Hog là gì

     

HOG là viết tắt của Histogram of Oriented Gradient - một các loại “feature descriptor”. Mục tiêu của “featura descriptor” là trừu tượng hóa đối tượng bằng phương pháp trích xuất ra những đặc trưng của đối tượng đó và bỏ đi những thông tin không hữu ích. Bởi vì vậy, HOG được sử dụng đa phần để mô tả ngoài mặt và sự xuất hiện của một đối tượng người sử dụng trong ảnh.

Bạn đang xem: Hog là gì

*

Bản chất của cách thức HOG là áp dụng thông tin về việc phân bố của các cường độ gradient (intensity gradient) hoặc của hướng biên (edge directins) nhằm mô tả các đối tượng tổng thể trong ảnh. Những toán tử HOG được sở hữu đặt bằng phương pháp chia bé dại một bức hình ảnh thành các vùng con, được điện thoại tư vấn là “tế bào” (cells) với với từng cell, ta sẽ giám sát một histogram về các hướng của gradients cho các điểm nằm trong cell. Ghép các histogram lại cùng nhau ta sẽ sở hữu một màn biểu diễn cho bức ảnh ban đầu. Để tăng tốc hiệu năng dấn dạng, các histogram viên bộ hoàn toàn có thể được chuẩn hóa về độ tương phản bằng cách tính một ngưỡng độ mạnh trong một vùng to hơn cell, hotline là những khối (blocks) và thực hiện giá trị ngưỡng kia để chuẩn chỉnh hóa tất cả các cell vào khối. Kết quả sau bước chuẩn chỉnh hóa sẽ là 1 trong những vector đặc trưng có tính không bao giờ thay đổi cao hơn đối với các biến đổi về điều kiện ánh sáng.

Có 5 cách cơ bạn dạng để thành lập một vector HOG mang lại hình ảnh, bao gồm:

Tiền xử lýTính gradientTính vector đặc trưng cho từng ô (cells)Chuẩn hóa khối (blocks)Tính toán vector HOG

1. Tiền xử lý

Trong câu hỏi này, để dễ dãi cho việc chia phần đông hình ảnh thành các khối, ô và giám sát đặc trưng ở quá trình tiếp theo, họ cần resize kích thước tất cả các hình hình ảnh trong tập dữ liệu về một size chung.

*

Trong các ví dụ được trình diễn trong bài viết này, size chung cho một hình ảnh sẽ mặc định là 64x128

2. Tính Gradient

Đây là những bước đầu tiên, được triển khai bằng hai phép nhân chập ảnh gốc với 2 chiều, tương ứng với các toán tử mang đạo hàm theo nhì hướng Ox và Oy. Vào đó, 2 hướng khớp ứng đó là:

*

T là phép toán gửi vị ma trận.

Nghe có vẻ khó đọc nhỉ, coi hình ảnh dưới đây để sở hữu cái quan sát trực quan rộng nhé.

*

Và nếu khách hàng có một ảnh input là I, ta sẽ có 2 hình ảnh đạo hàm riêng biệt theo 2 phía đó, theo công thức:

*

Khi đó, bạn cũng có thể tính được Gradient bao hàm hai nhân tố cường độ(Gradient Magnitude) với hướng(Gradient Derection) theo công thức (*):

*

Ví dụ: mang sử ta có một điểm hình ảnh như sau

*

Chúng ta vẫn áp dụng những công thức trên nhằm tính được gradient của điểm hình ảnh này:

*

Đối với hình ảnh màu, gradient của bố kênh(red, green với blue) được tiến công giá. Độ phệ của gradient tại một điểm ảnh là giá chỉ trị lớn nhất của cường độ gradient của ba kênh, và góc là góc khớp ứng với gradient tối đa.

Xem thêm: Tính Không Đồng Nhất ( Heterogeneity Là Gì ? Định Nghĩa Heterogeneity Là Gì

Sau cách này, công dụng thu được đang là:

*

3. Tính vector đặc thù cho từng ô (cells)

Để giám sát và đo lường vector đặc thù cho từng ô (cell), họ cần phân tách hình hình ảnh thành những block, mỗi block lại chia đa số thành những cell. Để xác định được số block, chúng ta sẽ thực hiện công thức sau:

*

Các block rất có thể xếp chồng lên nhau như hình:

*

Sau khi xác định số block và kích thước mỗi block, cell, để giám sát vector đặc thù cho từng cell, bọn họ cần:Chia không khí hướng thành p. Bin(số chiều vector đặc trưng của ô).Rời rộc rạc hóa góc phía nghiêng tại từng điểm ảnh vào trong các bin.

Giả sử góc hướng nghiêng trên pixel ở vị trí (x,y) gồm độ phệ là alpha(x,y)

Trường hòa hợp rời rốc hóa unsigned-HOG với p=9:

*

Trường hòa hợp rời rạc hóa signed-HOG cùng với p=18:

*

Giá trị bin được định lượng vì tổng cường độ biến thiên của những pixels ở trong về bin đó.Sau khi thống kê giám sát đặc trưng ô, ta đã nối các vector đặc thù ô nhằm thu được vector đặc thù khối. Số chiều vector đặc trưng khối tính theo bí quyết :

*

Ví dụ: trong trường vừa lòng này, hình hình ảnh của chúng ta có form size là 64x128, ta sẽ phân tách mỗi hình ảnh thành những block có kích thước 16x16. Mỗi block sẽ bao gồm 4 cell, mỗi cell có kích cỡ là 8x8.

*

Tiếp theo, tiến hành tính toán đặc trưng HOG tại mỗi cell sử dụng không khí hướng 9 bin, trường vừa lòng “unsigned-HOG”. Phía gradient đang chạy trong khoảng 0 độ mang lại 180 độ, trung bình 20 độ từng bin.

Tại mỗi cell, xây cất một biểu đồ độ mạnh gradient bằng cách vote các pixel vào biểu đồ. Trọng số vote của từng pixel nhờ vào hướng với cường độ gradient (được tính toán từ bước 2) của pixel đó. Ví dụ:

*

*

Như trong hình hình ảnh trên, thứ nhất là pixel có bao quanh màu xanh lam. Nó có hướng 80 độ cùng cường độ là 2, vày vậy ta thêm 2 vào bin đồ vật 5 (hướng 80 độ). Tiếp theo là pixel có bao quanh màu đỏ. Nó có hướng 10 độ với cường độ 4. Vì không có bin 10 độ, yêu cầu ta vote đến bin 0 độ và 20 độ, mỗi bin thêm 2 đơn vị.Sau lúc vote không còn các pixel trong một cell kích cỡ 8x8 vào 9 bin, ta hoàn toàn có thể thu được tác dụng như sau:

*

4. Chuẩn chỉnh hóa khối (blocks)

Để bức tốc hiệu năng dìm dạng, những histogram cục bộ sẽ được chuẩn hóa về độ tương phản bằng cách tính một ngưỡng cường độ trong một khối và thực hiện giá trị kia để chuẩn chỉnh hóa toàn bộ các ô vào khối. Hiệu quả sau bước chuẩn chỉnh hóa sẽ là một vector đặc trưng có tính bất biến cao hơn đối với các chuyển đổi về điều kiện ánh sáng.

Đầu tiên, hãy xem xét tác động của việc chuẩn hóa tới những vector gradient trong ví dụ sau:

*

Trong hình ảnh trên, ngôi trường hợp trước tiên là một ô của hình hình ảnh ban đầu. Ngôi trường hợp thứ hai, tất cả các giá bán trị px đã được tăng thêm 50. Trong trường hợp sản phẩm công nghệ ba, toàn bộ các giá bán trị pixel được nhân cùng với 1.5.Dễ dàng thấy được, trường hợp thứ bố hiển thị độ tương phản gia tăng. Ảnh tận hưởng của phép nhân là làm những điểm hình ảnh sáng trở yêu cầu sáng rộng nhiều, vào khi những điểm hình ảnh tối chỉ sáng rộng một chút, vì vậy làm tăng mức độ tương làm phản giữa những phần sáng và về tối của hình ảnh.

Xem thêm: Các Dạng Thông Tin Trong Tin Học Là Gì? Lý Thuyết Tin Học 10 Bài 2

Hãy nhìn vào các giá trị px thực tế và sự chuyển đổi của vector gradient của bố trường hòa hợp trên trong hình ảnh sau:

*

Các bé số trong những ô là giá chỉ trị px của những điểm ảnh lân cận điểm hình ảnh được ghi lại màu đỏ.Delta F là đạo hàm theo riêng hai vị trí hướng của điểm hình ảnh ()| Delta F| là quý hiếm cường độ điểm ảnh (Gradient Magnitude), tính theo phương pháp (*)

Trong trường hòa hợp một và hai, cực hiếm cường độ vector gradient của chúng tương đương nhau, cơ mà trong trường hợp máy ba, cường độ vector gradient đã tăng lên 1.5 lần. Nếu chia tía vector bằng độ to tương ứng, ta sẽ nhận thấy các kết quả tương đương cho tất cả ba trưởng hợp. Vày vậy, trong ví dụ trên, họ thấy rằng bằng phương pháp chia những vector gradient theo độ lớn của chúng, bạn cũng có thể biến bọn chúng thành không bao giờ thay đổi để chuyển đổi độ trương phản.

Có nhiều cách thức có thể được dùng để chuẩn chỉnh hóa khối. điện thoại tư vấn v là vector cần chuẩn chỉnh hóa chứa tất cả các histogram của mội khối.‖v(k)‖ là giá bán trị chuẩn hóa của v theo các chuẩn k=1, 3 với e là một trong hằng số nhỏ. Lúc đó, các giá trị chuẩn hóa hoàn toàn có thể tính bằng một trong những công thức sau:

*

Ghép những vector đặc thù khối vẫn thu được vector đặc thù R-HOG mang lại ảnh. Số chiều vector sệt trưng hình ảnh tính theo bí quyết :

*

5. Giám sát và đo lường vector đặc thù HOG

*

Với mỗi hình ảnh kích thước 64x128, chia thành các block 16x16 chồng nhau, sẽ có 7 block ngang và 15 block dọc, nên sẽ sở hữu 7x15 = 105 blocks.Mỗi block có 4 cell. Khi áp dụng biểu đồ 9-bin cho mỗi cell, mỗi block đang được thay mặt đại diện bởi một vector có size 36x1.Vì vậy, khi nối toàn bộ các vector trong một block lại cùng với nhau, ta sẽ thu được vector đặc trưng HOG của ảnh có kích cỡ 105x36x1 = 3780x1.Link tư liệu tham khảo:

Histogram of Oriented Gradients