opencv-101-HOG特征描述子之多尺度检测

知识点

HOG(Histogram of Oriented Gradient)特征本身不支持旋转不变性,通过金字塔可以支持多尺度检测实现尺度空间不变性,OpenCV中支持HOG描述子多尺度检测的相关API如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
virtual void cv::HOGDescriptor::detectMultiScale(
InputArray img,
std::vector< Rect > & foundLocations,
double hitThreshold = 0,
Size winStride = Size(),
Size padding = Size(),
double scale = 1.05,
double finalThreshold = 2.0,
bool useMeanshiftGrouping = false
)
Img表示输入图像
foundLocations表示发现对象矩形框
hitThreshold表示SVM距离度量,默认0表示,表示特征与SVM分类超平面之间
winStride表示窗口步长
padding表示填充
scale表示尺度空间
finalThreshold 最终阈值,默认为2.0
useMeanshiftGrouping 不建议使用,速度太慢拉

这个其中窗口步长与Scale对结果影响最大,特别是Scale,小的尺度变化有利于检出低分辨率对象,同事也会导致FP发生,高的可以避免FP但是会产生FN(有对象漏检)。窗口步长是一个或者多个block区域,关于Block区域可以看下图

代码(c++,python)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
#include <opencv2/opencv.hpp>
#include <iostream>

using namespace cv;
using namespace std;

int main(int argc, char** argv) {
Mat src = imread("D:/images/pedestrian_02.png");
if (src.empty()) {
printf("could not load image..\n");
return -1;
}
imshow("input", src);
HOGDescriptor *hog = new HOGDescriptor();
hog->setSVMDetector(hog->getDefaultPeopleDetector());
vector<Rect> objects;
hog->detectMultiScale(src, objects, 0.0, Size(4, 4), Size(8, 8), 1.05);
for (int i = 0; i < objects.size(); i++) {
rectangle(src, objects[i], Scalar(0, 0, 255), 2, 8, 0);
}
imshow("result", src);
waitKey(0);
return 0;
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
"""
HOG特征描述子之多尺度检测
"""

import cv2 as cv

src = cv.imread("images/pedestrian.png")
hog = cv.HOGDescriptor()
hog.setSVMDetector(cv.HOGDescriptor_getDefaultPeopleDetector())
# detect people in image
(rects, weights) = hog.detectMultiScale(src, winStride=(4, 4),
padding=(8, 8), scale=1.55,
useMeanshiftGrouping=False)

for (x, y, w, h) in rects:
cv.rectangle(src, (x, y), (x + w, y + h), (0, 255, 0), 2)

cv.imshow("hog-detector", src)

cv.waitKey(0)
cv.destroyAllWindows()

结果

代码地址

github