基于多尺度-多形状HOG特征的行人检测方法
- 格式:pdf
- 大小:660.41 KB
- 文档页数:5
⽬标检测学习_1(⽤opencv⾃带hog实现⾏⼈检测) 本⽂主要介绍下opencv中怎样使⽤hog算法,因为在opencv中已经集成了hog这个类。
其实使⽤起来是很简单的,从后⾯的代码就可以看出来。
本⽂参考的资料为opencv⾃带的sample。
关于opencv中hog的源码分析,可以参考本⼈的另⼀篇博客: 开发环境:opencv2.4.2+Qt4.8.2+ubuntu12.04+QtCreator2.5. 实验功能: 单击Open Image按钮,选择需要进⾏⼈检测的⼀张图⽚,确定后⾃动显⽰出来。
该图⽚的⼤⼩没限制。
单击People Detect按钮,则程序会⾃动对该图⽚进⾏⾏⼈检测,且将检测到的效果显⽰出来,即⽤1个矩形框将⾏⼈框出来。
单击Close按钮,退出程序。
实验说明: 1. hog描述⼦在opencv中为HOGDescriptor。
2. 可以调⽤该描述⼦setSVMDetector⽅法给⽤于对hog特征进⾏分类的svm模型的系数赋值,这⾥的参数为HOGDescriptor::getDefaultPeopleDetector()时表⽰采⽤系统默认的参数,因为这些参数是⽤很多图⽚训练⽽来的。
3. 对输⼊图⽚进⾏⾏⼈检测时由于图⽚的⼤⼩不⼀样,所以要⽤到多尺度检测。
这⾥是⽤hog类的⽅法detectMultiScale。
参数解释如下:HOGDescriptor::detectMultiScale(const GpuMat& img, vector<Rect>& found_locations, doublehit_threshold=0, Size win_stride=Size(), Size padding=Size(),double scale0=1.05, int group_threshold=2) 该函数表⽰对输⼊的图⽚img进⾏多尺度⾏⼈检测img为输⼊待检测的图⽚;found_locations为检测到⽬标区域列表;参数3为程序内部计算为⾏⼈⽬标的阈值,也就是检测到的特征到SVM分类超平⾯的距离;参数4为滑动窗⼝每次移动的距离。
一种基于多尺度滑动窗口图像检测行人的新方法作者:郑贤哲王艳东刘泽宇来源:《今日自动化》2020年第03期[摘要]针对行人检测领域的相关现实问题,传统机器学习算法通常采用对整幅图片以滑动窗口逐步检测的方法解决,这样会因检测非必要背景窗口过多而大大降低计算效率,针对上述问题提出一种基于多尺度滑动窗口图像检测行人的新方法。
首先以滑动窗口遍历图像,对整幅图片进行显著性检测,然后通过二值化处理的方式,将显著性物体分割出来,最后过滤非必要窗口,继而提高检测效率。
实验中采用HOG方法提取行人特征,运用线性SVM进行检测,最后验证新方法的有效性。
实验中,使用大小为300×451Dpi、261×400Dpi的图像,检测窗口数量分别减少了44.21%、34.96%,检测速率分别提高了9.30%、12.73%。
实验结果表明,相比于传统检测方法,新方法提高了检测效率。
[关键词]HOG特征提取;行人检测;SVM;显著性检验[中图分类号]TP391 [文献标志码]A [文章编号]2095–6487(2020)03–0–04[Abstract]In view of the related practical problems in the field of pedestrian detection,traditional machine learning algorithms usually adopt a method of gradually detecting the entire picture with a sliding window, which will greatly reduce the computational efficiency due to the detection of too many unnecessary background windows. To solve the above problems, a new method of pedestrian detection based on multi-scale sliding window images is proposed. First,traverse the image with a sliding window to detect the saliency of the entire picture, then segment the salient objects by binarization, and finally filter the unnecessary windows to improve the detection efficiency. In the experiment, the HOG method is used to extract pedestrian features,linear SVM is used for detection, and finally the effectiveness of the new method is verified. In the experiment, using images with sizes of 300×451Dpi and 261×400Dpi, the number of detection windows was reduced by 44.21% and 34.96%, respectively, and the detection rate was increased by 9.30% and 12.73%, respectively. Experimental results show that compared with traditional detection methods, the new method improves detection efficiency.[Keywords]HOG feature extraction; pedestrian detection; SVM; significance test1 國内外的研究现状近年来,随着图像识别技术的发展,基于图像识别检测行人的技术也得到广泛的关注和研究。
有关行人的智能检测,近年来可谓是一个热门话题。
日益流行的“智慧城市”的设想中,行人检测也可以应用在例如智能交通、安防等事业中。
来自法国的研究人员Navneet Dalal 等软件高手在2005年首次提出了HOG,即梯度直方图特征。
并以线性SVM作为分类器训练大量样本。
在他们大量的实验后证明,这样的研发成品可以很好得实现行人检测。
令人欣喜的是,强大的计算机视觉库OPENCV中现在已经有了HOG特征描述算子的API,而线性支持向量机SVM也是早早得就集成于OPENCV中了。
以上关于算法的介绍很粗线条,如果有对此感兴趣的朋友,给你们推荐个网址吧:/publications我想这个应该是最详实也是最权威的了,重点是2005年和2006年两篇,不过是全英文的,写得相当不错。
好了现在进入正题吧,我接触这个领域时间并不是很久,有幸现在到一家公司实习加上导师给的一些机会研究了一段时间,相信也有很多朋友在领域的门槛处跌倒了又跌倒,当然更有很多高手勇攀高峰。
所谓众口难调,我把这些天来的成果代码放在下面“示众”,跟我同一水平线的新手们可以看看,我保证这份代码是可以跑通的。
天外有天,人外有的那些高手们也可以赏光一览,若可朱笔一批,小生定不胜感激。
首先有几点说明的是:1.我用的win7 64位+vs2008+opencv2.3完成的项目,关于这个配置网上有很详细的资料。
也并不是很难。
如果是新手你还是听我唠叨两句:必须看好自己的电脑配置和软件版本,兼容问题不容小视;不要随意相信网上乱七八糟的说法,可以去CSDN或者OPENCV中文论坛上搜索文档配置方法。
那才是最靠谱儿的王道啊!2.关于OPENCV读取视频。
这个问题纠结了我大半天时间,cvCreateFileCapture这个函数比较逗,并不是所有的视频都可以进来。
我一开始以为.avi作为后缀的没有问题,后来试试才发现A VI也有很多种编码方式。
因此,如果这个地方有问题的朋友们可以尝试下一个Xvid编码器进行编码后,一切定迎刃而解。
改进的基于增强型HOG 的行人检测算法①李文书, 韩 洋, 阮梦慧, 王志骁(浙江理工大学 信息学院, 杭州 310018)通讯作者: 李文书摘 要: 行人检测在人工智能系统、车辆辅助驾驶系统和智能监控等领域具有重要的应用, 是当前的研究热点. 针对HOG 特征不明显、支持向量机(SVM)分类器计算复杂度高, 导致识别率低和检测速度慢的问题, 本文提出了一种改进的基于增强型HOG 的行人检测算法. 该算法首先预处理原始图像并提取其HOG 特征, 然后增强该特征生成增强型HOG, 经XGBoost 分类器进行行人检测. 在INRIA 数据集上进行测试, 实验结果表明所提算法识别率高达95.49%, 有效地提高了行人检测性能.关键词: 行人检测; HOG 特征; 增强型HOG; XGBoost 分类器引用格式: 李文书,韩洋,阮梦慧,王志骁.改进的基于增强型HOG 的行人检测算法.计算机系统应用,2020,29(10):199–204. /1003-3254/7587.htmlImproved Pedestrian Detection Method Based on Enhanced HOGLI Wen-Shu, HAN Yang, RUAN Meng-Hui, WANG Zhi-Xiao(School of Information Science and Technology, Zhejiang Sci-Tech University, Hangzhou 310018, China)Abstract : Pedestrian detection is a current research hotspot, which has important applications in the fields of artificial intelligence system, vehicle assistant driving system, and intelligent monitoring. In the process of pedestrian detection based on HOG feature, the HOG feature is not obvious, the SVM classifier has high computational complexity, resulting in low recognition rate and high missed detection rate, this study proposes an improved enhanced HOG feature combined with the eXtreme Gradient Boosting (XGBoost) classifier for pedestrian detection. Firstly, the original image is preprocessed to get saliency map and HOG features. Then, the contrast of HOG features is enhanced and the pedestrian detection analysis is carried out with XGBoost classifier. Tested with the INRIA dataset, the experimental results show that the proposed algorithm has a significant improvement in recognition rate and detection speed.Key words : pedestrian detection; HOG feature; Enhanced HOG (EHOG); XGBoost classifier近年来, 行人检测在众多领域得到了广泛的发展,日渐成为计算机视觉和模式识别领域中的关键问题.然而, 由于行人身材和姿态多样性、光线多变、背景复杂等原因, 使得行人检测依旧是计算机视觉研究的热点与难点[1–3].自2005年, Dalal 等人[4,5]提出了方向梯度直方图(HOG)特征后, 行人检测技术进入快速发展阶段. HOG 特征用于描述图像中像素值的梯度信息, 该特征对行人边缘信息描述充分, 对光照变化不敏感, 目前仍是行人检测领域中应用最广泛的特征算子. Dalal 等人提出的HOG 特征结合支持向量机(SVM)分类器的行人检测方法在INRIA 数据集上检测精度达90%, 但是检测计算机系统应用 ISSN 1003-3254, CODEN CSAOBNE-mail: Computer Systems & Applications,2020,29(10):199−204 [doi: 10.15888/ki.csa.007587] ©中国科学院软件研究所版权所有.Tel: +86-10-62661041① 基金项目: 国家重点研发计划重点专项(2018YFB1004901); 国家自然科学基金(31771224, 60702069); 浙江省自然科学基金(LY17C090011)Foundation item: Major Project of National Key Research and Development Program of China (2018YFB1004901); National Natural Science Foundation of China (31771224, 60702069); Natural Science Foundation of Zhejiang Province (LY17C090011)收稿时间: 2020-02-14; 修改时间: 2020-03-13; 采用时间: 2020-03-20; csa 在线出版时间: 2020-09-30199速度非常慢. 在Dalal等人的研究成果基础上, 学者们纷纷提出了改进方法.为了提高检测精度, 陈锐等人[6]提出了一种利用主成分分析法(PCA)对HOG特征进行降维后与局部二值模式(LBP)特征进行融合, 再使用SVM分类器进行分类的行人检测框架, 组合特征的检测方法比单一特征的检测方法更精确[7,8]. 李盈盈等人[9]提出了一种更精确的行人检测方法, 该方法将LBP特征、CSS特征[10]和HOG特征进行结合, 采用Adaboost[11]分类器进行行人检测, 提高了在INRIA数据集检测的识别率,但由于提取特征种类增加导致检测速度变得极其慢.为了提高检测速度, Chen PY等人[12]尝试从硬件层面改善, 提出了一种用于HOG特征提取的低成本高速硬件实现, 仿真实验表明, 它需要更少的硬件成本并且实现更快的工作速度. 龚露鸣等人[13]提出一种用于视频流的快速行人检测方法. 该方法首先利用基于高斯模型的背景差分法进行运动目标提取, 然后在对运动目标进行人体识别, 通过缩小检测区域的方式提高了行人检测的速度, 达到可在视频流进行实时行人检测的目的.此外, 近年来深度学习的算法在行人检测上的应用也越来越广泛, 基于深度学习的行人检测算法[14–17]在速度和准确率上普遍优于传统机器学习算法, 但对硬件性能要求较高.综上所述, 现有的HOG特征的研究和改进都是从外部寻找其他手段提高检测精度和检测速度, 而本文是从图像本身和HOG特征内部出发增强图像和HOG 特征的表达能力.1 HOG特征HOG特征即方向梯度直方图特征, 是一种通过目标边缘密度的分布来对目标形状进行描述的特征算子,被广泛应用于计算机视觉和图像处理中. HOG特征提取的方式是依次提取目标局域特征再进行串联, 所有的提取工作只在目标局部区域进行, 避免了光照和图像几何形变的影响. 因此, HOG特征具有良好的几何不变性和光照不变性. 此外, HOG特征通过串联局部信息描述目标整体形状的方式对目标姿态的变化具有很好的宽容度. 在行人检测中, 只要人体姿态大致不变,小幅度的肢体动作不会对检测效果产生影响. 因此, HOG特征特别适用于行人检测.n×n N×NHOG特征的基本单位为细胞单元(cell), 每个cell 由个像素组成, 个cell组成一个块(block),具体特征提取过程如图1所示. HOG特征的提取以block尺寸的滑动窗口为掩码, 进行滑窗扫描提取, 具体步骤为.图像灰度化和归一化计算梯度构建方向的直方图归一化 block 的梯度强度收集 HOG 特征Feature vector f=[…, …, …, …]输入图像检测窗口CellBlock图1 HOG特征提取流程图1) 将彩色图像转换为灰度图像, 使用Gamma校正法[18,19]对图像进行归一化处理, 计算经Gamma校正后的图像中像素的水平和垂直梯度;2) 其次将梯度方向分为九个区间, 如图2所示, 建立梯度直方图统计cell在每个区间梯度幅值的分布情况, 生成的9维特征向量为该cell的特征描述子;z9块z3块z1块z9块20°~40°, z2块YXz1块z2块图2 梯度方向划分图计算机系统应用2020 年 第 29 卷 第 10 期2003) 将block 内所有cell 的特征描述子串联起来并进行归一化处理, 生成该block 的特征描述子;4) 将所有block 的特征描述子串联起来得到输入图像的HOG 特征向量f .2 增强型HOG2.1 预处理操作计算每个像素在整个图像上的全局对比度, 即该像素与图像中其他所有像素在颜色上的距离之和作为该像素的增强值, 得到新的图像.I k 图像I 中某个像素的增强值计算公式如下:S alS (I k )=∑∀I i ∈I∥I k −I i ∥=∥I k −I 1∥+···+∥I k −I N ∥(1)I k [0,255]N I k =a m f n n 其中, 为灰度值, 取值范围为; 表示图像中像素的数量. 给定一张图像, 每个像素的颜色值已知, 假定, 表示图像中第个像素的频数. 则上式可重构:S alS (I k )=f 0∥a m −a 0∥+···+f 255∥a m −a 255∥(2)S alS (a m )=255∑n =0f n ∥a m −a n ∥(3)g b ,ave =n ∑c =1g c ,sum n(4)g c =a 1g c (x ,y ),g c (x ,y )<15g b ,avea 2g c (x ,y ),15g b ,ave ≤g c (x ,y )≤25g b ,ave a 3g c (x ,y ),25g b ,ave ≤g c (x ,y )≤35g b ,ave a 4g c (x ,y ),35g b ,ave ≤g c (x ,y )≤45g b ,ave a 5g c (x ,y ),g c (x ,y )>45g b,ave(5)g b,ave g c ,sum n gc (x ,y )(x ,y )a 1,a 2,a 3,a 4a 5a 1=0.6a 2=0.8a 3=1a 4=1.2a 5=1.4其中, 表示当前block 内cell 幅值的均值, 表示当前cell 内梯度值, 为block 内cell 的个数. 式(5)为block 内cell 的幅值具体调整方式, 其中表示当前block 内位置cell 的梯度值; 和为调整系数, 经实验分析后在本文取, ,, 和.提取经过预处理后图像的HOG 特征, 从增强特征对比度角度对HOG 特征进行改进, 提出了增强的HOG (Enhanced HOG, EHOG)特征. 增强HOG 特征对比度的方法是在提取HOG 特征后, 按照式(4)计算出当前block 的梯度值均值. 再按照式(5)对该block 内每个cell 的梯度值做出调整. 之后串连调整过的cell 特征描述子得到block 的特征描述子. 最后将所有block 的特征描述子串连得到EHOG 特征.经过特征增强处理, 梯度直方图中梯度值小的bin 得到进一步压缩, 梯度值大的bin 得到进一步放大,直方图的方差增大, 对比度显著增强. 为进一步分析EHOG 特征相较HOG 特征的变化, 本文提取INRIA 数据集中一张图片的HOG 特征和EHOG 特征进行可视化分析, 如图3所示.原图(a) HOG 特征图(b) EHOG 特征图预处理图3 HOG 和EHOG 特征可视化比较图图3中, 每个红色虚线区域代表一个cell 单元, 由图3(a)与图3(b)比较可以很直观地看出经过特征增强处理, cell 单元内各方向梯度值在保持原有趋势前提下, 对比度显著增大, cell 单元特征描述子的局部描述能力得到增强. 图4从数据角度很好的反应了这一点, HOG特征整体变化趋势与EHOG 特征保持一致但对比度得到增强, 如维度17位置对应特征分别为0.005和0.008,仅相差0.003; 最大特征值与最小特征值之差由0.335提高到0.470, 较未进行特征增强之前增长了40.3%.0.0080.3350.0050.470.050.100.150.200.250.300.350.400.450.50135791113151719212325272931方向梯度数据维度HOGEHOG图4 HOG 特征和EHOG 特征值图2020 年 第 29 卷 第 10 期计算机系统应用201算法1. EHOG特征获取Input: imgGray: 原始图像对应的灰度图Output: fOut: EHOG特征hist ← imgGray中出现像素灰度对应的频数设置一个用于保存0到255各灰度值对应的增强值的对象distfor i ← 0 to 255 dodist[i] ← 根据hist利用式(3)求出增强值endrows ← imgGray的高度cols ← imgGray的宽度设置一个用于保存结果增强后结果的与imgGray大小相同的单通道图像imgEnhancefor i ← 0 to cols – 1 dofor j ← 0 to rows – 1 dogray ← imgGray位于(i,j)位置的灰度值将imgEnhance中位于(i,j)位置的像素设置为dist[gray]的值endend对imgEnhance进行归一化处理szCell ← 用于提取HOG的cell单元大小szBlock ← 用于提取HOG的滑动窗口大小, cell的数量szStep ← 用于提取HOG的步长, 为szCell的整数倍f ← 根据szBlock、szStep和szCell在imgEnhance上滑动计算收集所有HOG特征numWindow ← (rows – szBlock×szCell)×(cols –szBlock×szCell)/(szStep×szStep) + 1for i ← 0 to numWindow – 1 dogCellSum ← 根据f中的信息计算当前窗口内cell梯度总和gBlock ← 根据gCellSum利用式(4)计算出当前窗口内cell梯度均值for j ← 0 to szBlock×szBlock – 1 dogCellCur ← 格局f中的信息获取当前位置cell的梯度值gCellAdp ← 根据gBlock和gCellCur利用式(5)计算出当前cell的调整值将f中对应的cell位置的值设置为gCellAdpendendfOut ← f3 实验分析本文实验的相关参数设置如下: cell大小为像素, block大小为cell, 滑动窗口采用固定大小为, 扫描步长为8个像素. 实验采用INRIA数据集进行实验分析, 部分示例图像如图5所示.INRIA数据集中行人姿态多样, 背景复杂多变, 在行人检测领域该数据集认可度较高. 训练样本中正样本数量为2416个, 负样本数量为1218个; 测试样本中正样本数量为1126个, 负样本数量为453个. 硬件的运行环境设置为: Windows 7操作系统, Intel(R) Core(TM) i7-4770 CPU, 8 GB内存. 软件平台为Visual Studio 2015.(a)训练图像(b)测试图像图5 INRIA数据集的部分示例图像为验证本文提出的EHOG特征相较其他特征的优越性, 将EHOG特征和其他几种常用特征结合XGBoost 分类器[20,21]进行实验对比, 实验结果见表1.表1 不同特征结合XGBoost分类器的比较特征种类识别率(%)检测时间(ms)Haar77.4053.27LBP83.6449.01HOG90.7825.61EHOG95.4930.85由表1可知HOG特征和本文提出EHOG在识别率和检测时间上明显优于其他特征. 相较HOG特征,使用Haar和LBP特征训练所得的分类器识别率相对较低, 分别只有77.40%, 83.64%. 使用EHOG特征的识别率为95.49%, 较Haar和LBP特征分别提高了18.09%和11.85%, 较传统HOG特征提高了4.71%. 表1中最后一列是不同特征在与XGBoost分类器结合时所需的检测时间, 其中HOG特征所需最少, 为25.61 ms, 而本文提出的EHOG特征所需检测时间为30.85 ms与其接近, 但是识别率有明显的提升.为了进一步检测XGBoost分类器较其他分类器的计算机系统应用2020 年 第 29 卷 第 10 期202优越性, 本文将EHOG 特征结合SVM 分类器进行实验对比, 实验结果见表2和图6.表2 不同特征结合SVM 分类器检测时间特征种类检测时间(ms)Haar 74.63LBP 69.51HOG 57.81EHOG64.311020304050607080HaarLBPHOGEHOG检测时间 (m s )特征种类SVM XGBoost图6 不同特征在SVM 和XGBoost 分类器上检测时间的比较由图6可以看出, 不同特征结合XGBoost 分类器普遍比SVM 分类器所需的检测时间要少, 这是因为XGBoost 分类器的多线程并行操作, 有效地降低了行人检测时间. 由表2可知, HOG 特征在结合SVM 分类器时所需的检测时间, 远远少于Haar 特征和LBP 特征, 而EHOG 特征较HOG 特征检测时间略有增加, 是因为提取EHOG 特征之前对原始图像进行了预处理增加了时间开销, 但较传统SVM 分类器, XGBoost 分类器很明显的降低了检测时间.4 结束语行人检测具有极广泛的应用: 智能辅助驾驶, 智能监控, 行人分析以及智能机器人等领域. 从2005年以来行人检测进入了一个快速的发展阶段, 但是也存在很多问题还有待解决, 主要还是在性能和速度方面还不能达到一个权衡. 近年, 以谷歌为首的自动驾驶技术的研发正如火如荼地进行, 这也迫切需要能对行人进行快速有效的检测, 以保证自动驾驶期间对行人的安全不会产生威胁.本文从预处理原始图像和增强特征对比度两方面对其做出改进, 提出了增强型HOG, 并基于EHOG 特征结合XGBoost 分类器的行人检测方法. 实验结果证明, 针对不同特征(Haar 、LBP 、HOG 、EHOG), 本文提出的方法在识别率和检测速度方面有明显优越性.本文下一步研究方向是, 针对遮挡问题改进检测算法, 在复杂环境下进一步提高检测精度提升检测速度.参考文献苏松志, 李绍滋, 陈淑媛, 等. 行人检测技术综述. 电子学报, 2012, 40(4): 814–820. [doi: 10.3969/j.issn.0372-2112.2012.04.031]1宋婉娟, 张剑. 融合回归网络和多尺度特征表示的实时行人检测. 电子测量与仪器学报, 2018, 32(7): 15–20.2李俊杰, 刘成林, 朱明. 基于多任务CNN 的监控视频中异常行人快速检测. 计算机系统应用, 2018, 27(11): 78–83.[doi: 10.15888/ki.csa.006607]3Dalal N, Triggs B. Histograms of oriented gradients forhuman detection. Proceedings of 2015 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR ’05). San Diego, CA, USA. 2005.886–893.4Maldonado S, López J. Dealing with high-dimensional class-imbalanced datasets: Embedded feature selection for SVM classification. Applied Soft Computing, 2018, 67: 94–105.[doi: 10.1016/j.asoc.2018.02.051]5陈锐, 王敏, 陈肖. 基于PCA 降维的HOG 与LBP 融合的行人检测. 信息技术, 2015, (2): 101–105.6Aït-Sahalia Y, Xiu DC. Principal component analysis ofhigh-frequency data. Journal of the American Statistical Association, 2019, 114(525): 287–303. [doi: 10.1080/01621459.2017.1401542]7Xiao L, Zhang YJ, Wang Q, et al . Improved local texturefeatures for pedestrian detection. Proceedings of the IEEE 3rd International Conference on Image, Vision and Computing (ICIVC). Chongqing, China. 2018. 60–65.8Zhang PB, Yang ZX. A novel AdaBoost framework withrobust threshold and structural optimization. IEEE Transactions on Cybernetics, 2018, 48(1): 64–76. [doi: 10.1109/TCYB.2016.2623900]9Walk S, Majer N, Schindler K, et al New features andinsights for pedestrian detection. Proceedings of 2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. San Francisco, CA, USA. 2010.1030–1037.10李盈盈, 李菲菲, 陈虬. 基于改进HOG 共生概率特征的行人检测算法. 电子科技, 2018, 31(9): 4–8.112020 年 第 29 卷 第 10 期计算机系统应用203Chen PY, Huang CC, Lien CY, et al . An efficient hardware implementation of HOG feature extraction for human detection. IEEE Transactions on Intelligent Transportation Systems, 2014, 15(2): 656–662. [doi: 10.1109/TITS.2013.2284666]12龚露鸣, 徐美华, 刘冬军. 基于混合高斯和HOG + SVM 的行人检测模型. 上海大学学报(自然科学版), 2018, 24(3):341–351.13陈恩加, 唐向宏, 傅博文. Faster R-CNN 行人检测与再识别为一体的行人检索算法. 计算机辅助设计与图形学学报,2019, 31(2): 332–339.14Tian YL, Luo P, Wang XG, et al . Deep learning strong partsfor pedestrian detection. Proceedings of 2015 IEEE International Conference on Computer Vision. Santiago,Chile. 2015. 1904–1912.15Ouyang WL, Zhou H, Li HS, et al . Jointly learning deepfeatures, deformable parts, occlusion and classification for pedestrian detection. IEEE Transactions on Pattern Analysis16and Machine Intelligence, 2018, 40(8): 1874–1887. [doi: 10.1109/TPAMI.2017.2738645]王琳, 卫晨, 李伟山, 等. 结合金字塔池化模块的YOLOv2的井下行人检测. 计算机工程与应用, 2019, 55(3): 133–139. [doi: 10.3778/j.issn.1002-8331.1710-0236]17杨金锋, 师一华, 熊兴隆. 光照处理中改进的Gamma 矫正方法. 中国民航学院学报, 2006, 24(4): 39–42.18储清翠, 王华彬, 陶亮. 图像的局部自适应Gamma 校正. 计算机工程与应用, 2015, 51(7): 189–193, 208. [doi: 10.3778/j.issn.1002-8331.1305-0193]19Chen TQ, Guestrin C. XGBoost: A scalable tree boostingsystem. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco, CA, USA. 2016. 785–794.20Chen WB, Fu K, Zuo JW, et al . Radar emitter classificationfor large data set based on weighted-xgboost. IET Radar,Sonar & Navigation, 2017, 11(8): 1203–1207.21计算机系统应用2020 年 第 29 卷 第 10 期204。
HOG(Histogram of Oriented Gradient)特征在对象检测与模式匹配中是一种常见的特征提取算法,是基于本地像素块进行特征直方图提取的一种算法,对象局部的变形与光照影响有很好的稳定性,最初是用HOG特征来来识别人像,通过HOG特征提取+SVM训练,可以得到很好的效果,OpenCV已经有了。
HOG特征提取的大致流程如下:详细步骤第一步:灰度化对HOG特征提取来说第一步是对输入的彩色图像转换为灰度图像,图像灰度化的方法有很多,不同灰度化方法之间有一些微小的差异,从彩色到灰度的图像转换可以表示如下:第二步:计算图像梯度计算图像的X方向梯度dx与Y方向梯度dy,根据梯度计算mag与角度,计算梯度时候可以先高斯模糊一下(可选步骤),然后使用sobel或者其它一阶导数算子计算梯度值dx、dy、mag、angle:第三步:Cell分割与Block对于图像来说,分成8x8像素块,每个块称为一个Cell,每个2x2大小的Cell称为一个Block,每个Cell根据角度与权重建立直方图,每20度为一个BIN,每个Cell得到9个值、每个Block得到36个值(4x9), 图像如下:每个Block为单位进行L2数据归一化,作用是抵消光照/迁移影响,L2的归一化的公式如下:第四步:生成描述子对于窗口64x128范围大小的像素块,可以得到8x16个Cell,使用Block在窗口移动,得到输出的向量总数为7x15x36=3780特征向量,每次Block移动步长是八个像素单位,一个Cell大小。
使用HOG特征数据HOG特征本身是不支持旋转不变性与多尺度检测的,但是通过构建高斯金字塔实现多尺度的开窗检测就会得到不同分辨率的多尺度检测支持。
OpenCV中HOG多尺度对象检测API如下:virtual void cv::HOGDescriptor::detectMultiScale(InputArray img,std::vector< Rect > & foundLocations,double hitThreshold = 0,Size winStride = Size(),Size padding = Size(),double scale = 1.05,double finalThreshold = 2.0,bool useMeanshiftGrouping = false)Img-表示输入图像foundLocations-表示发现对象矩形框hitThreshold-表示SVM距离度量,默认0表示,表示特征与SVM分类超平面之间winStride-表示窗口步长padding-表示填充scale-表示尺度空间finalThreshold-最终阈值,默认为2.0useMeanshiftGrouping-不建议使用,速度太慢拉使用OpenCV预训练SVM行人HOG特征分类器实现多尺度行人检测的代码如下:import cv2 as cvif __name__ == '__main__':src = cv.imread("D:/images/pedestrian.png")cv.imshow("input", src)hog = cv.HOGDescriptor()hog.setSVMDetector(cv.HOGDescriptor_getDefaultPeopleDetector()) # Detect people in the image(rects, weights) = hog.detectMultiScale(src,winStride=(4, 4),padding=(8, 8),scale=1.25,useMeanshiftGrouping=False)for (x, y, w, h) in rects:cv.rectangle(src, (x, y), (x + w, y + h), (0, 255, 0), 2)cv.imshow("hog-detector", src)cv.waitKey(0)cv.destroyAllWindows()原图显示如下:运行显示如下:。
基于多尺度-多形状HOG特征的行人检测方法牛杰;钱堃【摘要】提出一种图像中人体快速自动检测方法.提取图像的多尺度-多形状方向梯度直方网(HOG)特征向量,用于描述人体的形状特征,结合Adaboost机器学习法训练级联型分类器,以加速人体的检测过程.相比较传统算法,该方法没有采用静态背景模型,也不是仅仅依赖于易受外部环境因索干扰的颜色信息,从而一定程度地适应了人体姿态变化,以及非结构化环境下常见的光照波动、背景杂乱等不良因素所带来的干扰.实验验证了该方法的准确性和较高的计算效率.%A fast and automatic people detection method is proposed. The multi-scale and multi-shape histogram of oriented gradient (HOG) features are extracted, which serve as a powerful description of human shapes;The extracted features are then fed into a cascade of classifiers trained by Adabcost algorithm to greatly accelerate the people detection scheme. The proposed method is independent from background models as well as color information in images, which is highly unreliable due to disturbance. This method is robust agains: human posture variances, lightening fluctuations as well as background cluttering. Experimental results validate the favorable performance of high accuracy and computational efficiency of the proposed method.【期刊名称】《计算机技术与发展》【年(卷),期】2011(021)009【总页数】5页(P99-102,106)【关键词】方向梯度直方图;行人检测;Adaboost;机器学习【作者】牛杰;钱堃【作者单位】常州信息职业技术学院电子与电气工程学院,江苏常州213164;东南大学自动化学院,江苏南京210096【正文语种】中文【中图分类】TP391.410 引言人的视觉检测在智能监控[1]、人机交互[2]等领域都有着重要的应用价值。
基于改进HOG特征和SVM分类器的行人检测行人检测是计算机视觉领域的一个重要问题,其应用范围广泛,如智能监控、智能驾驶等。
传统的行人检测方法在复杂场景下表现不佳。
为了提高行人检测的准确性和鲁棒性,研究者们提出了基于改进方案的HOG特征和SVM分类器的行人检测方法。
HOG(Histogram of Oriented Gradients)特征是一种常用的图像特征描述子,其通过统计图像局部区域的梯度方向直方图来表示图像的特征。
传统的HOG特征在行人检测中存在一些问题,如光照变化、遮挡等因素会影响HOG特征的准确性。
为了解决这些问题,研究者们提出了一系列的改进方法。
使用多尺度的HOG特征来提取图像的特征。
由于行人在不同尺度下有不同的形状和大小,因此使用多尺度的HOG特征可以更好地描述行人的特征。
采用梯度方向直方图的归一化来减小光照变化对特征的影响。
通过对梯度方向直方图进行归一化,可以保证特征在不同光照条件下的一致性。
研究者们还引入了局部二值模式(Local Binary Patterns,LBP)来增强HOG特征的描述能力。
LBP 描述了每个像素点与其周围像素点的关系,通过将局部二值模式与HOG特征相结合,可以更好地描述行人的纹理信息。
在特征提取之后,接下来需要选择一个分类器对行人进行分类。
通常,使用支持向量机(Support Vector Machine,SVM)作为分类器。
SVM是一种常用的机器学习算法,具有良好的分类性能和泛化能力。
为了提高SVM分类器的性能,研究者们采用了一些改进策略。
采用Hard Negative Mining的方法来生成更加具有挑战性的负样本,以训练更加鲁棒的分类器。
Hard Negative Mining通过从易分类为负样本的样本中选择最难分类的样本作为负样本,可以有效提高SVM分类器的性能。
引入了级联分类器的概念。
级联分类器由多个级联的分类器组成,每个级联的分类器都有自己的区域兴趣(Region of Interest,ROI),通过级联的方式来逐步过滤掉不是行人的区域,从而提高检测速度。
几十年来,行人检测一直是研究热点。
无论是在汽车辅助驾驶、智能机器人还是视频监控领域,行人检测都有广泛的应用。
特别是近几年随着深度学习兴起,行人检测领域有了长足的发展。
传统的行人检测方法依赖于滑动窗口和手工提取特征来检测行人。
实际场景中,行人的衣着服饰颜色、动作姿态等多样,这些变化通常影响着手工特征的鲁棒性。
如何设计适应性更强的特征提取模块也是传统行人检测领域所要思考和解决的问题。
目前,基于手工提取特征和基于神经网络提取特征是行人检测领域的主流方法。
Dalal等通过刻画图像的梯度特征提出了HOG[1]特征描述子。
Viola和Jones 提出了基于Adaboost的实时目标检测方法[2]。
Spatial-Pooling[3]提出了一种空间池化的低级视觉特征。
Nam 等[4]提出了局部去相关通道特征(Local Decorrelation Channel Features,LDCF)方法,其达到了当时最优的检测效果。
近年来,基于深度学习的目标检测方法开始涌现。
RFBnet[5]提出了RFB(Receptive Field Block)卷积块并集成到SSD(Single Shot Multibox Detector)[6]网络中,增强了卷积网络的感受野。
ExtremeNet[7]提出了一种无锚框自底向上的检测网络。
ScratchDet[8]重设了SSD网络的结构,在不使用分类网络预训练权值的情况下从零开始训练网络。
M2Det[9]使用主干网的两层特征融合输入到多个级联的TUM(Thinned U-shape Modules)模块中提取最终的多尺度检测特征。
RepLoss[10]和OR-多尺度特征融合重建的行人检测方法李佐龙,王帮海,卢增广东工业大学计算机学院,广州510006摘要:行人在众多场景中都存在多尺度变化问题,严重影响检测器的精度,为此设计卷积特征重建和通道注意力两种模块来增强对多尺度行人的检测效果。
基于HOG的人体跟踪算法的研究及应用的开题报告一、研究背景随着图像和视频处理技术的发展,人体跟踪技术在安防监控、智能交通、医学图像处理等领域得到了广泛应用。
目前,常用的人体跟踪算法有基于背景建模的、基于特征提取的和基于运动模型的。
其中,基于特征提取的算法因其在不同光照、遮挡、尺度变换等情况下鲁棒性较好的特点,成为研究热点。
Histogram of Oriented Gradients (HOG)是一种经典的特征提取方法,其主要通过计算图像中局部梯度的方向直方图来描述物体的形状和外观特征。
在人体跟踪中,HOG特征可以提取出人体区域的形状、纹理和颜色等信息,进而构建人体模型以用于后续跟踪。
本文旨在探究基于HOG的人体跟踪算法的原理及实现方式,并进一步研究其在实际应用中的性能和影响因素,为相关领域的应用提供参考和支持。
二、研究内容1. HOG特征提取原理及算法实现掌握HOG特征提取的原理及提取算法,包括梯度计算、方向直方图的构建和特征描述子的生成等。
2. 基于HOG的人体跟踪算法研究以HOG特征为基础,结合其他技术如SVM分类器和卡尔曼滤波器等,研究基于HOG的人体跟踪算法的实现和优化。
3. 实验设计与数据采集在公共场所布置监控设备,采集人体数据,构建人体库并进行测试,记录算法性能数据。
4. 算法性能分析与评价通过对算法的性能指标和实际应用场景中的影响因素进行分析,最终评价基于HOG的人体跟踪算法的优缺点。
三、研究意义和创新点本文的研究将探究基于HOG的人体跟踪算法的原理及实现,结合实际数据进行算法优化和性能分析,实现了对HOG特征提取技术在人体跟踪中的应用与探索。
本研究的意义及创新点如下:1. 提供了一种新的基于HOG特征的人体跟踪算法实现方式,为人体跟踪技术的进一步发展提供了思路和方向。
2. 分析了实际应用场景中影响算法性能的因素,有助于对算法进行优化和应用时的技术调整。
3. 通过数据采集和性能评价等实验,验证了基于HOG的人体跟踪算法在实际应用中的可行性和有效性。
hog行人检测原理
HOG(HistogramofOrientedGradient)是一种用于行人检测的特征提取方法。
它的原理是基于图像中物体边缘的梯度方向进行计算,并将其转换为直方图形式,用于描述图像的局部特征。
通过对局部特征的统计分析,可以判断图像中是否存在行人。
HOG 特征提取的流程主要包括以下几个步骤:
1. 图像预处理:将图像进行灰度化、归一化和平滑化处理,以便提高计算效率和减少图像噪声对结果的影响。
2. 计算梯度幅值和方向:在图像中计算每个像素点的梯度幅值和方向,以便确定局部梯度信息。
3. 划分 cell 和块:将图像划分为多个 cell 和块,每个 cell 包含多个像素点,每个块由多个 cell 组成。
4. 统计梯度直方图:在每个 cell 中统计像素点的梯度方向,并将其转换为梯度直方图,用于描述局部特征。
在每个块中将多个cell 的梯度直方图进行归一化处理,以便提高特征的鲁棒性和可靠性。
5. 构建行人模型:通过对多个块的特征进行统计分析,构建行人模型,并使用分类器对其进行分类,以判断图像中是否存在行人。
HOG 行人检测方法具有较高的准确率和鲁棒性,在实际应用中得到了广泛应用。
它不仅可以用于行人检测,还可以应用于车辆检测、人脸识别等领域。
- 1 -。
一种基于HOG的快速人体检测方法刘东升;刘鹏鹏;王刚【摘要】Human detection based on HOG is a crucial issue in the field of human recognition. A fast HOG feature extraction algorithm is integrated, and SVM is used to train the human classifier. The experiments show that the algorithm does not reduce the detection effect, improved the speed of the human detection significantly, and has strong robustness.%Dalai等人提出的基于梯度方向直方图(HOG)的人体识别算法具有较高精度。
因此成为了人体识别领域热门研究的对象,文中提出了一种快速HOG特征提取算法,并用支持向量机(SVM)训练得到人体分类器。
实验结果表明,该算法在不降低检测效果的情况下,明显提高了人体检测的速度,且具有较强的鲁棒性。
【期刊名称】《电子设计工程》【年(卷),期】2012(020)011【总页数】3页(P190-192)【关键词】HOG;人体检测;SVM;人体分类器【作者】刘东升;刘鹏鹏;王刚【作者单位】西南技术物理研究所,四川成都610041;西南技术物理研究所,四川成都610041;西南技术物理研究所,四川成都610041【正文语种】中文【中图分类】TP391.4近年来,人体运动的视觉分析是计算机视觉领域备受关注的热门领域,人的运动分析主要涉及到模式识别、图像处理、人工智能等学科知识,在高级人机接口、安防监控、医疗诊断等方面具有广泛的应用前景和潜在的经济价值,而人体识别作为人体运动视觉分析的基础,得到了世界上广大科研工作者的关注和研究。
一种基于HOG的多清晰度模板行人检测方法
李位星;潘峰;任雪梅;马骉
【期刊名称】《计算机仿真》
【年(卷),期】2015(032)007
【摘要】行人检测是计算机视觉领域一个非常活跃的研究方向,为消除HOG特征提取过程中混叠现象对行人检测的影响,在特征提取过程中采用三线性插值技术;为解决待检测图像上采样过程会造成原始图像模糊而影响提取到的HOG特征不能完整描述行人的问题,提出一种基于多清晰度模板的分类器训练方法,首先对测试样本进行模糊处理,然后再提取HOG特征进行分类器训练用于行人检测.在INRIA行人检测库和自建的行人库进行了广泛的实验,仿真结果表明在窗口误检率(FPPW)为10-5量级时,将漏检率降低到了15%;在640*480的图像分辨率下检测时间控制在0.5s内.
【总页数】4页(P398-401)
【作者】李位星;潘峰;任雪梅;马骉
【作者单位】北京理工大学自动化学院,北京100081;北京理工大学自动化学院,北京100081;北京理工大学自动化学院,北京100081;北京理工大学自动化学院,北京100081
【正文语种】中文
【中图分类】TP391.9
【相关文献】
1.基于显著性检测与HOG-NMF特征的快速行人检测方法 [J], 孙锐;陈军;高隽
2.基于HOG特征的行人视觉检测方法 [J], 程广涛;陈雪;郭照庄
3.一种基于HOG和颜色自相似性特征的行人检测方法 [J], 张金慧;吴斌;邵延华
4.基于边缘对称性和HOG的行人检测方法 [J], 姚雪琴;李晓华;周激流
5.基于多尺度-多形状HOG特征的行人检测方法 [J], 牛杰;钱堃
因版权原因,仅展示原文概要,查看原文内容请购买。