当前位置:文档之家› 自适应Harris特征点检测算法在奶牛形体图像处理中的应用

自适应Harris特征点检测算法在奶牛形体图像处理中的应用

自适应Harris特征点检测算法在奶牛形体图像处理中的应用
自适应Harris特征点检测算法在奶牛形体图像处理中的应用

第30卷 第4期2009年12月

内蒙古农业大学学报

J o u r n a lo f I n n e r M o n g o l i a A g r i c u l t u r a l U n i v e r s i t y

V o l.30 N o.4

D e c.2009

自适应H a r r i s特征点检测算法在

奶牛形体图像处理中的应用*

王立中1,3, 麻硕士2*, 薛河儒3, 侯振杰3

(1. 内蒙古农业大学职业技术学院,包头 014100;2.内蒙古农业大学机电工程学院,呼和浩特 010018;

3. 内蒙古农业大学计算机与信息工程学院,呼和浩特 010018)

摘要: 针对奶牛形体图像特性,分析H a r r i s特征点检测算法的应用和不足,提出1种自适应的H a r r i s特征点检测算法,解决了特征点聚簇现象,检测出的特征点分布均匀。实验结果表明,该算法具有精确性、有效性和鲁棒性,为进一步的图像三维重建提供保证。

关键词: 奶牛体型; 特征点检测; H a r r i s算法;

中图分类号: T P391.4 文献标识码: A 文章编号:1009-3575(2009)04-0230-04

A P P L I C A T I O NO FS E L F-A D A P T I V EH A R R I SF E A T U R E

P O I N TD E T E C T I O NA L G O R I T H M I NC O W

C O N F O R M A T I O NI M A G EP R O C E S S I N G

W A N GL i-z h o n g1,3, M AS h u o-s h i2*, X U EH e-r u3, H O U-Z h e n-j i e3

(1. V a c a t i o n a l a n dT e c h n i c a l C o l l e g e,I n n e r M o n g o l i aA g r i c u l t u r e U n i v e r s i t y,B a o t o u014100,C h i n a;

2. C o l l e g e o f M e c h a n i c a l a n d E l e c t r i c a l E n g i n e e r i n g,I n n e r M o n g o l i a A g r i c u l t u r e U n i v e r s i t y,H o h h o t010018,C h i n a;

3. C o l l e g e o f C o m p u t e r a n d I n f o r m a t i o nE n g i n e e r i n g,I n n e r M o n g o l i a A g r i c u l t u r e U n i v e r s i t y,H o h h o t010018,C h i n a)

A b s t r a c t: Ak i n do f s e l f-a d a p t i v e H a r r i s F e a t u r e p o i n t d e t e c t i o na l g o r i t h mb a s e do n t h e c o wc o n f o r m a t i o nf e a t u r e i s p r o p o s e db y a n-a l y z i n g t h e a p p l i c a t i o n a n dd i s a d v a n t a g e o f H a r r i s a l g o r i t h m.I t m a k e s t h e f e a t u r e p o i n t s w e l l-p r o p o r t i o n e d d i s t r i b u t i n g,a n d a v o i d s t o o m a n y f e a t u r e p o i n t s s t a y e dt o g e t h e r.E x p e r i m e n t s d e m o n s t r a t e t h a t t h i s a l g o r i t h mh a s a g o o d p e r f o r m a n c e o f a c c u r a c y e f f i c i e n c y a n d r o-b u s t n e s s,a n d c a np r o v i d eg u a r a n t e e f o r3Dr e c o n s t r u c t i o n.

K e yw o r d s: C o wc o n f o r m a t i o n; f e a t u r ep o i n t d e t e c t i o n; h a r r i s a l g o r i t h m;

特征点检测是奶牛图像三维重建[1]的基础。图像平面内亮度沿不同方向上变化较大的局部极值点称为特征点[2],其作为图像的局部特性是最常用也是相对简单的匹配基元。特征点在不同的几何变换下均能保持良好的几何稳定性为相机定标的求解和多视点几何关系提供可靠而足够的约束条件[3]。

特征点检测方法主要分为:(1)基于模板匹配的特征点检测;(2)基于边缘检测的特征点检测;(3)基于亮度变化的特征点检测[4]。第(1)种方法因为特征点大量的特征(点度、边缘的梯度、内角度),很难设计出大量模板来匹配所有类型的特征点。所以在复杂图像中这种方法是不可行的。第(2)类方法因依赖图像边缘检测,检测精度不高。第(3)类方法利用特征点本身的特点直接提取特征点,不依赖于图像的其它局部特征,实验证明这类算法速度快、实时性强。目前此类方法主要有H a r r i s算子、M o r a v e c 算子及S u s a n算子等。实验证明,效果最好的是H a r r i s特征点检测法。而阈值T的选择是H a r r i s检

*收稿日期: 2009-06-17

基金项目: 内蒙古自治区基本建设农口重点项目(内蒙古发改委20081715)

作者简介: 王立中(1972-),男,副教授,博士,主要从事计算机图像处理及应用的研究.

*通讯作者 

测法得到较理想的特征点的前提,针对不同的图像属性,阈值的选择多是经验性的、试探性的。T选择的较低,特征点分布总体均匀,但往往特征点紧挨在一起,产生聚簇现象,T选择的较高,检测出的特征点分布不均匀,特征值较大的点只集中在少数区域,这些都严重影响进一步特征点的匹配[5]。

1 H a r r i s特征点检测

1.1 检测原理

H a r r i s特征点检测算法的思想是:在图像中设计1个局部检测窗口w,当该窗口沿各个方向作微小移动(x,y)时,考察窗口的平均能量变化,当该能量变化值超过设定的阈值时,就将窗口的中心像素点提取为特征点。其灰度强度变化[6]表示为:E x,y=∑[I x+u,y+v-I u,v]2=∑

u,v

W u,v[x X+y Y+O(x2,y2)]2

=A x2+2C x y+B y2=(x,y)M(x,y)T

其中,X和Y是一阶灰度梯度:

X=I

x

=I(-1,0,1)

Y=I

Y

=I(-1,0,1)

为提高抗噪能力,选用如下高斯窗口进行高斯平滑: w u,v=e x p[-1

2

(u2+v2)/δ2]

定义:

A=x2w,B=y2w,C=(X Y)w,M=A C C B

设λ1和λ2分别是M的2个特征值,与局部自相关函数的主曲率有比例关系,故λ1和λ2构成对M的1个旋转不变数。可以根据λ1和λ2的值去判断平坦区,边沿和特征点,分如下3种情况:

(1)λ1和λ2都很小,即两个曲率都很小,表明局部自相关函数很平坦;

(2)λ1和λ2中1个大1个小,即1个曲率大,另1个曲率小,表明局部自相关函数呈山脊状,E沿着山脊的变化很小,垂直于山脊的变化很大,则该处为1个边沿;

(3)λ1和λ2都很大,即两个曲率都很大,表明局部自相关函数有1个尖峰,E沿各个方向的变化都很大,则该处为1个特征点。

H a r r i s特征点定义为下式的局部区域最大值:

R=D e t(M)-k T r2(M)

D e t(M)=λ1λ2=A B-C2

T r(M)=λ1+λ2=A+B

其中,D e c(M)表示矩阵M的行列式值; T r(M)表示矩阵M的迹;k值一般使用0.04。则特征点相应函数定义为:

R=A B-C2-k(A+B)2

1.2 算法步骤

使用H a r r i s算法提取图像特征点算法可以分为以下步骤:

(1)计算图像中各像素点在水平方向上的梯度

I x和垂直方向上的梯度I y,以及两者的乘积I x I y,得到矩阵M:

M=

I2x I x I y

I x I y I2y

(2)对图像高斯滤波后得到新的M

离散二维零均值高斯函数为:

G a i s s=e x p(-(x2+y2)/(2σ2))

(3)计算图像上每个像素点的兴趣值R

R=[I2x×I2y-(I x,I y)2]-k[I2x+I2y]2

(4)选取局部极值点。H a r r i s算法中,特征点是局部范围内兴趣值R大的像素点。

(5)设置适当的阈值T去选取一定数量的特征点。

2 自适应H a r r i s特征点检测算法

2.1 算法思想

H a r r i s算法进行特征点检测时,阈值的设定是经验性的。应用于多数普通图像时效果不理想,其需要的特征点参考值数量也存在不确定性[7]。本文算法采用图像分块和自动迭代筛选阈值,在进行特征点检测之前先对图像进行分块处理,以保证特征点分布均匀。分块时不采用固定单位边长的方法,而采用固定块数的分块方法,以保证处理不同大小的图像时达到同样的效果。当特征点检测完成后,对于每个图像块,自动选取阈值T提取一定数量的特征点。当所有图像块都按上述方法处理后,图像各个区域中值R较大的特征点均已被检测出并保留,实现了检测出的特征点分布的均匀性[8,9]。

2.2 算法描述

由以上分析,本文提出的自适应H a r r i s特征点检测算法如下:

(1)计算图像中的每个像素点水平和垂直方向上的梯度及两者的乘积,得到矩阵M。

231

第4期 王立中等: 自适应H a r r i s特征点检测算法在奶牛形体图像处理中的应用

(2)对图像高斯滤波后求出新的M ,并计算每个像素点的R 值。

(3)计算原始图像的长A 和宽B ,将原始图像分为a ×b 个矩形块,并保持A /a =B /b 。

(4)检测每一图像块中存在的特征点,选择不同的初始阈值T ,每个图像块中的特征点数目可能相差较大。设定每个图像块需保留的特征点数目最多P 个,采用二分法迭代选取阈值T ,使最终选取的T 能保证该图像块中的特征点数目在[0,P ]中。并记录特征点的行值r 和列值c 。

(5)计算每个图像块中得到的行值r 和列值c ,并计算其在原始图像中的行值和列值。

3 实验结果与分析

将本文算法与原算法的应用效果进行了比较,以验证本文算法对奶牛形体图像特征点检测的有效性,实验中所用的图像大小均为552×552。图1为原始图像

:

图1 原图像F i g .1O r i g i n a l i m a g

e

图2 T=6000检测结果F i g .2D e t e c t i o nr e s u l t w h e nT =4000

图2为使用原算法T=6000处理后得到的结果,共检测到65个特征点。因T 值选取的较大,特

征点集中在图像小部分区域,不能表征整个图像的特征

图3 T =2000检测结果

F i g .3D e t e c t i o nr e s u l t w h e nT =2000

图3为使用原算法T=2000处理后得到的结果,共检测到260个特征点。随着T 值降低,检测到的特征点数量显著增加,但仍然是集中图像小部分区域,产生聚簇现象,仍然不能很好地表征整个图像的特征

图4 T=100检测结果F i g .4D e t e c t i o nr e s u l t w h e nT =

100

图5 本文算法检测结果F i g .5D e t e c t i o nr e s u l t u s i n g t h i s a l g o r i t h m

图4为使用原算法T =100处理后得到的结果,共检测到829个特征点。T 值取到100时,特征点分

232

内蒙古农业大学学报 2009年

布在图像大部分区域,能表征整个图像的特征,但特征点数量太大,聚簇现象也更加严重。数据冗余度太大。

图5为使用本算法将整个图像分为64个图像块,P取值为5处理后得到的结果,共检测到244个特征点。能表征整个图像的特征,特征点数量较小,聚簇现象也减轻。

以上各图比较可知,达到表征原图像各区域的基本特征时,本算法较原算法需要检测的特征点数量大幅减小,大大减轻数据的冗余度。检测到的数量相近特征点时,本算法较原算法检测到的特征点分布均匀,如图3使用原算法检测到260个特征点,但集中分布在牛的口鼻耳处,图5检测到244个特征点,却分布在牛体型图像的各个部分,能代表原图像各区域的基本特征。

4 结束语

在保持H a r r i s特征点检测算法计算简便性和稳定性的前提下,本文算法针对奶牛形体图像进行特征点检测,改进了原算法中经验性选取阈值的不足,使得到的特征点定位精确,分布均匀,区域可控,数量可控,有效减轻了数据冗余和聚簇的现象,在奶牛图像特征点检测中效果显著,抗噪能力较强。检测到的特征点能较好的表征原图像特征。参 考 文 献:

[1] S H e n H T,H u W C.A R o t a t i o n a l l y I n v a r i a n t T w o-p h a s e

S c h e m ef o rC o r n e rD e t e c t i o n〔J〕.P a t t e r nR e c o g n i t i o n,

1996,29(5):819-828.

[2] Z h o uJ i,S h i J i a o y i n g.Ar o b u s t a l g o r i t h m f o r f e a t u r ep o i n t

m a t c h i n g〔J〕.C o m p u t e r s&G r a p h i c s,2002,26:429-

436.

[3] 张春森.基于点特征匹配的S U S A N,H a r r i s算子比较

〔J〕.西安科技大学学报,2007,V o l.27(4):608-616 [4] 张春美,龚志辉,黄艳.几种特征点提取算法的性能评

估及改进〔J〕.测绘科学技术学报,2008,V o l.5(3):231

-234.

[5] 王玉珠,杨丹,张小洪.基于B样条的改进型H a r r i s角

点检测算法〔J〕.计算机应用研究,2007,2:192-194. [6] 陈白帆,蔡自兴.基于尺度空间理论的H a r r i s角点检测

〔J〕.中南大学学报(自然科学版),2005,V o l.36(5):

751-754.

[7] 李博,杨丹,张小洪.基于H a r r i s多尺度角点检测的图

像配准新算法〔J〕.计算机工程与应用,2006,35:37-

40.

[8] 赵万金,龚声蓉,刘纯平.一种自适应的H a r r i s角点检

测算法〔J〕.计算机工程,2008,V o l.34(10):212-217.

[9] 彭勃,周文晖,刘济林.基于H a r r i s角点检测的立体视

觉里程计〔J〕.兵工学报,2007,V o l.28(12):1498-

1502.

233

第4期 王立中等: 自适应H a r r i s特征点检测算法在奶牛形体图像处理中的应用

交通道路标志牌检测与识别综述.

交通道路标志牌检测与识别综述 一、背景综述 随着社会科技不断发展和进步,车辆已经普及到国内大部分家庭。汽车的普及极大方便了人们的出行、生活和工作,同时也不可避免的产生了很多的交通问题。据公安部交通管理局统计,2014年1月至10月,全国共发生道路交通事故426378起,造成87218人死亡、391752人受伤,直接财产损失20.2亿元。交通安全问题成为人们日常生活中最常见的问题之一,受到了政府、科研机构以及汽车生产厂家的高度重视。 解决交通安全问题的途径之一是准确、有效地设立道路交通标志,为驾驶员提供丰富的禁令、警告、指示等信息,从而起到减少交通事故的作用。为了确保交通标志的信息能够及时、准确地传达,交通标志自动识别系统(Traffic Sign Recognition,TSR)受到了各国学者的关注,其主要功能表现在以下几个方面: (1)用于驾驶辅助。交通标志识别的概念最早就是作为驾驶辅助工具被提出的。TSR系统在识别出交通标志后,可对驾驶员进行语音或视频等方式的提醒,甚至可以在必要的时候对车辆驾驶系统直接做出控制,从而确保驾驶安全。 (2)用于交通标志维护。由于交通标志通常放置于室外环境中,受自然环境(如风吹雨淋)及人为因素(如涂抹)影响,难免出现褪色、变形甚至坠落失踪现象,需要进行定期检查维护。通常,这一工作需安排专人专岗,工作量巨大且很难保证实时性和准确性。显然,一个有效的TSR系统是完成这一工作的理想方案。 (3)用于无人驾驶技术。无人驾驶汽车在近年来受到了越来越多的关注。从上世纪90年代起,国内外相继研发出了一系列无人驾驶汽车,其智能化逐渐提高,能够自动规划路线,避让障碍物等。使无人驾驶汽车具备辨认交通标志的能力显然是使其实用化的一个重要步骤。 TSR在计算机领域中是一个非常重要的分支研究领域,而图像检测以及处理是其主要手段,这是一个难度比较大的实景图形识别问题。在车载视觉系统中,如何有效地识别道路交通标志是一个非常重要的研究课题。 TSR包括三个重要模块:图像复原、标志检测、标志分类。交通标志的外观

数字图像处理算法汇总

形态学运算:基本思想是具用一定结构形状的结构元素去度量和提取图像中的对应形状以达到对图像分析和识别的目的。 腐蚀运算:将结构元素中心遍历整个图像,当图像完全包含结构元素时的中心点的轨迹即为腐蚀后的图像,图像变细。腐蚀运算可用于滤波,选择适当大小和形状的结构元素,可以滤除掉所有不能完全包含结构元素的噪声点。当然利用腐蚀滤除噪声有一个缺点,即在去除噪声的同时,对图像中前景物体形状也会有影响,但当我们只关心物体的位置或者个数时,则影响不大。 膨胀运算:将结构元素中心遍历整个图像边缘,中心点的轨迹即为腐蚀后的图像,图像整体变粗。通常用于将图像原本断裂开来的同一物体桥接起来,对图像进行二值化之后,很容易是一个连通的物体断裂为两个部分,而这会给后续的图像分析造成干扰,此时就可借助膨胀桥接断裂的缝隙。 开运算:先腐蚀后膨胀,可以使图像的轮廓变得光滑,还能使狭窄的连接断开和消除细毛刺;但与腐蚀运算不同的是,图像大的轮廓并没有发生整体的收缩,物体位置也没有发生任何变化。可以去除比结构元素更小的明亮细节,同时保持所有灰度级和较大亮区特性相对不变,可用于补偿不均匀的背景亮度。与腐蚀运算相比,开运算在过滤噪声的同时,并没有对物体的形状轮廓造成明显的影响,但是如果我们只关心物体的位置或者个数时,物体形状的改变不会给我们带来困扰,此时腐蚀滤波具有处理速度上的优势。 闭运算:先膨胀后腐蚀,可以去除比结构元素更小的暗色细节。开闭运算经常组合起来平滑图像并去除噪声。可使轮廓变的平滑,它通常能弥合狭窄的间断,填补小的孔洞。腐蚀运算刚好和开运算相反,膨胀运算刚好和闭运算相反,开闭运算也是对偶的,然而与腐蚀、膨胀不同的是,对于某图像多次应用开或闭运算的效果相同。 击中击不中运算:先由结构元素腐蚀原图像,再将结构元素取反去腐蚀原图像的取反图,最后将两幅处理后的图像取交。主要用于图像中某些特定形状的精确定位。 顶帽变换:原图像减去开运算以后的图像。当图像的背景颜色不均匀时,使用阈值二值化会造成目标轮廓的边缘缺失,此时可用开运算(结构元素小于目标轮廓)对整个图像背景进行合理估计,再用原图像减去开运算以后的图像就会是整个图像的灰度均匀,二值化后的图像不会有缺失。 Sobel算子: Prewitt算子: LOG算子: Canny算子:力图在抗噪声干扰和精确定位之间尊求折中方案,主要步骤如下所示: 1、用高斯滤波器平滑图像; 2、用一阶偏导的有限差分来计算梯度的幅值和方向; 3、对梯度幅值进行非极大值抑制; 4、用双阈值算法检测和连接边缘。 Hough变换: 边缘检测:

目标跟踪相关研究综述

Artificial Intelligence and Robotics Research 人工智能与机器人研究, 2015, 4(3), 17-22 Published Online August 2015 in Hans. https://www.doczj.com/doc/9b6633133.html,/journal/airr https://www.doczj.com/doc/9b6633133.html,/10.12677/airr.2015.43003 A Survey on Object Tracking Jialong Xu Aviation Military Affairs Deputy Office of PLA Navy in Nanjing Zone, Nanjing Jiangsu Email: pugongying_0532@https://www.doczj.com/doc/9b6633133.html, Received: Aug. 1st, 2015; accepted: Aug. 17th, 2015; published: Aug. 20th, 2015 Copyright ? 2015 by author and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). https://www.doczj.com/doc/9b6633133.html,/licenses/by/4.0/ Abstract Object tracking is a process to locate an interested object in a series of image, so as to reconstruct the moving object’s track. This paper presents a summary of related works and analyzes the cha-racteristics of the algorithm. At last, some future directions are suggested. Keywords Object Tracking, Track Alignment, Object Detection 目标跟踪相关研究综述 徐佳龙 海军驻南京地区航空军事代表室,江苏南京 Email: pugongying_0532@https://www.doczj.com/doc/9b6633133.html, 收稿日期:2015年8月1日;录用日期:2015年8月17日;发布日期:2015年8月20日 摘要 目标跟踪就是在视频序列的每幅图像中找到所感兴趣的运动目标的位置,建立起运动目标在各幅图像中的联系。本文分类总结了目标跟踪的相关工作,并进行了分析和展望。

图像中角点(特征点)提取与匹配算法

角点提取与匹配算法实验报告 1 说明 本文实验的目标是对于两幅相似的图像,通过角点检测算法,进而找出这两幅图像的共同点,从而可以把这两幅图像合并成一幅图像。 下面描述该实验的基本步骤: 1.本文所采用的角点检测算法是Harris 角点检测算法,该算法的基本原理是取以目标像素点为中心的一个小窗口,计算窗口沿任何方向移动后的灰度变化,并用解析形式表达。设以像素点(x,y)为中心的小窗口在X 方向上移动u ,y 方向上移动v ,Harris 给出了灰度变化度量的解析表达式: 2 ,,|,|,,()(x y x y x u y v x y x y I I E w I I w u v o X Y ??= -=++??∑∑ (1) 其中,,x y E 为窗口内的灰度变化度量;,x y w 为窗口函数,一般定义为2 2 2 ()/,x y x y w e σ +=; I 为图像灰度函数,略去无穷小项有: 222222 ,,[()()2]2x y x y x y x y E w u I v I uvI I Au Cuv Bv = ++=++∑ (2) 将,x y E 化为二次型有: ,[]x y u E u v M v ?? =???? (3) M 为实对称矩阵: 2 ,2 x y x x y x y y I I I M w I I I ???= ???????∑ (4) 通过对角化处理得到: 11 ,200x y E R R λλ-??= ??? (5) 其中,R 为旋转因子,对角化处理后并不改变以u,v 为坐标参数的空间曲面的形状,其特征值反应了两个主轴方向的图像表面曲率。当两个特征值均较小时,表明目标点附近区域为“平坦区域”;特征值一大一小时,表明特征点位于“边缘”上;只有当两个特征值均比较大时,沿任何方向的移动均将导致灰度的剧烈变化。Harris 的角点响应函数(CRF)表达式由此而得到: 2 (,)det()(())C RF x y M k trace M =- (6)

图像局部特征点检测算法综述

图像局部特征点检测算法综述 研究图像特征检测已经有一段时间了,图像特征检测的方法很多,又加上各种算法的变形,所以难以在短时间内全面的了解,只是对主流的特征检测算法的原理进行了学习。总体来说,图像特征可以包括颜色特征、纹理特等、形状特征以及局部特征点等。其中局部特点具有很好的稳定性,不容易受外界环境的干扰,本篇文章也是对这方面知识的一个总结。 本篇文章现在(2015/1/30)只是以初稿的形式,列出了主体的框架,后面还有许多地方需要增加与修改,例如2013年新出现的基于非线性尺度空间的KAZE特征提取方法以及它的改进AKATE等。在应用方面,后面会增一些具有实际代码的例子,尤其是基于特征点的搜索与运动目标跟踪方面。 1. 局部特征点 图像特征提取是图像分析与图像识别的前提,它是将高维的图像数据进行简化表达最有效的方式,从一幅图像的M×N×3的数据矩阵中,我们看不出任何信息,所以我们必须根据这些数据提取出图像中的关键信息,一些基本元件以及它们的关系。 局部特征点是图像特征的局部表达,它只能反正图像上具有的局部特殊性,所以它只适合于对图像进行匹配,检索等应用。对于图像理解则不太适合。而后者更关心一些全局特征,如颜色分布,纹理特征,主要物体的形状等。全局特征容易受到环境的干扰,光照,旋转,噪声等不利因素都会影响全局特征。相比而言,局部特征点,往往对应着图像中的一些线条交叉,明暗变化的结构中,受到的干扰也少。 而斑点与角点是两类局部特征点。斑点通常是指与周围有着颜色和灰度差别的区域,如草原上的一棵树或一栋房子。它是一个区域,所以它比角点的噪能力要强,稳定性要好。而角点则是图像中一边物体的拐角或者线条之间的交叉部分。 2. 斑点检测原理与举例 2.1 LoG与DoH 斑点检测的方法主要包括利用高斯拉普拉斯算子检测的方法(LOG),以及利用像素点Hessian矩阵(二阶微分)及其行列式值的方法(DOH)。 LoG的方法已经在斑点检测这入篇文章里作了详细的描述。因为二维高斯函数的拉普拉斯核很像一个斑点,所以可以利用卷积来求出图像中的斑点状的结构。 DoH方法就是利用图像点二阶微分Hessian矩阵:

行为识别国内外现状

1.原始视频的特征提取 (1)光流场 光流场是空间运动物体在观测成像面上像素运动的瞬时速度。它利用图像序列中的像素强度数据的时域变化和相关性来研究图像的灰度在时间上的变化与场景巾物体结构及其运动的关系。光流法通常假设相邻帧的图像差异非常小,从而获取对真实运动场的近似估计【31。它不用预知任何先验知识,即能提供有关运动速度及图像中运动区域的简洁描述,适用于摄像机运动的情形。但光流法易受噪声及光照变化的影响,且计算较为复杂,很难用于实时的视频监控系统。 (2)点轨迹 目标的运动轨迹也可以作为特征,从而大致推断出目标运动所属的行为类别。但图像平面上的轨迹对平移、旋转和缩放等变换比较敏感,因此在大多情形下,此特征显得不够可靠。常用的替代特征表达有轨迹速度、时空曲率等【4,51。运动轨迹的获取比较依赖于精确的跟踪算法。从原始视频中提取点轨迹特征同样容易受到噪声、遮挡及混乱背景等的影响。(3)人体形状表达 在摄像机固定的情形下,假设背景已知,通过背景剪除法可以很容易得到运动人体形状。基于全局、边界及骨架等的描绘子都可以用来表达人体形状。全局方法16,71如剪影、矩等是在整体形状区域内计算描绘子,而边界方法仅考虑形状轮廓【8l,骨架i方法则是用一组lD 骨架曲线代表一个复杂的人体形状,比如中轴变换[91等。 (4)滤波器响应 空时滤波器响应是一个广义上的分类。Zhang等【lo】存时间轴上计算高斯导数,将滤波器响应较高的区域作为运动区域。LaptevI¨1利用一组空时高斯导数滤波器将Harris角点检测扩展应用于三维的视频数据从而检测出空时兴趣点。这类方法大都基于简单的卷积操作,运算快速而简便。当视频分辨率较低的情形下,提取光流或剪影特征较为困难,利用滤波器响应特性可以从视频数据中提取有效的底层特征。 2.低层特征的描述与识别 我们将低层特征的描述与识别方法分为三类①:非参数方法、空时体方法和参数时序法,分别对现有方法进行归类,并作一个简短的综述。 2.1非参数方法 (1)模板匹配法 这类方法需要对每种行为的特征建立相应的模板,将获取的特征数据与模板相匹配,通过计算两者之间的相似度进行识别。Polana和Nelson[4刀将整个序列分解为多个周期行为,利用二维网格特征识别各种行为。Bobick和Davis[391将图像序列转换为运动能量图像(膨酣)和运动历史图像(朋m)模板,MEI反映运动覆盖的范围及强度,而MHI反映运动在时间上的变化情况。Weinland等【拍】提出运动历史体积(MHV)模板,从多个视角重建目标并将其投影到圆柱坐标系,提取Fourier变换特征以描述行为。Wang和Suter[451也将整个行为过程融合为基于轮廓的平均运动形状(MMS)和基于运动前景的平均运动能量(彳^扭)两个模板。模板匹配法计算复杂度低、实现简单,但它本身无法描述动态系统,也不能完全反映数据在空问上的分布属性,具有一定的局限性。而且不同行为之间执行速率的不同、噪声、光照等因素都会影响模板匹配的准确性。 (2)目标建模法 行为可以通过建立人体动态表观模型进行描述。常见的人体模型有棍图模型【109]、2D模型例及3D模型51。3D人体建模是最常用的人体结构表征方法,通过跟踪人体模型中主要

数字图像处理计算题复习精华版

30452 计算题复习
一、 直方图均衡化(P68)
对已知图像进行直方图均衡化修正。
例:表 1 为已知一幅总像素为 n=64×64 的 8bit 数字图像(即灰度级数为 8),各灰度级(出现的频率)分布
列于表中。要求将此幅图像进行均衡化修正(变换),并画出修正(变换)前后的直方图。
表1
原图像灰
度级 rk
r0=0 r1=1 r2=2 r3=3 r4=4 r5=5 r6=6 r7=7
原各灰度级 原分布概率
像素个数 nk pr(rk)
790
0.19
1023
0.25
850
0.21
656
0.16
329
0.08
245
0.06
122
0.03
81
0.02
解:对已知图像均衡化过程见下表:
原图像灰
度级 rk
原各灰度级 原分布概率 累积分布函
像素个数 nk
pr(rk)
数 sk 计
取整扩展
sk 并
r0=0
790
0.19
0.19
1
r1=1
1023
0.25
0.44
3
r2=2
850
0.21
0.65
5
r3=3
656
0.16
0.81
6
r4=4
329
0.08
0.89
6
r5=5
245
0.06
0.95
7
r6=6
122
0.03
0.98
7
r7=7
81
0.02
1.00
7
画出直方图如下:
确定映射 对应关系
rk→sk
0→1 1→3 2→5 3→6 4→6 5→7 6→7 7→7
新图像灰
度级 sk
1 3 5
新图像各灰 度级像素个
数 nsk
790 1023 850
新图像分 布概率
ps(sk)
0.19 0.25 0.21
6
985
0.24
7
448
0.11
1

图像处理之三种常见双立方插值算法

图像处理之三种常见双立方插值算法 图像处理之三种常见双立方插值算法双立方插值计算 涉及到16个像素点,其中(i’, j’)表示待计算像素点在源图像 中的包含小数部分的像素坐标,dx表示X方向的小数坐标,dy表示Y方向的小数坐标。具体可以看下图: 根据上述图示与双立方插值的数学表达式可以看出,双立方插值本质上图像16个像素点权重卷积之和作为新的像素值。其中R(x)表示插值表达式,可以根据需要选择的表达式不同。常见有基于三角取值、Bell分布表达、B样条曲线表达式。1. 基于三角形采样数学公式为 最简单的线性分布,代码实现如下:[java] view plain copy private double triangleInterpolation( double f ) { f = f / 2.0; if( f < 0.0 ) { return ( f + 1.0 ); } else { return ( 1.0 - f ); } } 2.基于Bell分布采样的数学公式如下: Bell分布采样数学公式基于三次卷积计算实现。代码实现如下:[java] view plain copy private double bellInterpolation( double x ) { double f = ( x / 2.0 ) * 1.5; if( f > -1.5 && f < -0.5 ) { return( 0.5 * Math.pow(f + 1.5, 2.0)); } else if( f > -0.5 && f < 0.5 )

SUSAN检测算法概述

SUSAN检测算法 检测算法概述 概述 概述 SUSAN算法是1997年英国牛津大学的Smith等人提出的一种处理灰度图像的方法。探测算子的基本原理是:与每一图像点相关的局部区域具有相同的亮度。下面介绍SUSAN角点检测准则。 1SUSAN算子 将位于圆形窗口模板中心等待检测的象素点称为核心点。假设图像中无纹理存在,称与核心点具有一样的灰度值的区域为USAN(Univalue Segment Assimilting Nucleus)。 图(1)给出了USAN的三种典型形状: 图(1) 由图(1)可以清楚的看到,当核心点位于USAN区域内时,USAN区域面积最大;当核心点位于边 缘时,USAN区域相当于整个领域面积的一半;当核心点的USAN区域最小时,核心点是角点。利用这个原理,Smith等人提出了最小核心值相似区域 (SUSAN,Smallest Univalue Segment Assimilating Nucleus )的角点检测算法。 SUSAN算子使用的是圆形模板进行角点检测,一般使用的模板的半径为3~4个像素,如图(2)所示。

图(2) SUSAN圆形模板 将模板中的各点亮度与核心点的亮度利用下面的函数进行比较, (1) 在上式中 为图像中像素 的灰度值, t为灰度差别的阈值, 为模板中心的像素, 为其他的像素, C为比较函数。模板中所有的像素都用这个函数进行比较,然后 计算 出函数C的和值n。 (2) 和值n就是USAN(univalue segment assimilating nucleus)区域的像素个数,就是USAN区域的面积,然后把这个面积和几何阈值进行比较,得到最后的响应函数: (3) 上式中,R为响应函数,g为阈值,通常在探测角点时取值为1/2模板的像素个数,当采用7×7的模板时,g=37×1/2。

Harris角点检测算法编程步骤及示例演示

Harris角点检测算法编程步骤及示例演示 也不说那么多废话了,要介绍啥背景意义之类的,角点检测,顾名思义,就是检测角点,最简单的就是两条线的交点了,还有比如下国际象棋的棋盘格子的交点之类的,反正就是检测这些点。 简单将Harris角点检测算法的思想说下,就是拿一个小窗在图像中移动,通过考察这个小窗口内图像灰度的平均变换值来确定角点。(1)如果窗口内区域图像的灰度值恒定,那么所有不同方向的偏移几乎不发生变化; (2)如果窗口跨越一条边,那么沿着这条边的偏移几乎不发生变化,但是与边垂直的偏移会发生很大的变化; (3)如果窗口包含一个孤立的点或者角点,那么所有不同方向的偏移会发生很大的变化。 下面给出具体数学推导: 设图像窗口平移量为(u,v),产生的灰度变化为E(u,v), 有E(u,v)=sum[w(x,y)[I(x+u,y+v)-I(x,y)]^2],其中w(x,y)为窗口函数, I(x+u,y+v)为平移后的灰度值,I(x,y)为平移前的灰度值。 有泰勒公式展开可得: I(x+u,y+v)=I(x,y)+Ix*u+Iy*v+O(u^2,v^2); Ix,Iy分别为偏微分,在图像中为图像的方向导数. 因此E(u,v)=sum[w(x,y) [Ix*u+Iy*v+O(u^2,v^2)]^2], 可以近似得到E(u,v)=sum[w(x,y) [Ix*u+Iy*v]^2],即 E(u,v)=[u,v][Ix^2,Ix*Iy;Ix*Iy,Iy^2][u,v]T

令M=[Ix^2,Ix*Iy;Ix*Iy,Iy^2],因此最后对角点的检测成了对矩阵M的特征值的分析了,令M其特征值为x1,x2; 当x1>>x2或者x2>>x1,则检测到的是边缘部分; 当x1,x2都很小,图像窗口在所有移动的方向上移动灰度级都无明显变化. 当X1,X2都很大时且相当,检测到的是角点。 编程时用x1,x2不方便,因此定义角点响应函数; R=det(M)-k(trace(M))^2; 其中det(M)为矩阵M的行列式,trace(M)为矩阵M的迹。 下面给出更具数学公式实际编程的步骤: 1.利用水平,竖直差分算子对图像的每个像素进行滤波以求得 Ix,Iy,进而求得M中的四个元素的值。 M=[Ix^2,Ix*Iy;Ix*Iy,Iy^2] 2.对M的四个元素进行高斯平滑滤波,为的是消除一些不必要 的孤立点和凸起,得到新的矩阵M。 3.接下来利用M计算对应每个像素的角点响应函数R,即: R=det(M)-k(trace(M))^2; 也可以使用改进的R: R=[Ix^2*Iy^2-(Ix*Iy)^2]/(Ix^2+Iy^2);里面没有随意给定的参数k,取值应当比第一个令人满意。 4.在矩阵R中,同时满足R(i,j)大于一定阈值threshold和R(i,j)

基本图像处理算法的优化分析

基本图像处理算法的优化分析 摘要数字视频图像处理技术已经被广泛地应用到各个领域内,并取得了良好效果。但是就现状来看,以往所应用的基于通用CPU的图像处理系统已经无法完全满足现在所需,还需要在原有基础上来对基本图像处理算法进行优化,以求更好地提高数字图像处理速度。 关键词图像处理;算法优化;GPU 基于处理图像幅度的不断加大,以及像元密集度的逐渐增加,图像处理算法所需要面对的情况更为复杂,传统基于CPU的数字图像处理算法已经无法满足实时性要求。将GPU作为基础,基于其可编程性特点,加强对其的研究,通过其来实现对图像处理算法的优化设计,提高图像处理综合效果。 1 图像处理技术分析 图像为传递信息的重要媒介,同时也是获取信息的重要方式,因此图像处理技术在持续研究以及不断更新,实现对模拟图像处理以及数字图像处理。模拟图像处理即图像明暗程度与空间坐标处于连续状态时,无法通过计算机来对其进行处理,必须要通过光学或者电子手段处理。数字图像处理则是对图像进行简单的采样与量化处理后,通过计算机以及其他实时硬件来处理图像信息。相比来看,模拟图像处理技术具有更强灵活性,但是处理精度较低。相反数字图像处理精度高且具有较强变通能力,逐渐发展成现在主要图像处理技术。基于计算机技术、数字成像技术以及人工智能技术等,现在数字图像处理技术在不断完善,应用也越来与广泛。对于图像处理技术进行分析,可确定其包括图像分割、图像增强、图像压缩、图像复原、运动图像检测以及图像理解等[1]。传统基于CPU的图像处理技术已经无法满足实际应用需求,想要进一步提高图像处理速度以及质量,还需要在原有技术上来进行优化,争取通过高效的图像处理算法来达到最佳效果。 2 基于GPU图像处理算法优化设计 2.1 GPU结构特点 GPU即图形处理器,主要用于图形渲染的设备。相比于CPU倾向程序执行效率,GPU更倾向于大量并行数据计算,将数字图像算法特点与GPU通用计算特点进行有效结合,基于GPU来处理数字图像,可以实现图像处理算法的优化,提高图像处理速度。近年来GPU发展迅速,除了速度与质量方面的优化外,也为更多图像处理技术的发展提供了基础。现今GPU已经兼具流处理、高密集型并行运算等特点,且为GPU处理性能的拓展提高打好了基础。 2.2 GPU数字图像处理算法

配准综述

图像配准是对取自不同时间,不同传感器或者不同视角的同一区域的两幅或者多幅图像进行匹配叠加的过程。随着技术手段的不断发展,人们对图像配准的要求也越来越离。包括配准方法的鲁棒性、算法的难易程度、算法的自主性等都是考量算法的指标。图像配准的方法中,有人提出过被广泛认同的四个巧骤: a.特征空间的选择 特征空间是指将运用到配准中元素的集合。特征空间包括很多方面,比如像素值,比如点、线,或者平面甚至是曲面。 b.搜索空间 搜索策略是指一系列配准变换操作的集合。搜索空间是建立在几何形变基础上的。而几何形变一般包括全局的和局部的几何形变。典型的全局变形包括平移,缩放,扭曲等变形以及它们的组合。而局部形变,对变换参数要求比较苛刻,因为某一套变换参数只能作用在局部形变区域,而其余区域需采用插值技术补充。然而,另外的变形区域则需要另外的变换参数去表述。在一般的处理中,我们将变换模型看成是一种先验知识。不然则需要考量所有的变换模型。 c.搜索策略 搜索策略是实施变换的依据。它的存在是为了找寻变换模型的最优解。常用的搜索策略有松弛模型法、牛顿法和共扼梯度法。 d.相似性度量 相似性度量是对采用的变换模型的评价。相似性度量主要是采用参考图像和配准图像之间的共有的特征之间的差异比较的方法来评价配准的情况。这其中的差异可以包括点位的误差,或者是灰度值相关的差异,还可以是在变换域之间的差异值等等。最常见的相似性度量是检测特征的欧氏距离。 上述的几个步骤构成了图像配准的基本框架。许许多多的算法充斥其中产生了种类繁多的配准方法。下面主要介绍下几种典型的配准算法。目前典型的配准算法中大致可分成基于灰度、基于特征和基于模型的方法。 基于灰度的配准算法 基于灰度的算法中,重点是对图像配准的过程上,而不是特征集的选择

角点检测算法综述

角点检测算法综述 范娜,俞利,徐伯夏 (中国航天科工集团第三研究院8357所天津300308) 摘要:角点作为图像的一个重要特征,它保留了图像绝大部分的特征信息。角点在三维场景重建、运动估计、目标跟踪以及图像配准与图像匹配等计算机视觉领域有着重要的作用。本文对角点检测算法的类别进行总结,对各类算法进行了详细介绍,并对近几年来各类算法发展与改进进行了总结。 关键词:特征信息;计算机视觉;角点检测 Survey of Corner Detection Algorithms FAN Na, YU Li, and XU Bo-xia (The 8357 Research Institute of the Third Research Academy of CASIC Tianjin 300308) Abstract:As a more important feature of image, corner contains voluminous information of image features.In the domain of computer vision, such as three-dimensional reconstruction, motion estimation, object tracking, image registration and image matching, corner of image play an important role.this paper attempt to summarize and detailedly introduce corner detection algorithms, and summarize the developments of these algorithms in recent years. Key words: Feature Information;Computer Vision;Corner Detection 1 引言 角点并没有明确的定义,一般将图像中亮度变化剧烈的点或图像边缘上曲率取极大值的点认为是角点。从形态上来说,角点包括L、T、Y、X和箭头型角点等。角点作为图像的重要特征,保留了图像的绝大部分的特征信息,又有效地减少了信息的数据量,从而有效地提高了运算速度以及匹配的可靠性。总结现有的角点检测算子的评价方法,总体上有以下几个标准[1]: (1)稳定性:即同一场景图像在亮度、对比度等因素变化的情况下,检测出的角点数目及位置应当稳定 (2)可靠性:即在算子的可变参数改变情况下,不影响生成的角点的质量,只改变检测出角点的数目;检测到的角点具有平移、旋转、伸缩不变性 (3)鲁棒性:即算法的抗噪性能,在一定的噪声干扰下,算子仍然具有很强的角点检测能力 (4)准确性:主要指不发生误检测以及角点位置定位准确 (5)高效性:是指算法的计算速度快慢,算法速度必须足够快以满足图像处理系统的要求 经过几十年的研究与探索,产生了许多检测角点的方法,但大致可以分为四类:基于灰度图像的角点检测算法、基于二值图像的角点检测算法、基于边缘特征的角点检测算法以及支持矢量机角点检测算法。本文中

(完整word版)人工智能算法在图像处理中的应用

人工智能算法在图像处理中的应用 人工智能算法在图像处理中的应用人工智能算法包括遗传算法、蚁群算法、模拟退火算法和粒子群算法等,在图像边缘检测、图像分割、图像识别、图像匹配、图像分类等领域有广泛应用。本文首先介绍常用人工智能算法的的原理和特点,然后将其在图像处理方面的应用进行综述,最后对应用前景做出展望。【关键词】人工智能算法图像处理人工智能算法是人类受自然界各种事物规律(如人脑神经元、蚂蚁觅食等)的启发,模仿其工作原理求解某些问题的算法。随着计算机技术的发展,人工智能算法在图像处理方面得到广泛应用。当前流行的人工智能算法包括人工神经网络、遗传算法、蚁群算法、模拟退火算法、粒子群算法等。 1 人工神经网络人工神经网络是一种模拟动物神经网络行为特征,进行分布式并行信息处理的算法数学模型,通过调整内部大量节点之间相互连接的关系,达到处理信息的目的,具有自组织、自学习、自推理和自适应等优点。神经网络可用于图像压缩,将图像输入层和输出层设置较多节点,中间传输层设置较少节点,学习后的网络可以较少的节点表示图像,用于存储和传输环节,节约了存储空间,提高的传输效率,最后在输出层将图像还原。学者Blanz和Gish 提出一个三层的前馈神经网络图像分割模型,Babaguchi提

出多层BP网络获取图像的分割阈值,Ghosh使用神经网络对大噪声的图像进行分割。J.Cao使用PCA神经网络提取图像特征来对图像进行分类,B.Lerner用神经网络对人类染色体图像进行分类。神经网络还可与小波变换相结合(MCNN)对手写体数字进行多分辨率识别。 2 遗传算法遗传算法(Genetic Algorithm,GA)是模拟生物进化论的自然选择和遗传学进化过程的计算模型,是一种通过模拟自然进化过程随机搜索最优解的方法,体现了适者生存、优胜劣汰的进化原则,其主要特点是直接对结构对象进行操作,不存在求导和函数连续性的限定,具有并行性和较强的全局寻优能力。遗传算法把问题的解表示成染色体,求解步骤如下: (1)编码:定义问题的解空间到染色体编码空间的映射,一个候选解(个体)用一串符号表示。(2)初始化种群:在一定的限制条件下初始化种群,该种群是解空间的一个子空间。(3)设计适应度函数:将种群中的每个染色体解码成适于适应度函数的形式,计算其数值。(4)选择:根据适应度大小选择优秀个体繁殖下一代,适应度越高,选择概率越大。(5)交叉:随机选择两个用于繁殖下一代的个体的相同位置,在选中的位置实行交换。(6)变异:对某个串中的基因按突变概率进行翻转。(7)从步骤4开始重复进行,直到满足某一性能指标或规定的遗传代数。GA在图像分割领域应用最为成熟,只要有两种应用,一是在多种分割结果中搜索最佳分

行人检测与目标跟踪算法研究

基于opencv中光流法的运动 行人目标跟踪与检测 一、课题研究背景及方法 行人检测具有极其广泛的应用:智能辅助驾驶,智能监控,行人分析以及智 能机器人等领域。从2005年以来行人检测进入了一个快速的发展阶段,但是也存在很多问题还有待解决,个人觉得主要还是在性能和速度方面还不能达到一个权衡。 早期以静态图像处理中的分割、边缘提取、运动检测等方法为主。例如 (1)以Gavrila为代表的全局模板方法:基于轮廓的分层匹配算法,构造了将近2500个轮廓模板对行人进行匹配, 从而识别出行人。为了解决模板数量众多而引起的速度下降问题,采用了由粗到细的分层搜索策略以加快搜索速度。另外,匹配的时候通过计算模板与待检测窗口的距离变换来度量两者之间的相似性。 (2)以Broggi为代表的局部模板方法:利用不同大小的二值图像模板来对人头和肩部进行建模,通过将输入图像的边缘图像与该二值模板进行比较从而识别行人,该方法被用到意大利Parma大学开发的ARGO智能车中。 (3)以Lipton为代表的光流检测方法:计算运动区域内的残余光流; (4)以Heisele为代表的运动检测方法:提取行人腿部运动特征; (5)以Wohler为代表的神经网络方法:构建一个自适应时间延迟神经网络来判断是否是人体的运动图片序列; 以上方法,存在速度慢、检测率低、误报率高的特点。 2、行人检测的研究现状

(1)基于背景建模的方法:分割出前景,提取其中的运动目标,然后进一步 提取特征,分类判别;在存在下雨、下雪、刮风、树叶晃动、灯光忽明忽暗等场 合,该方法的鲁棒性不高,抗干扰能力较差。且背景建模方法的模型过于复杂,对 参数较为敏感。 (2)基于统计学习的方法:根据大量训练样本构建行人检测分类器。提取的 特征一般有目标的灰度、边缘、纹理、形状、梯度直方图等信息,分类器包括神经 网络、SVM,adaboost等。该方法存在以下难点: (a)行人的姿态、服饰各不相同; (b)提取的特征在特征空间中的分布不够紧凑; (c)分类器的性能受训练样本的影响较大; (d)离线训练时的负样本无法涵盖所有真实应用场景的情况; 尽管基于统计学习的行人检测方法存在着诸多的缺点,但依然有很多人将注 意力集中于此。 行人检测国外研究情况: 法国研究人员Dalal在2005的CVPR发表的HOG+SVM的行人检测算法(Histograms of Oriented Gradients for Human Detection, Navneet Dalel,Bill Triggs, CVPR2005)。 Dollar 在 2010 年 BMVC 的《The fastest pedestrian detector in the west》一文中提出了一种新的思想,这种思想只需要训练一个标准 model,检测N/K(K ≈10)然后其余的 N-N/K 种大小的图片的特征不需要再进行这种复杂的计算,而是跟据这 N/K 次的结果,由另外一种简单的算法给估计出来,这种思 想实现的基础是大小相近的图像的特征可以被足够精确的估计出来;同年,德国

基本数字(精选)图像处理算法的matlab实现

基本数字图像处理算法的matlab实现 1.数字图像处理的简单介绍 所谓数字图像就是把传统图像的画面分割成为像素的小的离散点,各像素的灰度值也是用离散值来表示的。 数字图像处理是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。 2.图像的显示与运算 2.1图像的显示 Matlab显示语句 imshow(I,[lowhigh])%图像正常显示 I为要显示的图像矩阵。,[lowhigh]为指定显示灰度图像的灰度范围。高于high的像素被显示成白色;低于low的像素被显示成黑色;介于high和low之间的像素被按比例拉伸后显示为各种等级的灰色。 subplot(m,n,p) 打开一个有m行n列图像位置的窗口,并将焦点位于第p个位置上。 2.2图像的运算 灰度化将彩色图像转化成为灰度图像的过程成为图像的灰度化处理。彩色图像中的每个像素的颜色有R、G、B三个分量决定,而每个分量有255中值可取,这样一个像素点可以有1600多万(255*255*255)的颜色的变化范围。而灰度图像是R、G、B三个分量相同的一种特殊的彩色图像,其一个像素点的变化范围为255种,所以在数字图像处理种一般先将各种格式的图像转变成灰度图像以使后续的图像的计算量变得少一些。灰度图像的描述与彩色图像一样仍然反映了整幅图像的整体和局部的色度和亮度等级的分布和特征。图像的灰度化处理可用两种方法来实现。

第一种方法使求出每个像素点的R、G、B三个分量的平均值,然后将这个平均值赋予给这个像素的三个分量。 第二种方法是根据YUV的颜色空间中,Y的分量的物理意义是点的亮度,由该值反映亮度等级,根据RGB和YUV颜色空间的变化关系可建立亮度Y与R、G、B三个颜色分量的对应:Y=0.3R+0.59G+0.11B,以这个亮度值表达图像的灰度值。 灰度是灰度级的函数,它表示图象中具有每种灰度级的象素的个数,反映图象中每种灰度出现的频率。 图像增强的目标是改进图片的质量,例如增加对比度,去掉模糊和噪声,修正几何畸变等;图像复原是在假定已知模糊或噪声的模型时,试图估计原图像的一种技术。 Matlab图像格式转换语句 rgb2gray(I) %从RGB图创建灰度图 imhist(I) %画灰度直方图 图像的线性变换 D B=f(D A)=f A*D A+f B Matlab源代码: I1=imread('F:\图片2.jpg'); subplot(2,2,1);imshow(I1);title('原图'); I2=rgb2gray(I1); %灰度化图像 subplot(2,2,2);imshow(I2);title('灰度化后图'); [M,N]=size(I2); subplot(2,2,3) [counts,x]=imhist(I2,60); %画灰度直方图 counts=counts/M/N; stem(x,counts);title('灰度直方图'); g=zeros(M,N);%图像增强

常用算法简介

机器视觉中常用图像处理算法 机器视觉就是用机器代替人眼来做测量和判断。机器视觉系统是指通过机器视觉产品(即图像摄取装置,分CMOS 和CCD 两种)将被摄取目标转换成图像信号,传送给专用的图像处理系统,得到被摄目标的形态信息,根据像素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征,进而根据判别的结果来控制现场的设备动作。机器视觉是使用计算机(也许是可移动式的)来模拟人的视觉,因此模拟才是计算机视觉领域的最终目标,而真正意义上的图像处理侧重在“处理”图像:如增强,还原,去噪,分割,等等,如常见的Photoshop就是功能强大的图像处理软件。大部分的机器视觉,都包含了图像处理的过程,只有图像处理过后,才能找到图像中需要的特征,从而更进一步的执行其它的指令动作。在我们实际工程应用中研究的一些图像算法,实际上是属于机器视觉,而不是纯粹的图像处理。总的来说,图像处理技术包括图像压缩,增强和复原,匹配、描述和识别3个部分,在实际工程中,这几块不是独立的,往往是环环相扣、相互辅助来达到实际效果。接下来简单介绍一下机器视觉中常用的图像处理算法。 一、滤波 滤波一般在图像预处理阶段中使用,改善图像信息,便于后续处理,当然,这不是绝对的,在图像算法过程中如果有需要,随时可以进行滤波操作。比较常用的滤波方法有以下三种: 1、均值滤波 均值滤波也称为线性滤波,其采用的主要方法为邻域平均法。线性滤波的基本原理是用均值代替原图像中的各个像素值,即对待处理的当前像素点(,) x y,选择一个模板,该模板由其近邻的若干像素组成,求模板中所有像素的均值,再把该均值赋予当前像素点(,) g x y,即 x y,作为处理后图像在该点上的灰度值(,) 波方法可以平滑图像,速度快,算法简单。但是无法去掉噪声,只能减弱噪声。 2、中值滤波

三维重构相关论文-整理

[1]王新宇。 学士论文,2004 基于计算机立体视觉的三维重建。 引言: 三维重构是计算机视觉的研究重点,三维重构的目标是要使计算机具有通过二维图像认知三维环境信息的能力,这种能力将不仅使机器能感知三维环境中物体的几何信息,包括它的形状、位置、姿态、运动等,并且能对它们进行描述、存储、识别与理解。 摘要: 本文以M arr视觉理论为基础,对重建过程中图像特征点进行提取及匹配、摄像机参数的标定和物体三维模型的贴纹理显示等问题进行了较为系统地研究。 正文: 1、基础矩阵计算往往转化为最优化问题,本文采用对极约束作为适应度函数,提出了一种基于遗传算法的基础矩阵估计方法,对基础矩阵的鲁棒求解进行了一次有意义的尝试。 2、实现了一种三阶段的鲁棒匹配算法。在相关法得到初始匹配的基础上,利用松驰迭代法消除模糊匹配,再进一步引入了最小中值法,剔除了大部分错误匹配,从而大大提高了基础矩阵的计算精度,使得重建结果更为准确。 3、综述了摄像机标定理论和各种标定算法,并根据本文的研究目标和实际具有的设备环境,选择实现了一种介于传统标定方法和自标定方法之间的新的、更灵活的方法一一张氏平面标定方法。它既避免了传统方法设备要求高、操作繁琐等缺点,又较自标定方法精度高。 4、在三维重建的可视化方面,一般三维重建的结果是离散的三维空间点,本文先对平面图像进行二维三角化,实际上是表面生成,再将三角平面作为纹理贴到三维空间,得到具有真实感的物体,改善了重建的效果。 5、在本文的研究中,我们实现了一个简单的三维重建系统,通过两幅图像恢复出了物体的三维形状,并介绍了系统构成和各功能模块及其所用的 结论: 本论文以M arr的计算机视觉理论为基础,对计算机视觉研究领域中的三维重建这一热点问题及其子问题,进行了较为系统的研究,在分析和总结现有各种方法优缺点的基础上,提出了一套切实可行的方案。 在计算机视觉领域的研究中,基础矩阵是一个重点;特征匹配问题是实现三维重建过程中非常重要的一步,同时也是视觉领中的一个瓶颈问题;空间直线、曲线、曲面等高级的三维物体基元的重建对提高重建效果具有积极的作用;镜头的畸变误差往往决定三维重建精度。 [2]朱红军,高潮,郭永彩 2014.1 基于计算机视觉的非朗伯表面三维重构 摘要: 目前的三维重构研究主要针对不透明的朗伯表面,且已经比较成熟,但对非朗伯表面仍然面临诸多问题。文中主要对非朗伯表面的现有三维重构方法的原理、特点、适用范围和最新研究方向进行了介绍,对非朗伯表面三维重构的现有问题和发展前景进行了讨论。 Ps:非朗伯表面:在任意发射(漫射、透射)方向上辐射亮度变化的表面.也称非理想漫反射表面。和朗伯表面相对的。 正文:

相关主题
文本预览
相关文档 最新文档