图象视觉特征的提取与表示
- 格式:doc
- 大小:342.50 KB
- 文档页数:11
使用计算机视觉技术进行图像分析的步骤图像分析是利用计算机视觉技术对图像进行解析、提取信息和获取有用知识的过程。
通过图像分析,我们可以理解图像中的内容、结构、特征,并为后续的处理和决策提供参考。
图像分析的步骤可以分为以下几个方面:1. 图像获取和预处理在进行图像分析之前,首先需要获取图像数据。
图像可以通过不同的传感器设备或者采集系统获得,比如数字相机、摄像机、扫描仪等。
获取到的图像数据可能会受到噪声、光照和畸变等因素的干扰,因此要进行预处理,包括去除噪声、颜色校正、几何校正等,以便得到质量更好的图像数据。
2. 特征提取和表示特征提取是图像分析中的核心步骤之一。
通过特征提取,可以从图像中提取出表达图像特点的数学描述,用于后续的分析和处理。
常见的特征包括颜色、纹理、形状、边缘等。
特征提取可以采用传统的算法,如高斯滤波、边缘检测、纹理分析等;也可以使用深度学习技术,如卷积神经网络(CNN)进行端到端的特征提取。
3. 图像分割图像分割是将图像划分成不同的区域或对象的过程。
图像分割可以通过基于像素的方法,如阈值分割、边缘分割等,或者基于特征的方法,如基于区域生长、区域分裂合并等。
图像分割可以提取出感兴趣的区域,并为后续的目标检测、识别等任务提供准确的输入。
4. 目标检测与识别目标检测与识别是图像分析的重要应用之一。
通过目标检测与识别,可以自动地识别图像中的目标物体,并进行分类、定位和跟踪等操作。
目标检测与识别可以使用传统的机器学习方法,如支持向量机(SVM)、决策树等;也可以使用深度学习方法,如卷积神经网络、循环神经网络等。
目标检测与识别可以应用于人脸识别、车辆检测、物体识别等多个领域。
5. 图像理解和分析图像理解和分析是对图像中语义信息的理解和提取。
通过图像理解和分析,可以从图像中获取更高级别的信息,如场景理解、情感分析等。
图像理解和分析可以使用传统的图像处理方法,如特征匹配、图像拼接等;也可以使用深度学习方法,如图像标注、图像生成等。
1 .什么是机器视觉技术试论述其基本概念和目的。
答:机器视觉技术是是一门涉及人工智能、神经生物学、心理物理学、计算机科学、图像处理、模式识别等诸多领域的交叉学科。
机器视觉主要用计算机来模拟人的视觉功能,从客观事物的图像中提取信息,进行处理并加以理解,最终用于实际检测、测量和控制。
机器视觉技术最大的特点是速度快、信息量大、功能多。
机器视觉是用机器代替人眼来完成观测和判断,常用于大批量生产过程汇总的产品质量检测,不适合人的危险环境和人眼视觉难以满足的场合。
机器视觉可以大大提高检测精度和速度,从而提高生产效率,并且可以避免人眼视觉检测所带来的偏差和误差。
2 .机器视觉系统一般由哪几部分组成试详细论述之。
答:机器视觉系统主要包括三大部分:图像获取、图像处理和识别、输出显示或控制。
图像获取:是将被检测物体的可视化图像和内在特征转换成能被计算机处理的一系列数据。
该部分主要包括,照明系统、图像聚焦光学系统、图像敏感元件(主要是CCD和CMOS)采集物体影像。
图像处理和识别:视觉信息的处理主要包括滤波去噪、图像增强、平滑、边缘锐化、分割、图像识别与理解等内容。
经过图像处理后,图像的质量得到提高,既改善了图像的视觉效果又便于计算机对图像进行分析、处理和识别。
输出显示和控制:主要是将分析结果输出到显示器或控制机构等输出设备。
3 .试论述机器视觉技术的现状和发展前景。
答:。
机器视觉技术的现状:机器视觉是近20〜30年出现的新技术,由于其固有的柔性好、非接触、快速等特点,在各个领域得到很广泛的应用,如航空航天、工业、军事、民用等等领域。
发展前景:随着光学传感器、信息技术、信号处理、人工智能、模式识别研究的不断深入和计算机性价比的不断提高,机器视觉技术越来越成熟,特别是市面上已经有针对机器视觉系统开发的企业提供配套的软硬件服务,相信越来越多的客户会选择机器视觉系统代替人力进行工作,既便于管理又节省了成本。
价格持续下降、功能逐渐增多、成品小型化、集成产品增多。
数字图像处理知识点总结第一章导论1.图像:对客观对象的一种相似性的生动性的描述或写真。
2.图像分类:按可见性(可见图像、不可见图像),按波段数(单波段、多波段、超波段),按空间坐标和亮度的连续性(模拟和数字)。
3.图像处理:对图像进行一系列操作,以到达预期目的的技术。
4.图像处理三个层次:狭义图像处理、图像分析和图像理解.5.图像处理五个模块:采集、显示、存储、通信、处理和分析.第二章数字图像处理的基本概念6.模拟图像的表示:f(x,y)=i(x,y)×r(x,y),照度分量0< i(x,y)〈∞ ,反射分量0 <r(x,y)<1。
7.图像数字化:将一幅画面转化成计算机能处理的形式-—数字图像的过程。
它包括采样和量化两个过程。
像素的位置和灰度就是像素的属性。
8.将空间上连续的图像变换成离散点的操作称为采样.采样间隔和采样孔径的大小是两个很重要的参数。
采样方式:有缝、无缝和重叠.9.将像素灰度转换成离散的整数值的过程叫量化.10.表示像素明暗程度的整数称为像素的灰度级(或灰度值或灰度)。
11.数字图像根据灰度级数的差异可分为:黑白图像、灰度图像和彩色图像.12.采样间隔对图像质量的影响:一般来说,采样间隔越大,所得图像像素数越少,空间分辨率低,质量差,严重时出现像素呈块状的国际棋盘效应;采样间隔越小,所得图像像素数越多,空间分辨率高,图像质量好,但数据量大。
13.量化等级对图像质量的影响:量化等级越多,所得图像层次越丰富,灰度分辨率高,图像质量好,但数据量大;量化等级越少,图像层次欠丰富,灰度分辨率低,会出现假轮廓现象,图像质量变差,但数据量小.但在极少数情况下对固定图像大小时,减少灰度级能改善质量,产生这种情况的最可能原因是减少灰度级一般会增加图像的对比度.例如对细节比较丰富的图像数字化。
14.数字化器组成:1)采样孔:保证单独观测特定的像素而不受其它部分的影响。
2)图像扫描机构:使采样孔按预先确定的方式在图像上移动。
数字图像处理名词解释数字图像是由像素组成的二维矩阵,每个小块区域称为像素(pixel)。
数字图像处理是指利用数字计算机及其它数字技术,对图像进行某种运算和处理,从而达到某种预期目的的技术。
8-连通是指对于具有值V的像素p和q,如果q在集合N8(p)中,则称这两个像素是8-连通的。
灰度直方图反映了一幅图像中各灰度级像元出现的频率,是灰度级的函数,描述的是图像中该灰度级的像素个数。
直方图只反映该图像中不同灰度值出现的次数,而未反映某一灰度值像素所在位置。
直方图可用于判断图像量化是否恰当,给出了一个简单可见的指示,用来判断一幅图象是否合理的利用了全部被允许的灰度级范围。
数字图像通常有两种表示形式:位图和矢量图。
点位图由像素构成,包含不同色彩信息的像素的矩阵组合构成了千变万化的图像。
矢量图形指由代数方程定义的线条或曲线构成的图形,由许多矢量图形元素构成,这些图形元素称为“对象”。
两种图像的构成方式不同,其绘画方式也存在差别。
点位图是通过改变像素的色彩实现绘画和画面的修改,而矢量图操纵的是基本的图形(对象)。
在矢量图中,以Corel Draw为例,选择贝赛尔曲线工具,用鼠标在页面上定出一些节点,节点之间有线段,构成一个封闭图形。
用修改工具把这个图形调整圆滑。
傅里叶变换是一种将空间域中复杂的卷积运算转化为频率域中简单的乘积运算的方法,其应用主要有以下三方面:简化计算、处理空间域中难以处理或处理起来比较复杂的问题、以及实现特殊目的的应用需求。
通过傅里叶变换,可以将图像从空间域变换到频率域,利用频率域滤波或频域分析方法对其进行处理和分析,然后再将处理后的图像变换回空间域,从而实现图像的增强、特征提取、数据压缩、纹理分析、水印嵌入等效果。
对于M*N的图像f(x,y),其基矩阵的大小为M*N,也即及图像由M*N块组成。
当(x,y)取遍所有可能的值(x=0,1,2….m-1;y=0,1…n-1)时,就可得到由(M*N)*(M*N)块组成的基图像,所以其基图像大小为M平方*N平方。
《数字图像处理》知识点汇总1.什么是图像?“图”是物体投射或反射光的分布,“像”是⼈的视觉系统对图的接受在⼤脑中形成的印象或反映。
图像是客观和主观的结合。
2.数字图像是指由被称作象素的⼩块区域组成的⼆维矩阵。
将物理图象⾏列划分后,每个⼩块区域称为像素(pixel)。
对于单⾊即灰度图像⽽⾔,每个像素包括两个属性:位置和灰度。
灰度⼜称为亮度,灰度⽤⼀个数值来表⽰,通常数值范围在0到255之间,即可⽤⼀个字节来表⽰。
0表⽰⿊、255表⽰⽩。
3.彩⾊图象可以⽤红、绿、蓝三元组的⼆维矩阵来表⽰。
通常,三元组的每个数值也是在0到255之间,0表⽰相应的基⾊在该象素中没有,⽽255则代表相应的基⾊在该象素中取得最⼤值,这种情况下每个象素可⽤三个字节来表⽰。
4.数字图像处理就是利⽤计算机系统对数字图像进⾏各种⽬的的处理。
5.对连续图像f(x,y)进⾏数字化需要在空间域和值域进⾏离散化。
空间上通过图像抽样进⾏空间离散,得到像素。
像素亮度需要通过灰度级量化实现灰度值离散。
数字图像常⽤矩阵来表⽰。
6.从计算机处理的⾓度可以由⾼到低将数字图像分为三个层次,分别为图像处理、图像分析和图像理解。
这三个层次覆盖了图像处理的所有应⽤领域。
(1). 图像处理指对图像进⾏各种加⼯,以改善图像的视觉效果;强调图像之间进⾏的变换。
图像处理是⼀个从图像到图像的过程。
(2). 图像分析指对图像中感兴趣的⽬标进⾏提取和分割,获得⽬标的客观信息(特点或性质),建⽴对图像的描述;图像分析以观察者为中⼼研究客观世界,它是⼀个从图像到数据的过程。
(3). 图像理解指研究图像中各⽬标的性质和它们之间的相互联系,得出对图像内容含义的理解及原来客观场景的解释;图像理解以客观世界为中⼼,借助知识、经验来推理、认识客观世界,属于⾼层操作(符号运算)。
7.图像处理、图像分析和图像理解是处在三个抽象程度和数据量各有特点的不同层次上。
图像处理是⽐较低层的操作,它主要在图像像素级上进⾏处理,处理的数据量⾮常⼤。
图像特征提取方法摘要特征提取是计算机视觉和图像处理中的一个概念。
它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。
特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。
至今为止特征没有万能和精确的图像特征定义。
特征的精确定义往往由问题或者应用类型决定。
特征是一个数字图像中“有趣”的部分,它是许多计算机图像分析算法的起点。
因此一个算法是否成功往往由它使用和定义的特征决定。
因此特征提取最重要的一个特性是“可重复性”:同一场景的不同图像所提取的特征应该是相同的。
特征提取是图象处理中的一个初级运算,也就是说它是对一个图像进行的第一个运算处理。
它检查每个像素来确定该像素是否代表一个特征。
假如它是一个更大的算法的一部分,那么这个算法一般只检查图像的特征区域。
作为特征提取的一个前提运算,输入图像一般通过高斯模糊核在尺度空间中被平滑。
此后通过局部导数运算来计算图像的一个或多个特征。
常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。
当光差图像时,常常看到的是连续的纹理与灰度级相似的区域,他们相结合形成物体。
但如果物体的尺寸很小或者对比度不高,通常要采用较高的分辨率观察:如果物体的尺寸很大或对比度很强,只需要降低分辨率。
如果物体尺寸有大有小,或对比有强有弱的情况下同事存在,这时提取图像的特征对进行图像研究有优势。
常用的特征提取方法有:Fourier变换法、窗口Fourier变换(Gabor)、小波变换法、最小二乘法、边界方向直方图法、基于Tamura纹理特征的纹理特征提取等。
设计内容课程设计的内容与要求(包括原始数据、技术参数、条件、设计要求等): 一、课程设计的内容本设计采用边界方向直方图法、基于PCA的图像数据特征提取、基于Tamura纹理特征的纹理特征提取、颜色直方图提取颜色特征等等四种方法设计。
(1)边界方向直方图法由于单一特征不足以准确地描述图像特征,提出了一种结合颜色特征和边界方向特征的图像检索方法.针对传统颜色直方图中图像对所有像素具有相同重要性的问题进行了改进,提出了像素加权的改进颜色直方图方法;然后采用非分割图像的边界方向直方图方法提取图像的形状特征,该方法相对分割方法具有简单、有效等特点,并对图像的缩放、旋转以及视角具有不变性.为进一步提高图像检索的质量引入相关反馈机制,动态调整两幅图像相似度中颜色特征和方向特征的权值系数,并给出了相应的权值调整算法.实验结果表明,上述方法明显地优于其它方法.小波理论和几个其他课题相关。
使用计算机视觉技术进行医学图像分析的步骤医学图像分析是医学领域中非常重要的一项技术,它可以帮助医生快速、准确地诊断疾病,并指导治疗方案的制定。
随着计算机视觉技术的不断发展和进步,越来越多的医学图像分析任务可以得到自动化、智能化的处理。
本文将为您介绍使用计算机视觉技术进行医学图像分析的主要步骤。
步骤一:数据采集与预处理首先,对需分析的医学图像进行数据采集,常见的医学图像包括X射线片、CT扫描、磁共振成像(MRI)、超声波图像等。
采集好的原始图像需要经过一系列预处理步骤,如去噪、图像增强、图像校正等,以提高图像质量和减少干扰因素。
步骤二:特征提取与选择在医学图像分析中,特征提取是关键步骤。
它旨在从原始图像中提取有意义的、具有代表性的特征,以描述图像中的目标结构和重要信息。
常用的特征包括形状特征、纹理特征、颜色特征等。
特征的选择要根据分析任务具体要求,结合医学领域的知识和经验进行。
步骤三:模型建立与训练在特征选择完成后,需要建立合适的模型来进行医学图像分析。
常见的模型包括机器学习算法(如支持向量机、随机森林等)、深度学习算法(如卷积神经网络等)。
模型的建立通常需要使用标注好的医学图像数据进行训练,以学习图像与目标之间的关联规律。
训练过程中要注意合理选择训练集与验证集,防止模型的过拟合问题。
步骤四:模型评估与性能优化模型训练完成后,需要对其性能进行评估。
评估指标可以是准确率、召回率、F1分数等。
通过评估结果,可以判断模型的优劣并对其进行优化。
优化方法包括参数调整、数据扩增、模型结构改进等。
根据实际情况,可以多次进行模型评估与性能优化的循环,以达到更好的分析效果。
步骤五:应用与结果解释经过前面的步骤,一个具有较好性能的医学图像分析模型将可以投入实际应用。
应用时要注意选择合适的图像输入、输出方式,并制定良好的结果解释策略。
医生可以通过与该模型的交互,借助计算机视觉技术得到更准确的分析结果,并能够针对不同的临床病例和疾病进行相应的诊断和治疗方案制定。
1、电磁波谱按频率由高到低排列主要由r-射、X-射线、紫外线、可见光、红外波段、微波、无线电等组成。
2、绝对黑体辐射通量密度是温度和波长的函数。
3、一般物体的总辐射通量密度与绝对温度和发射率成正比关系。
4、维恩位移定律表明绝对黑体的波长最大值和温度的乘积是常数2897.8。
当绝对黑体的温度增高时,它的辐射峰值波长向短波方向移动。
二1. 遥感卫星轨道的四大特点:近圆形轨道、近极地轨道、与太阳同步轨道、可重复轨道。
2、卫星轨道参数有升交点赤经、近地点角距、轨道倾角、卫星轨道的长半轴、卫星轨道的偏心率、卫星过近地点时刻3、卫星姿态角是滚动、俯仰、航偏。
4、遥感平台的种类可分为地面平台、航空平台、航天平台三类。
5、卫星姿态角可用红外姿态测量仪、星相机、陀螺仪等方法测定。
6、与太阳同步轨道有利于卫星在相近的光照条件下对地面进行观测。
7、LANDSAT系列卫星带有TM探测器的是Landsat4/5;带有ETM探测器的是Landsat6。
8、SPOT系列卫星可产生异轨立体影像的是SPOT 1-5;可产生同轨立体影像的是SPOT 5。
9、ZY-1卫星空间分辨率为19.5m10、美国高分辨率民用卫星有IKONOS, Quick Bird,Orbview ,GeoEye-1 。
11、小卫星主要特点包括重量轻,体检小;研制周期短,成本低;发射灵活,启用速度快,抗毁性强;技术性能高。
12、可构成相干雷达影像的欧空局卫星是ENVISAT三4、目前遥感中使用的传感器大体上可以分为如下一些类型:(1)摄影类型的传感器(2)扫描成像类型的传感器(3)雷达成像类型的传感器(4)非图像类型的传感器5、遥感传感器大体上包括收集器探测器处理器输出器及部分五1、2、遥感图像的变形误差可以分为静态误差和动态误差,又可以分为内部误差和外部误差。
3、外部误差是指在传感器处于正常的工作状态下,由传感器以外的因素所引起的误差。
包括传感器的外方位元素变化,传播介质不均匀,地球曲率,地形起伏以及地球旋转等因素引起的变形误差。
第1章图像视觉特征的提取和表示1.1引言图像视觉特征的提取和表示是将图像的视觉信息转化成计算机能够识别和处理的定量形式的过程,是基于视觉内容的图像分类与检索的关键技术,因此,图像视觉特征的提取和表示一直是图像内容分析领域中一个非常活跃的课题。
图像底层视觉特征一定程度上能够反映图像的内容,可以描述图像所表达的意义,因此,研究图像底层视觉特征是实现图像分类与检索的第一步。
一般来说,随着具体应用的不同,选用的底层特征也应有所不同,在特定的具体应用中,不同底层视觉特征的选取及不同的描述方式,对图像分类与检索的性能有很大的影响。
通常认为,一种良好的图像视觉特征的提取和表示应满足以下几个要求:(1)提取简单,时间和空间复杂度低。
(2)区分能力强,对图像视觉内容相似的图像其特征描述之间也应相近,反之,对于视觉内容不相似的图像其特征描述之间应有一定的差别。
(3)与人的视觉感知相近,对人的视觉感觉相近的图像其特征描述之间也相近,对人的视觉感知有差别的图像其特征描述之间也有一定的差别。
(4)抗干扰能力强,鲁棒性好,对图像大小,方向不敏感,具有几何平移,旋转不变性。
本章重点讨论当前比较成熟的特征提取方法,在此基础上选取合适的特征提取方法,用于图像分类与检索系统的特征提取模块。
接下来,将依次介绍颜色,纹理,形状等特征的提取和表示方法,最后对各种特征的特点加以比较。
1.2颜色特征的提取和表示颜色是图像视觉信息的一个重要特征,是图像分类与检索中最为广泛应用的特征之一。
一般来说同一类别的图像之间颜色信息具有一定的相似性,不同类别的图像,其颜色信息具有一定的差异。
相对几何特征而言,颜色特征稳定性好,有对大小、方向不敏感等特点。
因此,颜色特征的提取受到极大重视并得到深入研究。
本章首先介绍几种常用的颜色空间模型,然后介绍各种颜色特征提取和表示方法。
1.2.1颜色空间模型为了正确地使用颜色这一特征,需要建立颜色空间模型,通常的颜色空间模型可用三个基本量来描述,所以建立颜色空间模型就是建立一个3-D坐标系,其中每个空间点都代表某一种颜色。
通常来说,对于不同的应用,应该选取不同的颜色空间模型。
常用的颜色空间模型主要有:RGB、HIS、HSV、YUV、YIQ、Munsell、Lu*v*和La*b*等。
颜色空间模型的选取需要符合一定的标准,下面就这一标准和最常用的颜色空间模型作一些介绍。
文献[错误!未找到引用源。
]中介绍了选择颜色空间模型的标准主要有以下几个:(1)观察角度的鲁棒性(2) 对物体几何性质的鲁棒性 (3) 对光照方向改变的鲁棒性 (4) 对照强度改变的鲁棒性(5) 对照明的光谱能量分布(SPD)的鲁棒性 (6) 高分辨能力(7) 对物体遮掩和杂乱的鲁棒性 (8) 对图像噪声的鲁棒性RGB 颜色空间模型由R 、G 、B 分量构成,是最常用的颜色空间模型,现在各种格式的图像都是采用RGB 空间存储和传输,并得到各种物理设备的直接支持。
但是,研究发现,RGB 颜色空间模型也有一些缺点,主要表现在以下三个方面:首先是通道之间的相关性,BR 之间的相关性系数大约为0.74,RG 相关性系数约为0.98,GB 之间的相关性系数为0.94;其次是心理学上的非直观性;最后是感知上的非一致性。
为了更好地适应于各种应用场合,人们提出了很多的其他颜色空间模型。
HIS 颜色空间模型反映了人观察颜色的方式,与人的视觉感知特性符合较好,其中,I 表示亮度,H 表示色度,S 表示饱和度。
与HIS 颜色空间模型相比,HSV 颜色空间模型更符合人类对颜色的视觉感知特性,H 表示色调,色调是彩色相互区分的特性,S 表示饱和度,是指彩色的纯洁性,V 表示强度,是指彩色的明暗程度,这三个分量是相互独立的。
在彩色图像的分割中,RGB 模式难以直接进行分割,只有将它们转化成HSV 模式才行。
从RGB 颜色空间模型转换到HSV 颜色空间模型的方法有多种[错误!未找到引用源。
],本文介绍一种比较容易实现的转换方法。
(-)(-)a rc c o s (-)(-)2-a rc c o s R G R B B G H R G R B B Gπ+⎧≤⎪⎪=⎨+⎪>⎪⎩(2-1)m a x (,,)m in (,,)m a x (,,)R G B R G B S R G B -=(2-2)m a x (,,)255R G B V =(2-3)YUV 和YIQ 主要用于视频传输和编码,其中Y 为亮度分量,UV 或IQ 为色差分量。
Munsell 系统是从心理学的角度,根据颜色视觉的特点所指定的颜色分类和定标的系统,它由以H (色调)、V (明度)和C (色度)为基础系统排列的色卡组成。
Lu *v *和La *b *为均匀色度空间,其中色差可以由欧氏距离度量。
从图像处理的角度来说,对颜色的描述与人对颜色的感知越接近越好,这样便于将人的意图在处理结果中反映出来。
从视觉感知均匀的角度来说,人们希望所感知的两个颜色的距离应该与这两个颜色在颜色空间中的距离是一致的。
在均匀颜色空间中,人们观察到的两个颜色的距离与这两个颜色在空间中的欧氏距离成正比。
1.2.2 颜色特征的表示方法常用的颜色特征表示方法有:颜色直方图、颜色矩、颜色聚合向量、颜色集等。
(1) 直方图法直方图的颜色特征方法是把颜色量化成若干种,然后统计每种颜色的像素数在整幅图像中所占的比重。
颜色直方图特别适用于描述那些难以自动分割图像和不需要考虑物体空间位置的图像。
常用的颜色直方图的方法有简单颜色直方图和累积颜色直方图两种。
最早使用颜色直方图进行图像检索的是Swam 和Ballard [错误!未找到引用源。
],其核心思想是在一定的颜色空间中对颜色出现的频数进行统计,然后采用色彩直方图的交来度量两幅图像色彩的相似性,其最大的缺点是完全丢失了图像色彩的空间信息。
直方图是一个向量,维数为颜色级数,每维数值即对应该维所对应颜色的像素数占整幅图像像素数的百分比。
设图像I ,颜色被量化成N 种颜色(N 通常小于实际颜色数),直方图表示为:()[(0),(1),(1)]H I h h h N =-(2-1)其中()k n h k n =(2-2) 1N kk n n -==∑(2-3)kn 表示第k 种颜色的像素的数目,N 为颜色数。
直方图表示为简单直方图时没有考虑到相邻颜色的相似性,为了改进这个不足,以颜色为横坐标,颜色累加出现的频数为纵坐标,引入累积直方图的定义。
累积直方图的统计方法如式(2-4)所示。
()ki i n h k n==∑(2-4)无论是哪种直方图特征,都需要进行直方图量化,更多的量化区间可以具有更强的能力,但具有更高的运算代价,且不适于数据库索引。
一些改进的方法将直方图结合空间信息,将图像按特定方法分割成不同的子区域,在子区域中统计颜色直方图。
(2) 颜色矩基于图像中任何的颜色分布均可用它的矩来表示这一数学基础,Stricker 和Orengo 提出了颜色矩的颜色特征表示方法[错误!未找到引用源。
]。
此外,由于颜色分布信息主要集中在低阶矩中,因此仅采用颜色的一阶矩(mean)、二阶矩(variance)和三阶矩(skewness)就足以表达图像的颜色分布。
与颜色直方图相比,该方法的另一个好处在于无需对特征进行向量化。
颜色的三个低阶矩在数学上表达为:11Ni ijj p Nμ==∑(2-5)()12211Ni iji j pu N σ=⎛⎫=-⎪⎝⎭∑ (2-6)()13311Ni iji j s pu N=⎛⎫=-⎪⎝⎭∑ (2-7)其中i j p 是图像中第j 个像素的第i 个颜色分量的值。
由于颜色空间模型都是有3个分量构成,因此图像的颜色矩一般只需要9个分量,与其它的颜色特征相比非常简洁的。
在实际应用中为避免低阶矩较弱的分辨能力,颜色矩常和其它特征结合使用,而且一般在使用其它特征前起到过滤缩小范围的作用。
(3) 颜色聚合向量针对颜色直方图和颜色矩无法表达图像中色彩的空间位置的缺点,Pass 和Zabih 等人提出了颜色聚合向量(color coherence vector)[错误!未找到引用源。
]。
该方法是颜色直方图的一种演变,其核心思想是:将属于直方图每一个柄的像素分成两部分,如果该柄内的某些像素所占据的连续区域的面积大于给定的阈值,则该区域内的像素作为聚合像素,否则作为非聚合像素。
假设i α与i β分别代表直方图的第i 个柄中聚合像素和非聚合像素的数量,图像的颜色聚合向量可以表达为1122(,),(,),(,)NN αβαβαβ<> 。
而1122,,NN αβαβαβ<+++>就是该图像的颜色直方图。
由于包含了颜色分布的空间信息,对需要比较物体的空间位置的图像,颜色聚合向量能比颜色直方图达到更好的检索效果。
(4) 颜色集颜色集是J.R. Smith 提出的图像颜色特征的一种表示方法,其表示形式为二值空间中的一个M 维指示向量,其值指示在图像中是否出现符合某种特定条件的颜色,1表示出现,0表示未出现[错误!未找到引用源。
]。
颜色集的统计方法为:首先选择一个合适的颜色空间,并在此空间得到一个具有M 种颜色输出的颜色量化函数,每种颜色在M 维的二值空间中占一位;然后利用颜色量化函数对图像进行量化处理,使得处理后的图像至多包含M 种颜色;最后为每种颜色确定一个阈值,如果图像中属于此颜色的像素达到这一阈值,则相应的二值指示向量的位置置为1,否则置为0。
事实上颜色集只是一种表示方式,它等价于阈值直方图。
另外,如果每种颜色的阈值都定义较高的话,颜色集中置为1的那些颜色实际上就是主色。
1.3 纹理特征的提取和表示纹理是图像的另一个主要特征,通常看作图像的某种局部特征,它不仅反映图像的灰度统计信息,而且反映图像的空间分布信息和结构信息。
对图像纹理,迄今为止仍无一个公认的、一致的严格定义。
但图像纹理对人们来说是很熟悉的。
纹理是人眼视觉的重要组成部分,反映了物体的深度和表面信息,表达了物体表面颜色和灰度的某种变化。
而且这些变化又与物体本身的属性有关,是图像的固有特征之一。
数字图像中的纹理是相邻像素的灰度或颜色的空间相关性,或是图像灰度和颜色随空间位置变化的视觉表现。
纹理特征描述方法大致可以分为四类:统计法、结构法、模型法、频谱法。
(1) 统计法统计方法分析纹理的主要思想是通过图像中灰度级分布的随机属性来描述纹理特征。
(2) 结构法结构法分析纹理的基本思想是假定纹理模式由纹理基元以一定的、有规律的形式重复排列组合而成,特征提取就变为确定这些基元并定量分析它们的排列规则。
(3) 模型法模型法是利用一些成熟的图像模型来描述纹理,如基于随机场统计学的马尔可夫随机场、自回归模型,以及在此基础上产生的多尺度自回归模型等。