基于颜色形状纹理综合特征的CBIR
- 格式:doc
- 大小:1.75 MB
- 文档页数:17
第15卷第2期2003年2月计算机辅助设计与图形学学报JO U RNAL OF COM PU T ER -AI DED DESIGN &COM PU T ER GRA PHI CS V ol.15,No.2Feb.,2003图像纹理特征及其在CBIR 中的应用万华林1) Morshed U.Chow dhury 2) 胡 宏1) 史忠植1)1)(中国科学院计算技术研究所智能信息处理重点实验室 北京 100080)2)(School of Computing and M athematics,Deakin U niversity -M elbourne Campus,M elbourne Victori a 3125)摘要 基于内容的多媒体信息检索是当前世界的研究热点,然而在图像内容表示及其相似性度量这两个关键问题上取得的进展还不能令人满意.通过深入研究纹理的本质和人类视觉系统的特性,结合M PEG -7标准提出的图像内容描述子概念,提出一种新的谱方法来描述图像的纹理特征,并将其应用于图像内容的表示和检索.在此基础上,讨论了图像的颜色描述子和相似性度量策略,并给出了实验结果和性能评价.关键词 CBIR;M P EG -7;图像内容描述子;纹理谱;相似性度量中图法分类号 T P391Texture Feature and Its Application in CBIRWan H ualin 1) Morshed U.Chow dhury 2) H u Hong 1) Shi Zhongzhi1)1)(L aboratory of I ntelligent Inf or mation Proce ssing ,Institute of Comp uting Technology,Chinese Academy o f Sciences,Beij ing 100080)2)(School of Comp uting and M athematics,Deakin Univ ersity-M elbour ne Campu s,M elbou rne Victoria 3125)Abstract Content -based image retrieval (CBIR)has been an active research area,how ever,the achievements in image representation and sim ilarity measurement are not satisfy ing.After going deep into the nature of imag e tex ture and human vision system,incorporating the concept of image content descriptor proposed by MPEG -7,w e propose a new tex ture spectrum to describe the tex ture feature of images.Moreover,w e discuss color descriptor,image similarity scheme,and the com bined color and texture descriptor.Experiment results and evaluation are illustrated.Key words CBIR;MPEG -7;image content descriptor;texture spectrum;similarity measurement原稿收到日期:2001-11-13;修改稿收到日期:2002-03-14.本课题得到国家自然科学基金(69790080)资助.万华林,男,1974年生,博士,主要研究方向为基于内容的多媒体信息检索、图像处理、分析、模式分类与识别等.Morshed U.Chowdhury ,男,博士,主要研究方向为多媒体同步、图像检索等.胡 宏,男,1962年生,副研究员,主要研究方向为图像处理、神经计算和模式识别等.史忠植,男,1941年生,研究员,博士生导师,主要研究方向为人工智能、数据挖掘、多媒体信息检索等.1 引 言随着多媒体计算和通信技术的飞速发展,多媒体(包括图像、视频等)数据规模急剧增长,如何帮助用户快速准确地找到感兴趣的图像或视频已成为一个迫切需要解决的问题.针对这一问题,人们提出了基于内容的图像检索(Content -Based Image Re -trieval,CBIR)方法,其目的是提供在没有人类参与的情况下能自动识别或理解图像重要特征的算法.决定CBIR 性能的两个最重要的问题是:(1)如何利用图像的低级可视特征(如颜色、纹理、形状等)有效地表示图像的内容.(2)如何度量图像的相似性.目前,绝大多数关于基于内容检索的研究工作都是围绕这两个问题展开的[1-4],研究人员力求找到一种能利用图像低级可视特征有效地表示图像内容,并能有效地计算图像相似性的方法,但是效果并不是很理想.图像内容的表示一直困扰着图像理解和计算机视觉领域的研究者,为了实现对图像内容的存取、访问和检索,文献[5-6]介绍了MPEG -7,提出了图像内容描述子的概念,如颜色描述子、纹理描述子、形状描述子等,它们的性能直接影响CBIR 的性能.但现在还没有一种有效的内容描述子.为了激励全世界的研究者提出更好、更有效的图像内容描述子,M PEG -7标准没有给出具体的特征描述子提取算法.目前,人们已经提出了各种各样的图像颜色、纹理、形状描述子[4-6],但仍然不理想.颜色特征,特别是颜色直方图(或称为颜色谱)因其简单有效的性能而在大多数CBIR 系统中得到应用,我们是不是也能用一种类似颜色谱的纹理谱方法来描述图像的纹理呢?出于这些考虑,刘继敏提出了图像特征谱的概念,并指出了图像特征谱表示图像内容的优越性[7].本文在此基础上提出一种新的纹理谱表示方法,其主要思想是通过刻画图像像素点邻域灰度的变化来描述图像的纹理特征,该方法不但能有效地刻画邻域内像素点灰度的变化,而且能很好地描述图像的粗糙程度.2 图像纹理谱图像纹理反映的是图像的一种局部结构化特征,具体表现为图像像素点某邻域内像素点灰度级或者颜色的某种变化,而且这种变化是空间统计相关的,它由纹理基元和基元的排列两个要素构成[8],如图1所示.在20世纪70年代初期,Haralick 等提出了纹理特征的共生矩阵表示[9].首先根据像素间的方向和距离构造一个共生矩阵,然后从共生矩阵中抽取适当的统计量作为纹理表示,但用共生矩阵提取的纹理性质缺少视觉相似性.20世纪90年代初期,在引入小波变换并建立它的理论框架后,许多研究者开始研究在纹理表示中使用小波变换.Manjunath 等评价了各种小波变换[10],他们发现Gabor 小波变换最符合人类的视觉特征,缺点是提取图像的Ga -bor 纹理计算量很大,不能满足海量图像检索系统的实时性要求.针对上述纹理描述方法的不足,本文结合纹理的本质定义和文献[11]提出的纹理谱概念,提出了一种新的图像纹理谱描述方法.为了刻画图像像素点在某邻域内的灰度变化,我们考虑像素点的3 3邻域,如图2所示,其中I i (i =0,1, ,8)表示图像在该像素点处的灰度,I 4所在位置为中心点.对于24位RGB 彩色图像,可以用公式(1)将其转换为灰度图像.I =0.299R +0.587G +0.114B(1)如果将像素点的灰度V i 看作纹理基元,并用二进制序列V i (i =0,1, ,7)来刻画邻域内像素点的灰度沿水平方向的变化情况,即基元的排列,则V i 可定义为V i =0, if |I i -I i +1| T I1, otherw ise(2)其中,T I 为正的阈值常数(实验中取T I =2).从式(2)容易看出,本文的方法注重像素灰度的显著变化,这符合人类视觉对图像纹理的感知.因为与绝对灰度值比较,人类视觉系统对灰度的变化更为敏感 .另外,式(2)表明,iV i 越小,即 0 的个数越多,意味着该像素所在的邻域越光滑.为了刻画图像的纹理谱分布和图像的光滑度(或粗糙度),并易于计算和理解,我们将二进制序列V i (i =0,1, ,7)作进一步处理,记l T =7i=02i V i(3)这时l T 即可唯一地表示图像在此像素点处的纹理模式,即像素灰度在此3 3邻域中的变化状况.根据式(3)易知,l T 的取值范围为[0,1,2, ,255],统计图像各像素点的纹理在值l T 处的分布,就可以得到图像的纹理谱.假设用T (i,j )表示图像在像素点I (i,j )处的纹理值l T ,h [k](k =0,1,2, ,255)表示图像的纹理谱,则有196计算机辅助设计与图形学学报2003年作者曾经用类似于式(2)的方法比较邻域像素的灰度和中心像素的灰度,虽然也可以得到类似的结果,但效果不如沿水平方向好.h[k]= m-1i=0n-1j=0f(i,j)m n(4)其中,f(i,j)=1,if T(i,j)=k0,otherwise,m,n分别为图像的高度和宽度.容易看出, 255i=0h[k]=1 0.另外,从式(2)可以看出,二进制序列V0V1 V7中 0 的数目在一定程度上代表了图像在该邻域内的光滑度,如果用TN表示二进制序列V0V1 V7中 0 的数目,则TN= 7i=0(1-V i)(5)显然,TN的取值范围是[0,1, ,8],用类似于式(4)的方法统计图像各像素点的粗糙度TN在区间[0,1, ,8]的分布,就可以有效地刻画整幅图像的粗糙度.实际上,从二进制序列V0V1 V7还可以推导出其它更多的统计特征,例如,包含一定空间信息矩特征等等.与一般的纹理表示方法相比较,本文提出的纹理表示方法的主要特点是:(1)通过比较邻域内像素点灰度的变化来刻画像素点的纹理,而不是常用的绝对灰度值,这更符合人类对纹理的感知,即纹理是图像像素灰度的某种变化;(2)本文提出的纹理谱表示方法能有效地刻画图像的粗糙度;(3)本文方法得到的是像素点的局部纹理信息,这使获得图像的纹理谱成为可能.与文献[11]提出的纹理表示方法相比,(1)文献[11]的刻画策略是:如果邻域像素点的灰度比中心点的灰度小,V i=0;如果相等,V i=1;如果大,则V i=2.显然,这种描述方法对灰度的变化过于敏感,而且不能刻画像素点邻域的粗糙度,而本文的纹理谱表示方法注重像素灰度的显著变化,更符合人类视觉对图像纹理的感知;(2)本文提出的纹理谱表示方法将像素点纹理模式的数目从6 561降到了256,从而极大地降低了计算时间和空间复杂度,使得纹理谱特征在基于内容的多媒体信息检索中的应用成为可能.3 图像表示与相似性度量颜色特征计算简单而且有效,从而在基于内容的检索中得到广泛研究和应用.当前MPEG-7草案采用的颜色描述子主要包括三类方法:直方图描述子,主颜色描述子和颜色分布描述子[6-7].本文采用文献[8,12]介绍的基于主观视觉感知的颜色量化算法,它既能描述颜色直方图特征,又能刻画颜色的空间分布.其主要思想是将H,S,V三个分量按照人的颜色感知进行非等间隔的量化,这种量化方法的优点表现在:(1)由于同时考虑了H,S,V三个分量的非等间隔量化,使得量化结果更接近人类视觉对颜色的感知;(2)将视觉近似的颜色合并在一起,从而避免了其他颜色量化方法的色彩冗余问题.某一种类型的低层可视特征(如颜色,纹理,形状等)不足以准确地表示图像的内容.除了纹理谱描述子,本文还集成了图像的颜色描述子,也就是说,将该图像表示为由颜色和纹理描述子组成的高维向量.现在的问题是:如何利用图像的特征向量度量图像之间的相似度?本文采用如下策略,假设已知查询图像Q和库中候选图像X的向量表示,则它们的相似度S(Q,X)=w text ure S text ure(Q,X)+w color S color(Q,X)(6)其中,S tex ture和S color分别表示两幅图像关于特征纹理和颜色的相似度,w texture,w col or分别为其权重.对于图像颜色的相似性,本文采用欧氏距离[8],而对于纹理的相似度计算,本文采用Cosine距离度量S text ure=256i=1h x[i] h q[i]256i=1(h q[i])21/2256i=1(h x[i])21/2(7)其中,{h x[i]},{h q[i]}(i=1,2, ,256)分别为查询图像Q和库中候选图像X的纹理谱.4 实验结果及评价本文提出的图像纹理谱描述子已经在基于内容的多媒体检索系统M IRES中得到实现,该系统环境:Intel PIII800,Window s2000,256M内存.系统测试图像库中的图像都是普通的自然图像,大多数来自 Corel Im age Gallery ,总共有20多万幅.为测试本文的纹理描述子的性能,并提供实验数据,我们按照图像库的初始分类从中挑选了23个语义类(花、鸟、山、工具、建筑物、风景等),共7864幅.对图像库中的图像没有进行任何预处理(如去噪声、归一化等),对于图像库中每一幅图像,用本文方法提取并存储图像的纹理描述子(纹理谱256维,纹理粗糙度9维)和颜色描述子(108维).每一次检索,M IRES系统返回100幅最相似的图像,并按照相似度的大小排序.如果系统返回的1972期万华林等:图像纹理特征及其在CBIR中的应用图像和用户提供的示例图像属于同一个语义类,例如,查询图像为鸟,返回的图像也为鸟,就认为是一个正确的匹配.图3所示为M IRES 系统的图像检索界面及部分检索结果,检索界面的左上角为用户提供的查询图像,右边是系统返回的检索结果.实验时,我们从其中的8个图像类中随机地选取40幅测试图像,每个类5幅.测试图像类别如表1所示.表1 系统性能测试使用的图像类别及编号编号12345678类别花山鸟建筑物时装国画工具邮票通常,CBIR 的实验结果用查准率和查全率这两个指标来评价,查准率定义为p recision =a/(a +b),查全率定义为recall =a/(a +c ).其中,a 为系统返回的图像中满足条件的图像数目,b 为系统返回的图像中不满足条件的图像数目,c 为满足条件但系统未返回的图像数目.本文仅采用平均查准率(Precision )这个指标来评价本文的图像检索算法,实验数据如表2所示,而没有计算系统的查全率,这是因为查全率与系统返回图像的数目有关,M IRES 系统的测试图像库较大,每个语义类中所包含的图像数目远远超过100,因此统计系统的查全率很困难.我们在实验中发现,对于一些具有显著语义特征的图像类,本文的纹理谱特征具有很好的分类性能,如山、建筑物、国画、工具等.对于山,它们拥有的共同特征是蓝天和波浪形的山脊;国画拥有相似的颜色基调和相似的纸质纹理等.对于语义目标不突出、背景比较复杂的图像,系统的效果相对要差一点,例如在自然环境中拍摄的鸟类和时装图像,即使这样,系统的平均查准率仍然能达到50%以上.表2中的数据说明返回的图像越少,检索的准确性、相关性越高.表2 系统对于不同语义类的平均查准率图像类别A vg -P(15)Av g -P (30)A v g -P (100)花0.7330.70.75山0.9330.80.76鸟0.7670.70.59建筑物0.8670.90.82时装0.7670.6170.495国画0.9860.9330.86工具0.9170.8330.69邮票0.7460.7220.68注:图中所示的分别是系统返回15,30,100幅图像的平均查准率实验中采用相同的测试环境,对颜色描述子结合Gabor 纹理描述子,以及仅仅用颜色描述子[8],与本文提出的纹理谱描述子方法进行了对比实验.实198计算机辅助设计与图形学学报2003年验数据如图4所示,由图4可以看出,结合本文的纹理谱描述子和颜色描述子的图像特征表示具有很好的分类性能,检索准确率比文献[13]的方法平均高18.2%,比文献[8]的实验数据提高35%以上.实际上,提取图像的Gabor 纹理特征非常耗时,实验中,提取一幅835 835彩色自然图像的纹理特征时,提取本文的纹理谱特征用时1.3 s ,而提取Gabor 纹理用时125.7 s.基于内容的信息检索系统对反应速度要求很高,对于管理、存储和检索大规模的图像库,Gabor 纹理显然是不合适的.提取图像Gabor 纹理的源代码可以从http://w ww /texture/softw are/feature/下载.5 结 论本文提出了一种新的图像纹理谱表示方法,该方法的主要优点:通过比较邻域内像素点灰度的变化来刻画像素点的纹理,而不是常用的绝对灰度值,使得提取图像的纹理谱特征成为可能;注重邻域内像素灰度的显著变化,能有效地刻画图像的粗糙度.这些特点都说明本文的纹理谱描述子和人类视觉对图像纹理的感知是一致的.为了测试本文纹理谱描述子的有效性,将其应用于CBIR ,大量的实验数据证明:本文的纹理谱方法作为图像纹理描述子具有很好的分类性能.参 考 文 献[1]Flichner M ,et al .Query by image and video content:T he QBIC system[J].IEEE Computer,1995,28(9):23~32[2]Pentland A P,Picard R,et al .Photobook:Content -based ma -nipulation of image databases [J ].Journal of Computer Vision,1996,18(3):233~254[3]John R Smith,Shih -Fu Chang.VisualSEEk :A fully automated content -based image query system[A].In:Proceedings of ACM M ultimedi a 96,Boston,M A,1996.87~98[4]Yong Rui,Thomal S Huang,et al .Image retrieval:Current techniques ,promising directions,and open issues [OL ].http://research.m /users/yongrui/html/publica -tion.html,1999[5]B S M anjunath,J ens -Rainer Ohm,et al .Color and texture de -scriptors[J].IEEE Transactions on Circuits and Systems for Video Technology,2001,11(6):703~715[6]M iroslaw Borber.M PEG -7visual shape descriptors [J].IEEE Transactions on Circuits and Systems for Video T echnology,2001,11(6):716~719[7]Liu Jimin.Regi on -based image retrieval[D].Beijing:Institute of Computing Technology,Chinese Academy of Scien ces,2000(in Chinese)(刘继敏.基于形状检索的研究[博士学位论文].北京:中国科学院计算技术研究所,2000)[8]Zhang L ei.Research of the cooperation between human and computer in content -based i mage retrieval [D].Beijing:T s -inghua University,2001(in Chinese)(张 磊.基于内容的图像检索中人机协同问题的研究[博士学位论文].北京:清华大学,2001)[9]R M Haralick,K Shanmngam,et al .T exture feature for image classification[J ].IEEE T ransactions on Systems,M an,and Cybernetics,1973,SM C -3(6):768~780[10]B S M anjunath,W Y M a.T exture features for brow si ng and retrieval of image data[J].IEEE Transactions on PAM I,1996,18(8):837~842[11]H e D C ,Wang L.T exture features based on texture spectrum [J].Pattern Recognition,1991,24(5):391~399[12]Cao Lihua,Liu W ei,et al .Research and implementation of an image retrieval algorithm based on multiple dominant colors[J].Journal of Computer Research &Development,1999,36(1):33~37(in Chinese)(曹莉华,柳 伟,等.集于多种主色调的图像检索算法研究与实现[J].计算机研究与发展,1999,36(1):33~37)[13]Jia L i ,James Z Wang,Gio W iederhold.IRM :Integrated re -gion matching for image retrieval[A].In :Proceedings of ACM M ultimedi a,Los Angeles,2000.147~1561992期万华林等:图像纹理特征及其在CBIR 中的应用。
用于CBIR的图像颜色和纹理特征提取的开题报告一、研究背景和意义随着数字图像的快速发展,图像信息的获取和处理变得越来越重要。
图像检索是利用计算机技术对图像进行语义分析和获取的过程。
基于内容的图像检索(CBIR)是图像检索中的一个重要分支,它是通过对图像的特定属性,如颜色、纹理等进行描述和匹配,来实现对图像的检索和分类。
在CBIR中,图像特征的提取是关键步骤之一,准确的特征提取可以大大提高检索的效率和准确性。
而颜色和纹理特征作为图像的基本视觉特征,被广泛应用于CBIR 中。
本课题研究将在传统的颜色和纹理特征提取方法的基础上,利用新的图像特征提取方法和算法,提高CBIR系统的检索效率和准确性,为图像检索技术的发展做出贡献。
二、研究内容和目标本课题研究的内容主要包括:CBIR系统的设计和实现、图像颜色和纹理特征的提取算法研究、基于神经网络的图像特征提取方法研究、特征融合算法研究等方面。
本课题的目标是:1. 实现一个高效、准确的CBIR系统,具有良好的用户界面和搜索性能。
2. 提出一种基于卷积神经网络的图像颜色和纹理特征提取算法,该算法具有高效、准确等优点。
3. 提出一种特征融合算法,将不同特征提取方法得到的特征进行融合,提高CBIR系统的检索效率和准确性。
三、研究方法和步骤本课题采用的研究方法主要包括:问题分析法、文献调研法、实验分析法等。
本课题的步骤大致如下:1. 对CBIR系统进行需求分析,确定系统的功能、性能等方面的要求。
2. 综合研究图像颜色和纹理特征提取算法的理论和实践应用,分析不同算法的优劣。
3. 提出基于卷积神经网络的图像特征提取算法,并进行实验验证。
4. 提出一种特征融合算法,并进行实验验证。
5. 对CBIR系统进行设计和实现,开展实验测试,对系统的性能进行评估和优化。
四、预期成果和意义本课题预期具有以下成果和意义:1. 实现一个高效、准确的CBIR系统,具有优秀的用户界面和搜索性能。
技术市场1.引言基于内容特征的图像检索(Content-Based Image Re-trieval,CBIR)不同于传统的检索手段,直接以图像自身的属性,如颜色、纹理、形状等反映图像内容并与图像存储在一起的各种量化特征作为检索参数,使用的是基于相似性度量的示例查询(Query By Example)方法,具有传统的文本检索技术无法比拟的优越性。
目前,基于内容的图像检索技术已成为检索技术研究的热点。
2.基于内容的图像检索技术CBIR采用视觉特征描述方法,比较通用、有效的对图像的检索是基于图像的颜色、纹理、形状以及图像中子图像等特征,主要包括:①纹理检索,检索具有相似纹理的图像。
②颜色检索,检索与用户指定颜色相似的图像。
③形状检索,用户选择形状或勾勒草图,利用形状特征或匹配主要边界进行检索。
2.1基于纹理检索纹理是指某种基本结构元素在图中有规律的表现,这种基本的结构元素在大小、灰度和空间关系上自然呈现周期性或者随机性;在视觉上表现为粒度、取向及重复性。
为了定量地描述纹理,需要研究纹理本身可能具有的特征。
多年来,人们建立了许多纹理分析方法。
根据纹理的不同表现,处理的方法可以分为四类:基于结构的方法、统计的方法、频谱分析的方法和模型匹配方法。
然而,由于纹理的复杂表现,基于纹理进行检索所需要的纹理分割是困难的事,另外还缺少稳健的纹理模型以及直观性。
2.2基于颜色检索色彩是图像的重要特征之一,具有对图像旋转、平移、尺度变化、甚至各种形变都不敏感的特点,是基于内容的图像索引中应用最广泛的特征。
颜色特征一般采用Swain和Ballard 所提出的颜色直方图来描述。
2.3基于形状检索和颜色、纹理相比,形状特征显得更为直观,而且便于交互描述。
一幅图像中物体的形状,代表着高层信息。
通过边沿检测、细化和收缩等算法可以提取出物体的轮廓,轮廓仍旧保留了物体的主要信息。
基于形状检索基本上是从形状的轮廓特征和形状的区域特征来建立图像的索引。
cbir地原理和基础
CBIR,即基于内容的图像检索,是一种用于图像检索的技术。
它的原理和基础主要基于图像特征的提取和匹配。
具体来说,CBIR首先从待检索的图像中提取出各种特征,如颜色、纹理、形状和空间关系等。
然后,将这些特征与图像数据库中的特征进行比较,找出相似的特征,从而找出相似的图像。
为了实现这一过程,CBIR需要具备以下基础:
1.特征提取:这是CBIR中最关键的步骤。
好的特征能够有效地描述图
像的内容,提高检索的准确率。
常用的特征包括颜色、纹理、形状和空间关系等。
2.特征匹配:在提取出特征后,需要将这些特征与数据库中的特征进行
比较,找出相似的特征。
这一过程需要考虑到特征之间的相似性和距离度量。
3.相似度排序:在比较了特征之后,需要将相似的特征按照相似度进行
排序,以便用户能够快速找到他们需要的图像。
4.索引技术:为了加快检索速度,CBIR需要使用索引技术来对图像特
征进行索引。
常用的索引技术包括哈希索引、B树索引和倒排索引
等。
通过这些原理和基础,CBIR能够实现快速、准确的图像检索,为用户提供更好的检索体验。
基于颜色与形状特征的CBIR系统的研究与实现的开题报告一、选题背景及研究意义随着数字图像技术的不断发展,数字图像在人们的生活中占据了越来越重要的地位。
在众多的图像应用领域中,图像检索(Content-Based Image Retrieval, CBIR)已成为一个重要的研究领域。
在CBIR中,图像的内容被用来作为图像的检索关键字,而这些内容通常取决于这些图像的特征。
图像特征是指在图像中包含的可供计算机处理的信息,通常包括颜色、纹理、形状等方面的信息。
目前,已经有许多的CBIR系统被研究出来,然而,如何在这些特征中选择合适的特征并提高检索效率是本领域中的热点问题。
本文通过研究基于颜色与形状特征的CBIR系统,探讨了CBIR系统中特征选择与检索效率的问题,并提出了一种基于颜色与形状特征分类的检索方法,旨在达到更高的检索准确率和效率,对于CBIR技术的发展有一定的参考价值。
二、研究内容及方法本文主要研究以下内容:1. 利用颜色与形状特征对图像进行特征提取。
2. 通过图像分类器对提取出的特征进行分类。
3. 对分类结果进行汇总、排序后输出。
本文的研究方法主要是:1. 使用Python语言实现基于颜色与形状特征提取的算法。
2. 利用经典的分类算法(如SVM算法)进行分类。
3. 利用评估函数评价检索结果的准确率和效率。
三、预期结果本文研究的基于颜色与形状特征的CBIR系统,旨在达到以下预期结果:1. 实现基于颜色与形状特征提取的算法。
2. 使用分类算法对提取出的特征进行分类,并对分类结果进行汇总、排序输出。
3. 对结果进行评价,优化算法,提高检索效率和准确率。
四、研究的难点及解决方案本文的研究难点主要包括以下两个方面:1. 如何选择合适的特征进行检索。
本文采用了基于颜色与形状特征分类的方法,通过调整分类器的参数来达到最优的分类效果。
2. 如何提高系统的运行速度。
本文通过使用较为高效的Python语言以及优化算法的方式进行改进,提高系统的运行速度。
综合颜色和纹理特征的图像检索1、引言近年来,随着信息技术的迅猛发展,图像处理在各个领域的应用越来越广泛。
如何快速的组织、管理和检索图像数据库已成为近年来研究的热点研究课题[1]。
图像特征可以从各个方面描述图像的内在语义。
根据对不同特征定义的相似度来表示图像之间的相似度,可以实现对图像的精细、快速检索。
基于内容的图像检索(CBIR)[2]得到学术界和应用领域的青睐。
本文在颜色的特征提取方面,利用文献[4]提出的基于HVS 加权颜色特征的方法,对不同分块的主色进行加权处理,形成基于主色特征加权的颜色特征;在纹理特征提取方面,对传统共生矩阵进行改进,结合结构分析方法中的共生矩阵的优点,提取更丰富的纹理特征。
最后利用高斯归一化方法将图像颜色和纹理特征结合,形成最终的检索特征。
实验结果验证了该方法的高效性。
2、基于颜色特征的图像检索2.1颜色空间选取HSV颜色表示色相、饱和度和亮度三个分量组成,该颜色空间可以用一个圆锥来表示。
每个分量都与人的视觉有一定的关联。
由于HSV空间是高维,需进一步进行量化,才可以使运算得到简化。
对于色调H、饱和度S和亮度V的权重分别取15、4、1,由于色调包含图像的大多数信息,减少亮度和饱和度对检索图像的影响,进行量化后[5],合成为一维颜色:L=15H+4S+V2.2 颜色特征的提取采用分块和圆环结合的方式进行颜色特征的提取,首先对图像进行分块,将图像看成为矩阵,用行列号进行分块,对每个分块的像素进行量化合成后,都可以获得一个具有64(假设划分为8×8)的一维颜色分量的矢量,提取其中像素点数多的作为该分块颜色的主色,最后获得图像的综合主色颜色向量。
采用熵的图像分块边缘检测[6],然后采用圆环分割分割图像,图像被划分为N个圆形。
上述两种方法的结合,克服传统只是通过单一的分块或圆环的方式来检索图像的颜色特征。
此外,可以根据实际需要,解决图像的标准化、单一的问题。
采用直方图有时候会出现零值,影响检索的效果和标准。
题目:基于形状特征的图像检索系统的设计与实现基于形状特征的图像检索系统的设计与实现摘要近年来,随着多媒体和计算机互联网技术的快速发展,数字图像的数量正以惊人的速度增长。
面对日益丰富的图像信息海洋,人们需要有效地从中获取所期望得到多媒体信息。
因此,在大规模的图像数据库中进行快速、准确的检索成为人们研究的热点。
为了实现快速而准确地检索图像,利用图像的视觉特征,如颜色、纹理、形状等来进行图像检索的技术,也就是基于内容的图像检索技术(CBIR)应运而生[6]。
本文主要研究基于形状特征的图像检索,边缘检测是基于形状特征的一种检索方法,边缘是图像最基本的特性。
在图像边缘检测中,微分算子可以提取出图像的细节信息,景物边缘是细节信息中最具有描述景物特征的部分,也是图像分析中的一个不可或缺的部分。
本文详细地分析了一种边缘检测方法Canny算子,用C++编程实现各算子的边缘检测,并根据边缘检测的有效性和定位的可靠性,得出Canny算子具备有最优边缘检测所需的特性。
并通过基于轮廓的描述方法,傅里叶描述符对图像的形状特征进行描述并存入数据库中。
对行相应的检索功能。
关键词:图像检索;形状特征;Canny算子;边缘检测;傅里叶描述符Design and Implementation of Image Retrieval System Based onShape FeaturesABSTRACTWith the rapid development of multimedia and computer network technique, the quantity of digital image and video is going up fabulously. Facing the vast ocean of information of image, it has a good sense to obtain the desired multimedia information. Currently, rapid and effective searching for desired image from large-scale image databases becomes an hot research topic.In order to retrieve image quickly and accurately using image visual features such as color, texture, shape, which named content-based image retrieval (CBIR) came into being. This paper introduces the principle of wavelet transform applying to image edge detection. Edge detection is based on the shape of the characteristics of a retrieval method, and the edge is the most basic characteristics of the image. In the image edge detection ,differential operator can be used to extract the details of the images, features’ edge is the most detailed information describing the characteristics of the features of the image analysis, and is also an integral part of the image. This paper analyzes a Canny operator edge detection method, and we complete with the C++ language procedure to come ture edge detection. According to the effectiveness of the image detection and the reliability of the orientation, we can deduced that the Canny operator have the characteristics which the image edge has. And contour-based method for describing the image Fourier descriptors to describe the shape feature and stored in the database. Align the corresponding search function.Key words:image retrieval;sharp feature;Canny operator;edge detection;Fourier shape descriptors目录1 前言 (1)1.1 课题背景及研究意义 (1)1.2 国内外发展状况 (1)1.3 课题研究的主要内容 (2)2 基于形状特征的图像检索 (3)2.1 图像检索技术的发展过程 (3)2.1.1 基于内容的图像检索技术 (3)2.1.2 基于形状特征的图像检索 (3)2.2 边缘检测 (4)2.3 Canny边缘检测 (4)2.3.1 Canny指标 (4)2.3.2 Canny算子的实现 (5)2.4 基于轮廓的描述方法 (7)2.4.1 傅立叶形状描述符 (7)2.5 图像的相似性度量 (9)3 基于形状特征的图像检索系统的设计 (10)3.1 Canny算子的程序设计 (10)3.2 图像特征数据库设计 (11)3.3 实验结果 (12)4 基于形状特征的图像检索系统实现 (13)4.1 系统框架 (13)4.2 编程环境 (14)4.3 程序结果 (14)5 总结 (15)参考文献 (16)致谢 (17)附录 (18)1前言1.1课题背景及研究意义随着多媒体技术、计算机技术、通信技术及Intemet网络的迅速发展,人们正在快速地进入一个信息化社会。
研究生课程考核试卷科目:数字图象处理教师:黄鸿姓名:井涛学号:20120802040 专业:仪器科学与技术类别:学术上课时间:2012 年10月至2012 年12月考生成绩:卷面成绩平时成绩课程综合成绩阅卷评语:阅卷教师(签名)重庆大学研究生院制基于综合特征的图像检索系统摘要基于内容的图像检索(CBIR)是一个非常热门的研究领域。
本文在对颜色特征、形状特征和纹理特征的研究基础上,将三种特征结合在一起,实现了可以自定义权重的综合特征的图像检索系统,并在Matlab平台上实现了这一系统。
图像特征的提取和相似性度量是CBIR的两个关键技术。
对于颜色特征,本文采用HSV空间中的颜色矩表示颜色特征;对于形状特征,本文采用图像的Hu 不变矩作为形状特征;对于纹理特征,为减少计算量,本文首先对图像进行预分割,提取分割后区域基于傅立叶描述子的纹理特征作为整个图像的纹理特征。
在相似性度量方面,采用曼哈顿距离作为度量标准,得到各个特征的相似度向量。
本文在Matlab平台上实现了这一图像检索系统,实现自定义权重以及综合特征下的图像检索,并在655副图像的大数据库中随机抽取24副图像进行检索实验,得到了较好的效果。
关键词:图像检索,颜色矩,不变矩,傅立叶描述子AbstractNowadays content-based image retrieval (CBIR) has become a very active field. On the basis of study on the color features, shape feature and the texture characteristics, in order to achieve a comprehensive retrieval system, these three features are combined together in the paper, which has been built on Matlab.There are two key techniques in CBIR, which are image feature extraction and similarity measure. The color characteristic in this paper is expressed in the method of extracting color moments in HSV space. The shape feature used in this system is the invariant moments of images. As to texture characters, bo undaries’ Fourier descriptor is used after the image is divided.This paper bulit an image retrieval system based on Matlab which combines these three features and realizes user-defined weights. This retrieval system has a good effect on a database of 24 images.KeyWords:Image retrieval, Color moments, Invariant moments, Fourier descriptor1 图像检索的发展历程从20世纪70年代开始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术(Text-based Image Retrieval,简称TBIR),利用文本描述的方式描述图像的特征。
到90年代以后,出现了对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术,即基于内容的图像检索(Content-based Image Retrieval,简称CBIR)技术。
2 基于内容的图像检索2.1 基于内容的图像检索的概念基于内容的图像检索根据图像、图像的内容语义以及上下文联系进行查找,以图像语义特征为线索从图像数据库中检出具有相似特性的其它图像。
因为图像的规模一般要大于纯粹的文本信息,因此,基于内容的图像检索在检索的速度和效率上要求更高。
2.2 CBIR的研究现状在上世纪90年代,随着计算机和网络技术得到广泛应用之后,基于内容的图像检索技术取才得了较大的突破,人们也逐渐地将对基于内容的图像检索技术的研究成果应用到实际的工作和生活中,而对这种技术的需求的日益增长也驱动人们对基于内容的图像检索的技术向更高的层次进行研究。
从当前的CBIR的研究的热点和未来的发展趋势的来看,可大致将其研究分为三层[3]:1.最低层次的检索,在这个层次主要是利用全局特征(例如:颜色、纹理、形状等底层特征)去描述图像的内容,进行检索,这也是最直接的层面;2.较高层次的检索,该层次主要是利用图像对象语义来描述图像的内容,进行检索,这种技术是底层特征的基础上加入了图像语义特征(例如:对象与对象之间的空间关系等);3.最高层次的检索,该层次是利用图像概念级语义来描述图像的内容,进行检索,该技术是建立在图像对象语义特征提取的基础上加入了图像的概念级语义(例如:用户对图像的理解、情感等高层语义)。
尽管对CBIR技术的研究已经经过了很长时间,但目前较为常用的CBIR技术基本上都是基于底层特征的检索。
现有的CBIR底层特征的检索系统主要包括基于颜色的图像检索系统、基于纹理的图像检索系统和基于形状的图像检索系统,下面就对上述三种检索系统进行一下简单的概述。
2.2.1 基于颜色特征的图像检索颜色是描述图像内容最直接的视觉特性。
颜色特征是一种定义比较明确和简单的特征,人的视觉对它的敏感度最大,人眼可以很直观地利用颜色特征区分出两幅图像的不同之处,因此颜色特征成为在CBIR研究中最早被用到的图像特征。
颜色特征的表示方法主要包括颜色索引、颜色矩等。
颜色索引是一种以颜色直方图和直方图相交算法为基础的颜色特征表示方法,该方法在上述基础上,首先,将颜色空间划分为多个固定的子空间;其次,统计每个固定的子空间中像素的数目;最后,用直方图相交算法计算图像之间的相似度,按照相似度的大小对检索结果进行输出。
该方法除了具有颜色特征通用的优点外,还有个突出优点是计算简单。
但也存在两个不足之处:一是它没有办法反映出颜色的空间分布信息,例如两幅图像中对象空间分布的位置不同时,这两幅图像可能具有几乎完全一致的颜色直方图。
二是量化方法的不一样也可能对检索结果也可能产生很大的影响,比如原来两幅图像的颜色直方图很相似,但是由于量化过大,使得某些颜色消失,最终得到的两幅图像的颜色直方图大相径庭,这样造成了图像检索的准确度大大折扣。
由于颜色直方图在空间信息方面的缺失,后来又出现了颜色矩的概念来表示颜色特征,该方法先将图像按照一定的规则进行分块,然后对每一块提取颜色直方图。
随后,出现了按物体对象的空间分割法,将图像按照图像中对象的分布进行分割,然后提取每个对象的颜色特征和对象之间的空间信息。
上述两种方法都是在颜色整体特征的信息中加入了图像的空间分布信息,但是这两种方法存在的共同的缺陷是对于任意图像,如何对图像进行合适的分割。
除了上述颜色特征的表示方法外,还有颜色相关向量法和颜色聚类法,这两种方法也在颜色的特征中添加了空间信息,在实际的应用中不常见,还处于研究阶段。
2.2.2 基于纹理特征的图像检索和颜色一样,纹理是也是图像中一种不可或缺的视觉特性。
纹理没有统一的定义,一般可以用图像的某种局部性质来对纹理下定义,纹理描述了局部区域中像素之间的关系,同时也描述了图像中的空间分布信息。
对纹理可以通过粗糙度、方向性、对比度和规则性四个方面来描述。
应用较为广泛的基于纹理特征的图像检索技术包括采用共生矩阵,和基于数学模型如小波变换的纹理特征检索。
2.2.3 基于形状特征的图像检索形状描述的是图像中各种物体的外在特征,所以基于形状的检索系统中最关键的技术是如何表示图像中物体的特有的外在特征和如何对提取出的形状特征进行特征匹配,目前常用的描述形状特征的方法主要包括:矩描述法、边界描述法和几何参数法。
以前表示形状特征的常用方法有链码、曲线、傅里叶描述子和B 样条曲线等[6]。
后来又出现了小波描述逼近法和超二次曲线法。
形状特征的提取需要人工对图像进行分割、提取目标,就目前的发展状况,还没有实现对形状特征的自动提取。
而人眼对颜色和纹理特征比较敏感,提取方法也相对比较简单,所以在目前的检索系统中使用最多的底层特征是颜色和纹理特征。
3.基于综合特征的CBIR为了结合各个底层特征的优点,本文同时提取图像的颜色、形状和纹理三种特征结合为一个综合特征,并实现结合权重的自定义。
3.1 颜色特征在颜色特征方面,为减小运算量,采用颜色矩作为检索的特征,分别提取被检测图像和数据库中图像的一、二、三阶矩。
由于HSV 颜色空间的色调、饱和度、明度与人眼对颜色的主观认识相对比较符合,与其他颜色空间相比HSV 空间能更好的反映人类对颜色的感知,所以本文采用HSV 颜色空间下的颜色矩作为颜色特征。
使用曼哈顿距离进行颜色矩相似度度量。
颜色信息集中在图像颜色的低阶矩中,主要是每种颜色分量的一阶矩(均值)、二阶矩(方差)、三阶矩(斜度),可以有效地表示图像中的颜色分布。
三个颜色矩的数学定义如下:11N i ij j f N μ==∑211()N i ij i j f Nσμ==-∑ 311()N ij i j fN ξμ==-∑其中ij f 表示像素j 的颜色值为i 的概率,N 为图像中像素点的个数。
若用,Q I 表示两幅图像,则它们的矩的距离公式为:31211[,]()Q I Q I Q I i i i i i i i i i i D Q I ωμμωσσωξξ==-+-+-∑其中,0(1,3)ij i j ω≥≤≤是指定的加权洗漱,一般要设置为12i i ωω≥,13i i ωω≥,提高了平均颜色的比重。
提取到待匹配图和数据库图的颜色矩后,利用曼哈顿特征进行度量,即可得到颜色特征的相似性向量。
3.2 形状特征本文利用形状不变矩作为图像检索的形状特征。
利用目标区域所占的区域的矩作为形状描述参数是常用的形状描述方法。
Hu 矩不变量由于具有不随图像的位置、大小和方向而变化的特点,对于提取图像中的形态特征来说,是一个非常有效的工具。
区域(,)f x y 的()p q +阶矩定义为:(,)p q pq x ym x y f x y =∑∑ ,0,1,2,.p q = 其相应的中心距定义为:()()(,)p q pq x yu x x y y f x y =--∑∑ ,0,1,2,.p q = 其中,1000m x m =,0100m y m =, 即重心坐标。