前景与背景最大熵算法图像分割
- 格式:ppt
- 大小:874.00 KB
- 文档页数:10
医学图像分割方法综述林瑶,田捷1北京,中国科学院自动化研究所人工智能实验室,100080摘要: 图像分割是一个经典难题,随着影像医学的发展,图像分割在医学应用中具有特殊的重要意义。
本文从医学应用的角度出发,对医学图像分割方法,特别是近几年来图像分割领域中出现的新思路、新方法或对原有方法的新的改进给出了一个比较全面的综述,最后总结了医学图像分割方法的研究特点。
关键词:医学图像分割 综述1.背景介绍医学图像包括CT 、正电子放射层析成像技术(PET )、单光子辐射断层摄像(SPECT )、MRI (磁共振成像技术)、Ultrasound (超声)及其它医学影像设备所获得的图像。
随着影像医学在临床医学的成功应用,图像分割在影像医学中发挥着越来越大的作用[1]。
图像分割是提取影像图像中特殊组织的定量信息的不可缺少的手段,同时也是可视化实现的预处理步骤和前提。
分割后的图像正被广泛应用于各种场合,如组织容积的定量分析,诊断,病变组织的定位,解剖结构的学习,治疗规划,功能成像数据的局部体效应校正和计算机指导手术[2]。
所谓图像分割是指将图像中具有特殊涵义的不同区域区分开来,这些区域是互相不交叉的,每一个区域都满足特定区域的一致性。
定义 将一幅图像,其中g x y (,)0≤≤x Max x _,0≤≤y Max y _,进行分割就是将图像划分为满足如下条件的子区域...:g 1g 2g 3 (a) ,即所有子区域组成了整幅图像。
(b) 是连通的区域。
g k (c) ,即任意两个子区域不存在公共元素。
(d) 区域满足一定的均一性条件。
均一性(或相似性)一般指同一区域内的像素点之间的灰度值差异较小或灰度值的变化较缓慢。
g k 如果连通性的约束被取消,那么对像素集的划分就称为分类(pixel classification),每一个像素集称为类(class)。
在下面的叙述中,为了简单,我们将经典的分割和像素分类通称为分割。
第六章图像的锐化处理一.填空题1. 在图像的锐化处理中,通过一阶微分算子和二阶微分算子都可以进行细节的增强与检测.垂直方向的微分算子属于________________.〔填"一阶微分算子〞或"二阶微分算子〞〕2. 在图像的锐化处理中,通过一阶微分算子和二阶微分算子都可以进行细节的增强与检测.Roberts 交叉微分算子属于________________.〔填"一阶微分算子〞或"二阶微分算子〞〕3. 在图像的锐化处理中,通过一阶微分算子和二阶微分算子都可以进行细节的增强与检测.Sobel微分算子属于________________.〔填"一阶微分算子〞或"二阶微分算子〞〕4. 在图像的锐化处理中,通过一阶微分算子和二阶微分算子都可以进行细节的增强与检测.Priwitt 微分算子属于________________.〔填"一阶微分算子〞或"二阶微分算子〞〕5. 在图像的锐化处理中,通过一阶微分算子和二阶微分算子都可以进行细节的增强与检测.Laplacian微分算子属于________________.〔填"一阶微分算子〞或"二阶微分算子〞〕6. 在图像的锐化处理中,通过一阶微分算子和二阶微分算子都可以进行细节的增强与检测.Wallis 微分算子属于________________.〔填"一阶微分算子〞或"二阶微分算子〞〕7. 在图像的锐化处理中,通过一阶微分算子和二阶微分算子都可以进行细节的增强与检测.水平方向的微分算子属于________________.〔填"一阶微分算子〞或"二阶微分算子〞〕8. 图像微分______________了边缘和其他突变的信息.〔填"增强〞或"削弱〞〕9. 图像微分______________了灰度变化缓慢的信息.〔填"增强〞或"削弱〞〕10. 图像微分算子______________用在边缘检测中.〔填"能〞或"不能〞〕四.简答题1. 图像中的细节特征大致有哪些?一般细节反映在图像中的什么地方?2. 一阶微分算子与二阶微分算子在提取图像的细节信息时,有什么异同?3. 简述水平方向的微分算子的作用模板和处理过程.4. 简述垂直方向的微分算子的作用模板和处理过程.5. 已知Laplacian微分算子的作用模板为:,请写出两种变形的Laplacian算子. 解答:1. 图像的细节是指画面中的灰度变化情况,包含了图像的孤立点、细线、画面突变等.孤立点大都是图像的噪声点,画面突变一般体现在目标物的边缘灰度部分.2. 一阶微分算子获得的边界是比较粗略的边界,反映的边界信息较少,但是所反映的边界比较清晰;二阶微分算子获得的边界是比较细致的边界.反映的边界信息包括了许多的细节信息,但是所反映的边界不是太清晰.五.应用题1. 已知Roberts算子的作用模板为:,Sobel算子的作用模板为:.设图像为:请完成:①用Roberts算子对其进行锐化,写出锐化过程和结果.〔4分〕②用Sobel算子对其进行锐化,写出锐化过程和结果.〔6分〕.设图像为:请完成:①用Roberts算子对其进行锐化,写出锐化过程和结果.〔4分〕②用Laplacian算子对其进行锐化,写出锐化过程和结果.〔6分〕3. 已知Roberts算子的作用模板为:,Sobel算子的作用模板为:.设图像为:请完成:①用Roberts算子对其进行锐化,写出锐化过程和结果.〔4分〕②用Sobel算子对其进行锐化,写出锐化过程和结果.〔6分〕4. 已知Roberts算子的作用模板为:,Laplacian算子的作用模板为:.设图像为:请完成:①用Roberts算子对其进行锐化,写出锐化过程和结果.〔4分〕②用Laplacian算子对其进行锐化,写出锐化过程和结果.〔6分〕5. 已知Roberts算子的作用模板为:,Sobel算子的作用模板为:.设图像为:请完成:①用Roberts算子对其进行锐化,写出锐化过程和结果.〔4分〕②用Sobel算子对其进行锐化,写出锐化过程和结果.〔6分〕.设图像为:请完成:①用Roberts算子对其进行锐化,写出锐化过程和结果.〔4分〕②用Laplacian算子对其进行锐化,写出锐化过程和结果.〔6分〕7. 已知Roberts算子的作用模板为:,Sobel算子的作用模板为:.设图像为:请完成:①用Roberts算子对其进行锐化,写出锐化过程和结果.〔4分〕②用Sobel算子对其进行锐化,写出锐化过程和结果.〔6分〕8. 已知Roberts算子的作用模板为:,Laplacian算子的作用模板为:.设图像为:请完成:①用Roberts算子对其进行锐化,写出锐化过程和结果.〔4分〕②用Laplacian算子对其进行锐化,写出锐化过程和结果.〔6分〕9. 已知Roberts算子的作用模板为:,Sobel算子的作用模板为:.设图像为:请完成:①用Roberts算子对其进行锐化,写出锐化过程和结果.〔4分〕②用Sobel算子对其进行锐化,写出锐化过程和结果.〔6分〕.设图像为:请完成:①用Roberts算子对其进行锐化,写出锐化过程和结果〔4分〕②用Laplacian算子对其进行锐化,写出锐化过程和结果〔6分〕第七章图像分割一.填空题1. 依照分割时所依据的图像特性不同,图像分割方法大致可以分为_阈值方法__、边界分割方法和区域提取方法三大类.2. 基于图像灰度分布的阈值方法包含很多种算法,其中,p-参数法是针对预先已知图像中_ _____目标物所占比例__________的情况下,所采用的一种简单有效的方法.3. ____熵_____是信息论中对不确定性的度量,是对数据中所包含信息量大小的度量.4. 所谓聚类方法,是采用模式识别中的聚类思想,以____类内_保持最大相似性以与类间保持最大距离为目标,通过迭代优化获得最佳的图像分割阈值.5. 基于图像灰度分布的阈值方法包含很多种算法,其中,____p-参数法__是针对预先已知图像中目标物所占比例的情况下,所采用的一种简单有效的方法.二.选择题1. 以下图像分割方法中,不属于基于图像灰度分布的阈值方法的是〔 D 〕A、类间最大距离法B、最大类间、内方差比法C、 p-参数法D、区域生长法2. 以下图像分割方法中,属于基于图像灰度分布的阈值方法的是〔 B 〕A、区域合并、分裂法B、最大类间、内方差比法C、已知形状的曲线检测D、区域生长法3. 关于进行图像分割时使用的最大类间、类内方差比法,下列说法正确的是〔 C 〕A、选择的阈值使得两类数据间的方差越小越好.B、选择的阈值使得同一类的数据之间的方差越大越好.C、使用类间、类内方差比作为选择阈值的评价参数.D、使用类内、类间方差比作为选择阈值的评价参数.4. 关于最大类间、类内方差比法,下列说法正确的是〔D 〕A、选择的阈值使得两类数据间的方差越小越好.B、选择的阈值使得同一类的数据之间的方差越大越好.C、选择的阈值使得两类数据间的方差越小越好,同时同一类的数据之间的方差越大越好.D、选择的阈值使得两类数据间的方差越大越好,同时同一类的数据之间的方差越小越好.5. 使用类间最大距离法进行图像分割时,下列步骤正确的是〔 C 〕①计算相对距离度量值.②给定一个初始阈值,将图像分成目标和背景两类.③分别计算出两类的灰度均值.④选择最佳的阈值,使得图像按照该阈值分成两类后,相对距离度量值达到最大.A、①②③④B、②①③④C、②③①④D、①③②④三.判断题1. 阈值方法的核心是阈值的确定.〔 T 〕2. 类间最大距离法的设计思想是:在某个适当的阈值下,图像分割后的前景目标与背景两个类之间的差异最小为最佳分割.〔 F 〕3. 类间最大距离法的设计思想是:在某个适当的阈值下,图像分割后的前景目标与背景两个类之间的差异最大为最佳分割.〔 T 〕4. 二维熵方法的设计思想是:采用二维熵来度量像素以与其邻域像素中像素之间的信息相关性,当空间相关信息量最小时,认为是最佳阈值.〔 F 〕5. 二维熵方法的设计思想是:采用二维熵来度量像素以与其邻域像素中像素之间的信息相关性,当空间相关信息量最大时,认为是最佳阈值.〔T 〕6. 区域生长方法的实现有三个关键点:种子点的选取;生长准则的确定;区域生长停止的条件.〔 T〕7. 区域生长方法中选取的种子点只能是单个像素.〔F 〕8. 在使用区域合并、分裂方法进行图像分割时,不需要用到每个子块的属性.〔 F 〕9. 基于图像灰度空间分布的阈值方法不需要考虑像素与像素之间的相关性.〔 F 〕10. 基于图像灰度空间分布的阈值方法除了考虑当前像素本身的灰度值外,还需要考虑其与邻近像素之间的关系.〔T 〕一.填空题1. 如果当前点像素值为1,其四近邻像素中至少有一个点像素值为1,即认为存在两点间的通路,称之为___四连接___.2. 如果当前点像素值为1,其八近邻像素中至少有一个点像素值为1,即认为存在两点间的通路,称之为____八连接____________.3. 开运算是使用同一个结构元素对图像先___腐蚀_______再进行膨胀的运算.4. 在对二值图像进行分析时,我们将相互连接在一起的像素值全部为1的像素点的集合称为一个___连通域_____.5. 闭运算是使用同一个结构元素对图像先___膨胀________再进行腐蚀的运算.6. 形态学处理中最基本的运算是腐蚀与膨胀.其中,_____腐蚀______通常在去除小颗粒以与消除目标物之间的粘连是非常有效的.7. 形态学处理中最基本的运算是腐蚀与膨胀.其中,_____膨胀______通常用以填补目标物中存在的某些空洞.8. 在对二值图像进行分析时,通常用_____欧拉数_______表示二值图像中连通域的个数减去孔的个数.三.判断题1. 贴标签处理是对二值图像的每个不同的连通域进行不同的编号,来区分不同的连通域.〔T〕2. 膨胀运算可以理解为对图像的补集进行腐蚀处理.〔T 〕3. 膨胀是一种消除边界点,使边界向内收缩的过程.〔 F 〕4. 膨胀是将与目标区域接触的背景点合并到该目标物中,使目标边界向外扩张的处理.〔T 〕5. 经过细线化之后,图像中所有线条的幅度均为一个像素.〔T 〕6. 可以用圆形度来表示二值图像中的各个连通域的形状与圆形的相似程度.〔 T 〕7. 可以用矩形度来表示二值图像中的各个连通域的形状与矩形的相似程度.〔T 〕8. 在连通域中的点,按照其是否与背景相邻接,可以分为内部点和外部点.〔 F 〕9. 在连通域中的点,按照其是否与背景相邻接,可以分为内部点和边界点.〔 T 〕10. 在对二值图像进行分析时,将没有孔的连通域称为单连通.〔 T 〕四.简答题1. 写出腐蚀运算的处理过程.2. 写出膨胀运算的处理过程.3. 在二值图像中的几何特征测量中,面积是如何定义的?.解答:1. 腐蚀运算的处理过程为:1〕扫描原图,找到第一个像素值为1的目标点;2〕将预先设定好形状以与原点位置的结构元素的原点移到该点;3〕判断该结构元素所覆盖的像素值是否全部为1:如果是,则腐蚀后图像中的相同位置上的像素值为1;如果不是,则腐蚀后图像中的相同位置上的像素值为0; 4〕重复2〕和3〕,直到所有原图中像素处理完成.2. 膨胀运算的处理过程为:1〕扫描原图,找到第一个像素值为0的背景点;2〕将预先设定好形状以与原点位置的结构元素的原点移到该点;3〕判断该结构元素所覆盖的像素值是否存在为1的目标点:如果是,则膨胀后图像中的相同位置上的像素值为1;如果不是,则膨胀后图像中的相同位置上的像素值为0; 4〕重复2〕和3〕,直到所有原图中像素处理完成.第九章彩色图像处理一.填空题1. HSV表色系由色调、饱和度和亮度三属性组成.2.饱和度与一定色调的纯度有关,饱和度________________的颜色看起来越鲜艳.〔填"越大〞或"越小〞〕3. 在YUV表色系中,Y表示亮度,U表示蓝色与亮度的色差,V表示_红色__与亮度的色差.4. 人在区分颜色时常用的三种基本特征量为辉度、色调和饱和度.其中,色调_是与混合光谱中主要光波长相联系的,表示了感官上感受到的不同的颜色._饱和度__与一定色调的纯度有关,饱和度越大的颜色看起来越鲜艳.5. 国际照明委员会于1931年规定了三种基本色的波长,并将其称为三基色,它们分别是红色、蓝色和___绿色_____.6. 人在区分颜色时常用三种基本特征量,它们是:辉度、_色调_和饱和度.二.选择题1. 以下选项中,不属于表色系的是:〔 B 〕A、 RGBB、 DCTC、 CMYKD、 HSI2. 关于RGB 表色系,以下说法不正确的是的〔 A 〕A、RGB表色系是减色系统.B、RGB 表色系的三基色中包含红色.C、若某个像素点的值是〔0,255,0〕,则表示该颜色中只含绿色.D、若某个像素点的值是〔255,255,255〕,则表示该颜色为白色.3. HSI 表色系的三属性包含:〔 A 〕①色调②色饱和度③亮度④色度A、①②③B、①②④C、②③④D、①③④4. 关于YUV表色系,以下说法不正确的是:〔 C 〕A、YUV表色系常用于多媒体技术中.B、YUV色系与RGB色系可以相互转换.关于YUV表色系,以下说法不正确的是:〔 C 〕A、YUV表色系常用于多媒体技术中.B、YUV色系与RGB色系可以相互转换.C、YUV 色系不包含亮度信号.D、YUV 表色系包含一个亮度信号和两个色差信号.C、YUV 色系不包含亮度信号.D、YUV 表色系包含一个亮度信号和两个色差信号.5. CMYK表色系的三基色包含:〔 D 〕①青色②黑色③黄色④品红色A、①②③B、①②④C、②③④D、①③④6. 下面哪个彩色空间最接近人视觉系统的特点〔 D 〕A 、RGB空间B、CMY空间C、CIE XYZ空间D、HSI空间7. 以下选项中,属于表色系的是:〔 A 〕A 、CIE XYZ B、 FFT C、 DCT D、 Sobel8. 关于CMYK表色系,以下说法正确的是〔A 〕A、 CMYK表色系是减色系统.B、 CMYK表色系的三基色中包含黑色.C、 CMYK表色系的三基色中包含红色.D、 CMYK表色系的三基色中包含绿色.9. 关于HSI表色系,以下说法不正确的是〔 B 〕A、HSI表色系的三属性中包含色调.B、HSI表色系的三属性中包含色度.C、HSI表色系的三属性中包含饱和度.D、HSI表色系的三属性中包含亮度.10. 关于RGB色系下的彩色图像,下列说法正确的是:〔A 〕A、彩色图像的红色分量、绿色分量、蓝色分量都是灰度图像.B、该彩色图像的红色分量是彩色图像.C、若某个像素点的值是〔0,255,0〕,则表示该颜色中只含红色.D、若某个像素点的值是〔255,255,255〕,则表示该颜色为黑色.三.判断题1. 在RGB空间中,若某个像素点的值是〔0,0,0〕,则表示该颜色为白色.〔 F 〕2. 在RGB空间中,若某个像素点的值是〔0,0,255〕,则表示该颜色为蓝色.〔 T 〕3. RGB表色系具有亮度信息与色度信息相分离的特点.〔 F 〕4. YCbCr表色系具有亮度信息与色度信息相分离的特点.〔 T 〕5. 白平衡方法比最大颜色值平衡方法更适合于处理两种情况:一是图像中白色的点不存在,二是白色的点只占画面总像素的很少比例.〔F 〕四.简答题1. 为什么YUV表色系适用于彩色电视的颜色表示?2. 简述白平衡方法的主要原理.3. 为什么使用白平衡方法可以达到彩色平衡的目的?4. YUV表色系的优点是什么?5. 使用白平衡方法进行彩色平衡的主要思想是什么?解答:1. YUV表色系适用于彩色电视的颜色表示主要原因有以下3点:〔1〕YUV表色系具有亮度与色度相分离的特点,黑白电视接收彩色电视节目信号时,只需要将Y、U、V三路信号中的Y信号介入电视机信号即可;〔2〕YUV表色系具有亮度与色度相分离的特点,彩色电视机接收黑白电视节目信号时,只要将U、V两路信号置为0即可.〔3〕YUV表色系与RGB表色系的转换运算比较简单,便于实时进行色系之间的转换.2. 白平衡方法的主要原理是:如果原始场景中的某些像素点应该是白色的〔R=G=B=255〕,但是由于所获取的图像中的相应像素点存在色偏,这些点的R,G,B三个分量的值不再保持相同,通过调整这三个颜色分量的值,使之达到平衡,由此获得对整幅图像的彩色平衡影射关系,通过该映射关系对整幅图像进行处理,由此达到彩色平衡的目的.4. YUV表色系的有点体现在以下2个方面:〔1〕亮度信号与色度信号相互独立,由Y信号构成的灰度图像与用U、V信号构成的两外两幅单色图是相互独立的.可以对这些单色图单独进行编码.〔2〕YUV表色系与RGB表色系的转换运算比较简单,便于实时进行色系之间的转换.第十章图像变换一.填空题1. 所谓的图像变换,是指将图像信号从_空域__变换到另外的域上进行分析的手段.2. 图像变换包括了图像的频域变换、图像的时频域变换以与其他正交变换等,其中__ 傅里叶变换属于频域变换.3. 图像变换包括了图像的频域变换、图像的时频域变换以与其他正交变换等,其中__小波变换属于时频域变换.4. 数字图像处理包含很多方面的研究内容.其中,图像变换是指通过一种数学映射的手段,将空域的图像信息转换到如频域、时频域等空间上进行分析的数学手段.5. 将一个函数通过正交分解映射到正交函数空间的数学变换称为_正交变换_____二.选择题1. 下图1是一幅标准测试图像Lena图,对图像进行处理后,形成的结果图像如图2所示.这是如何处理得到的?〔 B 〕A、傅里叶变换B、小波变换C、离散余弦变换D、沃尔什变换2. 下图1是一幅标准测试图像Lena图,对图像进行处理后,形成的结果图像如图2所示.这是如何处理得到的?〔 D 〕A、图像锐化B、图像去噪C、图像对比度增强D、亮度减弱3. 下图1是一幅标准测试图像Lena图,对图像进行处理后,形成的结果图像如图2所示.是如何处理得到的?〔 B 〕A、图像锐化B、图像去噪C、图像亮度减弱D、图像对比度增强4. 下图1是一幅标准测试图像Lena图,对图像进行处理后,形成的结果图像如图2所示.这是如何处理得到的?〔 B 〕A、图像亮度减弱B、边缘检测C、图像对比度减弱D、图像对比度增强5. 下图1是一幅标准测试图像Lena图,对图像进行处理后,形成的结果图像如图2所示.这是如何处理得到的?〔 A 〕A、图像锐化B、边缘检测C、图像亮度减弱D、图像对比度减弱三.判断题1. 傅里叶变换可以用在图像的卷积运算中,主要原因是:空域上的卷积对应其在频域上的点乘.〔 T 〕2. 傅里叶变换可以用在图像压缩中.〔 T 〕3. 一幅图像进行一次小波变换后,概貌信息大都集中在高频图像子块中.〔 F 〕4. 一幅图像经过1次小波变换后,可以得到4个子块图像.〔 T 〕5. 一幅图像进行一次小波变换后,细节信息大都集中在高频图像子块中.〔T 〕6. 离散余弦变换是图像处理中常用的正交变换.〔 T 〕7. 傅里叶变换的所写是FTT.〔 F 〕8. 一幅图像经过2次小波变换后,可以得到8个子块图像.〔 F 〕9. 一幅图像进行一次小波变换后,概貌信息大都集中在低频图像子块中.〔 T 〕10. 一幅图像进行一次小波变换后,细节信息大都集中在低频图像子块中.〔F 〕四.简答题1. 请简述快速傅里叶变换的原理.2. 简述至少2种傅里叶变换在图像处理中的应用.3. 傅里叶变换在图像处理中有着广泛的应用,请简述其在图像的高通滤波中的应用原理.4. 傅里叶变换在图像处理中有着广泛的应用,请简述其在图像的低通滤波中的应用原理.5. 小波变换在图像处理中有着广泛的应用,请简述其在图像的压缩中的应用原理.解答:1. 傅里叶变换是复杂的连加运算,计算时间代价很大.快速傅里叶变换的核心思想是,将原函数分解成一个奇数项和一个偶数项加权和,然后对所分解的奇数项和偶数项再分别分解成其中的奇数项和偶数项的加权和.这样,通过不断重复两项的加权和来完成原有傅里叶变换的复杂运算,达到较少计算时间代价的目的.3. 图像经过傅里叶变换后,景物的概貌部分集中在低频区段,景物的细节部分集中在高频区段,可以通过图像的高通滤波将图像中景物的细节提取出来.具体做法是,将傅里叶变换得到频谱图的低频部分强制为0,而将高频部分的信息保持不变,就相当于使用一个只保持高频部分信息不变,而低频信息被完全抑制的高通滤波器作用在原始图像上.将经过这样处理后的频谱进行傅里叶逆变换,就可以得到图像的细节部分.4. 图像经过傅里叶变换后,景物的概貌部分集中在低频区段,景物的细节部分集中在高频区段,可以通过图像的高通滤波将图像中景物的概貌提取出来.具体做法是,将傅里叶变换得到频谱图的高频部分强制为0,而将低频部分的信息保持不变,就相当于使用一个只保持低频部分信息不变,而高频信息被完全抑制的低通滤波器作用在原始图像上.将经过这样处理后的频谱进行傅里叶逆变换,就可以得到图像的概貌部分.5. 一幅图像经过一次小波变换之后,概貌信息大多集中在低频部分,而其余部分只有微弱的细节信息.为此,如果只保留占总数据量1/4的低频部分,对其余三个部分的系数不存储或传输,在解压时,这三个子块的系数以0来代替,则就可以省略图像部分细节信息,而画面的效果跟原始图像差别不是很大.这样,就可以得到图像压缩的目的.第十一章图像压缩编码一.填空题1. 图像编码是通过改变图像的描述方式,将数据中的冗余去除,由此达到压缩数据量的目的.2. 按照压缩后的数据是否能够完全重构来分,图像的压缩算法分成无损压缩算法和有损压缩算法两种.其中行程编码属于_无损压缩算法.4. 按照压缩后的数据是否能够完全重构来分,图像的压缩算法分成无损压缩算法和有损压缩算法两种.其中霍夫曼编码属于无损压缩算法.5. 按照压缩后的数据是否能够完全重构来分,图像的压缩算法分成无损压缩算法和有损压缩算法两种.其中DCT变换编码属于有损压缩算法.6. 每种不同的压缩编码方法都有其不同的特点.将若干种编码方法结合在一起,由此来达到更高的压缩率,这种编码方式称为_混合压缩编码.7. 像素冗余是由像素之间的内在相关性所导致的冗余.8. 我们将由像素之间的内在相关性所导致的冗余称为像素冗余.9. 所谓的数据冗余,就是如果在减少一定数据量时,不会引起产生歧义的数据丢失,也就是说描述信息的数据量中存在多余的部分.〔填"会〞或者"不会〞〕10. 行程编码也称为游程编码,是一种无失真的压缩编码方法.〔填"失真〞或"无失真〞〕二.选择题1. 以下属于无损压缩编码的是:〔 A 〕①一维行程编码②二维行程编码③霍夫曼编码④DCT 变换编码A、①②B、①④C、②④D、③④2. 如果一个图像的灰度级编码使用了多于实际需要的编码符号,就称图像中包含了:〔A〕A、编码冗余B、像素间冗余C、心理视觉冗余D、计算冗余3. 以下属于无损压缩编码的是:〔B〕①一维行程编码②二维行程编码③LZW编码④DCT 变换编码A、①④B、①③C、②④D、③④4. 以下属于有损压缩编码的是:〔D〕A、行程编码B、 LZW编码C、霍夫曼编码D、 DCT 变换编码5. 以下属于无损压缩编码的是:〔C〕① LZW编码②二维行程编码③霍夫曼编码④DCT 变换编码A、①④B、②④C、②③D、③④6. 下列哪一个压缩标准用于压缩静止图像.〔A 〕A、JPEGB、MPEGC、H.261D、以上均不能7. 一个参数为2分钟、25帧/秒、640*480分辨率、24位真彩色数字视频的不压缩的数据量约为〔D 〕.A、2764.8MBB、21093.75MBC、351.56MBD、2636.72MB8. 下列哪一项不是图形图像文件的扩展名.〔 C 〕A、wmfB、bmpC、mp3D、gif9. 不通过计算,判断下表中的符号进行霍夫曼编码后对应哪个符号的码字最长?〔 A 〕A、a1B、a2C、a3D、a410. 以下编码方式中,属于变换压缩编码的是:〔 A 〕①小波变换编码②算术编码③LZW编码④DCT 变换编码A、①④B、①③C、②④D、③④四.简答题1. 什么是图像的无损压缩?给出2种无损压缩算法.2. 对于扫描结果:aaaabbbccdeeeeefffffff,若对其进行霍夫曼编码之后的结果是:f=01e=11 a=10 b=001 c=0001 d=0000.若使用行程编码和霍夫曼编码的混合编码,压缩率是否能够比单纯使用霍夫曼编码有所提高?3. DCT变换编码的主要思想是什么?4. 简述DCT变换编码的主要过程.5. 什么是一维行程编码?简述其与二维行程编码的主要区别.6. 什么是二维行程编码?简述其与一维行程编码的主要区别.7. 简述一维行程编码和二维行程编码的异同.8. 压缩编码算法很多,为什么还要采用混合压缩编码?请举例说明.9. 举例说明什么是混合压缩编码.10. 对于扫描结果:aaaabbbccdeeeeefffffff,若对其进行霍夫曼编码之后的结果是:f=01e=11 a=10 b=001 c=0001 d=0000.若使用行程编码和霍夫曼编码的混合编码,压缩率是否能够比单纯使用行程编码有所提高?解答:1.图像的无损压缩是指压缩后的数据进行重构〔或称为还原,或称为解压缩〕,重构后的信息与原来的信息完全相同的压缩编码方式.无损压缩用于要求重构的信息与原始信息完全一致的场合.常用的无损压缩算法包含行程编码、霍夫曼编码等.2.原始扫描结果所占空间为:22*8=176<bits>单纯霍夫曼编码的结果是:,共占53<bits>.压缩比为:176:53.Hufman与行程编码混合:,共占3+2+3+3+3+4+3+4+3+2+3+2=35 <bits>,压缩比为176:35. 即压缩比有所提高.3. DCT变换编码的思想是利用离散余弦变换对数据信息强度的集中特性,可以将数据中视觉上容易察觉的部分与不容易察觉的部分进行分离,由此可以达到进行有损压缩的目的.4. 第一步,将图像分成8*8的子块;第二步,对每个子块进行DCT变换;第三步,将变换后的系数矩阵进行量化,量化后,得到的矩阵左上角数值较大,右下部分为0;第四步,对量化后的矩阵进行Z形扫描,以使得矩阵中为0的元素尽可能多的连在一起;第五步,对Z扫描结果进行行程编码;第六步,进行熵编码.5. 一维行程编码是里利用一行上像素的相关性,逐行对图像进行扫描,然后对扫描的结果进行编码.一维行程编码只考虑了消除行内像素之间的相关性,没有考虑到某种方向之间的相关性;而二维行程编码是按照一定的扫描路线进行扫描,既可以消除行内像素之间水平方。
*国家自然科学基金资助项目(No.40971217)收稿日期:2011-10-13;修回日期:2012-07-13作者简介曹建农,男,1963年生,博士后,教授,主要研究方向为遥感、图像分析、地理信息系统.E-mail :caojiannong@126.com.图像分割的熵方法综述*曹建农(长安大学地球科学与资源学院西安710054)摘要对图像分割的熵方法进行较全面地分析和综述,其中包括一维最大熵、最小交叉熵、最大交叉熵图像分割方法等.对Shannon 熵、Tsallis 熵及Renyi 熵之间的关系等进行分析与评述.对二维(高维)熵及空间熵等进行分析与评述.最后指出一维熵与其它理论的有机结合、高维熵模型的计算效率等未来研究方向.关键词图像分割,交叉熵,二维(高维)熵,空间熵,玻耳兹曼熵中图法分类号P 237Review on Image Segmentation Based on EntropyCAO Jian-Nong(School of Earth Science and Resourses ,Chang 'an University ,Xi 'an 710054)ABSTRACTThe image segmentation based on entropy is analyzed and reviewed including one-dimensional maximum entropy ,minimum cross entropy ,maximum cross entropy and so on.The relations of Shannon entropy ,Tsallis entropy and Renyi entropy are analyzed and commented ,and the performance of two dimensional (high dimension )entropy and spatial entropy is also appraised.In conclusion ,it points out the future research direction ,such as the computational efficiency of the high-dimensional entropy model and one-dimensional entropy and other theories integrated.Key WordsImage Segmentation ,Cross Entropy ,Two Dimensional (High Dimentional )Entropy ,Spatial Entropy ,Boltzmann Entropy1引言许多应用中,图像分割是最困难且最具挑战的问题之一.自从20世纪80年代开始,利用熵的概念选择图像分割阈值一直受到研究者的关注.文献[1]首先提出最大后验熵上界法,文献[2]提出一维最大熵阈值法,文献[3]提出二维熵阈值法.在最大熵阈值法中,熵采用香农(Shannon )熵的定义形式[1-10].香农熵满足可加性(Additivity )或者说广延性(Ex-tension ),这一特性忽略了子系统之间的相互作用.Tsallis 熵[11]和Renyi 熵[12]具有非可加性(Non-addi-tivity )或者说非广延性(Non-extension ),它考虑两个子系统之间的相互作用.文献[13]提出最小交叉熵,并不断完善[14],随后产生最大交叉熵算法[15]以及极大交叉熵算第25卷第6期模式识别与人工智能Vol.25No.62012年12月PR &AI Dec 2012法[16],它们具有较好的有效性、合理性和鲁棒性,受到广泛关注[17].文献[18]提出基于高斯分布的最小交叉熵迭代方法.文献[19]提出基于伽马(Gamma)分布的最小交叉熵阈值优化搜索方法.文献[20]提出基于伽马分布的最小交叉熵迭代算法.文献[21]将交叉熵应用于马尔可夫随机场(MRF)能量函数的构造.文献[22]提出基于MRF的空间熵概念.文献[23]用玻耳兹曼熵直接表达灰度变化.基于熵方法的图像分割经历三十多年的研究发展,存在一些值得综合讨论的问题,因此有必要进行梳理与评价,以利于继续深入研究.2图像分割的熵方法文献[24]将图像分割方法分为6类:1)基于直方图形状;2)基于聚类;3)基于熵;4)基于对象属性;5)空间分析:包括高维概率分布和像素共生关系;6)局部方法:调整像素与图像局部特征关系阈值选择,并认为,基于熵的方法是最好的分割方法之一[24].文献[25]将熵方法分为7类:局部熵(Local Entropy,LE);全局熵(Global Entropy,GE);联合熵(Joint Entropy,JE);局部相对熵(Relative Local Entropy,LRE);全局相对熵(Relative Global Entropy,GRE);联合相对熵(Relative Joint Entropy,JRE);最大熵(Maximum Entropy,ME)[1]等.相对熵又称互熵或交叉熵等,本文统一称为交叉熵(Cross Entropy,CE).综合上述观点,本文将熵在图像分割中的应用分为5类:1)基于直方图形状的熵方法;2)基于熵测度的聚类方法;3)基于对象属性熵方法;4)基于熵的空间分析方法:包括高维概率分布的高维熵和基于共生关系的联合熵;5)局部熵方法:调整像素与图像局部熵特征关系的阈值选择.因为聚类和对象属性熵方法中的熵测度可以是任何一种熵形式,所以本文进一步概括为3种基本熵方法:基于全局信息的一维熵方法;基于局部信息的二维(高维)熵方法;交叉熵方法.2.1熵方法概念香农[26-27]定义一个n状态系统的熵:H=-∑ni=1piln(pi),(1)其中,pi是第i个事件发生的概率,并且相关事件的概率满足∑n i=1pi=1,0≤pi≤1.(2)认为获得一个事件的信息增益(Gain in Information)恰好与事件发生的概率相关,所以香农用ΔI=ln(1p i)=-ln(p i),(3)作为信息增益的测度,显然,上式表达的信息增益的数学期望就是H=E(ΔI)=-∑ni=1piln(pi).(4)考虑到,概率为“0”时,式(3)和式(4)均无定义;无知性测度(Measure of Ignorance)或信息增益在统计学上更宜于表示成(1-pi)的形式,文献[28]提出将信息增益表达成ΔI(p i)=e(1-p i),则上式表达的信息增益的数学期望就是指数熵[28]:H=E(ΔI)=∑ni=1pie(1-p i).(5)图1给出状态系统中香农熵和指数熵与事件概率的函数关系,可见香农熵与指数熵在信息增益或无知性测度上是一致的,式(4)和(5)在实践中是等价的,但是后者在概率闭区间中连续.图12个状态系统的概率与标准化熵分布Fig.1Distribution of probability vs.normalized entropy fortwo state systems从式(4)和(5)以及图1,可得熵与概率关系的以下特性:1)具有极高可能性或极低可能性的事件,信息增益的期望必置于两个有限极限值附近;2)当系统中所有事件的概率均等时,熵最大,数学关系如下:H(p1,p2,…,pn)≤H(1n,1n,…,1n);(6)3)当事件发生的概率为0.5时,该事件的熵最大,即对此事件的无知性测度、不确定性最大,或者说,对此事件的信息增益最大,可获得的信息量最大;4)当概率大于或小于0.5时,熵呈下降趋势,即9596期曹建农:图像分割的熵方法综述对此事件的无知性测度、不确定性在减小,或者说,对此事件的信息增益在减小,可获得的信息量在减小.文献[29]对图像分割给出较严密的定义,即将图像细分为其组成区域或对象.图像分割的实质就是寻找直接或间接实现像素对均质区域归属的某种最优化机制.利用熵进行图像分割,就是选择恰当的多个(一个或以上)灰度阈值,将图像的灰度分为多个(二个或以上)集合,这多个集合所对应的所有像素的概率和,分别构成多个事件,这多个事件的信息增益的数学期望就是熵,如式(4)或式(5).显然,此时图像的熵是灰度阈值的函数,通过迭代优化控制,当熵取得最大值时,根据式(6),图像灰度的多个集合的概率最接近,其信息增益最小,或者说信息量变化最小,获得最优化分割.熵的特性是其优化评价的能力,因此,图像分割的熵方法本质,是借助熵对事物信息量的数理异同性测度能力,构造不同的熵函数以帮助确定最优度量或最优控制实现图像分割.2.2熵模型原理2.2.1一维(全局)熵模型基于直方图形状的熵方法可归为一维熵方法,是一种高效经典的熵方法.1)一维熵的两元统计法.根据式(4)或式(5)中的一维(直方图)概率p i 直接构造熵函数,就是一维熵,因为它只依据图像全局直方图信息,又称全局熵(Global Entropy ).假设F =[f (x ,y )]M ˑN 是一幅尺寸为M ˑN 的图像,其中f (x ,y )是空间位置(x ,y )处的灰度值,f (x ,y )∈G L ={0,1,…,L -1}灰度集合.设第i 个灰度级的频数为N i ,则∑L -1i =0N i =MN ,文献[1]、[2]和[30]都将图像F 的灰度直方图看作L 个符号的一次输出,这L 个符号独立对应于图像F 的L 个灰度级.根据式(1),文献[1]定义的图像熵:H =-∑L -1i =0p i ln (p i ),p i =N iN.(7)设t 为分割阈值,P t =∑ti =0p i表示直方图灰度取值在[0,t ]区间内的所有像素的概率和,则图像的后验熵:H'L (t )=-P t ln (P t )-(1-P t )ln (1-P t ).(8)文献[1]用上式的最大化上界为准则选择阈值.由上式可知,图像中的目标与背景被看作两元事件,所以,称其为一维熵的两元统计法.2)一维熵的多元统计法.与文献[1]不同,文献[2]则考虑两个概率分布,一个对应目标,一个对应背景,将目标与背景的熵分别加和,并以其最大值为准则选择阈值,图像的一维后验熵:HᵡL (t )=-∑ti =0p i P t ln (p iP t)-∑L -1j =t +1(p j 1-P t )ln (p j1-P t),(9)由上式可知,图像中的目标与背景被看作两个系列多元事件,所以,称其为一维熵的多元统计法.3)一维熵的泊松分布假设法.除了式(8)和式(9)的算法之外,文献[28]根据文献[31]等的研究,认为如果感光一致,则图像灰度值服从泊松分布.因此,数字图像的灰度直方图将由两个泊松分布混合构成,两个泊松分布的参数λO 和λB 分别对应目标和背景,如图2(b )中的虚线所示.因此,目标与背景的分割问题就是寻找灰度阈值t ,使其满足λB>t >λO ,并通过两个泊松分布的熵之和最大化选择阈值t.两个泊松分布的概率p O i 和p B i 分别由参数λO 和λB 决定,λO 和λB 则由最大似然方法或其它方法预估得到.因此,图像熵H (t )=∑ti =0p O ie 1-p O i+∑L -1j =t +1p B i e 1-p B i.(10)这里选择式(5)计算熵,可避免概率为零时,香农熵无定义,下文类似问题不再说明.根据式(8)对Lena 图像(如图2(a ))进行分割的结果(如图2(b )),阈值为0.25,此时背景与目标像素的概率和分别为0.4992和0.5008,其处于等概率位置.实验表明,式(8)的算法认为,目标与背景像素是同一概率事件的两个状态,当目标与背景像素的概率基本均等,熵取得最大值时,为阈值选取准则,虽然符合熵的第二特性,但不够恰当.其不合理性在于,直方图的灰度等概率分割点,不一定对应图像目标与背景的分割点.与式(8)的观点相反,根据式(11)对Lena 图像进行分割的结果(如图2(c )),阈值为0.46,它认为目标与背景像素是两个相关独立事件,属于目标或背景的像素概率,各自的总熵之和取得最大值时,为阈值选取准则.其合理性在于,独立计算目标或背景的像素概率及其熵,可更客观地测度目标与背景的内部一致性以及外部差异性,符合图像分割的本质特性.根据式(10)采用泊松分布对Lena 图像进行分割,结果如图2(d ),分割阈值为0.32,其阈值介于图2(b )和(c )之间,理论较完善.但是,泊松分布的参069模式识别与人工智能25卷数需要预先估计,需要先验知识为条件,而且泊松分布假设不适合许多实际图像,因此,具有局限性.(a )Lena 原始图像(b )式(8)分割结果(a )Original image Lena(b )Segmentation result of equation (8)(c )式(9)分割结果(d )式(10)分割结果(c )Segmentation result of equation (9)(d )Segmentation result of equation (10)图23种方法分割结果对比Fig.2Segmentation result comparison of 3methods2.2.2二维(局部)熵模型从一维熵原理可知,灰度的概率统计方法是使用熵原理选取阈值的关键,因此,可用高维统计量或条件统计量,计算图像近邻灰度的高维概率或条件概率,获得图像的局部统计特征信息,实现高维熵或条件熵的图像分割[28].1)高维熵(Higher-Order Entropy ).式(6)是一维统计概率p i 的熵,据此可推广,高维统计概率p (L q i )的熵:H (q )=1q ∑ip (L q i )exp (1-p (L qi )),(11)其中,p (L q i )表示与灰度L 有关的q 维统计概率,i 为灰度序号.当q =1时,是一维(全局)熵的表达式,例如式(10)或式(8)和式(9)的指数熵表达式.当q =2时,可得二维(局部)熵的表达式:H (2)=12∑ip (L 2i )exp (1-p (L 2i )).(12)当q >2时,高维统计概率为p (L q i ),可依上式类似方法,构造高维局部熵测度H (q ),或称为q 维局部熵(Local Entropy of Order q ).2)条件熵(Conditional Entropy ).条件熵取决于条件概率的计算,设图像灰度L O k 和L Bk 分别属于目标O 和背景B ,其中k 表示图像空间中任意位置的灰度,基于某种准则的条件概率分别为p (L O k /L B k )和p (L B k /L O k ),则相应的条件熵:H (O /B )=∑L O k∈O ∑L B k∈Bp (L O k /L Bk )exp (1-p (L O k /L Bk )),(13)H (B /O )=∑L B k∈B ∑L O k∈Op (L B k /L Ok )exp (1-p (L B k /L Ok )).(14)图像的条件熵:H (C )=12(H (B /O )+H (O /B )).(15)3)联合熵(Joint Entropy ).文献[28]提出条件熵,文献[25]将条件熵归入联合熵.本文认为从概率的计算过程看,式(16)和式(17)表达目标或背景灰度联合出现的概率,因此,式(18)到式(20)是联合熵表达.文献[25]将式(18)到式(20)归类为局部熵,文献[28]则将条件熵和联合熵都称作局部熵,可见,联合熵与条件熵具有内在联系.局部熵实验,采用图像灰度共生概率(Probability of Co-occurrence of Gray Levels ,PCGL )矩阵,表达二阶统计概率,其它高维统计问题,可依此类推.根据不同空间关系或不同近邻阶数,式(12)中的p (L 2i )可有多种定义方法,本文采用3ˑ3近邻无结构方向区分方法计算PCGL ,则PCGL 矩阵如图3(a )(原始图像为图2(a )).PCGL 矩阵的行、列分别表示灰度从上到下、从左到右逐渐增大.设图像被阈值t 分为两个的灰度区间L O i 和L B i ,其分别属于目标O 和背景B ,则阈值t 将PCGL 矩阵划分为四个区域,如图3(a )中A 、B 、C 、D 区域.基于二维(局部)熵的表达式(14)对图像进行分割,图3(a )中A 、C 区域分别是对应背景与目标的二维局部概率:p Ai ,j=p i ,jP A;0≤i ,j ≤t ;P A =∑t i =0∑tj =0p i ,j ,(16)pCi ,j=p i ,jP C ;t +1≤i ,j ≤L -1;P C =∑L -1i =t +1∑L -1j =t +1p i ,j .(17)则其熵分别为H 2A(t )=12∑ti =0∑tj =0p A i ,j exp (1-p Ai ,j ),(18)1696期曹建农:图像分割的熵方法综述H 2C(t )=12∑L -1i =t +1∑L -1j =t +1p C i ,j exp (1-p C i ,j ).(19)因此,图像分割的二维局部熵:H 2T (t )=H 2A (t )+H 2C (t ),(20)基于上式的二维局部熵分割结果如图3(b ),阈值为0.43.(a )原始图像PCGL 矩阵(a )Matrix PCGL of originalimage(b )式(20)分割结果(c )式(21)分割结果(b )Segmentation result of equation (20)(c )Segmentation result of equation (21)图3局部熵与条件熵分割结果对比Fig.3Segmentation result comparison between local entropy and conditional entropy利用PCGL 矩阵提供条件概率,如图3(a )的B 、D 区域中,阈值为t ko ,kb ,其中ko 和kb 分别表示PCGL 矩阵的行列号,当第kb 灰度属于目标O 时,第ko 灰度出现在背景B 的概率为p (L O k /L Bk ),同理当第ko 灰度属于目标O 时,第kb 灰度出现在背景B 的概率为p (L B k /L Ok ),条件概率分别为p (L O k /L B k )=p Bi ,j =p i ,j P B;0≤i ≤t ,and t +1≤j ≤L -1;P B =∑ti =0∑L -1j =t +1p i ,j ;p (L B k /L O k )=p D i ,j =p i ,jP D;t +1≤i ≤L -1,and 0≤j ≤t ;P D =∑L -1i =t +1∑tj =0p i ,j .则相应条件熵分别为H (O /B )=∑ti =0∑L -1j =t +1p B i ,j exp (1-p B i ,j ),H (B /O )=∑L -1i =t +1∑tj =0p D i ,j exp (1-p D i ,j ).因此,图像分割的条件熵H (C )T (t )=H (O /B )+H (B /O )2.(21)基于上式的条件熵分割结果如图3(c ),阈值为0.13.可见,统计矩阵PCGL 的不同区域,可看作对图像灰度的不同统计方法,A 、C 区域被看作背景与目标的后验联合概率分布,而B 、D 区域则被看作背景与目标的后验条件概率分布.这种垂直划分具有一定误差,因此,近年来产生一些斜分区域的研究(见第4节).2.2.3交叉熵模型原理假设存在两个分布P ={p 1,p 2,…,p N },Q ={q 1,q 2,…,q N },两个分布间信息论意义的距离是D (Q ,P )(以下简称距离),交叉熵可度量两个分布之间的距离,数学关系[32]D (Q ,P )=∑Nk =1q k log 2q kp k.(22)Renyi 特别强调式(22)的信息论意义[33],即当一个分布(Q )替代另一个分布(P )时,式(22)是信息变化量的期望值,使其成为优化计算的前沿热点[34].只要获得某两个分布,就可通过式(22)获得两个分布之间相互替代或逐渐相互替代过程中期望值变化的全部状态值,这些状态特征值就是优化的标志,如最大或最小值,极大或极小值等.当没有先验信息可获得时,通过对p k 设定相同初始估计值,则最小交叉熵方法可看作是最大熵方法的扩展[14],这一结论是极大交叉熵算法[16]的指导思想之一.1)最小交叉熵模型.文献[14]将图像分割过程描述为图像灰度分布的重构过程.设图像函数为f ʒN ˑN →G ,这里G ={1,2,…,L } N 灰度集,N 是自然整数集.图像分割过程就是构造一个函数g ʒN ˑN →S ,这里S ={μ1,μ2}∈R +ˑR +,R +是实正数集合.分割图像g (x ,y )重构如下:g (x ,y )=μ1,f (x ,y )<t μ2,f (x ,y )≥t {(23)分割图像g (x ,y ),通过3个未知参数t 、μ1和μ2的确定,由原始图像f (x ,y )唯一生成.因此,必须构造一个准则,等价确定一套优化参数集t 、μ1和μ2,269模式识别与人工智能25卷使f (x ,y )和g (x ,y )之间尽可能相似,即η(g )≡η(t ,μ1,μ2).这个准则函数,是某种变形测度,例如从原始图像f 到分割图像g 的均方差就是常用测度,最小误差算法[35-36]和Otsu 算法[37]都属于这一类.文献[14]认为,对于正定加性分布(如图像分布),交叉熵测度比均方差测度更适合.此时,图像分割就被转化为使用约束的经典最大熵推理问题,设一个数值集合G ={g 1,g 2,…,g N },则数值集合G 只能由被观测图像F ={f 1,f 2,…,f N },连同所使用的适当约束条件推理得到,它们的分布,可用相同方法通过线性化二维分布得到.g i 和f i 来自图像空间中的相同位置,并且,G 包含的元素只有两个值μ1和μ2.为计算μ1和μ2,文献[14]提出灰度守恒约束准则,认为重构G 的灰度分布应该与F 的灰度密切相关,原始图像灰度F 给出μ1和μ2数值上的约束,则分割图像G 中的两类灰度强度的总和,等于原始图像F 的灰度强度总和.文献[15]和[38]对灰度守恒约束准则提出不同意见,但是,文献[39]在理论上证明这一准则的正确性.据此,这些约束可被概括为g i ∈{μ1,μ2},∑f i <tf i =∑f i<t μ1,∑f i≥t f i =∑f i≥tμ2,(24)其中,μ1和μ2可确定如下:μ1(t )=∑f i<tf i N 1,μ2(t )=∑f i≥tf i N 2,N 1和N 2分别是两个区域(目标和背景)内的像素数.结合式(22)、式(23)和上式,可得η(t )=∑f i <t f i lnf iμ1(t )()+∑f i ≥t f i lnf iμ2(t )(),(25)则阈值t 0=min t(η(t )),其中t 0就是所求阈值.由于式(25)的加和操作,需要在整个图像上进行的,存在重复聚集计算问题,因此对式(25)进行改造,得μ1(t )=∑j =t -1j =1jh j∑j =t -1j =1h j =1P 1∑j =t -1j =1jh j ,μ2(t )=∑j =Lj =t jh j∑j =Lj =th j =1P 2∑j =Lj =tjh j ,η(t )=∑j =t -1j =1jh j lnjμ1(t )()+∑j =Lj =tjh j lnjμ2(t )(),(26)其中h j 是离散图像的直方图函数,对上式η(t )最小化,就可得阈值t 0.2)最小后验交叉熵改进模型.文献[15]提出的最大后验交叉熵方法与文献[14]本质一样.如果用标准交叉熵式(27)取得最小值,则可得最小后验交叉熵分割结果,即文献[14]、[15]的改进方法[39].3)最大交叉熵模型基于最小交叉熵准则的算法,是考虑目标或背景的类内特性.如果考虑目标和背景的类间差异性,则构造的交叉熵函数必然是上凸函数,其最大值可作为分割阈值.据此,文献[15]定义类间差异为图像中所有像素点分别判决到目标和背景的后验概率之间的平均差异.该算法假设目标和背景像素的条件分布服从正态分布,利用贝叶斯公式估计像素属于目标或背景两类区域的后验概率,再搜索这两类区域后验概率之间的最大交叉熵.设用图像灰度值j 表示图像F 在j =f (x ,y )处的像素点,j ∈F ={f (x ,y )ʒ(1,2,…,L )∈M ˑN },其中M ,N 是图像行列号,表示图像灰度集.定义像素点j (j ∈G )基于后验概率p (1/j )、p (2/j )的对称交叉熵:D (1ʒ2;j )=p (1/j )log 2p (1/j )p (2/j )+p (2/j )log 2p (2/j )p (1/j ).(27)考虑到后验概率可能趋于0,会使上式中的对数项奇异化,在保证非负性的前提下将式(27)做如下修正(文献[15]没有给出说明是一个缺陷):D (1ʒ2;j )=13[1+p (1/j )]log 21+p (1/j )1+p (2/j )+13[1+p (2/j )]log 21+p (2/j )1+p (1/j ).(28)然后分别对目标和背景内的像素的交叉熵求取平均值,将两者之和作为总的类间差异,得D (1ʒ2)=∑j ∈1p (j )P 1D (1ʒ2;j )+∑j ∈2p (j )P 2D (1ʒ2;j ).(29)同时假设目标和背景灰度的条件分布服从正态分布:p (j /i )=12槡πσi (t )exp (-(j -μi (t ))22σ2i (t )),其参数由直方图估计,其中类内均值估计同式(26)的μ1(t ),类内方差估计分别为σ21(t )=1P 1∑j =t -1j =1h (j )(j -μ1(t ))2,σ22(t )=1P 2∑j =Lj =th (j )(j -μ2(t ))2.用贝叶斯公式求取后验概率如下:3696期曹建农:图像分割的熵方法综述p (i /j )=P i ·p (j /i )∑2i =1(P i ·p (j /i )),结合灰度直方图重写式(38),得D (1ʒ2;t )=∑tj =1h (j )P 1D (1ʒ2;j )+∑Lj =t +1h (j )P 2D (1ʒ2;j ).(30)搜索使上式最大的值t 就是最优分割阈值.根据式(26)对Lena 图像(如图2(a ))进行分割实验,结果如图4(a ),分割阈值为0.208.根据式(27)对Lena 图像进行分割实验,结果如图4(b ),分割阈值为0.200.根据式(28)对Lena 图像进行分割实验,结果如图4(c ),分割阈值为0.196.可看出,3种方法,虽然对交叉熵的理解角度不同,但是其核心原理具有一致性,所以它们的分割结果非常接近.(a )式(26)分割结果(b )式(27)分割(c )式(28)分割结果结果[15](a )Segmentation result of equation (26)(b )Segmentation result of equation (27)(c )Segmentation result of equation (28)图43种方法分割结果对比Fig.4Segmentation result comparison of 3methods3熵模型评述3.1香农熵模型文献[40]提出最大熵原理,在约束条件下推理未知概率分布,其解存在于给出最大熵的位置(或时间),最初的概念是可以给出最大无偏估计,同时允许约束条件具有最大自由度.随着中心理论的应用与重数(Multiplicity )的研究,已经表明,较高的熵分布具有较高的重数特性,因而也更容易观察[41].对归纳推理来说,当新的信息以期望值形式给出时,最大熵方法是唯一正确的方法[42],给出比传统方法(例如最大似然法)更好的解决方案[43].文献[28]认为式(8)和式(9)假设图像信息完全被直方图所表达,因此,即使不同图像的灰度空间分布不同,但当其具有完全一样的直方图时,将会产生相同分割结果,显然不正确,式(8) 式(10)一维全局熵的共同缺陷主要在于此,它们忽略图像灰度邻域的空间信息,对图像分割的灵活性和准确性都不够,另外,对式(9)的多阈值区间统计将导致计算量按(L -2)!(L -2-k )!k !增加(L 是灰度级,k 是阈值数).文献[25]基于均质(Uniformity )和形状(Shape )性能的算法测试表明,最大熵[2]与局部熵性能相同并且最优,这一结论与本文第2节的实验结果一致,如图2(c )和图3(b ).虽然式(9),被认为优于其它熵阈值算法[43],但是依然不能被广泛接受,并且有时分割性能很差,多有研究者对其进行扩展、改造.文献[44]使用图像的近邻空间关系和联合熵,作为选择阈值的准则.虽然文献[43]在最大熵阈值方法中,保留直方图熵函数,但却引入一套额外启发式原理选择阈值.因此,只要将式(9)与其它处理策略相结合,就可产生许多更有效的算法(见第4节).3.2Tsallis 熵与香农熵模型熵是热力学中与不可逆过程顺序相关的一个基本概念[45-46],它可用来度量物理系统内在的无序性.Tsallis 熵也称为不可扩展熵,其概念首先出现在统计力学中,它的提出进一步促进香农熵在信息理论中的拓展.因为现实世界的信息内容具有重大争议,所以香农的信息论强调信息量的数学表达(不涉及信息的内容),其关键在于给出具有普遍意义的信息量的定义,如式(3).按照布里渊的思想[46],信息的不同的可能性(概率)可和状态数联系起来,从而获得信息与熵的关系.状态数是热力学熵的统计度量,概率则适用于一切具有统计特征的包含信息的事件.可见,信息熵不但来自于热力学熵,而且具有内在联系.Tsallis 熵是传统玻耳兹曼/吉布斯(Boltzmann /Gibbs )熵在具有不可扩展性物理系统中的推广[47].香农重新定义玻耳兹曼/吉布斯熵函数,用来考查系统内所包含信息的不确定性,并且定量地衡量各状态过程所产生信息量的大小,其定义如式(1) (4).但是,式(4)的应用,受限于玻耳兹曼-吉布斯-香农(BGS )的统计学有效范围内.通常将服从BGS 统计学的系统称为可扩展系统.假设一个物理系统,可分解为两个统计独立的子系统A 和B ,子系统事件必须等概率,则复合系统的概率为p A +B =p A p B ,可证明香农熵具有可扩展性(可加性),即满足S (A +B )=S (A )+S (B ),469模式识别与人工智能25卷即一个系统分成若干独立子系统,则整个系统的熵等于若干子系统的香农熵之和.然而,对于呈现远距离交互、长时间记忆以及具有不规则结构的物理系统来说,需要在BGS统计学的基础上进行适当的改进.因此,Tsallis重新定义一种熵,用来描述不可扩展系统的热统计特性[11]:S q =1-∑ni=1(pi)qq-1,(31)其中,n是系统可能的状态数目,实数q衡量系统不可扩展的程度.一个统计独立系统的Tsallis熵,即不可扩展熵:Sq(A+B)=S q (A)+Sq(B)+(1-q)Sq(A)Sq(B).(32)Renyi熵的定义及其不可扩展熵:S α=11-αln∑ni=1(pi)α,(33)S α(A+B)=Sα(A)+Sα(B),(34)其中,n是系统可能的状态数目,α>0.Renyi熵和Tsallis熵不但在形式上,而且在图像分割的阈值选取方法上,都具有特殊的等价关系[12].3.3交叉熵模型文献[14]的交叉熵形式与文献[48]的图像熵很相似,而图像熵推导援引4个公理才得s(f,m)=∫d x(f(x)-m(x))-f(x)ln(f(x)m(x)),(35)其中,f(x)是图像灰度强度分布,m(x)是(被处理)图像f(x)的模型.事实上,如果考虑灰度守恒约束,则式(26)的η(t)与式(35),正好大小相等符号相反,因为式(35)的前两项在对所有类进行积分后消掉.文献[14]的方法是在原始图像和分割图像之间求取最小交叉熵,获得优化结果,Otsu类间方差最大化算法则可从与式(24)相同的约束条件中,利用均方差距离作为两个图像之间的测度推导出来.在这种情况下,准则函数如下:θ(t)=∑f i<t (fi-μ1(t))2+∑f i≥t(fi-μ2(t))2.如果使用直方图进行聚集加和,则这个准则函数:θ(t)=∑f i<t hj(j-μ1(t))2+∑f i≥thj(j-μ2(t))2.上式就是文献[37]所定义的类内方差.上式定义函数的最小化,等价于Otsu算法的准则.文献[15]提出的基于最大类间后验交叉熵准则的二值化阈值分割算法,可根据式(26) 式(30)导出,并且与文献[14]给出的交叉熵形式及文献[48]导出的图像熵相似,实验结果如图4(b)、(c).同时,文献[39]从理论上证明文献[14]、[49]所提方法符合最小交叉熵概念,从而为最小交叉熵方法的广泛应用奠定坚实的理论基础.因为每幅图像都有自身的灰度(平衡)特征,文献[14]不对图像进行任何分布假设,提出图像的灰度守恒准则,更符合图像个性,所以更具一般性.相反,文献[15]的正态分布假设与文献[28]的泊松分布假设一样,都要求直方图具有双峰特征,就直接全图分割而言,对大多数图像不适合.最小交叉熵的灰度守恒条件[14],实质上,是产生相关性时间序列函数的条件.也就是说,图像的每个分割区域,例如目标或背景,都被各自的灰度均值来表示,且都是灰度阈值的函数,即时间序列函数.在图像分割过程中,每个具有特定灰度值的像素的概率测度,就是动态相关实验的结果,其实质是将相似像素归为等概率事件[50].所以灰度守恒条件在一定程度上确保像素近邻空间信息的相关性.3.4熵模型相互关系Tsallis熵引入参数q度量系统的不可扩展性,解决图像区域间相关性而产生的不独立部分的熵表示问题.文献[11]提出基于Tsallis熵的阈值分割方法.文献[51]将Tsallis熵推广到二维.文献[44]提出一种基于二维Tsallis熵的全局阈值方法,由于算法复杂性高且运算时间长,因此,利用粒子群优化算法来搜索全局分割阈值.文献[51]提出Tsallis交叉熵的概念,并研究它的基本性质.文献[52]将Tsallis熵的非广延性应用到最小交叉熵的阈值法中,提出最小Tsallis交叉熵阈值法,既考虑目标和背景之间的信息量差异,又考虑目标和背景之间的相互关系,克服传统最小交叉熵忽略目标和背景之间的相互关系所导致的阈值选择不恰当的缺陷.香农熵强调系统内部的均匀性,在分割算法中就是搜索使目标或背景内部的灰度分布尽可能均匀的最优阈值.交叉熵则是度量两个概率分布之间的信息量差异[32],最初称作有向散度(Directed Divergence),它所构造的熵函数可能是下凹或上凸函数.熵函数的凸性方向与对交叉熵的两个分布理解及定义有关,据此可分别构成最大或最小交叉熵寻优机制.文献[13]提出最小交叉熵图像分割方法,并在文献[14]中得到进一步阐述,其主要贡献在于将交叉熵对图像分割问题进行成功的数学建模.文献[49]利用对称性交叉熵改进文献[14]的方法.文献[38]把原始图像和分割图像的直方图分别作为两个概率分布,利用交叉熵选择阈值.针对文5696期曹建农:图像分割的熵方法综述。
数字图象处理课程设计题目:采用最大熵方法进行图像分割班级:电信121学号:3120412014姓名:吴向荣指导老师:王栋起止时间:2016.1.4~2016.1.8西安理工大学源代码:clear,clcimage=imread('C:\Users\Administrator\Desktop\图像课设\3.jpg');subplot(2,2,1);imshow(image);title('原始彩图')%% %灰度图imagegray=rgb2gray(image); %彩色图转换为灰度图subplot(2,2,2);imshow(imagegray);title('灰度图')%计算灰度直方图分布counts和x分别为返回直方图数据向量和相应的彩色向量count=imhist(imagegray);subplot(2,2,3);imhist(imagegray);title('灰度直方图')[m,n]=size(imagegray);imagegray=fun_maxgray(count,imagegray,m,n);subplot(2,2,4);imshow(imagegray);title('最大熵处理后的图')%% 彩色图% r=image(:,:,1);countr=imhist(r);r=fun_maxgray(countr,r,m,n);% subplot(2,2,1);imshow(r);% g=image(:,:,2);countg=imhist(g);g=fun_maxgray(countg,g,m,n); % subplot(2,2,2);imshow(g);% b=image(:,:,3);countb=imhist(b);b=fun_maxgray(countb,b,m,n); % subplot(2,2,3);imshow(b);b=0;for z=1:3figuretitleName = strcat('第',num2str(z),'通道灰度直方图');titleName1 = strcat('第',num2str(z),'通道最大熵处理后图');a=image(:,:,z);subplot(1,2,1);imhist(a);title(titleName)countr=imhist(a);a=fun_maxgray(countr,a,m,n);subplot(1,2,2);imshow(a);title(titleName1)b=b+a;endfigure,imshow(b);title('彩色各通道处理后叠加图')最大熵方法进行图像分割的子函数:function sample=fun_maxgray(count,sample,m,n) countp=count/(m*n); %每一个像素的分布概率E=[];E1=0;E2=0;L=256;for th=2:L-1 %循环阈值pth=sum(countp(1:th+1)); %计算对应阈值概率if countp(th)==0 %当阈值概率为0跳出当前循环continue;endfor i=1:thif countp(i)==0 %当前像素概率为0,跳出当前循环continue;endE1=E1-countp(i)/pth*log(countp(i)/pth);endfor i=th-1:Lif countp(i)==0continue;endE2=E2-countp(i)/(1-pth)*log(countp(i)/(1-pth)); ende=E1+E2;E=[E e];endth=find(E==(max(E))); %找数组中最大值的阈值%[ma,index]=max(E);for i=1:m %对图像二值化for j=1:nif sample(i,j)>thsample(i,j)=255;elsesample(i,j)=0; e运行结果:其他图片比较:THANKS !!!致力为企业和个人提供合同协议,策划案计划书,学习课件等等打造全网一站式需求欢迎您的下载,资料仅供参考。
毕业设计(论文)任务书第1页第2页第3页第4页基于信息熵最大的图像分割研究摘要图像分割是根据图像的某些特征或特征集合的相似性准则,对图像像素进行分组聚类,把图像平面划分为一系列“有意义"的区域,使其后的图像分析及识别等高级处理阶段所要处理的数据量大大减少,同时又保留有关图像结构特征的信息.在信息理论中,熵用于度量信息传输的有效性。
本论文主要讨论针对数字图像利用信息熵标准结合阈值迭代法进行图像分割,以提高图像分割的准确性。
设计信息熵算法并程序实现,仿真结果表明编写程序有效,分割效果明显。
关键词:阈值分割迭代法信息熵Maximum entropy-based image segmentation studyAbstractBased on the similarity criterion of the image’ some cha racteristics or characteristics set, image segmentation technique divides the image pixels into groups and partition the image into a series of "meaningful” regions. This technique will greatly reduce the amount of data in the following advanced processing to the image analysis and identification,as will as retain the information about image structure characteristics. In information theory, entropy is used to measure the effectiveness of information transmission。
摘要图象分割是数字图象处理与机器视觉的基本问题之一,是目标检测和识别过程中的重要步骤。
由于待分割图象的可变性比较大,且混有噪声,构成了图象分割所面临的主要困难。
到目前为止还不存在一种通用的、能使各种类型的图象达到最优分割质量的图象分割方法。
近年来一些学者将模糊理论和遗传算法引入到图象分割中,较传统方法取得了更好的分割效果。
本文在研究传统的模糊阈值分割的基础上,提出了一种基于改进的自适应遗传算法的图象分割方法,提高了图象的分割质量和分割效率。
本文具体研究工作如下:首先,针对标准遗传算法容易“早熟”的缺点,提出一种改进的自适应遗传算法。
该算法引进新的变量来衡量群体适应度的集中程度,从而对交叉概率和变异概率进行自适应调整,提高了算法的收敛率。
然后,将模糊理论和遗传算法结合起来应用于图象分割处理。
针对目标和背景两类图象分割,考虑二维灰度直方图,采用了一种更符合图象空间分布特点的隶属函数,建立了对应的二维图象模糊熵,分别采用标准遗传算法和改进的自适应遗传算法对二维图象模糊熵的各个参数进行优化,根据最大模糊熵准则,确定目标和背景的最佳分割阈值。
实验结果表明,基于改进的自适应遗传算法的二维最大模糊熵阈值分割法具有较好的分割性能和较快的分割速度,对噪声有一定的抑制能力。
另外,针对多目标的复杂图象分割问题,本文采用了一种三类阈值分割法,该方法将图象分为暗区、灰度区和亮区,通过建立相应的模糊隶属函数,对图象各个灰度级属于暗区、灰度区和亮区的模糊特性进行描述,并采用改进的自适应遗传算法对模糊熵参数进行优化,根据最大模糊熵准则,确定最佳的分割阈值;实验结果表明,基于改进的自适应遗传算法的三类阈值分割法能快速有效地分割复杂图象。
关键词:图象分割;模糊熵;遗传算法AbstractImage segmentation is one of basis problem of digital image processing and machine vision, and it is also an important step for detecting and identifying objects. The main difficulties lie in the great variability of images and the presence of noises.Recently, many researchers have introduced fuzzy set theory and genetic algorithm to image segmentation, which can get better results than traditional algorithms. An improved adaptive genetic algorithm in image segmentation is proposed to improve image division performance and division efficiency based on the study of fuzzy threshloding methods.Firstly, because the simple genetic algorithm is easily premature, an improved adaptive genetic algorithm is proposed. This method adopts a new variable to evaluate the concentration degree of population fitness. According to the concentration degree, the crossover probability and mutation probability is adaptively changed, which could improve the convergence of the genetic algorithm.Then, a thresholding method for image segmentation is presented, based on two-dimensional maximum fuzzy entropy and genetic algorithm. Utilizing two-dimensional histogram, the method defines a membership function that is fitter for image characteristics, and then gives the description of image’s fuzzy entropy. The procedure for finding the optimal combination of fuzzy parameters is implemented by simple genetic algorithm and improved adaptive genetic algorithm. Finally, the optimal threshold is determined by maximizing the fuzzy entropy. The experimental results indicated that the proposed method gave better performance and higher calculation speed, and the ability of resisting noise is improved. For multi-target image segmentation, a three-level thresholding method is presented. The method defines different membership functions for dark part, gray part and bright part of the image, and then gives the definition of fuzzy entropy. An improved adaptive genetic algorithm is proposed for the optimization of fuzzy parameters. Finally, the optimal thresholds can be determined by maximizing the fuzzy entropy. The experimental results demonstrated that the proposed method could segment the image effectively and fast.Keywords:image segmentation; fuzzy entropy; genetic algorithm目录第一章绪论 (1)1.1图象分割技术简介及其意义 (1)1.2遗传算法发展简介 (4)1.3模糊理论简介 (5)1.4本文的研究内容和拟解决的关键问题 (5)1.5本文的章节安排 (6)第二章图象分割原理和方法 (7)2.1图象分割的理论基础 (7)2.2图象分割的基本方法 (7)第三章遗传算法的基本理论 (11)3.1遗传算法的基本概念 (11)3.2标准遗传算法 (12)3.3遗传算法的基本定理 (15)3.4遗传算法的特点 (15)3.5遗传算法的理论及应用研究现状 (16)第四章模糊理论基础与应用 (18)4.1模糊理论的提出 (18)4.2模糊集基础 (18)4.3模糊理论在图象处理中的应用 (20)4.4图象分割中的模糊技术 (21)第五章基于最大模糊熵和遗传算法的图象阈值分割 (23)5.1引言 (23)5.2阈值分割原理 (23)5.3基于一维最大模糊熵的图象分割算法 (23)5.4基于二维最大模糊熵的图象分割算法 (25)5.5遗传算法的改进 (27)5.6利用遗传算法优化二维最大模糊熵进行图象分割 (29)5.7基于最大模糊熵和改进的自适应遗传算法的三类阈值分割 (33)第六章结束语 (38)6.1论文的主要工作 (38)6.2论文的创新点 (38)参考文献 (40)研究生期间发表的论文 (45)致谢 (46)第一章绪论1.1图象分割技术简介及其意义图象分割一直是图象处理领域中的重点和难点。