当前位置:文档之家› K均值算法图像分割

K均值算法图像分割

K均值算法图像分割
K均值算法图像分割

毕业论文(设计) 题目基于特征的图像分割技术

学生姓名万亚堃

学号20111334044

学院电子与信息工程学院

专业通信工程

指导教师胡昭华老师

二O一五年四月五日

目录

1.绪论 (4)

1.1课题研究意义 (4)

1.2图像分割技术发展概况 (5)

1.3 图像分割方法的现状 (7)

1.4论文内容 (9)

2.基于综合特征的图像分割 (9)

2.1概述 (9)

2.2颜色空间选取 (10)

2.3图像特征提取 (10)

2.3.1颜色特征提取 (10)

2.3.2纹理特征提取 (10)

2.4综合特征分割 (11)

3.K均值算法 (12)

3.1原始K均值算法 (12)

3.2K均值聚类分割算法 (13)

3.2.1 聚类 (13)

3.2.2 K-均值聚类算法的工作原理: (13)

3.2.3 K-means聚类算法的一般步骤: (13)

3.2.4 K-均值聚类法的缺点: (14)

3.3.基于灰度空间的彩色图像像素聚类 (14)

3.4改进的k-均值聚类图像分割算法 (15)

3.5分割结果及分析 (20)

4.本文结论 (20)

4.1存在的问题以及对未来的展望 (20)

参考文献 (21)

致谢 (23)

附一:K-均值聚类改进前的matlab源程序 (24)

基于特征的图像分割技术

万亚堃

南京信息工程大学电子与信息工程学院,江苏南京 210044

摘要:图像分割是指将一副图像分解为若干互不交叠的有意义且具有相同属性的区域。图像分割是数字图像处理中的一项关键技术,其分割的准确性直接影响后续任务的有效性,因此具有十分重要的意义。现有的分割算法在不同程度上取得了一定的成功,但是图像分割的很多问题还远远没有解决,该方面的研究仍然面临很多挑战。

本文采用改进的K均值算法进行图像分割,在颜色空间选取上也采用比较好的RBG颜色空间,对图像分别进行了颜色特征提取与纹理特征提取,最后进行了原始K均值算法与改进后的K均值算法分割图形的比较,实验结果表明本文提出的方法可以很好的从图像中分割出有意义的区域,更突出目标区域。

关键词:图像分割,颜色空间,K均值聚类。

Based on the characteristics of the image segmentation

technology

Wanyakun

NUIST,Nanjing 210044,China

Abstract:Image segmentation is a pair of images are decomposed into several mutually

overlapping area of meaningful and with the same attribute.Image segmentation is a key technology of digital image processing,The segmentation accuracy directly affect the effectiveness of the subsequent task, So it is of vital significance. Existing segmentation algorithm in different degree, has achieved some success, but is far from solved many problems of image segmentation, the research still faces many challenges.

Image segmentation is one of the most basic and important field in image processing, is to visual image analysis and pattern recognition is the basic premise. Proposed in this paper USES the improved k-means algorithm for image segmentation, on the selection of color space is better HUV based on color space (by linear RBG color space transformation). Image feature and color feature extraction of texture feature extraction respectively, finally has carried on the original k-means algorithm and the improved k-means algorithm segmentation graphical comparison of the experimental results show that the proposed approach can be very good meaningful regions segmented from the image.

Keywords:Image segmentation, color space, k-means clustering.

1.绪论

1.1 课题研究意义

图像分割是数字图像处理中的一项关键技术,它通常用于对图像进行分析、识别、编码等处理之前的预处理环节,其分割的准确性直接影响后续任务的有效性,因此具有十分重要的意义。自上世纪70年代以来,已经出现了多种图像分割方法,而每一种图像分割方法都

是为了解决一些特定的应用问题。该技术成功地应用于许多领域,例如:交通路口的电子警察、光学字符识别(OCR)、指纹识别、机动车牌号识别等等。

图像分割是指将一副图像分解为若干互不交叠的有意义且具有相同属性的区域。好的图像分割应具备的特性:①分割出来的各区域对某种性质如灰度、纹理而言具有相似性,区域内部比较平整;②相邻区域对分割所依据的性质有明显的差异;③区域边界上是明确和规整的。

大多数图像分割方法只是部分满足上述特征。如果强调分割区域的同性质约束,则分割区域很容易产生大量小孔和不规则边缘;若强调不同区域间性质差异的显著性,则易造成不同区域的合并。具体处理时,不同的图像分割方法总是在各种约束条件之间寻找一种合理的平衡。

虽然图像分割方法已经有了很大的发展,但由于它的复杂性,仍有很多问题没有很好地得到解决。因此,人们至今还一直在努力发展新的、更有潜力的分割算法,以期实现更通用、更完美的分割结果。实践表明,对图像分割理论与技术的进一步研究仍然具有非常重要的意义。

本文首先对数字图像分割的一些经典分割方法作了概述,然后分析了现有项目开发中使用的图像分割方法所存在的问题,最后基于经典算法进行技术改进,实现了一种新的分割方法,并将其应用到实验当中,取得了良好的效果。

1.2图像分割技术发展概况

利用计算机进行图像处理有两个目的:一是产生出更适合人观察和识别的图像,二是希望能够由计算机自动识别和理解图像。无论为了哪种目的,关键的一步就是能够对包含有大量、各式各样景物信息的图像进行分解,分解的最终结果是一些具有某种特征的最小成分即图像的基元。图像的特征指图像中可用作标志的属性。它可分为图像统计特征和图像的视觉特征两类。图像的视觉特征是一些人为特征,需通过变换才能得到,如图像的直方图。图像的视觉特征指人的视觉可直接感受到的自然特征,如区域的亮度、纹理或轮廓等等。上述将图像分解成具有不同特殊单元的过程就是图像的分割,由此可以看出,图像分割是实现图像分析的重要步骤。

图像分割是图像分析的初始步骤之一,也是图像处理最原始的问题,几乎自数字图像处理问世不久,人们就开始了图像分割技术的研究,并取得了相当的进展和成功。但由于它的复杂性,有许多问题没有很好地解决,因此人们至今还一直在努力发展新的、更有潜力的分

割算法,以期实现更通用、更完美的分割结果。图像分割是计算机图像处理的一个基本问题,是许多后续图像分析任务的第一步处理,特别是对于图像识别、图像的可视化和基于目标的图像压缩都高度依赖于分割结果。图像分割是由图像处理进到图像分析的关键步骤,也是一种基本的计算机视觉技术,这是因为图像的分割、目标的分离、特征的提取和参数的测量将原始的图像转化为更抽象、更紧凑的形式,使得更高层的分析和理解成为可能。通常,分割问题包括将给定图像中相似的块分割成一个区,相邻的分割结果是不相似的。从另一个角度

说,分割也可以被认为是像素的标记处理,属于同一区域的像素被标上相同的号。一直以来,人们致力于分割方法的研究,提出了很多分割方法。但是,图像分割仍然是图像处理中的一个瓶颈。实际上,图像分割就是把图像中的目标分成许多感兴趣的区域与图像中各种物体目标相对应。目前可能的理解图像方法只限于信息中部分特征,如:灰度差别、局部纹理差别、彩色差别、局部统计特征或局部区域的频谱特征的差别等成熟技术表征的特征。既然我们只能用图像信息中某些部分特征去分割区域,因此各种分割方法必然带有局限性。迄今为止,还没有一种图像分割方法适用于所有的图像。

图像分割的实质是要正确地划分属性空间,使得具有相同属性的像素归属于同一区域,不同属性的像素归属不同的区域。

图像分割方法的研究始于上世纪 50 年代,研究己有几十年的历史,借助各种理论

至今已提出了上千种各种类型的分割算法,而且这方面的研究仍在积极进行中。经典的

图像分割方法分为以下几种:

1、阈值分割技术

阈值分割技术是经典的、流行的图像分割方法之一,也是最简单的一种图像分割方法,这种方法的关键在于寻找适当的灰度阈值。常用的方法有最大类间方差法、最小误差法、最大熵法等。这些方法都是基于一维灰度直方图,而且对整幅图像使用一个固定全局阈值,如果图像中有阴影或光照不均等,分割效果会受到影响。为此,提出了用二维直方图或者动态阈值等技术进行分割,但同时计算复杂度会增加。阈值分割技术它仅适用于高反差的简单图像的分割,不能满足灰度渐变或以某种纹理而不是灰度来表征不同区域的那些复杂图像的分割。

2、区域技术

区域技术通过对目标像素的直接检测来实现分割。区域生长法是一种常用的区域技术。区域增长是:先从每个需要分割的目标中找一个种子像素作为生长的起点,然后将其周围的像素按照某种相似性标准(如灰度相似性)与之对比,如果满足标准则合并到种子像素的集合内,将新合并的像素作为新的种子像素继续向外扩展,直到找不到满足条件的像素为止。这种方法能够同时利用图像的多种性质进行分割,但是由于它采用串行机制,计算时间较长,实时性较差。

3、边缘检测技术

图像分割能够通过检测不同区域的边缘来获得。在目标的边缘处常常有灰度的急剧变化,借助各种空域微分算子,如梯度算子,方向算子,拉普拉斯算子和马尔算子等,能够检测出图像中具有边缘特性的像素点。在此基础上,采用边界闭合技术把边缘像素连接起来组成目标区域的封闭边界,从而达到分割的目的。但边界检测是一项困难的工作,因为通常图像的边界都很难找到。随着数学工具,成像设备和计算机技术的发展,图像分割方法呈现出新的特点和趋势:

(1)多种新兴数学工具的加入,使得新的方法不断涌现。人工神经网络,小波理论和遗传

算法是加世纪 90 年代兴起的新型理论工具,人们将其应用到图像分割中,起到了改善分割效果,扩展适用范围以及提高运算速度等作用。

(2)成像设备和技术的发展使得应用对象的范围大大扩展。现在采集的图像种类与以往相比有了较大的变化和发展,不仅仅局限于常见的两维静止灰度图像,还有各种 3 维图像,彩色图像,运动图像等等。这些发展对图像分割方法提出了更高的要求。

(3)多特征的利用和多方法的融合。图像分割方法要取得更好的效果,不能局限于单一特征的分析,而要综合利用多种信息。图像分割是一个复杂的过程,需要融合多种方法的优势进行。

1.3 图像分割方法的现状

从上世纪五十年代开始,学者一直热衷于研究图像分割技术。迄今为止,已提出上千种图像分割算法,依这些算法对图像处理的特点,主要可分为以下几类方法。

(1)阈值分割法

阈值分割法作为一种常见的区域并行技术,它通过设置阀值,把像素点按灰度级分若干类,从而实现图像分割。由于是直接利用图像的灰度特性,因此计算方便简明、实用性强。显然,阈值分割方法的关键和难点是如何取得一个合适的阈值,而实际应用中阈值设定易受噪声和光亮度影响。近年来关于阈值分割法主要有:最大相关性原则选择阈值法、基于图像拓扑稳定状态法、灰度共生矩阵法、熵法、峰值和谷值分析法等。其中,自适应阈值法、最大熵法、模糊阈值法、类间阈值法是对传统阈值法改进较成功的几种算法。更多的情况下,阈值的选择会综合运用两种或两种以上的方法,这也是图像分割发展的一个趋势。例如,将图像的灰度直方图看作是高斯分布的选择法与自适应定向正交投影高斯分解法的结合,较好地拟合了直方图的多峰特性,从而得到了更为准确的分割效果。阈值法的缺陷主要在于它仅仅考虑了图像的灰度信息,而忽略了图像的空间信息。对于非此即彼的简单图像处理(如一些二值图像的处理)是有效的,但是对于图像中不存在明显的灰度差异或各物体的灰度值范围有较大重叠的图像分割问题则难以得到准确的分割效果。

(2)基于边缘的图像分割法

边缘总是以强度突变的形式出现,可以定义为图像局部特征的不连续性,如灰度的突变、纹理结构的突变等。边缘常常意味着一个区域的终结和另一个区域的开始,图像的边缘包含了物体形状的重要信息,它不仅在分析图像时大幅度地减少了要处理的信息量,还保护了目标的边界结构。对于边缘的检测常常借助空间微分算子进行,通过将其模板与图像卷积完成。两个具有不同灰度值的相邻区域之间总存在灰度边缘,而这正是灰度值不连续的结果,这种不连续可以利用求一阶和二阶导数检测到。

当今的局部技术边缘检测方法中,主要有一次微分(Sobel算子、Roberts算子)、二次微分(拉普拉斯算子等)和模板操作(Prewitt算子、Kirsch算子和Robinson算子)等。这些边缘检测器对边缘灰度值过渡比较尖锐且噪声较小等不太复杂的图像可以取得较好的效果,但对于边缘复杂(如边缘模糊、边缘丢失、边缘不连续等)的图像效果不太理想。此外,

噪声的存在使基于导数的边缘检测方法效果明显降低,在噪声较大的情况下所用的边缘检测算子通常都是先对图像进行适当的平滑,抑制噪声,然后求导数,或者对图像进行局部拟合,然后再用拟合光滑函数的导数来代替直接的数值导数,如Marr算子、Canny算子等。有关学者曾给出了一种基于彩色边缘的图像分割方法,这是对传统边缘分割方法只适用于灰度图像状况的一个突破。

在未来的研究中,用于提取初始边缘点的自适应阈值选取、用于图像层次分割的更大区域的选取,以及如何确认重要边缘去除假边缘将变得非常重要。

(3)基于聚类的分割法

对灰度图像和彩色图像中相似灰度或色度合并的方法称之为聚类,通过聚类将图像表示为不同区域即所谓的聚类分割方法。此方法的实质是将图像分割问题转化为模式识别的聚类分析,如k均值、参数密度估计、非参数密度估计等方法都能用于图像分割。常用的聚类分割有颜色聚类分、灰度聚类分割和像素空间聚类分割。颜色聚类分割实际上是将相似的几种颜色合并为一色,描述颜色近似程度的指标是色差,在标准CIE匀色空间中,色差是用两个颜色的距离来表示的。但是显示器采用的RGB空间是显示器的设备空间,与CIE系统的真实三原色不同,为简单起见,一般采用RGB色空间中的距离来表示。

灰度聚类分割就是只把图像分成目标和背景两类,而且仅考虑像素的灰度,这就是一个在一维空间中把数据分成两类的问题。通过在灰度空间完成聚类,得到两个聚类中心(用灰度值表征),聚类中心连线的中点便是阈值。显然这个概念也可以轻松地延扩至多阈值和动态阈值的情况。

像素空间聚类分割在某些特定的尺度上观察图像,比如说把图像信号通过一个带通滤波器,滤波的结果将使图像的局部信息更好地被表达。通过一个多尺度分解,轮廓信息可以在大尺度图像上保留下来,细节或者突变信息可以在中小尺度上体现,基于多尺度图像特征聚类的分割方法渐渐得到了人们的关注。

(3)函数优化法

基于函数优化的分割方法是图像分割中另一大类常用的方法,其基本思路是给出一个目标函数,通过该目标函数的极大化或极小化来分割图像,G.A.Hewer等人提出了一个具有广泛意义的目标函数。统计学分割法、结合区域与边缘信息法、最小描述长度(MDL)法、基于贝叶斯公式的分割法等是目前几种活跃的函数优化法。

统计学分割法就是把图像中各个像素点的灰度值看作是具有一定概率分布的随机变量,且观察到的实际物体是作了某种变换并加入噪声的结果。统计学分割方法包括基于马尔科夫随机场法(MRF)、标号法(Labeling)和混合分布法(Mixture)等。

结合区域与边缘信息法是基于区域信息的图像分割的主要方法。区域增长有两种方式:一种是先将图像分割成很多一致性较强的小区域,再按一定的规则将小区域融合成大区域,达到分割图像的目的;另一种是事先给定图像中要分割目标的一个种子区域,再在种子区域基础上将周围的像素点以一定的规则加入其中,最终达到目标与背景分离的目的。分裂合并

法对图像的分割是按区域生长法沿相反方向进行的,无需设置种子点,其基本思想是给定相似测度和同质测度,从整幅图像开始,如果区域不满足同质测度,则分裂成任意大小的不重叠子区域;如果两个邻域的子区域满足相似测度则合并。

最小长度描述法(MDL)的基本思路是用一种计算机语言来描述图像的区域和边界信息,得到一个描述长度函数,以此作为目标函数,根据图像极小化描述长度从而得到分割结果。MDL准则主要应用于区域竞争中,即通过这种规则对比若干个种子区域,找出其中的坏种子。它常常与其他方法结合使用。

1.4论文内容

本文通过大量阅读图像分割技术方面的文献,认真研究K均值算法,并对其中的一些算法提出了改进优化了K均值算法。算法流程为颜色空间选取--图像特征提取(颜色特征提取和纹理特征提取)--综合特征分割--分割结果及分析。

文章内容安排如下:

(1)第一章:主要阐述课题研究意义,图像分割技术发展概况,图像分割方法的现状,论文的主要内容。

(2)第二章:主要阐述技术基于综合特征的图像分割的流程颜色空间的选取(比较HSV 颜色空间与RGB颜色空间,最后选择了RGB颜色空间--图像特征的提取(分别进行颜色特征提取和纹理特征提取)--综合特征分割(先用原始的K均值算法,然后再使用改进后的K 均值算法,对两者进行比较,K均值算法的流程为初始聚类--K均值迭代--后处理)--分割结果及其分析(对原始K均值算法与改进后的K均值算法所分割出来的图像进行对比,发现区别得出结论)。

(3)第三章:存在的问题以及对未来的展望。

2.基于综合特征的图像分割

2.1概述

目前彩色图像的分割方法大多仅用颜色特征或纹理特征,难以满足基于内容检索应用的

需要。例如目前很有代表性的VisualSEEK系统仅仅采用颜色特征用于分割,很容易对高纹理区域产生过分割,而一些仅用纹理分割的算法又没有充分利用颜色所携带的丰富信息,可能产生欠分割,不管是只使用颜色特征进行的分割,还是只是用纹理特征进行的分割在对图像进行分割的时候都会产生不好的影响,因此有效地融合颜色和纹理信息是获得稳健的图像分割的重要途径。目前,这方面的分割方法的研究相对较少。针对这个问题,该文提出了一种利用图像的颜色和纹理综合特征进行分割的方法。

图像分割方法有很多种,其中,聚类法是一个较简单有效的综合特征分割方法,已被广

泛应用到图像分割领域。典型的聚类方法有K 均值法、ISODATA 法、模糊C 均值法等。ISODA TA 法有六个参数必须由用户提供,较难实现,且不能做到自动分割;模糊C 均值法是对特征集的模糊划分,这种方法主要用于三维图像和医疗图像的分割;而K 均值法通过改进可以做到一定程度的自动分割,而且适合于分割普通图像,在处理大量数据集方面也具有其它聚类算法无法比拟的优势,但是,K 均值法的缺点在于需要具有聚类数目及聚类中心的先验知识,聚类结果往往与初始聚类个数和聚类中心的选定有关,聚类只考虑图像点的特征相近性,未考虑点的位置邻近性。因此该文采用了改进的K 均值算法来进行图像分割。改进后的方法能克服以上缺陷,分割出有意义的区域。 2.2颜色空间选取

由于HSV 颜色空间在视觉上比RGB 颜色空间更均匀,即HSV 的空间距离比RGB 的空间距离更加符合人眼视觉特征,因此目前有许多图像分割算法采用了HSV 空间。但是,从RGB 到HSV 的转换是个非线性变换,H 和S 都有不可避免的奇异点,即在转换公式中出现分母为零的情况。在奇异点附近即使R 、G 、B 的值有很小变化也引起变换值有很大的跳动,这样会产生不稳定,因此不宜用于区域分割算法中。

从这点说,由R 、G 、B 经线性变换法得到的彩色坐标系更为可取,替代非线性的色调和饱和度变换的方法是采用三滤波器值的线性变换。文章采用了YUV 空间,YUV 空间是由RGB 空间经过线性变换得到的。RGB 空间到YUV 空间的转换公式为:

??????????V U Y =?????-55.0169.0299

.0 419.0332.0587.0-- ?????-081.0500.0144.0????

?

?????B G R 认知科学表明,YUV 是一种独立于设备的彩色空间,它按照人类的感知程度以一致的尺度表示色彩差别,而且,该文经过实验发现,采用YUV 空间产生的分割结果比HSV 空间的分割结果更好。 2.3图像特征提取 2.3.1颜色特征提取

采用4*4的图像块为图像分割的最小单位,因此,特征提取的最小单位也是4*4的图像块。对于小块的颜色特征,直接采用小块里的各个像素的Y 、U 、V 的颜色均值。设小块的16个点从上至下,从左至右标号为1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,该小块的颜色特征(Y 、U 、V )计算公式为:

Y=16

1

∑=16

1i Yi ,U=∑=16

1161i Ui ,∑==16

1

i Vi V 2.3.2纹理特征提取

由于小波变换能提取图像的高频信息,因此,它非常适合于提取图像的纹理特征。考虑到计算的简洁性和效率,该文选择了哈尔小波。小波变换的对象是各个4*4的图像块。一次小波变换后,一个4*4的块分解成四个频带,低频带LL 及三个高频带HL 、LH 、HH ,每个频带包含4个系数,见图1。

(a ) 原始图像

(b)小波变换

图1小波变换示意图

提取三个高频带的小波能量作为纹理特征。以HL 频带为例,假设其对应的小波系数为{

c c c

c l k l k l k l

k 1,1,11

,,,,,++++}该频带对应的纹理特征量计算如下:

∑∑=++==1

j 21

,11

i 41f c

l k ((3)

从HH 和LH 频带计算另两个纹理特征量,计算公式类似式(3),即求该频带的小波系数的二阶矩的均值。 2.4综合特征分割

将颜色特征的三维向量和纹理特征的三维向量组合成一个六维向量,利用这种综合特征向量来分割图像,以达到预期的图像分割效果。

3.K 均值算法

3.1原始K 均值算法

K 均值聚类法可以用来进行综合特征的分割,下面是原始均值算法的伪代码。 原始K 均值算法的伪代码如下: function Direct-k-means( )

初始化K 个模板(

),...,,,3

2

1

w w w w k

使∈=j i w l

j

,{1,2,···,k},

∈l {1,2,···,n}

聚类

w

j

j

对应于模板c

Repeat

for 每个输入向量∈l i

l 其中,{1,2,···,n} do

将w

c i j

j

l 对应的模板为加入最近的聚类,

(即符合∈-≤-j w i w i j

l

j

l

,{1,2,···,k})

for 每个聚类

∈j c

j

,{1,2,···,k}

do 按照目前

c

j

中的所有样本来更新模板

w

j

∑∈=i c j

l c

i

w j

l j

计算误差函数:21

∑∑∈=-=

c i E j

l w

i j

l

k

j

Until 不改变或者聚类成员不再改变。从以上步骤可以看出,最终的聚类依赖于初始聚 类中心及聚类数目K 值的选择。很多情况下要得到图像的先验知识是不可能的,因此,K 均值聚类算法中,类别数目的确定是个难点,数目过多会产生过分割(分割得过细),过少又会导致欠分割(有的区域未分割出来)。我们提出了一种改进的K 均值方法来分割图像,使得这些参数可以通过图像的统计信息确定相应的初始值,而无需用户进行事先的指定,然后再根据K 均值迭代对聚类个数和模板初值进行不断的调整,直到聚类个数和模板初值不再变化为止,而且,通过加入后处理,兼顾了聚类时点的位置连通关系。

3.2K均值聚类分割算法

3.2.1 聚类

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析计算方法主要有如下几种:划分方法,层次方法,基于密度的方法,基于网格的方法,基于模型的方法。

K-均值聚类算法是著名的划分聚类分割方法。划分方法的基本思想是:给定一个有N 个元组或者纪录的数据集,分裂法将构造K个分组,每一个分组就代表一个聚类,K

3.2.2 K-均值聚类算法的工作原理:

K-means算法的工作原理:算法首先随机从数据集中选取K个点作为初始聚类中心,然后计算各个样本到聚类中的距离,把样本归到离它最近的那个聚类中心所在的类。计算新形成的每一个聚类的数据对象的平均值来得到新的聚类中心,如果相邻两次的聚类中心没有任何变化,说明样本调整结束,聚类准则函数已经收敛。本算法的一个特点是在每次迭代中都要考察每个样本的分类是否正确。若不正确,就要调整,在全部样本调整完后,再修改聚类中心,进入下一次迭代。这个过程将不断重复直到满足某个终止条件,终止条件可以是以下任何一个:

(1)没有对象被重新分配给不同的聚类。

(2)聚类中心再发生变化。

(3)误差平方和局部最小。

3.2.3 K-means聚类算法的一般步骤:

处理流程:

(1)从n个数据对象任意选择k 个对象作为初始聚类中心;

(2)循环(3)到(4)直到每个聚类不再发生变化为止;

(3)根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分;

(4)重新计算每个(有变化)聚类的均值(中心对象),直到聚类中心不再变化。这种划分使得下式最小

2

1i j

k

i j

j x E x m ω

=∈

=-∑

3.2.4 K-均值聚类法的缺点:

缺点:

(1)在 K-means 算法中 K 是事先给定的,这个 K 值的选定是非常难以估计的。 (2)在 K-means 算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化。

(3) K-means 算法需要不断地进行样本分类调整不断地计算调整后的新的聚类中心因此当数据量非常大时算法的时间开销是非常大的。

(4)K-means 算法对一些离散点和初始k 值敏感,不同的距离初始值对同样的数据样本可能得到不同的结果。

3.3.基于灰度空间的彩色图像像素聚类

1.读取彩色图像,将RGB 值转化为灰度值

2. 利用k 均值聚类对像素的灰度值进行划分,提取特征点(本方法采用误差平方和准则函数判断聚类是否合理)。

3.利用matlab 编程实现结果如下: 随即地取c1(1)=25; c2(1)=125;

c3(1)=200;%选择三个初始聚类中心

图1

得到最终聚类中心的灰度值如下:

R =109.5763 G =158.0943 B =212.8034

随机选取聚类中心的K-均值聚类结果:

图2

3.4改进的k-均值聚类图像分割算法

4.1 K-均值聚类算法中重要的一步是初始聚类中心的选取,一般是随机选取待聚类样本集的K个样本,聚类的性能与初始聚类中心的选取有关,聚类的结果与样本的位置有极大的相关性。一旦这K个样本选取不合理,将会增加运算的复杂程度,误导聚类过程,得到不合理的聚类结果。通过粗糙集理论提供K-均值聚类所需要的初始类的个数和均值,提高了聚类的效率和分类的精度。

于粗糙集理论的灰度空间划分

1.粗糙集的研究对象是由一个多值属性集合描述的对象集合。主要思想是在保持分类能力不变的情况下,通过知识约简,导出问题的决策和分类规则[4]。粗糙集理论能很好地近似分类。从图像的直方图可以看出图形一般呈谷峰状分布,同一区域内像素的灰度值比较接近,而且不同区域内像素数大小不等。若灰度值相差不大的像素可归为一类,则可将图像分为几类。为此,定义像素的灰度值差为条件属性,等价关系R定义为:如果两个像素灰度值差小于定间距D,则两个像素是相关的,属于等价类。

首先确定间距D,通过原图可求出灰度值分布范围,根据灰度值范围可求出灰度级数L。将灰度级范围内对应像素个数最多的灰度值定义为中心点P。计算L个中心点之两两间距,若最小距离小于间距D,则将相应中心点合并,并将两点的算术平均值作为该中心点的值。

重复进行直到所有中心点的两两间距均大于间距D 。中心点的个数和数值就是K_均值聚类所需要的初始类的个数和均值。

2.像素的灰度值为(0,1,

,255)p x p =,

其中()i j Q 为第 i 次迭代后赋给类j 的像素集合, j μ为第 j 类的均值。

具体步骤如下:

① 将粗糙集理论提供的L 个中心点P 作为初始类均值

(1)1μ,(2)2μ,,()l l μ。

② 在第i 次迭代时,考察每个像素,计算它与每个灰度级的均值之间的间距,即它与聚类中心的距离 D ,将每个像素赋均值距其最近的类,即

{

}

()()min ,(1,2,

)i i p l p j D x D x j l μμ-=-= (3.6)

则()i p j x Q ∈。 ③对于1,2,

j l =,计算新的聚类中心,更新类均值:()

(1)

1/i j i j

j p x Q N x μ+∈=∑

,式中,j

N 是()i j Q 中的像素个数。

④将所有像素逐个考察,如果1,2,j K =,有 (1)()i i j j μμ+=,则算法收敛,结束;

否则返回②继续下一次迭代。

⑤ 以上聚类过程结束后,为了增强显示效果,分割结果各像素以聚类中心灰度值作为该类最终灰度

由原图像的灰度直方图,本文将定间距D 设为32,灰度级L 的个数为8。原灰度图的灰度值范围为[0,255],被分成8个灰度级,七个灰度级对应中心点P 为{32,64,96,128,160,192,224,256}。计算这12个中心点之两两间距,若最小距离小于间距20,则将相应中心点合并,并将两点的算术平均值作为该中心点的值,处理后结果P{32,160,192}

下面将c1(1)=32;c2(1)=160;c3(1)=192;作为初始聚类中心,编程进行聚类分析。得到结果如下:

图3

图3与图2相比分类结果更好,图像分割效果更明显,更能表现图像特征。边缘更加清晰,分割结果既突出了目标,又保留了细节信息,达到了较好的分割效果。因此,基于粗糙集的K_均值聚类算法可以有效地对灰度图像进行分割,从分割后的图像中可获取更多的目标信息,为进一步的图像分析和理解提供了良好的基础。

继续对多幅图像用上述两种方法进行K-均值聚类分割,得到如下对比图像:

图4

K-均值聚类得到的:

图5

根据改进的K-均值算法得到的:

图6 原始图像:

K-均值聚类得到的:

根据改进的K-均值算法得到的:

图七

3.5分割结果及分析

原始的 K 均值分割方法容易产生过分割,应该合并的区域没有合并,导致这些区域不能组成独立的物体而且原始 K 均值方法也容易产生欠分割,原因是采用的聚类没有考虑各点的位置关系,会产生不相邻的点被归到一个区域,导致区域不连通,通常不连通的区域不能对应一个独立

的物体,影响了后面的检索。改进后的 K 均值算法能分割出普通图像的目标区域,例如,由于有相似的纹理和颜色、花朵、花叶、黑马、白马、草原、大海、草坪、树等独立完整的有意义的区域可以被分割出来。

试验表明,基于粗糙集理论和K-均值聚类算法的图像分割方法,比随机选取聚类的中心点和个数减少了运算量,提高了分类精度和准确性,而且对于低对比度、多层次变化背景的图像的形状特征提取具有轮廓清晰、算法运行速度快等特点,是一种有效的灰度图像分割算法。

4.本文结论

4.1存在的问题以及对未来的展望

虽然近年来研究成果越来越多,但由于图像分割本身所具有的难度,使研究没有大的突破性的进展.仍然存在的问题主要有两个:其一是没有一种普遍使用的分割算法;其二是没有

图像分割算法开题报告

图像分割算法开题报告 摘要:图像分割是图像处理中的一项关键技术,自20世纪70年代起一直受到人们的高度重视,并在医学、工业、军事等领域得到了广泛应用。近年来具有代表性的图像分割方法有:基于区域的分割、基于边缘的分割和基于特定理论的分割方法等。本文主要对基于自动阈值选择思想的迭代法、Otsu法、一维最大熵法、二维最大熵法、简单统计法进行研究,选取一系列运算出的阈值数据和对应的图像效果做一个分析性实验。 关键字:图像分割,阈值法,迭代法,Otsu法,最大熵值法 1 研究背景 1.1图像分割技术的机理 图像分割是将图像划分为若干互不相交的小区域的过程。小区域是某种意义下具有共同属性的像素连通集合,如物体所占的图像区域、天空区域、草地等。连通是指集合中任意两个点之间都存在着完全属于该集合的连通路径。对于离散图像而言,连通有4连通和8连通之分。图像分割有3种不同的方法,其一是将各像素划归到相应物体或区域的像素聚类方法,即区域法,其二是通过直接确定区域间的边界来实现分割的边界方法,其三是首先检测边缘像素,然后再将边缘像素连接起来构成边界的方法。 图像分割是图像理解的基础,而在理论上图像分割又依赖图像理解,两者是紧密关联的。图像分割在一般意义下十分困难的,目前的图像分割处于图像的前期处理阶段,主要针对分割对象的技术,是与问题相关的,如最常用到的利用阈值化处理进行的图像分割。 1.2数字图像分割技术存在的问题

虽然近年来对数字图像处理的研究成果越来越多,但由于图像分割本身所具有的难度,使研究没有大突破性的进展,仍然存在以下几个方面的问题。 现有的许多种算法都是针对不同的数字图像,没有一种普遍适用的分割算法。 缺乏通用的分割评价标准。对分割效果进行评判的标准尚不统一,如何对分割结果做出量化的评价是一个值得研究的问题,该量化测度应有助于视觉系统中的自动决策及评价算法的优劣,同时应考虑到均质性、对比度、紧致性、连续性、心理视觉感知等因素。 与人类视觉机理相脱节。随着对人类视觉机理的研究,人们逐渐认识到,已有方法大都与人类视觉机理相脱节,难以进行更精确的分割。寻找到具有较强的鲁棒性、实时性以及可并行性的分割方法必须充分利用人类视觉特性。 知识的利用问题。仅利用图像中表现出来的灰度和空间信息来对图像进行分割,往往会产生和人类的视觉分割不一致的情况。人类视觉分割中应用了许多图像以外的知识,在很多视觉任务中,人们往往对获得的图像已具有某种先验知识,这对于改善图像分割性能是非常重要的。试图寻找可以分割任何图像的算法目前是不现实,也是不可能的。人们的工作应放在那些实用的、特定图像分割算法的研究上,并且应充分利用某些特定图像的先验知识,力图在实际应用中达到和人类视觉分割更接近的水平。 1.3数字图像分割技术的发展趋势 从图像分割研究的历史来看,可以看到对图像分割的研究有以下几个明显的趋势。 对原有算法的不断改进。人们在大量的实验下,发现一些算法的效

关于图像分割算法的研究

关于图像分割算法的研究 黄斌 (福州大学物理与信息工程学院 福州 350001) 摘要:图像分割是图像处理中的一个重要问题,也是一个经典难题。因此对于图像分割的研究在过去的四十多年里一直受到人们广泛的重视,也提山了数以千计的不同算法。虽然这些算法大都在不同程度上取得了一定的成功,但是图像分割问题还远远没有解决。本文从图像分割的定义、应用等研究背景入手,深入介绍了目前各种经典的图像分割算法,并在此基础比较了各种算法的优缺点,总结了当前图像分割技术中所面临的挑战,最后展望了其未来值得努力的研究方向。 关键词:图像分割 阀值分割 边缘分割 区域分割 一、 引言 图像分割是图像从处理到分析的转变关键,也是一种基本的计算机视觉技术。通过图像的分割、目标的分离、特征的提取和参数的测量将原始图像转化为更抽象更紧凑的形式,使得更高层的分析和理解成为可能,因此它被称为连接低级视觉和高级视觉的桥梁和纽带。所谓图像分割就是要将图像表示为物理上有意义的连通区域的集合,也就是根据目标与背景的先验知识,对图像中的目标、背景进行标记、定位,然后将目标从背景或其它伪目标中分离出来[1]。 图像分割可以形式化定义如下[2]:令有序集合表示图像区域(像素点集),H 表示为具有相同性质的谓词,图像分割是把I 分割成为n 个区域记为Ri ,i=1,2,…,n ,满足: (1) 1,,,,n i i j i R I R R i j i j ===??≠ (2) (),1,2,,i i i n H R True ?== (3) () ,,,i j i j i j H R R False ?≠= 条件(1)表明分割区域要覆盖整个图像且各区域互不重叠,条件(2)表明每个区域都具有相同性质,条件(3)表明相邻的两个区域性质相异不能合并成一个区域。 自上世纪70年代起,图像分割一直受到人们的高度重视,其应用领域非常广泛,几乎出现在有关图像处理的所有领域,并涉及各种类型的图像。主要表现在: 1)医学影像分析:通过图像分割将医学图像中的不同组织分成不同的区域,以便更好的

基于全卷积网络的图像语义分割算法研究

哈尔滨工业大学工程硕士学位论文 Abstract Because of the development of deep learning and the emergence of fully convolutional networks,the domain of the image semantic segmentation has been rapidly developed.It is widely used in the fields of driverless,medical diagnosis, machine navigation and so on.Driverless technology has been a research hotspot,in this technology,the perception of the environment around the vehicle is the key points.It can classify images on the pixel-level to obtain the overall information of the image,and the semantic segmentation requires the low-cost vision sensors,so it fits the demand of driverless technology. Fully convolutional networks is a feasible and effective image semantic segmentation algorithm.The algorithm innovatively replaces the fully connected layer with the convolutional layer and applies it to the pixel-level classification task. DeepLab is an improved algorithm with the fully convolutional networks and this algorithm has a high accuracy.However,there are still some problems in this algorithm,and there is a great space for improvement.We research each sub-module of the algorithm,then research the problem and give the improvement plan to further improve the accuracy of the algorithm. In order to solve the problem that the DeepLab algorithm does not make full use of global information,resulting in poor results in complex scenes,we introduces the global context information module,this module can provides prior information of complex scenes in the picture,the global context features are extracted and then merged with the local features.This module can improve the expression ability of the features.In order to solve the problem that decoder module of the DeepLab is too simple and the boundary of the predicted result is rough,we design an efficient decoder module,the shallow layer features are fully utilized,the shallow layer features are merged with the deep layer features,and we adjusts the proportion of the deep features and the shallow features,this way can restore some of the details information,and the boundary of the object is optimized.In order to solve the problem that the DeepLab is over fitting the fixed size picture,two effective multi-scale feature level fusion modules are designed by combining the idea of integrated learning with the multi-scale model training,and on this basis,an extra supervision module is introduced,this way can improve the robustness of the algorithm. We mainly use the extended Pascal VOC2012dataset for experiments. Specifically,first we determine the optimal parameter of the improved method,then

图像分割算法的比较与分析

中北大学 课程设计说明书 学生姓名:学号: 学生姓名:学号: 学生姓名:学号: 学生姓名:学号: 学院:信息与通信工程学院 专业:电子信息工程 题目:信息处理综合实践: 图像分割算法的比较与分析 指导教师:陈平职称: 副教授 2014 年12 月29 日

中北大学 课程设计任务书 14/15 学年第一学期 学院:信息与通信工程学院专业:电子信息工程 学生姓名:学号: 课程设计题目:信息处理综合实践: 图像分割算法的比较与分析起迄日期:2015年1月5日~2015年1月16日课程设计地点:电子信息工程专业实验室 指导教师:陈平 系主任:王浩全 下达任务书日期: 2014 年12月29 日课程设计任务书

课程设计任务书

目录 第一章绪论 (1) 研究目的和意义 (1) 图像分割的研究进展 (1) 第二章区域生长法分割图像 (4) 区域生长法介绍 (4) 区域生长法的原理 (4) 区域生长法的实现过程 (5) 第三章程序及结果 (6) 区域生长算法及程序 (6) 图像分割结果 (7) 第四章方法比较 (8) 阈值法 (8) 区域法 (8) 分水岭法 (8) 形态学方法 (9) 第五章总结 (10) 参考文献 (11)

第一章绪论 研究目的和意义 图像分割是一种重要的图像技术,在理论研究和实际应用中都得到了人们的广泛重视。图像分割的方法和种类有很多,有些分割运算可直接应用于任何图像,而另一些只能适用于特殊类别的图像。许多不同种类的图像或景物都可作为待分割的图像数据,不同类型的图像,已经有相对应的分割方法对其分割;但某些分割方法只是适合于某些特殊类型的图像分割,所以分割结果的好坏需要根据具体的场合及要求衡量。图像分割是从图像处理到图像分析的关键步骤,可以说,图像分割结果的好坏直接影响对图像的理解。 图像分割是由图像处理到图像分析的关键步骤,在图像工程中占有重要位置。一方面,它是目标表达的基础,对特征测量有重要的影响。另一方面,因为图像分割及其基于分割的目标表达、特征提取和参数测量等将原始图像转化为更抽象、更紧凑的表达形式,使得更高层的图像分析和理解成为可能。因此在实际应用中,图像分割不仅仅要把一幅图像分成满足上面五个条件的各具特性的区域,而且要把其中感兴趣的目标区域提取出来。只有这样才算真正完成了图像分割的任务,为下一步的图像分析做好准备,使更高层的图像分析和理解成为可能。 图像分割在很多方面,如医学图像分析,交通监控等,都有着非常广泛的应用,具有重要的意义。(1)分割的结果常用于图像分析,如不同形式图像的配准与融合,结构的测量,图像重建以及运动跟踪等。(2)在系统仿真,效果评估,图像的3D重建以及三维定位等可视化系统中,图像分割都是预处理的重要步骤。 (3)图像分割可在不丢失有用信息的前提下进行数据压缩,这就降低了传输的带宽,对提高图像在因特网上的传输速度至关重要。(4)分割后的图像与噪声的关系减弱,具有降噪功能,便于图像的理解。 图像分割的研究进展 图像分割是图像处理中的一项关键技术,至今已提出上千种分割算法。但因

图像分割常用算法优缺点探析

图像分割常用算法优缺点探析 摘要图像分割是数字图像处理中的重要前期过程,是一项重要的图像分割技术,是图像处理中最基本的技术之一。本文着重介绍了图像分割的常用方法及每种方法中的常用算法,并比较了各自的优缺点,提出了一些改进建议,以期为人们在相关图像数据条件下,根据不同的应用范围选择分割算法时提供依据。 关键词图像分割算法综述 一、引言 图像分割决定了图像分析的最终成败。有效合理的图像分割能够为基于内容的图像检索、对象分析等抽象出十分有用的信息,从而使得更高层的图像理解成为可能。目前图像分割仍然是一个没有得到很好解决的问题,如何提高图像分割的质量得到国内外学者的广泛关注,仍是一个研究热点。 多年来人们对图像分割提出了不同的解释和表达,通俗易懂的定义则表述为:图像分割指的是把一幅图像分割成不同的区域,这些区域在某些图像特征,如边缘、纹理、颜色、亮度等方面是一致的或相似的。 二、几种常用的图像分割算法及其优缺点 (一)大津阈值分割法。 由Otsu于1978年提出大津阈值分割法又称为最大类间方差法。它是一种自动的非参数非监督的门限选取法。该方法的基本思路是选取的t的最佳阈值应当是使得不同类间的分离性最好。它的计算方法是首先计算基于直方图而得到的各分割特征值的发生概率,并以阈值变量t将分割特征值分为两类,然后求出每一类的类内方差及类间方差,选取使得类间方差最大,类内方差最小的t作为最佳阈值。 由于该方法计算简单,在一定条件下不受图像对比度与亮度变化的影响,被认为是阈值自动选取的最优方法。该方法的缺点在于,要求得最佳阈值,需要遍历灰度范围0—(L-1)内的所有像素并计算出方差,当计算量大时效率会很低。同时,在实际图像中,由于图像本身灰度分布以及噪声干扰等因素的影响,仅利用灰度直方

针对卫星图像的语义分割算法研究

哈尔滨工业大学工学硕士学位论文 Abstract With the rapid improvement of satellite technology, satellite images, especially high resolution remote sensing satellite images have been paid great attention by various countries, and have been applied in different fields. Satellite image can extract the relative position and spatial distribution of various natural elements with its rich information and visual image, which provides great space for the development of target semantic segmentation in both civil and military aspects. At the same time, in the wave of artificial intelligence, deep learning has been greatly developed with the ability of computing, which not only brings great changes in the traditional computer vision and robot, but also brings new solutions in such aspects as finance and medical care. Therefore, deep learning is applied to the semantic segmentation of satellite images, which opening up new ideas for military tactics and civilian business planning. In this paper, we use convolution neural network to classify multi resolution satellite images. The main contents of this paper are as follows: Firstly, it summarizes the basic models of deep learning and three characteristics of deep learning, namely, the simplicity, extensibility and mobility of models. The focus is mainly on the conformation, characteristics, research mechanism and development direction of convolution neural network. For the semantic segmentation of satellite images using the learning features of artificial design, the feature design learning is too complicated and the adaptation range is limited. This paper uses convolution neural network to automatically design and extract features. Based on the typical semantic segmentation network, the semantic segmentation network structure of satellite images is designed, which combines the advantages of the existing Convolutional Neural Network (CNN) and the conditional random field (Conditional Random Field, CRF). In view of the small number of images in the satellite image set, and the uneven distribution between classes, this paper adjusts the context semantic environment in the satellite image segmentation network, and combines the rough feature and the fine feature by increasing the jump connection. At the same time, the conditional random field was added to the network output to make the precision more than 16%. In order to improve the network performance, the sample set is preprocessed and added and includ the multispectral image channel synthesis, and the increase of multi remote sensing imaging index. In the view of the difference between the loss function of the convolution neural network in the semantic segmentation process and the traditional classification network, the loss function of the network is improved and the joint loss

几种图像分割算法在CT图像分割上的实现和比较

第20卷第6期2000年12月北京理工大学学报JOurnaI Of Beijing InStitute Of TechnOIOgy VOI.20NO.6Dec.2000 文章编号21001-0645(2000)06-0720-05几种图像分割算法在CT 图像分割上的 实现和比较 杨 加19吴祈耀19田捷29杨骅2(1-北京理工大学电子工程系9北京1000 1;2-中国科学院自动化研究所9北京1000 0)摘要2对目前几种在图像分割领域得到较多应用的交互式分割 区域生长分割以及阈值 分割算法进行了探讨9并且结合实际CT 片图例分别进行分割实验研究9得到较为满意和 可用性强的结果.实验表明2阈值分割对于CT 切片的效果最好;区域生长分割适宜于对面 积不大的区域进行分割9分割效果较好;基于动态规划的交互式分割算法比较复杂9计算时 间较长9但对于边缘较平滑的区域9同样具有较好的实际效果.几种算法的评估为其在CT 图像分割上的实际应用提供了科学依据. 关键词2图像分割算法;CT 图像分割;交互式分割;阈值分割;区域生长分割 中图分类号2TN 911-73文献标识码2A 收稿日期220000625 基金项目2国家自然科学基金资助项目(69 43001);国家 63 计划项目作者简介2杨加9男91975年生9硕士生. 图像分割可以分解为两个任务9即识别(recOgnitiOn )和描绘(deIineatiOn ).识别的目的在于确定目标物体的大致位置并区别于图像中的其它物体;而描绘的任务在于精确定义和刻画图像中目标物体的区域或边缘的空间范围.人的识别能力通常强于计算机算法9另一方面9计算机算法的描绘能力则优于操作者(人).因此既能利用操作者强大的识别能力9又能利用计算机算法的描绘能力的交互式图像分割则越来越受到人们的关注.在医学领域中9图像分割是病变区域提取 特定组织测量以及实现三维重建的基础9因此图像分割技术在医学图像处理中具有十分重要的意义[1].作者探讨了3种目前在图像分割上得到较多实际应用的分割算法9并结合实际CT 片图例进行了实验研究9得到较为满意和可用性强的结果;最后对这几种方法进行了评估9为这些算法在CT 图像分割上的实际应用提供了科学依据. 1 交互式分割算法1-1基本理论及算法描述 动态规划方法最早应用于图像边缘跟踪[2].可以将图像边缘检测看作一个优化问题[3]9并将其表述为找出一目标函数V =V (I 19I 29I 39~9I H )的最优值M (如取最小值min )9得V 取最优值时的一组自变量值(I 19I 29I 39I 49~9I H 9).若变量离散9目标函数没有特定规律可循时9则该问题将包括一个极大的解空间.如果这个目标函数能够描述成如下形式2 V =V (I 19I 29I 39~9I N )=V 0(I 09I 1)+V 1(I 19I 2)+~+V H-1(I H-19I H )

图像分割技术的原理及方法

浅析图像分割的原理及方法 一.研究背景及意义 研究背景: 随着人工智能的发展,机器人技术不断地应用到各个领域。信息技术的加入是智能机器人出现的必要前提。信息技术泛指包括通信技术、电子技术、信号处理技术等相关信息化技术的一大类技术。它的应用使得人们今天的生活发生了巨大变化。从手机到高清电视等家用电器设备出现使我们的生活越来越丰富多彩。在一些军用及民用领域近几年出现了一些诸如:图像制导、无人飞机、无人巡逻车、人脸识别、指纹识别、语音识别、车辆牌照识别、汉字识别、医学图像识别等高新技术。实现它们的核心就是图像处理、机器视觉、模式识别、智能控制、及机器人学等相关知识。其中图像处理具有重要地位。而图像分割技术是图像分析环节的关键技术。 研究图像分割技术的意义: 人类感知外部世界的两大途径是听觉和视觉,尤其是视觉,同时视觉信息是人类从自然界中获得信息的主要来源,约占人类获得外部世界信息量的80%以上。图像以视觉为基础通过观测系统直接获得客观世界的状态,它直接或间接地作用于人眼,反映的信息与人眼获得的信息一致,这决定了它和客观外界都是人类最主要的信息来源,图像处理也因此成为了人们研究的热点之一。人眼获得的信息是连续的图像,在实际应用中,为便于计算机等对图像进行处理,人们对连续图像进行采样和量化等处理,得到了计算机能够识别的数字图像。数字图像具有信息量大、精度高、内容丰富、可进行复杂的非线性处理等优点,成为计算机视觉和图像处理的重要研究对象。在一幅图像中,人们往往只对其中的某些区域感兴趣,称之为前景,这些区域内的某些空间信息特性(如灰度、颜色、轮廓、纹理等)通常与周围背景之间存在差别。图像分割就是根据这些差异把图像分成若干个特定的、具有独特性质的区域并提取感兴趣目标的技术和过程。在数字图像处理中,图像分割作为早期处理是一个非常重要的步骤。为便于研究图像分割,使其在实

kmeans图像分割算法

he = imread('f:\3.jpg'); % 读入图像 imshow(he), title('H&E image'); text(size(he,2),size(he,1)+15,... 'Image courtesy of Alan Partin, Johns Hopkins University', ... 'FontSize',7,'HorizontalAlignment','right'); cform = makecform('srgb2lab'); % 色彩空间转换 lab_he = applycform(he,cform); ab = double(lab_he(:,:,2:3)); % 数据类型转换 nrows = size(ab,1); % 求矩阵尺寸 ncols = size(ab,2); % 求矩阵尺寸 ab = reshape(ab,nrows*ncols,2); % 矩阵形状变换 nColors = 3; % 重复聚类3次,以避免局部最小值 [cluster_idx cluster_center] = kmeans(ab,nColors,'distance','sqEuclidean', ... 'Replicates',3); pixel_labels = reshape(cluster_idx,nrows,ncols); % 矩阵形状改变 imshow(pixel_labels,[]); % 显示图像 title('image labeled by cluster index'); % 设置图像标题 segmented_images = cell(1,3); % 细胞型数组 rgb_label = repmat(pixel_labels,[1 1 3]); % 矩阵平铺 for k = 1:nColors color = he; color(rgb_label ~= k) = 0;

基于图的快速图像分割算法

Efficient graph-based image segmentation 2.相关工作 G=(V ,E),每个节点V i v 对应图像中一个像素点,E 是连接相邻节点的边,每个边有对应有一个权重,这个权重与像素点的特性相关。 最后,我们将提出一类基于图的查找最小割的分割方法。这个最小割准则是最小化那些被分开像素之间的相似度。【18】原文中叫Component,实质上是一个MST,单独的一个像素点也可以看成一个区域。 预备知识: 图是由顶点集(vertices )和边集(edges )组成,表示为,顶点,在本文中即为单个的像素点,连接一对顶点的边具有权重,本文中的意义为顶点之间的不相似度,所用的是无向图。 树:特殊的图,图中任意两个顶点,都有路径相连接,但是没有回路。如上图中加粗的边所连接而成的图。如果看成一团乱连的珠子,只保留树中的珠子和连线,那么随便选个珠子,都能把这棵树中所有的珠子都提起来。如果,i 和h 这条边也保留下来,那么h,I,c,f,g 就构成了一个回路。 最小生成树(MST, minimum spanning tree ):特殊的树,给定需要连接的顶点,选择边权之和最小的树。上图即是一棵MST 。 本文中,初始化时每一个像素点都是一个顶点,然后逐渐合并得到一个区域,确切地说是连接这个区域中的像素点的一个MST 。如图,棕色圆圈为顶点,线段为边,合并棕色顶点所生成的MST ,对应的就是一个分割区域。分割后的结果其实就是森林。 边的权值: 对于孤立的两个像素点,所不同的是颜色,自然就用颜色的距离来衡量两点 的相似性,本文中是使用RGB 的距离,即

图像阈值分割技术原理和比较要点

图像阈值分割和边缘检测技术原理和比较

摘要 图像分割是一种重要的图像分析技术。对图像分割的研究一直是图像技术研究中的热点和焦点。医学图像分割是图像分割的一个重要应用领域,也是一个经典难题,至今已有上千种分割方法,既有经典的方法也有结合新兴理论的方法。医学图像分割是医学图像处理中的一个经典难题。图像分割能够自动或半自动描绘出医学图像中的解剖结构和其它感兴趣的区域,从而有助于医学诊断。 阈值分割是一种利用图像中要提取的目标物与其背景在灰度特性上的差异,把图像视为具有不同灰度级的两类区域(目标和背景)的组合,选取一个合适的阈值,以确定图像中每个像素点应该属于目标区域还是背景区域,从而产生对应的二值图像。 本文先介绍各种常见图像阈值分割和边缘检测方法的原理和算法,然后通过MATLAB 程序实现,最后通过比较各种分割算法的结果并得出结论。 关键词:图像分割;阈值选择;边缘检测;

目录 1.概述 (4) 2.图像阈值分割和边缘检测原理 (4) 2.1.阈值分割原理 (4) 2.1.1.手动(全局)阈值分割 (5) 2.1.2.迭代算法阈值分割 (6) 2.1.3.大津算法阈值分割 (6) 2.2.边缘检测原理 (6) 2.2.1.roberts算子边缘检测 (7) 2.2.2.prewitt算子边缘检测 (7) 2.2.3.sobel算子边缘检测 (7) 2.2.4.高斯laplacian算子边缘检测 (8) 2.2.5.canny算子边缘检测 (8) 3.设计方案 (9) 4.实验过程 (10) 4.1.阈值分割 (12) 4.1.1.手动(全局)阈值分割 (12) 4.1.2.迭代算法阈值分割 (12) 4.1.3.大津算法阈值分割 (12) 4.2.边缘检测 (13) 4.2.1.roberts算子边缘检测 (13) 4.2.2.prewitt算子边缘检测 (13) 4.2.3.sobel算子边缘检测 (13) 4.2.4.高斯laplacian算子边缘检测 (13) 4.2.5.canny算子边缘检测 (14) 5.试验结果及分析 (14) 5.1.实验结果 (14) 5.1.1.手动(全局)阈值分割 (14) 5.1.2.迭代算法阈值分割 (17) 5.1.3.大津算法阈值分割 (18) 5.1.4.roberts算子边缘检测 (19) 5.1.5.prewitt算子边缘检测 (20) 5.1.6.sobel算子边缘检测 (21) 5.1.7.高斯laplacian算子边缘检测 (22) 5.1.8.canny算子边缘检测 (23) 5.2. 实验结果分析和总结 (24) 参考文献 (24)

图像分割方法总结

医学图像分割理论方法概述 医学图像分割就是一个根据区域间的相似或不同把图像分割成若干区域的过程。目前,主要以各种细胞、组织与器官的图像作为处理的对象,图像分割技术主要基于以下几种理论方法。 1.基于统计学的方法 统计方法是近年来比较流行的医学图像分割方法。从统计学出发的图像分割方法把图像中各个像素点的灰度值看作是具有一定概率分布的随机变量,观察到的图像是对实际物体做了某种变换并加入噪声的结果,因而要正确分割图像,从统计学的角度来看,就是要找出以最大的概率得到该图像的物体组合。用吉布斯(Gibbs)分布表示的Markov随机场(MRF)模型,能够简单地通过势能形式表示图像像素之间的相互关系,因此周刚慧等结合人脑MR图像的空间关系定义M arkov随机场的能量形式,然后通过最大后验概率 (MAP)方法估计Markov随机场的参数,并通过迭代方法求解。层次MRF采用基于直方图的DAEM算法估计标准有限正交混合( SFNM)参数的全局最优值,并基于MRF先验参数的实际意义,采用一种近似的方法来简化这些参数的估计。林亚忠等采用的混合金字塔Gibbs随机场模型,有效地解决了传统最大后验估计计算量庞大和Gibbs随机场模型参数无监督及估计难等问题,使分割结果更为可靠。 2.基于模糊集理论的方法 医学图像一般较为复杂,有许多不确定性和不精确性,也即模糊性。所以有人将模糊理论引入到图像处理与分析中,其中包括用模糊理论来解决分割问题。基于模糊理论的图形分割方法包括模糊阈值分割方法、模糊聚类分割方法等。模糊阈值分割技术利用不同的S型隶属函数来定义模糊目标,通过优化过程最后选择一个具有最小不确定性的S函数,用该函数表示目标像素之间的关系。这种方法的难点在于隶属函数的选择。模糊C均值聚类分割方法通过优化表示图像像素点与C各类中心之间的相似性的目标函数来获得局部极大值,从而得到最优聚类。Venkateswarlu等改进计算过程,提出了一种快速的聚类算法。 2. 1 基于模糊理论的方法模糊分割技术是在模糊集合理论基础上发展起来的,它可以很好地处理MR图像内在的模糊性和不确定性,而且对噪声不敏感。模糊分割技术主要有模糊阈值、模糊聚类、模糊边缘检测等。在各种模糊分割技术中,近年来模糊聚类技术,特别是模糊C - 均值( FCM)聚类技术的应用最为广泛。FCM是一种非监督模糊聚类后的标定过程,非常适合存在不确定性和模糊性特点的MR图像。然而, FCM算法本质上是一种局部搜索寻优技术,它的迭代过程采用爬山技术来寻找最优解,因此容易陷入局部极小值,而得不到全局最优解。近年来相继出现了许多改进的FCM分割算法,其中快速模糊分割( FFCM)是最近模糊分割的研究热点。FFCM算法对传统FCM算法的初始化进行了改进,用K - 均值聚类的结果作为模糊聚类中心的初值,通过减少FCM的迭代次数来提高模糊聚类的速度。它实际上是两次寻优的迭代过程,首先由K - 均值聚类得到聚类中心的次最优解,再由FCM进行模糊聚类,最终得到图像的最优模糊分割。

PCB缺陷检测中图像分割算法的分析与比较

PCB 缺陷检测中图像分割算法的分析与比较 摘要:图像分割在图像处理中占有重要的地位,分割结果的好坏直接影响图像的后续处理。本文介绍了4种常用的图像分割方法及其在PCB 缺陷检测中的应用,并且利用实际的分割效果对4种分割方法进行了比较。对PCB 检测的实际应用提出了一种比较好的图像分割思路,并且做了实验研究。 关键词:图像处理;图像分割;PCB 检测 引言: 图像分割是图像处理中的一项关键技术,分割结果的好坏直接影响到图像的后续处理。本文中图像分割的目的是根据图像灰度等级准确划分出其中有意义的目标区域。但是由于系统在PCB 图像的采集、传输过程中,由于光照不均,CCD 摄像机自身的电子干扰,都不同程度的带来噪声,使图像污染。这些噪声也给图像分割带来了一定的难度。而传统的图像分割方法针对实际应用,本文分别采用四种公认比较好的分割方法对PCB 图像进行分割,并对分割效果进行了比较,最后确定了适合PCB 检测的图像分割方法。下面对它们进行具体说明。 1. 基于标准图像的模糊推理法 模糊理论在图像处理中的应用越来越广。在图像分割中,它可以把数据的校验用一些 模糊规则来进行描述。用基于标准图像的模糊推理法进行图像的分割主要包括以下几步[1]: (1) 计算原始图像的灰度直方图并用迭代阈值法计算它的阈值; (2) 寻找目标和背景的像素簇的峰值; (3) 计算LD(象素值低与较低之间的阈值)和LB (像素值高与较高之间的阈值); (4) 使用模糊逻辑方法(FLM-fuzzy linguistic method )来获取二值图像数据; 待处理PCB 图像的灰度直方图如图1所示 图1 像素值直方图 Fig.1 Pixel value histogram 背景和目标对象是直方图中的两个簇。这里采用迭代阈值的方法来求取待检测图像的阈值。具体过程如下[2]: 1) 求出图像中的最小和最大灰度值H min 及H max ,令阈值初始值为: T 0像素数 像素值 Dark max threshold Bright max 255 (= 1 2 (H min +H max ) (1)

图像分割---人工智能大作业

计算机科学与技术学院《高级人工智能》课程设计 学号:S314060094 专业:计算机科学与技术 学生姓名:魏嫚 任课教师:刘杰教授 2014年12月

1. 问题描述 图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。是由图像处理到图像分析的关键步骤。现有的图像分割方法主要分以下几类:基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。其中比较典型的方法是基于阈值的分割方法,在实际的应用中,阈值分割的方法也往往能取得好的分割效果,很大程度上影响着后续的图像处理和图像分析的效果,图像阈值分割是指能够找到一个能把图像分割为目标和背景的最优阈值。 图像阈值分割方法一般根据不同理论将问题转化,根据不同的理论,阈值分割一般先构造一个评价函数,然后求解关于这个函数的最优化问题,因此许多利用群体智慧的算法也被应用到了阈值分割中,例如蚁群算法,神经网络算法,遗传算法,在此我将遗传算法应用到了图像的阈值分割中。 2. 问题表示与算法描述 在算法中根据遗传算法的原理结合图像的特征,将图像中的每一个像素看作一条染色体,并对每一条染色体进行编码,然后通过交叉变异的方法找到最优解。遗传算法主要包括四个部分: 1.编码和种群的初始化,一般采用二进制的方法进行编码,种群的初始化 即是指产生一组可行解X,X是n*m大小的矩阵,n是种群的大小,m 是染色体的长度,X的每一个行向量代表一个染色体; 2.定义适值函数,选择个体。由适值函数可以计算出每个染色体(即可行解) 的适值,按一定的选择机制f对新种群中的染色体进行选择,得到进化 后的种群X′=f(X); 3.交叉变异运算,交叉运算在种群体中按照交叉率选择出父体,这些父体 两个一组,在每组染色体中随机选择一个或多个点进行基因交换,变异 运算在种群中按变异率选出染色体,在每个选出的染色体中随机选择一 个或多个点,并改变该点的基因,种群X′经过交叉变异运算得到一个 新种群X′′,X′′为n*m矩阵; 4.终止条件.将X′′的值赋给X,重复进行交叉变异运算和定义适值函数 并选择个体,直到满足一定的终止条件。 图像中的每个像素可以看作是一个染色体,对像素的灰度值进行编码后可得到染色体的基因序列。染色体应该向着适值最大的方向进化,即在进化过程中越来越适应环境,会产生一个最优的阈值,但最优阈值事先无法确定,所以染色体进化的方向也无法确定,即遗传算法无法进行。所以首先设置一个初始阈值,让个体向着这个阈值代表的方向进化,然后根据选择机制选择出来的新群体更新阈值。群体代表了图像的灰度值特征,阈值更新后应将群体复原。随着阈值的不断更新,群体的进化最后趋于稳定。当群体每次进化得到的阈值趋于稳定时,则说明该阈值是最优的阈值。下面对每一阶段做详细的介绍。 编码和种群的初始化 在文中是对灰度图像进行处理,灰度值的取值范围为0~255,故用二进制表示,染色体的长度L应该为8,染色体的值可用一个向量表示,如若一点的灰度值为255,则染色体的向量可以表示为x=[1 1 1 1 1 1 1 1]。在进行算法计算之前,先生成初始种群,随机生成种群,种群大小为n。在最开始时生成初始种群,随机生成n个染色体。 X={x(i)=round(rand(1,L))}

图像分割算法有哪些

图像分割算法有哪些 数字图像处理技术是一个跨学科的领域。随着计算机科学技术的不断发展,图像处理和分析逐渐形成了自己的科学体系,新的处理方法层出不穷,尽管其发展历史不长,但却引起各方面人士的广泛关注。首先,视觉是人类最重要的感知手段,图像又是视觉的基础,因此,数字图像成为心理学、生理学、计算机科学等诸多领域内的学者们研究视觉感知的有效工具。其次,图像处理在军事、遥感、气象等大型应用中有不断增长的需求。 图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤。现有的图像分割方法主要分以下几类:基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。1998年以来,研究人员不断改进原有的图像分割方法并把其它学科的一些新理论和新方法用于图像分割,提出了不少新的分割方法。图像分割后提取出的目标可以用于图像语义识别,图像搜索等等领域。 图像分割有哪些方法1 基于区域的图像分割 图像分割中常用的直方图门限法、区域生长法、基于图像的随机场模型法、松弛标记区域分割法等均属于基于区域的方法。 (1)直方图门限分割就是在一定的准则下,用一个或几个门限值将图像的灰度直方图(一维的或多维的)分成几个类,认为图像中灰度值在同一个灰度类内的象素属于同一个物体,可以采用的准则包括直方图的谷底、最小类内方差(或最大类间方差)、最大熵(可使用各种形式的熵)、最小错误率、矩不变、最大繁忙度(由共生矩阵定义)等。门限法的缺陷在于它仅仅考虑了图像的灰度信息,而忽略了图像中的空间信息,对于图像中不存在明显的灰度差异或各物体的灰度值范围有较大重叠的图像分割问题难以得到准确的结果。 (2)区域生长是一种古老的图像分割方法,最早的区域生长图像分割方法是由Levine等人提出的。该方法一般有两种方式,一种是先给定图像中要分割的目标物体内的一个小块

相关主题
文本预览
相关文档 最新文档