当前位置:文档之家› 基于反透视变换的图像分割方法的研究与软件实现

基于反透视变换的图像分割方法的研究与软件实现

基于反透视变换的图像分割方法的研究与软件实现
基于反透视变换的图像分割方法的研究与软件实现

摘 要

针对铁路安全监控系统中图像分割问题进行了研究及算法实现。算法主要功能是实现对铁轨图像中阻碍列车通行一定大小障碍物的准确分割。

在分析铁轨图像的采集环境及图像特征的基础上,提出了基于反透视变换的图像分割算法。算法首先运用边缘检测原理及建立铁轨模板这一先验条件找出障碍物的位置信息;接着运用反透视变换的原理消除铁轨图像所呈现的透视效果,还原其在世界坐标系中的真实性质,为图像分割提供先决判断条件;最后根据得出的位置信息及先决条件对满足大小条件的障碍物进行区域生长的分割处理并最终得到分割结果。

在算法实现的基础上,对图片样本库进行了相关测试,测试结果表明了本文工作的有效性。

关键字:反透视变换,图像分割,边缘检测

ABSTRACT

This dissertation has researched on image segmentation for monitor system of railway safety . The arithmetic mainly has realized to segmentalize roadblock that would block off the moving train.

An arithmetic for image segmentation based on inverse perspective mapping has been proposed after analysing image features and experimental conditions. Firstly the arithmetic has applied edge detection and template creation to find the position of roadblock. And then it has removed the perspective effect from the acquired image with inverse perspective mapping, and has provided preconditions. At last, it has segmentalized the roadblock blocking off the moving train with the arithmetic of region growing, according to the position of roadblock and preconditions.

This dissertation has tested the arithmetic with many different samples. Eventually, the testing result has proved the feasibility of this dissertation.

Jin Meiyu(Computer Software and Theory)

Directed by Prof. Song Yu KEY WORDS:inverse perspective mapping,image segmentation,edge detection

目录

第一章绪论 (1)

1.1课题研究的背景和意义 (1)

1.2国内外研究现状 (1)

1.2.1图像分割方法的研究现状 (1)

1.2.2反透视变换的研究现状 (3)

1.3论文要解决的问题和工作要点 (4)

1.4 论文内容安排 (4)

第二章基于反透视变换图像分割算法的设计 (6)

2.1基于反透视变换图像分割算法整体设计 (6)

2.2图像边缘检测 (7)

2.3模板生成与定位 (8)

2.4 图像特征分析 (9)

2.5反透视变换 (9)

2.6图像分割 (10)

2.7 本章小结 (12)

第三章图像边缘检测与模板生成 (13)

3.1图像边缘检测 (13)

3.1.1 一阶边缘检测算子 (13)

3.1.2 二阶边缘检测算子 (18)

3.1.3 Canny边缘检测算子 (22)

3.2 模板生成与定位 (26)

3.2.1样条曲线 (27)

3.2.2 三次B样条曲线多项式推导 (29)

3.2.3 三次样条曲线的几何问题 (30)

3.2.4 模板建立 (30)

3.2.5模板定位 (31)

3.3图像特征分析 (32)

3.4本章小结 (34)

第四章铁路图像的反透视变换 (36)

4.1铁轨图像分析 (36)

4.2坐标系关系 (36)

4.2.1 世界坐标系 (36)

4.2.2摄像机坐标系 (37)

4.2.3 图像坐标系 (38)

4.2.4图像缓存坐标系 (38)

4.2.5 坐标系之间的变换 (38)

4.3 图像的反透视变换 (40)

4.4本章小结 (45)

第五章铁轨图像的分割 (46)

5.1图像分割简介 (46)

5.2图像分割的定义 (47)

5.3图像分割方法的分类 (48)

5.3.1基于阈值选取的图像分割方法 (48)

5.3.2基于区域的图像分割方法 (51)

5.3.3 基于边缘检测的图像分割算法 (53)

5.4 图像分割算法实现 (56)

5.5 实验与分析 (59)

5.6本章小结 (60)

第六章总结与展望 (61)

6.1本文工作总结 (61)

6.2今后进一步的研究方向 (62)

致谢 (63)

参考文献 (64)

在学期间发表学术论文和参加科研情况 (67)

第一章 绪论

1.1课题研究的背景和意义

本文是以保定市天河电子技术有限公司开发的“铁路高危路段监控系统项目”为背景,以项目中数字图像处理部分的主要环节—铁轨图像的分割方法为主要研究对象。

铁路是国家的重要交通系统,是国民经济生活的命脉。随着铁路交通事业的快速发展及列车运行速度的提高,如何保证铁路沿线的路轨、路基安全也变得越来越重要。但由于铁路横跨地域广泛,线路环境复杂,所以铁路在正常运行和维护方面比其他交通系统具备更多的特殊性。铁路灾难时有发生,除了由于技术原因和社会原因造成灾难以外,灾害性天气造成的灾难也不容忽视,山体滑坡、泥石流、雪崩、洪水都可能造成线路不畅。一旦出现这些险情,如果过往列车没有得到事先预警,则后果将不堪设想。通常发生这些灾难的地区分布在无人的旷野,这也给线路维护带来极大麻烦。传统高危路段预警方式通常采用人工现场值班的方法,这种方法不仅费时费力,而且也存在一定的安全隐患。

此外铁道部为加快铁路信息化发展,提高信息化水平,制订了铁路信息化“十五”规划,确定了铁路信息化建设的目标及总体要求。运输组织、客运营销及经营管理是铁路信息化的三大领域[1]。在这三大领域中,运输组织的安全是整个信息化的关键。并且当今在交通系统中对安全的重视也提高到了日益重要的程度,在新建线路特别是客运专线已将防灾系统列入了设计规范,防灾系统将是客运专线的运营支撑系统,而不再是辅助性设备。

综上所述,铁路系统由于种种原因迫切需要开发一套用于检测铁轨线路上的异常情况的安全监控系统,使铁路安全检测人员能够通过该安全监控系统确保铁路上列车安全通行。铁路高危路段监控系统项目的开发将为中国铁路运营的安全提供一种急需的技术手段,而对铁轨图像分割问题是铁路高危路段监控系统项目首先必须解决的问题,也是最基础的研究问题。图像的分割效果直接影响到后续监控报警的准确率。因此图像分割方法的研究在此项目中具有了举足轻重的作用,这也为本论文的研究提供了有力而可靠的实践基础及意义。

1.2国内外研究现状

1.2.1图像分割方法的研究现状

在对图像进行研究和应用的时候,人们往往仅对图像中的某些部分感兴趣。这些部分常称为目标或前景(其他部分称为背景)。它们一般对应图像中特定的、具有独特性质的区域。为了辨识和分析目标,需要将它们分离提取出来,在此基础上才有可能对目标进一步利用。图象分割就是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程。这里特性可以是象素的灰度、颜色、纹理等,预先定义的目标,可以对应单个区域,也可以对应多个区域[2]。由分割产生的区域是图像内容的一种表示,它是对图像进行视觉分析和模式识别的基本前提,分割结果的质量直接影响到以后的图像分析、识别和解释的质量,因此具有重要的意义。

图像分割作为图像分析的第一步,是计算机视觉的基础,是图像理解的重要组成部分,也是图像处理、模式识别和人工智能等多个领域中一个十分重要且又十分困难的问题。图像分割的应用非常广泛,几乎出现在有关图像处理的所有领域,如:工业自动化、在线产品检验、生产过程控制、文档图像处理、图像编码、遥感和生物医学图像分析、保安监视,以及军事、体育、农业工程等方面[3]。在各种图像应用中,对图像目标进行提取、测量等都离不开图像分割。尽管人们对图像分割已进行了大量的研究,但还没有一种适合于所有图像的通用的分割算法。所以,图像分割一直以来都是图像技术中的研究热点。因此,从原理、应用和应用效果等方面来深入研究图像分割技术,对于提高图像分析和图像理解系统的性能以及提高图像处理技术的应用水平都具有十分重要的意义。

图像分割的研究最早可以追溯到20世纪60年代,经过近四十年的研究,国内外学者已经提出了上千种不同的算法,但目前还没有一种适合于所有图像的通用的分割算法,绝大多数算法都是针对具体问题而提出的。另一方面,给定一个实际应用要选择合适的分割算法仍是一个很麻烦的问题,由于缺少通用的理论指导,常常需要反复的进行实验。在已提出的这些算法中,较为经典的算法有阈值分割法、区域增长技术、基于边缘检测方法。另外20世纪80年代末期以来,在这些经典算法的基础上提出了基于小波变换的分割算法、基于数学形态学的分割算法、基于模糊数学的分割算法、基于遗传算法的分割方法、基于神经网络分割算法、基于分形的图像分割技术、基于信息论的图像分割技术等等。

尽管国内外学者对图像分割技术有了广泛的研究,但仍很难得到可靠的图像分割方法,其原因如下:1、由于光照的变化,图像中像素的亮度可能不连续;图像中物体和背景往往对比不够明显;2、每一种分割算法都是利用图像的一些特定的性质来进行分割的,适合于分割一类图像的算法不一定适合另一类图像;也可能对于同一幅图像,对于不同的区域也要用到不同的分割方法;3、现有的好多技术都不适合于实时或接近实时的处理。Hung对不同的因素给了详细的描述,正是这些因素导致了图像分割的困难。在图像分割的研究方面,虽然发表了大量的研究成果,但

目前仍旧缺乏可行的通用方法和策略。至今,已出版了大量有关图像工程(包括图像处理,图像分析,图像理解)理论研究和技术应用的专门书籍,许多书均有专门的章节论述图像分割技术。并且有关图像分割技术的综述文章也己发表了很多,它们所引用的有关图像分割研究的参考文献数以千计。国际上每年都召开许多次有关图像技术的学术会议,其中许多大会,如ICASSP,ICP,ICPR,SPIE,都有图像分割主题和分会。事实上图像分割多年来一直是图像技术中的研究热点,至今仅各种类型的分割算法就己提出了上千种,而且近年来每年都有上百篇有关研究报道发表。但据了解,至今罕有专门论述图像分割的书籍出版,目前国内有关图像分割的专著仅有清华大学章毓晋编著的《图象分割》(2001,科学出版社)一本,即使国外有关图像分割的专著也很少。其主要原因为:第一图像分割还没有建立起统一的理论,第二已提出的技术和算法种类繁多且分属不同。

1.2.2反透视变换的研究现状

在采集目标物体信息的时候,我们通常使用摄像机或照相机获取他它们的图像。通常获取的图像是一种人类视觉系统比较习惯认知的透视图,由于透视效果的存在,使得铁轨在图像的底部比较清晰、容易识别,但是在灭点附近的却难以识别,因为此时原本平行的铁轨特征已不存在。此外图像中各点所代表的实际尺寸和信息也不一致,使得远处和近处的铁轨相差很远。总的来说这对于分割及识别铁轨上一定大小的障碍物是很不利的。

而实际中人们往往希望能得到消除透视变换影响的、反映其在自然界的真实映像的判断结果。例如在本算法中需要分割出影响列车通行一定大小的障碍物,而经过透视变换的图像已经完全不能显示出算法感兴趣的部分的真实大小,为了能弥补这种不足。算法运用了反透视变换的概念,还原摄像机采集到的图像中认为可能存在障碍物部分的原始大小。若其原始大小超过阈值,就将其分割出来,作为最终的分割结果。否则认为此时的障碍物很小不会对列车通行没有影响,则不用进行图像分割操作。

反透视变换的理论在数学及图形学领域是比较成熟的理论。在应用方面它也有很广泛的领域。由美国卡内基梅隆大学机器人学院开发的RALPH系统首先对输入图像运用反透视变换原理进行了图片处理,将前视图转换为准俯视图,再确定道路的曲率,然后计算车辆偏离车道中心的距离。该系统在假设道路表面为平面的基础上,利用反透视变换的理论及跟踪道路的平行线方法,提高了对道路标识不清晰的道路识别算法的鲁棒性。随后由NavLab实验室和Vision &Autonomous Systems Center(VASC)采用两个彩色摄像机联合开发的SCARF系统中也采用了反透视变换的理论,并收到了良好的效果,在一定程度上提高了道路识别技术。在公安系统中,

办案人员经常从事故现场拍回一系列的图片,比如含有罪犯脚印或指纹的图片,通过分析来判断罪犯的年龄、性别、身高等具体特征时,失真的图像是无法获得准确信息的,所以必须使用反透视变化使图像恢复原状。在建筑学领域中,反透视变换也可用于建筑物测量等方面。

1.3论文要解决的问题和工作要点

本文以铁路高危路段监控系统项目为背景,对基于反透视变换的图像分割问题进行了研究。算法的主要功能是完整、准确的分割出铁轨图像中位于铁轨之上对列车通行造成障碍的物体,为铁路高危路段监控系统实时可靠的识别各种不同的障碍物提供准确的分割结果。本算法在开发的时候为了达到理想的分割效果,综合利用了多种图像处理方法:图像增强、图像边缘检测及图像分割等。

根据本算法的功能,其主要的工作是:

1、采用图像边缘检测的方法提取出铁轨的边缘。

2、对铁轨边缘图采用曲线拟合的方法得出铁轨模板图作为图像分割的先验条件(同

一环境只需拟合一次,以后的图片处理中将其作为已知条件使用)。

3、由铁轨边缘图与模板图对铁轨的完整性进行分析。

4、对铁轨信息不完整处进行反透视变换分析。

5、根据反透视变换的分析结果对感兴趣区域进行图像分割。

1.4 论文内容安排

本论文主要对基于反透视变换的图像分割的方法进行了研究。全文共分为六章,各章节安排如下:

第一章:绪论。首先介绍了本课题研究的背景及意义,然后分析了反透视变换及图像分割技术的研究现状,最后提出了本论文要解决的问题及工作要点。

第二章:基于反透视变换图像分割算法的设计。简述了本算法的结构、设计思路及每个模块的概要。

第三章:对图像进行边缘检测和模板生成。首先介绍了图像边缘检测的原理,然后运用此原理对图像中的铁轨进行边缘检测。最后在提取的铁轨边缘的基础上由曲线拟合生成模板,作为后续图像分割的先验条件。

第四章:铁轨信息不完整处的反透视变换。主要讲述了反透视变换的原理及如何对铁轨图像进行反透视变换操作。

第五章:铁轨图像的分割。首先介绍了图像分割的基本概念及不同分割方法的基本原理。利用第四章提供的信息对铁轨图像进行图像分割操作并得出分割结果。

第六章:结论与展望。总结了本论文所解决的问题及所做的基本工作,通过对这些内容的总结提出了本文继续研究的方向。

第二章 基于反透视变换图像分割算法的设计

2.1基于反透视变换图像分割算法整体设计

基于反透视变换图像分割算法的主要功能是能准确完整的分割出在铁轨上对列车通行造成影响的障碍物。此算法所处理的对象是由摄像机定点拍摄所采集的静态图片。由于是定点拍摄,因此铁轨在图像中的位置是基本没有变化的,这为本算法提供了一定的有利条件。摄像机在安装时为了能更大范围采集到图像必须具有一定的高度及角度,此采集图片的过程经过了透视变换,即将三维世界中的物体转换到二维图像中。透视变换的存在使得铁轨在图片中失去了原有的平行关系,并且在图片中所表现出来的铁轨大小也与其距离摄像机的距离有着密切的关系。这给分割不同位置一定大小的障碍物带来了困难。

为了利用上述有利条件并克服不利条件,本文设计了基于反透视变换的图像分割的算法。算法首先充分利用铁轨在图像中的位置基本不变化的性质,通过人工标定铁轨位置之后由曲线拟合生成铁轨模板(即描述铁轨的位置信息),为后续的图像分割提供先验条件。其次运用图像边缘检测的原理对铁轨图像进行铁轨边缘提取,并运用铁轨边缘图与铁轨模板分析当前图片中铁轨的完整性。如果发现铁轨不完整(即存在缺口),则对缺口处进行反透视变换分析,还原了缺口在世界坐标系中的真实性质(即得出缺口在世界坐标系中的真实大小)。当判断此缺口的真实大小大于等于一定阈值时,算法就认为当前造成此缺口的物体很有可能就是障碍物,则在此缺口处进行图像分割操作并得出分割结果。当判断此缺口的真实大小小于一定阈值时则认为当前造成此缺口的物体不会影响到列车通行,因此不需要对其进行图像分割操作。这样做的目的是提高算法的运算速度,满足其实时性的要求。本算法在实现时需要首先生成铁轨模板图作为图像分割的先验条件,此步骤可以独立于本算法之外,但是是一个必要且重要的环节。图2.1及图2.2分别用结构示意图来描述铁轨模板生成过程及基于反透视变换图像分割算法过程。

图2.1 铁轨模板生成结构示意图

图2.2 基于反透视变换图像分割算法结构示意图

2.2图像边缘检测

图像边缘是图像的最基本的形状特征。形状特征提取通过边缘检测获取图像的形状,边缘一般是指周围像素灰度强度有反差变化的那些像素的集合[5]。例如:灰度级的突变,颜色的突变,纹理结构的突变等。边缘广泛的存在于目标与目标、物体与背景、区域与区域(含不同的颜色)之间,它是图像识别的重要特征。一般来说,图像的边缘检测需要如下几个步骤:

滤波:边缘检测算法主要是基于图像灰度的一阶和二阶微分,但是微分的计算对噪声很敏感,因此必须使用滤波器来降低噪声,特别需要指出,大多数滤波器在降低噪声的同时也导致了边缘强度的损失[6~8],因此,在增强边缘和降低噪声之间需要兼顾。

增强:增强边缘的基础是确定图像各点邻域强度的变化值。增强算法可以将邻域(或者局部)强度值有显著变化点突显出来,边缘增强一般是通过计算灰度的一阶和二阶微分来完成的[9]。

检测:在图像中有许多点的微分幅值比较大,而这些点在特定的应用领域中并不是边缘,所以应该用某种方法来确定哪些点是边缘点,哪些点不是边缘点,最简单的边缘检测方法是对微分幅值进行阈值判断[10]。

定位:如果某一场合要求确定边缘位置,则边缘的位置可以在子像素分辨率上来估计,边缘的方向也可以被估计出来。

在边缘检测算法中,前3个步骤是用得十分普遍的。这是因为在大多数场合下,仅仅靠边缘检测器指出边缘的位置出现在图像某一像素点的附近,而没有必要指出边缘的精确位置或方向。边缘检测误差通常是指边缘误分类误差,即把非边缘判别成边缘而保留,而把边缘判别成非边缘而去掉。

常见的一阶微分算子有Roberts、Sobel、和Prewitt算子等[11],其边缘检测的原理是:由于微分算子具有突出灰度变化的作用,对图像进行微分运算,在图像边缘处其灰度变化比较大,故该出微分计算值比较高,可将这些微分值作为相应点的边

缘强度,通过阈值判别来提取边缘点。在二维空间中,对应的二阶导数有2种算子:拉普拉斯算子和二阶方向导数,二阶导数算子在实际中很少单独使用,因为任何包含有二阶导数的算子比只包含有一阶导数的算子更容易受到噪声的影响,甚至一阶导数很小的局部峰值也可能导致二阶导数过零点,为了避免噪声的影响,在使用二阶导数算子进行边缘检测前,必须采用特别有效的滤波方法来进行去噪,一般采用高斯滤波[12]的方法。

那么什么是既能滤去噪声又能保持边缘特性的边缘检测最优滤波器呢?不少研究者从一定的边缘模型及噪声模型出发,提出了边缘抽取的最优滤波器,这些研究者都采用最简单的阶跃边缘与可加性的白噪声模型[13]。在这些模型假设下,Canny 首次提出了用于边缘检测的一阶微分滤波器的3条最优化准则,即最大信号噪声比准则、最优过零点定位准则与多峰值响应准则[14],并用变分原理推出最优化滤波器函数形式应近似为高斯函数的一阶微分,因此采用Canny算子进行边缘检测有很大的优势,其具体细节见后面章节。

2.3模板生成与定位

本算法主要是为了分割出在铁轨上对列车通行造成影响的障碍物,其研究的对象很明确,即图像中铁轨位置处。铁轨是具有很明显几何特征的物体(两条铁轨始终相互平行),且其位置是固定不变的,当摄像机及采集设备固定的情况下,铁轨在图像中的位置是几乎没有变化的。因此在算法中可以加以利用铁轨位置不变这个先验条件。算法中仅需要在图像固定像素位置处(即固定铁轨处)查看是否有异常信息出现,即可判断出是否存在拟障碍物。这里所说的模板就是指铁轨的边缘信息,如图2.3所示。

(a)铁轨原图(b)铁轨的模板图

图2.3 铁轨模板示意图

铁轨模板图的生成采用了曲线拟合的方法。曲线拟合就是利用假想为曲线(或接近它们)的一组离散的点集合,寻找形式比较简单、性能良好的曲线解析式。曲线拟合有两种方式:插值方式与逼近方式。插值方式通过原先给定的离散点,而逼近方式与所给的离散点相当“接近”。

曲线拟合的最终目的是使得这些离散点能够达到最佳拟合。所谓的最佳拟合现在有很多不同的方法定义,并且存在无群数目的曲线。但证实是否是最佳拟合只有一个原则,即所有离散点与拟合曲线相对应点之间的距离求平方和,称作为误差平方和。当误差平方和最小的时候,即为最佳拟合曲线。

在实际的工作环境中,由于大风或者火车产生的振动会使镜头产生小范围的晃动,其成像就会产生铁轨位置的偏移,但是其基本的几何信息还是不变的,产生变化的只是这个几何信息在图像中的位置(即偏移几个像素),因此,可以设计算法对原模版进行定位,这样就可以利用先验知识更加准确和稳定地算出铁轨的位置,为后面的图像特征分析提供更好的依据。

2.4 图像特征分析

图像特征分析的主要功能是根据铁轨的边缘图与重新定位的铁轨模板图,判断出铁轨信息的完整性。如果铁轨边缘图中模板位置相对应的像素均存在边缘信息,则认为铁轨信息是完整的,即此时不存在障碍物。否则认为铁轨信息不完整的地方有可能存在障碍物。

在图像特征分析时,主要应用了铁轨的边缘图与重新定位的铁轨模板图的信息。二者是上述边缘检测及模板建立的最终结果,其表现形式是与原图同样大小的图片,图片中仅用黑色(值为0)与白色(值为255)的像素表示(黑色表示边缘及模板信息,其余像素均用白色表示)。图像特征分析就是将二者做相与操作,由此查看铁轨边缘图中的铁轨信息是否完整,如完整则意味着当前铁轨上没有物体影响列车通行,否则意味着可能存在影响列车通行的障碍物,并分析有几段不完整的信息(即可能存在几个障碍物),将其结果(缺口信息)以图像的形式表示出。

2.5反透视变换

本算法中所需处理的图片是由摄像机采集到的,其表现形式是一种人类视觉系统比较习惯于认知的透视图。由于透视效果的存在,使得图像中铁轨在近端表现的比较清晰,分辨率相对比较高;而在远端则表现的比较模糊,分辨率相对比较低。

表现出来的效果是近端与远端铁轨的宽度等性质相差甚远。这对于计算机识别出一定大小的障碍物是很不利的。

受到基于单目视觉的投影分析方法的启发,本文综合了反透视投影变换的方法来研究铁轨图像的分割。该方法通过对铁轨信息不完整处进行反透视变换的分析,重现铁轨缺口在世界坐标系中真实大小。并根据其大小确定后续的图像分割操作,最终分割出在铁轨上影响列车通行的一定大小的障碍物。反透视变换一般需要考虑以下几个方面:

摄像机的参数:摄像机的安装及摄像机焦距、分辨率、视角范围等参数都直接影响到世界坐标系中的物体在图像中的位置。为了能使得图像中的物体消除透视变换的影响,准确的反映相互之间的位置关系,必须要严格测量得知摄像机的参数。

坐标系之间的转换:反透视变换的作用是将二维的图片坐标系中的物体还原到三维世界坐标系中。在此转换过程中,像素点的形成要经过四个坐标系之间的转换。因此必须准确了解四个坐标系之间的转换,但首要的任务是正确的建立他们。

二维坐标系与三维坐标系之间的对应关系。通过对摄像机参数的获得及各个坐标系之间的转换我们可以得到二维坐标系与三维坐标系之间的对应关系式,由这个关系式可以很清楚的找到彼此的点,从而达到反透视变换的最终目的。

反透视变换的结果。经过反透视变化可以清楚的得知原图中每个象素在世界坐标系中的具体位置,同理可以得出铁轨缺口在世界坐标系中的位置,继而能得知铁轨缺口的真实大小。而本算法中运用反透视变换的作用就是需要知道铁轨缺口的真实大小从而为后续图像分割提供可靠的判断条件,这样就避免了不必要的分割操作,在很大程度上提高了算法的速度,满足其实时性的要求。

2.6图像分割

图像分割是一种重要的图象分析技术。在对图像的研究和应用中,人们往往仅对图像中的某些部分感兴趣。这些部分常称为目标或前景(其他部分称为背景),它们一般对应图像中特定的、具有独特性质的区域。为了辨识和分析图像中的目标,需要将它们从图像中分离提取出来,在此基础上才有可能进一步对目标进行测量和对图像进行利用。图象分割就是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程。

铁轨上存在障碍物类型有很多种,不同类型的障碍物会对铁轨造成不同的影响,因此后续的识别算法需要将其准确识别进行分类处理。这就对前序图像分割操作提出了要求,必须将可能有影响的障碍物完整准确的分割出来。前述边缘检测及

反透视变换的操作为是否需要进行图像分割提供了一个可靠的条件。当前述判断当前缺口信息超过一定大小时就在缺口处进行图像分割得出障碍物,否则认为不存在障碍物即没有分割结果。

数字图像处理技术发展了几十年,技术相对来说比较成熟,图像分割是数字图像处理中较为基础的处理方法之一。图像分割是由图像处理进到图像分析的关键步骤,也是一种基本的计算机视觉技术。这是因为图像的分割、目标的分离、特征的提取和参数的测量将原始图像转化为更抽象更紧凑的形式,使得更高层的分析和理解成为可能。图像分割的分类方式有很多种,在本文中将图像分割方式从基于阈值的图像分割、基于区域的图像分割及基于边缘检测的图像分割方法三种方式来介绍。

本算法中采用了基于区域的图像分割方法中区域生长法来对图像进行分割。基于区域的分割方法是依赖于图像的空间局部特征,如灰度、纹理以及其他像素统计特性的均匀性等对图像进行分割的。典型的基于区域的分割方法有区域生长法、分裂—合并法等。区域生长的基本思想是将具有相似性质的像素集合起来构成区域。具体实现是对每个分割的区域找个种子像素作为生长的起点,根据某种实现确定的生长或相似准则,在种子像素周围领域中寻找与种子像素有相同或相似性质的像素,并将这些像素合并到种子像素点所在的区域中。将这些新像素当作新的种子像素进行上述的过程,知道再没有满足条件的像素可被包括进来,这样一个区域就长成了。

在实际应用区域生长法时需要解决三个问题:

1、选择或确定一组能正确代表所需区域的种子像素。种子像素的选取常可借助具体问题的特点来选取。如果对具体问题没有先验知识,则可以借助生长准则对每个像素进行相应计算。如果计算结果呈现聚类的情况则接近聚类重心的像素可选取为种子点。

2、确定在生长过程中能将相邻像素包括进来的准则。生长准则的选取不仅依赖于具体问题本身,也和所用图像数据的种类有关。另外还需要考虑像素间的连通性和邻近性,否则有时会出现无意义的分割结果。

3、制定让生长停止的条件或准则。一般生长过程在进行到没有满足生长准则需要的像素时停止。但常用的基于灰度、纹理、彩色的准则大都基于图像中的局部性质,并没有充分考虑生长的“历史”。为增加区域生长的能力常需要考虑一些与尺寸、形状等图像全局性质有关的准则。在这种情况下常需要对分割建立一定的模型。

2.7 本章小结

本章主要是对基于反透视变换的图像分割整个算法的综述及各模块的介绍。首先通过对铁轨图像特征的分析介绍了算法的整体设计及结构。其次对各个模块进行了功能阐述,通过对各模块采用的图像处理技术的可行性分析,确定各个子模块所采用的理论依据。

第三章 图像边缘检测与模板生成

3.1图像边缘检测

图像边缘是图像特征之一,它蕴含了图像丰富的内在信息(如方向,阶越性质与形状等)。图像边缘往往是由图像中景物的物理特性发生变换而引起的,如物体的成像亮度(阴影等)、几何特性(方向和深度等)以及反射系数,它广泛存在与物体与背景之间、物体与物体之间和区域与区域之间。图像边缘和图像内容的物理特性之间存在着直接的联系,因此图像的边缘包括了图像大部分的信息。

边缘是指图像灰度(亮度)发生空间突变或者在梯度方向上发生突变的像素集合。常见的图像边缘大体可以划分为阶梯状边缘、脉冲状边缘及屋顶状边缘,其中,阶梯状边缘两边的灰度值有明显的变化,处于图像中两个具有不同灰度值的相邻区域之间;脉冲状主要对用细条状的灰度值突变区域;而屋顶状边缘在灰度增加和减小的交界处,其边缘上升下降沿都比较缓慢。在数学上可以利用其灰度变化曲线的一阶、二阶倒数来描述两种不同的边缘,同样也可以用这种性质来检测图像的边缘信息。图3.1中分别给出了上述三种边缘的示意图、剖面图、一阶导数及二阶导数的变换规律。

图3.1 边缘及导数示意图

3.1.1 一阶边缘检测算子

一幅数字图象的一阶导数是基于各种二维梯度的近似值。图像f(x,y)在位

置(x ,y )的梯度可定义为下列向量(两个分量分别是沿X 和Y 方向的一阶导数): (,)x y f G x f x y f G y ???

???????==????????????

(3-1) 从向量分析中,梯度向量指向坐标(x , y )的f 的最大变化方向。梯度有幅值及方向两个属性,(,)f x y 的幅值为

12

22|(,)|[]x y

f f x y G G ?==+,或 |(,)|||||x y f f x y G G ?==+ (3-2) 梯度的方向是函数(,)f x y 增加最快的方向,定义为

)arctan(),(x y

G G y x a = (3-3)

在这里,角度是以x 轴为基准度量的。一般常用的一阶微分算子有如下几种:

3.1.1.1差分边缘检测方法

差分边缘检测方法是最原始、经典的边缘检测方法,它根据图像像素灰度变化的一阶导数是否处于极值(阶梯状边缘)的原理进行奇异点检测。差分边缘检测方法可以通过对像素点边缘强度设定阈值进一步得到边缘图像,阈值的选取决定了边缘检测的效果。差分边缘检测方法要求差分的方向要和边缘方向正交,如果要精确检测边缘,需要对图像的不同方向都进行差分运算,显然这会带来繁琐的运算,因此差分边缘检测方法已经很少被采用。常见的垂直边缘、水平边缘和对角边缘的方向模板为图3.2所示。

000110000???????????

010010000???????????100010000???????????001010000?????????

图3.2 方向模板示意图

3.1.1.2 Roberts 边缘检测算子

任意一对互相垂直方向上的差分可以堪称求梯度的近似方法,

Roberts 边缘检测

图像分割算法的比较与分析

中北大学 课程设计说明书 学生姓名:学号: 学生姓名:学号: 学生姓名:学号: 学生姓名:学号: 学院:信息与通信工程学院 专业:电子信息工程 题目:信息处理综合实践: 图像分割算法的比较与分析 指导教师:陈平职称: 副教授 2014 年12 月29 日

中北大学 课程设计任务书 14/15 学年第一学期 学院:信息与通信工程学院专业:电子信息工程 学生姓名:学号: 课程设计题目:信息处理综合实践: 图像分割算法的比较与分析起迄日期:2015年1月5日~2015年1月16日课程设计地点:电子信息工程专业实验室 指导教师:陈平 系主任:王浩全 下达任务书日期: 2014 年12月29 日课程设计任务书

课程设计任务书

目录 第一章绪论 (1) 研究目的和意义 (1) 图像分割的研究进展 (1) 第二章区域生长法分割图像 (4) 区域生长法介绍 (4) 区域生长法的原理 (4) 区域生长法的实现过程 (5) 第三章程序及结果 (6) 区域生长算法及程序 (6) 图像分割结果 (7) 第四章方法比较 (8) 阈值法 (8) 区域法 (8) 分水岭法 (8) 形态学方法 (9) 第五章总结 (10) 参考文献 (11)

第一章绪论 研究目的和意义 图像分割是一种重要的图像技术,在理论研究和实际应用中都得到了人们的广泛重视。图像分割的方法和种类有很多,有些分割运算可直接应用于任何图像,而另一些只能适用于特殊类别的图像。许多不同种类的图像或景物都可作为待分割的图像数据,不同类型的图像,已经有相对应的分割方法对其分割;但某些分割方法只是适合于某些特殊类型的图像分割,所以分割结果的好坏需要根据具体的场合及要求衡量。图像分割是从图像处理到图像分析的关键步骤,可以说,图像分割结果的好坏直接影响对图像的理解。 图像分割是由图像处理到图像分析的关键步骤,在图像工程中占有重要位置。一方面,它是目标表达的基础,对特征测量有重要的影响。另一方面,因为图像分割及其基于分割的目标表达、特征提取和参数测量等将原始图像转化为更抽象、更紧凑的表达形式,使得更高层的图像分析和理解成为可能。因此在实际应用中,图像分割不仅仅要把一幅图像分成满足上面五个条件的各具特性的区域,而且要把其中感兴趣的目标区域提取出来。只有这样才算真正完成了图像分割的任务,为下一步的图像分析做好准备,使更高层的图像分析和理解成为可能。 图像分割在很多方面,如医学图像分析,交通监控等,都有着非常广泛的应用,具有重要的意义。(1)分割的结果常用于图像分析,如不同形式图像的配准与融合,结构的测量,图像重建以及运动跟踪等。(2)在系统仿真,效果评估,图像的3D重建以及三维定位等可视化系统中,图像分割都是预处理的重要步骤。 (3)图像分割可在不丢失有用信息的前提下进行数据压缩,这就降低了传输的带宽,对提高图像在因特网上的传输速度至关重要。(4)分割后的图像与噪声的关系减弱,具有降噪功能,便于图像的理解。 图像分割的研究进展 图像分割是图像处理中的一项关键技术,至今已提出上千种分割算法。但因

关于图像分割算法的研究

关于图像分割算法的研究 黄斌 (福州大学物理与信息工程学院 福州 350001) 摘要:图像分割是图像处理中的一个重要问题,也是一个经典难题。因此对于图像分割的研究在过去的四十多年里一直受到人们广泛的重视,也提山了数以千计的不同算法。虽然这些算法大都在不同程度上取得了一定的成功,但是图像分割问题还远远没有解决。本文从图像分割的定义、应用等研究背景入手,深入介绍了目前各种经典的图像分割算法,并在此基础比较了各种算法的优缺点,总结了当前图像分割技术中所面临的挑战,最后展望了其未来值得努力的研究方向。 关键词:图像分割 阀值分割 边缘分割 区域分割 一、 引言 图像分割是图像从处理到分析的转变关键,也是一种基本的计算机视觉技术。通过图像的分割、目标的分离、特征的提取和参数的测量将原始图像转化为更抽象更紧凑的形式,使得更高层的分析和理解成为可能,因此它被称为连接低级视觉和高级视觉的桥梁和纽带。所谓图像分割就是要将图像表示为物理上有意义的连通区域的集合,也就是根据目标与背景的先验知识,对图像中的目标、背景进行标记、定位,然后将目标从背景或其它伪目标中分离出来[1]。 图像分割可以形式化定义如下[2]:令有序集合表示图像区域(像素点集),H 表示为具有相同性质的谓词,图像分割是把I 分割成为n 个区域记为Ri ,i=1,2,…,n ,满足: (1) 1,,,,n i i j i R I R R i j i j ===??≠ (2) (),1,2,,i i i n H R True ?== (3) () ,,,i j i j i j H R R False ?≠= 条件(1)表明分割区域要覆盖整个图像且各区域互不重叠,条件(2)表明每个区域都具有相同性质,条件(3)表明相邻的两个区域性质相异不能合并成一个区域。 自上世纪70年代起,图像分割一直受到人们的高度重视,其应用领域非常广泛,几乎出现在有关图像处理的所有领域,并涉及各种类型的图像。主要表现在: 1)医学影像分析:通过图像分割将医学图像中的不同组织分成不同的区域,以便更好的

遥感影像的分类处理

摘要 在面向对象的影像分类方法中,首先需要将遥感影像分割成有意义的影像对象集合,进而在影像对象的基础上进行特征提取和分类。本文针对面向对象影像分类思想的关键环节展开讨论和研究,(1) 采用基于改进分水岭变换的多尺度分割算法对高分辨率遥感影像进行分割。构建了基于高斯尺度金字塔的多尺度视觉单词,并且通过实验证明其表达能力优于经典的词包表示。最后,在词包表示的基础上,利用概率潜在语义分析方法对同义词和多义词较强的鉴别能力对影像对象进行分析,找出其最可能属于的主题或类别,进而完成影像的分类。 近些年来,随着航空航天平台与传感器技术的高速发展,获取的遥感影像的分辨率越来越高。高分辨率遥感影像在各行业部门的应用也越来越广泛,除了传统的国土资源、地质调查和测绘测量等部门,还涉及到城市规划、交通旅游和环境生态等领域,极大地拓展了遥感影像的应用范围。因此,对高分辨率遥感影像的处理分析成为备受关注的领域之一。高分辨率遥感影像包括以下三种形式:高空间分辨率(获取影像的空间分辨率从以前的几十米提高到1 至5 米,甚至更高);高光谱分辨率(电磁波谱被不断细分,获取遥感数据的波段数从几十个到数百个);高时间分辨率(遥感卫星的回访周期不断缩短,在部分区域甚至可以连续观测)。本文所要研究的高分辨率遥感影像均是指“高空间分辨率”影像。 相对于中低分辨率的遥感数据,高空间分辨率遥感影像具有更加丰富的空间结构、几何纹理及拓扑关系等信息,对认知地物目标的属性特征更加方便,如光谱、形状、纹理、结构和层次等。另外,高分辨率遥感影像有效减弱了混合像元的影响,并且能够在较小的空间尺度下反映地物特征的细节变化,为实现更高精度的地物识别和分类提供了可能。 然而,传统的遥感影像分析方法主要基于“像元”进行,它处于图像工程中的“图像处理”阶段(见图1-1),已然不能满足当今遥感数据发展的需求。基于“像元”的高分辨率遥感影像分类更多地依赖光谱特征,而忽视影像的纹理、形状、上下文和结构等重要的空间特征,因此,分类结果会产生很严重的“椒盐(salt and pepper)现象”,从而影响到分类的精度。虽然国内外的很多研究人员针对以上缺陷提出了很多新的方法,如支持向量机(Support Vector Machine,SVM) 、纹理聚类、分层聚类(Hierarchical Clustering) 、神经网络(Neural Network, NN)等,但仅依靠光谱特征的基于像元的方法很难取得更好的分类结果。基于“像元”的传统分类方法还有着另一个局限:无法很好的描述和应用地物目标的尺度特征,而多尺度特征正是遥感信息的基本属性之一。由于在不同的空间尺度上,同样的地表空间格局与过程会表现出明显的差异,因此,在单一尺度下对遥感影像进行分析和识别是不全面的。为了得到更好的分类结果,需要充分考虑多尺度特征。 针对以上问题,面向对象的处理方法应运而生,并且逐渐成为高空间分辨率遥感影像分析和识别的新途径。所谓“面向对象”,即影像分析的最小单元不再是传统的单个像元,而是由特定像元组成的有意义的同质区域,也即“对象”;因此,在对影像分析和识别的过程

图像分割方法的比较研究

图像分割方法的比较研究 在计算机视觉的相关研究中,图像分割是连接低级视觉和高级视觉的桥梁和纽带,而图像分割是计算机视觉系统中最关键和重要的一个环节。在概要介绍几种常用图像分割方法的基础上,比较了每种图像分割算法的优缺点及其适应范围,结果表明:不同工程应用中,应根据其需求与图像特点合理采用不同的图像分割方法以达到更好的处理效果。 标签:图象分割;图象处理 1 引言 近年来,随着工业、农业、医学、军事等领域自动化和智能化需求的迅速发展,对图像处理技术的要求也日益提高。其中,对图像的自动识别与理解就是一项重要任务,而对图像进行分割来提取目标是其关键步骤之一,如果得不到合理的图像分割图,也就无法对图像进行正确的识别与理解。在过去的四十多年里,图像分割的研究一直受到人们高度的重视。迄今为止,研究者提出了上千种不同类型的分割算法,而且近年来每年都有上百篇相关研究成果发表。但是,现有的方法多是为特定应用设计的,有很大的针对性和局限性,对图像分割的研究还缺乏一个统一的理论体系。Fu和Mui从细胞学图像处理的角度将图像分割技术分为三大类:特征阈值或聚类、边缘检测和区域提取。依据算法所使用的技术或针对的图像,Pal and Pal把图像分割算法分成了6类:阈值分割、像素分割、深度图像分割、彩色图像分割、边缘检测和基于模糊集的方法。本文将依据上述两种分类方法进行深入研究。 2 图象分割方法 简而言之,图像分割(Image Segmentation)就是把图像中的物体与背景或物体与物体分割开,实现不同区域的特殊处理。 2.1 基于阈值的分割方法 这类方法简单实用,在过去的几十年间备受重视,其分类也不一而足。根据使用的是图像的整体信息还是局部信息,可以分为上下文相关方法和上下文无关方法;根据对全图使用统一阈值还是对不同区域使用不同阈值,可以分为全局阈值方法和局部阈值方法;另外,还可以分为单阈值方(bileverthresholding)和多阈值方法。 阈值分割的核心问题是如何选择合适的阈值。其中,最简单和常用的方法是从图像的灰度直方图出发,先得到各个灰度级的概率分布密度,再依据某一准则选取一个或多个合适的阈值,以确定每个像素点的归属。选择的准则不同,得到的阈值化算法就不同。 下面就常见的几种阈值分割算法进行比较:

图像分割方法总结

医学图像分割理论方法概述 医学图像分割就是一个根据区域间的相似或不同把图像分割成若干区域的过程。目前,主要以各种细胞、组织与器官的图像作为处理的对象,图像分割技术主要基于以下几种理论方法。 1.基于统计学的方法 统计方法是近年来比较流行的医学图像分割方法。从统计学出发的图像分割方法把图像中各个像素点的灰度值看作是具有一定概率分布的随机变量,观察到的图像是对实际物体做了某种变换并加入噪声的结果,因而要正确分割图像,从统计学的角度来看,就是要找出以最大的概率得到该图像的物体组合。用吉布斯(Gibbs)分布表示的Markov随机场(MRF)模型,能够简单地通过势能形式表示图像像素之间的相互关系,因此周刚慧等结合人脑MR图像的空间关系定义M arkov随机场的能量形式,然后通过最大后验概率 (MAP)方法估计Markov随机场的参数,并通过迭代方法求解。层次MRF采用基于直方图的DAEM算法估计标准有限正交混合( SFNM)参数的全局最优值,并基于MRF先验参数的实际意义,采用一种近似的方法来简化这些参数的估计。林亚忠等采用的混合金字塔Gibbs随机场模型,有效地解决了传统最大后验估计计算量庞大和Gibbs随机场模型参数无监督及估计难等问题,使分割结果更为可靠。 2.基于模糊集理论的方法 医学图像一般较为复杂,有许多不确定性和不精确性,也即模糊性。所以有人将模糊理论引入到图像处理与分析中,其中包括用模糊理论来解决分割问题。基于模糊理论的图形分割方法包括模糊阈值分割方法、模糊聚类分割方法等。模糊阈值分割技术利用不同的S型隶属函数来定义模糊目标,通过优化过程最后选择一个具有最小不确定性的S函数,用该函数表示目标像素之间的关系。这种方法的难点在于隶属函数的选择。模糊C均值聚类分割方法通过优化表示图像像素点与C各类中心之间的相似性的目标函数来获得局部极大值,从而得到最优聚类。Venkateswarlu等改进计算过程,提出了一种快速的聚类算法。 2. 1 基于模糊理论的方法模糊分割技术是在模糊集合理论基础上发展起来的,它可以很好地处理MR图像内在的模糊性和不确定性,而且对噪声不敏感。模糊分割技术主要有模糊阈值、模糊聚类、模糊边缘检测等。在各种模糊分割技术中,近年来模糊聚类技术,特别是模糊C - 均值( FCM)聚类技术的应用最为广泛。FCM是一种非监督模糊聚类后的标定过程,非常适合存在不确定性和模糊性特点的MR图像。然而, FCM算法本质上是一种局部搜索寻优技术,它的迭代过程采用爬山技术来寻找最优解,因此容易陷入局部极小值,而得不到全局最优解。近年来相继出现了许多改进的FCM分割算法,其中快速模糊分割( FFCM)是最近模糊分割的研究热点。FFCM算法对传统FCM算法的初始化进行了改进,用K - 均值聚类的结果作为模糊聚类中心的初值,通过减少FCM的迭代次数来提高模糊聚类的速度。它实际上是两次寻优的迭代过程,首先由K - 均值聚类得到聚类中心的次最优解,再由FCM进行模糊聚类,最终得到图像的最优模糊分割。

高空间分辨率遥感影像分割方法研究综述

高空间分辨率遥感影像分割方法研究综述 高空间分辨率遥感影像分割方法研究综述 刘建华毛政元 (福州大学,空间数据挖掘与信息共享教育部重点实验室,福建省空间信息工程研究中心,福州350002) 摘要:遥感影像分割是指把一幅影像划分为互不重叠的一组区域的过程,它要求得到的每个区域的内部具有某种一致性或相似性,而任意两个相邻的区域则不具有此种相似性。遥感影像分割是面向对象的遥感影像数据挖掘与应用中的一项关键技术,对于影像目标信息自动化提取与智能识别尤为重要,在面向对象的遥感影像处理工程中具有重要意义。本文对常见的高空间分辨率遥感影像分割方法与应用策略进行了分析,比较了各种分割方法的应用范围、优缺点及目前存在的改进措施。建立了面向对象的遥感影像分割方法的分类体系,最后指出了面向对象的遥感影像分割方法目前所存在的问题及应用前景。 关键词:高空间分辨率遥感影像影像分割方法应用策略进展 A Survey on High Spatial Resolution Remotely Sensed Imagery Segmentation Techniques and Application Strategy Liu Jian hua Mao zheng yuan (Fuzhou University, Spatial Information Research center, Fuzhou, 350002) Abstract: Remotely sensed imagery segmentation is a process of dividing an image into different regions such that each region is, but the union of any two adjacent regions is not, homogeneous. It is one of key techniques in the object-oriented remotely sensed imagery data mining and its application, also quite essential in remote sensing image processing engineering. In this paper, we have a rough survey on different methods of high spatial resolution remotely sensed imagery segmentation, categorizing them into four groups according to the gray or color information they are exploiting. The disadvantage of current methods and the proper progress which can be attained in the near future are pointed out at the end of this essay. Keywords: High Spatial Resolution Imagery, Segmentation methods, application strategy, advances and prospects 1 引言 高空间分辨率遥感影像(如GeoEye、WorldView、QuickBird、IKONOS等,本文简称高分影像)在诸多领域(地形图更新、地籍调查、城市规划、交通及道路设施、环境评价、精细农业、林业测量、军事目标识别和灾害评估等)得以广泛应用[1]。目前,影像信息提取自动化程度低是高分影像应用潜力得不到充分发挥的主要限制因素,是理论和应用研究中必须突破的瓶颈。 遥感影像分割是面向对象的遥感影像分析方法[2]的基础和关键,在遥感影像工程中处于影像处理与影像理解的中间环节,是面向对象的影像分析理论研究的突破口。按照一般的影像分割定义[3],分割出的影像对象区域需同时满足相似性和不连续性两个基本特性;其中相似性指该影像对象内的所有像元点都满足基于灰度、色彩、纹理等特征的某种相似性准则,不连续性是指影像对象的特征在区域边界处的不连续性。迄今为止,将计算机视觉领域的图像分割算法应用于图像分割过程中,已开展了较多的研究[4-7],并提出了大量的算法;但针对遥感影像尤其是高分影像的分割方法较少[8],仍不成熟。这是由于与其它类型图像的分割相比,高分影像分割难度更大,也更具挑战性。具体体现在高分影像其空间分辨率高、纹理信息丰富而光 基金项目: 国家重点基础研究发展计划项目(973)子课题“高空间分辨率遥感影像自适应数据挖掘方法研[2006CB708306]”,国家自然科学基金项目“基于场模型的自适应空间聚类方法研究[40871206]”。 作者简介: 刘建华,男,博士研究生,曾从事GIS与RS教学工作。目前主要研究方向为空间数据挖掘、遥感图像处理以及GIS与RS集成等。E-mail:sirc.liujh@https://www.doczj.com/doc/0912331884.html,。

图像分割技术的研究背景及意义

图像分割技术的研究背景及意义 1概述 2图像分割技术的研究背景及意义 2.1阈值分割方法 2.2基于边缘的分割方法 2.3基于区域的分割方法 2.4 结合特定理论工具的分割方法 1概述 图像的研究和应用中,人们往往对图像中的某些部分感兴趣,这些感兴趣的部分一般对应图像中特定的、具有特殊性质的区域(可以对应单一区域,也可以对应多个区域),称之为目标或前景;而其他部分称为图像的背景。为了辨识和分析目标,需要把目标从一幅图像中孤立出来,这就是图像分割要研究的问题。 2图像分割技术的研究背景及意义 图像分割是图像处理中的一项关键技术,也是一经典难题,发展至今仍没有找到一个通用的方法,也没有制定出判断分割算法好坏的标准,对近几年来出现的图像分割方法作了较为全面的综述,探讨了图像分割技术的发展方向,对从事图像处理研究的科研人员具有一定的启发作用。 图像分割是图像分析的第一步,图像分割接下来的任务,如特征提取、目标识别等的好坏,都取决于图像分割的质量如何。由于该课题的难度和深度,进展比较缓慢。图像分割技术自20世纪70年代起一直受到人们的高度重视,虽然研究人员针对各种问题提出了许多方法,但迄今为止仍然不存在一个普遍适用的理论和方法。另外,还没有制定出选择适用分割算法的标准,这给图像分割技术的应用带来许多实际问题。最近几年又出现了许多新思路、新方法或改进算法,对一些经典方法和新出现的方法作了概述,并将图像分割方法分为阈值分割方法、边缘检测方法、区域提取方法和结合特定理论工具的分割方法4类。

2.1阈值分割方法 阈值分割方法的历史可追溯到近40前,现已提出了大量算法。阈值分割法就是简单的用一个或几个阈值将图像的直方图分成几类,图象中灰度值在同一个灰度类内的像素属于同一个类。它是一种PR法。其过程是决定一个灰度值,用以区分不同的类,这个灰度值就叫阈值。它可以分为全局阈值分割和局部阈值分割。所谓全局阈值分割是利用整幅图像的信息来得到分割用的阈值,并根据该阈值对整幅图像进行分割;而局部阈值分割是根据图像中的不同区域获得对应的不同区域的阈值,利用这些阈值对各个区域进行分割,即一个阈值对应一个相应的子区域,这种方法也叫称为适应阈值分割。可以看出,确定一个最优阈值是分割的关键。现有的大部分算法都是集中在阈值确定的研究上。阈值分割方法根据分割算法所有的特征或准则,还可以分为直方图与直方图变换法、最大类空间方差法、最小误差法与均匀化误差法、共生矩阵法、最大熵法、简单统计法与局部特性法、概率松驰法、模糊集法、特征空间聚类法、基于过渡区的阈值选取法等。 目前提出了许多新方法,如严学强等人提出了基于量化直方图的最大熵阈值处理算法,将直方图量化后采用最大熵阈值处理算法,使计算量大大减小。薛景浩、章毓晋等人提出基于最大类间后验交叉熵的阈值化分割算法,从目标和背景的类间差异性出发,利用贝叶斯公式估计象素属于目标和背景两类区域的后验概率,再搜索这两类区域后验概率之间的最大交叉熵。这种方法结合了基于最小交叉熵以及基于传统香农熵的阈值化算法的特点和分割性能,取得很好的通用性和有效性,该算法也容易实现二维推广,即采用二维统计量(如散射图或共生矩阵)取代直方图,以提高分割的准确性。俞勇等人提出的基于最小能量的图像分割方法,运用了能量直方图来选取分割阈值。任明武等人提出的一种基于边缘模式的直方图构造新方法,使分割阈值受噪声和边缘的影响减少到最小。程杰提出的一种基于直方图的分割方法,该方法对Ostu准则的内在缺陷进行了改进,并运用对直方图的预处理及轮廓追踪,找出了最佳分割阈值。此方法对红外图像有很强的针对性,付忠良提出的基于图像差距度量的阈值选取方法,多次导出Ostu方法,得到了几种与Ostu类似的简单计算公式,使该方法特别适合需自动产生阈值的实时图像分析系统。陈向东、常文森等人提出了基于小波变换的图像分数维计算方法,利用小波变换计算图像的分数维准确性高的特性。结果表明计算出的图像分数维准确,而且通过应用快速小波变换可以满足实时计算的要求,为实时场景分析提供有效的方法。建立在积分几何和随机集论基础之上的数学形态学以其一整套变换、概念和算法为数学工具,提供了并行的、具有鲁棒性的图像分割技述。它不仅能得到图像中各种几何参数的间接测量,反映图像的体视特性,而

图像分割方法总结

对象检测构建一个与图像中的每个类对应的边界框。 图像分割为图像中的每个对象创建像素级掩码。 图像分割: 语义分割 所有属于特定类的像素都用相同的颜色表示(背景为黑色,person为粉红色)。 实例分割 同一类的不同对象有不同的颜色(Person 1为红色,Person 2为绿色,background为黑色等)。

提出区域细分 对象和图像的背景之间存在强烈的对比 阈值分割 设置一个阈值,低于或高于该阈值的像素值可以相应地分类(作为对象或背景)。 全局阈值 定义一个单一的阈值,把图像分成两个区域(对象和背景)。 局部阈值。 定义多个阈值,分割多个对象和背景。 根据某些阈值将对象分割到不同的区域。 1. 简单的计算 2. 运行速度快 3.当目标和背景有很高的对比度时,这种方法表现得很好 当灰度值之间没有明显的灰度差或重叠时,很难得到准确的线段。

边缘检测分割 边缘看作是图像不连续的局部特征,利用这种不连续性来检测边缘,从而定义物体的边界。有利于图像在物体之间有更好的对比度。 如果图像中有太多的边,并且物体之间的对比度较低,则不适合。 基于聚类的分割 将图像的像素划分为均匀的簇。 首先,随机选择k个初始簇 将每个数据点随机分配到k个集群中的任意一个 计算这些集群的中心 计算所有点到每个簇中心的距离 根据这个距离,这些点被重新分配到最近的集群 计算新形成的星团的中心 最后,重复步骤(4)、(5)和(6),直到集群的中心不变或者达到设定的迭代次数 a.计算时间太长,开销太大。 b. k-means是一种基于距离的算法。它不适合聚类非凸聚类。 Mask R-CNN

图像分割方法综述

图像分割方法综述 摘要:图像分割是计算计视觉研究中的经典难题,已成为图像理解领域关注的一个热点, 本文对近年来图像分割方法的研究现状与新进展进行了系统的阐述。同时也对图像分割未来的发展趋势进行了展望。 关键词:图像分割;区域生长;活动边缘;聚类分析;遗传算法 Abstract: Image segmentation is a classic problem in computer vision,and become a hot topic in the field of image understanding. the research actuality and new progress about image segmentation in recent years are stated in this paper. And discussed the development trend about the image segmentation. Key words: image segmentation; regional growing; active contour; clustering analysis genetic algorithm 1 引言 图像分割是图像分析的第一步,是计算机视觉的基础,是图像理解的重要组成部分,同时也是图像处理中最困难的问题之一。所谓图像分割是指根据灰度、彩色、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域,使得这些特征在同一区域内表现出一致性或相似性,而在不同区域间表现出明显的不同。简单的说就是在一副图像中,把目标从背景中分离出来。对于灰度图像来说,区域内部的像素一般具有灰度相似性,而在区域的边界上一般具有灰度不连续性。 关于图像分割技术,由于问题本身的重要性和困难性,从20世纪70年代起图像分割问题就吸引了很多研究人员为之付出了巨大的努力。虽然到目前为止,还不存在一个通用的完美的图像分割的方法,但是对于图像分割的一般性规律则基本上已经达成的共识,已经产生了相当多的研究成果和方法。本文根据图像发展的历程,从传统的图像分割方法、结合特定工具的图像分割方法、基于人工智能的图像分割方法三个由低到高的阶段对图像分割进行全面的论述。 2 传统的图像分割方法 2.1 基于阀值的图像分割方法 阀值分割法是一种传统的图像分割方法,因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割技术。阀值分割法的基本原理是通过设定不同的特征阀值,把图像像素点分为具有不同灰度级的目标区域和背景区域的若干类。它特别适用于目标和背景占据不同灰度级范围的图,目前在图像处理领域被广泛应用,其中阀值的选取是图像阀值分割中的关键技术。 灰度阀值分割方法是一种最常用的并行区域技术,是图像分割中应用数量最多的一类。图像若只用目标和背景两大类,那么只需要选取一个阀值,此分割方法称为单阀值分割。单阀值分割实际上是输入图像f到输出图像g的如下变换:

一种改进的高分辨率遥感影像分割方法

第35卷第3期 地球科学———中国地质大学学报 Vol.35 No.32010年5月 Earth Science —Journal of China University of G eosciences May 2010 doi :10.3799/dqkx.2010.050 基金项目:教育部新世纪优秀人才计划资助项目(No.NCET 20720772);国家重点“863”项目(No.2007AA120503). 作者简介:高伟(1980-),男,博士生,主要从事遥感数据处理与信息提取的科研和教学工作.E 2mail :cuggaowei @hot https://www.doczj.com/doc/0912331884.html, 一种改进的高分辨率遥感影像分割方法 高 伟1,2,刘修国1,2,彭 攀1,2,陈启浩1,2 1.中国地质大学信息工程学院,湖北武汉430074 2.地理信息系统软件及其应用教育部工程中心,湖北武汉430074 摘要:分形网络演化算法是面向对象的遥感影像分类中比较成熟的一种构建对象的算法,但在分割效率上有待进一步提高, 而四叉树分割是一种高效的图像分割方法.提出了一种基于四叉树预分割的分形网络演化构建对象的方法.实验证明,该方法基本不影响影像分割的效果,而且提高了形成初始对象的效率,较大程度上提高了整体的分割效率.关键词:影像分割;分形网络演化;高空间分辨率;四叉树;地理信息系统.中图分类号:TP311 文章编号:1000-2383(2010)03-0421-05 收稿日期:2010-01-15 An Improved Method of High 2R esolution R emote Sense Image Segmentation GAO Wei 1,2,L IU Xiu 2guo 1,2,PEN G Pan 1,2,CH EN Qi 2hao 1,2 1.Facult y of I nf ormation Engineering ,China Uni versit y of Geosciences ,W uhan 430074,China 2.Engineering Research Center f or GIS S of t w are and A p plications ,Minist ry of Education ,W uhan 430074,China Abstract :Fractal net evolution approach (FN EA )is a relatively mature one among the object 2oriented image segmentation algo 2rithms ,but its efficiency is to be improved.Quad 2Tree segmentation is a kind of effective image segmentation method.In this paper ,an improved object oriented multi 2scale image segmentation method based on the quad 2tree pre 2segmentation and FN EA is introduced.The experiment shows that the effect of its segmentation result is almost the same as that of traditional FN EA method.Moreover ,It saves time. K ey w ords :image segmentation ;f ractal net evolution approach ;high 2nesolution remote sense ;quad 2tree ;geographic informa 2tion system (GIS ). 0 引言 近年来,以I KONOS 和Quick 2Bird 为代表的高空间分辨率遥感影像得到广泛应用(高伟,2006).高分辨率遥感影像具有丰富的空间信息,地物几何结构和纹理信息,便于认识地物目标的属性特征,如地物的图层值、形状、纹理、层次和专题属性,有助于提高地物定位和判读精度,使得在较小的空间尺度上观察地表细节变化,进行大比例尺遥感制图,以及监测人为活动对环境的影响成为可能.为土地利用、城市规划、环境监测等民用方面提供了更便利、更详细的数据源.高分辨率影像的广泛应用迫切要求人们对高分辨率遥感信息提取进行研究,以满足高分辨 率影像信息不断增长的应用和研究需要(Chen et al .,2009). 面向对象的高分辨率遥感影像的分类方法不仅利用地物的光谱信息,而且更多地利用几何信息和结构信息,可以结合其他空间知识和上下文信息来进行更为深入的分类,使得对高分辨率影像的分类更为合理和有效,这成为高分辨率影像信息提取的重要方法之一(Blaschke and Hay ,2001;陆关祥等,2002).在面向对象高分辨率影像的信息提取中,对遥感图像进行分割,形成具有一定特征相似性的影像区域,是实现从影像上进行地物目标计算机自动提取的第一步. 目前分形网络演化算法(Baatz and Schape ,

一种多尺度无监督遥感图像分割方法

一种多尺度无监督遥感图像分割方法 郭小卫,官小平 (北京东方泰坦科技有限公司,北京100083) 摘要:提出了一种多尺度无监督遥感图像分割方法。通过对多尺度图像数据在每个尺度上进行G auss 子集聚类,并将每个像素的邻域内的G auss 子集类别标记作为特征向量,利用Markov 四叉树模型进行二次聚类,从而实现无监督图像分割。与其他基于多尺度Markov 模型的无监督分割方法和传统动态聚类方法相比,该方法既无需假定每类的分布形式,又能较好地反映数据的概率结构。合成图像与SAR 图像的实验结果表明,该方法的分割精度接近于有监督的H 2MPM 和H 2SMAP 方法。 关键词:多尺度;四叉树;MPM (maximum posterior marginals );EM (expectation maximization )算法;无监督分割中图分类号:P237.3 文献标识码:A 文章编号:1000-3177(2006)88-0020-03 收稿日期:2006-04-06 作者简介:郭小卫,男(1971)~,博士,主要从事图像处理、模式识别和多尺度统计建模等方面的研究。 1 引 言 基于多尺度Markov 模型的图像分割方法[1~4],是近年来基于统计模型的图像分割方法的研究热点。多尺度 Markov 模型分割算法通常采用Bayes 估计。Bayes 估计的前 提条件是每类的概率密度已知。在无监督图像分割问题中,由于训练样本的类别未知,为估计每类的概率密度,需要假定每类的分布形式已知(通常假定每类服从G auss 分布或其他简单分布),从而,利用一些如EM (expectation 2maximiza 2 tion )、SEM (stochastic expectation 2maximization )或ICE (iter 2ative conditional estimation )等混合密度的估计方法,就可以 得到每类的分布参数。但在很多情况下,各类的分布可能无法用某种简单的分布形式来表示,甚至无法用参数化的方法来表示,因而也就不能应用这类方法来估计每类的概率密度。一种替代方法是将图像数据离散化,并应用EM 等算法来估计离散形式的混合分布。但直接对图像数据离散化一方面会造成分布参数过多,并带来计算量增加、EM 算法初始化困难等问题;另一方面,由于缺少足够的约束条件,导致离散形式混合密度的估计结果有很大的不确定性,典型的例子是在各类分布的交叠区,分布参数的估计严重甚至完全依赖于初值的选取。 针对此问题,本文提出一种基于Markov 四叉树模型的无监督图像分割方法。该方法通过对多尺度图像数据在每一尺度上进行G auss 子集聚类,并将聚类的结果(G auss 子集类标记)作为多尺度特征数据,进而应用Markov 四叉树模型和MPM (maximum posterior marginals )估计进行二次聚类,实现无监督图像分割。该方法无需假定每类的分布形式已知;与离散形式的多尺度Markov 模型方法相比,离散值的数目(G auss 子集数)通常很小,使得EM 算法的初值选择比较容易,并减小了参数估计的不确定性。 2 Markov 四叉树模型 本文采用的Markov 四叉树模型,其结构如图1所示。记树上的节点集为S ,根节点为r ,黑节点(隐节点)代表像素的未知类别,白节点(观测节点)代表像素值或像素的某种特征数据,在特定假设条件下[1,3],所有隐节点的集合与观测节点的集合构成一(隐)马尔可夫树。将该模型应用于图像分割,实际上就是根据观测值估计隐节点状态的问题。解决该问题的方法通常有两种,MAP 估计和MPM 估计,本文采用MPM 估计,其具体算法见文献[3] 。 图1 Markov 四叉树模型 要将上述模型应用于图像分割,需要首先估计模型参数。记πm =p (X r =m ),并对Πs ∈S (n ) ,记a m ,k ,n =p (X s =m |X s +=k ),f m ,n (l )=p (Y s =l |X s =m ),Markov 四叉 树模型参数可记为θ=(πm ,(a m ,k ,n )k =1…M ,n =0…N ,(f m ,n (l )) l ∈R ,n =0…N )m =1…M 。若假定转移概率和条件分布仅与尺 度有关,与具体节点无关,并进一步假定每类数据服从G auss 分布,此时,模型参数简化为θ=( πm ,(a m ,k ,n )k =1…M ,n =0…N ,(μm ,n ) n =0,…,N ,(∑m ,n )n =0,…,N )m =1…M 。利用EM 算法,可 得到θ的估计[7]。 3 基于Markov 四叉树模型的无监督分割 上述多尺度Markov 模型的无监督图像分割方法需要假定每类数据服从G auss 等简单分布形式,这种假定在很多情

医学图像分割方法汇总

医学图像分割方法汇总 本文主要介绍在医学图像分割方面的几种典型算法,详细介绍每种算法的工作原理,通过对具体的医学图像实验来对比每种方法在分割方面的优点和缺点,分析结果产生的原因,从而在后面的实际应用中选择最合适的算法。 1阈值法分割 1-1 简单阈值分割 简单的阈值处理是图像分割中最为简单基础的一种分割方法。对于一副灰度图像,使用给定的阈值。图像中的像素超过这个阈值的一律设置为最大值(对于八位灰度图像,最大值一般为255),像素小于这个阈值的设置为0.下图 1.2是利用五个不同的阈值对脑部图像(图1.1)的分割结果。(从上到下,从左到右一次使用的阈值分别为最大值的0.1,0.3,0.5,0.7,0.9倍)。 图1.1原始脑部图像 图1.2 使用不同阈值分割后的结果

从实验结果来看,使用简单的阈值分割,过程十分简便,原理简单易懂,但是要是得到比较好的分割结果需要进行多次试验。 1-2 otsu阈值分割法 Otsu阈值分割法又称大津阈值分割法。它的原理是对图像所有的像素范围进行遍历(对8位灰度图像来说呢,就是从0遍历到255),找出合适的T(阈值),把原始图像分割成前景图像和背景图像并且两者之间的类方差最大。 原理: 对于图像I(x,y),前景(即目标)和背景的分割阈值记作T,属于前景的像素点数占整幅图像的比例记为ω0,其平均灰度μ0;背景像素点数占整幅图像的比例为ω1,其平均灰度为μ1。图像的总平均灰度记为μ,类间方差记为g。 假设图像的背景较暗,并且图像的大小为M×N,图像中像素的灰度值小于阈值T的像素个数记作N0,像素灰度大于阈值T的像素个数记作N1,则有:ω0=N0/ M×N (1) ω1=N1/ M×N (2) N0+N1=M×N (3) ω0+ω1=1 (4) μ=ω0*μ0+ω1*μ1 (5) g=ω0(μ0-μ)^2+ω1(μ1-μ)^2 (6) 将式(5)代入式(6),得到等价公式: g= ω0ω1(μ0-μ1)^2 (7)这就是类间方差 找出使得g(类方差)的值到达最大的T(值),就是我们需要的结果。 下图1.3是使用otsu阈值分割法对图1.1脑部图像的分割结果。 图1.3 使用ostu阈值分割得到的结果

遥感图像分割和ENVI软件介绍实习报告

遥感图像处理 实训指导书 单位:测绘学院测绘工程1102班 姓名:王文兵 学号:1110020213 指导教师:陈晓宁、黄远程、竞霞、席晶、史晓亮 测绘科学与技术学院

2013 年12 月 实习一遥感图像处理实训概述与ENVI软件介绍 一、实验内容: 随着遥感技术日新月异的发展,伴随近年来我国高分辨率传感器的发展,在地物识别方面取得了巨大的成就和进步。根据陕西省地理国情白皮书的内容,发现我省各城市城区面积呈连年扩大之势,本次实验利用ZY-3卫星获取的2012年7月28日西安地区的高分辨影像为主要的数据源,通过对图像的光谱、空间和纹理信息的分析,采用多尺度分析和面向对象的分析方法,运用遥感影像自动分类方法,包括SVM、knn算法实现城市地物高精度的分类为主要目标。 本次试验加强深入了解ENVI软件的基本操作步骤以及各部分功能的使用方法,并对ZY-3卫星获取的西安市高分辨率影像图加以剪切,即剪切生成图名为g042016的实验图区,其覆盖范围为108°56’15”~109°00’ 00”; 34°15’ 00”~34°17’ 30”;之后对图区地物进行简单描述。 二、实验目的: 1.深入了解ENVI软件的各部分功能以及基本操作步骤,加深理解,增强动手能力; 2.学会对所需图区进行符合要求的剪切操作; 3.学会在高分辨影像图上识别地物并做简单描述;

三、实验步骤: 1.打开ENVI软件,打开File--Open Image File ,加载正视影像图ZY3_01a_mynnavp_017139_20120728_113641_0007_SASMAC_CHN_sec_ rel_001_1208096324.tif; 2.进行所需图区的截取;打开Basic Tools--Resize data(Spatial/Spectral),之后选中此图像进行截取; 3.单击Spatial Subset--map,之后在空格内输入所需图区的两个对角(左上和右下)经纬度坐标,即(108.9375,3 4.29);(109,34.25),单击OK确定后点Choose并建立文件夹进行保存,截取图区操作完成; 4.重新加载正视影像图区g042016,肉眼对图像进行简单的地物判别描述; 四、实验结果: 1.截取的全色影像图区g042016结果:

遥感图像分析

0、遥感图像分析 遥感实际上是通过接收(包括主动接收和被动接收方式)探测目标物电磁辐射信息的强弱来表征的,它可以转化为图像的形式以相片或数字图像表现。多波段影像是用多波段遥感器对同一目标(或地区)一次同步摄影或扫描获得的若干幅波段不同的影像。 在遥感影像处理分析过程中,可供利用的影像特征包括:光谱特征、空间特征、极化特征和时间特性。在影像要素中,除色调/彩色与物体的波谱特征有直接的关系外,其余大多与物体的空间特征有关。像元的色调/彩色或波谱特征是最基本的影像要素,如果物体之间或物体与背景之间没有色调/彩色上的差异的话,他们的鉴别就无从说起。其次的影像要素有大小、形状和纹理,它们是构成某种物体或现象的元色调/彩色在空间(即影像)上分布的产物。物体的大小与影像比例尺密切相关;物体影像的形状是物体固有的属性;而纹理则是一组影像中的色调/彩色变化重复出现的产物,一般会给人以影像粗糙或平滑的视觉印象,在区分不同物体和现象时起重要作用。第三级影像要素包括图形、高度和阴影三者,图形往往是一些人工和自然现象所特有的影像特征。 1、遥感信息提取方法分类 常用的遥感信息提取的方法有两大类:一是目视解译,二是计算机信息提取。 1.1目视解译 目视解译是指利用图像的影像特征(色调或色彩,即波谱特征)和空间特征(形状、大小、阴影、纹理、图形、位置和布局),与多种非遥感信息资料(如地形图、各种专题图)组合,运用其相关规律,进行由此及彼、由表及里、去伪存真的综合分析和逻辑推理的思维过程。早期的目视解译多是纯人工在相片上解译,后来发展为人机交互方式,并应用一系列图像处理方法进行影像的增强,提高影像的视觉效果后在计算机屏幕上解译。 1)遥感影像目视解译原则 遥感影像目视解译的原则是先“宏观”后“微观”;先“整体”后“局部”;先“已知”后“未知”;先“易”后“难”等。一般判读顺序为,在中小比例尺像片上通常首先判读水系,确定水系的位置和流向,再根据水系确定分水岭的位置,区分流域范围,然后再判读大片农田的位置、居民点的分布和交通道路。在此基础上,再进行地质、地貌等专门要素的判读。 2)遥感影像目视解译方法 (1)总体观察 观察图像特征,分析图像对判读目的任务的可判读性和各判读目标间的内在联系。观察各种直接判读标志在图像上的反映,从而可以把图像分成大类别以及其他易于识别的地面特

相关主题
文本预览
相关文档 最新文档