数字图像处理读书报告12
- 格式:doc
- 大小:38.00 KB
- 文档页数:4
数字图像处理读书报告4——空间域操作的灰度变换及空间滤波——钱增磊前言:本次学习冈萨雷斯的图像处理主要复习了前两章的内容,并将以前未理解的东西重新加深了理解,在本次报告中予以体现,并补充了第二章报告中的遗漏内容,以及对第三章的内容进行新的学习。
首先对前两章的复习进行一个简单的复习总结。
第一章的绪论主要内容:从20世纪20年代巴特兰电缆图片传输系统作为数字图像的起源,利用5个灰度级及更多灰度级的编码为基础进行传输。
后来随着计算机的发展,网络的发展,数字图像处理的应用开始延伸到各个领域,举例了根据光子能量排列的电磁波谱列出不同的范围的光所在的成像应用,更多的应用于天文观测,医疗,以及地理勘测等领域。
还有用声波和超声波的成像应用。
第二章的数字图像基础主要内容:介绍了人眼的结构以及成像原理,用来给计算机成像奠定基础,并介绍简单图像形成模型,利用光源照射总量与反射的光照总量两个分量来表征其光亮。
对于图像的质量利用分辨率与灰度级来衡量,不仅介绍了不同分辨率与不同灰度级对图像质量的影响,还分析了分辨率与灰度级的关系,图像细节越多,则分辨率与灰度级越相互独立。
还分别介绍了像素之间的一些基本关系,这里对邻接性与连通性有了更深刻的理解,m邻接消除了8邻接的二义性,消除对构成闭合回路阻碍。
二、补充第二章报告中的遗漏内容图像处理中所用的数学工具一是算术操作,针对每个像素值进行加减乘除的运算,对于加法用于针对降噪的带噪图像相加平均,使得每个位置(x,y)的像素值变化减小,达到减噪的目的;对于减法用于增强图像的差别,为加强某些观察差异,需要消除某些相同的部分来加强对差异的观察;适用图像的相乘与相除来校正阴影;二是集合和逻辑操作,介绍了集合和元素概念,以及在灰度级集合上的操作。
对于集合引出模糊集合的概念,对没有严格分界各集合的关系,使用隶属度函数来实现这样的概念。
三是空间操作,主要针对邻域的操作和几何空间变换,对某一点像素值采用该点邻域的像素值来代替,可以实现图像的局部模糊,与模糊概念相对应。
数字图像处理实习报告在当今数字化的时代,数字图像处理技术在众多领域中发挥着至关重要的作用,从医疗诊断到卫星遥感,从娱乐产业到工业检测,其应用无处不在。
通过这次数字图像处理实习,我对这一领域有了更深入的了解和实践经验。
实习的初始阶段,我主要进行了相关理论知识的学习。
数字图像处理涵盖了众多概念,如图像的数字化表示、像素、灰度值、分辨率等。
了解这些基础知识是后续处理图像的基石。
同时,我还学习了常见的图像格式,如 JPEG、PNG、BMP 等,以及它们的特点和适用场景。
在掌握了一定的理论基础后,我开始接触图像处理的基本操作。
图像增强是我最先实践的部分,通过调整图像的对比度和亮度,能够使原本模糊不清或暗淡的图像变得更加清晰和易于观察。
例如,对于一张曝光不足的照片,增加亮度可以让隐藏在黑暗中的细节显现出来;而提高对比度则可以使图像中的不同区域更加分明,突出重点。
图像滤波是另一个重要的环节。
均值滤波可以有效地去除图像中的噪声,但在一定程度上会使图像变得模糊;中值滤波则能够在去除噪声的同时较好地保留图像的边缘细节。
我通过对不同类型和程度的噪声图像进行滤波处理,直观地感受到了它们的效果差异。
图像的几何变换也是实习中的关键内容。
图像的平移、旋转和缩放操作看似简单,但其背后涉及到复杂的数学计算。
在实际操作中,需要准确地计算变换矩阵,以确保图像在变换后的准确性和完整性。
实习过程中,我还深入研究了图像分割技术。
这是将图像分成不同区域或对象的过程,以便进行后续的分析和处理。
阈值分割是一种常见且简单的方法,通过设定一个阈值,将图像中的像素分为两类。
然而,对于复杂的图像,这种方法往往效果不佳,这时就需要更高级的分割算法,如基于边缘检测的分割或基于区域生长的分割。
在进行数字图像处理的过程中,我也遇到了一些挑战和问题。
例如,在处理大规模图像数据时,计算资源的限制可能导致处理速度缓慢;在选择图像处理算法时,需要根据具体的图像特点和需求进行权衡,否则可能无法达到理想的效果。
主要学习内容1.数字图像处理( Digital Image Processing )又称为计算机图像处理, 它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程, 以提高图像的实用性, 从而达到人们所要求的预期结果。
例如: 对照片反差进行变换;对被噪声污染的工业电视图像去除噪声;从卫星图片中提取目标物特征参数等等。
与人类对视觉机理着迷的历史相比, 数字图像处理还是一门相对年轻的学科。
但在其短短的历史中, 它却以程度不同的成功被应用于几乎所有与成像有关的领域。
由于其表现方式(用图像显示)所固有的魅力, 它几乎吸引了从科学家到平民百姓太多的注意。
几个新的技术发展趋势将进一步刺激该领域的成长: 包括由低价位微处理器支持的并行处理技术;用于图像数字化的低成本的电荷耦合器件(CCD);用于大容量、低成本存储阵列的新存储技术;以及低成本、高分辨的彩色显示系统。
另一个推动力来自于稳定涌现出的新的应用。
在商业、工业、医学应用中, 数字成像技术的使用持续增长。
尽管军费在削减, 在遥感成像中却更多地使用了数字图像处理技术。
低成本的硬件加上正在兴起的几个非常重要的应用, 我们可以预料到数字图像处理在将来会发挥更重要的作用。
2.图像增强技术图像增强是指按特定的需要突出一幅图像中的某些信息, 同时, 削弱或去除某些不需要的信息的处理方法。
其主要目的是处理后的图像对某些特定的应用比原来的图像更加有效。
图像增强技术主要包含直方图修改处理、图像平滑化处理、图像尖锐化处理和彩色处理技术等。
空间域平滑技术为了抑制噪声改善图像质量所进行的处理称为图像平滑或去噪。
它可以在空间域或频率域中进行。
此处介绍空间域的几种平滑方法。
(1)局部平滑法局部平滑发又称邻域平均法或移动平均法。
它是利用像素邻域内的各像素的灰度平均值代替该像素原来的灰度值, 实现图像的平滑。
邻域平均法是将当前像素邻域内各像素的灰度平均值作为其输出值的去噪方法。
其作用相当于用这样的模板同图像卷积。
数字图像处理课程心得本学期,我有幸学习了数字图像处理这门课程,这也是我大学学习中的最后一门课程,因此这门课有着特殊的意义。
人类传递信息的主要媒介是语音和图像。
据统计,在人类接受的信息中,听觉信息占20%,视觉信息占60%,其它如味觉、触觉、嗅觉信息总的加起来不过占20%。
可见图像信息是十分重要的。
通过十二周的努力学习,我深刻认识到数字图像处理对于我的专业能力提升有着比较重要的作用,我们可以运用Matlab对图像信息进行加工,从而满足了我们的心理、视觉或者应用的需求,达到所需图像效果。
数字图像处理起源于20世纪20年代,当时通过海底电缆从英国伦敦到美国纽约采用数字压缩技术传输了第一幅数字照片。
此后,由于遥感等领域的应用,使得图像处理技术逐步受到关注并得到了相应的发展。
第三代计算机问世后,数字图像处理便开始迅速发展并得到普遍应用。
由于CT的发明、应用及获得了备受科技界瞩目的诺贝尔奖,使得数字图像处理技术大放异彩。
目前数字图像处理科学已成为工程学、计算机科学、信息科学、统计学、物理、化学、生物学、医学甚至社会科学等领域中各学科之间学习和研究的对象。
随着信息高速公路、数字地球概念的提出以及Internet的广泛应用,数字图像处理技术的需求与日俱增。
其中,图像信息以其信息量大、传输速度快、作用距离远等一系列优点成为人类获取信息的重要来源及利用信息的重要手段,因此图像处理科学与技术逐步向其他学科领域渗透并为其它学科所利用是必然的。
数字图像处理是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。
数字图像处理的产生和迅速发展主要受三个因素的影响:一是计算机的发展;二是数学的发展(特别是离散数学理论的创立和完善);三是广泛的农牧业、林业、环境、军事、工业和医学等方面的应用需求的增长。
图像处理科学是一门与国计民生紧密相联的应用科学,它给人类带来了巨大的经济和社会效益,不久的将来它不仅在理论上会有更深入的发展,在应用上亦是科学研究、社会生产乃至人类生活中不可缺少的强有力的工具。
数字图像精细分割读书报告Literature-Report on Digital Matting摘要:数字图像精细分割是图像编辑和视觉特效制作的一种重要的基础性操作。
本文综述了国内外图像精细分割领域的研究现状,并给出了今后的研究方向。
关键字:数字图像精细分割,贝叶斯框架,泊松方程Abstract :Digital matting is a fundamental operation in image editing and visual effect. In this paper, an survey on digital matting is given and the future works in this field are listed.Keywords :Digital matting, Bayesian framework, Poisson equation一、引言1.1 图像精细分割概述视觉是人类五感中最高级的感官,因此,毫无疑问图像在人类感知中扮演着最重要的角色。
已有研究表明,人类从外界获取的各种信息约有80%是从图像中得到的。
然而,人类的视觉仅限于电磁波谱的可见光频段,数字成像机器则可以处理那些由不可见光源产生的图像。
因此,数字图像技术被广泛运用于各种应用领域。
数字图像研究领域被笼统的分为三个层次,即图像处理、图像分析和计算机视觉。
然而,从图像处理到计算机视觉这个连续的统一体内并没有明确的界线。
通常它们的关系如图1所示。
图像处理涉及一些比较底层的操作,例如:图像噪声过滤,图像锐化;它的输入和输出都是图像。
图像分析则包括一些中级的处理,例如:图像边缘提取;它的输入为图像,但输出是从这些图像中提取的特征。
作为高级处理的计算机视觉涉及从总体上理解在图像分析中被识别的物体,以及执行与视觉相关的识别函数等。
在对图像的研究和应用中,人们通常只是对图像中的某些部分感兴趣。
这些符号 目标 象素 操作对象 图1. 数字图像研究领域层次结构 Fig. 1 the structure of digital image processing部分通常被称作对象或目标,他们一般对应图像中特定的、具有独特性质的区域。
《数字图像处理》实验报告数字图像处理是一门将图像进行数字化处理的学科,它通过计算机算法和技术手段对图像进行分析、增强、压缩和重建等操作。
在本次实验中,我们学习了数字图像处理的基本概念和常用算法,并通过实验来探索其应用和效果。
首先,我们进行了图像的读取和显示实验。
通过使用Python中的OpenCV库,我们能够轻松地读取图像文件,并将其显示在屏幕上。
这为我们后续的实验奠定了基础。
同时,我们还学习了图像的像素表示方法,了解了图像由像素点组成的原理。
这使我们能够更好地理解后续实验中的算法和操作。
接下来,我们进行了图像的灰度化实验。
灰度化是将彩色图像转换为灰度图像的过程。
在实验中,我们使用了不同的算法来实现灰度化操作,包括平均值法、最大值法和加权平均法等。
通过比较不同算法得到的灰度图像,我们发现不同算法对图像的处理效果有所差异,这使我们深入理解了灰度化的原理和应用。
随后,我们进行了图像的直方图均衡化实验。
直方图均衡化是一种用于增强图像对比度的方法。
在实验中,我们使用了直方图均衡化算法来对图像进行处理,并观察了处理前后的效果变化。
通过实验,我们发现直方图均衡化能够显著提高图像的对比度,使图像更加清晰和鲜明。
在进一步探索图像处理技术的过程中,我们进行了图像的滤波实验。
滤波是一种常用的图像处理操作,它通过对图像进行卷积操作来实现。
在实验中,我们学习了不同类型的滤波器,包括均值滤波器、高斯滤波器和中值滤波器等。
通过比较不同滤波器对图像的处理效果,我们发现每种滤波器都有其适用的场景和效果。
此外,我们还进行了图像的边缘检测实验。
边缘检测是一种用于提取图像边缘信息的方法。
在实验中,我们学习了不同的边缘检测算法,包括Sobel算子、Canny算子和Laplacian算子等。
通过比较不同算法对图像的处理效果,我们发现每种算法都有其独特的特点和应用。
最后,我们进行了图像的压缩实验。
图像压缩是一种将图像数据进行压缩以减小文件大小的方法。
数字图像处理学习报告在这一学期,我选修了《数字图像处理基础》这门课程,同时,老师还讲授了一些视频处理的知识。
在这里,梳理一下这学期学到的知识,并提出一些我对这门课程的建议。
图像处理是指对图像信息进行加工,从而满足人类的心理、视觉或者应用的需求的一种行为。
图像处理方法一般有数字法和光学法两种,其中数字法的优势很明显,已经被应用到了很多领域中,相信随着科学技术的发展,其应用空间将会更加广泛。
数字图像处理又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程.数字图像处理是从20世纪60年代以来随着计算机技术和VLSL的发展而产生、发展和不断成熟起来的一个新兴技术领域。
数字图像处理技术其实就是利用各种数字硬件与计算机,对图像信息通过转换而得到的电信号进行相应的数学运算,例如图像去噪、图像分割、提取特征、图像增强、图像复原等,以便提高图像的实用性。
其特点是处理精度比较高,并且能够对处理软件进行改进来优化处理效果,操作比较方便,但是由于数字图像需要处理的数据量一般很大,因此处理速度有待提高。
目前,随着计算机技术的不断发展,计算机的运算速度得到了很大程度的提高。
在短短的历史中,它却广泛应用于几乎所有与成像有关的领域,在理论上和实际应用上都取得了巨大的成就。
1. 数字图像处理需用到的关键技术由于数字图像处理的方便性和灵活性,因此数字图像处理技术已经成为了图像处理领域中的主流。
数字图像处理技术主要涉及到的关键技术有:图像的采集与数字化、图像的编码、图像的增强、图像恢复、图像分割、图像分析等。
图像的采集与数字化:就是通过量化和取样将一个自然图像转换为计算机能够处理的数字形式。
图像编码:图像编码的目的主要是来压缩图像的信息量,以便能够满足存储和传输的要求。
图像的增强:图像的增强其主要目的是使图像变得清晰或者将其变换为机器能够很容易分析的形式,图像增强方法一般有:直方图处理、灰度等级、伪彩色处理、边缘锐化、干扰抵制。
数字图像处理读书报告Efficient object detection and segmentation for fine-grained recognition细粒度识别的有效目标检测与分割李其信201120952 信号与信息处理1摘要本文提出了一种针对细粒度的识别的目的检测和分割算法。
该算法首先检测可能属于对象的低级别的区域,,然后通过传播进行完整的对象分割。
除了分割对象,我们也可以以中心“放大”对象,依据尺度比例规范对象,因此折扣背景的影响。
这种算法与一个国家的最先进分类算法的结合能明显提高性能,特别是对于认为很难识别数据集,如鸟类物种,性能提高更加明显。
该算法的效率远远超过同样方案下的其它已知算法[4,21]。
我们的方法也比较简单,我们将其应用到不同的对象的类,如鸟类,花卉,猫和狗。
我们在一些基准细粒度的分类数据集上测试了该算法的性能。
它优于所有已知的最先进的方法对这些数据集的性能,有时高达11%。
在所有的数据集上应用此算法,基线算法的性能提高了3-4%。
我们在识别性能上具有挑战性的大规模花的数据集(包含578个品种的花250000图像)上进行试验,观察到还观察到上出现超过4%的改善。
2背景本文讨论的对象分类问题属于相同的基本范畴,如物种鸟,花等。
这个任务通常被称为细粒识别,需要特定领域的专家知识,而这些知识通常很少的人才有。
因此,开发自动识别系统这样的任务对于非专家存在很大好处。
毫无疑问,细粒度的分类面临的主要挑战是物种之间细微的差异。
然而,一个自动系统会遇到更多的挑战。
例如,图像通常包括丰富的自然环境和具有挑战性的背景,其中的背景的影响可能会变得突出,从而干扰算法的识别。
但是,有时背景可能是有用的,所以分割出背景将是有益的。
分割也有助于提取感兴趣对象的轮廓,可以提供良好的特征识别。
一种检测和分割算法的另一个好处就是,它可以定位对象,这个对象是有益的,特别是如果该对象不在图像的中心,或者大小的中央,不同于其它对象的大小。
《数字图像处理》读书报告3——钱增磊摘要:本周的主要任务是接着上周所看的数字图像的基础部分。
上一周主要对人眼视觉系统做了一个简单的概括,并对人眼视觉系统的成像原理以及应用了做了比较深入的探讨,对后期图像处理做了一个理论基础。
本周主要是将人眼视觉系统过渡到数字图像处理系统上来,通过对电磁光谱、图像的感知和获取、图像的取样和量化以及像素间的一些基本关系来阐述数字图像处理的基础。
一、讨论光和电磁能谱的元素以及它们的图像特性在1666年时,牛顿最先发现了光的奇异现象,当太阳光透过玻璃棱镜时,光由一系列不同颜色的光谱组成,一端是紫色,另一端是红色,然而这些可见光之石电磁光谱中很小的一部分。
电磁波是一系列无质量的γ粒子以光的速度作正弦运动形成的传播,每个粒子由一定的能量,而电磁光谱是由波长、频率和能量来描述的,他们的关系可以表示为:υλc=。
每一个频段的能量由公式υh E =给出,其中h 为普朗克常数。
我们可以看到当频段越高的波段,所携带的能量就越大。
以下是不同波段携带的能量大小关系:无线波 < 微波 < 红外波 < 可见光 < 紫外光 < X 射线 < γ射线所以在核辐射中,γ射线才是对人体伤害最严重的射线。
其中在可见光中可分为六个区域,每个区域的能量关系也不同:紫光 < 蓝光 < 绿光 < 黄光 < 橙色光 < 红光人在不同情况下可以看到不同颜色的光,其本质的这些光是由于这些物体的反射,根据物体在不同可见光谱内呈现不同颜色,对其他颜色光谱会进行吸收,那么其他颜色就看不见了。
上述就是其中一个图像特性,不同波段的光谱与携带能量以及波长的关系。
另一个特性分为两类:(1)一类是针对单色光,用灰度级来描述单色光强度。
(2)一类是针对彩色光,彩色光共有3个特性:A 、发光强度:从光源流出能量的总量,用W 表示单位;B、光通量:观察者从光源感受到的能量,用lm表示单位;C 、亮度:是光感受的主观指绘子,是描述色彩感觉的参数之一。
傅里叶变换在图像处理中的应用摘 要为了有效的和快速的对图像进行处理和分析,常需要将原定义在图像空间的图像以某种形式转换(正变换)到另外一些空间,并利用在这些空间的特有性质方便进行一定的加工,最后再转换(反变换或逆变换)回图像空间以得到所需的效果。
这些在不同空间转换的技术就是图像变换技术。
傅里叶叶变换是一种基本和常用的变换,它把图像从图像空间(空域)转换到频率空间(频域)。
傅立叶变换研究是应用数学的一个重要方向,一个多世纪以来,傅立叶变换作为数学工具被迅速的应用到图像和语音分析等众多领域。
通过在时空域和频率域来回切换图像,对图像的信息特征进行提取和分析,简化计算工作量,被誉为描述图像信息的第二种语言。
理论正弦波就是一个圆周运动在一条直线上的投影。
所以频域的基本单元也可以理解为一个始终在旋转的圆傅里叶变换傅里叶变换实际上是对一个周期无限大的函数进行傅里叶变换。
定义:单变量连续函数)(x f 的傅里叶变换)(u F 定义为等式⎰+∞∞-=dx e x f u F ux)xp(-j2)()(π逆变换为: 1,...,2,1,02ex p)()(10-==∑-=M x M ux j u F x f M u π二维离散傅里叶逆变换如下:∑∑-=-=+=1010))//(2exp(),(),(M u N v N vy M ux j v u F y x f π其中1,...,2,1,01,...,2,1,0u -=-=N v M 。
如果),(y x f 是实函数,则它的傅里叶变换必然为对称的,即),(),(v u F v u F --=*其中“*”表示对复数的标准共轭操作。
它遵循 ),(),(v u F v u F --=其中,傅里叶变换的频率谱是对称的。
傅立叶变换在图像处理中的作用1. 图像增强与图像去噪绝大部分噪音都是图像的高频分量,通过低通滤波器来滤除高频——噪声;边缘也是图像的高频分量,可以通过添加高频分量来增强原始图像的边缘。
数字图像处理读书报告12
——表示与描述
——钱增磊前言:在数字图像处理中,在前面几章都讲解了它的各种处理方法以及应用,那么对于这些处理的方法在真正程序实现的过程中,不能仅仅只是一个二维的像素矩阵点来表示,对于类似图像分割以及编码等的过程都需要特征的提取,而这些提取出来的特征表示,则需要一些表示以及描述,也就是本章节引出来的原因。
对于表示和描述虽表达的是同一意思,但是也有一定的区别,我个人的理解是表示是一种更加具体直接的表示目标,所呈现出来的是非常直观的描绘方法。
而描述则是用一种我们没办法直观的看到目标特征的抽象表示方法,因为在某一些领域,对于直观的表示不能够很好的对其进行处理,相反,将某一些需要处理的特征以另一种表示方法表现出来从而处理,会达到事半功倍的效果。
一、表示
1、边界追踪
对于边界的表示我们从图上可以看到很直观的表示,但是在将他提取出来的时候就需要一种表示的方法,这里采用的是Moore边界追踪算法。
它是根据对一个边界上的点求它的八邻域,如果是一个完整的闭合边界,那么边界的另一个点就应该在这个八邻域上面,我们采用对它的八邻域按顺时针方向的寻找,当找到另一个边界点的时候,同样对这个边界求八邻域,循环执行本操作,这样就起到了一个跟踪的效果。
边界也就被提取出来了。
但是这里会遇到一个问题,如果在显示边界的时候由于各种原因边界上存在毛刺,那么可能存在一个点的八邻域是不存在其他边界点的,这样会导致算法的出错,我们可以利用给区域的方法而不是给边界的方法来改善它,区域的外围便是边界,这样就防止了毛刺的发生。
2、链码
上述讲述了边界的提取算法,对于提取出来的边界需要保存下来,那么就需要一种对提取的边界进行编码的过程,在离散的边界提取中,边界的跟踪方向无非是8个方向,也就是八个邻域,那么对这八个方向进行方向性数字序列的编码,便称为佛雷曼链码。
一般分为4方向链码和8方向链码。
那么给定一个起始点,进行上述的跟踪方式,用编码好的链码进行编码,那么对于一个边界就转化为一串数字。
编码的意义不仅仅只是为了表示,而且也为了计算机的存储和传输做贡献的,如此便需要考虑到编码的容量问题,在图像压缩的过程中,我们了解到了编码的冗余,对于一些具有规则图形的边界,采用上述的编码方法的话会发生冗余,这时便可以采用差分的方法,也就是对下一个编码要针对上一个编码相对旋转的角度来规定编码的数字,这样对于规则图像就产生了一系列连续的相同编码,于是可以采用图像压缩中的编码方法进行压缩,大大缩减
了存储的容量。
3、最小周长多边形的近似MPP
上述两种方法讲述了边界的表示以及提取,那么对于一个连续的图如何形成离散的边界呢?我们这里采用的便是最小周长多边形的近似MPP 算法。
每一个数字图像最终都是在一个很大的阵列中显现的,阵列中有许多形状相同的小正方形组成,这就是像素格,在连续的图像上放在如此的阵列上会出现边界不断地穿越在各个像素格中,每一个像素格中的线条最靠近哪一条边界就将此线条代替为该像素格的某一边界。
那么如此便可以得到由像素格的边组成的多边形近似。
由于为了能够更加精确,采用的是最小周长多边形,也就是将比较折线和对角线的近似程度,这种技术体现在对MPP 的顶点选取上。
对于区域图像由区域和边界组成,那么也就构成了外墙和内墙,顶点的选取在于内墙的凸顶点和外墙的凹顶点。
4、标记图
标记图是一种表示边界的一维函数,标记方法有很多,比如以角度的函数的行书画出质心到边界的距离,这就是一种标记,对边界的操作其实也可以变换为对函数的操作。
5、边界线段
这是边界的另一种表示方法,利用凸壳的概念,将一幅原有的图像的凸壳表示出来,那么凸壳和原有图像之间就构成了一个内外的区域,我们可以假设当进入凸壳区域时标记一个边界,当沿着原图像进行扫描,最后走出凸壳区域,那么再标记一个边界,如此便可产生分割的边界,这种方法成为边界鲁棒分解的有力工具。
6、骨架
骨架的算法已经在形态学里涉及过了,就是利用中轴变换MA T 对边界求它的中心点,中心点的轨迹就是骨架。
这里要注意的是骨架的分支,这个分支的实现是通过对某一点领域内的八个方向的边界分别求中心点确定的,如果只是求两个方向,那么无论图像形状如何,都只有一条线段构成的骨架。
二、描述
描述是一种抽象的表示方法,它对目标的表达是不能很直观的,但是对于某一些的特征却能够很好地图像出来,简化处理的复杂度。
1、边界描绘子
第一种是形状数,将一幅图像分解成网格的形式,然后对于每一个网格的边界来粗略的描绘他的边界,最终利用佛雷曼链码来对其进行编码。
第二种是傅里叶描绘子,对空间坐标中的任何一个点对其进行傅里叶变换,可以得到的频率域内的点称为傅里叶描绘子,由于傅里叶系数是有无限多个的,这里使用前P 个傅里叶系数来描绘便达到一个估计:
∑-==10/2)(1
)(ˆP u P uk j e
u a K k s π
由于低频是表示图像的大体信息,而高频是表示图像的细节信息,所以用少量的傅里叶描绘子便可以捕获边界的大体特征。
第三种便是统计矩,它形如均值、方差、高阶矩之类的形式来描述边界线段,比如均值显示一幅图像的总体灰度水平,方差则是灰度的变化性,三阶矩则是度量关于均值的对称性等等。
2、区域描绘子
第一种是拓扑描绘子,拓扑学是研究未受任何变形影响的图形的性质,该图形未被撕裂或者粘连,对于图形的面积、长度、大小、体积等都是无关的。
比如一个带有孔洞的图像,对于孔洞的数量都与上述度量关系无关,那么便可描绘成拓扑描绘子。
第二种是纹理,描述该区域的纹理的三种主要方法是统计方法、结构方法和频谱方法。
其中统计方法主要采用图像的灰度级直方图的统计矩,与边界的描绘子方法类似。
然而在纹理的图像中,往往一些灰度分布在空间位置中反复出现,在图像空间中相隔某距离的两象素之间会存在一定的灰度关系,即图像中灰度的空间相关特性。
这就利用到了灰度共生矩阵,矩阵中的横纵坐标对应的值分别是该坐标的两个坐标分量在图像中紧挨着出现的次数,那么纹理性的图像会在对应的共生矩阵中出现主对角线上明显的亮度。
结构方法是利用一串字符串来描述的,对于一幅图像的每个元素都可用一个规则符号来表示,那么对于某些具有规律的排布,可利用循环的规则产生式来描述这幅图像的创建。
频谱的方法,顾名思义是利用傅里叶变换将空间域转换到频率域中,然后在频率域中发现纹理的特征。
3、主分量描绘
该方法是针对一组已经配准图像的基础上提出来的方法,对于将配准的图像所对应的每一个像素采用向量的形式放到一幅图像中去,这样一来一幅图像的每一个元素均是由若干个分量组成的向量。
每一个分量可以看做是一个样本,那么对这个总体的每一个元素求协方差,可得协方差矩阵:
}))({(T
x x x m x m x E C --= 其中x m 是总体均值向量,那么这里采用一种变换叫霍特林变换,将向量x 映射为向量y :
)(x m x A y -=
我们可以得到向量y 的协方差矩阵T
x y A AC C =,其中y C 是一个对角矩阵,对角线上的元
素是x C 的特征值。
同样对其进行反变换可以重建x 向量,但此时,我们不使用所有的x C 的特征向量,而
是对应于k 个最大特征值的k 个特征向量来形成矩阵k A ,于是得到重建的向量:
x T k m y A x +=ˆ
由于特征值是根据由大到小排列的,那么也表示每一个分量对重建图像的影响因子是从大到小排列的,这样的重建可以根据在允许的误差内得到最好的重建图像,大大减小了计算量。
总结:本章节主要讲述了表示与描述的一些常用方法,我觉得之所以要对这两者区分是因为对其的应用不同。
可以看到,表示注重的是表达和演示,对于一个程序是由数据结构和算法组成的,程序是最好的表达产物,那么表示必定是要倾向于能够用程序去表达出来,这样的效果是比较直观的,比如在前面众多的讲解中,表示一节重在一个对编码表示的过程,比如对于边界轮廓,目的就是要将边界用实际计算机能够识别的东西去表现出来,于是它更接近于一个程序的伪代码,对于像素点在边界中已经用编码顺序表现出来了,可以直接作为一个输入去执行。
对于表示与我所相关的图像压缩邻域有着很大的关系,不仅仅要把目标表达出来,更要注重如何的表达能够效率最高,最精准,最节省空间,这才是表示的重心。
然而描述重在描写叙述,对于人物的描写,往往我们会写这是个什么样的人,有些什么特征,身高多少,性格如何等等一系列所谓的“特征”去表示,所以用所谓的像素点是无法表达的,于是就要产生一些方法,将目标的一些特征相联系起来。
比如在傅里叶描绘子的时候,它注重空间域当中的一些信息可以在频率域中体现,在进行统计矩描绘的时候,它利用概率统计中的均值、方差、相关等的公式去描述这个图像在这些特性中的体现如何,用产生出来的具体值去勾勒这幅图像中的整体样子是什么样的,这在图像分割中起到了重要的应用。
在上一章的图像分割中,并不是仅仅对图像的像素点的灰度变化进行分割,这只能对很简单的图像的操作,更重要的往往是抓住这个图像区域中的与众不同的特征来进行分割,如何快的找到很好的不同点,往往决定了这个分割算法的好坏。
无论是表示还是描述,都是为了某一个目标而进行的,那么当表达出我们感兴趣的目标的时候,便就要开始下一章的应用:目标的识别。
好的描述与表示方法,对目标的识别将会起到至关重要的作用。