当前位置：文档之家› 数字图像处理

数字图像处理

问题：人为什么能分辨出见过一次的东西？

眼睛是生物体上十分神奇的器官，人类的眼睛可分辨约一千万颜色。他可以感知光线，是人们获得外界信息最主要的途径；同时，眼睛包括含心理意识在的丰富信息。

一、人眼构造

人眼是人身体中最重要的感觉器官，人获取的信息90%以上通过眼睛来获取。人眼的构造决定了人眼成像的原理，同时决定了人眼的特性。人眼相当于一架摄像机或照相机，但在构造方面有别于摄像机和照相机。人眼的成像系统是由角膜、晶状体、前房、后房和玻璃体组成。

角膜——直径为11mm的透明膜，镶嵌于巩膜前面圆孔，其中央部的曲率半径为8mm，周边部比较平坦。

晶状体——形似双凸镜的透明组织，由小带纤维悬挂于瞳孔后面，睫状肌收缩时小带松弛，晶状体依靠其本身的弹性而变厚，前后表面的曲度增加，整体屈

光度增加，利用看清近处物体，称为调节。在角膜和水晶体之间为虹膜，中间开有一个可以自动控制大小的孔，让适当的光线进来，称为瞳孔。

前方、后房——前房为角膜后面、虹膜和晶状体前面的孔隙，充满着房水。后房为位于虹膜后面、睫状体、晶状体周边部之间的孔隙，也充满着房水。房水的主要功能是维持眼压，并维持晶状体的代。

玻璃体——一透明胶样组织，充填于视网膜的空间。占眼球4/5的容积。具有保护视网膜、缓冲震动功能。

视网膜——是接近黑的深红色，反光很弱，其上面布满感光细胞。正对眼球中心有一个直径约为2mm的黄色区域，称为黄斑，黄斑中心有一小凹，称为中央凹，面积为1平方毫米。

视网膜上面有两种感光细胞，一种叫做视锥细胞，另一种叫做视杆细胞。视锥细胞是像一个玉米的锥形，尖向外，只对较强的光敏感，至少有分别感觉红、蓝、绿三种颜色的视锥细胞存在，因此能够感知颜色。视杆细胞只有一种，因此没有颜色感觉，但灵敏度非常高，可以看到非常暗的物体。

视锥细胞在黄斑里面非常集中，尤其是在中央凹里面最为集中，是产生最清晰视觉的地方。视杆细胞恰好在黄斑里面最少，除此之外分布的比较均匀，距离中心10~20度的围相对集中些。

在比较暗的情况下，视锥细胞就不再起作用了，只能是分布广而相对稀疏的视杆细胞起作用，一次人眼的分辨能力大大下降。中心黄斑部分视力下降到0.05，反而不如黄斑以外，非黄斑区域视力基本不变，最好视力在黄斑附近，大约偏离中心15度左右，为0.1，这时的视力，称为暗视觉。但由于视杆细胞只有一种，因此是分辨不出物体颜色的，因此我们观察星云时，看不出颜色。

二、人眼的视觉特征

人眼的视觉系统是世界上最好的图像处理系统，但它远远不是完美的。人眼的视觉系统对图像的认知是非均匀的和非线性的，并不是对图像中的任何变化都能感知。例如图像系数的量化误差引起的图像变化在一定围是不能为人眼所觉察的。因此，如果编码方案能利用人眼视觉系统的一些特点，是可以得到高压缩比的。对人眼视觉特性的深入研究及由此而建立的各种数学模型，一直是各种图像数字压缩算法的基础。

人眼对380～780纳米不同波长的光具有不同的敏感程度，称为人眼的视敏特性。衡量描述人眼视敏特性的物理量为视敏函数和相对视敏函数。

1.1视敏函数

在相同亮度感觉的条件下，不同波长上光辐射功率的倒数可以用来衡量人眼对各波长光明亮感觉的敏感程度。称为视敏函数 K(λ)=1/pr(λ) 。

1.2 相对视敏函数

实验表明，人眼对波长为555纳米的光最敏感，因此把任意波长的光的视敏函数与最大视敏函数值K(555)相比的比值称为相对视敏函数

。

2.1对比灵敏度

人眼对亮度光强变化的响应是非线性的，通常把人眼主观上刚刚可辨别亮度差别所需的最小光强差值称为亮度的可见度阈值。也就是说，当光强I增大时，在一定幅度感觉不出，必须变化到一定值I+ΔI时，人眼才能感觉到亮度有变化，ΔI/I一般也称为对比灵敏度。因此恢复图像的误差如果低于对比灵敏度，即不会被人眼察觉。此外，高频部分在相同的灵敏度阈值下，色差信号Y-R空间频

率只有亮度Y的一半，色差信号Y-B空间频率只有亮度Y的1/4。人眼对于运动图像的对比灵敏度与时间轴上信息的变化速度有关，随着时间轴变化频率的增加，人眼所能感受到的图像信息的误差阈值呈上升趋势，视觉上的这种动态对比灵敏度特性表现为图像序列之间相互掩盖效应。可见度阈值和掩盖效应对图像编码量化器的设计有重要作用，利用这一视觉特性，在图像的边缘可以容忍较大的量化误差，因而可使量化级减少，从而降低数字码率。

2.2分辨率

当空间平面上两个黑点相互靠拢到一定程度时，离开黑点一定距离的观察者就无法区分它们，这意味着人眼分辨景物细节的能力是有限的，这个极限值就是分辨率。研究表明人眼的分辨率有如下一些特点：①当照度太强、太弱时或当背景亮度太强时，人眼分辨率降低。②当视觉目标运动速度加快时，人眼分辨率降低。③人眼对彩色细节的分辨率比对亮度细节的分辨率要差，如果黑白分辨率为1，则黑红为0.4，绿蓝为0.19。

2.3马赫效应

当亮度发生跃变时，会有一种边缘增强的感觉，视觉上会感到亮侧更亮，暗侧更暗。马赫效应会导致局部阈值效应，即在边缘的亮侧，靠近边缘像素的误差感知阈值比远离边缘阈值高3~4倍，可以认为边缘掩盖了其邻近像素，因此对靠近边缘的像素编码误差可以大一些。

三、视觉感知

对时间频率的感知

时间频率即画面随时间变化的快慢。Kelly.D.H用亮度按时间正弦变化的条纹做实验，亮度Yt) = B(1+mcos2πft)。改变m, 测试不同时间频率f下的对比

敏感度。

实验表明时间频率响应还和平均亮度有关。在一般室光强下，人眼对时间频率的响应近似一个带通滤波器。对15~20Hz信号最敏感，有很强闪烁感(flick)，大于75Hz响应为0，闪烁感消失。刚到达闪烁感消失的频率叫做临界融合频率(CFF)。在较暗的环境下，呈低通特性，且CFF会降低，这时对5Hz信号最敏感，大于25Hz闪烁基本消失。电影院环境很暗，放映机的刷新率为24Hz也不感到闪烁, 这样可以减少胶卷用量和机器的转速。而电脑显示器亮度较大，需要75Hz 闪烁感才消失。闪烁消失后，亮度感知等于亮度时间平均值(塔鲁伯法则)。这种低通特性，也可以解析为视觉暂留特性，即当影像消失/变化时，大脑的影像不会立刻消失，而是保留一个短暂时间。生活中常感受到的动态模糊，运动残像也和这个有关。有很多电子产品设计利用了这一现象，例如LED数码管的动态扫描，LED旋转字幕等。

对运动物体感知

观察一个运动物体，眼球会自动跟随其运动，这种现象叫随从运动(eye pursuit movement)。这时眼球和物体的相对速度会降低，我们能更清晰地辨认物体。例如观看球类比赛(如棒球)，尽管棒球的运动速度很快，由于随从运动，我们仍够看得到球的大概样子(但会有运动模糊)。如果我们把眼睛跟着风扇转动方向转动，会发现对扇叶细节看得较清楚。眼球随从最大速度为4～5度/秒，因此我们不可能看清楚一颗子弹飞行。

空间频率

即影像在空间中的变化速度。用亮度呈空间正弦变化的条纹做测试，亮度Y(x,y) = B(1+mcos2πfx), 给定条纹频率f为一固定值(看作是宽度)，改变振幅

m(看作对比度)，测试分辨能力。显然m越大分辨越清楚，测试不同条件下(不同cpd)可分辨的最少m值，定义1/mmin为对比敏感度(contrast sensitivity)。定义人眼的对空间感觉的角度频率：cpd: cycle / degree ，表示眼球每转动一度扫过的黑白条纹周期数。对给定的条纹，这个值与人眼到显示屏的距离有关，对于同样大小的屏幕，离开越远，cpd越大。

通常人眼对空间的感觉相当于一个带通滤波器。最敏感在2~5个cpd ，空间截止频率为30cpd。比如我们看油画和电视机屏幕时，当距离离开一定远，cpd 增大，人的眼睛就分辨不了象素点细节，便感觉不到颗粒感了。

当人观察一个静止影像时，眼球不会静止一处(精神病人除外), 通常停留在一处几百毫秒完成取像后，移到别处取像，如此持续不断。这种运动称为跳跃性运动(saccadic eye movement)。研究表明跳跃性运动可以增大对比敏感度，但敏感度峰值却减少。

四、模式识别

人们在观察事物或现象的时候，常常要寻找它与其他事物或现象的不同之处，并根据一定的目的把各个相似的但又不完全相同的事物或现象组成一类。字符识别就是一个典型的例子。例如数字“4”可以有各种写法，但都属于同一类别。更为重要的是，即使对于某种写法的“4”，以前虽未见过，也能把它分到“4”所属的这一类别。人脑的这种思维能力就构成了“模式”的概念。在上述例子中，模式和集合的概念是分未弄的，只要认识这个集合中的有限数量的事物或现象，就可以识别属于这个集合的任意多的事物或现象。为了强调从一些个别的事物或现象推断出事物或现象的总体，我们把这样一些个别的事物或现象叫作各个模式。

模式识别研究主要集中在两方面，一是研究生物体(包括人)是如何感知对象的，属于认识科学的畴，二是在给定的任务下，如何用计算机实现模式识别的理论和方法。前者是生理学家、心理学家、生物学家和神经生理学家的研究容，后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力，已经取得了系统的研究成果

80年代初（1982，1984，1985），霖提出视觉拓扑理论（visual topological theory）。该理论认为，在视觉处理的早期阶段，人的视觉系统首先检测图形的拓扑性质；它对图形的大围拓扑性质敏感，而对图形的局部几何性质不敏感。图形的拓扑性质（topological properties）：指在拓扑变换下图形保持不变的性质和关系，如连通性（connectedness）、封闭性（closedness）、洞（hole），都是典型的拓扑性质，而大小、角度、平行性等几何性质则不是拓扑性质。按照人们的直觉经验，圆盘、三角形和正方形是明显不同的图形；但按拓扑学的观点，由于它们都是实心图形，因而在拓扑性质上是等价的。相反，圆盘和圆环按直觉经验是相似的，而按其拓扑性质讲，则是不等价的。

霖认为，图形的封闭性、连通性、洞都是图形的拓扑学性质。图形的具体形状可能千差万别，但只要它们的拓扑性质相同，就可以说它们是拓扑性质等价的图形。在视觉早期信息加工中，视觉系统对这些大围的拓扑学性质更加敏感。视觉系统先加工图形的拓扑性质，然后才加工它的局部性质。近年来，霖用神经心理学和电生理学的实验技术，进一步证明了视觉系统的这一特点。

数字图像处理 (2)

数字图像处理的理论基础及发展方向一、数字图像处理的起源及发展数字图像处理(Digital Image Processing) 将图像信号转换成数字信号并利用计算机对其进行处理，起源于20 世纪20年代，目前已广泛地应用于科学研究、工农业生产、生物医学工程、航空航天、军事、工业检测、机器人视觉、公安司法、军事制导、文化艺术等，已成为一门引人注目、前景远大的新型学科，发挥着越来越大的作用。数字图像处理作为一门学科形成于20 世纪60 年代初期，早期的图像处理的目的是改善图像的质量，以人为对象，以改善人的视觉效果为目的，首次获得实际成功应用的是美国喷气推进实验室(J PL)并对航天探测器徘徊者7 号在1964 年发回的几千张月球照片使用了图像处理技术，并考虑了太阳位置和月球环境的影响，由计算机成功地绘制出月球表面地图，随后又对探测飞船发回的近十万张照片进行了更为复杂的图像处理，以致获得了月球的地形图、彩色图及全景镶嵌图，为人类登月创举奠定了坚实的基础，也推动了数字图像处理这门学科的诞生。数字图像处理取得的另一个巨大成就是在医学上获得的成果，1972 年英国EMI 公司工程师Ho usfield 发明了用于头颅诊断的X射线计算机断层摄影装置即CT(Computer Tomograph) 。1975 年EMI 公司又成功研制出全身用的CT 装置，获得了人体各个部位鲜明清晰的断层图像。1979 年这项无损伤诊断技术获得了诺贝尔奖，说明它对人类作出了划时代的贡献。随着图像处理技术的深入

发展，从70 年代中期开始，随着计算机技术和人工智能、思维科学研究的迅速发展，数字图像处理向更高、更深层次发展。人们已开始研究如何用计算机系统解释图像，实现类似人类视觉系统理解外部世界。很多国家，特别是发达国家投入更多的人力、物力到这项研究，取得了不少重要的研究成果。其中代表性的成果是70 年代末MIT 的Ma rr 提出的视觉计算理论，这个理论成为计算机视觉领域其后多年的主导思想。图像理解虽然在理论方法研究上已取得不小的进展，但它本身是一个比较难的研究领域，存在不少困难，因人类本身对自己的视觉过程还了解甚少，因此计算机视觉是一个有待人们进一步探索的新领域。正因为如此，图像处理理论和技术受到各界的广泛重视，当前图像处理面临的主要任务是研究新的处理方法，构造新的处理系统，开拓更广泛的应用领域。二、数字图像处理的研究内容数字图象处理，就是采用计算机对图象进行信息加工。图象处理的主要内容有：图像的采集、增强、复原、变换、编码、重建、分割、配准、嵌拼、融合、特征提取、模式识别和图象理解。对图像进行处理(或加工、分析)的主要目的有三个方面： 1)提高图像的视感质量,如进行图像的亮度、彩色变换,增强、抑制某些成分,对图像进行几何变换等,以改善图像的质量。 2)提取图像中所包含的某些特征或特殊信息,这些被提取的特征或信息往往为计算机分析图像提供便利。提取特征或信息的过程是模式识别或计算机视觉的预处理。提取的特征可以包括很多方面,如频

数字图像处理教学大纲(2014新版)

数字图像处理课程编码：3073009223 课程名称：数字图像处理总学分： 2 总学时：32 (讲课28，实验4) 课程英文名称：Digital Image Processing 先修课程：概率论与数理统计、线性代数、C++程序设计适用专业：自动化专业等一、课程性质、地位和任务数字图像处理课程是自动化专业的专业选修课。本课程着重于培养学生解决智能化检测与控制中应用问题的初步能力，为在计算机视觉、模式识别等领域从事研究与开发打下坚实的理论基础。主要任务是学习数字图像处理的基本概念、基本原理、实现方法和实用技术，并能应用这些基本方法开发数字图像处理系统，为学习图像处理新方法奠定理论基础。二、教学目标及要求 1．了解图像处理的概念及图像处理系统组成。 2．掌握数字图像处理中的灰度变换和空间滤波的各种方法。 3．了解图像变换，主要是离散和快速傅里叶变换等的原理及性质。 4．理解图像复原与重建技术中空间域和频域滤波的各种方法。 5. 理解解彩色图像的基础概念、模型和处理方法。 6. 了解形态学图像处理技术。 7. 了解图像分割的基本概念和方法。三、教学内容及安排第一章：绪论（2学时）教学目标：了解数字图像处理的基本概念，发展历史，应用领域和研究内容。通过大量的实例讲解数字图像处理的应用领域；了解数字图像处理的基本步骤；了解图像处理系统的组成。重点难点：数字图像处理基本步骤和图像处理系统的各组成部分构成。 1.1 什么是数字图像处理 1.2 数字图像处理的起源

1.3.1 伽马射线成像 1.3.2 X射线成像 1.3.3 紫外波段成像 1.3.4 可见光及红外波段成像 1.3.5 微波波段成像 1.3.6 无线电波成像 1.3.7 使用其他成像方式的例子 1.4 数字图像处理的基本步骤 1.5 图像处理系统的组成第二章：数字图像基础（4学时）教学目标：了解视觉感知要素；了解几种常用的图像获取方法；掌握图像的数字化过程及其图像分辨率之间的关系；掌握像素间的联系的概念；了解数字图像处理中的常用数学工具。重点难点：要求重点掌握图像数字化过程及图像中像素的联系。 2.1 视觉感知要素（1学时） 2.1.1 人眼的构造 2.1.2 眼镜中图像的形成 2.1.3 亮度适应和辨别 2.2 光和电磁波谱 2.3 图像感知和获取（1学时） 2.3.1 用单个传感器获取图像 2.3.2 用条带传感器获取图像 2.3.3 用传感器阵列获取图像 2.3.4 简单的图像形成模型 2.4 图像取样和量化（1学时） 2.4.1 取样和量化的基本概念 2.4.2 数字图像表示 2.4.3 空间和灰度级分辨率 2.4.4 图像内插 2.5 像素间的一些基本关系（1学时） 2.5.1 相邻像素 2.5.2 临接性、连通性、区域和边界 2.5.3 距离度量 2.6 数字图像处理中所用数学工具的介绍 2.6.1 阵列与矩阵操作

数字图像处理整理经典

名词解释数字图像：是将一幅画面在空间上分割成离散的点（或像元），各点（或像元）的灰度值经量化用离散的整数来表示，形成计算机能处理的形式。 1.数字图像：一幅图像f(x,y)，当x,y 和幅值f 为有限的离散数值时，称该图像为数字图像。图像：是自然生物或人造物理的观测系统对世界的记录，是以物理能量为载体，以物质为记录介质的信息的一种形式。数字图像处理：采用特定的算法对数字图像进行处理，以获取视觉、接口输入的软硬件所需要数字图像的过程。图像增强：通过某种技术有选择地突出对某一具体应用有用的信息，削弱或抑制一些无用的信息。无损压缩：可精确无误的从压缩数据中恢复出原始数据。灰度直方图：灰度直方图是灰度级的函数，描述的是图像中具有该灰度级的像素的个数。或：灰度直方图是指反映一幅图像各灰度级像元出现的频率。细化：提取线宽为一个像元大小的中心线的操作。 8、8-连通的定义：对于具有值V的像素p和q ,如果q在集合N8(p)中,则称这两个像素是8-连通的。 9、中值滤波：中值滤波是指将当前像元的窗口（或领域）中所有像元灰度由小到大进行排序，中间值作为当前像元的输出值。 10、像素的邻域：邻域是指一个像元（x，y）的邻近（周围）形成的像元集合。即{（x=p,y=q）}p、q为任意整数。像素的四邻域：像素p(x,y)的4-邻域是:(x+1,y),(x-1,y) ,(x,y+1), (x,y-1) 11、灰度直方图：以灰度值为自变量，灰度值概率函数得到的曲线就是灰度直方图。 12.无失真编码：无失真编码是指压缩图象经解压可以恢复原图象，没有任何信息损失的编码技术。 13.直方图均衡化：直方图均衡化就是通过变换函数将原图像的直方图修正为平坦的直方图，以此来修正原图像之灰度值。 14.采样：对图像f(x,y)的空间位置坐标（x,y）的离散化以获取离散点的函数值的过程称为图像的采样。 15.量化：把采样点上对应的亮度连续变化区间转换为单个特定数码的过程，称之为量化，即采样点亮度的离散化。 16.灰度图像：指每个像素的信息由一个量化的灰度级来描述的图像，它只有亮度信息，没有颜色信息。 17.色度：通常把色调和饱和度通称为色度，它表示颜色的类别与深浅程度。 18.图像锐化：是增强图象的边缘或轮廓。 19.直方图规定化（匹配）：用于产生处理后有特殊直方图的图像的方法 20. 数据压缩：指减少表示给定信息量所需的数据量。像素的邻域:邻域是指一个像元（x，y）的邻近（周围）形成的像元集合。即{（x=p,y=q）}p、q为任意整数。像素的四邻域:像素p(x,y)的4-邻域是:(x+1,y),(x-1,y) ,(x,y+1), (x,y-1) 灰度直方图:灰度直方图是指反映一幅图像各灰度级像元出现的频率。、中值滤波:中值滤波是指将当前像元的窗口（或领域）中所有像元灰度由小到大进行排序，中间值作为当前像元的输出值。像素数字图像是由有限的元素组成的，每个元素都有一个特定的位置和幅值，这些元素称为图像元素、画面元素或像素。 4.空间分辨率：是图像中可辨别的最小细节。灰度级分辨率：是指在灰度级别中可分辨的最小变化。

数字图像处理

院系：计算机科学学院专业：计算机科学与技术年级： 09级课程名称：数字图像处理组号： 25组指导教师：孙阳光学号：姓名： 2012 年 6 月 13 日

年级班号学号专业姓名实验名称MATLAB图像处理编程基础实验类型设计型综合型创新型 √ 实验目的或要求加深对数字图像处理理论课程的理解，进一步熟悉数字图像处理课程的相关算法和原理选择一副图像，叠加椒盐噪声，分别用邻域平均法和中值滤波法对该图像进行滤波，显示滤波后的图像，比较和分析各滤波器的效果。选择一副图像，叠加零均值高斯噪声，设计一种处理方法，既能去噪声，又能保持边缘清晰。

实验原理（算法流程图或者含注释的源代码）二、算法原理平滑滤波器用滤波模板确定的领域内象素的平均灰度值去代替图像中的每一个像素点的值，这种处理减少了图像灰度的“尖锐”变化,常称为邻域平均法。邻域平均法有力地抑制了噪声，同时也引起了模糊，模糊程度与邻域半径成正比。中值滤波法是一种非线性平滑技术，它将每一象素点的灰度值设置为该点某邻域窗口内的所有象素点灰度值的中值.中值滤波法对消除椒盐噪音非常有效。图像平滑往往使图像中的边界、轮廓变得模糊，为了减少这类不利效果的影响，这就需要利用图像锐化技术，使图像的边缘变的清晰。图像锐化处理的目的是为了使图像的边缘、轮廓线以及图像的细节变的清晰。三、Matlab代码 1: I = imread('eight.tif'); J = imnoise(I,'salt & pepper',0.02); subplot(231); imshow(I);title('原图象'); subplot(232); imshow(J);title('添加椒盐噪声图象'); k1 = filter2(fspecial('average', 3), J); k2 = filter2(fspecial('average', 5), J); k3 = filter2(fspecial('average', 7), J); k4 = filter2(fspecial('average', 9), J); subplot(233); imshow(uint8(k1));title('3×3模板平滑滤波'); subplot(234); imshow(uint8(k2));title('5×5模板平滑滤波'); subplot(235); imshow(uint8(k3));title('7×7模板平滑滤波'); subplot(236); imshow(uint8(k4));title('9×9模板平滑滤波'); I = imread('eight.tif'); J = imnoise(I,'salt & pepper',0.02); subplot(231); imshow(I);title('原图象'); subplot(232); imshow(J);title('添加椒盐噪声图象'); k1 = medfilt2(J); k2 = medfilt2(J,[5,5]); k3 = medfilt2(J,[7,7]); k4 = medfilt2(J,[9,9]); subplot(233); imshow(k1);title('3×3模板中值滤波'); subplot(234); imshow(k2);title('5×5模板中值滤波'); subplot(235); imshow(k3);title('7×7模板中值滤波'); subplot(236); imshow(k4);title('9×9模板中值滤波');

数字图像处理_图片识别

研究生课程考核试卷（适用于课程论文、提交报告）科目：数字图像处理教师：黄鸿姓名：潘世强学号：20110802096 专业：仪器科学与技术类别：（学术）上课时间：2011年10月至2012年01月考生成绩：阅卷评语：阅卷教师(签名) 重庆大学研究生院制

CHONGQING UNIVERSITY 数字图像处理 ——基于内容的图像检索系统学院：光电工程学院姓名：潘世强学号：20110802096 指导教师：黄鸿时间： 2012年01月08日

基于内容的图像检索系统摘要：随着多媒体技术的迅速发展，图像数据库也急剧膨胀起来，如何高效、快速地从像资源中获取有用的图像成了信息检索技术研究的热点。本文主要针对基于内容的图像检索技术（CBIR）做了相关的介绍，对基于图像检索技术中的特征提取技术进行了较为详细的阐述，研究了图像颜色的提取方法，以及图像间相似性度量方法。本文运用的特征值提取方法为颜色直方图的方法，对图像提取颜色特征，并根据这些特征对目标图片与图片库中的图片进行了相似度排序，最后运用Matlab软件对上述方法进行验证，得到图像检索结果，从而实现基于内容的图像检索。关键词：直方图HIS彩色空间基于内容图像检索 1．引言图像是对客观对象的一种相似性的、生动性的描述或写真。或者说图像是客观对象的一种表示，它包含了被描述对象的有关信息。它是人们最主要的信息源。据统计，一个人获取的信息大约有75%来自视觉。俗话说“百闻不如一见”，“一目了然”，都反映了图像在信息传递中的独特效果。所谓基于图像内容检索，即从图像库中查找含有特定目标的图像，也包括从连续的视频图像中检索含有特定目标的视频片段。它区别于传统的图像检索手段，融合了图像理解技术，从而可以提供更有效的检索手段。本文主要针对基于内容的图像检索技术中的特征提取方法展开论述，简要地介绍了近年来基于内容的图像检索中颜色、纹理、形状及语义特征的描述方法，并对颜色特征的描述方法以及特征相似性做了详细的论述。

《数字图像处理》课程学习心得

《数字图像处理》课程学习心得导读：本文《数字图像处理》课程学习心得，仅供参考，如果能帮助到您，欢迎点评和分享。《数字图像处理》课程学习心得（一）在这一学期，我选修了《数字图像处理基础》这门课程，同时，老师还讲授了一些视频处理的知识。在这里，梳理一下这学期学到的知识，并提出一些我对这门课程的建议。图像处理是指对图像信息进行加工，从而满足人类的心理、视觉或者应用的需求的一种行为。图像处理方法一般有数字法和光学法两种，其中数字法的优势很明显，已经被应用到了很多领域中，相信随着科学技术的发展，其应用空间将会更加广泛。数字图像处理又称为计算机图像处理，它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理是从20世纪60年代以来随着计算机技术和VLSL的发展而产生、发展和不断成熟起来的一个新兴技术领域。数字图像处理技术其实就是利用各种数字硬件与计算机，对图像信息通过转换而得到的电信号进行相应的数学运算，例如图像去噪、图像分割、提取特征、图像增强、图像复原等，以便提高图像的实用性。其特点是处理精度比较高，并且能够对处理软件进行改进来优化处理效果，操作比较方便，但是由于数字图像需要处理的数据量一般很大，因此处理速度有待提高。目前，随着计算机技术的不断发展，计算机的运算速度得到了很大程度的提高。在短短的历史中，它

却广泛应用于几乎所有与成像有关的领域，在理论上和实际应用上都取得了巨大的成就。 1、数字图像处理需用到的关键技术由于数字图像处理的方便性和灵活性，因此数字图像处理技术已经成为了图像处理领域中的主流。数字图像处理技术主要涉及到的关键技术有：图像的采集与数字化、图像的编码、图像的增强、图像恢复、图像分割、图像分析等。图像的采集与数字化：就是通过量化和取样将一个自然图像转换为计算机能够处理的数字形式。图像编码：图像编码的目的主要是来压缩图像的信息量，以便能够满足存储和传输的要求。图像的增强：图像的增强其主要目的是使图像变得清晰或者将其变换为机器能够很容易分析的形式，图像增强方法一般有：直方图处理、灰度等级、伪彩色处理、边缘锐化、干扰抵制。图像的恢复：图像恢复的目的是减少或除去在获得图像的过程中因为各种原因而产生的退化，可能是由于光学系统的离焦或像差、被摄物与摄像系统两者之间的相对运动、光学或电子系统的噪声与介于被摄像物跟摄像系统之间的大气湍流等等。图像的分割：图像分割是将图像划分为一些互相不重叠的区域，其中每一个区域都是像素的一个连续集，通常采用区域法或者寻求区域边界的境界法。图像分析：图像分析是指从图像中抽取某些有用的信息、数据或

数字图像处理

信息工程学院实验报告课程名称：数字图像处理实验项目名称：数字图像处理的基础实验时间：班级：姓名：学号：实验目的: 1.通过本次实验熟悉matlab语言 2.学会对图像的放大缩小处理实验环境: Matlab软件实验内容及过程: 1.数字图像采样过程（1）实现图像4倍、16倍的减采样（缩小）最简单的是减小一半，这样只需取原图的偶（奇）数行和偶（奇）数列构成新的图像。（2）实现图像4倍、16倍的增采样（放大）如果需要将原图像放大k*k倍，则将一个像素值添在新图像的k*k的子块中。注意：减采样或者增采样过程可以使用灰度图像或者彩色图像。编程时候要特别注意灰度图像的数据是2维的，彩色图像的数据是3维的。 2. 数字图像灰度级变换过程（1）将一幅彩色图像转换为256级灰度图像；（2）将一幅256级灰度图像分别转换为64级、16级、8级、2级灰度图像。实验结果及分析：

1.数字图像采样过程（1）实现图像4倍、16倍的减采样（缩小）设计程序 function Iw = resample(I,m) [a,b] = size(I); aa = floor(a/m); bb = floor(b/m); Iw=zeros(aa,bb); for i=1:aa for j=1:bb Iw(i,j)=I(m*(i-1)+1,m*(j-1)+1); end end Iw=uint8(Iw); clc;clear; close all; I=imread('cameraman.tif'); m=4; Iw=resample(I,m); imshow(I); imshow(Iw); n=16; Iw2=resample(I,n); figure:imshow(Iw2); figure:imshow(I); 实验结果（2）实现图像4倍、16倍的增采样（放大） function Iw = resample2(I,m) [a,b] = size(I); for i=1:a for j=1:b Iw(m*i,m*j)=I(i,j); end end Iw=uint8(Iw);clc; clear; close all; I=imread('cameraman.tif'); m=4; Iw=resample2(I,m); imshow(I); imshow(Iw); figure:imshow(I);

(完整word版)数字图像处理试题集2(精减版)

第一章概述一.填空题 1. 数字图像是用一个数字阵列来表示的图像。数字阵列中的每个数字，表示数字图像的一个最小单位，称为__________。 5. 数字图像处理包含很多方面的研究内容。其中，________________的目的是根据二维平面图像数据构造出三维物体的图像。解答:1. 像素5. 图像重建第二章数字图像处理的基础一.填空题 1. 量化可以分为均匀量化和________________两大类。 3. 图像因其表现方式的不同，可以分为连续图像和________________两大类。 5. 对应于不同的场景内容，一般数字图像可以分为________________、灰度图像和彩色图像三类。解答: 1. 非均匀量化 3. 离散图像 5. 二值图像二.选择题 1. 一幅数字图像是：( ) A、一个观测系统。 B、一个有许多像素排列而成的实体。 C、一个2-D数组中的元素。 D、一个3-D空间的场景。 3. 图像与灰度直方图间的对应关系是：（） A、一一对应 B、多对一 C、一对多 D、都不对 4. 下列算法中属于局部处理的是：（） A、灰度线性变换 B、二值化 C、傅立叶变换 D、中值滤波 5. 一幅256*256的图像，若灰度级数为16，则该图像的大小是：（） A、128KB B、32KB C、1MB C、2MB 6. 一幅512*512的图像，若灰度级数为16，则该图像的大小是：（） A、128KB B、32KB C、1MB C、2MB 解答:1. B 3. B 4. D 5. B 6. A 三.判断题 1. 可以用f(x,y)来表示一幅2-D数字图像。（） 3. 数字图像坐标系与直角坐标系一致。（） 4. 矩阵坐标系与直角坐标系一致。（） 5. 数字图像坐标系可以定义为矩阵坐标系。（） 6. 图像中虚假轮廓的出现就其本质而言是由于图像的灰度级数不够多造成的。（） 10. 采样是空间离散化的过程。（）解答:1. T 3. F 4. F 5. T 6. T 10. T 1、马赫带效应是指图像不同灰度级条带之间在灰度交界处存在的毛边现象（√）第三章图像几何变换一.填空题 1. 图像的基本位置变换包括了图像的________________、镜像及旋转。 7. 图像经过平移处理后，图像的内容________________变化。（填“发生”或“不发生”） 8. 图像放大是从小数据量到大数据量的处理过程，________________对许多未知的数据的估计。（填“需要”或“不需要”） 9. 图像缩小是从大数据量到小数据量的处理过程，________________对许多未知的数据的估计。（填“需要”

数字图像处理

数字图像处理数字图像处理方法的研究源于两个主要应用领域:其一是为了便于人们分析而对图像信息进行改进:其二是为使机器自动理解而对图像数据进行存储、传输及显示。从图像处理到计算机视觉这个连续的统一体内并没有明确的界线。然而,在这个连续的统一体中可以考虑三种典型的计算处理(即低级、中级和高级处理)来区分其中的各个学科。低级处理涉及初级操作,如降低噪声的图像预处理,对比度增强和图像尖锐化。低级处理是以输入、输出都是图像为特点的处理。中级处理涉及分割(把图像分为不同区域或目标物)以及缩减对目标物的描述,以使其更适合计算机处理及对不同目标的分类(识别)。中级图像处理是以输入为图像,但输出是从这些图像中提取的特征(如边缘、轮廓及不同物体的标识等)为特点的。最后,高级处理涉及在图像分析中被识别物体的总体理解,以及执行与视觉相关的识别函数(处在连续统一体边缘)等。图像获取是第一步处理。注意到获取与给出一幅数字形式的图像一样简单。通常,图像获取包括如设置比例尺等预处理。图像增强是数字图像处理最简单和最有吸引力的领域。基本上,增强技术后面的思路是显现那些被模糊了的细节,或简单地突出一幅图像中感兴趣的特征。一个图像增强的例子是增强图像的对比度,使其看起来好一些。应记住,增强是图像处理中非常主观的领域。图像复原也是改进图像外貌的一个处理领域。然而,不像增强,图像增强是主观的,而图像复原是客观的。在某种意义上说,复原技术倾向于以图像退化的数学或概率模型为基础。另一方面,增强以怎样构成好的增强效果这种人的主观偏爱为基础。彩色图像处理已经成为一个重要领域,因为基于互联网的图像处理应用在不断增长。就使得在彩色模型、数字域的彩色处理方面涵盖了大量基本概念。在后续发展,彩色还是图像中感兴趣特征被提取的基础。小波是在各种分辨率下描述图像的基础。特别是在应用中,这些理论被用于

数字图像处理

实验名称：图像分割所属课程：《数字图像处理》实验类型：验证性实验实验类别：专业实验学时：3 一、实验目的 1.使用MatLab 软件进行图像的分割。 2.通过实验体会一些主要的分割算子对图像处理的效果。 3.探索各种因素对分割效果的影响。二、实验原理及过程 1.实验背景在对图像的研究和应用中，人们往往只对图像中的某些部分感兴趣，这些部分通常称为目标或者前景(其他不感兴趣的部分称为背景)。为了分析和辨识目标，需要将它们从背景中提取出来。从图像中提取目标的技术和过程就称为图像分割。图像分割是图像处理中一类重要的研究内容，其目的是把图像分成一些有意义、互不重叠的区域，分割结果的优劣将直接影响图像的后续处理。作为图像分析、理解的基础，图像分割在诸多领域具有广泛的应用，例如基于内容的图像检索、机器视觉、文字识别、指纹识别，以及生物医学图像处理方面的病变检测和识别，军事图像处理方面的地形匹配与目标制导，工业图像处理方面的无损探伤和非接触式检测等。另外，图像分割技术也已用于图像压缩编码，近年来发展起来的基于内容的视频编码(如MPEG-4)同样离不开图像分割的结果。 2.实验设计指标 ?能够自行评价各主要算子在无噪声条件下和噪声条件下的分割性能。 ?能够掌握分割条件(阈值等)的选择。 ?完成规定图像的处理并要求正确评价处理结果 ?能够从理论上作出合理的解释。 3.实验要求（设计要求）

(1)使用Roberts 算子的图像分割实验调入并显示图像；使用Roberts 算子对图像进行边缘检测处理； Roberts 算子为一对模板：相应的矩阵为：rh = [0 1；-1 0]； rv = [1 0；0 -1]；这里的rh 为水平Roberts 算子，rv为垂直Roberts 算子。分别显示处理后的水平边界和垂直边界检测结果；用“欧几里德距离”和“街区距离”方式计算梯度的模，并显示检测结果；对于检测结果进行二值化处理，并显示处理结果；注意： ?先做检测结果的直方图，参考直方图中灰度的分布尝试确定阈值。 ?应反复调节阈值的大小，直至二值化的效果最为满意为止。 ?分别显示处理后的水平边界和垂直边界检测结果。 ?将处理结果转化为“白底黑线条”的方式。 ?给图像加上零均值的高斯噪声；对于噪声图像重复步骤b~f。 (2)使用Prewitt 算子的图像分割实验使用Prewitt 算子进行内容(1)中的全部步骤。 (3)使用Sobel 算子的图像分割实验使用Sobel 算子进行内容(1)中的全部步骤。 (4)使用LoG (拉普拉斯-高斯)算子的图像分割实验使用LoG (拉普拉斯-高斯)算子进行内容(1)中的全部步骤。提示： ?处理后可以直接显示处理结果，无须另外计算梯度的模。 ?注意调节噪声的强度以及LoG (拉普拉斯-高斯)算子的参数，观察处理结果。 (5) 打印全部结果并进行小组讨论。 4.实验（设计）仪器设备和材料清单 ?PC计算机 ?MatLab软件/语言包括图像处理工具箱(Image Processing Toolbox) ?实验所需要的图片 5.实验源代码： ?Roberts 算子、Prewitt 算子、Sobel 算子的图像分割实验 I=imread('F:\matlab作业\1.jpg'); %读取图像 I1=im2double(I); %将彩图序列变成双精度 I2=rgb2gray(I1); %将彩色图变成灰色图

(完整版)学习数字图像处理心得

学习数字图像处理心得姓名：黄冬芬学号：070212051 班级：12级通信工程1班数字图像是我们生活中接触最多的图像种类，他伴随人们的生活、学习、工作，并在军事、工业和医学方面发挥着极大地作用，可谓随处可见，尤其在生活方面作为学生的我们，会在外出旅游，生活和工作中拆下许多数字照片，现在已进入信息化时代，图片作为信息的重要载体，在信息传输方面有着不可替代的作用，并且近年来图像处理领域，数字图像处理技术取得了飞速的发展，作为计算机类专业的大学生更加有必要对数字图像处理技术有一定的掌握，而大多数人对于数字图像的知识也很模糊，比如各类繁多的各种图像格式之间的特点，不同的情况该用何种图像格式，还有关于图像的一些基本术语也不甚了解。尤为重要的是一些由于拍摄问题导致的令人不甚满意的照片该如何处理，或者如何对一些照片进行处理实现特殊的表现效果。所以对于数字图像处理这门课大家有着极大地兴趣。我们班有的同学学过Photoshop软件，因此对于数字图像处理有了一些基础，更加想利用这门课的学习加深自己数字图像处理的理解并提高在数字图像处理方面的能力。通过这8周的学习，我们虽然还没有完全掌握数字图像处理技术，但是收获不少，对于数字图像方面的知识有了更深的了解。更加理解了数字图像处理的本质，即是一些数字矩阵，但灰度图像和彩色图像的矩阵形式是不同的。对于一些耳熟能详的数字图像相关的术语有了明确的认识，比如，常见的像素（衡量图像的大小）、分辨率（衡

量图像的清晰程度）、位图（放大后会失真）、矢量图（经过放大不会失真）等大家都能叫上口但都很模糊的名词。也了解图像处理技术中一些常用处理技术的实质，比如锐化处理是使模糊的图像变清晰，增强图片的边缘等细节。而平滑处理的目的是消除噪声、模糊图像，在提取大目标之前去除小的细节或弥合目标间的缝隙。对常见的RGB图像和灰度图像有了明确的理解，这对大家以后应用Photoshop等图像处理软件对图像进行处理打下了坚实的基础。更重要的是学习到了数字图像处理的思想。通过学习也是对C++编程应用的很好的实践和复习。当然通过8周的学习还远远不够，也有许多同学收获甚微，我总结了下大家后期学习的态度与前期学习的热情相差很大的原因。刚开始大家是有很高的热情去学习这门课，可随着这门课的更深入的学习，大家渐渐发现课程讲授内容与自己起初想学的实用图像处理技术是有很大的差别的，大家更着眼于如何利用软件、技术去处理图像而得到满意的效果，或者进行一些图像的创意设计，可是课程的内容更偏向于如何通过编程实现如何多图像进行一些类似锐化、边缘提取、模糊、去除噪声等基础功能的实现，这其中涉及很多算法、函数，需要扎实的数学基础和编程基础，并且需要利用大量时间在课下编写代码，并用visual c++软件实现并进行调试，然而大部分人的C++实践能力和编程能力还有待提高，尤其是对于矩阵进行操作的编程尤为是个考验。在老师授课方面的建议是可以再课上多进行一些具体操作，这

数字图像处理学(第二版)答案

第四章答案 1.图像增强的目的是什么？其主要目的是使处理后的图像对某种特定的应用来说，比原始图像更适用。2.什么是直方图？直方图就是反映一副图像中的灰度级与出现这种灰度的概率之间关系的图形。 3.直方图修改的技术基础是什么？通过变换函数T(r)可以控制图像灰度级的概率密度函数，从而改变图像的灰度层次。 4.在直方图修改技术中采用的变换函数的基本要求是什么？（1）在0≤r≤1区间内，T(r)单值单调增加；（2）对于0≤r≤1，有0≤T（r）≤1。 5.直方图均衡化处理采用何种变换函数？累计分布函数 6.直方图均衡化处理的结果是什么？扩展了原始图像的灰度范围 7.假定有64×64大小的图像，灰度为16级，概率分布如下表，试用直方图均衡

00.10.20.30.40.50.60.70.80.91 原图像直方图 S0=0.195 S1=0.335 S2=0.502 S3=0.608 S4=0.681 S5=0.737 S6=0.786 S7=0.827 S8=0.864 S9=0.895 S10=0.922 S11=0.945 S12=0.964 S13=0.981 S14=0.993 S15=1 00.10.20.30.40.50.60.70.80.91 变

换之后 s0≈3/15 s1≈5/15 s2≈8/15 s3≈9/15s4≈10/15 s5≈11/15 s6≈12/15 s7≈12/15 s8≈13/15 s9≈13/15 s10≈14/15 s11≈14/15 s12≈1 s13≈1 s14≈1 s15≈1 00.10.20.30.40.50.60.70.80.91 最后的新直方图 8.（略） 9.直方图均衡化处理的主要步骤是什么？（1）对给定的待处理图像统计其直方图，求出Pr(R)；（2）根据统计出的直方图采用累积分布函数做变换 Sk=T(Rk) 求变换后的新灰度；（3）用新灰度代替旧灰度，求出Ps(s)，这一步是近似过程，应根据处理目的尽量做到合理，同时把灰度值相等活近似地合并到一起。 10.什么是“简并”现象？如何克服？变换后的灰度级减少了，这种现象称为简并。克服：（1）增加像素的比特数；（2）采用灰度间隔放大理论。 11.直方图规定化处理的技术难点是什么？如何解决？主要困难在于如何构成有意义的直方图。解决方法：（1）给定一个规定的概率密度函数，如高斯、瑞利等函数；（2）规定一个任意可控制的直方图，其形状可由一些直线组成，得到希望的形状后，将这个函数数字化。 12.试写一段直方图均衡化处理的程序。

数字图像处理第三版中文答案--冈萨雷斯

第二章（第二版是和*的矩形，第三版是和圆形）对应点的视网膜图像的直径x 可通过如下图题所示的相似三角形几何关系得到，即 ()()017 023 02.x .d = 解得x=。根据节内容，我们知道：如果把中央凹处想象为一个有337000 个成像单元的圆形传感器阵列，它转换成一个大小2 5327.?π成像单元的阵列。假设成像单元之间的间距相等，这表明在总长为1.5 mm （直径）的一条线上有655个成像单元和654个成像单元间隔。则每个成像单元和成像单元间隔的大小为s=[(1.5 mm)/1309]=×10-6 m 。如果在中央凹处的成像点的大小是小于一个可分辨的成像单元，在我们可以认为改点对于眼睛来说不可见。换句话说，眼睛不能检测到以下直径的点： m .d .x 61011060-?<=，即m .d 610318-?< 当我们在白天进入一家黑暗剧场时，在能看清并找到空座时要用一段时间适应。节描述的视觉过程在这种情况下起什么作用亮度适应。虽然图中未显示，但交流电的却是电磁波谱的一部分。美国的商用交流电频率是77HZ 。问这一波谱分量的波长是多少、光速c=300000km/s ，频率为77Hz 。因此λ=c/v= * 108(m/s)/77(1/s) = *106m = 3894 Km. 根据图得：设摄像机能看到物体的长度为x (mm)，则有:500/x=35/14; 解得：x=200，所以相机的分辨率为：2048/200=10;所以能解析的线对为：10/2=5线对/mm. 假设中心在（x0,y0）的平坦区域被一个强度分布为： ])0()0[(2 2),(y y x x Ke y x i -+--= 的光源照射。为简单起见，假设区域的反射是恒定的，并等于，令K=255。如果图像用k 比特的强度分辨率进行数字化，并且眼睛可检测相邻像素间8种灰度的突变，那么k 取什么值将导致可见的伪轮廓解：题中的图像是由： ()()()()()[]()()[]2 02 02 02 025501255y y x x y y x x e .e y ,x r y ,x i y ,x f -+---+--=?== 一个截面图像见图（a ）。如果图像使用k 比特的强度分辨率，然后我们有情况见图（b ），其中()k G 21255+=?。因为眼睛可检测4种灰度突变，因此，k G 22564==?，K= 6。

数字图像处理学习报告

数字图像处理学习报告在这一学期，我选修了《数字图像处理基础》这门课程，同时，老师还讲授了一些视频处理的知识。在这里，梳理一下这学期学到的知识，并提出一些我对这门课程的建议。图像处理是指对图像信息进行加工，从而满足人类的心理、视觉或者应用的需求的一种行为。图像处理方法一般有数字法和光学法两种，其中数字法的优势很明显，已经被应用到了很多领域中，相信随着科学技术的发展,其应用空间将会更加广泛。数字图像处理又称为计算机图像处理，它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程.数字图像处理是从20世纪60年代以来随着计算机技术和VLSL的发展而产生、发展和不断成熟起来的一个新兴技术领域。数字图像处理技术其实就是利用各种数字硬件与计算机，对图像信息通过转换而得到的电信号进行相应的数学运算，例如图像去噪、图像分割、提取特征、图像增强、图像复原等，以便提高图像的实用性。其特点是处理精度比较高，并且能够对处理软件进行改进来优化处理效果,操作比较方便，但是由于数字图像需要处理的数据量一般很大，因此处理速度有待提高。目前，随着计算机技术的不断发展，计算机的运算速度得到了很大程度的提高。在短短的历史中，它却广泛应用于几乎所有与成像有关的领域，在理论上和实际应用上都取得了巨大的成就。 1. 数字图像处理需用到的关键技术由于数字图像处理的方便性和灵活性，因此数字图像处理技术已经成为了图像处理领域中的主流。数字图像处理技术主要涉及到的关键技术有：图像的采集与数字化、图像的编码、图像的增强、图像恢复、图像分割、图像分析等。图像的采集与数字化：就是通过量化和取样将一个自然图像转换为计算机能够处理的数字形式。图像编码：图像编码的目的主要是来压缩图像的信息量，以便能够满足存储和传输的要求。图像的增强：图像的增强其主要目的是使图像变得清晰或者将其变换为机器能够很容易分析的形式，图像增强方法一般有：直方图处理、灰度等级、伪彩色处理、边缘锐化、干扰抵制。图像的恢复：图像恢复的目的是减少或除去在获得图像的过程中因为各种原因而产生的退化，可能是由于光学系统的离焦或像差、被摄物与摄像系统两者之间的相对运动、光学或电子系统的噪声与介于被摄像物跟摄像系统之间的大气湍流等等。图像的分割：图像分割是将图像划分为一些互相不重叠的区域，其中每一个区域都是像素的一个连续集，通常采用区域法或者寻求区域边界的境界法。图像分析：图像分析是指从图像中抽取某些有用的信息、数据或度量,其目的主要是想得到某种数值结果。图像分析的内容跟人工智能、模式识别的研究领域有一定的交叉。

数字图像处理基础知识总结

第一章数字图像处理概论 *图像是对客观存在对象的一种相似性的、生动性的描述或写真。 *模拟图像空间坐标和明暗程度都是连续变化的、计算机无法直接处理的图像 *数字图像空间坐标和灰度均不连续的、用离散的数字（一般整数）表示的图像（计算机能处理）。是图像的数字表示，像素是其最小的单位。 *数字图像处理（Digital Image Processing）利用计算机对数字图像进行（去除噪声、增强、复原、分割、特征提取、识别等）系列操作，从而获得某种预期的结果的技术。（计算机图像处理） *数字图像处理的特点（优势）（1）处理精度高，再现性好。（2）易于控制处理效果。（3）处理的多样性。（4）图像数据量庞大。（5）图像处理技术综合性强。 *数字图像处理的目的（1）提高图像的视感质量，以达到赏心悦目的目的 a.去除图像中的噪声； b.改变图像的亮度、颜色； c.增强图像中的某些成份、抑制某些成份； d.对图像进行几何变换等，达到艺术效果；（2）提取图像中所包含的某些特征或特殊信息。 a.模式识别、计算机视觉的预处理（3）对图像数据进行变换、编码和压缩，以便于图像的存储和传输。 **数字图像处理的主要研究内容（1）图像的数字化 a.如何将一幅光学图像表示成一组数字，既不失真又便于计算机分析处理 b.主要包括的是图像的采样与量化（2*）图像的增强 a.加强图像的有用信息，消弱干扰和噪声（3）图像的恢复 a.把退化、模糊了的图像复原。模糊的原因有许多种，最常见的有运动模糊，散焦模糊等（4*）图像的编码 a.简化图像的表示，压缩表示图像的数据，以便于存储和传输。（5）图像的重建 a.由二维图像重建三维图像（如CT）（6）图像的分析 a.对图像中的不同对象进行分割、分类、识别和描述、解释。（7）图像分割与特征提取 a.图像分割是指将一幅图像的区域根据分析对象进行分割。 b.图像的特征提取包括了形状特征、纹理特征、颜色特征等。（8）图像隐藏 a.是指媒体信息的相互隐藏。 b.数字水印。 c.图像的信息伪装。（9）图像通信

数字图像处理

1、图像处理的基本概念和术语 1.数字图像 2.数字图像处理 3.亮度函数入射分量反射分量 4.图像分辨率图像深度 5.色彩的基本属性 RGB HSI HSV HSB 6.主观颜色 7.采样采样处理 8.图像信号的量化 9.直方图累积直方图连续图像幅度的密度函数幅度分布函数 10.点运算代数运算几何运算 11.双线性插值 12.线性系统移不变系统线性移不变系统 13.单位冲击单位冲击响应 14.卷积相关 15.图像幅度信息量信息熵 16.积分变换 17.傅里叶变换对傅里叶振幅谱傅里叶相位谱傅里叶能量谱 18.快速傅里叶变换 19.图像增强技术图像复原技术 20.动态范围灰度级 21.直方图均衡化直方图规定化图像平滑图像锐化 22.空域增强（滤波）频域增强（滤波）同态增强（滤波） 23.数字压缩图像的均方信噪比 24.香农信息保持定理图像冗余度编码效率 25.有损压缩无损压缩 26.率失真理论 27.假色彩与伪色彩 2、典型图像处理的基本过程及相关硬件设备 3、数字图像处理的主要内容 4、数字图像处理涉及的主要数字工具 1.直方图幅度密度函数概率分布 2.卷积 3.积分变换（傅里叶变换 DCT等） 4.代数运算与图像合成五、图像增强的基本方法 1.直方图增强：均衡规定

2.平滑：均值滤波中值滤波低通滤波多图像平均法自适应滤波 3.锐化：微分锐化高通锐化 4. 同态滤波 6、图像退化的数学模型及复原中的主要问题 7、图像压缩与编码 1.无损编码 Huffman编码算术编码双字长编码行程编码 2.有损预测编码 3.JPEG利用DCT编码与解码的基本过程八、图像分析与识别基础 1.视觉再认模式 2.常用图像分割方法点检测与线检测边缘检测：梯度算子拉普拉斯算子高斯拉普拉斯算子门限值分割：全局门限局部门限自适应门限区域生长区域分裂与合并形态学的边缘提取与分水岭算法 9、形态学图像处理腐蚀膨胀闭开轮廓提取区域填充 10、图像表示连码一阶差分码形状数灰度共生矩阵

数字图像处理作业2

数字图像处理作业学院：专业班级：姓名：学号：

摘要 MATLAB全称是Matrix Laboratory（矩阵实验室），一开始它是一种专门用于矩阵数值计算的软件，从这一点上也可以看出，它在矩阵运算上有自己独特的特点。实际上MATLAB中的绝大多数的运算都是通过矩阵这一形式进行的。这一特点也就决定了MATLAB在处理数字图像上的独特优势。理论上讲，图像是一种二维的连续函数，然而在计算机上对图像进行数字处理的时候，首先必须对其在空间和亮度上进行数字化，这就是图像的采样和量化的过程。二维图像进行均匀采样，就可以得到一幅离散化成M×N样本的数字图像，该数字图像是一个整数阵列，因而用矩阵来描述该数字图像是最直观最简便的了。而MATLAB的长处就是处理矩阵运算，因此用MATLAB处理数字图像非常的方便。 MATLAB支持五种图像类型，即索引图像、灰度图像、二值图像、RGB图像和多帧图像阵列；支持BMP、GIF、HDF、JPEG、PCX、PNG、TIFF、XWD、CUR、ICO等图像文件格式的读、写和显示。MATLAB对图像的处理功能主要集中在它的图像处理工具箱（Image Processing Toolbox）中。图像处理工具箱是由一系列支持图像处理操作的函数组成，可以进行诸如几何操作、线性滤波和滤波器设计、图像变换、图像分析与图像增强、二值图像操作以及形态学处理等图像处理操作。

一、MATLAB语言的基本操作 MATLAB语言是一种运算纸型的运算语言，其特点就是与平时在运算纸上书写运算的形式相同，这使得它成为一种比较容易掌握的语言；其变量均以矩阵向量形式表示（单独一个数据可以认为是一维向量）；其程序语法类似于C语言，只要有一点C语言基础的人可以很快掌握。针对数字图像处理的需要，可以重点掌握以下几个内容：矩阵、向量的输入和操作（包括如何输入一个矩阵，如何产生一个全零全一的矩阵，如何对一个矩阵的行列元素进行读取、写入）；矩阵与向量的基本运算（包括加、减、点乘等）二、MATLAB中图像文件的读/写（a）imread imread函数用于读入各种图像文件，其一般的用法为 [X，MAP]=imread( ‘filename’, ‘fmt’) 其中，X为读出的图像数据，MAP为颜色表数据（或称调色板，亦即颜色索引矩阵，对灰度图像和RGB彩色图像，该MAP为空矩阵），fmt为图像的格式（可以缺省），filename为读取的图像文件（可以加上文件的路径）。例：[X，MAP]=imread(‘flowers.tif’, ‘tif’) （b）imwrite imwrite函数用于输出图像，其语法格式为： imwrite(X, MAP, filename, fmt) imwrite(X, MAP, filename, fmt) 按照fmt指定的格式将图像数据矩阵X