当前位置:文档之家› 图像视频处理技术论文

图像视频处理技术论文

图像视频处理技术论文
图像视频处理技术论文

第一章绪论

1.1 引言

最近的几十年里,通信技术的发展日新月异,技术更新也非常快速。图像和视频处理技术作为信号处理技术发展的产物,已经越来越引起国际社会的关注。一个产业的发展离不开标准化,正是基于此国际学术会议以及相关组织所提出的标准化建议或协议就相当重要了。近些年,一系列国际图像和视频压缩编码标准的制定和更新,使得编码压缩技术技术和相关产业日趋成熟,极大的促进了图像视频信号处理技术在社会生活中的应用。尤其是在最近几年,第三代移动通信技术正在蓬勃发展,它将无线通信与国际互联网等各种多媒体通信结合,是当今社会极具发展潜力和价值的新一代移动通信系统。面对巨大的移动终端市场,进行视频压缩也更有利于通信交互,这将会极大地促进通信技术的推广和发展。因此,科技的更新和用户的要求对各种信号的处理技术有了更高的标准。为了适应各种现代通信和信息传输网络的技术要求,除了继续使用与传统的信号处理技术相同的技术外,在此基础上,还应该提出一个新的信号处理技术,算法,模型,以满足应用的需求。

2003年,ITU和ISO联合制定出H.264/AVC,该标准也是至今最新、最先进的的视频压缩编码标准。H.264/AVC以先前制定的视频编码标准为基础,集合了其中的一些已经得到足够发展技术也很成熟的算法,同时吸收了视频编码和图像处理领域里的一些为提高编码性能所提出的最新最有效地研究成果。H.264极大地提高了编码效率,在增强网络适应性方面也有很大的飞跃,它的最终目标是适应人们对基于网络应用的视频多媒体信号的个性要求。

联合视频小组(joint video team,JVT)所提出的新视频编码标准——H.264,与以往标准相比在编码效率方面具有显著的优势;但为了提高压缩效率,它所带来的的高计算复杂度是实际应用领域所承受不了的。在H.264的参考软件JM中,运动估计和模式决策占了大部分的时间。所以,研究简单快速的算法对提高H.264/AVC在实时领域中的应用有着极其重大的意义。

对H.264的一些主要算法进行改进,需要完成的主要工作集中在不对编码质量造成过大影响的前提下减少其编码时间提高编码效率,因此,大部分的研究工作都是为了寻求更合适更快速的算法。

1.2 视频编码标准发展历程介绍

从1984年CCITT研究组发布的第一个视频领域编码标准H.120开始,迄今为止已相继提出了众多国际标准。视频编码标准发展至今也有近三十年的历史,这段历史的一个转折点就是1988年CCITT所提出的H.261建议,从这个转折点开始,国际标准组织ITU-T、ISO 等开始公布了一系列的以H.261为基础的视频编码标准,从此视频编码标准的编码方法统一采用了基于波形的混合编码方法。

一些国际标准组织有联合图像专家组(JPEG,Joint Photographic Experts Group),它是于1986年由ISO和CCITT 联合成立的。此外还有活动图像专家组(MPEG,Moving Picture Expert Group),它于1988年由ISO/IEC信息技术联合委员会组成;并分别在1991 年和1994年公布了MPEG-1 视频编码标准以及MPEG-2 视频编码标准。

新一代视频编码标准H.264 于2003年3月由ITU-T 和ISO/IEC 正式提出,该标准实现了良好的压缩效率,同时对网络具备了良好的亲和性和兼容性,对实时系统的应用及其有帮助。不久的将来,国际视频组织即将推出HIVC,即H.265,可想而知的是该标准的发布将会带来新一轮的研究热潮,对视频的发展和应用也会产生巨大的影响。

1.2.1 视频编码原理

图像(image)的定义是自然景物中物体反射的可见光的强度,也可以是其它的各类电磁波反射后的强度反映。在图像信息处理的过程中用数字来描述图像中的像素点、强度和颜色等信息。在显示的时候,它是通过数字化的方式将呈现对象用一定的分辨率加以分辨后对得到的色彩信息进行呈现,如此可以快速显示在屏幕上[1]。在显示的过程中分辨率和灰度是主要影响参数。图像适用于表现那些含有大量细节(如亮度变化、场景变换、轮廓明显、色彩丰富)的对象,如:影片、绘画等。图像软件可以对复杂图像进行处理,从而得到质量更高的图像,比如提高清晰度或者产生符合个性要求的特殊效果。

运动视频数据本质上就是时间顺序的图片序列,而相机通常每秒产生约24,25,或30帧。这就导致需要处理大量的数据,因此需要使用到压缩技术。例如:假设每个图片都有一个相对较低的QCIF,即176*144样本,每个样本用8个比特表示,我们每三个图片跳过两个以削减比特率。对于彩色图片,三色组成样本对于为每个像素表现足够的色彩空间是必要的。即使是传输这种相对低的高保真的图片序列,原始数据源速率仍然超过6Mbit/s。然而,今天低成本的传输通道经常工作在低得多的数据率,从而视频信号的数据率需要进一步压缩。例如,使用V.34调制解调器在拨号模拟电话线上传输率最多为33.4 Kbit/s,我们仍然需要进一步压缩视频码率至200倍左右(如果音频同一通道耗时6 Kbit/s或电话线实现太吵以至于不能实现V.34的全比特率,压缩率将会更高)。

视频中的每幅图像被称为一帧(flame),当连续的图像以每秒超过24帧画面以上的速度进行变化时,根据视觉暂留原理可知,人眼是无法辨别单幅的静态画面的;看上去则近似于平滑连续的视觉效果,这样在人眼中形成的连续的画面叫做视频。视频其实就是在时间轴上的一组图像序列的组合,通常也被称为视频图像、视频序列等。视频技术最早是为了电视系统而发展,但现在已经扩展成了多种广泛应用的格式,这样极大地方便了消费者将视频记录下来。

从自然世界所获取的视频场景属于模拟视频信号,通常可以表示为时间与空间上的连续函数[1]。计算机内部是以数字形式来描述信息的,为了更方便地用计算机对最终得到的视频进行一些基本操作,如:处理,传输、存储和加工等;需要对需要处理的模拟信号进行时间空间域的转换,即是讲视频进行数字化处理,最终将模拟视频转换为数字视频。为把模拟视频它转换成数字视频,需要对坐标和幅度分别进行采样操作。数字化坐标值称为采样,包括空间采样和时间采样;而幅度值的数字化则称为量化过程。

最终得到的数字视频信号包含了大量的数据信息,需要对其进行一定的压缩编码才能在实时通信系统中得到实际的应用,也即满足对网络带宽的要求进行实时传输。

数据作为信息的载体,但是数据和信息是两个不同的概念,终归不能完全等价。要想对数字视频进行压缩,就要了解数字视频的特点。数字视频的一个独特特点就是其具有相关性。如果能够利用这些相关性,对数字视频里的各种信息冗余进行去除便能实现对视频信号的压缩。一般将数字视频信号中的冗余归为下面几类[2]:

A:空间冗余。数字图像是视频的基本元素,数字图像的得到要通过对模拟视频信号进行空间采样。这些构成图像的相近像素之间是紧密相关的,即他们之间的像素值一般是没有太大的相差的。当需要预测当前像素的数值时,可以通过分析其相邻像素的数值进而通过一

些数学规则来进行预测而达到目的。

B:时间冗余。从视觉的理论出发,视频是一连串人们看起来连续的图像;但实际上这些图像之间是有间隔的,也就是不连续的。视频帧与帧之间的采样间隔是非常小的,这是为了满足人们对视频信号连续视觉效果的要求。在几乎静止不动的环境中,当前帧和其邻近帧的图像内容几乎是是完全一致的;而在研究场景中变换的运动目标时,若是能掌握其运动规律,也可以很轻易地地由前面帧的图像推算出它在当前帧中的大概位置。这就是视频序列中的时间冗余。

C:心理视觉冗余。总而言之,大部分情况下最终的视频编码系统都是由人类视觉系统来接收的。人类视觉系统理论中提到:人类所感知的图像亮度取决于该点的反射光的强度以及相邻区域的光强。而且,对于不同的视觉信息图像因素等,人类视觉系统表现出了不一样的敏感度。视频中某些信息相比于其他的信息在人类通常的感知过程中更重要,能提供更多的有用信息,也即人眼对该部分信息的敏感度相对要高些。如一定幅度值内的图像信息变化如果相比很微小,人眼是感受不到这样微小的变化的。因此,可以利用人眼视觉系统的这些特点对视频信息中的某些信息进行去除,这些操作并不会对人们去感受图像造成影响,即是不会降低图像质量。这样的特性都可以叫做心理视觉冗余,这充分地利用了人眼视觉系统的一些特点。

1.2.2 视频压缩编码标准发展历史

视频压缩编码标准主要包括两个部分,一个是由国际电信联盟(ITU)所制定的H.26x系列标准,另一个是由国际标准化组织(International Standardization Organization.ISO)和MPEG组织(Moving Picture Expert Group)所制定的MPEG.x系列标准。这些视频编码标准都是为了应对不同领域中对数字音频和数字视频的不同要求而制定的。

第一个视频编码国际标准由CCITT公布于1984年,距今已有28年了。例如,3G时代的来临带来了一个非常重要的概念,即可视电话。由于打破的距离的障碍,在有限的带宽上实现了实时视频的传输,该技术一直被认为是一种非常理想的通信技术,可近30 年来至今仍未能得到广泛的普及,这是因为满足带宽要求所付出的代价极高,从而造成性价比不高。

H.264 视频压缩标准由ITU-T/ISO 于2003年3月正式公布,同以往标准相比它具有非常优秀的性能,受到了普遍的认可。通过每项性能指标的对比可以发现,在同样视频质量下将H.264与H.263或MPEG-4进行对比发现H.264的数码率降低了接近一半的倍数;或者说在码率相同的条件下,信噪比提高很大。正是因为H.264所体现出的良好性能使得其在国际上受到了广泛地认可和重视。

下面按时间顺序对几个重要的视频编码标准作简单介绍[1]:

1.MPEG-1标准及MPEG-2标准

MPEG-1标准出版于1992年,是一个获得广泛成功的视频编解码器,能够近似VHS录像带的质量或更好地将比特率设定为约1.5 Mbit/s。比特率范围覆盖了约1-2 Mbit / s的。MPEG -1的缩写由运动图像专家组制定并被其发展。MPEG-1视频(IS 11172-2 )是ISO/IEC JTC1组织的一个项目,于1993年获得批准。在技术功能方面,它增加了双向预测帧(B帧)和半像素运动(半像素运动已经在H.261的发展过程中提出来过,但当时被认为是过于复杂)。对数据进行随机访问的要求和高效压缩造成了冲突,为了解决这个问题,MPEG-1定义了四种图像类型:I帧,P帧,B帧和D图像。

在更高的比特率操作时,它提供比H.261更好的质量。(比特率可能低于1兆位/秒,此时H.261的性能更好,因为MPEG -1并没有设计为能够运行在此范围内。)

MPEG -2:在比特率,图像质量和知名度上更上一层楼。 MPEG-2被称为“21世纪的电视标准”,

不管是标准清晰度还是高清晰度电视(SDTV和HDTV)。 MPEG-2视频(ISO 13818-2 / ITU-T 的H.262 )的目的是要包括MPEG-1,同时还要以更高的比特率提供高品质隔行扫描的视频源。MPEG-2视频作为一个正式的ISO / IEC JTC1和ITU-T组织的联合开发项目,通常被认为是一个ISO标准,并在1994年年底完成。其主要新技术特点是高效处理隔行扫描图片和层次位使用的可扩展性。其目标比特率范围约为4-30 Mbit/s。

2.MPEG-4及MPEG-7标准

MPEG-4标准正式公布于1998年12月。主要是为了满足窄带多媒体通信等领域的应用要求而制定,其传输码率也限制在64Kbps以下。MPEG-4压缩编码部分所采用的压缩方法的一个特点就是基于内容,使用基于内容的方法作为压缩编码的一个重点,这样做是可以将视频信息的应用从播放型扩展到可以进行基于内容的访问和操作型,丰富了视频信息应用的领域和方式。

MPEG-4是一个开放型的标准,对标准中各种技术的具体实现算法不作规定,由此,研究者可以根据标准的要求制定出更新更优更快速的算法。可以将MPEG-4当做一个工具箱,随时加入新的想法以丰富这个标准。

MPEG-7(多媒体内容描述接口)是对MPEG-4的进一步完善,是为了适应新一代的网络发展要求而制定的,为描述各种纷繁复杂的媒体信息做了一种标准化的规定,这样就为信息的描述与媒体内容建立了一对一更加紧密标准的联系,极大地方便了用户对各种信息进行检索和利用。

3.H.263标准

1996年3月,ITU—T正式通过了H.263国际标准。H.263(第1版)是ITU-T项目,并于1996年初批准(技术内容在1995年年底完成)。是第一个专门用来处理非常低比特率视频的编解码器,其在这一领域的表现仍然是最优秀的。H.263是目前最好的实际视频通信的标准。原来的目标比特率范围约10-30 Kbit / s的,但在开发过程中扩大,大约为10-2048 Kbit / s。很明显,它可以在任何比特率优于H.261。主要应用于视频会议会议、可视电话等跟视频相关的通信业务。该标准的出现解决了视频通信领域的大难题,极大地推动了通信技术的发展,是视频通信领域的重大突破。新的H.263的关键技术特点是可变块大小运动补偿,重叠块运动补偿,运动矢量图片推断,三维的运行水平,最后可变长度编码,平均压预测,更高效的开销信号(相对于H.261其特点有算术编码,半像素运动,双向预测。但第一个特征也包含在JPEG里,其他两个则在MPEG -1)。在非常低的比特率(例如,低于30 kbit/s),H.263可使用一半或不到一半的比特率编码达到与H.261相同的质量。在更高的比特率,例如,高于80千比特/秒,相比H.261它有能够提供更多中等程度性能的优势。亦见于下面的H.263 +。

H.263支持5种图像格式:Sub QCIF(128x96)、QCIF(176x144)、CIF(352x288)、4CⅢ(740x576)、16CIF(1408x1152),采样格式为4:2:0。

4.H.263 +

H.263 +:技术上是H.263 的第二版。H.263 +项目添加了一些新的可选功能到H.263 。相比于以前标准的H.263+有一个显着的技术进步,它是第一个为无线或基于分组的传输网络提供高度的错误恢复的视频编码标准。H.263 +在压缩效率的研究、灵活的视频格式和可扩展反向兼容补充方面也增加了一些改进。它是在1998年1月由ITU-T批准,在1997年9月完成技术含量。它将H.263的有效比特率扩展到任何比特率和任何逐行扫描(非交错)图片格式和帧速率的范围上, H.263 +的性能在整个的任何现有标准范围内都是相对优越的。H.263 +项目的第一作者是H.263的编辑也是ITU-T的高级视频编码专家组(SG16Q15)开发员(主席)。

5.H.264/AVC标准

2003年3月继H.263标准之后,联合视频专家组(JVT)提出一项最新的视频编码标准—

H.264建议。ISO将其称为“ISO/IEC 14496 Partl0高级视频编码算法”(ISO/IEC 14496 1 0 AVC),把它作为MPEG.4的第十部分。

H.264主要支持4:2:0格式,其它格式如4:2:2和4:4:4则是作为额外的参考信息参数。支持连续或隔行视频的编码与解码,编码图像类型除了以往标准中有的I帧、P帧和B 帧之外,还新定义了SP帧和SI帧。新定义的这些功能可以实现不同传输速率、不同图像质量码流的条件下的快速切换,同时还具有快速恢复丢失的信息等功能。

H.264标准的编码结构有两层,分别是VCL视频编码层和NAL网络抽象层。H.264高效率的压缩性能的实现就是由VCL层来完成的,为了解决网络适配的问题,需要从具体的传输层中将VCL抽象出来,这部分工作是由NAL完成的。要使得码流适应不同环境的各类信道,需要对不同网络选用一个最合适的方式对数据进行处理、打包和传送。NAL以NALU为单元,这样使得在许多基于包交换的技术网络中H.264都能够能够完成编码数据流的传输的功能,这极大地提高了H.264技术的网络适应性。H.264的双层系统结构在功能上将每一层独立起来,各自独立完成自身的功能,这样的层定义极大地优化了整个编码系统。

1.3 研究工作介绍

本次研究需要深入学习H.264协议,基本掌握整个视频编码的流程及其算法;最重要的是要重点研究H.264模式决策过程和率失真优化技术,同时要在JM里找到实现这些技术的具体程序段。基于这些基本知识,对参考论文进行学习,提炼出其发明的快速算法的重要技术和公式。最后在vs2005的环境下对H.264的官方参考软件JM8.3进行修改,实现快速速率估计算法。

本设计主要内容要求有:

(1)速率估计计算公式设计

(2)对实验仿真结果进行分析

(3)分析该算法的优缺点

1.4 论文章节内容安排

论文围绕如何实现快速速率估计算法而展开。

本文共分为五章,组织结构的安排如下:

第二章介绍最新的视频编码标准H.264,对标准的相关重要技术做了介绍。

第三章介绍了本次设计所要实现的快速速率算法,同时描述了几种相关技术原理,如率失真优化技术,CA VLC编码过程等。

第四章完成实验结果的展示,并对仿真结果进行比对,分析。

第五章是总结和展望。对本文所做的工作进行总结,提出后续工作的方向。

第二章H.264/AVC视频编码协议

2.1 相关理论知识

2.1.1 H.264标准

H.264仍旧吸收了早年的编码标准中一些较为经典的技术,并在此基础上提出了新的关键技术。这些改进都能够满足现在日益增长的需求。这些新的关键技术不仅大大地提高了编码效率,同时还在提高压缩比率方面有很好的表现,这是以往的任何一种编码标准都无法达到的。

H.264标准依旧吸取了早年编码标准的优势,编码方式也没有大的变化。这个大的算法框架同以往的编码标准是相似的,同时在这些大的算法框架范围内,H.264又提出了很多新的关键技术,对视频编码流的时间冗余和空间冗余的去除进行了更加细化的处理。这些新的关键技术大大提高了视频的编码效率,同时也极大地提高了视频在传输过程中的抗误码性能。

从概念出发,为了满足网络应用方面的要求,H.264标准单独划分出网络层,从此概念出发定义了一个新的概念—网络抽象层(NAL)。这样做使得编码的视频流可以通过一个具体定义的接口在实际网络中进行转换和传输,也为其它传输协议如H.320、MPEG-4、H.323/IP、MPEG-2等等也提供了一个入口,由此可以正确的映射到编码数据信息。

H.264的颁布是视频领域的一件大事,尤其是对视频通信领域造成了很深远的影响,极大地推动了这个领域的发展[2]。H.264标准具有优异的压缩性能和网络亲和性,同时在网络传输性能方面表现也非常优秀。这些优异的特性使其在视频通信领域比如无线移动视频通讯、3G可视电话、网络视频直播、视频会议/电话、视频监控、高清晰度数字电视等方面有了重大的应用,其优越的性能也使得在这些领域的视频压缩方面发挥了重大的作用。

2.1.2 基本概念

1.宏块、片及帧

待编码的一个图像通常被划分成若干宏块,一个宏块由一个16×16亮度像素和附加的一个8×8 C b和一个8×8 Cr 彩色像素块组成[1]。H.264/AVC中常用的帧为I帧,P帧以及B帧。

P 宏块是采用帧内预测方式的,其预测是利用先前已编码图象作为参考图象来完成的。一般情况下还要进一步地分割一个帧内编码的宏块,同时对其亮度像素块以及彩色像素进行分割。分割后的模式有16×16、16×8、8×16 、8×8 。另外一点说明是,如果选择的子宏块为8×8模式,则可再度细分成更小的子宏块,即是8×8、8×4、4×8、4×4 的亮度像素块,同时也包括附带的彩色像素。

此外,在压缩码流的过程中,为了实现不插入I帧的情况下可以对码流进行随即切换的功能,H.264/AVC还新定义了两个帧类型SI帧(Switching I Picture)和SP(Switching P Picture)帧,加入的这两个新的帧类型顺应了视频码流的带宽适应性同时提高了视频的抗误码性能。

2.档次和级

H.264有三种档次,即基本档次、主要档次、扩展档次。每个档次有特定的功能,适用于特定的应用。

1)基本档次:运用I片和P片格式,支持帧内、帧间编码,熵编码方式为CAVLC。主要用于电视会议等讲究实时通信的视频通领域;

2)主要档次:支持视频的隔行扫描技术,帧内编码的方式是加权预测法,帧间编码方式为B片;支持CABAC)。

3)扩展档次:支持码流之间高效的切换,即在SP和SI片间进行切换,运用数据分割减少误码,不支持隔行扫描以及 C A B A C。

3.熵编码

熵编码是在统计意义上对数据的冗余信息进行压缩的,是一种无损压缩编码方法[3]。熵编码是基于随机过程的统计特性而建立的一种编码方法。在视频编码时一般采用Huffman编码和变长编码两种编码相结合的方法,概率大的数据用短的字长来表示,概率小的数据用长的字长表示,从而达到降低数据量提高压缩效率的目的[3]。

熵编码直接和信号的传输进行连接,同时熵编码也是编码器的最后一个过程。由于熵编码对视频压缩效率有重大的影响,其压缩效率对整个视频编码器也就起着起着非常重要的作用了。H.264中的熵编码技术主要包括变长编码(VLC)和内容自适应二进制算术编码(CABAC),其中VLC又分为指数哥伦布编码、内容自适应变长编码(CAVLC)[3]。

2.1.3 视频编码标准对比

MPEG-1

类型:Audio&Video

制定者:MPEG(Moving Picture Expert Group)

所需频宽:2Mbps

特性:

对于一些运动范围较小,运动不激烈的视频信号表现较好,图像质量较高;但当运动范围较大,动作激烈时,会出现马赛克现象。因此这种技术不能广泛适用于实际应用中。优点:对动作范围小,视频内容变化小的视频信号可获得较好的图像质量。

缺点:运动激烈时会有马赛克现象。

MPEG-2

类型:Audio&Video

制定者:MPEG(Moving Picture Expert Group)

所需频宽:视频上的频宽是4.3 Mbps,音频上最低的采样率为16kHz

特性:

编码码率的范围是每秒3兆比特~100兆比特,不同的码率分别用于不同档次和不同级别的视频压缩。该图像压缩标准达到了广播级质量,同时音质也达到了CD级别。有三种分级编码:空间域分级、时间域分级和信噪比分级。用于数字视频广播(DVB)、家用DVD 的视频压缩及高清晰度电视(HDTV)。MPEG-2对于不同速率以及不同分辨率的场合都能够得到应用。但出现的一个问题是,MPEG-2标准所造成的数据量很大,这对存放和传输会有较大的难度。

优点:

MPEG-2可在一个较大的范围内改变压缩比,视频领域存在着不同画面质量、不同存储容量以及带宽不同大小,MPEG-2能够适应这些需求。支持隔行扫描视频格式和其它先进功能。

缺点:

压缩率比较低,数据量依然巨大,数据的存放和传输仍然难度大。而网络方面的应用需要比较高的网络带宽,由于带宽限制该标准不适用于网络视频点播等方面。

MPEG-4

类型:Video

制定者:MPEG(Moving Picture Expert Group)

所需频宽:128Kbps~38.4Mbps(600kb/s左右)

特性:

标准中强调了多媒体系统的交互性以及灵活性,主要应用于可视通信、视频会议等。为便于操作和控制对象,采用基于对象的编码方式,MPEG-4 的基于对象操作使用户可以直接在终端对象进行拼接操作。适用于频宽变化大的网络,也适用于远程监控等领域。

优点:压缩效率高,图像质量好,容错性能好,压缩方式为面向对象。

缺点:专利收费不合理。

2.2 JM编码原理

2.2.1 编码原理

H.264编码器包括帧内模式预测,运动估计与运动补偿,整数变换,DCT量化,熵编码,去块滤波等几大部分。

编码过程大致如下,首先编码器读入原始图像,编码器首先解决的问题是选择帧间编码还是帧内编码,该过程需要运用一些判决策略来完成。若是选择帧间编码,则运用运动估计算法;若是选择帧内编码,则采用一些标准定义的预测方法,随后将所得的预测值与实际值进行对比,取一个差值,该差值就是残差值。为了有效地数据传输将数据压缩,还需要对残差值进行整数变换、量化、扫描以及熵编码。最终为了得到重构帧,同时进行的还有对量化后的残差值进行反量化、反变换,将还原的残差值与前面得到的预测值相加重构出当前图像的实际值,最后一步就是进行去块滤波,送入帧存储器。

2.2.2 编码一个宏块

编码一个宏块的具体过程如下图1所示:

图2.1 编码一个宏块的流程图

2.3 视频压缩原理

2.3.1 压缩原理简介

视频信号的信息量很大,对网络传输所需的带宽要求也高,因此对视频信号进行压缩

处理非常有必要。能否将在视频信号传送前先对其进行压缩编码,随后才进行传送,由此达到节省传送带宽和存储空间的目的,这样就提出了一个很重要的问题—视频压缩。

视频质量有两个标准:主观质量、客观质量;主管质量是从人的视觉上进行评定的;客观质量则通用信噪比(S/N)PSNR表示。在评定一个视频的好坏时要综合考虑主管质量和客观质量,两者不可或缺。很多实际情况下,这两个要求会有冲突,最佳的质量往往是在这两者之间求一个最佳的平衡,达到最好的效果。

压缩视频内容的方式之一是使用一种编码语法,如JPEG简单地压缩每幅图片。最常见的“基线”JPEG方案是将图像分解成大小相等的块。这些块由一个离散余弦变换(DCT )进行转化,然后DCT系数进行量化并使用可变长编码传输。因为该图片的编码没有涉及编码视频序列中的其他图片,我们将把这种方式作为帧内编码的编码方案。事实上,这种单独帧内编码作为一个视频编码方法共同使用在今天的生产质量编辑系统,这种方法要求快速访问视频内容的任何帧。

然而,改进压缩的性能可以通过利用视频内容里存在的大量时间冗余来达到。帧间编码时我们将运用这种技术。通常情况下,所描绘的场景基本上只是重复前后的图片而没有任何显着的变化。可以显而易见的是,在更有效地表示视频这点上,只编码视频内容的变化比反复编码每帧图片要好得多。使用时域冗余提高编码效率的这种能力是视频压缩与静止图像压缩的根本区别。

2.3.2 视频压缩的基本方法和技术

一个通过只编码视频场景的变化来提高视频压缩的简单方法被称为有条件补充( CR ),它是第一个数字视频编码标准ITU-T建议H.120 [2]里唯一的减少时间冗余的方法。CR编码包括两个过程,发送信号表明图片的哪些区域可以被重复,发送新的编码信息取代产生变化的区域。从而,CR允许为每个区域选择跳过模式和内部模式两种模式之一作为代表。然而,CR编码有一个重要的的缺点,即无法改善一个近似。通常,前一帧图片的某个区域的内容可以是一个新的图片很好的近似,只需要一个小的改动就能成为一个更好的参照。但CR 编码只允许确切的重复或完全替代每一个画面区域。添加的第三种“预测模式” 可以发送一种精炼帧间差分近似,使得压缩性能得到进一步的改善。

通过加入运动补偿预测( MCP ),帧差细化的概念也迈出了一步。大多数视频内容的变化通常是由于相对的成像平面所描绘的场景中的对象的移动而产生的,即使是少量运动也可能会导致图片区域中的像素值差异较大,尤其是接近一个物体的边缘的区域。通常情况下,用空间位置的几个像素取代前画面的某个区域,这就使得发送帧差分近似信息的数量显着减少。使用这种空间位移形成一个近似位置的方法被称为运动补偿,使用编码器搜索最好的空间位移近似的方法被称为运动估计。

2.3.2 混合编码解码器

最成功的视频压缩设计类被称为混合编解码器。这种编码器的命名是由于其作为一个移动处理和图像编码技术混合体的建设的原因,编解码器这个词用来指视频压缩系统编码器和解码器。其设计和操作涉及了一些决策的优化,包括以下部分:

1.如何将一个图片分割成区域

2.是否完全用新图片内的内容更换图片的各个区域

3.如果不更换新的内部内容

(a)如何做运动估计,即如何选择转移的空间位移用于画面间编码预测。(目前零值

位移一个重要的特殊情况)

(b)如何做DFD的编码,即如何选择近似用来作为帧间预测的细化。(零值逼近作为一个重要的特例)

4.如果新的内容更换一个地区,发送一个近似值作为更换的内容。

工程师设计这样一个视频编码系统就引入了一个问题,即应当编码图像的哪个部分?应使用什么方法编码?如果可能的运作模式在帧内编码时受到限制和跳过,选择会相对比较简单。但混合视频编解码器是通过运用自适应分配部分编码图片的操作模式以达到达到对压缩性能的要求。同时由于两个运动估计的影响在帧间编码D和FD编码阶段之间产生了依赖关系。这些决定视频编码器的设计和操作的优化是视频压缩中的重要内容。

第三章快速速率估计算法

3.1 H.264模式决策过程

每个16×16宏块可以有以下两种待选编码类型:Intra4×4和Intra16×16。不同于与其它视频标准的Intra编码,H.264的帧内编码是参考空间域中已编码的邻居,对其进行采样进而作预测编码的。帧内模式决策有以下常用准则:

1.利用相邻块预测模式的相关性为准则;

2.利用结合全零块提前终止的准则;

3.基于纹理特征的预测模式块尺寸预先选择准则;

4.通过量化系数QP进行判断;

当前帧或块的编码模式在7 种帧间或17 种帧内模式中间选择。7种帧间模式分别是:16x16、16x8、8x16、8x8、8x4、4x8、4x4,相应的模式编号为1-7。17 种帧内模式分别是:9 种基于 4x4 块进行亮度分量预测的帧内模式,基于宏块进行亮度分量预测的4 种模式和相同块色度分量预测的4 种模式[4]。需要注意的一点是,帧间预测中,若是要选择8x4,4x8 和4x4 的分块首先要完成先选择一个宏块再将其细分成4个8×8模块。

H.264/AVC标准的帧间模式选择算法是针对多参考帧进行全搜索运动估计算法,该算法也是基于RDO策略的。模式选择的大致过程是:

编码器先对帧间预测模式的8种( SKIP,M_16x16,M_16x8,M_8x16,M_8x8,M _8x4,M_4x8,M_4×4)待选模式分别进行残差块的计算,SAD定义为即当前宏块与参考宏块之间的差值。然后对比经过R-D代价函数计算后的数值,确定R-D代价最小的模式选项。帧间预测模式的判决所采用的方法同帧内的情况是一致的,这意味着,编码器需要尝试所有的模式组合,包括不同的帧内及帧间预测模式,同时要编码所有的模式组合。

JM采用这样的判决策略,类似用穷尽所有预测模式的方法,参考了多个帧的优点是保证了视频的质量,性能好,使得在码率优化方面也有了很大的提高,以较小的码率传输内容更大的视频信息。可想而知的是这样的穷尽算法需要极大的运算量,计算方案也是相对复杂的,这些都极大地影响了编码对实时性的要求。

3.1.1 率失真优化策略

率失真优化( Rate Distortion Optimized) 策略是基于率失真理论,在其基础之上提出的一种代价函数方案。它在网络传输和编码技术中有着广泛的应用[5]。 H.264/ AVC引入了RDO作为算法中的代价函数策略,在模式决策的过程中就是运用RDO进行代价的计算,相比于以往的传统代价计算函数,该方法的应用使得编码效率有了极大的提高。

RDO 在计算代价函数时,由于码率和失真度都成为了代价大小的制约因素,这样的制约关系体现在为了利于视频数据流的传输还在低失真度的条件下保证低的码率。H.264中有三个地方运用到了RDO代价函数,他们分别是运动搜索、参考帧择优、模式决策,但他们所使

用的代价函数有一定的区别。在某些情况下也将非RDO 代价函数即without RDO 列为可选模式, 以满足不同的需要[6]。

H.264 编码标准采用率失真优化对各宏块的所有待选编码模式逐一进行选择并且从算法的角度进行一定的优化。为了给每一个宏块选择出最佳编码模式, H.264 编码器对7种编码模式分别计算率失真代价值。

拉格朗日率失真代价函数如下:

R D J e e mod mod λ+= (1)

其中:D 和R 分别为宏块编码的失真度的表征和码率;λmode 为拉格朗日乘子。 H.264的模式选择中对帧内模式的选择需要进行592次率失真代价的计算;对帧间模式的选择还涉及到运动搜索、运动补偿、变换、量化、编码等步骤。

对不同纹理特性的图像子块图像,各个预测模式中还定义了更多的预测选项以应对不同的纹理方向,从而要保证其预测的准度。预测时,每个单独的块都要全部使用到所有定义的预测选项进行预测,得出每种预测选项下相应的SAD 值,其实该SAD 值就是上式中定义的D ,最终根据SAD 值确定最优预测选项。由于设计了针对不同纹理方向的多种预测选项,即使是不同类型的图像,这种预测方法也能够以较小的误差逼近实际的真实值。空间域帧内预测算法在这里起到了相当重要的作用。SAD 指的是原始块与重构块之间的绝对误差总和,计算的公式如下: ∑∑=-=-=1-N 0x 1

0),(),(y),SAD(x N y s

c y x f y x f (2) fc(x ,y)、fs(x ,y)分别表示重构图像和原始图像的像素值。

3.2.1 CA VLC 编码

熵的大小与信源的概率模型是密切相关的,那么信源的熵随着各个符号的概率不同而不同。熵取得极大值发生在当信源中各事件的发生等概分布时。这个极大值与当前信源的熵的差值反映了信息冗余度的高低。冗余度越低,信息所携带的内容也就是信息量越大,对提高后面的视频压缩效率也就越有益。视频压缩的一项重要技术就是熵编码。H.264的熵编码包括两类,CAVLC 和CABAC 。下面重点介绍CAVLC 编码理论及其原理。

CAVLC 是基于上下文的自适应变长编码。视频块经过整形变换和量化后,大部分系数都是0,只有较少的一部分非零数据集中在较低频率部分。针对这样的特点运用游程编码能够极大地减少编码所需的码字子长。H.264标准中分别定义了不同的码表,以便于对亮度块和色度块的编码进行直接查询。

在CAVLC 中,对各个系数的幅值大小、空间位置进行独立的编码。残差数据经过变换量化后所产生的数据呈现出一些较为明显的特点:非零系数的数量较少,幅值也小,并且大

部分都在低频部分;其他大部分数据则变成了零,并且主要出现在高频区域。

CA VLC编码的每个子块总共含有5个部分,分别是非零系数CoeffToken、正负1标记或拖尾系数TrailingonesFlag、非0系数幅值Level、0系数总个数Totalzeros和非0系数间连0总个数Runbefore。

下面举例说明CA VLC对五种系数的具体编码过程:

编码过程:

一个4*4块的数据如下:

{

0、3、-1、0、

0、-1、1、0、

1、0、0、0、

0、0、0、0、

}

数据重排列:0,3,0,1,-1,-1,0,1,0……

1)

初始值设定:

非零系数的数目(TotalCoeffs)=5;

拖尾系数的数目(TrailingOnes)=3;

最后一个非零系数前零的数目(Total_zeros)= 3;

变量NC=1;

suffixLength = 0;

i = TotalCoeffs = 5;

2)编码coeff_token:

查标准(BS ISO/IEC 14496-10:2003),可得:

If (TotalCoeffs == 5 && TrailingOnes == 3 && 0 <= NC < 2)

coeff_token = 0000 100;

Code = 0000 100;

3)编码所有TrailingOnes 的符号:

逆序编码,三个拖尾系数的符号依次是+(0),-(1),-(1);

即:

TrailingOne sign[i--] = 0;

TrailingOne sign[i--] = 1;

TrailingOne sign[i--] = 1;

Code = 0000 1000 11;

4)编码除了拖尾系数以外非零系数幅值Levels:

过程如下:

(1)将有符号的Level[ i ]转换成无符号的levelCode;

如果Level[ i ]是正的,levelCode = (Level[ i ]<<1) –2;

如果Level[ i ]是负的,levelCode = - (Level[ i ]<<1) –1;

(2)计算level_prefix:level_prefix = levelCode / (1<

(3)计算level_suffix:level_suffix = levelCode % (1<

(5)suffixLength updata:

If ( suffixLength == 0 )

suffixLength++;

else if ( levelCode > (3<

依然按照逆序,Level[i--] = 1;(此时i = 1)

levelCode = 0;level_prefix = 0;

查表可得level_prefix = 0时对应的bit string = 1;

因为suffixLength初始化为0,故该L evel没有后缀;

因为suffixLength = 0,故s uffixLength++;

Code = 0000 1000 111;

编码下一个L evel:Level[0] = 3;

levelCode = 4;level_prefix = 2;查表得bit string = 001;

level_suffix = 0;suffixLength = 1;故码流为0010;

Code = 0000 1000 1110010;

i = 0,编码L evel结束。

5)编码最后一个非零系数前零的数目(TotalZeros):

查表当T otalCoeffs = 5,total_zero = 3时,bit string = 111;

Code = 0000 1000 1110 0101 11;

6) 对每个非零系数前零的个数(RunBefore )进行编码:

i = TotalCoeffs = 5;ZerosLeft = Total_zeros = 3;查表

依然按照逆序编码

ZerosLeft =3, run_before = 1 run_before[4]=10;

ZerosLeft =2, run_before = 0 run_before[3]=1;

ZerosLeft =2, run_before = 0 run_before[2]=1;

ZerosLeft =2, run_before = 1 run_before[1]=01;

ZerosLeft =1, run_before = 1 run_before[0]不需要码流来表示

Code = 0000 1000 1110 0101 1110 1101;

编码完毕。

3.2 快速速率估计算法

为了估计量化变换后的系数,我们需要对CA VLC 五种不同类型的符号分别进行估计。

1、非0系数标记(非0系数个数,拖尾系数)

编码系数标记的比特消耗与非0系数个数是成正比的;由VLC 码表也可得到编码系数标记的比特消耗与拖尾系数个数成反比。基于这些准则可以推导出下面的表达式[8]: 321ωωω+-=o off T Tc R (3) Tc :非0系数的总个数,To :拖尾系数的个数,ω1,ω2, ω3为权重因子。经过对不同类型序列(Akiyo, Foreman, Stefan, Mobile, Table Tennis, Paris)的实验发现,当ω1,ω2, ω3分别取1,1,0时,率失真性能最优。

2、正负1标记

对每一个To ,用一个比特编码标记(0=+,1=-)。编码拖尾系数的比特数按如下公式计算[8]

To R traill = (4)

3、除拖尾系数之外的非零系数的幅值(Levels)进行编码

通过对level-VLC 码表观察可知,比特的需要量同非零系数的量级成正比。编码幅值信息的比特如下式所示:

l level SAT R 4ω= (5) 其中l SAT 定义如下:

∑==Tc

k k l L SAT 1 (6) k L 是第k 个非零系数的绝对值,l SAT 是量化残差块所有幅值的绝对值总和,4ω是一个正数常量。通过改变4ω的值发现当其值为1时结果更好。

4、对最后一个非零系数前零的数目(TotalZeros)进行编码

编码所需的比特率与TotalZeros 的个数成正比,故可以设计下面的公式[8]:

z zero T R 5ω= (7) z T 为最后一个非零系数前零的数目,同样的方法可以设定5ω=1。

5、对每个非零系数前零的个数(RunBefore)进行编码

非零系数的变化有一些规律,这些系数之间都有一定的相关性,零系数的游程编码也具有一定特性。由VLC 码表可以看出,比特率与高频部分非零系数游程数有以下关系:

150,6)(≤≤=k k f Rrun k ω (8)

k f 是编码块第k 个非零系数的频率,运用前面相同的办法得出6ω的值为0.3

通过前面的分析,可以得出编码残差块所需的比特率[9]:

∑=+++=Tc k run zero traill coeff k res R R R R st 1)()(Re (9) 将之前的结论代入上式:

∑=+++=Tc k k l z c st f SAT T T res 1e 3.0R )( (10)

3.3项目编程环境

3.3.1 JM 编程概述

H. 264 标准领域的算法层面的研究是基于其对应的编解码软件JM 来实现的,一些基于标准的实际应用的搭建工作也是在JM 平台完成的。要对H.264作更多的研究,需要深入理解JM 的程序组织结构,掌握其具体实现H.264重要技术算法的程序段。JM 是H.264的官

方测试源码,是H.264标准的国际参考软件,通过搭建复杂的程序结构一步一步实现了H.264的所有特性。正是由于JM的官方地位,所有对H.264进行的学术研究以及提出的新的算法都是在JM平台上进行实现并同JM的源代码进行比较。JM编码的主旨是要实现H.264的特性,需要考虑引入标准所定义的新特性,完成标准所需要体现的优越性能以及编码效率。在编码的过程中,只实现性能便忽略了复杂度的问题,如此便造成了特别复杂的程序结构以及相当高的编码复杂度。

帧间的编码模式一共有7 种,帧内编码模式有17 种。需要说明的一点是,当进行帧间预测时,只有通过先把一个宏块划分成8x8的模式的操作之后,才能选择8x4,4x8 和4x4 这三种类型。

根据配置文件encoder_baseline中RDOptimization 的不同取值情况,模式选择开销的计算分为两种方式。

没有使用率失真优化[10]:

cost_mode=cost_ref+lambda_motion*Rate_mode

Rate_mode 代表编码该参考帧信息所产生的比特数。其具体的数值可以在JM 中查表的得到。

如果使用了率失真优化,则:

cost_mode=SSD+lambda_mode*Rate

SSD 表示原始块与重建块之间的差值的总和。

完成上文中所介绍的模式选择的操作后,JM此处的编码是程序调用store_macroblock_parameters ()函数和set_stored_macroblock_parameters ()函数,调用这两个函数完成存储相关的编码信息的工作。程序从encode_one_macroblock ()函数返回以后,会接着调用write_one_macroblock ()进行熵编码和码流生成的工作。

3.3.2 仿真平台

本次设计实验仿真的平台是Visual Studio 2005,在该平台运行JM8.3工程,对其进行修改,修改完成调试实验结果,完成仿真。

Visual Studio 2005是基于.NET2.0框架的。它同时也能开发跨平台的应用程序,如手机操作系统等较大的程序。总的来说,Visual Studio是一个比较庞大的软件,甚至还包含了测试代码的功能。

3.3.3 待修改程序段落

需要修改的程序段落分别被包含在rdopt.c、macroblock.c、slice.c等文件中。rdopt.c文件的主要内容是完成JM编码部分的率失真技术,macroblock.c文件的内容是编码一个块的

所有信息,包括头信息,运动矢量信息以及残差信息,slice.c 文件主要是各个片的定义,该文件对于整个JM 的组织架构很重要。本次设计主要是修改编码一个块时对残差信息的估计部分。程序修改的工作集中在macroblock.c 文件。

3.4 算法具体实现办法

3.4.1 修改计算RD-cost 程序段

RD-cost 是JM 里RDO 技术的具体计算公式,快速算法主要是修改该公式中计算比特率的部分,具体在JM 中就是要修改下列公式

rdcost = (double)distortion + lambda*(double)rate 中计算rate 的部分。通过阅读程序得知,在该程序段中rate 是用公式 rate += writeCoeff4x4_CA VLC 来计算的,由此发现,最终需要修改的函数是writeCoeff4x4_CA VLC ,本次设计中定义新的rate 计算公式,最终编写了新的函数命名为writeCoeff4x4_CA VLC_my 。

3.4.2 修改JM 模式选择过程涉及的调用关系

JM 中的调用关系一环一环,算法比较复杂,对于修改后的函数,有许多地方都存在调用关系;在这些调用关系里需要进行分析,然后决定是否调用新编写的函数。同时,在最后写入rate 的时候函数段也调用了writeCoeff4x4_CA VLC ,此处的调用关系需要保留,所以需要重新定义一个函数体,保留写的功能。

3.4.3 编程实现速率计算公式

当编码器读入一个4×4块时,如前文所述,这个块是一串数据流,编码为含0,+1,-1的一串数字。算法中计算rate 的公式如上式 (10):

∑=+++=Tc

k k l z c st f SAT T T res 1e 3.0R )(

各个系数的具体含义前文已经做了详细叙述,所以程序的重点就放在如何统计这个4×4块中的16个数据。修改的程序段落见附件,具体编程流程如下图所示: 第四章 实验仿真结果与分析

4.1 实验环境概述

本次仿真实验使用了参考软件JM8.3,具体的测试条件如下:

1)CA VLC 可使用

2)帧率30

3)MV 搜索范围为±32

4)编码帧数为100

5)配置文件为encoder_baseline.cfg

最终调试结果显示在Intel(R) Pentium (R) Dual T3200@ 2.00GHz个人笔记本电脑。调试结果用ΔT%,ΔPsnr%,ΔBit%表示,他们分别代表快速算法同JM原算法相比较之后的时间,信噪比,比特率的增减百分比大小。

4.2实验调试结果展示

4.2.1 快速算法对比原JM算法

最终调试结果显设置不同的Qp值,为保证描点的准确性,在调试过程中取六组数值。将Qp分别设置在20、24、28、32、36、40;记录对应于每个Qp值下的比特率。最后分别记录下快速算法和原JM算法的这六组数据,以比特率为横坐标,Qp值为纵坐标用matlab7.0描点画出对应的曲线。对Forman(QCIF)、Akyio(QCIF)、stefan(CIF)、Paris(CIF)序列进行测试,仿真结果如下列图所示:

4.2.2 对不同序列全I帧预测实验结果

对以下序列设置三组Qp值,即20、28、36;记录比特率、PSNR,编码时间encoding time,通过计算得出ΔPsnr、ΔBit%、ΔT%。

4.3实验结果分析

最终得到的实验结果与参考论文中的结果基本一致,证明此次设计获得了成功。对各种序列的测试实验结果表明,该快速算法适用于各种序列,有较大的可行性。在视频质量没有大的损失的情况下,编码时间大大的减少,由实验结果可知,时间的减少量平均达到了40%以上。

通过快速算法和JM原算法的比对,如图1,图2,图3;可知,两条绘制的曲线非常接近,证明该算法的应用并未对视频质量造成消极的影响,同时编码效率却大大的提高了。由此得出,在编码效率这个角度上来说该算法是比较成功的。

但是通过对结果的分析发现,当比特率较大的时候,两条曲线之间的差距拉大,较之比特率较小的时候视频质量有下降趋势。因此,该算法在低比特率的条件下,表现更优。

第五章总结与展望

5.1工作总结

本文对快速速率估计算法的实现做了详细的介绍,学习了H.264视频编码标准协议的研究前景和重要意义。基于vs2005平台,对JM作出修改,实现了快速算法,完成了此次设计。文章重点介绍了H.264协议中的一些重要技术,并对快速算法的具体实现办法和过程进行了详细的介绍。最终实现的算法,有效地减少了JM编码器的编码时间,同时PSNR值也没有过大的损失,证明了该算法的可行性。在整个设计的过程中,主要做了以下工作:

1.学习视频编码最新标准H.264,了解其发展历史和前景。掌握其中的重要技术及相关理论知识。

2.学习CA VLC,掌握其编码思想,对其中的五个系数进行了解。

3.掌握率失真优化技术,结合JM了解RDO的全过程。

4.仔细阅读JM中的相关程序段,找出要修改的代码,添加新的函数,完成调用关系的修改。

5.以科学严谨的态度对仿真实验结果进行记录统计。

6.对实验结果进行分析。

5.2工作展望

本次设计实现了快速算法,得到了正确的实验结果,但是通过对实验结果的分析可以看出,当比特率较高的时候,该算法的psnr表现不好,也即视频的质量性能不好,可见今后的工作当中可以在比特率较高的时候,对算法做出修改。

本次的工作也对我今后的研究生阶段的学习打下了基础,着眼于自己的研究方向,可以在模式决策,DCT量化技术中做出努力,争取获得有效的研究成果。本次设计对于今后的方向也是有极大的帮助的。

关于数字图像处理论文的题目

长春理工大学——professor——景文博——旗下出品 1基于形态学运算的星空图像分割 主要内容: 在获取星图像的过程中,由于某些因素的影响,获得的星图像存在噪声,而且星图像的背景经常是不均匀的,为星图像的分割造成了极大的困难。膨胀和腐蚀是形态学的两个基本运算。用形态学运算对星图像进行处理,补偿不均匀的星图像背景,然后进行星图像的阈值分割。 要求: 1> 图像预处理:对原始星空图像进行滤波去噪处理; 2> 对去噪后的图像进行形态学运算处理; 3> 选取自适应阈值对形态学运算处理后的图像进行二值化; 4> 显示每步处理后的图像; 5> 对经过形态学处理后再阈值的图像和未作形态学处理后再阈值的图像进行对比分析。 待分割图像直接分割图像处理后的分割图像 2基于数字图像处理的印刷电路板智能检测方法 主要内容: 通过对由相机实时获取的印刷电路板图像进行焊盘识别,从而提高电子元件的贴片质量,有效提高电路板的印刷效率。 要求: 1> 图像预处理:将原始彩色印刷电路板图像转成灰度图像,对灰度图像进行背景平滑和滤波去噪; 2> 对去噪后的图像进行图像增强处理,增强边缘提取的效果。 3> 对增强后的图像进行边缘提取(至少两种以上的边缘提取算法); 4> 显示每步处理后的图像(原始电路板图像可自行查找); 5> 图像处理后要求能对每个焊盘进行边缘提取,边缘清晰。 3静止背景下的移动目标视觉监控 主要内容:

基于视觉的人的运动分析最有前景的潜在应用之一是视觉监控。视觉监控系统的需求主要来自那些对安全要求敏感的场合,如银行、商店、停车场、军事基地等。通过对静止背景下的目标识别,来提醒监测人员有目标出现。 要求: 1>对原始参考图和实时图像进行去噪处理; 2>对去噪后的两幅图像进行代数运算,找出目标所在位置,提取目标,并将背景置黑; 3> 判断目标大小,若目标超过整幅图像的一定比例时,说明目标进入摄像保护区域,系统对监测人员进行提示(提示方式自选)。 4>显示每步处理后的图像; 5>分析此种图像监控方式的优缺点。 背景目标出现目标提取 4车牌识别图像预处理技术 主要内容: 车辆自动识别涉及到多种现代学科技术,如图像处理、模式识别与人工智能、计算机视觉、光学、机械设计、自动控制等。汽车作为人类生产、生活中的重要工具被广泛的使用,实现自动采集车辆信息和智能管理的车牌自动识别系统具有十分重要的意义: 要求: 1>对原始车牌图像做增强处理; 2>对增强后的彩色图像进行灰度变换; 3>对灰度图像进行直方图均衡处理; 4>选取自适应的阈值,对图像做二值化处理; 5>显示每步处理后的图像; 6>分析此种图像预处理的优缺点及改进措施,简要叙述车牌字符识别方法 原始车牌图像处理后的车牌图像 5医学细胞图像细胞分割图像增强算法研究 主要内容: 医学图象处理利用多种方法对各种图像数据进行处理,以期得到更好的显示效果以便医生根据细胞的外貌进行病变分析。 要求: 1>通过对图像的灰度变换调整改变细胞图像的灰度,突出感兴趣的细胞和细胞核区域。 2>通过直方图修改技术得到均衡化或规定化等不同的处理效果。 3>采用有效的图像平滑方法对细胞图像进行降噪处理,消除图像数字化和传输时所混入的噪声,提高图像的视觉效果。 4>利用图像锐化处理突出细胞的边缘信息,加强细胞的轮廓特征。 5>显示每步处理图像,分析此种细胞分割图像预处理方法的优缺点。 原始细胞图像 图像处理后的细胞图像 6瓶子灌装流水线检测是否液体灌装满瓶体 当饮料瓶子在罐装设备后要进行液体的检测,即:进行判断瓶子灌装流水线是否灌装满瓶体的检测,如液面超过瓶颈的位置,则装满,否则不满,如果不满则灌装液体不合格,需重新进行灌装。 具体要求: 1)将原进行二值化 2)二值化后的图像若不好,将其滤波再进行膨胀处理,并重新进行二值化

图像处理论文

图像处理技术近期发展及应用 摘要:图像处理技术的研究和应用越来越收到社会发展的影响,并以自身的技术特点反过来影响整个社会技术的进步。本文主要简单概括了数字图像处理技术近期的发展及应用现状,列举了数字图像处理技术的主要优点和制约其发展的因素,同时设想了图像处理技术在未来的应用和发展。 关键字:图像处理发展技术应用 1.概述 1.1图像的概念 图像包含了它所表达的物体的描述信息。我们生活在一个信息时代,科学研究和统计表明,人类从外界获得的信息约有百分之七十来自视觉系统,也就是从图像中获得,即我们平常所熟知的照片,绘画,动画。视像等。 1.2图像处理技术 图像处理技术着重强调在图像之间进行的变换,主要目标是要对图像进行各种加工以改善图像的视觉效果并为其后的目标自动识别打基础,或对图像进行压缩编码以减少图像存储所需要的空间或图像传输所需的时间。图像处理是比较低层的操作,它主要在图像像素级上进行处理,处理的数据量非常大。 1.3优点分析 1.再现性好。数字图像处理与模拟图像处理的根本不同在于,它不会因图像的存储、传输或复制等一系列变换操作而导致图像质量的退化。 2.处理精度高。按目前的技术,几乎可将一幅模拟图像数字化为任意大小的二维数组,这主要取决于图像数字化设备的能力。现代扫描仪可以把每个像素的灰度等级量化为16位甚至更高,这意味着图像的数字化精度可以达到满足任一应用需求。 3.适用面宽。图像可以来自多种信息源,它们可以是可见光图像,也可以是不可见的波谱图像(例如X射线图像、射线图像、超声波图像或红外图像等)。从图像反映的客观实体尺度看,可以小到电子显微镜图像,大到航空照片、遥感图像甚至天文望远镜图像。即只要针对不同的图像信息源,采取相应的图像信息采集措施,图像的数字处理方法适用于任何一种图像。 4.灵活性高。图像处理大体上可分为图像的像质改善、图像分析和图像重建三大部分,每一部分均包含丰富的内容。而数字图像处理不仅能完成线性运算,而且能实现非线性处理,即凡是可以用数学公式或逻辑关系来表达的一切运算均可用数字图像处理实现。 2.近期发展及应用领域

数字图像处理毕业论文

毕业论文声明 本人郑重声明: 1.此毕业论文是本人在指导教师指导下独立进行研究取得的成果。除了特别加以标注地方外,本文不包含他人或其它机构已经发表或撰写过的研究成果。对本文研究做出重要贡献的个人与集体均已在文中作了明确标明。本人完全意识到本声明的法律结果由本人承担。 2.本人完全了解学校、学院有关保留、使用学位论文的规定,同意学校与学院保留并向国家有关部门或机构送交此论文的复印件和电子版,允许此文被查阅和借阅。本人授权大学学院可以将此文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本文。 3.若在大学学院毕业论文审查小组复审中,发现本文有抄袭,一切后果均由本人承担,与毕业论文指导老师无关。 4.本人所呈交的毕业论文,是在指导老师的指导下独立进行研究所取得的成果。论文中凡引用他人已经发布或未发表的成果、数据、观点等,均已明确注明出处。论文中已经注明引用的内容外,不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究成果做出重要贡献的个人和集体,均已在论文中已明确的方式标明。 学位论文作者(签名): 年月

关于毕业论文使用授权的声明 本人在指导老师的指导下所完成的论文及相关的资料(包括图纸、实验记录、原始数据、实物照片、图片、录音带、设计手稿等),知识产权归属华北电力大学。本人完全了解大学有关保存,使用毕业论文的规定。同意学校保存或向国家有关部门或机构送交论文的纸质版或电子版,允许论文被查阅或借阅。本人授权大学可以将本毕业论文的全部或部分内容编入有关数据库进行检索,可以采用任何复制手段保存或编汇本毕业论文。如果发表相关成果,一定征得指导教师同意,且第一署名单位为大学。本人毕业后使用毕业论文或与该论文直接相关的学术论文或成果时,第一署名单位仍然为大学。本人完全了解大学关于收集、保存、使用学位论文的规定,同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、扫描、数字化或其它手段保存或汇编本学位论文;学校有权提供目录检索以及提供本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有关部门或者机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权大学可以将本学位论文的全部或部分内容编入学校有关数据库和收录到《中国学位论文全文数据库》进行信息服务。在不以赢利为目的的前提下,学校可以适当复制论文的部分或全部内容用于学术活动。 论文作者签名:日期: 指导教师签名:日期:

图像处理论文

数字图像处理技术及其在农业中的应用研究 随着信息产业的逐渐发展以及与其他各个学科间不断结合的普及,图像识别技术已经能够深入地应用到具体目的物识别等领域中图像是人类获取和交换信息的主要来源,因此,图像处理的应用领域必然涉及到人类生活和工作的方 方面面随着人类活动范围的不断扩大,图像处理的应用领域也将随之不断扩大。 1 数字图像处理的概念 1 数字图像处理的概念数字图像处理又称为计算机图像处理,它是指将图 像信号转换成数字信号并利用计算机对其进行处理的过程图像处理中,输入的 是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。 2 数字图像处理的应用 2.1 数字图像处理技术在农产品收获中的应用 研制自动识别采摘机器是图像处理在农业收获中的主要应用,此课题目前备受关注。自动收获机器人的构成主要是收获系统、行走系统和视觉机构。基于数字图像处理的自动收获机器人主要在两个方面应用该技术: 一是,识别和 空间定位果实或其他目标物,为采摘系统的行为提供参数,提高收获果实的准确性;二是,识别障碍物体,为行走系统提供准确的目标以躲避障碍。苹果、梨、橘子、番茄等作物都是研究的对象,但是此类农作物生长环境比较复杂,自动识别的图像必然包含枝叶土壤等对目标物产生影响的背景噪声,所以在实 现上不易准确,且识别成功率较低。Slaughter 等在室外晴朗天气自然光照条件下获取照片的色度亮度等方面信息以指导果实采摘机械手,创建了利用彩 色照片的颜色信息在橘子树中“认出”橘子的模型,成功率75%,在速度方面 基本可以接受,可是准确率比较低;识别柑橘中心的错误率为 6%。 Zhang 等 利用描绘苹果照片图像的边缘线,通过神经网络测定、定位的方式达到自动采摘功能。

数字图像处理应用论文数字图像处理技术论文

数字图像处理应用论文数字图像处理技术论文 关于数字图像处理及其应用的研究 摘要:首先对数字图像处理的关键技术以及相应的处理设备进行详细的探讨,然后对数字图像处理的应用领域以及发展趋势进行详尽论述。 关键词:数字图像处理:关键技术;应用领域 0 引言 人类通过眼、耳、鼻、舌、身接受信息,感知世界。约有75%的信息是通过视觉系统获取的。数字图象处理是用数字计算机处理所获取视觉信息的技术,上世纪20年代Bartlane电缆图片传输系统(纽约和伦敦之间海底电缆)传输一幅图片所需的时间由一周多减少到小于3个小时;上世纪50年代,计算机的发展,数字图像处理才真正地引起人们的巨大兴趣;1964年,数字图像处理有效地应用于美国喷气推进实验室(J.P.L)对“徘徊者七号”太空船发回的大批月球照片的处理;但是直到上世纪六十年代末至七十年代扔,由于离散数学理论的创立和完善,使之形成了比较完整的理论体系,成为一门新兴的学科。数字图像处理的两个主要任务:如何利用计算机来改进图像的品质以便于人类视觉分析;对图像数据进行存储、传输和表示,便于计算机自动化处理。图像处理的范畴是一个受争论的话题,因此也产生了其他的领域比如图像分析和计算机视觉等等。

1 数字图像处理主要技术概述 不论图像处理是基于什么样的目的,一般都需要通过利用计算机图像处理对输入的图像数据进行相关的处理,如加工以及输出,所以关于数字图像处理的研究,其主要内容可以分为以下几个过程。图像获取:这个过程基本上就是把模拟图像通过转换转变为计算机真正可以接受的数字图像,同时,将数字图像显示并且体现出来(例如彩色打印)。数据压缩和转换技术:通过数据压缩和数据转换技术的研究,减少数据载体空间,节省运算时间,实现不同星系遥感数据应用的一体化。图像分割:虽然国内外学者已提出很多种图像分割算法,但由于背景的多变性和复杂性,至今为止还没有一种能适用于各种背景的图像分割算法。当前提出的小波分析、模糊集、分形等新的智能信息处理方法有可能找到新的图像分割方法。图像校正:在理想情况下,卫星图像上的像素值只依赖于进入传感器的辐射强度;而辐射强度又只与太阳照射到地面的辐射强度和地物的辐射特性(反射率和发射率)有关,使图像上灰度值的差异直接反映了地物目标光谱辐射特性的差异,从而区分地物目标。图像复原,以图像退化的数学模型为基础,来改善图像质量表达与描述,图像分割后,输出分割标记或目标特征参数;特征提取:计算描述目标的特征,如目标的几何形状特征、统计特征、矩特征、纹理特征等。图像增强:显示图像中被模糊的细节。或是突出图像中感兴趣的特征。图像识别:统计模式识别、模糊模式识别、人工神经网络等。

数字图像处理论文

华东交通大学理工学院课程设计报告书 所属课程名称数字图像处理期末论文分院电信分院专业班级14 计科 学号20140210440214 学生姓名习俊 指导教师熊渊 2016 年12 月13 日

摘要 数字图像处理是用计算机对图像信息进行处理的一门技术,主要是为了修改图形,改善图像质量,或是从图像中提起有效信息,还有利用数字图像处理可以对图像进行体积压缩,便于传输和保存。本文论述了用Matlab编程对数字图像进行图像运算的基本方法。图像运算涵盖了MA TLAB程序设计、图像点运算、代数运算、几何运算等基本知识及其应用(点运算是图象处理的一个重要运算)。以及对图像加入噪声、图像缩放和图像旋转。 关键词图像点运算;代数运算;几何运算;图像缩放;图像旋转

目录 绪论 第一章图像运算 2.1点运算 2.2代数运算 2.3几何运算 第二章程序设计与调试 结束语 参考文献

绪论 早期的计算机无论在计算速度或存储容量方面,难于满足对庞大图像数据进行实时处理的要求。随着计算机硬件技术及数字化技术的发展,计算机、内存及外围设备的价格急剧下降,而其性能却有了大幅度的提高。 图像信息是人类获得外界信息的主要来源,数字图像处理技术越来越多的应用于人们日常工作、学习和生活中。和传统图像处理相比,它具有精度高、再观性好、通用性和灵活性强等特点。在近代科学研究、军事技术、工农业生产、医学、气象及天文学等领域中也得到了广泛应用。 近几年来,随着计算机和各个相关领域研究的迅速发展,科学计算可视化、多媒体技术等研究和应用的兴起,数字图像处理从1个专门领域的学科,变成了1种新型的科学研究和人机界面的工具。数字图像作为一门新兴技术,它是二十一世纪五十年代数字计算机发展到相当水平后开拓出来的计算机应用新领域,它把图像转换成数据矩阵存放于计算机中,并进行滤波、增强、删除等处理,包括图像输入输出技术、图像分析、变换于处理技术以及图像识别和特征提取等方面。六十到七十年代数字处理技术的理论和方法更加完善,其准确性、灵活性和通用性逐步提高。 在日常生活中,电脑人像艺术,电视中的特殊效果,自动售货机钞票的识别,邮政编码的自动识别和利用指纹、虹膜、面部等特征的身份识别等均是图像处理的广泛应用。 进行数字图像处理时主要涉及数字图像点运算处理,针对图像的像素进行加、减、乘、除等运算,有效地改变了图像的直方图分布。

视频处理技术

S3 视频处理 S1.1 视频基础知识 视频信息是连续变化的影像,通常是指实际场景的动态演示,例如电影、电视、摄像资料等。视频信息带有同期音频,画面信息量大,表现的场景复杂,通常采用专门的软件对其进行加工和处理。 S3.1.1 视频设备 常用的视频设备主要有采集卡(用于采集模拟信号)、1394卡(用于采集数字视频信号)、DVD/CD 刻录机(存储视频)。 S3.1.2 视频格式 1、AVI AVI的英文全称为Audio Video Interleaved,即音频视频交错格式。它于1992年被Microsoft 公司推出,随Windows3.1一起被人们所认识和熟知。所谓“音频视频交错”,就是可以将视频和音频交织在一起进行同步播放。这种视频格式的优点是图像质量好,可以跨多个平台使用,其缺点是体积过于庞大,而且更加糟糕的是压缩标准不统一,最普遍的现象就是高版本Windows媒体播放器播放不了采用早期编码编辑的AVI格式视频,而低版本Windows媒体播放器又播放不了采用最新编码编辑的AVI格式视频,所以我们在进行一些AVI格式的视频播放时常会出现由于视频编码问题而造成的视频不能播放或即使能够播放,但存在不能调节播放进度和播放时只有声音没有图像等一些莫名其妙的问题,如果用户在进行AVI格式的视频播放时遇到了这些问题,可以通过下载相应的解码器来解决。 DV-AVI格式:DV的英文全称是Digital Video Format,是由索尼、松下、JVC等多家厂商联合提出的一种家用数字视频格式。目前非常流行的数码摄像机就是使用这种格式记录视频数据的。它可以通过电脑的IEEE 1394端口传输视频数据到电脑,也可以将电脑中编辑好的的视频数据回录到数码摄像机中。这种视频格式的文件扩展名一般是.avi,所以也叫DV-AVI格式。 2、MPEG MPEG-1制定于1992年,为工业级标准而设计,可适用于不同带宽的设备,如CD-ROM、Video-CD、CD-i。它可针对SIF标准分辨率(对于NTSC制为352X240;对于PAL制为352X288)的图象进行压缩,传输速率为1.5Mbits/sec,每秒播放30帧,具有CD(指激光唱盘)音质,质量级别基本与VHS相当。MPEG的编码速率最高可达4-5Mbits/sec,但随着速率的提高,其解码后的图象质量有所降低。 MPEG-2制定于1994年,设计目标是高级工业标准的图象质量以及更高的传输率。MPEG-2所能提供的传输率在3-10Mbits/sec间,其在NTSC制式下的分辨率可达720X486,MPEG-2也可提供并能够提供广播级的视像和CD级的音质。MPEG-2的音频编码可提供左右中及两个环绕声道,以及一个加重低音声道,和多达7个伴音声道(DVD可有8种语言配音的原因)。由于MPEG-2在设计时的巧妙处理,使得大多数MPEG-2解码器也可播放MPEG-1格式的数据,如VCD。 MPEG-4标准主要应用于视像电话(videophone),视像电子邮件(VideoEmail)和电子新闻(Electronicnews)等,其传输速率要求较低,在4800-64000bits/sec之间,分辨率176X144。 MPEG-4利用很窄的带宽,通过帧重建技术,压缩和传输数据,以求以最少的数据获得最佳的图象质量。与MPEG-1和MPEG-2相比,MPEG-4的特点是其更适于交互AV服务以及远程监控。

数字图像处理结课论文

数字图像处理结课作业 --数字图像频域增强方法 及在matlab中的实现 学生姓名: 学号: 学院:理学院 班级:电科班 指导教师:

摘要:图像增强的目的是使处理后的图像更适合于具体的应用,即指按一定的需要突出一幅图像中的某些信息,同时削弱或去除某些不需要的信息,使之改善图像质量,加强图像判读和识别效果的处理技术。从总体上可以分为两大类:空域增强和频域增强。频域处理时将原定义空间中的图像以某种形式转换到其他空间中,利用该空间的特有性质方便的进行图像处理。而空域增强是在图像空间中借助模板对图像进行领域操作,处理图像每一个像素的取值都是根据模板对输入像素相应领域内的像素值进行计算得到的。空域滤波基本上是让图像在频域空间内某个范围的分量受到抑制,同时保证其他分量不变,从而改变输出图像的频率分布,达到增强图像的目的。本文主要从空域展开图像增强技术,重点阐明数字图像增强处理的基本方法,介绍几种空域图像增强方法。 关键词:图像增强 MATLAB 空域增强锐化空间滤波平滑空间滤波

目录: 1、何为数字图像处理及MATLAB的历史 2、空间域图像增强技术研究的目的和意义 3、空间域的增强 3.1 背景知识 3.2 空间域滤波和频域滤波之间的对应关系 3.3 锐化滤波 3.4 平滑滤波 4、结论 1、何为数字图像处理及MATLAB的历史 数字图像处理(digital image processing),就是利用数字计算机或者其他数字硬件,对从图像信息转换而得到的电信号进行某些数学运算,以提高图像的实用性。例如从卫星图片中提取目标物的特征参数,三维立体断层图像的重建等。总的来说,数字图像处理包括运算、几何处理、图像增强、图像复原、图像形态学处理、图像编码、图像重建、模式识别等。目前数字图像处理的应用越来越广泛,已经渗透到工业、医疗保健、航空航天、军事等各个领域,在国民经济中发挥越来越大的作用。 MATLAB是由美国Math Works公司推出的软件产品。MATLAB是“Matric Laboratory”的缩写,意及“矩阵实验室”。MATLAB是一完整的并可扩展的计算机环境,是一种进行科学和工程计算的交互式程序语言。它的基本数据单元是不需要指定维数的矩阵,它可直接用于表达数学的算式和技术概念,而普通的高级语言只能对一个个具体的数据单元进行操作。它还是一种有利的教学工具,它在大学的线性代数课程以及其它领域的高一级课程的教学中,已成为标准的教学工具。

图形图像处理论文

图形图像技术在印刷上的最新应用 学号姓名 (湖南工业大学包装与材料工程学院印刷工程专业, 湖南株洲, 412008) 摘要:本文主要阐述了图像技术和数字图像技术在印刷检测中的广泛应用,并分析他们各自的优点,同时还介绍了图形图像用在印刷方面的各种软件,从印刷行的角度出发,指明了数字图像技术在印刷行业中前景将会越来越好。 关键词:数字图像处理、印刷检测、计算机技术 The latest application of image technology in pritnting Abstract:T his article mainly expounds the image technology and digital image technology is widely used in printing detection, and analyzes their respective advantages, at the same time also introduces the image used in printing all kinds of software, from the Angle of the printing line, pointed out the digital image technology in printing industry in the future will be better and better. Key Words:Digital image processing , Computer technology , Press Test 通过这几天查看一些书籍,让我对图形图像在印刷方面的应用有了初步的了解。在印前处理领域常用的图形处理软件包括:Corel公司的CorelDraw、Adobe 公司的Illustrator、Macromedia公司的Freehand、三维动画制作软件3Dmax ,此外,在计算机辅助设计与制造等工程领域,常用的图形处理软件还AutoCAD,GHCAD,Pro/E,UG,CATIA,MDT,CAXA电子图版等等。 在印前领域最为常用的图像处理软件是Adobe公司的Photoshop软件,该软件广泛地应用于各领域的图像处理工作中,几乎占据了计算机图像处理软件的统治地位。1、凹印色彩图像质量的因素 灰色平衡时评价凹印彩色图像复制质量的重要指标,它是衡量凹版图像质量和凹印打样质量、印刷中网点与墨量变化的尺度。阶调,就是层次,在印刷上,称为:图像上从最亮到最暗部分的密度等级,也是指原稿或复制图像上最亮到最暗部分层次演变,是图像中视觉可分辨的在、差别。阶调复制是凹印图像复制中的重要指标,只有阶调设定和调整正确、合理,才能再现图像颜色层次所需的全部部信息,就能保证印刷图像阶调层次整体框架的完整性,使亮、中、暗调层次丰富,否则就会损失一部分图像层次信息。凹印图像复制,其实就是色彩的复制,色彩复制是凹印彩色图像复制的灵魂锐度也是清晰度,是原稿和印刷图像上轮廓清晰的程度,以及细微层次,物象质感的尖锐度,是视觉识别印刷图像质量的一个主要指标,由于凹印制版机印刷过程中,图像的清晰度会受到各种因素的影响而变差。因此,电分机机调色时,必须对图像进行锐化增强处理,达到在屏幕上观察有些过分为佳,从而逼真地表现凹印图像的清晰度。 2、利用图像软件增强印刷效果 把专色加入到一个Photoshop图像上时,可能就需要自己动手镂空图像的区域了,这是因为专色通道总是叠印在其它颜色通道之上,可能会产生不满意的印刷效果。是否需要将图像中出现专色的部位镂空,取决于图像、选择的专色和所需的印刷效果。为了不让专色区域叠印在图像上,需将图像上与专色区域对应的部位镂空。此外,为了便于印刷时的套印精确,镂空部位的面积应稍微收缩一点,即比专色区域稍小一点。如果不做这样的补偿工作,印刷时只要有一点点套印不准,那么在专色区域的边缘上将会出现明显的漏白。

数字图像处理论文

安徽工程大学 论文题目:数字图像处理图像增强算法的研究 学院:计算机与信息学院 班级:软件141 姓名:程健 学号:3140704135 指导老师:卢桂馥 2017年6月9日

摘要 在我们的实际生活、生产中,人们直接获得的原始图像并不能够直接运用到生活、生产中,因为原始图像在生成、传输和转换过程中可能会受到多种因素的影响,如各种各样的噪声、通道带宽等,往往会出现清晰度下降、对比度偏低等降质现象,为了使得处理后的图像对某种特定的应用比原始图像更合适,往往需要提高图像质量。图像增强是指按特定的需要突出一幅图像中的某些信息,同时削弱或去除某些不需要信息的处理方法,其目的是使得处理后的图像对某种特定的应用比原始图像更合适。 本文研究了图像增强的一些常用方法,包括空域图像增强、频率域图像增强,并用MATLAB 编程设计了相应的实验,对图像增强效果进行了验证。 关键字:图像增强;图像;算法;空域增强;频率增强

Abstract In our daily life and production, people often can't used the raw image directly, because of the generation and transformation of the original image, it may be affected by many factors, such as a variety of kinds of noise and channel bandwidth. The sharpness and contrast is decreasing and have low qualities. in order to make the image more suitable for some particular application after processing than the original, we often need to improve image quality. Images enhance is in a particular need to highlight a picture in the information, and weaken or remove certain need of information in the process, its purpose is to make the image of a specific application is better than the original image. This paper studies the image of some common method, including airspace images enhance and increase the frequency domain, and images matlab programming, design corresponding to picture to enhance the effect of the verification. Key words:Image enhancement; the airspace strengthened; the frequency domain enhancement

基于matlab的数字图像处理本科毕业设计论文

毕业设计(论文)原创性声明和使用授权说明 原创性声明 本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。 作者签名:日期: 指导教师签名:日期: 使用授权说明 本人完全了解大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。 作者签名:日期:

学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。 作者签名:日期:年月日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 涉密论文按学校规定处理。 作者签名:日期:年月日 导师签名:日期:年月日

图像处理技术的应用论文

图像处理技术的应用先展示一下自己用Photoshop处理的图片(做的不好望见谅)

摘要:图像处理技术的研究和应用越来越收到社会发展的影响,并以自身的技术特点反过来影响整个社会技术的进步。本文主要简单概括了数字图像处理技术近期的发展及应用现状,列举了数字图像处理技术的主要优点和制约其发展的因素,同时设想了图像处理技术在未来的应用和发展。 关键字:图像处理发展技术应用 1.概述 1.1图像的概念 图像包含了它所表达的物体的描述信息。我们生活在一个信息时代,科学研究和统计表明,人类从外界获得的信息约有百分之七十来自视觉系统,也就是从图像中获得,即我们平常所熟知的照片,绘画,动画。视像等。 1.2图像处理技术 图像处理技术着重强调在图像之间进行的变换,主要目标是要对图像进行各种加工以改善图像的视觉效果并为其后的目标自动识别打基础,或对图像进行压缩编码以减少图像存储所需要的空间或图像传输所需的时间。图像处理是比较低层的操作,它主要在图像像素级上进行处理,处理的数据量非常大。 1.3优点分析 1.再现性好。数字图像处理与模拟图像处理的根本不同在于,它不会因图像的存储、传输或复制等一系列变换操作而导致图像质量的退化。 2.处理精度高。按目前的技术,几乎可将一幅模拟图像数字化为任意大小的二维数组,这主要取决于图像数字化设备的能力。现代扫描仪可以把每个像素的灰度等级量化为16位甚至更高,这意味着图像的数字化精度可以达到满足任一应用需求。 3.适用面宽。图像可以来自多种信息源,它们可以是可见光图像,也可以是不可见的波谱图像(例如X射线图像、射线图像、超声波图像或红外图像等)。从图像反映的客观实体尺度看,可以小到电子显微镜图像,大到航空照片、遥感图像甚至天文望远镜图像。即只要针对不同的图像信息源,采取相应的图像信息采集措施,图像的数字处理方法适用于任何一种图像。 4.灵活性高。图像处理大体上可分为图像的像质改善、图像分析和图像重建三大部分,每一部分均包含丰富的内容。而数字图像处理不仅能完成线性运算,而且能实现非线性处理,即凡是可以用数学公式或逻辑关系来表达的一切运算均可用数字图像处理实现。 2.应用领域 2.1图像技术应用领域

数字视频技术及应用复习题

第一章数字视频概述 1.什么是复合视频?2页,可改为填空题 例如:黑白视频信号是一个已经经过加工处理并包含扫描同步和消隐的图像信号,通常也叫做复合视频,简称视频。由于频带范围在1-6MHZ人们又把它叫做电视基带视频。 2.什么是视频技术?它主要应用在哪些领域?3页,可以改为填空题 例如:在不考虑电视调制发射和接收等诸多环节时,单纯考虑和研究电视基带信号的摄取、改善、传输、记录、编辑、显示的技术就叫做视频技术。 主要应用领域:广播电视的摄录编系统、安全及监控、视频通信和视频会议、远程教育及视听教学、影像医学、影音娱乐和电子广告。 3.什么是数字视频?5页 广义的数字视频表述为数字视频是指依据人的视觉暂留特性,借着计算机或微处理器芯片的高速运算,加上Codec技术、传输存储技术等来实现的以比特流为特征的,能按照某种时基规律和标准在显示终端上再现活动影音的信息媒介。狭义的数字视频时指与具体媒体格式所对应的数字视频。 第二章彩色数字视频基础 1.彩色电视系统是根据色光三基色原理来再现彩色图像的。按照此原理,任何一种色光颜色都可以用R G B三个彩色分量按一定的比例混合得到。7页 2.匹配兼容制彩色电视亮度信号的公式是:8页(2-2) 3.两个色差信号正交调制的目的是什么?10页 4.电视扫描分为逐行扫描和隔行扫描两种。 5.电视基带视频有复合视频、亮色分离视频和分量视频三种。13页 6.彩色电视制式有哪三种?制式差异主要体现在哪些方面?14页或改为填空 世界上现行的彩色电视制式有NTSC制式、PAL制式和SECAM制式三大制式。制式差异主要体现在亮度合成公式、色差信号提取、色副载选取及其正交调制类型、扫描方式、同步时基确定等方面的参数。 7.彩色电视图像的数字化有信号上游数字化和信号下游数字化两种。 8.A/D转换主要包括哪些环节?量化的实质是什么?编码的实质是什么?17,18页,可改为填空 A/D转换就是指对幅值连续变化的模拟视频电信号进行脉冲抽样保持、量化、编码等环节后形成二进制码流的技术处理过程。 9.一般常用的线性D/A转换器,其输出模拟电压U和输入数字量D之间成正比关系。19页 10.YCbCr信号和YUV信号是正比关系。21页,或选择A正比B反比C非线性D平方11.CCIR601标准为NTSC、PAL、和SECAM制式规定了共同的图像采样频率是13.5MHZ。21页 12.PAL制NTSC制的现行标准数字电视有效显示分辨率(清晰度)各为720X576像素和720X480像素。公用中分辨率为352X288像素。23页 第三章广义数字视频及分类 1.广义数字视频的定义?28页 2.广义的数字视频是依据人的视觉暂留特性,借助计算机或微处理器芯片的高速运算加上Codec编解码技术、传输存储技术等来实现的比特流为特征的全新的信息媒介。 3.图像序列的特点有哪些?33页 特点是每帧的分辨率相同,图像内容相关、图像文件名连续编号,而且有表示开始的图像序列头和表示结束的图像终止码。

第4章_视频处理技术

08电子信息工程2班林伟彬3108002633 第四章视频处理技术 一、选择题 1、在视频通信应用中,用户对视频质量的要求和对网络带宽占用的要求之间的关系是:A A、矛盾的 B、一致的 C、反向的 D、互补的2在视频应用通信中,解决用户对视频质量要求和占用网络带宽要求之间矛盾的是:B A、提高视频质量B、视频编解码技术 C、降低视频质量 D、增加带宽 3、图像和视频之所以能进行压缩,在于图像和视频中存在大量的:A A、冗余 B、相似性 C、平滑区 D、边缘区 4、在视频图像中,C 是相邻两帧的差值,体现了两帧之间的不同之处。 A、视觉冗余 B、运动估计 C、运动补偿 D、结构冗余 5、在视频图像中主要存在的是:B A、视觉冗余 B、时间冗余 C、空间冗余 D、结构冗余6.视频图像的编码方法的基本思想是:第一帧和关键帧采用A方法进行压缩。 A.帧内编码B.帧间编码C.运动估计D.运动补偿 7.如果视频图像只传输第一帧和关键帧的完整帧,而其他帧只传输B,可以得到较高的圧缩比。 A.运动估计和补偿B.帧差信息 C.运动估计D.运动补偿 8.下列D视频压缩系列标准主要用于视频通信应用中。 A.MPEG B.H.26x C.JPEG D.AVS 9.下列B视频压缩系列标准主要用于视频存储播放应用中。 A.MPEG B.H.26x C.JPEG D.AVS 10.基于LAN网络的视频压缩标准是:C。 A.MPEG B.H.324 C.H.323 D.H.320 11、基于ISDN网络的视频压缩框架标准是: D A、MPEG B、H.324 C、H.323 D、H.320 12、基于PSTN网络的视频压缩框架标准是: B A、MPEG B、H.324 C、H.323 D、H.320 13、视频压缩系列标准MPEG-x主要是应用于视频存储播放应用中,例如,DVD中的视频压缩标准为 B A、MPEG-1 B、MPEG-2 C、MPEG-3 D、MPEG-4 14、CIF图像格式的大小是 B A、176×144 B、352×288 C、704×576 D、1408×1152 15、当采用H.261标准编码时,亮度分量与颜色分量的比值为 A A、4:1:1 B、4:2:2 C、4:0:2 D、4:2:0 16、曾经普遍使用的VCD系统就是基于 A 编码标准研制的。 A、MPEG-1 B、MPEG-2 C、MPEG-3 D、MPEG-4 17.MPEG-1标准的典型编码码率为A ,其中1.1Mbps用于视频,128看kps用于音频,其余带宽用于MPEG系统本身。 A 1.5Mps B 2Mps C 10Mps D 15Mps 18.MPEG-1标准中, C是图像编码的基本单元,运动补偿、量化等均在其上进行。

数字图像处理论文

数字图像处理的发展、应用及前景 数字图像处理(Dital Image Processing)又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。 形式化的数学表示可表示为:f(x,y)表示幅图像。x,y,f为有限、离散值。黑白图像可用二维函数f(x,y)表示,其中x,y是平面的二维坐标,f(x,y)表示点(x,y)的亮度值(灰度值)。对模拟图像来讲,f(x,y)显然是连续函数。为了适应数字计算机的处理,必须对连续图像函数进行空间和幅值数字化。空间坐标(x,y)的数字化称为图像采样,而幅值数字化被称为灰度级量化。经过数字化后的图像称为数字图像(或离散图像)。 (1)数字图像的灰度图像的阵列表示法。 设连续图像f(x,y)按等间隔采样,排成MxN阵列(一般取方阵列NxN) 图像阵列中每个元素都是离散值,称为像素(pix—el)。在数字图像处理中,一般取阵列N和灰度级C都是2的整数幂,即取N=及G=。对一般电视图像,N取256或512,灰度级C取64级(m=6bit)至256级m=8bit),即可满足图像处理的需要。对特殊要求的图像,如SAR图片取10000×10000,灰度级m取8bit或者16bit。 (2)数字图像的二值图像表示法。 所谓二值图像就是只有黑白两个灰度级,即像素灰度级非1即0。如文字图片,其数字图像可用每个像素1Bit的矩阵表示,以减少存储量。二值图像还可采用一些特有的表示方法,如链码仅称Freeman码)。常用链码是八向链码,能进一步减少存储量。 数字图像处理作为一门学科大约形成于2O世纪60年代初期。数字图像处理技术是一门新兴的技术,但它已经在各行各业显示出了特有的优点,它已经极大地提高了生产效率,引起了越来越多的人们的关注。早期的图像处理的目的是改善图像的质量、

数字图像处理论文

数字图像处理 题目指纹图像的分割技术 姓名 学号 院系 成绩 二O一一年十二月二十八日

指纹图像的分割技术 摘要 介绍了一种基于指纹多特征的指纹图像分割方法。首先简述了三种基于单一特征的指纹图像分割方法;基于灰度方差的指纹图象分割、基于方向信息的指纹图像分割和基于角度灰度均值的指纹分割的适用情况及利弊,然后介绍了将方向图法和灰度法两种分割方法合理结合起来的基于多特征的指纹图像分割方法,该方法首先将图像划分成多个不重叠的块,并计算各子块的灰度方差与均值,再根据各个图像块的灰度方差值与方差闲的关系,确定各子块是采用方向图法还是采用灰度法继续进行图像分割。实践证明,基于多特征的指纹图像分刻方法充分利用了指纹图像的特征,避免了单一特征的缺陷,从而能获取更加清晰质量更好的指纹图像为指纹的进一步识别提供了更好的条件。 关键词指纹图像图像分割分割技术 正文 自古至今人类中还没有发现不同的人具有相同的指纹, 并且同一指的指纹形和细节特征在一个人的一生中都保持不变。因此, 指纹一直被当作人的身份鉴定的可靠手段。 随着数字图像处理技术的不断发展以及图像处理必须具备的条件日益得到满足, 数字图像处理在计算机科学、信息学科、生物科学、医学等领域里得到广泛的重视和应用。而今科技也是相当的发达,因此,出现了一门独有的技术指纹图像分割技术。 图像分割所采用的基本原则是,使区域内部所考虑的特征或属性是相同或相近的,而这些特征或属性在相邻的区域中则不同,存在差异㈠。目前,国内外有许多指纹图像分割方法,从分割的操作方法和分割的精确程度上来分类,可以大致分成以下两类: 一类是按图块来进行操作的指纹图分割方法。唐良瑞㈡提出了基于D-S 证据理论的指纹图像分割方法,将D-S 证据理论运用到指纹图像的分割之中,利指纹识别的目的主要是确定两枚指纹是否相同,判断两枚指纹是否一致主要是判断指纹细节特征即纹线的突然终断点和叉点是否匹配。用图像块的方向和对比度信息实现了指纹图像分割。Mehtre㈢根据分块图像的梯度分布情况和灰度方差将这些块分成前景和背景。X. Chen㈣使用线性分类器对指纹图像块进行分类,从而实现了图像的分割。Q.Ren㈤提出了基于特征信息统计和基于前景边缘线搜索的两种指纹图像分割方法。 另一类是按像素点来进行操作的指纹图分割方法。蒋景英㈥将遗传算法和方向图相结合,实现了指纹图像的分割。A. M. Bazen㈦通过对像素点特征定义与分类,使用关于CMV 三个指标的线性分割器,将图像中的前景区和背景区分离。何余良㈧提出了一种基于马尔科夫随机场的指纹图像分割方法。 值得注意的一点是,虽然已经出现各种各样的图像分割方法,但至今为止还没有发现某一种对任何图像都有良好效果的图像分割算法,也就是说任何一种分

相关主题
文本预览
相关文档 最新文档