2020年尹其畅数字图像处理大作业精编版
- 格式:docx
- 大小:469.98 KB
- 文档页数:13
《数字图像处理》期末大作业大作业题目及要求:一、题目:本门课程的考核以作品形式进行。
作品必须用Matlab完成。
并提交相关文档。
二、作品要求:1、用Matlab设计实现图形化界面,调用后台函数完成设计,函数可以调用Matlab工具箱中的函数,也可以自己编写函数。
设计完成后,点击GUI图形界面上的菜单或者按钮,进行必要的交互式操作后,最终能显示运行结果。
2、要求实现以下功能:每个功能的演示窗口标题必须体现完成该功能的小组成员的学号和姓名。
1)对于打开的图像可以显示其灰度直方图,实现直方图均衡化。
2)实现灰度图像的对比度增强,要求实现线性变换和非线性变换(包括对数变换和指数变换)。
3)实现图像的缩放变换、旋转变换等。
4)图像加噪(用输入参数控制不同噪声),然后使用空域和频域进行滤波处理。
5)采用robert算子,prewitt算子,sobel算子,拉普拉斯算子对图像进行边缘提取。
6)读入两幅图像,一幅为背景图像,一幅为含有目标的图像,应用所学的知识提取出目标。
3、认真完成期末大作业报告的撰写,对各个算法的原理和实验结果务必进行仔细分析讨论。
报告采用A4纸打印并装订成册。
附录:报告模板《数字图像处理》期末大作业班级:计算机小组编号:第9组组长:王迪小组成员:吴佳达浙江万里学院计算机与信息学院2014年12月目录(自动生成)1 绘制灰度直方图,实现直方图均衡化 (5)1.1 算法原理 (5)1.2 算法设计 (5)1.3 实验结果及对比分析 (5)2 灰度图像的对比度增强 (5)2.1 算法原理 (5)2.2 算法设计 (5)2.3 实验结果及分析 (5)3 图像的几何变换 (5)3.1 算法原理 (5)3.2 算法设计 (5)3.3 实验结果及分析 (5)4 图像加噪(用输入参数控制不同噪声),然后使用空域和频域进行滤波处理 (5)4.1 算法原理 (5)4.2 算法设计 (6)4.3 实验结果及分析 (6)5 采用robert,prewitt,sobel,拉普拉斯算子对图像进行边缘提取 (6)5.1 算法原理 (6)5.2 算法设计 (6)5.3 实验结果及分析 (6)6 读入两幅图像,一幅为背景图像,一幅为含有目标的图像,应用所学的知识提取出目标 (6)6.1 算法原理 (6)6.2 算法设计 (6)6.3 实验结果及分析 (6)7 小结(感受和体会) (6)1 绘制灰度直方图,实现直方图均衡化1.1 算法原理图像增强是指按特定的需要突出一幅图像中的某些信息,同时,消弱或去除某些不需要的信息的处理方法。
1.数字图像与连续图像相比具有哪些优点?连续图像f(x,y)与数字图像I(c,r)中各量的含义是什么?它们有何联系和区别? (To be compared with an analog image, what are the advantagesof a digital image? Let f(x,y) be an analog image, I(r, c) be a digital image, please giveexplanation and comparison for defined variables: f/I, x/r, and y/c)2.图像处理可分为哪三个阶段? 它们是如何划分的?各有什么特点? (We can divide image processing into 3 stages, what are they? how they are divided? What are their features?)答:低级处理---低层操作,强调图像之间的变换,是一个从图像到图像的过程;中级处理---中层操作,主要对图像中感兴趣的目标进行检测和测量,从而建立对图像的描述,是一个从图像到数值或符号的过程;高级处理---高层操作,研究图像中各目标的性质和相互联系,得出对图像内容含义的理解以及对原来客观场景的解释;3.试从结构和功能等角度分析人类视觉中最基本的几个要素是什么?什么是马赫带效应? 什么是同时对比度?它们反映了什么共同问题? (According to the structure and function of theeyes, what are the basic elements in human vision? What is the Mach Band Effect? What is Simultaneous Contrast? What common facts can we infer from both Mach Band Effect and Simultaneous Contrast?)答:人的视觉系统趋向于过高或过低估计不同亮度区域边界的现象称为“马赫带”效应;同时对比度指的是人的视觉系统对某个区域感觉到的亮度除了依赖于它本身的强度,还与背景有关. 马赫带效应和同时对比度现象表明人所感觉到的亮度并不是强度的简单函数.4.比较说明像素邻域、连接、通路以及连通基本概念的联系与区别。
图像处理技术大作业院(系):物联网工程学院专业: 计算机科学与技术班级:学号:姓名:摘要图像分割就是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程。
它是图像处理、模式识别和人工智能等多个领域中的重要课题,也是计算机视觉技术中首要的、重要的关键步骤。
图像分割的应用非常广泛,几乎出现在有关图像处理的所有领域。
因此,从世纪年代以来,图像分割一直都是图像技术中的研究热点。
由于图像分割的好坏直接关系到后续工作的研究进展,广大研究学者们提出了许多既经典又有效的分割算法。
但随着数字图像技术的发展和应用领域的拓宽,一些经典的图像分割算法已不能应用于新的领域。
因此,新的图像分割算法成为迫切之需并在这样的大背景下应运而生。
尽管有许多新的图像分割算法已被提出,但对于图像分割算法的研究仍然是图像分割领域中的一个热点与难点,对广大学者们更是一个巨大的挑战。
本文所做工作主要包括以下三个方面:(1)图像分割目标和研究现状。
(2)图像分割方法总结。
(3)水平集方法程序实现和实验结果。
关键词:图像分割活动轮廓模型算法图像分辨率水平集方法图像分割的目标图像分割是图像分析的第一步,是计算机视觉的基础,是图像理解的重要组成部分,也是图像处理、模式识别和人工智能等多个领域中一个十分重要且又十分困难的问题。
所谓图像分割就是要将图像表示为物理上有意义的连通区域的集合,也就是根据目标与背景的先验知识,对图像中的目标、背景进行标记、定位,然后将目标从背景或其他伪目标中分离出来。
由于这些被分割的区域在某些特性上相近,因而图像分割常用于模式识别与图像理解以及图像压缩与编码两大类不同的应用目的门。
由分割产生的区域是图像内容的一种表示,它是对图像进行视觉分析和模式识别的基本前提,分割结果的质量直接影响到以后的图像分析、识别和解释的质量,具有重要的意义。
图像分割的目的在于根据某些特征如灰度级、频谱、纹理等将一幅图像分成若干有意义的区域,使得这些特征在某一区域内表现一致或相似,而在不同区域间表现出明显的不同。
《图像处理技术》大作业学号:200808205135姓名:柯锦班级:B08082051学院:数计1 作业题目基于图像的动态景物的监测与跟踪2 作业数据短视频,背景相同,一个目标运动,及多目标运动3 基本方法(1)图像增强(2)图像基本运算(3)图像分割见代码注释:单目标主要代码如下function pushbutton4_Callback(hObject, eventdata, handles)% hObject handle to pushbutton4 (see GCBO)% eventdata reserved - to be defined in a future version of MATLAB% handles structure with handles and user data (see GUIDATA)global KeJin;%设置全局变量,用于记录目标单击的按钮axes(handles.axes1); %在axes1中处理,实现原动画的显示clear data %数据清理avi = aviread('samplevideo.avi');%读取一个avi动画,放到临时数组avi中video = {avi.cdata};for a = 1:length(video) %一帧一帧的读取video,并调用绘图函数imagesc显示每一帧的内容,以达到avi动画的播放imagesc(video{a});axis image offdrawnow;end;%handles.keJin=1;%guidata(hObject, handles);KeJin=1;% --- Executes on button press in pushbutton5.function pushbutton5_Callback(hObject, eventdata, handles)% hObject handle to pushbutton5 (see GCBO)% eventdata reserved - to be defined in a future version of MATLAB% handles structure with handles and user data (see GUIDA TA)global KeJin;if KeJin==1axes(handles.axes2);%在axes2中处理,实现目标的跟踪的显示clear dataavi = aviread('samplevideo.avi');video = {avi.cdata};tracking(video);%调用tracking函数,实现动画跟踪(单目标)endif KeJin==2axes(handles.axes2);MovingDetect();%调用MovingDetect函数,实现动画跟踪(多目标)endfunction d = tracking(video) %跟踪处理函数,实现一个运动目标的跟踪if ischar(video)% Load the video from an avi file.avi = aviread(video);pixels = double(cat(4,avi(1:2:end).cdata))/255;%将数据缩小255倍,然后以第四维进行组合,图像的增强(像素点的值缩小)clear avielse% Compile the pixel data into a single arraypixels = double(cat(4,video{1:2:end}))/255; %将数据缩小255倍,然后以第四维进行组合,图像的增强(像素点的值缩小)clear videoend% Convert to RGB to GRAY SCALE image.nFrames = size(pixels,4);%pixels第四维的大小放在nFrames中(总帧数)for f = 1:nFrames %对于没一帧,都做如下工作pixel(:,:,f) = (rgb2gray(pixels(:,:,:,f))); %转换为灰度图像endrows=240;cols=320;nrames=f;for l = 2:nrames%从第二帧到最后一帧,都做如下工作%下句为图像的基本运算,减运算,也是该跟踪的根本算法之一d(:,:,l)=(abs(pixel(:,:,l)-pixel(:,:,l-1)));%前后图像相减,得到的矩阵放到d中,以实现图像跟踪,此为图像的基本运算k=d(:,:,l);bw(:,:,l) = im2bw(k, .2);%转化为二值图像bw1=bwlabel(bw(:,:,l));imshow(bw(:,:,l))%显示二值图像hold on%右方向为横坐标轴%下方向为纵坐标轴cou=1;for h=1:rowsfor w=1:colsif(bw(h,w,l)>0.5)%此处用到图像分割,全局阀值分割toplen = h; %每一帧,如果cou!=1的话,下边界纵坐标放在toplen中,if (cou == 1)tpln=toplen; %每一帧,上边界纵坐标放在tpln中endcou=cou+1;breakendendend%disp(toplen);coun=1;for w=1:colsfor h=1:rowsif(bw(h,w,l)>0.5)%此处用到图像分割,全局阀值分割leftsi = w; %每一帧,如果coun!=1的话,右边界横坐标放在leftsi中if (coun == 1)lftln=leftsi; %每一帧,左边界横坐标放在lftln中coun=coun+1;endbreakendendendwidh=leftsi-lftln;%矩形的长(宽度)heig=toplen-tpln;%矩形的宽(高度)widt=widh/2;heit=heig/2;with=lftln+widt;%中心横坐标heth=tpln+heit;%中心纵坐标rectangle('Position',[lftln tpln widh heig],'EdgeColor','r');%用红色矩形框住目标,以确定目标位置plot(with,heth, 'r^');%用Δ标出目标的中心drawnow;hold offend;多目标function x = MovingDetect()clear data%初始化背景所需要的帧数N=15;%背景更新参数p1 = 95;p2 = 100-p1;M_ = 1;%读取A VI视频文件mov = aviread('My.AVI');%获取视频帧数dimension = size(mov);frameQTY = dimension(2);M=mov;tmFr = rgb2gray(frame2im(mov(1)));s = size(tmFr);scrsz = get(0,'ScreenSize');%%%h1 = figure('position', [scrsz(4)/2,scrsz(4)/2,s(2)*2,s(1)*2]); cdataSum = int16(zeros(s));sedisk = strel('rectangle',[2,2]);sedisk2 = strel('rectangle',[3,2]);count = zeros(s);for c1 = 1:frameQTY;colorFrC = M(c1);%获取第i帧frC = rgb2gray(frame2im(colorFrC));frC = im2frame(frC, gray(256));f = int16(frC.cdata);if( c1<= N)%前N帧用于背景建模movie(frC, 1, 15, [0,s(1),0,0]);%播放第i帧%movie(h1, frC, 1, 15, [0,s(1),0,0]);%播放第i帧cdataSum = cdataSum + f;else%开始运动检测,首先计算出背景if(c1==N+1)cdB = cdataSum/N;else cdB = int16(cdB);endf2 = abs( f - cdB );f2 = uint8(f2);if( c1 == 25)disp('1');endbwf = f2;bw = find( f2 < 45 );bwf(bw) = 0;cdB(bw) = (f(bw)+9*(cdB(bw)) )/10;bw = find( f2 >= 45 );bwf(bw) = 255;%bwf=logical(bwf);cdB = uint8(cdB);f3 = imdilate(bwf, sedisk);f3 = imerode(f3, sedisk);noSmall = bwareaopen( f3, 150 );%标签矩阵L = bwlabel( noSmall, 4 );taggedCars( :,: ) = frC.cdata;if any( L(:) )stats = regionprops(L,'boundingbox','filledArea');for label = 1:length(stats)box = stats(label);if( box.FilledArea < 200 || box.FilledArea/(s(1)*s(2)) > 0.3 )continue;endbox = box.BoundingBox;left=round(box(1));top=round(box(2));right=round(box(1)+box(3)-1);bottom=round(box(2)+box(4)-1);if( abs(top - bottom)/abs(right - left) > 4 || abs(right - left)/abs(top - bottom) > 4 )continue;endtaggedCars(top,left:right)=1; %画矩形框%taggedCars(bottom,left:right)=1;taggedCars(top:bottom,left)=1;taggedCars(top:bottom,right)=1;endend%f5 = imdilate(imerode(f,tk1), tk);ff = [frC.cdata, cdB;f3, taggedCars];%noSmall, taggedCarsff = im2frame(ff,gray(256));movie(ff, 1, 15, [0,0,0,0]);%播放第i帧%movie(h1, ff, 1, 15, [0,0,0,0]);%播放第i帧end% end of if-elseend%--播放结束4 作业完成目标:动态目标的定位与跟踪,并用方框提示并给出运动轨迹截图如下:单目标:多目标:部分代码来源于:/search.php?searchid=475&orderby=lastpost&ascdesc=desc&searchsubmit=yes&page=1小结:此次大作业采用减法运算达到单个目标跟踪的目的,采用了图像增强,设定阀值使结果便于观察,分析。
1. 图像处理与计算机图形学的区别与联系是什么?答:数字图像处理,是指有计算机及其它有关的数字技术,对图像施加某种运算和处理,从而达到某种预期的目的,而计算机图形学是研究采用计算机生成,处理和显示图形的一门科学。
两者区别:(1)研究对象不同,计算机图形学研究的研究对象是能在人的视觉系统中产生视觉印象的事物,包括自然景物,拍摄的图片,用数学方法描述的图形等,而数字图像处理研究对象是图像;(2)研究内容不同,计算机图像学研究内容为图像生成,透视,消阴等,而数字图像处理研究内容为图像处理,图像分割,图像透析等;(3)研究过程不同,计算机图像学是由数学公式生成仿真图形或图像,而数字图像处理是由原始图像处理出分析结果,计算机图形与图像处理是逆过程。
两者的联系:图像处理需图形学的交互手段,图形学需要图像处理合成图像,两者有重叠。
2. 图像数字化过程中的失真有那些原因?就在减少图像失真和减少图像的数据量两者之间如何取得平衡,谈谈个人的看法。
答:图像数字化过程中失真的原因主要来自三个方面:一.采样频率太低,即未满足采样定理而造成的失真;二.外部和内部噪声的影响,例如外部的电磁波、机械运动等;三.用有限个灰度值表示自然界无限连续的灰度值必然造成失真,为了减小失真必然增加采样点,即增加图像数据量。
在减少图像失真和减少图像的数据量两者之间取得平衡,要根据图像需求保留有用信息,如军事图像只需保留反应地形地貌及目标的信息,普通照片只需满足视觉要求即可。
3. 一幅模拟彩色图像经平板扫描仪扫描后获得一幅彩色数字图像,其分辨率为1024×768像素。
若采用RGB彩色空间,红、绿、蓝三基色的灰度等级为8比特,在无压缩的情况下,在计算机中存储该图像将占用多少比特的存储空间?当用Photoshop图像处理软件去掉图像的彩色信息,只留下灰度信息,灰度等级为4比特,在无压缩的情况下,存储该图像将占用多少字节的存储空间?答:(1)采用RGB彩色空间,红、绿、蓝三基色的灰度等级为8比特,在无压缩的情况下,占存储空间大小为:1024×768×8×3=18874268bit=2.25MB(2)去掉彩色信息,只留下灰度信息,灰度等级为4比特,在无压缩的情况下,所占的存储空间大小为:1024×768×4 =3145728bit=0.375MB4. 试设计一个程序实现nn 的中值滤波器,当模板中心移过图像中每个位置时,设计一种简便的中值更新方法。
《数字图像处理》模拟试卷(A 卷)一、单项选择题(从下列各题四个备选答案中选出一个正确答案,并将其代号填在题前的括号内。
答案选错或未作选择者,该题不得分。
每小题1分,共10分)( d)1.一幅灰度级均匀分布的图象,其灰度范围在[0,255],则该图象的信息量为:a. 0b.255c.6d.8( b)2.图象与灰度直方图间的对应关系是:a.一一对应b.多对一c.一对多d.都不对( d )3.下列算法中属于局部处理的是:a.灰度线性变换b.二值化c.傅立叶变换d.中值滤波( b)4.下列算法中属于点处理的是:a.梯度锐化b.二值化c.傅立叶变换d.中值滤波( d) 5.一曲线的方向链码为12345,则曲线的长度为a.5b.4c.5.83d.6.24( c)6. 下列算法中属于图象平滑处理的是:a.梯度锐化b.直方图均衡c. 中值滤波placian增强( b )7.下列图象边缘检测算子中抗噪性能最好的是:a.梯度算子b.Prewitt算子c.Roberts算子d. Laplacian算子( c)8.采用模板[-1 1]主要检测____方向的边缘。
a.水平b.45°c.垂直d.135°( d )9.二值图象中分支点的连接数为:a.0b.1c.2d.3( a)10.对一幅100´100像元的图象,若每像元用8bit表示其灰度值,经霍夫曼编码后压缩图象的数据量为40000bit,则图象的压缩比为:a.2:1b.3:1c.4:1d.1:2二、填空题(每空1分,共15分)1.图像锐化除了在空间域进行外,也可在频率域进行。
2.图像处理中常用的两种邻域是4-邻域和8-邻域。
3.直方图修正法包括直方图均衡和直方图规定化两种方法。
4.常用的灰度内插法有最近邻元法双线性内插法(双)三次内插法5.多年来建立了许多纹理分析法,这些方法大体可分为统计分析法和结构分析法两大类。
6.低通滤波法是使高频成分受到抑制而让低频成分顺利通过,从而实现图像平滑。
1图像变换1.1实验背景在数字图像应用领域,图像需要进行分析、变换、压缩或者增强来提高图像的可处理性和视觉效果。
其中,图像变换是将图像从空间域变换到频率域,变换的目的是根据图像在变换域的某些性质对其进行处理,而这些性质在空间域难以获取,通常在频率域才能获取,在变换域处理完后再反变换到空间域,恢复图像。
图像变换可以减少图像的计算量,提高处理性能。
图像变换常用的有三种变换方法:傅里叶变换,沃尔什-哈达码变换,离散余弦变换。
此外,还有近年来兴起的小波变换。
其中应用最广泛最重要的是傅里叶变换。
它的变换核是复指数函数,转换域图像是原空间域图像的二维频谱,其直流项与原图像亮度的平均值成比例,高频项表征图像中边缘变化的强度和方向,快速傅里叶变换[3]是为了提高原傅里叶变换的运算速度孕育而生的。
本文重点分析傅里叶变换的原理以及它在数字图像中的应用效果。
1.2实验目的熟悉并掌握图像变换中的傅里叶变换原理,完成傅里叶变换的简单实例。
1.3实验原理1807年,傅里叶首先提出傅里叶级数的概念,即任一周期信号可以分解为复正弦信号的叠加。
在此基础上傅里叶在1822年提出傅里叶变换,它是数字图像中应用最重要最广泛的正交变换。
函数)(x f 的一维连续傅里叶变换和反变换由下式定义:dx ex f u F uxj ⎰∞∞--=π2)()( (1)du eu F x f uxj ⎰∞∞-=π2)()( (2)傅里叶变换的实部,虚部,振幅,能量和相位分别用下式表示: 实部 ⎰∞∞-=dx ux x f u R )2cos()()(π (3) 虚部 ⎰∞∞-=dx ux x f u I )2sin()()(π (4)振幅 []2122)()()(u I u R u F += (5) 能量 2)()(u F u E = (6)相位 )()(arctan )(u R u I u =φ (7)傅里叶变换很容易扩展到二维情况,它的定义式如(8)所示:⎰⎰∞∞-∞∞-+-=dxdy ey x f v u F vy ux j )(2),(),(π (8)同理得其傅里叶反变换、频率谱、相位谱和能量谱也可以从一维扩展到二维。
可编辑修改精选全文完整版XXXX 学院2020-2021学年学期期末考试卷课程《数字图像处理》考试时间: 120 分钟班级姓名学号一.填空题(每空1分,共20分)1.________是指由外部轮廓线条构成的矢量图,即由计算机绘制的直线、圆、矩形、曲线、图表等。
2. 图像根据色彩分为:彩色图像、___________和___________。
3. 对一幅连续图像f(x,y)在二维空间上的离散化过程称为___________,离散化后的采样点称为___________。
4. 图像分辨率包括___________和___________两部分,它们分别由采样点数和灰度级来控制。
5.普通彩色图像中,一个像素需要24比特构成,R、G、B各占______个比特,可能的颜色数有______种。
6. RGB模型,也叫______、______、______模型,广泛用于彩色显示器,高质量彩色摄像机中。
7. 在HSI空间中,彩色图像包含色调、___________和___________三个分量。
8. ______________是一种线性的积分变换,常在将信号在时域(或空域)和频域之间变换时使用,在物理学和工程学中有许多应用。
9. 灰度变换是数字图像增强技术的一个重要的手段,目的是使图像的__________动态范围扩大,图像的__________扩大,图像更加清晰,特征越发明显。
10. 图像的退化由系统特性和__________两部分引起。
11. _____________是利用图像数据的冗余进行压缩,可完全恢复原始数据而不引起任何失真,压缩率受冗余度的理论限制。
12. _____________的目的是简化或改变图像的表示形式,使得图像更容易理解和分析。
二.选择题(每题2分,共20分)(请将答案填入下面表格中)1.________目的是改善图像质量,使图像更加符合人类的视觉效果,从而提高图像判读和识别效果的处理方法。
《数字图像处理》大作业——车牌识别(车牌定位和字符分割部分)学院:电子与控制工程学院专业:交通信息工程及控制学号:2012132029姓名:尹其畅任课教师:丁爱玲车牌识别系统1 车牌识别系统1.1车牌识别系统的概述目前随着科技和经济的日益发展,智能交通系统在世界范围内引起重视,我国已经将其列入科技计划重点实施。
智能交通系统是交通发展的必然趋势,而车牌识别系统是智能交通系统中的重要组成部分。
该系统可以记录十字路口违章车辆,实现高速公路,收费路口,停车场等地的收费。
既减少了人力,又节约了时间,还提高了效率。
车牌识别系统的主要任务是分析和处理摄取到的复杂背景下的车辆图像,定位分割牌照,最后自动识别汽车牌照上的字符,LPR是利用车辆牌照的唯一性来识别和统计车辆,它是以数字图像处理、模式识别、计算机视觉等技术为基础的智能识别系统。
在现代化交通发展中车牌识别系统是制约交通系统智能化、现代化的重要因素,LPR系统应该能够从一幅图像中自动提取车辆图像,自动分割牌照图像,对字符进行正确识别,从而降低交通管理工作的复杂度。
车牌字符识别的实质是对车牌上的汉字、字母和数字进行快速准确的识别并以字符串的形式输出识别结果,字符识别技术是整个车牌识别系统的关键。
车牌识别系统与其它图像识别系统相比较而言要复杂的多,在字符识别中,汉字识别是最难也是最关键的部分,很多国外较为成熟的车牌识别系统无法进入中国市场的原因就在于无法有效的识别汉字。
1.2车牌识别系统的结构和工作原理车牌识别技术的任务是处理、分析摄取的车辆图像,实现车牌号码的自动识别。
典型的车辆牌照识别系统是由图像采集系统、中央处理器、识别系统组成,一般还要连接相应的数据库以完成特定的功能。
当系统发现(通过埋地线圈或者光束检测)有车通过时,则发出信号给图像采集系统,然后采集系统将得到的图像输入识别系统进行识别,其识别结果应该是文本格式的车牌号码。
图1.1 车牌识别系统原理图车牌整体识别过程大体可分为四个步骤:图像预处理、车牌定位和分割、车牌字符分割和车牌字符识别。
数字图像处理每章课后题参考答案第一章和第二章作业:1.简述数字图像处理的研究内容。
2.什么是图像工程?根据抽象程度和研究方法等的不同,图像工程可分为哪几个层次?每个层次包含哪些研究内容?3.列举并简述常用表色系。
1.简述数字图像处理的研究内容?答:数字图像处理的主要研究内容,根据其主要的处理流程与处理目标大致可以分为图像信息的描述、图像信息的处理、图像信息的分析、图像信息的编码以及图像信息的显示等几个方面,将这几个方面展开,具体有以下的研究方向:1.图像数字化,2.图像增强,3.图像几何变换,4.图像恢复,5.图像重建,6.图像隐藏,7.图像变换,8.图像编码,9.图像识别与理解。
2.什么是图像工程?根据抽象程度和研究方法等的不同,图像工程可分为哪几个层次?每个层次包含哪些研究内容?答:图像工程是一门系统地研究各种图像理论、技术和应用的新的交叉科学。
根据抽象程度、研究方法、操作对象和数据量等的不同,图像工程可分为三个层次:图像处理、图像分析、图像理解。
图像处理着重强调在图像之间进行的变换。
比较狭义的图像处理主要满足对图像进行各种加工以改善图像的视觉效果。
图像处理主要在图像的像素级上进行处理,处理的数据量非常大。
图像分析则主要是对图像中感兴趣的目标进行检测和测量,以获得它们的客观信息从而建立对图像的描述。
图像分析处于中层,分割和特征提取把原来以像素描述的图像转变成比较简洁的非图形式描述。
图像理解的重点是进一步研究图像中各目标的性质和它们之间的相互联系,并得出对图像内容含义的理解以及对原来客观场景的解释,从而指导和规划行为。
图像理解主要描述高层的操作,基本上根据较抽象地描述进行解析、判断、决策,其处理过程与方法与人类的思维推理有许多相似之处。
第三章图像基本概念1.图像量化时,如果量化级比较小时会出现什么现象?为什么?答:当实际场景中存在如天空、白色墙面、人脸等灰度变化比较平缓的区域时,采用比较低的量化级数,则这类图像会在画面上产生伪轮廓(即原始场景中不存在的轮廓)。
《数字图像处理》试卷A 卷一、单项选择题(从下列各题四个备选答案中选出一个正确答案,并将其代号填在题前的括号内。
答案选错或未作选择者,该题不得分。
每小题1分,共10分)( d )1.一幅灰度级均匀分布的图像,其灰度范围在[0,255],则该图像的信息量为:a. 0b.255c.6d.8 ( b )2.图像与灰度直方图间的对应关系是:a.一一对应b.多对一c.一对多d.都不对( d )3.下列算法中属于局部处理的是:a.灰度线性变换b.二值化c.傅立叶变换d.中值滤波( b )4.下列算法中属于点处理的是:a.梯度锐化b.二值化c.傅立叶变换d.中值滤波( d ) 5.一曲线的方向链码为12345,则曲线的长度为a.5b.4c.5.83d.6.24( c )6. 下列算法中属于图像平滑处理的是:a.梯度锐化b.直方图均衡c. 中值滤波placian增强( b )7.下列图像边缘检测算子中抗噪性能最好的是:a.梯度算子b.Prewitt算子c.Roberts算子d. Laplacian算子( c )8.采用模板[-1 1]主要检测____方向的边缘。
a.水平b.45︒c.垂直d.135︒( d )9.二值图像中分支点的连接数为:a.0b.1c.2d.3( a )10.对一幅100 100像元的图像,若每像元用8bit表示其灰度值,经霍夫曼编码后压缩图像的数据量为40000bit,则图像的压缩比为:a.2:1b.3:1c.4:1d.1:2二、填空题(每空1分,共15分)1.图像锐化除了在空间域进行外,也可在频率域进行。
2.图像处理中常用的两种邻域是4-邻域和8-邻域。
3.直方图修正法包括直方图均衡和直方图规定化两种方法。
4.常用的灰度内插法有最近邻元法、双线性内插法和(双)三次内插法。
5.多年来建立了许多纹理分析法,这些方法大体可分为.统计分析法和结构分析法两大类。
6.低通滤波法是使高频成分受到抑制而让低频成分顺利通过,从而实现图像平滑。
《数字图像处理》大作业——车牌识别(车牌定位和字符分割部分)学院:电子与控制工程学院专业:交通信息工程及控制学号:2012132029姓名:尹其畅任课教师:丁爱玲车牌识别系统1 车牌识别系统1.1车牌识别系统的概述目前随着科技和经济的日益发展,智能交通系统在世界范围内引起重视,我国已经将其列入科技计划重点实施。
智能交通系统是交通发展的必然趋势,而车牌识别系统是智能交通系统中的重要组成部分。
该系统可以记录十字路口违章车辆,实现高速公路,收费路口,停车场等地的收费。
既减少了人力,又节约了时间,还提高了效率。
车牌识别系统的主要任务是分析和处理摄取到的复杂背景下的车辆图像,定位分割牌照,最后自动识别汽车牌照上的字符,LPR是利用车辆牌照的唯一性来识别和统计车辆,它是以数字图像处理、模式识别、计算机视觉等技术为基础的智能识别系统。
在现代化交通发展中车牌识别系统是制约交通系统智能化、现代化的重要因素,LPR系统应该能够从一幅图像中自动提取车辆图像,自动分割牌照图像,对字符进行正确识别,从而降低交通管理工作的复杂度。
车牌字符识别的实质是对车牌上的汉字、字母和数字进行快速准确的识别并以字符串的形式输出识别结果,字符识别技术是整个车牌识别系统的关键。
车牌识别系统与其它图像识别系统相比较而言要复杂的多,在字符识别中,汉字识别是最难也是最关键的部分,很多国外较为成熟的车牌识别系统无法进入中国市场的原因就在于无法有效的识别汉字。
1.2车牌识别系统的结构和工作原理车牌识别技术的任务是处理、分析摄取的车辆图像,实现车牌号码的自动识别。
典型的车辆牌照识别系统是由图像采集系统、中央处理器、识别系统组成,一般还要连接相应的数据库以完成特定的功能。
当系统发现(通过埋地线圈或者光束检测)有车通过时,则发出信号给图像采集系统,然后采集系统将得到的图像输入识别系统进行识别,其识别结果应该是文本格式的车牌号码。
图1.1 车牌识别系统原理图车牌整体识别过程大体可分为四个步骤:图像预处理、车牌定位和分割、车牌字符分割和车牌字符识别。
图1.2 车牌识别流程图⑴图像预处理,在外界光照不均匀,光照强度不稳定的情况下,通过摄像机采集到的车牌原始图像会模糊不清,因此需要对其进行图像增强的处理;在外界环境噪声以及电子器件自身产生的噪声干扰下,车牌图像质量会有所下降,因此需要对原图像进行去噪处理;当摄像头摆放位置与车辆牌照悬挂位置存在一定角度,或者在摄像头进行拍摄的过程中,由于车辆发动机的震动导致摄像头抖动从而使摄取到的车牌图像具有一定程度的倾斜,因此需要对车牌图像进行倾斜矫正等等。
以上所做的这些处理均属于图像预处理的工作。
⑵车牌定位分割,在一张完整的车辆图像中,大部分区域都是背景图像,对识别工作毫无意义,我们可以将背景区域视为无用区域,并设法将其去除,即从复杂的背景图像中准确的定位并分割出车牌区域图像,从原图像中提取出需要的部分舍弃不需要的部分,以便节省系统识别时间,这也是车牌定位分割的目的及意义所在。
在定位分割的过程中要保证不能把非车牌区域误判为车牌区域,也不能漏检车牌区域,否则后继的工作将无法进行。
⑶车牌字符分割,被分离出的车牌区域图像,系统并不能直接对其进行识别,还需要将车牌上的每一个字符都独立的完整的分割出来,即从车牌区域图像中将车牌上所包含的每一个字符都切分出来,使其成为不具有任何相关性的单个字符图像,再由系统分别对每个字符进行识别,在对字符进行切分时,要注意保证每个字符的完整度。
⑷字符识别:车牌字符识别是系统的最后一个步骤,也是最为关键的一步,前面对车牌图像所做的处理都是为了完成最终的识别。
系统输入的是单个的字符图像,输出的却是文本格式的完整的车牌号码,车牌字符识别的准确率直接反映出车牌识别系统性能的好坏。
对于车牌识别系统而言,以上的每一个步骤都是必不可少的,并且后一步骤均是建立在前面步骤的基础之上进行的,因此,只有确保做好每一步才能顺利完成系统最终的识别工作。
本文采用VS2005与open cv 1.0相结合对车牌定位过程进行处理。
2 车牌定位车牌定位是将通过前方摄像头采集的图像经过预处理后,根据车牌的区域特征来判断车牌的位置。
采集是指从摄像头读入一幅图像或者打开本地现存的一幅彩色位图文件。
而预处理包括灰度化,二值化,灰度拉伸及边缘提取等过程。
这些过程包含将待处理图像彩色信息转换成灰度信息,较少处理过程中的信息量,节约了时间。
而且过滤图像噪声使图像区域特征明显,根据区域特征确定车牌区域。
车牌定位的流程图如图2.1所示:图2.1 车牌定位的流程图2.1 车辆图像采集与预处理车辆图像的采集是车牌识别的第一步工作,只有采集到合理的车辆图像,并使当地预处理,才能够进行后续的字符分割与识别工作。
2.1.1车辆图像采集当与摄像头外设相连时,通过捕捉含有车辆的一帧图像进行处理.也可以直接打开一幅计算机本地存储的位图文件,本文采用此方法,在PlateIdentify工程里的资源视图的菜单资源中,为【文件】I【打开】菜单项在PlateIdentifyDoc 类中添加响应函数onOpenducument。
车辆图像采集结果如图2.2所示:图2.2车辆图像采集结果图2.1.2车辆图像预处理(1)灰度化通常情况下,实际的车牌识别系统中由摄像机采集到的原始图像是彩色图像,所有的彩色图像都是由红(R)、绿(G)、蓝(B)三基色组合而成,在数字图像中每一个基色都被分为256个等级,即0~255。
由R、G、B三基色不同级别的组合方式,可以计算出一幅彩色数字图像最多可包含2563=16777216种颜色。
在灰度图像中R=G=B,因此灰度图像中只有一种灰度颜色,同彩色图像中的三基色一样,灰度色也被分成0~255,共256个等级,同理可以计算出一幅灰度图像最多只包含256种颜色。
由此可见,一幅彩色图像所包含的信息量远远大于一幅灰度图像,它不仅需要大量的存储空间还需要复杂的图像处理算法,这使得整个车牌识别系统操作时间过长,无法达到其实时性的要求。
所以,应将采集到的彩色图像转换成一幅灰度图像,这个过程便是图像的灰度化。
令g为转换后灰度图像在某一点的灰度值,R、G、B分别为转换前该点的R、G、B分量。
常用的灰度化处理方法有以下三种:⑴最大值法(Maximum)g=max(R ,G ,B) (2-1)这种方法处理后灰度图像的亮度会偏高。
⑵ 平均值法(Average) g=3R G B ++ (2-2) 这种方法处理后灰度图像的亮度较柔和。
⑶ 加权平均值法 (Weighted Average)g=3W R B W G W R B G ++ (2-3) 式(2-3)中,W R 、W G 、W B 分别为R 、G 、B 的权值,当其权值取不同的值时,能够形成不同灰度的灰度图像,由于人眼对绿色的敏感度最高,红色次之,蓝色最低。
因此当W G > W R >W B 时,所产生的灰度图像更符合人眼的视觉感受,通常W R =0.9,W G =1.77, W B =0.33时图像的灰度最合理,即g=0.3R+0.59G+0.11B (2-4)式(2-4)中:R 表示原图像中每个像素点的红色分量的值,G 表示原图像中每个像素点的绿色分量的值,B 表示原图像中每个像素点的蓝色分量的值。
g 表示灰度变换后图像中每个像素点的颜色值。
本文使用加权平均值法对彩色汽车图像进行灰度化处理。
本章选择加权法来对图像进行灰度化。
灰度化处理同样采用open cv 提供的库函数。
灰度化预处理结果如图2.3所示:图2.3 灰度化预处理结果图(2)二值化二值图像是指整幅图像内仅有黑,白两个值。
为了加快处理速度并能够将车牌字符与车牌背景分开,通过阈值的设定将灰度值小于阈值的像素直接设置为0,灰度值大于阈值的像素直接设置为255.因此阈值的选择至关重要,阈值分为全局阈值与局部阈值。
全局阈值方法速度比较快,但是容易受到光线条件,背景亮度及车牌背景的影响从而引起笔画的丢失。
局部阈值可能引起伪影或笔画断裂。
本章采用全局阈值的方法实现。
选择的阈值如下:T =3-minmax -max G G G(2-5)其中, max G 和G min 为最高和最低灰度值,二值化处理同样采用open cv 提供的库函数。
二值化预处理结果如图2.4所示。
图2.4 二值化预处理结果图(3)灰度拉伸有时因为光线问题会造成图像局部过亮或过暗,这就需要对图像进行拉伸,使之覆盖较大的取值区间,使得亮的区域更亮,暗的区域更暗,提高图像的对比度,从而使图像边缘明显,车牌的信息能表现更加清楚。
灰度拉伸是将灰度图像进行分段性变化。
若源图像f(x,y)灰度变化为[a,b],希望变换后图像g(x,y)的灰度范围扩展到[c,d],变换公式如下:g(x,y){c, 0≤f(x,y)≤a(d−cb−a)f(x,y)+c,a≤f(x,y)≤bd, b≤f(x,y)≤255(2-6)灰度拉伸后的效果如图2.5所示。
图2.5灰度拉伸后的效果图(4)边缘增强边缘主要存在于目标与目标,目标与背景之间,是分割目标,提取纹理的重要特征。
通过边缘增强的方法突出车牌丰富的纹理信息,使得车牌定位更加快速,准确。
常用边缘检测算子检测每个像素的点的邻域,并对灰度化率进行量化。
常用的边缘检测算子有:Roberts算子,Sobel算子,Prewitt算子,Laplacian 算子,Gauss-Lapcian算子及Canny算子等。
本文采用opencv 提供的Canny算子来实现。
边缘增强后的效果如图2.6所示。
图2.6边缘增强后的效果图2.2车牌区域定位车牌定位是根据对经过预处理后的图像中的车牌进行准确的位置确定。
车牌定位在整个车牌识别系统中至关重要,只有准确定位车牌才能为后续的识别工作提供有力的保障。
目前车牌的定位有很多种方法,本节采用水平投影和垂直投影相结合的方法来定位车牌的位置。
1.水平投影定位通常车牌靠近整幅图像的下半部分,因此由下向上扫描。
对前面处理过的图像的像素沿着水平方向累加产生一个车牌图像的投影分布,车牌位置应该对应投影分布的某个峰值,波峰的宽度所包含的区域就应该对应的车牌所在的水平位置。
对每一个波峰进行检测,当测定的高度与车牌投影高度相近时,即可认为是车牌的上下边界,就能准确的定位出车牌的水平位置。
2.垂直投影定位垂直投影定位与水平投影原理相似。
首选对图像做垂直投影,对得到的水平投影从左到又的扫描,当超过一定的跳变时,即认为是车牌区域,若扫描的宽度符合车牌的宽高比约为3:1的区域,即认为是车牌的垂直区域。
水平扫描区域与垂直扫描区域相交汇的区域,即为车牌区域。
车牌区域定位的结果如图2.7所示:图2.7 车牌区域定位图3 字符分割字符分割是根据已经确定的车牌位置提取每一个字符的过程。