数字图像处理 第一章 第三节
- 格式:pdf
- 大小:67.16 KB
- 文档页数:28
1Digital Image Processing数字图像处理课程简介本课程为计算机科学与技术、电子科学与技术、信息与通信工程、控制科学与工程以及电气工程等学科下研究生的专业基础课。
主要内容课程共分三大部分:第一部分:介绍数字图像处理的基础知识,包括绪论、图像与视觉系统、图像变换等;第二部分:介绍图像处理的基本方法,包括图像增强、图像复原及图像压缩等;第三部分:介绍图像分析的基本原理和技术,包括图像分割、图像描绘及特征提取等。
教学目标⏹基本:完成课程学习,通过考试,获得学分。
掌握数字图像处理的基本概念和研究方法,相关交叉学科的基本知识;⏹提高:能够将所学知识和内容用于课题研究;⏹再提高:通过数字图像处理课程的学习,改进思维方式。
教材及参考书第一章绪论绪论⏹前言⏹数字图像处理的起源⏹数字图像处理的基本概念与研究内容⏹数字图像处理与其他学科的关系⏹数字图像处理的主要应用⏹数字图像处理的发展动向前言“百闻不如一见”One picture is worth more than ten thousand words.在人类接受的信息中,听觉信息占约20%,视觉信息占约60%,其他如味觉、触觉等总起来不过占约20%。
所以,作为传递信息的重要手段—图像信息是十分重要的。
第一节数字图像处理的起源(1)世界上第一幅实景照片(1827)数字图像的应用之一是在报业,20世纪20年代的海底电缆使得伦敦与纽约之间图片的传输从过去的一个多星期缩短到3个小时以内。
1921年经编码后用电报打印机打印的图像1929年通过海底电缆从伦敦传输到纽约的一幅照片第一节数字图像处理的起源(2)二十世纪二十年代:图像远距离传输第一节数字图像处理的起源二十世纪五十年代:伴随着技术进步,数字计算机发展到一定水平,尤其是大规模的存储和显示系统的发展,数字图象处理引起巨大关注。
第一节数字图像处理的起源进实验室(Jet PropulsionLaboratory,JPL)运用计算机处理了由“旅行者7号”发回的月球表面照片。
《数字图像处理_第三版_中_冈萨雷斯》第⼀章笔记
前⾔:没有做过系统性的学习,如何能对⼀个领域达到深究的地步。
《数字图像处理》——冈萨雷斯版只是零零碎碎的阅读过,未曾做过系统性的通读,故⽤博客记录,以便后续的巩固和温习,帖⼦只记录⼀些个⼈觉得⽐较有⽤的知识。
第⼀章笔记
数字图像处理领域
各种成像实例:伽马摄像成像、X射线成像、紫外波段成像、可见光及红外波段成像、微波波段成像、⽆线电波段成像。
超声图像成像步骤
数字图像处理的基本步骤
图像获取:图像起源
图像增强:对⼀幅图像进⾏某种操作。
图像复原:改进图像外观的处理领域,倾向于图像退化的数学或者概率模型为基础。
⼩波:不同分辨率描述图像的基础。
形态学处理:提取图像分量的⼯具,描述图像形状。
分割:将⼀幅图像划分它的组成部分或者⽬标。
图像处理系统的组成
趋势:⼤型图像处理系统朝着⼩型化和通⽤化的⼩型机并且带有专⽤图像处理硬件的混合系统的⽅向发展。
毕业设计说明书基于ARM的嵌入式数字图像处理系统设计学生姓名:张占龙学号: 0905034314学院:信息与通信工程学院专业:测控技术与仪器指导教师:张志杰2013年 6月摘要简述了数字图像处理的应用以及一些基本原理。
使用S3C2440处理器芯片,linux内核来构建一个简易的嵌入式图像处理系统。
该系统使用u-boot作为启动引导程序来引导linux内核以及加载跟文件系统,其中linux内核与跟文件系统均采用菜单配置方式来进行相应配置。
应用界面使用QT制作,系统主要实现了一些简单的图像处理功能,比如灰度话、增强、边缘检测等。
整个程序是基于C++编写的,因此有些图像变换的算法可能并不是最优化的,但基本可以满足要求。
在此基础上还会对系统进行不断地完善。
关键词:linnux 嵌入式图像处理边缘检测AbstractThis paper expounds the application of digital image processing and some basic principles. The use of S3C2440 processor chip, the Linux kernel to construct a simple embedded image processing system. The system uses u-boot as the bootloader to boot the Linux kernel and loaded with file system, Linux kernel and file system are used to menu configuration to make corresponding configuration. The application interface is made using QT, system is mainly to achieve some simple image processing functions, such as gray, enhancement, edge detection. The whole procedure is prepared based on the C++, so some image transform algorithm may not be optimal, but it can meet the basic requirements. On this basis, but also on the system constantly improve.Keywords:linux embedded system image processing edge detection目录第一章绪论 (1)1.1 数字图像处理概述 (1)1.2 数字图像处理现状分析 (5)1.3 本文章节简介 (8)第二章图像处理理论 (8)2.1 图像信息的基本知识 (8)2.1.1 视觉研究与图像处理的关系 (8)2.1.2 图像数字化 (10)2.1.3 图像的噪声分析 (10)2.1.4 图像质量评价 (11)2.1.5 彩色图像基本知识 (11)2.2 图像变换 (13)2.2.1 离散傅里叶变换 (13)2.2.2 离散沃尔什-哈达玛变换(DWT-DHT) (20)2.2.3 离散余弦变换(DCT) (21)2.2.4 离散图像变换的一般表达式 (23)2.3 图像压缩编码 (24)2.3.1 图像编码的基本概念 (24)2.4 图像增强和复原 (24)2.4.1 灰度变换 (24)2.4.2 图像的同态增晰 (26)2.4.3 图像的锐化 (27)2.5 图像分割 (27)2.5.1 简单边缘检测算子 (27)2.6 图像描述和图像识别 (28)第三章需求分析 (28)3.1 系统需求分析 (28)3.2 可行性分析 (28)3.3 系统功能分析 (29)第四章概要设计 (29)4.1 图像采集 (30)4.2 图像存储 (31)4.3 图像处理(image processing) (31)4.4 图像显示 (32)4.5 网络通讯 (32)第五章详细设计 (32)5.1 Linux嵌入式系统的构建 (33)5.1.1 启动引导程序的移植 (33)5.1.2 Linux内核移植 (33)5.1.3 根文件系统的移植 (34)5.2 图像处理功能的实现 (34)5.2.1 彩色图像的灰度化 (34)5.2.2 灰度图的直方图均衡化增强 (35)5.2.3 图像二值化 (35)5.2.4 边缘检测 (36)第六章调试与维护 (36)附录 A (37)参考文献 (43)致谢 (44)第一章绪论1.1 数字图像处理概述数字图像处理(Digital Image Processing)又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。
3、图像显示和打印图像显示设备:每个点的电压和该点所对应的灰度值成正比随机存储的阴极射线管CRT,电视显示器,液晶显示器LCD 打印设备:各种打印机,一般用于输出较低分辨率的图像输出图像上任一点的灰度值可由该点打印的字符数量和密度来控制1)半调输出主要分为幅度调制技术和频率调制技术多数打印设备只能直接显示输出二值图像,即打印机输出的灰度只有两级半调输出技术----使得输出灰度图像保持其原有的灰度级半调输出技术:将灰度或彩色图像转化为二值图像的技术将灰度(彩色)图像各种灰度转化为二值点的模式,可由打印设备输出,同时利用人眼集成特性(人眼感知的亮度是某单元的平均灰度,正比于其中的黑象素个数),通过控制输出二值点的形式(包括数量,尺寸,形状)来让任获得视觉上多个灰度的感觉2)幅度调制通过调整输出黑点的尺寸来显示不同的灰度----幅度调制AM半调技术在每个象素位置打印一个尺寸反比于该象素灰度的黑圆点,即在亮的图像区域打印的点小,在暗的图像区域打印的点大。
在一定距离观察时,一个小点的集合可产生亮灰度的视觉效果,一个大点的集合可产生暗灰度的视觉效果当点足够小,观察距离足够远时,人眼就不容易分开各个小点(人眼的集成特性),而得3) 频率调制频率调制半调技术:输出黑点的尺寸是固定的,但在空间的分布(点间的间隔,在一定区域内点出现的频率)取决于所需表示的灰度如果分布较密,就得到较暗的灰度,如果分布较稀,就得到较亮的灰度表示一个较暗的灰度:需要排列很近的许多个点,他们合成一个打印单元,也称打印点,对应图像中一个象素4) 调制模板(参考图1.3.2---图1.3.4)半调技术具体实现方法:调制模板将图像输出的单元细分,取邻近的基本二值点结合起来组成输出单元,在每个单元内包含若干个基本二值点,让其中一些基本二值点输出黑,其他基本二值点输出白,就可得到不同灰度的效果为输出不同的灰度,建立一套模板,每个模板对应一个输出单元,将每个模板划分成规则网格,每个格对应一个基本二值点,通过调整各个基本二值点为黑或白,可让每个模板输出不同的灰度。
5) 抖动输出技术半调技术是通过减少图像空间分辨率来改善图像幅度分辨率,或者说牺牲空间点数而增加图像的灰度级数。
要保持一定的空间分辨率,则输出灰度级比较少,或者说要保留细节则灰度级数不能太多。
抖动输出技术:通过调节和变动图像的幅度值来改善量化过粗图像的质量。
(灰度级数比较少时,图像质量比较差,会出现虚假轮廓)通过对原始图像加一个随机的小噪声来实现,即显示两者的和。
由于图像灰度值和噪声之间没有任何规律的联系,所以可以帮助消除量化不足而导致的图像中出现的虚假轮廓。
具体实现方法:设b是图像显示的比特数,则噪声的值以均匀概率取:-2(6-b)-2(5-b) 2 2(5-b)2(6-b)效果参考图1.3.54 图像存储1 )图像存储器Ø用于处理过程中使用的快速存储器,如计算机内存,帧缓存Ø用于比较快的重新调用的在线或联机存储器,如磁光MO存储器,光盘塔,光盘阵列Ø不经常使用的数据库存储器如磁带,光盘2 )图像文件格式矢量图静态图像位图,即栅格图像u矢量图:主要用于图形数据文件用一系列绘图指令来表示一幅图像,如AutoCAD的绘图语句,图像使用一系列线段或线段的组合体来表示,线段的灰度可以是均匀的或变化的。
本质是用数学(几何学)描述一幅图像,图像中每一个形状都是一个公式,称为一个对象优点:图像数据量小,图像质量与分辨率无关(即不论放大或缩小多少次,图像总是以显示设备允许的最大清晰度显示)缺点:不易制作色调丰富和色彩变换太多的图像,绘出的图像不逼真,不易在软件间交换文件b. 灰度图像在灰度图像中,像素灰度级用8bit来表示,每个像素都是介于黑色和白色之间的256中灰度中的一种。
灰度图像只有灰度颜色而没有彩色,通常的黑白照片,其实包含了黑白之间的所有灰度色调。
从技术上来说,就是具有从黑到白的256种灰度色域的单色图像。
c. 索引图像PC机处理颜色:大多数扫描仪是以24位模式对图像进行采样,即可从图像中擦样除1670万种不同的颜色,用这种方式获得的颜色通常称为RGB颜色。
颜色深度位每像素24位的数字图像是目前所能获取、浏览和保存的颜色信息最丰富的彩色图像,由于它所表达的颜色远远超出人眼所能辨别的范围,故将其称为“真彩色”在真彩色出现之前,由于技术上的原因,计算机在处理时并没有达到每像索引图像:也称为映射颜色,在这种模式下,颜色是预先定义的,并且可供选用的一组颜色也很有限,索引颜色的图像最多只能显示256中颜色。
一幅索引图像在图像文件中定义,当打开该文件时,构成该图像具体颜色的索引值被读入程序,然后根据索引值找到最终的颜色。
d. 真彩色图像是RGB颜色的另一种流行的叫法。
从技术角度考虑,真彩色是指写到磁盘上的图像类型,而RGB颜色是指显示器的显示模式。
RGB图像的颜色是非映射的,它可以从系统的“颜色表”里自由获取所需的颜色,这种图像文件中的颜色直接与PC机上的显示颜色像对应。
在真彩色图像中,每个像素由红、绿、蓝三个字节组成,每个字节为8bit,表示0--255之间的不同的亮度值,这三个字节组合,可产生u1)像素(pixel)、点(Dot)和样点(Sample)在计算机中,图像是由显示器上许多光点组成的,将显示在显示器上的这些点(关的单元)称为像素。
实际常用正方形网格点阵分割方案。
扫描一幅图像时,需设置扫描仪的分辨率,分辨率决定了扫描仪从原图像里每英寸取多少个样点。
扫描仪将源图像看成由大量网格组成,然后在每一个网格中取出一点,用该点的颜色之来代表这一网格中所有点的颜色之,这下被选中的点就是样点。
扫描仪的分辨率单位为dpi(每英寸点数),但激光打印机的dpi与扫描仪的dpi(样点)时不同的,实际上,以150dpi分辨率扫描的图像,它的效果相当于激光打印机的1200dpi的效果像素不是绝对的度量单位,而是可大可小,如果获取图像时的分辨率较低(如50dpi),则显示该图像时,每英寸所显示的像素个数也很少,这样2)分辨率分辨率是指在单位长度内所含有的点(像素)的多少,与数字图像有关的分辨率:图像分辨率:每英寸图像含有多少个点或像素,分辨率的单位为dpi.分辨率的大小直接影响图像的质量,分辨率越高,图像细节越清晰,但产生的文件尺寸大,处理时间长,对设备的要求越高。
屏幕分辨率:显示器上每单位长度显示的像素或点的数量,通常以每英寸点数(dpi)来表示。
屏幕分辨率取决于显示器的大小及其像素设置。
屏幕分辨率由计算机的显示卡决定。
标准的VGA 显示卡的分辨率是640×480,即水平方向640点(像素),垂直方向480点(像素),高性能显卡支持1280×1024打印机分辨率:又称输出分辨率,是打印机输出图像时每英寸的点数(dpi),打印机分辨率也决定了输出图像的质量,打印机分辨率越高,可以减少打印的锯齿边缘,新打印机分辨率可达600—1200dpi扫描仪分辨率:表示方法与打印机类似,一般也用dpi表示,不过这里的点是样点,与打印机的输出点是不同的。
一般扫描仪提供的方式是水平分辨率比垂直分辨率高。
台式扫描仪的分辨率可以分为光学分辨率和输出分辨率。
光学分辨率是指扫描仪硬件所真正扫描到的图像分辨率,可达800--1200dpi以上,输出分辨率是通过软件强化以及内插补点之后产生的分辨率,大约为光学的3-4倍。
(见到的号称分辨率高达4800dpi或6400dpi的扫描仪时,一定指的是输出分辨率)GIF BMP JPEG TAG TIFF等多种图象格式并存1、位图图象格式(1)采用数据点表示象素点(2)由一个矩阵点阵组成,每个象素点代表原图中一个象素点,表示该点的颜色值。
(3)矩阵点阵如何与原图数据点对应取决于图象的存储方式2、位图图象的典型存储方式(1)扫描行存储(存储图象数据时)每次存储原始图象中的一行象素,每行中象素按从左到右顺序存储,行与行之间采用从上到下顺序(2)位平面存储方式适合于每象素点的表示长度超过8位的图象数据先将每象素点最高数据位存储到第一位平面中,再将象素第二数据位的取值存储到第二位平面中……依次类推,直到存完所有图象数据特点:每个位平面中都包含原始图象数据中所有象素的某个位值优点:v可以方便处理图象中对应于某个位平面的图象特征,适合单独处理图象中某些敏感位内容v有利于发挥某些显示适配器格式的图象显示速度v在彩色图象中具有无与伦比的优势(3)交叉行存储优点:即使没有读出全部图象数据,也可以构成原始图象的近似轮廓例如:先存储偶数行数据,再存储奇数行数据或以相反顺序存储奇数行数据用于网络传输的图象文件格式GIF :首先每隔8行存储一行数据,再依次减半存储其他行的数据网络图象格式PNG:采用两维交叉存储(同时对数据行列交叉存储)(4)有损失存储(有损失压缩)不以象素为基本单位存储数据,而是存储图象中的一些数据块,利用它们重新构造原始图象BMP是微软为Windows环境设置的标准图象格式(API)特点:K每个文件只能存放一幅图象K压缩处理是图象文件的一个选项非压缩格式是BMP文件的一种通用格式压缩有两种方式:16色,用RLE4方式压缩;256色,用RLE8方式压缩K BMP可存储单色,16色,256色以及真彩色图象数据,数据排列顺序于一般文件不同,以图象的左下角为起点存储图象;所用的调色板数据结构中,R,G,B三基色数据的排列顺序于其他图象文件格式相反格式介绍:BMP图象文件的结构有三部分组成:文件头调色板数据图象数据文件头:长度固定,54字节调色板数据:对不超过256色图象需进行设置;对真彩色图象不存在调色板数据的设置信息图象数据:可采用压缩算法处理,也可以不压缩typedef Struct tagBITMAPINFOHEADER {DWORD bfsize ;以字节为单位指定此数据结构占用的存储容量,固定值为40D WORD biWidth ; 以象素为单位给出BMP 文件所描述位图的宽度与高度DWORD biHeight ;biHeight 为正,原点为左下角,为负,原点为左上角。
一般位图定义中两者都必为正数WORD biPlane ;代表目标设备的平面数必须为1WORD biBitcount ;确定每个象素所需位数(单色图,取值1;16色—4;256色—8;真彩色—24)DWORD biCompression ;表示原点在左下角位图的压缩类型(左上角的不能压缩)DWORD bisizeImage ;以字节为单位给出该BMP 内图象数据占用的空间大小,若图象文件描述为BI —RGB ,则该字段的值必须设置为0DWORD biXPeIsPerMeter ;DWORD biYPeIsPerMeter ;以每米象素数为单位给出位图目的设备水平及垂直方向的分辨率DWORD biClrused ;给出位图实际使用的颜色表中的颜色变址数,若取值为0 表示本位图使用了biBitCount 字段值所代表的最大颜色值,取值与压缩方法有关DWORD biClrzmportant ;给出位图显示过程中重要颜色的变址数,取值为0表示所用颜色都是重要色。