数字图像编码课程一
- 格式:pdf
- 大小:2.30 MB
- 文档页数:52
《数字图像处理》课程教学大纲课程代码:ABJD0619课程中文名称:数字图像处理课程英文名称:Dig让a1ImageProcessing课程性质:选修课程学分数:3学分课程学时数:48学时(32理论课时+16实验学时)授课对象:电子信息工程本课程的前导课程:高等数学,概率论,线性代数,数字信号处理,信息论,程序设计等一、课程简介数字图像处理是一门新兴的跨学科的前沿高科技,在军事、工业、科研、医学等领域获得了广泛应用,是国内外高校和科研院所的研窕生教育中一个重要的研究方向。
通过本课程的学习,同学们将掌握数字图像处理的基本理论与方法,包括图像变换、图像增强、图像分割、图像恢复、图像识别、图像压缩编码、数字图像处理系统及应用等内容。
二、教学基本内容和要求(-)数字图像处理方法概述教学内容:数字图像处理的研究对象、基本应用、研究内容等,数字图像的基本概念、彩色图像的调色板等概念。
课程的重点、难点:重点:CDIB类与程序框架结构介绍。
难点:调色板的基本概念和应用。
教学要求:D了解本课程研究的对象、内容及其在培养软件编程高级人才中的地位、作用和任务;2)了解数字图像处理的应用;3)理解数字图像的基本概念、与设备相关的位图(DDB)、与设备无关的位图(D1B);4)理解调色板的基本概念和应用;5)了解CD1B类与程序框架结构介绍;6)掌握位图图像处理技术。
(二)图像的几何变换教学内容:图像的几何变换种类以及概念,几何变换的实现原理和实施方法课程的重点、难点:重点:镜像变换。
难点:旋转。
教学要求:1)理解图像的缩放、平移、镜像变换、转置、旋转。
(三)图像灰度变换教学内容:直方图的概念、灰度的点运算(包含灰度信息的线性变化、指数变换等)、直方图的均匀化和规定化课程的重点、难点:重点:灰度直方图。
难点:灰度分布均衡化。
教学要求:1)了解非O元素取1法、固定阈值法、双固定阈值法的图像灰度变换;2)掌握灰度的线性变换、窗口灰度变换处理、灰度拉伸、灰度直方图、灰度分布均衡化。
“数字图像处理”实验指导书(一)一、实验课程编码:103003二、实验课程名称:数字图像处理三、实验项目名称:练习图像处理软件Photoshop的使用四、实验目的1.对常用的图像处理方法的处理效果有一个直观的认识;2.学习利用现成软件实现图像处理的方法。
五、主要设备计算机(含Windows XP,VC++6.0,MSDN,Photoshop)六、实验内容1.熟悉Photoshop的界面,了解工具栏菜单的各项功能;2.对样例图像进行各种基本处理。
七、实验步骤1.开机,运行Photoshop程序,并打开样例图像;2.依次查看工具栏菜单的各项功能;3.对样例图像进行各种基本处理(如增加亮度、提高对比度、改变颜色、放大、扭曲等)。
八、实验结果熟悉了Photoshop,能用Photoshop简单地处理图像了。
执笔人:杨磊实验室主任:系主任:杨磊一、实验课程编码:103003二、实验课程名称:数字图像处理三、实验项目名称:BMP图像文件格式解析(综合性、设计性实验)四、实验目的深入了解和掌握BMP图像的文件格式五、主要设备计算机(含Windows XP,VC++6.0,MSDN,Photoshop)六、实验内容1.使用Visual C++编制程序,用多幅8位灰度图像实现对BMP图像文件格式的解析和显示;2.要求解析和显示图像文件头、信息头以及颜色表和图像数据的各项内容;3.输出图像的颜色表;4.输出图像中每个像素的灰度值;七、实验步骤1.开机,运行Visual C++程序;2.编制程序,打开BMP图像文件;3.分析BMP文件的组成。
八、实验结果写出BMP文件结构,输出选定图像指定位置的像素灰度值。
执笔人:杨磊实验室主任:系主任:杨磊一、实验课程编码:103003二、实验课程名称:数字图像处理三、实验项目名称:图像增强(空间域灰度图像)(综合性实验)四、实验目的熟悉空间域图像增强方法,掌握增强模板使用方法。
五、主要设备计算机(含Windows XP,VC++6.0,MSDN,Photoshop)六、实验内容1.使用Visual C++编制程序,分别采用给定的两个模板对给定的一幅灰度图像进行处理并显示处理后的结果;2.对结果进行分析。
《数字图像处理》课程教学大纲Digital Image Processing一、课程说明课程编码:045236001 课程总学时(理论总学时/实践总学时):51(42/9),周学时:3,学分:3,开课学期:第6学期。
1.课程性质:专业选修课2.适用专业:电子信息与技术专业3.课程教学目的和要求《数字图像处理》是信号处理类的一门重要的专业选修课,通过本课程的学习,应在理论知识方面了解和掌握数字图像的概念、类型,掌握数字图像处理的基本原理和基本方法:图像变换、图像增强、图像编码、图像的复原和重建。
并通过实验加深理解数字图像处理的基本原理。
4.本门课程与其他课程关系本课程的先修课程为:数字信号处理和应用5.推荐教材及参考书推荐教材:阮秋琦,《数字图像处理学》(第二版),电子工业出版社,2007年参考书(1)姚敏等,《数字图像处理》,机械工业出版社,2006年(2)何东健,《数字图像处理》(第二版),西安电子工业出版社,2008年(3)阮秋琦,《数字图像处理基础》,清华大学出版社,2009年(4) (美)Rafael C. Gonzalez著,阮秋琦译,《数字图像处理》(第二版),电子工业出版社,2007年6.课程教学方法与手段主要采用课堂教学的方式,通过多媒体课件进行讲解,课外作业,答疑辅导。
并辅以适当的实验加深对数字图像处理的理解。
7.课程考核方法与要求本课程为考查课课程的实验成绩占学期总成绩的50%,期末理论考查占50%;考查方式为笔试。
8.实践教学内容安排实验一:图像处理中的正交变换实验二:图像增强实验三:图像复原详见实验大纲。
二、教学内容纲要与学时分配(一)数字图像处理基础(3课时)1.主要内容:图像处理技术的分类,数字图像处理的特点,数字图像处理的主要方法及主要内容,数字图像处理的硬件设备,数字图像处理的应用,数字图像处理领域的发展动向2.基本要求:了解图像处理技术的分类和特点,数字图像处理的主要方法及主要内容,熟悉数字图像处理的硬件设备。
《数字图像处理》课程教学大纲课程信息课程代码:课程名称:数字图像处理/Digital Image Process课程类型:专业任选课学时学分:48学时/3学分适用专业:计算机科学与技术开课部门:灾害信息工程系一、课程的地位、目的和任务本课程是计算机科学与技术本科专业任选课。
课程的主要内容包括:(1)数字图像处理的基本概念,包括数字图像格式,数字图像显示,灰度直方图,点运算,代数运算和几何运算等概念。
(2)介绍二维傅氏变换、离散余弦变换、离散图像变换和小波变换的基本原理与方法。
(3)重点介绍图像的增强方法,包括空间域方法和变换域方法。
(4)图像恢复和重建基本原理与方法。
(5)图像压缩编码的基本原理与方法以及一些国际标准。
(6)图像的分析和模式识别基本原理。
通过本课程的学习使学生掌握数字图像处理的基本概念、基本原理和实现方法和实用技术,了解数字图像处理基本应用和当前国内外的发展方向。
要求学生通过该课程学习,具备通过程序解决智能化检测与应用问题的初步能力,为在计算机视觉、模式识别等领域从事研究与开发打下扎实的理论基础。
二、课程与相关课程的联系与分工要求学生先修课程为:《C语言程序设计》、《数据结构》、《线性代数》、《高等数学》、《概率与数理统计》后继课程:生产实习三、教学内容与基本要求第一章概述1.教学内容1.1 数字图像的发展历史1.2 图像工程的概述1.3 数字图像处理的应用及其发展趋势1.4 VC++ 运行环境的介绍1.5 BMP文件的基本介绍2.重点难点VC运行环境;BMP文件格式;3.基本要求了解图像工程的概念;熟悉数字图像的应用领域;熟悉VC运行环境;掌握BMP文件结构形式;能够在vc环境下,从内存显示BMP图像。
第二章图像采集1.教学内容2.1.视觉过程2.2.成像中的空间关系2.3.光度学和亮度学2.4.采样和量化2.重点成像中的空间关系。
3.难点采样和量化。
4.基本要求了解视觉过程及其原理;掌握几何投影和齐次坐标下的成像变换;熟悉光强度、照度、景深等概念;了解成像模型;理解采样和量化的原理;掌握图像数字化的原理好过程。
信息技术教学*********************32中国信息技术教育● 学科核心素养①了解图像数字化的基本原理,理解图像的采样、量化和编码过程;认识像素、图像尺寸、颜色深度等基本概念,能够根据位图图像的特征计算位图文件大小。
(信息意识、计算思维)②了解图像的常见格式,并能根据需要对图像进行简单的加工处理,形象直观地表达观点和思想。
(数字化学习与创新、信息社会责任)● 课程标准要求①在具体感知数据与信息的基础上,描述数据与信息的特征,知道数据编码的基本方式。
②针对具体学习任务,体验数字化学习过程,感受利用数字化工具和资源的优势。
● 学业要求能够描述数据与信息的特征,知道数据编码的基本方式,掌握数字化学习的方法,能够根据需要选用合适的数字化工具开展学习。
● 教材分析笔者采用的是人教-中图版教材,第一章的项目为“体质数据促健康”,要求学生学习数据与信息的相关知识和原理,理解并掌握信息数字化的作用和技能,能在本章学习结束时用多媒体作品呈现项目学习成果。
本章第1.2.3节《数据编码》详细介绍了各种数据编码,主要分成字符编码、声音编码、图像与视频编码、数据压缩四个部分。
图像和视频的数字化过程与声音数字化原理类似,但有其特别之处。
由于教材详细地阐述了声音数字化的过程,所以对图像与视频的数字化就不再赘述,因而需要教师在教学中适当加以补充。
另外,图像文件的不同类型意味着不同的压缩编码,也为后面的数据压缩做了铺垫。
本课是《图像与视频编码》的第一课时,主要讲解图像数字化的过程和原理,通过学习活动加深学生对图像编码的理解,并能初步掌握图像处理的常用方法和技能。
因此,在图像加工处理环节,教师安排的学习活动是为“体质健康”项目设计封面或招贴画,这样既能达成技能教学的目标,又能为本章项目的顺利完成做好铺垫。
● 教学对象分析图像是高一学生喜闻乐见的媒体格式,但他们对图像的数字化原理可能一知半解。
关于图像的加工处理,他们可能熟悉一些简单的手机应用软件,但对计算机上的常用编辑软件却不太熟悉。
数字图像处理教学大纲一、课程基本信息课程名称:数字图像处理课程类别:专业必修课学分:X总学时:X授课对象:具体专业二、课程教学目标通过本课程的学习,使学生掌握数字图像处理的基本概念、原理和方法,具备运用相关知识和技术解决实际问题的能力。
具体包括:1、理解数字图像的获取、表示和存储方式。
2、掌握数字图像增强、复原、压缩、分割等基本处理技术。
3、能够运用编程工具实现简单的数字图像处理算法。
4、培养学生的创新思维和实践能力,为进一步学习和从事相关领域的工作打下坚实的基础。
三、课程教学内容(一)数字图像基础1、图像的感知和获取视觉系统的特性图像的形成与数字化图像的采样和量化2、数字图像的表示灰度图像彩色图像图像的矩阵表示3、数字图像的存储图像文件格式图像数据库(二)图像增强1、空域增强灰度变换直方图均衡化空域滤波2、频域增强傅里叶变换频域滤波(三)图像复原1、图像退化模型常见的退化原因退化函数的建立2、逆滤波原理与实现局限性3、维纳滤波基本原理算法实现(四)图像压缩1、图像压缩的基本原理信息论基础冗余度2、无损压缩霍夫曼编码算术编码3、有损压缩预测编码变换编码(五)图像分割1、阈值分割全局阈值局部阈值2、边缘检测梯度算子拉普拉斯算子Canny 算子3、区域分割区域生长区域分裂与合并(六)图像特征提取与描述1、颜色特征颜色直方图颜色矩2、纹理特征统计方法结构方法3、形状特征边界描述区域描述(七)图像识别1、模式识别基础分类器设计特征选择与提取2、图像分类与识别应用人脸识别车牌识别四、课程教学方法1、课堂讲授通过讲解理论知识,使学生掌握数字图像处理的基本概念、原理和方法。
2、实验教学安排一定数量的实验课程,让学生通过实践加深对理论知识的理解,提高编程和解决实际问题的能力。
3、案例分析结合实际应用案例,引导学生分析问题、解决问题,培养学生的创新思维和实践能力。
4、小组讨论组织学生进行小组讨论,促进学生之间的交流与合作,激发学生的学习兴趣和主动性。
图像编码——图像数字化教材:《信息技术必修1:数据与计算》1.理解图像编码实现过程,知道采样、量化、编码三个步骤。
2.了解位图的基本参数:像素、色彩深度、分辨率。
3.认识到图像信息安全风险,尊重他人的知识版权,承担信息社会责任。
教学重点:图像数字化的实现过程教学难点:图像的采样、量化、编码教学教程:一、情境导入图像已成为生活中必不可少的元素。
在日常使用图像时,你遇到过这样的问题吗?(1)、为什么有的图像很清楚、有的图像却很模糊?(2)、当图像大小无法满足系统使用要求时,该怎么办?(3)、如何去除图像中不需要的文字等信息?图像质量、大小和显示都与什么因素有关呢?若想知道这个问题的答案,我们首先需要了解计算机是如何存储和处理图像的。
二、数字图像是如何形成的1.实现方式通过扫描仪、数字照相机、智能手机和连接在计算机上的摄像头等设备,就可将实现图像的数字化。
2. 实现过程(1)图像采样图像采样是指将模拟图像在水平和垂直方向上进行分割,形成矩阵。
对图像采样后所形成的微小方格称为像素。
像素是数字图像的基本单位,一副图像可看做由许多独立的像素所组成的。
那么在采样是,像素个数是越多还是越少图像的质量会更好呢?学生观察两幅图像,体会不同像素个数的区别。
并理解输入分辨率对于图像质量的影响。
(2)图像量化图像量化是对像素属性进行分级,每一级对应一个数,从而实现用有限的数近似地表示连续变化的各项属性。
以像素的属性为例,将其分为4级,每个像素选择这4级中最接近的颜色。
那么分级越多还是越少,图像质量会更好呢?将4级和6级颜色进行对比,引导学生体会分级数量不同对图像质量的影响。
颜色的每一个等级要用对应的二进制数字表示。
以6级颜色为例,每个等级颜色的二进制数字如下。
经过量化,每个像素的颜色属性就可以转换成对应的二进制编码。
体验实践:请在任务单中尝试将本图像量化后的二进制编码填写完成。
颜色深度用来表示像素颜色所占二进制位数。
颜色深度越多,可表达的色彩越丰富;但存储容量也会越大。
数字图象编码Digital Image Coding课程目的•了解图象和视频编码技术的发展历程;•掌握基本信源压缩编码原理;•学习各类图象和视频编码标准的不同和特点。
——为今后进行相关领域研究打好基础参考书目•Video Processing and Communications, Yao Wang, 电子工业出版社。
•Digital Video Processing,A. Murat Tekalp, 清华大学出版社。
•数字图象压缩编码,张春田,清华大学出版社。
课程内容简介第一节图像压缩编码简介Introduction第二节统计编码Statistical Coding第三节预测编码Prediction Coding第四节变换编码Transform Coding第五节其他编码方式Other Coding第六节静止图像压缩编码标准JPEG & JPEG2000第七节视频压缩编码标准Video CodingStandard(H.261/MPEG1/MPEG2/MPEG-4/H.264)第一节IntroductionEncoder---Decoder----CodecSource Code---------Channel Code---------CryptographCompression CodingLossy CompressionLossless Compression (Error-Free Compression)Picture-------Image------Frame-------FieldMoving Picture-------Sequence--------VideoA Code is a system of symbols (letters, numbers, bits and the like…)used to represent a body of information or set of events. Each piece of information or event is assigned a sequence of code symbols, called a code word…..Photo Graphics Figure …..1.1 Image and DigitalizationPixel (像素)–samplingCFA(Color Filter Array) in a digital sensorColor Filter Array on Canon 450D()RGB or RGBW in a display⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡----=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡B G R Z Y X 009.1089.0468.0014.0426.1897.0005.0515.0365.2Tri-receptor Theory of Color VisionCIE RGB primary system, which consists of colors at 700(R),546.1(G) and 435.8(B) nm.RGB CMYK XYZ YUV HSILuminance and chrominance (亮色表示)4:4:4 YCbCr(Digital lossless)4:1:1 YCbCr(DV)4:2:0 YCbCr(VCD, DVD…) 4:2:2 YCbCr(Digibeta, DVB)1.2 Why we need compression?Middle definition picture:640×480 = 307200×24bit/pixel=7.37Mb----1GB=1000 picturesImage Sequence to video:640×480×24×25=184Mb/s------1GB=43sStandard Definition Color TV(演播室):(13.5+6.75+6.75) ×8=216Mb/s------CD-ROM(640MB)40sStandard Definition Color TV(节目传输):(720×576)×25×(1+0.25+0.25) ×8=123.416Mb/sHDTV:1140×1152, 1920×1080, 1280×720-------1Gb/s ----------DVD-ROM(4.7GB, 9.8GB) Conventional Telephone-----0.3-56kbps ISDN------56kbpsEthernet-----10Mbps Broadband ISDN----100-200Mbps✓屏幕尺寸计算方法:屏幕对角线的长度(按照英寸计量,1英寸等于公制的2.54厘米)✓屏幕比例目前屏幕比例一般有4:3和16:9两种。
✓分辨率(清晰度)标准清晰度(Standard Definition)物理分辨率在720p以下的一种视频格式。
720×480高清晰度(High Definition)视频垂直分辨率超过720p或1080i。
720p、1080i与1080p三种标准形式.1920×1080超高清晰度Ultra High-Definition)4K分辨率(3840×2160 像素) 8K分辨率(7680×4320像素)1.3 How to compress the pictures and video?Redundancy :Structure RedundancyStatistical RedundancyTemporal RedundancySubjective Redundancy (Psychovisual Redundancy )Resolution :Spatial (Detail)Temporal (Motion)Contrast (Gray)人眼是一个精密系统,但不是一个精确系统。
Example:Example 3:1.4 Image Compression Processing1.5 Source Coding and Channel Coding1.6 Categorization of source coding✓Still picture coding, Motion picture coding;✓Lossy coding, Lossless coding;✓Waveform-based coding, Content-dependent coding;✓……Depend on the different coding algorithms:Prediction codingTransform codingStatistical codingSub-band codingVector Quantization CodingFractal codingContent-based coding (semantic-based, knowledge-based, object-based) ……1.7 Image and Video Compression Standard•ISO (International Organization for Standardization)国际标准化组织•ITU( International Telecommunication Union)国际电信联盟•CCITT (International Telephone and Telegraph Consultative Committee )国际电话与电报顾问委员会JPEG-----Joint picture experts groupMPEG----Moving picture experts groupVCEG----Video coding experts groupJVT----Joint video teamA VC---Advanced video codingA VS---Audio video coding standard workgroup of China第二节人眼视觉系统和质量评价2.1 人眼视觉系统人类视觉系统(the human visual system, HVS)是神经系统的一部分,神经系统是一个非常复杂的通信网络。
在这个网络中通信是通过神经细胞——神经元进行的,并由一个十分强大的计算机——大脑来管理。
2.2 人眼视觉特性✓视觉的适应✓绝对视觉阈✓阈值对比度✓光谱灵敏度✓分辨力•明视觉•暗视觉•中介视觉•颜色适应3×10-5cd/m 23cd/m 23×105cd/m 2暗视觉明视觉中介视觉明视觉响应:人眼适应大于或等于3cd/m2的视场亮度时,视觉由锥状细胞起作用。
暗视觉响应:人眼适应小于或等于3×10-5cd/m2的视场亮度时,视觉由杆状细胞起作用。
(夜间的灰白)中介视觉响应:视场亮度介于明、暗视觉响应之间时,视觉响应逐渐由锥状细胞转向杆状细胞起作用。
当视场亮度发生突变时,人眼的适应主要包括明暗适应和色彩适应。
人眼的适应性光谱灵敏度•光谱灵敏度(光谱光视效率):人眼对各种不同波长的辐射光有不同的灵敏度(响应),对大量正常视力观察者的实验表明:–在较明亮环境中,人眼视觉对波长0.555μm左右的绿光最敏感;–在较暗条件下,人眼视觉对波长0.512μm左右的黄绿光最敏感;下图给出不同视场亮度下,人眼的光谱光视效率曲线:暗视觉明视觉◆人眼分辨力⏹人眼的分辨力:人眼能区分两发光点的最小角距离称为极限分辨角θ,其倒数为人眼分辨力。
⏹从内因分析,影响分辨力的因素为眼睛的构造。
⏹从外因分析,是目标的亮度与对比度。
人眼会根据外界条件自动进行适应,从而可以得到不同的极限分辨角。
人眼视觉惰性一般将人眼亮度感觉变化滞后于实际亮度变化,以及视觉暂留特性,总称为视觉惰性。
一般在电影播放中每秒放24幅固定的画面,电视每秒传送25~30幅图像,就可以使人眼感觉为连续活动的图像。
与视觉惰性紧密联系的还有临界闪烁频率,它是指刚好不引起闪烁感觉的最低频率。
School of Electronic Information Engineering , Tianjin University局部门限效应在出现亮度跳变的两侧,亮度变化的可觉察门限会提高。
这种现象是边缘“掩盖”了人对其邻近处信号的感觉,使人对这一局部区域信号的感觉不如没有这个边缘时灵敏、精确了。