2数字视频处理重点总结
- 格式:doc
- 大小:56.08 KB
- 文档页数:4
数字信号处理课程总结一、概括数字信号处理这门课程,真是让我大开眼界,原来信号也能玩出这么多花样!这门课程主要介绍了数字信号处理的基础概念、基本原理和实际应用。
学完之后我简直觉得信号的海洋是如此的广阔和深邃。
一开始课程从信号的表示和处理方式入手,让我对信号有了全新的认识。
接着介绍了数字信号处理的核心原理和方法,比如采样、量化、滤波等等。
这些内容听起来很高级,但实际上都是处理我们生活中遇到的各种各样信号的基础。
通过学习我发现数字信号处理并不是高高在上的高难课程,而是与我们的日常生活紧密相连。
而且课程还深入浅出地介绍了数字信号处理在通信、音频、图像等领域的应用。
这让我意识到,原来我们每天都在和数字信号处理打交道,只是我们不知道罢了。
可以说这门课程让我对数字信号处理有了更深的理解和更多的兴趣。
学习数字信号处理这门课程,让我对信号有了全新的认识,也让我明白了数字信号处理的重要性。
我觉得这门课程不仅仅是理论知识的学习,更是打开了一扇探索信号世界的窗户。
现在我已经迫不及待想要继续深入学习了!二、数字信号处理基础知识在这一阶段的学习过程中,你们可能已经领略到数字信号处理的奇妙世界,那么先来简单聊聊那些处理的基础常识。
说起数字信号处理,是不是听起来像进入了什么高大上的黑科技世界?但实际上数字信号处理跟我们的日常生活紧密相连,例如音频播放、视频播放这些大家每天干的事都与数字信号处理密切相关。
当你聆听音乐的每一个节拍时,数字信号处理就像魔法一样确保了这些音频的完美传递和重现。
好啦接下来我们说说那些具体的常识。
首先了解什么是信号,信号可以简单理解为一种传递信息的媒介,比如声音、图像等都可以是信号。
而数字信号处理则是把这些信号转换成数字形式进行处理,想象一下这就像是把现实世界的声音、图像等转化成电脑能懂的语言。
接下来是处理的过程,这涉及到信号的采集、转换、分析和处理等环节。
在这个过程中,数字信号处理帮助我们实现信号的放大、滤波等功能,让我们的音质更加纯净、图像更加清晰。
数字视频基础知识数字视频是现代社会中广泛应用的一种媒体形式。
它以数字信号为基础,通过图像编码、传输和解码等技术,实现对视频图像的采集、处理和展示。
数字视频的应用领域涉及电视、电影、广告、网络视频等众多领域。
本文将介绍数字视频的基础知识,包括视频编码、视频格式、视频分辨率和帧率等方面。
一、视频编码数字视频的编码技术是将连续的视频图像序列转化为数字信号的过程。
常见的视频编码标准有MPEG-2、H.264、H.265等。
这些编码标准通过对图像进行压缩,实现了视频数据的高效传输和存储。
视频编码的核心原理是空间和时间的冗余性去除,即通过图像的相似性和相邻帧之间的相关性,减少视频数据的冗余程度。
二、视频格式视频格式是指数码视频文件的存储和传输格式。
常见的视频格式包括AVI、MOV、MP4、MKV等。
这些格式不仅包含视频数据,还可以携带音频数据、字幕等相关信息。
不同的视频格式适用于不同的应用场景,选择合适的视频格式可以提高视频的传输和播放效果。
三、视频分辨率视频分辨率是指视频图像的大小和清晰度程度,通常以像素为单位来表示。
常见的视频分辨率有1080p、720p、480p等。
数字视频的分辨率决定了图像的细节和清晰度,高分辨率的视频图像能够更真实地还原真实场景,但也需要更大的存储和传输带宽。
四、帧率帧率是指视频中每秒显示的图像帧数。
常见的帧率有24fps、30fps、60fps等。
帧率的选择直接影响到视频图像的流畅度和感官效果。
较低的帧率可能导致视频卡顿和画面不连贯,而较高的帧率则能够呈现出更加细腻和流畅的动态效果。
五、视频编解码器视频编解码器是视频编码和解码的工具软件或硬件。
常见的视频编解码器有X264、X265、FFmpeg等。
视频编解码器的作用是将视频数据进行压缩编码和解码还原,实现视频文件的传输和播放。
六、数字视频的应用数字视频在现代社会中有着广泛的应用。
电视、电影、广告等传统媒体领域,数字视频成为了主流媒体形式。
数字视频处理数字视频处理概述数字视频就是先用摄像机之类的视频捕捉设备,将外界影像的颜色和亮度信息转变为电信号,再记录到储存介质(如录像带)。
播放时,视频信号被转变为帧信息,并以每秒约30帧的速度投影到显示器上,使人类的眼睛认为它是连续不间断地运动着的。
电影播放的帧率大约是每秒24帧。
如果用示波器(一种测试工具)来观看,未投影的模拟电信号看起来就像脑电波的扫描图像,由一些连续锯齿状的山峰和山谷组成为了存储视觉信息,模拟视频信号的山峰和山谷必须通过数字/模拟(D/A)转换器来转变为数字的“0”或“1”。
这个转变过程就是我们所说的视频捕捉(或采集过程)。
如果要在电视机上观看数字视频,则需要一个从数字到模拟的转换器将二进制信息解码成模拟信号,才能进行播放。
模拟视频的数字化包括不少技术问题,如电视信号具有不同的制式而且采用复合的YUV信号方式,而计算机工作在RGB空间;电视机是隔行扫描,计算机显示器大多逐行扫描;电视图像的分辨率与显示器的分辨率也不尽相同等等。
因此,模拟视频的数字化主要包括色彩空间的转换、光栅扫描的转换以及分辨率的统一。
模拟视频一般采用分量数字化方式,先把复合视频信号中的亮度和色度分离,得到YUV或YIQ分量,然后用三个模/数转换器对三个分量分别进行数字化,最后再转换成RGB空间。
DSP是数字信号处理器的简称,在全球的数字化浪潮中,DSP以其高性能和软件可编程等特点,长期对数字媒体处理起到了积极的推动作用。
最初DSP的应用在于专业数据通信和语音处理,各种专用调制解调器、声码器、数据加密机初步获得市场。
其后DSP应用扩展到广泛的民用产品,诸如硬盘驱动器、通用调制解调器、数字答录机、无线通信终端。
九十年代中DSP在数字GSM手机应用和无线基站应用中都获得了巨大的成功。
与此同时,DSP开始全面拓展到新兴应用,并在宽带通信、数字控制、数字音频、数字视频等众多市场全球。
现在,我们就DSP在数字视频行业中的应用进行分析。
DSP重点知识点总结DSP(数字信号处理)是一门涉及数字信号获取、处理和分析的学科。
DSP技术被广泛应用于通信、音频和视频处理、雷达和图像处理等领域。
下面是DSP的重点知识点总结。
1.信号与系统理论:信号可以理解为一种函数或者波形,可以用数学模型表示。
系统是根据输入信号产生输出信号的过程。
信号与系统理论研究信号和系统之间的关系,如卷积、频谱分析等。
2.时域和频域分析:时域分析是指对信号在时间上的特征进行分析,如幅度、相位、周期等。
频域分析则是将信号在频率上进行分析,如频谱、谐波成分等。
3.Z变换和离散时间系统:Z变换是一种离散信号处理的分析工具,它可以将离散时间信号转换成复变量的函数。
离散时间系统是一种对离散时间信号进行处理的系统,可以用系统函数来描述其输入输出关系。
4.数字滤波器设计:数字滤波器是一种对数字信号进行滤波处理的系统。
低通滤波器可以通过去除高频成分来平滑信号,高通滤波器则可以去除低频成分,带通滤波器可以只保留一些频段的信号。
5.快速傅里叶变换(FFT):FFT是一种将时域信号转换成频域信号的算法,它可以高效地计算信号的频谱。
FFT广泛应用于频谱分析、滤波器设计、信号压缩等领域。
6.语音信号处理:语音信号处理是DSP的一个重要应用领域。
它包括语音信号的获取、去噪、压缩、识别等技术。
常用的算法包括线性预测编码(LPC)、梅尔倒谱系数(MFCC)等。
7.图像处理:图像处理是DSP的另一个重要应用领域。
它包括图像的获取、增强、压缩、分割、识别等技术。
常用的算法包括离散余弦变换(DCT)、小波变换等。
8.数字信号处理芯片:数字信号处理芯片是一种集成了数字信号处理功能的专用芯片。
它可以高效地进行信号处理和计算,并广泛应用于通信设备、音频设备等领域。
9.数字信号处理应用:DSP技术在通信、音频、视频、雷达、图像等领域有广泛的应用。
例如,DSP可以用于音频信号的压缩、通信系统的调制解调、雷达信号的处理等。
数字媒体技术期末自我总结随着数字时代的到来,数字媒体技术的应用广泛而深入,对于我来说,学习数字媒体技术是我大学学习生涯中的一段重要经历。
通过这门课程的学习,我对数字媒体技术有了更深入的了解,也体会到了数字媒体技术对于我们生活的重要性。
在这门课程中,我学到了很多与数字媒体技术相关的知识。
首先,我学会了数字媒体技术的基本概念和原理,包括数字图像处理、数字音频处理、数字视频处理等方面的知识。
我了解了数字媒体技术的基本原理,例如数字图像处理是通过对图像进行采样、量化和编码来实现的;数字音频处理是通过对音频进行取样、量化和编码来实现的;数字视频处理是通过对视频进行采样、压缩和编码来实现的。
通过这些学习,我掌握了数字媒体技术的一些基础理论和方法。
其次,在课程中我也学习了一些数字媒体技术的应用实例。
例如,我学习了数字图像处理的一些应用,如图像增强、图像分割、图像压缩等。
通过这些应用实例,我了解了数字媒体技术在图像处理领域的一些具体应用。
另外,我也了解了数字音频处理和数字视频处理的一些应用,如音频编辑、音频压缩、视频编辑、视频压缩等。
通过这些实例,我对数字媒体技术在音频和视频处理方面的应用有了一些了解。
除了理论知识和应用实例,课程中还有一些实践环节。
例如,我们进行了一些数字媒体技术的实验,如图像处理实验、音频处理实验、视频处理实验等。
通过这些实验,我能够更深入地理解数字媒体技术的操作和应用。
同时,我也掌握了一些数字媒体技术的工具和软件,如Photoshop、Audacity、Premiere等。
这些实践环节为我提供了一个锻炼自己的机会,让我能够更好地应用所学知识。
通过这门课程的学习,我深刻地认识到数字媒体技术对于我们生活的重要性。
在现代社会中,数字媒体技术已经成为我们生活中不可或缺的一部分。
无论是在娱乐、教育、文化还是商业方面,数字媒体技术都发挥着重要的作用。
例如,在娱乐方面,我们可以通过数字媒体技术来观看电影、听音乐、玩游戏等;在教育方面,数字媒体技术可以帮助学生更好地理解和记忆知识;在文化方面,数字媒体技术可以保存和传承文化遗产;在商业方面,数字媒体技术可以帮助企业宣传和推广产品。
数字媒体技术大一上知识点数字媒体技术是一门综合性学科,涉及广泛且深入的知识点。
在大一上学期,学生们主要学习数字媒体的基础知识和技术原理。
以下是大一上学期数字媒体技术的一些重点知识点:1. 基本原理与概念:数字媒体技术的基本原理主要涉及数字信号的表示和处理、数字图像与视频的生成与处理、声音与音频的数字化等。
在这门课程中,学生需要了解数字信号的特点,学习如何将模拟信号转换为数字信号,并理解数字图像、音频和视频的基本概念。
2. 数字图像处理:数字图像处理是数字媒体技术中的重要组成部分。
学生需要学习图像的采集、压缩、存储和处理等基本概念和方法。
此外,学生还需要掌握数字图像处理软件的使用,例如Adobe Photoshop等。
3. 矢量图形与动画:学生需要了解矢量图形的基本特点及其在数字媒体中的应用。
此外,学生还需要学习动画的制作原理,包括关键帧动画、插值动画等基本概念和技术。
4. 数据压缩与编码:数据压缩是数字媒体技术中的重要内容。
学生需要学习数据压缩的原理和方法,了解常用的压缩标准和编码方式,例如JPEG、MPEG等。
5. 声音与音频处理:学生需要了解声音的特性及其在数字媒体中的应用。
此外,学生还需要学习音频采集、编辑、合成和处理的基本技术,包括音频格式、音频编辑软件等。
6. 数字视频技术:数字视频技术包括视频的采集、编辑、压缩和传输等基本技术。
学生需要学习数字视频的基本概念,了解视频压缩的原理和方法,以及熟悉视频编辑软件的使用。
7. 三维图形与动画:学生需要学习三维图形的基本概念和表示方法,了解三维图形的生成和处理技术。
此外,学生还需要学习三维动画的制作原理和方法,以及掌握相关的三维建模和动画软件。
8. 虚拟现实与增强现实:学生需要了解虚拟现实和增强现实的基本概念,学习虚拟现实的成像原理和技术,了解增强现实的应用领域和技术实现。
9. 数字媒体系统与应用:学生需要了解数字媒体系统的组成结构和基本原理,学习数字媒体的应用领域和实际案例。
第一章1. 填空题(1)波长在 380~780 NM 范围内的电磁波能够使人眼产生颜色感觉,称为可见光。
(2)由不同光谱混合出相同色光的现象叫同色异谱。
(3)发光体的颜色由它本身所发出的光谱确定。
(4)不发光体的颜色与照射光的光谱和不发光体对照射光的反射、透射特性有关。
(5)光通量是按人眼的光感觉来度量的辐射功率,用符号Φ表示。
其单位名称为流明(LM) 。
(6)光照度 E,单位为勒(克斯),符号为 LX。
(7)人眼最敏感的光波长为 555NM,颜色是草绿色。
(8)杆状细胞灵敏度很高,但对彩色不敏感。
(9)人眼的亮度感觉总是滞后于实际亮度的,这一特性称为视觉惰性。
(10)视力正常的人视觉暂留时间约为 0.1S。
(11)不引起闪烁感觉的最低重复频率称为临界闪烁频率。
(12)若照射物体的光强度不变,物体的反射性能越好,则物体越亮。
(13)描述一种色彩需要用亮度、色调和色饱和度三个基本参量。
(14)饱和度反映彩色光的深浅程度。
(15)饱和度与彩色光中的白光比例有关,白光比例越大,饱和度越低。
(16)色饱和度和色调合称为色度。
(17)当两种颜色混合得到白色时,这两种颜色称为互补色。
(18)谱色曲线上任意一点与 E 白点的连线称为等色调线。
(19)在 XYZ 计色制中系数 Y 的数值等于合成彩色光的亮度, 合成彩色光色度由 X、Y、Z 的比值决定。
(20)在 XYZ 计色制中当 X=Y=Z 时,配出等能白光 E 白。
2. 选择题 (1)下列波长的电磁波不能够使人眼产生颜色感觉的是(④ 880 nm )。
(2)在白光下呈绿色的纸在红光下应该呈(④ 黑色)。
(3)光源的色温单位是(③ 开氏度)。
(4) 光照度为 10-1 勒相当于(③ 月光)。
(5) 彩色三要素是(② 亮度、色调和饱和度)。
(6) 在彩色电视中,选用的三基色是(① 红、绿、蓝)。
(7) 两种颜色互为补色的是(③ 黄、蓝)。
(8) 绿色、紫色、青色相加得到(① 浅绿)。
数字多媒体知识点总结一、数字多媒体的基本概念数字多媒体是指利用计算机技术进行数字化处理的多媒体信息,包括文字、图像、声音、视频等多种媒体形式。
数字多媒体技术将这些多种媒体形式集成起来,以数字化的方式进行存储、处理和传输。
数字多媒体技术包括多媒体信息的获取、处理、编码、解码、存储、传输等过程,在这些过程中涉及到多媒体信息的表示、压缩、同步、恢复等技术。
数字多媒体技术是多媒体技术和数字技术的结合,它利用计算机和网络等数字技术来对多媒体信息进行处理和传播。
数字多媒体技术的发展为多媒体信息的获取、处理、传输、存储等提供了新的途径,它使多媒体信息可以以数字化的方式在计算机和网络等平台上进行展示和传播。
数字多媒体技术的发展已经深刻影响了我们的生活和工作,它改变了我们获取信息、进行沟通、娱乐、学习等方面的方式和习惯。
数字多媒体技术也为媒体产业、教育、医疗、娱乐等各个领域带来了新的发展机遇。
二、数字多媒体的技术原理1. 多媒体信息的获取多媒体信息的获取是指利用各种传感器和设备来捕获多媒体信息,包括文字、图像、声音、视频等多种形式的媒体信息。
现代的数字相机、数字录像机、麦克风、传感器等设备已经可以方便地进行多媒体信息的获取,它们将多种媒体信息转换成数字化的形式,以便后续的数字化处理和传输。
2. 多媒体信息的处理多媒体信息的处理包括对多媒体信息进行编辑、合成、变换、增强等处理,以便使其更加适合于特定的应用需求。
例如,对图像和视频进行图像处理、视频处理,对声音进行音频处理,对文字进行文本处理等。
3. 多媒体信息的编码和解码多媒体信息的编码是指将多媒体信息转换成数字化的形式,以便在计算机和网络等数字平台上进行存储和传输。
多媒体信息的解码则是指将数字化的多媒体信息恢复成原始的多媒体信息。
多媒体信息的编码和解码涉及到多种编码和解码技术,例如图像编码、视频编码、音频编码等。
4. 多媒体信息的存储多媒体信息的存储是指将数字化的多媒体信息以数字化的形式保存在存储设备中,以便随时进行检索和传输。
数字视频处理实验报告学院:通信与信息工程学院系班:电信科0901姓名:学号:时间:2012年11月2号一、实验名称:A VI格式的数字视频的读取与视频数据分析二、实验目的:1、编程读取A VI格式视频,并了解视频数据的特点。
2、编程求取视频两帧误差图像,掌握视频的时间冗余特性。
3、编程提取固定像素点视频帧的一维数据,并画图显示,掌握视频的时间冗余特性。
三、实验程序1、读取A VI格式视频程序VideoName='shaky_car.avi';VideoData=aviread(VideoName);%截取部分帧显示图像for NumberFram=2:10:32FrameData=double(VideoData(NumberFram).cdata);subplot(2,2,floor(NumberFram/10)+1)imagesc(FrameData);title([‘第' num2str(NumberFram) '帧图像'])colormap(gray);axis off;endaxis off;%视频播放movie(VideoData);2、视频两帧误差图像程序%打开文件VideoName='shaky_car';VideoData=aviread(VideoName);%获取前两帧图像数据videoFrame1 = VideoData(1);videoFrameData1 = double(videoFrame1.cdata);videoFrame2 = VideoData(2);videoFrameData2 = double(videoFrame2.cdata);%求两帧差值chazhi=abs(videoFrameData2-videoFrameData1);%显示各图像figure;subplot(2,2,1);imagesc(videoFrameData1);title('第一帧图像');axis off;subplot(2,2,2);imagesc(videoFrameData2);title('第二帧图像');axis off;subplot(2,2,3);imagesc(chazhi);title('差值图像');colormap(gray);axis off;3、固定像素点视频帧的一维数据程序%打开图像VideoName='shaky_car';VideoData=aviread(VideoName);%获取视频帧数k及图像的大小m和nk=length(VideoData);[m,n]=size(double(VideoData(1).cdata));Y1=zeros(1,k);%提取没帧图像的中间点像素,将其存入数组Y1 for FrameNumber = 1:kvideoFrame = VideoData(FrameNumber);videoFrameData = double(videoFrame.cdata);Y1(FrameNumber)=videoFrameData(m/2,n/2); end%画出各帧中心像素变化图t=1:k;stem(t,Y1);title('每帧图像中心点像素分析图');xlabel('帧数');ylabel('像素值');grid on;四、实验结果与分析1、读取A VI格式视频结果图1 视频部分帧图像2、视频两帧误差图像结果图二视频两帧误差图像3、固定像素点视频帧的一维数据结果图三固定像素点视频帧的一维数据分析图。
一、实训背景随着信息技术的飞速发展,数字媒体技术已经成为现代科技的重要组成部分。
为了提高学生的实践能力和综合素质,我国高校纷纷开设了数字媒体技术专业。
为了使学生们更好地将理论知识与实践相结合,提高实际操作能力,我校组织了为期一个月的数媒专业综合实训。
二、实训目的1. 使学生掌握数字媒体技术的基本原理和操作技能;2. 提高学生团队协作能力和沟通能力;3. 培养学生创新意识和实践能力;4. 增强学生对数字媒体行业的认识,为今后就业打下基础。
三、实训内容1. 数字图像处理:学习数字图像处理的基本理论,掌握图像的获取、处理、存储和显示方法,熟悉常用图像处理软件的操作。
2. 数字视频处理:了解数字视频的基本概念,掌握视频的采集、编辑、合成和输出等操作,熟悉常用视频编辑软件的使用。
3. 3D建模与动画:学习3D建模的基本原理,掌握3D建模软件的使用,了解动画制作的基本流程。
4. 网页设计与制作:学习网页设计的基本理论,掌握网页制作软件的使用,了解网站开发的基本流程。
5. 实际项目制作:分组进行实际项目制作,如视频剪辑、动画制作、网页设计等,提高学生的实践能力。
四、实训过程1. 实训初期,学生们通过学习相关理论,了解数字媒体技术的基本概念和操作方法。
2. 在实训过程中,学生们分组进行实际项目制作,遇到问题时,相互讨论、共同解决。
3. 实训中期,学生们通过请教老师、查阅资料等方式,提高自己的实践能力。
4. 实训后期,学生们对作品进行修改和完善,准备项目汇报。
五、实训成果1. 学生们掌握了数字媒体技术的基本原理和操作技能,提高了实际操作能力。
2. 学生们在团队协作中,提高了沟通能力和团队协作能力。
3. 学生们通过实际项目制作,培养了创新意识和实践能力。
4. 学生们对数字媒体行业有了更深入的了解,为今后就业奠定了基础。
六、实训总结1. 实训过程中,学生们积极参与,认真完成各项任务,取得了良好的成果。
2. 实训使学生们认识到理论知识与实践相结合的重要性,提高了学生的综合素质。
数字视频实践报告总结数字视频是在现实世界中根据数字技术进行创造和传播的视频形式。
数字视频的出现使得视频制作和传播变得更加便利和灵活,为创作者提供了更多的创作空间和表现手法。
在数字视频的制作过程中,我通过学习和实践掌握了一些基本的技能和知识。
首先,我学会了使用视频编辑软件进行基本的剪辑和处理。
这些软件提供了丰富的编辑功能,包括剪辑、合并、特效添加等,使得我能够按照自己的创意对视频进行灵活的处理和修改。
其次,我学习了如何拍摄和调整视频的画面。
合理的画面构图和角度选择可以增强视频的艺术感和观赏性,我通过实践掌握了一些拍摄技巧,比如运用倒影、对焦、颜色调整等手法来提升画面的效果。
最后,我还学习了如何添加和调整音频。
音频是视频中不可或缺的一部分,通过调整音量、混音和剪辑可以使得视频的音效更加贴合主题和效果。
在实践过程中,我遇到了一些挑战和困难,但通过持续的努力和实践,我逐渐克服了这些问题。
首先,我发现视频编辑软件的使用有一定的学习曲线,需要耐心和时间去学习和掌握各种功能和操作。
然而,通过不断地尝试和摸索,我逐渐熟悉了软件的使用方法,能够灵活地运用各种功能进行视频编辑。
其次,我在拍摄过程中有时会遇到一些技术问题,比如光线不足、画面虚花、音频杂音等。
然而,通过学习和实践,我慢慢掌握了一些应对这些问题的办法和技巧,比如增加光源、调整相机设置等。
通过数字视频实践,我不仅学到了一些实际的技能和知识,还培养了一些重要的能力和素质。
首先,我提高了自身创作和表达的能力。
通过数字视频的制作,我能够将自己的创意和想法通过视觉形式传达给观众,这不仅增强了我的沟通和表达能力,也提升了我的创造力和想象力。
其次,我培养了团队合作的意识和能力。
在实践过程中,我发现数字视频的制作往往需要多人合作完成,每个人的任务和角色都很重要。
因此,我学会了与团队成员合作,并且能够有效地分工和协作,确保视频制作的顺利进行。
总的来说,数字视频实践是一次富有收获和挑战的经历。
1.三基色原理:任何一种颜色可以通过三基色按不同比例混合得到。
照明光源的基色系包括红色、绿色和蓝色,称为RGB基色。
R+G+B=White 反射光源的基色系包括青色、品色和黄色,称为CMY基色。
C+M+Y=Black RGB和CMY基色系是互补的,也就是说混合一个色系中的两种彩色会产生另外一个色系中的一种彩色。
2.HVS(人类视觉系统) -人类获取外界图像、视频信息的工具。
视网膜有两种类型感光细胞:
锥状细胞:在亮光下起作用,感知颜色的色调。
含有三种类型的锥状细胞。
杆状细胞:在暗一些的光强下工作,只能感知亮度信息。
3.相加混色法:
1)空间混色法:将三种基色光同时分别投射到同一平面的相邻3点,若3点相距足够近,由于人眼的分辨力有限和相加混色功能,因此,人眼看到的不是基色,而是这三种基色的混合色。
彩色显像管的现象就是利用了空间混色法。
2)时间混色法:按一定顺序轮流将三种基色光投射到同一平面上,由于人眼的视觉惰性和相加混色功能,因此,人眼看到的不是基色,而是这三种基色的混合色。
场顺序制彩色电视就是采用时间混色法以场顺序来传送三种基色信号的。
3)生理混色法:(立体彩色电视的显像原理)
4)全反射混色法:(投影电视的基本原理)
4.彩色电视三种制式:
NTSC制:正交平衡调幅制(采用YIQ彩色空间)
PAL制:正交平衡调幅逐行倒相制(采用YUV彩色空间)
SECAM制:行轮换调频制(采用YDbDr彩色空间)
矢量量化
编码--用二进制数来表示量化后样值的过程
9.量化:(将无限极的信号幅度变换成有限级的数码表示)
量化的用途
1)将模拟信号转换为数字信号,以便进行数字处理和传输
2)用于数据压缩
10.二维采样定理:
若二维连续信号f(x,y)的空间频率u和v分别限制在|u|<=Um、|v|<=Vm (Um、Vm为最高空间频率),则只要采样周期Δx、Δy满足Δx<=1/2Um、Δy<=1/2Vm,就可以由采样信号无失真的恢复原信号。
3.基于多分辨率的运动估计:
1)运动场接近最优解的概率更大;在较小分辨率层上,误差函数可以接近全局最小值,通过插值,获得高分辨率上的初始解,最后到达最大分辨率时,运动场很可能接近最优解。
2)计算量比直接在最大分辨率上进行运动估计时要小;在较小分辨率层上,搜索范围限制在较小的范围。
1.压缩时,视频冗余:
1)空间冗余:相邻像素/行变化小
2)时间冗余:相邻帧变化小,具有相关性
3)结构冗余:图像从大面积上看常存在有相似结构,称之为结构冗余。
4)知识冗余:有些图像的理解与某些知识有相当大的相关性
5)视觉冗余:人眼的视觉系统对于图像的感知是非均匀和非线性的,对图像的变化并不都能察觉出来。
3.预测编码:
利用图像信号的空间或时间相关性,用已传输的像素对当前的像素进行预测,即只对预测值与真实值的差——预测误差进行编码(处理和传输)。
所谓预测编码,就是用信源的前几个符号来预测接下来的符号,用几个符号就称之为几阶预测。
不直接对当前符号进行编码,而是利用相邻符号来预测当前符号,然后对预测误差进行编码。
预测编码主要消除时间冗余和生理冗余。
(1)运动估计
是对运动物体的位移作出估计,即估计出运动物体从上一帧到当前帧的位移方向和位移量,也就是估计出运动矢量。
(2)运动补偿
是按照运动矢量将上一帧作位移基准,求出当前帧的运动结果。
对运动物体的补偿后的位移帧差信号以及运动矢量等进行编码传输。
帧间运动补偿原理:
①当前帧在过去帧的窗口中寻找匹配部分,从中找到运动矢量;
②根据运动矢量,将过去帧位移,求得对当前帧的估计;
③将这个估计和当前帧相减,求得估计的误差值;
④将运动矢量和估计的误差值送到接收机端去。
4.变换编码:
将空间域描述的图像经某种变换(如傅立叶变换、离散余弦变换等),即将空间域分散分布的图像能量变为变换域的相对集中分布,便于用Z字形扫描、自适应量化、变长编码等进一步处理,完成对图像信息的有效压缩。
变换编码主要消除空间冗余。
1.JPEG:
JPEG是联合图象专家组(Joint Picture Expert Group)的英文缩写,是国际标准化组织(ISO)和CCITT联合制定的静态图象的压缩编码标准。
JPEG是目前静态图象中压缩比最高的。
JPEG压缩是有损压缩,它利用了人的视觉系统的特性,使用量化和无损压缩编码相结合来去掉视觉的冗余信息和数据本身的冗余信息。
DCT的特点:
DC分量为子块的平均灰度,系数分布集中在低频端
(1)正交变换具有熵保持性
(2)正交变换具有能量保持性,并能把能量重新分配与集中。
(3)去相关性,可使高度相关的空间样值变为相关性较弱的变换系数,从而
减少空间样值之间冗余度。
四种操作模式:
(1)基于DCT的顺序型操作模式一遍扫描
(2)基于DCT的渐进型操作模式从粗到细多遍扫描
(3)基于DPCM的无损编码操作模式
(4)基于多分辨率编码的操作模式
2.JPEG2000主要特点:(新一代静态图像压缩标准)
(1)高压缩率。
与JPEG相比,可修复约30%的速率失真特性。
JPEG和JPEG2000在压缩率相同时, JPEG2000的信噪比将提高30%左右;
(2)无损压缩。
预测编码作为对图像进行无损编码的成熟方法被集成在JPEG2000中;
(3)渐进传输。
JPEG2000可实现以空间清晰度和信噪比为首的各种可调节性,从而实现渐进传输,即具有“渐现”特性;
(4)感兴趣区域压缩。
JPEG2000 支持所谓的“感兴趣区域”。
与JPEG的区别:
采用了以小波变换为主的多分辨率编码方式:统一了面向静态图像和二值图像的编码方式:既支持低比率压缩又支持高比率压缩。
3.H.264/AVC新一代视频压缩标准:
根据应用领域不同,制定了不同的算法集合和技术限定,共分为3个档次:基本档(视频会话)、主档(消费电子应用)和扩展档(网络视频流)。
基本档是扩展档的子集,但不是主档的子集。
H.264优点:
(1)更高的编码效率
(2)自适应的时延特性
(3)面向IP包的编码机制
(4)错误恢复功能
(5)开放性
显示顺序:
编码顺序:
I、P、B关系:
图像压缩首先处理I帧图像,然后是P帧,最后在两者的基础上才处理B帧;
IBBPBBP……帧序重排:在编码器端需要对输入图像重新排序,对按显示顺序输入的序列,经过帧序重排后成为按编码顺序排列,然后按I、 P 、 B帧分别进行编码,即图像的显示顺序和编码顺序不相同。
6层数据结构:
图像序列、图像组、图片、切片slice、宏块、块
(1)图像序列层——由连续图像组成,用序列终止符结束;
(2)图像组层——图像组(GOP)由几帧连续图像组成,是随机存取单元,其第一帧总是I帧;
(3)图像层——图像(帧)编码的基本单元,独立的显示单元;
(4)条带层——由一帧图像中的几个宏块组成,主要用于误差恢复;
(5)宏块层——一个宏块由四个8×8的亮度块和两个8×8的色差块组成;
(6)块层——一个8×8的像素区域称为一个块,是最小的DCT单位。
MPEG-4采用了基于对象的编码方案。