第四章 二维运动估计
- 格式:ppt
- 大小:3.42 MB
- 文档页数:141
运动估计一、概述运动估计的基本思想是将图像序列的每一帧分成许多互不重叠的宏块,并认为宏块内所有象素的位移量都相同,然后对每个宏块到参考帧某一给定特定搜索范围内根据一定的匹配准则找出与当前块最相似的块,即匹配块,匹配块与当前块的相对位移即为运动矢量。
视频压缩的时候,只需保存运动矢量和残差数据就可以完全恢复出当前块。
这段来源于百度:第一句,说把一帧分成许多不重叠的宏块,涉及到几个概念,一个是分隔,一个是不重叠,一个是宏块,H.264的宏块,都是16*16的像素块,其中又有一个隐含的概念,就是一个宏块包含亮度,色度U和色度V,其中.二比一的关系。
第二句,认为宏块内所有像素的位移量都相同。
当然,实际情况可能是一个宏块内的像素属于两个运动物体,比如属于两只小鸟,分别飞往两个方向,这样的话,这分属于两个小鸟的像素的位移,包括移动距离和方向,都是不一样的,但这样太复杂了,而且,H.264里,用到这个位移,它并不是要真的研究位移,只是为了压缩样本像素的网络传输,所以,在高度复杂的问题面前,没必要纠结对与错。
而是把宏块作为一个整体来看的。
它只是要在参考帧中找到一个类似的块来求差,而参考帧的这个块,也许和当前的块根本就没任何关系。
我是这样猜出想的,比如这个帧里,有一块纯黑的区域,在同一个帧里,还有另一块纯黑的区域,如下图:假定这个图从左向右移动,它就成了一段连续的,相似的动画,或者叫一个序列算了。
这样的话,在上面的那个黑色区域里的某一个宏块,可以用前一帧对应位置附近的一个黑色宏块作参考,也可以用前一帧里,下面这个黑色区域里的一个宏块作参考,在小范围里来说,压缩效果是一样的。
看H.264里,有个最优匹配的概念,对于这个纯色的图来说,没什么太大的感觉,如果对于那些花花绿绿的真彩色图来说,很少存在这样的纯色块,那个最优匹配应该就有优势了。
在真彩色的每一个宏块,它并不见的能找到一个和它一样样的宏块来作参考,一般也就找个比较接近的,那这个最优匹配,就是找最近似的了吧,如何认为是最近似的,好像是H.264里的SAE什么的,不管是不是它,肯定有一个判断的标准。
Project report about two -dimensional DOA estimation题目:考虑一个20阵元数的双线性均匀线阵,现有三个信源入射,它们的波达方向(DOA )分别是(10o , 10o ), (20o , 20o ) 和 (30o , 30o ),请用2D -MUSIC 算法,2D -ESPRIT 算法,2D -Capon 算法,2D -PM 算法以及DOA 矩阵方法来估计这些信源的波达方向。
1. 信号接收模型如图1,考虑N 个不同二维DOA (),,1,2,,n n n N θφ=的窄带远场信号()n s t ,在离散时间t 入射有2M 个传感器的双平行均匀线阵时。
x 轴和y 轴上信源的方向矢量分别为:图1()()21sin cos 2sin cos ,1,,,n n n n Tj M d j d x n n e e πθφλπθφθφ-⎡⎤=⎣⎦a (1)()2sin sin ,1n n Tj d y n n e πθφλθφ⎡⎤=⎣⎦a(2)其中λ为波长,d 是阵元间距,x 轴M 个阵元对应方向矩阵为()()()1122,,,,,,x x x x N N θφθφθφ=⎡⎤⎣⎦A a a a ,具体表示为:()()()112211222sin cos 2sin cos 2sin cos 21sin cos 21sin cos 21sin cos 111N NN Nj d j d j d M Nx j M d j M d j M d e e e e e e πθφλπθφλπθφλπθφλπθφλπθφλ⨯---⎡⎤⎢⎥⎢⎥=∈⎢⎥⎢⎥⎢⎥⎣⎦A (3)y 轴2个阵元对应方向矩阵为()()()1122,,,,,,y y y y N N θφθφθφ⎡⎤=⎣⎦A a a a ,具体表示为:112222sin sin 2sin sin 2sin sin 1111N NNy j d j d j d eeeπθφπθφλπθφλ⨯⎡⎤=∈⎢⎥⎣⎦A (4)双平行线阵中子阵列1的接收信号为()()()11x t s t t =+x A n(5)子阵列2的接收信号为()()()22x t t t =+x A Φs n(6)其中()1t n 和()2t n 分别表示子阵列1和2的与信号不相干的加性高斯白噪声,112sin sin 2sin sin ,,N N j d j d diag e e πθφλπθφλ⎡⎤=⎣⎦Φ,()()()11,TN N t s t s t ⨯=∈⎡⎤⎣⎦s 表示信源矢量。
二维光流运动估计的方法嘿,咱今儿个就来唠唠二维光流运动估计的方法。
你说这光流运动估计啊,就像是给运动的物体安上了一双眼睛,能让我们清楚地知道它是咋动的。
先来说说基于梯度的方法吧。
这就好比是在一个迷宫里找路,通过观察周围的变化来确定方向。
这种方法呢,简单直接,能快速地算出个大概来。
但是呢,它也有它的局限性,就像走迷宫有时候也会碰到死胡同一样,可能会不太准确。
然后呢,还有基于区域匹配的方法。
这就像是拼图游戏,把相似的部分找出来拼在一起,从而了解物体的运动情况。
这种方法呢,相对来说更准确一些,就好像拼图拼对了就能看到完整的画面。
可它也不是完美的呀,有时候找那些相似的部分也挺费劲儿的呢。
再有就是基于相位的方法啦。
这个就有点像听音乐的节奏,通过节奏的变化来感知运动。
它有它的独特之处,能在一些复杂的情况下发挥作用,就像音乐的节奏能带动人的情绪一样。
还有基于特征的方法呢,这就像是抓住物体的一些关键特点,然后根据这些特点的变化来估计运动。
就好比你记住了一个人的独特之处,下次再见到就能认出来一样。
咱说了这么多种方法,每种都有它的长处和短处。
就像人一样,没有一个人是完美无缺的,每种方法也都有它适用的场景和不适用的情况。
那咱在实际应用的时候可得好好琢磨琢磨,到底哪种方法更适合当下的情况呢。
你想想啊,要是在一个很复杂的环境里,那是不是就得选一个更能应对复杂情况的方法呢?要是在一个简单的场景下,也许就不需要那么复杂的方法啦,简单直接的说不定更好用呢。
总之呢,二维光流运动估计的方法有很多,咱得根据具体情况来选择,可不能瞎用一通啊。
这就好比你去爬山,总不能穿着高跟鞋去吧,得选对鞋子才能爬得稳当呀!咱对待这些方法也得这样,选对了,才能让我们更好地了解物体的运动,为我们的研究或者应用提供有力的支持。
你说是不是这个理儿呀?。
第四章数字压缩编码技术1 数字压缩的必要性数字信号有很多优点,但当模拟信号数字化后其频带大大加宽,一路6MHz的普通电视信号数字化后,其数码率将高达167Mbps,对储存器容量要求很大,占有的带宽将达80MHz左右,这样将使数字信号失去实用价值。
数字压缩技术很好地解决了上述困难,压缩后信号所占用的频带大大低于原模拟信号的频带。
因此说,数字压缩编码技术是使数字信号走向实用化的关键技术之一,表4-1列出了各种应用的码率。
有线电视网中数字压缩技术主要包括用于会议电视系统的H.261压缩编码,用于计算机静止图像压缩的JPEG和用于活动图像压缩的MPEG数字压缩技术。
2 图像压缩编码的可能性从信息论观点来看,图像作为一个信源,描述信源的数据是信息量(信源熵)和信息冗余量之和。
信息冗余量有许多种,如空间冗余,时间冗余,结构冗余,知识冗余,视觉冗余等,数据压缩实质上是减少这些冗余量。
可见冗余量减少可以减少数据量而不减少信源的信息量。
从数学上讲,图像可以看作一个多维函数,压缩描述这个函数的数据量实质是减少其相关性。
另外在一些情况下,允许图像有一定的失真,而并不妨碍图像的实际应用,那么数据量压缩的可能性就更大了。
3 图像压缩编码方法的分类编码压缩方法有许多种,从不同的角度出发有不同的分类方法,比如从信息论角度出发可分为两大类:(1)冗余度压缩方法,也称无损压缩,信息保持编码或熵编码。
具体讲就是解码图像和压缩编码前的图像严格相同,没有失真,从数学上讲是一种可逆运算。
(2)信息量压缩方法,也称有损压缩,失真度编码或熵压缩编码。
也就是讲解码图像和原始图像是有差别的,允许有一定的失真。
应用在多媒体中的图像压缩编码方法,从压缩编码算法原理上可以分类为:(1)无损压缩编码种类·哈夫曼编码·算术编码·行程编码·Lempel zev编码(2)有损压缩编码种类·预测编码:DPCM,运动补偿·频率域方法:正文变换编码(如DCT),子带编码·空间域方法:统计分块编码·模型方法:分形编码,模型基编码·基于重要性:滤波,子采样,比特分配,矢量量化(3)混合编码·JBIG,H261,JPEG,MPEG等技术标准衡量一个压缩编码方法优劣的重要指标是:(1)压缩比要高,有几倍、几十倍,也有几百乃至几千倍;(2)压缩与解压缩要快,算法要简单,硬件实现容易;(3)解压缩的图像质量要好。
附件2:以硕士同等学力身份报考博士研究生初试及复试科目内容及参考书一、政治理论主要考核内容为自然辩证法。
参考书目:教育部社会科学研究与思想政治工作司主编,《自然辩证法概论》,高等教育出版社,2004年二、报考控制理论与控制工程专业1.计算机控制理论及应用预修课程:计算机原理、自动控制理论本课程为控制科学与工程学科研究生的学科基础课,同时也是其它学科研究生的专业基础课。
本课程研究计算机用于各类控制系统、数据采集系统的方法、基础理论与应用。
第一章计算机控制系统概述第二章过程通道和接口采样,量化,D/A,A/D,采样保持电路,通道构成。
第三章设计方法的理论基础拉氏变换,传递函数和响应,模拟PID调节器,Z变换,脉冲传递函数和离散系统响应,连续部件离散化,离散化方法,保持器。
第四章连续设计方法各种数字PID控制器,PID参数整定,数字滤波方法,数字控制器的实现。
第五章离散设计方法解析法-数字控制器的直接设计,最少拍响应,无波纹设计,有限拍响应,达林算法,修正Z变换。
第六章复杂规律的计算机控制系统设计模型算法控制,串级控制,前馈控制,多变量解耦控制。
第七章几个实例炉温控制,示教再现型液压驱动机械手最小拍控制,上臂假肢的微机控制,海蟹号六足步行机两级微机控制,交流喷漆机器人控制,中国剧院机械舞台计算机网络控制,两足仿生机器人的现场总线控制。
第八章多变量系统的状态空间法状态方程和输出方程,离散状态方程的解和脉冲传递函数矩阵,单变量的状态方程实现,离散系统的结构分析-可达性和可观测性,状态反馈和极点配置,状态观测器,闭环系统的解耦控制。
主要参考书:1.杜继宏,《计算机控制》,中国科学院研究生院,北京,1999。
2.李清泉,杜继宏,《计算机控制系统及应用》,机械工业出版社,北京,1988。
3.何克忠,郝忠恕,《计算机控制系统分析与设计》,清华大学出版社,北京,1988。
2.最优控制理论预修课程:常微分方程、矩阵代数教学目的和要求:本课程为控制科学与工程学科研究生的学科基础课,同时也是电气工程、电子科学与技术、信息与通信工程学科各专业研究生的专业基础课。