第5章限失真信源编码
- 格式:ppt
- 大小:3.48 MB
- 文档页数:75
第5章 有失真信源编码(信息率失真函数)离散信源有失真编码 连续信源有失真编码5.1信息率-失真函数的概念在第2章我们证明了当输入随机变量的概率分布确定时,互信道是条件转移概率的下凸函数,即互信息必存在一个最小值。
然而,在没有其它约束条件的情况下,这个最小值就是零。
因为一方面互信息总是非负的,另一方面,当输入和输出随机变量相互独立时互信息等于零。
所以研究一般情况下互信息的极小值问题没有什么意义。
无失真信源编码时,信源的熵是信息率所能达到的下限。
在很多实际情况下,要做到完全没有失真是没有必要的,特别是对连续信源编码,由于信源的绝对熵无穷大,要达到无失真编码是不可能的。
为此,我们有必要研究在满足某种失真准则下互信息的极小值问题,即信息率-失真函数。
首先看离散信源的情况。
设X和Y是定义在相同取值域},,,{21n a a a B A ==上的离散型随机变量。
失真函数d(x,y) 是定义在B A ⨯上的非负函数B y A x y Y x X d y x d ∈∈===,),,(),(例如,可定义⎩⎨⎧≠===j i j i a a d j i d j i ,,0),(),(α(5.1.1)其物理意义是当输入和输出相等时没有失真,当输入和输出不相等时失真是相同的。
显然失真函数d(x,y)是对Y代表X所引起失真的量度。
失真函数的定义由所研究的客观问题决定。
(5.1.1)式的失真函数称为汉明失真准则。
失真函数只定义了若干具体失真的数值,为了反映随机变量之间的总体失真情况,我们定义平均失真[]),(y x d E d =(5.1.2)对离散型变量∑∑=ijj i d i j p i p ),()|()( (5.1.3)如果X和Y都是L维随机矢量,可定义矢量间的失真为∑==Ll l l L y x d L Y X d 1),(1),((5.1.4)平均失真[]∑∑=====L l Ll ll l L L d L y x d E L Y X d E d 111)],([1),((5.1.5)其中l d 是第l 个分量的平均失真。
第五章无失真信源编码定理与编码5.1.1 信源编码和码的类型1.信源编码2.码的类型若码符号集中符号数r=2称为二元码,r=3称为三元码,……,r元码。
若分组码中所有码字的码长都相同则称为等长码,否则称为变长码。
若分组码中所有码字都不相同则称为非奇异码,否则称为奇异码。
若每个码符号x i∈X的传输时间都相同则称为同价码,否则称为非同价码。
若分组码的任意一串有限长的码符号只能被唯一地译成所对应的信源符号序列则称为唯一可译码,否则称为非唯一可译码。
若分组码中,没有任何完整的码字是其他码字的前缀,则称为即时码(又称非延长码或前缀条件码),否则称为延长码。
本章主要研究的是同价唯一可译码.5.1.2 即时码及其树图构造法即时码(非延长码或前缀条件码)是唯一可译码的一类子码。
即时码可用树图法来构造。
构造的要点是:(1)最上端为树根A,从根出发向下伸出树枝,树枝总数等于r,树枝的尽头为节点。
(2)从每个节点再伸出r枝树枝,当某节点被安排为码字后,就不再伸枝,这节点为终端节点。
一直继续进行,直至都不能伸枝为止。
(3)每个节点所伸出的树枝标上码符号,从根出发到终端节点所走路径对应的码符号序列则为终端节点的码字。
即时码可用树图法来进行编码和译码。
从树图可知,即时码可以即时进行译码。
当码字长度给定,即时码不是唯一的。
可以认为等长唯一可译码是即时码的一类子码。
5.1.3 唯一可译码存在的充要条件(1)对含有q个信源符号的信源用含r个符号的码符号集进行编码,各码字的码长为l1,l2,…,l q的唯一可译码存在的充要条件是,满足Kraft不等式5.1.4 唯一可译码的判断法唯一可译码的判断步骤:首先,观察是否是非奇异码.若是奇异码则一定不是唯一可译码。
其次,计算是否满足Kraft不等式。
若不满足一定不是唯一可译码。
再次,将码画成一棵树图,观察是否满足即时码的树图的构造,若满足则是唯一可译码。
或用Sardinas和Patterson设计的判断方法:计算出分组码中所有可能的尾随后缀集合F,观察F中有没有包含任一码字,若无则为唯一可译码;若有则一定不是唯一可译码.上述判断步骤中Sardinas和Patterson设计的判断方法是能确切地判断出是否是唯一可译码的方法,所以可以跳过前三个步骤直接采用该判断法。