信息论编码例题
- 格式:doc
- 大小:359.00 KB
- 文档页数:13
信息论与编码试题集题目一:1. 请解释以下术语的含义:a) 信源熵b) 信源编码c) 香农定理d) 奈奎斯特准则e) 奇偶校验码2. 在一个二进制对称信道中,如果发送方发送的比特为0,接收方接收到的比特也为0的概率为0.9,发送方发送的比特为1,接收方接收到的比特也为1的概率为0.8。
请计算该信道的信道容量。
题目二:1. 在一个具有4个等概率输出符号的信源中,计算该信源的熵。
2. 一个典型的英文字母出现的概率如下:P(A) = 0.4, P(B) = 0.3, P(C) = 0.2, P(D) = 0.1。
请计算该信源的平均码长以及编码效率。
题目三:1. 请解释Huffman编码的原理及步骤。
2. 使用Huffman编码对以下信源的输出编码:A: 0.3,B: 0.2,C: 0.15,D: 0.1,E: 0.1,F: 0.05,G: 0.05,H: 0.05。
计算编码的平均码长和编码效率。
题目四:1. 请解释线性分组码和卷积码的区别。
2. 针对一个二进制码串11001011,使用以下生成矩阵计算该码串的卷积码:G = [1 1 0 1; 1 0 1 0]。
给出计算过程和最终编码结果。
题目五:1. 请解释码激励方法。
2. 针对一个码激励线性分组码,当收到的码字为101010时,给出该码字的输入和输出码字。
题目六:1. 请解释BCH编码的原理及应用场景。
2. 对一个BCH(n, k)码,当n=15,k=11时,请给出该BCH码的生成矩阵。
题目七:1. 请解释LDPC码以及LDPC码的译码方法。
2. 对于一个n=7,k=4的LDPC码,给出该LDPC码的校验矩阵。
题目八:1. 请比较分组密码与流密码的特点和应用场景。
2. 使用RC4流密码算法对明文"HELLO"进行加密,已知初始密钥为"KEY",给出加密后的密文。
题目九:1. 请解释区块密码与流密码的工作原理和区别。
信息论与编码题库及答案信息论是一门关于信息传输和处理的学科,主要研究信息的传输、存储与处理,以及在信息传输过程中可能产生的各种噪声和干扰。
信息论在近年来得到了广泛的应用,尤其在计算机科学、通信工程、数据处理以及加密技术等领域中得到了广泛应用。
作为信息处理学科的一个分支,编码学是信息论中重要的研究领域之一,主要研究在信息传输的过程中如何将信息进行编码,并在保证高可靠性的同时减少信息传输的开销。
现代编码学研究所涉及到的内容非常广泛,包括错误检测、纠正编码、信息压缩以及密码学等领域。
为了帮助广大信息与通信工程学习者更好地掌握编码理论及其应用,以下总结了一些编码学的题库及答案,供大家参考。
一、错误检测编码1. 什么是奇偶校验码?答:奇偶校验码是一种简单的错误检测编码方式,它采用了消息的一位奇偶性作为编码方式。
具体而言,对于一组位数固定的二进制数,在其中加入一个附加位,使得这组数的位数为偶数。
然后将这些二进制数按照某种规则排列,例如相邻的两位组成一组,计算每组中1的个数。
如果某组中1的个数是偶数,则附加位赋值为0,否则为1。
这样,如果在传输的过程中数据出现了单一位的错误,则会被检测出来。
2. 什么是海明编码?答:海明编码是一种通过添加校验位来实现错误检测和纠正的编码方式。
在海明编码中,校验位的数目为2的k次幂个,其中k 表示数据位中最大1的位置数。
具体而言,将原始信息看作一组二进制数,再将这些数按照某种规则排列,然后按照一定的算法计算出每个校验位的值,并将这些值添加到原始信息中。
在传输的过程中,如果发现了错误的位,则可以通过一系列错误检测和纠正的操作来确定和修复出错的信息位。
二、信息压缩编码1. 什么是霍夫曼编码?答:霍夫曼编码是一种基于无损数据压缩的编码方式,它的特点是可以将原始信息中出现最频繁的字符用最短的二进制码来表示,同时将出现次数较少的字符用较长的二进制码来表示。
具体来说,霍夫曼编码首先对原始信息中的字符进行统计,确定每个字符出现的频率。
1、有一个二元对称信道,其信道矩阵如下图所示。
设该信道以1500个二元符号/秒的速度传输输入符号。
现有一消息序列共有14000个二元符号,并设在这消息中P(0)=P(1)=1/2。
问从信息传输的角度来考虑,10秒钟内能否将这消息序列无失真地传送完?解答:消息是一个二元序列,且为等概率分布,即P(0)=P(1)=1/2,故信源的熵为H(X)=1(bit/symbol)。
则该消息序列含有的信息量=14000(bit/symbol)。
下面计算该二元对称信道能传输的最大的信息传输速率: 信道传递矩阵为:信道容量(最大信息传输率)为:C=1-H(P)=1-H(0.98)≈0.8586bit/symbol得最大信息传输速率为:Rt ≈1500符号/秒× 0.8586比特/符号 ≈1287.9比特/秒 ≈1.288×103比特/秒此信道10秒钟内能无失真传输得最大信息量=10× Rt ≈ 1.288×104比特 可见,此信道10秒内能无失真传输得最大信息量小于这消息序列所含有的信息量,故从信息传输的角度来考虑,不可能在10秒钟内将这消息无失真的传送完。
2、若已知信道输入分布为等概率分布,且有如下两个信道,其转移概率矩阵分别为:试求这两个信道的信道容量,并问这两个信道是否有噪声?1100.980.020.020.98P ⎡⎤=⎢⎥⎣⎦111122221111222212111122221111222200000000000000000000000000000000P P ⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦11222211122222log 4(00)1/()log 42/log 8(000000)2/(),H bit symbol H X bit symbol C C H bit symbol H X C =-===>=-==1解答:(1)由信道1的信道矩阵可知为对称信道故C 有熵损失,有噪声。
1、平均自信息为表示信源的平均不确定度,也表示平均每个信源消息所提供的信息量。
平均互信息表示从Y获得的关于每个X的平均信息量,也表示发X前后Y的平均不确定性减少的量,还表示通信前后整个系统不确定性减少的量。
2、最大离散熵定理为:离散无记忆信源,等概率分布时熵最大。
3、最大熵值为。
4、通信系统模型如下:5、香农公式为为保证足够大的信道容量,可采用(1)用频带换信噪比;(2)用信噪比换频带。
6、只要,当N足够长时,一定存在一种无失真编码。
7、当R<C时,只要码长足够长,一定能找到一种编码方法和译码规则,使译码错误概率无穷小。
8、在认识论层次上研究信息的时候,必须同时考虑到形式、含义和效用三个方面的因素。
9、1948年,美国数学家香农发表了题为“通信的数学理论”的长篇论文,从而创立了信息论。
按照信息的性质,可以把信息分成语法信息、语义信息和语用信息。
按照信息的地位,可以把信息分成客观信息和主观信息。
人们研究信息论的目的是为了高效、可靠、安全地交换和利用各种各样的信息。
信息的可度量性是建立信息论的基础。
统计度量是信息度量最常用的方法。
熵是香农信息论最基本最重要的概念。
事物的不确定度是用时间统计发生概率的对数来描述的。
10、单符号离散信源一般用随机变量描述,而多符号离散信源一般用随机矢量描述。
11、一个随机事件发生某一结果后所带来的信息量称为自信息量,定义为其发生概率对数的负值。
12、自信息量的单位一般有 比特、奈特和哈特 。
13、必然事件的自信息是 0 。
14、不可能事件的自信息量是 ∞ 。
15、两个相互独立的随机变量的联合自信息量等于 两个自信息量之和 。
16、数据处理定理:当消息经过多级处理后,随着处理器数目的增多,输入消息与输出消息之间的平均互信息量 趋于变小 。
17、离散平稳无记忆信源X 的N 次扩展信源的熵等于离散信源X 的熵的 N 倍 。
18、离散平稳有记忆信源的极限熵,=∞H )/(lim 121-∞→N N N X X X X H 。
信息论与编码题库信息论与编码模拟题⼀、填空题1、已知 8 个码组为(000000)、(001110)、(010101)、(011011)、(100011)、(101101)、(110110)、(111000)。
则该码组的最⼩码距是 3 ,若只⽤于检错可检测 2 位错码,若只⽤于纠错可纠正 1 位错码。
2、同时掷两个正常的骰⼦,也就是各⾯呈现的概率都是 1/6,则“两个 1 同时出现”这⼀事件的⾃信息量为 5.17 ⽐特。
3、已知信源的各个符号分别为字母A ,B ,C ,D ,现⽤四进制码元表⽰,每个码元的宽度为10ms ,如果每个符号出现的概率分别为1/5,1/4,1/4,3/10,则信源熵H (x )为 1.985 ⽐特/符号,在⽆扰离散信道上的平均信息传输速率为 198 bit/s 。
4.1948 年,美国数学家⾹农发表了题为“通信的数学理论”的长篇论⽂,从⽽创⽴了信息论。
5.对离散⽆记忆信源来说,当信源呈____________分布情况下,信源熵取最⼤值。
6、对于某离散信道,具有3 x 5的转移矩阵,矩阵每⾏有且仅有⼀⾮零元素,则该信道噪声熵为;最⼤信息传输率为。
7、⼆元删除信道BEC(0.01)的信道转移矩阵为,信道容量为;信道矩阵为100001010001010??的DMC 的信道容量为。
8.数据处理定理:当消息经过多级处理后,随着处理器数⽬的增多,输⼊消息与输出消息之间的平均互信息量趋于变⼩。
9.(7,3)码监督矩阵有 4 ⾏,⽣成矩阵有 3 ⾏。
10.对线性分组码,若要求它能纠正3个随机差错,则它的最⼩码重为 7 ,若要求它能在纠错2位的同时检错3位,则它的最⼩码重为 8。
11.汉明码是⼀种线性分组码,其最⼩码距为 3 。
12.信道编码的⽬的是提⾼数字信息传输的可靠性 ,其代价是降低了信息传输的有效性。
13.在通信系统中,纠检错的⼯作⽅式有反馈重发纠错、前向纠错、混合纠错等。
14.离散对称信道输⼊等概率时,输出为( 等概)分布。
一、概念简答题(每题5分,共40分)二、1.什么是平均自信息量与平均互信息,比较一下这两个概念的异同?平均自信息为:表示信源的平均不确定度,表示平均每个信源消息所提供的信息量。
平均互信息:表示从Y获得的关于每个X的平均信息量;表示发X前后Y的平均不确定性减少的量;表示通信前后整个系统不确定性减少的量。
2.简述最大离散熵定理。
对于一个有m个符号的离散信源,其最大熵是多少?最大离散熵定理为:离散无记忆信源,等概率分布时熵最大。
最大熵值为3.解释信息传输率、信道容量、最佳输入分布的概念,说明平均互信息与信源的概率分布、信道的传递概率间分别是什么关系?信息传输率R指信道中平均每个符号所能传送的信息量。
信道容量是一个信道所能达到的最大信息传输率。
信息传输率达到信道容量时所对应的输入概率分布称为最佳输入概率分布。
平均互信息是信源概率分布的∩型凸函数,是信道传递概率的U型凸函数。
4.对于一个一般的通信系统,试给出其系统模型框图,并结合此图,解释数据处理定理。
数据处理定理为:串联信道的输入输出X、Y、Z组成一个马尔可夫链,且有,。
说明经数据处理后,一般只会增加信息的损失。
5.写出香农公式,并说明其物理意义。
当信道带宽为5000Hz,信噪比为30dB时求信道容量。
香农公式为,它是高斯加性白噪声信道在单位时间内的信道容量,其值取决于信噪比和带宽。
6.由得,则7.解释无失真变长信源编码定理。
只要,当N足够长时,一定存在一种无失真编码。
8.解释有噪信道编码定理。
答:当R<C时,只要码长足够长,一定能找到一种编码方法和译码规则,使译码错误概率无穷小。
9.10.8.什么是保真度准则?对二元信源,其失真矩阵,求a>0时率失真函数的和?答:1)保真度准则为:平均失真度不大于允许的失真度。
11.2)因为失真矩阵中每行都有一个0,所以有,而。
二、综合题(每题10分,共60分)1.黑白气象传真图的消息只有黑色和白色两种,求:1)黑色出现的概率为0.3,白色出现的概率为0.7。
1.按发出符号之间的关系来分,信源可以分为(有记忆信源)和(无记忆信源)2.连续信源的熵是(无穷大),不再具有熵的物理含义。
3.对于有记忆离散序列信源,需引入(条件熵)描述信源发出的符号序列内各个符号之间的统计关联特性3.连续信源X,平均功率被限定为P时,符合(正态)分布才具有最大熵,最大熵是(1/2ln(2 ⅇ 2))。
4.数据处理过程中信息具有(不增性)。
5.信源冗余度产生的原因包括(信源符号之间的相关性)和(信源符号分布的不均匀性)。
6.单符号连续信道的信道容量取决于(信噪比)。
7.香农信息极限的含义是(当带宽不受限制时,传送1bit信息,信噪比最低只需-1.6ch3)。
8.对于无失真信源编码,平均码长越小,说明压缩效率(越高)。
9.对于限失真信源编码,保证D的前提下,尽量减少(R(D))。
10.立即码指的是(接收端收到一个完整的码字后可立即译码)。
11.算术编码是(非)分组码。
12.游程编码是(无)失真信源编码。
13.线性分组码的(校验矩阵)就是该码空间的对偶空间的生成矩阵。
14.若(n,k)线性分组码为MDC码,那么它的最小码距为(n-k+1)。
15.完备码的特点是(围绕2k个码字、汉明矩d=[(d min-1)/2]的球都是不相交的每一个接受吗字都落在这些球中之一,因此接收码离发码的距离至多为t,这时所有重量≤t的差错图案都能用最佳译码器得到纠正,而所有重量≤t+1的差错图案都不能纠正)。
16.卷积码的自由距离决定了其(检错和纠错能力)。
(对)1、信息是指各个事物运动的状态及状态变化的方式。
(对)2、信息就是信息,既不是物质也不是能量。
(错)3、马尔可夫信源是离散无记忆信源。
(错)4、不可约的马尔可夫链一定是遍历的。
(对)5、单符号连续信源的绝对熵为无穷大。
(错)6、序列信源的极限熵是这样定义的:H(X)=H(XL|X1,X2,…,XL-1)。
(对)7、平均互信息量I(X;Y)是接收端所获取的关于发送端信源X的信息量。
一、(11’)填空题(1)1948年,美国数学家香农发表了题为“通信的数学理论”的长篇论文,从而创立了信息论。
(2)必然事件的自信息是 0 。
(3)离散平稳无记忆信源X的N次扩展信源的熵等于离散信源X的熵的 N倍。
(4)对于离散无记忆信源,当信源熵有最大值时,满足条件为__信源符号等概分布_。
(5)若一离散无记忆信源的信源熵H(X)等于2.5,对信源进行等长的无失真二进制编码,则编码长度至少为 3 。
(6)对于香农编码、费诺编码和霍夫曼编码,编码方法惟一的是香农编码。
(7)已知某线性分组码的最小汉明距离为3,那么这组码最多能检测出_2_______个码元错误,最多能纠正___1__个码元错误。
(8)设有一离散无记忆平稳信道,其信道容量为C,只要待传送的信息传输率R__小于___C(大于、小于或者等于),则存在一种编码,当输入序列长度n足够大,使译码错误概率任意小。
(9)平均错误概率不仅与信道本身的统计特性有关,还与___译码规则____________和___编码方法___有关三、(5')居住在某地区的女孩中有25%是大学生,在女大学生中有75%是身高1.6米以上的,而女孩中身高1.6米以上的占总数的一半。
假如我们得知“身高1.6米以上的某女孩是大学生”的消息,问获得多少信息量?解:设A表示“大学生”这一事件,B表示“身高1.60以上”这一事件,则P(A)=0.25 p(B)=0.5 p(B|A)=0.75 (2分)故 p(A|B)=p(AB)/p(B)=p(A)p(B|A)/p(B)=0.75*0.25/0.5=0.375 (2分)I(A|B)=-log0.375=1.42bit (1分)四、(5')证明:平均互信息量同信息熵之间满足I(X;Y)=H(X)+H(Y)-H(XY)证明:()()()()()()()()()()Y X H X H y x p y x p x p y x p x p y x p y x p Y X I X X Y j i j i Y i j i XYi j i j i -=⎥⎦⎤⎢⎣⎡---==∑∑∑∑∑∑log log log; (2分)同理()()()X Y H Y H Y X I -=; (1分) 则()()()Y X I Y H X Y H ;-= 因为()()()X Y H X H XY H += (1分) 故()()()()Y X I Y H X H XY H ;-+=即()()()()XY H Y H X H Y X I -+=; (1分)五、(18’).黑白气象传真图的消息只有黑色和白色两种,求:1) 黑色出现的概率为0.3,白色出现的概率为0.7。
例 题例1 简述最大离散熵定理。
对于一个有m 个符号的离散信源,其最大熵是多少? 解:最大离散熵定理为:离散无记忆信源,等概率分布时熵最大。
最大熵值为m H 2max log =。
例2 什么是平均自信息(信息熵)?什么是平均互信息?比较一下两个概念的异同之处。
解:平均自信息为∑-=iiix p x p X H )(log )()(表示信源的平均不确定度,也表示平均每个信源消息所提供的信息量。
平均互信息为)()|(log)();(i j i ij i jx p y x p y x p Y X I ∑∑=表示从Y 获得的关于每个X 的平均信息量,也表示发X 前后Y 的平均不确定性减少的量,还表示通信前后整个系统不确定性减少的量。
例3 解释等长信源编码定理和无失真变长信源编码定理,说明对于等长码和变长码,最佳码的每符号平均码长最小为多少?编码效率最高可达多少? 解:等长信源编码定理:对于任意ε>0,δ>0,只要ε+≥)(log X L LH m LK ,则当L 足够长时必可使译码差错<δ。
变长信源编码定理:只要1log )(log )(+<≤mX H K m X H ,一定存在一种无失真编码。
等长码和变长码的最小平均码长均为mX H log )(,编码效率最高可达100%。
例4 解释最小错误概率译码准则,最大似然译码准则和最小距离译码准则,说明三者的关系。
解:最小错误概率译码准则下,将接收序列译为后验概率最大时所对应的码字。
最大似然译码准则下,将接收序列译为信道传递概率最大时所对应的码字。
最小距离译码准则下,将接收序列译为与其距离最小的码字。
三者关系为:输入为等概率分布时,最大似然译码准则等效于最小错误概率译码准则。
在二元对称无记忆信道中,最小距离译码准则等效于最大似然译码准则。
例5 什么是保真度准则?对二元信⎥⎦⎤⎢⎣⎡-=⎥⎦⎤⎢⎣⎡p p X P X 110)(源,其失真矩阵⎥⎦⎤⎢⎣⎡=00a a D ,求0>a a >0时率失真函数的min D 和max D ?解:1)保真度准则为:平均失真度不大于允许的失真度。
(一)一、判断题.1. 当随机变量X 和Y 相互独立时,条件熵)|(Y X H 等于信源熵)(X H . ( )2. 由于构成同一空间的基底不是唯一的,所以不同的基底或生成矩阵有可能生成同一码集. ( )3.一般情况下,用变长编码得到的平均码长比定长编码大得多. ( )4. 只要信息传输率大于信道容量,总存在一种信道编译码,可以以所要求的任意小的误差概率实现可靠的通信. ( )5. 各码字的长度符合克拉夫特不等式,是唯一可译码存在的充分和必要条件. ( )6. 连续信源和离散信源的熵都具有非负性. ( )7. 信源的消息通过信道传输后的误差或失真越大,信宿收到消息后对信源存在的不确 定性就越小,获得的信息量就越小.8. 汉明码是一种线性分组码. ( ) 9. 率失真函数的最小值是0. ( ) 10.必然事件和不可能事件的自信息量都是0. ( ) 二、填空题1、码的检、纠错能力取决于 .2、信源编码的目的是 ;信道编码的目的是 .3、把信息组原封不动地搬到码字前k 位的),(k n 码就叫做 .4、香农信息论中的三大极限定理是 、 、 .5、设信道的输入与输出随机序列分别为X 和Y ,则),(),(Y X NI Y X I N N =成立的 条件 .6、对于香农-费诺编码、原始香农-费诺编码和哈夫曼编码,编码方法惟一的是 .7、某二元信源01()1/21/2X P X ⎡⎤⎧⎫=⎨⎬⎢⎥⎣⎦⎩⎭,其失真矩阵00a D a ⎡⎤=⎢⎥⎣⎦,则该信源的max D = .三、计算题.1、某信源发送端有2种符号i x )2,1(=i ,a x p =)(1;接收端有3种符号i y )3,2,1(=j ,转移概率矩阵为1/21/201/21/41/4P ⎡⎤=⎢⎥⎣⎦.(1)计算接收端的平均不确定度()H Y ;(2) 计算由于噪声产生的不确定度(|)H Y X ; (3) 计算信道容量以与最佳入口分布.(二)一、填空题1、信源编码的主要目的是 ,信道编码的主要目的是 。
平均互信息的物理意义(1)Y 对X 的平均互信息)/(log )()/()/()()/(1log )()(1log )()()/(log )();()();(21121121121111j i n i mj j i j i n i mj j i i ni mj j i i j i n i mj j i j i n i m j j i y x p y x p Y X H Y X H X H y x p y x p x p y x p x p y x p y x p y x I y x p Y X I ∑∑∑∑∑∑∑∑∑∑==========-=-=-===其中条件熵:* Y 对X 的平均互信息是对Y 一无所知的情况下,X 的先验不定度与收到Y 后关于X 的后验不定度之差,即收到Y 前、后关于X 的不确定度减少的量。
H(X/Y)表示收到随机变量Y 后,对随机变量X 仍然存在的不确定度,这是Y 关于X 的后验不定度,通常称它为信道疑义度或损失熵(代表了在信道中损失的信息) (2)X 对Y 的平均互信息* X 对Y 的平均互信息是Y 的先验不定度与发出X 后关于Y 的后验不定度之差,即发X 前、后关于Y 的不确定度减少的量。
H(Y/X)表示发出随机变量X 后,对随机变量Y 仍然存在的平均不确定度,常被称为噪声熵。
(3) Y 对X 的平均互信息 )/(log )()/()/()()/(1log )()(1log )()()/(log )();()();(21121121121111i j ni mj j i i j n i m j j i i ni mj j i j i j n i mj j i i j n i m j j i x y p y x p X Y H X Y H Y H x y p y x p y p y x p y p x y p y x p x y I y x p X Y I ∑∑∑∑∑∑∑∑∑∑==========-=-=-===其中条件熵:)(log )()()()()()(1log )()(1log )()(1log )()()()(log )();()();(21121121121121111j i ni mj j i j i n i mj j i j n i mj j i i ni mj j i j i j i n i mj j i j i n i m j j i y x p y x p XY H XY H Y H X H y x p y x p y p y x p x p y x p y p x p y x p y x p y x I y x p Y X I ∑∑∑∑∑∑∑∑∑∑∑∑============-=-+=-+===其中联合熵:* 信道两端随机变量X ,Y 之间的平均互信息量等于通信前、后整个系统不确定度减少的量。
联合熵表示输入随机变量X ,经信道传输到达信宿,输出随机变量Y ,即收发双方通信后,整个系统仍然存在的不确定度。
如果在通信前,我们把X ,Y 看成是两个独立的随机变量,那么通信前,整个系统的先验不定度即X 和Y 的联合熵等于H(X)+H(Y);通信后,我们把信道两端同时出现X 和Y 看成是由信道的传递统计特性联系起来的具有一定统计关联关系的两个随机变量,这时整个系统的后验不定度由H(XY)描述。
[例2.1.5]将已知信源⎭⎬⎫⎩⎨⎧=⎥⎦⎤⎢⎣⎡5.05.0)(21x x X P X 接到下图所示的信道上,求在该信道上传输的平均互信息量I(X;Y)、疑义度H(X/Y)、噪声熵H(Y/X)和联合熵H(XY)。
1x 0.98 1y0.020.22x 0.8 2y解:(1)由),/()()(i j i j i x y p x p y x P =求出各联合概率:49.098.05.0)/()()(11111=⨯==x y p x p y x p 01.002.05.0)/()()(12121=⨯==x y p x p y x p 10.020.05.0)/()()(21212=⨯==x y p x p y x p 40.080.05.0)/()()(22222=⨯==x y p x p y x p(2)由,)()(1∑==ni j i j y x P y P 得到Y 集各消息概率:=)(1y p 59.010.049.0)()()(1211211=+=+=∑=y x p y x p y x P i i41.059.01)(1)(12=-=-=y p y p(3)由)()()/(j j i j i y p y x p y x p =,得到X 的各后验概率:831.059.049.0)()()/(11111===y p y x p y x p169.0)/(1)/(1112=-=y x p y x p同样可推出976.0)/(,024.0)/(2221==y x p y x p(4))/(1}5.0log 5.05.0log 5.0{)(log )()(22212符号比特=+-=-=∑=i i i x p x p X H}41.0log 41.059.0log 59.0{)(log )()(22212+-=-=∑=i i i y p y p Y H=0.98(比特/符号))(log )()(211j i n i mj j i y x p y x p XY H ∑∑==-=}40.0log 40.010.0log 10.001.0log 01.049.0log 49.0{2222+++-== 1.43(比特/符号) (5)平均互信息符号)比特/(55.043.198.01)()()();(=-+=-+=XY H Y H X H Y X I(6)疑义度∑∑==-=21212)/(log )(/i j j i j i y x p y x p Y X H )(}976.0log 40.0169.0log 10.0024.0log 01.0831.0log 49.0{2222+++-= 符号)比特/(45.0=(7)噪声熵∑∑==-=21212)/(log )(/i j i j j i x y p y x p X Y H )(}80.0log 40.020.0log 10.002.0log 01.098.0log 49.0{2222+++-= 符号)比特/(43.0=◆平均互信息的性质-非负性 先前考虑两个具体消息j i y x 和之间的互信息量);(j i y x I 时,可能出现负值。
而平均互信息量不是从两个具体消息出发,而是从随机变量X 和Y 的整体角度出发,并在平均意义上观察问题,所以平均互信息量不会出现负值。
);(0log )()()(log )()()(log 1)()()()()()()(log )()()()(log )();(2111121111211211211≥=⎥⎦⎤⎢⎣⎡-=⎥⎦⎤⎢⎣⎡-=⎥⎥⎦⎤⎢⎢⎣⎡-≤=-=-∑∑∑∑∑∑∑∑∑∑∑∑∑∑==============Y X I ey x p y p x p e y x p y p x p e y x p y p x p y x p y x p y p x p y x p y p x p y x p y x p Y X I m j n i m j j i j n i i mj ni mj j i j i n i j i j i ni mj j i j i j i ni mj j i j i j i ni mj j i 即 当且仅当X 和Y 相互独立时,等号成立。
◆凸函数性)/()()/(log )/()()()/(log )();(1211211i jni ii j i jni mj ij i j n i mj jix yp x p x y p x yp x p y p x y p yx p Y X I ∑∑∑∑∑=======显然平均互信息是信源概率分布),,2,1)((n i x p i =和表示输入输出之间关系的条件概率或称信道传递概率分布),,2,1;,,2,1)(/(m j n i x y p i j ==的函数。
若固定信道,调整信源:)]([);(i x p f Y X I =若固定信源,调整信道:)]/([);(i j x y p f Y X I =(1)平均互信息是输入信源概率分布)(i x p 的上凸函数所谓上凸函数,是指同一信源集合},,{21n x x x ,对应两个不同的概率分布)(1i x p 和),,2,1)((2n i x p i =,若有小于1的正数10<<α,使不等式)]([)1()]([)]()1()([2121i i i i x p f x p f x p x p f αααα-+≥-+成立,则称函数f为)(i x p 的上凸函数。
令)()1()()(213i i i x p x p x p αα-+=,因)(3i x p 是)(1i x p 和)(2i x p 的线性组合,)(3i x p 构成一个新的概率分布(参见上节熵的上凸性的证明)。
当固定信道特性为)/(0i j x y p 时,由)(3i x p 确定的平均互信息为∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑===============-++-+---+-=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡-+-+-=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡-+-+=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=-+=n i mj i j i j i in i mj j j i j i ni mj j j i j i n i mj i j n i i j i i i j i i n i m j ni i j i i i j i j i i n i m j ni i j i i j i j i i i i x y p x y p x px p y p y p x y p x p y p y p x y p x p x y p x y p x p x p x y p x p x p x y p x p x p x y p x y p x p x p x y p x p x y p x y p x p x p x p f x p I 1102021112120211212011101021202111102102021111030203213)/(log )/()]()1()([)]()1()([log )/()()1()]()1()([log )/()()/()/()]()1()([log )/()]()1()([)/()]()1()([)/(log )/()]()1()([)/()()/(log )/()()]()1()([)]([αααααααααααααααααα根据熵的极值性∑∑==-≥-n i ni i i i i x p x p x q x p 1122)(log )()(log )(有)(log )()]()1()([log )/()()(log )()]()1()([log )/()(2212121210212111212101j mj j mj j j n i i j i j mj j mj j j n i i j i y p y p y p y p x y p x p y p y p y p y p x y p x p ∑∑∑∑∑∑======-≥-+⎥⎦⎤⎢⎣⎡--≥-+⎥⎦⎤⎢⎣⎡-αααα代入上式有)]([)1()]([)()/(log )/()()1()()/(log )/()()/(log )/()]()1()([)(log )()1()(log )()]([21112020211102011102021112221213i i ni mj j i j i j i ni mj j i j i j i n i mj i j i jiim j mj j j j j i x p I x p I y p x y p x y p x p y p x y p x y p x p x y p x yp x p x p y p y p y p y p x p I αααααααα-+=-+=-++---≥∑∑∑∑∑∑∑∑========仅当)(3i x p =)(1i x p =)(2i x p 时,等号成立,一般情况下)]([)1()]([)]([213i i i x p I x p I x p I αα-+>(2)平均互信息是信道转移概率)/(i j x y p 的下凸函数固定信源)(i x p ,通过调整信道)/(i j x y p 而得;即有两个不同的信道特性)/(1i j x y p 和)/(2i j x y p 将信道两端的输入和输出即X 和Y 联系起来,如果用小于1的正数10<<α对)/(1i j x y p 和)/(2i j x y p 进行线性组合,得到信道特性:)/()-(1 )/()/(213i j i j i j x y p x y p x y p αα+=。