信息论基础理论与应用第三版傅祖芸第5章讲义

《信息论》第五章

(1)
=1 3
7
结论:错误概率不仅与信道的统计特性有关,而且与译结论:错误概率不仅与信道的统计特性有关, 码规则有关. 码规则有关. 我们来定义译码规则设信道的输入符号集为X =1, 设信道的输入符号集为X={ ai},i =1,2,…,r ; 输出符号集为Y =1, 输出符号集为Y= {bj},j =1,2,…,s. 制定译码规则就是设计一个单值函数F ),它对于制定译码规则就是设计一个单值函数F(bj),它对于每一个输出符号b 确定一个唯一的输入符号a 每一个输出符号bj确定一个唯一的输入符号ai与其对应 . F(bj)= ai 即 i =1,2,…,r =1, j =1,2,…,s =1, 种译码规则可供选择. 注:对于同一有噪信道共有 r s 种译码规则可供选择.
15
编码1 编码1:将每个码元重复三次纠正任一位上的错误设码字记为 (c8c7c6c5c4c3c2c1c0 ) 由编码方法知
c8 = c7 = c6 c5 = c4 = c3 c2 = c1 = c0
纠错: c c 位出错. 纠错:如果 8 = c6 ≠ c7,则 7位出错.在同一组中以相同二 — ( ). 元数多的为正确 — — —大数判决法择多译码"规则 "择多译码"
3×10-4 2×10-2 2.23×10-2 7.8×10-4 3×10-2 × × × × ×
14
错误概率与编码方法
重复发送——大数判决规则重复发送——大数判决规则信息数据 000 001 010 011 100 101 110 111 编码1 编码1 000000000 000000111 000111000 000111111 111000000 111000111 111111000 111111111 编码2 编码2 000000000 001001001 010010010 011011011 100100100 101101101 110110110 111111111

信息论基础理论与应用第三版傅祖芸113页PPT

END
16、业余生活要有意义，不要越轨。——华盛顿 17、一个人即使已登上顶峰，也仍要自强不息。——罗素·贝克 18、最大的挑战和突破在于用人，而用人最大的突破在于信任人。——马云 19、自己活着，就是为了使别人过得更美好。——雷锋 20、要掌握书，莫被书掌握；要为生而读，莫为读而生。——布尔沃
信息论基础理论与应用第三版傅祖芸
16、人民应该为法律而战斗，就像为了城墙而战斗一样。 ——赫拉克利特 17、人类对于不公正的行为加以指责，并非因为他们愿意做出这种行为，而是惟恐自己会成为这种行为的牺牲者。—— 柏拉图 18、制定法律法令，就是为了不让强者做什么事都横行霸道。— —奥维德 19、法律是社会的习惯和思想的结晶。—— 托·伍·威尔逊 20、人们嘴上挂着的法律，其真实含义是财富。— —爱献生

信息论第5章-1

log m K log m
L
K log m

K log m
22
二元编码：编码效率=编码后的信息传输率
定长编码
基本源编码：
对单个符号X进行编码， X∈{x1 ,x2 ,…, xn}，输入符号总共有 n 种若对信源进行定长编码 Ki=K，实现无失真编码 (存在唯一可译码)的条件——Kraft不等式
码表码0 00 01 10 11 码1 0 11 00 11 码2 0 10 00 01 码3 1 10 100 1000 码4 1 01 001 0001
11
信源符号 x1 x2 x3 x4
码的分类
奇异码 → 非唯一可译码
非奇异码中既有唯一可译码也有非唯一可译码
等长码：非奇异 → 唯一可译码变长码：任意N次扩展码（ N ≥ 1）均为非奇异码
第五章
信源编码
信源编码
5.1 信源编码的定义 5.2 无失真信源编码 5.3 限失真信源编码
5.4 常用信源编码方法简介
2
信源编码
5.1 信源编码的定义 5.2 无失真信源编码 5.3 限失真信源编码
5.4 常用信源编码方法简介
3
信源编码的定义
例：英文电报信源符号X={a,b,c…z,空格符,…}，n=32。数字信道只允许{0, 1}两种状态的信号，因此为了在数字信道中传输，需要对信源符号进行编码
i i
i
码元符号/信源符号
L长符号序列编码： K K L L
p(x ) K
i i
Li
L
码元符号 /信源符号
编码后的信息传输率R：编码后平均每个码元传送的信息量 H L ( X) H(X )

信息论基础理论与应用第三版(傅祖芸) 第5章讲义

l H ( S ) 2 N log r
则不可能实现无失真编码，当N趋向于无穷大时，译码错误率接近于1。
•分析：定理中的条件式可写成
l log r NH (S )
左边: 长为 l 的码符号（码字）所能载荷的最大信息量；右边: 长为N的信源符号序列平均携带的信息量。因此，定理说明了：只要码字传输的最大信息量大于信源序列携带的信息量，则可以实现无失真编码。
第5章无失真信源编码定理
5.1 编码器 5.2 等长码 5.4 等长信源编码定理 5.5 变长码 5.6 变长信源编码定理
引言
信息通过信道传输到信宿的过程。要做到既不失真又快速地通信，需要解决两个问题：信源编码: 在不失真或允许一定失真条件下，提高信息传输率. 信道编码: 在信道受到干扰的情况下，增加信号的抗干扰能力，同时又使得信息传输率最大.
信源符号
码字
00: W1W1=B1
001:W1W2=B2 0001:W1W3=B3 0111:W1W4=B4
信源符号
码字
010:W2W1=B5
信源符号
码字
α1
α2 α3 α4
α5
：：：
：
：： α16
：
：：
111111:W4W4=B16
：：：
6、唯一可译码(单义可译码）
由码构成的任意一串有限长的码符号序列只能被唯一的译成所对应的信源符号序列。否则,就为非惟一可译码或非单义可译码。

最佳编码：一般来说，抗干扰能与信息传输率二者相互矛盾。而编码定理理论上证明，至少存在某种最佳的编码能够解决上述矛盾，做到既可靠又有效地传输信息。信源编码：信源虽然多种多样，但无论是哪种类型的信源，信源符号之间总存在相关性和分布的不均匀性，使得信源存在冗余度。信源编码的目的就是要减少冗余，提高编码效率。

《信息论》—基础理论与应用(傅祖芸)课后答案

X a1 = 0 a 2 = 1 a 3 = 2 a 4 = 3 【 2.5 】设离散无记忆信源，其发出的消息为 = 1/ 4 1/ 4 1/ 8 P ( x) 3 / 8 （202120130213001203210110321010021032011223210），求（1）此消息的自信息是多少？（2）在此消息中平均每个符号携带的信息量是多少？解：信源是无记忆的，因此，发出的各消息之间是互相独立的，此时发出的消息的自信息即为各消息的自信息之和。根据已知条件，发出各消息所包含的信息量分别为： I (a 0 = 0) = log 8 = 1.415 比特 3
本页已使用福昕阅读器进行编辑。福昕软件（Ｃ）２００５－２０１０，版权所有，仅供试用。
即函数 f ( x ) 为减函数，因此有 f (0) ≥ f (ε ) ，即 ( p1 − ε ) log( p1 − ε ) + ( p 2 + ε ) log( p 2 + ε ) ≤ p1 log p1 + p 2 log p 2 因此 H ( X ) ≤ H ( X ′) 成立。【解释】当信源符号的概率趋向等概率分布时，不确定性增加，即信息熵是增加的。【2.11】试证明：若 ∑ pi = 1 ， ∑ q j = p L ，则
本页已使用福昕阅读器进行编辑。福昕软件（Ｃ）２００５－２０１０，版权所有，仅供试用。
P( A | B) =
P( AB) P( A) P( B | A) 0.25 × 0.75 = = = 0.375 P( B) P( B) 0.5
已知该事件所能获得的信息量为 I = log 1 ≈ 1.415 比特 0.375
问女同志回答“否”所获昨的信息量为： I = log 1 ≈ 7.23 × 10 −3 比特/符号 0.995

信息论与编码理论基础(第五章)

2012-5-10
15
两种典型的译码规则
[解答最佳译码判决指的是最大后验概率译码。记(Q(x1), Q(x2), 解答] 最佳译码判决指的是最大后验概率译码。解答 Q(x3))信道的输入随机变量的概率向量，又称为先验概率向信道的输入随机变量X的概率向量信道的输入随机变量的概率向量，为信道的输出随机变量Y的分布概率量， (W(y1), W(y2), W(y3))为信道的输出随机变量的分布概率为信道的输出随机变量向量。则向量。 (Q(x1), Q(x2), Q(x3))=(1/2,1/4, 1/4)，，
2012-5-10
20
两种典型的译码规则
2012-5-10 7
k0长信息段信息段纠错编码器
n0长码段
• (n0, k0)卷积码 (Convolutional codes)：各分组卷积码：相关，约束长度L为相关，约束长度为(m+1) k0
….
n0长码段
(N, L)分组码 (Block codes)：分组之间独立，分组码：分组之间独立，约束长度L为约束长度为k0
2012-5-10
3
11
译码规则
例：有一个离散信道，其转移概率矩阵P为
根据该转移概率矩阵可以设计一个译码规则A如上; 也可以设计一个译码规则B如下：
2012-5-10
12
译码规则
制定译码规则就是设计一个函数它对于每一个输出符号确定一个唯一的输入符号与其对应。号确定一个唯一的输入符号与其对应。若信道有r个输入符号，s个输出符号，则共有多少种若信道有个输入符号，个输出符号个输入符号个输出符号，译码规则？译码规则？由于s个输出符号中的每一个都可以翻译成个输入符由于个输出符号中的每一个都可以翻译成r个输入符个输出符号中的每一个都可以翻译成号中的任何一个，所以共有r 种译码规则可供选择。号中的任何一个，所以共有 s种译码规则可供选择。译码规则的选择应该根据什么准则？译码规则的选择应该根据什么准则？一个很自然的准则当然就是要使错误概率为最小。一个很自然的准则当然就是要使错误概率为最小。

信息论基础理论与应用第三版傅祖芸绪论

认证性：接受者能正确判断所接收的消息的正确性，验证消息的完整性，而不是伪造和窜改的。
23
信息论研究的内容
? 狭义信息论：
? 主要研究信息的测度、信道容量以及信源和信道编码理论等问题。
? 一般信息论：
? 主要也是研究信息传输和处理问题，除香农信息论，还包括噪声理论、信号滤波和预测、统计检测和估计、调制理论、信息处理理论以及保密理论等。
（2）概率测度对每一个可能选择的消息指定一个概率。
（3）概率空间
?X ??P(
? x)??
?
? a1 ??p(a1)
a2 ? p(a2) ?
an ? p(an )??
样本空间概率测度
? 先验概率p(xi)：
选择符号 xi作为消息的概率。
11
? 例：气象预报
甲
?X ? ??p(x)??
?
?晴 ??1/ 2,
? 1948 年香农的权威性长文“通信的数学理论”，讨论了信源和信道特性，1949 年香农“噪声中的通信”，两论文奠定了现代信息论的理论基础。
? 此后，在基本理论和实际应用方面，信息论都得到了巨大的发展。
27
信息论的发展
? 香农信息理论的数学严格化 ? 无失真信源编码定理和技术的发展 ? 信道纠错编码的发展 ? 限失真编码的提出和发展 ? 多用户、网络信息化的发展 ? 信息保密与安全理论的提出和发展
谢谢
32
28
信息论的研究成果举例
? 语音编码
CCITT G.722 ，G.723.1 ， G.728
? 图像编码
JPEG, MPEG-4
? 视频编码
H.261,H.263
29
信息论的发展

信息论与编码傅祖云讲义

p( y 1 x 0) p( y 0 x 1) 0 是较合理旳。
单符号离散信道旳数学模型
由此可见，一般单符号离散信道旳转移概率可用
信道转移矩阵P来表达：
b1
b2
a1 a2
p(b1 a1)
p(b1
a2
)
p(b2 a1) p(b2 a2 )
ar p(b1 ar ) p(b2 ar )
3.1信道旳数学模型及分类
在广义旳通信系统中，信道是很主要旳一部分。
信道旳任务是以信号方式传播信息和存储信息。
研究信道旳目旳就是研究信道中能够传送或存储旳最大信息量，即信道容量问题。
本章首先讨论离散信道旳统计特征和数学模型，然后定量地研究信道传播旳平均互信息及其性质，并导出信道容量及其计算措施。
4、平均互信息旳凸状性（两个定理）
定理3.1 平均互信息I (X ;Y ) 是信源概率分布p(x)旳 ∩型凸函数。
平均互信息旳特征
定理3.1旳意义：对于每一种固定信道，一定存在一种信源（某一概率分布P(X)），使输出端取得旳平均信息量为最大Imax（∩型凸函数存在极大值）。这时称这个信源为该信道旳匹配信源。
log
p
1
p
p
log
1 p
p
log
1 p
H ( p p) H ( p)
二元对称信道BSC旳平均互信息
I
(
X
;Y
)
(
p
p)
log
p
1
p
(p
p)
log
p
1
p
p
log
1 p
p
log
1 p
H ( p p) H ( p)

信息论--傅祖芸课后题解答

N
lim H N ( X ) H ( X ) 0.97
(3)
H ( X ) 2 H ( X ) 4 0.97 3.88
2
0000,0001,0010,0011,0100,0101,0110,0111
1000,1001,1010,1011,1100,1101,1110,1111
PE
1 24

1 12
第五章 5.3 （1）最小距离为3 （2）
5 5 （3） F (1000) 10010, F (01100) 11100, F (00100) 不确定 R log 4 2
（4）能纠正一位错误 5.15 (1)最小汉明距离准则（2） 7 6 PE p 5 p p （3）（4） P 1 (0.99 7 0.99
p 2
当p＝0： H p log p p log 2 0 当p＝1： H p log p p log 2 1
p
p
第二章习题
a1 : 1 2
a2 : a3 :
a1 : 1
a2 : 1 4 1 4 a3 :
1 2
2.23 图应改为：
s1
s2
1 2
s3
（1）
Q ( s1 ) 0.5Q ( s1 ) Q ( s 3 ) Q ( s 2 ) 0.25Q ( s1 ) 0.5 Q ( s 2 ) Q ( s3 ) 0.25Q ( s1 ) 0.5Q ( s 3 ) Q ( s ) Q ( s ) Q ( s ) 1 1 2 3
第二章习题 2.21 (1)
Q ( E i ) P ( ai )
p p P (0) pP (0) P (1) P (2) 2 2 p p P (1) pP (1) P (0) P (2) 2 2 p p P (2) pP (2) P (1) P (0) 2 2

信息论讲义-第五章(13讲)

信息理论基础第13讲北京航空航天大学201教研室陈杰21.编码器—信源符号集S =(s 1,s 2, …s q )—码符号集X =(x 1,x 2…x r )—代码组(Source Code ) C =(W 1, W 2,…W q )—码字(Codeword ) W i =(x l1,x l2,…x li )2. 分组码—奇异性(Non-singular )—唯一可译性(Uniquely decodable )—即时码(Instantaneous )All codesNon-singular codesUniquely decodable codesInstantaneous codesFigure 5.1. Classes of codes343. 定长编码3.1 唯一可译定长码编码速率编码效率log log L ql N r=≥log 1log q r +>log log L r R qN=≥()()log H S H S R qη=≤例:英文字符数q =27,且log 2q=4.754 bit 信源熵H (S )=4.03 bit ,取编码速率R=log 2q 则编码效率η=85%53. 定长编码3.2 定长码编码定理(1)正定理：(2)逆定理：log ()L rR H S Nε=≥+2[()]i E D I s p N ε≤log ()2L rR H S Nε=≤−12N E p ε−≥−0E p →1E p →63. 定长编码3.2 定长码编码定理根据正定理，令p E <δlog ()L rR H S Nε=≥+2[()]i E D I s p N δε≤<2[()]i D I s N εδ≥()H S Rη=()()H s H s ε≤+[]222()()(1)i D I s N H S ηηδ≥⋅−1()H s ηεη−=75.4 变长码•引入1. 变长码无需很长的码长就能实现高效率的无失真信源编码2.变长码必须是唯一可译码，才能实现无失真编码3.变长码是唯一可译码的充要条件：(1)非奇异码(2)任意有限次扩展码是非奇异码4. 变长码必须即时码85.4.1码的分类和主要编码方法信源编码方法：⑴匹配编码：概率大的信源符号，代码长度短；反之，代码长度长⑵变换编码：从一种空间变换成另一种空间，然后进行编码⑶识别编码：对有标准形状的文字、符号和数据进行编码9定理：设信源符号集为S=(s 1,s 2, …，s q,)，码符号集为X=(x 1,x 2, …x r )，对信源进行编码，代码组C=(W 1,W 2, …W q )，相应码长分别l 1,l 2,…l q ，即时码存在（唯一可译码存在）的充要条件为：11≤∑=−qi l ir10释：(1)克拉夫特(Kraft)不等式为即时码存在充要条件(2)麦克米伦(McMilan )不等式为唯一可译码存在充要条件(3)该定理不能作为判别一种码是否为即时码（唯一可译码）的判据(4)当码字长度和码符号满足该不等式时，必可构造出即时码（唯一可译码）115.4.3 唯一可译码判别准则•唯一可译码：如果一个分组码对于任意有限的整数N ，其N 次扩展码均为非奇异码，则为唯一可译码•唯一可译码的充要条件：（见书上128页）121.码平均长度离散无记忆信源为编码后的码子码字的长度因为是唯一可译码，s i 和W i 一一对应则码字平均长度为[]1212()()()q q s s s S P p s p s p s ⎡⎤=⎢⎥⎣⎦""12,,,qW W W "ql l l ,,,21"()()i i p s p W =11()()q qi i i ii i L p W l p s l ====∑∑13释：(1)是每个信源符号编码需要的平均码符号个数；(2) 编码后，每个信源符号s i 平均用个码符号来表示，平均每个码符号携带的信息量是信道的信息传输率(3) 若传输一个码符号需要t 秒，则每秒传输率为故L L L s H X H R )()(==Ls H R t R t )(1==bit/码符号bit/秒L R t 信息传输率高2.紧致码定义：对于某一个信源和某一码符号集，若有一L个唯一可译码，其平均码长度小于所有其它唯一可译码的平均码长度，则称该码为紧致码（也称最佳码）•释：无失真信源编码核心问题是寻找紧致码14153.定理：（平均码长下界）设离散无记忆信源的信源熵为H (S )，用码符号集进行编码，则存在一种编码方式构成唯一可译码，平均码长满足[]1212()()()q q s s s SP p s p s p s ⎡⎤=⎢⎥⎣⎦""},,,{21q x x x X "=L rS H L r S H log )(1log )(+<≤16释：(1) 的极限值为，即下界；小于下界，则唯一可译码不存在(2) 当选择时，才能达到下界(3) 紧致码平均码长不一定达到下界(4) 达到下界的唯一可译码是紧致码(5) 紧致码最短码长L ()log H S r Llog ()log i i p s l r=−rS H L log )(=174 变长无失真信源编码定理（香农第一定理）定理：设离散无记忆信源其信源熵为H (S )，它的N 次扩展信源为[]1212()()()q q s s s SP p s p s p s ⎡⎤=⎢⎥⎣⎦""1212()()()N N qN q S P p p p αααααα⎡⎤⎡⎤=⎢⎥⎣⎦⎢⎥⎣⎦""18扩展信源熵为H (S N )，码符号集X =(x 1,x 2, …x r )，用X 对S N 编码，则总可以找到一种编码方法，构成唯一可译码，使信源S 中的每个信源符号所需要的码字平均长度满足或rS H N L N r S H N log )(1log )(≥>+)(1)(S H NL N S H r N r ≥>+19当时，则其中，是扩展信源中每个信源符号对应的平均码长式中，是对应的码字长度∞→N )(lim S H N L r N N =∞→rS H N L N N log )(lim =∞→N L i α1()Nq N i ii L p αλ==∑i λi α20释：对于平稳遍历的离散有记忆信源（如马尔可夫信源），有其中，为有记忆信源的极限熵N L N L 原始信源平均码长N次扩展信源编码后每原始信源符号的平均码长≥rH N L N N log lim ∞∞→=∞H5.4.4变长信源编码定理5.编码速率、编码效率、剩余度(1) 编码速率：变长编码的编码速率为 LN R= log r N (2) 编码效率：编码效率定义为H ( S ) NH r ( S ) NH ( S ) = = η= R LN LN log r(3) 剩余度：定长码的剩余度为NH r ( S ) γ = 1 −η = 1 − LN21例题例5.2 设离散无记忆信源Ss2 ⎤ ⎡S ⎤ ⎡ s1 ⎢ P( S ) ⎥ = ⎢0.75 0.25⎥ ⎣ ⎦ ⎣ ⎦ 对信源S及其扩展信源进行二元变长编码，求当信源扩展次数N＝2,3,4时的平均码长和编码效率。

信息论基础理论和应用第三版傅祖芸-讲义

001 010 011 100 101 110
用作消息旳码字（许用码字） 000 （表达0）
二元对称信道旳三次扩
展信道
111 （表达1）
输出端接受序列
000 001 010 011 100 101 110 111
则信道矩阵为：
根据最大似然译码准则，当p=0.01，可得译码函数为：
F(000)=000 F(100)=000
一般信道传播时都会产生错误，而选择译码准则并不会消除错误，那么怎样降低错误概率呢？下边讨论经过编码措施来降低错误概率。
例：对于如下二元对称信道
0
0.99
0
0.01
0.01
1
1
0.99
按照最大似然准则译码，
怎样提升信道传播旳正确率呢？可用反复消息旳措施，即尝试扩展信道旳措施。
未用旳码字（禁用码字）
第二种措施旳错误率为
比较可知，第一种措施好。仔细观察发觉：在第一种措施中，假如 000 有一位犯错，就能够鉴定犯错了；而在第二种措施中，假如000中任何一位犯错，就变成了其他旳正当旳码字，我们无法判断是否犯错。再仔细观察，发觉第二种措施中，码字之间太相同。
码字距离：长度为n旳两个码字相应位置上不同码元旳个数。一
详细计算如下：
即：
假如先验概率相等，则：
某个输入符号ai传播引起旳错误概率
例：某信道
1）若根据最大似然准则选择译码函数为B：若输入等概率，则平均错误概率为
若输入不等概分布，则错误概率为：
2）采用最小错误概率译码准则，则联合矩阵为：
所得译码函数为：C：平均错误概率：
6.2 错误概率与编码措施
0
1/3
2/3

信息论与编码第五章部分PPT课件

C(abda)×21＝0.10111[0.1,0.110] 第二个符号为b
去掉累积概率Pb： 0.10111-0.1=0.00111
放大至[0,1](×p b-1)：
0.00111×22=0.111
第三个符号为d
[0.111,1]
去掉累积概率Pd： 0.111-0.111=0 放大至[0,1](×p d-1)：0×24＝0
PCM实际参数：fs=8KHz
量化电平mq： 0.5, 1.5, 2.5, 3.5
M=256
量化级数M：M=4
N=8 Rb=64Kbit/s
量化误差e：emax=0.5 编码位数N：N=2(要求2N>=M)
例：对10路带宽均为300~3400kHz的模拟语音信号进行PCM编码，抽样频率为 8000Hz，抽样后按8级量化，并编为二进制码。求该系统的数据传输速率。
例：若消息符号的概率分布为： p(u0)=1/2,p(u1)=1/4,p(u2)=1/8,p(u3)=1/8。求：（3）若各消息符号间相互独立，求编码后对应的二进制序列的熵；（4）若传输每个码字需要1.8元钱，问采用二定长码、二进制哈夫曼编码、二进制费诺码、三进制费诺码和三进制哈夫曼编码哪个更节省费用。答案(3)p(0)=1/2,p(1)=1/2, H(Y)=1
C ( ) 0, A( ) 1
C ( Sr
A
(
Sr
) )
C (S A(S
) )
pi
A(S
) Pr
L log 1 A(S )
C() 0, A() 1
C(Sr) A(Sr)
C(S) A(S)pi
A(S)Pr
例有四个符号a，b，c，d构成简单序列

信息论讲义-第五章(13讲)

信息理论基础第13讲北京航空航天大学201教研室陈杰21.编码器—信源符号集S =(s 1,s 2, …s q )—码符号集X =(x 1,x 2…x r )—代码组(Source Code ) C =(W 1, W 2,…W q )—码字(Codeword ) W i =(x l1,x l2,…x li )2. 分组码—奇异性(Non-singular )—唯一可译性(Uniquely decodable )—即时码(Instantaneous )All codesNon-singular codesUniquely decodable codesInstantaneous codesFigure 5.1. Classes of codes343. 定长编码3.1 唯一可译定长码编码速率编码效率log log L ql N r=≥log 1log q r +>log log L r R qN=≥()()log H S H S R qη=≤例:英文字符数q =27,且log 2q=4.754 bit 信源熵H (S )=4.03 bit ,取编码速率R=log 2q 则编码效率η=85%53. 定长编码3.2 定长码编码定理(1)正定理：(2)逆定理：log ()L rR H S Nε=≥+2[()]i E D I s p N ε≤log ()2L rR H S Nε=≤−12N E p ε−≥−0E p →1E p →63. 定长编码3.2 定长码编码定理根据正定理，令p E <δlog ()L rR H S Nε=≥+2[()]i E D I s p N δε≤<2[()]i D I s N εδ≥()H S Rη=()()H s H s ε≤+[]222()()(1)i D I s N H S ηηδ≥⋅−1()H s ηεη−=75.4 变长码•引入1. 变长码无需很长的码长就能实现高效率的无失真信源编码2.变长码必须是唯一可译码，才能实现无失真编码3.变长码是唯一可译码的充要条件：(1)非奇异码(2)任意有限次扩展码是非奇异码4. 变长码必须即时码85.4.1码的分类和主要编码方法信源编码方法：⑴匹配编码：概率大的信源符号，代码长度短；反之，代码长度长⑵变换编码：从一种空间变换成另一种空间，然后进行编码⑶识别编码：对有标准形状的文字、符号和数据进行编码9定理：设信源符号集为S=(s 1,s 2, …，s q,)，码符号集为X=(x 1,x 2, …x r )，对信源进行编码，代码组C=(W 1,W 2, …W q )，相应码长分别l 1,l 2,…l q ，即时码存在（唯一可译码存在）的充要条件为：11≤∑=−qi l ir10释：(1)克拉夫特(Kraft)不等式为即时码存在充要条件(2)麦克米伦(McMilan )不等式为唯一可译码存在充要条件(3)该定理不能作为判别一种码是否为即时码（唯一可译码）的判据(4)当码字长度和码符号满足该不等式时，必可构造出即时码（唯一可译码）115.4.3 唯一可译码判别准则•唯一可译码：如果一个分组码对于任意有限的整数N ，其N 次扩展码均为非奇异码，则为唯一可译码•唯一可译码的充要条件：（见书上128页）121.码平均长度离散无记忆信源为编码后的码子码字的长度因为是唯一可译码，s i 和W i 一一对应则码字平均长度为[]1212()()()q q s s s S P p s p s p s ⎡⎤=⎢⎥⎣⎦""12,,,qW W W "ql l l ,,,21"()()i i p s p W =11()()q qi i i ii i L p W l p s l ====∑∑13释：(1)是每个信源符号编码需要的平均码符号个数；(2) 编码后，每个信源符号s i 平均用个码符号来表示，平均每个码符号携带的信息量是信道的信息传输率(3) 若传输一个码符号需要t 秒，则每秒传输率为故L L L s H X H R )()(==Ls H R t R t )(1==bit/码符号bit/秒L R t 信息传输率高2.紧致码定义：对于某一个信源和某一码符号集，若有一L个唯一可译码，其平均码长度小于所有其它唯一可译码的平均码长度，则称该码为紧致码（也称最佳码）•释：无失真信源编码核心问题是寻找紧致码14153.定理：（平均码长下界）设离散无记忆信源的信源熵为H (S )，用码符号集进行编码，则存在一种编码方式构成唯一可译码，平均码长满足[]1212()()()q q s s s SP p s p s p s ⎡⎤=⎢⎥⎣⎦""},,,{21q x x x X "=L rS H L r S H log )(1log )(+<≤16释：(1) 的极限值为，即下界；小于下界，则唯一可译码不存在(2) 当选择时，才能达到下界(3) 紧致码平均码长不一定达到下界(4) 达到下界的唯一可译码是紧致码(5) 紧致码最短码长L ()log H S r Llog ()log i i p s l r=−rS H L log )(=174 变长无失真信源编码定理（香农第一定理）定理：设离散无记忆信源其信源熵为H (S )，它的N 次扩展信源为[]1212()()()q q s s s SP p s p s p s ⎡⎤=⎢⎥⎣⎦""1212()()()N N qN q S P p p p αααααα⎡⎤⎡⎤=⎢⎥⎣⎦⎢⎥⎣⎦""18扩展信源熵为H (S N )，码符号集X =(x 1,x 2, …x r )，用X 对S N 编码，则总可以找到一种编码方法，构成唯一可译码，使信源S 中的每个信源符号所需要的码字平均长度满足或rS H N L N r S H N log )(1log )(≥>+)(1)(S H NL N S H r N r ≥>+19当时，则其中，是扩展信源中每个信源符号对应的平均码长式中，是对应的码字长度∞→N )(lim S H N L r N N =∞→rS H N L N N log )(lim =∞→N L i α1()Nq N i ii L p αλ==∑i λi α20释：对于平稳遍历的离散有记忆信源（如马尔可夫信源），有其中，为有记忆信源的极限熵N L N L 原始信源平均码长N次扩展信源编码后每原始信源符号的平均码长≥rH N L N N log lim ∞∞→=∞H5.4.4变长信源编码定理5.编码速率、编码效率、剩余度(1) 编码速率：变长编码的编码速率为 LN R= log r N (2) 编码效率：编码效率定义为H ( S ) NH r ( S ) NH ( S ) = = η= R LN LN log r(3) 剩余度：定长码的剩余度为NH r ( S ) γ = 1 −η = 1 − LN21例题例5.2 设离散无记忆信源Ss2 ⎤ ⎡S ⎤ ⎡ s1 ⎢ P( S ) ⎥ = ⎢0.75 0.25⎥ ⎣ ⎦ ⎣ ⎦ 对信源S及其扩展信源进行二元变长编码，求当信源扩展次数N＝2,3,4时的平均码长和编码效率。

信息论与编码(傅祖云讲义)第五章

平均错误率为：
PE''' 1 * P(b / a) (0.125 0.05) (0.075 0.075) (0.05 0.125) 0.5 3 Y , X a
第二节错误概率与编码方法
一般信道传输时都会产生错误，而选择译码准则并不会消除错误，那么如何减少错误概率呢？下边讨论通过编码方法来降低错误概率。例：对于如下二元对称信道
第二节错误概率与编码方法我们再讨论一个例子，取M＝4，n＝5，这4个码字按 2 如下规则选取：R
5
设输入序列为:
ai (ai1 ai 2
ai3
ai 4
ai5 )
满足方程： ai 3 ai1 ai 2
ai 4 ai1 a a a i1 i2 i5
若译码采取最大似然准则：
P(b j / a* ) P(a* ) P(b j ) P(b j / ai ) P(ai ) P(b j )
第一节错误概率与译码规则即： P(bj / a* )P(a* ) P(bj / ai )P(ai ) 当信源等概分布时，上式为：
P(bj / a* ) P(bj / ai )
和B： (b ) a F 1 1
F (b2 ) a3 F (b3 ) a2
译码规则的选择应该有一个依据，一个自然的依据就是使平均错误概率最小有了译码规则以后，收到 bj 的情况下，译码的条件正确概率为： P( F (b ) / b ) P(a / b )
j j i j
第一节错误概率与译码规则而错误译码的概率为收到 bj 后，推测发出除了 ai 之外其它符号的概率：
第一节错误概率与译码规则
为了减少错误，提高通信的可靠性，就必到什么程度。前边已经讨论过，错误概率与信道的统计特性有关，但并不是唯一相关的因素，译码方法的选择也会影响错误率。

信息论基础理论与应用第三版(傅祖芸)讲义(课堂PPT)

唯一可译码的条件
1）不同的信源符号变换成不同的码字(非奇异码)；
2）任意有限长的信源序列所对应的码元序列各不相同. 即: 码的任意有限长N次扩展码都是非奇异码。
Or: 码符号序列的反变换也唯一的（扩展码非奇异）
原因：若要使某一码为惟一可译码，则对于任意有限长的码
符号序列，必须只能被惟一地分割成一个个的码字，才能实现唯一的译码。
否则,就为非惟一可译码或非单义可译码。
例：对于二元码 C1 {1,01,00}，当任意给定一串码字序列，例如 …10001101…
只可唯一地划分为1,00,01,1,01，因此是惟一可译码；而对另一个二元码 C2 {0,10,01} ，当码字序列为
…01001… 可划分为0,10,01或01,0,01，所以是非惟一可译的。
编码的形式化描述：从信源符号到码符号的一种映射
si(i1,2,..q)., W i (xi1xi2..xi.li), xik X,(k1,2, .li.).
或：
i(si1si2.s .iN .) W i(xi1xx2..xili.),
sik S,(k1 ,2,.N .).;xik X (k1 ,2,.li)..
例设信源
4
S P(s)sP 1(s1)
最佳编码：一般来说，抗干扰能与信息传输率二者相互矛盾。而编码
定理理论上证明，至少存在某种最佳的编码能够解决上述矛盾，做到既可靠又有效地传输信息。
信源编码：信源虽然多种多样，但无论是哪种类型的信源，信源符号
之间总存在相关性和分布的不均匀性，使得信源存在冗余度。信源编码的目的就是要减少冗余，提高编码效率。
3、非奇异码与奇异码非奇异码: 一组码中所有码字都不相同。

信息论基础理论与应用第三版傅祖芸113页文档

▪
26、要使整个人生都过得舒适、愉快，这是不可能的，因为人类必须具备一种能应付逆境的态度。——卢梭
▪
27、只有把抱怨环境的心情，化为上进的力量，才是成功的保证。——罗曼·罗兰
▪
28、知之者不如好之者，好之者不如乐之者。——孔子
▪
29、勇猛、大胆和坚定的决心能够抵得上武器的精良。——达·芬奇
▪
Байду номын сангаас
30、意志是一个强壮的盲人，倚靠在明眼的跛子肩上。——叔本华
谢谢！
113
信息论基础理论与应用第三版傅祖芸
11、获得的成功越大，就越令人高兴。野心是使人勤奋的原因，节制使人枯萎。 12、不问收获，只问耕耘。如同种树，先有根茎，再有枝叶，尔后花实，好好劳动，不要想太多，那样只会使人胆孝懒惰，因为不实践，甚至不接触社会，难道你是野人。(名言网) 13、不怕，不悔(虽然只有四个字，但常看常新。 14、我在心里默默地为每一个人祝福。我爱自己，我用清洁与节制来珍惜我的身体，我用智慧和知识充实我的头脑。 15、这世上的一切都借希望而完成。农夫不会播下一粒玉米，如果他不曾希望它长成种籽；单身汉不会娶妻，如果他不曾希望有小孩；商人或手艺人不会工作，如果他不曾希望因此而有收益。-- 马钉路德。

信息论基础理论与应用第三版傅祖芸第5章讲义

合集下载

《信息论》第五章

信息论基础理论与应用第三版傅祖芸113页PPT

信息论第5章-1

信息论基础理论与应用第三版(傅祖芸) 第5章讲义

《信息论》—基础理论与应用(傅祖芸)课后答案

信息论与编码理论基础(第五章)

信息论基础理论与应用第三版傅祖芸绪论

最新信息论-第五章教学讲义ppt

信息论与编码傅祖云讲义

信息论--傅祖芸课后题解答

信息论讲义-第五章(13讲)

信息论基础理论和应用第三版傅祖芸-讲义

信息论与编码第五章部分PPT课件

信息论讲义-第五章(13讲)

信息论与编码(傅祖云讲义)第五章

信息论基础理论与应用第三版(傅祖芸)讲义(课堂PPT)

信息论基础理论与应用第三版傅祖芸113页文档

文档推荐

最新文档

信息论基础理论与应用第三版傅祖芸第5章讲义

合集下载

《信息论》第五章

信息论 基础理论与应用第三版 傅祖芸113页PPT

信息论第5章-1

信息论 基础理论与应用第三版(傅祖芸) 第5章 讲义

《信息论》—基础理论与应用(傅祖芸)课后答案

信息论与编码理论基础(第五章)

信息论基础理论与应用第三版傅祖芸绪论

最新信息论-第五章教学讲义ppt

信息论与编码傅祖云讲义

信息论--傅祖芸课后题解答

信息论讲义-第五章(13讲)

信息论基础理论和应用第三版傅祖芸-讲义

信息论与编码第五章部分PPT课件

信息论讲义-第五章(13讲)

信息论与编码(傅祖云 讲义)第五章

信息论基础理论与应用第三版(傅祖芸)讲义(课堂PPT)

信息论 基础理论与应用第三版 傅祖芸113页文档

文档推荐

最新文档

信息论基础理论与应用第三版傅祖芸113页PPT

信息论基础理论与应用第三版(傅祖芸) 第5章讲义

信息论与编码(傅祖云讲义)第五章

信息论基础理论与应用第三版傅祖芸113页文档