信息论与编码课程设计

  • 格式:doc
  • 大小:279.38 KB
  • 文档页数:24

下载文档原格式

  / 24
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

信息论与编码课程设计报告

设计题目:统计信源熵、香农编码与费诺编码

专业班级:XXXXXXXXXXXX

姓名:XXXXXXXXXXXX

学号:XXXXXXXXXXXX

指导老师:XXXXXXXXXXXX

成绩:

时间:2015年3月31日

目录

一、设计任务与要求 (2)

二、设计思路 (2)

三、设计流程图 (5)

四、程序及结果 (7)

五、心得体会 (11)

六、参考文献 (12)

附录 (13)

一、 设计任务与要求

1. 统计信源熵

要求:统计任意文本文件中各字符(不区分大小写)数量,计算字符概率,并计算信源熵。 2. 香农编码

要求:任意输入消息概率,利用香农编码方法进行编码,并计算信源熵和编码效率。 3. 费诺编码

要求:任意输入消息概率,利用费诺编码方法进行编码,并计算信源熵和编码效率。

二、 设计思路

1、统计信源熵:

统计信源熵就是对一篇英文文章中的i 种字符(包括标点符

号及空格,英文字母不区分大小写)统计其出现的次数count i (),

然后计算其出现的概率()p i ,最后由信源熵计算公式:

1()()log ()n

i i n H x p x p x ==-∑

算出信源熵()H x 。所以整体步骤就是先统计出文章中总的字符

数,然后统计每种字符的数目,直到算出所有种类的字符的个数,进而算出每种字符的概率,再由信源熵计算公式计算出信源熵。在这里我选择用Matlab 来计算信源熵,因为Matlab 中系统自带了许多文件操作和字符串操作函数,其计算功能强大,所以计算信源熵很是简单。

2、香农编码

信源编码模型:

信源编码就是从信源符号到码符号的一种映射f ,它把信源输出的符号i a 变换成码元序列i x 。

1,2,...

,,i i N

f a i q x =→:

1:{,...,}q S s a a ∈ 信源 1

2

{,...,}li

i i i i X x x x = 码元

1{,...,}

1,2,...,i q S a a i N ∈= 1,2,...,N i q =

1:{,...,}r X x x x ∈ 码符号

N

次扩展信源无失真编码器

凡是能载荷一定的信息量,且码字的平均长度最短,可分离的变长码的码字集合都可以称为最佳码。为此必须将概率大的信息符号编以短的码字,概率小的符号编以长的码字,使得平均码字长度最短。能获得最佳码的编码方法主要有:香农(Shannon )、费诺(Fano )、哈夫曼(Huffman )编码等。

信源编码器

香农第一定理: 离散无记忆信源为

12

1

2......

()()()......q q s s s S p s p s p s P ⎡⎤

⎡⎤=⎢⎥

⎢⎥⎣⎦⎣⎦

熵()H S ,其N 次扩展为

1212......

()()

()......N q q S p p p P αααααα⎡⎤⎡⎤=⎢⎥

⎢⎥⎢⎣⎦⎦

熵为()N H S ,码符号集为12(,,...,)r X x x x =。先对信源N S 进行编码,总可以找到一种编码方法,构成唯一可译码,使S 中每个信源符号所需的平均码长满足

()1()

log log N L H S H S r N N r

+>≥

且当N →∞时有()()

log lim N r N L H S H S N r →∞== ,

L 是平均码长1()N

q

i i i L p αλ==∑,i λ是i α对应的码字长度。

香农编码方法:

(1) 将信源消息符号按其出现的概率大小依次排列:12...n p p p ≥≥ (2)确定满足下列不等式整数码长i K 为

()()1i i i lb p K lb p -≤≤-+

(3)为了编成唯一可译码,计算第i 个消息的累加概率为

1

1()i i k k P p a -==∑

(4)将累加概率i P 变成二进制数。

(5)取i P 二进制数小数点后i K 位即为该消息符号的二进制码字。

3、费诺编码方法

(1)将信源消息符号按其出现的概率大小依次排列:12...n p p p ≥≥ (2)将依次排列的信源符号按概率值分为两大组,使两个组的概率之和近似相同,并对各组赋予一个二进制码元“0”和“1”。(3)将每一大组的信源符号再分为两组,使划分后的两个组的概率之和近似相同,并对各组赋予一个二进制符号“0”和“1”。 (4)如此重复,直至每个组只剩下一个信源符号为止。 (5)信源符号所对应的码字即为费诺码。

三、 设计流程图

1、统计信源熵

用Matlab 读入一段英文 计算这段文字的字符总数unm

① ②

统计每种字符的个数n(i) 算出每种字符的概率p(i)

③ ④

由信源熵计算公式1()()log ()n

i i n H x p x p x ==-∑计算出信源熵

⑤ 2、香农编码

开始

输入概率矩阵

将概率由大到小排列

计算累加概率和概率的个数

根据公式调用函数计算码长

用循环程序编码并调整输出格式

计算信源熵和编码效率

输出信源熵、编码效率和码字

结束

3、费诺编码

开始

输入概率矩阵

将概率由大到小排列