huffman编码及截断huffman编码、解码实习报告(word版)

格式：docx
大小：683.50 KB
文档页数：13

下载文档原格式

/ 13

哈夫曼编码译码实验报告

哈夫曼编码译码实验报告哈夫曼编码译码实验报告一、引言哈夫曼编码是一种用来对数据进行压缩的算法，它能够根据数据的频率分布来分配不同长度的编码，从而实现对数据的高效压缩。

本次实验旨在通过实际操作，深入理解哈夫曼编码的原理和实现方式，并通过编码和解码过程来验证其有效性。

二、实验目的1. 掌握哈夫曼编码的原理和算法；2. 学会使用编程语言实现哈夫曼编码和解码；3. 验证哈夫曼编码在数据压缩中的实际效果。

三、实验过程1. 数据准备在实验开始前，首先需要准备一段文本数据作为实验材料。

为了更好地展示哈夫曼编码的效果，我们选择了一篇新闻报道作为实验文本。

这篇报道涵盖了多个领域的信息，包括科技、经济、体育等，具有一定的复杂性。

2. 哈夫曼编码实现根据哈夫曼编码的原理，我们首先需要统计文本中每个字符的频率。

为了方便处理，我们将每个字符与其频率构建成一个字符-频率的映射表。

然后，我们根据频率构建哈夫曼树，将频率较低的字符作为叶子节点，频率较高的字符作为内部节点。

最后，根据哈夫曼树构建编码表，将每个字符映射到对应的二进制编码。

3. 哈夫曼解码实现在哈夫曼解码过程中，我们需要根据编码表将二进制编码转换回字符。

为了实现高效解码，我们可以将编码表转换为一个二叉树，其中每个叶子节点对应一个字符。

通过遍历二叉树，我们可以根据输入的二进制编码逐步还原出原始文本。

4. 编码和解码效果验证为了验证哈夫曼编码的有效性，我们需要对编码和解码的结果进行比较。

通过计算编码后的二进制数据长度和原始文本长度的比值，我们可以得到压缩率，进一步评估哈夫曼编码的效果。

四、实验结果经过实验，我们得到了以下结果：1. 哈夫曼编码表根据实验文本统计得到的字符-频率映射表，我们构建了哈夫曼树，并生成了相应的编码表。

编码表中每个字符对应的编码长度不同，频率较高的字符编码长度较短，频率较低的字符编码长度较长。

2. 编码结果将实验文本使用哈夫曼编码进行压缩后，得到了一串二进制数据。

数据结构实验实验报告Huffman赫夫曼编码及应用

实验报告课程名称：数据结构实验名称：赫夫曼编码及应用院（系）：计算机与通信工程学院专业班级：计算机科学与技术姓名：学号：指导教师：2020 年 5 月12 日一、实验目的掌握赫夫曼树和赫夫曼编码的基本思想和算法的程序实现。

二、实验内容及要求1、任务描述a.提取原始文件中的数据（包括中文、英文或其他字符），根据数据出现的频率为权重，b.构建Huffman编码表；c.根据Huffman编码表对原始文件进行加密，得到加密文件并保存到硬盘上；d.将加密文件进行解密，得到解码文件并保存点硬盘上；e.比对原始文件和解码文件的一致性，得出是否一致的结论。

2、主要数据类型与变量a.对Huffman树采用双亲孩子表示法，便于在加密与解密时的操作。

typedef struct Huffman* HuffmanTree;struct Huffman{unsigned int weight; //权值unsigned int p, l, r;//双亲，左右孩子};b．对文本中出现的所有字符用链表进行存储。

typedef struct statistics* List;struct statistics {char str; //存储此字符int Frequency; //出现的频率（次数）string FinalNum; //Huffman编码struct statistics* Next;};3、算法或程序模块对读取到的文本进行逐字符遍历，统计每个字符出现的次数，并记录在创建的链表中。

借助Huffman树结构，生成结构数组，先存储在文本中出现的所有字符以及它们出现的频率（即权值），当作树的叶子节点。

再根据叶子节点生成它们的双亲节点，同样存入Huffman树中。

在完成对Huffman树的创建与存储之后，根据树节点的双亲节点域以及孩子节点域，生成每个字符的Huffman编码，并存入该字符所在链表节点的FinalNum域。

哈夫曼编码的实验报告

哈夫曼编码的实验报告哈夫曼编码的实验报告一、引言信息的传输和存储是现代社会中不可或缺的一部分。

然而，随着信息量的不断增加，如何高效地表示和压缩信息成为了一个重要的问题。

在这个实验报告中，我们将探讨哈夫曼编码这一种高效的信息压缩算法。

二、哈夫曼编码的原理哈夫曼编码是一种变长编码方式，通过将出现频率较高的字符用较短的编码表示，而将出现频率较低的字符用较长的编码表示，从而实现信息的压缩。

它的核心思想是利用统计特性，将出现频率较高的字符用较短的编码表示，从而减少整体编码长度。

三、实验过程1. 统计字符频率在实验中，我们首先需要统计待压缩的文本中各个字符的出现频率。

通过遍历文本，我们可以得到每个字符出现的次数。

2. 构建哈夫曼树根据字符频率，我们可以构建哈夫曼树。

哈夫曼树是一种特殊的二叉树，其中每个叶子节点代表一个字符，并且叶子节点的权值与字符的频率相关。

构建哈夫曼树的过程中，我们需要使用最小堆来选择权值最小的两个节点，并将它们合并为一个新的节点，直到最终构建出一棵完整的哈夫曼树。

3. 生成编码表通过遍历哈夫曼树，我们可以得到每个字符对应的编码。

在遍历过程中，我们记录下每个字符的路径，左边走为0，右边走为1，从而生成编码表。

4. 进行编码和解码在得到编码表后，我们可以将原始文本进行编码，将每个字符替换为对应的编码。

编码后的文本长度将会大大减少。

为了验证编码的正确性，我们还需要进行解码，将编码后的文本还原为原始文本。

四、实验结果我们选取了一段英文文本作为实验数据，并进行了哈夫曼编码。

经过编码后，原始文本长度从1000个字符减少到了500个字符。

解码后的文本与原始文本完全一致，验证了哈夫曼编码的正确性。

五、讨论与总结哈夫曼编码作为一种高效的信息压缩算法，具有广泛的应用前景。

通过将出现频率较高的字符用较短的编码表示，哈夫曼编码可以在一定程度上减小信息的存储和传输成本。

然而，哈夫曼编码也存在一些局限性，例如对于出现频率相近的字符，编码长度可能会相差较大。

完整word版哈夫曼编码译码器试验报告

中北大学数据结构课程设计说明书学生姓名: 郝晨栋学号： 1021010933软件学院学院:软件开发与测试: 专业哈夫曼编码/目题: 译码器康珺教指导师2011年12月20日目录1 问题描述.............................................................. 错误！未定义书签。

2 需求分析.............................................................. 错误！未定义书签。

3 概要设计 (1)3．1抽象数据类型定义 (1)3．2总体框图以及功能描述 (2)4 详细设计 (2)4．1数据类型的定义 (2)4．2主要模块的算法描述 (3)5 测试分析................................................................................................46 课程设计总结 (6)附录（源程序清单） (7)- 1 -1 问题描述1.设计一个利用哈夫曼算法的编码和译码系统，重复地显示并处理以下项目，直到选择退出为止。

(1) 将权值数据存放在数据文件(文件名为data.txt，位于当前目录中)；(2) 分别采用动态和静态存储结构; 初始化：键盘输入字符集大小n、n个字符和n个权值，建立哈夫曼树;(3) 编码：利用建好的哈夫曼树生成哈夫曼编码；输出编码；设计要求：(1) 符合课题要求，实现相应功能；(2) 要求界面友好美观，操作方便易行；(3) 注意程序的实用性、安全性。

2 需求分析编写此软件是为了实现一个利用哈夫曼算法的编码和译码系统。

比如，再利用电报进行通讯时，需要将文字转换成由二进制的字符组成的字符串。

比如需传送的电文为“A B A C C D A”假设将A,B,C,D分别编码为00、01、10、11.则上述电文遍为00010010101100，总长度为14位。

哈夫曼树编码译码实验报告

数据结构课程设计设计题目：哈夫曼树编码译码目录第一章需求分析1第二章设计要求1第三章概要设计2（1）其主要流程图如图1-1所示。

3（2）设计包含的几个方面4第四章详细设计4（1）①哈夫曼树的存储结构描述为：4（2）哈弗曼编码5（3）哈弗曼译码7（4）主函数8（5）显示部分源程序：8第五章调试结果10第六章心得体会12第七章12附录：12第一章需求分析在当今信息爆炸时代，如何采用有效的数据压缩技术节省数据文件的存储空间和计算机网络的传送时间已越来越引起人们的重视，哈夫曼编码正是一种应用广泛且非常有效的数据压缩技术。

哈夫曼编码是一种编码方式，以哈夫曼树—即最优二叉树，带权路径长度最小的二叉树，经常应用于数据压缩。

哈弗曼编码使用一张特殊的编码表将源字符（例如某文件中的一个符号）进行编码。

这张编码表的特殊之处在于，它是根据每一个源字符出现的估算概率而建立起来的（出现概率高的字符使用较短的编码，反之出现概率低的则使用较长的编码，这便使编码之后的字符串的平均期望长度降低，从而达到无损压缩数据的目的）。

哈夫曼编码的应用很广泛，利用哈夫曼树求得的用于通信的二进制编码称为哈夫曼编码。

树中从根到每个叶子都有一条路径，对路径上的各分支约定：指向左子树的分支表示“0”码，指向右子树的分支表示“1”码，取每条路径上的“0”或“1”的序列作为和各个叶子对应的字符的编码，这就是哈夫曼编码。

哈弗曼译码输入字符串可以把它编译成二进制代码，输入二进制代码时可以编译成字符串。

第二章设计要求对输入的一串电文字符实现哈夫曼编码，再对哈夫曼编码生成的代码串进行译码，输出电文字符串。

通常我们把数据压缩的过程称为编码，解压缩的过程称为解码。

电报通信是传递文字的二进制码形式的字符串。

但在信息传递时，总希望总长度能尽可能短，即采用最短码。

假设每种字符在电文中出现的次数为Wi，编码长度为Li，电文中有n种字符，则电文编码总长度为∑WiLi。

若将此对应到二叉树上，Wi为叶结点的权，Li为根结点到叶结点的路径长度。

哈夫曼编码实验报告

... ... 哈夫曼编码器实验报告学院：计算机学院班级：计科0801班：王宇宏学号：04081027（27）一．实验目的练习树和哈夫曼树的有关操作，和各个算法程序，理解哈夫曼树的编码和译码二．实验环境Microsoft visual c++三、问题描述利用哈夫曼编码进行通信可以大大提高信道利用率，缩短信息传输时间，降低传输成本。

但是，这要求在发送端通过一个编码系统对待传数据预先编码，在接收端将传来的数据进行译码（复原）。

对于双工信道（即可以双向传输信息的信道），每端都需要一个完整的编码/译码系统。

试为这样的信息收发站写一个哈夫曼编码的编码/译码器。

四、需求分析（1）初始化;从终端输入字符集的大小n，以及n个字符和n个权值建立哈夫曼树。

（2）输出哈夫曼树，及各字符对应的编码。

（3）编码：利用建好的哈夫曼树，对输入的待发送电文进行编码。

同时输入原文及编码串。

（4）译码：利用建好的哈夫曼树，对输入的已接收电文进行译码。

同时输入编码串及原文。

五、概要设计#include <iostream.h>#include <iomanip.h>#include <string.h>#include <malloc.h>#include <stdio.h>//typedef int TElemType;const int UINT_MAX=1000;char str[50];typedef struct{int weight,K;int parent,lchild,rchild;}HTNode,* HuffmanTree;typedef char **HuffmanCode;//-----------全局变量-----------------------HuffmanTree HT;HuffmanCode HC;int w[50],i,j,n;char z[50];int flag=0;int numb=0// -----------------求哈夫曼编码-----------------------struct cou{char data;int count;}cou[50];int min(HuffmanTree t,int i){ // 函数void select()调用int j,flag;int k=UINT_MAX; // 取k为不小于可能的值,即k为最大的权值1000 for(j=1;j<=i;j++)if(t[j].weight<k&&t[j].parent==0)k=t[j].weight,flag=j;t[flag].parent=1;return flag;}//--------------------slect函数----------------------void select(HuffmanTree t,int i,int &s1,int &s2){ // s1为最小的两个值中序号小的那个int j;s1=min(t,i);s2=min(t,i);if(s1>s2){j=s1;s1=s2;s2=j;}}// --------------算法6.12--------------------------void HuffmanCoding(HuffmanTree &HT,HuffmanCode &HC,int *w,int n){ // w存放n个字符的权值(均>0),构造哈夫曼树HT,并求出n个字符的哈夫曼编码HCint m,i,s1,s2,start;//unsigned c,f;int c,f;HuffmanTree p;char *cd;if(n<=1)return;//检测结点数是否可以构成树m=2*n-1;HT=(HuffmanTree)malloc((m+1)*sizeof(HTNode)); // 0号单元未用 for(p=HT+1,i=1;i<=n;++i,++p,++w){p->weight=*w;p->parent=0;p->lchild=0;p->rchild=0;}for(;i<=m;++i,++p)p->parent=0;for(i=n+1;i<=m;++i) // 建哈夫曼树{ // 在HT[1~i-1]中选择parent为0且weight最小的两个结点,其序号分别为s1和s2select(HT,i-1,s1,s2);HT[s1].parent=HT[s2].parent=i;HT[i].lchild=s1;HT[i].rchild=s2;HT[i].weight=HT[s1].weight+HT[s2].weight;}// 从叶子到根逆向求每个字符的哈夫曼编码HC=(HuffmanCode)malloc((n+1)*sizeof(char*));// 分配n个字符编码的头指针向量([0]不用)cd=(char*)malloc(n*sizeof(char)); // 分配求编码的工作空间cd[n-1]='\0'; // 编码结束符for(i=1;i<=n;i++){ // 逐个字符求哈夫曼编码start=n-1; // 编码结束符位置for(c=i,f=HT[i].parent;f!=0;c=f,f=HT[f].parent)// 从叶子到根逆向求编码if(HT[f].lchild==c)cd[--start]='0';elsecd[--start]='1';HC[i]=(char*)malloc((n-start)*sizeof(char)); // 为第i个字符编码分配空间strcpy(HC[i],&cd[start]); // 从cd复制编码(串)到HC }free(cd); // 释放工作空间}//--------------------- 获取报文并写入文件---------------------------------int InputCode(){//cout<<"请输入你想要编码的字符"<<endl;FILE *tobetran;if((tobetran=fopen("tobetran.txt","w"))==NULL){cout<<"不能打开文件"<<endl;return 0;}cout<<"请输入你想要编码的字符"<<endl;gets(str);fputs(str,tobetran);cout<<"获取报文成功"<<endl;fclose(tobetran);return strlen(str);}//--------------初始化哈夫曼链表--------------------------------- void Initialization(){ int a,k,flag,len;a=0;len=InputCode();for(i=0;i<len;i++){k=0;flag=1;cou[i-a].data=str[i];cou[i-a].count=1;while(i>k){if(str[i]==str[k]){a++;flag=0;}k++;if(flag==0)break;}if(flag){for(j=i+1;j<len;j++){if(str[i]==str[j])++cou[i-a].count;}}}n=len-a;for(i=0;i<n;i++){ cout<<cou[i].data<<" ";cout<<cou[i].count<<endl;}for(i=0;i<=n;i++){*(z+i)=cou[i].data;*(w+i)=cou[i].count;}HuffmanCoding(HT,HC,w,n);//------------------------ 打印编码-------------------------------------------cout<<"字符对应的编码为:"<<endl;for(i=1;i<=n;i++){puts(HC[i]);}//-------------------------- 将哈夫曼编码写入文件------------------------cout<<"下面将哈夫曼编码写入文件"<<endl<<"...................."<<endl;FILE *htmTree;char r[]={' ','\0'};if((htmTree=fopen("htmTree.txt","w"))==NULL){cout<<"can not open file"<<endl;return;}fputs(z,htmTree);for(i=0;i<n+1;i++){fprintf(htmTree,"%6d",*(w+i));fputs(r,htmTree);}for(i=1;i<=n;i++){fputs(HC[i],htmTree);fputs(r,htmTree);}fclose(htmTree);cout<<"已将字符与对应编码写入根目录下文件htmTree.txt中"<<endl<<endl;}//---------------------编码函数---------------------------------void Encoding(){cout<<"下面对目录下文件tobetran.txt中的字符进行编码"<<endl; FILE *tobetran,*codefile;if((tobetran=fopen("tobetran.txt","rb"))==NULL){cout<<"不能打开文件"<<endl;}if((codefile=fopen("codefile.txt","wb"))==NULL){cout<<"不能打开文件"<<endl;}char *tran;i=99;tran=(char*)malloc(100*sizeof(char));while(i==99){if(fgets(tran,100,tobetran)==NULL){cout<<"不能打开文件"<<endl;break;}for(i=0;*(tran+i)!='\0';i++){for(j=0;j<=n;j++){if(*(z+j-1)==*(tran+i)){fputs(HC[j],codefile);if(j>n){cout<<"字符错误，无法编码!"<<endl; break;}}}}}cout<<"编码工作完成"<<endl<<"编码写入目录下的codefile.txt中"<<endl<<endl;fclose(tobetran);fclose(codefile);free(tran);}//-----------------译码函数---------------------------------void Decoding(){cout<<"下面对根目录下文件codefile.txt中的字符进行译码"<<endl;FILE *codef,*txtfile;if((txtfile=fopen("txtfile.txt","w"))==NULL){cout<<"不能打开文件"<<endl;}if ((codef=fopen("codefile.txt","r"))==NULL){cout<<"不能打开文件"<<endl;}char *work,*work2,i2;int i4=0,i,i3;unsigned long length=10000;work=(char*)malloc(length*sizeof(char));fgets(work,length,codef);work2=(char*)malloc(length*sizeof(char));i3=2*n-1;for(i=0;*(work+i-1)!='\0';i++){i2=*(work+i);if(HT[i3].lchild==0){*(work2+i4)=*(z+i3-1);i4++;i3=2*n-1;i--;}else if(i2=='0') i3=HT[i3].lchild;else if(i2=='1') i3=HT[i3].rchild;}*(work2+i4)='\0';fputs(work2,txtfile);cout<<"译码完成"<<endl<<"容写入根目录下的文件txtfile.txt中"<<endl<<endl;free(work);free(work2);fclose(txtfile);fclose(codef);}//-----------------------打印编码的函数----------------------void Code_printing(){cout<<"下面打印根目录下文件CodePrin.txt中编码字符"<<endl; FILE * CodePrin,* codefile;if((CodePrin=fopen("CodePrin.txt","w"))==NULL){cout<<"不能打开文件"<<endl;return;}if((codefile=fopen("codefile.txt","r"))==NULL){cout<<"不能打开文件"<<endl;return;}char *work3;work3=(char*)malloc(51*sizeof(char));do{if(fgets(work3,51,codefile)==NULL){cout<<"不能读取文件"<<endl;break;}fputs(work3,CodePrin);puts(work3);}while(strlen(work3)==50);free(work3);cout<<"打印工作结束"<<endl<<endl;fclose(CodePrin);fclose(codefile);}//------------------------------- 打印译码函数---------------------------------------------void Code_printing1(){cout<<"下面打印根目录下文件txtfile.txt中译码字符"<<endl;FILE * CodePrin1,* txtfile;if((CodePrin1=fopen("CodePrin1.txt","w"))==NULL){cout<<"不能打开文件"<<endl;return;}if((txtfile=fopen("txtfile.txt","r"))==NULL){cout<<"不能打开文件"<<endl;return;}char *work5;work5=(char*)malloc(51*sizeof(char));do{if(fgets(work5,51,txtfile)==NULL){cout<<"不能读取文件"<<endl;break;}fputs(work5,CodePrin1);puts(work5);}while(strlen(work5)==50);free(work5);cout<<"打印工作结束"<<endl<<endl;fclose(CodePrin1);fclose(txtfile);}//------------------------打印哈夫曼树的函数----------------------- void coprint(HuffmanTree start,HuffmanTree HT){if(start!=HT){FILE * TreePrint;if((TreePrint=fopen("TreePrint.txt","a"))==NULL){cout<<"创建文件失败"<<endl;return;}numb++;//该变量为已被声明为全局变量coprint(HT+start->rchild,HT);cout<<setw(5*numb)<<start->weight<<endl;fprintf(TreePrint,"%d\n",start->weight);coprint(HT+start->lchild,HT);numb--;fclose(TreePrint);}}void Tree_printing(HuffmanTree HT,int w){HuffmanTree p;p=HT+w;cout<<"下面打印哈夫曼树"<<endl;coprint(p,HT);cout<<"打印工作结束"<<endl;}//------------------------主函数------------------------------------void main(){char choice;while(choice!='q'){ cout<<"\n******************************"<<endl;cout<<" 欢迎使用哈夫曼编码解码系统"<<endl;cout<<"******************************"<<endl;cout<<"(1)要初始化哈夫曼链表请输入'i'"<<endl; cout<<"(2)要编码请输入'e'"<<endl;cout<<"(3)要译码请输入'd'"<<endl;cout<<"(4)要打印编码请输入'p'"<<endl;cout<<"(5)要打印哈夫曼树请输入't'"<<endl;cout<<"(6)要打印译码请输入'y'"<<endl;if(flag==0)cout<<"\n请先初始化哈夫曼链表,输入'i'"<<endl;cin>>choice;switch(choice){case 'i':Initialization();break;case 'e':Encoding();break;case 'd':Decoding();break;case 'p':Code_printing();break;case 't':Tree_printing(HT,2*n-1);break;case 'y':Code_printing1();break;default:cout<<"input error"<<endl;}}free(z);free(w);free(HT);}运行结果：六、所遇问题及心得体会本次试验中所遇到的主要问题为哈弗曼编码的算法，以及整个变量的控制。

信息论课程实验报告—哈夫曼编码

else if(T[j].weight < T[*p2].weight)
*p2 = j;
}
}
void CreateHuffmanTree(HuffmanTree T)
{
int i,p1,p2;
InitHuffmanTree(T);
InputWeight(T);
for(i = n;i < m;i++)
4）依次继续下去，直至信源最后只剩下两个信源符号为止，将这最后两个信源符号分别用二元码符号“0”和“1”表示；
5）然后从最后—级缩减信源开始，进行回溯，就得到各信源符号所对应的码符号序列，即相应的码字。
四、实验目的：
(1)进一步熟悉Huffman编码过程；(2)掌握C语言递归程序的设计和调试技术。以巩固课堂所学编码理论的知识。
#include "stdio.h"
#include "stdlib.h"
#include <float.h>
#include <math.h>
#define n 8
#define m 2*n-1
typedef struct
{
float weight;
int lchild,rchild,parent;
}
}
void InputWeight(HuffmanTree T)
{
float temp[n] = {0.20,0.18,0.17,0.15,0.15,0.05,0.05,0.05};
for(int i = 0;i < n;i++)
T[i].weight = temp[i];
}

实习报告6_哈夫曼编码

1.初始化：从文件（程序运行时，由用户输入）读入字符集大小n，以及n个字符和n个权值，建立哈夫曼树，将它存于文件中。

2.编码：利用已建好的哈夫曼树（如不在内存，则从文件中读入）对文件字符集中的每一个进行编码，将结果放在中。

3.译码：利用已建好的哈夫曼树将中的代码进行译码，结果保存在中。

4.印代码文件。

将文件以紧凑的格式显示在终端上，每行50个代码。

同时将结果保存在中。

二.概要设计：1.哈夫曼树的抽象数据类型定义：ADT haffman{ 数据对象：D={ai|ai为charnode型的结点，i=1，2，3，……n，n>0}数据关系：R={<ai,><ai,>|ai是D上的元素}} ADT haffman2.编码集结构体的抽象数据类型的定义：ADT code{ 数据对象：D1={ai| ai是charlink型的结点，i=1，2，……n，n>0}D2={bi|bi是codelink型的结点，i=1，2，……n，n>0}数据关系： R1={<ai,>|ai是D1上的元素}R2={<bi,>|bi是D2上的元素}} ADT code3.程序分为四个部分：1）读入字符集以及相应频度，建立哈夫曼树。

2）根据哈夫曼树得到每一个字符的哈夫曼编码。

3）读入要编码的字符串，根据哈夫曼树和编码集求出字符串的哈夫曼编码。

4）根据哈夫曼编码和哈夫曼树得到字符串。

三.详细设计：h >> hufW[ ii ].wt;}(); .eight<< setw( 8 ) << hufT[ tOut ].parent<< setw( 8 ) << hufT[ tOut ].lChild<< setw( 8 ) << hufT[ tOut ].rChild << endl;}hufTreeOutPut << "-- end HT --------------------------- " << endl << endl << "-- HC ------------------------------- " << endl;for( int cOut = 1 ; cOut <= hufNum ; cOut++ ){hufTreeOutPut << " " << hufC[ cOut ].ch << " ---->> " << hufC[ cOut ].hufCh << endl;}hufTreeOutPut << "-- convert -- ok -------------------- " << endl;(); t;p->parent = p->lChild = p->rChild = 0; i-1 ]选择parent 为 0 且weight 最小的两个结点，其序号分别为 s1 和 s2arent = i; arent = i; Child = s1; Child = s2; eight =HT[ s1 ].weight + HT[ s2 ].weight; arent ; f != 0 ; c = f , f =HT[ f ].parent ) Child == c ) { cd[ --start ] = '0'; }else { cd[ --start ] = '1'; }}HC[ i ].ch = w[ i-1 ].ch ; ufCh = ( char* ) malloc ( ( n - start ) * sizeof( char ) ); ufCh , &cd[ start ] ); arent != 0 ) continue;else{sm1 = HT[ m ].weight;s1=m;break;}}for( int j = m+1 ; j <= i ; j++ ) arent != 0 ) continue;else{if( sm1 > HT[ j ].weight ){sm1 = HT[ j ].weight;s1 = j;}}}for( m = 1 ; m <= i ; m++ ) arent != 0 ) continue;else{sm2 = HT[ m ].weight;s2=m;if( s2 == s1 ) continue;else break;}}for( int k = m+1 ; k <= i ; k++ ) arent != 0 ) continue;else{if( (HT[ k ].weight < sm2) && ( k != s1 ) ) eight;s2 = k;}}}} ufCh == ' 'fOut << HC[ sub ].hufCh;}else if( inBuf == '\n' ){continue;}else{ufCh == 'A'. 以下的字符雷同sub = inBuf - 63;fOut << HC[ sub ].hufCh;}}HT[p]就为 HT 的根.Child != 0 ) Child; ufCh , cd ) == 0 ){fOut << HC[ iHC ].ch;break; Child; Child != 0 ) Child; ufCh , cd ) == 0 ){fOut << HC[ iHC ].ch;break; Child; ufCh , cd ) == 0 ){fOut << HC[ iHC ].ch;break; ufCh , cd ) == 0 ){fOut << HC[ iHC ].ch;break; 试分析1.本次作业在打印树形结构的时候有点遗憾，其他的都应该做的完美的了。

《数据结构课程设计》赫夫曼编码实验报告

目录一、概述 (1)二、系统分析 (1)三、概要设计 (2)四、详细设计 (4)4.1 赫夫曼树的建立 (4)4.1.1 选择选择parent 为0 且权值最小的两个根结点的算法 (5)4.1.2 统计字符串中字符的种类以及各类字符的个数 (7)4.1.3构造赫夫曼树 (8)4.2赫夫曼编码 (10)4.2.1赫夫曼编码算法 (10)4.2.2建立正文的编码文件 (11)4.3代码文件的译码 (12)五、运行与测试 (14)六、总结与心得 (14)参考文献 (15)附录 (15)一、概述本设计是对输入的一串电文字符实现赫夫曼编码，再对赫夫曼编码生产的代码串进行译码，输出电文字符串。

在当今信息爆炸时代，如何采用有效的数据压缩技术节省数据文件的存储空间和计算机网络的传送时间越来越引起人们的重视，赫夫曼编码正是一种应用广泛且非常有效的数据压缩技术。

二、系统分析赫夫曼编码的应用很广泛，利用赫夫曼树求得的用于通信的二进制编码成为赫夫曼编码。

树中从根到每个叶子都有一条路径，对路径上的各分支约定：指向左子树的分支表示“0”码，指向右子树的分支表示“1”码，取每条路径上的“0”或“1”的序列作为和每个叶子对应的字符的编码，这就是赫夫曼编码。

通常我们把数据压缩的过程称为编码，解压缩的过程称为解码。

电报通信是传递文字的二进制码形式的字符串，但在信息传递时，总希望总长度能尽可能短，即采用最短码。

假设每种字符在电文中出现的次数为W i ,编码长度为L i ，电文中有n 种字符，则电文编码总长为∑W i L i 。

若将此对应到二叉树上，W i 为叶节点的权，L i 为根节点到叶节点的路径长度。

那么，∑W i L i 恰好为二叉树上带权路径长度。

因此，设计电文总长最短的二进制前缀编码，就是以n 种子符出现的频率作权，构造一刻赫夫曼树，此构造过程成为赫夫曼编码。

根据设计要求和分析，要实现设计，必须实现以下方面的功能：（1）赫夫曼树的建立；（2）赫夫曼编码的生成；（3）编码文件的译码；三、概要设计程序由哪些模块组成以及模块之间的层次结构、各模块的调用关系；每个模块的功能。

Huffman实验报告

实习报告题目：哈夫曼编/译码器班级：计算机四班24021004学号：2402100402姓名：张青赛完成日期：2011年6月10日一、设计题目哈夫曼编码/译码器二、需求分析Ⅰ、运行环境：Microsoft Visual C++Ⅱ、程序执行的命令包括1 初始化：输入一串字符（正文），计算不同字符(包括空格)的数目以及每种字符出现的频率(以该种字符出现的次数作为其出现频率），根据权值建立哈夫曼树，输出每一种字符的哈夫曼编码。

2 编码：利用求出的哈夫曼编码，对该正文（字符串）进行码，并输出。

3 译码：对于得到的一串编码，利用已求得的哈夫曼编码进行译码，将译出的正文输出。

4 结束5 测试数据：E : 12 H : 2 M : 3 K : 7三、设计目的：1. 掌握建立哈夫曼树和哈夫曼编码的方法。

2. 掌握哈夫曼编码的实际应用方法。

四、设计内容利用哈夫曼编码进行通信可以大大提高信道利用率，缩短信息传输时间，降低传输成本。

这要求在发送端通过一个编码系统，对待传数据预先编码，在接收端将传来的数据进行译码。

对于双工信道(即可以双向传输信息的信道)，每端都需要一个完整的编\译码系统。

试为这样的信息收发站写一个哈夫曼的编\译系统。

五设计说明：1 算法设计思想：确定哈夫曼树和哈夫曼编码的存储表示，在数组中存放结点的各类信息，设计构造哈夫曼树的程序creathuffmantree、求出n个字母的哈夫曼编码程序huffmancode和哈夫曼的译码程序huffmandecode。

利用译码程序进行译码并输出，main()中调用各个函数，实现整个过程。

2．二叉树的抽象数据类型定义为：ADT BinaryTree{数据对象D:D是具有相同特性的数据元素的集合数据关系R:若D为空,则BinaryTree称为空二叉树；若D不为空,则BinaryTree满足二元关系；基本操作P：InitBiTree(&T);操作结果：构造空二叉树T。

哈夫曼编码与解码实验报告

数据结构课程设计报告题目：哈夫曼编码与解码学生姓名：侯清源学号： 1021111118班级： 102111111指导教师：张军2012年6月1日目录需求分析说明总体设计详细设计实现部分程序测试部分实验总结附图：开发环境和工程文件介绍1，需求分析说明A，通信线路中实现信息的最大传送，利用变长编码的方式，可以有效充分利用带宽，实现信息传送前的压缩。

B，在文件保存时，利用哈夫曼编码的方式，压缩文件。

可以实现硬盘存储最大的信息量。

C，实验目的：1，.学会使用哈夫曼进行对文本文件的编码与译码。

2，通过对哈夫曼的编码与译码，能够理解通信领域中的数据传输的压缩原理。

3，通过对哈夫曼的编码/译码器的研究与分析，能够彻底的理解软件设计的一般步骤和方法，灵活地运用各种数据结构进行操作，熟练地把所学地数据结构应用地软件开发当中，提高软件设计水平，增强程序设计能力。

D，实现功能压缩：实现对用户输入的字符串压缩，并在终端显示相应字符对应的频率，编码，编码长度，平均编码长度，字符个数。

并显示字符串编码后的二进制文件。

解压：实现对压缩后的二进制文件解压，还原为原来的字符串。

并显示在终端。

和用户输入的字符串比较。

2，总体设计2,1 开发环境介绍编译器：gcc 4.6.3编辑器：vim 7.0附插件：ctags、taglist、autocomplpop。

打开syntax enable、syntax on、set number。

操作系统：Ubuntu 12.04 LTS硬件环境：Processor：Intel(R) Core™ i5-2430 CPU @2.40GHzV endor:AcerTravelMate 4750G Business LaptopMemory:4G2.2系统框架系统结构流程算法思想描述（文字和图）1，首先，根据用户输入的字符串得到字符频率。

根据频率得到频率数据，对该频率数组由栈顶到栈低由小到大排列，同时将从小到大顺序存入优先队列2，构造哈弗曼树，过程如下：从栈中取出两个最小频率。

数据结构实验报告-霍夫曼编码

院系：计算机学院实验课程：数据结构实验实验项目：实验五霍夫曼编码/译码指导老师：开课时间：专业：计算机类班级：学生：学号：实验五霍夫曼编码/译码1.综设实验题目霍夫曼编码/译码2.中文摘要本实验是利用霍夫曼编码这一经典的数据编码方式来实现一个编码和解码的软件，实现了对指定文本的压缩功能，和对被压缩过的文件进行解压缩，恢复为原来的文件。

3.关键词课程名称数据结构实验实验项目霍夫曼编码/译码实验时间年月日实验指导老师实验评分霍夫曼编码压缩C++4.前言实验目的：利用霍夫曼编码进行通信可以大大提高信道利用率，缩短信息传输时间，降低传输成本。

这要求在发送端通过一个编码系统对待传输数据预先编码，在接收端将传来的数据进行译码（复原）。

对于双工信道（即可以双向传输信息的信道），每端都需要一个完整的编/译码系统。

实验意义：方便对通讯网络或数据传输中对数据进行压缩，减少数据所占用的资源空间。

实验内容：主要是初始化霍夫曼树、编码、解码。

5.实验设计由于该实验主要涉及到树这一存储结构，因此整个实验的关键点便在于对树这个数据结构的建立和操作上。

这个霍夫曼树主要有以下功能：由树转化成字符和编码的映射表、保存映射表、获取树的根节点、初始化树、利用映射表对文本进行编码、利用映射表对压缩过的文本进行解压缩，还有打印树的内容。

6.实验实现主要功能模块有：由树转化成字符和编码的映射表、保存映射表、获取树的根节点、初始化树、利用映射表对文本进行编码、利用映射表对压缩过的文本进行解压缩，还有打印树的内容。

由树转化成字符和编码的映射表是getCode()函数，代码如下：void Huffman::getCode() {stack< pair<node*, string> > s;s.push(make_pair(root, "0"));pair<node*, string> temp;while (!s.empty()) {temp = s.top();s.pop();if (temp.first->lchild == NULL && temp.first->rchild == NULL) {code[temp.first->data] = temp.second;code_reverse[temp.second] = temp.first->data;continue;}if (temp.first->lchild != NULL) s.push(make_pair(temp.first->lchild, temp.second + "0"));课程名称数据结构实验实验项目霍夫曼编码/译码实验时间年月日实验指导老师实验评分if (temp.first->rchild != NULL) s.push(make_pair(temp.first->rchild, temp.second + "1"));}return;}这个函数是对树进行前序遍历，每次访问到叶子节点时就保存这时的编码串和叶子结点所表示的字符。

哈夫曼编码实验报告

实验1哈夫曼编码实验的目的是掌握哈夫曼编码的原理，掌握哈夫曼树的生成方法。

了解数据压缩。

实验要求实现Huffman编解码器生成算法。

三。

实验内容首先统计待压缩文件中出现的字符和字母的数量，根据字符字母和空格的概率对其进行编码，然后读取要编码的文件并将其存储在另一个文件中；然后调用已编码的文件，对输出进行解码，最后存储到另一个文件中。

5实验原理1。

假设树的权值是用huffn树的定义来构造的。

每个加权叶为wi，权值路径最小的二叉树成为Huffman树或最优二叉树。

Huffman树的结构：权重是一个输入频率的数组，这些值根据节点对象中的数据属性按顺序分配给HTs，即每个HT节点对应一个输入频率。

然后，根据数据属性，从最小值到最大值取两个最小值和这个小HT节点，将它们的数据相加，构造一个新的htnode作为它们的父节点。

指针parentleftchild和rightchild被分配了相应的值。

将这个新节点插入最小堆。

按照这个程序，我们能建一棵树吗？通过构造的树，从下至上搜索父节点，直到父节点成为树的顶点。

这样，每次向上搜索后，根据原始节点是父节点的左子节点还是右子节点记录1或0。

每一个01都有一个完整的编码，每一个都有一个完整的编码。

初始化，以文本文件中的字符数为权值，生成Huffman树，按符号概率由大到小对符号进行排序，概率最小的两个符号形成一个节点。

重复步骤（）（），直到概率和为1，从根节点到每个符号对应的“叶”，概率高的符号标为“0”，概率低的符号从根节点开始，对符号7进行编码。

实验程序ා include<iostream>ා include<iomanip>ා include<iomanip>使用命名空间STD；typedef struct//节点结构{char data；//记录字符值long int weight；//记录字符权重unsigned int parent，lchild，rchild；}Htnode，*HuffmanTree；typedef char**huffmancode；//dynamicly allocate array to store Huffman code table void select（HuffmanTree&HT，int i，int&S1，int&S2）//选择HT[1中权重最小且父节点不为0的两个节点。

哈夫曼编码实验报告

哈夫曼编码实验报告哈夫曼编码实验报告一、引言哈夫曼编码是一种用于数据压缩的算法，由大卫·哈夫曼于1952年提出。

它通过将出现频率高的字符用较短的编码表示，从而实现对数据的高效压缩。

本实验旨在通过实际操作和数据分析，深入了解哈夫曼编码的原理和应用。

二、实验目的1. 掌握哈夫曼编码的基本原理和算法；2. 实现哈夫曼编码的压缩和解压缩功能；3. 分析不同数据集上的压缩效果，并对结果进行评估。

三、实验过程1. 数据集准备本实验选取了三个不同的数据集，分别是一篇英文文章、一段中文文本和一段二进制数据。

这三个数据集具有不同的特点，可以用来评估哈夫曼编码在不同类型数据上的压缩效果。

2. 哈夫曼编码实现在实验中，我们使用了Python编程语言来实现哈夫曼编码的压缩和解压缩功能。

首先，我们需要统计数据集中各个字符的出现频率，并构建哈夫曼树。

然后，根据哈夫曼树生成每个字符的编码表，将原始数据转换为对应的编码。

最后，将编码后的数据存储为二进制文件，并记录编码表和原始数据的长度。

3. 压缩效果评估对于每个数据集，我们比较了原始数据和压缩后数据的大小差异，并计算了压缩比和压缩率。

压缩比是指压缩后数据的大小与原始数据大小的比值，压缩率是指压缩比乘以100%。

通过对比不同数据集上的压缩效果，我们可以评估哈夫曼编码在不同类型数据上的性能。

四、实验结果与分析1. 英文文章数据集对于一篇英文文章，经过哈夫曼编码压缩后，我们发现压缩比为0.6，即压缩后的数据只有原始数据的60%大小。

这说明哈夫曼编码在英文文本上具有较好的压缩效果。

原因在于英文文章中存在大量的重复字符，而哈夫曼编码能够利用字符的出现频率进行编码，从而减少数据的存储空间。

2. 中文文本数据集对于一段中文文本，我们发现哈夫曼编码的压缩效果不如在英文文章上的效果明显。

压缩比为0.8，即压缩后的数据只有原始数据的80%大小。

这是因为中文文本中的字符种类较多，并且出现频率相对均匀，导致哈夫曼编码的优势减弱。

哈夫曼编码译码器实验报告

问题解析与解题方法问题分析：设计一个哈夫曼编码、译码系统。

对一个ASCII编码的文本文件中的字符进行哈夫曼编码，生成编码文件；反过来，可将编码文件译码还原为一个文本文件。

（1）从文件中读入任意一篇英文短文（文件为ASCII编码，扩展名为txt）；（2）统计并输出不同字符在文章中出现的频率（空格、换行、标点等也按字符处理）；（3）根据字符频率构造哈夫曼树，并给出每个字符的哈夫曼编码；（4）将文本文件利用哈夫曼树进行编码，存储成压缩文件（编码文件后缀名.huf）（5）用哈夫曼编码来存储文件，并和输入文本文件大小进行比较，计算文件压缩率；（6）进行译码，将huf文件译码为ASCII编码的txt文件，与原txt文件进行比较。

根据上述过程可以知道该编码译码器的关键在于字符统计和哈夫曼树的创建以及解码。

哈夫曼树的理论创建过程如下：一、构成初始集合对给定的n个权值{W1,W2,W3,...,Wi,...,Wn}构成n棵二叉树的初始集合F={T1,T2,T3,...,Ti,...,Tn}，其中每棵二叉树Ti中只有一个权值为Wi的根结点，它的左右子树均为空。

二、选取左右子树在F中选取两棵根结点权值最小的树作为新构造的二叉树的左右子树，新二叉树的根结点的权值为其左右子树的根结点的权值之和。

三、删除左右子树从F中删除这两棵树，并把这棵新的二叉树同样以升序排列加入到集合F中。

四、重复二和三两步，重复二和三两步，直到集合F中只有一棵二叉树为止。

因此，有如下分析：1.我们需要一个功能函数对ASCII码的初始化并需要一个数组来保存它们；2.定义代表森林的数组，在创建哈夫曼树的过程当中保存被选中的字符，即给定报文中出现的字符,模拟哈夫曼树选取和删除左右子树的过程；3.自底而上地创建哈夫曼树，保存根的地址和每个叶节点的地址，即字符的地址，然后自底而上检索，首尾对换调整为哈夫曼树实现哈弗曼编码；4.从哈弗曼编码文件当中读入字符，根据当前字符为0或者1的状况访问左子树或者右孩子，实现解码；5.使用文件读写操作哈夫曼编码和解码结果的写入；解题方法：结构体、数组、类的定义：1.定义结构体类型的signode 作为哈夫曼树的节点，定义结构体类型的hufnode 作为哈夫曼编码对照表的节点，定义HFM类实现对哈夫曼树的创建，利用其成员函数完成哈夫曼编码译码的工作。

哈夫曼编码译码系统实验报告

目录摘要 (II)Abstract (II)第一章课题描述 (1)1.1 问题描述 (1)1.2 需求分析…………………………………………………..……………………………11.3 程序设计目标……………………………………………………………………………第二章设计简介及设计方案论述 (2)2.1 设计简介 (2)2.2 设计方案论述 (2)2.3 概要设计 (2)第三章详细设计 (4)3.1 哈夫曼树 (4)3.2哈夫曼算法 (4)3.2.1基本思想 (4)3.2.2存储结构 (4)3.3 哈夫曼编码 (5)3.4 文件I/O 流 (6)3.4.1 文件流 (6)3.4.2 文件的打开与关闭 (7)3.4.3 文件的读写 (7)3..5 C语言文件处理方式..............................................................................第四章设计结果及分析 (8)4.1 设计系统功能 (8)4.2 进行系统测试 (8)总结 (13)致 (1)4参考文献 (15)附录主要程序代码 (16)摘要在这个信息高速发展的时代，每时每刻都在进行着大量信息的传递，到处都离不开信息，它贯穿在人们日常的生活生产之中，对人们的影响日趋扩大,而利用哈夫曼编码进行通信则可以大大提高信道利用率，缩短信息传输时间，降低传输成本。

在生产中则可以更大可能的降低成本从而获得更大的利润，这也是信息时代发展的趋势所在。

本课程设计的目的是使学生学会分析待加工处理数据的特性，以便选择适当的逻辑结构、存储结构以及进行相应的算法设计。

学生在学习数据结构和算法设计的同时，培养学生的抽象思维能力、逻辑推理能力和创造性的思维方法，增强分析问题和解决问题的能力。

此次设计的哈夫曼编码译码系统，实现对给定报文的编码和译码，并且任意输入报文可以实现频数的统计,建立哈夫曼树以及编码译码的功能。

实验5 Huffman编码

深圳大学实验报告课程名称：算法设计与分析实验项目名称：Huffman编码学院：专业：指导教师：报告人：学号：班级：实验时间：2017年11月26日实验报告提交时间：2017年12月6日教务部制方法、步骤：一．实验思路：1.霍夫曼编码原理假如给定字符串如下。

图一：增广路径示意图统计字符种类及每种字符出现的个数。

图二：统计结果每次选取权值最小的两个节点构建二叉树。

图三：构建二叉树置其根结点的权值为其左右子树权值之和。

图四：构建设置父节点删除表中两个已经添加过的叶子节点，将根节点置入表中，并回到第一步。

图五：删除节点注：规定左节点小于右节点，当权值相等时比较字符在ASCII表中顺序。

图六：构建霍夫曼表重复上述步骤即可。

如果为二进制文件则用二进制打开并读取，每五位一组。

2.压缩率和压缩时间字母压缩Rar压缩时间效率259ms 0ms压缩效率62.2634% 25.84%3.改进方法问题：要构造编码树必须提前统计符号出现概率，必须先进行扫描。

扫描要进行两次，第一遍统计符号出现概率，第二遍进行编码。

这里我们采用自适应的霍夫曼编码。

随着符号的统计也动态进行，同一个符号的编码可能发生改变。

霍夫曼编码方法不唯一。

因为编码时的0和1是任意给的，在两个符号有相同概率时的编码过程不唯一。

这些问题使解码需要编码树的结构，因此需要降低哈弗曼树的存储空间。

而范式霍夫曼编码则对于同一层的节点，所有的叶子节点都调整到左边。

然后，对于同一层的叶子节点按照符号顺序从小到大调整。

最后，按照左0右1的方案分配编码。

图七：构建范式霍夫曼表范式霍夫曼编码要求相同长度的码字是连续整数的二进制描述。

码字长度最小的第一个编码从0开始。

长度为i第一个码字f(i)必须满足f(i) = 2(f(i-1)+1)。

例如，符号：a b c d e f g h i j k ... u，码长：3 4 4 4 4 4 4 4 4 5 5 ... 5。

根据约定3，即first[3] = 0可得到符号a的范式哈夫曼编码为000。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

题目：编码与解码 1、要求对下图实施截断哈夫曼编码和解码，计算图象熵，平均码长和冗余度； 3 3 4 4 4 4 5 2 4 1 1 2 2 1 5 4 4 3 4 4 4 4 5 2 4 5 2 5 0 3 1 2 1 5 0 3 3 5 6 4 2 3 1 1 2 2 1 2 0 3 6 5 5 7 2 0 3 1 2 2 1 5 0 3

2、理论 Ⅰ 信息量和熵信息量的定义：对应每个符号的

2()log()iiIaPa

其中，()iPa指ia出现的概率。信源的定义：信源指能够产生信息的事情。在数学上信源是一概率场，若信源X可能产生的信源是12,,...,nxxx，这些信息出现的概率分别是12,,...,nppp，则该信源可能表示为

1212,,...,,,...,nn

xxx

ppp



由于()iIa是一个随机变量，因此也可以定义信源的信息量的统计平均为熵[entropy]

21()()log()njjjHxPaPa



在编码应用中，熵表示信源中消息的平均信息量，在不考虑消息间的相关性时，是无失真代码平均长度比特数的下限。 Ⅱ 编码过程编码器是用符号集A中的符号构成输出代码，并建立输出信号单元与输出代码的对应关系，如下图所示 

121212,,...,W=,,...,A=,,...,n

mmXxxxwwwaaa 符号集符号（码元）消息集合输出代码编码器

根据Shannon无干扰信息保持编码定理，若对原始图数据的信息进行信源的无失真图像编码，则压缩后的平均码率B存在一个下限，这个下限是信源信息熵H。理论上最佳信息

保持编码的平均码长可以无限接近信源信息熵H。若原始图像平均码长为B，则 L-10B=iiip

i为灰度级i对应的码长，ip为灰度级i出现的概率。那么B总是大于或等于图像的熵H。

因此可定义冗余度 B1rH

编码效率定义为 1B1Hr 当经过编码压缩后图像信息的冗余度r已接近于零，或编码效率已接近于1时，那么平均码长已接近其下限，这类编码方法称为高效编码 Ⅲ Huffman编码 Huffman编码是由D.A.Huffman在1952年提出的一种编码方法。这种编码方法根据源数据各信号发生的概率进行编码。在源数据中出现概率越大的信号，分配的码字越短；出现概率越小的信号，其码字越长，从而达到用尽可能少的码表示源数据的目的。它在变长编码方法中是最佳的。 Huffman编码的步骤如下：设信源X有m个符号（消息）

1212,,...,,,...,mm

xxx

Xppp



（1）把信源X中的消息按概率从大到小的顺序排列；（2）把最后两个出现概率最小的消息合并成一个消息，从而使信源的消息数减少，并同时再按信源符号（消息）出现的概率从大到小排列；（3）重复上述2个步骤，直到信源最后为

1212

ooooo

xxXpp



（4）将被整合的消息分别赋予1和0，并对最后的两个消息也相应地赋予1和0. 通过以上步骤就可构成最优变长码（Huffman编码） Ⅳ 截断Huffman编码（1）对最可能出现的M个符号进行Huffman编码（2）对其他的码都用在一个合适的定长码前加一个前缀码来表示

3、算法设计 Ⅰ 编码部分由于我们最开始得到的image是一个mn的矩阵，因此我们第一步需要做的是事情就是将矩阵中的字符进行概率分布计算，并得到概率分布矩阵，以进行下面的计算特此编写pro=getpro(image)函数返回得到概率分布矩阵pro（其中pro为2n阶矩阵，第一行为各字符概率值，第二行为相应各字符，n为所有字符种类的总个数）。由Huffman编码要求（1），得到的概率分布矩阵要按照从大到小得顺序来排列，所以需要编写pro=getsequence(pro)函数来得到顺序排列的概率分布矩阵。由Huffman编码要求（2），我们需要从pro（1,:）中找到两个最小的概率值，所以需要编写找出两个最小值的函数[min1,min2]=getmin(tree),其中tree是在进行Huffman编码过程中产生的Huffman树（包含pro信息，具体下面介绍），并且在min1与min2中若两者值相等，则在pro中概率序号在前的概率值赋予min1，概率序号在后的概率值赋予min2，此函数主要部分如下： for i=s; if(tree(2,i) min2=min1; m2=m1; min1=i; m1=tree(2,i); elseif(tree(2,i) min2=i; m2=tree(2,i); end end 下面先介绍下tree，树在matlab中的构造，在matlab中用tree(MN,s1,s2,s3„„)这个系统函数来构造二叉树。声明一个tree(6,x)结构的树型结点，一个结点包括有6个变量存储单元。其中tree(1,x)记录该结点的编号；tree(2,x)记录该结点的概率值；tree(3,x)记录该结点的父结点编号；tree(4,x)记录该结点是左结点还是右结点(其中左结点为“0”，右结点为“1”)；tree(5,x)记录该结点是否为根结点标志(该结点为根结点记为“1”，否则决为“0”)。tree(6,x)记录该结点的字符，x的个数为pro中字符的个数，其余值人为赋零。由截断Huffman编码要求（2），我们需要对字符进行一个定长码的顺序编码，所以需要编写函数SequenceTree=Sequence(pro)来得到一棵顺序编码的二叉树，其中pro为截断Huffman编码要求中剩余的字符组成的新pro概率分布矩阵（按概率值先大后小的顺序排序） n0=size(pro,2); n1=ceil(log2(n0)); n=2^n1; tree=ones(6,2*n-1); tree(1,:)=1:(2*n-1); tree(5,(n+1):end)=0; tree(2,1:n)=pro(1,:); tree(6,1:n)=pro(2,:); tree(6,n+1:end)=0; 如上为在进行顺序编码前构造的基本树 for i=1:2:(2*n-3); location=(i+1)/2+n; tree(2,location)=tree(2,i)+tree(2,i+1); tree(5,location)=1; tree(3,i)=location;tree(3,i+1)=location; tree(4,i)=0;tree(4,i+1)=1; tree(5,i)=0; tree(5,i+1)=0; end SequenceTree=tree; 通过以上步骤可以返回得到一棵顺序编码完成的二叉树SequenceTree。由截断Huffman编码要求（1），需要对M个符号进行Huffman编码，因此编写其编码部分，主要代码如下 for i=(n+1):(2*n-1); [mi1,mi2]=getmin(tree); tree(2,i)=tree(2,mi1)+tree(2,mi2); tree(5,i)=1; tree(3,mi1)=i;tree(3,mi2)=i; tree(4,mi1)=1;tree(4,mi2)=0; tree(5,mi1)=0; tree(5,mi2)=0; end T_HuffmanTree=tree; 通过以上两步，得到了两棵二叉树T_HuffmanTree和T_SequenceTree

接下来进行对image的编码部分依次获取image中的每个字符，然后历遍T_HuffmanTree和T_SequenceTree（如果满足

进入条件）可以得到最后的T_HuffmanCode 主要代码如下： m=find(T_SequenceTree(6,1:n2)==k); while(T_SequenceTree(5,m(1))~=1) %判断是否已历遍到根节点 Code(CodeNumber)=T_SequenceTree(4,m(1)); CodeNumber=CodeNumber+1; m=T_SequenceTree(3,m); %指向父节点 end k=-1; %指向标示位如上为逆历遍T_SequenceTree的过程。 m=find(T_HuffmanTree(6,1:n)==k); while(T_HuffmanTree(5,m)~=1) %判断是否已历遍到根节点 Code(CodeNumber)=T_HuffmanTree(4,m); CodeNumber=CodeNumber+1; m=T_HuffmanTree(3,m); % 指向父节点 end 如上为逆历遍T_HuffmanTree的过程。 for z=LastPoint:SumCode; %将n个符号的编码组合到一起 T_HuffmanCode(z)=Code(CodeNumber); CodeNumber=CodeNumber-1;

huffman编码及截断huffman编码、解码实习报告(word版)

合集下载

哈夫曼编码译码实验报告

数据结构实验实验报告Huffman赫夫曼编码及应用

哈夫曼编码的实验报告

完整word版哈夫曼编码译码器试验报告

哈夫曼树编码译码实验报告

哈夫曼编码实验报告

信息论课程实验报告—哈夫曼编码

实习报告6_哈夫曼编码

《数据结构课程设计》赫夫曼编码实验报告

Huffman实验报告

哈夫曼编码与解码实验报告

数据结构实验报告-霍夫曼编码

哈夫曼编码实验报告

哈夫曼编码实验报告

哈夫曼编码译码器实验报告

哈夫曼编码译码系统实验报告

实验5 Huffman编码

文档推荐

最新文档

huffman编码及截断huffman编码、解码实习报告(word版)

合集下载

哈夫曼编码译码实验报告

数据结构实验实验报告Huffman赫夫曼编码及应用

哈夫曼编码的实验报告

完整word版哈夫曼编码译码器试验报告

哈夫曼树编码译码实验报告

哈夫曼编码实验报告

信息论课程实验报告—哈夫曼编码

实习报告6_哈夫曼编码

《数据结构课程设计》赫夫曼编码实验报告

Huffman实验报告

哈夫曼编码与解码实验报告

数据结构实验报告-霍夫曼编码

哈夫曼编码实验报告

哈夫曼编码 实验报告

哈夫曼编码译码器实验报告

哈夫曼编码译码系统实验报告

实验5 Huffman编码

文档推荐

最新文档

哈夫曼编码实验报告