信息论与编码期末论文
- 格式:doc
- 大小:265.50 KB
- 文档页数:9
《信息论与编码》课程论文——通过信息论对已有知识产生的新认识马赛1143031014《信息论与编码》课程是通信专业的一门基础课。
其讲述的理论——香农信息论是当今信息科学的基础,可以说没有信息论的理论支持,就没有当今的信息化社会。
通过对于信息论的学习,我认识到,信息论的贡献就是解释了什么是“信息”,同时使用数学工具,对信息及伴随它产生的各种事物概念进行了解析。
近代科学的重大飞跃往往都是因人类对于一个事物有了强有力的分析工具而产生的。
有了信息论这一近乎完备(存在一些缺陷)的解析理论,人类才得以驾驭信息,社会才有了长足的进步。
在学习时,我习惯于把正在学习的知识和自己已经掌握的知识进行联系。
通过这种方法,可以增进对正在学习知识的理解,同时对已掌握的知识也有新的认识。
下文中,列举了两个问题,同时使用信息论的角度去进行解释。
一、计算机的存储容量与信息量的联系当今的计算机已经十分普及。
存储容量,无论内存还是外存,都是判定一台计算机性能的重要指标。
现在的个人计算机硬盘容量已经达到了TB级别,而在20年前,几百MB的硬盘都十分罕见。
在追求更高的存储容量时,我们是否思考过存储的东西是什么?KB、MB、GB等单位究竟代表的含义是什么?这是计算机科学的基本知识:“8 bit = 1 byte”。
bit即“位”,这是计算机存储单元最基本的单位;而信息论中也将信息量——用于衡量信息的量的单位称为bit,这两个概念有什么联系吗?在课程讲解时提到过这个问题,幻灯片上的答案如是解释:两者代表着不同的概念,信息论中的bit代表着信息量;而计算机中的bit代表着计算机中的二元数字1和0。
我认为两者是同一种概念,都代表信息量,而计算机中的bit是更为细化的概念,单指计算机中的信息量。
信息的一种解释是:对于不确定性的消除。
信息量是对信息的一种衡量手段,描述对事件不确定性消除的程度。
而描述事件不确定性的量就是这个事件发生的概率,因此一个事件发生的概率与事件包含的信息量具有对应的关系。
滨江学院《信息论与编码》课程论文题目阐述信息论院系电子工程系专业班级12通信3 班学生姓名学号教师杨玲成绩二O一四年十二月二十二日阐述信息论20122334942摘要:本文介绍了信息论的基础探究,通过本文可以让读者更好的去了解信息论的发展历史和应用。
现代社会是一个充满信息的世界,没有信息的世界是混乱的世界。
因而信息十分重要,随着社会信息化进程的加速,人们对信息的依赖程度会越来越高。
所以关于信息的研究——信息论也因运而生。
提到信息论就不得不提一个人——香农,他为信息论的发展做出了巨大的贡献。
信息论的主要基本理论包括:信息的定义和度量;各类离散信源和连续信源的信源熵;有记忆、无记忆离散和连续信道的信道容量;无失真信源编码和限失真信源编码定理等。
关键词:信息,信源,信源熵,信道容量、信源编码引言现代社会是一个充满信息的世界,没有信息的世界是混乱的世界。
因而信息十分重要,随着社会信息化进程的加速,人们对信息的依赖程度会越来越高。
结合所学知识和查阅相关书籍本文简要介绍了信息论的发展、和主要的几个基础理论,让人们更好的去了解信息论这门课程。
一、信息论的发展过程信息论理论基础的建立,一般来说开始于香农(C.E.Shannon)在研究通信系统时所发表的论文。
随着研究的深入与发展,信息论有了更为宽广的内容。
信息在早些时期的定义是由奈奎斯特(H.Nyquist)和哈特利(L.V.R.Hartley)在20世纪20年代提出来的。
香农被称为是“信息论之父”。
人们通常将香农于1948年10月发表于《贝尔系统技术学报》上的论文《A Mathematical Theory of Communication》(通信的数学理论)作为现代信息论研究的开端。
这一文章部分基于哈里·奈奎斯特和拉尔夫·哈特利先前的成果。
后来其他科学家维纳、朗格等科学家又对信息理论作出了更加深入的探讨。
使得信息论到现在形成了一套比较完整的理论体系。
香农信息论对现代社会的影响摘要:1948年香农在Bell System Technical Journal上发表了《A Mathematical Theory of Communication 》。
论文由香农和威沃共同署名。
这篇奠基性的论文是建立在香农对通信的观察上,即“通信的根本问题是报文的再生,在某一点与另外选择的一点上报文应该精确地或者近似地重现”。
这篇论文建立了信息论这一学科,给出了通信系统的线性示意模型,即信息源、发送者、信道、接收者、信息宿,这是一个新思想。
此后,通信就考虑为把电磁波发送到信道中,通过发送1和0的比特流,人们可以传输图像、文字、声音等等。
今天这已司空见惯,但在当时是相当新鲜的。
他建立的信息理论框架和术语已经成为技术标准。
他的理论在通信工程师中立即获得成功,并刺激了今天信息时代所需要的技术发展。
关键词:香农、通信、编码Abstract: In 1948, Shannon Bell System Technical Journal published "A Mathematical Theory of Communication". Paper co-signed by the Hong farmers. This ground-breaking paper is based on Shannon's observation of the communication that "the fundamental problem of communication is the message of regeneration, at some point with another point to report the selected text should be reproduced exactly or approximately." This paper established the discipline of information theory, given the linear signal model of communication system, that information source, sender, channel, receiver, message places, this is a new idea. Since then, the communication to consider the electromagnetic waves sent to the channel, by sending a stream of bits 1 and 0, one can transfer images, text, and so on. It has become commonplace today, but was very fresh. He established the theoretical framework and terminology of information technology has become the standard. His theory in communications engineer in immediate success, and stimulate the need for the information age of today's technology.Keywords:Shannon、Communications、Coding信息论的理论定义是由当代伟大的数学家美国贝尔实验室杰出的科学家香农在他1948年的著名论文《通信的数学理论》所定义的,它为信息论奠定了理论基础。
信息论与编码课程论文电子邮件安全与密码学的应用刘畅,200900840179山东大学威海分校机电与信息工程学院,威海 264209摘要:本文分析了传统电子邮件系统存在的安全性问题,探讨应用密码技术采弥补这些安全漏洞,并且绍了在安全电子邮件系统中使用的密码技术。
关键词:RSA;PGB;PEM1、概述随着计算机技术和网络技术的迅速发展,电子邮件的应用也越来越广泛.成为网络牛活中重要的组成部分,大有取代传统邮件之势。
作为一种新的信息传递技术,电子邮件以其简单、快捷、方便的优势被人们所接受和喜爱。
但是也存在一些问题妨碍了它的推广。
其中关键之一就是电子邮件的信息安全。
由于电子邮件技术在设计之初是为了科学家之间的通信方便,所以并来考虑信息安全因素。
但是髓着时代的发展。
尤其是电子商务的速成长。
作为其沟通手段的电子邮件的安全性问题就不得不受到高度重视。
人们很自然的想到把已经成熟的密码技术商用于电子邮件系统。
密码技术就是对信息进行重新编码。
从而达到隐藏信息内容使非法用户无法获取真实信息内容的一种手段。
本文就浅述一下密码技术安全电子邮件中的应用。
2、密码学简介2.1、加密的历史作为保障数据安全的一种方式,数据加密起源于公元前2000年。
埃及人是最先使用特别的象形文字作为信息编码的人。
随着时间推移,巴比伦,希腊等都开始使用一些方法来保护他们的书面信息。
对信息进行编码曾被Julias Caesar(恺撒大帝)使用,也曾用于历次战争中,包括美国独立战争,美国内战和两次世界大战。
最广为人知的编码机器是German Enigma机,在第二次世界大战中德国人利用它创建了加密信息。
此后,由于Alan Turing 和Ultra计划及其他人的努力,终于对德国人的密码进行了破解。
当初,计算机的研究就是为了破解德国人的密码,当时人们并没有想到计算机给今天带来的信息革命。
随着计算机的发展,运算能力的增强,过去的密码都变的十分简单了。
于是人们又不断地研究出了新的数据加密方式,如私有密钥算法和公有密钥算法。
论最大熵原理及其应用摘要:熵是源于物理学的基本概念,后来Shannon在信息论中引入了信息熵的概念,它在统计物理中的成功使人们对熵的理论和应用有了广泛和高度的重视。
最大熵原理是一种在实际问题中已得到广泛应用的信息论方法。
本文从信息熵的概念出发,对最大熵原理做了简要介绍,并论述了最大熵原理的合理性,最后提及它在一些领域的应用,通过在具体例子当中应用最大熵原理,展示该原理的适用场合,以期对最大熵原理及其应用有更深刻的理解。
关键词:熵;信息熵;最大熵原理;不适定性问题1 引言科学技术的发展使人类跨入了高度发展的信息化时代。
在政治、军事、经济等各个领域,信息的重要性不言而喻,有关信息理论的研究正越来越受到重视,信息论方法也逐渐被广泛应用于各个领域。
信息论一般指的是香农信息论,主要研究在信息可以度量的前提下如何有效地、可靠地、安全地传递信息,涉及消息的信息量、消息的传输以及编码问题。
1948年C.E.Shannon为解决通信工程中不确定信息的编码和传输问题创立信息论,提出信息的统计定义和信息熵、互信息概念,解决了信息的不确定性度量问题,并在此基础上对信息论的一系列理论和方法进行了严格的推导和证明,使以信息论为基础的通信工程获得了巨大的发展。
信息论从它诞生的那时起就吸引了众多领域学者的注意,他们竞相应用信息论的概念和方法去理解和解决本领域中的问题。
近年来,以不确定性信息为研究对象的信息论理论和方法在众多领域得到了广泛应用,并取得了许多重要的研究成果。
迄今为止,较为成熟的研究成果有:E.T.Jaynes 在1957年提出的最大熵原理的理论;S.K.Kullback 在1959年首次提出后又为J.S.Shore 等人在1980年后发展了的鉴别信息及最小鉴别信息原理的理论;A.N.Kolmogorov 在1956年提出的关于信息量度定义的三种方法——概率法,组合法,计算法;A.N.Kolmogorov 在1968年阐明并为J.Chaitin 在1987年系统发展了的关于算法信息的理论。
编码技术在单片机通信中的研究与应用摘要:计算机之间数据通讯的校验以奇偶校验或数据块和校验较为常见.在误码率稍显突出时,这种方式的数据通信效率就会降低.本文从实际出发,介绍了一种提高计算机通信效率的编译码方法,并以八位单片机为例,给出了软件实现编译码的设计.该设计对于提高单片机数据通信效率,减少误码率具有很强的实用价值.关键词:单片机;通信;编码;译码;纠错;抗干扰Application of the Coding to Data Communicatingin the MicroprocessorAbstract:There are two familiar methods of checking the accuracy of the data communicated between two computers.0ne is the method of counting the number of 0 or 1in the data.Another is the method of adding all data.When the mistake code rate is slightly outstanding ,the efficiency of the data communication will lower.Proceeding from actual condition,this test introduces a kind of the coding method and gives a design with 8 bit microprocessor .The method can raise the efficiency the data communication and cut down the wrong data.Keywords:microprocessor;communication; encoding;correcting code:anti-interference0 概述在数据通信中,误码率是项重要指标.误码可能发生在各个环节,大量实践证明,传输媒介是产生误码的主要来源.为了提高数据传输可靠性,人们开始广泛采用编码技术,通过编码以一定的规则产生一些附加数字(称为监督数字),使原来不相关的信息序列变为相关的新列(称为码序或码字),然后把新的序列发送出去.通过编码的方法使信息具有纠检差错的能力.该通信模型可简要地用图1表示.1 设计思想1.1选择编码形式人们已研究出许多编码方法,如奇偶校验码、汉明码、循环码和卷积码等.这些编码中,有的具有检错能力,有的既能检错、又能纠错.在众多的编码中,汉明码比较直观简单,传输信息数字的频率(即信息率)最高,它既具有检错能力,又具有纠错能力,而且软硬件实现起来也较为简单.本设计采用汉明码中纠1检2错线性码编码,当接收端发现接收的信息出现了一位差错时,在译码的同时也就完成了纠错;当出现两位差错时,能及时检出舍弃⋯.1.2 MCS-51编码方案设计对于Mcs .5l 系列单片机的串行口来说,若接收和发送双方约定选用方式1工作时,串行口一次能够发送10位数码(1位起始位、8位数据位和l 位停止位).接收缓冲器里一次只能存放一个字节数据.对于一个8位数码,若再加上一些监督位,则该码就超过8位,Mcs .5 1单片机一次发送不能完成.若先发送8位信息,后发送监督位,则达不到纠1检2的目的.为此,一个8位信息可分为两组编码,即高4和低4位分别编码发送、分别纠检差错. 2 编码技术具体应用2.2 译码依据原则根据汉明码取最少的监督数字,包含最多的信息原则,来确定监督数字的位数.该原则可用公式:21mm -- 表达,式中m 为监督数字位数.该表达式运算结果即为所包含的最多有效信息.本例中取m=3(位)监督数字,则可包含4位有效信息,这时码长为:4+3=7(位),根据一致监督矩阵的特点可知,一致监督矩阵的横行数等于监督数字的个数,纵列数等于码的长度.这样把1、2、⋯、7化为二进制数,然后把它们作为矩阵的纵列,组成一个矩阵,再按照一致监督矩阵排列得:在做一致监督矩阵时,要求包含:100r ()、 r r(010)、(001).这3个纵列是为了保证矩阵中的每一横行线性无关,这样就能保证由这个一致监督矩阵做出的42=16个状态包含所有的信息.为了更加明确编程思路,简要介绍一下纠码原理.设c 为一个码字,根据一致监督方程的关系,则有:们7=0.根据此关系,设接收矢量为R ,则当0T HR =时,认为R 是一个正确的码字;若0T HR ≠时,则R 就不是一个正确的码字,即接收信息有错.假设接收矢量R 只包含一个差错,则利用监督子T T S HR =可确定这个差错的位置,从而可得到纠正.针对本例,设112277(,,,)R C E C E C E =+++ ,其中E 为错型,则T T S HR =展开后得:由式2可见,当接收矢量中只有一个差错时,监督子TS 就等于监督矩阵中的某一纵列,从而能纠正单个差错。
本科生课程论文题目:互信息技术在数字图像配准中的应用姓名:学院:理学与信息科学学院专业:信息与计算科学班级:学号:指导教师:完成时间:2011 年7 月1 日2011年7月1日课程论文任务书学生姓名指导教师论文题目互信息技术在数字图像配准中的应用论文内容(需明确列出研究的问题):图像配准是使两幅图像上的对应点达到空间上一致的一个过程。
本文介绍了一种基于最大互信息原理的图像配准技术。
并针对基于最大互信息图像配准的不足,研究了基于Harris角点算子的多模态医学图像配准。
在计算互信息的时候,采用部分体积插值法计算联合灰度直方图。
在优化互信息函数的时候采用了改进的遗传算法将配准参数收敛到最优值附近。
资料、数据、技术水平等方面的要求:论文要符合一般学术论文的写作规范,具备学术性、科学性和一定的创造性。
文字要流畅、语言要准确、论点要清楚、论据要准确、论证要完整、严密,有独立的观点和见解。
内容要理论联系实际,计算数据要求准确,涉及到他人的观点、统计数据或计算公式等要标明出处,结论要写的概括简短。
参考文献的书写按论文中引用的先后顺序连续编码。
发出任务书日期2011.06.23 完成论文(设计)日期2011.07.01 学科组或教研室意见(签字)院、系(系)主任意见(签字)目录摘要: (1)Abstract: (2)前言 (3)1 概述 (4)1.1 互信息与信息论 (4)1.2 数字图像配准 (5)1.2.1 数字图像配准的介绍 (5)1.2.2 数字图像配准的方式 (5)1.2.3 数字图像配准的发展 (6)2 配准方法 (7)2.1 变换和插值模型 (7)2.2 特征点的提取 (8)2.3 多元互信息 (11)2.4 优化算法 (12)2.4.1 编码方式 (12)2.4.2适应度表示 (12)2.4.3轮盘赌法和最优保存策略 (12)3 互信息技术在图像配置中的应用 (13)3.1 Harris角点后的CT图和PET图 (14)3.2 配准过程及结果 (14)4 总结 (14)参考文献: (16)互信息技术在数字图像配准中的应用信息与计算科学专业指导教师【摘要】:医学图像配准技术已经被应用于心脏病诊断和包括脑瘤在内的各种各样的神经混乱诊断研究中。
信息论与编码论文通过信道编码器和译码器实现的用于提高信道可靠性的理论和方法。
信息论的内容之一。
信道编码大致分为两类:①信道编码定理,从理论上解决理想编码器、译码器的存在性问题,也就是解决信道能传送的最大信息率的可能性和超过这个最大值时的传输问题。
②构造性的编码方法以及这些方法能达到的性能界限。
编码定理的证明,从离散信道发展到连续信道,从无记忆信道到有记忆信道,从单用户信道到多用户信道,从证明差错概率可接近于零到以指数规律逼近于零,正在不断完善。
编码方法,在离散信道中一般用代数码形式,其类型有较大发展,各种界限也不断有人提出,但尚未达到编码定理所启示的限度,尤其是关于多用户信道,更显得不足。
在连续信道中常采用正交函数系来代表消息,这在极限情况下可达到编码定理的限度。
不是所有信道的编码定理都已被证明。
只有无记忆单用户信道和多用户信道中的特殊情况的编码定理已有严格的证明;其他信道也有一些结果,但尚不完善。
信道编码技术数字信号在传输中往往由于各种原因,使得在传送的数据流中产生误码,从而使接收端产生图象跳跃、不连续、出现马赛克等现象。
所以通过信道编码这一环节,对数码流进行相应的处理,使系统具有一定的纠错能力和抗干扰能力,可极大地避免码流传送中误码的发生。
误码的处理技术有纠错、交织、线性内插等。
提高数据传输效率,降低误码率是信道编码的任务。
信道编码的本质是增加通信的可靠性。
但信道编码会使有用的信息数据传输减少,信道编码的过程是在源数据码流中加插一些码元,从而达到在接收端进行判错和纠错的目的,这就是我们常常说的开销。
这就好象我们运送一批玻璃杯一样,为了保证运送途中不出现打烂玻璃杯的情况,我们通常都用一些泡沫或海棉等物将玻璃杯包装起来,这种包装使玻璃杯所占的容积变大,原来一部车能装5000各玻璃杯的,包装后就只能装4000个了,显然包装的代价使运送玻璃杯的有效个数减少了。
同样,在带宽固定的信道中,总的传送码率也是固定的,由于信道编码增加了数据量,其结果只能是以降低传送有用信息码率为代价了。
《信息论与编码》课程小结《信息论与编码》课程小结信息论是信息科学的主要理论基础之一,它是在长期通信工程实践和理论基础上发展起来的。
信息论是应用概率论、随机过程和数理统计和近代代数等方法,来研究信息的存储、传输和处理中一般规律的学科。
它的主要目的是提高通信系统的可靠性、有效性和安全性,以便达到系统的最优化。
编码理论与信息论紧密关联,它以信息论基本原理为理论依据,研究编码和译码的理论知识和实现方法。
通过《信息论与编码》课程的学习,得到了以下总结:一、信息论的基本理论体系1948年,香农在贝尔系统技术杂志上发表“通信的数学理论”。
在文中,他用概率测度和数理统计的方法系统地讨论了通信的基本问题,得出了几个重要而带有普遍意义的结论,并由此奠定了现代信息论的基础。
香农理论的核心是:揭示了在通信系统中采用适当的编码后能够实现高效率和高可靠地传输信息,并得出了信源编码定理和信道编码定理。
从数学观点看,这些定理是最优编码的存在定理。
但从工程观点看,这些定理不是结构性的,不能从定理的结果直接得出实现最优编码的具体方法。
然而,它们给出了编码的性能极限,在理论上阐明了通信系统中各种因素的相互关系,为寻找最佳通信系统提供了重要的理论依据。
对信息论的研究内容一般有以下三种理解:(1) 狭义信息论,也称经典信息论。
它主要研究信息的测度、信道容量以及信源和信道编码理论等问题。
这部分内容是信息论的基础理论,又称香农基本理论。
(2) 一般信息论,主要是研究信息传输和处理问题。
除了香农理论以外,还包括噪声理论、信号滤波和预测、统计检测与估计理论、调制理论、信息处理理论以及保密理论等。
后一部分内容以美国科学家维纳(N.Wiener)为代表,其中最有贡献的是维纳和苏联科学家柯尔莫哥洛夫。
(3) 广义信息论。
广义信息论不仅包括上述两方面的内容,而且包括所有与信息有关的自然和社会领域,如模式识别、计算机翻译、心理学、遗传学、神经生理学、语言学、语义学甚至包括社会学中有关信息的问题,是新兴的信息科学理论。
《信息论与编码》期末论文姓名文慧班级一班学号***********成绩二○一五年一月信息论与编码的应用与发展--纠错编码的应用与发展人类社会在经历了机械化、电气化之后进入了一个崭新的信息化时代。
信息论自诞生至今不到80年的时间,在人类科学史上是短暂的,但它的发展对学术界与人类社会的影响是相当广泛的。
信息论是通信技术与概率论、随机过程、数理统计相结合逐步发展而形成的一门新兴科学。
其研究的目的是发现信息传输的可靠性、有效性、保密性和认证性,以达到信息传输系统的最优化。
有效性、可靠性、保密性和认证性构成了现代通信系统对信息传输的全面要求。
其研究内容为香农理论,编码理论,维纳理论,检测和估计理论,信号设计和处理理论,调制理论,随机噪声理论和密码学理论等。
首先简单介绍一下信息论的起源、历史与发展。
1924年,Nyquist提出信息传输理论;1928年,Hartly提出信息量关系;1932年,Morse发明电报编码;1946年,柯切尼柯夫提出信号检测理论;1948年,Shannon提出信息论,“通信中的数学理论”—现代信息论的开创性的权威论文,为信息论的创立作出了独特的贡献。
现在人们常说的信息论与编码主要包括四大定理,第一定理信源编码定理,是解决通信中信源的压缩问题,也是后来图像和视频压缩的基本定理;第二定理信道编码定理,是解决通信中数据能够在特定信道中传输的最大值的问题,即最大数据速率小于信道容量,容量问题是通信中研究最活跃的问题之一,比如4G 或LTE中广泛用到的MIMO(多输入多输出,或多天线)技术,其理论本质是David Tse提出的该容量与天线数成线性递增的关系;第三定理有损信源编码定理解决了在允许一定失真的情况下的信源编码问题,比如jpeg图像编码,mp3音频编码,都是有损的编码,其都是在香农第三定理之下得出的;第四定理信源信道分离定理,解决了信源编码和信道编码能够分开来解决的问题。
这里具体介绍一下信道编码。
《信息论与编码》期末考察报告题目JPEG编码学生姓名蒲亚洁学号***********院系电子工程专业通信工程二O一三年一月八日JPEG编码蒲亚洁滨江学院电子工程系通信工程专业10级3班摘要:本文介绍了JPEG。
JPEG是一种针对相片影像而广泛使用的一种失真压缩标准方法。
JPEG 标准指定了一系列实现静态图像压缩编码的方法,这些方法的选择决定于具体应用的要求及性能价格比的考虑。
这些方法基本上可以分为两种:一种是采用以离散余弦变换(DCT)为基础的有损压缩算法,另一种是采用以预测技术为基础的无损压缩算法。
使用有损压缩算法时在压缩比为25﹕1 的情况下压缩后还原的图像与原始图像相比较非图像专家难以找到它们的区别因此得到了广泛的应用。
JPEG采取多种编码方式,包含有行程编码(Run Length Coding)和哈夫曼(Huffman)编码,有很高的压缩比。
在编码前,先对数据进行分块,离散余弦变换(DCT)及量化,保留能量大的低频信号,丢弃高频信号以达到压缩。
解码时,进行熵解码,反量化,反离散余弦变换(IDCT)。
关键词:有损压缩算法;无损压缩算法;失真压缩标准方法;哈夫曼编码;有损压缩;JPEGAbstract:This paper introduced JPEG.JPEG is a widely used for photo image of a standard method for compression distortion. JPEG standard specifies a series of static image compression coding method, these methods of selection determines the specific application requirements and performanceconsiderations. These methods generally can be divided into two kinds: one is using a discrete cosine transform (DCT) based on lossy compression algorithm, another is using a lossless compression algorithm based on prediction technology. When using lossy compression algorithms in the compression ratio of 25: 1 compressed restored image and non-image compared to the original image experts struggling to find their difference therefore is widely applied. JPEG multiple encoding contains the run length encoding (Run Length Coding), and Huffman (Huffman) encoding, a very high compression ratio. Before encoding, chunked data first, discrete cosine transform (DCT) and quantified, retain the energy of low-frequency signals, discarding high frequency signals in order to achieve compression. When decoding, entropy decoding, inverse quantization and inverse discrete cosine transform (IDCT).Keywords: A lossy compression algorithm;Llossy compression algorithm;Lossy compression standard method;Huffman coding;Lossy compression;JPEG1、引言信息时代,人们对使用计算机获取信息、处理信息的依赖性越来越高。
计算机系统面临的是数值、文字、语言、音乐、图形、动画、静图像、电视视频图像等多种媒体。
数字化的视频和音频信号的数量之大是惊人的,对于电视画面的分辨率640×480的彩色图像,30帧/s,则一秒钟的数据量为:640×480×24×30=221.12M,所以播放时,需要221Mbps的通信回路。
存储时,1张CD可存640M,则仅可以存放 2.89s的数据。
大数据量的图像信息会给存储器的存储容量,通信干线信道的带宽,以及计算机的处理速度增加极大的压力。
单纯靠增加存储器容量,提高信道带宽以及计算机的处理速度等方法来解决这个问题是不现实的,这时就要考虑压缩。
2、JPEG整个编码过程实现jpeg整个的编码过程实现:8*8的源图像数据变为范围为 -128~127对转换范围后的数据进行DCT变换,并四舍五入取接近的整数,公式为FDCT变换公式。
一共得到 64个 DCT 变换系数。
u=0且v=0 时,称为DC系数,是64个图像采样平均值。
剩下的63个系数称为AC系数。
对这64个DCT变换系数根据亮度量化表和色度量化表进行量化。
对量化后的系数进行采用zig-zag(“Z”字形)扫描,然后对量化后的DC系数进行 DPCM 编码,对量化后的AC系数进行行程编码。
对DPCM编码后的DC系数和行程编码后的AC系数继续进行熵编码,最后得到压缩后的图像数据。
FDCT变换公式:每个8*8二维源图像采集数据块,实际上是64点离散信号,该信号是空间二维参数x和y的函数。
离散余弦的变换的的每个变换系数值由64个输入信号唯一确定。
在频域平面上变换系数是二维频域变量u和v的函数。
对应于u=0,v=0的系数,称作直流分量,即DC系数,其余63个系数称作AC系数,即交流分量[1]。
图像基础知识在图像处理中,为了利用人的视角特性,从而降低数据量,通常把 RGB 空间表示的彩色图像变换到其他色彩空间。
现在常用的色彩空间变换有三种:YIQ,YUV 和 YCrCb。
每一种色彩空间都产生一种亮度分量信号和两种色度分量信号,而每一种变换使用的参数都是为了适应某种类型的显示设备。
YIQ:用于NTSC彩色电视制式YUV:用于PAL和SECAM彩色电视制式YCbCr:用于计算机显示器这三种彩色空间变换都会产生一种亮度分量信号和两种色度分量信号,然后把这些信号单独存储,显示的时候一起显示JPEG编码过程框图如下:量化表是控制 JPEG 压缩比的关键,这个步骤除掉了一些高频量;另一个重要原因是所有图片的点与点之间会有一个色彩过渡的过程,大量的图像信息被包含在低频率中,经过量化处理后,在高频率段,将出现大量连续的零。
[2]3、哈夫曼编码Huffman编码是一种常用的压缩编码方法,是Huffman于1952年为压缩文本文件建立的。
它的基本原理是频繁使用的数据用较短的代码代替,较少使用的数据用较长的代码代替,每个数据的代码各不相同。
这些代码都是二进制码,且码的长度是可变的。
举个例子:假设一个文件中出现了8种符号S0,S1,S2,S3,S4,S5,S6,S7,那么每种符号要编码,至少需要3比特,假设编码成000,001,010,011,100,101,110,111(称做码字)。
那么符号序列S0S1S7S0S1S6S2S2S3S4S5S0S0S1编码后变成000001111000001110010010011100101000000001,共用了42比特。
我们发现S0,S1,S2这三个符号出现的频率比较大,其它符号出现的频率比较小,如果我们采用一种编码方案使得S0,S1,S2的码字短,其它符号的码字长,这样就能够减少占用的比特数。
例如,我们采用这样的编码方案:S0到S7的码字分别01,11,101,0000,0001,0010,0011,100,那么上述符号序列变成011110001110011101101000000010010010111,共用了39比特,尽管有些码字如S3,S4,S5,S6变长了(由3位变成4位),但使用频繁的几个码字如S0,S1变短了,所以实现了压缩。
上述的编码是如何得到的呢?随意乱写是不行的。
编码必须保证不能出现一个码字和另一个的前几位相同的情况,比如说,如果S0的码字为01,S2的码字为011,那么当序列中出现011时,你不知道是S0的码字后面跟了个1,还是完整的一个S2的码字。
我们给出的编码能够保证这一点。
下面给出具体的Huffman编码算法。
1.首先统计出每个符号出现的频率,上例S0到S7的出现频率分别为4/14,3/14,2/14,1/14,1/14,1/14,1/14,1/14。
2.从左到右把上述频率按从小到大的顺序排列。
3.每一次选出最小的两个值,作为二叉树的两个叶子节点,将和作为它们的根节点,这两个叶子节点不再参与比较,新的根节点参与比较。
4.重复3,直到最后得到和为1的根节点。
5.将形成的二叉树的左节点标0,右节点标1。
把从最上面的根节点到最下面的叶子节点途中遇到的0,1序列串起来,就得到了各个符号的编码。
上面的例子用Huffman编码的过程如下图所示,其中圆圈中的数字是新节点产生的顺序。
可见,我们上面给出的编码就是这么得到的。
4、JPEG编码应用在图像处理领域,随着人们对于图像数据量的要求越来越大。
图像数据如果不进行有效压缩处理的话,不论是处理、传输还是存储,都将面临极大的困难。
现有的计算机的处理能力也难以处理这么大的数据信息,绝大多数网络的带宽,也不足以承载如此巨大的数据传输速率。
只有对图像数据进行压缩后,才适宜于处理,从而可大大减少用于传输和存储的工作量。
所以,图像数据在处理、传输和存储前必须要进行压缩,解决这一问题的有效方法就是利用数据压缩技术。
为了实现静止图像低复杂度和高压缩比的有效统一。
近年来JPEG标准在静止图像处理领域受到了广泛的关注,并对JPEG压缩编码算法的应用及发展前景进行研究。
2静态图像压缩标准JPEGJPEG[8]是联合图像专家组(Joint Picture Ex-pert Group)的英文缩写,是国际标准化组织(ISO)和CCITT联合制定的静态图像的压缩编码标准。