第2.1章_古典密码学
- 格式:ppt
- 大小:1.17 MB
- 文档页数:69
第一节语言的统计特性1为了研究一种密码的保密性能或者探讨这种密码的破译方法,必须研究明信息在密信息中有多大的泄漏,这就要首先研究明信息自身所具有的统计规律性,建立适当的统计模型。
2假设明信息是某种语言的文字(可能是英文文字、计算机程序或数据等),那么加密就是对该语言的明文进行一种变换,使其成为密信息。
然而明文和密文都是由被称为字母表的有限字符集中的字符组成。
3设字母表为X = {x0,x1,…,x m−1}.方便起见,也可用数字来表示,将字母表记为Z m= {0, 1,..., m−1}4例如,明信息为英文报文,可将其字母表记为X= {a, b,..., z} 或Z26= {0,1,..., 25}其中0表示a,1表示b,…,25表示z。
如果给字母表中的字母之间规定一个结合规则,便可确定一种语言。
如在英语中,字母q后面总是跟着字母u等。
5对于自然语言, 如果取一本非专业书籍,统计足够长的文章就会发现,字母(或字符)出现的频率会反映出相应语言的统计特性:每个字母出现的频率是相对稳定的。
6因此可用文中字母出现的频率近似地看成其在相应语言中出现的概率。
于是便得到该语言字母表X上的一个概率分布p= (p0, p1, …, p m−1) (2.1)我们也称(2.1)为该语言的一阶统计特性。
7例2.1英文字母表X={a, b, ..., z}。
由独立试验产生明文单码,Beker在1982年统计的样本总数为100362,得到单码的概率分布见表2.1。
这就是英文语言的一阶统计特性。
8根据表2.1,英文字母出现的概率按大小排列如下:E T A O I N S H R D L C UM W F G Y P B V K J X Q Z .9表2.1中, 不少字母出现的概率近乎相等。
若将英文字母按其出现的概率大小分类, 分类情况见表2.2。
10第二章 古典密码学表2.2 1 2 3 4 5 6 7 英文字母分类表 e t, a, o i, n, s, h, r d, l c, m, w, f, g, y, p, b, u v, k j, x, q, z11极大概率字母集: 大概率字母集: 较大概率字母集: 平均概率字母集: 较低概率字母集: 低概率字母集: 极低概率字母集:第二章 古典密码学如果我们随意统计一段足够长的英文文章, 只 要内容不是太特殊, 其结果一定和表2.1和表2.2基 本相同。