《信息编码1》选择题
- 格式:doc
- 大小:111.00 KB
- 文档页数:2
题号 一 二 三 四 总分 统分人 题分 35 10 23 32 100得分 一、填空题(每空1分,共35分) 得分| |阅卷人|1、1948年,美国数学家 发表了题为“通信的数学理论”的长篇论文,从而创立了信息论。
信息论的基础理论是 ,它属于狭义信息论。
2、信号是 的载体,消息是 的载体。
3、某信源有五种符号}{,,,,a b c d e ,先验概率分别为5.0=a P ,25.0=b P ,125.0=c P ,0625.0==e d P P ,则符号“a ”的自信息量为 bit ,此信源的熵为 bit/符号。
4、某离散无记忆信源X ,其概率空间和重量空间分别为1234 0.50.250.1250.125X x x x x P ⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦和1234 0.5122X x x x x w ⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦,则其信源熵和加权熵分别为 和 。
5、信源的剩余度主要来自两个方面,一是 ,二是 。
6、平均互信息量与信息熵、联合熵的关系是 。
7、信道的输出仅与信道当前输入有关,而与过去输入无关的信道称为 信道。
8、马尔可夫信源需要满足两个条件:一、 ; 二、 。
9、若某信道矩阵为⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡0100010000001100,则该信道的信道容量C=__________。
10、根据是否允许失真,信源编码可分为 和 。
11、信源编码的概率匹配原则是:概率大的信源符号用 ,概率小的信源符号用 。
(填短码或长码)12、在现代通信系统中,信源编码主要用于解决信息传输中的 性,信道编码主要用于解决信息传输中的 性,保密密编码主要用于解决信息传输中的安全性。
13、差错控制的基本方式大致可以分为 、 和混合纠错。
14、某线性分组码的最小汉明距dmin=4,则该码最多能检测出 个随机错,最多能纠正 个随机错。
15、码字101111101、011111101、100111001之间的最小汉明距离为 。
一、填空题(每空1分,共35分) 1、1948年,美国数学家 发表了题为“通信的数学理论”的长篇论文,从而创立了信息论。
信息论的基础理论是 ,它属于狭义信息论。
2、信号是 的载体,消息是 的载体。
3、某信源有五种符号}{,,,,a b c d e ,先验概率分别为5.0=a P ,25.0=b P ,125.0=c P ,0625.0==e d P P ,则符号“a ”的自信息量为 bit ,此信源的熵为 bit/符号。
4、某离散无记忆信源X ,其概率空间和重量空间分别为1234 0.50.250.1250.125X x x x x P ⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦和12340.5122X x x x x w ⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦,则其信源熵和加权熵分别为 和 。
5、信源的剩余度主要来自两个方面,一是,二是 。
6、平均互信息量与信息熵、联合熵的关系是 。
7、信道的输出仅与信道当前输入有关,而与过去输入无关的信道称为 信道。
8、马尔可夫信源需要满足两个条件:一、 ; 二、。
9、若某信道矩阵为⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡010001000001100,则该信道的信道容量C=__________。
10、根据是否允许失真,信源编码可分为 和 。
12、在现代通信系统中,信源编码主要用于解决信息传输中的 性,信道编码主要用于解决信息传输中的 性,保密密编码主要用于解决信息传输中的安全性。
13、差错控制的基本方式大致可以分为 、 和混合纠错。
14、某线性分组码的最小汉明距dmin=4,则该码最多能检测出 个随机错,最多能纠正 个随机错。
15、码字101111101、011111101、100111001之间的最小汉明距离为 。
16、对于密码系统安全性的评价,通常分为 和 两种标准。
17、单密钥体制是指 。
18、现代数据加密体制主要分为 和 两种体制。
19、评价密码体制安全性有不同的途径,包括无条件安全性、 和 。
信息论与编码题库信息论与编码模拟题⼀、填空题1、已知 8 个码组为(000000)、(001110)、(010101)、(011011)、(100011)、(101101)、(110110)、(111000)。
则该码组的最⼩码距是 3 ,若只⽤于检错可检测 2 位错码,若只⽤于纠错可纠正 1 位错码。
2、同时掷两个正常的骰⼦,也就是各⾯呈现的概率都是 1/6,则“两个 1 同时出现”这⼀事件的⾃信息量为 5.17 ⽐特。
3、已知信源的各个符号分别为字母A ,B ,C ,D ,现⽤四进制码元表⽰,每个码元的宽度为10ms ,如果每个符号出现的概率分别为1/5,1/4,1/4,3/10,则信源熵H (x )为 1.985 ⽐特/符号,在⽆扰离散信道上的平均信息传输速率为 198 bit/s 。
4.1948 年,美国数学家⾹农发表了题为“通信的数学理论”的长篇论⽂,从⽽创⽴了信息论。
5.对离散⽆记忆信源来说,当信源呈____________分布情况下,信源熵取最⼤值。
6、对于某离散信道,具有3 x 5的转移矩阵,矩阵每⾏有且仅有⼀⾮零元素,则该信道噪声熵为;最⼤信息传输率为。
7、⼆元删除信道BEC(0.01)的信道转移矩阵为,信道容量为;信道矩阵为100001010001010??的DMC 的信道容量为。
8.数据处理定理:当消息经过多级处理后,随着处理器数⽬的增多,输⼊消息与输出消息之间的平均互信息量趋于变⼩。
9.(7,3)码监督矩阵有 4 ⾏,⽣成矩阵有 3 ⾏。
10.对线性分组码,若要求它能纠正3个随机差错,则它的最⼩码重为 7 ,若要求它能在纠错2位的同时检错3位,则它的最⼩码重为 8。
11.汉明码是⼀种线性分组码,其最⼩码距为 3 。
12.信道编码的⽬的是提⾼数字信息传输的可靠性 ,其代价是降低了信息传输的有效性。
13.在通信系统中,纠检错的⼯作⽅式有反馈重发纠错、前向纠错、混合纠错等。
14.离散对称信道输⼊等概率时,输出为( 等概)分布。
1.按发出符号之间的关系来分,信源可以分为(有记忆信源)和(无记忆信源)2.连续信源的熵是(无穷大),不再具有熵的物理含义。
3.对于有记忆离散序列信源,需引入(条件熵)描述信源发出的符号序列内各个符号之间的统计关联特性3.连续信源X,平均功率被限定为P时,符合(正态)分布才具有最大熵,最大熵是(1/2ln(2 ⅇ 2))。
4.数据处理过程中信息具有(不增性)。
5.信源冗余度产生的原因包括(信源符号之间的相关性)和(信源符号分布的不均匀性)。
6.单符号连续信道的信道容量取决于(信噪比)。
7.香农信息极限的含义是(当带宽不受限制时,传送1bit信息,信噪比最低只需-1.6ch3)。
8.对于无失真信源编码,平均码长越小,说明压缩效率(越高)。
9.对于限失真信源编码,保证D的前提下,尽量减少(R(D))。
10.立即码指的是(接收端收到一个完整的码字后可立即译码)。
11.算术编码是(非)分组码。
12.游程编码是(无)失真信源编码。
13.线性分组码的(校验矩阵)就是该码空间的对偶空间的生成矩阵。
14.若(n,k)线性分组码为MDC码,那么它的最小码距为(n-k+1)。
15.完备码的特点是(围绕2k个码字、汉明矩d=[(d min-1)/2]的球都是不相交的每一个接受吗字都落在这些球中之一,因此接收码离发码的距离至多为t,这时所有重量≤t的差错图案都能用最佳译码器得到纠正,而所有重量≤t+1的差错图案都不能纠正)。
16.卷积码的自由距离决定了其(检错和纠错能力)。
(对)1、信息是指各个事物运动的状态及状态变化的方式。
(对)2、信息就是信息,既不是物质也不是能量。
(错)3、马尔可夫信源是离散无记忆信源。
(错)4、不可约的马尔可夫链一定是遍历的。
(对)5、单符号连续信源的绝对熵为无穷大。
(错)6、序列信源的极限熵是这样定义的:H(X)=H(XL|X1,X2,…,XL-1)。
(对)7、平均互信息量I(X;Y)是接收端所获取的关于发送端信源X的信息量。
第一章认识数据与大数据检测练习一、选择题1.下列关于信息编码的描述,正确的是()A.用手机扫二维码支付是信息编码的过程B.只有数字化的数据才能被保存和处理C.已知大写字母“I”的ASCII值是49H,则大写字母“J”的ASCII值是50HD.n进制表达式(6)n+(1)n的计算结果为两位n进制数,则n一定为72.下列关于大数据和数据安全的说法,不正确...的是()A.大数据可以处理非结构化的数据B.可以通过数据校验来提高数据的保密性C.利用大数据进行数据处理时,个别数据不准确不影响分析结果D.大数据的应用和发展可以帮助人们更好地利用数据,但同时也增加了数据泄露风险3.下列关于数据和信息的说法,正确的是()A.经加工处理后的假消息价值较低B.被删除到计算机中回收站的数据中没有信息存在C.残缺的竹简无法还原历史文献,说明了载体依附性D.大数据中数据结构很多,因此要求每个数据保证准确4.语音识别技术,目标是将人类的语音中的词汇内容转换为计算机可读的输入。
语音识别的流程包括信号处理(模数转换等)、信号表征(特征提取等)、模式识别。
其中特征提取、模式匹配和模型训练都离不开大量训练数据的积累和匹配, 随着大数据时代的来临,带来了大量文本或语音方面的语料数据。
语音识别技术还引入深度神经网络技术,更逼近人脑的思维能力,同时借助于大数据,极大地提升了语音识别准确率。
下列关于数据和大数据的说法不正确...的是()A.识别的语音为模拟信号B.语音识别结果在计算机内一般是以十六进制数存储C.大部分文本或语音方面的语料资源数据属于非结构化数据D.大数据价值密度低,需要对其“提纯”才能获得用于训练的语料数据5.下列关于大数据的说法,不正确...的是()A.处理大数据时,一般采用分治思想B.社交网络数据可采用图计算进行处理D.价值密度的高低与数据总量的大小成反比6.下列关于信息的说法,不正确的是()A.计算机只能处理数字化后的信息B.虚假广告的出现,说明信息具有真伪性C.数据灾备系统可以提高信息的安全性D.通过计算机获取的信息都是真实可信的7.将十六进制数225 转换成二进制数是()A.1000100101B B.100100110B C.11100001B D.100100111B 8.将声音数字化的过程需要对声音进行采样,一般采用三个参数来衡量,其中不包括()A.采样频率B.色彩位数C.声道数D.量化位数9.数据压缩是我们常用的文件存储方式,关于数据压缩,下列说法正确的是()A.W A V格式音频压缩为MP3格式,是无损压缩B.MPEG是常用的图片压缩格式C.因为有损压缩会产生失真,所以都使用无损压缩D.压缩比是衡量压缩技术的一个指标10.将二进制的数字“1000”转化十进制应该是()A.4B.6C.8D.1011.我们在选择数据采集方法时,既可以选择传感器采集数据,也可以使用网络获取数据。
· 1 ·2.1 试问四进制、八进制脉冲所含信息量是二进制脉冲的多少倍?解:四进制脉冲可以表示4个不同的消息,例如:{0, 1, 2, 3}八进制脉冲可以表示8个不同的消息,例如:{0, 1, 2, 3, 4, 5, 6, 7} 二进制脉冲可以表示2个不同的消息,例如:{0, 1} 假设每个消息的发出都是等概率的,则:四进制脉冲的平均信息量symbol bit n X H / 24log log )(1=== 八进制脉冲的平均信息量symbol bit n X H / 38log log )(2=== 二进制脉冲的平均信息量symbol bit n X H / 12log log )(0=== 所以:四进制、八进制脉冲所含信息量分别是二进制脉冲信息量的2倍和3倍。
2.2 居住某地区的女孩子有25%是大学生,在女大学生中有75%是身高160厘米以上的,而女孩子中身高160厘米以上的占总数的一半。
假如我们得知“身高160厘米以上的某女孩是大学生”的消息,问获得多少信息量?解:设随机变量X 代表女孩子学历X x 1(是大学生) x 2(不是大学生) P(X) 0.25 0.75设随机变量Y 代表女孩子身高Y y 1(身高>160cm ) y 2(身高<160cm ) P(Y) 0.5 0.5已知:在女大学生中有75%是身高160厘米以上的 即:bit x y p 75.0)/(11=求:身高160厘米以上的某女孩是大学生的信息量 即:bit y p x y p x p y x p y x I 415.15.075.025.0log )()/()(log )/(log )/(11111111=⨯-=-=-=2.3 一副充分洗乱了的牌(含52张牌),试问(1) 任一特定排列所给出的信息量是多少?(2) 若从中抽取13张牌,所给出的点数都不相同能得到多少信息量?解:(1) 52张牌共有52!种排列方式,假设每种排列方式出现是等概率的则所给出的信息量是:!521)(=i x p bit x p x I i i 581.225!52log )(log )(==-=(2) 52张牌共有4种花色、13种点数,抽取13张点数不同的牌的概率如下:· 2 ·bit C x p x I C x p i i i 208.134log)(log )(4)(135213135213=-=-==2.4 设离散无记忆信源⎭⎬⎫⎩⎨⎧=====⎥⎦⎤⎢⎣⎡8/14/1324/18/310)(4321x x x x X P X ,其发出的信息为(202120130213001203210110321010021032011223210),求 (1) 此消息的自信息量是多少?(2) 此消息中平均每符号携带的信息量是多少?解:(1) 此消息总共有14个0、13个1、12个2、6个3,因此此消息发出的概率是:62514814183⎪⎭⎫ ⎝⎛⨯⎪⎭⎫ ⎝⎛⨯⎪⎭⎫ ⎝⎛=p此消息的信息量是:bit p I 811.87log =-=(2) 此消息中平均每符号携带的信息量是:bit n I 951.145/811.87/==2.5 从大量统计资料知道,男性中红绿色盲的发病率为7%,女性发病率为0.5%,如果你问一位男士:“你是否是色盲?”他的回答可能是“是”,可能是“否”,问这两个回答中各含多少信息量,平均每个回答中含有多少信息量?如果问一位女士,则答案中含有的平均自信息量是多少?解: 男士:symbolbit x p x p X H bitx p x I x p bit x p x I x p i i i N N N Y Y Y / 366.0)93.0log 93.007.0log 07.0()(log )()( 105.093.0log )(log )(%93)( 837.307.0log )(log )(%7)(2=+-=-==-=-===-=-==∑女士:symbol bit x p x p X H ii i / 045.0)995.0log 995.0005.0log 005.0()(log )()(2=+-=-=∑2.6 设信源⎭⎬⎫⎩⎨⎧=⎥⎦⎤⎢⎣⎡17.016.017.018.019.02.0)(654321x x x x x x X P X ,求这个信源的熵,并解释为什么H(X) > log6不满足信源熵的极值性。
3.1数据编码练习题1.数字6的16×A.0001F B.1800 C.1818 D.1F182.在ASCII码中,小写英文字母a的十进制数是97,下列中选项中能正确表示ASCII码中的a的是()A.1100001B.01100001C.1100011D.011000113.十进制数47转换成的二进制数是()A.100010B.101100C.101111D.1110004.下列数字中,值最大的是()A.2D HB.111010 BC.37 HD.48 D5.进制转换(1)(79)10=____________2=____________16(2)(3E)16=____________D=____________B(3)(110100)2+(72)8+(2A)16=____________10(4)(54)10=(________)8, (197)8=(________)106.ASCII码为01111111,转换为Unicode码为()D.00000000011111117.声音数字化的步骤()A.采样、量化、编码B.编码、采样、量化C.编码、量化、采样D.量化、采样、编码8.在计算机内部,所有的数据都以()存储A.Unicode B.ASCII 码C.十六进制 D.二进制9.一个数字需要()存储。
A.1B B.1bC.1KB D.1MB10.下列数中是二进制数的是()。
A.1011011 B.12345 C.56112 D.1013611.一图片压缩后的大小是256KB,已知其压缩比10:1,原文件大小是()A.4MBB.10MBC.2560KBD.56KB参考答案:第1题:B第2题:B第3题:C第4题:C第5题:(1)1001111 4F(2)62 111110(3)152(4)16 143第6题:D第7题:A第8题:D第9题:A第10题:A第11题:C。
12207020建设工程项目信息的分类、编码和处理方法题库1-0-8问题:[问答题]信息编码问题:[单选]业主方和项目参与各方可根据各自的项目管理需求确定其信息管理的分类,但为了()的方便和实现部分信息共享,应尽可能作一些统一分类的规定。
A.信息加工B.信息交流C.信息处理D.信息汇总业主方和项目参与各方可根据各自项目管理的需求确定其信息的分类,但为了信息交流的方便和实现部分信息共享,应尽可能作一些统一分类的规定。
所以B正确。
问题:[单选]“信息获取便捷”、“信息透明度高”以及“信息流扁平化”有利于()。
A.项目信息的检索和查询B.项目参与方之间的信息交流C.数据和文件版本的统一D.项目的文档管理信息交流是确保各要素构成一个完整的、动态的、持续改进的体系和基础,应关注信息交流的内容和方式。
所以8正确。
(电竞圈 /)问题:[单选]对建设工程项目信息分类按()分为设计准备信息、设计信息、招投标信息和施工过程信息等。
A.项目管理工作的对象分类B.项目实施的工作过程C.项目管理工作的任务分类D.按信息内容的属性分类问题:[单选]一个建设项目有不同类型和不同用途的信息,为了有组织地存储信息、方便信息的检索和信息的整理,必须对项目的信息进行()。
A.编码B.归类C.汇总D.分解问题:[单选]建设工程项目的业主方和项目参与方的信息处理应考虑充分利用()的方式。
A.广域网通信B.远程数据通信C.局域网通信D.城域网通信问题:[多选]数据通信网络类型包括()。
A.无线网B.局域网C.城域网D.广域网E.互联网问题:[多选]建设工程项目信息按项目实施的工作过程分类,可按()等进行分类。
A.投资计划B.设计准备C.设计D.招标投标E.施工过程按项目实施的过程,如设计准备、设计、招标投标和施工过程等进行信息分类。
投资计划不属于项目实施的过程。
所以B、C、D、E正确。
汉字编码选择题复习1、一个汉字的内码长度为2个字节,其每个字节的最高二进制位的值依次分别是________。
A)0,0 B)0,1 C)1,0 D)1,1【解析】国标码是汉字信息交换的标准编码,但因其前后字节的最高位为0,与ASCII码发生冲突,于是,汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变,因此机内码前后字节最高位都为1。
2、、一个汉字的16×16点阵字形码长度的字节数是________。
A)16 B)24 C)32 D)40【解析】每个点阵用一个0或1代替,需要16*16个0或1,因为8位为一字节,换算成字节就是16*16/8.3、根据汉字国标GB2312-80的规定,一个汉字的内码码长为________。
A)8bit B)12bit C)16bit D)24bit【解析】一个汉字是两个字节,一字节是8bit,所以就是16bit。
4、下列4个4位十进制数中,属于正确的汉字区位码的是________。
A)5601 B)9596 C)9678 D)8799【解析】区位码:94×94阵列,区号范围:1~94,位号范围:1~94。
5、存储1024个24×24点阵的汉字字形码需要的字节数是________。
A)720B B)72KB C)7000B D)7200B【解析】在24×24的网格中描绘一个汉字,整个网格分为24行24列,每个小格用1位二进制编码表示,每一行需要24个二进制位,占3个字节,24行共占24×3=72个字节。
1024个需要1024×72=73728字节。
6、在计算机中,对汉字进行传输、处理和存储时使用汉字的________。
A)字形码 B)国标码 C)输入码D)机内码【解析】显示或打印汉字时使用汉字的字形码,在计算机内部时使用汉字的机内码。
7、区位码输入法的最大优点是________。
《信息编码》选择题
1、提出计算机内的程序和数据都应采用二进制代码表示的是()
(A)乔治·布尔(B)莱布尼兹(C)香农(D)冯·诺依曼
2、在计算机内部,信息的存储和处理都采用二进制,最主要的原因是()
(A)便于存储(B)数据输入方便(C)可以增大计算机存储容量(D)易于用电子元件实现3.二进制数(1101)2转换成十进制数是()
(A)10 (B)11 (C)12 (D)13
4.十进制数19转换成二进制数是()
(A)(10001)2 (B)(10011)2 (C)(10101)2 (D)(11101)2
5.二进制数(101011)2转换成十六进制数是()
(A)10AH (B)10BH (C)2AH (D)2BH
6.十六进制数3AH转换成二进制数是()
(A)(100001)2 (B)(110101)2 (C)(111010)2 (D)(111111)2
7.“全拼输入法”属于输入码中的()
(A)处理码 (B)交换码 (C)字形码 (D)拼音码
8.标准ASCII码最多能表示的字符个数是()
(A)128 (B)127 (C)64 (D)8
9.在GB 2312汉字编码字符集中,一个汉字的编码所占的字节数是()
A、1
B、2
C、4
D、8
10、字符编ASCII码是一种字符编码,每一字符存储时需占用的字节数是()
A、1
B、 2
C、4
D、8
11.汉字“人”的内码是“11001000 11001011”,那么在UltraEdit软件中观察到的十六进制编码是()
(A)B8 CB (B)B8 BA (C)D8 DC (D)C8 CB
12、张汉在用WINHEX软件观察“IT行业”这四个字符的内码时,结果如下图所示。
从中可以看出,字符“T”的内码(十六进制表示)是()
A、49
B、54
C、49 54
D、 D0 D0
13、大写字母C的ASCII码值为67,则大写字母A的ASCII码值为( )
A、69
B、68
C、65
D、63
14.某电子设备的电路板上有一个6位“跳板开关”,此开关每一位都只有“打开”和“闭合”两种状态。
这个“跳板开关”最多能表示的状态数为()
A.128 B.64 C.60 D.6
15、1个字节由()个二进制位组成。
(A)2(B)8(C)10(D)7
16、1024 MB的存储容量等于()
(A) 1 TB(B) 1024 KB(C) 1 GB(D) 1024*1024 B
17.下列有关图形与图像的说法正确的是()
(A)矢量图的基本单元是像素(B)对矢量图进行放大,不会影响图形的清晰度和光滑度
(C)位图往往比矢量图占用空间更少(D)用“画图”程序既可以绘制位图也可以绘制矢量图
18、一般情况下,描述图像的最小单位是()
A、像素
B、英寸
C、厘米
D、毫米
19、在计算机中表示一个黑白像素的点,需要的存储空间是()
A、1个位
B、1个字节
C、2个位
D、2 个字节
20、1024×768像素的图像,每个像素占用2个字节的存储空间,为了存储这幅图像所需的字节数是()
A、1.5K
B、192K C 、1.5M D 、3M
21、存储一幅640×480像素的256色位图图像,需用的字节数约是()
A、38400
B、76800
C、153600
D、307200
22、存储一幅没有经过压缩的1024×768像素、24位真彩色的图像需要的字节数约为()
A、768K
B、 1.5M
C、2.25M
D、18M
23、若用数码相机的1024*768模式可拍50张照片,为了拍摄多于50张照片,可把相机分辨率调为()
A、800*600
B、1152*864
C、1280*768
D、1600*1200
24、一幅1024×768像素,16位色的图像,不经过压缩,也不改变尺寸,只是把它另存为256色的图像,其存储空间将()
A、不变
B、变大
C、变小
D、由显示器大小而定
25、以下不属于图像编辑软件的是()
A、Photoshop B 、 CorelDRAW C 、画图 D、记事本。