当前位置:文档之家› 计算机中数据的表示与信息编码

计算机中数据的表示与信息编码

计算机中数据的表示与信息编码
计算机中数据的表示与信息编码

计算机中数据的表示与信息编码计算机最主要的功能是处理信息,如处理文字、声音、图形和图像等信息。在计算机内部,各种信息都必须经过数字化编码后才能被传送、存储和处理。因此要了解计算机工作的原理,还必须了解计算机中信息的表现形式。

1.2.1 计算机使用的数制

1.计算机内部是一个二进制数字世界

计算机内部采用二进制来保存数据和信息。无论是指令还是数据,若想存入计算机中,都必须采用二进制数编码形式,即使是图形、图像、声音等信息,也必须转换成二进制,才能存入计算机中。为什么在计算机中必须使用二进制数,而不使用人们习惯的十进制数?原因在于:

⑴易于物理实现:因为具有两种稳定状态的物理器件很多,例如,电路的导通与截止、电压的高与低、磁性材料的正向极化与反向极化等。它们恰好对应表示1和0两个符号。

⑵机器可靠性高:由于电压的高低、电流的有无等都是一种跃变,两种状态分明,所以0和1两个数的传输和处理抗干扰性强,不易出错,鉴别信息的可靠性好。

⑶运算规则简单:二进制数的运算法则比较简单,例如,二进制数的四则运算法则分别只有三条。由于二进制数运算法则少,使计算机运算器的硬件结构大大简化,控制也就简单多了。

虽然在计算机内部都使用二进制数来表示各种信息,但计算机仍采用人们熟悉和便于阅读的形式与外部联系,如十进制、八进制、十六进制数据,文字和图形信息等,由计算机系统将各种形式的信息转化为二进制的形式并储存在计算机的内部。

2.进位计数制

数制,也称计数制,是指用一组固定的符号和统一的规则来表示数值的方法。数制可分为非进位计数制和进位计数制两种。非进位计数制的数码表示的数值大小与它在数中的位置无关;而进位计数制的数码所表示的数值大小则与它在数中所处的位置有关。而我们在这里讨论的数制指的都是进位计数制。

进制是进位计数制的简称,是目前世界上使用最广泛的一种计数方法,它有基数和位权两个要素。

基数:在采用进位计数制的系统中,如果只用r个基本符号(例如0,1,2,…,

r-1)表示数值,则称其为r数制(Radix-r Number System),r称为该数制的基数(Radix)。如日常生活中常用的十进制,就是r=10,即基本符号为0,1,2,…,9。如取r=2,即基本符号为0和1,则为二进制数。

位权:每个数字符号在固定位置上的计数单位称为位权。位权实际就是处在某一位上的1所表示的数值大小。如在十位制中,个位的位权是100,十位的位权是101,…;向右依次是10-1,10-2,…。而二进制整数右数第2位的位权为2,第3位的位权为4,第4位的位权为8。一般情况下,对于r进制数,整数部分右数第i位的位权为r i-1,而小数部分左数第i位的位权为r-i。

各种进制的共同点是:

⑴每一种数制都有固定的符号集。如十进制数制,其符号有十个:0,1,2, (9)

二进制数制,其符号只有两个:0和1。需要指出的是,16进制数基数为16,所以有16个基本符号,分别为0,1,2,…,8,9,A,B,C,D,E,F。表1-3列出了计算机中常用的几种进制。

⑵采用位置表示法,用位权来计数。即处于不同位置的数符所代表的值不同,与它所在位置的权值有关。例如:十进制的1358.74可表示为:

1358.74=1×103+3×102+5×101+8×100+7×10-1+4×10-2

可以看出,各种进位制中的位权的值恰好是基数的某次幂。因此,对于任何一个进位计数制表示的数都可以写出按其权值展开的各项式之和,称为“按权展开式”。任意一个n位整数和m位小数的r进制数D可表示为:

D. D m

∑-

-

=

?=

m

n

i

i

i

r

D

D

1

⑶按基数来进位和借位(逢r进一,借一当r)。

现列举二进制的算术运算如下:从这里我们能够体会到二进制的运算的确能够起到简化硬件的作用.

加法:0+0=0减法:0-0=0

0+1=10-1=1(借位)

1+0=11-0=1

1+1=10(进位)1-1=0

乘法:0×0=0除法: 0 ÷1=0

n位整数m位数

0×1=01÷1=1

1×0=0

1×1=1

表1-3 计算机中常用的几种进位数制

1.2.2 数制间的相互转换

1.非十进制数转换十进制数

r进制转换为十进制数,采用r进制数的位权展开法,即将r进制数按“位权”展开形成多项式并求和,得到的结果就是转换结果。

【例1.1】【例1.1】把(11011.101)2转换成十进制数

解:(11011.101)2 = 1524 + 1523 + 0522 + 1521 + 1520 + 152-1 + 052-2 + 152-3

= 16 + 8 + 0 + 2 + 1 + 0.5 + 0 +0.125

= (27.625)10

2.十进制数转换非十进制数

转换规则:整数部分采用“逐次除以基数取余”法,直到商为0;

小数部分采用“逐次乘以基数取整”法,直到小数部分为0或取到有效数

位。

⑴十进制数转换成二进制数:整数部分采用“除2取余”法;

小数部分采用“乘2取整”法

【例1.2】把(157.6875)10转换成二进制数

注:十进制小数不一定能转换成完全等值的二进制小数,有时要取近似值。

(0.6875)10 = (1011) 2结果:(157.6875)10 = (10011101.1011)2

⑵用同样的方法,可将十进制数转换成八进制数和十六进制数,分别采用“除8取余,乘8取整”和“除16取余,乘16取整”法。

3. 非十进制数之间的转换

通常两个非十进制数之间的转换方法是采用上述两种方法的组合,即先将被转换数转换为相应的十进制数,然后再将十进制数转换为其他进制数。由于二进制、八进制和十六进制之间存在着特殊关系,即81=23,161=24,因此转换方法就比较容易,如表1-4所示。

⑴二进制、八进制数之间的转换。

由于1位八进制数相当于3位二进制数,因此,二进制数转换成八进制数,只需以小数点为界,整数部分按照由右至左(由低位向高位)、小数部分按照从左至右(由高位向低位)的顺序每三位划分为一组,最后不足3位二进制数时用零补足。按表1-4,每三位二进制数分别用与其对应的八进制数码来取代,即可完成转换。而将八进制转换成二进制的过程正好相反。

【例1.3】将(11001110.01010111)2 转换成八进制数。

(011001110.010101110)2

↓↓↓↓↓↓

(316.2 5 6)8

【例1.4】将(574.623)8 转换成二进制数。

(574.623)8

↓↓↓↓↓↓

(101111100.110010011)2

⑵二进制、十六进制数之间的转换

由于十六进制的1位数相当于二进制的4位数,因此二进制同十六进制之间的转换就如同二进制同八进制之间的转换一样,只是4位一组,不足补零。

【例1.5】将(11011 1110 0011 . 1001 011)2 转换成十六进制数。

(0001101111100011.10010110)2

↓↓↓↓↓↓

(1BE3.96)16

表1-4 二进制、八进制和十六进制之间的关系

且目前大部分微型机的字长是4位、8位、16位、32位和64位的,都是4的整数倍,故在书写时可用十六进制表示。一个字节(8位)可用两位十六位进制数表示,两个字节(16位)可用4位十六进制表示等,书写方便且不容易出错。

1.2.3 二进制数在计算机内的表示

计算机中的数据包括数值型和非数值型两大类。

数值型数据指可以参加算术运算的数据,例如(123)10、(1001.101)2等。

非数值型数据不参与算术运算。例如字符串“电话号码:2519603”、“4的3倍等于12”等都是非数值数据。注意这两个例子中均含有数字,如2519603、4、3、12 ,但它们不能也不需要参加算术运算,故仍属非数值数据。

下面讨论数值型的二进制数的表示形式:

1. 机器数

在计算机中,因为只有“0”和“1”两种形式,所以数的正负,也必须以“0”和“1”表示。通常把一个数的最高位定义为符号位,用0表示正,1表示负,称为数符,其余位仍表示数值。把在机器内存放的正、负号数码化的作为一个整体来处理的二进数串称为机器数(或机器字),而把机器外部由正、负表示的数称为真值数。

例:真值为(+1010011) B的机器数为01010011,存放在机器中,等效于+83。

需注意的是,机器数表示的范围受到字长和数据的类型的限制。字长和数据类型定了,机器数能表示的数值范围也就定了。例如,若表示一个整数,字长为8位,则最大的正数为01111111,最高位为符号位,即最大值为127。若数值超出127,就要“溢出”。

2. 数的定点表示和浮点表示

当计算机所需处理的数含有小数部分时,又出现了如何表示小数点的问题。计算机中并不单独利用某一个二进制位来表示小数点,而是隐含规定小数点的位置。根据小数点位置是否固定,计算机中的数可分为定点数和浮点数两种。

⑴定点表示法:所谓定点表示法就是小数点在数中的位置固定不变,它总是隐含在预定位置上。通常,对于整型数,小数点固定在数值部分的右端,即在数的最低位之后,其格式如图1-2所示;对于小数,小数点固定在数值部分左端,即在数的符号位之后、最高数位之前,其格式如图1-3所示。

例如:定点整数120用8位二进制数可表示为01111000,其中最高位0表示符号为正。

根据计算机字长不同,如果用n个二进制位存放一个定点整数,那么它的表示范围为:-2n-1~2n-1-1。

说明:上面表示的整数的范围是以补码形式表示的,有关补码的知识在后面介绍。

定点小数-0.125用8位二进制数可表示为10010000,其中最高位1表示号为负。

根据计算机字长不同,如果用n个二进制位存放一个定点小数(纯小数),其表示范围为:-1~(2- (n-1))。

⑵数的浮点表示

定点数用来表示整数或纯小数。如果,一个数既有整数部分,又有小数部分,采用定点格式就会引起一些麻烦和困难。因此,计算机中使用浮点表示方法。

浮点表示法对应于科学(指数)计数法,如数110.011可表示为

N=110.011=1.10011×2+10 =11001.1×2-10 =0.110011×2+11

浮点表示法中的小数点在数中的位置不是固定不变的,是浮动的。任何浮点数都由阶码和尾数两部分组成,阶码是指数,尾数是纯小数。其存储格式如图1-4所示。其中,数符和阶符都各占一位,数符是尾数(纯小数)部分的符号位;而阶符为阶码(指数部分)的符号位。阶码的位数随数值的表示的范围而定,尾数的位数则依数的精度而定。当一个数的阶码大于

例如,设尾数为4位,阶码为2位,则二进制数N=1011×1011的浮点数表示形式为

阶符 阶码

数符 尾数

应当注意的是:浮点数的正负是由尾数的数符确定的,而阶码的正、负只决定小数点的位置,即决定浮点数的绝对值的大小。当浮点数的尾数为零或阶码为最小值时,机器通常规定,把该数看作零,称为机器零。

3. 带符号数的表示

在计算机中,带符号数可以用不同方法表示,常用的有原码、反码和补码。 ⑴ 原码

数X 的原码记作 [X]原,如果机器字长为n ,由则原码的定义如下:

例: X 1 ,X 2

[X 1]原 [X 2]原原由此可以看出,原码的最高位为符号位,正数为0,负数为1,其余n-1位表示数的真值的绝对值。其中,0的原码表示有两种,[+0]原=00000000 [-0]原=10000000

采用原码的优点是简单易懂,与真值转换方便,用于乘除法运算十分方便。但是对于加减法运算就麻烦了,因为当两个同号数相减或两个异号数相加时,必须判断两个数的绝对值哪个大,用绝对值大的数减去绝对值小的数,而运算结果的符号则应取与绝对值大的数相同符号。要完成这些操作相当麻烦,还会增加运算器的复杂性。为了克服原码的缺点,引进了数的补码表示方法。 ⑵ 补码

数X

码(符号位除外)各位取反,并在末位加1而得到的数。

例: X 1 ,X 2的真值为 X 1=+1010110 X 2=-1001010 , 补码表示为 [X 1]补=01010110 [X 2]补=10110110

在补码中,0有唯一的编码:[+0]补=[-0]补=00000000

补码可以将减法运算转化为加法运算,即实现类似代数中的x-y = x+(-y)的运算。如补码的加减法运算规则:[X+Y]补=[X]补+[Y]补[X-Y]补=[X]补+[-Y]补

⑶反码

反码是对负数原码除符号位外逐位取反所得的数,正数的反码则与其原码形式相同。

例:X1 ,X2的真值为X1=+1010110 X2=-1001010 , 反码表示为

[X1]反=01010110 [X2]反=10110101

同样,反码表示方式中,0有两种表示方法:[+0]反=00000000 [-0]反=11111111

1.2.4 数字化信息编码

数字化信息编码是把少量二进制符号(代码),根据一定规则组合起来,以表示大量复杂多样的信息的一种编码。一般来说,根据描述信息的不同可分为数字编码、字符编码、汉字编码等。

1. 数字编码

数字编码是用二进制数码按照某种规律来描述十进制数的一种编码。最简单最常的是8421码,或称BCD码(Binary-Code-Decimal)。它利用四位二进制代码进行编码,这四位二进制代码,从高位至低位的位权分别为23、22、21、20,即8、4、2、1。并用来表示一位十进制数。下面列出十进制数符与8421码的对应关系。

十进制数0123456789

8421码0000000100100011010001010110011110001001

根据这种对应关系,任何十进制数都可以同8421码进行转换。

如(52)10=(01010010)BCD (1001 0100 1000 0101)=(9485)10

2.字符编码

在计算机系统中,除了处理数字外,还需要把符号、文字等利用二进制表示,这样的二进制数称为字符编码。

ASCII码(American Standard Code of Information Interchange)是“美国标准信息交换代码”的缩写。该种编码后来被国际标准化组织ISO采纳,作为国际通用的字符信息编码方案。ASCII码用7位二进制数的不同编码来表示128个不同的字符(因27=128),它包含十进制数符0~9、大小写英文字母及专用符号等95种可打印字符,还有33种通用控制字符(如回车、换行等),共128个。ASCII码表如表1-5所示,如A的ASCII码为1000001。ASCII码中,每一个编码转换为十进制数的值被称为该字符的ASCII码值。

表1-5 ASCII表

2. 2.汉字编码:

汉字在计算机内也采用二进制的数字化信息编码。由于汉字的数量大,常用的也有几千个之多,显然汉字编码比ASCII码表要复杂得多,用一个字节(8 bit)是不够的。目前的汉字编码方案有二字节、三字节甚至四字节的。在一个汉字处理系统中,输入、内部处理、输出对汉字的要求不同,所用代码也不尽相同。汉字信息处理系统在处理汉字词语时,要进行输入码、国标码、内码、字型码等一系列的汉字代码转换。

⑴国标码

1981年我国制定了《中华人民共和国国家标准信息交换汉字编码》(GB2312-80标准),

这种编码称为国标码。在国标码字符集中共收录了汉字和图形符号7445个,其中一级汉字3755个,二级汉字3008个,西文和图形符号682个。

国标GB2312-80规定,所有的国标汉字与符号组成一个94594的矩阵。在此方阵中,每一行称为一个区(区号分别为01~94)、每个区内有94个位(位号分别为01-94)的汉字字符集。

汉字与符号在方阵中的分布情况如下:

1~15区为图形符号区:

16~55区为一级常用二级汉字区

56~87区为不常用的二级汉字区

88~94区为自定义汉字区。

⑵汉字输入码与机内码

计算机处理时,由于汉字具有特殊性,因此汉字输入、存储、处理及输出过程所使用的代码均不相同。其中包含用于汉字输入的输入码、机内存储和处理的机内码、用于显示及打印的字模点阵码(字形码)。

输入码(外码)

汉字由各种输入设备以不同方式输入计算机所用到的编码。每一种输入码都与相应的输入方案有关。根据不同的输入编码方案不同,一般可分类为:数字编码(如区位码)、音码(如拼音编码)、字形码(如五笔字型编码)及音形混合码等。

机内码

汉字系统中对汉字的存储和处理使用了统一的编码,即汉字机内码(机内码、内码)。机内码与国标码稍有区别,如果直接用国标码作内码,就会与ASCII码冲突。在汉字输入时,根据输入码通过计算或查找输入码表完成输入码到机内码的转换。如汉字国标码(H)+8080(H)=汉字机内码(H)。

⑶汉字库与汉字字形码。

汉字在显示和打印输出时,是以汉字字形信息表示的,即以点阵的方式形成汉字图形。汉字

字形码是指确定一个汉字字形点阵的代码(汉字字模)。

一般采用点阵表示字形。如图1-5所示是一个16×16点

阵的汉字“中”,用“1”表示黑点、“0”表示白点,则

黑白信息就可以用二进制数来表示。每一个点用一位二

进制数来表示,则一个16×16的汉字字模要用32个字

节来存储。国标码中的6763个汉字及符号码要用261696字节存储。以这种形式存储所有汉字字形信息的集合称为汉字字库。可以看出,随着点阵的增大,所需存储容量也很快变大,其字形质量也越好,但成本也越高。目前汉字信息处理系统中,屏幕显示一般用16×16点阵,打印输出时采用32×32点阵,在质量要较高时可以采用更高的点阵。

计算机中数据的表示与信息编码

计算机中数据的表示与信息编码 计算机最主要的功能是处理信息,如处理文字、声音、图形和图像等信息。在计算机内部,各种信息都必须经过数字化编码后才能被传送、存储和处理。因此要了解计算机工作的原理,还必须了解计算机中信息的表现形式。 1.2.1 计算机使用的数制 1.计算机内部是一个二进制数字世界 计算机内部采用二进制来保存数据和信息。无论是指令还是数据,若想存入计算机中,都必须采用二进制数编码形式,即使是图形、图像、声音等信息,也必须转换成二进制,才能存入计算机中。为什么在计算机中必须使用二进制数,而不使用人们习惯的十进制数?原因在于: ⑴易于物理实现:因为具有两种稳定状态的物理器件很多,例如,电路的导通与截止、电压的高与低、磁性材料的正向极化与反向极化等。它们恰好对应表示1和0两个符号。 ⑵机器可靠性高:由于电压的高低、电流的有无等都是一种跃变,两种状态分明,所以0和1两个数的传输和处理抗干扰性强,不易出错,鉴别信息的可靠性好。 ⑶运算规则简单:二进制数的运算法则比较简单,例如,二进制数的四则运算法则分别只有三条。由于二进制数运算法则少,使计算机运算器的硬件结构大大简化,控制也就简单多了。 虽然在计算机内部都使用二进制数来表示各种信息,但计算机仍采用人们熟悉和便于阅读的形式与外部联系,如十进制、八进制、十六进制数据,文字和图形信息等,由计算机系统将各种形式的信息转化为二进制的形式并储存在计算机的内部。 2.进位计数制 数制,也称计数制,是指用一组固定的符号和统一的规则来表示数值的方法。数制可分为非进位计数制和进位计数制两种。非进位计数制的数码表示的数值大小与它在数中的位置无关;而进位计数制的数码所表示的数值大小则与它在数中所处的位置有关。而我们在这里讨论的数制指的都是进位计数制。 进制是进位计数制的简称,是目前世界上使用最广泛的一种计数方法,它有基数和位权两个要素。 ??基数:在采用进位计数制的系统中,如果只用r个基本符号(例如0,1,2,…,r-1)表示数值,则称其为r数制(Radix-r Number System),r称为该数制的基数(Radix)。如日常生活中常用的十进制,就是r=10,即基本符号为0,1,2,…,9。如取r=2,即基本符号为0和1,则为二进制数。 ??位权:每个数字符号在固定位置上的计数单位称为位权。位权实际就是处在某一位上的1所表示的数值大小。如在十位制中,个位的位权是100,十位的位权是101,…;向右依次是10-1,10-2,…。而二进制整数右数第2位的位权为2,第3位的位权为4,第4位的位权为8。一般情况下,对于r进制数,整数部分右数第i位的位权为r i-1,而小数部分左数第i位的位权为r-i。 各种进制的共同点是: ⑴每一种数制都有固定的符号集。如十进制数制,其符号有十个:0,1,2, (9) 二进制数制,其符号只有两个:0和1。需要指出的是,16进制数基数为16,所以有16个基本符号,分别为0,1,2,…,8,9,A,B,C,D,E,F。表1-3列出了计算机中常用的几种进制。 ⑵采用位置表示法,用位权来计数。即处于不同位置的数符所代表的值不同,与它所在位置的权值有关。例如:十进制的1358.74可表示为: 1358.74=1×103+3×102+5×101+8×100+7×10-1+4×10-2 可以看出,各种进位制中的位权的值恰好是基数的某次幂。因此,对于任何一个进位计数制表示的数都可以写出按其权值展开的各项式之和,称为“按权展开式”。任意一个n位整数和m位小数的r进制数D可表示为:

信息编码和其在计算机中的运用

第2章信息编码及在计算机中的表示 2.1 信息的数字化编码 编码:是用来将信息从一种形式转变为另一种形式的符号系统,通常选用少量最简单的基本符号和一定的组合规则,以表示出大量复杂多样的信息。 信息的数字化编码:是指用“0”或“1”这种量最少、最简单的二进制数码,并选用一定的组合规则,来表示数据、文字、声音、图形和图像等各种复杂的信息。 计算机中采用的是二进制数码,为什么?(重点) 2.2 进位计数制及其相互转换 2.2.1 进位计数制 数制中的三个基本名词术语: 数码:用不同的数字符号来表示一种数制的 数值,这些数字符号称为“数码”。 基:数制所使用的数码个数称为“基”。 权:某数制各位所具有的值称为“权”。 1.十进制数(Decimal System) 数码:0、1、…… 8、9 基:10(逢十进一,借一当十) 权:以10为底的幂 任何一个十进制数DnDn-1…D1D0D-1…,可以表示成按权展开的多项式: Dn×10n+Dn-1×10n-1+…+D1×101+D0×100+D-1×10-1+…+D-m×10-m 例如:1234.5的按权展开多项为:1234.5=1×103+2×102+3×101+4×100+5×10-1 ⒉二进制数 二进制(Binary System) 数码: 0和1 基:2 权:以2为底的幂 任何一个二进制数BnBn-1…B1B0B-1…B-m,可以表示成按权展开的多项式: Bn×2n+Bn-1×2n-1+…+B1×21+B0×20+B-1×2-1+…+B(-m+1)×2-(m-1)+B-m ×2-m 例如: 1101.01的按权展开多项为: 1101.01=1×23+1×22+0×21+1×20+0×2-1+1×2-2 ⒊八进制数 八进制数(Octave System) 数码: 0、1、…… 6、7 基: 8 权:以8为底的幂

计算机数据与编码

计算机数据与编码 1.6.1信息和数据 信息是人们对客观世界的认识,即对客观世界的一种反映。 数据是表达现实世界中各种信息的一组可以记录、可以识别的记号或符号。它是信息的载体,是信息的具体表现形式。 数据形式可以是字符、符号、表格、声音、图像等。 数据可以在物理介质上记录或传输,并通过输入设备传送给计算机处理加工。数据的单位分为以下几种: 1)位(bit) 计算机中最小的数据单位二进制的一个数位,称为比特位,简称位。 1位二进制只能表示两种状态,即0或1。n位二进制能表示2n种状态 2)字节(Byte) 相邻8个比特位组成一个字节,用B表示。字节是计算机中用来表示存储容量大小的基本单位。 1B = 8bits 1KB = 210B = 1024B 1MB = 220B = 1024KB 1GB = 230B = 1024MB 1TB = 240B = 1024GB 3)字(Word) 在计算机中作为一个整体被存取、传送、处理的二进制数位叫做一个字,每个字中二进制位数的长度,称为字长。 用8位字长表示一个整数与用16位字长表示一个整数,其所表示的数的上限和下限是不一样的。 字长所占位数其所表示的数的范围 8 -128 ~ 127 即:-27 ~ (27 - 1) 16 -32768 ~ 32767 即:-215 ~ (215 - 1)

32 -48 ~ 47 即:-231 ~ (231 - 1) 1.6.2 数字化信息编码 在计算机内部,可用物理器件的高低电平代表二进制的“0”和“1”,另外,脉冲的正负极性,晶体管的导通和截止都可以用来表示二进制的“0”和“1”。由于二进制只有两个状态,数据的传输和处理不容易出错,另外二进制数的记数、加减法运算规则较为简单,可用开关电路实现,且二进制的“0”和“1”正好与逻辑命题的两个值“真”和“假”相对应,为计算机种中实现逻辑运算和逻辑判断提供了便利的条件。所以,在计算机中,广泛采用的是只有“0”和“1”两个基本符号组成的基二码,或称为二进制码。 计算机最重要的功能是处理信息,这些信息包括数值、文字、图形、符号、图象、声音等,所有这些信息都必须经过编码,转换成计算机能够识别和处理的二进制码的形式才能够被存储、传送和加工。 BCD码是二进制编码的十进制数(Binary Coded Decimal)的简写。有四位BCD码、六位BCD码和扩展的BCD码三种。 (1)非数值数据的表示 1) 字符数据的表示 ASCII码(America Standard Code for Information Interchage)是美国标准信息交换码,被国际化组织指定为国际标准,分为7位和8位两种版本。 国际通用的是7位ASCII码,它已对大、小写英文字母、阿拉伯数字、标点符号及控制符等特殊符号编码,共128个字符。 (2) 汉字的表示 汉字与英文的主要区别:

计算机中的数据与编码

计算机中的数据与编码 一、数据的单位与存储形式(掌握) 1.数据是指能够输入计算机并被计算机处理的数字、字母和符号的集合。 2.在计算机内部,数据是以二进制的形式存储和运算的。 3.数据的表示形式:数据的最小单位是二进制的一位数(Bit)。 4.数据的存储形式:数据存储的最小单位是Byte。 5.文件存储的最小单位是簇 6.一个字节(Byte)由八个二进制位组成。 7.通常一个英文字符用一个字节存储,一个汉字机内编码需要两个字节甚至更多的字节来存储。 8.在计算机中常用一个字来表示该种计算机能最方便、最有效地进行操作的数据或信息的长度。一个字由若干字节组成。通常将组成一个字 的位数叫作该字的字长。例如:在8位机中,每个字由一个字节组成; 在16位机中,每个字由两个字节组成。 9.单位换算:1GB=1024MB 1MB=1024KB 1KB=1024B=210B 1TB=1024GB 二、字符的编码(理解) 字符编码就是规定用怎样的二进制码来表示字母、数字以及专门符号。在计算机系统中,有两种重要的字符编码方式:EBCDIC和ASCⅡ。前者主要用于IBM的大型主机,后者则用于微型机与小型机。 1.ASCII码 (1)ASCII是美国标准信息交换码(American Standard Code for Information Interchange),它已被国际化组织接收为国际标准。 (2)ASCII码有7位,它包含10个阿拉伯数字、52个英文大小写字母、 32个标点符号和运算符以及34个控制码。总共128个符,所以可用7 位码(27=128)来表示。具体编码见课本P16。通过表可以确定一个数 字、字母、符号或控制码的ASCII码。例如,数字“0”的ASCII码是?, “9”的ASCII码是?;字母“A”的ASCII码是?,“a”的ASCII码是?。

第1章 数据的表示与编码 习题与答案

第一章习题 一、复习题 1、试述数制的概念。 位置化数字系统中,在数字中符号所占据的位置决定了其表示的值。大多数人使用的数字系统是以10为底的,也就是十进制。二进制数字系统是最简单的数字系统。(P21-23) 2、列举出你所知道的数字系统。 提示:根据本章内容和自己接触过的情况,也可以上网搜索有关资料。 3、谈谈二进制、八进制和十六进制等数字表示方法各有什么有点和缺点。 八进制就是逢8进位,十六进制就是逢16进位,2、8、16,分别是2的1次方,3次方,4次方。这三种进制之间可以非常直接地互相转换。八进制数或十六进制数实际上是缩短了的二进制数,但保持了二进制数的表达特点。(P23-P25) 4、为什么使用二进制计算的时候会出现溢出? 因为存储空间大小(即存储单元的位的数量)的限制,可以表达的整数范围是有限的。二进制补码中两个整数相加的法则是,2个位相加,将进位加到下一列。如果最左边的列相加后还有进位,则舍弃它。如果在最高位有进位,那就会产生溢出。(P29-32) 5、反码和补码相对于原码有什么优点?计算机中的数是用原码表示的还是用反码、补码表示的? 数值的反码表示法是用最高位存放符号,并将原码的其余各位逐位取反。反码的取值空间和原码相同且一一对应。在补码表示法中,正数的补码表示与原码相同,即最高符号位用0表示正,其余位为数值位。而负数的补码则为它的反码、并在最低有效位(即D0位)加1所形成。处理器内部默认采用补码表示有符号数。(P29) 6、汉字编码有哪几种?各自的特点是什么? 汉字的编码有国际码、机内码等。在国标码的字符集中共收录了6763个常用汉字和682个非汉字字符,汉字机内码是与ASCII对应的,用二进制对汉字进行的编码。由于汉字数量多,一般用2个字节来存放汉字的内码,即双字节字符集(double-byte character set,简称DBCS)。(P36-37) 7、图像是如何压缩存储的?哪一种图像占用空间最小,为什么? 图形压缩编码的考虑主要由于位图文件体积太大,人们研究通过编码的形式,在保证图像具备一定质量的前提下,缩小图像文件的大小。压缩编码按其对图像质量的影响可分为无损压缩和有损压缩两类。当前最主流的图像压缩方式是JPEG ,JPEG压缩技术十分先进,即能支持无损压缩,也支持大压缩比的有损压缩。(P40-P41) 8、ASCII码是什么编码?为什么国际上推行Unicode码? ASCII编码是由美国国家标准学会制定的标准单字节字符编码方案,用于基于文本的数据。ASCII码是计算机世界里最重要的标准,但它存在严重的国际化问题Unicode扩展自ASCII

计算机的数据与编码

计算机的数据与编码 一、数据存储单位 1.数据:对事实、概念或指令的一种表示形式,可以由人工或自动装置进行处理。 (1)数据的形式:数字、文字、图形或声音等。 (2)数据的分类:数值数据、非数值数据。 2.信息:经过解释赋予一定意义的数据。 (1)控制信息:指挥计算机的各种操作的指令。 (2)数据信息:计算机加工处理的对象。 注意:(1)计算机能识别和处理的只能是二进制数。 (2)计算机中有人读数据和机读数据两种状态。 3.位:一个二进制位称为比特(bit),,以b表示。一位可以表示0和1两种状态。 位是数据的最小单位, 4.字节:八个二进制位称为字节(Byte),以B表示。 字节是数据处理和数据存储的基本单位。 一个字节的8位二进制自左至右排列,最左边为最高位,最右边为最低位。 换算公式: 1KB=1024B 1MB=1024KB=1024×1024B 1GB=1024MB=1024×1024KB=1024×1024×1024B=1073741824B 5.字与字长 (1)字:在计算机中做为一个单元进行存储、传送等操作的一组字符或一组二进制位称为字(Word)。 (2)字长:一个字中的字符数量或二进制的位数称为字长。

字长决定计算机处理信息的速率,是计算机的一个重要性能指标。 (3)字的组成:一个字由若干个字节组成。 二、字符及其编码 1.字符集 字符:用来组织、控制或表示数据的字母、数字及计算机能识别的其它符号。 字符集:为了某一目的而设计的一组互不相同的字符。 在微机系统中普遍采用的是有128个符号的键盘字符集,包括: (1)10个十进制数码0~9 (2)52个大小写英文字母 (3)32个标点符号、专用符号、运算符号 (4)34个控制符 2.字符编码 字符编码:规定用怎样的二进制编码表示数字、字母和各种专用符号。 由于这是一个涉及世界范围内的有关信息表示、交换、处理、传输和存储的基本问题,因此都以国家标准或国际标准的形式颁布施行。 目前在微型机中普遍采用的字符编码是ASCⅡ码。 ASCⅡ是英文American Standard Code for Information Interchange的缩写,意为“美国标准信息交换代码”。该编码后被国际标准化组织ISO(国际标准化委员会)采纳,作为国际通用的信息交换标准代码。 ASCⅡ有7位版本和8位版本。 (1)7位ASCⅡ码 用七位二进制数表示一个字符,由于27=128,所以可表示128个不同的字符,其中包括:数码0~9,26个大写英文字母,26个小写英文字母以及各种运算符号、标点符号及控制命令等。 注意:7位ASCⅡ表示数的范围是0~127 在微机中采用7位ASCⅡ字符编码时,最高位b7恒为零,因此,一个字符的ASC

计算机科学概论第1章 数据的表示与编码 习题与答案

第一章习题 (1)复习题 1、试述数制的概念。 位置化数字系统中,在数字中符号所占据的位置决定了其表示的值。大多数人使用的数字系统是以10为底的,也就是十进制。二进制数字系统是最简单的数字系统。(P21-23) 3、谈谈二进制、八进制和十六进制等数字表示方法各有什么有点和缺点。 八进制就是逢8进位,十六进制就是逢16进位,2、8、16,分别是2的1次方,3次方,4次方。这三种进制之间可以非常直接地互相转换。八进制数或十六进制数实际上是缩短了的二进制数,但保持了二进制数的表达特点。(P23-P25) 6、汉字编码有哪几种?各自的特点是什么? 汉字的编码有国际码、机内码等。在国标码的字符集中共收录了6763个常用汉字和682个非汉字字符,汉字机内码是与ASCII对应的,用二进制对汉字进行的编码。由于汉字数量多,一般用2个字节来存放汉字的内码,即双字节字符集(double-byte character set,简称DBCS)。(P36-37) 7、图像是如何压缩存储的?哪一种图像占用空间最小,为什么? 图形压缩编码的考虑主要由于位图文件体积太大,人们研究通过编码的形式,在保证图像具备一定质量的前提下,缩小图像文件的大小。压缩编码按其对图像质量的影响可分为无损压缩和有损压缩两类。当前最主流的图像压缩方式是JPEG ,JPEG压缩技术十分先进,即能支持无损压缩,也支持大压缩比的有损压缩。(P40-P41) 8、ASCII码是什么编码?为什么国际上推行Unicode码? ASCII编码是由美国国家标准学会制定的标准单字节字符编码方案,用于基于文本的数据。ASCII码是计算机世界里最重要的标准,但它存在严重的国际化问题Unicode扩展自ASCII 字元集。Unicode使用16位元编码,并可扩展到32位,这使得Unicode能够表示世界上所有的书写语言中可能用於电脑通讯的字元、象形文字和其他符号。(P38-39) (2)练习题 1、信息的最小单位是___________,它也是存储在计算机中的最小单位。 位(P26) 2、为了使表示法的固定部分统一,科学计数法(用于十进制)和浮点表示法(用于二进制)都在小数点左边使用了唯一的非零数码,这称为___________。 规范化(P34) 3、1980年我国颁布了代号为GB2312-80的国标码,共收录了6763个常用汉字和682个非汉字字符(图形、符号),这些字符以___________进行排列,这种编码又称为___________。偏旁部首区位码(P40)

计算机中数据的表示与信息编码

计算机中数据的表示与信息编码计算机最主要的功能是处理信息,如处理文字、声音、图形和图像等信息。在计算机内部,各种信息都必须经过数字化编码后才能被传送、存储和处理。因此要了解计算机工作的原理,还必须了解计算机中信息的表现形式。 1.2.1 计算机使用的数制 1.计算机内部是一个二进制数字世界 计算机内部采用二进制来保存数据和信息。无论是指令还是数据,若想存入计算机中,都必须采用二进制数编码形式,即使是图形、图像、声音等信息,也必须转换成二进制,才能存入计算机中。为什么在计算机中必须使用二进制数,而不使用人们习惯的十进制数?原因在于: ⑴易于物理实现:因为具有两种稳定状态的物理器件很多,例如,电路的导通与截止、电压的高与低、磁性材料的正向极化与反向极化等。它们恰好对应表示1和0两个符号。 ⑵机器可靠性高:由于电压的高低、电流的有无等都是一种跃变,两种状态分明,所以0和1两个数的传输和处理抗干扰性强,不易出错,鉴别信息的可靠性好。 ⑶运算规则简单:二进制数的运算法则比较简单,例如,二进制数的四则运算法则分别只有三条。由于二进制数运算法则少,使计算机运算器的硬件结构大大简化,控制也就简单多了。 虽然在计算机内部都使用二进制数来表示各种信息,但计算机仍采用人们熟悉和便于阅读的形式与外部联系,如十进制、八进制、十六进制数据,文字和图形信息等,由计算机系统将各种形式的信息转化为二进制的形式并储存在计算机的内部。 2.进位计数制 数制,也称计数制,是指用一组固定的符号和统一的规则来表示数值的方法。数制可分为非进位计数制和进位计数制两种。非进位计数制的数码表示的数值大小与它在数中的位置无关;而进位计数制的数码所表示的数值大小则与它在数中所处的位置有关。而我们在这里讨论的数制指的都是进位计数制。 进制是进位计数制的简称,是目前世界上使用最广泛的一种计数方法,它有基数和位权两个要素。 基数:在采用进位计数制的系统中,如果只用r个基本符号(例如0,1,2,…,

计算机内部用于存储数据和处理指令的编码

计算机内部用于存储数据和处理指令的编码为( C)。 选项: a、ASCII码(这是无线路由加密用的) b、十六进制码(不明) c、二进制码(计算机内部储存代码) d、国标码(不明) 总线是微型计算机的信息传输通道,分为不同类型,以下(D )不属于总线类型。 选项:a、数据总线 b、地址总线 c、控制总线 d、交换总线(没听说过这玩意) 下列IP地址中,(C )不属于A类地址。 选项:a、126.3.12.234 b、129.5.5.5 c、16.53.3.6(貌似)不确定 d、109.5.87.127 下列命令中,(D )用于测试网络是否连通。 选项:a、Telnet b、ftp c、nslookup d、ping(必须是这个CMD命令行下运行) 搜索同时包含关键字“中国”和“2008”的页面,下列四种方法中,(B)错误。选项:a、中国-2008 b、中国2008(貌似) c、中国+2008 d、“中国”“2008” 局域网的核心硬件是(A )。 选项:a、服务器(必需品) b、工作站 c、公用打印机 d、网卡 nternet由四部分组成,包括:主机、路由器、信息资源和(B )。 选项: a、数据库 b、协议 c、硬件 d、通信线路 光盘是目前被广泛使用的一种外存储器,其英文缩写CD-ROM指的是(C )。选项: a、只写型光盘 b、只读型光盘 c、一次写入型光盘(应该叫不可重复擦写光盘) d、可读写型光盘\ 运算器的主要功能是完成(D)运算。

选项:a、算术 b、逻辑 c、代数 d、算术和逻辑 -------------------------------------------------------------------------------- 计算机病毒是一种隐藏在(A)中的伺机破坏计算机软、硬件系统的程序。选项:a、内存(不载入内存怎么运行我考) b、外存 c、网络 d、传输线路 -------------------------------------------------------------------------------- POP3服务器是用来(C )邮件的。 选项a、接收 b、发送 c、接收和发送 d、存储 -------------------------------------------------------------------------------- 以下格式中,(B)属于音频文件格式。 选项:a、JPG b、WAV(貌似是MS 发明的高保真非压缩格式音频) c、MOV d、DAT -------------------------------------------------------------------------------- 计算机能够具备自动处理功能的基础是(A )。 选项:a、存储程序 b、具有逻辑判断功能 c、运算速度快 d、计算精度高 -------------------------------------------------------------------------------- 关于网络协议,下列说法中(B)正确。 选项:a、是网民们相互签定的合同 b、为实现网络通信而指定的、通信各方必须遵守的约定 c、协议仅仅是给网络通信者看的一种书面资料 d、局域网不需要使用协议 -------------------------------------------------------------------------------- 微型计算机中的“PIII”或“PIV”指的是CPU的主频(错!)。 选项:1、错 2、对 -------------------------------------------------------------------------------- DOS属于计算机的应用软件。(错) 选项:1、错是操作软件!!! 2、对

基础数据标准与描述(参考数据格式表示法)

! 基础数据标准 -目录规范和编码标准 基础数据标准 范围 基础数据标准化是的信息化重要工作之一,建立集中、规范统一的基础数据标准,是保证企业信息化系统正常运行的前提条件。此外,统一编码也是企业的一项重要的基础管理工作,对企业管理标准化具有促进作用。通过建立标准化制度,使各业务部门能够协同工作,能够消除重复性劳动,大幅度提高工作效率。 基础数据标准化的意义: 1、统一基础数据,便于计算机系统管理 、 手工管理状态之下,对基础数据处理存在很大的随意性,不便于计算机系统管理,只有对基础数据统一之后,才能充分体现计算管理所带来的效率。 2、保证基础数据的正确性 使用统一的基础数据编码,可以有效防止一物多码、一物多名、物名错乱等现象的发生。 3、集团范围内基础数据趋于统一、实现数据上报、汇总功能。 集团范围内使用统一基础数据,使业务数据上报、汇总成为可能,以实现集团管理。

数据准备策略 根据项目实施工作的整体要求,根据各项静态基础数据的特点,以及数据准备工作量和难度,分别采用如下准备策略: 1、简单基础数据 ? 由项目顾问组制定编码规范,安排业务培训,下发Excel格式的编码模板,由企业各项目人员自行准备,此类基础数据比较简单,企业人员按示例数据整理即可,并能采用简单方法导入系统(导入方法在“导入实现方式”章节详细说明)。项目顾 问组检查编码规范执行情况,并提供必要的工作指导。 2、复杂基础数据 由项目顾问组制定编码规范,安排业务培训,下发Excel格式的编码模板,与简单基础数据相比,数据结构要复杂得多,并且存在一些关联关系,对数据准备要求也比较高,占全部工作量50%以上,因此,需要采用专门的处理方法,其导入方法也比较特别。因此,复杂数据单独作为一类,企业需要配备更多的人员进行处理。以业务编码为例,除了物资管理部门外,技术部门也需要参与基础数据准备,以保证编码质量。项目顾问组重点进行指导检查,并根据实际需要提供更多的支持。 3、固定基础数据 本次实施的目标就是为了使集团范围内业务流程趋同,为集团业务汇总创造有利条件,因此,对于此类编码由项目顾问组提出建议方案,企业一般不再需要调整,以固定编码的方法主导实施,使业务流程趋于一致化(配合业务流程规范)。此类编码一般内容固定,有规范可遵循,数据量很少,按照统一的编码导入即可。目标。

数据在计算机中的表示doc

选择题 1.信息处理进入了计算机世界,实质上是进入了世界。 A、模拟数字 B、十进制数 C、二进制数 D、抽象数字 答案:C 2.计算机中使用二进制,下面叙述中不正确的是。 A、是因为计算机只能识别0和1 B、物理上容易实现,可靠性强 C、运算,通用性强 D、计算机在二进制数的0、1数码与逻辑量“真”和“假”的0与1吻合,便于表示和进行逻辑运算 答案:A 3.十进制数92转换为二进制数和十六进制数分别是。 A、01011100和5C B、01101100和61 C、和5D D、01011000和4F 答案:A 4.人们通常用十六进制而不用二进制书写计算机中的数,是因为。 A、十六进制的书写比二进制方便 B、十六进制的运算规则比二进制简单 C、十六进制数表达的范围比二进制大 D、计算机内部采用的是十六进制 答案:A 5.浮点数之所以能表示很大或很小的数,是因为使用了。

A、较多的字节 B、较长的尾数 C、阶码 D、符号位 答案:C 6.在科学计算时,经常会遇到“溢出”,这是指。 A、数值超出了内存容量 B、数值超出了机器的位所能表示的范围 C、数值超出了变量的表示范围 D、计算机出故障了 答案:B 7.下列有关二进制的说法中,是错误的。 A、二进制数只有0和1两个数码 B、二进制数只由两位数组成 C、二进制数各位上的权分别为1,2,4,…… D、二进制运算逢二进一 答案:B 8.下列关于字符之间大小关系的说法中,正确的是。 A、空格符>b>B B、空格符>B>b C、b>B>空格符 D、B>b>空格符 答案:C 9.目前在微机上最常用的字符编码是。 A、汉字字型码 B、ASCII码 C、8421码

相关主题
文本预览
相关文档 最新文档