计算机的数据与编码
一、数据存储单位
1.数据:对事实、概念或指令的一种表示形式,可以由人工或自动装置进行处理。
(1)数据的形式:数字、文字、图形或声音等。
(2)数据的分类:数值数据、非数值数据。
2.信息:经过解释赋予一定意义的数据。
(1)控制信息:指挥计算机的各种操作的指令。
(2)数据信息:计算机加工处理的对象。
注意:(1)计算机能识别和处理的只能是二进制数。
(2)计算机中有人读数据和机读数据两种状态。
3.位:一个二进制位称为比特(bit),,以b表示。一位可以表示0和1两种状态。
位是数据的最小单位,
4.字节:八个二进制位称为字节(Byte),以B表示。
字节是数据处理和数据存储的基本单位。
一个字节的8位二进制自左至右排列,最左边为最高位,最右边为最低位。
换算公式:
1KB=1024B
1MB=1024KB=1024×1024B
1GB=1024MB=1024×1024KB=1024×1024×1024B=1073741824B
5.字与字长
(1)字:在计算机中做为一个单元进行存储、传送等操作的一组字符或一组二进制位称为字(Word)。
(2)字长:一个字中的字符数量或二进制的位数称为字长。
字长决定计算机处理信息的速率,是计算机的一个重要性能指标。
(3)字的组成:一个字由若干个字节组成。
二、字符及其编码
1.字符集
字符:用来组织、控制或表示数据的字母、数字及计算机能识别的其它符号。
字符集:为了某一目的而设计的一组互不相同的字符。
在微机系统中普遍采用的是有128个符号的键盘字符集,包括:
(1)10个十进制数码0~9
(2)52个大小写英文字母
(3)32个标点符号、专用符号、运算符号
(4)34个控制符
2.字符编码
字符编码:规定用怎样的二进制编码表示数字、字母和各种专用符号。
由于这是一个涉及世界范围内的有关信息表示、交换、处理、传输和存储的基本问题,因此都以国家标准或国际标准的形式颁布施行。
目前在微型机中普遍采用的字符编码是ASCⅡ码。
ASCⅡ是英文American Standard Code for Information Interchange的缩写,意为“美国标准信息交换代码”。该编码后被国际标准化组织ISO(国际标准化委员会)采纳,作为国际通用的信息交换标准代码。
ASCⅡ有7位版本和8位版本。
(1)7位ASCⅡ码
用七位二进制数表示一个字符,由于27=128,所以可表示128个不同的字符,其中包括:数码0~9,26个大写英文字母,26个小写英文字母以及各种运算符号、标点符号及控制命令等。
注意:7位ASCⅡ表示数的范围是0~127
在微机中采用7位ASCⅡ字符编码时,最高位b7恒为零,因此,一个字符的ASC
Ⅱ码占一个字节位置。
(2)8位ASCⅡ码
使用8位二进制数进行编码,这样可以表示256种字符。
当最高位恒为0时,编码与7位ASCII码相同,称为基本ASCII码。当最高位为1时,形成扩充ASCII码。
通常,各国都把扩充ASCII码部分作为自己本国语言字符代码。
常用ASCII码:
字符大小比较:按ASCII码值的大小进行比较。
CR〈ESC〈SP(空格)〈0〈......A〈......a〈DEL
字符串大小比较:先比较第一个字符,若相同,再比较第二个字符,以此类推。
3.汉字编码
我国于1981年颁布了〈信息交换用汉字编码字符集——基本集〉,即国家标准GB2312-80。
基本集中共收集汉字和图形符号7445个,汉字6763个,分为两级。
一级汉字有3755个,属常用汉字,按汉字拼音字母顺序排列;
二级汉字为3008个,属次常用汉字,按部首排列。
图形符号682个。
规定:一个汉字用两个字节表示。
为了使中文信息与西文信息兼容,每个字节的最高位用于区分汉字编码或是ASCII 字符编码,因此汉字编码每个字节只用低七位。
此外,由于每个字节的低7位中还有34个控制字符编码,因此每个字节只能有128-34=94种状态可用于汉字编码。这样两个字节可以有94×94=8836种状态。
(1)区位码
GB2312-80基本字符集将汉字按规则排成94行,94列,第一个字节用于表示区号,第二个字节用于表示位号,因此,每个汉字就有唯一的一个区号和一个位号,称为汉字的区位码。
给定汉字编码表中的一个区号(十进制01~94)和位号(十进制01~94),则唯一对应一个汉字或图形符号。
例如:区号54,位号48(均为十进制),对应汉字为“中”。
区位码的安排:
01~15区:各种字母、数字及图形符号
16~55区:一级汉字
56~87区:二级汉字
区位码是用十进制数表示的国标码,即国标BG2312-80中的区位编码,也可称为国标区位码。
(1)国标码
将汉字区位码的区码和位码分别用十六进制数表示,然后再加上十六进制数2020形成。
例:“中”的区位码为5448,表示成十六进制3630,再加上2020,则它的国标码为5650。
国标码的主要作用是用于统一不同的系统之间所用的不同编码。通过将不同的系统使用的不同编码统一转换成国标码,不同系统之间的汉字信息就可以相互交换。
4.汉字内码
计算机系统内部进行存储、加工处理、传输统一使用的代码,简称汉字内码或机内码。
不同系统使用的机内码可能不同,目前国内广泛使用的汉字内码是将国标码的两个字节的最高位分别置为“1”形成。
即一个汉字在机器内部占两个字节,每个字节的最高位恒为1。
汉字机内码=汉字国标码+8080H
=区位码+2020H+8080H
=区位码+A0A0H
加十六进制8080H的目的是将表示汉字国标码的两个字节的最高位分别置为“1”。
在计算机中,由于机内码的存在,输入汉字时就允许用户根据自己的习惯使用不同的输入码,进入系统后再统一转换成机内码存储。
5.汉字外码
为方便人工通过键盘键入汉字而设计的代码称为汉字输入码,又称为汉字外码。
(1)以国标GB2312-80为基准的区位码、国标码
(2)以汉字拼音为基础的拼音类输入法
(3)以汉字拼形为基础的拼形类输入法
(4)以汉字拼音和拼形结合为基础的音形类输入法
(5)在电信业中通用的电报码
6.汉字字形码
是指汉字字库中存储的汉字字形的数字化信息。
汉字是一种象形文字,每一个汉字都可以看成是一个特定的图形,这种图形可以用点阵来描述。
用点阵来表示汉字,以16×16点阵为例,表明一个汉字图形有16行,每一行上有16个点。一位二进制可以表示点阵中一个点的信息,因此用两个字节来存放每一行上的16个点,并且规定某二进制位值“0”表示对应点为白,而“1”表示对应点为黑。由此可知,一个16×16点阵的汉字字形需要用2×16=32个字节来存放。其它点阵的汉字可以此类推。
汉字字形点阵有:16×16、24×24、32×32点阵等。随点阵数的不同,汉字字形码的长度不同。例16×16点阵占32个字节,24×24点阵需72个字节。
汉字字形码又称为汉字输出码或汉字发生器编码。
7.汉字字模
字模:即汉字字库中存放的汉字字形。字模与字形的概念没有严格区别。
字模可分为宋体字模、仿宋体字模、楷体字模、黑体字模。
字模按点阵大小可分为16×16点阵字模、24×24点阵字模等。点阵数越大,字形质量越高。
8.汉字字库
汉字字库:汉字字形数字化后,以二进制文件的形式存储在存储器中,构成汉字字形库或汉字字模库,简称汉字字库。
汉字字库为汉字的输出设备提供字形数据,汉字字形的输出是将存储在汉字字库中的相应字形信息取出,送到所指定的汉字输出设备上输出。
字库中汉字字形信息的存储方法:
(1)整字存储法
将汉字字形的点阵信息逐个字节存放在字形信息存储器中,需要输出时直接读出。
(2)压缩信息存储法
采用信息压缩办法,只存储汉字的压缩信息,使用时再还原成字形信息。
汉字字库有硬字库和软字库之分。
(1)硬字库
将汉字库固化在ROM或EPROM中,称为硬字库。
(2)软字库
将汉字库存放在某种外设(软、硬盘)中,称为软字库。
要输出一个汉字时,首先根据该汉字的机内码找出其字模信息在字库中的位置,然后取该汉字的字模信息作为图形在屏幕上显示或打印机上打印输出。
三、计算机中数的表示
1.带符号数的表示
用0表示正数,用1表示负数,使数的符号数字化,符号和数一起进行存储和运算。
(1)符号位
位于数值最高位的左部,0表示正数,1表示负数。
如果用八进制位表示一个有符号的整数,则最高位为符号位,具体表示数值的只有七位,其最小数为(111111111)2=(-127)10,最大数为(01111111)2=+127。
如果用16进制位表示一个有符号的整数,除去最高位的符号位外,具体表示数值
的只有15位,所能表示数的范围为(-32767,+32767)
显然,在表示一个数值时,使用的二进制位数越多,其表示数值的范围就越大。
例如:用八位二进制数表示+50和-50
(+50)10 =(00110010)2(-50)10 =(10110010)2
用十六位二进制数表示+513和-513
(+513)10 =(0000001000000001)2 (-513)10=(1000001000000001)2
显然,用八位二进制数无法表示513、-513。
(2)真值
真正表示数值大小的部分,并按一般书写规则表示的原值。
(3)机器数
在计算机中使用的,连同数符一起数码化了的数叫机器数。机器数表示的范围由计算机字长决定。
如果数值越过机器所能表示的范围,运算就会因此出错而停止,称为“溢出”。
例:用8位二进制数表示+49和-49
十进制数+49 -49
真值+0110001 -0110001
机器数00110001 10110001
机器数也有不同表示方法,常用的有三种,即原码,补码和反码。
(1)原码
用最高位表示数符,0代表正数,1代表负数,数值部分为真值的绝对值,这种表示方法称为原码。
例:
十进制+73 -73 +127 -127 +0 -0
真值+1001001 -1001001 +1111111 -1111111 +0000000 -0000000
原码01001001 11001001 01111111 11111111 00000000 10000000
由上可知,数值0在原码中有两种形式:两种形式均当0处理
[+0]原=00000000 [-0]原=10000000
(2)反码
正数的反码和原码相同,负数的反码是对该数的原码除符号位外各位求反(即0变
1,1变0)。用数学式子表示如下:
例:(+50)10原码=00110010 反码=00110010 (相同)
(-50)10原码=10110010 反码=11001101 (不同)
[+0]反=[+0]原=00000000
[-0]原=10000000,[-0]反=11111111
注意:一个数反码的反码是原码本身。
(3)补码
正数的补码与原码相同,负数的补码则是该数的反码未位加1。
例:(+50)10原码=00110010=反码=补码
(-50)10原码=10110010
反码=11001101
补码=11001110
[+0]补=00000000
[-0]=[-0]反+1=11111111+1=100000000=00000000
由于字长限定为N位,因此最高位前面的1因表示不出来而丢失。从而保留下来的相同。所以计算机中一般都采用补码进行运算。
结果与[+0]
补
注意:负数补码的补码等于该负数的原码。即[[X]补]补=[X]原
例:求下列数的原码、反码、补码。
十进制数+1 -1 +127 -127 +0 -0
原码00000001 10000001 01111111 11111111 00000000 10000000
反码00000001 11111110 01111111 10000000 00000000 11111111
补码00000001 11111111 01111111 10000001 00000000 00000000
(4)各种码的十进制数范围
二进制数无符号数原码反码补码
00000000 0 +0 +0 +0
01111111 127 +127 +127 +127
10000000 128 -0 -127 -128
11111111 255 -127 -0 -1
范围0~255 -127~+127 -127~+127 -128~127
2.小数点的表示
由于计算机只能识别0和1,所以采用约定的方式表示小数点。在计算机中,小数点通常有两种表示法:定点表示法与浮点表示法。
(1)定点数
规定小数点的位置固定不变,总是隐含在某个预定位置上。采用定点数表示法的计算机称为定点计算机。
定点纯整数:将小数点固定在数的最低位之后(隐含,小数点不占二进制位)。在这种表示法中,符号位右边的所有位数表示的是一个整数。格式如下:
符号位尾数.
例:机器字长16,符号位1,数值位15
0111111111111111→+111111*********→+32767
定点纯小数:将小数点固定在符号位之后,最高数值位之前(隐含,小数点不占二进制位)。在这种表示法中,符号位右边的第一位是小数的最高位。格式如下:
例:机器字长16位,符号位1,数值位15
1000000000000001→-.000000000000001→2-15
(2)浮点数
小数点位置不固定的数(位置浮动),采用浮点数表示的计算机称为浮点计算机。浮点表示的一般表示形式为:
N=2P×S
其中:P——称为阶码(含符号)
S——称为尾数(含符号)
2——阶码的底(隐含的,不必出现在数据表示中)
在计算机中表示一个浮点数其结构如下:
P f:阶符,即指数部分的符号位。
P:阶码,表示幂次。
S f:数符,即尾数部分符号位。
S:尾数
注意:浮点数表示法要规定字的格式。
实际应用中,阶码用补码(或移码)表示成定点纯整数,尾数用补码(或原码)表示成定点纯小数。为了保证不损失有效数字,常对尾数进行规格化处理,即保证尾数部分最高位是1,而数的大小可以通过阶码进行调整。
四、多媒体数据简介
1.多媒体的概念
(1)媒体
存储信息的实体,磁盘、光盘、存储器等。
承载信息的载体,数值、文字、图形、声音、视频、图像
(2)多媒体
文、图、声像等多种信息同计算机融合在一起形成的信息传播媒体。
硬件配置在原有计算机系统基础上扩充了:数字信号处理器、大容量光盘、触摸式屏幕、其它外围设备,以多种形式表达、存储和处理信息。
电视与信息系统的多媒体明显区别:①被动与主动
②模拟与数字
(3)多媒体信息
用多媒体传播的信息
(4)多媒体系统
能产生、储存、传播多媒体信息的系统,全称为多媒体计算机系统。
2.多媒体数据类型
(1)数字字符型关系数据
完成信息抽象后建立与实体之间的关系。由字符和数值构成,具有规范的结构化形式。
(2)文本数据
是最常见的媒体形式。包括字母、数字、字、词、句、段落、文章、书及书库。
(3)声音数据
包括话音、音乐、机器声、雷声、雨声、风声以及各种动物发出的声音等。
(4)图像数据
基于抽象程序或时间。
图形数字化:位图(照片、绘图、医学图像数据)。
图形矢量化:图形(CAD图、地理图等)。
3.多媒体数据的特点
(1)数据量大
(2)媒体种类繁多使数据处理复杂
(3)改变了数据库的接口,不仅使图、文、声并茂,且改变了数据库的操纵形式。
4.视频信息和音频信息的获取
目的:将声频和视频信息数字化后送入计算机。
(1)视频信息获取技术的简单原理和主要组成
组成:彩色解码电路、同步锁相及时序电路、A/D、D/A、编码器、输出显示器。
(2)音频信息获取技术的工作原理和主要组成
组成:拾音器、音频放大器、A/D、D/A、滤波器、功率放大器和增益控制器。
5.多媒体数据压缩技术
数据的压缩方法即为一种变换及其反变换,称为编码技术。
(1)数据压缩方法分类
无失真压缩:利用数据的统计冗余进行压缩,可完全恢复原始数据而不引入任何失真,但压缩率受到统计冗余度的理论限制。多用于文本数据、程序、图像数据的压缩。
有失真压缩:利用人类视觉和听觉器官对图像或声音中某些频率成分不敏感的特性,允许在压缩过程中损失一定的信息,从而换来了较大压缩比。多用于语音、图像和视频数据的压缩。
(2)压缩的国际标准
静止图像压缩标准:JPEG
动态图像压缩标准:MPEG
计算机中数据的表示与信息编码 计算机最主要的功能是处理信息,如处理文字、声音、图形和图像等信息。在计算机内部,各种信息都必须经过数字化编码后才能被传送、存储和处理。因此要了解计算机工作的原理,还必须了解计算机中信息的表现形式。 1.2.1 计算机使用的数制 1.计算机内部是一个二进制数字世界 计算机内部采用二进制来保存数据和信息。无论是指令还是数据,若想存入计算机中,都必须采用二进制数编码形式,即使是图形、图像、声音等信息,也必须转换成二进制,才能存入计算机中。为什么在计算机中必须使用二进制数,而不使用人们习惯的十进制数?原因在于: ⑴易于物理实现:因为具有两种稳定状态的物理器件很多,例如,电路的导通与截止、电压的高与低、磁性材料的正向极化与反向极化等。它们恰好对应表示1和0两个符号。 ⑵机器可靠性高:由于电压的高低、电流的有无等都是一种跃变,两种状态分明,所以0和1两个数的传输和处理抗干扰性强,不易出错,鉴别信息的可靠性好。 ⑶运算规则简单:二进制数的运算法则比较简单,例如,二进制数的四则运算法则分别只有三条。由于二进制数运算法则少,使计算机运算器的硬件结构大大简化,控制也就简单多了。 虽然在计算机内部都使用二进制数来表示各种信息,但计算机仍采用人们熟悉和便于阅读的形式与外部联系,如十进制、八进制、十六进制数据,文字和图形信息等,由计算机系统将各种形式的信息转化为二进制的形式并储存在计算机的内部。 2.进位计数制 数制,也称计数制,是指用一组固定的符号和统一的规则来表示数值的方法。数制可分为非进位计数制和进位计数制两种。非进位计数制的数码表示的数值大小与它在数中的位置无关;而进位计数制的数码所表示的数值大小则与它在数中所处的位置有关。而我们在这里讨论的数制指的都是进位计数制。 进制是进位计数制的简称,是目前世界上使用最广泛的一种计数方法,它有基数和位权两个要素。 ??基数:在采用进位计数制的系统中,如果只用r个基本符号(例如0,1,2,…,r-1)表示数值,则称其为r数制(Radix-r Number System),r称为该数制的基数(Radix)。如日常生活中常用的十进制,就是r=10,即基本符号为0,1,2,…,9。如取r=2,即基本符号为0和1,则为二进制数。 ??位权:每个数字符号在固定位置上的计数单位称为位权。位权实际就是处在某一位上的1所表示的数值大小。如在十位制中,个位的位权是100,十位的位权是101,…;向右依次是10-1,10-2,…。而二进制整数右数第2位的位权为2,第3位的位权为4,第4位的位权为8。一般情况下,对于r进制数,整数部分右数第i位的位权为r i-1,而小数部分左数第i位的位权为r-i。 各种进制的共同点是: ⑴每一种数制都有固定的符号集。如十进制数制,其符号有十个:0,1,2, (9) 二进制数制,其符号只有两个:0和1。需要指出的是,16进制数基数为16,所以有16个基本符号,分别为0,1,2,…,8,9,A,B,C,D,E,F。表1-3列出了计算机中常用的几种进制。 ⑵采用位置表示法,用位权来计数。即处于不同位置的数符所代表的值不同,与它所在位置的权值有关。例如:十进制的1358.74可表示为: 1358.74=1×103+3×102+5×101+8×100+7×10-1+4×10-2 可以看出,各种进位制中的位权的值恰好是基数的某次幂。因此,对于任何一个进位计数制表示的数都可以写出按其权值展开的各项式之和,称为“按权展开式”。任意一个n位整数和m位小数的r进制数D可表示为:
第2章信息编码及在计算机中的表示 2.1 信息的数字化编码 编码:是用来将信息从一种形式转变为另一种形式的符号系统,通常选用少量最简单的基本符号和一定的组合规则,以表示出大量复杂多样的信息。 信息的数字化编码:是指用“0”或“1”这种量最少、最简单的二进制数码,并选用一定的组合规则,来表示数据、文字、声音、图形和图像等各种复杂的信息。 计算机中采用的是二进制数码,为什么?(重点) 2.2 进位计数制及其相互转换 2.2.1 进位计数制 数制中的三个基本名词术语: 数码:用不同的数字符号来表示一种数制的 数值,这些数字符号称为“数码”。 基:数制所使用的数码个数称为“基”。 权:某数制各位所具有的值称为“权”。 1.十进制数(Decimal System) 数码:0、1、…… 8、9 基:10(逢十进一,借一当十) 权:以10为底的幂 任何一个十进制数DnDn-1…D1D0D-1…,可以表示成按权展开的多项式: Dn×10n+Dn-1×10n-1+…+D1×101+D0×100+D-1×10-1+…+D-m×10-m 例如:1234.5的按权展开多项为:1234.5=1×103+2×102+3×101+4×100+5×10-1 ⒉二进制数 二进制(Binary System) 数码: 0和1 基:2 权:以2为底的幂 任何一个二进制数BnBn-1…B1B0B-1…B-m,可以表示成按权展开的多项式: Bn×2n+Bn-1×2n-1+…+B1×21+B0×20+B-1×2-1+…+B(-m+1)×2-(m-1)+B-m ×2-m 例如: 1101.01的按权展开多项为: 1101.01=1×23+1×22+0×21+1×20+0×2-1+1×2-2 ⒊八进制数 八进制数(Octave System) 数码: 0、1、…… 6、7 基: 8 权:以8为底的幂
计算机中的数据与编码 一、数据的单位与存储形式(掌握) 1.数据是指能够输入计算机并被计算机处理的数字、字母和符号的集合。 2.在计算机内部,数据是以二进制的形式存储和运算的。 3.数据的表示形式:数据的最小单位是二进制的一位数(Bit)。 4.数据的存储形式:数据存储的最小单位是Byte。 5.文件存储的最小单位是簇 6.一个字节(Byte)由八个二进制位组成。 7.通常一个英文字符用一个字节存储,一个汉字机内编码需要两个字节甚至更多的字节来存储。 8.在计算机中常用一个字来表示该种计算机能最方便、最有效地进行操作的数据或信息的长度。一个字由若干字节组成。通常将组成一个字 的位数叫作该字的字长。例如:在8位机中,每个字由一个字节组成; 在16位机中,每个字由两个字节组成。 9.单位换算:1GB=1024MB 1MB=1024KB 1KB=1024B=210B 1TB=1024GB 二、字符的编码(理解) 字符编码就是规定用怎样的二进制码来表示字母、数字以及专门符号。在计算机系统中,有两种重要的字符编码方式:EBCDIC和ASCⅡ。前者主要用于IBM的大型主机,后者则用于微型机与小型机。 1.ASCII码 (1)ASCII是美国标准信息交换码(American Standard Code for Information Interchange),它已被国际化组织接收为国际标准。 (2)ASCII码有7位,它包含10个阿拉伯数字、52个英文大小写字母、 32个标点符号和运算符以及34个控制码。总共128个符,所以可用7 位码(27=128)来表示。具体编码见课本P16。通过表可以确定一个数 字、字母、符号或控制码的ASCII码。例如,数字“0”的ASCII码是?, “9”的ASCII码是?;字母“A”的ASCII码是?,“a”的ASCII码是?。
计算机的数据与编码 一、数据存储单位 1.数据:对事实、概念或指令的一种表示形式,可以由人工或自动装置进行处理。 (1)数据的形式:数字、文字、图形或声音等。 (2)数据的分类:数值数据、非数值数据。 2.信息:经过解释赋予一定意义的数据。 (1)控制信息:指挥计算机的各种操作的指令。 (2)数据信息:计算机加工处理的对象。 注意:(1)计算机能识别和处理的只能是二进制数。 (2)计算机中有人读数据和机读数据两种状态。 3.位:一个二进制位称为比特(bit),,以b表示。一位可以表示0和1两种状态。 位是数据的最小单位, 4.字节:八个二进制位称为字节(Byte),以B表示。 字节是数据处理和数据存储的基本单位。 一个字节的8位二进制自左至右排列,最左边为最高位,最右边为最低位。 换算公式: 1KB=1024B 1MB=1024KB=1024×1024B 1GB=1024MB=1024×1024KB=1024×1024×1024B=1073741824B 5.字与字长 (1)字:在计算机中做为一个单元进行存储、传送等操作的一组字符或一组二进制位称为字(Word)。 (2)字长:一个字中的字符数量或二进制的位数称为字长。
字长决定计算机处理信息的速率,是计算机的一个重要性能指标。 (3)字的组成:一个字由若干个字节组成。 二、字符及其编码 1.字符集 字符:用来组织、控制或表示数据的字母、数字及计算机能识别的其它符号。 字符集:为了某一目的而设计的一组互不相同的字符。 在微机系统中普遍采用的是有128个符号的键盘字符集,包括: (1)10个十进制数码0~9 (2)52个大小写英文字母 (3)32个标点符号、专用符号、运算符号 (4)34个控制符 2.字符编码 字符编码:规定用怎样的二进制编码表示数字、字母和各种专用符号。 由于这是一个涉及世界范围内的有关信息表示、交换、处理、传输和存储的基本问题,因此都以国家标准或国际标准的形式颁布施行。 目前在微型机中普遍采用的字符编码是ASCⅡ码。 ASCⅡ是英文American Standard Code for Information Interchange的缩写,意为“美国标准信息交换代码”。该编码后被国际标准化组织ISO(国际标准化委员会)采纳,作为国际通用的信息交换标准代码。 ASCⅡ有7位版本和8位版本。 (1)7位ASCⅡ码 用七位二进制数表示一个字符,由于27=128,所以可表示128个不同的字符,其中包括:数码0~9,26个大写英文字母,26个小写英文字母以及各种运算符号、标点符号及控制命令等。 注意:7位ASCⅡ表示数的范围是0~127 在微机中采用7位ASCⅡ字符编码时,最高位b7恒为零,因此,一个字符的ASC
计算机数据与编码 1.6.1信息和数据 信息是人们对客观世界的认识,即对客观世界的一种反映。 数据是表达现实世界中各种信息的一组可以记录、可以识别的记号或符号。它是信息的载体,是信息的具体表现形式。 数据形式可以是字符、符号、表格、声音、图像等。 数据可以在物理介质上记录或传输,并通过输入设备传送给计算机处理加工。数据的单位分为以下几种: 1)位(bit) 计算机中最小的数据单位二进制的一个数位,称为比特位,简称位。 1位二进制只能表示两种状态,即0或1。n位二进制能表示2n种状态 2)字节(Byte) 相邻8个比特位组成一个字节,用B表示。字节是计算机中用来表示存储容量大小的基本单位。 1B = 8bits 1KB = 210B = 1024B 1MB = 220B = 1024KB 1GB = 230B = 1024MB 1TB = 240B = 1024GB 3)字(Word) 在计算机中作为一个整体被存取、传送、处理的二进制数位叫做一个字,每个字中二进制位数的长度,称为字长。 用8位字长表示一个整数与用16位字长表示一个整数,其所表示的数的上限和下限是不一样的。 字长所占位数其所表示的数的范围 8 -128 ~ 127 即:-27 ~ (27 - 1) 16 -32768 ~ 32767 即:-215 ~ (215 - 1)
32 -48 ~ 47 即:-231 ~ (231 - 1) 1.6.2 数字化信息编码 在计算机内部,可用物理器件的高低电平代表二进制的“0”和“1”,另外,脉冲的正负极性,晶体管的导通和截止都可以用来表示二进制的“0”和“1”。由于二进制只有两个状态,数据的传输和处理不容易出错,另外二进制数的记数、加减法运算规则较为简单,可用开关电路实现,且二进制的“0”和“1”正好与逻辑命题的两个值“真”和“假”相对应,为计算机种中实现逻辑运算和逻辑判断提供了便利的条件。所以,在计算机中,广泛采用的是只有“0”和“1”两个基本符号组成的基二码,或称为二进制码。 计算机最重要的功能是处理信息,这些信息包括数值、文字、图形、符号、图象、声音等,所有这些信息都必须经过编码,转换成计算机能够识别和处理的二进制码的形式才能够被存储、传送和加工。 BCD码是二进制编码的十进制数(Binary Coded Decimal)的简写。有四位BCD码、六位BCD码和扩展的BCD码三种。 (1)非数值数据的表示 1) 字符数据的表示 ASCII码(America Standard Code for Information Interchage)是美国标准信息交换码,被国际化组织指定为国际标准,分为7位和8位两种版本。 国际通用的是7位ASCII码,它已对大、小写英文字母、阿拉伯数字、标点符号及控制符等特殊符号编码,共128个字符。 (2) 汉字的表示 汉字与英文的主要区别:
计算机内部用于存储数据和处理指令的编码为( C)。 选项: a、ASCII码(这是无线路由加密用的) b、十六进制码(不明) c、二进制码(计算机内部储存代码) d、国标码(不明) 总线是微型计算机的信息传输通道,分为不同类型,以下(D )不属于总线类型。 选项:a、数据总线 b、地址总线 c、控制总线 d、交换总线(没听说过这玩意) 下列IP地址中,(C )不属于A类地址。 选项:a、126.3.12.234 b、129.5.5.5 c、16.53.3.6(貌似)不确定 d、109.5.87.127 下列命令中,(D )用于测试网络是否连通。 选项:a、Telnet b、ftp c、nslookup d、ping(必须是这个CMD命令行下运行) 搜索同时包含关键字“中国”和“2008”的页面,下列四种方法中,(B)错误。选项:a、中国-2008 b、中国2008(貌似) c、中国+2008 d、“中国”“2008” 局域网的核心硬件是(A )。 选项:a、服务器(必需品) b、工作站 c、公用打印机 d、网卡 nternet由四部分组成,包括:主机、路由器、信息资源和(B )。 选项: a、数据库 b、协议 c、硬件 d、通信线路 光盘是目前被广泛使用的一种外存储器,其英文缩写CD-ROM指的是(C )。选项: a、只写型光盘 b、只读型光盘 c、一次写入型光盘(应该叫不可重复擦写光盘) d、可读写型光盘\ 运算器的主要功能是完成(D)运算。
选项:a、算术 b、逻辑 c、代数 d、算术和逻辑 -------------------------------------------------------------------------------- 计算机病毒是一种隐藏在(A)中的伺机破坏计算机软、硬件系统的程序。选项:a、内存(不载入内存怎么运行我考) b、外存 c、网络 d、传输线路 -------------------------------------------------------------------------------- POP3服务器是用来(C )邮件的。 选项a、接收 b、发送 c、接收和发送 d、存储 -------------------------------------------------------------------------------- 以下格式中,(B)属于音频文件格式。 选项:a、JPG b、WAV(貌似是MS 发明的高保真非压缩格式音频) c、MOV d、DAT -------------------------------------------------------------------------------- 计算机能够具备自动处理功能的基础是(A )。 选项:a、存储程序 b、具有逻辑判断功能 c、运算速度快 d、计算精度高 -------------------------------------------------------------------------------- 关于网络协议,下列说法中(B)正确。 选项:a、是网民们相互签定的合同 b、为实现网络通信而指定的、通信各方必须遵守的约定 c、协议仅仅是给网络通信者看的一种书面资料 d、局域网不需要使用协议 -------------------------------------------------------------------------------- 微型计算机中的“PIII”或“PIV”指的是CPU的主频(错!)。 选项:1、错 2、对 -------------------------------------------------------------------------------- DOS属于计算机的应用软件。(错) 选项:1、错是操作软件!!! 2、对
计算机中数据的表示与信息编码计算机最主要的功能是处理信息,如处理文字、声音、图形和图像等信息。在计算机内部,各种信息都必须经过数字化编码后才能被传送、存储和处理。因此要了解计算机工作的原理,还必须了解计算机中信息的表现形式。 1.2.1 计算机使用的数制 1.计算机内部是一个二进制数字世界 计算机内部采用二进制来保存数据和信息。无论是指令还是数据,若想存入计算机中,都必须采用二进制数编码形式,即使是图形、图像、声音等信息,也必须转换成二进制,才能存入计算机中。为什么在计算机中必须使用二进制数,而不使用人们习惯的十进制数?原因在于: ⑴易于物理实现:因为具有两种稳定状态的物理器件很多,例如,电路的导通与截止、电压的高与低、磁性材料的正向极化与反向极化等。它们恰好对应表示1和0两个符号。 ⑵机器可靠性高:由于电压的高低、电流的有无等都是一种跃变,两种状态分明,所以0和1两个数的传输和处理抗干扰性强,不易出错,鉴别信息的可靠性好。 ⑶运算规则简单:二进制数的运算法则比较简单,例如,二进制数的四则运算法则分别只有三条。由于二进制数运算法则少,使计算机运算器的硬件结构大大简化,控制也就简单多了。 虽然在计算机内部都使用二进制数来表示各种信息,但计算机仍采用人们熟悉和便于阅读的形式与外部联系,如十进制、八进制、十六进制数据,文字和图形信息等,由计算机系统将各种形式的信息转化为二进制的形式并储存在计算机的内部。 2.进位计数制 数制,也称计数制,是指用一组固定的符号和统一的规则来表示数值的方法。数制可分为非进位计数制和进位计数制两种。非进位计数制的数码表示的数值大小与它在数中的位置无关;而进位计数制的数码所表示的数值大小则与它在数中所处的位置有关。而我们在这里讨论的数制指的都是进位计数制。 进制是进位计数制的简称,是目前世界上使用最广泛的一种计数方法,它有基数和位权两个要素。 基数:在采用进位计数制的系统中,如果只用r个基本符号(例如0,1,2,…,
选择题 1.信息处理进入了计算机世界,实质上是进入了世界。 A、模拟数字 B、十进制数 C、二进制数 D、抽象数字 答案:C 2.计算机中使用二进制,下面叙述中不正确的是。 A、是因为计算机只能识别0和1 B、物理上容易实现,可靠性强 C、运算,通用性强 D、计算机在二进制数的0、1数码与逻辑量“真”和“假”的0与1吻合,便于表示和进行逻辑运算 答案:A 3.十进制数92转换为二进制数和十六进制数分别是。 A、01011100和5C B、01101100和61 C、和5D D、01011000和4F 答案:A 4.人们通常用十六进制而不用二进制书写计算机中的数,是因为。 A、十六进制的书写比二进制方便 B、十六进制的运算规则比二进制简单 C、十六进制数表达的范围比二进制大 D、计算机内部采用的是十六进制 答案:A 5.浮点数之所以能表示很大或很小的数,是因为使用了。
A、较多的字节 B、较长的尾数 C、阶码 D、符号位 答案:C 6.在科学计算时,经常会遇到“溢出”,这是指。 A、数值超出了内存容量 B、数值超出了机器的位所能表示的范围 C、数值超出了变量的表示范围 D、计算机出故障了 答案:B 7.下列有关二进制的说法中,是错误的。 A、二进制数只有0和1两个数码 B、二进制数只由两位数组成 C、二进制数各位上的权分别为1,2,4,…… D、二进制运算逢二进一 答案:B 8.下列关于字符之间大小关系的说法中,正确的是。 A、空格符>b>B B、空格符>B>b C、b>B>空格符 D、B>b>空格符 答案:C 9.目前在微机上最常用的字符编码是。 A、汉字字型码 B、ASCII码 C、8421码