数的表示以及字符与汉字编码
- 格式:doc
- 大小:93.50 KB
- 文档页数:5
一、计算机基础知识大纲要求:1.计算机的发展、特点、分类及应用领域;2.数制的概念,二、八、十及十六进制的表示及相互转换;3.计算机的数与编码,计算机中数的表示,字符、汉字的编码;4.计算机中信息的存储单位:位、字节、字、字长的概念;5.汉字常用的输入方法(熟练一种);了解汉字输入码(外码)、内码、字库的概念。
大纲知识点:(一)计算机的发展、特点、分类及应用领域;1.计算机的发展史【熟记】第一台计算机的名称、诞生时间和地点;各代计算机的元器件。
1946年美国宾夕法尼亚大学研制成功了世界上第一台计算机ENIAC(电子数字积分计算机),ENIAC的诞生标志着电子计算机时代的到来。
通常根据计算机采用电子元件的不同将计算机划分为电子管、晶体管、集成电路和超大规模集成电路4个阶段,分别称为第一代至第四代计算机。
2. 计算机的特点【熟记】计算机的特点1)运算速度快运行速度:每秒所能执行的指令条数。
单位:MIPS(百万条指令/秒),Million Instructions Per Second主频:2GHz的Pentium 4 运行速度为40亿次/秒,即4000MIPS。
一般来说主频越高,运算速度就越快。
2)计算精度高计算机的计算精度一般用字长来表示。
字长:指的是CPU一次能并行处理的二进制位数,一般有8位、16位、32位、64 位等。
字长总是8的整数倍。
通常PC机的字长为16位(早期),32位,64 位。
3)存储能力强不仅可以把原始数据、中间结果、运算指令等信息存储,还可以存储指挥计算机工作的程序,同时还可以保存大量的文字、图片、声音等信息资料。
硬盘:1956年9月IBM公司制造的世界上第一台磁盘存储系统只有区区的5MB 。
40GB、80GB、160GB、 320GB、1TB=1024GB4)具有逻辑判断能力计算机不仅能进行算术运算,同时也能进行各种逻辑运算,具有逻辑判断能力。
计算机的逻辑判断能力是计算机智能化必备的基本条件。
⏹计算机最基本的功能是对数据进行计算和加工处理,这些数据包括数值、文本、图形、图像、声音和视频等。
⏹在计算机系统中,这些数据都要转换成0和1的二进制形式存储,也就是二进制编码。
⏹数值的表示:定点数和浮点数⏹西文字符:ASCII码⏹汉字编码⏹西文字符采用ASCII编码(American Standard Code forInformation Interchange,美国信息交换标准码) 作为编码标准⏹ASCII编码表:⏹使用7位二进制编码,最高位为0⏹0—127,共可表示128个字符⏹‘A’~‘Z’ 26⏹‘a’~’z’ 26⏹‘0’~’9’ 10⏹其他键盘字符、控制键⏹0~32、127为非图形字符,其余94个图形字符⏹需记字符和规律:⏹换行 0AH 10⏹回车 0DH 13⏹空格 20H 32⏹‘0’~‘9’ 30H~39H 48~57⏹‘A’~‘Z’ 41H~5AH 65~90⏹‘a’~‘z’ 61H~7AH 97~122⏹例如:‚a‛字符的编码为01100001,对应的十进制数是97;⏹已知‚a‛的字符编码是97,‚d‛的是多少?⏹汉字编码:⏹(1) 输入码⏹音码类:全拼、双拼、微软拼音、自然码和智能ABC等。
⏹形码类:五笔字型法、郑码输入法、表形码等。
⏹(2) 国标码(GB2312-80)⏹每个汉字占两个字节⏹最高位0,27×27=16384⏹一级汉字:3755个;二级汉字:3008个。
⏹(3) 机内码⏹汉字在设备或信息处理系统内部最基本的表达形式。
⏹为了在计算机内部能够区分是汉字编码还是ASCII码,将国标码每个字节最高位设置为1(80H 1000 0000B).⏹国标码‚中‛(56 50)H (0 1010110 0 1010000)B⏹机内码‚中‛(D6 D0)H (1 1010110 1 1010000)B⏹(4) 汉字字形码⏹点阵:汉字字形点阵的代码,有16×16、24×24、32×32、48×48等⏹编码、存储方式简单、无需转换直接输出,放大后产生的效果差⏹思考: 24×24点阵一个汉字占多少字节?⏹矢量:存储的是描述汉字字形的轮廓特征 ⏹矢量方式特点正好与点阵相反矢量TTF 点阵 FON。
编码标准.字符的表示——字符是人与计算机交互过程中不可缺少的重要信息。
要使计算机能处理、存储字符信息,首先也必须用二进制“0”和“1”代码对字符进行编码。
下面以西文字符和汉字字符为例,介绍常用的编码标准。
(1)ASCII编码ASCII 编码是由美国国家标准委员会制定的一种包括数字、字母、通用符号和控制符号在内的字符编码集,全称叫美国国家信息交换标准代码(American Standard Code for Information Interchange)。
ASCII 码是一种7位二进制编码,能表示2 7=128种国际上最通用的西文字符,是目前计算机中,特别是微型计算机中使用最普遍的字符编码集。
ASCII编码包括4类最常用的字符。
①数字“0”~“9”。
ASCII编码的值分别为0110000B~0111001B,对应十六进制数为30H~39H。
②26个英文字母。
大写字母“A”~“Z”的ASCII编码值为41H~5AH,小写字母“a”~“z”的ASCII编码值为61H~7AH。
③用字符。
如“+”、“-”、“=”、“*”和“/”等共32个。
④制符号。
如空格符和车符等共34个。
ASCII码是一种7位编码,它存时必须占全一个字节,也即占用8位:b 7b 6b 5b 4b 3b 2b 1b 0,其中b 7恒为0,其余几位为ASCII码值。
(2)汉字编码1981年颁行的《信息交换用汉字编码字符集·基本集》(代号为GB2312-80)是交换码的国家标准,所以交换码也称为国标码。
GB2312-80共收集和定义了 7445个基本汉字。
其中,使用频度较高的 3755个汉字定义为一级汉字。
使用频率较低的 3008个汉字定义为二级汉字,共有 6763个汉字。
另外还定义了拉丁字母、俄文字母、汉语拼音字母、数字和常用符号等 682个。
GB2312- 80规定每个汉字用 2个字节的二进制编码,每个字节最高位为 0,其余 7位用于表示汉字信息。
汉字的编码方式以及相应的关系汉字的编码方式是汉字在计算机中的表示方法,即将汉字转化为二进制码以便计算机识别和处理。
在汉字的编码方式中,最常用的有GBK、GB2312、Unicode、UTF-8等。
1. GBK(国标码或扩展码)GBK是中国国家标准(GB2312)的扩展,使用两个字节表示一个汉字,因此可以表示包括简体汉字、繁体汉字、日文汉字在内的全部汉字字符。
GBK编码方式采用统一的编码标准,保证了不同计算机之间的汉字编码的兼容性。
2. GB2312(国标码)GB2312是中国国家标准的第一代汉字编码方式,使用两个字节表示一个汉字。
GB2312只包含了中华人民共和国境内的汉字和一些常用的符号、拉丁字母等。
GB2312的编码方式已经比较古老且局限性较大,不能涵盖所有汉字字符。
3. Unicode(统一码)Unicode是一种全球通用的字符编码标准,旨在为世界上几乎所有的书写系统都提供一个唯一的数字代码。
它使用两个字节(16位)表示一个字符,可以表示世界上几乎所有的字符,包括汉字。
Unicode是一种通用的编码方式,具有国际性和兼容性。
4. UTF-8(Unicode转化格式-8位)UTF-8是一种用于Unicode的可变长度字符编码,它可以使用一至四个字节表示一个字符,根据不同的字符而变化字节长度。
UTF-8编码方式兼容ASCII码,对于表示ASCII字符的部分,其字节和ASCII码完全相同,因此在ASCII字符范围内,UTF-8编码和ASCII码是相同的。
汉字编码方式之间的关系:- GB2312和GBK是中国国家标准,GB2312是GBK的子集,GBK是GB2312的扩展。
GBK编码方式在GB2312的基础上增加了更多的字符,以满足更广泛的需求,可以兼容GB2312。
- Unicode是全球通用的字符编码标准,与GB2312和GBK是不同的编码方式,Unicode可以表示更多的字符,并且具有兼容性和国际性。
数在计算机中的表示方法及编码计算机中的信息不仅有数据,还有字符、命令,其中数据还有大与小、正数与负数之分。
计算机是如何用“0”或“1”,来表示这些信息的呢?1.计算机中数的表示形式在计算机中,只有数码1和0两种不同的状态,对于一个数的正、负号,两种不同状态,约定正数的符号用0表示,负数的符号用1表示,将符号位放在数的最左边。
例如:N1=+1011,N2=-1011。
由于MCS—51为8位单片机,即信息是以8位为单位进行处理的,且每个存贮单元只能存贮—个8位的二进制数,称为一个字节,如果用一个字节(即8位二进制数)来表示上述两个符号数,它们在单片机中可分别表示为:00001011和10001011,其中最高位为符号值,其余位为数值位。
最高位为0表示是正数,最高位为1表示是负数。
这种计算机用来表示数的形式叫机器数。
而把对应于该机器数的算术值叫真值。
值得注意的是:机器数和真值的面向对象不同,机器数面向计算机,真值面向用户,机器数不同于真值。
但真值可以用机器数来表示。
机器数是计算机中表示数的基本方法,机器数通常有原码、反码和补码三种形式。
(1)原码表示方法用8位二进制数表示数的原码时,最高位为数的符号位,其余7位为数值位。
例如:真值为+120和-120的原码形式=01111000[+120]原=11111000[-120]原对于零,可以认为它是正零,也可以认为它是负零,所以零的原码有两种表示形式:[+0]=00000000原[-0]=10000000原8位二进制数原码表示范围为:11111111~01111111,即-127~+127。
(2)反码表示方法在反码表示方法中,正数的反码与原码相同,负数的反码由它对应原码除符号位之外,其余各位按位取反得到。
例如:[+120]反=[+120]原=01111000[-120]反=10000111零的反码有两种表示方式,即:[+0]反=00000000[-0]反=111111118位二进制数反码表示范围为:11111111~01111111,即-127~+127。
1、位( bit):数据储存的最小单位。
每个二进制数字0 或许 1 就是 1 个位;2、字节 (byte):8 个位构成一个字节;即:1byte(字节 )=8bit(位);1 KB = 1024 B(字节 );1 MB = 1024 KB;(2^10 B)1 GB = 1024 MB;(2^20 B)1 TB = 1024 GB;(2^30 B)3、字符 (char):a、A、中、 +、* 、の ......均表示一个字符;一般 utf-8编码下,一个汉字字符占用 3 个字节;一般 gbk 编码下,一个汉字字符占用2个字节;4、字符集:即各样各个字符的会合,也就是说哪些汉字,字母(A、b、 c)和符号(空格、引号..)会被收入标准中;5、编码:规定每个“字符”分别用一个字节仍是多个字节储存,用哪些字节来储存,这个规定就叫做“编码”。
(其实质是对字符集中字符进行编码,即:每个字符用二进制在计算中表示储存);平常的说:编码就是依据规则对字符进行翻译成对应的二进制数,在计算器中运转储存,用户看的时候(比方阅读器),在用对应的编码分析出来用户能看懂的;( 1)标准 ASCii字符集:有 96 个打印字符,和 32 个控制字符构成;一共96+32=128个;用 7 位二进制数来对每 1 个字符进行编码;而因为 7 位还还不够 1 个字节,而电脑的内部常用字节来用办理,每个字节中多出来的最高位用0 代替;0 000 0000....0 0 1111111..127;从 0----127,来表示 128 个 ACSii编码;比如:字符 'A'--在内部用 0100 0001(65)来表示;字符 'a'---在内部用 0110 0001(97)来表示;注意: '10'在计算器内部是没有编码的,因为它是字符串,而不是单个字符。
能够分别对 1,0 字符编码储存;( 2)扩展 ASCii字符集:将标准的ASCii最高位 1,获得十进制代码128---255(1 000 0000----1 111 1111);所以字符集一共有0---255,256 个字符;(3)gb2312 字符集:全部汉字字符在计算机内部采纳2 个字节来表示,每个字节的最高位规定为1【正好与标准ASCii字符(最高位是0)不重叠,并兼容】,不支持繁体字;所以: gb2312 表示汉字的编码为: [129--255][129--255](两个字节,每个字节最高位是 1);小于 127 的字符,与 ASCii编码同样;(4)gbk 字符集: gb2312 的扩大,兼容 gb2312,除了收录 gb2312 全部的字符外,还收录了其余不常有的汉字、繁体字等; gbk 中字符是一个或两个字节,单字节字符 00--7F(0---127)这个区间和 ASCII是同样的;双字节字符的第一个字节是在 81--FE(129--254)之间。
数的表示以及字符与汉字编码
数的表示以及字符与汉字编码
一、实验目的
(1)计算机中数的表示
(2)了解西文字符编码ASCII码
(3)了解汉字编码流程
二、实验任务
(1)自定义拼音系统编码,完成姓名的编码与解码操作。
(2)使用ASCII码进行字符的编码与解码。
(3)汉字的编码及存储空间的计算
三、实验步骤
1、我们已经学会了用一组比特来表示任意的数。
现在为了表示汉语的拼音系统,就需要用到4个声调和26个字母,一共30个元素。
下面我们用十进制1-30对拼音系统进行自定义编码,用0表示“空格”如下表所示。
g h I j k l m n o p
2 1
2
2
2
3
2
4
2
5
2
6
2
7
2
8
2
9
3
q r S t u v w x y z 例如:用下面的代码就能表达出“你好”的拼音编码。
1 8
1
3
3 0 1
2
5 1
9
3
请用以上的格式将自己和邻座同学的姓名进行编码,完成后相互交叉检查。
27518112141618114125194
2、ASCII表的使用:编码与解码实验。
(1)十六进制ASCII编码串的译码:写出49206C6F766520796F7521(十六进制表示,每两位表示一个字符)所代表的英文字符。
I love you!
(2)英文句子“1. You are welcome!”,其对应的ASCII编码是什么(用十六进制表示)?
891111179711410111910110899111109101
3、汉字字形码
写出下面汉字横向存储的点阵字库对应的16进制数据,并计算存储这样一个汉字需要多大的存储空间。
1860
3EFC
6DB0
5FF8
1818
1FF8
1818
1FF8
1818
1FF8
0660
FFFF
0660
1860
7060
E060需要存储空间32
0020000038000030383FFFFC0060000060603 FFFF000C00000C0187FFFFE018200030300030180 07FFC00F01E01B019E23018873FF8003018003018 003018003FF80030180020100
需要存储空间72
4、在该网址中查看编码资料/NewsList.asp?type=1008,如下载点阵字模提取与制作软件。