计算机中字符的编码
- 格式:doc
- 大小:29.00 KB
- 文档页数:3
ascii码编码原理ASCII码是计算机中常用的一种字符编码标准,用于将字符转换为计算机可识别的数字。
ASCII(American Standard Code for Information Interchange)码由美国国家标准学会在1963年制定,包含128个字符,其中包括了英文字母、数字、标点符号以及一些控制字符。
在ASCII码中,每个字符对应一个唯一的整数值,范围从0到127。
其中,0到31的值对应一些不能直接显示的控制字符,比如回车、换行、制表等。
而32到126的值对应的字符包括了大小写英文字母、数字、特殊符号等。
ASCII码采用7位二进制数来表示一个字符,最高位为空闲位。
这使得ASCII码只能表示128个字符,对于许多特殊字符和非英文字符来说,ASCII码无法满足需求。
为了解决这个问题,后来又推出了扩展的ASCII码,使用8位二进制数来表示一个字符,扩展了字符的范围。
在计算机中,使用ASCII码进行字符的输入、输出和储存。
当我们在键盘上输入一个字符时,计算机将通过查找相应的ASCII码来识别该字符。
同样,计算机在显示字符时也会根据ASCII码进行识别,将数字转换为对应的字符形式。
ASCII码的编码原理是将字符转换为对应的整数值,即字符与数字之间的映射关系。
字符通过ASCII码与二进制数的转换来表示,在计算机内部以二进制的形式存储和传输。
当将字符转换为对应的ASCII码时,需要使用编码表来查询字符对应的整数值。
同样地,当将ASCII码转换为对应的字符时,也需要使用解码表进行查询。
ASCII码编码原理的实质是使用了二进制数的编码方式,将字符转换为对应的二进制数,并通过ASCII码表进行映射。
这种方式简化了字符的表示和传输,方便了计算机的处理和存储。
总结起来,ASCII码编码原理是将字符转换为对应的整数值,并以二进制的形式表示和存储。
ASCII码的应用使得计算机能够方便地处理和储存字符信息,成为了计算机中不可或缺的基础知识。
常用数字编码
在计算机科学和通信领域中,常用的数字编码包括以下几种:
1.ASCII码(American Standard Code for Information Interchange):ASCII
码是最早和最常用的字符编码标准,使用7位二进制数字来表示128个字符,包括基本的拉丁字母、数字、标点符号和控制字符。
2.Unicode编码:Unicode是一种更为全面的字符编码方案,旨在涵盖全球范
围内的所有字符。
它使用16位或32位二进制数字来表示字符,包括 ASCII 码中的字符以及各种语言的字符、符号、表情符号等。
3.UTF-8编码(Unicode Transformation Format-8):UTF-8是一种变长编码
方案,用于表示 Unicode 字符集中的字符。
它使用8位二进制数字来表示字符,可以在兼容 ASCII 编码的同时支持其他字符,是互联网上最常用的字符编码方式之一。
4.UTF-16编码:UTF-16也是一种变长编码方案,使用16位二进制数字来表示
字符,能够表示 Unicode 字符集中的所有字符。
5.BCD码(Binary-Coded Decimal):BCD码是一种用于表示十进制数字的编
码方式,每个十进制数位使用4位二进制来表示,常用于数字显示和计算机中的数值处理。
1.ASCII码我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串。
每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。
也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000到11111111。
上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定。
这被称为ASCII码,一直沿用至今。
ASCII码一共规定了128个字符的编码,比如空格“SPACE”是32(二进制00100000),大写的字母A是65(二进制01000001)。
这128个符号(包括32个不能打印出来的控制符号),只占用了一个字节的后面7位,最前面的1位统一规定为0。
2.2、非ASCII编码英语用128个符号编码就够了,但是用来表示其他语言,128个符号是不够的。
比如,在法语中,字母上方有注音符号,它就无法用ASCII码表示。
于是,一些欧洲国家就决定,利用字节中闲置的最高位编入新的符号。
比如,法语中的é的编码为130(二进制10000010)。
这样一来,这些欧洲国家使用的编码体系,可以表示最多256个符号。
但是,这里又出现了新的问题。
不同的国家有不同的字母,因此,哪怕它们都使用256个符号的编码方式,代表的字母却不一样。
比如,130在法语编码中代表了é,在希伯来语编码中却代表了字母Gimel (ג),在俄语编码中又会代表另一个符号。
但是不管怎样,所有这些编码方式中,0—127表示的符号是一样的,不一样的只是128—255的这一段。
至于亚洲国家的文字,使用的符号就更多了,汉字就多达10万左右。
一个字节只能表示256种符号,肯定是不够的,就必须使用多个字节表达一个符号。
比如,简体中文常见的编码方式是GB2312,使用两个字节表示一个汉字,所以理论上最多可以表示256x256=65536个符号。
计算机中的常用编码计算机中的常用编码字符又称为符号数据,包括字母和符号等。
计算机除处理数值信息外,大量处理的是字符信息。
例如,将高级语言编写的程序输入到计算机时,人与计算机通信时所用的语言就不再是一种纯数字语言而是字符语言。
由于计算机中只能存储二进制数,这就需要对字符进行编码,建立字符数据与二进制数据之间的对应关系,以便于计算机识别、存储和处理。
1. ASSII码目前,国际上使用的字母、数字和符号的信息、编码系统种类很多,但使用最广泛的是ASCII码(American Standard Code for Interchange)。
该码开始时是美国国家信息交换标准字符码,后来被采纳为一种国际通用的信息交换标准代码。
ASCII码总共有128个元素,其中包括32个通用控制字符,10个十进制数码,52个英文大、小写字母和34个专用符号。
因为ASCII码总共为128个元素,故用二进制编码表示需用7位。
任意一个元素由7位二进制数D7D6D5D4D3D2D1表示,从0000000到1111111共有128种编码,可用来表示128个不同的字符。
ASCII码是7位的编码,但由于字节(8位)是计算机中常用单位,故仍以1字节来存放一个ASCII字符,每个字节中多余的最高位D7取为0。
表1-3所示为7位ASCII编码表(省略了恒为0的最高位D7)。
表1-3 7位ASCII编码表要确定某个字符的ASCII码,在表中可先查到它的位置,然后确定它所在位置相应的列和行,最后根据列确定高位码(D6D5D4),根据行确定低位码(D3D2D1D0),把高位码与低位码合在一起就是该字符的ASCII码(高位码在前,低位码在后)。
例如,字母A的ASCII码是1000001,符号"+"的ASCII码是0101011。
ASCII码的特点如下。
编码值0~31(0000000~0011111)不对应任何可印刷字符,通常为控制符,用于计算机通信中的通信控制或对设备的功能控制;编码值为32(0100000)是空格字符,编码值为127(1111111)是删除控制DEL码;其余94个字符为可印刷字符。
字符编码的发展历史节点字符编码是计算机系统中用来表示和存储字符的方式,它随着计算机技术的发展出现了许多不同的历史节点。
1. ASCII编码:ASCII(American Standard Code for Information Interchange)是最早的字符编码标准。
它使用7个比特位(后来扩展至8个比特位)来表示128个不同的字符,包括英文字母、数字以及常见的特殊字符。
ASCII编码在1963年被正式推出,成为了现代字符编码的基础。
2. ISO-8859编码:随着计算机在全球范围内的普及,美国的ASCII编码无法满足其他语言的需要。
因此,国际标准化组织(ISO)推出了ISO-8859系列编码,以满足不同国家和地区的字符需求。
其中,ISO-8859-1编码是欧洲字符的标准编码。
3. Unicode编码:随着计算机技术的飞速发展,需要一种统一的编码方案来表示所有字符。
Unicode应运而生,它提供了全球统一的字符编码方案。
Unicode编码使用16位比特位(后来扩展至32位)来表示每个字符,可包含几乎所有的语言和符号。
Unicode编码在1991年首次发布,目前广泛应用于各种操作系统和软件。
4. UTF-8编码:为了减少存储空间的占用和传输带宽的消耗,出现了一种可变长度的Unicode编码方案,即UTF-8编码。
UTF-8编码是一种向后兼容的编码方式,它可以表示任意Unicode字符,但只使用1至4个字节来编码字符,大多数常用字符只使用1至2个字节。
UTF-8编码是互联网上最常用的字符编码之一。
5. GB18030编码:由于Unicode编码包含了全球范围内的字符,对于中国汉字的表示,GB2312编码已经无法满足需求。
因此,在2000年,中国制定了新的编码标准GB18030,它是对Unicode的扩展,能够准确表示所有的汉字和其他字符。
综上所述,字符编码的发展历史经历了ASCII编码、ISO-8859编码、Unicode编码、UTF-8编码和GB18030编码等多个重要节点,每个节点都在不同程度上解决了字符表示和存储的需求。
常用的字符编码随着互联网的发展,人们的交流方式也在不断变化。
在这个数字化时代,我们经常需要在电脑上输入中文、英文、数字、符号等多种字符。
而这些字符都需要通过字符编码的方式转化为计算机能够识别的二进制代码,才能在屏幕上显示出来。
本文将介绍几种常用的字符编码方式。
ASCII码ASCII码(American Standard Code for Information Interchange,美国信息交换标准代码)是一种最早的字符编码方式,它规定了英文字符、数字和一些符号的二进制代码。
ASCII码使用7位二进制数表示一个字符,因此最多只能表示128种字符。
常见的ASCII码表如下:ASCII码表中,数字0-9的二进制代码分别为00110000-00111001,大写字母A-Z的二进制代码分别为01000001-01011010,小写字母a-z 的二进制代码分别为01100001-01111010。
ISO-8859编码ISO-8859编码是一种基于ASCII码的字符编码方式,它扩展了ASCII码表,增加了欧洲语言中的特殊字符。
ISO-8859编码使用8位二进制数表示一个字符,因此最多可以表示256种字符。
ISO-8859编码有多个版本,每个版本针对不同的语言和地区,例如ISO-8859-1适用于拉丁字母语言,ISO-8859-2适用于中东欧语言,ISO-8859-3适用于南欧语言等等。
Unicode编码Unicode编码是一种全球通用的字符编码方式,它包含了几乎所有世界上使用的字符,包括中文、日文、韩文等。
Unicode编码使用16位或32位二进制数表示一个字符,因此最多可以表示65536或4294967296种字符。
Unicode编码有多种实现方式,最常用的是UTF-8和UTF-16编码。
UTF-8编码UTF-8编码是一种变长的Unicode编码方式,它使用1-4个字节表示一个字符,根据字符的不同而变化。
计算机常用编码一、字符编码字符编码是将字符集中的每个字符与一个唯一的数字码相对应的过程。
常见的字符编码标准包括ASCII码、Unicode、GB2312、GBK和UTF-8等。
ASCII码是最早的字符编码标准,它将128个字符分配了0-127的码值。
Unicode则是一个跨平台的字符编码标准,它为每个字符提供了一个唯一的码值,适用于国际化的应用。
GB2312和GBK是中国常用的字符编码标准,支持中文字符的编码。
UTF-8是一种可变长度字符编码,它支持多种语言字符,并且兼容ASCII码。
二、数值编码数值编码是指将数值数据转换为二进制或其他进制表示的过程。
常见的数值编码方式包括二进制、十进制、十六进制等。
二进制是计算机内部处理数据的格式,所有的信息都被表示成二进制形式。
十进制是我们日常使用的数字表示方式,而十六进制则是一种简化的数字表示方式,它使用数字0-9和字母A-F来表示数值。
三、图像编码图像编码是指将图像数据转换为二进制或其他进制表示的过程。
常见的图像编码方式包括JPEG、PNG、BMP等。
JPEG是一种有损压缩的图像编码格式,广泛应用于网络和多媒体应用中。
PNG是一种无损压缩的图像编码格式,支持透明度和渐变效果。
BMP是一种简单的图像编码格式,它是未经压缩的位图格式。
四、音频编码音频编码是指将音频数据转换为二进制或其他进制表示的过程。
常见的音频编码方式包括MP3、AAC、WAV等。
MP3是一种有损压缩的音频编码格式,广泛应用于音乐和语音的存储和传输中。
AAC是一种高级音频编码格式,支持更高的音质和更高效的压缩。
WAV是一种无损压缩的音频编码格式,支持多种音频采样率和位深度。
五、视频编码视频编码是指将视频数据转换为二进制或其他进制表示的过程。
常见的视频编码方式包括MPEG、AVI、MOV等。
MPEG是一种有损压缩的视频编码格式,广泛应用于视频存储和传输中。
AVI是一种无损压缩的视频编码格式,支持多种视频分辨率和帧率。
计算机常用的编码一、字符编码字符编码是用于将字符集(如英文字母、数字、标点符号等)转换为计算机可以理解的二进制数的一种方式。
以下是几种常见的字符编码:1.ASCII码:ASCII码是用于将字符集转换为二进制数的标准编码方式。
它包含了128个不同的字符,每个字符由7位二进制数表示。
2.Unicode:Unicode是一种国际化的字符编码标准,它包含了世界上几乎所有语言的字符。
每个Unicode字符由16位二进制数表示。
3.GB2312和GBK:GB2312是中国国家强制标准,包含了6000多个常用汉字和英文符号。
GBK是在GB2312基础上扩展的,包含了更多的汉字和符号。
4.UTF-8:UTF-8是一种可变长度的字符编码,它能够表示任何Unicode字符。
UTF-8编码的每个字符由1到4个字节表示,对于英文字母和数字,UTF-8编码与ASCII码相同。
二、数值编码数值编码是用于将数值转换为二进制数的一种方式。
以下是几种常见的数值编码:1.二进制:二进制是最简单的数值编码方式,只有0和1两种状态。
2.十进制:十进制是我们日常使用的数值编码方式,它有0到9共10个数字。
3.十六进制:十六进制是一种简化的数值编码方式,它有0到9和A到F共16个数字。
在计算机科学中,十六进制常用于表示二进制数的简写方式。
三、图像编码图像编码是将图像数据转换为二进制数的一种方式。
以下是几种常见的图像编码:1.JPEG:JPEG是一种常用的图像压缩标准,它采用有损压缩算法,能够在保证图像质量的前提下,大大减少图像数据的存储空间。
2.PNG:PNG是一种无损压缩的图像格式,它能够保留原始图像的所有信息,并且在压缩后不失真。
PNG广泛应用于网页设计、软件界面设计等领域。
3.GIF:GIF是一种基于LZW算法的压缩图像格式,它可以支持动态图像和透明背景。
GIF广泛应用于网页中的动画、图标等设计。
四、音频编码音频编码是将音频数据转换为二进制数的一种方式。
国际计算机编码计算机中的编码知识编码是指将一种数据形式转换为另一种数据形式的过程。
在国际计算机编码中,编码是计算机系统中非常重要的概念。
它涉及到如何表示和存储各种数据类型,包括字符、数字、图像、声音和视频等。
编码的选择对计算机系统的性能和功能起着至关重要的作用。
在国际计算机编码中,最常用的编码是字符编码。
字符编码是将字符映射到数字的一种方式。
最经典的字符编码是ASCII码(American Standard Code for Information Interchange)。
ASCII码使用7位二进制数表示128个字符,包括英文字母、数字、标点符号和控制字符等。
ASCII码为计算机系统提供了一种标准的字符表示方式,使得不同计算机系统之间可以进行字符数据的交流和存储。
然而,ASCII码只能表示有限的字符集,并且只适用于英语等少数语言。
随着计算机应用范围的扩大,需要更加全面和丰富的字符编码。
为此,出现了各种扩展的字符编码标准,如ISO-8859、UTF-8和UTF-16等。
ISO-8859是一系列的字符编码标准,用于表示拉丁字母系列语言和其他常用字符。
常见的ISO-8859编码包括ISO-8859-1(Latin-1)和ISO-8859-2(Latin-2)。
ISO-8859-1编码可以表示大多数欧洲语言的字符,而ISO-8859-2编码可以表示东欧语言的字符。
ISO-8859编码使用8位二进制数表示字符,因此可以表示256个字符。
与ISO-8859不同,UTF-8和UTF-16是一种变长的字符编码标准。
UTF-8使用8位、16位和32位二进制数表示字符,可以表示几乎所有的字符。
UTF-8是一种向后兼容的编码方式,可以表示ASCII字符,并向后兼容ISO8859-1编码。
这使得UTF-8成为全球范围内最常用的字符编码标准之一UTF-16编码也是一种变长编码方式,它使用16位和32位二进制数表示字符。
汉字的编码方式以及相应的关系汉字的编码方式是汉字在计算机中的表示方法,即将汉字转化为二进制码以便计算机识别和处理。
在汉字的编码方式中,最常用的有GBK、GB2312、Unicode、UTF-8等。
1. GBK(国标码或扩展码)GBK是中国国家标准(GB2312)的扩展,使用两个字节表示一个汉字,因此可以表示包括简体汉字、繁体汉字、日文汉字在内的全部汉字字符。
GBK编码方式采用统一的编码标准,保证了不同计算机之间的汉字编码的兼容性。
2. GB2312(国标码)GB2312是中国国家标准的第一代汉字编码方式,使用两个字节表示一个汉字。
GB2312只包含了中华人民共和国境内的汉字和一些常用的符号、拉丁字母等。
GB2312的编码方式已经比较古老且局限性较大,不能涵盖所有汉字字符。
3. Unicode(统一码)Unicode是一种全球通用的字符编码标准,旨在为世界上几乎所有的书写系统都提供一个唯一的数字代码。
它使用两个字节(16位)表示一个字符,可以表示世界上几乎所有的字符,包括汉字。
Unicode是一种通用的编码方式,具有国际性和兼容性。
4. UTF-8(Unicode转化格式-8位)UTF-8是一种用于Unicode的可变长度字符编码,它可以使用一至四个字节表示一个字符,根据不同的字符而变化字节长度。
UTF-8编码方式兼容ASCII码,对于表示ASCII字符的部分,其字节和ASCII码完全相同,因此在ASCII字符范围内,UTF-8编码和ASCII码是相同的。
汉字编码方式之间的关系:- GB2312和GBK是中国国家标准,GB2312是GBK的子集,GBK是GB2312的扩展。
GBK编码方式在GB2312的基础上增加了更多的字符,以满足更广泛的需求,可以兼容GB2312。
- Unicode是全球通用的字符编码标准,与GB2312和GBK是不同的编码方式,Unicode可以表示更多的字符,并且具有兼容性和国际性。
计算机中字符的编码
一个二进制数位简称为位(英文名称为bit)。
计算机中最直接、最基本的操作就是对二进制位的操作。
一个二进制位可表示两种状态(0或1)。
两个二进制位可表示四种状态(00,01,10,11)。
位数多,所表示的状态就越多。
ASCII 码
ASCII 码是美国信息交换用标准代码(American Standard Codefor Information Inte rchange)。
ASCII码虽然是美国国家标准,但它已被国际标准化组织(ISO)认定为国际标准,为世界公认,并在世界范围内通用。
ASCII码用一个8位二进制数(字节)表示,每个字节只占用了7位,最高位恒为0。
7位ASCII码可以表示128(27=128)种字符,其中通用控制字符34个,阿拉伯数字10个,大、小写英文字母52个,各种标点符号和运算符号32个。
编码范围二进制十进制十六进制基本ASCII 码00000000~011111110~1270~7F
控制字符00000000~00100000、011111110~32、1270~1F、7F
数字00110000~0011100148~5730~39
大写字母01000001~010*******~9041~5A
小写字母01100001~0111101097~12261~7A
当最高位为0时,称为基本ASCII码,当最高位为1时,形成扩充的ASCII码,它表示数的范围为128~255,可表示128种字符。
通常各个国家都把扩充的ASCII码作为自己国家语言文字的代码。
汉字编码
我国用户在使用计算机进行信息处理时,一般都要用到汉字。
由于汉字是象形文字,字的数目很多,常用汉字就有3000~5000个,加上汉字的形状和笔画多少差异极大,因此,不可能用少数几个确定的符号将汉字完全表示出来,或像英文那样将汉字拼写出来。
汉字必须有它自己独特的编码。
1. 汉字信息交换码(国标码)
《信息交换用汉字编码字符集·基本集》是我国于1980年制定的国家标准GB2312-80,代号为国标码,是国家规定的用于汉字信息处理使用的代码依据。
GB2312-80中规定了信息交换用的6763个汉字和682个非汉字图形符号(包括几种外文字母、数字和符号)的代码。
6763个汉字又按其使用频度、组词能力以及用途大小分成一级常用汉字3755个和二级常用汉字3008个。
一级汉字按拼音字母顺序排列;若遇同音字,则按起笔的笔形顺序排列;若起笔相同,则按第二笔的笔形顺序排列,依次类推。
所谓笔形顺序,就是横、竖、撇、点和折的顺序。
二级汉字按部首顺序排列。
在此标准中,每个汉字(图形符号)采用双字节表示。
每个字节只用低7位,最高位恒为1。
由于低7位中有34种状态是用于控制字符,因此,只有94(128-34=94)种状态可用于汉字编码。
这样,双字节的低7位只能表示94×94=8836种状态。
编码范围二进制数码十进制数码基本ASCII 码00000000~011111110~127
控制字符00000000~00100000、011111110~32、127
可用汉字段00100001~0111111033~126 (1~94)
扩充ASCII 码10000000~11111111128~255
控制字符10000000~10100000、11111111128~160、255
GB2312-8010100001~11111110161~254 (1~94)
此标准的汉字编码表有94行、94列,其行号称为区号,列号称为位号。
双字节中,用高字节表示区号,低字节表示位号。
非汉字图形符号置于第1~11区,一级汉字3755个且于第16~55区,二级汉字3008个置于第56~87区。
每个图形字符的汉字交换码,均用两个字节的低7位二进制码表示。
汉字国标码通常用十六进制数表示。
例如:“中”字的区号为54,位号为48,计算它的二进制数和十六进制数国标码。
解:先将区、位号分别加上32 :
54+32=86
48+32=80
分别转换为二进制数:
(86)10=01010110
(80)10=01010000
得到二进制数国标码为:
01010110 01010000。
最后通过8 4 2 1 ── 二进制取位法转换成十六进制汉字国标码为:5650。
又如“国”字的区号为25,位号为90,用以上相同的方法得到它的国标码为:
二进制:00111001 01111010
十六进制:397A
2. 汉字的机内码
汉字的机内码是供计算机系统内部进行存储、加工处理、传输统一使用的代码,又称为汉字内部码或汉字内码。
目前使用最广泛的一种为两个字节的机内码,俗称变形的国标码。
这种格式的机内码是将国标GB2312-80 交换码的两个字节的最高位分别置为l而得到的。
其最大优点是机内码表示筒单,且与交换码之间有明显的对应关系,同时也解决了中西文机内码存在二义性的问题。
例如“中”的国标码为十六进制:
5650(01010110 01010000),
其对应的机内码为十六进制:
D6D0(11010110 11010000)。
同样,“国”字的国标码为:397A,其对应的机内冯为:B9FA。
汉字的机内码与国标码的关系:
◆十六进制:
机内码区号(16)=国标码高位字节+80H
机内码位号(16)=国标码低位字节+80H
◆十进制:
机内码区号=国标码高位字节(10)+128
机内码位号=国标码低位字节(10)+128
汉字的区位码与国标码的关系:
◆十六进制:
国标码高位字节=区位码区号(16)+20H
国标码低位字节=区位码位号(16)+20H
◆十进制:
国标码高位字节(10)=区位码区号+32
国标码低位字节(10)=区位码位号+32
汉字的区位码与机内码的关系:
◆十六进制:
机内码高位字节=区位码区号(16)+A0H
机内码低位字节=区位码位号(16)+A0H
◆十进制:
机内码高位字节(10)=区位码区号+160
机内码低位字节(10)=区位码位号+160
3. 汉字的输入码(外码)
汉字输入码是为了将汉字通过键盘输入计算机而设计的代码。
汉字输入编码方案很多,其表示形式大多用字母、数字或符号。
输入码的长度也不同,多数为四个字节。
综合起来可分为流水码、拼音类输入法、拼形类输入法和音形结合类输入法几大类。
4. 汉字的字形码
汉字字形码是汉字字库中存储的汉字字形的数字化信息,用于汉字的显示和打印。
目前汉字字形的产生方式大多是数字式,即以点阵方式形成汉字。
因此,汉字字形码主要是指汉字字形点阵的代码。
汉字字形点阵有l6×16点阵、24×24点阵、32×32点阵、64×64点阵、96×96点阵、128×128点阵、256×256点阵等。
一个汉字方块中行数、列数分得越多,描绘的汉字也就越细微,但占用的存储空间也就越多。
汉字字形点阵中每个点的信息要用一位二进制码来表示。
对于16×16点阵的字形码,需要用32个字节(16×16÷8=32)表示;24×24点阵的字形码需要用72个字节(24×24÷8=72)表示。
汉字字库,是汉字字形数字化后,以二进制文件形式存储在存储器中而形成的汉字字模库。
汉字字模库亦称汉字字形库,简称汉字字库。
汉字字库可分为软汉字字库和硬汉字字库。
汉字字库文件存储在软盘或硬盘中,称为软汉字宇库。
汉字字库存储在汉卡中,将汉卡安装在机器的扩展槽中,称为硬汉字字库,亦称汉卡。