94:美标中形象码的总数,33--126 汉字区、位码各加上32,就会与美标形象码的
范围重合,称为该字的“国标码”,与其相对应 的两个美标符号,为该字的“国标符” 如何区分国标符与美标符:国标码的两个数字 各加上128,称“准国标”或“机内码” 机内码=(区位码)H + 8080H +2020H
..
15
BIG5码
针对繁体汉字的编码,在台湾、香港的 电脑系统中得到普遍应用
非汉字
一级汉字 二级汉字
第一字节 A1~A2 A3 C6 C7~C8 A4~C5 C6 C9~F8 81~A0
第二字节 40~7E/A1~FE 40~7E/A1~E0
A1~FE 40~7E/A1~FE 40~7E/A1~FE
每一组包含256个平面(plane),每一个平面包 含256行(row),每一行包含256个字位(cell), 又称为“列”,plane、row、cell的值范围都 是从00到FF全编码
整个编码字符集的每个字符都是由4个八位序 列表示,(按照组八位、面八位、行八位、列八 位的顺序)
可编码空间为:128X256X256X256=32KX64K
..
27
UTF-8
为满足面向字节、基于ASCII码系统的需要而 制定(主要用于数据传输、互联网)
用最多达4个字节的序列来表示每个字符,为 有效分析字符串,用第一个字节指明某个多字 节序列中的字节数
通常用于数据交换
Unicode 范围
Unicode 编码点和 UTF-8 编码字符之间的关系 UTF-8 编码的字节
的变形显现形式、特殊字符等均放在此区
..
23
ISO/IEC 10646空间分配现状