汉字编码技术
- 格式:ppt
- 大小:624.50 KB
- 文档页数:37
我国汉字编码标准首先,我国的汉字编码标准在不同阶段都遵循了统一性、规范性和适用性的原则。
在GB2312-80发布之后,我国的计算机领域得到了长足的发展,但是随着信息化建设的深入,GB2312-80已经不能满足当今社会对汉字编码的需求。
因此,1995年发布了GBK编码,它在GB2312-80的基础上增加了对繁体字和少数民族文字的支持。
而随着国际化的发展,GB18030-2005标准的发布则进一步完善了我国汉字编码标准,使其更加符合国际标准。
其次,我国汉字编码标准的发展也受益于技术的进步和应用的需求。
随着计算机技术的不断发展,对于汉字编码的要求也越来越高。
GB18030-2005标准的发布,不仅支持了Unicode标准,还对繁体字和少数民族文字进行了更好的支持,使得我国的汉字编码标准更加符合当今信息化建设的需要。
再者,我国汉字编码标准的发展也受益于国际化的趋势。
随着我国在国际上的地位不断提升,对于国际标准的遵循和应用也越来越重要。
GB18030-2005标准的发布,使得我国的汉字编码标准更加符合国际标准,为我国在国际上的信息交流和合作提供了更好的支持。
最后,我国汉字编码标准的发展也为我国的信息化建设和文化传承提供了更好的支持。
汉字是我国的传统文化符号,对于汉字的数字化编码,不仅可以更好地保护和传承我国的传统文化,还可以更好地适应当今信息化建设的需要。
因此,我国汉字编码标准的不断完善和发展,为我国的信息化建设和文化传承提供了更好的基础和保障。
总之,我国汉字编码标准的发展经历了多个阶段,每一次的更新都是为了更好地适应当代社会的需求。
随着技术的进步、国际化的趋势以及信息化建设的需求,我国汉字编码标准将会不断完善和发展,为我国的信息化建设和文化传承提供更好的支持和保障。
汉字编码问题由于常常要和汉字处理打交道,因此,我常常受到汉字编码问题的困扰。
在不断的打击与坚持中,也积累了一点汉字编码方面的经验,想和大家一起分享。
一、汉字编码的种类汉字编码中现在主要用到的有三类,包括GBK,GB2312和Big5。
1、GB2312又称国标码,由国家标准总局发布,1981年5月1日实施,通行于大陆。
新加坡等地也使用此编码。
它是一个简化字的编码规范,当然也包括其他的符号、字母、日文假名等,共7445个图形字符,其中汉字占6763个。
我们平时说6768个汉字,实际上里边有5个编码为空白,所以总共有6763个汉字。
GB2312规定“对任意一个图形字符都采用两个字节表示,每个字节均采用七位编码表示”,习惯上称第一个字节为“高字节”,第二个字节为“低字节”。
GB2312中汉字的编码范围为,第一字节0xB0-0xF7(对应十进制为176-247),第二个字节0xA0-0xFE(对应十进制为160-254)。
GB2312将代码表分为94个区,对应第一字节(0xa1-0xfe);每个区94个位(0xa1-0xfe),对应第二字节,两个字节的值分别为区号值和位号值加32(2OH),因此也称为区位码。
01-09区为符号、数字区,16-87区为汉字区(0xb0-0xf7),10-15区、88-94区是有待进一步标准化的空白区。
2、Big5又称大五码,主要为香港与台湾使用,即是一个繁体字编码。
每个汉字由两个字节构成,第一个字节的范围从0X81-0XFE(即129-255),共126种。
第二个字节的范围不连续,分别为0X40-0X7E(即64-126),0XA1-0XFE(即161-254),共157种。
3、GBK是GB2312的扩展,是向上兼容的,因此GB2312中的汉字的编码与GBK中汉字的相同。
另外,GBK中还包含繁体字的编码,它与Big5编码之间的关系我还没有弄明白,好像是不一致的。
GBK中每个汉字仍然包含两个字节,第一个字节的范围是0x81-0xFE(即129-254),第二个字节的范围是0x40-0xFE(即64-254)。
标准中文电码标准中文电码,也被称为简体字电码,是一种用来输入中文字符的输入法。
它是由中国国家标准GB/T 16264-1996《信息技术汉字输入编码方案》规定的。
标准中文电码的最基本单位是汉字。
每个汉字都有一个独特的电码,用于表示该汉字。
标准中文电码的编码方式是按照汉字的部首、偏旁、笔画等因素进行分类。
每个编码一般包括四位数字或字母。
标准中文电码的编码规则如下:1. 汉字的编码按照部首、偏旁、笔画的顺序进行。
首先根据汉字的部首进行分类,然后根据偏旁进行细分,最后再根据笔画进行具体编码。
2. 部首的编码采用一位数字表示,共有五个不同的编码范围,分别是1-5、6-10、11-15、16-20和21-23。
根据这个编码范围,可以确定该汉字的部首属于哪个编码范围。
3. 偏旁的编码采用一位数字表示,共有17个不同的编码范围,分别是1-17。
根据这个编码范围,可以确定该汉字的偏旁属于哪个编码范围。
4. 笔画的编码采用两位数字表示,共有99个不同的编码范围,从00到99。
根据这个编码范围,可以确定该汉字的笔画属于哪个编码范围。
5. 汉字的具体编码由部首、偏旁和笔画编码组成,一共是四位数字。
例如,字母A的编码是0001,字母B的编码是0002,以此类推。
标准中文电码的优点是简单、易学、易用。
由于采用了部首、偏旁和笔画等因素进行分类,使得汉字的编码更加准确和高效。
同时,标准中文电码还具有输入汉字简单、速度快的优点,适用于各种不同的输入设备和场景。
总之,标准中文电码是一种用来输入中文字符的输入法,它采用部首、偏旁、笔画等因素对汉字进行分类,通过编码来表示汉字。
它具有简单、易学、易用的特点,适用于各种不同的输入场景和设备。
汉字的编码方式以及相应的关系汉字的编码方式以及相应的关系在当今信息时代,汉字编码方式是一个备受关注的话题。
汉字作为中文的基本表达形式,其编码方式的选择和规范对于信息技术、文化传承以及国际交流都具有重要的意义。
我们有必要对汉字的编码方式进行全面评估,并根据深度和广度的要求来探讨其相关的问题。
我们来看一下汉字的编码方式。
汉字的编码方式有多种,其中最为常见的是Unicode、GBK、Big5等。
Unicode是一个国际标准,它主要用于整合和统一世界上所有的符号和文字。
而GBK是我国最常用的字符集,它包含了大部分常用汉字和少量的生僻字,是我国计算机领域的标准。
与此相对应的是Big5编码,它是台湾地区所使用的一种传统编码方式。
这些不同的编码方式在一定程度上反映了汉字的传统与现代、国际化与本土化的关系。
进一步来说,汉字的编码方式与其发展历史、文化底蕴以及实际运用之间存在着紧密的关系。
汉字作为中国文字的代表,承载着悠久的历史和深厚的文化内涵。
其编码方式不仅仅是一种技术手段,更是对于汉字所承载的文化价值和民族认同的体现。
我们在选择和规范汉字的编码方式时,需要全面考量文化传承、技术发展和国际交流的多重需求,确保汉字得到妥善的保护和传承。
我们还需要深入思考汉字的编码方式对于教育、出版、文化创意产业等方面的影响和作用。
随着信息化技术的发展,汉字的编码方式不仅仅是影响计算机输入、网页显示等技术领域,更是对于教育教学、文学创作、文化传播等领域产生着深远的影响。
我们需要在汉字的编码方式上进行深入的评估和探讨,更好地发挥其在各个领域中的作用和效果。
在总结和回顾上述内容时,我们可以清晰地看到汉字的编码方式是一个涵盖文化、技术、教育等多个领域的综合话题。
其深度和广度不仅需要我们全面理解其相关知识和背景,更需要我们具备跨学科、跨领域的能力来进行分析和思考。
个人而言,我认为汉字的编码方式是一个值得我们深入研究和关注的话题,它不仅关乎我国的文化传承和软实力的提升,更关乎我们对于技术发展和人文精神的综合理解。
类推技术标准说一说汉字编码技术标准中的类推简化1.引言随着《通用规范汉字表》发布,一场宣传已经展开,随之也有一些争论出现。
争论中一个重要问题,或焦点性问题:是应该实行有限制的类推,还是无限制的类推?这个问题不仅仅是语言文字学里的理论性争论,它密切关联着电脑的实际使用。
实际上,此次的《字表》已经继续类推出一批电脑汉字编码中没有的汉字,即新造了一批电脑外字,160余个。
这将带来一系列不良后果。
由于汉字编码技术标准是新事物,其产生历史不过仅仅三十多年,又具有较强的技术性,领导机构管理者、广大公众对其了解较少。
本文将对此做简要但也是较为完整的介绍。
2.文字编码技术标准的产生世界上最早的文字计算机编码技术标准是ISO646—1973(约40年前)。
这是一个关于拉丁字母文字的国际编码标准。
编码的字符包括拉丁字母、数码以及标点等其他符号,总计94个可见图形字符,及一些起控制作用符号共计128个,占用7位二进制位。
此标准的前身是美国国内的编码技术标准,1960年代的版本中只有大写字母,没有小写字母;后来补充大写字母,又被称为ASCII字符集。
这个ISO646或者说是ASCII字符集,成为世界信息技术界最重要的技术标准。
它决定了拉丁字母文字信息的表达、存储、加工、以及传输,保障了一大批西方文字、科技语言、程序语言在全球范围的电子化流通。
这个信息化的、电子化的字符集,取代了历史久远,在工业时代、机械化时代成功广泛应用的,以纸质印刷形式为主的‘字母表’,成为文字规范的新形式、新手段。
以此为基础的英文信息处理电脑化的成功,极大地刺激了、推动了世界各国文字处理技术的电脑化浪潮。
3.中国汉字编码技术标准的初期,简化字无限制类推阶段中国的第一个汉字计算机编码技术国家标准是GB2312—1980(刚刚33年)。
这是在国际性文字处理电脑化浪潮初起时期的一项开创性工作。
主持者是一位比王选还年轻十来岁的青年技术工作者。
该标准的语言文字学依据,自然靠向语文学家请教,遵循了当时语文界的主流认识。
我国字符编码标准我国字符编码标准我国字符编码标准是指在计算机系统中,将字符与二进制代码相互对应的规则。
我国字符编码标准主要有GB2312、GBK、GB18030等。
GB2312是我国最早的字符编码标准,于1980年发布。
它包含了6763个汉字和682个非汉字字符,其中包括了基本汉字、次常用汉字和一些符号。
GB2312采用双字节编码,每个汉字占两个字节,每个非汉字字符占一个字节。
GB2312的出现,使得计算机能够处理中文字符,为中文信息处理提供了基础。
GBK是GB2312的扩展版本,于1995年发布。
GBK包含了21003个汉字和882个非汉字字符,其中包括了GB2312中的所有字符。
GBK同样采用双字节编码,但是它的编码范围更广,能够表示更多的汉字字符。
GBK的出现,使得计算机能够更好地处理中文字符,为中文信息处理提供了更多的可能性。
GB18030是我国最新的字符编码标准,于2000年发布。
GB18030包含了27484个汉字和760个非汉字字符,其中包括了GBK中的所有字符。
GB18030同样采用双字节编码,但是它的编码范围更广,能够表示更多的汉字字符和其他语言字符。
GB18030的出现,使得计算机能够更好地处理多语言字符,为多语言信息处理提供了更多的可能性。
总的来说,我国字符编码标准的发展历程,是从GB2312到GBK再到GB18030的过程。
这一过程中,我国字符编码标准不断完善和扩展,为计算机处理中文和多语言信息提供了更好的支持。
同时,我国字符编码标准的发展,也为中文信息处理和多语言信息处理的发展提供了重要的技术基础。
在实际应用中,我们需要根据具体的需求选择合适的字符编码标准。
如果只需要处理基本的中文字符,可以选择GB2312;如果需要处理更多的中文字符,可以选择GBK;如果需要处理多语言字符,可以选择GB18030。
选择合适的字符编码标准,可以提高计算机处理信息的效率和准确性,为信息处理提供更好的支持。
我国汉字编码标准我国汉字编码标准的制定经历了多个阶段的发展。
早期的汉字编码标准主要是针对计算机技术的发展和应用需求而制定的。
随着信息技术的不断发展,我国汉字编码标准也在不断完善和更新。
目前,我国汉字编码标准已经形成了一套完整的体系,包括了GB2312、GBK、GB18030等多个版本。
GB2312是我国早期的汉字编码标准,它采用双字节编码方案,共收录6763个汉字和682个非汉字符号。
GB2312标准的推出,标志着我国汉字编码标准化工作的开始。
随着计算机技术的迅速发展,GB2312标准已经不能满足当今信息处理的需要,于是在1995年,GBK标准应运而生。
GBK标准是在GB2312的基础上进行了扩展,共收录了21003个汉字和图形符号。
与GB2312相比,GBK标准的编码方案更加完善,字符编码更加规范。
在GBK标准的基础上,我国还制定了GB18030标准,它是目前最新的汉字编码标准,共收录了70244个汉字和图形符号,涵盖了中国大陆、香港、澳门以及台湾地区使用的汉字字符。
我国汉字编码标准的制定不仅在技术上取得了重大突破,而且在推动汉字信息化处理、促进中文信息交换和共享方面也发挥了重要作用。
汉字编码标准的不断完善,为我国信息化建设提供了有力支撑,也为汉字的国际化应用奠定了基础。
总的来说,我国汉字编码标准的制定经历了多个阶段的发展,从GB2312到GBK再到GB18030,每一个阶段都标志着我国汉字编码标准化工作的不断完善和更新。
汉字编码标准的不断发展,不仅推动了我国信息技术的进步,也为汉字的国际化应用提供了有力支持。
相信随着科技的不断发展,我国汉字编码标准将会迎来更加美好的未来。
汉字编码名词解释
汉字编码是指将汉字转换为数字或符号的方法,是计算机处理汉字数据的基础。
汉字编码通常分为两种类型:一种是基于拼音的编码,另一种是基于笔画的编码。
基于拼音的编码,也称为注音编码,是利用汉字的拼音作为编码基础。
在注音编码中,每个汉字都对应一个唯一的拼音,将拼音转换为数字后,可以用来表示该汉字的编码。
例如,“张”字的拼音是“zhāng”,它的编码可以是1Z。
基于笔画的编码,是利用汉字的笔画作为编码基础。
在基于笔画的编码中,
每个汉字都对应一个唯一的笔画,根据笔画顺序将汉字转换为数字。
例如,“王”字的笔画数为4,它的编码可以是1N4。
汉字编码不仅可以用于计算机处理汉字数据,还可以用于汉语学习、汉字书法等领域。
此外,随着人工智能技术的发展,汉字编码也可能会被应用于自动翻译、语音识别等领域。
拓展:
汉字编码的发展历程可以追溯到20世纪50年代。
当时,中国科学家钱学森提出了基于拼音的汉字编码方案,并在中国科学院计算机中心进行试用。
此后,
基于拼音的汉字编码方案逐渐成为主流。
随着计算机技术的发展,汉字编码也得到了进一步改进。
基于拼音的汉字编码方案采用了拼音和注音符号相结合的方法,使得拼音输入更加准确和方便。
同时,基于笔画的编码方案也不断发展,采用了多种算法来提高编码效率和准确性。
汉字编码不仅是计算机处理汉字数据的基础,也是汉语学习、汉字书法等领域的重要工具。
此外,随着人工智能技术的发展,汉字编码也可能会被应用于自动
翻译、语音识别等领域。
中文汉字的各种编码标准
随着计算机技术的不断发展,中文汉字的编码标准也相应地出现了多种。
这些编码标准的出现,对于中文汉字的输入、存储、传输等方面都起到了重要的作用。
目前,常见的中文汉字编码标准主要有以下几种:
1. GB2312编码:GB2312是我国首个官方公布的中文字符集,共收录了6763个常用汉字和682个生僻汉字,是目前使用最广泛的汉字编码标准之一。
2. GBK编码:GBK是GB2312的扩展版本,包含了大约21000个汉字,包括了GB2312中的所有字符,并增加了一些生僻汉字和繁体汉字。
GBK编码标准的出现,大大方便了中文汉字的输入和存储。
3. GB18030编码:GB18030是我国最新的汉字编码标准,共收录了70244个字符,包括了GB2312、GBK中的所有字符以及一些罕见汉字、藏文、蒙文等字符。
GB18030编码标准的出现,使得中文汉字在国际间的交流变得更加便捷。
4. Unicode编码:Unicode是一种全球范围内通用的字符集标准,包括了世界上所有的语言和符号。
其中,汉字部分被分为中日韩统一表意文字(简称CJK汉字),是目前最常用的汉字编码标准之一。
总之,中文汉字编码标准的多样化和不断更新,为中文汉字的计算机化应用提供了强有力的支持。
在未来,随着技术的不断发展,我们也有理由期待更加先进、更加智能的汉字编码标准的出现。
- 1 -。
中文编码规则
中文编码规则是涉及计算机处理和传输汉字的重要技术。
以下是几种常见的中文编码规则:
1. GB2312编码:GB2312简体中文编码,一个汉字占用2个字节,在大陆是主要的编码方式。
当文章/网页中包含繁体中文、日文、韩文等时,这些内容可能无法被正确编码。
范围:高字节从A1-A7,低字节从A1到FE。
将高字节和低字节分别加上0xA0即可得到编码。
2. GBK编码:GBK编码是GB2312的扩展,支持更多的汉字字符。
它也是一个双字节编码方案,兼容GB2312编码。
3. GB18030编码:GB18030是中国制定的一个中文编码标准,旨在覆盖更多的汉字和其他字符。
它也是一个双字节编码方案,但支持的字符数量比GBK更多。
4. Big5编码:Big5是繁体中文的常用编码方式,使用两个字节表示一个汉字字符。
它主要在台湾和香港地区使用。
5. Unicode编码:Unicode是一种国际化的编码标准,旨在将世界上所有的字符纳入一个统一的编码系统。
它使用一个或多个16位的码位来表示一个字符。
对于汉字,Unicode标准将常用的汉字字符纳入基本多语言平面,每个汉字使用两个16位的码位来表示。
以上是中文编码规则的介绍,了解这些规则有助于更好地在计算机中处理和传输中文字符。
汉字编码方案首先讲讲所有编码类型Unicode是一种字符编码规范。
先从ASCII说起。
ASCII是用来表示英文字符的一种编码规范,每个ASCII字符占用1个字节(8bits)因此,ASCII编码可以表示的最大字符数是256,其实英文字符并没有那么多,一般只用前128个(最高位为0),其中包括了控制字符、数字、大小写字母和其他一些符号。
而最高位为1的另128个字符被成为“扩展ASCII”,一般用来存放英文的制表符、部分音标字符等等的一些其他符号这种字符编码规范显然用来处理英文没有什么问题。
(实际上也可以用来处理法文、德文等一些其他的西欧字符,但是不能和英文通用),但是面对中文、阿拉伯文之类复杂的文字,255个字符显然不够用于是,各个国家纷纷制定了自己的文字编码规范,其中中文的文字编码规范叫做“GB2312-80”,它是和ASCII兼容的一种编码规范,其实就是利用扩展ASCII没有真正标准化这一点,把一个中文字符用两个扩展ASCII字符来表示。
但是这个方法有问题,最大的问题就是,中文文字没有真正属于自己的编码,因为扩展ASCII码虽然没有真正的标准化,但是PC里的ASCII码还是有一个事实标准的(存放着英文制表符),所以很多软件利用这些符号来画表格。
这样的软件用到中文系统中,这些表格符就会被误认作中文字,破坏版面。
而且,统计中英文混合字符串中的字数,也是比较复杂的,我们必须判断一个ASCII码是否扩展,以及它的下一个ASCII是否扩展,然后才“猜”那可能是一个中文字。
总之当时处理中文是很痛苦的。
而更痛苦的是GB2312是国家标准,台湾当时有一个Big5编码标准,很多编码和GB是相同的,所以……,嘿嘿。
这时候,我们就知道,要真正解决中文问题,不能从扩展ASCII 的角度入手,也不能仅靠中国一家来解决。
而必须有一个全新的编码系统,这个系统要可以将中文、英文、法文、德文……等等所有的文字统一起来考虑,为每个文字都分配一个单独的编码,这样才不会有上面那种现象出现。
本技术属于汉字编码,它将汉字拆分成若干个“块”(即“字梁”),并用分类码与识别码分别表示每一个字梁,这样,分类码(为主)和识别码(为辅)就构成了汉字的编码。
技术要求1、九笔特征汉字编码(下简称九笔特征码)与现有的五笔字型等多种汉字编码一样,都是将汉字拆分成若干个“块”(五笔字型称为“字根”,九笔特征码称为“字梁”),然后按一定的方法将这些“块”进行分类,一般分为26类,并分别用26个英文字母表示(一般编码方案没有将其定名,九笔特征码将其定为分类码)。
对于“块”数较多的汉字,这些英文字母(分类码)就足够组成编码,对于“块”数较少的汉字,不同的编码方案采用了不同的处理方法。
九笔特征码的特点在于另将每一个“块”的读音(指拼音)的首字母(无读音的用其他相关字母)定为识别码(具体内容见下页字梁表),对于单、双字梁字,识别码是组成编码的后半部分。
2、权利要求1所述的编码方法中,汉字拆分成“块”的方法(规则),不同的编码方案具有不同的构思,它们一般仅限于常规拆分,九笔特征码的特点在于在拆分的三原则(书写原则、直观原则、最小原则)的指导下总结出的三原理(相似相随原理、交不攀连、连不攀散原理、顺序优先原理)和常规拆分以外的非常规拆分(对称拆分、嵌入拆分、插入拆分)使汉字(含繁、简体)的拆分趋于规范、直观、简明、具有唯一性。
3、权利要求1所述的编码方法中,汉字拆分成“块”的数目较多,它们的归类,不同的编码方案采用了不同的方法,九笔特征码的特点在于,将字梁按其方向、形状、笔顺的综合特征以及字梁搭配的互补利用原则归为26类,分别用相关的26个英文字母表示,称为分类码(具体内容见下页字梁表)。
(未完,见下页)四、(一)九笔特征汉字编码字梁表(续)4、权利要求1所述的编码方法中,识别码还可改为用整个汉字的读音的首字母。
5、根据权利要求1所述的编码方法,权利要求2所述的拆分方法,权利要求3所述的分类码,权利要求1所述的识别码,可以:①编制字典、词典或其它书刊目录,用于查字(含繁、简体)。
一种用于电脑汉字输入的汉字编码方法,根据汉字的笔划拆分编码,将汉字笔划归纳为五类,每类笔划均对应标准键盘的一个数字键码或字母键码,并将汉字结构类型分为单体字、包围字、多结构字三类,利用“米”字方框图形将每一汉字或其字根等分为四个角和八个方位,编码时,每一汉字按其类型取八个不同方位之笔划,一个汉字四键即可输入。
本技术易学易记,重码率低,输入速度快,符合汉字规律而自然拆分汉字。
技术要求1、一种四角八位汉字编码方法,根据汉字的笔划拆分编码,其特征在于:(1)、将汉字笔划归纳为横、竖、撇、捺、折五类,笔划提归入撇类,笔划点归入捺类,每类笔划均对应标准键盘的一个数字键码或字母键码,对应数字键的代码为:横1、竖2、撇3、捺4、折5,对应的字母键码为:横Y、竖U、撇I、捺O、折P,也称单笔码;(2)、将汉字结构类型分为三类:a、单体字:凡笔划之间相互交连、紧贴的汉字;凡有一个字根紧贴形为中文数字一、二、三之字根的字;凡三笔以下、有距离、有交连、笔划紧贴的字;凡看似二字根但其中一字根只有一笔的字;b、包围字:凡具有周包、角包笔划特征及有撇有捺、有折撇有折捺之字;c、多结构字:包括二字根字、三字根字及多字根字,在拆分汉字时尽量取大字根拆分;(3)、利用“米”字方框图形将每一汉字或其字根等分为四个角和八个方位,四个角即左上角、右上角、左下角、右下角,八个方位自左上角起顺时针顺序用S1、S2、S3、S4、S5、S6、S7、S8表示,进行编码时,每一汉字按其类型取八个不同方位之笔划,每一方位只取其中之一笔,每一汉字按单笔划取码共八位编码,若某一方位内没有笔划则要向其相邻角之相邻方位借其笔划作编码,若该相邻方位仍无笔划取其下一相邻方位内之一笔划,可以其下一相邻方位之方向顺时针或逆时针方向直至取到笔划为止;(4)、当汉字之某一方位内有两笔或两笔以上笔划时,按以下方法:a、取最大半径笔划,即取距离汉字中心点最远之笔划;b、取最近距离笔划,即取距“米”字划分线最近之笔划;c、若既有最大半径笔,又有最近距离笔,则按二笔取小数法,即优先取笔划对应之数字码值较小的笔划;d、对包围字之内部字根按方位取一笔时,取该方位内笔划对应之数字码值较大的笔划;e、某方位内有笔划相互交叉构成的内角且内角内有笔划时,优先取内角内之笔划;(5)、五类汉字笔划码的两两组合共有25种,在进行汉字输入时,利用键盘上的25个字母键,分别代表25对笔划码,即每一字母键码代表二个笔划编码,从而使每一汉字的八位编码输入时只需击四键即可完成,每一汉字对应的四个字母键码,称为双笔码,依序定义为:A1、A2、A3、A4,字母键码与笔划码的对应关系如下:Q(捺竖)、W(折撇)、E(横折)、R(捺撇)、T(捺折)、Y(折折)、U(折横)、I(竖捺)、O(撇折)、P(捺横)、A(横横)、S(捺捺)、D(横捺)、F(竖横)、G(竖竖)、H(竖撇)、J(竖折)、K(撇横)、L(撇竖)、X(折捺)、C(横撇)、V(折竖)、B(横竖)、N(撇捺)、M(撇撇)。