国家标准信息技术汉字编码字符集基本集-全国信息技术标准化
- 格式:doc
- 大小:25.00 KB
- 文档页数:4
我国汉字编码标准首先,我国的汉字编码标准在不同阶段都遵循了统一性、规范性和适用性的原则。
在GB2312-80发布之后,我国的计算机领域得到了长足的发展,但是随着信息化建设的深入,GB2312-80已经不能满足当今社会对汉字编码的需求。
因此,1995年发布了GBK编码,它在GB2312-80的基础上增加了对繁体字和少数民族文字的支持。
而随着国际化的发展,GB18030-2005标准的发布则进一步完善了我国汉字编码标准,使其更加符合国际标准。
其次,我国汉字编码标准的发展也受益于技术的进步和应用的需求。
随着计算机技术的不断发展,对于汉字编码的要求也越来越高。
GB18030-2005标准的发布,不仅支持了Unicode标准,还对繁体字和少数民族文字进行了更好的支持,使得我国的汉字编码标准更加符合当今信息化建设的需要。
再者,我国汉字编码标准的发展也受益于国际化的趋势。
随着我国在国际上的地位不断提升,对于国际标准的遵循和应用也越来越重要。
GB18030-2005标准的发布,使得我国的汉字编码标准更加符合国际标准,为我国在国际上的信息交流和合作提供了更好的支持。
最后,我国汉字编码标准的发展也为我国的信息化建设和文化传承提供了更好的支持。
汉字是我国的传统文化符号,对于汉字的数字化编码,不仅可以更好地保护和传承我国的传统文化,还可以更好地适应当今信息化建设的需要。
因此,我国汉字编码标准的不断完善和发展,为我国的信息化建设和文化传承提供了更好的基础和保障。
总之,我国汉字编码标准的发展经历了多个阶段,每一次的更新都是为了更好地适应当代社会的需求。
随着技术的进步、国际化的趋势以及信息化建设的需求,我国汉字编码标准将会不断完善和发展,为我国的信息化建设和文化传承提供更好的支持和保障。
国家标准化管理委员会公告2011年第1号――批准发
布410项国家标准目录
文章属性
•【制定机关】国家标准化管理委员会
•【公布日期】2011.01.10
•【文号】国家标准化管理委员会公告2011年第1号
•【施行日期】2011.01.10
•【效力等级】部门规范性文件
•【时效性】现行有效
•【主题分类】标准化
正文
国家标准化管理委员会公告
(2011年第1号)
关于批准发布《紧固件质量保证体系》等410项国家标准的公告国家质量监督检验检疫总局、国家标准化管理委员会批准《紧固件质量保证体系》等410项国家标准,现予以公布。
二〇一一年一月十日附件:。
中文信息处理①信息:是物质世界存在的形式、状态及各种关系,是与物质、能量共同构成世界的三大要素之一。
具有主观和客观双重属性。
中文信息,是特指以汉语言文字为载体形式的信息。
从宏观角度看,一类是自然性信息,一类是社会性信息。
②信息处理:就是用计算机对各种信息符号进行输入、转换、存储、传输、分类、排序、统计、分析、重组等加工过程。
③中文信息处理:是利用计算机对中文(包括口语和书面语)进行输入、转换、传输、存储、分析、加工的科学。
中文信息处理技术已到社会生活的各个方面,汉字/汉语信息处理。
④代码:汉字的代码有:汉字输入码、汉字内部码、汉字交换码、汉字地址码、汉字字形码和汉字控制功能码。
从汉字代码的角度看,一个汉字信息处理系统,就是一个进行汉字代码转换的过程。
中文代码包括内部码和外部码两大类,内部码是中文在计算机系统内部进行处理和传输的代码,外部码作为人机接口由用户给计算机输入信息时使用的代码。
*中文计算机操作系统使用的代码系列一共三种,七位代码系列,八位代码系列和双八位代码系列。
中文信息内部处理代码包括存储码、运算码、传输码。
(是程序员用开发工具所支持的语言写出来的源文件,是一组由字符、符号或信号码元以离散形式表示信息的明确的规则体系。
)⑤编码:是以固定的顺序排列字符,并以此做记录、存贮、传递、交换的统一内部特征,这个字符排列顺序被称为“编码”。
A.计算机通讯技术领域对所处理信息的字符集序号序列的排序原则和代码赋值方式,也是“机内码”的编码。
B.专指计算机键盘输入汉字的代码设计与实现,简称外码或人机界面编码。
汉字编码:广义的汉字编码就是汉字排检法,即确定一个排序规则使全部汉字成为有序的集合,以便能按照排序规则检索到所需要的汉字。
狭义的汉字编码特指采用通用键盘上的字母数字为汉字编制代码,以便实现汉字的计算机输入。
*静态编码:指把汉字作为等概率的离散字符进行的编码,不考虑汉字的使用频率。
动态编码:是根据汉字的使用频率进行信息编码,如传输码、处理吗都采用动态编码。
转换内码gb2312为utf-8各类内码详细解析[日期:2009-04-29] 来源: 作者:sdiel 阅读:3706 次 [字体:大中小]GB2312 字符集GB2312又称为GB2312-80字符集,全称为《信息交换用汉字编码字符集·基本集》,由原中国国家标准总局发布,1981年5月1日实施,是中国国家标准的简体中文字符集。
它所收录的汉字已经覆盖99.75%的使用频率,基本满足了汉字的计算机处理需要。
在中国大陆和新加坡获广泛使用。
powered by GB2312收录简化汉字及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母,共7445 个图形字符。
其中包括6763个汉字,其中一级汉字3755个,二级汉字3008个;包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。
GB2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号。
这种表示方式也称为区位码。
它是用双字节表示的,两个字节中前面的字节为第一字节,后面的字节为第二字节。
习惯上称第一字节为“高字节” ,而称第二字节为“低字节”。
“高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0),“低位字节”使用了0xA1-0xFE(把01-94加上0xA0)。
以GB2312字符集的第一个汉字“啊”字为例,它的区号16,位号01,则区位码是1601,在大多数计算机程序中,高字节和低字节分别加0xA0得到程序的汉字处理编码0xB0A1。
计算公式是:0xB0=0xA0+16, 0xA1=0xA0+1。
GBK字符集GBK字符集是GB2312的扩展(K),GBK1.0收录了21886个符号,它分为汉字区和图形符号区,汉字区包括21003个字符。
GBK字符集主要扩展了繁体中文字的支持。
BIG5 字符集BIG5又称大五码或五大码,1984年由台湾财团法人信息工业策进会和五间软件公司宏碁(Acer)、神通(MiTAC)、佳佳、零壹(Zero One)、大众(FIC)创立,故称大五码。
答案自己做的1.在下列有关不同进位制系统的叙述中,错误的是___________。
A.在计算机中所有的信息均以二进制编码存储B.任何进位制的整数均可精确地用其它任一进位制表示C.任何进位制的小数均可精确地用其它任一进位制表示D.十进制小数转换成二进制小数,可以采取“乘以2取整法"2.在下列有关汉字编码字符集的叙述中,错误的是 ___________。
A.GB2312—80是我国颁布最早的汉字编码字符集标准,它包含6000多个汉字B.UCS-2(Unicode)编码标准,西文字符采用单字节编码,汉字用双字节或四字节编码C.汉字扩展内码规范(GBK)保持与GB2312-80字符集的汉字编码完全兼容D.BIG5字符集是一种繁体汉字字符集,它包含10000多个汉字3.在下列有关PC机物理组成的叙述中,错误的是____________。
A.通常所说的主机空机箱,一般包含电源盒B.系统板也称为主板或大底板,一般包含BIOS和CMOS集成电路芯片C.系统板上的内存插槽一般只有一个,扩展内存只能通过更换内存条进行D.一块系统板上通常包含多种类型的I/O接口4.为了使计算机有较高的性能/价格比,现代计算机均采用多种存储器组成的层次式结构体系。
在下列存储器中。
其存取周期一般为毫秒级的是____________.A.Cache存储器B.主存储器C.硬盘D.磁带(库)5.1991年Intel公司提出的PCI局部总线标准(工作频率为33MHz),因其高性能、低成本,目前仍广泛使用。
当数据线宽度为64位时,其传输速率约为 __________ 。
A.33MB/s B.66MB/s C.133MB/s D.266MB/s6.构建不同的网络需要选择不同的网络设备.在构建局域网时,一般不需要__________ 。
A.路由器B.集线器C.网卡D.中继器7.下列关于Internet网中主机、IP地址和域名的叙述中,错误的是___________。
GBK字库介绍【基本概念】GBK 是又一个汉字编码标准,全称《汉字内码扩展规范》(GBK),英文名称Chinese Internal Code Specification ,中华人民共和国全国信息技术标准化技术委员会1995 年12 月 1 日制订,国家技术监督局标准化司、电子工业部科技与质量监督司1995 年12 月15 日联合以技监标函[1995] 229 号文件的形式,将它确定为技术规范指导性文件,发布和实施。
这一版的GBK 规范为 1.0 版。
GB 即“国标”,K 是“扩展”的汉语拼音第一个字母。
GBK 向下与GB 2312 编码兼容,向上支持ISO 10646.1 国际标准,是前者向后者过渡过程中的一个承上启下的标准。
ISO 10646 是国际标准化组织ISO 公布的一个编码标准,即Universal Multilpe-Octet Coded Character Set(简称UCS),大陆译为《通用多八位编码字符集》,台湾译为《广用多八位元编码字元集》,它与Unicode 组织的Unicode 编码完全兼容。
ISO 10646.1 是该标准的第一部分《体系结构与基本多文种平面》。
我国1993 年以GB 13000.1 国家标准的形式予以认可(即GB 13000.1 等同于ISO 10646.1)。
GBK编码,是在GB2312-80标准基础上的内码扩展规范,使用了双字节编码方案,其编码范围从8140至FEFE(剔除xx7F),共23940个码位,共收录了21003个汉字,完全兼容GB2312-80标准,支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字,并包含了BIG5编码中的所有汉字。
GBK编码方案于1995年10月制定,1995年12月正式发布,目前中文版的WIN95、WIN98、WINDOWS NT以及WINDOWS 2000、WINDOWS XP等都支持GBK编码方案。
汉字的编码方式以及相应的关系汉字的编码方式以及相应的关系在当今信息时代,汉字编码方式是一个备受关注的话题。
汉字作为中文的基本表达形式,其编码方式的选择和规范对于信息技术、文化传承以及国际交流都具有重要的意义。
我们有必要对汉字的编码方式进行全面评估,并根据深度和广度的要求来探讨其相关的问题。
我们来看一下汉字的编码方式。
汉字的编码方式有多种,其中最为常见的是Unicode、GBK、Big5等。
Unicode是一个国际标准,它主要用于整合和统一世界上所有的符号和文字。
而GBK是我国最常用的字符集,它包含了大部分常用汉字和少量的生僻字,是我国计算机领域的标准。
与此相对应的是Big5编码,它是台湾地区所使用的一种传统编码方式。
这些不同的编码方式在一定程度上反映了汉字的传统与现代、国际化与本土化的关系。
进一步来说,汉字的编码方式与其发展历史、文化底蕴以及实际运用之间存在着紧密的关系。
汉字作为中国文字的代表,承载着悠久的历史和深厚的文化内涵。
其编码方式不仅仅是一种技术手段,更是对于汉字所承载的文化价值和民族认同的体现。
我们在选择和规范汉字的编码方式时,需要全面考量文化传承、技术发展和国际交流的多重需求,确保汉字得到妥善的保护和传承。
我们还需要深入思考汉字的编码方式对于教育、出版、文化创意产业等方面的影响和作用。
随着信息化技术的发展,汉字的编码方式不仅仅是影响计算机输入、网页显示等技术领域,更是对于教育教学、文学创作、文化传播等领域产生着深远的影响。
我们需要在汉字的编码方式上进行深入的评估和探讨,更好地发挥其在各个领域中的作用和效果。
在总结和回顾上述内容时,我们可以清晰地看到汉字的编码方式是一个涵盖文化、技术、教育等多个领域的综合话题。
其深度和广度不仅需要我们全面理解其相关知识和背景,更需要我们具备跨学科、跨领域的能力来进行分析和思考。
个人而言,我认为汉字的编码方式是一个值得我们深入研究和关注的话题,它不仅关乎我国的文化传承和软实力的提升,更关乎我们对于技术发展和人文精神的综合理解。
《信息技术通用编码字符集(基本多文种平面)汉字15×16点阵字型》(征求意见稿)编制说明
一、工作简况
1、任务来源
随着信息技术的不断发展,中文信息技术产品所使用硬件设备得到提升,中文信息处理设备对点阵字型出现了新的需求,为了满足信息处理设备对15×16点阵的需求,国家标准化管理委员会在2015年第三批“制、修订国家标准项目计划”中安排了本标准的制定工作,计划代号为20153659-T-469,标准名称为《信息技术通用编码字符集(基本多文种平面)汉字15×16点阵字型》。
本标准由中国电子技术标准化研究院、北京仓颉博雅信息技术有限公司等单位负责起草,标准主要起草人有代红、熊涛等。
2、主要工作过程
标准计划任务下达后,由中国电子技术标准化研究院牵头成立了标准编制组和专家组,并制定了详细的标准研究实施方案。
中国电子技术标准化研究院主要负责字型设计、组织协调和标准文本起草,北京仓颉博雅信息技术有限公司负责字型设计,火箭军装备研究院第四研究所和潍坊北大青鸟华光照排有限公司负责字型纠错修改,专家组负责字型审查工作。
按照标准实施方案的要求,标准编制组于2016年6月底,分批提供了15×16点阵字型的设计初稿,并将字型设计初稿提供给字型专家审查,在设计点阵字型时对有疑问的字进行查证讨论,做到每个字的修改确定有据可查。
根据字型专家提出的修改意见,标准编制组对字型设计初稿进行修改,于2017年7月底前完成了对字型设计初稿的修改整理。
在对字型设计稿修改的同时,标准编制组还进行了标准文本的起草工作,2017年10月完成了标准草案。
2017年11月标准草案提交中国电子技术标准化研究院进行标准专家内审,标准起草组根据标准内审专家提出的意见对草案进行修改,形成了标准的征求意见稿,现向各位征求意见。
3、标准编制的主要成员单位及其所做的工作
本标准由中国电子技术标准化研究院、北京仓颉博雅信息技术有限公司、火箭军装备研究院第四研究所等单位负责起草。
中国电子技术标准化研究院主要负责标准文本的起草、标准研究的组织协调,北京仓颉博雅信息技术有限公司负责
标准字型数据的制作和修改,火箭军装备研究院第四研究所负责标准字型数据的审查,其他单位参与标准起草工作。
二、标准编制原则和确定主要内容的论据及解决的主要问题
本标准依据编码字符集国家标准GB/T 13000中基本多文种平面中CJK统一汉字、CJK统一汉字扩充A及《通用规范汉字表》中其余汉字的内容和编码顺序制定,汉字的位置与GB/T 13000中的编码位置相对应。
字形依照1965年1月30日中华人民共和国文化部、中国文字改革委员会发布的《印刷通用汉字字形表》、1988年3月25日国家语言文字工作委员会、中华人民共和国新闻出版署发布的《现代汉语通用字表》和2013年6月18日中华人民共和国国务院发布的《通用规范汉字表》而设计,以确保字形的准确性与规范化。
本标准以GB/T 13000编码字符集基本多文种平面中CJK统一汉字、CJK统一汉字扩充A规定的27558个汉字及《通用规范汉字表》中的其余196个汉字为依据设计了15×16点阵字型。
本标准编制的原则是充分利用15×16点阵栅格进行设计,要求足格、清晰、准确。
对点阵字的设计满足如下要求:
●准确:字形正确,笔形规范;
●清楚:黑白适中,笔画清晰;
●美观:字的结构端正,大小匀称,组合比例协调,充分体现汉字字体风格。
为适应中文信息处理的发展和国际信息交换及汉字的规范化、标准化需求,在研制汉字字型的过程中,考虑到本标准的使用范围、时间和影响等因素,重点做了以下几个方面的工作:
(1)字形的正确性
常用字以《通用规范汉字表》为依据容易确定,而超出规范字表的一些字在不同的字典里列出的字形不一致,因此,在字形整理时,不仅根据整理汉字字形的规则,还参考已有的标准及《康熙字典》、《汉语大字典》、《中华字海》等工具书,本着不放过任何一个疑问的原则,经过专家组的反复逐字审查讨论确定。
(2)规范性
虽然国家早已公布了规范字表,但是实际应用中,如报刊、杂志、书籍,甚至个别字典中,仍然有不规范的字出现。
在设计和整理字形时,为保证每个字在字形结构、笔画数、笔形等方面做到准确、规范,编制组查证了大量的资料,并
进行了多次研究,特别对那些笔形容易出错的字进行了重点检查。
在保证每个字形正确的前提下,整个字库要做到相同的部件尽量统一,防止出现前后矛盾。
(3)美观性
由于本标准所收的汉字数量多、字形结构复杂,笔画多的字占比大,受点阵字型像素空间的限制,给字型设计增加了难度。
为了保证整副字的质量,在字形设计时,对字的结构特征做了分类,结合人的视觉因素和阅读效果,在进行实验对比的基础上,使整副字达到结构端正、大小一致、排列整齐、字形清晰。
三、主要试验[或验证]情况分析
无
四、知识产权情况说明
本标准不涉及知识产权及专利内容。
五、产业化情况、推广应用论证和预期达到的经济效果
无
六、采用国际标准和国外先进标准情况
目前暂无与本标准相对应的国际标准。
七、与现行相关法律、法规、规章及相关标准的协调性
本标准是为配合编码字符集国家标准GB/T 13000《信息技术通用编码字符集(UCS)》的使用而制定的,本标准依据GB/T 13000编码字符集基本多文种平面中CJK统一汉字、CJK统一汉字扩充A规定的27558个汉字及《通用规范汉字表》中其余196个汉字设计了15×16点阵字型,字汇和字序与GB/T 13000的相关规定保持一致。
九、标准性质的建议
建议本标准作为强制性标准发布实施。
十、贯彻标准的要求和措施建议
建议本标准发布后,实施过渡期半年。
十一、替代或废止现行相关标准的建议
本标准替代GB 19966-2005。
十二、其它应予说明的事项
在本标准编制过程中,有许多有关汉字字形共性的问题和一些字的个性问题需要一一解决。
(1)汉字的正形
根据GB/T 13000中所提供的CJK统一汉字扩充A的汉字有6582个,其中G列的汉字是由我国提出。
为了适应信息处理的发展和国际交流的需要,对G 列空缺汉字采用了其他国家和地区相应的字形,并按照字形规范化的要求适当进行了整理和设计。
(2)重码字的处理
本标准对重码的汉字字形进行处理,原则上保留原字形,对有些字的笔形与旧笔形不同的地方做了部分修改。
标准编制组
2018年4月。