GBK字库介绍
- 格式:doc
- 大小:32.00 KB
- 文档页数:5
GBK●基本含义GBK,汉字国标扩展码, 是Guo Biao Kuo的首拼音字母连缀而成。
是用于实现中文信息交换的编码表,包含了原GB2312-80所有的汉字并保持原有码位,涵盖了原Unicode中所有的汉字(20902个)。
总共收录了21886个字符(883个符号和21003个汉字),提供了1894个造字码位。
●来历GB2312-80只收录了6763个汉字,部分人名用字、台湾及香港使用的繁体字、日语及韩语汉字,并未包含在内,微软利用GB2312-80未使用的编码空间,将这些字的编码扩展补充进去,指定并形成了该GBK编码表。
Microsoft简体版中文Windows 95/98就是以GBK为内码,又由于GBK同时也涵盖了Unicode所有CJK(Chinese、Japanese、Korean)汉字,所以也可以和Unicode做一一对应。
中国国家标准GB18030兼容GBK。
●码表结构字符有一字节编码和双字节编码两种。
对于半角英文字符,采用一字节编码,范围00~7F(十六进制,下同)。
两字节的全角字符(包括各种全角符号和所有汉字),采用两字节编码。
前一字节(高字节)的编码范围81~FE,后一字节的编码范围分为40~FE和80~FE两种。
GBK双字节码表结构如下表所示:GBK码表的二维布局示意图如下:可以重点关注一下常用的6763个汉字区域在分布图中的位置及其相对大小。
码表到点阵字库的映射方式码表的最主要用途,就是用来实现字符内码到字库中具体字符点阵信息的索引和映射。
点阵字库中,只有一级映射,而且是线性的。
矢量字库中,有两级映射,第一级映射也是线性的。
为简洁起见,以下仅介绍GBK点阵字库的映射和访问方法。
GBK码对点阵字库中点阵数据偏移量的计算公式为:[ (H gbk-0xB0)*0x5E + (L gbk-0xA1) ] * 每个汉字点阵所占用的字节数这里:H gbk-----GBK内码第一字节(高字节)L gbk-----GBK内码第二字节(低字节)后面是具体的GBK码表全部内容,略微浏览即可,查对某字符时则可细看。
gbk字体是什么意思gbk字体,又称华文新魏字体、中易宋体或方正宋体,是一种汉字字形的设计标准。
这个由台湾松散数位有限公司(简称为松散数位)所制定的华文新魏系列规格最初只在电脑上应用,但近年来亦被普遍地于其他类型装置甚至手机上使用。
它与日文假名等可缩写表意文字同属于可缩写表意文字家族之一。
gbk文字家族不包括数学符号和化学元素符号;除非特别说明,下面关于该家族成员排序都以GBK文档顺序为依据: gb-t1共5项gb-t2共6项gb-t3共3项gb-t4共1项gb-t5共8项gb-t6共7项二、常见问题1、我的GBK字库安装好后怎么没有显示? 2、如何才能将GBK字库放到系统光盘中运行并支持GBK?请参考下述几点: a、将GBK文件复制到硬盘里。
b、在DOS 下直接使用“ WinRAR”,解压“ Xgbk”文件夹,把里边所有文件全部剪切出去,然后进行打开即可c、用GBK版的文本编辑器直接打开4、如果你的Windows2000/XP / 2003支持GBK了那就没必要再浪费一次钱了!因为默认的“ MSTTI.TTC”程序会自动转换码的。
5、不知道哪些程序可以直接读取到GBK格式呢?答案很多,例如: TXT6、我想通过windows xp来兼容GBK字体(例如宋体),需要什么工具吗?b、解压GBK文件(Xgbk),用WinRAR打开后,按提示操作即可七、 gbk 相对于宋体及仿宋体优势在哪儿1)从目前看,所谓基于宋体的“ gbk 字体”其实指代是一套类似于“宋体”字库样式的东西,而无法谈论究竟谁更接近于宋体,毕竟两者完全是风马牛不相及;2) gbk字库拥有诸多人性化的选择模块,利用简单拖曳操控界面各区域大小,且加入独立外挂功能以满足各领域不同环境变量。
让你彻底告别传统字库令人眼花缭乱的设置;既省心也省力!gbk字体的详细介绍。
字库基本知识字库基本知识要想定制自己的字库,最好有一些相应的知识。
一者,随着相关知识的增加,进入到专业人士之内,你可以对这个行业内部的规律更加了解,花多少钱,办多少事,自己心里明白,可以做到少花钱多办事;二者也便于我们相互之间的交流和沟通。
下面就字库的基本知识作一个十分简要的介绍:字库,就是我们使用计算机是显示汉字的图像源。
计算机调用字库显示汉字,不是直接调用相同的图像,而是调用这个汉字的内码,程序通过这个内码,再到相应的图像源(字库)当中寻找相应的图像信息,并画到屏幕上或者打印到纸上。
所以,只要是文本文件,在以二进制模式打开的时候,显示的都是这些字的内码而不是图形。
人们一般常用的都是PC机。
操作环境一般使用的都是Windows 操作系统。
它的字库都存放在C:\Windows\fonts\目录下。
打开这个目录就可以看到各式各样的字库。
其中显示为汉字的(如"宋体"),就是中文字库。
安装字库的时候,只要用鼠标点击浏览器的文件→安装新字体,就显示出一个文件操作界面。
选中相关字库文件所在的目录,系统就会自动扫描字库文件,选中之后再点击"安装",字库就会拷贝到C:\Windows\fonts\目录下了,这就算安装好了。
如果你对文件所在位置比较熟悉,也可以直接将其拷贝到该目录下,之后,当你再启动应用软件(如Word、WPS等等)的时候,在选择字库的时就可以选用你安装的字库了。
想删除字库,同样也是进入到该目录下,选中想要删除的字库,点击文件→删除就可以了,更为便捷的,使用鼠标右键,直接删除。
字库的内部结构。
用常见的字库程序(详见文件下载部分)可以打开字库。
字库打开之后可以发现,字库内的每一个字的图像都是由曲线环绕而成。
曲线上有很多的小点点。
当鼠标拖动这些控制点的时候,曲线会发生变化,字的图像也就改变了。
如果就这样存盘,在使用这个字库的这个字的时候,就会和原来的不一样而和你修改后的样子相同。
威尔取模软件使用介绍(V1.0)一、简介1.1 界面介绍二、我要取几个汉字的字模2.1 取模2.1.1 打开软件2.1.2 在中文字符集文本框中输入要取模的文字,比如“欢迎使用威尔取模软件”,如下图所示。
2.1.3 选择要取模的字体,比如我要取宋体的字模,就选择宋体。
如下图所示。
此处列出的是系统安装的所有字体,如果要取自己下载的字体的模,请先安装该字体。
2.1.4 添加我要取模的字号,宽度,高度等信息。
点击添加按钮,打开添加窗口,如下图所示。
在字号,宽度,高度框中输入你要取模的文字大小。
比如我要取16*16的点阵,就在宽度和高度中输入16、16。
然后计算字号,字号=0.75*宽度。
输入12。
点击添加。
点击添加以后回到主界面,你会发现主界面字号列表框里面就多了一种你刚刚添加的字号了。
这时候点击你刚刚添加的字号选中它,然后再在预览框中输入一个汉字,看看效果。
2.1.5 如果效果不错可以跳过这一步。
如果效果不好有以下两种情况。
1.文字太大或者太小,如下图两种情况所示。
这时候就需要重新设置字号了。
增大或者减小字号。
2.字符不居中,如下图所示。
这时候调节右下方的位置调整滑块,将文字调节居中,如下图所示。
2.1.6 选择要生成C语言格式还是二进制文件格式。
如果是C语言格式,还可以选择是否生成数组的数组名。
2.1.7 假如我只要取我刚刚设置的16*16点阵字体,那么就要选择“取选中字号”,并选中16*16那一列。
如下图所示。
2.1.8 假如我只要取中文字模,那么就勾上取模中文,同时去掉取模英文的勾,如下图所示。
2.1.9 好了,所有设置妥当,可以开始取模啦。
点击“开始取模”。
如果选择的是C语言格式则取模完成后自动弹出结果窗口,如下图所示。
三、我要取整个GBK字库或者GB2312字库的字模3.1 取模3.1.1 打开软件3.1.2 假如我要取整个GBK字库的字模,那么点击右侧“GBK字库”按钮,自动输入GBK字符集所有文字。
GBK编码GBK编码是中国制订的、等同于UCS的新的中文编码扩展国家标准。
GBK工作小组于1995年10月,同年12月完成GBK规范。
该编码标准兼容GB2312,共收录汉字21003个、符号883个,并提供1894个造字码位,简、繁体字融于一库。
UTF-8编码UTF-8编码可以通过屏蔽位和移位操作快速读写。
字符串比较时strcmp()和wcscmp()的返回结果相同,因此使排序变得更加容易。
字节FF和FE在UTF-8编码中永远不会出现,因此他们可以用来表明UTF-16或UTF-32文本(见BOM) UTF-8 是字节顺序无关的。
它的字节顺序在所有系统中都是一样的,因此它实际上并不需要BOM。
GB2312GB2312支持的汉字太少。
1995年的汉字扩展规范GBK1.0收录了21886个符号,它分为汉字区和图形符号区。
汉字区包括21003个字符。
2000年的GB18030是取代GBK1.0的正式国家标准。
该标准收录了27484个汉字,同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。
现在的PC平台必须支持GB18030,对嵌入式产品暂不作要求。
所以手机、MP3一般只支持GB2312。
从ASCII、GB2312、GBK到GB18030,这些编码方法是向下兼容的,即同一个字符在这些方案中总是有相同的编码,后面的标准支持更多的字符。
在这些编码中,英文和中文可以统一地处理。
区分中文编码的方法是高字节的最高位不为0。
按照程序员的称呼,GB2312、GBK到GB18030都属于双字节字符集 (DBCS)。
一、JSP页面显示乱码二、表单提交中文时出现乱码三、数据库连接大家在JSP的开发过程中,经常出现中文乱码的问题,可能一至困扰着您,我现在把我在JSP开发中遇到的中文乱码的问题及解决办法写出来供大家参考。
一、JSP页面显示乱码下面的显示页面(display.jsp)就出现乱码:对不同的WEB服务器和不同的JDK版本,处理结果就不一样。
汉字编码字符集汉字编码字符集是指用于表示和存储汉字的一套编码系统。
在计算机领域,为了能够准确地表示和处理汉字,人们设计了多种不同的汉字编码字符集。
本文将介绍几种常见的汉字编码字符集,包括GB2312、GBK、Unicode以及UTF-8。
一、GB2312GB2312是中国国家标准局于1980年发布的一种汉字编码字符集,是最早被广泛使用的汉字字符集之一。
GB2312字符集包含了7445个汉字和682个非汉字字符,采用双字节表示每个字符。
其中,第一个字节的范围是0xB0至0xF7,第二个字节的范围是0xA1至0xFE。
GB2312字符集主要适用于简体中文。
二、GBK随着计算机技术的发展和汉字数量的增加,GB2312字符集的容量已经无法满足需求。
为了解决这个问题,国家标准局于1995年发布了GBK字符集,它是对GB2312字符集的扩充和改进。
GBK字符集兼容GB2312字符集,同时加入了21003个汉字,总计包含了21886个汉字。
GBK字符集同样采用双字节表示每个字符,第一个字节的范围是0x81至0xFE,第二个字节的范围是0x40至0xFE。
GBK字符集支持简体中文和繁体中文。
三、UnicodeUnicode是一种国际标准字符集,旨在为全球所有字符提供唯一的编码。
Unicode采用16位的编码方案,可以支持最多65536个不同的字符。
不仅包括了各个国家语言的文字,还包括了数学符号、技术符号、图形符号等。
Unicode字符集为各种语言的文字提供了一个统一的编码标准。
四、UTF-8UTF-8是一种可变长度的Unicode编码方案,更好地解决了存储效率和兼容性的问题。
UTF-8使用1至4个字节来表示一个字符,根据不同的字符而变化。
对于单字节的字符,编码和ASCII码相同,兼容ASCII码。
对于多字节的字符,第一个字节的高位标识了字节数。
UTF-8字符集可以表示Unicode字符集中的所有字符。
在计算机系统中,为了使不同的系统能够正确地处理汉字编码,一般需要统一选择一种字符集来使用。
字体、字库深入详解及方正字库的分类字体、字库深入详解及方正字库的分类第一章:字体第一节:字体的概念:文字是用来记录和传达语言的书写符号。
印刷上用的字符可以分为字体、字号、字种等内容。
一、字体:字体(Font):是一系列字号、样式和磅值相同的字符(例如:10磅黑体Palatino)。
现多被视为字样的同义词。
印刷中的基本字体有:宋体:宋体字是印刷行业应用得最为广泛的一种字体,根据字的外形的不同,又分为书宋和报宋。
宋体是起源于宋代雕版印刷时通行的一种印刷字体。
宋体字的字形方正,笔画横平竖直,横细竖粗,棱角分明,结构严谨,整齐均匀,有极强的笔画规律性,从而使人在阅读时有一种舒适醒目的感觉。
在现代印刷中主要用于书刊或报纸的正文部分。
楷体:楷体又称活体,是一种模仿手写习惯的一种字体,笔画挺秀均匀,字形端正,广泛地用于学生课本、通俗读物、批注等。
黑体:黑体字又称方体或等线体,是一种字面呈正方形的粗壮字体,字形端庄,笔画横平竖直,笔迹全部一样粗细,结构醒目严密。
黑体适用于标题或需要引起注意的醒目按语或批注,因为字体过于粗壮,所以不适用于排印正文部分。
仿宋体:仿宋体是一种采用宋体结构、楷书笔画的一种较为清秀挺拔的字体,笔画横竖粗细均匀,常用于排印副标题、诗词短文、批注、引文等,在一些读物中也用来排印正文部分。
美术体:美术体是指一些非正常的特殊的印刷用字体,一般是为了美化版面而采用。
美术体的笔画和结构一般都进行了一些形象化,常用于书刊封面或版面上的标题部分,应用适当,可以有效地增强印刷品的艺术品味。
这类字体的种类非常广泛,如汉鼎、文鼎等字库中的字体。
二、字号字号是区分文字的大小的一种衡量标准,国际上通用的是点制,在国内则是以号制为主,点制为辅。
号制是采用互不成倍数的几种活字为标准的,根据加倍或减半的换算关系而自成系统,可以分为四号字系统、五号字系统、六号字系统等。
字号的标称数越小,字形越大,如四号字比五号字要大,五号字又要比六号字大等。
汉字字库的存储原理
汉字字库的存储原理主要涉及两个方面:编码方式和存储结构。
一、编码方式:
汉字的编码方式有很多种,包括ASCII码、GB2312码、GBK码、GB18030码、Unicode码等。
其中,GB2312码是中国国家标准,GBK码是GB2312的扩展,GB18030是GBK的进一步扩展,而Unicode码则是国际通用的字符编码标准。
不同的编码方式对应不同的字符集和编码规则,其目的是为了能够表示和存储所有的汉字以及其他字符。
二、存储结构:
汉字字库的存储结构多样,常见的有平面码和压缩码两种。
1. 平面码:
平面码指的是将每个汉字固定占用一个字节或两个字节的存储空间,如GB2312和GBK码就采用了这种方式。
这种存储方式的优点是简单、直观,适合于对存储空间要求不高的场景。
但缺点是存储空间浪费,因为一个汉字可能占用多个字节的存储空间。
2. 压缩码:
压缩码指的是将汉字的存储空间进行优化压缩,减少存储空间的占用。
常见的压缩码有Huffman码和字典树码。
Huffman码是一种变长编码方式,将高频汉
字用较短的编码表示,低频汉字用较长的编码表示,以达到最佳的压缩效果。
字典树码则是一种多叉树结构,每个节点代表一个汉字,节点上存储了该汉字的编码以及其他相关信息。
这种存储方式的优点是存储空间利用率高,但缺点是编码和解码的复杂度较高。
总之,汉字字库的存储原理是通过合适的编码方式将每个汉字映射到相应的编码,然后将这些编码按照一定的存储结构进行存储,以实现对汉字的高效管理和使用。
不同的编码方式和存储结构有各自的优缺点,可以根据具体需求选择适合的方式进行存储。
GB2312GBKGB18030BIG5的历史GBK中的“K”是扩展的意思,而GB2312中的“2312”以及GB18030中的“18030”是国家标准的代号,BIG5是港澳台地区的编码。
下面详细介绍一下字库情况,你就可看出其区别:(一)GB2312-80字库从1975年开始,我国为了研究汉字的使用频度,进行了大规模的字频统计工作,内容包括工业、农业、军事、科技、政治、经济、文学、艺术、教育、体育、医药卫生、天文地理、自然、化学、文字改革、考古等多方面的出版物,在数以亿计的浩翰文献资料中,统计出实际使用的不同的汉字数为6335个,而其中有 3000多个汉字的累计使用频度达到了99.9%,而另外的3000多个累计频度不到0.1%,说明了常用汉字与次常用汉字的数量不足7000个,这就为国家制定汉字库标准提供了依据。
1980年颁布了《信息交换用汉字编码字符集--基本集》的国标交换码,国家标准号为:GB2312-80,选入了6763个汉字,分为两级,一级字库中有3755个,是常用汉字,二级字库中有3008个,是次常用汉字;还选入了682个字符,包含有数字、一般符号、拉丁字母、日本假名、希腊字母、俄文字母、拼音符号、注音字母等。
(二)大字符集字库(又叫GBK字库)国际标准化组织为了将世界各民族的文字进行统一编码,制定了UCS标准。
根据这一标准,中、日、韩三国共同制定了《CJK统一汉字编码字符集》,其国际标准号为:ISO/IEC10646,国家标准号为:GB13000-90,该汉字编码字符集就是通常人们所说的大字符集,它编入了20902个汉字,收集了大陆一二级字库中的简体字,台湾《通用汉字标准交换码》中的繁体字,58个香港特别用字和92个延边地区朝鲜族“吏读”字,甚至涵盖了日文与韩文中的通用汉字,满足了方方面面的需要。
Windows95/98/NT/2000中都装入了大字符集汉字库,人们一般称它为GBK字库。
[资料]GBK字库及其与unicode间的转换(用于mp3文件名的显示)经过几天的摸索终于可以显示mp3的中文名了。
现在将我做的资料与大家分享,想做mp3的朋友可以试试。
点击此处下载armok01141262.rar上面的文件是我在网上搜索的素材,我自己编了些小程序将其转换成两张表,即unicode与gbk相互转换的表。
点击此处下载armok01141263.rar上面是我用程序产生的GBK字符,是按照顺序存放的,用这个文件配合我前几天发的“GB2312字库制作方法”中的程序用于生成GBK字库点阵。
点击此处下载armok01141264.rar上面的文件是我最终生成的用于mp3的4个文件了。
st12.sys为gbk字库12*12的点阵文件,取模方式“纵向取模,高位在下”(我用的液晶是128*64 ks0108兼容LCD模块)st16.sys为gbk字库16*16的点阵以上两个文件的起始汉字是以0x8140 开始的,为了在程序中能线形查找,其中不存在的编码如0x**7f 0x**ff等均在编码内,只不过不会用到。
也就是说从0x8140 ~0xfeff 其中高位从0x81到0xfe 地位从0x40到0xff 即126*192 = 24192个汉字数据。
因此12*12的点阵文件大小是580608Bytes (每个汉字用24字节,汉字下半截虽用4bits但是存储是按8bits)16*16的点阵文件大小是774144Bytes(每个汉字用32字节)uni2gbk.sys为unicode转gbk的表,从unicode的0x4e00 到0x9fa5 顺序存放着相应的gbk码,总共20902个汉字,对应的文件是41804Bytes注:由于没有找到一些符号的unicode对照表,因此这张表中只包含了汉字部分。
因此不能显示诸如“”()等符号,程序中要做相应处理。
注文件存放方式是高字节在前比如0x4e00 存放方式为0x4e 0x00gbk2uni.sys为gbk转unicode的表,从gbk的0x8140 到0xfeff 即126*192 = 24192按照gbk的编码顺序放,为了线形查找,其中不合法的或根据资料没有相应unicode码的都作了填零处理。
gbk编码GBK编码:一种用于中文字符集的字符编码方式摘要:GBK编码是一种用于中文字符集的字符编码方式,它在保留ASCII编码的基础上,对汉字和其他特殊字符进行了扩展编码。
本文将介绍GBK编码的起源、特点和使用方法,并讨论其与其他编码方式的比较以及在实际应用中的一些问题。
引言在计算机中,字符编码是将字符映射到二进制数据的过程。
随着全球信息交流的增加,各种国际化的字符集也应运而生。
GBK编码是其中一种针对中文字符的编码方式,它的出现解决了早期ASCII编码无法表示中文字符的问题。
本文将详细介绍GBK编码的起源、特点和使用方法,并对比其他编码方式,讨论其在实际应用中的一些问题。
一、GBK编码的起源GBK编码是在GB2312编码的基础上发展起来的。
GB2312编码是中国国家标准局于1980年发布的第一套中文字符集编码,它采用了双字节表示一个汉字的方式。
但GB2312编码只收录了6763个汉字,无法满足中文字符集的全部需求。
为了解决这一问题,计算机产业发起了一项名为“扩展汉字集”的项目,最终完成了GBK编码的发布。
GBK编码于1995年底发布,采用了类似GB2312的双字节编码方案,并在GB2312编码的基础上增加了不少汉字和其他特殊字符。
它的编码范围包括了20902个汉字(包括繁体字)、882个特殊字符和94个控制字符,总计的编码范围达到了21886个字符,解决了GB2312编码不能表示所有中文字符的问题。
二、GBK编码的特点1. 兼容性强:GBK编码是GB2312编码的扩展,因此兼容GB2312编码,可以正确解码GB2312编码的文本。
同时,GBK编码还兼容ASCII编码,可以在GBK编码下表示ASCII字符。
2. 编码范围广:GBK编码收录了20902个汉字(包括繁体字)、882个特殊字符和94个控制字符,能够满足大部分中文字符的需求。
3. 汉字编码规则:GBK编码采用了双字节表示一个汉字的方式,其中第一个字节是0x81到0xFE之间的其中一个,第二个字节是0x40到0xFE之间的其中一个。
(7条消息)汉字编码,GB2312、GB13000、GBK、GB18030介绍1、GB2312、GB 13000、GBK、GB18030介绍GB 2312:又称为 GB 2312-80,是一个简体中文字符集的中国国家标准,于1980年由中国国家标准总局发布,1981年5月1日实施,全称为《信息交换用汉字编码字符集基本集》,规定了6763个汉字和682个非汉字图形。
GB 13000:为了便于多个文种的同时处理,国际标准化组织下属编码字符集工作组研制了新的编码字符集标准,ISO/IEC 10646。
该标准第一次颁布是在1993年,当时只颁布了其第一部分,即ISO/IEC 10646.1: 1993,我国相应的国家标准是GB 13000.1-93《信息技术通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面》。
制定这个标准的目的是对世界上的所有文字统一编码,以实现世界上所有文字在计算机上的统一处理。
GBK:随着信息技术在各行业应用的深入,GB 2312收录汉字数量不足的缺点已经初步显露出来。
例如:"镕"字现在是高频率使用字,而GB 2312 却没有为它编码,因而,政府、新闻、出版、印刷等行业和部门在使用中感到十分不便。
1995年,全世界大多数的PC操作系统都实现了16/32位。
GB 13000.1的实现出现了一线曙光。
一方面为了对 GB 2312进行扩充,一方面顺应当时技术的发展向 GB 13000.1推进,同时兼顾当时最广泛采用 GB 2312内码系统。
原电子部和原国家技术监督局联合颁布了指导性技术文件《汉字内码扩展规范》1.0版,即GBK 。
在GBK的内码系统中,GB 2312汉字所在码位保持不便,这样,保证了 GBK对 GB 2312的完全兼容。
同时,GBK内码与 GB 13000.1代码一一对应,为 GBK向 GB 13000.1的转换提供了解决办法。
微软对 GB 2312的扩展,也就是 CP936字码表 (Code Page 936)的扩展(原来的CP936 和GB 2312-80 一模一样),最初出现于Windows 95 简体中文版中。
威尔取模软件使用介绍(V1.0)一、简介1.1 界面介绍二、我要取几个汉字的字模2.1 取模2.1.1 打开软件2.1.2 在中文字符集文本框中输入要取模的文字,比如“欢迎使用威尔取模软件”,如下图所示。
2.1.3 选择要取模的字体,比如我要取宋体的字模,就选择宋体。
如下图所示。
此处列出的是系统安装的所有字体,如果要取自己下载的字体的模,请先安装该字体。
2.1.4 添加我要取模的字号,宽度,高度等信息。
点击添加按钮,打开添加窗口,如下图所示。
在字号,宽度,高度框中输入你要取模的文字大小。
比如我要取16*16的点阵,就在宽度和高度中输入16、16。
然后计算字号,字号=0.75*宽度。
输入12。
点击添加。
点击添加以后回到主界面,你会发现主界面字号列表框里面就多了一种你刚刚添加的字号了。
这时候点击你刚刚添加的字号选中它,然后再在预览框中输入一个汉字,看看效果。
2.1.5 如果效果不错可以跳过这一步。
如果效果不好有以下两种情况。
1.文字太大或者太小,如下图两种情况所示。
这时候就需要重新设置字号了。
增大或者减小字号。
2.字符不居中,如下图所示。
这时候调节右下方的位置调整滑块,将文字调节居中,如下图所示。
2.1.6 选择要生成C语言格式还是二进制文件格式。
如果是C语言格式,还可以选择是否生成数组的数组名。
2.1.7 假如我只要取我刚刚设置的16*16点阵字体,那么就要选择“取选中字号”,并选中16*16那一列。
如下图所示。
2.1.8 假如我只要取中文字模,那么就勾上取模中文,同时去掉取模英文的勾,如下图所示。
2.1.9 好了,所有设置妥当,可以开始取模啦。
点击“开始取模”。
如果选择的是C语言格式则取模完成后自动弹出结果窗口,如下图所示。
三、我要取整个GBK字库或者GB2312字库的字模3.1 取模3.1.1 打开软件3.1.2 假如我要取整个GBK字库的字模,那么点击右侧“GBK字库”按钮,自动输入GBK字符集所有文字。
\\\\\\\\\|======================================|////////||||||||| 欢迎您使用《方正兰亭》GBK编码V5.00! ||||||||/////////|======================================|\\\\\\\\[[[[ 一、简介 ]]]]===================《方正兰亭》GBK编码V5.00 是北京北大方正电子有限公司最新推出的一个针对专业排版、办公用户的通用大字符集字库产品,以MS Windows 95、MS Windows 98、MS Windows NT、MS Windows 2000、 MS Windows XP为运行平台。
GBK是最新的国家汉字编码标准(GBK/GB13000),它兼容原来的GB2312-80。
支持ISO/IEC 10646-1和GB13000-1的全部中日韩(CJK)汉字,共收汉字21003个,而GB2312-80只收了6763个汉字。
专业用户使用GBK字库可以很好地解决排版书籍、报纸、杂志的生僻字问题,同时辞书、古籍、户籍的编辑管理等诸多领域也可通过GBK字库来大幅度地提高工作效率和质量。
1998年4月,北大方正提供的书宋、黑体、仿宋、楷体四款GBK字库通过了国家有关权威机构鉴定,方正字库也成为首家通过鉴定的GBK字库产品,专家们一致认定方正字库符合国家用字规范和印刷标准,具有良好的通用性、兼容性和一致性,符合国际流行的工业标准。
《方正兰亭》GBK编码V5.00精选62款方正字体,其中19款汉字数为21003个,另有892个符号,全部字体含有欧元符号,其GBK码:A2E3。
字型全部采用曲线外轮廓方式描述,运行速度快,存贮容量小,全部62款安装占用480M磁盘空间。
字库和安装程序增加了加密功能,字体文件必须用安装程序安装,不能用系统fonts上的“安装新字体”命令进行安装或直接拷贝,否则报错不能使用。
字库【基本概念】★字库是外文字体、中文字体以及相关字符的电子文字字体集合库,字库被广泛用于计算机、网络及相关电子产品上。
字库按不同的规定有多种分类,按语种不同可分为:外文字库、中文字库、图形符号库;外文字库又可分为:英文字库、俄文字库、日文字库等等。
按不同公司划分为:微软字库、方正字库、汉仪字库、文鼎字库、汉鼎字库、长城字库、金梅字库等等。
按历史版本可划分为:GB字库、GBK字库、GB18030字库等等。
【字库编码】一、GB字库:★全称GB2312或GB2312-80是一个简体中文字符集的中国国家标准,全称为《信息交换用汉字编码字符集--基本集》,由中国国家标准总局发布,1981年5月1日实施。
GB2312编码通行于大陆;新加坡等地也采用此编码。
几乎所有的中文系统和国际化的软件都支持GB2312。
★GB2312标准共收录6763个汉字,GB2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号。
这种表示方式也称为区位码。
01-09区为特殊符号。
16-55区为一级汉字共有汉字3755个,按拼音排序;56-87区为二级汉字共有汉字3008个,按部首/笔画排序;10-15区及88-94区则未有编码。
二、GBK字库:★GBK全名为汉字内码扩展规范,英文名Chinese Internal Code Specification。
K 即是“扩展”所对应的汉语拼音(KuoZhan)中“扩”字的声母。
1993年,Unicode1.1版本推出,收录了中国大陆、台湾、日本及韩国通用字符集的汉字,总共有20,912个。
中国大陆订定了等同于Unicode 1.1版本的“GB13000.1-93”“信息技术通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面”。
★由于GB2312-80只收录了6763个汉字,有不少汉字,如部分于GB2312-80推出后才简化的汉字(如“啰”),部分人名用字(如中国前总理朱镕基的“镕”字),台湾及香港使用的繁体字,日语及朝鲜语汉字等,并未有收录在内。
楷体-GBK摘要:楷体-GBK是一种广泛使用的中文字体,具有优雅而稳定的外观。
在汉字的排印和印刷技术中起到重要作用。
本文将对楷体-GBK进行详细介绍,包括其设计背景、特点以及使用场景。
楷体-GBK是一种经典的字体,为中文排印提供了极大的方便,值得在各种场合广泛使用。
1. 引言楷体-GBK,全称“楷体-国标库”,是钟繇的行书楷书字形所改编而来,是一种流行的中文字体。
在汉字的排印和印刷领域中扮演着非常重要的角色。
楷体-GBK的设计以简洁、稳定和优雅为特点,适用于各种文字排印场景。
本文将对楷体-GBK的历史、特点以及使用场景进行详细介绍。
2. 楷体-GBK的历史楷体-GBK的设计灵感来源于钟繇的行书楷书字形,钟繇是中国古代书法发展历史上的重要人物。
他的行书楷书字形简练而饱满,成为后来楷体字的设计基础。
楷体-GBK的设计师参考了钟繇的楷书字形,进行了一系列改编和调整,使得字形更加规范、易读。
楷体-GBK的设计纳入了中国国家标准库,成为广泛使用的中文字体。
3. 楷体-GBK的特点楷体-GBK有以下几个特点:3.1 简洁明了:楷体-GBK的字形简洁明了,每个笔画清晰可辨。
它的字形匀称、端正,非常适合大面积文字排版。
3.2 优雅稳定:楷体-GBK的字形优雅稳定,给人一种舒适的视觉感受。
每个字母都经过精心设计和调整,使得整个字体看起来和谐统一。
3.3 易读易识别:楷体-GBK的字形设计经过严格的测试和调整,保证了易读易识别。
每个字母的比例和间距都经过精确计算,使得文字在印刷和排印环境中都能清晰展现。
4. 楷体-GBK的使用场景楷体-GBK适用于各种文字排印场景,特别是在正式文件、书籍、期刊和报纸等场合中广泛使用。
4.1 正式文件:楷体-GBK的简洁、稳定和优雅的外观使其成为正式文件排版的理想选择。
例如,公文、证书和合同等正式文件中常常选用楷体-GBK。
4.2 书籍和期刊:楷体-GBK在书籍和期刊排版中也得到广泛应用。
GBK代码集和方正超大字符集定义表郑永晓内容提要像笔者这样的文字工作者经常遇到冷僻字难以输入,在某些情况下,明明知道系统字库中收有该字,但即使是“全拼”输入法也难以找出此字。
在这种情况下,就只好到GBK 字符集中去寻找,如果GBK字符集中仍找不到,就应该到“方正超大字符集”中寻找,该字符集中收录汉字65,531个。
涵盖GB18030 (以及ISO10646-20 00或Unicode 4.0) 中编入的汉字。
虽然编制方法不甚科学,但该字符集仍能帮助我们输入绝大部分汉字。
如果该字符集仍然没有你需要的字符,就只好造字或到日本“文字镜”中查询了。
因而,只要我们能细心查询,一般情况下极少会遇到不能输入的汉字。
此处整理的《GB K 代码集字符定义表》和《方正超大字符集》所收汉字有六万之多,根据笔者的使用体会,应该能够解决绝大部分汉字的录入问题。
GBK字符定义表使用说明:①在windows中安装区位输入法。
②点击输入法的工具条,使其变成GBK内码输入状态。
③在相关页码中找到所需字符后,按照左上角(两位数字)—下方(一位)—上方(一位)之顺序组成的四位数字键入即可完成输入。
当然,最简单的方法即直接复制到word 中。
笔画索引是笔者制作,偏旁后面的数字是本字符在本文件中的页码。
该索引不很完备,用户在使用时需注意。
方正超大字符集使用说明:用户可以通过输入汉字的Unicode(或Surrogate)码来输入汉字。
如在Word 2003 中,可以直接键入Unicode码,然后按Alt+X 转换成汉字。
对于扩展B的汉字,请将前面两个“去掉。
比如,针对Unicode 是00020000的一个冷僻字,在word中输入020000 ,然后按Alt+X即可,即可出现相应的汉字。
要想知道每个字符的Unicode,也可以将光标定位在汉字后面,然后按ALT+X,相应的Unicode码则会显示出来。
为便于用户使用,笔者提供的此表包含了每个字符在《康熙字典》或《汉语大辞典》的页码。
GBK字库介绍
【基本概念】
GBK 是又一个汉字编码标准,全称《汉字内码扩展规范》(GBK),英文名称Chinese Internal Code Specification ,中华人民共和国全国信息技术标准化技术委员会1995 年12 月 1 日制订,国家技术监督局标准化司、电子工业部科技与质量监督司1995 年12 月15 日联合以技监标函[1995] 229 号文件的形式,将它确定为技术规范指导性文件,发布和实施。
这一版的GBK 规范为 1.0 版。
GB 即“国标”,K 是“扩展”的汉语拼音第一个字母。
GBK 向下与GB 2312 编码兼容,向上支持ISO 10646.1 国际标准,是前者向后者过渡过程中的一个承上启下的标准。
ISO 10646 是国际标准化组织ISO 公布的一个编码标准,即Universal Multilpe-Octet Coded Character Set(简称UCS),大陆译为《通用多八位编码字符集》,台湾译为《广用多八位元编码字元集》,它与Unicode 组织的Unicode 编码完全兼容。
ISO 10646.1 是该标准的第一部分《体系结构与基本多文种平面》。
我国1993 年以GB 13000.1 国家标准的形式予以认可(即GB 13000.1 等同于ISO 10646.1)。
GBK编码,是在GB2312-80标准基础上的内码扩展规范,使用了双字节编码方案,其编码范围从8140至FEFE(剔除xx7F),共23940个码位,共收录了21003个汉字,完全兼容GB2312-80标准,支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字,并包含了BIG5编码中的所有汉字。
GBK编码方案于1995年10月制定,1995年12月正式发布,目前中文版的WIN95、WIN98、WINDOWS NT以及WINDOWS 2000、WINDOWS XP等都支持GBK编码方案。
【知识链接】
我们经常使用各种编码标准的汉字,编码到底是什么呢?所谓编码,是以固定的顺序排列字符,并以此做为记录、存贮、传递、交换的统一内部特征,这个字符排列顺序被称为“编码”。
和中文字库有关的编码标准有:国标GB码、GBK码、港台BIG-5
码等,不同编码的汉字字库都与汉字的应用有密切关系。
很多人在使用过程中,发现字不够用,因为目前大家使用的主要是GB编码字库,此编码标准只收录了6763个常用汉字,而GB字库以外大量汉字,只能通过方正女娲补字软件拼字或其它造字程序补字。
尽管补出的汉字在字形上满足需要,但在字体风格、大小、结构方面难以协调统一,而采用手工贴图的方式补字,更不雅观。
进而言之,如果用户建立信息系统,或需要查询新闻、出版内容时,靠补字是无法实现的。
方正开发的GBK字库,将极大地缓解缺字现象。
从GB字库扩充到GBK字库,增加了1万4千多字。
北大方正从1996年投入大量人力,开始做黑、宋、仿、楷GBK字库,并于1998年4月成为第一家通过国家权威部门组织的GBK 字库鉴定的专业厂商。
到现在为止,北大方正已将全部字体转换成GBK字库,共46款,其中18款字数达21003个,是拥有GBK字库款数最多的厂商。
ISO 10646 是一个包括世界上各种语言的书面形式以及附加符号的编码体系。
其中的汉字部分称为“CJK 统一汉字”(C 指中国,J 指日本,K 指朝鲜)。
而其中的中国部分,包括了源自中国大陆的GB 2312、GB 12345、《现代汉语通用字表》等法定标准的汉字和符号,以及源自台湾的CNS 11643 标准中第1、2 字面(基本等同于BIG-5 编码)、第14 字面的汉字和符号。
【相关概念】
◎一、字汇
GBK 规范收录了ISO 10646.1 中的全部CJK 汉字和符号,并有所补充。
具体包括:
1. GB 2312 中的全部汉字、非汉字符号。
2. GB 13000.1 中的其他CJK 汉字。
以上合计20902 个GB 化汉字。
3. 《简化字总表》中未收入GB 13000.1 的52 个汉字。
4. 《康熙字典》及《辞海》中未收入GB 13000.1 的28 个部首及重要构件。
5. 13 个汉字结构符。
6. BIG-5 中未被GB 2312 收入、但存在于GB 13000.1 中的139 个图形符号。
7. GB 12345 增补的 6 个拼音符号。
8. 汉字“○”。
9. GB 12345 增补的19 个竖排标点符号(GB 12345 较GB 2312 增补竖排标点符号29 个,其中10 个未被GB 13000.1 收入,故GBK 亦不收)。
10. 从GB 13000.1 的CJK 兼容区挑选出的21 个汉字。
11. GB 13000.1 收入的31 个IBM OS/2 专用符号。
◎二、码位分配及顺序
GBK 亦采用双字节表示,总体编码范围为8140-FEFE,首字节在81-FE 之间,尾字节在40-FE 之间,剔除xx7F 一条线。
总计23940 个码位,共收入21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号883 个。
全部编码分为三大部分:
1. 汉字区。
包括:
a. GB 2312 汉字区。
即GBK/2: B0A1-F7FE。
收录GB 2312 汉字6763 个,按原顺序排列。
b. GB 13000.1 扩充汉字区。
包括:
(1) GBK/3: 8140-A0FE。
收录GB 13000.1 中的CJK 汉字6080 个。
(2) GBK/4: AA40-FEA0。
收录CJK 汉字和增补的汉字8160 个。
CJK 汉字在前,按UCS 代码大小排列;增补的汉字(包括部首和构件)在后,按《康熙字典》的页码/字位排列。
2. 图形符号区。
包括:
a. GB 2312 非汉字符号区。
即GBK/1: A1A1-A9FE。
其中除GB 2312 的符号外,还有10 个小写罗马数字和GB 12345 增补的符号。
计符号717 个。
b. GB 13000.1 扩充非汉字区。
即GBK/5: A840-A9A0。
BIG-5 非汉字符号、结构符和“○”排列在此区。
计符号166 个。
3. 用户自定义区:分为(1)(2)(3)三个小区。
(1) AAA1-AFFE,码位564 个。
(2) F8A1-FEFE,码位658 个。
(3) A140-A7A0,码位672 个。
第(3)区尽管对用户开放,但限制使用,因为不排除未来在此区域增补新字符的可能性。
◎三、字形
GBK 对字形作了如下的规定:
1. 原则上与GB 13000.1 G列(即源自中国大陆法定标准的汉字)下的字形/笔形保持一致。
2. 在CJK 汉字认同规则的总框架内,对所有的GBK 编码汉字实施“无重码正形”(“GB 化”);即在不造成重码的前提下,尽量采用中国新字形。
3. 对于超出CJK 汉字认同规则的、或认同规则尚未明确规定的汉字,在GBK 码位上暂安放旧字形。
这样,在许多情况下GBK 收入了同一汉字的新旧两种字形。
4. 非汉字符号的字形,凡GB 2312 已经包括的,与GB 2312 保持一致;超出GB 2312 的部分,与GB 13000.1 保持一致。
5. 带声调的拼音字母取半角形式。
【实践应用】
伴随GBK字库的推广使用,中国新华通讯社于2000年1月1日起开始使用GBK编码向各新闻单位播发新闻稿。
2000年4月1日起,中国银行业开始推行“储蓄实名制”。
同时,各种出版物已开始向网络化发展,网上发布新闻、网络出版已是大势所趋,通过网络传播信息的广度和深度对汉字使用提出了更高要求,GBK字库是缓解人名和地名等冷僻字的“当然之选”。
北大方正已为广大用户使用GBK字库做好了充分准备,其出版系统已全面支持GBK字库,如方正书版9.0、方正飞腾从1.0版本、世纪RIP从1.0版本开始就支持GBK字库,用户的补字量将大大降低。
方正GBK字库的使用非常便捷。
排版软件方面,目前Windows上大多数文字处理软件,如MS Office、
PageMaker、金山WPS等均已支持GBK字库,方正书版9.0、方正飞腾3.6和方正世纪RIP完全支持GBK字库。
输入法方面,除了Windows上的全拼、王码五笔等主流输入法支持GBK字库外,北大方正还专门为GBK的输入制作了一本GBK内码字典,用户可以用查字典的方法很快找到汉字的GBK编码完成录入。