Opentype技术在藏文教育网站页面显示中的实现与应用共5页文档
- 格式:doc
- 大小:16.00 KB
- 文档页数:5
uni中opentype用法-回复Opentype技术是一种计算机字体格式,它由Adobe公司和微软公司合作开发,于1996年首次发布。
这种字体格式包含了许多创新的特性,使得文字在屏幕和打印上的表现更加精确、灵活和美观。
本文将详细介绍Opentype的用法,以及一步一步回答在使用Opentype字体格式时可能遇到的问题。
Opentype是一种支持Unicode编码的字体格式,因此它可以包含来自世界各地的不同文字和字符。
这一点使得Opentype成为全球化设计的理想选择。
Opentype字体文件通常以后缀名.otf或.ttf保存,可以在Windows和Mac操作系统上使用。
首先,要使用Opentype字体,你需要将文件安装到你的计算机系统中。
在Windows系统中,你可以将字体文件复制到“C:\Windows\Fonts”文件夹中。
在Mac系统中,只需双击字体文件,系统会自动安装。
一旦安装了Opentype字体,你可以在不同的应用程序中使用它们。
例如,在Adobe套件中,你可以在Photoshop、Illustrator或InDesign中选择并应用Opentype字体。
在Microsoft Office软件中,你也可以使用Opentype字体来创建和编辑文档。
Opentype字体的一个重要特点是它们的大容量存储和广泛的特性。
Opentype字体可以包含数千个字符,包括字母、数字、标点符号、符号、特殊符号等。
此外,Opentype字体可以包含多种变体和替代字形,以及各种小写和大写字母的变体形式。
要访问和使用Opentype字体的高级特性,你通常需要使用支持Opentype功能的应用程序。
例如,在Adobe应用程序中,你可以使用字符面板或自动替换功能来选择和应用字体的不同变体和替代字形。
另一个有用的Opentype功能是其支持复杂的排版功能,比如字符间距、行距、断字和连字等。
这些功能可以使得文字在设计中更加灵活和美观。
藏文转写系统的设计与实现随着信息技术的发展,藏文的数字化处理成为一项重要任务。
为了实现藏文语言文字的自动处理和数字化传播,设计和实现一款高效的藏文转写系统变得尤为重要。
本文将介绍藏文转写系统的设计与实现,探讨其在提高藏文数字化处理效率和保护藏文文化遗产方面的重要性。
一、引言藏文是藏族人民的主要语言文字,对于藏族文化的传承和发展有着举足轻重的作用。
然而,由于藏文的特殊性,包括字符数量庞大、字形繁多以及复杂的音韵和文法体系等特点,使得对藏文的数字化处理变得困难和耗时。
因此,设计和实现一款高效的藏文转写系统是十分必要的。
二、设计原则1. 准确性:藏文转写系统应该准确地将藏文文本转写为易于处理和存储的文本形式。
系统应准确地识别藏文字符和音节的对应关系,确保转写结果的准确性。
2. 高效性:为了提高处理效率,系统应设计优化算法和数据结构,减少处理时间和资源消耗。
系统应能够快速处理大量的藏文文本。
3. 用户友好性:系统应提供简洁易用的用户界面,方便用户输入和操作藏文文本。
系统还应该支持多种输入方式,如键盘输入、手写输入等。
4. 可扩展性:在设计和实现藏文转写系统时要考虑到未来可能出现的新的需求和技术发展。
系统应具备良好的可扩展性,便于对未来需求的适应和扩展。
三、系统实现1. 数据预处理:首先,需要对输入的藏文数据进行预处理,包括字符编码转换和文本分割。
字符编码转换可以将输入的藏文字符转换为计算机可识别的编码形式。
文本分割可以将整篇藏文文本切割为单个的词或句子,方便后续处理。
2. 字符映射表:为了实现藏文转写,系统需要建立一个字符映射表,将藏文字符映射到计算机可处理的字符。
这个映射表可以采用一对一的对应关系,也可以采用多对一的映射关系,根据具体的需求进行设计。
3. 转写算法:根据字符映射表,系统可以实现转写算法。
转写算法通过扫描输入的藏文文本,根据映射表将藏文字符逐个转换为计算机可处理的字符。
算法可以根据不同的需求和场景进行优化,以提高转写的效率和准确性。
藏文信息处理的原理与应用电子版引言藏文是中国少数民族中使用的一种重要文字,它承载着藏族人民的文化遗产和思想智慧。
为了更好地进行藏文信息的处理和应用,电子版的藏文信息处理技术应运而生。
本文将介绍藏文信息处理的原理和应用,以及电子版在这个过程中的作用。
藏文信息处理的原理1. Unicode编码Unicode是一种全球统一的字符编码标准,它为不同文字和符号提供了唯一的数字编码,包括了藏文字符。
Unicode编码使得计算机能够正确地处理藏文字符,并能够在不同的平台上进行正确显示和编辑。
2. 字符转换由于藏文的特殊性,需要将其转换为计算机能够处理的格式,一种常见的方式是将藏文字符转换为Unicode编码。
这样可以在计算机上进行相应的处理和操作,比如搜索、排序、保存等。
3. 分词在进行藏文信息处理时,常常需要将文本拆分成词语的形式进行处理。
分词是将一段藏文文本按照词语为单位进行划分的过程。
分词可以提取有用的信息,帮助进行词频统计、文本分类和信息检索等操作。
4. 语言模型语言模型是指对自然语言中的词序列概率进行建模的方法。
通过语言模型,我们可以对藏文文本进行预测和生成。
语言模型可以用于机器翻译、自动摘要、对话系统等应用中,为藏文信息处理提供了更多的可能性。
藏文信息处理的应用1. 机器翻译机器翻译是将一种语言的文本转换为另一种语言的过程。
对于藏文这样的特殊语言,采用机器翻译可以极大地减少人工翻译的工作量,并且提高翻译的效率。
通过将藏文转换为计算机可处理的格式,机器翻译可以在不同语言之间进行自动翻译。
2. 文本分析文本分析是对文本信息进行提取、分析和理解的过程。
在藏文信息处理中,文本分析可以帮助我们更好地理解藏文文本的含义和结构,比如提取关键信息、聚类相似文本、情感分析等。
文本分析可以应用于网络舆情监测、情报分析、文本挖掘等方面。
3. 信息检索信息检索是指在大规模文本数据集中查找符合用户需求的文档或信息的过程。
对于藏文信息处理来说,信息检索可以帮助用户快速、准确地找到想要的藏文文档。
藏文在线识别技术的研究与应用第一章:引言藏文作为中华民族五大文字之一,是藏族人民的宝贵文化遗产。
随着科技的发展,许多藏文资料被数字化存储,而藏文在线识别技术的研究和应用也开始受到关注。
本文将基于现有的相关文献,对藏文在线识别技术的研究和应用做一个综述。
第二章:相关技术介绍2.1 OCR技术OCR(Optical Character Recognition,光学字符识别)技术是对印刷文字、手写文字等文本信息进行自动识别的技术。
OCR技术包含预处理、文本分割、特征提取、分类器训练等步骤。
在针对藏文识别的OCR技术中,一般会以藏文约定的字母序列为分类标准,利用预处理算法主要解决光照不均匀、噪声等问题,在特征提取中大多数采用基于局部二值模式的特征提取方法,然后通过分类器进行分类判别。
2.2 深度学习技术深度学习技术是一种针对大规模数据进行特征提取和学习的机器学习方法,该技术已经在图像识别、语音识别等自然语言处理领域取得了很好的结果。
在藏文在线识别方面,深度学习技术也被广泛应用。
例如,常用的卷积神经网络(CNN)等深度学习方法,对于超大规模的庞杂藏文数据集进行了训练,可以实现比传统OCR识别准确率更高的结果。
第三章:藏文在线识别技术的应用场景3.1 古籍数字化著作等重要的藏文文献是人类文化遗产的宝贵资源。
通过藏文在线识别技术,可以实现藏书修订、重校与阅读等操作,如全文检索、查找、翻译等,真实反映藏书、密咒、历史文献等真实内容,同时开创妥善保存古籍的新领域。
3.2 商业应用运用藏文在线识别技术在岗位培训、测试和课程建设等方面,可以提高企业工作效能,为当地人民创造更多就业机会,增强民族经济的发展与竞争力。
3.3 教育应用藏区教育资源丰富,但仍面临诸如基础设施建设、教师素质、教学环境等问题。
通过藏文在线识别技术,可以实现文本朗读、翻译、文献整理等功能,为教育资源的开发和利用提供了更加丰富和直接的手段。
同时,对于藏区的青少年学生来说,可通过藏文在线识别技术更深入了解藏文文化,培养对民族文化的认同感和文化自信心。
藏文国际编码的发展与技术应用藏文国际编码的发展与技术应用昊兵江获[摘要]藏文编码过程中一直存在两种完全不同又可互补的观念,即组合观念和预组合观念.前者以ISO/IEC10646~一l:1993,Umc~e或GB—l6959—1997(《信.&技术一信息交换用藏文编码字符集一基本集》)以及其应用方案SystemofMicrosoftHimalaya和TheMicrosoftTibetanKeyboard为代表,后者以GB/T20542—2006(《信息技术一藏文编码字符集一扩充集A》)以及应用系统"d匕大方正藏文书报版系统"为代表.就编码修订和增补来看,随着OpenType等新技术应用,组合编码方案更具简洁性,无遗漏涵盖等特点,发展前景广阔.本文以微观方式梳理出藏文编码产生,修订和发展的复杂过程,分析了藏文编码的技术布局,编码细节及技术应用情况.[关键词】藏文;编码;藏文扩A;藏文扩B;Unicode中图分类号:C955文献标识码:A文章编号:1004--3926(2011)08—Oo46—O6作者简介:吴兵(1972一).男,四川泸定人,上海师范大学博士研究生,西南民族大学计算机科学与技术学院副教授,研究方向:自然语言处理.四川成都610041江荻(1954一),男,山西定襄人,中国社科院民族学研究所研究员,语音与计算语言学研究室副主任,博导,研究方向:汉藏语言学,现代藏语语法及计算语言学.北京100081藏文中国国家标准于1998年1月1日正式发布,迄今已有l3个年头.藏文国家标准是在ISO/IEC国际标准基础上制定的,并随着Unicode和ISO/IEC的持续发展而不断完善.本文在理清藏文编码技术的发展历程中,针对藏文软件发展状况分析,意图找出藏文编码的发展趋向和应用前景,以资感兴趣者共同探讨或把握..一,藏文编码的创制藏文走入计算机,走向信息化一直是人们梦寐以求的愿望.20世纪80年代,设计出数码代字等藏文计算机处理方案(于道泉,1982),自创点阵型藏文字符(张连生,1983),开始了藏文信息化之路. 藏文国际标准编码的起步是从国际统一编码联盟(TheUnicodeConsortium)1991年1O月发布Unicod~1.0开始的,当时收入藏文字符71个.这些字符未按现在的体系编码,部分命名和功能描述也不准确.Unicode1.0的编码从u+1000开始,第一个字符即辅音字母ka,全部辅音字符连续编码至u+ 1022,共计35个,例如:,f1(ka,lOOO),(kha,1001) ……弓(ha,1021),(8,1022),还包括了5个反写梵源藏文字母:(tta,1008),器(ttha,1009),(dda, IOOA),严(nna,100B),(ssha,101F).其他重要符号是:元音7个,其中鑫(i,1026),雷(一i,lO27),(U, 1028),(e,1029),(0,102A)连续编码,另两个是复合元音:各(ai,103D),(an,103E);数字符号10 个,从O(100o)至9(1009)连续编码.余下的是标点符号与读音辅助符号,例如,表示左右括号厂(左半符,103C),,(右半符,102F);表示句终或停顿符{ (单垂符,1034);表示语音变读的0(随音点,102C), 3(涅槊点,102E),(无韵辅音符,104B),(弱读符,104C).当时的命名也有一些不规范之处,相当部分采用口语读音而非正字,例如100C命名描述为tsatru,正字应该是tsaphru.再如,表示强调的符号ngezunggorta,正字应该是ngasbzungsgor rtags,功能描述也应清楚表述,该版表述为"下画圈underring)".与此同时,国际标准化组织开始制定全球性标准,其中ISO/IEC10646—1这个版本在组织内部不断修订.由于这两个国际组织明白世界并不需要两个不同标准,它们自愿走到一起来,统一标准.因此统一编码修订第1.1版(1993.6)时,出现一个戏剧性的景况,所有藏文字符全部被删除.这是因为专家们接受了把当时的Unicode作为ISO/IEC 10646的一个子集观念,而后者尚未收入藏文字符, 且一时无法完善1.O版的不足,于是在这个版本中暂先屏蔽掉藏文,以使两个标准顺利接轨.统一码在1.1版之后(包括它内部的多个版本),经长时间磨合,逐渐与ISO/IEC10646—1对民族语言文化47应起来.在推出的Unicode2.0版(1996.7)时,收入藏文符号168个,包括了部分佛教文本符号.而此前,国际标准化组织内部制定的ISO/IEC 10646各个测试版本已包括这些符号(1992—1993).藏文在这两个版本中已基本实现一致.但直到Unicode3.0发布,这两个版本才完全紧密结合起来,相应的国际编码标准是ISO/IEC10646 一l:2000.在Unicode2.0和ISO/IEC10646—1:1993编码标准中,藏文位于基本平面0FO0一OFBF编码区域,共168个符号,占用192个码位.其中藏文字符分为:篇章起首符11个:0F00~0FOA;标点或类标点符号17个:OFOB一0F14,0F34,01736,OF3A一0F3F;历算和筹算符号11个:0F15—0F1F;数字或半数字符号2O个:OF20—0F33;敬重或凸现符号3 个:0F35,0F37—0F38;变音符号13个:0F39,OF7E,OFTF,0F82—0F8B;辅音字符41个:OF40—0F69;组合用辅音字符:0O一0F95,0F97—0FAD,0FB1—0FB7,0FB9;组合用元音字符从0F71一OF7D,0FSO~0F81.其编码如表l所示.表1藏文图形字符编码表Ol23456789ABCDEFU+0F0彝冬冬喜,.:f}}_●——U+0F1?审-j目警一.,O品H一..__'●一一●●-^一'-._.,,…●--__.U+0F2,气乜t,,起坤U*OF3产jf}0,U+OF41f≈离等墨鼙嚼弃厦尸蠢芦丐,H——一.L-●__●……-U+0F5詹气蒜≈窖茛《瑚虚葶__,_--.____●_●…,_U+0F6nZR砷弓丑..---_-一_OF7仓geS0愠'喝U+0F8霄喜^,●',_●___●…-…U+0F9警誊&t0警譬譬量导U+OFA譬譬譬警t~辩●__●'●-nH一●-'..-.0‰譬鲁I三+0FBe雨一A^■曹舶_^一_●--_-_-…_R一一●-_-___—-_e0+OFCoo0古l●Oo目前来看,可把Unicode统一码2.0或ISO/IEC10646一l:1993藏文国际编码看作藏文编码的创始,此后的国际编码版本都在此基础上的增补和修订.二,藏文编码的增补与修订2000年统一码联盟发布Unicode3.0(pub- lishedbyAddison—Wesley),它与国际标准组织的ISO/IEC10646一l(第2版)相匹配.其中藏文增加了25个字符(见表1中),并对部分藏文字符和字符名称,意义描述加以修订澄清.Unicode2.0中有三个下加字都采用了变形字形,(wabtags,OFAD),鲁(yabrags,0FB1),2(ra btags,OFB2),但在藏文译写梵文时,经常使用不变形字体,为此3.0需要添加它们的完形字符:名(OFBA),岛(0FBB),冀(0EBC).藏文上加字(r一)在各类基字上组合时需要变形为否(r一,0F62),但在基字9(nya)上则不变形,为此新版增加这个不变形字符(0F6A). Unicode2.0中墨(0F88),n(0F89),(OFSB)曾定义为组合字符,新版不作此规定.关于符号"'''(OFOC),原本意图作为文本中,(nga,ngu等)的断行限制符,但错误地描述为定界分音点.同样,符号"'(0FOB)描述为音节间分音点,这个版本调整为语素间分音点.Unieode3.0增加了五个组合用下加符号:謇(O6),a(0FAE),鲁(0FAF),敏(0FBO),岛(0FB8),这些符号是2.0版中考虑不周遗漏所致.除了以上修订和增加的符号,3.0版还增加了16个其它符号,有类标点符号:×(0FBE),鲦(OFBF);吟诵示意符:o(0FC0),.(OFC1),~(OFC2),$(0FC3),6 (0FC4),t(0FC5),~(0FC7),~(0FC8);吉祥装饰符:(0FC5),~(0FC9),~(0rCA),@(0FCB),~(0FCC);筹码符号:~(0FCF).此外最重大的修订是扩展了藏文字符编码区.由中国,爱尔兰,英国三国专家联合提议的第1660号提案(1997—12)?所提出的增补字符远超出原来的192个字符区域(OFO0—0FBF),这次扩展使藏文编码区域从0F00扩展至OFFF,可编码的字符数达到了256个.在Unicode后续的几个版本中,藏文编码没有增删变化,包括3.1版(2001.3),3.2版(2002.3),4.0版(2003.4).应注意的是,4.0版与国际标准组织发布的ISO10646:2003版相匹配.2005 年3月的4.1版中,增加了两个字符:~x-(0FD0),~(0FD1),这是两个信函或公文篇首书写起始符. Unicode5.0版(2006.7)藏文没有变化.r2Oo8年3月发布的5.1版中藏文增加了6个字符,分别(0F6B),(OF6C),这两个字符是根据西部藏语巴尔提话(克什米尔地区)转译乌尔都语借词创造的;×0(0FCE),这是一个筹算符号;:(0FD2)是用于古代文献的分音点,非常罕见;(0FD3),(0FD4),都是篇首起始符云头符的变体形式.2009年10月发布Unicode5.2版,藏文编码共增加4个佛教符号:(0FD5),(0FD6),(0FD7),(0FD8),都是表示好运吉祥的符号.这个版本与国际标准组织发布的ISOl0646:2003版的第三版第6次修订版匹配.2011年2月17日Unicode6.0发布,这是目前最新版本,其中增加了6个藏文符号.~(0F8C),~(OFSD),a(0F8E),48《西南民族大学》(人文社会科学版)2011年第8期a(OFSr)^.,(0FD9),..(OFDA),都是相当罕见的符号.例如0FSC仅发现于18世纪汉文文献《同文韵统》(第2卷135.页),用来给藏文,蒙古文,满文注音.最后两个是文本编辑符号.三,预组合型藏文编码的发展中国的藏文编码起步较早,2o世纪80年代初就已开始.然而,中国藏文编码所走的技术路子深受汉字编码的影响,形成了以字丁为造字基础的格局.所谓字丁是藏文字符书写上由基字和叠置在其上下的字符垂直组合构成的结构,传统藏文叠置层次可达四层,转写梵文的梵源藏字层次更多.80年代末期,中国藏学研究中心与华光集团合作研制藏语文计算机排版系统,并于1993年实际应用于《大藏经》校勘出版,采用的就是预先组合的字丁编码模式】拟).与此同时,中国其他机构或大学也推出了相同技术和模式的藏文编码系统,例如北大方正藏语文书版排版系统,西北民族大学的兰海藏语文系统等,以及2000年以后西藏语委,西藏大学等联合开发的藏文办公套件及西南民族学院的ZWin藏文软件.这个技术模式也集中反映在2002—2003年中国向ISO/IEC 编码组(WG2)提交的N2558(在ISO/IEC10646基本平面中藏文大字丁字符编码提案,2002.12. 06)和N2621提案(关于ISO/IEC10646基本平面中藏文大字丁字符编码的修订提案,2003.O9. 18),以及略晚的N2661解释提案(关于藏文大字丁提案的声明和解释,2003.09.18).由于Uni—code和ISO/IEC等国际标准组织的专家坚持资源重于技术(编码空间有限),中国提案未能通过.紧接着,2007年1月美国微软公司推出了包含藏文标准字符编码和输入法的应用系统Windows Vista,采用OpemType字体和叠置引擎技术基本解决了藏文上下叠置书写问题.中国国内采用预组合藏文字符编码有着一定的传统基础,早期的机械式藏文打字机和报刊排版铅字都采用了预组合字丁符号.计算机应用以来,各种预组合藏文编码文本已有相当数量的累积,这些因素都对藏文编码方案制定产生影响¨.?为解决实际应用中的问题,2006年1O月中国标准化机构发布了GB/T20542—2006藏文扩充集A(以下简称藏文扩A),共收录1536个藏文和常用梵源藏文垂直预组合字符.所有字符在GB13000.1—1993的专用用户区编码,每个字符由2个字节编码,编码范围OxF300—0xFSFF,共占用1536个编码位置[3]《附).藏文扩A预组合字符用到藏文基本字符集中的74个基本字符,其字符编码分别是:0F18,0F19,OF35,0F37,0F39,0F3E,OF3F,OF71,OF84,OF86,0F87,OF90—0F97,0F99一OFBC,OFC6.藏文扩A将预组合藏文字符和预组合梵源藏文字符分开排序.其中预组合藏文字符共761个,以基字为准,按藏文字母的顺序排序.例如,预组合首字符为0xF300~,依次是F301~,F302~,F303~,F304g,F305~,F306~,F307fi,F308~,F309~,F30A~,F3OB~F30C~F30D~F30E~,F30F~……F5F1,F5F2写,F5F3再,F5F4,F5F5g,F5F65,F5n,FSr~c~.这些预组合字符编码排序规则是:辅音+元音,基字+下加字(依次是g2寓t),基字+下加字+元音,基字+上加字(依次是),基字+上加字+元音,基字+下加字+上加字,基字+下加字+上加字+元音']l(¨.藏文扩A收录的梵文转写藏文字符共775个,以最上层辅音字符为准,按元音,辅音的字母顺序排序.预组合首字符为FSFg~,依次是F5FA奄,F5FB~,F5FC~,F5FD号,F5FE,~,F5FF~……F8F65,F8F7逗,F8F85,F8F9号,F8FA马,F8FB~,F8FC禹,F8FD ,FSFE~,FSFF~.在梵文转写藏文字符中,除上加字和下加字3时出现一些不同写法外,其它转写都是一致的.对少数有不同写法的转写字符,为转写字符的美观和书写规范确定了一种转写方式和对应的一个编码,如荟j,吾雨,誊墨,蔼等不同的转写写法时,确定为如≈,吾,酬的转写方式.随着藏文的实际使用,藏文扩A中定义的梵源转写字符尚不完备.2008年6月国家标准机构发布了GB/T22238—2008藏文扩充集B(以下简称藏文扩B).该标准收录5702个梵源藏文字符.所有字符在GB13000.1—1993的专用平面0F上编码上,采用4字节编码,由000F0000—000F1645表示,共占用5702个编码位置.收录的字符以最上层辅音字符为准,按藏文字母顺序排序-4】(.预组合首字符为FO000~,依次是FO001$, F0002~,f0003毫,FO004,F0005苯,F0006笨……F161B~,F161C暑,F161D~,F161E~,F161F{,F1620g, F1621~,F1622~,F1623g,F1624~.并增加了33个专用于上下加组合用字符:n625:,,F1626"*,F1627":,F16282.,F1629~,,F162A,F162BF162C,F162D,F162E呻,n62F:,F1630",F1631',F1632:,F1633',F16345,F1635,r1636~,F1637"..,F1638~,F1639:,F163A'~,F163,F163,F163IY,F163,F163F,F1640",F1641~,E1642',F1643,F1644.标准最后定义了一个空白字符F1645.各字符排序和转民族语言文化49写方式与藏文扩A中的预组合梵源字符部分一样. 在目前应用驱动下,藏文国际标准编码和国内预组合编码都有各自应用领域,前者主要应用于个人电脑和办公系统,后者应用于专业书刊排版机构.但随着技术发展,两种编码终将走向一体化. 四,藏文编码的应用我国有500多万(2001年)藏族人口,不同方言间交谈虽有一定困难,但进行藏文字书面交流, 除部分术语不同以外则无困难.有近1400年历史的藏文字,是藏文化最主要和最基本的载体.藏文记载的经典文献,古籍着述和译作文献数量仅次于汉文历史文献,独特的人类文化价值不可估量,在广大藏区持续发挥着巨大作用,是中华民族文化遗产宝库中一颗璀璨的明珠.在藏文的信息化过程中,先后出现不少能进行藏文信息处理的应用软件系统J,其中主要有北大方正藏文系统,华光藏文系统,同元藏文系统,班智达藏文系统,ZWin藏文系统,桑布扎软件,喜马拉雅藏文平台.(一)早期藏文处理技术1981年张连生最早在英文DOS下用COBOL语言实现了一个藏文排序软件,1983年在美伊利诺斯大学用PLA TO计算机上TUTOR软件的图形叠加功能完成藏文字显示,并用李方桂先生的罗马转写藏文为输入方案,实现了集输入,显示和打印为一体的藏文字处理系统J.,1984年上海教育学院俞乐等人用BASIC实现了能输入显示和打印藏文的字处理系统和报表软件.在此前后,甘肃省计算中心胡彦发等人和西北民族学院用扩展BASIC开发出藏文字处理系统ZWCL及藏文文献联机检索系统.航天部710 研究所罗圣仪等人用TLLP字符写入程序实现了一个藏文字处理系统,藏文字母采用拉丁转写,上下加字采用数字的编码方案.该时期藏文处理研究工作主要围绕藏文字处理系统基本实现在应用层面展开,在技术上有许多欠缺.这些藏文软件都是在应用软件层面实现,而非操作系统层面实现的,故很难利用英文各类应用软件和编程语言;都是单文种(藏字)处理系统,无法同时兼容英文,汉文系统;无统一相关技术标准(如内部交换码,字符集等)可参照,各系统间不能兼容;实现的藏文字符普遍偏少或不全, 不具备梵源藏文字符处理能力;输入编码采用拉丁转写或数字替代,输犬繁琐难记.但这些工作为后来确定藏文基本字符集,系统平台开发积累了技术经验.(二)基于DOS的藏文系统CCDOS汉字处理技术极大地推动了与汉英文兼容的藏文操作系统的发展.1986年在CCDOS2.13下研制出兼容汉英文的藏文操作系统TCDOSo在此基础上,熊涛等人与西北民族学院于洪志等人合作实现了挂接在WPS下的兰海藏文系统.1992年lO月,西藏大学尼玛扎西等人研发(TCE藏汉英文信息处理系统》通过了西藏自治区的审定.在此前后,西南民族学院沙马拉毅和吴兵等人也研发了支持藏汉英混排的ZWPS藏文系统;四川大学彭寿全等人也实现了兼容汉英文的藏文系统.南京新技术研究所于江苏,葛小冲等人也开发出藏汉英文兼容的ZWDOS系统.这些藏文系统中藏文编码主要是占用GB2312—80中部分区位,多是将藏文分布在l0区一15区和88区一94区.当时这些编码区均未分配汉字,在当时一般使用没问题,但是由于这些藏文系统编码不统一,相互间不兼容.中国藏学研究中心和航天部710所于1988年8月推出了藏文字处理及激光编排印刷系统,后与潍坊华光合作开发出了书林藏文排版和激光照排系统(即华光藏文系统).中软总公司,民族印刷厂,北大计算所,中国民族语文翻译中心在华光藏文系统基础上,于1990年底联合推出了北大方正藏文书报版系统(简称北大方正藏文系统).华光,方正系统藏文编码虽无国家标准,但其编码有完整对应关系,且在国内外有着广泛的用户群,成为国内事实上的标准"系统.此后很长一段时期,一直是国内藏文信息处理研究领域的基本平台,至今仍占据着广大藏区9o%以上的书,报印刷市场,也是许多藏文信息处理研究者的首选基本平台J.本阶段,在国家大力支持下,国内各主要研究单位和企业的通力协作,基于DOS的藏文操作系统与汉文操作系统基本同步实现本地化工作. (三)基于Windows的藏文字处理系统90年代后期软硬件技术飞速发展,基于GUI的Windows视窗系统逐步替代了字符界面的DOS 系统成为微机操作系统主流.原有的藏文系统不能在视窗系统下使用,基于视窗的藏文系统研发成为该时期藏文信息处理核心任务之一.视窗系统结构庞杂,内核代码不公开,系统换代更新快,若在其内核级实现藏文化支持非常难.通常是直接在应用层面开发,或是挂接在汉,英视窗系统下实现藏文化支持.北大方正1997年开发了Win3.1的藏文维思彩印系统,但其藏文输入,编辑仍需切换到DOS下进行;西北民族学院信息所于洪志,戴玉刚等人50《西南民族大学》(人文社会科学版)2011年第8期2000年研制的基于视窗同元藏文字处理软件,是利用WordAPI动态链接库wLL技术嵌入藏文输入法和町藏文字库实现.同期,青海师范大学也开发了视窗版的班智达藏文字处理软件,并在汉藏机器翻译系统和藏药信息系统中有所应用. 2001年西藏大学尼玛扎西,洛藏等人和四川火狐信息技术公司合作开发了基于视窗的火狐藏文字处理软件.2002年西南民族大学沙马拉毅,吴兵等人研发的ZWin藏文系统,支持Win98至WinXP 的多种系统,能动态调用藏文不同输入方案和藏汉英文混排印刷及支持其它软件中使用藏文J.总体看,同元,班智达和ZWin明显优于国外的桑布扎,主要是前者支持藏,中,英文同时输入编辑,而后者不能同时处理汉,藏文,实际使用中有很大障碍.只能用Word软件,才能输入桑布扎藏文,而同元,班智达和ZWin则可在视窗平台上任何应用软件中处理藏文,如可在投影演示软件中方便地处理文稿或课件,大大拓展使用范围.此阶段的藏文字处理软件多在应用层面研制或部分在汉英文视窗下挂接实现,功能上仅具备一般藏字处理功能,属于基于视窗的藏文字处理软件,而非真正藏文视窗操作系统,主要问题有:1.未采用国际标准编码.占用GB2312—80的1O一15区或88—94区的空余码位,有的藏文字库竟占用15—81区部分码位.藏文字符(上加,下加情况)均采用自定义编码,未采用藏文基本字符编码,导致藏字所占编码多(约占五千多个编码),且各藏文系统间编码不统一,相互间不兼容. 2.未采用国际标准编码,更不用谈与汉英文在系统底层实现兼容处理及对其它软件底层支持. 3.有些仅针对某个应用软件来实现藏文字处理功能.如早期同元和Sambhota仅在Word中才能使用,一旦脱离Word软件就无法处理藏文.4.从技术角度看,多数是利用视窗系统应用层面的API或WordAPI函数挂接实现,而系统级的藏文视窗系统研发还有许多技术要攻克.(四)基于Linux的藏文操作系统及支撑软件2005年7月,中科院软件所,西藏藏语委办公室,西藏大学合作研发自主知识产权的《基于Linux 的跨平台藏文信息处理系统》,支持藏文Linux平台和符合藏文应用习惯的OpenOffiee办公套件,提出多语言网站结构并开发了多语言处理浏览器引擎, 为藏文网络化奠定了良好基础.从技术上看,它从多语言计算共通性出发,建立了我国民族语言规范化,标准化的统一文字处理体系.目前在Linux上的软件较少及用户习惯等原因该系统主要在西藏部分事业单位和政府机构使用.Linux下支持藏文,主要解决藏文编码的自动叠加显示和输入,扩展Linux系统级字符编码支持.(五)微软视窗藏文系统Ms—Himalaya2007年微软发布的Vista系统,采用Unieode国际标准编码的Op~nType字库技术解决了藏文小字符集排版打印外观质量问题,输入方案也采用我国藏文国家标准.OpenType技术初步解决藏文编码复杂性以及基本字符集技术在应用中动态组合所存在的问题,在基本编码字符外构造OpenType组合字形文件,用于存放可能的藏文字形(包括叠加字形),再通过字符编码与字形特征之间的映射关系来显现藏文OpenType字体.这项技术实现难度很大,却是未来藏语编码处理的主要方向.这促进了系统级藏文信息化处理的普及,目前获得不少用户.在使用过程中,也有一些问题缺陷:1.微软藏文与汉文,日文,韩文等文字混排时不美观,相对视高和大小比例不协调.2.藏文字体少,仅一种藏文标准体(白体).'.3.藏文组合叠加有一定问题,叠加超过一定层数藏文字就不太美观,甚至出现显示叠加或不全.4.Vista,win7系统要求较高的电脑硬件性能指标,较难在原硬件环境下运行.5.输入藏文过程中藏文键盘切换不太便于一般的输入操作习惯.6.藏字和M的输入组合键Alt+Ctrl+Shift+6和Alt+Ctrl+Shift+/在Word中已用于其它用途,不便输人.虽然可先在其它软件(如记事本)中输入好再复制进去,或换成别的输人组合键(如Y alasoo方案),但却无法避免这些组合键在其他应用软件中不会冲突.技术分析发现,其输入设计模式是沿用西文输入方式,直接原因是采用有技术局限的西文键盘定义工具MSKLC来生成藏文输入法所导致.五,藏文编码目前的技术应用中科院软件所的《汉藏在线翻译多媒体电子词典》可实现藏汉互查,汉藏文单词真人发音,单词都有音标,词源,解释,例句,词性变化等,并推广使用.2010年初佛教网上发布的《布谷鸟藏汉电子词典》,采用国际编码藏文字,可互查藏汉词义,收录2万多藏汉对照词条,是初步实现网页取词的实用化藏汉互译词典.藏文信息化面对互联网的机遇,但信息技术的滞后,特别是藏文字符编码不统一,造成了藏文网上信息不兼容,用户电脑要与藏文网站有同样的藏文系统才能浏览藏文,否则就是乱码.随着民族语言文化51网上藏文信息像滚雪球般增加,将来统一这些不兼容的海量信息的代价也越大.目前藏文网站虽还不算多,但呈逐年递增之势.藏文网站内容包括:新闻广播,教育,文化民俗,藏语文学习,政策,经济,农牧,藏医药,旅游,论坛,博客等内容.这里以目前访问量较大的二十多个藏文网站(截止于2011.2.10)进行统计显示,基于同元藏文和基于Ms—Himalaya的网站数量相差不大,详见表2.此外仅少部分网站藏文平台是基于班智达,藏大扩A,北大方正扩A等.表2主要藏文网站使用的藏文系统调查网站的藏调查的藏文网站网站比例文平台数雪域文化网,中国西藏信息中心妇女频道,新华网西藏频道,中国藏族信息同元网或中国西藏信息中心,卡哇坚(藏族ll47.83%藏文历史网),雪域文化(藏文版),藏农牧经济信息网(藏文版),藏大,布达拉,藏传佛教,岗坚少年报西藏藏语言文字网,中国藏学,中国藏族网通,中国西藏网,琼迈藏族文学M8一Him网,青海医院藏文网,青海省藏语广播1252 .17%alaya藏文网,西藏藏医学院,藏语学生网,中国西藏新闻网(西藏日报藏文版),西藏人民广播电台,琼迈网为解决不同藏文系统间的乱码问题,部分藏文网站还提供了不同平台的藏文编码转换软件. 从国内情况看,符合国际编码标准的藏文系统平台和藏文应用软件还较少,不符合国际编码标准的藏文网站还有待规范.六,目前藏文编码的问题与思考目前的主要问题是藏文编码的混乱.这就造成:1.用户使用不便,不同藏文平台创建的文件会出现乱码,用户只能固定使用一种平台或将文件在不同平台间转换,造成大量无谓重复劳动,该问题在网络信息时代变得更为突出:在因特网上浏览藏文时用户电脑的藏文平台必须与网站使用的藏文平台一致,否则是乱码;2.藏文编码标准不统一,不规范造成相关I,I'厂商消极观望等待,担心与标准不符,会造成大量返工和浪费,缺乏继续完善升级系统的动力;3.开发的软件和数据资料不能共享,制约后续软件的开发4.制约藏文通讯(如手机短信,彩信)技术的应用.其次,符合藏文国际编码标准基于OpenType技术的字库还不够丰富,多数藏文系统仅提供一两种字体.而藏文传统字体至少有十余种之多,它们艺术性很强,风格各异,极具藏族同胞的审美要求.不过近两年来,情况有所改观,北大方正新一代藏文系统开发了七种藏文字体:新黑体,新白体,吾坚琼体,长体,竹体,美术体,标题体.2010。
题目:uni中opentype用法一、uni的概念及作用在计算机编程中,uni是表示Unicode编码的前缀,Unicode编码是一种全球通用的字符编码标准,它包括了世界上几乎所有的文字和符号。
opentype是一种字体文件格式,它可以支持Unicode编码,并且具有丰富的排版和排版功能。
通过uni和opentype的结合使用,可以实现对Unicode编码字符的高效排版和排版效果。
二、uni中opentype的使用场景1. 多语言排版由于Unicode编码的特性,它覆盖了世界上几乎所有的语言文字,包括中文、英文、日文、韩文等。
而opentype字体支持Unicode编码,因此在多语言排版时,可以通过uni中opentype的使用实现对不同语言文字的高效排版和美观排版效果。
2. 字体特效opentype字体文件不仅支持基本的文字显示,还可以实现一些特效效果,比如阴影、镂空、渐变等。
通过uni中opentype的使用,可以实现对文字的个性化排版,让文字看起来更加生动、鲜活。
3. 大数据文本处理在大数据处理领域,对于文本的排版和排版效果也有较高的要求。
uni 中opentype的使用可以帮助处理大数据文本的排版需求,提高文本的可读性和美观性。
三、uni中opentype的技术实现1. 字体文件准备首先需要准备支持opentype格式的字体文件,在字体文件中包含了Unicode编码和字形信息。
2. 编程实现在编程中,可以通过CSS、JavaScript等前端技术来控制字体文件的加载和使用,进而实现uni中opentype的功能。
3. 排版效果调整在排版时,可以通过调整字体大小、颜色、字距等样式来实现对文字的美观排版效果,让文字显示更加清晰、美观。
四、uni中opentype的优点和局限性1. 优点(1)支持多语言排版,适用范围广泛;(2)具有丰富的字体特效,能够实现个性化排版;(3)可以满足大数据文本处理的排版需求。
Opentype技术在藏文教育网站页面显示中的实现与应用实现教育现代化,大力推进教育信息化进程是时代的要求。
已有近1400 年历史的藏文化作为这个时代藏民族文化传承的主要载体,如何通过现代科技进行传承是信息时代古老藏文化面临的挑战。
[1]基于藏汉语教学模式下的藏区要实现真正意义上的教育信息化,其关键在于能否解决好信息技术与藏文整合的问题。
随着藏文在信息技术领域的不断应用和推广,基于Web环境下的藏文教育网站在藏区基础教育领域内得到了一定的应用。
但由于藏文字结构的特殊性,目前Web环境下藏文字的排版和显示仍存在着一些问题。
一、Web环境下藏文字符的版式要求
二、目前藏文页面显示在藏文字符
处理中存在的问题
1. 目前主流的网页浏览器不支持藏文独特的排版特性
目前藏文文本无法在主流浏览器中正常显示。
Firefox 浏览器将一个没有空格的藏文字符串当作一个英文单词处理,无论这个字符串有多长,在页面上都将会显示成一行。
而在Internet Explorer浏览器中,将一个没有空格的藏文字符串当作一段中文字符串处理,也就是Internet Explorer将每个藏文字母当作一个汉字,根据汉语语法规则对藏文字符串进行处理,而不是根据藏文语法规则处理断行,违背了藏文字符书写的语法规则,造成服务器端和客户端无法正确地识别藏文字。
2. 无法解决藏文网站服务器端对藏文字符的切分
4. 藏文字体图像化带来的客户端信息检索缺失
如果藏文信息在HTML页面中已经被描述成图像信息,HTML页面通过超链接的方式把图像信息插入到当前页面中时,这种形式的文本信息与其他的图像信息没有任何区别。
但是如果文字信息有所调整或者要改变字体风格,就必须重新生成图像, 使得页面的制作过程繁琐且要使用专业的图像处理软件或者其他专用软件才能完成,制作过程不太可能自动实现。
三、Opentype技术在藏文教育网站
页面显示中的应用
OpenType字体技术是Microsoft 和Adobe共同研制的设计字形技术, 该技术在扩展TrueType 字形技术的基础上, 增加了支持PostScrip 字形的数据。
OpenType 的字形在保持TrueType 字形具有的高质量显示、自由变换字形、任意缩放字形大小等优点的基础上, 还具有支持多平台、支持国际字符集、保护字形数据、灵活的控制字体显示和字库文件更小等诸多优点。
同时, 随着OpenType 藏文字库的实现,克服了传统TTF字库文件大、编码混乱、互不兼容以及无法支持Internet藏文信息交换等缺陷。
OpenType字库技术解决了在客户端没有特定字库的情况下无法显示
一些少数民族文字或特殊字符的问题。
主要通过在网页中使用CSS层叠样式表,描述OpenType字库的信息,使用WEFT3.0(Web Embedding Font Tool)工具软件对已经制作的网页进行处理和生成OpenType字库信息的Eot文件的方法来实现。
[3]该技术的优点是: 客户端无需下载字库,显示的藏文具备网页上显示的文字信息的选择、复制和粘贴等功能,显示速度快,可以保护字库,便于网页的修改。
就目前情况来看教育网站大多数是动态网站,动态网站的内容和更新
维护是通过基于数据库技术的内容管理系统完成的。
藏文教育网站是交互性很强的应用平台,网站建设者和用户之间进行沟通交流才能提供少数民族学生和教师学习所需要的服务,才能真正实现藏文与计算机网络技术的整合,才能在藏区中小学师生的教学中得到广泛的使用。
四、Opentype在藏文教育网站
页面显示中的实现过程
一般来说,静态页面的修改需要通过人工向页面增加HTML标签实现,这对于页面规模较小的局部小型网站来说是可行的,但对具有一定学习者数量的教育网站来说,采用这种人工添加标签的方法将会耗费大量的人力与财力,所以学校教育网站主要还是采用动态页面设计。
动态页面的内容是从数据库或数据文件中提取,所有换行标签通过服务器脚本程序来自动添加。
这样既可以减少大量的人力与财力成本,又可以节省大量的时间。
对于藏文教育网站页面,Web服务器不可能知道客户端中有没有安装某种字体,服务器运行的程序也无法得到客户端字体的信息,所以在教育网站服务器上解决藏文字符动态交互问题是首要选择。
1. 藏文网站中文本数据库表的设计
在文本数据库中设计存放藏文的表有Id, Subject, Content和Datetime 四个字段,数据类型分别为自动编号、文本、备注和日期/时间,打开表后可以设置字段的字体为TIBETLi,此时数据库的表就可以自动显示藏文。
调用数据库中的此表,需要用ASP语句连接ACCESS数据库,ASP 连接数据库有几种方法, 在本文中使用的是ActiveX Data Objects(ADO)语句。
部分代码如下:
在每次连接数据库的时候都需要使用以上语句进行连接,因此可以将以上语句存为一个ASP文件,以后需要连接数据库时可以在当前页面的头部调用该语句即可。
动态交互网站和静态网站的不同之处在于静态网站文本的目录是固定的,如果需要修改就必须手动逐一修改页面的HTML语句,而动态交互网站的文本目录是直接调用数据库中表的字段,只需直接对数据库中的表进行增加、删除和修改的操作,页面的语句保持不变,就减少了工作量。
如在尖扎县第一民族中学藏文版教育网站藏文化栏目的设计中,主页面中显示文本目录就通过调用连接数据库语句即conn.asp 文档, 然后打开需要调用的表实现。
部分代码如下:
显示文章内容使用的是ASP语句,为了使该语句能够显示藏文,需要事先在ASP文档的头部(head)添加风格元素定义藏文字体类型,这样引用的藏文就可以正常地显示在页面中。
3. 藏文教育网站后台页面的管理
部分代码如下:
.p4{margin:0.25in; border:0.25in; padding:0.25in;
font-size:9pt; color: #FEF9EF; font-family:TIBETBT;
五、结语
希望以上资料对你有所帮助,附励志名言3条::
1、世事忙忙如水流,休将名利挂心头。
粗茶淡饭随缘过,富贵荣华莫强求。
2、“我欲”是贫穷的标志。
事能常足,心常惬,人到无求品自高。
3、人生至恶是善谈人过;人生至愚恶闻己过。