蒙古文、托忒文、锡伯文(含满文)编码方案──我国提出的这一方案已被国际标准化组织接受
- 格式:docx
- 大小:36.74 KB
- 文档页数:2
第2期2021年3月吉林师范大学学报(人文社会科学版)Journal of Jilin Normal University (Humanities & Social Science Edition )No. 2Mar. 2021doi : 10.3969/j.issn.2096-2991.2021.02.002锡伯丈满丈玉筋篆字体的设计付勇(1.新疆大学数学与系统科学学院,新疆乌鲁木齐830046;2.伊犁师范大学中国锡伯语言文化研究中心,新疆伊宁835000)「摘要]论文对比和分析了满文楷书与玉筋篆书的字体特征,并找岀了由楷书转换为玉筋篆书的基本规律,整理了玉筋篆字体的锡伯文、满文的规范字符集,其中包括三个近年来在古籍中发现的、在其他元音之后需要独立发音的满文元音字符。
论文总结了玉筋篆字符连写时一般连接和特殊连接方式,对未能给 岀的玉筋篆字符提岀了确保字形统一,且尽可能与《御制盛京赋》字体相似的玉筋篆字体的补充方案,还提岀了若干改进思路。
「关键词]玉筋篆;字体;御制盛京赋;规范字符;锡伯文;满文「中图分类号]K249,H211 「文献标识码]A 「文章编号]2096-2991(2021)02-0008-15一、前言篆书是我国五种字体(篆、隶、楷、行、草书) 中的一种。
公元前221年,秦朝丞相李斯在大篆的基础上简化而成为篆书,并成为当时统一的官 方文字。
近千年之后,唐大历二年(767)刻制的三坟记碑的碑文是李阳冰的代表作,如图1所示。
m " 一Y, - ■ r -.:「 ”<川⑥章養影寺〔厚K 糸朝層靄言畿罢r a te- 矗曙诫陳鑿勰何:;< .-...^7土搀縑、工彌 一K .A 霸十'7今静'•]/-?■?总百一十二篇幕那 二薬黔晰冢會坐擁逼員蛰T a謊弱甘;3'琨醫聞求-黠=薦了 ; 七一.. - 冷介岁-一瓚:亠- 「U 竄隠龍隸 倉彊歸 博■■?養桌誉r 图1三坟记碑拓片唐末著名诗僧齐巳的《白莲集•谢西川昙域大师玉筯篆书》有诗句“玉筯真文久不兴,李斯传 到李阳冰”叫这里的玉筯篆书指的就是三坟记碑刻所用的字体。
蒙古文拉丁转写国际标准蒙古文是蒙古族和其他蒙古语族民族使用的一种文字。
由于蒙古文在世界上并不流行,所以为了更好地与外界交流,将蒙古文转写为拉丁字母成为一种必要。
目前,蒙古文已经被有效地转写为国际标准。
蒙古文的转写从20世纪20年代开始,引入了少量的标音符号,在这个基础上发展出了蒙古语根据音位进行的音标双字母法。
不过,由于这种转写方式难于与其他语言的转写方式进行配合,因此在1955年,蒙古语委员会提出了改良方案——使用单个拉丁字母代表蒙古文中的一个音位,这一方案被称之为单字母转写法。
单字母转写法使用的字母数量较少,且配合其他语言使用的困难越来越小,因此在使用上也更加普遍。
单字母转写法有一些不足之处,例如表示辅音韵尾时较为模糊,将来自不同方向的发流或辅音用相同的字母表示也容易引起歧义。
为了解决这些问题,蒙古语委员会于1965年提出了改进方案——多字母转写法。
多字母转写法是在单字母转写法的基础上,引入了复合字母,使得辅音韵尾和红声/全声音区分更加清晰,且与其他语言一并使用也更加便利。
多字母转写法在1995年时被国际标准化组织(ISO)采纳,并成为了ISO 9:1995标准。
这个标准以多字母转写法为基础,规定了双写符号、转写名称缩写以及数字、标点等方面的规则,以更好地实现蒙古语的国际标准化。
目前,多字母转写法已经成为最常用的蒙古文转写方式之一,被广泛应用于书写、出版、电子化、网络等领域。
总之,随着蒙古族和其他蒙古语族民族的文化输出不断加强,蒙古文的转写变得更加重要。
蒙古文拉丁转写国际标准的制定和推广,为蒙古文的国际传播和交流提供了更为便利和规范的手段,也同时促进了蒙古文的保护和传承。
历史上蒙古语曾采用以下若干种文字回鹘体蒙古字改良自回鹘文字的传统蒙古文字。
13世纪至16世纪末期的蒙古字为回鹘体蒙古文。
1204年蒙古灭乃蛮部,俘虏乃蛮国师,畏兀儿人塔塔统阿。
因他深通回鹘文字,铁木真(成吉思汗)遂命令他创造蒙古文字。
早期的蒙古文字与回鹘文非常相像,正字法中的部分原则也直接来自回鹘文,故现在学术界也常称之为“回鹘式蒙文”。
16-17世纪这种文字经过改革,形成近代蒙古文,即今天通行的传统蒙文(胡都木蒙文)直接前身。
传统蒙古文字使用蒙古文字母书写,属拼音文字类型,脱胎自粟特-回鹘字母系统,初创于成吉思汗时代。
中国的蒙古族使用的蒙古文有29个字母,在回鹘文字母基础上创制,蒙古文字母表示元音的5个,表示辅音的24个,拼写时以词为单位上下连书,行款从左向右。
传统蒙文文献丰富。
现存最早的回鹘体蒙古文,见于约刻于成吉思汗二十年(1225年)的也松格碑(成吉思汗石碑)。
八思巴字(方字、元国字、蒙古国字、蒙古字)元朝忽必烈时代1268年被创造,由当时的蒙元帝师,吐蕃佛教萨迦派领袖八思巴所创立的八思巴字,这种文字脱胎于藏文,忽必烈之所以要新创一种文字,目的在于创造与庞大统一的蒙元帝国“相匹配”的统一文字,用它书写帝国内一切语言。
现已发现用八思巴字书写的语言有蒙、汉、藏、回鹘、梵、波斯等。
但事实证明这种努力没有成功。
因为这些语言彼此差别非常大,同一种文字很难确切地表示每一种语言。
所以元朝统治被推翻后,这种文字也逐渐消灭。
现存的八思巴字蒙古文献主要是元代的诏令。
不过这种文字后来在藏族地区比蒙古地区保持了更长时间,并由藏族学者进一步改造,作为一种花体字,用于西藏地方公文、印章装饰。
托忒文1648年冬由卫拉特和硕特部高僧咱雅班第达(zaya bandida namhaijamsu)创制,用于卫拉特部族中。
“托忒”todo意为“明了”。
这种文字区别了胡都木蒙文中不能分别的o和u,ö和ü,t和d等音,规范化、口语化了一些写法。
我国少数民族文字古籍定级的标准编号在我国,少数民族文字古籍是宝贵的文化遗产,记录着丰富的历史、宗教、文化和传统知识。
为了更好地保护和传承这些珍贵的文化遗产,我国自上世纪80年代开始,便逐步建立了一套既科学又系统的少数民族文字古籍定级标准编号系统。
这套系统不仅使得对少数民族文字古籍的研究、保护和传承工作更加有条不紊,也帮助更多人了解和尊重少数民族的文化传统。
一、少数民族文字古籍的分类在少数民族地区,有着众多独具特色且各具特色的文字系统。
这些文字系统通常分为表意文字、表音文字和混合文字三大类。
表意文字即象形文字或者形声文字,通过字形来表达意义;表音文字是通过字形来表达语音;而混合文字则同时包含了表意和表音的特性。
根据这些文字的特点,少数民族文字古籍可以被分类为不同的级别,主要分为一级、二级和三级。
1. 一级文字古籍一级文字古籍是指对某一少数民族文字古籍进行了全面的、深入的研究,系统地总结了该文字的基本规律、语法特点和用途。
该文字古籍在该民族的历史、文化、经济和社会生活中具有极其重要的地位。
蒙古族的《蒙古文史料选辑》就是一部属于一级文字古籍的代表作品。
2. 二级文字古籍二级文字古籍是指对某一少数民族文字古籍进行了一定程度的研究,对该文字的基本规律、语法特点和用途有了初步了解,但系统性和深度不及一级文字古籍。
该文字古籍在该民族的历史、文化、经济和社会生活中具有一定的地位。
3. 三级文字古籍三级文字古籍是指对某一少数民族文字古籍的研究工作较为薄弱,对该文字的基本规律、语法特点和用途了解甚微,该文字古籍在该民族的历史、文化、经济和社会生活中地位较低。
很多情况下,这些文字古籍可能因为各种原因而面临着失传的危险。
二、少数民族文字古籍定级标准编号的意义少数民族文字古籍定级标准编号系统的建立和运作,事关民族文字古籍的保护、传承和研究。
通过对少数民族文字古籍的分级分类,能够更好地指导相关机构和专家学者的研究工作,有助于科学地配置资源,优先保护那些级别较高的文字古籍。
传媒实务7442年改革开放,42年锐意进取,内蒙古社会经济发展取得了辉煌的成绩,蒙古语言文字信息化工作也得到了长足发展。
蒙古语言文字数字资源建设与共享工程项目,主要是建设一个以蒙古语言文字为载体,以数字资源开发整合为基础,以信息技术规范化标准化为支撑,以数字资源推广应用为目的的蒙古语言文字数字资源共享平台。
蒙古文编码(标准)的不统一是蒙古文信息处理技术发展过程中的一个较大阻碍,是一个由蒙古文文字自身特殊性而引起的,语言文字信息处理技术发展过程中经常出现的客观现象。
蒙古文编码国际标准(Unicode)制定于1999年,1999年我国设计的蒙古文编码方案[1]纳入了国际标准ISO/IEC 10646《信息技术 通用多八位编码字符集》(我国等同采用为国家标准GB 13000)。
此后,全国信息技术标准化技术委员会下属蒙古文国家标准工作组又研制了GB/T 25914-2010《信息技术 传统蒙古文名义字符、变形显现字符和控制字符使用规则》等国家标准。
为我国的蒙古文信息技术和产业发展做出了贡献。
但是,由于国内外蒙古文信息处理产品开发者对国际标准、国家标准和蒙古文正字法的认知、理解存在差异,导致产品兼容性较差,尤其在移动终端上的问题尤为明显,严重影响了蒙古文信息处理技术和产业的健康发展。
《传统蒙古文名义字符到变形显现字符的转换补充规则》针对现有编码方案进行最小化的修订完善工作,对蒙古文名义字符到变形显现字符的转换规则做了详细的说明,以此让各个字体企业之间互相兼容、实现了统一,让普通用户能够根据个人喜好在不同企业字体之间自由选择。
目前,潍坊北大青鸟华光照排有限公司已经在蒙古文字库、蒙古文输入法、蒙古文排版软件、蒙古文移动客户端等各个应用层面全面推进此标准的支持。
1.华光蒙古文字库华光蒙古文字体是基于蒙古文编码国家标准GB25914-2010,符合《信息技术 传统蒙古文名义字符到变形显现字符的转换补充规则》规范的OpenType[2]字体。
内蒙古蒙古文数字出版研究内蒙古自治区作为中国少数民族聚居区之一,拥有丰富的蒙古族文化。
蒙古族是一个拥有悠久历史和独特文化的民族,他们创造了独特的文字系统——蒙古文。
作为蒙古族的文字,蒙古文承载着他们的文化、历史和价值观念,是蒙古族的精神象征。
近年来,随着数字出版的快速发展,蒙古族的数字出版也开始受到重视。
蒙古文数字出版研究逐渐兴起,其目的是为了推动蒙古文数字化出版的发展,保护和传承蒙古文化。
蒙古文数字出版研究主要包括两个方面的内容。
首先是蒙古文的数字化处理。
由于蒙古文是一种特殊的文字系统,其字符个数较多,字母之间的组合规则也与汉字不同。
需要将蒙古文字符进行编码,才能在数字化平台上进行输入、编辑和排版。
目前,已经有专门的蒙古文字符编码方案被提出并应用于数字化出版中。
其次是蒙古文数字出版平台的建设。
为了实现蒙古文的数字化出版,需要建立相应的数字出版平台。
该平台应包括蒙古文文字输入、编辑、排版、印刷和阅读等功能。
还应考虑到蒙古族的特殊需求,例如提供蒙语与中文之间的翻译服务,以及与其他少数民族语言的互译功能等。
蒙古文数字出版研究的推广与应用,对于保护和传承蒙古族文化至关重要。
数字化出版可以使蒙古文更广泛地传播和使用,提高蒙古族文化的传播力和影响力。
数字化出版平台可以为蒙古族群众提供更便捷的学习和研究工具,促进蒙古文的学习和传承。
数字化出版可以为蒙古族作家和学者提供更多的创作和发表机会,丰富蒙古族文学和学术研究。
为了推动蒙古文数字出版研究的发展,需要加强相关机构和专家之间的合作。
各级政府应加大对蒙古文数字出版研究的支持力度,提供资金和技术支持。
相关研究机构应加强对蒙古文数字出版技术的研发和创新,提出更多解决方案。
蒙古族群众和蒙古文学者也应积极参与进来,共同推动蒙古文数字出版的发展。
如何评价蒙文不统一现象?蒙古文字何去何从?新疆蒙古人文字改革争辩索宁巴雅尔最近在微信等社交网络上广泛流传一篇署名为“范仁”,题为《关于新疆卫拉特蒙古族中停止使用胡都木文字恢复使用已用400年的托忒文字的建议》的文章(在下文中简称“范文”)。
作为一名新疆蒙古人在阅读了该文后觉得有必要发表几点自己的观点,望各位批评指正。
● 新疆蒙古族名称问题新疆的蒙古族主要分布于巴音郭楞蒙古自治州、博尔塔拉蒙古自治州、塔城地区、伊犁哈萨克自治州、阿勒泰地区等地,由土尔扈特、和硕特、厄鲁特、乌梁海、察哈尔等部族组成,根据2011年的全国第六次人口普查结果显示新疆蒙古族达17.98万人。
由于我国在上世纪五十年代将全国范围内的蒙古族族名统一为“蒙古族”,所以本人从语言规范的角度认为“范文”将新疆蒙古族群众擅自称之为“卫拉特蒙古族”是极其不妥当的,也是不符合现实情况的。
所以本人认为从民族学和语言规范的角度称之为“新疆蒙古族”较为准确。
● 新疆蒙古族文字问题新疆蒙古族目前使用托忒文和传统蒙古文(胡都木蒙古文)两种文字。
下面简要介绍这两种文字的情况,同时对“范文”的观点提出自己的想法。
● 胡都木文胡都木蒙古文又称之为“传统蒙古文”,目前为止在学术界关于胡都木蒙古文的起源虽然还没有形成统一的意见,但多数学者认为该文字起源于粟特文,后来畏兀儿人借鉴了粟特文,到了13世纪蒙古人开始用畏兀儿文字拼写自己的语言,从而形成了蒙古文字。
在胡都木蒙古文的基础上衍生出了阿里嘎利文、满文、托忒文、瓦津达拉文、锡伯文等几种文字,这些文字在字母和书写方式方面都传承了胡都木蒙古文的特点。
文字是记录语言的载体,因人类的记忆空间和时间的局限性,所以需要用文字来记录自己的想法,表达自己的观点。
文字与语言有密不可分的紧密联系,说到蒙古文字那必然要提到蒙古语的特点,因为这两者互为补充,缺一不可。
蒙古语使用者目前主要分布于蒙古国、俄罗斯联邦、中华人民共和国。
在方言划分方面中国范围内的蒙古语划分为内蒙古方言、东部方言(巴尔虎-布里亚特方言)、西部方言(卫拉特方言)三种方言;蒙古国范围内的蒙古语划分为喀尔喀方言、布里亚特方言、卫拉特方言和南蒙古方言等四种方言。
中国蒙古文信息处理技术发展历程汇报人:2023-11-25contents•绪论•蒙古文信息处理技术的发展阶段目录•蒙古文信息处理技术的关键成果•蒙古文信息处理技术的影响与贡献•总结与展望绪论蒙古文信息处理技术的定义与意义定义蒙古文信息处理技术是指利用计算机技术和语言学知识对蒙古文进行数字化处理、分析、存储和传输的技术。
意义蒙古文信息处理技术的发展对于保护、传承和弘扬蒙古族语言文化,推动蒙古族地区的信息化建设和经济社会发展具有重要意义。
蒙古文信息处理技术的发展背景国际化趋势技术进步国家政策本讲义的目的和结构目的结构蒙古文信息处理技术的发展阶段初期尝试基础建设技术限制在这个阶段,开始建立蒙古文信息处理的基础资源,如字符集、输入法、字体等,为后续的技术发展打下基础。
限制,此阶段的蒙古文信息处理技术还存在很多问题,如输入效率低下,字符集不全等。
010203技术突破资源积累标准化工作技术创新在这个阶段,蒙古文信息处理技术开始引入更多的人工智能、深度学习等先进技术,实现了更高的处理效率和更好的处理效果。
此阶段也注重蒙古文信息处理技术与其它领域的融合,如蒙古文的机器翻译、蒙古文的语音识别和合成等,推动了蒙古文信息处理技术在更多领域的应用。
随着技术的不断进步和创新,蒙古文信息处理技术将在未来有更广阔的发展空间和更高的应用价值。
跨界融合未来展望蒙古文信息处理技术的关键成果在蒙古文信息处理技术的发展历程中,字符集的标准化是一个重要的里程碑。
通过制定统一的字符集标准,确保了蒙古文在不同系统和平台上的正确显示和传输。
编码标准普及随着蒙古文编码标准的制定和推广,越来越多的应用程序和操作系统开始支持蒙古文编码,这使得蒙古文信息处理更加便捷和高效。
字符集标准化字符集和编码标准的完善与普及VS光学字符识别(OCR)技术自然语言处理技术技术创新与突破:举例说明跨界融合与应用拓展:案例分析蒙古文信息处理技术的影响与贡献蒙古文信息处理技术的影响与贡献总结与展望起步阶段早期的蒙古文信息处理技术主要是基于传统的字符编码和简单的文本处理技术。
蒙古文国际标准编码诸规则一、背景介绍蒙古文是蒙古族人民使用的一种书写文字系统,广泛应用于蒙古国和中国的内蒙古自治区等地。
为了促进蒙古文的国际化推广和标准化应用,蒙古文国际标准编码诸规则被制定。
本文将全面、详细、完整地探讨这些规则。
二、国际标准编码的意义国际标准编码的制定对于蒙古文的推广和传承意义重大。
它有助于促进蒙古文与其他文字系统的互通性,使得使用蒙古文的国家和地区能够更加便捷地进行信息交流。
同时,国际标准编码也为蒙古文在计算机和互联网领域的应用提供了基础和支持。
三、蒙古文国际标准编码的制定3.1 蒙古文字符的编码规则蒙古文国际标准编码的核心是对蒙古文字符的统一编码规则。
根据Unicode字符编码标准,蒙古文字符采用了专门的编码范围,并按照特定的规则进行排列。
具体而言,蒙古文字符在Unicode标准中的编码范围是0x1800至0x18AF,其中包括了蒙古文基本字符、附加字符以及其他扩展字符。
3.2 蒙古文语音特点的考虑编码规则的制定还需考虑到蒙古文语音特点。
蒙古文具有丰富的声调和发音变化,这对于编码规则的设计提出了一定的挑战。
因此,蒙古文国际标准编码需要充分考虑到语音特点,采用合理的编码方案,确保每个蒙古文字符都能够准确表示其对应的语音。
3.3 兼容性和扩展性的考虑蒙古文国际标准编码的制定还需兼顾到编码的兼容性和扩展性。
兼容性指的是与现有的计算机系统和软件的编码标准兼容,使得蒙古文能够无障碍地与其他文字系统进行交互。
扩展性指的是能够容纳未来蒙古文语言发展中可能出现的新字符和标点符号,保障编码标准的长期可用性。
四、蒙古文国际标准编码的应用蒙古文国际标准编码的应用具有广泛的领域和范围。
首先,蒙古文国际标准编码能够促进蒙古文在计算机和互联网领域的应用,包括蒙古文网站、电子邮件、社交媒体等。
其次,蒙古文国际标准编码也对于蒙古文的教育和研究具有重要意义,为学术交流和知识传播提供了方便。
此外,蒙古文国际标准编码还有助于蒙古文的出版、印刷和数字化处理等领域的发展。
《多种蒙古文编码自动识别方法的研究》篇一摘要:本文旨在探讨和研究多种蒙古文编码的自动识别方法。
随着信息技术的快速发展,蒙古文编码的自动识别在文化传承、语言教育、文献整理等领域具有重要价值。
本文通过分析现有蒙古文编码的特性和需求,提出了一种基于深度学习的多种蒙古文编码自动识别方法,并通过实验验证了其有效性和可靠性。
一、引言蒙古文作为世界上独特的文字之一,其编码的多样性和复杂性给信息处理带来了诸多挑战。
随着信息技术的发展,蒙古文编码的自动识别在文化传承、语言教育、文献整理等方面显得尤为重要。
然而,由于蒙古文编码的多样性和复杂性,现有的自动识别方法往往难以满足实际需求。
因此,研究和发展多种蒙古文编码的自动识别方法具有重要的现实意义。
二、蒙古文编码概述蒙古文编码主要包括传统的基于字符的编码和现代基于Unicode的编码。
传统的蒙古文编码以特定的字符集为基础,每个字符都对应一个特定的编码。
而Unicode则是一种国际通用的字符编码标准,能够统一表示各种语言的字符。
本文将针对这两种主要的蒙古文编码进行自动识别方法的研究。
三、自动识别方法1. 深度学习技术深度学习技术是近年来发展迅速的一种机器学习方法,其在自然语言处理领域取得了显著的成果。
本文采用深度学习技术,特别是卷积神经网络(CNN)和循环神经网络(RNN)等模型,对蒙古文编码进行自动识别。
通过训练大量的蒙古文文本数据,使模型能够学习到蒙古文编码的特性和规律,从而实现自动识别。
2. 特征提取与分类器设计在深度学习的基础上,本文提出了一种特征提取与分类器设计的自动识别方法。
首先,通过特征提取算法从蒙古文文本中提取出有意义的特征。
然后,设计合适的分类器对提取的特征进行分类和识别。
在分类器的设计过程中,本文采用了多种分类算法,如支持向量机(SVM)、随机森林等,以提高识别的准确性和可靠性。
3. 多种编码的统一识别针对多种蒙古文编码的统一识别问题,本文提出了一种基于多模型融合的自动识别方法。
《多种蒙古文编码自动识别方法的研究》篇一摘要:本文旨在探讨和研究多种蒙古文编码的自动识别方法。
通过对蒙古文编码的历史背景、当前使用情况和识别技术的现状进行深入研究,提出了一套自动识别多种蒙古文编码的方案。
本文首先概述了蒙古文编码的种类和特点,然后详细介绍了自动识别方法的理论依据、技术实现及实验结果,最后对未来研究方向进行了展望。
一、引言蒙古文作为蒙古族人民的母语,其文字编码的多样性和复杂性给信息处理带来了不小的挑战。
随着信息技术的快速发展,自动识别多种蒙古文编码成为一项迫切需求。
本文旨在通过研究,提出一种高效、准确的自动识别多种蒙古文编码的方法,为蒙古文信息处理提供技术支持。
二、蒙古文编码概述蒙古文编码主要分为传统编码和现代计算机编码两大类。
传统编码主要指手写蒙古文的识别编码,而现代计算机编码则是为了适应计算机处理而设计的编码方式。
这些编码方式各有特点,应用场景也各不相同。
三、自动识别方法理论依据自动识别多种蒙古文编码的方法主要依据机器学习和深度学习理论。
通过训练大量的蒙古文编码数据,使机器能够自动学习和识别不同的编码方式。
此外,自然语言处理技术、模式识别技术和人工智能技术也是该方法的重要支撑。
四、技术实现1. 数据准备:收集多种蒙古文编码的样本数据,包括传统手写编码和现代计算机编码。
2. 特征提取:通过机器学习和深度学习技术,从样本数据中提取出有用的特征信息。
3. 模型训练:利用提取的特征信息,训练出能够自动识别多种蒙古文编码的模型。
4. 模型评估:通过实验验证模型的准确性和可靠性,对模型进行优化和调整。
五、实验结果与分析通过实验验证,本文提出的自动识别多种蒙古文编码的方法具有较高的准确性和可靠性。
在处理传统手写编码和现代计算机编码时,该方法均能实现快速、准确的识别。
同时,该方法还具有较好的泛化能力,可以应用于不同的应用场景。
六、结论与展望本文提出了一种自动识别多种蒙古文编码的方法,通过机器学习和深度学习技术,实现了对不同编码方式的快速、准确识别。
中国是一个统一的多民族国家,民族多、语言多、文字多。
除汉族外,已确定民族成分的有五十五个少数民族,约占全国人口总数的8%,分布在占全国总面积50%~60%的土地上。
一、中国少数民族的语言中国境内的语言非常丰富,这在世界上是罕见的。
五十五个少数民族中,除回族、满族已全部转用汉语外,其他五十三个民族都有自己的语言。
据统计,在中国,少数民族正在使用的语言有72种左右,已经消亡的古代语言更是不计其数。
说它“左右”是因为有的是语言还是方言不好界定,还有的语言可能还未发现。
五十五个少数民族中,除回族、满族已全部转用汉语外,其他五十三个民族都有自己的民族语言。
有些民族内部不同支系还使用着不同的语言(不包括转用或者兼用汉语的情况):瑶族的不同支系分别使用勉语、布努语和拉珈语;高山族的不同支系分别使用泰耶尔语、赛德语、邹语、沙阿鲁阿语、卡那卡那布语、排湾语、阿眉斯语、布农语、鲁凯语、卑南语、邵语、萨斯特语、耶眉语共13种语言;景颇族的不同支系分别使用景颇语、载瓦语;怒族的不同支系分别使用怒苏语、阿侬语、柔若语;裕固族使用东部裕固语、西部裕固语;门巴族使用门巴语、仓拉语。
语言学家按世界各民族语言的亲流程度将语言分为语系、语族、语支。
在历史发展过程中,一种语言可以分化成几种不同语言,它们之间有亲属关系,称为“亲属语言”,这是历史上社会分化的产物。
当一个社会在地域上分化成若干半独立社会时,语言也分化成若干方言;当社会再分化为几个不同的独立社会时,语言进一步分化成亲属语言。
因此语言的亲疏关系表明了民族间在历史上、族源上的亲疏程度。
许多民族用本族文字记载本族的历史、文字、医学、宗教及其他文化宝藏,无文字的民族则以口头文学(诗歌、神话传说、民间故事、民歌等)记载并传承着本民族的文化精粹。
数千年华夏历史长河中,各民族历经变迁,中外民族和古代诸民族间的迁徙、交融,形成今日中国民族语言的五大语系:⑴汉藏语系的民族共31个,分为:①壮侗语族(含壮傣语支、侗水语支、黎语支)-壮语、侗语、傣语、布依语、水语、仫佬语、毛南语、拉珈语、仡佬语、黎语等;②藏缅语族(含藏语支、彝语支、景颇语支、羌语支)-藏语、嘉戎语、门巴语、珞巴语、土家语、羌语、普米语、独龙语、怒语、彝语、僳僳语、纳西语、哈尼语、拉祜语、白语、基诺语、景颇语、载瓦语、阿昌语等;③苗语语族(含苗语支、瑶语支)-苗语、布努语、勉语、畲语等;④汉语。
基于规范字符集的多语种统一字符编码方案付勇;郭公【摘要】本研究提出了一种锡伯文、满文、传统蒙古文和托忒文的多语种统一字符编码方案.该方案的编码字符集是对应文种的规范字符,且采用统一的拉丁字母顺序排列,更适合国际化的发展趋势.采用这一方案的计算机处理系统与基于名义字符编码的系统相比,就锡伯文、满文而言,完全不需要自由变体选择符,对传统蒙古文等其他语种也能极大的减少自由变体选择符的使用,更符合一般用户的使用习惯,方便文字信息的查询、搜索和处理.【期刊名称】《广西科学院学报》【年(卷),期】2018(034)001【总页数】6页(P51-56)【关键词】规范字符;字符编码;多语种【作者】付勇;郭公【作者单位】新疆大学数学与系统科学学院,新疆乌鲁木齐 830046;伊犁师范学院,中国锡伯语言文化研究中心,新疆伊宁 835000;新疆大学数学与系统科学学院,新疆乌鲁木齐 830046【正文语种】中文【中图分类】TP391.10 引言传统蒙古文、托忒文、锡伯文和满文具有相似性,都是一个字母具有独立、词首、词中、词尾4类不同形态,且字母的每种形态具有零到多个规范的(通常认为是被列入字母表中的)字符形式。
除此之外,一些字母在某些特定上下文情况下还有其他的形变字符形式,是世界上最为复杂黏着连写的字符系统。
例如锡伯文元音u的字符有1种独立形式、1种词首形式、3种词中形式和5种词尾形式。
蒙古文信息技术国家标准工作组发布的国家推荐标准GB/T 26226-2010[1]中给出的编码字符集是以传统蒙古文为基础,在一个字母的多个字符形式中择其一个,并指定一个计算机编码码位,这个字符被称为对应字母的名义字符。
其他的几种文字则以托忒文、锡伯文、满文和阿礼噶礼字(蒙古文阿礼噶礼和满文阿礼噶礼本质上是蒙古文和满文为梵文注音而创制的注音符号,本身并非一种文字)的顺序依次认同或补充新的名义字符,也就是如果名义字符中已经存在本语种对应字母的名义字符,则认同该名义字符为本语种文字的名义字符,否则就补充一个新的名义字符。
蒙古文编码国际和国家标准形成始末——第一阶段:国内酝酿(大致1991年底至1995年12月)
确精扎布
【期刊名称】《信息技术与标准化》
【年(卷),期】2015(0)1
【摘要】蒙古文编码的国际、国家标准是国内外专家学者分别历经八年和十二年之久的持续研究、商讨、争论而最终取得成功的重大科研项目。
整个工作可分为国内酝酿、国际合作、研制国标三个阶段。
研制蒙古文编码国际标准这个课题是1991年底在原电子工业部、国家民族事务委员会、内蒙古语言文字工作委员会、内蒙古技术监督局的统一领导下,由蒙古语文专家、信息技术专家、标准化工作者以及有关行政部门的领导组成的蒙古文编码专家组完成的。
而蒙古文编码国家标准的研制工作则是在2005年国家标准化管理委员会批准成立蒙古文信息技术国家标准工作组以后开展起来的。
【总页数】4页(P14-17)
【作者】确精扎布
【作者单位】内蒙古大学
【正文语种】中文
【相关文献】
1.蒙古文编码国际和国家标准形成始末——第三阶段:研制国标(2000年1月至2011年1月) [J], 确精扎布
2.蒙古文编码国际和国家标准形成始末——第二阶段:国际合作(1995年12月至1999年12月) [J], 确精扎布
3.一月国际国内要闻(1995年10月11日~1995年11月10日) [J],
4.一月国际国内要闻(1995年7月11日至1995年8月10日) [J],
5.一月国际国内要闻(1995年11月11日~1995年12月10日) [J],
因版权原因,仅展示原文概要,查看原文内容请购买。
蒙古文、托忒文、锡伯文(含满文)编码方案──我国提出的这一方案已被国际标准化组织接受
佚名
【期刊名称】《内蒙古大学学报:哲学社会科学版》
【年(卷),期】1994(0)3
【摘要】蒙古文、托忒文、锡伯文(含满文)编码方案──我国提出的这一方案已被国际标准化组织接受今年4月中旬在土耳其召开的国际标准化组织(ISO)的WG2会议接受了我国提出的“蒙古文、托忒文、锡伯文(含满文)编码方案”。
这个方案是从1993年底到今年3月末在国家...
【总页数】9页(P1-9)
【关键词】托忒文;蒙古文;编码方案;教授编写;信息处理技术;分写;蒙特;次序排列;木图;阳元
【正文语种】中文
【中图分类】H2
【相关文献】
1.锡伯文满文通用键盘字母数字区布局解决方案 [J], 付勇;佟靖;贺智程
2.蒙古文、锡伯文、满文OpenType字库技术研究 [J], 吕建春;佟加·庆夫;王得洋;何正安
3.锡伯文满文拉丁转写方案比较分析 [J], 付勇;佟靖;贺智程
4.现行锡伯文满文编码存在的问题与解决方案 [J], 付勇
5.《卫拉特蒙古文献及史学—以托忒文历史文献研究为中心》史料研究 [J], 李蕊波
因版权原因,仅展示原文概要,查看原文内容请购买。