藏文拉丁转写方案
- 格式:doc
- 大小:42.00 KB
- 文档页数:4
汉字拉丁化二字母法新文字方案
汉字拉丁化二字母法新文字方案:
一、定义
汉字拉丁化二字母法是指将汉字转换为对应的英语字母,并由此创建
出一种兼容汉语和英语的新文字方案。
它的目的是使英语语言的用户
可以更容易地掌握汉语,同时也让汉语用户可以更容易使用英语。
二、具体实现
汉字拉丁化二字母法是将汉字发音转换为相应的英语字母,以写出一
种能够在汉语和英语之间对应的、汉语发音对应英语字母的新文字方案。
具体的实现方式分为三部分:
1. 单音节汉字:将汉字转换为与其发音相对应的大写英文字母,一般
情况下,单音节汉字将转换为单字母,如“元”将转换为“Y”。
2. 多音节汉字:将汉字转换为与其发音对应的双字母组合,多音节汉
字将转换为双字母,如“必”将转换为“B-I”。
3. 声母:汉字拉丁化二字母法中的声母使用音素法来表示,声母有“b”“p”“m”“f”“d”“t”“n”“l”“g”“k”“h”等,多音节汉字的发音首先是声母,之后是韵母。
三、结束
汉字拉丁化二字母法是一种更易于掌握的文字方案,可以帮助英语用户更好地理解汉语,也能让汉语用户更好地使用英语。
未来,伴随着科技、特别是计算机技术的发展,汉字拉丁化二字母法将会在华文传播中发挥越来越多的作用。
汉字拉丁化方案汉字拉丁化方案引言汉字拉丁化是一种将汉字转换为拉丁字母表的方案,其目的是为了方便在国际交流、信息处理和计算机输入输出等方面使用汉字。
汉字作为一种象形文字,其复杂的构造和数量众多的字形给拉丁化带来了一定的挑战。
本文将介绍几种常见的汉字拉丁化方案,并讨论其优缺点以及应用场景。
拼音方案拼音方案是最为常见的一种汉字拉丁化方案。
它通过用拉丁字母来表示汉字的发音,以构建一种简单直观的拼音系统。
目前最为广泛使用的拼音方案是汉语拼音方案,它由国家标准化管理委员会规定,并于1958年正式公布。
汉语拼音方案使用26个字母(包括a-z)来表示21个声母和36个韵母,并通过一些特殊符号来表示声调。
**优点:**- 简单易学,符合拉丁字母表的规范。
- 适用于语言学研究、教育和计算机输入输出等方面。
**缺点:**- 无法准确表达汉字的字形和意义,容易引起歧义。
- 存在多音字和同音字的问题,使得理解和使用时容易产生困惑。
拼音方案的应用场景非常广泛,特别是在语言学、教育和计算机输入法中。
无论是中文学习者还是外国人,通过学习拼音方案,都可以更方便地了解和使用汉字。
注音符号方案除了拼音方案外,还有一种常用的汉字拉丁化方案是注音符号方案。
注音符号是台湾推广的一种音标符号,它通过注音符号来表示汉字的读音,并配以相应的符号来表示声调。
注音符号方案在台湾地区被广泛使用,并且在一些中文输入法和字典中也有使用。
**优点:**- 可以较为准确地表示汉字的读音和声调。
- 使用方便,适合作为输入法方案。
**缺点:**- 注音符号方案只适用于台湾地区,国内使用较少。
- 注音符号方案无法直接表示汉字的字形和意义。
注音符号方案主要适用于台湾地区的教育和输入法场景。
在这些场景中,通过注音符号可以较为准确地表示汉字的读音和声调,方便学习和输入。
数字拼音方案数字拼音方案是一种特殊的汉字拉丁化方案,它通过将汉字拼音转换为数字的方式表示。
这种方案主要用于计算机输入法和信息处理中,可以简化对汉字的处理和存储。
汉字转写方案1. 概述汉字转写是指将汉字用外文(通常是拉丁字母)拼写出来的一种方法。
汉字转写方案的设计旨在将中文的发音转换为外文拼音,以方便外国人学习、拼读和理解汉字。
2. 历史背景在与世界交流日益频繁的现代社会中,汉字转写成为了必不可少的工具。
在中国古代,人们使用音韵书籍记录了汉字的发音规律,但直到近代才真正出现了汉字转写的系统化方案。
自19世纪末20世纪初开始,一系列的汉字转写方案应运而生,成为了国际上交流中使用的主要工具。
3. 汉字转写方案的分类根据使用的拉丁字母的不同,汉字转写方案可以分为不同的类型。
以下是一些常见的汉字转写方案:3.1 Wade-Giles(韦氏拼音)Wade-Giles是最早出现的汉字转写方案之一。
由英国传教士托马斯·韦德和赫伯特·吉尔斯于19世纪末提出。
这一方案使用了大量的音标符号,并且与汉语音韵并没有直接的对应关系。
3.2 Pinyin(拼音)拼音是中国政府于1958年制定的官方汉字转写方案。
拼音方案使用了较少的音标符号,便于学习和使用。
拼音方案与汉语音韵有一定的对应关系,方便外国人学习和拼读汉字。
3.3 Bopomofo(注音符号)Bopomofo是台湾地区常用的汉字转写方案。
它使用了一系列特殊的注音符号,可以准确地表示汉字的音韵。
Bopomofo在台湾教育系统中被广泛应用,并且也在汉字输入法中使用。
3.4 Jyutping(粤拼)粤拼是广东话(粤语)的汉字转写方案。
它使用了拉丁字母和一些特殊符号来表示广东话的发音,方便外国人学习和使用粤语。
4. 不同汉字转写方案的应用不同的汉字转写方案在不同的国家和地区具有不同的应用。
以下是一些典型的应用示例:•Wade-Giles方案主要用于早期的西方学术研究和书籍中。
•拼音方案成为了中国大陆和许多国际场合中最主要的汉字转写方案,如在中国大陆的教育系统、商务交流和外国人学习汉语等方面。
•Bopomofo方案主要应用于台湾地区的教育系统和媒体。
藏文拉丁转写方案藏文拉丁字母转写是指将藏文字母转换成拉丁字母,从而使藏语罗马化的文字转写方法。
在国内外有各种各样的转写方案。
在此介绍现在国内外较通用的威利(Wylie)转写方案。
(注,在威利方案中三十个辅音字母的第六组第三个字母(第23个辅音字母)用的是' ,而在此用字母v)转写方案:(对应关系)(1)辅音字母(2)元音转写时以藏文书写顺序,把藏文的每一个字符转换成相应的拉丁字母。
也就是说将把一个字按它的基字(ming gzhi)、元音(dbyngs)、前加字(sngon vjuk)、后加字(rjes vjuk)、再后加字(yang vjuk)、上加字(mgo can)、下加字(vdogs can)按手写顺序拆成其相应拉丁字母的方法。
切记必须按照正确的手写顺序拆字。
如:吐蕃,转写为bod;拉萨,转写为lha sa;安多,转写为a mdo;康巴,转写为khms pa;卫藏,转写为dbus gtsang;雪域,转写为gnags ljongs;扎西,转写为bkra shis;转写方法详解:对于一个字儿,(1)如果不含有元音字母,那么转写时需要将在基字对应的拉丁字母后面加一个a;如果含有元音字母,那么在基字后面不需要加a,可以理解成用元音替代了字母a(2)如果含有上加字,那么转写时需要把其对应的拉丁字母写在基字对应的拉丁字母前(完全符合手写顺序);如果含有后加字、再后加字,那么后加字对应的拉丁字母写在基字对应的拉丁字母后,再后加字对应的拉丁字母跟在后加字之后(完全符合手写顺序);如果含有下加字,那么下加字对应的拉丁字母要写在基字对应的拉丁字母后。
如果其下加字不含有元音字母,那么在下加字对应的拉丁字母后面需要加一个a,如果含有元音字母,那么元音字母对应的拉丁字母跟在下加字对应的拉丁字母后。
(3)如果其前加字是第三个辅音(g),而其基字是第六组第四个字母,即第24个辅音字母(y)时,需要在g和y之间加一个点(.)否则会有混淆的。
自己整理的藏语入门知识主题一:藏语与汉字的关系藏文有头字声母表以及对应罗马字读音剑桥中国古代史一汉藏同源词对照表藏语自7世纪起有文字,由30个辅音字母和5个元音字母组成。
语言研究者也常常使用拉丁字母来转写藏语,较通行的一个方案是于道泉设计的,只使用26个拉丁字母,不用附加符号。
藏语属于汉藏语系,所以藏语和汉语之间存在并不遥远的关系,两种语言来自同一原始语。
估计是西兀前4000年到6000年左右。
藏文保留了上古汉语的古音,包括复杂的复辅音。
藏语和汉语之间存在很多同源词。
但由于汉语经历因许多语音变化,特别是历史上方游牧民族的融入,不能直接把现今普通话的发音用来进行比较,必须运用上古汉语的构拟。
比如藏语的数字作为基础词汇和汉语上古音类似,构成同源词。
图为数字作为同源词在上古汉语与藏语数字间的类似性。
还有一些汉藏语系的基础词也具有类似性(见右图剑桥中国古代史79页)。
其他还比如,江,汉字上古音【Kroong】,藏语【Klung】;水,汉字上古音【0 iuI】;藏语【chhu.】。
然而,汉语和藏缅语之间有共同的数词一至十,但"千"和"万"却各并不相同,而在汉语中,"千"和"万"在殷商时期就已经出现,那么汉语与藏缅语与的分化必定早于殷商时期。
语言学家们大致推断,这个时间距今约4000-5000年左右。
除此以外,汉语的基础词方向名词"东南西北"也与其他任何汉藏语系支系不同,也出现最早,且不晚于殷商时期。
藏文保留了上古汉语的古音,包括复杂的复辅音。
以下举上几个有代表性的汉藏同源词(由于上古汉语的发音为后人所拟构,因此可能和实际的发音有所误差,所以在确定这些字的真实发音之前,所有的拟构字前方都加上*的符号):汉藏语同源词汉字上古音藏语虱*sr?k shig 吾*?aa nga 语*?a?ngag 飞*p?r vphur 死*sij?shi 杀*sreet bsad 目*mruk mig 耳*n?rna 二*nis gnyis 三*s?m gsum 四*slijs bzhi 五*?aa?Inga 主题二:藏语的辅音字母学习(一)、三十个辅音字母藏文有三十个辅音字母:1.辅音字母都能单成音节,单成音节时,发音都带有元音a。
藏文转写系统的设计与实现随着信息技术的发展,藏文的数字化处理成为一项重要任务。
为了实现藏文语言文字的自动处理和数字化传播,设计和实现一款高效的藏文转写系统变得尤为重要。
本文将介绍藏文转写系统的设计与实现,探讨其在提高藏文数字化处理效率和保护藏文文化遗产方面的重要性。
一、引言藏文是藏族人民的主要语言文字,对于藏族文化的传承和发展有着举足轻重的作用。
然而,由于藏文的特殊性,包括字符数量庞大、字形繁多以及复杂的音韵和文法体系等特点,使得对藏文的数字化处理变得困难和耗时。
因此,设计和实现一款高效的藏文转写系统是十分必要的。
二、设计原则1. 准确性:藏文转写系统应该准确地将藏文文本转写为易于处理和存储的文本形式。
系统应准确地识别藏文字符和音节的对应关系,确保转写结果的准确性。
2. 高效性:为了提高处理效率,系统应设计优化算法和数据结构,减少处理时间和资源消耗。
系统应能够快速处理大量的藏文文本。
3. 用户友好性:系统应提供简洁易用的用户界面,方便用户输入和操作藏文文本。
系统还应该支持多种输入方式,如键盘输入、手写输入等。
4. 可扩展性:在设计和实现藏文转写系统时要考虑到未来可能出现的新的需求和技术发展。
系统应具备良好的可扩展性,便于对未来需求的适应和扩展。
三、系统实现1. 数据预处理:首先,需要对输入的藏文数据进行预处理,包括字符编码转换和文本分割。
字符编码转换可以将输入的藏文字符转换为计算机可识别的编码形式。
文本分割可以将整篇藏文文本切割为单个的词或句子,方便后续处理。
2. 字符映射表:为了实现藏文转写,系统需要建立一个字符映射表,将藏文字符映射到计算机可处理的字符。
这个映射表可以采用一对一的对应关系,也可以采用多对一的映射关系,根据具体的需求进行设计。
3. 转写算法:根据字符映射表,系统可以实现转写算法。
转写算法通过扫描输入的藏文文本,根据映射表将藏文字符逐个转换为计算机可处理的字符。
算法可以根据不同的需求和场景进行优化,以提高转写的效率和准确性。
藏语方言分歧较大,卫藏方言人名“次仁”,安多方言说“才让”,文字写法却是一样的。
一般认为藏文创制于公元7世纪初,是松赞干布的大臣图弥三菩札从印度留学回来,,根据梵文创制的。
实际上,7世纪以前就已经有藏文了。
它也与象雄文、克什米尔文有关系。
藏文字母30个,都是辅音,带有声调,不标元音符号时辅音带a音,如第一个字母读ga,第二个字母读ka.与普通话一样,拉萨口语清辅音送气与不送气对立,而不是清浊对立。
每个音节中,位于音节中心的字母叫基字,基字可以有上加字、前加字、下加字、后加字、再后加字,后两种表示韵尾,其余表示声母。
拉萨口语,声母有36个,韵母有50个,实际拼写远比30个字母要丰富。
字母la写在ha上面时,表示的音在汉、英、法等语言里都没有。
它的发音方法是:舌卷起,接触齿背,“拉萨”(Lhasa)第一个音节的声母就是这个音。
后加字为-la、-da(低升调)、-sa、-la (高降调)时,元音[a]变成了[ε](英语air 前半部),[u]变成[y](汉语普通话的“鱼”),[o]变成了[鴀(法语deux的元音)。
这样,可以表示复杂的语音,又可区分开同音词。
在韩、法、德语里,这三种变音都是常见的。
上图:藏文元音符号与辅音字母藏文诞生有13个世纪了,有过文字上的小改革,变化很小,而藏语语音有了很大变化。
文化名人“八思巴”(1239—1280)的名字有两个音节,“八思”的-s(韵尾)现在不发音了,所以这个名字今译应当是“帕巴”。
有文字的民族,时间一久,就免不了面对文字与口语的差距。
语言的演变是必然的,要让文字与读音完全一致,在某个时期办得到,几百年以后就可能行不通了。
保持文字的相对稳定,制订把文字与现今读音联系起来的规则,可以解决文字和读音的差距问题。
这种历史音变造成的学习难度,并不比英语无章可循的拼读形式难。
花上一周,完全可以学会藏语语音,可是没有任何人敢说他能准确读出任何英语单词。
藏文的稳定性,对于发展文化和教育是有贡献的。
中国拉丁化新文字方案摘要:中国拉丁化新文字方案是一种试图用拉丁字母替代汉字的方案,旨在简化汉字书写和提高汉字的国际传播能力。
本文将介绍中国拉丁化新文字方案的背景、目标、主要内容以及可能的影响,并对其可行性进行探讨。
1. 引言中国汉字作为一种千年文字系统,在世界文化遗产中具有重要地位。
然而,随着全球化的加速发展,汉字的复杂结构和书写方式也成为中国学习者和外国人学习汉语的难题。
因此,有人提出了中国拉丁化新文字方案,试图用拉丁字母替代汉字,以简化汉字书写和提高汉字的国际传播能力。
2. 目标中国拉丁化新文字方案的主要目标包括:- 简化汉字书写:通过使用拉丁字母,将汉字的许多复杂字形简化,减少学习者在书写上的困难;- 提高汉字的国际传播能力:拉丁字母是世界上广泛使用的字母系统,将汉字转换为拉丁字母可以使汉字更易于被外国人理解和学习;- 促进信息交流与合作:拉丁化的汉字文字系统可以降低汉语学习的门槛,使更多的人能够理解和使用汉语,从而促进中外人士之间的信息交流与合作。
3. 主要内容中国拉丁化新文字方案主要包括以下几个方面:- 汉字转写:将汉字按照一定字典规则转写为拉丁字母,以保留原汉字的发音和意义。
例如,将汉字“中国”转写为“Zhongguo”;- 拼音标注:在拉丁转写的基础上,使用拼音标注来表示汉字的声调和读音,以帮助学习者正确发音;- 字母组合:由于汉字数量庞大,无法直接用拉丁字母一一对应,需设计字母组合来表示具体的汉字。
例如,“zh”表示“中”,“ch”表示“国”;- 结构调整:汉字的复杂结构需要进行调整,以符合拉丁字母的书写习惯。
例如,“书”字的横、竖结构可以使用“shu”来表示;- 标点符号:用拉丁化的方式表示汉语的标点符号,如句号、逗号、叹号等。
4. 可能的影响中国拉丁化新文字方案的推行可能会带来一些影响:- 文化变迁:汉字作为中国文化的独特象征,其被替代可能会引发文化认同危机,影响一些人的情感和认同感;- 教育改革:从小学到大学的汉字教育都需要进行相应的改革,培养学习者掌握拉丁化新文字方案的技能;- 文字习惯改变:中国人习惯了用汉字进行书写和交流,转而使用拉丁字母会需要一段时间的适应过程。
拉丁字母与西里尔字母的转写规则拉丁字母与西里尔字母是两种不同的字母系统,各自用于不同的语言中。
为了方便交流和研究,需要将两种字母系统之间进行互相转换,这就需要遵循一定的转写规则。
下面将分别介绍拉丁字母转写为西里尔字母和西里尔字母转写为拉丁字母的规则。
一、拉丁字母转写为西里尔字母1. 原则:尽可能保留原文的发音,将拉丁字母转写为最接近的西里尔字母。
2. 具体规则:a. 一般情况下,一个拉丁字母对应一个西里尔字母,如:- a →а- b →б- c →ц- d →д- e →е- f →ф- g →г- h →х- i →и- j →ж- k →к- l →л- m →м- n →н- o →о- p →п- q →к- r →р- s →с- t →т- u →у- v →в- w →в- x →кс- y →й- z →зb. 一些特殊的拉丁字母可能需要用多个西里尔字母来表示,如:- ch →ч- sh →ш- th →тх- ph →фc. 有些拉丁字母在某些语言中具有特殊的发音,在转写为西里尔字母时需要特别处理,如:- c 在法语中发音为/s/,在英语中发音为/k/。
在转写为西里尔字母时,需要根据其发音来选择合适的字母,如:- cecil →сесиль- cinema →синема- j 在英语中发音为/dʒ/,在西班牙语中发音为/x/。
在转写为西里尔字母时,需要根据其发音来选择合适的字母,如:- jeans →джинсы- jalapeño →халапеньо二、西里尔字母转写为拉丁字母1. 原则:尽可能保留原文的发音,将西里尔字母转写为最接近的拉丁字母。
2. 具体规则:a. 一般情况下,一个西里尔字母对应一个拉丁字母,如:-а→a-б→b-в→v-г→g-д→d-е→e-ж→zh-з→z-и→i-й→y-к→k-л→l-м→m-н→n-о→o-п→p-р→r-с→s-т→t-у→u-ф→f-х→kh-ц→ts-ч→ch-ш→sh-щ→shch-ъ→(不转写)-ы→y-ь→(不转写)-э→e-ю→yu-я→yab. 有些西里尔字母在某些语言中具有特殊的发音,在转写为拉丁字母时需要特别处理,如:-ё在俄语中发音为/yo/,在转写为拉丁字母时可写作e 或yo,如:-ёлка→yolka/eolka-щ在俄语中发音为/shch/,在转写为拉丁字母时可写作shch 或sch,如:-щенок→shchenok/schenok-ы在俄语中发音为/ɨ/,在转写为拉丁字母时可写作i 或y,如:-медведь→medved'/medvedi综上所述,拉丁字母与西里尔字母的转写规则是一种重要的语言学工具,能够帮助研究者们进行有效的跨语言交流和研究。
面向智能信息处理的语料库标注质量影响因子*——从《汉语人名拉丁转写方案》的设计谈起通拉嘎(泉州师范学院图书馆,福建泉州362000)[摘要]语料库是大量自然素材的有序集合,不仅为语言研究提供新的手段,也可以为自然语言信息处理相关研究提供重要支持。
探讨了影响语料库标注的各种原因,以基于蒙古文语料库的《汉语人名拉丁转写方案》为例,分析了各项因子对语料库建设产生的作用,认为标注的规范化发展、标注的准确性、一致性、中立性、通用性是衡量语料库标注质量的关键因素。
[关键词]智能信息处理语料库标注质量汉语人名拉丁转写方案[分类号]TP391.1*本文使用的语料库由内蒙古大学和中科院计算所提供,在此深表谢意。
本文系2013年国家自然科学基金重大项目“跨语言社会舆情分析基础理论与关键技术研究”成果之一。
1引言语料库是大量自然语言素材的有序集合,这些语言素材是书面文本、言语录音或其转写[1],语料库标注是为语料库增加一些语言学信息[2]。
语料库不仅为语言研究提供新的研究手段,也为信息检索、文本分类、机器翻译等自然语言信息处理的研究提供重要支持。
由于国内外语料库建设尚缺乏通用的规范或标准可以遵循,如何衡量语料库标注的质量、语料库标注出现了哪些问题,都值得我们深入探究。
笔者以智能信息处理发展相对薄弱的少数民族信息处理典型代表蒙古文信息处理的子问题——《汉语人名拉丁转写方案》的设计为例,探讨影响语料库标注质量的各类因素。
蒙古文语料库的建设从20世纪80年代开始兴起,由于传统蒙古文书写形式从上至下,蒙古文部分元音、辅音显示形式相同,新以蒙古文语料库建设之初即以拉丁形式转写各式语料,避免了排版、显示、系统兼容及部分歧义问题,把面向信息处理的蒙古文本形式简化为蒙古文(或汉字)包括标点符号等组成的一个字符串问题[3]。
不过与中、英文大规模语料库的发展相比,蒙、藏、维为代表的少数民族语言信息处理的研究与发展相对滞后,语料库经过机器标注之后,还需大量的人工校对过程,这不仅耗时耗力,还因标注者的不同理解,语料有不同层次的标注问题。
羅馬轉寫備忘錄略談中國藏學界慣用之拉丁轉寫規則﹝2001.7.30﹞兩岸藏學界的交流透過多次國際學術會議與書刊出版,漸入佳境。
台灣地區大概自1992 年東初出版社引薦大陸學者王堯、褚俊傑合著的《宗喀巴評傳》起,陸續引進若干藏學譯著與書刊。
當然,大陸藏學界特有的轉寫法也漸為人知。
這套深具中國特色的拉丁轉寫規則,是由中國藏學前輩于道泉先生(1901~1992) 所創。
基於目前並無確切的名稱,是故暫稱之謂「VQ轉寫法」!為甚麼給取這麼個怪名? 看官且慢驚愕。
話說當今天下藏文轉寫之法,若非與梵文同路即屬WYLIE 為熟稔,曾於2000.5.19 備忘錄文中說明其間差異,已知以v代'之異;又因ga為前加字時,逕以q代g-之法( 諸如g-yar代以qyar ; g-ya'代以qyav )。
遂以得此二字之增語而立名焉! 豈不是簡單明瞭。
三維立體結構美學VS 恆河女神﹝2000.5.28~6.9﹞數千年前翩翩美少男曼殊室利追求恆河女神妙音天女譜寫的愛情史詩,驚天動地,一發而不可收拾。
一同啜飲神山雪水的子民,以顫動蒼茫的歌聲,撫摩八荒蒼穹之際,律動的音節拍擊大地,高亢的喉吭詠嘆悲歡,就這般探循著天女的氣息和聲韻,藏族先民從無序中觸發出豐富的語音,成為情感相互有序的傳答,接著一一予萬物命名...。
而後,淵源於印度字母形制的藏區文字,逐漸經由碰撞接觸仿傚演化變遷而呈現今日之狀,它那特殊的拼寫層疊結構,具有與漢字相同的「超方言」特徵,但卻是道地的「音節文字」。
藏文的音節結構由簡單發展至繁複,大略可歸納為三十六種連綴形式。
如以縱向觀察基字( m ing g zh i ) 向上下四方衍增的情況,試分四大類來示範轉寫的軌則。
例字中紅色的「輔音字母」即為「基字」。
第一類姑且稱之「一以貫之」型,就是由基字和上加字、下加字、母音符號分別連綴成的單字,底下依音節結構由簡入繁作轉寫示範,為了易於識別,特將基字以紅色顯示,以收一目了然之效。
藏文拉丁字母转写系统藏文拉丁字母转写系统藏文拉丁字母转写系统本条目含有藏文字母。
如果您的操作系统不能显示,可参考英文版帮助或此网页以获取藏文支持。
藏文拉丁字母转写系统是指将藏文字母转换成拉丁字母,从而使藏语罗马化的一套文字转写系统。
本条目只介绍现在通用的威利(Wylie)转写方案。
1959年,威利(Turrell Wylie)精炼了原有的转写方案,只使用基本的26个拉丁字母,而不需添加字母和添加符号。
在此之后,这套方案成为藏学界尤其是美国藏学界的标准转写方案,并以威利的姓氏来命名。
在以拼音文字为文字形式的语言中,藏语着其特殊的地方:文字系统与语音系统不一致。
现行藏文字母纪录的是11世纪的藏语语音,这与现代藏语的语音有着很大的区别(例如,“西藏”一词,根据藏文字母的拉丁文转写为bod,而现代拉萨方言则是pö(音标为[p?ø?]),出现了声母清化和韵尾变化等现象)。
因此,任何一种藏语罗马化方案,都要从“描述现代藏语语音”和“转写描述古藏语语音的藏文字母”之间作出抉择。
早期的方案试图采取折中的方式,结果两边都不讨好。
威利转写方案则设计为准确转写藏文字母,而不顾及藏语词汇的现代发音,因此为学术和历史研究机构所接受。
威利转写系统辅音字母辅音?k ? kh ? g ? ngc ? ch ? j ? nyt ? th ? d ? np ? ph ? b ? mts ? tsh ? dz wzh ? z ? ' yr ? l sh ? sh零韵母?未被转写,以元音开头的音节都含有这个字母,可以通过这个特征来准确判断它的存在。
在藏文字母中,同一个音节的辅音字母群,既可能以前后缀的形式出现,也可能作为“根字母”的上缀或下缀。
对藏文字母的前后缀与上下缀,威利转写系统并不区分,因为这并不会构成混淆--除了gy-,既可能是g作为前缀使用,也可能是y作为下缀使用。
威利转写系统作了以下区分:当g作为前缀时,在g与y之间加.。
基于小字符集藏文拉丁转写系统的设计与实现
陈小莹;艾金勇
【期刊名称】《中文信息学报》
【年(卷),期】2016(30)3
【摘要】随着藏语语言信息技术的迅速发展,藏文拉丁转写成为迫切需要解决的重要课题之一.该文在前人有关藏文拉丁转写研究的基础上,设计并实现了基于小字符集方案的藏文拉丁转写系统.文章通过对小字符集编码方案的特征分析,同时根据藏文正字法知识,提出了基于小字符集编码的藏文拉丁转写算法,并对具体算法策略进行了分析和说明,最后在Windows平台进行了程序的实现.藏文拉丁转写方案的设计与实现,可以解决藏文多编码系统之间的兼容性问题.
【总页数】5页(P74-78)
【作者】陈小莹;艾金勇
【作者单位】西藏民族大学信息工程学院,陕西咸阳 712082;西藏民族大学图书馆,陕西咸阳 712082
【正文语种】中文
【中图分类】TP391
【相关文献】
1.藏文拉丁转写的设计与实现 [J], 陈小莹;艾金勇;郭小丹
2.基于国际标准编码系统的维吾尔文拉丁文转写规则研究 [J], 亚森·伊明
3.Linux系统藏文拉丁文转写输入法的实现 [J], 曹晖
4.基于国际标准编码系统的藏文拉丁文转写规则模型 [J], 祁坤钰;达召卡什吉
5.基于机器学习的藏文图像识别系统设计与实现 [J], 杨学斌; 贾磊
因版权原因,仅展示原文概要,查看原文内容请购买。
藏文拉丁转写方案
藏文拉丁字母转写是指将藏文字母转换成拉丁字母,从而使藏语罗马化的文字转写方法。
在国内外有各种各样的转写方案。
在此介绍现在国内外较通用的威利(Wylie)转写方案。
(注,在威利方案中三十个辅音字母的第六组第三个字母(第23个辅音字母)用的是' ,而在此用字母v)
转写方案:(对应关系)
(1)辅音字母
(2)元音
转写时以藏文书写顺序,把藏文的每一个字符转换成相应的拉丁字
母。
也就是说将把一个字按它的基字(ming gzhi)、元音(dbyngs)、前加字(sngon vjuk)、后加字(rjes vjuk)、再后加字(yang vjuk)、上加字(mgo can)、下加字(vdogs can)按手写顺序拆成其相应拉丁字母的方法。
切记必须按照正确的手写顺序拆字。
如:吐蕃,转写为bod;拉萨,转写为lha sa;安多,转写为a mdo;康巴,转写为khms pa;卫藏,转写为dbus gtsang;雪域,转写为gnags ljongs;扎西,转写为bkra shis;
转写方法详解:对于一个字儿,
(1)如果不含有元音字母,那么转写时需要将在基字对应的拉丁字母后面加一个a;如果含有元音字母,那么在基字后面不需要加a,可以理解成用元音替代了字母a
(2)如果含有上加字,那么转写时需要把其对应的拉丁字母写在基字对应的拉丁字母前(完全符合手写顺序);如果含有后加字、再后加字,那么后加字对应的拉丁字母写在基字对应的拉丁字母后,再后加字对应的拉丁字母跟在后加字之后(完全符合手写顺序);如果含有下加字,那么下加字对应的拉丁字母要写在基字对应的拉丁字母后。
如果其下加字不含有元音字母,那么在下加字对应的拉丁字母后面需要加一个a,如果含有元音字母,那么元音字母对应的拉丁字母跟在
下加字对应的拉丁字母后。
(3)如果其前加字是第三个辅音(g),而其基字是第六组第四个字母,即第24个辅音字母(y)时,需要在g和y之间加一个点(.)否则会有混淆的。
因为在藏文字母中,同一个音节的辅音字母群,既可能以前加字的形式出现,也可能作为基字的上加字或下加字出现,所以为了辨别加了个点。
如:“墙”转写成gyang,而“裂口”转写成
g.yang。
(4)字与字之间的分隔符点(tsheg)跟竖(shad)转写时点之间用空格代替,而单竖(chig shad)用一个点代替,双竖(nyid shad)用两个点代替,以此类推。
上述是最基本的藏文转写方法,是参考北京藏族文学小组的《rmu thag》藏文期刊第二期中的介绍转写方法的文章(《bod yig la ting yi ger phab vbri byed tshul skor mdor tsam kleg ba》by Tsering D.sharshon)的基础上平时使用过程中总结出来的一点东西,对于藏文构词组成的翻译上可能会有错误,希望大家见谅!因为在此要讲的内容是转写方法而不是有关翻译的。
由于不能正常显示藏文字体,
不能够用藏语举例,使的讲解带来了不少的麻烦,希望在回帖中用himalaya输入法举例并交流。
藏文中还有很多较复杂的字,如梵文、叠加字等,这些较少用的字可能有另外的转写方法,但是我自己不会使用,所以…
在此希望每一个同胞能熟练掌握这个转写方法,因为在网上聊天、手机短信、电子邮件上我们不能够如意使用自己的母语。
我想能够用拉丁字母把转写藏文是使用藏文,传承母语的良好途径,再次鼓励大家使用这个转写方法,因为这个完全是按照藏文字转写,而不是按字母发音,所以完全可以在各个藏区通用。