汉语基础教材的字频统计与跨区域比较
- 格式:pdf
- 大小:530.80 KB
- 文档页数:10
兩岸規範字的比較與分析两岸规范字的比较与分析 nhz\lee3 7/2005 R.提要:1986 台北出版的<通用汉字标准交换码>(CNS11643)内台湾规范字(13,051),其中包括常用字5401;1988 大陆公布的<现代汉语通用字表>内大陆规范字(7,000),二者之间究竟有多少差异?本文把两种规范字,以繁简体并列的方式,作一对一的对照比较,并详细分析二者之间的差异。
目錄: 1.0 引言 2.0 规范字的取样范围 3.0 繁简体的一般比较4.0 繁简体差异的详细比较5.0 概述规范字的统合6.0 总结附录:(次篇)1 只笔划略有不同2 只部首改变3 只音符或偏旁改变4 完全不同5 用较简笔的繁体字 6. 一對多的字7. 在台標外的規範字 8. 在陸規外的規範字附图:1.繁简体差异比较图 2. 繁简体的结构比较 3.繁简体笔划的分布1.0 引言多年来海峡两岸繁简字体各行其是,现在已到了讨论统合的时候了。
本篇是把大陆规范的通用字与台湾规范的常用字,作'一对一'的比较与分析,从多种角度说明它们之间的差异,提出一些资料以供讨论繁简规范字统合的参考。
简化字目前已成为中国大陆,及世界许多国家采用汉字的标准,其成效有目共睹。
它的规范(例如 7,000 通用字),无疑的,应成为两岸规范字统合的主要依据之一。
另一方面,简化字推行至今,已历半个世纪。
虽然中间曾有过小小的修正及补充,但尚未作全面的检讨。
第一次文字改革偏重通俗化,及笔划的减省,但是通俗化在某些方面与文字系统化互相矛盾;有些字为着减省几笔,反而牺牲了汉字原有的形声或表意功能。
因此在讨论两岸文字统合的时候,也就是检讨现行规范字的时候。
笔者认为随着社会文化的发展与多元化,人民教育的普及与提升,汉字的优化与规范的统一,应注重汉字的系统化与精致化;尤其文字计算机化之后,'省笔'不宜作为优化汉字的主要目标。
汉语方言汉字统计比较研究钱大香(南京师范大学文学院,江苏南京210000)摘要:本文利用《现代汉语方言语音词汇库》语料库材料.对汉语19个方言点3000多常用词中所包含的汉字进行统计比较。
得出结论:一是方言中有音无字的现象在一些方言区存在较多.二是19个方言点共有汉字的数目出乎我们的想象,只有1028个。
关键词:方言汉字有音无字共有汉字一、方言汉字浅述中国是个多民族的国家.由于地域广阔.难免会出现异地异音异形.所以中国古代文字中异体字占了很大的比重.像甲骨文和金文,我们可以从中看到许多异体字。
但是随着社会的发展,人们的交流越来越广泛,发现这些异体字不利于人们之间的沟通。
历代统治者为了推进社会的发展。
便开始统一文字,并规定教育和国家的政策和政令都必须用官方标准统一的文字书写.因此凡是经过教育的人都会接受并使用国家统一的标准文字。
而语音则受到很大的限制,古时人们生活范围有限,基本上是以本人所在的州府为活动范围,所以语音是纯粹的本地音。
读书人所读的书是国家统一刊印的本子.也就是说在使用汉字上全国没有什么不同。
而不同地方的人却用不同的语音来读。
因此人们认为不存在方言的书面语。
更不存在方言汉字,然而这是从共时的层面来说的。
汉字自从发展到唐朝的楷体已达到稳定时期.这之后字形基本上没发生变化,因此在这千年中所发生的细微变化通常不会对方言汉字造成重要的影响.因为它们本同出一源,所以说很大程度上方言汉字和共同语汉字没有多大差别。
因而学者从没有对方言汉字和现代汉语汉字之间存在的差别做过比较性的研究。
笔者认为虽然方言汉字和现代汉语汉字之间的差别是细微的,但这种研究仍是必要的。
从它们的比较中可以看出文字发展的地域性差异.另一方面透过文字的差异.对方言语音、词汇和语法的比较研究提供有价值的参考。
方言汉字是用来记录方言书面语的符号,大都来自共同语。
它随着共同语汉字的变化而变化,但常会出现有些汉字变化会影响方言词的读音和意义。
浅谈两个语料库统计功能的对比摘要:语料库的统计功能在语料库的使用中占据重要地位,一般而言,一个语料库的统计信息越是全面,则对于教学与研究的用处越大,在汉语中介语语料库中亦是如此。
笔者就HSK动态作文语料库及汉语中介语语料库两个语料库为例,对汉语中介语语料库的统计功能进行对比,以为汉语中介与语料库提供统计功能建设方面的建议。
关键词:语料库统计信息本文中讨论的统计功能并非是两个语料库内“统计”页面的所有功能,而是两个语料中共有的“字汇总”、“词汇总”、“按国家按国家和(或)地区统计”及“分词工具”4项功能。
(一)HSK动态作文语料库的部分“统计”功能“错误信息汇总”中显示“字错误汇总”、“词错误汇总”及“句子错误汇总”表格及用黄色标识出的“错误篇章总数2387”。
“字错误汇总”显示“字错误”、“标记”等5项内容,“字错误”类型分别有“错字”、“别字”等11种类,“详细”页面用蓝色字体显示该字的“字错误类型”、“标记”及“出现频次”,如以“错字”的错误类型为例,“错字”对应的“详细”页面的表格内显示相应的错字及其频次,错字的记录共2173条记录,此外该表格下方有“下载”选项,“下载”选项可以直接将错字及其频次下载至本地。
“字汇总”和“字汇总_按错误排序”页面显示在“序号”、“汉字”、“总频次”、“错误频次”4项信息是相同的。
两个表的不同之处在于“字汇总”表内是按照“总频次”由高到低进行排列的,而“字汇总_按错误排序”是按照“错误频次”由高到低进行排列的。
在“词汇总”和“词汇总_按错误排序”两个表内亦是如此。
在“按标点统计”页面可以进行各类标点的检索,如在查询“句号”该标点时,在查询页面输入“。
”即可进行“总数”、“标点多余”等5项信息。
在“分词工具”页面可以使用“分词”及“标注分词”工具,在“原文”框内输入待分词的文本信息,之后进行“分词”或“标注词性”选项即可查看分此后的内容。
在“按国家和地区统计”页面内可进行国家或地区的选择,在该选项内语料不到10篇的国家和地区的统计是不进行统计的,除此之外,在“请选择”功能中选择需要进行查找的国家和地区即可进行查看。
我国大陆、台湾和新加坡小学语文阅读教材编写体例比较汉语是中华民族的母语。
中华民族悠久的历史、几千年积累下的优秀化传统主要是依靠语言字传递下的。
因此同根同族的华人教育历重视语教学,而语教学中又以阅读教学为主。
其原因盖出于阅读教学所具有的工具价值和以载道的教育价值。
通过阅读教学可以使学生从中体验到中华优秀化的熏陶,从中获得民族化精神和民族审美的感情,这是汉语地区阅读教学所具有的独特功能。
以小学语阅读教学为例,大陆的语教学大纲中就指出:“阅读教学是语教学的基本环节。
它是识字的重要途径……能够进行听说读写的综合训练……能够使学生获得多方面的知识,发展思维,提高认识,受到思想教育和美的熏陶。
”台湾小学国语程标准规定,三至六年级的国教学时数为360分钟,其中200分钟是用于阅读教学的。
同根同,使得世界不同地区的汉语阅读具有某种共同性;异地异情,又使之具有一定的差异性。
比较这些异同,不仅可以使我们强化阅读教学中优秀民族化传统的认同感,还可以使我们相互借鉴,取长补短。
本拟对我国的大陆、台湾和新加坡的小学语阅读教材编选体例作一简要的比较。
一、阅读教材的总体编排比较阅读教材的总体编排有两个共同的特点:(一)大语观的总体编排模式三个地区都打破了“一本书”的传统阅读教材编排模式,即集、作业、补充阅读为一体的模式,代之以沟通内外、校内外,使学生在更广阔的背景中学习的阅读教材编排方式。
我国大陆的做法是将独立阅读从教科书中抽取出,编成独立成册的自读本。
作业虽未从教科书中独立出,但各单元的练习中均提供独立阅读的短及检验阅读效果的作业,加上自由度比较大的外阅读,构成了阅读教材体系。
对外阅读的要求,在教学大纲中提出了原则性的指导意见:“教师要加强外阅读的指导,经常向学生推荐合适的读物并指导学生选择读物,引导学生把语内学到的方法,运用到外阅读中去……”台湾和大陆不同的是:教科书中的练习以单元为单位,一般都有供阅读练习的短。
各的练习则从教科书中独立出,成为专门的“习作”。
第一章 中韩汉字字量比较第一节记录汉语和韩语所需汉字的数量汉字有数千年的历史,如果把历史上所有使用过的汉字都累积起来,其数目是异常庞大的,然而每个历史时期实际使用的汉字数量是一定的。
宋代编撰了《礼部韵略》(丁度等修订)作科举考试用书。
这部书最初收录了8829字,以后陆续出现各种版本,字数也有所增减,不过大体都保持在9000字左右。
韩国在高丽时期就引进《礼部韵略》作科举之用,以后朝鲜李氏王朝又多次再版刊行。
可以说,这9000字是知识阶层所要掌握的汉字数。
韩国曾经刊行过不少基础教育用汉字字书,其中最具代表性的是《千字文》《类合》和《训蒙字会》。
《千字文》收字1000个,单卷《类合》收字1518个,《训蒙字会》收字3360个。
韩国1945年解放后,语文政策几经变更,汉字教育问题始终未得到完满的解决。
为满足汉文教学的需要,1972年韩国文教部颁布《汉文教育用基础汉字》,选定了1800个汉字。
为了了解韩国目前实际生活当中所需要的汉字量,韩国国内曾经作过一些统计。
1998年韩国国语研究院曾委托首尔大学的许成道教授对汉文教育所需汉字进行调查研究。
许教授共收集近950万字的汉字语料,统计出韩国汉文教育所需的汉字的使用频率和汉字的数量。
具体数据如表1.1:表1.1 韩国汉字在不同类型语料中的覆盖率类型覆盖率70% 80% 90% 95%教材类397 881 1284 2038四书类182 303 841 1080诸子集成327 587 1097 1809续表类型覆盖率70% 80% 90% 95%十三经310 540 1057 1791 中国文学类838 1011 1781 2878 中国历史类328 538 991 1583 韩国文学类554 908 1824 2451 韩国历史类428 877 1174 1797 中国综合材料类407 888 1298 2133 韩国综合材料类442 701 1224 1882 韩中综合材料类485 744 1328 2105高丽大学国语国文学科的金兴圭对8500万字的材料进行了统计,统计出韩国国语用汉字的频率。
第1章绪论1.1研究目的、意义由于汉字意义多样、结构复杂、有多音字等特点,汉字教学成为对外汉语教学中一个突出的难点。
对外汉语教学中汉字教学的理论相对薄弱,《世界汉语教学》和《语言教学与研究》是目前国内汉语研究的权威刊物,以这两种刊物分析对象,从2000年到2014年《世界汉语教学》共发表了932篇文章,《语言教学与研究》从2000年到2014年3月共收有1029篇文章,但其中关于汉字教学的不到10篇。
汉字实际教学也存在很多问题,怎么教,教什么,教多少,都是需要好好把握的问题。
胡炳立认为,汉字的教学一直落后于语法、词汇教学的原因主要有三个:一是汉字教学观念淡薄,学界对其重视不足;二是汉字本身的特殊性;三是缺乏高质量的汉字教材。
从20世纪80年代开始,汉字教学的重要性已得到越来越多的关注,教学的重要载体——教材同样也得到了相应的重视与发展,国内出版的汉字教材层出不穷,比如《汉字轻松学》、《阶梯汉语——初级汉字》等,连国外也有独立编辑并出版的相关教材,比如新加坡出版有《FUN WITH CHINESE CHARACTERS》;韩国有《汉语汉字简体字书写本800字》、《容易习得的易learn汉语汉字》、《新手容易完成中国汉字》等。
调查显示,虽然目前汉字教材层出不穷,但对汉字教材的开发编写和理论探索还有待全面深入的分析研究。
本文希望通过分析《FUN WITH CHINESE CHARACTERS》和《体验汉字·入门篇》中外两本使用较多的教材,讨论中外汉字教材的编写目的、编写体例、编写内容和练习题设置等内容,希望能够为使用汉字教材的学习者或教学者提供一定的指导,也为汉字教材的编写者提供一定的参考,让汉字教学和汉字教材编写都更具计划性和科学性。
1.2研究方法1.2.1文献研究法本文通过系统查阅国内与国外跟汉字教学及汉字教材研究相关的文献资料和学术成果,汲取前人研究的理论精华,为本研究提供更多更好的指导。
儿童识字汉字的使用频率高频字表SANY标准化小组 #QS8QHH-HHGX8Q8-GNHHJ8-HHMHGN#汉字的使用频率汉字的数量非常庞大,总数大约九万左右。
但常用字才三千多个,即使是常用字,使用频率的差别也很悬殊。
国家标准GB2312-80《信息交换用汉字编码字符集*基本集》就是根据这种事实制订的。
一级字库为常用字,3755个,二级字库为不常用字,3008个,一、二级字库共有汉字6763个。
一级字库的字,使用频率合计达99.7%。
即在现代汉语材料中的每一万个汉字中,这些字就会出现9970次以上,其余的所有汉字也不足30次。
而最常用的1000个汉字,使用频率在90%以上.根据国家出版局抽样统计,汉字中最常用字560个,常用字807个,次常用字1033个。
三者合计2400个,占一般书刊用字的99%,所以小学生如果认识2400个常用字就能阅读一般书刊。
最常用的140个汉字(频率之和为50%按频率从高到低排列):的一是了我不人在他有这个上们来到时大地为子中你说生国年着就那和要她出也得里后自以会家可下而过天去能对小多然于心学么之都好看起发当没成只如事把还用第样道想作种开美总从无情己面最女但现前些所同日手又行意动方期它头经长儿回位分爱老因很给名法间斯知世什两次使身者被高已亲其进此话常与活正感使用频率排名141-232的汉字(这92个汉字的频率之和为10%)见明问力理尔点文几定本公特做外孩相西果走将月十实向声车全信重三机工物气每并别真打太新比才便夫再书部水像眼等体却加电主界门利海受听表德少克代员许和先口由死安写性马光白或住难望教命花结乐色使用频率排名233-380的汉字(148个汉字,使用频率之和10%)更拉东神记处让母父应直字场平报友关放至张认接告入笑内英军候民岁往何度山觉路带万男边风解叫任金快原吃妈变通师立象数四失满战远格士音轻目条呢病始达深完今提求清王化空业思切怎非找片罗钱法吗语元喜曾离飞科言干流欢约各即指合反题必该论交终林请医晚制球决窢传画保读运及则房早院量苦火布品近坐产答星精视五连司巴382-500 (5.43%)奇管类未朋且婚台夜青北队久乎越观落尽形影红爸百令周吧识步希亚术留市半热送兴造谈容极随演收首根讲整式取照办强石古华论拿计您装似足双妻尼转诉米称丽客南领节衣站黑刻统断福城故历惊脸选包紧争另建维绝树系伤示愿持千史谁准联妇纪基买志静阿诗独复痛消社算501-631算义竟确酒需单治卡幸兰念举仅钟怕共毛句息功官待究跟穿室易游程号居考突皮哪费倒价图具刚脑永歌响商礼细专黄块脚味灵改据般破引食仍存众注笔甚某沉血备习校默务土微娘须试怀料调广蜖苏显赛查密议底列富梦错座参八除跑亮假印设线温虽掉京初养香停际致阳纸李纳验助激够严证帝饭忘趣支632-1000春集丈木研班普导顿睡展跳获艺六波察群皇段急庭创区奥器谢弟店否害草排背止组州朝封睛板角况曲馆育忙质河续哥呼若推境遇雨标姐充围案伦护冷警贝着雪索剧啊船险烟依斗值帮汉慢佛肯闻唱沙局伯族低玩资屋击速顾泪洲团圣旁堂兵七露园牛哭旅街劳型烈姑陈莫鱼异抱宝权鲁简态级票怪寻杀律胜份汽右洋范床舞秘午登楼贵吸责例追较职属渐左录丝牙党继托赶章智冲叶胡吉卖坚喝肉遗救修松临藏担戏善卫药悲敢靠伊村戴词森耳差短祖云规窗散迷油旧适乡架恩投弹铁博雷府压超负勒杂醒洗采毫嘴毕九冰既状乱景席珍童顶派素脱农疑练野按犯拍征坏骨余承置脏彩灯巨琴免环姆暗换技翻束增忍餐洛塞缺忆判欧层付阵玛批岛项狗休懂武革良恶恋委拥娜妙探呀营退摇弄桌熟诺宣银势奖宫忽套康供优课鸟喊降夏困刘罪亡鞋健模败伴守挥鲜财孤枪禁恐伙杰迹妹遍盖副坦牌江顺秋萨菜划授归浪听凡预奶雄升编典袋莱含盛济蒙棋端腿招释介烧误亿丁丹虎羊刀二。
对外汉语初级汉字教材对比研究对外汉语初级汉字教材对比研究引言:对外汉语教学一直以来都是一个热门话题,近年来,随着中国的崛起和汉语的全球影响力的增加,越来越多的人对学习汉语表现出了浓厚的兴趣。
作为汉字是汉语的核心特征之一,汉字教学变得愈发重要。
对外汉语初级汉字教材的选择将直接影响学习者的学习效果。
本文将对几种常见的对外汉语初级汉字教材进行对比研究。
一、《HSK标准教程》《HSK标准教程》是一套由北京语言大学主编的教材,是专门针对中国汉语水平考试(HSK)的教材。
该教材注重实用性,侧重训练学习者的字音和字形记忆,适合那些希望通过汉语考试提高语言水平或是准备参加HSK考试的学习者。
教材以字词为主线,通过语境来帮助学习者理解和记忆汉字。
每个汉字都附有详细的解释、例句和练习题目,以便巩固学习效果。
二、《新实用汉语课本》《新实用汉语课本》是由北京语言文化大学等编制的一套全新的汉语教材。
该教材强调汉字的使用频率和实际场景,注重学习者的实际语言运用能力。
教材以生活情景为基础,通过丰富的图片和例句来帮助学习者理解和记忆汉字。
与《HSK标准教程》相比,该教材更加注重交际功能,并注重培养学习者的听说能力。
每个课文中的汉字都附有详细的笔画顺序和写法讲解,以帮助学习者正确书写汉字。
三、《汉语言课本》《汉语言课本》是一套由北京大学等编制的对外汉语教材,教材分为上下两册。
该教材结合了传统与现代教学方法,既注重基本知识的教授,又通过生动有趣的故事情节来吸引学习者的兴趣。
教材的词汇选择注重知识的层次,每个汉字都有详细的解释和例句来帮助学习者理解字义和用法。
教材还特别注重培养学习者的文化素养,通过让学习者了解汉字的来源和发展历程,以加深对汉字的认识和理解。
四、对比分析从教材内容来看,《HSK标准教程》重点在于汉字的文字形状和字音的记忆,适合那些强调考试技巧和准备HSK考试的学习者。
而《新实用汉语课本》则更注重日常实用的汉字运用能力,适合那些希望快速掌握汉字并能够灵活运用汉语的学习者。
101摘要:本文全面考察了世界主要华语区域——中国大陆、台湾,新加坡、马来西亚等4个国家和地区小学语文课本,利用语料库语言学理论与计算机技术,对各地语文教材的用字及其分布做了穷尽性的定量分析,真实地展现了基础教育阶段汉字在静态分布与动态频率上的共性与差异。
由此,进一步探讨全球华语(World Chinese )三大同心圈——内圈、中圈、外圈的区分,并试图在这种“大华语”视野下,针对海内外华语教育的不同特点,提出汉字教学的分级标准。
关键词:汉字分级字频统计语料库语言学全球华语一、引言汉语,中国大陆称“普通话”,台湾称“国语”,东南亚称“华语”,是全球华人的共同语,遍布世界各地。
但把它纳入9年基础教育体系中,作为中小学校必修课程的,目前主要有中国大陆(包括港澳)、台湾,以及新加坡、马来西亚等4个区域。
在这些国家和地区,社会文化环境有差异,汉语的语言地位各有不同,各地分别自行制定教学大纲,自编汉语教材,缺乏一个统一标准与参照点。
汉语教学应该如何定位,才能既满足当地的实际需要,又能实现相互间顺畅交流?长期以来,这是海内外汉语研究与汉语教育界共同关注的焦点。
本文将从汉字这个古老的话题入手,来对此进行一番新的探讨。
之所以选择汉字作为切入点,是因为在上述4个区域内,汉语是华人的母语,学生在接受学校教育以前,已经可以流利地进行口语交流,学校语文课的主要任务是提高阅读、写作等书面语能力。
因此,汉语书面语的基础——汉字——不约而同地成为汉语教学的首要内容,而且基本上都是在小学阶段完成。
本文的具体研究方法是,在中国大陆、台湾、新加坡、马来西亚的汉语教材语料库基础上,利用语料库语言学理论与计算机技术对这4地的主流小学语文课本进行穷尽性考察Ooi,Vincent Beng Yeow,Computer corpus lexicography (Edinburgh :Edinburgh University Press,1998).Schmitt,Norbert,Vocabulary in language teaching (New York :Cambridge University Press,2000).※——兼论全球华语区划与汉字教育问题[新加坡]王惠余桂林2007・2汉语基础教材的字频统计与跨区域比较1022007・2济、文化的各个层面。
在这里,小学语文课程是典型的基础母语教育。
根据中国教育部颁布的《全日制义务教育语文课程标准(实验稿)》,九年课程的总目标是“认识3500个左右常用汉字”。
其中,小学阶段的任务是:第一学段(1~2年级):认识常用汉字1600~1800个,其中800~1000个会写。
第二学段(3~4年级):累计认识常用汉字2500个,其中2000个左右会写。
第三学段(5~6年级):累计认识常用汉字3000个,其中2500个左右会写。
我们对90年代以后大陆出版的7套小学语文课本作了调查语文教材全名:新课标《义务教育课程标准实验教科书(语文)》(1—11册),人民教育出版社2006版。
新课标《义务教育课程标准实验教科书(语文)》(1—10册),江苏教育出版社2005版。
张庆、朱家珑主编:《九年义务教育六年制小学课本(试用修订本)》(1—12册),江苏教育出版社2001版。
“五四”学制教材总编委会编:《九年义务教育五年制小学试用课本——语文》(1—10册),北京师范大学出版社1999版。
人民教育出版社小学语文室编:《九年义务教育六年制小学教科书——语文》(1—12册),人民教育出版社1998版。
北京教育科学研究院基础教育教学中心编:《九年义务教育六年制小学试用课本——语文》(1—12册),北京出版社1998版。
九年义务教育教材(沿海地区)编写委员会编:《九年义务教育六年制小学试用课本——语文》(1—12册),广东教育出版社1991年版。
语文教材新课标人教版(1—11册)新课标江苏版(1—10册)江苏版(1—12册)北师大版(1—10册)北京版(1—12册)人教版(1—12册)广东版(1—12册)总计表1中国大陆小学语文课本用字课文篇数4112353003443083062992,203总字数261,98195,875125,243170,277186,538173,704170,6401,184,258单字量3,5773,0263,1873,2653,2993,2253,2224,262共有的字23652365236523652365236523652,365独有的字181246663583571498103料库,收集当地的儿童读物、教科书、教学参考书、工具书与电子光盘、网络论坛等,共计120万字,包含5,021个字种,共计2,921个繁体字种。
转换成简体字,则为2,853个字种。
字数之所以减少,是因为如下134个繁体字只对应66个简体字(见表2):2.3新加坡小学华文教材新加坡是中国以外唯一一个以华人为主的国家,300多万人口中,华人约占77%,马来人占14%,印度人占7.6%,其它种族占1.4%。
华语虽然是华人的母语,但并不是国家的第一语言。
新加坡的官方语言共有4种:英语、华语、马来语、淡米尔语。
其中,英语是第一语言,使用最为广泛,也是学校的主要教学语言;华语只是第二语言,仅在“华文”课上是用华语教学。
华文是新加坡华人学生的必修课程,根据程度不同,小学华语课本分作两类:(1)高级华文;(2)普通华文。
前者是培养华文精英的,只有极少数优秀学生才能修读;绝大部分学生读的是第2类,即“普通华文”课程。
二者相差其实并不大,小学一年级至六年级课本各有203篇课文,区别主要在于高级华文包括2,090个汉字,普通华文1,832个(见表3):———————————————国立编译馆国民小学国语科教科用书编审委员会编:《国民小学国语课本》(正式本初版),(台湾)国立编译馆2002版。
表2台湾小学国语课本的繁简字对照高级华文普通华文表3新加坡小学普通华文课本课文篇数203203总字数58,13746,499单字量2,0901,832共有的字17641764独有的字32668汉语基础教材的字频统计与跨区域比较1042007・2为了客观地反映新加坡汉字教育的真实水平,本文考察的是“普通华文”。
所选的教材为新加坡教育部课程规划与发展署编写的《小学华文》课本,是国民型小学(华小)教材,根据马来西亚教育部所颁发的《小学华文课程大纲》(2001)编写的,从小学1年级至6年级,共计334篇课文,160,043字次,2,828个字种。
三、汉字地域分布的不平衡性我们把中国大陆、台湾、新加坡、马来西亚的现行主流小学语文教材汇集在一起,组成一个专题语料库,共计492,507字次,包含3,758个字种。
从地域上看,这3,758个字的分布是极不均匀的,其中只有45%的字(1,687个)在四个区域中都出现。
其余55%的字则只出现在部分区域中:三区共用字占18%(660个),双区共用字16%(593个),单区独用字22%(818个)(见图1)。
3.1四区共用字(1,687个,占45%):基本上都是单音节词,其中最高频的50个是:的、一、了、我、不、是、有、在、来、他、人、上、们、说、子、个、大、小、到、着、这、地、你、里、天、就、下、看、好、要、得、和、家、去、出、么、时、学、妈、以、把、也、生、多、起、读、后、动、都、过3.2三区共用字(660个,占18%)———————————————马来西亚教育部编:《国民型小学(华小)华文教材》,(吉隆坡)PENERBITAN PELANGI SDN.BHD 出版社2003年版。
图1小学语文教材用字的地域分布180016001400120010008006004002000单区共用二区共用三区共用四区共用单区共用三区共用四区共用二区共用1687660593818105中国大陆、台湾、马来西亚的共用字,占三区共用字的绝大多数,共554个(占84%)。
新加坡与其他3地的共用字只占16%(106个):与马来西亚、中国大陆的共用字,52个;与马来西亚、台湾的共用字,32个;与中国大陆和台湾的共用字最少,只有22个。
见图2。
中国大陆、台湾、马来西亚的共用字(举例,最高频50字)词、述、构、悄、横、辨、席、泉、桃、梅、蒙、乎、湾、型、岩、溪、锋、映、仍、辩、挺、隐、描、翠、庄、哗、柳、若、介、茫、扁、岭、峰、浓、诸、博、塘、婶、索、罐、蝶、筝、迹、劲、启、输、孤、置、腾、蛮中国大陆、新加坡、马来西亚的共用字(52字)匪、狸、钞、拦、凶、拼、购、椒、恳、袖、瞎、职、挣、俭、裤、涂、爪、皂、扭、沟、著、驻、痰、睬、塔、嗽、浸、尿、粘、迅、狐、聋、狡、猾、泳、狱、尸、贼、尼、曼、豹、肖、啡、刹、睦、碟、帚、捣、橙、绊、咖、咦台湾、新加坡、马来西亚的共用字(32字)喇、孝、侄、戚、牌、矛、盾、捐、墓、婚、巷、惰、巡、叙、郎、坟、妨、煎、赚、鸽、醋、薪、租、吝、歹、凸、芭、簿、僧、甥、氛、韩中国大陆、台湾、新加坡的共用字(22字)瑞、杨、卜、孟、宋、蚕、袍、杆、堡、欧、陵、朱、秦、蚓、蚯、蟹、曹、尔、晖、迪、瑜、嘛3.3双区共用字(593个)其中95%是中国大陆和台湾、马来西亚之间的两两共用字,分别为231个(大陆马)、220个(大陆台)、113个(马台)。
新加坡与其他区域的共用字只有5%,分别为11个(新马)、10个(新台)、8个(大陆新),见图3。
中国大陆与马来西亚的共用字(举例,最高频50字):桑、叠、陷、诞、泊、熊、逆、碾、培、蚪、蝌、旺、帆、刨、吊、谚、旱、驼、瀑、攀、呕、黎、阱、眯、螺、兜、逝、掏、均、粮、拐、玲、蔽、丘、筐、蹄、绅、哩、裹、栅、桩、掘、窿、逮、窟、岗、帘、潜、殖、晕中国大陆与台湾的共用字(举例,最高频50字):蔺、璧、珊、咱、赵、萝、杏、峡、芦、榕、哨、葛、鲸、晏、咚、凤、詹、桂、咕、梢、莺、鸥、愣、蟋、蟀、陡、颇、轿、艇、蜓、酥、飕、秆、魏、淅、涧、迭、簇、菇、笋、匾、吾、牡、霜、谛、翩、铛、啪、邓、拱台湾与马来西亚的共用字(举例,最高频50字):币、栈、贤、姜、宗、娥、褒、侯、签、赌、予、斋、橡、挫、淑、颂、谆、耘、逛、叩、颁、旨、刊、肴、弊、荫、兢、惠、靡、擅、咸、宵、沈、宠、措、奸、祟、践、荼、烹、徙新加坡与马来西亚的共用字(11字):匙、贩、逊、售、妖、吠、薯、肮、啬、蛀、偿新加坡与台湾的共用字(10字):岳、轲、匈、郭、羿、儒、竽、荻、侠、螃新加坡与中国大陆的共用字(8字):鹤、玛、俄、嗖、茧、勘、鹉、鹦大陆台马,554新马大陆,52大陆台新,221062007・23.4单区独用字(818个)仅用于一个区域小学教材中的字,基本上都是历史典故中的人名、地名,或者双音节连绵词中的用字。