关于古籍数字化理论建构的思考
- 格式:pdf
- 大小:147.12 KB
- 文档页数:4
高校社科动态2006年第4期
关于古籍数字化理论建构的思考
毛建军
(南京大学中文系,江苏南京 210093)
摘 要:古籍数字化属于古籍整理的范畴,代表着古籍整理的未来方向。古籍数字化研究中存在着古籍整理学界参与少,理论研究相对滞后的特点。构建古籍数字化系统理论可以
为古籍数字化出版提供基础理论,开拓古籍整理和古典文献学专业的新视野,为文史研究者
提供新思维和新工具。关键词:古籍数字化;理论建构;古典文献学
古籍数字化属于古籍整理的范畴,代表
着古籍整理的未来方向。数字资源具有占据空间小、存贮量大、检索方便、传输迅速、
易于复制、可以长期保存等诸多优势。因
此,古籍数字化从其产生就受到有关部门和部分学者的关注。1988年曹书杰在5古籍
整理研究学刊6第1期发表了5古籍整理与
电子计算机应用研究的思考6,第一次以论
文的形式探讨了计算机运用到古籍整理的可能性和有效性。在台湾,计算机运用于古籍
整理也开始了真正的实践应用,学术界也首
次提出了古籍电脑化这一概念。[1]20世纪90年代以来,随着大量古籍数字化资源的
开发,实践上的丰富带动了人们对古籍数字
化的研究和思考。
1古籍数字化研究存在的问题与古籍数字化技术研究相比,古籍数字
化理论的研究则相对薄弱。尽管此间发表的
古籍数字化理论研究的论文数量较多,但多
集中在对古籍数字化资源的调查和利用方面,深层次理论探讨的论文则很少。通过对
近20年发表的古籍数字化研究的论文分析,
我们可以发现古籍数字化研究的两个特点:一是图书馆学界、信息管理学界参与的
多,古籍整理学界参与的少。从古籍数字化资源开发主体和发表论文的作者来看,参与
开发和研究的单位与人员绝大多数属于图书
馆界和信息管理界,而真正从事古籍整理的单位和人员则很少参与这个代表未来古籍整
理方向的工作。目前活跃在古籍数字化研究
中的专家多数是图书馆学界、信息管理学界
的学者。另外从目前部分院校和单位开设的有关古籍数字化的课程来看,信息管理学专
业已有部分高校开设了这样的课程,如南京
农业大学信息管理系侯汉清教授为硕士生开设的5古籍的数字化整理6、台湾国立中山
大学开设的5中文典籍数位化6课程、台北
大学开设的5中文古籍自动化与利用6。这
些课程都不是针对古籍整理专业的学生而开设,而是面向人文学科的学生的信息基础素
质教育课程,主要指导学生了解并能检索和
利用古籍中的文献信息。而令人遗憾的是,
国内古典文献学专业至今未见开设这类课程。存在这种情况的原因,与国内的学科分
工过细有关。由于专业分工过细,文理不
通,古典文献学专业从本科阶段就与计算机40信息技术产生了阻隔。而必须指出的是,古
籍数字化决不是单纯的计算机技术工程,必须要有古籍整理专业人员的参与才会有比较
良好的发展前景。
二是技术实践进展迅速,理论研究相对
滞后,尤其是系统理论缺乏。古籍数字化只是古籍整理手段的革新,这种变化仅仅是外
在技术发生了改变,而本质上仍然属于古籍
整理。古籍数字化在资源开发时必须注意版
本选择、文字校勘、文献辨伪和考证,从事古籍数字化工作的人员也必须要有古典文献
学的基本知识。由于古籍数字化还处在早期
阶段,技术问题仍然还是古籍数字化的关注的焦点,加之古籍整理学界的极少参与,因
此对于古籍数字化的理论思考,尤其是从古
籍整理学的角度去思考古籍数字化,则显得
十分薄弱。尽管国内已有部分学者对古籍数字化的相关理论做出了阶段性的思考,如潘
树广等5文献学纲要6(广西大学出版社,
2000年版)第八章5计算机与文献的生产和检索6,刘琳、吴洪泽5古籍整理学6(四
川大学出版社,2003年版)第九章5古籍
整理手段的现代化6以及苏州大学陈诚和东
北师范大学王冠中的硕士论文5论古典文献数字化6(2004)、5中文古籍数字化成果与
展望6(2005),但多集中在古籍数字化资源
的利用与检索、古籍数字化面临的问题及解决对策和古籍数字化所带来的冲击和影响等
方面的探讨。我们必须明确的是,古籍数字
化本质上属于古籍整理学的范畴,必须遵循
古籍整理学的规律。/古籍数字化的理论问题比技术问题更为重要,因为一旦理论发生
了偏差,技术越高明,则解决方案越是难以
成功。0[2]正是因为缺乏古籍数字化理论的指
导,才造成了目前古籍数字化的理念上的千差万别、质量上的参差不齐和标准上的各自
为阵的局面。因此,建立古籍数字化的系统
理论就显得十分迫切。2古籍数字化的理论建构
数字化古籍¹作为一种全新的文献存在形式,必然给人文学术研究带来新的研究手
段的变化和新的研究思维模式的转换。数字
化古籍,尤其是实现了网络共享的古籍改变
了古籍资源稀缺的状况,同时也实现了资源平等共享的理想,任何个人或单位都可以在
短时间内获得或占有利用古籍资源。同时,
计算机强大的储存空间和自动检索功能也将
彻底改变人脑记忆的限度,利用计算机的强大功能必将让人脑解放出来以用于更多的抽
象思维活动。当然古籍数字化还处在早期阶
段,技术问题仍然还是古籍数字化关注的焦点。但是随着古籍数字化资源的丰富和开发
经验的积累以及古籍数字化理论的成熟,古
籍数字化必将为传统的古典文献学开拓新的
研究领域,带来新的发展契机。依照于鸣镝先生提出的/大文献学0理论,[3]我们认为
这些新领域主要有:
数字化古籍生产学:研究古籍数字化编辑过程及其规律的科学。古籍数字化是一项
艰巨而复杂的系统工程,从组织选题、文字
录入、审校标引、版面分析、特征抽取到系
统配置都是一个全新的挑战。古籍数字化编辑过程也具有其独特的规律。因此,研究这
些规律将有助于古籍数字化的进一步研发。
数字化古籍流通学:研究数字化古籍出版、发行、典藏及其规律的科学。古籍数字
资源的出版发行目前很是混乱,除了数字古
籍光盘一般由出版发行单位遵照电子出版原
则出版外,多数网络古籍出版还处于一种无序状态。数字化古籍的出版应该具有其自身
的运行原则和规律。另外,图书馆和科研院
所引进的古籍数字化资源是馆藏资源的一部
分,也应该遵循数字典藏的基本规律。数字化古籍整序学:研究数字化古籍索
引、导航和链接原理及方法的科学。古籍数
字化最受欢迎的功能就是知识的索引、导航41和链接即超文本系统(Hypertext)。超文本
系统是数字化古籍的灵魂。超文本系统主要利用计算机将文件分成文件单元(tex-
tchunk),并自动提供相关文件单元的链接,
用户可根据需要按照索引导航链任意链接相
关数据。数字化古籍的超文本系统一般是指:简繁字关联、联机字典、Text文本关
联以及知识关联。例如文信传文史研究院/汉文史数据库0(http://www.hancu-l
ture.com/)设计有5人名大典6和5中国历史日历6。所有这些超文本系统都需要古
籍整理专家的参与设计,每一个系统数据库
都具有其基本的规律和特色。数字化古籍利用学:研究如何有效利用
数字化古籍的科学。古籍数字化资源的开发
最终是要为广大用户使用,因此研究如何有
效地利用数字化古籍就成为一个重要的领域。数字化古籍利用应包含两个方面,一是
图书馆有效服务系统,二是个人对数字化古
籍的组织和充分利用。3古籍数字化理论建构的意义
311为古籍数字化出版提供基础理论
对古籍出版工作者而言,古籍数字化为
传统的古籍整理开拓了新的领域,带来了新的发展契机。我国古籍种类繁多,数量庞
大。除纸质的古籍外,还有甲骨文、金文、
陶文、竹简、帛书、石刻、题记等。开发出版古籍,传播优秀文化,是古籍出版工作者
的一项重要任务。数字化古籍以其信息容量
巨大、检索快捷方便等特点显露了其在资源
传播和利用上的极大优势,无疑将扩大古籍图书使用者的范围和使用效率。
然而在古籍数字化进程中还存在一些重
要问题需要古籍出版工作者去思考和解决。
如古籍数字化标准问题。由于各古籍数字化制作机构不同,在利益角度上也各有考虑,
因此在标准与规范方面难以统一,各自独立
的阅读系统,不仅难以与其他古籍数字化项目共享资源,其数字化成果也很难纳入各图
书馆整个的文献资源体系之中。重复开发,浪费资源问题也是一个很值得思考的问题。
例如文渊阁5四库全书6已先后有四家单位
进行过影像的数字化,像5二十五史6、5康
熙字典6这类小规模的古籍,开发者就更多。因此,成立一个统一规划机构对古籍数
字化进行选题部署和出版协调就显得十分重
要。此外,诸如古籍数字化是否市场化、数
字化古籍在古籍保存和利用两方面存在的矛盾问题以及数字化古籍失真等问题都需要古
籍出版工作者去认真思考和解决。
312为古籍整理和古典文献学专业开拓新视野
对古籍整理工作者而言,古籍的数字化
是古籍整理发展的未来方向,顺应这种变
化,是时代提出的新要求。为迎接现代信息技术对古籍整理工作提出的挑战,开拓传统
古籍整理的新领域,古籍整理工作者应该对
古籍的数字化给予高度重视。以目录学为例,随着古籍载体的转变,大量古籍数字光
盘和网络古籍资源的出现,目录学研究对象
也发生了变化。在丰富的数字资源实践的基
础上,南开大学柯平教授甚至提出了/数字目录学0的理念。柯平教授认为从理论来源
来看,数字目录学的基础是在实践的基础上
对目录学发展的需要和对网络信息资源的探索。[4]因此,如何有效地解决古籍数字化资
源的揭示、组织和传播就成为21世纪古典
目录学研究的新任务。校勘和辑佚是古籍整
理中最为费时费力的工作,一部典籍往往耗费整理者一生的精力。而有了计算机辅助,
古籍的校勘和辑佚就显得容易多了。计算机
辅助古籍的校勘和辑佚的最突出特点是对重
出诗文的自动提取的快捷和精确。北京大学李铎教授开发的5全宋诗检索系统6使用格
律诗的向量空间模型,提取出了全部五千余
首重出诗。计算机辅助古籍的校勘和辑佚研42