网上常见古籍数据库
- 格式:docx
- 大小:16.76 KB
- 文档页数:2
文化学研究利用数字化改进高校图书馆古籍的保护及利用-----以西北民族大学图书馆为例侯颖(西北民族大学图书馆,甘肃兰州730030)摘要:多年来西北民族大学图书馆大力实施本馆古籍保护措施,在解决古籍收藏与利用矛盾方面,采取了数字化、院馆合力开发及向读者面对面开放等相结合的模式。
关键词:古籍西北民族大学图书馆保护利用数字化西北民族大学图书馆是甘肃省民族学、宗教学、少数民族文学和西北地方史志研究及收藏单位,馆藏汉文古籍约3万多册,明清地方志500多种,于右任旧藏金石拓片近3000种。
馆藏藏文古籍4500多种,其中善本古籍107种,藏量居全国高校图书馆之首。
藏文清代手抄本《大藏经•甘珠尔》共105函,用金泥、朱砂、墨汁三色抄写而成,为国内孤本,被学术界和宗为国籍。
2008 ,本共32种古籍《国家珍贵古籍名录',75种古籍《甘肃省珍贵古籍名录》。
1.古籍保护过程中存在的问题1.1古籍馆藏条件不完善相对于出藏量,本馆古籍保护条件还不够善。
“古代文本是三:一是经,二是人才缺乏,三是管理缺乏”®°4)。
西北民族大学校本图书于代,内i 旧,“、、、、、、,及人为”®®,于古籍及$本馆汉藏文古籍书,仅书内,书内、内,、防晒、防尘、水基本没有,长此以往造成一些古籍纸张变黄发脆,部分古籍出现不同程化、蛀、破、散佚情况。
1.2古籍管理队伍不稳定早期本馆未能立一支稳定古籍工作专业队伍,古籍管理人员大多没有历史文献专业学历,目录学、文学、版本学知识,对古汉语、文字、考据信息判断力不足,对古籍的著录往往不够准确和规范,且本馆对古籍管员能力培养够重视,造成馆藏古籍普查工作进展缓慢、古籍家底数目不清、古籍数据信息整不准确。
本馆古籍数据卡片目录为主,古籍书目信息无法检索机查询,古籍文献资源的有限输出全靠人工方式完成。
1.3古籍查阅限制过多古籍文是不可再生资源,“历史越久,数量愈少,存世越久,愈显珍贵,但是又越难保存*!(11),且“文献用纸的寿命文”帧02〉。
数字人文背景下图书馆古籍数字化新实践——以云南省图书馆古籍数据库建设为例颜艳萍(云南省图书馆,云南昆明650031)[摘要]数字人文的理论指导与技术支撑,为古籍文献的深层次开发提供了新思路。
通过对数字人文理念和当前古籍数字化建设实践的梳理,分析了图书馆常用的语义检索、地理信息系统等古籍文献资源数字化建设常用技术在古籍文献数字化中的新应用。
[关键词]数字人文古籍数字化关联数据G I S数据库建设[分类号]G2531引言随着大数据、人工智能等现代信息技术的飞速发展,数字技术同人文社科这两大领域彼此间的交融和渗透,催生出一个全新的领域,即数字人文。
其凭借特有的跨学科、跨领域的特点,深刻地影响着历史、文学、计算机科学等学科的演进,也为古籍资料的重新整合、梳理及使用创造了条件,使其拥有更先进的探究方法、工具和平台。
古籍是中华民族文化遗产的重要瑰宝,受自然环境与人为因素的影响,古籍原本流失严重,现存古籍破损情况严重。
据不完全统计,我国现存古籍超过五千万册,其中有三成多损毁严重,急需得到抢救性保护。
[1]“古籍数字化,是指利用现代信息技术对古籍文献进行加工处理,使其转换成计算机能够辨认的数字信息,构建古籍文献书目数据库及古籍全文数据库,全面呈现古籍信息资源的一项系统工作。
”[2]它使古籍文献的文化价值和社会服务功能得到充分体现。
可是大部分古籍数字化产品仅仅是原件的替代品,文献检索基本只能达到基于字符匹配的全文检索层次,不能对古籍文献进行深度挖掘利用,利用率较低。
近年来,数字人文逐渐兴起,给古籍数字化深度发展提供了全新的理论根据和实际操作方法,使古籍的文本挖掘、语义分析、智能标点、文本可视化、语料库建设等成为可能。
2数字人文概述数字人文是将现代计算机及互联网科技深度运用到传统人文学科的探究和教学当中的全新领域。
它将现代计算机及通信技术运用到文献学、统计学、历史学、艺术学等传统人文学科中,为人文学科研究提供了新的研究方法与范式。
古籍书目数据库建设面临的问题及解决措施古籍书目数据库建设是当前学术界和文化领域的一项重要工作。
随着数字化技术的发展,越来越多的古籍书目得以数字化存储和传播,这为学者和爱好者研究和欣赏古籍书目提供了更便利的途径。
古籍书目数据库建设面临着一系列问题,需要我们采取一系列解决措施,以提高古籍书目数据库的质量和可用性。
一、面临的问题:1. 古籍书目数量庞大:古籍书目的数量庞大,包括文、史、哲、艺术等方面的丰富资源,这就需要大量的人力和物力去整理、数字化和存储这些古籍书目。
2. 古籍书目信息碎片化:古籍书目信息碎片化严重,存储在不同机构和个人手中,检索困难,信息无法被完整的连接和利用。
3. 古籍书目质量参差不齐:由于古籍书目的保存和传播受到历史和自然条件的限制,其质量参差不齐,可能存在缺页、断简、错讹等问题。
4. 古籍书目分类复杂:古籍书目多样丰富,不同地区、不同年代的古籍书目分类习惯和规范不尽相同,给数据库建设带来了一定的困难。
二、解决措施:1. 利用现代科技手段提高工作效率:可以利用OCR文字识别技术、数字化扫描技术等现代科技手段,大大提高古籍书目信息的数字化速度和精度,降低人力成本。
2. 构建统一的古籍书目数据库平台:各地的古籍书目资源应当统一整合到一个数据库平台中,以解决古籍书目信息碎片化的问题,方便用户检索和利用。
3. 加强古籍书目质量检测和修复工作:在数字化过程中,要加强对古籍书目的质量检测和修复工作,减少错讹和缺损,保障古籍书目数据库的质量。
4. 制定统一的古籍书目分类规范:建立统一的古籍书目分类规范,以解决古籍书目分类复杂的问题,方便用户查找和利用古籍书目信息。
古籍书目数据库的建设是一项重要而艰巨的工作,需要学术界、文化机构和政府部门的共同努力。
只有加强古籍书目数据库的建设,才能更好地保护和传承我国的优秀传统文化,为学术研究和社会发展提供更加丰富的资源。
相信随着我们的共同努力,古籍书目数据库的建设将会取得更大的成就。
1.技术部分1.1技术方案1.1.1项目需求分析齐鲁大地传承千年的文脉,孕育了浩如烟海的珍贵古籍。
历经漫长历史岁月,这些多数存放在图书馆库房的宝贝,很多已损毁严重。
留存与修复、传承与发展,是山东乃至全国古籍从业者必须直面的课题。
我馆编制《山东省古籍数字图书馆工程——易学古籍数据库建设拟用书目》同时形成《山东省古籍数字图书馆工程建设方案与建设标准》对本馆古籍数字图像库:约900种,每种平均6册,每册有60页的筒子页,约32万页,进行数字化加工。
全面掌握全省易学古籍存藏情况,按照国家古籍编目标准,编制《山东省古籍数字图书馆工程——易学古籍数据库建设拟用书目》。
调查海内外当代大型古籍数据库情况,研究内容构成、使用方法、技术标准、优劣成败等情况,进行规律性总结,形成《山东省古籍数字图书馆工程建设方案与建设标准》。
4.1.2使用的技术标准相关规范标准A、安全性标准规范《计算机信息网络国际联网保密管理规定》,国家保密局发布《中华人民共和国计算机信息网络国际联网管理暂行规定》中华人民共和国国务院令第195号《计算机病毒防治管理办法》中华人民共和国公安部令第51号B、业务性标准规范《中华人民共和国档案法》国家档案局《CAD电子文件光盘存储、归档与档案管理要求》GB/T 17678.1-1999《档案著录规则》DA/T18-1999《电子文件归档与管理规范》GB/T 18894—2002《纸质档案数字化技术规范》DA/T31-2005《开发利用科学技术档案信息资源暂行办法》1998年10月26日国家档案局、财政部发布计算机软件工程规范国家标准汇编,GB/T16398-96《国家行政机关公文格式》标准,GB/T 9704-19《山东省古籍数字图书馆工程建设方案与建设标准》《山东省古籍数字图书馆工程——易学古籍数据库建设拟用书目》4.1.3技术解决方案4.1.3.1技术背景北京方圆慧图采用计算机技术,对古籍古籍进行全文数字化加工处理,制作成古籍古籍书目数据库和古籍全文数据库,不仅有效保护古籍,而且能更好地传播利用古籍,提高古籍古籍的使用率。
解析“中医古籍图像数据库”的图像标引丁侃;胡晓峰;张丽君【摘要】通过对中国中医科学院中国医史文献研究所在“中医古籍图像数据库”建设过程中的图像标引工作的介绍,探讨标引规则的制定;对书目、版本、图像本体3类共26项元数据进行详尽说明,辅以必要的示例;并对出处标引、规范制定、提高识图能力、细化释图文字标引等重点、难点问题进行讨论。
%By introducing image indexing in the construction period of“TCM Ancient Books Image Database”, the establishment of indexing regulations are explored; 26 items of metadata about the book, edition and image were elaborately explained, accompanied by necessary typical examples; the important and difficult problems including the reference and indexing, regulation establishment, raising the ability of image identification, refining figure legends were discussed.【期刊名称】《西部中医药》【年(卷),期】2016(029)005【总页数】4页(P48-51)【关键词】中医;古籍;插图;标引;图像数据库【作者】丁侃;胡晓峰;张丽君【作者单位】中国中医科学院中国医史文献研究所,北京 100700;中国中医科学院中国医史文献研究所,北京 100700;中国中医科学院中国医史文献研究所,北京 100700【正文语种】中文【中图分类】R-092本研究中的“中医古籍图像”,主要是指各类中医古籍中所刊载的承载中医知识的各类插图。
2012年4月内蒙古科技与经济A pril2012 第8期总第258期Inner M o ngo lia Science T echnolo gy&Economy N o.8T o tal N o.258从古籍书目数据库建设与数字化看图书馆古籍工作人才的培养乔雅俊(首都图书馆历史文献中心,北京 100021) 摘 要:图书馆在古籍收藏方面有着重要的地位。
图书馆古籍工作人员的素质高低直接影响着古籍保护与整理工作的进程与质量。
本文通过对图书馆古籍书目数据库和古籍数字化方面从业者的现状谈谈图书馆古籍工作者必备的素养,并对培养计划提出自己的意见。
关键词:古籍;书目数据库;古籍数字化;人才培养;图书馆 中图分类号:G251.5 文献标识码:A 文章编号:1007—6921(2012)08—0135—02 在中国五千年的历史长河里,祖先为我们留下了浩如烟海的珍贵典籍。
这些典籍忠实地记载了中华民族的历史,是中华民族的宝贵精神财富,也是全人类的文化瑰宝。
据不完全统计,我国现存有古籍约10万余种,其中大量的古籍藏于各种类型的图书馆。
以笔者所在的首都图书馆为例,所藏的线装古籍约43000余种、43万多册,善本古籍3千多种,是古籍藏量较多的公共图书馆之一。
作为古籍重要的收藏机构之一,在如何保护、整理和开发古籍方面,图书馆负有重任。
而图书馆的古籍工作人员作为具体工作的承担者,其工作能力与业务素质的高低直接影响着古籍保护与整理工作的进程与质量。
在当前的形势下,既要完成好传统的工作内容,又要适应网络化、数字化的新环境对工作提出的新要求,图书馆古籍工作人员必须全面提升自己的综合素质和工作能力,为图书馆在古籍整理项目中发挥应有的价值做出自己的贡献。
信息社会中的图书馆已经由原来的“藏书楼”成为文献信息中心。
社会职能与角色的转变必然带来工作内容的变化。
古籍书目数据库的建设是图书馆最基础的业务之一,古籍数字化代表了古籍整理未来的方向,这两项工作在图书馆古籍工作中非常重要。
∗本文系山东省高等学校青年创新科技计划 儒家文化与文学关系研究 (项目编号:2020RWC004)的研究成果之一㊂作者简介:董守轩,博士研究生,研究方向为数字人文㊂收稿日期:2023-10-29㊀㊀㊀㊀责任编辑:杨千子ʌ数字㊃人文ɔ数字人文视角下古籍资源知识挖掘与可视化研究∗以‘隋唐演义“为例Ә董守轩中国海洋大学文学与新闻传播学院,青岛,266100[摘㊀要]文章从数字人文角度出发,以图书馆馆藏资源及各类电子数据库为主要来源,运用SNS ㊁Python ㊁Ge-phi ㊁QGIS 等技术和软件,通过数据模型和传统图表结合的形式,绘制历史演义小说‘隋唐演义“人物关系及时空分布的可视化图谱㊂相关的分析结果有助于完成古籍的深入挖掘,丰富人文研究的范式,为古籍资源的整合与知识数据的联结提供新的思路㊂[关键词]数字人文㊀‘隋唐演义“㊀人物关系㊀时空分布[中图法分类号]G353㊀㊀㊀㊀㊀[文献标识码]A㊀㊀㊀㊀[文章编号]1003-7845(2024)01-0056-08[引用本文格式]董守轩.数字人文视角下古籍资源知识挖掘与可视化研究 以‘隋唐演义“为例[J ].高校图书馆工作,2024(1):56-63.引言数字人文(Digital Humanities),是以数据为基础,以平台为支撑,运用数字技术方法来研究人文科学的一门学科[1]㊂这一术语最初来自人文计算(Humanities Computing)领域,早期的人文计算仅是一种纯粹的技术工具㊂此后,随着技术的进步及时代的发展,人文计算理论与实践不断完善,逐渐被用于一些人文社科领域㊂20世纪90年代初,人文计算开始被当作一个独立的交叉学科[2]㊂2001年,约翰纳㊃德鲁克(Johanna Drucker)计算机与人文协会和在文学与语言计算协会(ACH /ALLC)联合会议上作的报告‘现状核实:数字人文项目与前景“(Re-ality Check :Projects and Prospects in Digital Humani-ties )是 数字人文 在学术领域的首次出现㊂2004年,苏珊㊃施莱布曼等人编纂的‘数字人文指南“使用数字人文概念,标志着这一术语从人文计算到数字人文的转变[3]㊂事实上,数字技术的发展对传统人文学科产生了极为重要的影响,比如各类古籍数据库的出现,如爱如生中国基本古籍库[4]㊁鼎秀古籍全文检索平台[5]㊁中华经典古籍库[6]等㊂这些数据库往往存储了海量的古籍文献,研究者可以通过其检索功能迅速㊁精确㊁全面地找出目标古籍的相关内容,从而开展研究㊂部分高校图书馆还提供书籍的电子扫描㊁文本识别㊁资源共享等服务,对文献资料的保存㊁整理㊁研究起到重要作用㊂除数据库外,数字人文还促进了学术地图平台及各类人物世系数据资源的建构,如王兆鹏教授团队开发的 唐宋文学编年地图 平台[7],徐永明教授团队开发的 学术地图发布平台 [8],美国哈佛大学包弼德教授联合北京大学等机构合作建立的 中国历代人物传记资料库 [9]等㊂目前,部分高校图书馆也将这些非文献类的新型数据库纳入馆藏,作为师生学术研究的重要依据及来源㊂除上述宏观层面的实践外,部分学者也开始使用SNS㊁GIS㊁NLP 等数字技术及相关软件对文学作品进行数字化呈现㊂如赵薇[10]借助SNS 对‘大波“三部曲人物关系及社会网络进行可视化研究㊂徐永明等[11]利用GIS 软件将‘全元诗“作者的地理分布进行可视化呈现㊂孙建旺等[12]借助SVM 作为机器学习模型,分析微博文本的不同情感类型㊂传统文学作品的早期研究只能通过例证的形式对其中的主要人物或篇目进行分析,难以做到全面覆盖㊂而利用数字技术处理文本信息,则可以帮助研究者进行全景式 阅读,有效提取目标信息,并通过软件进行可视化㊂这一过程实际上是借助大数据计算及科学图谱模型完成的,利用数字技术处理文本信息改变了传统人文研究的固化思维,并为其提供了新的研究路径㊂‘四雪草堂重订通俗隋唐演义“(以下简称‘隋唐演义“)是清代文学家褚人获所编的长篇章回体小说,也是明清小说的代表之作㊂全书以史为经,以事件为纬,叙述了隋朝至中唐的百余年历史,塑造了众多的人物形象,故事情节中蕴含大量地名㊂书中的人物涉及社会各个阶层,既有王侯将相,也有平民百姓,这些人物以时间为序依次出场,构成了交错复杂的网状结构㊂因此,本文以书中的人物关系㊁空间分布为例,采用数字人文技术及相关理论,运用各类数据库㊁数字软件,以数据模型和图表相结合的形式,对书中人物的社交网络及地理空间分布等要素进行可视化呈现,将书中的人名㊁地名等实体具象化,并挖掘其内在的联系,从而为数字人文研究提供借鉴㊂书中的地名涵盖南北,基本囊括了隋唐时期的重要城市,具有重要的文学与史学价值,对了解明清小说家的创作倾向㊁隋唐的历史发展及图书资源知识的发现有着深刻的意义㊂1㊀‘隋唐演义“数据来源及数据清洗本文选取鼎秀古籍全文检索平台扫描识别的‘隋唐演义“电子版为原始数据来源,利用Python㊁Gephi㊁QGIS等工具,通过数据采集㊁数据清洗㊁数据处理㊁数据可视化㊁数据分析等流程对‘隋唐演义“进行全面而系统的研究,实现对小说知识的挖掘和发现㊂其中,数据采集阶段主要是对书的文本进行爬取,并以txt文件的形式保存爬取出来的数据㊂数据清洗阶段是利用Python中的jieba库进行分词,提取书中的人物㊁地名等内容,并绘制相应的表格㊂数据处理阶段是运用Gephi㊁QGIS等数字软件对书中的社交网络㊁地理分布等进行分析㊂数据可视化阶段是运用Gephi软件对数据进行可视化呈现,形成可视化图谱㊂数据分析阶段主要是对可视化图谱内容展开分析发掘,实现文本内容与数字技术的结合,具体流程如图1所示㊂2㊀‘隋唐演义“社会网络与人物共现关系首先,利用Python中的jieba库对‘隋唐演义“的txt文本进行分词,通过jieba库的posseg模块提取人名,排除非人名词语㊂然后,结合书的具体文本内容及相关的历史文献,对同一个人物的不同指代称谓进行设置,建立映射词表㊂通过软件得到具体数据后,再结合书的文本内容进行人工比对和增补,由此得出‘隋唐演义“所有人物的人名数据㊂再次,使用Python对‘隋唐演义“txt文本进行识别,如果两个人物同时出现在同一段落中,则可认为二者存在某种联系㊂经数据分析与人工核对统计,最终得到书中的302位人物及7220组共现关系㊂最后,将人物与共现关系数据导入Gephi软件进行处理,获得人物共现关系的可视化图谱,并进行网络直径㊁网络平均度等网络特征指标的计算㊂图1㊀‘隋唐演义“资源知识发现流程2.1㊀‘隋唐演义“人物关系挖掘2.1.1㊀共现网络关系图谱建构图,也叫网络,表示为G=(V,E),其中V表示图中的节点集合,E表示图中边的集合[13]㊂在图论中,度数表示一个节点的连接数,即与该节点相连接的边的数目,一个节点的度越大就意味着这个节点在某种意义上越 重要 [14]㊂节点的度与节点的大小相关,节点度值越大则节点面积越大㊂将所得到人物与共现关系数据绘制到Excel表格,以CSV格式保存,利用Gephi软件读取表格数据,并进行人物矩阵网络关系图绘制㊂在操作过程中设置节点的大小,节点大小与度相关,度越大则节点面积越大㊂此外,连接两节点的边的粗细程度反映了两节点联系的紧密程度,两节点间的边越粗则代表联系越紧密,可视化结果如图2所示㊂图2㊀‘隋唐演义“人物共现网络关系2.1.2㊀人物共现关系的网络特征指标分析人物共现关系网络的拓扑结构可以通过网络平均度㊁平均路径长度㊁平均聚类系数等指标进行分析,‘隋唐演义“人物共现关系的网络特征指标数据如表1所示㊂表1㊀‘隋唐演义“人物共现关系的网络特征指标数据集节点数边数网络直径网络平均度平均聚类系数平均路径长度人物共现关系网络3027220623.910.684 2.4㊀㊀通过表1可以看出,本次录入的人物共有302位,他们相互之间构成的社交关系共7220条㊂共现关系网络中的人物,平均需要2 3步即可建立联系,而最长则需要6步才能建立㊂网络中的每个人物平均与23 24个其他人物存在共现关系㊂每个人物之间的平均聚类系数为0.684,即共现概率为68.40%㊂综上所述,‘隋唐演义“中的人物联系较为紧密,具有较为明显的小世界特性㊂2.1.3㊀基于中心度的网络人物中心性分析计算出人物共现关系网络中每个人物的中心度,统计出‘隋唐演义“前40位核心人物,按照中心度的大小依次排列,结果如表2所示㊂表2㊀基于中心度的‘隋唐演义“前40位核心人物㊀㊀结合图2和表2可以看出,秦琼的度中心性最高,在人物关系网络中处于中心地位㊂秦琼出场时间早㊁社交网络广,全书以其为中心连接了众多人物㊂从小说来看,秦琼出身没落的将门,混迹于市井草莽之中,因而结交了各路绿林豪杰㊂本书的前半部分以秦琼为中心,塑造了秦母宁夫人㊁秦妻张氏等女性形象,以及单雄信㊁王伯当㊁徐世勣等英雄形象㊂随着事件的发展引出瓦岗寨与李唐的线索㊂李渊和李世民作为唐王朝的缔造者,广泛联络豪杰㊁讨平各方势力,自然是书中的核心人物㊂而徐世勣㊁程咬金㊁李靖等人都是经历隋末动乱和大唐初建的功臣,与唐密切相关,也是较为重要之人㊂李密㊁窦建德㊁王世充及与之相关的单雄信㊁王伯当等人作为起兵反隋的重要领袖,在小说前半部分有较多的戏份,因此地位也比较突出㊂至于隋炀帝杨广㊁萧后,及与之相关的宇文化及㊁沙夫人㊁花夫人等,在小说中作为反面形象出现,在书里是连接隋唐历史交替的重要纽带,具有不可或缺的作用㊂此外,还有李隆基㊁杨贵妃㊁安禄山等历史人物,虽在小说中出场较晚,但也具有多的戏份,处于重要的社交网络位置,因此地位也较高㊂2.2㊀‘隋唐演义“社交网络人物群体分析2.2.1㊀基于模块化的凝聚子群分解一般认为,模块化指数大于0.3,即代表网络具有较明显的社区结构,真实世界社区的模块化指数通常介于0.3 0.7之间[15]㊂经过计算,‘隋唐演义“网络的模块化指数为0.482,表明其具有较为明显的网络社区结构㊂利用Gephi模块化功能对‘隋唐演义“中的不同群体进行着色,以图谱的形式呈现人物的共现关系网络,从而较为清晰地区分互动相对频繁的群体,结果如图3所示㊂从图3可以看出,‘隋唐演义“人物的共现关系网络大致可分为4个群体,分别是以秦琼等为中心的A群体,占比43.05%;以杨广为中心的B群体,占比33.11%;以李隆基为中心的C群体,占比22.52%;以王勃为中心的D群体,占比1.32%,该群体完全处于边缘位置㊂除群体间的不同外,人物的共现关系网络还存在 中心 边缘 的差异㊂人物的共现关系网络边缘存在的大量孤立节点,说明众多边缘人物共现关联较少㊁地位较低㊂2.2.2㊀基于k-core的人物群体过滤利用k-core社交网络对人物的共现关系网络进行过滤,可以更为直观地看出核心人物及其存在的共现关系㊂根据计算出的人物关系网络特征数据,结合本研究的实际情况,最终以k=12为标准对‘隋唐演义“中人物的共现关系网络进行过滤,保留核心人物群体共现关系,并进行可视化呈现,结果如图4所示㊂图3㊀‘隋唐演义“人物模块化分解共现网络图4㊀‘隋唐演义“人物k-core结构共现网络由于设置了k=12的参数,故图3人物模块化分解共现网络中的D群体因重要程度较低而消失㊂需要说明的是该群体比较特殊,仅有王勃㊁宇文钧㊁阎伯屿㊁吴子章4人㊂此4人仅出现在小说的第71回 武才人蓄发还宫秦郡君建坊邀宠 ㊂究其原因,是作者褚人获在撰写‘隋唐演义“的过程中,有意地将王勃为滕王阁撰写‘滕王阁序“的历史典故穿插进去㊂此章过后,书中便再未对该群体4人的生平活动进行交代㊂2.2.3㊀核心人物群体分析根据‘隋唐演义“人物在共现关系网络中的中心度排名㊁基于模块化的凝聚子群分解以及基于k-core的人物群体过滤,统计并划分前40名核心人物群体,结果如表3所示㊂表3㊀‘隋唐演义“核心人物群体划分编号核心人物核心人物数/所在群体数1秦琼㊁李世民㊁李密㊁李渊㊁窦建德㊁单雄信㊁贾润甫㊁王伯当㊁徐世勣㊁程咬金㊁王世充㊁翟让㊁李靖㊁李如珪㊁柴绍㊁罗士信㊁罗成㊁齐国远㊁秦怀玉㊁魏征㊁张公谨㊁窦线娘㊁张氏㊁尉迟恭㊁刘武周㊁李元吉㊁宁夫人㊁宇文述㊁孙安祖29/1302杨广㊁萧后㊁袁紫烟㊁宇文化及㊁沙夫人㊁杨义臣㊁朱贵儿㊁花夫人8/1003李隆基㊁杨贵妃㊁安禄山3/684无0/4㊀㊀‘隋唐演义“的人物分属4个群体,设置编号为1㊁2㊁3㊁4㊂结合表2可以看出,前40位核心人物在其中3个群体中都有分布㊂以秦琼㊁李世民㊁李密等人为代表的群体1所涵盖的核心人物最多㊂这些人物主要活动于小说的前期和中期,部分经历了隋唐两朝,见证了隋亡唐兴的历史进程,也是书中最为重要的一个群体㊂从人物构成来看,其主要是李渊父子及隋末的各路豪杰,如李密㊁窦建德㊁贾润甫等㊂需要注意的是,宇文述虽被归为这一群体,但其与以杨广为代表的群体2也有着密切联系,情况较为特殊㊂以杨广㊁萧后㊁袁紫烟为代表的群体2主要活动在隋末这一时间段,在书中的前半部分出场㊂从人物构成来看,这一群体具有明显的 隋 属性,多为隋朝的武将谋臣和后宫妃子㊂其中,萧后㊁袁紫烟等都是后妃,长期陪伴在杨广周围㊂宇文化及㊁杨义臣两人一奸一忠,都是杨广较为倚重的臣子㊂他们常出入宫廷,为杨广出谋划策,也形成较为紧密的人物关系㊂群体3的人数较少,只有李隆基㊁杨贵妃及安禄山3人㊂他们虽出场时间较晚,但却是全书后半部分的关键人物㊂李隆基晚年沉迷享乐,任用李林甫㊁杨国忠等人,导致朝政腐败,最终爆发安史之乱㊂在小说里,李隆基专宠杨贵妃,两人往来频繁,关系极为密切㊂而安禄山前期刻意讨好唐玄宗李隆基,后期则形成敌对,构成了复杂的人物关系㊂上述群体不仅在内部互相联系,还在外部与其他群体保持沟通与互动㊂尤其是群体1和群体2的多位人物都有着双向的互动,如群体1的所有人原先都是群体2中隋炀帝杨广的臣子,李渊㊁李世民更是传统意义上的 皇亲国戚 ,只是随着隋炀帝杨广的倒行逆施才反叛㊂此外,群体2中的袁紫烟本是隋炀帝的妃子,隋亡后流落民间,结识了群体1中的贾润甫㊁徐世勣等人,并最终嫁给徐世勣,加入李氏父子的阵营㊂由此完成了从群体2到群体1的转变㊂而群体3的李隆基在小说中不仅是李渊的后代,还被设定为隋炀帝宠妃朱贵儿的托生,而杨贵妃则相应地成为杨广的转世,两人由隋入唐,经历了两世的姻缘结合,这一点带有轮回果报的宗教思想㊂因此小说不同群体人物之间往来频繁,联系紧密㊂2.3㊀数字人文视角与传统人文视角人物研究对比与传统人文视角相比,数字人文视角下的‘隋唐演义“人物研究具有以下3个新的特点:其一,研究的人物数据更多㊁涉及范围更广㊂数字人文研究借助数字技术,对书中的全体人物进行分门别类的详细探究,研究对象更加全面,研究结论更加可信㊂其二,利用Python㊁Gephi等软件将书中的文本信息进行可视化呈现,还原所有人物的社交网络关系,能更为直观地识别人物之间的社会关系及联系的密切程度㊂其三,在图谱的基础上,运用科学的SNS理论分析文本,借助相关的技术理论将书中人物划分为不同的凝聚子群,了解其内部关系及外在联系,更好地把握书中的人物布局㊂3 ‘隋唐演义“府㊁州㊁郡的时空分布首先,利用中国历史地理信息系统(CHGIS)及中国历代人物传记资料库(CBDB)的地名沿革系统,限定时期为 隋(公元581年 公元618年) 唐(公元618年 公元907年) ,查找书中府㊁州㊁郡的经纬度坐标,保留3位小数㊂其次,将书中府㊁州㊁郡地名和出现频次绘制成Excel表格,结果如表4所示㊂表4㊀‘隋唐演义“中的府㊁州㊁郡空间及密度分布3.1㊀‘隋唐演义“府㊁州㊁郡时间分布特点作为一部历史演义小说,‘隋唐演义“以时间顺序进行叙事,但时间线索相对隐晦,只能通过不同皇帝的在位情况予以辨别㊂从书中的文本内容来看,大体可分为3个阶段:隋文帝 隋炀帝时期,唐高祖 唐太宗时期,唐高宗 唐代宗时期㊂将‘隋唐演义“的txt 文本按照上述3个阶段进行划分,并将其保存为3个txt 文件,运用Python 软件依次统计长安㊁洛阳㊁潞州等7个府㊁州㊁郡在3个时期的出现频次,绘制出河流图,结果如图5所示㊂图5㊀‘隋唐演义“代表城市各个时期频次河流分布㊀㊀从图5中可以较为直观地看出,除西都长安㊁东都洛阳在3个时期内的分布较为均匀外,其余府㊁州㊁郡的分布都呈现出明显的下降态势㊂这些州㊁府㊁郡都集中在书中的第一个阶段(隋文帝 隋炀帝时期),而到了唐代以后,他们的出现频次陡然减少㊂结合书中的具体内容来看,隋末群雄并起㊁逐鹿中原的情节显然是全书的中心,也是作者着力刻画的部分㊂书中的主要人物秦琼㊁李世民㊁李渊等主要活跃于这一时期㊂而自第47回隋炀帝身死,至第100回唐代宗即位㊂作者用了一半的篇幅描写了唐朝百余年的历史,略显冗长散漫㊂通过历时变化可以看出,书中所讲述事件的后期从关注全国各地的人物事件,到只关注东㊁西二京的历史人物,经历了由整体地域空间到局部中心城市的转变㊂3.2㊀‘隋唐演义“府㊁州㊁郡空间分布特点‘隋唐演义“中出现的府㊁州㊁郡一级地点共57处,涉及较多的地名㊂从表4空间及密度分布来看,频次区间为 1 5 的府㊁州㊁郡级地名有30处,约占地名总数的一半㊂此外,区间为 6 10 的地名有9处,区间为 11 20 的地名有7处,区间为 21 50 的地名有4处,区间为 51 100 的地名有4处,区间为 101 300 的地名有3处㊂可见,即使是那些重要性不高的府㊁州㊁郡,‘隋唐演义“也给予了一定的记录㊂而涉及重要人物㊁事件的地方,更是加强着墨㊂ 记所遇之地,即系地;记相见之时,即编年㊂ [1]‘隋唐演义“已具备一定的 系地 意识,有意识地对地域空间进行记录,从而使文本内容更加真实可信㊂此外,这样的行文方式对事件的展开起到了一定的辅助作用,可以帮助受众更好地理清人物与空间的交互关系㊂小说描绘的是隋唐故事,这一时期的重大历史事件往往集中在长安㊁洛阳㊁幽州等北方都会,如李渊父子起兵于太原㊁安史之乱爆发于范阳㊁张巡死守睢阳等㊂同时,书中前半部分出场的豪杰也多为北方人士,故小说总体以北方各州郡为中心,呈现北多南少的特点㊂此外,书中的地名主要集中于唐代的河东㊁河南㊁河北3道㊂其中,河东道下辖的太原府是李渊父子的根据地,聚集了众多英杰,河东道的泽州㊁潞州也是小说较早出现的地名,重要人物秦琼㊁单雄信等人早期活动于此;河南道包括今山东大部及河南一部,其下辖的齐州㊁青州等属现在的山东,早期王伯当㊁程咬金等英雄人物位于此,导致此道地名较多;与之有别,河北道各州郡出现时间较晚,多在第14回后出现,其所属的幽州㊁贝州㊁涿州,属反派窦建德㊁安禄山等人的势力范围㊂3.3㊀数字人文视角与传统人文视角时空研究对比与传统人文视角相比,数字人文视角下的‘隋唐演义“空间研究具有几个新的特点:其一,可以采集的地理数据更多㊂传统研究往往只能选取个别地域,如对关陇地区隋唐人物进行研究[16-17]等㊂而数字人文研究可借助GIS技术及Python㊁QGIS等软件,对书中出现的地名及人物活动地域进行精确的经纬度定位,从而得出更为准确且全面的结论㊂其二,传统空间研究无法直观还原空间分布特点,而数字技术可以在唐代当时的历史地图上直接实现标注,形成空间及密度分布表,以图表和数据的形式使府㊁州㊁郡的区划分布变得一目了然,便于后续研究的展开㊂其三,传统研究不能做到深入理解书中不同时期的空间分布特点,而通过数字技术可以实现对‘隋唐演义“文本的拆分,从而对不同历史时期的府㊁州㊁郡分布有更为直观的了解,由此探知书中的编排布局及创作规律,从而更好地分析书中人物与时空分布之间的联系㊂4 结语本研究充分运用数字人文技术及SNS㊁GIS的相关方法论,从非结构化的‘隋唐演义“的小说文本中抽取出结构化的人物与府㊁州㊁郡实体,进行社交网络及地理空间分布的可视化分析㊂需要注意的是,本文仅是基于长篇历史小说‘隋唐演义“的文本所展开的人物关系挖掘,网络所呈现的人物关系及地域空间与真实的历史可能会有所出入㊂此外,小说中的一些人物塑造得比较简略,地名存在偏差,因此一定程度上会影响研究的准确性㊂总之,本研究是将社会网络分析及地理信息系统用于分析古典长篇历史演义小说的实践尝试㊂通过数据采集㊁数据清洗㊁模型构建㊁数值统计㊁分析阐释等步骤完成从质化描述到量化分析㊁传统文学研究到数字人文结合的转变,在一定程度上拓宽了学术视野,为文学研究带来新的思路与方法㊂期待未来有更多的学者运用先进的数字技术研究传统人文学科,并推动其向前发展㊂参㊀考㊀文㊀献[1]㊀王兆鹏,邵大为.数字人文在古代文学研究中的初步实践及学术意义[J].中国社会科学,2020(8):108-129,206-207. [2]㊀赵雪芹,党昭,李天娥.数字人文视角下的档案信息资源开发问题与对策[J].北京档案,2021(1):18-22.[3]㊀薄一航.后数字时代计算思维下的电影研究新范式[J].北京电影学院学报,2023(10):23-32.[4]㊀爱如生中国基本古籍库个人版[EB/OL].[2023-11-17].ht-tp:///.[5]㊀鼎秀古籍全文检索平台[EB/OL].[2023-11-17].https://.[6]㊀中华经典古籍库[EB/OL].[2023-11-17].http://publish.an-/docShuju/platformSublibIndex.jspx?libId=6.[7]㊀搜韵.唐宋文学编年地图平台[EB/OL].[2023-11-17].ht-tps:///MPoetLifeMap.aspx.[8]㊀学术地图发布平台[EB/OL].[2023-11-17].http://amap..[9]㊀中国历代人物(CBDB)[EB/OL].[2023-11-17].https:///biog.[10]赵薇.社会网络分析与 ‘大波“三部曲 的人物功能[J].山东社会科学,2018(9):50-64.[11]徐永明,唐云芝.‘全元诗“作者地理分布的可视化分析[J].浙江大学学报(人文社会科学版),2019(1):150-160. [12]孙建旺,吕学强,张雷瀚.基于词典与机器学习的中文微博情感分析研究[J].计算机应用与软件,2014(7):177-181. [13]Even S.Graph Algorithms[M].Cambridge:Cambridge UniversityPress,2011:1.[14]张春红,于翠波,朱新宁,等.社交网络(SNS)技术基础与开发案例[M].北京:人民邮电出版社,2012:42.[15]Green D G,Liu J,Abbass H A.Dual-phase evolution[M].NewYork:Springer,2014:3-40.[16]徐清廉.论隋唐的门阀之争与关陇集团[J].西北大学学报(哲学社会科学版),1981(1):91-98,111.[17]刘彭冰.关陇集团与关中文化本位研究综述[J].西部学刊,2017(12):36-38,63.Study on the Exploitation and Visualization of Knowledge in Ancient Book Resources from the Perspective of Digital Humanities: Taking Romance of the Sui and Tang as an ExampleDong ShouxuanCollege of Liberal Arts,Journalism and Communication of Ocean University of China,Qingdao,266100 Abstract㊀This article,from the perspective of digital humanities,utilizes library collection resources and various electronic databases as the main basis.It employs methods and software such as SNS,Python,Gephi,and QGIS to draw the visualized charts of character relationships and temporal-spatial distribution in the historical fiction Romance of the Sui and Tang through a combination of data mod-els and traditional charts.The analysis results contribute to the in-depth exploration of ancient books,enrich the paradigm of humani-ties research,and provide new ideas for the integration of ancient book resources and the linkage of knowledge data. Keywords㊀Digital humanities;Romance of the Sui and Tang;Character relationship;Temporal-spatial distribution㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀(上接第48页)A Systematic Review of Research Data ManagementCapability Maturity Assessment ModelsJin YegangFudan University Library,Shanghai,200433Abstract㊀The research data management capability maturity assessment model identifies and improves deficiencies in practices by comparing current research data management practices with best practices.This study aims to describe the current state of development of research data management capability maturity assessment models in the context of Big Science. To this end,a systematic mapping study was conducted on a series of high-quality research results published in five related databases.The analysis of30research out-comes highlights the deficiencies and challenges in the field.Despite the gradual refinement of the concept of research data manage-ment,there is a lack of good consensus on the domain ontology among scholars,and the absence of objective factors in the models leads to insufficient innovation motivation in the field.In addition,there are issues with the unclear role positioning of management institu-tions in the assessment models and a significant lack of interaction between model construction and entities outside academia.The arti-cle hopes to provide new research directions and suggestions for the future study of research data management capability maturity assess-ment models.Keywords㊀Research data management;Capability maturity;Maturity assessment;Systematic review;Systematic mapping study。
网上常见古籍数据库(截止2012年)作者:blueteaflower
国图普通古籍书目数据库国家图书馆/(暂停)
国图善本古籍书目数据库/(暂停)
国图方志家谱书目数据库/(暂停)
中国石刻托片资源库http://202.96.31.42/ros/index.htm(可用)
国际敦煌项目(IDP) /(可用)
西夏碎金http://202.96.31.42:9080/wenxian/index.htm(可用)
国图敦煌资料库/newpages/database/dhzl.htm(可用)
中国金石拓片影像数据库/RubbingImg/(可用)
上图馆藏古籍全文检索库上海图书馆/gjsb/gjwb.htm(暂停)
上图藏宋元善本全文资源库/digilib/gj/index.htm(暂停)
上图名人家谱库/digilib/zjxm/jp.htm(可用)
上图盛怀宣档案库/digilib/zjxm/sxh.htm(可用)
上图民国图书库/digilib/mgts/index.htm(可用)
明清北京城垣资源库首都图书馆/guest/search/zhuantiku3.asp?TMPID=8
天津图书馆古籍善本选粹
天津图书馆/gszc/gjcx.asp(可用)
天津图书馆藏古籍善本图录/gcjp/sbtl.htm(可用)
太平天国史料库广西壮族自治区图书馆http://202.103.233.139/trsweb/tptg.htm(可用)北京师范大学珍稀期刊北京师范大学图书馆http://202.112.82.196:8080/was40/(可用)北京师范大学图书馆馆藏精品北京师范大学图书馆/featured/picture/FrameSet.htm(可用)
吴江市图书馆部分馆藏方志吴江市图书馆/gj/index.htm(可用)泉州市图书馆馆藏谱谍库泉州市图书馆/gcdp.htm(可用)
绍兴方志绍兴图书馆/gycslou/fzsy.htm
古香书斋山东省图书馆/special/classicality/index.jsp(可用)
中国古本小说目录金陵图书馆/library/oldnovel/(可用)
古代文献广东省中山图书馆/html/35/3546a0a.htm(可用)
古籍资料库北京市东城区图书馆/main/wxjs/wxjs.asp(可用)
全唐诗电子检索系统北京大学图书馆
/tang/(推荐)
古文献读者检索系统/pages/Search.htm(推荐)
吉林省图书馆古籍缩微品目录吉林省图书馆/gj2.htm(可用)
敦煌学数据库兰州大学/dunhuang/(可用)
绵阳市图书馆古籍线装书目绵阳市图书馆/tqjj/gj.htm(可用)
明清善本书目复旦大学古籍书目检索系统/cjy/guji.htm(暂停)
西安交通大学古籍特藏西安交通大学/html/xjtu/ckzl/guji/Index01.htm(可用)
国学宝典古文检索郭店楚简资料库香港中文大学图书馆.hk/(可用)
善本图书联合目录台湾中央图书馆
.tw/f89.htm(可用)
善本丛刊影像.tw/flyweb/ncl-book/index.htm(可用)
古籍影像检索系统/cgi/s_show?help(可用)
中华大藏经中国数字图书馆http://202.96.31.113/dzj01.htm(可用)
四部丛刊、四库全书北京书同文数字化技术公司/html/index.htm(可用)
中华古籍电子书北极星书库/gudian1chm.html(可用)
古籍图书库数字方舟/tushu/gjtsk/(可用)
国家档案文献库超星数字图书馆/zhuanti/dawx/index.html(可用)
四库全书目录国学网
/skqs/index.htm(可用)
古籍整理出版情况简报/gjzl/gJ_0.htm(可用)
国学宝典文献检索系统/web/home.htm(暂停)
宗教典籍中华古籍网/know/buddhism/regionbook.htm(可用)
中华古籍全文资料中华古籍网/know/hist/book.htm(可用)
古籍善本交流世界出版网(可用)
简帛研究论文简帛研究
/index.htm(可用)
简帛图片/Jbtk/pic.htm(可用)
甲骨文字库殷商文化网
/yswh/ys/jagu/jkzk.htm(可用)
精美甲骨/yswh/ys/jagu/beauty/beauall.htm(可用)
拓片大集/yswh/ys/jagu/tpdj.htm(可用)
中医电子书电子中医药古籍文献/nw2001/huagtemplate.htm(可用)
中醫電子書/TcmetGB/CnHuag_Template.htm(可用)
明清研究论文明清研究会(台湾).tw/~mingching/(可用)
典藏目录及资料库台湾汉学研究中心.tw/(可用)
唐宋文史资料库网路展书读.tw/(可用)
中文全文资料中央研究院汉籍电子文献.tw/ftms-bin/ftmsw3(推荐)所藏内阁大库档案目录台湾中央研究院历史语言研究所.tw/database/(暂停)
所藏同仁辑唐宋明清史书目(暂停)
所藏古籍线装书资源东京大学东洋文化研究所http://www.ioc.u-tokyo.ac.jp/~hidemi/ajideji/0.html(可用)
丝路文明美国丝绸之路基金会/toc/index.html(可用)
明史研究美国明史学会/ming/(可用)。