三大中文期刊全文数据库的比较
- 格式:doc
- 大小:25.00 KB
- 文档页数:6
中文三大全文数据库的比较摘要通过本课程的学习,结合本人的学习情况从三大数据库对论文的收录情况、检索功能、检索结果、检索界面等方面对中文三大全文数据库——《中文期刊网全文数据库》、《维普中文科技期刊数据库》和《万方数据资源系统数字化期刊》进行了比较,阐述了一些自己对这三大全文数据库的认识。
最后并谈了谈本人的学习收获和对本课程的些许建议。
关键词中文期刊网全文数据库维普中文科技期刊数据库万方数据资源系统数字化期刊全文数据库收录情况:这三个数据库基本覆盖了科学技术和社会科学的各个领域。
其中“维普”期刊的收藏量占有绝对优势,几乎覆盖了中国出版的所有中文期刊,并且收录了大量内部发行期刊,收录的年限最长,其中收录自然科学和工程技术方面的期刊量比“CNKI”多出近50%,但在文史哲类方面则几乎是空白,因此,“维普”适合用户进行科技文献的回溯性检索。
“CNKI”重点收录了国内公开出版的核心期刊与具有专业特色的中西文期刊,综合性上做得较好。
而“万方”收录期刊数量为三者中最少,但核心期刊比率高,收录文献的质量最高。
检索功能:三个数据库都提供了关键词、篇名、刊名、作者、机构、文摘等6个检索入口。
就其特殊检索功能而言,“CNKI”在每个检索入口提供了检索词字典,通过使用它可以规范所输入的检索词,有利于更全更准地检索文献信息。
“维普”在主题标引用词的基础上,编制了同义词库,有助于相关文献的检索,提高文献的查全率。
“万方”在检索时,可以对期刊所分布的地域进行限定。
检索结果:比如通过著者字段的检索,张安将教授是从事化学研究的,他所发表的论文是科技方面的,在上表中“CNKI”收录了16篇,“万方”收录了5篇,而“维普”收录了24篇(换成医学方面的);张靖龙教授是从事文学研究的,在上表中“CNKI”收录了9篇,“万方”收录了0篇,“维普”收录了1篇。
从这个比较中可以看出,三个数据库中综合性最强的是“CNKI”。
三个数据库中文摘做得最好的是“CNKI”,不仅可以从中获得文献的基本情况,而且能通过超级链接的方式,找到更多与查找主题相关的内容。
试从文献收录范围、反映速度、文献类型、检索入口、检索技术及检索结果等方面进行比较,《中文科技期刊数据库》、《中国学术期刊数据库》的异同特点数据库《中文科技期刊数据库》(维普)《中国学术期刊数据库》(CNKI)文献收录范围涵盖自然科学、工程技术、农业、医药卫生、经济、教育和图书情报等学科的8000余种中文期刊数据资源。
包括科技、人文、社科所有学科。
核心期刊与专业特色期刊8000余种,文献量2258万余篇。
反应速度很快很快文献类型所有文献被分为7个专辑:自然科学、工程技术、农业科学、医药卫生、经济管理、教育科学和图书情报。
拥有理工A专辑、理工B专辑、理工C专辑、医药卫生专辑、电子与信息专辑、经济与管理专辑。
检索入口支持快速检索、传统检索、高级检索、分类检索、期刊导航等分类检索、初级检索、高级检索和专业检索四种方式。
在每种方式的检索结果(包括二次检索的检索结果)里都可以进行二次检索检索技术特殊检索能力:支持中英文、繁简体混合检索。
同义词检索:参考各个学科主题词表编制同义词库,检索者可自由选择同义词,专业而灵活。
同名者检索:提供剔除同名作者检索能力,帮助提高查准率引文检索:提供引文模块检索,实现双向的文献漫游功能提供引文检索。
二次检索:可以选择逻辑“与”、“或”、“非”的任意一种进行二次检索特殊检索能力:支持全文检索,但字段之间的逻辑组配检索能力差。
同义词检索:提供扩展检索能力,但扩展词表不是严格的学术词表。
同名者检索:不提供引文检索:有引文,但不能跟期刊库互操作。
二次检索:有二次检索,只能选择逻辑“与”进行二次检索。
检索范围:检索的期刊范围上,则是CNKI库优于维普库,CNKI库可以选择EI来源刊、SCI来源刊、核心期刊进行检索,而维普库则是核心期刊和重要期刊检索结果检索结果是按照时间排列的,可以选择每页显示的记录数,每页最多可以显示50条记录。
使用传统检索检得文献的显示和同方库类似,点击文献篇名可以看到该文献的题录信息,且其页面风格与纸本刊物类似,符合大多数人的阅读习惯。
中文期刊全文数据库
主要有哪几个中文全文数据库?
KI中国知网(China National Knowledge Infrastructure):包含期刊、学位论文、报纸等多种形式的文献,多个子数据库,成为目前国内最权威的中文全文数据库,基本上能够检索到各学术期刊从创刊到目前的文章。
2.万方数据:包含期刊、学位论文、会议论文、标准等多种形式的文献,尤其是有标准数据库,可以下载国内各种标准的全文。
数字化期刊这部分内容收录的期刊种类较少,大体上能够检索98年以后的文章。
3.维谱中文期刊全文数据库:以科技期刊为主,能够检索到1989年之后的文章。
CNKI中国知网
•主页内容布局
•期刊文章检索(简单检索、高级检索、专业检索,检索结果的分组与排序、详细记录中文献引用关系
•检索实例
•专业检索作者检索同句检索期刊导航•CNKI知识元简介
检索实例
检索课题:雾霾的监测
课题分析:
1 本课题包含二个概念:雾霾监测。
2 概念扩展:
“雾霾”相关词有:灰霾霾pm2.5
“监测”相关词有:监控
检索式:
TI=(霾+pm2.5)*(监测+监控)
万方数据库
1.主页内容布局
2.期刊文章检索(简单检索、高级检索、检索结果记录特点)
3.学术趋势
维普科技期刊数据库传统检索(同义词与同名作者)高级检索(扩展功能)
分类检索。
浅析万方、维普、CNKI三大全文数据库万方、维普和CNKI都是中国知名的全文数据库,它们的出现为学术研究和科研工作提供了很大的便利,同时也成为了各大高校、研究机构必备的数字化资源。
本文将对这三个数据库进行简要分析比较。
一、万方数据库万方数据库成立于1993年,是一家专业的学术论文数据库出版商。
初期,万方的数据仅仅是在一些学术刊物上进行索引和收集。
后来,万方开始充分利用其兽医信息库、地学文献库、中药文献库等多个专门领域的数据库,推出了“万方数据”全文数据库,覆盖几乎所有领域的学术文献,以满足读者和作者的需求。
目前,万方全文数据库中约有5600多万条记录,包括7388种学术期刊、3515种会议录、2200种博硕论文等,内容涉及自然科学、社会科学、医药卫生、农业、工程技术等各个领域。
其中,自然科学领域的文献比较丰富,覆盖率也较高。
对于一般读者来说,万方文献库的检索界面使用简单,检索速度快,而且用户可以通过“文献下载券”来下载文献。
二、维普数据库维普数据库成立于2000年,是一家高质量的综合性数字化出版服务商。
维普的业务有期刊出版、数字图书出版、学术搜索引擎、学术知识服务平台等。
其中,维普期刊数据库是其主要业务之一。
目前,维普数据库收录学术期刊近三千种,覆盖几乎所有领域。
其中,社会科学和人文科学领域占维普数据库期刊总量的较大份额,自然科学和医学领域则相对较少。
维普数据库的文章多数是付费的,不过有一些优质文章对于普通用户免费开放,并且下载速度也较快。
三、中国知网(CNKI)中国知网,成立于1999年,是中国最大的数字图书馆之一,是中国科技文献数据库的重要组成部分。
知网数据库已发布刊物功能、学位论文功能、会议论文功能、专利功能、标准功能。
CNKI数据库的内容涉及自然科学、社会科学、农业、医药卫生、工程技术等各个领域。
目前,CNKI数据库中拥有数以千计的学术刊物,包括科技论文、会议论文、专业报纸和行业文摘等,而此外还有大量的博士和硕士论文。
知网、万方和维普三种主流数据库比较中国知网(CNKI)简介:中国知识资源总库(CNKI)《中国知识资源总库》是由清华大学主办、中国学术期刊(光盘版)电子杂志社出版、清华同方知网(北京)技术有限公司发行、数百位科学家、院士、学者参与建设,精心打造的大型知识服务平台和数字化学习系统。
目前,《总库》囊括了自然科学、人文社会科学及工程技术各领域知识,拥有期刊、报纸、博硕士培养单位的博士和优秀硕士学位论文、全国重要会议论文、中小学多媒体教辅以及1000多个加盟数据库。
全文采用CAJ和PDF 格式,必须下载专门的CAJ和PDF浏览器才可阅读。
数据库:《中国期刊全文数据库(CJFD)》截至2007年3月共收录了国内8127种期刊,全文文献总量已达2272万多篇,收录起始时间一般为1994年,个别追溯到1979年或创刊年,按学科分126个专题,内容每日累增。
产品形式有网络形式、光盘形式、《中国期刊专题全文数据库光盘版》。
《中国优秀博硕士学位论文全文数据库(CDMD)》收录2000年至今300多个博硕士培养单位的学位论文,内容每日累增。
《中国重要报纸全文数据库(CCND)》收录2000年至今1000多种重要报纸,内容每日累增。
《中国重要会议论文集全文数据库》(CPCD)收录2000年至今400家学术团体的会议论文,内容每日累增。
搜索界面:收费方式:使用步骤:数据库特点:最全面的中文数据库,内容丰富,更新速度快,收费灵活,价格较万方和维普适中。
万方数据库简介:集纳了涉及各个学科的期刊、学位、会议、外文期刊、外文会议等类型的学术论文,法律法规,科技成果,专利、标准和地方志。
期刊论文:全文资源。
收录自1998年以来国内出版的各类期刊6千余种,其中核心期刊2500余种,论文总数量达1千余万篇,每年约增加200万篇,每周两次更新。
搜索界面:收费方式:数据库特点:全面的中文数据库,内容丰富,更新速度快,收费不灵活,按照篇收费,就搜索期刊论文而言,价格较万方和维普偏高。
第32卷第1期河南图书馆学刊2012年2月浅析万方、维普、CNKI 三大全文数据库张 敏(河南职业技术学院图书馆,河南郑州 450046)关键词:维普 CNKI 万方 分析比较摘 要:在概括介绍基本情况的基础上,本文从检索功能、检索结果、检索界面等方面对《中国期刊全文网》、《万方数据资源系统数字化期刊》、《中文科技期刊数据库》国内3大期刊全文库进行深入地分析与比较,归纳总结各数据库的检索特点及差异,以期为各类读者及机构提供有效的参考与帮助。
中图分类号:G25 文献标识码:A 文章编号:1003-1588(2012)01-0088-03收稿日期:2011-10-16作者简介:张敏(1972-),河南职业技术学院图书馆助理馆员。
随着期刊电子化的发展,期刊全文数据库的发展也越来越快。
对各高校图书馆而言,电子期刊在采购中所占的比重正逐年递增。
如何深入地了解、分析并掌握目前我国比较有代表性的全文数据库的特点,并对其进行更好地开发和利用,直接决定了高校图书馆信息服务水平的高低。
1 万方、维普、CNKI 三大全文数据库的基本情况中国期刊全文网(简称“CNKI”)是由清华同方光盘股份有限公司、光盘国家工程研究中心和中国学术期刊(光盘版)电子杂志社共同研制出版的综合性全文数据库。
创建于1994年,1996年12月正式发行,是我国第一个连续出版的大型集成化学术期刊全文数据库。
通过建立镜像站点、互联网远程访问(包库)等方式提供服务。
【1】中文科技期刊数据库(简称“维普”)由科技部西南信息中心主办,重庆资讯有限公司制作,收录了1989年以来的文献资料,2001年正式出版发行。
其前身为《中文科技期刊篇名数据库》,是目前我国收录期刊最全的综合性全文期刊文献数据库。
【2】万方数据资源系统数字化期刊(简称“万方”)是万方数据库资源系统三大组成部分之一,由中国科技信息研究所属下的北京万方数据股份有限公司创办。
它是国家“九五”重点科技攻关项目“科技期刊网络服务系统”的组成部分,由万方数据网络中心具体运行。
04014017 刘菊国内三大中文数据库比较一:中国期刊网中国期刊全文数据库包括7200种学术期刊,1200余万篇学术论文。
收录全:收录7200余种,目前网上收录论文1250余万篇,94年至今每期收全,近2000余种重要期刊回溯至创刊,网上收录120余万篇;水平高:中国核心期刊1879种,已收录1824余种,占总量的97%;中国EI来源刊298种,已收录294种;中国SCI来源刊74种,已收录58种;质量优:文献95%以上为电子版,图像版清晰,OCR识别方便;技术领先:建库平台TPI、检索平台KNS、文献格式CAJ、专用浏览器CAJViewer全部自主研发,不断更新换代;尊重知识产权:100%签订收录合同,支付著作权使用费。
检索方法:导航检索、简单检索、高级检索、专业检索导航检索:在导航区按学科提供树状浏览。
用户层层点开,逐步缩小主题范围,直到看到具体的文章。
优点是便于用户查询某一学科的所有文章,层次清楚,方便快捷简单检索:选择检索字段,输入检索词高级检索:可选择1-5个检索词输入框,做逻辑组配。
检索技巧:逻辑组配符:*,+其中, *表示AND,+表示OR。
利用逻辑组配符可以实现一步检索阅览器:CAJviewer 6.0 :CAJviewer 6.0是中国期刊的专用全文格式阅读器,阅读CNKI 系列数据库的全文,必须下载全文浏览器CajViewer,目前CajViewer6.0版本适合于CNKI 系列所有数据库,只要下载安装一次就可以阅读各种数据库的全文。
它支持CNKI网的CAJ、NH、KDH和PDF格式文件它可配合网上的原文阅读,也支持阅读下载后的中国期刊全文,它的打印效果与原版的效果一致。
当然你必须有浏览全文的权限。
中国期刊网全文数据库具有较完备的检索功能,是电子期刊数据库检索较为典型的一种,可以通过对该数据库的检索实践,大体了解关于电子期刊数据库的检索方法。
形式上大同小异,可以借鉴该数据库的检索方法,尝试对其它数据库的检索。
国内三大中文文献数据库系统:维普、万方、中国期刊网(或称:中国知网、CNKI)都有期刊全文库,但各具特色:(1)从收录量和收录期刊起始年限上看目前,维普在收录期刊
种类和收录全文数量,以及收录期刊的起始年限上都是三者中最多和最早的一个。
CNKI正
回溯1994年以前期刊论文。
万方则注重核心期刊的收集,能收齐每期刊中的每篇文章,维
普和中国期刊网尚未做到这点。
(2)从检索功能上看维普既有菜单式傻瓜检索界面,又
有指令检索界面,适用于不同使用者。
尤其是他的指令检索界面,使用起来十分方便。
如使
用“*”代表“and”,使用“+”代表“or”。
CNKI也有菜单式和指令检索界面,其菜单式检索界面
与另外两者相比是做得最好的,加入了并列概念的选项。
CMKI和维普期刊资源整合服务平
台最有特色的是支持全文、引文和基金检索;工具书、知识元搜索;论文引证查询与分析,
万方没提供这些功能。
(3)从文献收录范围看三大中文数据库系统除提供期刊全文库外,各自还有很多核心或特色数据库,如:中国知网的优秀博硕士论文库、引文数据库、工具书、年鉴、报纸、科技报告数据库等。
万方的企业产品库、学位论文全文库、会议论文全文库、
中文电子图书库等。
另,中国期刊网和万方数据库为自然、社会科学综合性文献库,维普
期刊网则为自然学科文献库系统。
万方、维普、中国知网的区别简单比较:1、从二次检索情况来看,中国期刊网可以二次检索,并可以多次进行二次检索,检索字段同一次检索;万方可以二次检索,可以多次进行二次检索,检索字段是“任意字段”不能选择;维普可以二次检索,可以多次进行二次检索,检索字段同一次检索。
2、从是否支持逻辑检索来看,中国期刊网支持逻辑检索,逻辑关系词“与”、“或”、“非”;万方也支持逻辑检索,逻辑关系词“与”、“或”、“非”;维普支持逻辑检索,逻辑关系词“与”、“或”、“非”。
3、从检索年限来看,中国期刊网可以限制检索的时间范围,数据库收录范围:1994年-2006年;万方原来不能限定时间范围,从2006年开始加了此项功能,时间范围:1981年-2006年,当然只是少量的刊从1981年开始收录;维普可以限制检索的时间范围,数据库收录范围:1989年-2006年。
4、从跨库检索来看,中国期刊网可以跨库检索也可以单库检索;万方可以跨库检索也可以单库检索;维普可以跨库检索也可以单库检索。
5、从检索结果的显示来看,中国期刊网只有一种格式,显示序号,篇名,刊名,年,期。
点击可查看详细信息。
万方有两种格式,简单信息/详细摘要信息。
维普有三种格式,概要显示/文摘显示/全记录显示。
对检索结果的排序,中国期刊网可按时间/相关度排序,也可以选择不排序;万方和维普没有检索结果排序功能。
6、从检索风格的一致性来看,中国期刊网与该系统中各库检索界面风格一致,便于检索;万方与万方数据资源服务系统中各库检索界面风格一致,便于检索;维普目前只订购中文科技期刊数据库一个库,不存在风格一致性问题。
7、从检索策略来看,中国期刊网可编辑、保存检索策略;万方可编辑、保存检索策略;维普也可编辑、保存检索策略。
8、从能否进行引文查询来看,中国期刊网有专门的引文数据库;万方本来有引文查询,2006年改版后无引文检索这项功能;维普无引文查询这项功能。
9、从有无检索导航来看,中国期刊网有检索导航功能,有专辑导航、数据库刊源导航、刊期导航、出版地导航、主办单位导航、发行系统导航、期刊荣誉榜导航、世纪期刊导航、核心期刊导航、首字母导航等多种导航系统;万方只有专辑检索导航、地区导航、首字母导航三种导航系统;维普只有专辑导航、分类导航、首字母导航三种导航系统。
全文数据库集文献检索与全文提供于一体,是近年来发展较快和前景看好的一类数据库。
目前的中文全文数据库有:中国期刊全文数据库(清华同方)、中文科技期刊数据库(维普)、万方系统的数字化期刊全文数据库(万方)。
三种全文数据库共同优点1、免去了检索书目数据库后还得费力去获取原文的麻烦。
2、多数全文数据库提供全文字段检索,这有助于文献的查全。
3、三个库都可以进行简单检索、二次检索、高级检索等,检索策略都可以编辑、保存。
共同的缺点1、阅读全文数据库中的全文,计算机内必须安装有全文浏览器。
2、通用的全文格式较少,主要有PDF格式和HTML格式。
各类全文数据库的优缺点:1、从期刊种类收录情况来看,清华同方收录期刊为8712种,其中核心期刊1750多种;万方收录5928种,核心期刊2374种;维普收录12000余种,核心期刊1810种。
维普收录期刊总数最多,其中包括了具有一定影响且连续性的非正式发行刊物。
三个数据库对核心期刊的收录均沿用了自身设定的遴选标准,因此无法作出绝对的判断。
但从以上三大数据库对核心期刊收录量分别占期刊总数的百分比来看,清华同方占20.1%、维普占15.1%,万方占40.0%。
2007年以来医学中华系列杂志由万方独家发行,这样万方数据库在收录核心期刊中占有绝对优势。
2、从收录全文篇数来看(截止日期为2007年年底),清华同方收录期刊全文文献6196125条,维普收录期刊文献12514411条,万方数字化期刊收录期刊文献约800万条,维普收录期刊全文文献最多,特别是在学科交叉中体现较为明显,例如以中药葛根为关键词,时间限定在2003年~2007年,维普检索是2744条,清华同方是2315条,万方数据库是2061条,数据相差的原因是葛根不仅仅在医药专辑中能查到,在农林专辑中也可以查到。
3、从学科覆盖范围来看,清华同方和维普都涵盖了文理工农医全部学科的内容,而万方学科覆盖范围在人文科学方面要稍显不足。
三大中文数据库的文献类型第一家中文数据库是知网(中国知网)知网是中国最大的综合科技文献数据库,收录了各个学科领域的学术论文、期刊、博士、硕士论文、会议论文、报纸、年鉴、专利等不同类型的文献资源。
知网涵盖了从1952年至今的全文文献,拥有超过4亿篇全文文献资源,每天新增的文献达到了数以万计。
1. 学术论文:知网收录了各个学科领域的学术论文,涵盖了自然科学、工程技术、农业科学、医药卫生、哲学社会科学等众多学科领域。
学术论文是研究者发表研究成果、交流学术观点的重要形式,对于推动学术界的发展具有重要作用。
2. 期刊文献:知网收录了国内外各个学科领域的学术期刊,包括自然科学期刊、社会科学期刊、医学期刊等,涵盖了大量的学术研究成果。
期刊文献作为学术交流的重要载体,为研究者提供了一个发布和分享研究成果的平台。
3. 硕博士论文:知网收录了国内外的博士、硕士学位论文,这些论文是研究生们选择课题进行研究的成果总结,也是学术界关注的焦点。
硕博士论文的发表体现了研究生在学术研究方面的能力和造诣。
第二家中文数据库是万方数据库万方数据库是综合性的学术文献数据库,索引和提供了各个学科领域的学术论文、期刊、硕博士论文、会议论文等大量的中文文献资源。
1. 期刊文献:万方数据库收录了大量中文期刊的文献资源,包括自然科学、社会科学、医学、工程技术等学科领域的学术期刊。
期刊文献是学术交流的重要渠道,可以了解到最新的研究成果和学术动态。
2. 学术论文:万方数据库收集了各个学科领域的学术论文,包括自然科学、医学、工程技术等。
学术论文是学术研究的重要成果,可以了解到研究领域的最新进展和研究方法。
3. 硕博士论文:万方数据库收录了国内外的硕士和博士学位论文,这些论文是研究生们在特定领域进行研究的成果总结,可以了解到不同领域的研究方向和成果。
第三家中文数据库是CBM数据库CBM数据库是中国生物医学文献数据库,涵盖了生物医学领域的文献资源。
CBM数据库收录了生物医学期刊、硕博士论文、会议论文等各种类型的文献资源。
三大数据库比较与分析一、三种全文数据库基本情况概述1、CNKI中国期刊全文网(简称“CNKI”)是由清华同方光盘股份有限公司、光盘国家工程研究中心和中国学术期刊CNKI(光盘版)电子杂志社共同研制出版的综合性全文数据库。
创建于1994年,1996年12月正式发行,是我国第一个连续出版的大型集成化学术期刊原版全文数据库。
通过建立镜像站点、互联网远程访问(包库)等方式提供服务。
2、万方数据万方数据资源系统数字化期刊(简称“万方”)是万方数据库资源系统三大组成部分之一,由中国科技信息研究所属下的北京万方数据股份公司创办。
它是国家“九五”重点科技攻关项目“科技期刊网络服务系统”的一个组成部分,由万方数据网络中心具体运行。
2001年年底数字化期刊便囊括了我国所有科技学术期刊。
3、维普中文科技期刊数据库(简称“维普”)由科技部西南信息中心主办,重庆资讯有限公司制作(重庆维普资讯有限公司是科学技术部西南信息中心下属的一家大型的专业化数据公司),是中文期刊数据库建设事业的奠基人。
收录了1989年以来的文献资料,2001年正式出版发行。
其前身为《中文科技期刊篇名数据库》,是目前我国收录期刊最全的综合性全文期刊文献数据库。
二、三种全文数据库收录范围及分类体系比较1、CNKI:从1994年起,收录了7000多种期刊,其中有5400多种是全文期刊,约664万篇全文。
学科分为:理工A(数理科学)、理工B(化学化工能源与材料)、理工C(工业技术)、农业、医药卫生、文史哲、经济政治与法律、教育和社会科学、电子技术与信息科学。
按照《中国图书资料分类法》对每篇文章进行分类,将文献按所涉及的内容进行聚类后,按学科进行编辑,共分为9大系列,126个专题。
2、万方包含学术论文、期刊、学位、会议、专利、标准、成果、法规、企业等栏目,1998年以来共收录期刊6000余种,约30余万篇全文。
学科分为哲学政法、基础科学、农业科学、人文科学、医药卫生、工业技术、经济财政、教科文艺。
三大中文期刊全文数据库的比较研究摘要从论文收录情况、检索功能、检索结果、检索界面、用户服务等五个方面对国内三种期刊全文数据库——《中国期刊网全文数据库》、《维普中文科技期刊数据库》和《万方数据资源系统数字化期刊》进行了比较与分析,力图对图书情报机构在数据库选择方面有所指导,同时,对读者有针对性地使用这些数据库有所帮助。
关键词中国期刊网全文数据库维普中文科技期刊数据库万方数据资源系统数字化期刊全文数据库比较电子期刊《中国期刊网全文数据库》、《维普中文科技期刊数据库》和《万方数据库资源系统数字化期刊》是国内影响力和利用率很高的综合性中文电子期刊全文数据库,这三个数据库已经成为大多数高等院校、公共图书馆和科研机构文献信息保障系统的重要组成部分。
在互联网中,这三大数据库也成为中文学术信息的重要代表,体现了我国现有的中文电子文献数据库的建设水平。
笔者结合工作和学习中的实践,就上述三大数据库的收录情况、检索功能、检索结果、检索界面、用户服务等方面进行全面的比较,并通过检索实践举例进行比较分析,以供参考。
1 收录情况收录范围与数量《中国期刊网全文数据库》(本文中简称“清华”)是由清华同方光盘股份有限公司、光盘国家工程研究中心和中国学术期刊(光盘版)电子杂志社共同研制出版的综合性全文数据库。
该数据库收录自从1994年来公开出版发行的6600余种国内核心期刊和一些具有专业特色的中英文期刊全文,累积全文文献618万多篇(最新数据大于1600万篇),题录1500万余条,按学科分为理工A(数理科学)、理工B(化学化工能源与材料)、理工C(工业技术)、农业、医药卫生、文史哲、经济政治与法律、教育与社会科学、电子技术与信息科学九大类,126个专题文献数据库。
《中文科技期刊数据库》(本文中简称“维普”)由科技部西南信息中心主办,重庆维普资讯有限公司制作。
其前身为《中文科技期刊篇名数据库》。
该数据库收录了自1989年以来国内出版发行的12000种期刊,其中全文收录8000余种,按学科分为经济管理、教育科学、图书情报、自然科学、农业科学、医药卫生、工程技术等7大类,27个专辑,200个专题,按《中图法》编制了树型分类导航和刊名导航系统,基本覆盖了国内公开出版的具有学术价值的期刊,同时还收录了中国港台地区出版的108种学术期刊,积累700余万篇全文文献(最新数据大于1300万篇),数据量以每年100万篇的速度递增。
《万方数据资源系统数字化期刊》(本文中简称“万方”)是万方数据库资源系统三大组成部分之一,由中国科技信息研究所属下的北京万方数据股份有限公司创办。
万方期刊收录了我国自然科学的大量期刊以及社会科学的部分期刊,范围包括基础科学、医药卫生、农业科学、工业技术、人文科学等5大类,以及英文版期刊、中国科学系列杂志,共2500多种期刊。
期刊收录情况通过对三个期刊数据库收录情况进行统计分析,得到以下结果:1.2.1 根据《中文核心期刊要目总览》(2004年版)统计,我国核心期刊共1800种,由这三个数据库收录的期刊统计结果显示,“清华”收录核心期刊1391种,“维普”收录1490种,“万方”收录1300种核心期刊。
从绝对数量来看,三者的核心期刊收录量相差不大,但从以上三大数据库核心期刊收录量分别占期刊总数的百分比来看,分别为%(“清华”)、%(“维普”)和52%(“万方”),“万方”数据库占有绝对优势。
1.2.2 文史哲类期刊收录情况。
“维普”收录了5种,占此类期刊总量的%;“清华”收录了451种,占此类期刊总量的%;而“万方”收录了500种,占此类期刊总量的%。
说明“维普”在收录文史哲类期刊中所占比例很低,也比较符合它《中文科技期刊数据库》的名称。
1.2.3 医药卫生类期刊收录情况。
“维普”收录1153种,占此类期刊总量的%,“清华”收录809种,占此类期刊总数的%,“万方”收录588种,占此类期刊总数的%。
农业类期刊“维普”收录756种,占此类期刊总数的%,“清华”收录531种,占此类期刊总数的%,“万方”收录了246种,占此类期刊总数的%。
另外,在自然科学与工业技术、教育与社会科学、政治经济与法律等类目中,“维普”的收录量都是排名第一。
1.2.4 通过比较“清华”和“维普”收录期刊名录,得知两数据库期刊收录重复率约为50%,说明两数据库互补性很强,相互不可替代。
而“万方”收录期刊与这两个数据库的重复率较高,在80%以上。
从上述分析看,这三个数据库基本覆盖了科学技术和社会科学的各个领域。
其中“维普”期刊的收藏量占有绝对优势,几乎覆盖了中国出版的所有中文期刊,并且收录了大量内部发行期刊,收录的年限最长,其中收录自然科学和工程技术方面的期刊量比“清华”多出近50%,但在文史哲类方面则几乎是空白,因此,“维普”适合用户进行科技文献的回溯性检索。
“清华”重点收录了国内公开出版的核心期刊与具有专业特色的中西文期刊,综合性上做得较好。
而“万方”收录期刊数量为三者中最少,但核心期刊比率很高,收录文献的质量最高。
2 检索功能检索入口比较通过对三个数据库的使用、检索及测试,笔者得出以下结论:(1) 三个全文数据库都配备了强大的检索系统,提供了导航检索、简单检索和复合检索等三种检索方式,其中导航检索都包括了学科分类导航和期刊名称导航两项功能,读者不需要输入具体的检索词,就可按照分类或期刊名称,通过层层递进的方式,检索到某一专题下的论文,并按题录链接浏览全文。
检索方法简单易学。
数据库检索选择范围灵活,可以选择一个或多个专辑进行检索,在同一专辑下,可选择一个或多个专题进行检索。
(2) 三个数据库都提供了关键词、篇名、刊名、作者、机构、文摘等6个的检索入口。
同时根据各自系统的特点,“清华”的检索入口最多,还提供了引文、基金、全文、ISSN、主题词、年、期等7个特有的检索入口。
“维普”则提供了第一作者、分类号、任意字段等3个特有的检索入口。
而“万方”没有提供其他检索入口。
(3) 通过“清华”的“全文检索”和“维普”的“任意字段检索”,在对相同检索词进行检索时发现,前者的命中率较高,在一定程度上弥补了主题标引缺乏规范化所带来的漏查,有利于提高文献的查全率,但往往检出的文献太多,用户难以挑选到合适的文章,该检索方式对于检索前沿性课题文献信息或文献量较少的冷门课题较为适用;而后者(“维普”的“任意字段检索”)是在文章中除正文以外的其他任何部分进行检索,检出率虽然低于全文检索,但相对比较实用。
检索策略比较2.2.1 简单检索“清华”和“万方”的简单检索只有一个检索框,不支持同时输入多个运算符,就是说一次只能输入一个检索词。
而“维普”的简单检索支持同一检索框内同时输入多个运算符组配的词。
2.2.2 高级检索“清华”有四个检索框,提供多个检索项目进行逻辑组合检索,有检索结果排序方式和检索年限设定和专辑的选择;“万方”提供有两个检索框,提供多个检索项目进行逻辑组合检索,可以限定检索内容的大类和检索期刊的所在地区;“维普”提供四个检索框,可以实现检索条件的组配,还可以限定检索期刊范围,提供了检索年限的设定。
检索特殊功能比较2.3.1 “清华”在每个检索入口提供了检索词字典,通过使用它可以规范所输入的检索词,有利于更全更准地检索文献信息。
2.3.2 “维普”在主题标引用词的基础上,编制了同义词库,有助于相关文献的检索,提高文献的查全率。
而在进行作者字段检索时,可以通过调用同名作者库实现作者单位的限定,提高查准率。
另外进行了期刊类型的划分,分为全部期刊、重要期刊和核心期刊,使检索可根据需要灵活选择。
同时“维普”还提供了中图法分类号的检索功能。
对于关键词不规范的学科和领域,通过分类号检索,能提高某一学科文献的查准率。
2.3.3 《万方数据资源系统数字化期刊》在检索时,可以对期刊所分布的地域进行限定。
但笔者认为这一功能实用性不强。
3 检索结果检索效果的比较对于三大数据库,在设定相同检索条件的情况下(检索入口和检索限定一致),分别选择“题名”、“关键词”、“著者”和“分类”等四个检索入口进行检索,得出的结果见表1。
表1 检索结果数量统计表原表见通过检索返回数量统计表中的数据分析,可以得出这三种数据库的自身特点、收录的范围和学科类别的情况。
比如通过著者字段的检索,张安将教授是从事化学研究的,他所发表的论文是科技方面的,在上表中“清华”收录了16篇,“万方”收录了5篇,而“维普”收录了24篇;张靖龙教授是从事文学研究的,在上表中“清华”收录了9篇,“万方”收录了0篇,“维普”收录了1篇。
从这个对比中可以看出,三个数据库中综合性最强的是“清华”,收录理工科科技信息文献最多的是“维普”。
全文浏览的比较三个数据库中的文献都可以浏览原版的图像全文,也可以用文献浏览器上提供的OCR识别系统进行文字识别处理文献。
其中“清华”的全文要用CAJ全文浏览器或Acrobat Reader浏览器;“维普”的全文需要用VIP浏览器打开(已改为Acrobat Reader浏览器);而“万方”使用Acrobat Reader浏览器打开,有些文献可以在IE中直接打开。
单从数字化水平来说,笔者认为“万方”的数字化技术在三者中是最好的,它所用的是全球通用的PDF格式全文,方便交流,从打开的页面上看,制作得也比较精细。
其他两个所用的是自己公司生产的浏览器,文献页面存在一定的缺陷,特别是“维普”的全文甚至出现手写文字。
当然数据库数字化的水平也在不断进步中,比如:“清华”也推出了PDF的下载方式,自身的CAJ浏览器也在不断完善;“维普”页面数字化水平也在不断提高,同时从最新的信息来看,“维普”也将推出PDF格式的全文。
可以说未来的趋势就是三大全文数据库都会提供通用的PDF格式的全文,并最终过渡到统一的格式。
显示、排序与去重功能比较“清华”的检索结果是按照主题的相关度和文献的日期排序输出,可以设定每页显示文献的数量。
“维普”的检索结果是按照时间的倒序排列,同时间段按期刊顺序排列,用户不用翻页就可以浏览最新的文献。
“万方”在初次检索时不能设定检索结果显示的顺序,但在二次检索中可以设定是通过“升序”或“降序”排列。
数据库的去重功能做得都不够好,有待于进一步完善技术。
(不是很理解这句话的意思,倒是希望有进一步分析。
)文摘结果显示比较通过文献的文摘就可以了解一篇文章的基本情况,而不用浏览全文,这样科研人员就可以通过浏览文摘了解是不是自己找的文章,可以节约大量的时间。
“清华”的文摘显示内容有:篇名、作者、刊名、机构、引用链接、被引用链接、聚类检索、摘要、光盘号。
“维普”的文摘显示内容有:标题、刊名、作者、关键词和摘要。
“万方”的文摘显示内容有:光盘号、题名、作者、机构、刊名、ISSN号、CN号、藏号、关键词、分类号和摘要。