国内重要的全文检索系统功能比较
- 格式:doc
- 大小:25.50 KB
- 文档页数:6
书目检索(BibliographicRetrieval)是以文献线索为检索对象的信息检索。
检索系统存储的是以二次信息(目录、索弓丨、文摘等)为对象的信息,它们是女献信息的外部特征与内容特征的描述集合体。
信息用户通过检索获取的是原文的“替代物”,也即有关某一问题的一系列相关文献线索,然后再根据检出的文献线索去获取原文%书目检索系统是汇集某个领域的二次文献信息的信息检索系统,用于检索相关文献信息线索。
其手工检索阶段主要指文摘、题录、目录、索引等,计算机检索阶段则以书目数据库为核心,如各图书馆的0PAC即“联机公共目录查询系统"。
自从万维网出现以来,方兴未艾的Internet在图书馆的应用,使图书馆的书目检索服务范围得到了最广泛的深人和延伸。
目前,笔者就国内大学图书馆使用较为普遍的部分自动化管理集成系统(南京大学图书馆书目检索系统、北京邮电大学图书馆书目检索系统和深圳大学图书馆书目检索系统)在Web环境下的书目检索功能、书目检索途经和书目检索条件进行考察和比较分析。
1图书馆网站调查1.1南京大学图书馆书目检索系统该系统使用的是江苏汇文软件有限公司的汇文系统,从图书馆首页—资源导航―馆藏纸本目录―馆藏书目查询。
1.1.1书目检索功能该系统提供简单检索、全文检索、多字段检索(高级检索)和热门检索4项功能。
1.1.2书目检索途径(1)简单检索界面以下拉列表方式完成单项选择,提供有题名、责任者、主题词、ISBN/ISSN、订购号、分类号、索书号、出版社、丛书名、题名拼音和责任者拼音共11个检索途经。
(2)全文检索界面提供有任意词、题名、责任者、主题词、索书号、出版社和丛书名7个检索途经,使用“并且”“或者”“不含”进行组配。
(3)多字段检索界面较为复杂,分左右两列设置了题名、责任者、丛书名、主题词、出版社、ISBN/ISSN,索书号和起始年代8项检索,这8个检索途径既可以进行单项检索,也可以进行自由组配。
中文三大全文数据库的比较摘要通过本课程的学习,结合本人的学习情况从三大数据库对论文的收录情况、检索功能、检索结果、检索界面等方面对中文三大全文数据库——《中文期刊网全文数据库》、《维普中文科技期刊数据库》和《万方数据资源系统数字化期刊》进行了比较,阐述了一些自己对这三大全文数据库的认识。
最后并谈了谈本人的学习收获和对本课程的些许建议。
关键词中文期刊网全文数据库维普中文科技期刊数据库万方数据资源系统数字化期刊全文数据库收录情况:这三个数据库基本覆盖了科学技术和社会科学的各个领域。
其中“维普”期刊的收藏量占有绝对优势,几乎覆盖了中国出版的所有中文期刊,并且收录了大量内部发行期刊,收录的年限最长,其中收录自然科学和工程技术方面的期刊量比“CNKI”多出近50%,但在文史哲类方面则几乎是空白,因此,“维普”适合用户进行科技文献的回溯性检索。
“CNKI”重点收录了国内公开出版的核心期刊与具有专业特色的中西文期刊,综合性上做得较好。
而“万方”收录期刊数量为三者中最少,但核心期刊比率高,收录文献的质量最高。
检索功能:三个数据库都提供了关键词、篇名、刊名、作者、机构、文摘等6个检索入口。
就其特殊检索功能而言,“CNKI”在每个检索入口提供了检索词字典,通过使用它可以规范所输入的检索词,有利于更全更准地检索文献信息。
“维普”在主题标引用词的基础上,编制了同义词库,有助于相关文献的检索,提高文献的查全率。
“万方”在检索时,可以对期刊所分布的地域进行限定。
检索结果:比如通过著者字段的检索,张安将教授是从事化学研究的,他所发表的论文是科技方面的,在上表中“CNKI”收录了16篇,“万方”收录了5篇,而“维普”收录了24篇(换成医学方面的);张靖龙教授是从事文学研究的,在上表中“CNKI”收录了9篇,“万方”收录了0篇,“维普”收录了1篇。
从这个比较中可以看出,三个数据库中综合性最强的是“CNKI”。
三个数据库中文摘做得最好的是“CNKI”,不仅可以从中获得文献的基本情况,而且能通过超级链接的方式,找到更多与查找主题相关的内容。
医学文献检索试题(A)《医学信息检索》试题一、名词解释(共 5 题,每题 3 分,共 15分)1. 信息素养:是指判断何时、何地需要信息,并能有效的定位、获取、评价和利用信息的一系列能力的总和。
2. 引文检索:是以被引用文献为检索起点来查找引用文献的过程。
3. 索引:将内容中有检索意义的标识提取出来,按某种方式进行排序,以便于查询。
4. 书目数据库:是一种提供文献的各种特征,如文献篇名、作者、文献出处、摘要、馆藏单位的数据库。
5. 元搜索引擎:也称集成搜索引擎,是建立在异地搜索引擎基础上的虚拟智能整体,本身不一定建立网络信息索引数据库。
检索时,用户通过统一的检索界面,可同时链接多个或多种独立搜索引擎进行查询,将检索结果作出相关度排序后显示给用户。
二、单项选择题(共 15 题,每题 2 分,共 30 分)1. 关于信息的说法错误的是( b )。
A.信息是客观事物的运动状态和特征的反映B.信息是客观的C.信息是无形的,不断变化发展的D.信息的存储形式有多种2. 以下属于二次文献的是( c )。
A.述评B.研究报告C.索引D.专著3. 检索文献数据库时,下列哪种方法不能扩大检索范围( a )。
A. 主题词加权B. 用ORC. 用主题词扩展D. 采用截词4. 哪个途径是从文献的内部特征进行检索的( a )。
A. 分类途径B. 号码途径C. 作者途径D. 刊名途径5. 下列说法中错误的是( d )。
A. 综述是有关研究某一问题或某些问题的文章B. 综述是从一定时间内的大量的文献中摘取的情报C.综述是对特定的问题利用有关的情报进行的综合性叙述D.综述的目的是建立新知识6. 计算机文献检索中,每一种文献特征对应于计算机数据库中的( c )。
A. 一条记录B. 一篇文献C. 一个字段D.一个文档7. 下面哪个检索式的作用与短语检索"digiatal camera"等价:( a )。
A. digiatal (W) cameraB. digiatal (N) cameraC. digiatal AND cameraD. digiatal OR camera8. Medline光盘数据库的内容涵盖三种重要的纸本医学文献检索工具,它们是( d )。
文献检索复习题一、名词解释1、文献检索2、引文检索3、索引4、书目数据库5、工具书6、文摘二、选择题1、关于信息的说法错误的是( )A、信息是客观事物的运动状态和特征的反映B、信息是客观的C、信息是无形的,不断变化发展的D、信息的存储形式有多种2、以下属于二次文献的是( )A、述评B、研究报告C、索引D、专著3、检索文献数据库时,下列哪种方法不能扩大检索范围( )A、主题词加权B、用 ORC、用主题词扩展D、采用截词4、哪个途径是从文献的内部特征进行检索的( )A、分类途径B、号码途径 D. 刊名途径 C. 作者途径5. 下列说法中错误的是( )A.、综述是有关研究某一问题或某些问题的文章B、综述是从一定时间内的大量的文献中摘取的情报C、综述是对特定的问题利用有关的情报进行的综合性叙述D、综述的目的是建立新知识6、计算机文献检索中,每一种文献特征对应于计算机数据库中的( )A.、一条记录 B、一篇文献 C、一个字段 D、一个文档7. 检索工具的功能主要体现在( )A、附录部分B、目次表格C、索引部分D、使用说明A、是一个综合性数据库,提供 Academic Search Premier、Business Source Premier 等十几个数据库B、检出的文献含有国内的馆藏情况C、不支持截词检索D、有关键词途径、主题词途径、参考文献途径、索引途径等检索途径17、下列不是医学专业搜索引擎的是( )A.、Medical MatrixB. HONselectC. NSTLD. Cliniweb International18、下面提供 E-mail 检索服务的是( )A、 BigfootB、yahooC、AltavistD、Anywho19、计算机文献检索中,每一种文献特征对应于计算机数据库中的( )A.、一条记录 B、一篇文献 C、一个字段D、一个文档20. 检索工具的功能主要体现在( )A、附录部分B、目次表格C、索引部分 D、使用说明三、简答题1、什么是查全率和查准率,二者之间有何关系?2.、检索过程中当检索结果偏少时,简述进行扩检的方法?至少举出 4 种方法。
四大检索系统介绍+国内外文献数据库介绍(2011-10-28 14:57:41)文献数据库国内主要资源1.维普该数据库收录8000余种社科类及自然科学类期刊的题录、文摘及全文。
主题范畴为社科类、自然科学类、综合类。
年代跨度为1989年至今2.万方万方数据资源系统的数据库有百余个,应用最多的主要是包括了专业文献库、中国科技引文库、中国学位论文库、中国期刊会议论文库等。
ki 主要应用包括中国期刊全文数据库、中国优秀博士硕士论文全文数据库、中国重要报纸全文数据库、中国医院知识仓库、中国重要会议论文全文数据库。
4.超星图书馆、书生之家图书馆、中国数字图书馆国内主要汇集各类图书资源的数据库国外主要资源1.SpringerLink 包含学科:化学、计算机科学、经济学、工程学、环境科学、地球科学、法律、生命科学、数学、医学、物理与天文学等11个学科,其中许多为核心期刊。
2.IEEE/IEE 收录美国电气与电子工程师学会(IEEE)和英国电气工程师学会(IEE)自1988年以来出版的全部150多种期刊,5670余种会议录及1350余种标准的全文信息。
3.Engineering Village 由美国Engineering Information Inc.出版的工程类电子数据库,其中Ei Compendex数据库是工程人员与相关研究者最佳、最权威的信息来源。
4.ProQuest 收录了1861年以来全世界1,000多所著名大学理工科160万博、硕士学位论文的摘要及索引,学科覆盖了数学、物理、化学、农业、生物、商业、经济、工程和计算机科学等,是学术研究中十分重要的参考信息源5.EBSCO数据库 ASP(Academic Search Premier):内容包括覆盖社会科学、人文科学、教育、计算机科学、工程技术、语言学、艺术与文化、医学、种族研究等方面的学术期刊的全文、索引和文摘; BSP(Business Source Premier):涉及经济、商业、贸易、金融、企业管理、市场及财会等相关领域的学术期刊的全文、索引和文摘6.SCIENCEDIRECT数据库是荷兰Elsevier Science公司推出的在线全文数据库,该数据库将其出版的1,568种期刊全部数字化。
国内三大期刊全文数据库信息检索之比较研究作者:李建秀来源:《软件工程师》2013年第10期摘要:论文介绍了国内三大期刊全文数据库:中国知网-中国期刊全文数据库、维普-中文科技期刊数据库、万方-学术期刊全文数据库的信息检索,对三大期刊全文数据库的信息检索从检索途径、检索功能、检索效果进行比较研究,分析其中的优劣,提出改进建议,以期提高信息检索的查全率和查准率,为用户的信息检索选择提供有效的参考。
关键词:期刊;全文数据库;信息检索;比较研究中图分类号:G252.7 文献标识码:A1 引言国内三大期刊全文数据库:中国知网-中国期刊全文数据库、维普-中文科技期刊数据库、万方-学术期刊全文数据库,在国内学术文献信息运用中利用率最高,影响范围最广,市场占有率也是最大。
这三大期刊全文数据库已经成为高等院校图书馆中电子资源的重要组成部分,也是高校师生从事教学、科研和学术研究的重要信息来源。
1.1 研究背景与意义三大期刊全文数据库的信息检索运用,在高校图书馆中,也是用户运用最广,使用率最高。
以我校为例,在每年的图书馆读者问卷调查中发现,用户使用电子信息资源在逐年上升。
截止2012年底,我校共有35种中外文数据库,其中这三大期刊全文数据库,点击率最高,运用也最多。
对我校用户的统计,以“知网”为例,在2007年全年的下载量为798360次,到2012年时全年下载量为1192538次,五年的增长高于49%。
统计结果显示,用户需求增长很多。
为此,本文对这三大期刊全文数据库的信息检索,从检索途径、检索功能、检索效果进行比较分析研究,找出这三大期刊全文数据库的优势,对其不足之处提出改进建议。
以期为用户的信息检索选择更佳途径,为用户利用数据库时提供有效的参考。
1.2 研究文献综述笔者以2003年至2012年为时间段(2012年12月31日检索),按“三大期刊全文数据库的信息检索”为“题名或关键词”在三大期刊全文数据库进行检索,共检索出论文13篇,因有重复,实际上是9篇。
四大检索系统-SCI-ISTP检索-EI检索-ISR索引四大检索系统是指《科学引文索引》(SCI-- Science Citation Index),《工程索引》(El--The Engineering Index),《科学技术会议录索引》( ISTP---Index to Scientific & Technical Proceedings)《科学评论索引》(ISR--Index to Scientific Reviews)。
四大检索系统各有所长,SCI以不仅能提供文献检索功能,还能通过引文反映文献之间的关系而著称;El以收录工程类文献见长;ISTP收录国际会议论文;ISR专门收录综述评论方面的文献。
通常我们所说的四大检索系统主要指SCI,EI,ISTP,ISR的印刷版本或光盘版(光盘版的内容与印刷本的内容一致)。
四大检索系统在我国的知名度很高,除了它们本身已被国际权威机构公认外,还有一个重要原因是中国科技信息研究所从1989年起,每年以SCI,EI,ISTP(鉴于ISR收录的期刊和论文与SCI有较多重复,且收录我国的论文数量较少,每年约200篇,因此未选ISR为论文统计源)光盘收录的期刊及论文为统计源,对我国发表在国内外的论文进行了大规模的统计分析,并按种类数量指标的大小排出各高校、科研机构及论文作者学术活动和论文水平的名次表,以《中国科技论文统计与分析》(年度研究报告)形式发表,这就是所谓的“学术榜”。
随后,广东管理科学研究院武书连等人在上述三大检索系统的基础上又补充了人文社科的检索工具《人文社会科学引文索引》(SSCI)及(人文社会科学会议录索引)(ISSHP),并按年度相继发表了《中国大学评价),引起了社会各界和高校的广泛关注。
因此,了解这些权威检索工具收录期刊的原则,掌握其检索方法有助于研究人员随时把握世界先进的研究成果,针对“学术榜”的来源期刊投稿,使研究成果在世界范围内为更多的人所了解所利用,对于提高个人或单位的整体学术水平都会起到相当的推动作用。
⽂献检索复习题及参考答案医学⽂献检索复习资料第⼀章⼀、信息、知识、情报、⽂献(选择、判断改错)1、信息:是物质存在或运动⽅式与状态的表现形式或反映,是现实世界事物的反映,它提供了客观世界事物的消息、知识,是事物的⼀种普遍属性。
2、知识:是⼈类在认识和改造客观世界实践中获得的对事物本质的认识和经验的综合,是⼈们通过实践对客观事物及其运动过程和规律的认识。
3、情报:是指⼈们以各种⽅式传递与交流的具有⼀定⽬的与时效的信息,是⼈们为⼀定⽬的搜集的有使⽤价值的知识或信息。
情报的重要属性:知识性、传递性、效⽤性。
4、⽂献:是指以⽂字、图象、公式、声频、视频、代码等⼿段记录或描述在⼀定的物质载体上,并能起到存储和传播信息情报和知识作⽤的⼀切载体。
(记录有知识的⼀切载体。
)⽂献由三个基本要素构成:内容上的知识或信息;揭⽰和表达知识信息的表⽰符号;记录信息符号的物质载体。
信息、知识、⽂献、情报的包含关系:信息、知识、情报必须固定在⼀定的物质载体上,形成⽂献后才能进⾏传递,才能被⼈们所利⽤,⽂献是信息、知识、情报存储、传递、利⽤的重要⽅式。
信息可以成为情报;信息是知识的重要组成部分,但不是全部;情报是知识或信息经传递并起作⽤的部分。
第⼆章医学⽂献信息资源⼀、⽂献信息资源类型的划分1、按载体类型划分:(1)书写型⽂献:古代⽂献、书法作品、⼿稿、书信、原始记录等(2)印刷型⽂献:图书、期刊、会议⽂献、政府出版物、专利⽂献、技术标准、产品资料、学位论⽂、技术档案(3)缩微型⽂献:微缩胶卷、微缩胶⽚、微缩照⽚等(4)视听型⽂献:唱⽚、录⾳带、录像带、科技电影、幻灯⽚、电视⽚等(5)电⼦型⽂献:电⼦型⽂献按发布形式分为:①参考数据库:A.书⽬数据库:中药在线、CBM、PubMedB.⽂摘和索引数据库②全⽂数据库③事实数据库④搜索引擎/分类指南⑤⽹络学术资源学科导航⑥FTP资源⑦其他2、按出版类型划分:(1)图书:是现代出版物中最普通的⼀种类型,有封⾯、书名、作者、出版地、出版者,并装订成册。
医学文献检索复习题1.文献是记录有知识的一切载体。
2.情报的三个基本属性是:传递性、知识性、效用性。
3.信息素养包括:信息意识、信息能力、信心道德。
4.文献按载体划分为书写型、印刷型、缩微型、视听型四种类型。
5.ISBN的中文名称是国际标准书号;国际标准刊号的英文简称是 ISSN 。
6.正式公开出版的期刊有、、三个号码。
7.文献按内容的加工层次分为一次文献、二次文献、三次文献。
8.按文献的加工层次分,《中国临床保健杂志》为一次文献。
9.按文献的加工层次分,《中华核医学与分子影像杂志》为二次文献。
10.按文献的加工层次分,《全国新书目》为三次文献。
11.按文献的加工层次分,《中国医院管理年鉴》为二次文献。
12.《生物医药大辞典》属于二次文献。
13.我校图书馆的图书一般按照《中图法》进行分类组织。
14.《中国图书馆分类法》分为 5 大部类, 22 个基本大类,每个大类用一个大写字母表示,其中医药卫生类用字母 R 表示,文学类用表示。
临床医学的分类号是 R4 ,预防医学的分类号是 R1 ,内科学的分类号是 R5 ,妇产科学的分类号是 R71 。
15.R72儿科学属于二级类目,R56属于三级类目,R563属于五级类目。
16.图书馆藏书的索书号由分类号和两部分成。
17.读者用来检索查询图书馆书目数据的网络系统称为文献检索系统。
18.信息检索语言是信息检索系统存储与检索共同遵循的一种专用语言,按规范程度分为规划语言、非规划语言。
19.引文索引是指以为检索标识的检索系统。
20.常用的主题词表有《》、《》、《》。
21.在Medline中检索姓名为 David Saliven Crawford 的作者的文献,作者应处理为。
22.根据内容的详略程度,文摘分为指示性文摘和报道性文摘两类。
23.反映文献检索效果的最重要的两个指标是查全率和查准率。
24.数据库最小的记录单元是字段。
25.数据库主要有事实数据库、数值数据库、书目数据库、全文数据库、超文本型数据库五类。
国内三大中文文献数据库系统:维普、万方、中国期刊网(或称:中国知网、CNKI)都有期刊全文库,但各具特色:(1)从收录量和收录期刊起始年限上看目前,维普在收录期刊
种类和收录全文数量,以及收录期刊的起始年限上都是三者中最多和最早的一个。
CNKI正
回溯1994年以前期刊论文。
万方则注重核心期刊的收集,能收齐每期刊中的每篇文章,维
普和中国期刊网尚未做到这点。
(2)从检索功能上看维普既有菜单式傻瓜检索界面,又
有指令检索界面,适用于不同使用者。
尤其是他的指令检索界面,使用起来十分方便。
如使
用“*”代表“and”,使用“+”代表“or”。
CNKI也有菜单式和指令检索界面,其菜单式检索界面
与另外两者相比是做得最好的,加入了并列概念的选项。
CMKI和维普期刊资源整合服务平
台最有特色的是支持全文、引文和基金检索;工具书、知识元搜索;论文引证查询与分析,
万方没提供这些功能。
(3)从文献收录范围看三大中文数据库系统除提供期刊全文库外,各自还有很多核心或特色数据库,如:中国知网的优秀博硕士论文库、引文数据库、工具书、年鉴、报纸、科技报告数据库等。
万方的企业产品库、学位论文全文库、会议论文全文库、
中文电子图书库等。
另,中国期刊网和万方数据库为自然、社会科学综合性文献库,维普
期刊网则为自然学科文献库系统。
中外全文数据库的比较任博超(中国药科大学药学院,南京210098)摘要目的:本文对四种中外数据库检索系统的学科范围、检索功能、检索方式、检索技术、个性化服务、检索结果处理等进行比较研究, 分析其共性与个性。
关键词:中国期刊网;万方数字化期刊;Elsevier SDOS ; Springer Link ;全文电子期刊数据库The comparation of four kinds of full-text e-journal databases in the college library of China and foreign countriesREN Bo-chaoPharmaceutical,China Pharmaceutical University,Nanjing 210098 Abstract Aim:This paper compares and evaluares 4 kinds of full-text e-journal databases in the college library of China and foreign countries from the aspects of retrieval function, retrieval mode,retrieval technology, personality service and retrieval result handling , analysis their commonness and individual character. Key words China periodical digital database;WanFang digital database; Elsevier SDOS ; Springer Link ;Full-texte-journal databases随着计算机技术、网络技术的发展, 人们越来越倾向于直接在网上获取有用的信息。
中国期刊网全文数据库》、《维普中文科技期刊数据库》和《万方数据库资源系统数字化期刊》是国内影响力和利用率很高的综合性中文电子期刊全文数据库,这三个数据库已经成为大多数高等院校、公共图书馆和科研机构文献信息保障系统的重要组成部分。
在互联网中,这三大数据库也成为中文学术信息的重要代表,体现了我国现有的中文电子文献数据库的建设水平。
笔者结合工作和学习中的实践,就上述三大数据库的收录情况、检索功能、检索结果、检索界面、用户服务等方面进行全面的比较,并通过检索实践举例进行比较分析,以供参考。
1 收录情况(数据较早,甚至不是2004年的数据,感觉更像2002年左右的数据,后面将尽可能给出最新的数据值。
)收录范围与数量《中国期刊网全文数据库》(本文中简称“清华”)是由清华同方光盘股份有限公司、光盘国家工程研究中心和中国学术期刊(光盘版)电子杂志社共同研制出版的综合性全文数据库。
该数据库收录自从1994年来公开出版发行的6600余种国内核心期刊和一些具有专业特色的中英文期刊全文,累积全文文献618万多篇,题录1500万余条,按学科分为理工A(数理科学)、理工B(化学化工能源与材料)、理工C(工业技术)、农业、医药卫生、文史哲、经济政治与法律、教育与社会科学、电子技术与信息科学九大类,126个专题文献数据库。
《中文科技期刊数据库》(本文中简称“维普”)由科技部西南信息中心主办,重庆维普资讯有限公司制作。
其前身为《中文科技期刊篇名数据库》。
该数据库收录了自1989年以来国内出版发行的12000种期刊,其中全文收录8000余种,按学科分为经济管理、教育科学、图书情报、自然科学、农业科学、医药卫生、工程技术等7大类,27个专辑,200个专题,按《中图法》编制了树型分类导航和刊名导航系统,基本覆盖了国内公开出版的具有学术价值的期刊,同时还收录了中国港台地区出版的108种学术期刊,积累700余万篇全文文献,数据量以每年100万篇的速度递增。
中国期刊全文数据库的检索功能分析中国期刊全文数据库(CJFD)共收录了1994年以来我国公开出版发行的学术类核心期刊与专业期刊5300余种,内容涵盖所有学科的方方面面,为了便于用户使用,将全部收录的期刊按学科内容分为九个专辑,现已累积全文400多万篇,成为一种与印刷型期刊同步出版的大型集成化动态全文信息资源[1]。
CJFD新版本的检索软件提供给用户的检索功能分为初级检索系统和高级检索系统,且这两种系统都支持二次检索功能[2]。
对于简单课题的检索,一般用初级检索方式就可以满足;对于比较复杂的课题,涉及到多个主题,而且不同主题之间要用逻辑组配来检索时,建议用高级检索方式。
两种检索方式的检索都有十三个检索入口,包括全文、篇名、作者、机构、关键词、文摘、中文刊名等。
CJFD的界面非常友好,提供的检索入口多,对有针对性地获取原文帮助很大。
例如,在CJFD的初级检索界面,选择“中文刊名”为检索入口,输入检索词“图书馆建设”,便可检索到CJFD收录的《图书馆建设》上的论文。
初级检索系统就是系统提供的单项检索功能,也称为专项检索。
它提供的最基本的检索方法有:全文、中文文摘和关键词、英文文摘和关键词、篇名、作者、机构、刊名、期刊年期等十余种检索切人点。
该检索的特点是方便快速、执行效率高。
但初级检索仅适用于只需简单查询或不熟悉多条件组合查询或SQL语句查询的用户,而且查询结果有很大的冗余,会检出一大批用户所不期望的结果。
如果能在检索结果中进行二次检索,则检索命中率会大大提高。
例如:采用专项检索功能检索2006年至2010年有关“云计算”方面的文献,检索步骤如下:第一步:在字段的下拉框里选取检索字段:关键词。
第二步:在检索词文本框里输人:云计算。
第三步:确定检索词所在的专辑及专辑年份。
对于关键词我们要分析它应该出现在哪个专辑中,这样就可缩小检索范围。
由于“云计算在图书馆中的应用”属于传统计算机技术和网络技术发展的融合,所以我们将检索范围定在电子技术与信息科学专辑。
列举国内外常用的文献检索数据库常用的国内外文献检索数据库一、国内常用的文献检索数据库1. 中国知网中国知网是中国最大的综合性学术数据库,提供了包括学术期刊、学位论文、会议论文、报纸、年鉴、标准、专利等多种资源的检索和下载服务。
2. 万方数据库万方数据库是国内领先的综合性学术资源平台,拥有丰富的学术期刊、学位论文、会议论文、报纸、年鉴、图书等资源,涵盖了各个学科领域。
3. 维普中文科技期刊数据库维普中文科技期刊数据库收录了广泛的学术期刊,涵盖了自然科学、工程技术、农业科学、医药卫生、经济管理、人文社科等多个学科领域。
4. 中国期刊全文数据库中国期刊全文数据库是中国国家图书馆主办的学术期刊数据库,收录了大量的中文学术期刊,提供了全文检索和下载服务。
5. 北大法宝北大法宝是中国最大的法律法规数据库,收录了中国的法律法规、法律案例、法学期刊等资源,为法律研究提供了重要的参考资料。
二、国外常用的文献检索数据库1. PubMedPubMed是美国国家医学图书馆提供的生物医学文献数据库,收录了包括医学、生物学、生物化学、生物工程等领域的学术期刊文章。
2. IEEE XploreIEEE Xplore是电气和电子工程师学会(IEEE)提供的学术数据库,收录了电子工程、计算机科学、通信技术等领域的期刊、会议论文、标准等资源。
3. ScienceDirectScienceDirect是爱思唯尔旗下的学术数据库,涵盖了自然科学、工程技术、医学、社会科学等学科领域的期刊、书籍、参考工具等资源。
4. Web of ScienceWeb of Science是由汤森路透公司推出的学术文献数据库,包括了科学引文索引(SCI)、社会科学引文索引(SSCI)和艺术与人文科学引文索引(AHCI)等子数据库。
5. Google 学术Google 学术是Google推出的学术搜索引擎,通过搜索学术文献、论文、学位论文等资源,提供了全文检索和引用检索的功能。
我国五大数据库引文功能的比较研究摘要: 本文就我国目前出版的五种引文数据库: 中国科学引文数据库、中国科技论文与引文数据库、中文社会科学引文索引、中国学术期刊全文数据库、中文科技期刊引文数据库的数据库内容、数据库检索性能以及各自的优势和不足等几个方面, 进行了比较和分析,以便使用者在使用时有一个较为客观的选择。
关键词: 引文数据库; 研究; 比较; 特点这五种具有引文检索功能的数据库是中国科学引文数据库、中国科技论文与引文数据库、中文社会科学引文索引、中国学术期刊全文数据库、中文科技期刊引文数据库。
这五种引文数据库各有优势, 同时也各有不足。
本文将从这些库的来源期刊、覆盖学科、收录年限、更新频率、检索性能等各个方面来对各库进行分析比较, 以便使用者在使用时有一个较为客观的选择。
1 五种引文数据库简介1.1 中国科学引文数据库中国科学引文数据库即Chinese Science CitationDatabase ( 以下简称CSCD)。
该库始建于1989 年, 1999 年起作为中国科学文献计量评价数据库ASPT 系列光盘之 A 辑, 由中国科学院文献情报中心与中国学术期刊( 光盘版)电子杂志社联合主办, 并由清华同方光盘电子出版社正式出版。
该库具有很高的权威性, 被称为中国的SCI, 是一个集多种功能为一体的综合性文献数据库。
1.2中国科技论文与引文数据库中国科技论文与引文数据库即Chinese Science and Technology Paper and Citation Database ( 以下简称CSTPCD) 。
它是中国科技信息研究所信息分析研究中心与万方数据库公司在历年开展科技论文统计工作的基础上, 开发的多功能数据库, 共设论文分析与引文分析两部分, 它既有科技论文与引文的统计分析功能, 又有很强的文献检索功能。
它通过先进的信息技术手段自动完成数据的采集、建库和统计分析工作, 为科技界研究与评价科学活动水平和交流传播机制提供了必要的手段和工具。
信息检索2010信管林雪11我们已经进入信息时代,我们的生活、学习和工作都需要及时并正确地掌握信息,并对其进行处理。
应用最广泛的是从www上获取信息。
然而,由于网络信息的自由存取和易用,使任何人任何机构都可以发布信息,其广泛、丰富,但是缺乏组织和质量,呈现无序,质量参差不齐状态,即信息过载。
所以,我们需要高效的检索系统能及时找到用户需要的信息。
据资料统计,搜索引擎的使用已占到网络应用的61.6%,是中国当前第二大互联网的应用。
我们比较熟悉的是百度、Google、搜狐、Yahoo等。
通过对检索系统的运用,现总结如下:全文搜索搜索引擎有庞大的全文索引数据库。
国外的搜索引擎Google在关键词搜索的精确度和网页限制方面明显要比其他一些搜索引擎高很多,例如其语言、地区、文件格式、日期、字词位置、网站和使用权限,还有搜索特定网页。
国内的百度,虽然没有Google那么多的限制,但是其分类很多,也使搜索范围有了一定程度的缩小,例如社区搜索、移动互联网、网站与企业服务、购物在线娱乐、软件、更多产品和服务、百度旗下。
他们都提供了类似空间的个人服务,满足个性需求;文件格式的限制都为下载提供了很大的方便;Google的手气不错和百度的百科很相似。
当然,百度得到文库在下载文档方面分类更加细致,积分的施行使用户在上传文档方面更加积极,一定程度上促进了百度的使用。
在网页设计方面,Google更简洁,从两者的视频搜索可以看出来。
Lygo提供了网页快照,免去用户打开网页的步骤,使网页内容一览无余,减缓了网速慢这一不利因素,为用户节省了时间。
目录搜索如国外的Yahoo!和国内的新浪。
和全文搜索的区别很明显,由人工对web 站点和文档进行评价、分类和简要描述。
它把主要内容直接显示出来,并按主题分类加以组织,使主题范围缩小,使用户获取信息更加迅捷。
但是其分类和连接太多,致使浏览本身不方便。
另一方面我们可以看到,他们本身也提供了检索功能。
国内重要的全文检索系统功能比较摘要:随着信息技术的快速发展,尤其是近年来internet的日益普及和网上信息的激增,大大扩展了人们可利用的信息空间。
与此同时,信息检索系统无论从技术上还是服务方式上也都向网络化、可视化、便捷化等方向发展,信息检索的功能也更加丰富。
中国知识基础设施工程(cnki)和万方数据资源系统是目前国内主要的两大全文检索系统,通过深入的分析和比较这两大信息检索系统,对于研究全文检索系统的应用和发展具有一定的参考。
关键词:全文检索系统;功能比较
中图分类号:g633 文献标识码:a 文章编号:1003-2851(2012)-12-0189-01
一、cnki数据资源系统的概述
cnki是中国知识基础设施(china national knowledge infrastructure)工程,由清华大学中国学术期刊(光盘版)电子杂志社,光盘国家工程研究中心和清华同方光盘股份有限公司联合建立,从1999年3月正式开始实施。
该系统为国内的各级政府职能部门、高等院校、科研院所、学术机构等出版的重要会议论文集,内容覆盖理工、农业、医药卫生、文史哲、经济政治法律、教育与社会科学综合等各方面。
ki全文数据库的种类
目前,中国的网络版数据库每日更新。
其主要的数据库包括以下几种:
(1)中国期刊全文数据库。
(2)中国优秀博硕士论文全文数据库。
(3)中国重要报纸全文数据库。
(4)中国重要会议论文全文数据库。
(5)中国科学文献计量评价数据库。
ki全文检索系统的收录状况
cnki数字图书馆具有翔实的文献资源基础。
它囊括的资源总量达到全国同类资源总量的80%以上。
在此基础上,cnki组织各学科专家对文献中的知识进行提炼,并通过知识元链接、引文链接等技术,将文献间的知识关联起来,使收录的知识资源形成了具有内在联系的知识网络整体。
ki全文检索系统的范围
经过多年的努力,cnki数字图书馆已经建成了世界上全文传息量规模最大的“cnki数字图书馆”,内容涵盖我国自然科学、工程技术、人文与社会科学期刊、博硕士论文报纸、图书、会议论文等公共知识信息资源,用户遍及全国和世界多个国家和地区,基本实现了中国知识信息资源在互联网条件下的社会人共享与国际化传播。
ki全文检索系统的功能
cnki数据库还具有引文链接功能,利用该功能进入中国期刊全文数据库网的用户可构建相关的知识网络,还可用来进行个人机构、期刊、论文等方面的计量分析与评价。
5.全文检索系统的特点
全文检索系统的特点有以下几点:
(1)cnki全文检索系统将中文自然语言处理技术应用在检索技术中,采用多种信息检索模型,能够有效地提高检索的准确率。
(2)cnki全文检索系统以词为索引基础,而不是单个汉字。
(3)cnki全文检索系统支持大数据量的网页、文本索引。
二、万方数据资源系统的概述
万方数据资源系统(china info)是北京万方数据有限公司在中国科技信息研究所数十年积累的全部信息资源的基础上建立起
来的,形成以科技信息为主,集经济、金融、社会、人文信息为一体,实现网络化服务的信息资源系统。
1.万方数据库的收录情况
万方数据自有版权以及与合作伙伴共同开发的数据库总计110
多个,内容涉及自然和社会科学各个专业领域,收录范围包括期刊、会议文献、科技报告标准、专利、连续出版物和工具书等,用户既可单库、跨库检索,也可以所有数据库中检索,同时还可以按行业需求进行检索。
2.检索系统的功能特点
这几年万方数据库在不断的改进,其功能也有了很大的变化。
它的各功能特点如下:
(1)强大的信息采集能力。
(2)分秒级的实时检索。
(3)快速的检索响应。
(4)全面的检索功能。
(5)精确的检索结果。
(6)丰富的检索结果展示。
三、cnki与万方的功能比较
cnki与万方的功能相比较,万方数据资源网络数据库具有全面的信息服务平台,可为用户提供准确、全面、详实、快捷的检索服务,为用户提供一般的检索和专业检索功能。
一般检索可以采用字段检索、全文检索以及高级检索(逻辑检索),专业检索支持布尔检索、相邻检索、截词检索、同字段检索、同句检索和位置检索等全文检索技术,具有较高的查全率和查准率。
数字化期刊检索系统提供分类检索、高级检索和期刊引文检索三种方法。
而cnki文献资源数据库则涉及理工、农业、医药卫生、文史哲、经济政治、法律、教育以及社会科学等各个方面,其综合能力较强,具有便捷多样的检索方式,准确的结果定位,如:全文检索就可以让用户凭借对所查找文献的模糊记忆,输入多个关键字,即可快速检索定位到该文献资料。
同时还具有丰富的信息利用功能,表现的显著特点是帮助用户便捷有效地对信息资料进行管理,同时辅以多种信息利用功能。
而且还具有系统伸缩性强布置方式灵活等特点。
系统采用“部分集中”的分布式数据库处理方式,适用中小学多媒体数字图书馆、中国医院知识仓库、中国企业知识仓库、中国城市规划知识仓库以及政府职能部门等用户部署的需求,既提高了共度数据的访问效
率,又有效解决了数据冗余问题,大大降低了硬件设备的建设成本。
1.两大系统检索效果的比较。
对于两大数据库,在设定相同检索条件的情况下(检索入口和检索限定一致),分别选择”题名”、“关键词”、“著者”和“分类”等四个检索入口进行检索。
然后通过检索返回数量统计表中的数据分析,可以得出这两种数据库的自身特点、收录的范围和学科类别的情况。
2.全文浏览的比较。
两个数据库中的文献都可以浏览原版的图像全文,也可以用文献浏览器上提供的ocr识别系统进行文字识别处理文献。
其中“万方”使用acrobat reader浏览器打开单。
从数字化水平来说,万方的数字化技术在二者中是最好的,它所用的是全球通用的pdf格式全文,方便交流,从打开的页面上看,制作得也比较精细。
cnki所用是自己公司生产的浏览器,文献页面存在一定的缺陷。
当然数据库数字化的水平也在不断进步中。
不过未来的趋势就是各个全文数据库都会提供通用的pdf格式的全文,并最终过渡到统一的格式。
3.显示、排序与去重功能比较。
“cnki”的检索结果是按照主题的相关度和文献的日期排序输出,可以设定每页显示文献的数量。
“万方”在初次检索时不能设定检索结果显示的顺序,但在二次检索中可以设定是通过“升序”或“降序”排列。
4.文摘结果显示比较。
通过文献的文摘就可以了解一篇文章的基本情况,而不用浏览全文,这样科研人员就可以通过浏览文摘了解是不是自己找的文章,可以节约大量的时间。
两个数据库中文摘
做得最好的是cnki,不仅可以从中获得文献的基本情况,而且能通过超级链接的方式,找到更多与查找主题相关的内容。
总之,国内的这两大全文检索系统已经成功的在各类信息机构、高等院校、公共图书馆、网站、政府部门等企事业单位进行各种应用。
到目前为止,这两大检索系统已经承受了千万级单容量的商业应用,并表现出了卓越性能,为用户提供了便捷、高效的在线检索功能。
参考文献
[1]祁延莉,赵丹群.信息检索概论[m].北京大学出版社,2006.
[2]王付军,童静原.中文全文检索系统在服务行业中的应用,2006.
[3]袁志平,海量信息全文检索系统的实现.2005.。