当前位置:文档之家› 计算机信息检索课程教案

计算机信息检索课程教案

1.5.3 计算机信息检索的基本技术与方法

[学习重点]熟练掌握计算机信息检索的基本技术

1.5.3.1 计算机文献信息检索的技术

查全率(Recall ratio)=[检出相关文献量/文献库内相关文献的总量 ]×100%

查准率(Precision ratio)=[检出相关文献量/检出文献总量]×100% 1.布尔逻辑检索(逻辑组配检索)(Boolean logical)

指采用布尔逻辑表达式来表达用户的检索要求,并通过一定的算法和实现手段进行检索的过程。

布尔逻辑表达式是采用布尔运算符(逻辑与“and”、逻辑或“or”、逻辑非“not”等)来连接运算检索词,以及表示运算优先级的括号组成的一种表达检索要求的一种算式,简称提问逻辑式。

●逻辑与“ AND ”运算符,也可用“*”表示,用来组配不同的概念的检索词。是一种概念相交和限定关系的组配。例如:“A AND B”或“A * B”

其含义是:检出的信息中必须同时含有“A”和“B”两个检索词。

基本作用是对检索范围加以限定,逐步缩小检索范围,提高检索结果的查准率。例如,检索“计算机在图书馆中的应用”方面的文献,其提问式可写成:计算机 and 图书馆或计算机*图书馆

●逻辑或“ OR ”运算符,也可用“ + ”表示,是用来组配具有同义或同族概念的检索词。如:检索提问式:“A OR B”或“A + B”

其含义是数据库记录中任何一条记录,只要含有“A”或“B”中任何一个检索词即为命中的文献。

基本作用是扩大检索范围,增加命中文献量,提高文献的查全率。如:“微机 + 电脑 + PC机”、“微机 or 电脑 or PC机”

●逻辑非“ NOT ”运算符,也可用“-”表示,“NOT”算符是排除含有某些词的记录,其逻辑提问表达式为“A NOT B”或“A - B”,即检出的记录中只能含有“NOT”算符前的检索词 A,但不能同时含有“NOT”后的检索词 B。

基本作用是缩小检索范围,但并不一定能逻辑非提高文献命中的准确性,一般只起到减少文献输出量的作用。在联机检索中可降低检索费用。例如:“计算机 NOT 微机”

应注意,由于“NOT”算符有排除掉相关文献的可能,因此,在实际检索中应慎重使用。

2.截词检索

截词检索是在词干的不同位置添加截词符“?”、“*”或“$”,以此代

表词的可变部位,以检索一组概念相关或同一词根的词,从而减少相同词干的检索词的输入数量,提高检全率的一种常用检索方法。

这种检索方式可以扩大检索范围,提高查全率,主要用于西文数据库检索。中文数据库通常不使用这种技术。

主要用于检索词的单复数、词性的词尾变化、词根相同的一类词,以及同一词的拼法变异等。在不同的检索系统里用不同的符号,一般为:*、?、!

基本作用是提高查全率,防止漏检。

类型:

■根据截词的位置不同,分为前截断、后截断、中截断

?前截断:又称左截断,截词符放在被截词的左边,可与后截断一同使用。目前这种检索技术应用已经极少,例如:*magnetic。

?中截词:把截词符放在词的中间。这种方式查找英美不同拼法的概念最有效。例如:如:wom*n 可检出woman,women

?后截断:是前方一致检索,又称右截断,截词符放在被截词的右边,是最常用的检索技术,例如:librar*。

■根据截断的数量不同,分为有限截断和无限截断。

?有限截断:限制被截断的字符数量,例如输入apple? ? 表示被截断的字符只有两个,可检出apple、applet等结果。

?无限截断:不限制被截断的字符数量。例如输入educat?,可以检索educator,educators,educated,educating,education,educational,等等。

?注:不同的数据库所用的截词符不一样,使用应先查一下各数据库的帮助加以确认。

3.位置算符检索

表示两个检索词间的位置临近关系,又叫邻接检索。这种检索技术通常只出现在西文数据库中,在全文检索中应用较多。

布尔逻辑运算符表示两个概念之间的逻辑关系,位置算符表示的是两个概念在信息中的实际物理位置关系

常用位置算符

? W/n(with/n):两词相邻,在一个标引字段中W/n表示两个词不可以互换顺序,二者之间可插入0-n个词。如:智能机器人(w/3)控制,可检出“智能机器人控制”,“智能机器人行为控制”等

? N/n(near/n):两词相邻,N/n表示两个词可以互换顺序,二者之间可插入n个词。如:智能机器人(n/3)控制,可检出“智能机器人控制”,“控制算法对智能机器人的影响”等

? F(field):同字段检索,被f连接的检索词必须出现在同一字段中。

? S(sub-field/sentence):同句检索,要求参加检索运算的两个检索词必须在同一自然句中出现。

4. 限制检索

通过设定相应的检索条件实现对检索的优化。是缩小或约束检索结果的方法,最常用的是对特定字段的限定检索。

如:rice in ti(表示只在题目字段中查找文献)

rice in de(只在主题词中查找)

rice in ab(只在文摘中查找)

au = Smith, (查作者为Smith,的文章)

py = 1998(只查1998年的文章)

la =Chinese (只查语种为中文的文献)

常用的限制检索方式:

?字段检索——将检索限定在特定字段内进行限制的方法。

字段限制范围的大小顺序是:题名<关键词<摘要<全文

常见的检索字段:

题名(Title,TI)、著者(Author,AU)、文摘(Abstract,AB)、

关键词(Keyword,KW)、文献类型(Document Type,DT)、主题词(DE)

刊名(Journal,JN)、语种(Language,LA)、全文(Full-text)等

5.禁用词表

有些词在单独使用时无实际意义或出现频率过高,一些检索系统规定这些词为禁用词(Stop Words),如:in,on,about,a,an,only,do等。这些词在某些数据库(如BP BIOSIS Previews 生物学文摘数据库)中不能作为检索词。

6.嵌套检索技术

用括号将优先检索的检索式括起来,系统首先检索括号中的概念。

优先算符()优先级别最高

优先级运算:()>NOT>AND>OR

7. 全文检索:

全文检索是指对文献全文内容进行字符串匹配检索,包括字符串检索、截词检索和位置检索等技术。全文检索技术是一种面向全文、提供全文的新型检索技术。它可以使用原文中任何一个有实际意义的词作为检索入口,得到的结果是源文献而不是文献的线索。

全文检索系统必须具有一个全文数据库。在全文库的基础上,对其字、词、句、段等的加工、检索与编辑。系统除了可以用布尔逻辑运算式进行检索外,还具有文本检索功能,并具有同义词控制、后控词表对检索策略的自动调整等

功能。此外,系统还允许用户以自然语言进行检索,直接获取原文中的有关章、节、段、句等。

8. 扩检:在试探性检索所获取的检索结果过少,还不到检索要求时,应采取扩展检索以扩大检索范围,保证检索率。采用的方法可以是增加检索词:如将原检索词的所有同义词、别名、俗名作为检索词进行组配检索,使用截词技术或扩大检索的年代与文献范围。

缩检:亦称二次检索,当检索结果数量过多,评价、筛选困难时,为保证检索精度与检准率,使用缩检,即在原有检索结果中进行筛选,这个措施可反复采用,直到检索结果符合要求。

1.5.4 文献信息检索的基本步骤与策略

[学习目标]掌握文献信息检索的基本步骤,并能运用于实践。

采用检索工具检索文献信息一般要经历5个紧密相连的步骤

1.分析研究课题,明确检索要求

分析研究检索课题是整个检索过程的关键,是信息检索成功与否的关键,检索者首先要对课题作综合分析,通过分析明确如下要求,

(1)明确课题的专业范围及其关健点,选取主题词。

(2)明确所需文献类型。

(3)确定所需文献的时间范围与语种范围.

(4)分析检索目的:以科研攻关,解决具体的技术难题为目的。

(5)研究探索:密切跟踪,了解国内外某一研究领域的最新成果与动态。

每一项理论或技术都有其发生、发展和形成的过程,检索时就是根据研究课题相关知识发展的形成期、高峰期和稳定期来确定检索的时间范围。

检索要求愈明确,检索范围愈具体,已知条件愈多,检索效果愈好。因此,分析研究课题这一步进展得如何,对其后的检索程序至关重要.检索者切忌情况不明就贸然开始检索,这会导致走弯路或检索失败。

检索的目的与要求及检索范围作为选择检索工具与数据库的依据。不同的数据库其收集的文献类型、学科范围,对文献的回溯期限不同。

2.选择检索工具(或数据库)与检索手段

根据已经明确的检索要求与专业范围,选择合适的检索工具或数据库。

确定检索方法:追溯法、常用法(顺查法,倒查法,抽查法)

中外文检索工具与数据库很多,检索者要求对各种检索工具或数据库的性质,内容和特点作深入了解,可借助于各种检索工具指南,学科文献指南或联机数据库目录。

机检包括联机检索,脱机检索,光盘检索与网络检索,其中手工检索基本

上不花钱,机检速度快,效率高,但费用也高。检索者可根据时时间要求、设备状况与经费条件来选择合适的检索手段。

3.确定检索途径与拟定检索式

采用哪种方法与途径,要结合课题检索要求与检索工具或数据库的特点来确定。就检索途径而言,如果课题检索要求泛指性较强的文献资料,最好用分类途径;如果课题检索要求是专指度较高的文献资料,最好选择主题途径,如果事先巳知文献著者,分子式,专利号,标准号,报告号等条件,则利用著者途径,分子式途径与文献代码等途径为好。必要时将这些途径与分类、主题途径配合使用,将会收到更好的检索效果。

检索提问式是计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符、截词符以及系统规定的其他组配连接符号组成。

4.实施试检索操作

用分类法与主题法检索文献时,要选准分类号与主题词,在机检中还要构造机检策略,即用布尔逻辑或其它符号将检索词连接起来,组成一种逻辑运算式。在检索过程中,无论是手检或机检,均需视检出结果,如果试检索的结果与检索需求存在差距,则需要对检索课题进行再分析,不断修改与完善检索策略,以达到检索的合理性与有效性。再分析的过程包括:重新选择检索系统,选择相关检索词,重新拟定检索式,以及在原有检索策略的基础上进行扩检、缩检,设定较长的文献回溯期等。阅读检出结果,决定取舍。在手检中对切题的文献要记录文献资料的篇名(书名),著者,文摘、文种、来源等,尤其是文献来源切不可遗漏。倘若是机检,可选择打印格式,联机或脱机打印输出即可。

5.检索结果的评价与获取原始文献

评价检索结果是结合多种标准对检索结果进行评价、筛选,把真正符合需要的检索结果保留下来。

获取原文是文献检索的最后一步,原文获取可以通过多种途径实现。全文数据库的检索与原文获取可以一步完成,是检索时的首选。而题录与摘要信息检索系统只能检索到原文的线索,在这种情形下,应尽可能通过本地资源获取原文。如本地资源无法保障,则可以考虑使用电子文献传递系统从其他图书、情报机构获得原始文献。目前大部分非全文数据库多提供了原文的外链接,用户可以根据需要选择。

1.5.5 计算机信息检索的策略

1.分析研究课题,明确检索要求

检索误区1——过分依赖搜索引擎。Internet资源与专业的网络数据库来

比,无论是质量还是数量上都有很大的差距,检索文献目前来说最主要的来源还应是专业数据库,即正规的出版物上发表的文献。

检索误区2——忽略摘要数据库。摘要数据库的数据量大,范围广,是查找文章线索极好的检索工具。就目前的情况而言,不可能全部都能得到电子版的全文,先找到文章线索再根据线索查找印刷版的全文是一项不错的组合。

2.选择数据库或网络检索工具

选择合适检索工具的前提是对网络资源有一个较全面的、清晰的了解,具体地说要对检索工具的类型、内容特点、时间范围、学科范围、甚至出版商的大体情况都要有一个了解。

方法:

①注重平时的积累

②不要盲目检索,应养成检索前了解一下数据库的习惯

③注重与他人的交流

④重视图书馆主页的资源

3.提炼检索词,制定检索式

①检索词尽可能选用词或词组,然后用布尔逻辑运算符将检索词连接起来,切忌把整个题名输入到检索框中。

如:网络数据库的安全性研究

②要提炼关键的、核心的词作为检索词。去掉意义太泛或“无所谓有”的词,有时不需要死抠字眼,意思匹配就可以了。

③漏检:忽视了同义词、相似词等。

④检索中不断调整策略

4.实施试检索操作

检索,再分析,再检索,再分析。

5.检索结果处理。

1.5.6 提高检准率与检全率的常用方法

1.提高检全率的方法

?使用同义词、近义词、相关词和缩略词扩大检索范围,去掉连字符也可扩大检索范围;

?使用逻辑或“or”;

?使用截词检索技术;

?扩大检索年限;

?以其他数据库或检索系统进行补充;

?其他方法:如通过已有检索结果切换检索途径。

2.提高检准率的方法

?核心概念的限定;

?核心期刊的限定;

?语种的限定;

?用布尔逻辑算符“and”或者“not”组配检索词;

?使用位置算符“near”和字段算符“in”提高查准率;

?使用“Index”和叙词表,选择确切的检索词缩小检索范围。

2大型综合性检索系统

[学习目标] 熟悉了解各种大型综合性检索系统的收录范围、特点以及主要数据库。

大型综合性检索系统:指具有统一的检索界面、集成多个数据库,在资源内容上跨学科的检索系统。

随着知识经济的兴起,世界经济一体化进程的加快和国际信息资源竞争的加剧,客观上要求各国的信息资源机构必须以新的观念、新的视角、新的思维和新的对策来迎接新的挑战,对构建一个支撑国家知识创新的信息资源保障体系提出了迫切的要求。构建一个全新的信息资源保障体系是信息资源建设发展的第一战略,是信息资源机构的重要任务,是保证社会持续发展的不竭动力,更是各信息资源机构在市场经济竞争中的立身之本。

自20世纪中期以来,国外许多国家都十分重视信息资源保障问题,并在书刊采购的协调与合作方面进行了有益的探索,对信息保障体系的相关研究也比较多。特别是近年来,随着网络的推广普及,人们的信息视野得到了延伸,主动建立一个信息世界成为现代社会人们的一个重要任务。因此,各个国家都从宏观和微观两个方面来促进信息资源保障体系的建设,并卓有成效。应该说,信息资源保障体系集成了各个系统的资源,系统、全面、权威,充分利用各个项目的建设成果与服务将是获取优质网络资源的最佳途径。

CNKI数字图书馆

1998年世界银行提出了国家知识基础设施(National Knowledge

Infrastructure,NKI)的概念。中国知识基础设施工程(China National Knowledge

Infrastructure),简称CNKI工程,是采用现代信息技术,建设适合于我国的可以进行整和、生产、网络化传播扩散和互动,交流合作的一种社会化知识基础设施的国家级大规模信息化工程。该工程受到了国家和社会各方面的高度重视,其主体CNKI数据仓库项目已被国家科技部、对外贸易经济合作部等5部确立为“国家级重点新产品重中之重”,并被国家科技部列为国家级火炬计划项目。

CNKI工程始建于1999年6月,由清华大学、清华同方发起,以实现全社会知识资源传播共享与增值利用为目标。CNKI工程集团经过多年努力,采用自主开发并具有国际领先水平的数字图书馆技术,建成世界上全文信息量规模最大的CNKI数字图书馆,并正式启动建设《中国知识资源总库》及CNKI网格资源共享平台,通过产业化运作,为全社会知识资源高效共享提供最丰富的知识信息资源和最有效的知识传播与数字化学习平台。

CNKI工程的具体目标,一是大规模集成整合知识信息资源,整体提高资源的综合和增值利用价值;二是建设知识资源互联网传播扩散与增值服务平台,为全社会提供资源共享、数字化学习、知识创新信息化条件;三是建设知识资源的深度开发利用平台,为社会各方面提供知识管理与知识服务的信息化手段;四是为知识资源生产出版部门创造互联网出版发行的市场环境与商业机制,大力促进文化出版事业、产业的现代化建设与跨越式发展。

2.1.1 《中国知识资源总库》知识资源特色:

资源丰富,类型多样,支持"一站式"异构跨库统一检索。

(1)增值服务:全方位相关知识信息链接,如:相似文献,知识元库,引文链接、相关作者链接、相关研究机构链接等等。

(2)文献类型:学术期刊、博士学位论文、优秀硕士学位论文、重要会议论文、年鉴、专著、报纸、专利、标准、科技成果、工具书、知识元、哈佛商业评论数据库、古籍等;还可与Springer期刊库等外文资源统一搜索。

(3)出版内容:基础研究、应用基础研究、工程技术、高级科普、政策研究与指导、行业指导、实用技术、职业指导、标准等各类文献,覆盖自然科学、工程技术、人文与社会科学各学科领域。

(4)时间覆盖:收录了1912年至今我国产出的各类文献,且每日更新。

(5)编辑方式:按《中国图书馆分类法》,分类汇编成为10个专辑、168个专题、3000多个学科专业数字图书馆,并利用引文、作者、知识元等链接,将文献整合为知识网络,面向各专业用户提供高质量的文献、情报、知识的检索和系统调研需求。

2.1.2 创新服务:

针对注册用户,中国知网提供的创新服务包括:数字出版物超市、用户个

性化数字图书馆、数字化学习研究等。其中用户用户个性化数字图书馆又包括个人数字图书馆以及机构数字图书馆,可根据不同用户主动提供多种个性化服务栏目和服务。

2.1.3 CNKI搜索

CNKI文献搜索以CNKI总库资源为基础,共涵盖了中国学术期刊、博硕士论文、会议论文、报纸文献、专利标准等近4000多万篇专业学术文献。

CNKI知识搜索在KBase独有的搜索引擎技术上,采用了最新的文献排序技术,分组技术、以及用户搜索意图智能分析技术。能够对用户一个简单的搜索请求做全方位的智能解析,在返回最相关最重要的文献基础上,对全部相关文献做立体化分析:提供专业的分组、全方位的排序、相关知识等服务。让用户对当前的搜索结果有一个全面的了解。

CNKI文献搜索包括简单搜索与高级搜索。其中简单搜索包括单语词搜索、多语词搜索;高级搜索包括特定文献信息搜索、特定期刊内容搜索、特定作者搜索。

2.1.4 CNKI全文数据库

CNKI的知识仓库根据资源来源分为期刊、报纸、会议论文、博/硕士论文、工具书等多种数据库,根据用户需要和中国图书分类法又分为若干类专业化数据库:外文类、工业类、农业类、医药卫生类、经济类、教育类。

CNKI全文数据库是CNKI工程所建设的核心资源。其中期刊、博硕士论文、会议论文、报纸四大源数据库统一产品体系和导航结构,统一划分为十大专辑,168个专题文献数据库,内容涉及理工、农业、医药卫生、文史哲、政治军事与法律、经济管理、教育与社会科学、电子技术与信息科学等多个学科。

期刊全文数据库、优秀博硕士学位论文库、重要报纸全文库三大库各自特色:

* 报纸全文数据库:时事性强,浅显易懂,易引起关注。

* 期刊全文数据库:提供丰富、及时的学习资源,推动图书馆期刊资源的广泛利用,保证图书馆长期、完整、连续的文献收藏。

* 优秀博硕士学位论文库:反映国内科研的前沿水平,系统性强,揭示新的研究课题和方向。

2.1.4.1 主要数据库:

●中国期刊全文数据库(CJFD)

中国期刊全文数据库(CJFD)是目前世界上最大的连续动态更新的中国期刊全文数据库,收录国内公开出版的8100种核心期刊与专业特色期刊,积累全文文献800万篇,题录1500余万条,分九大专辑,126个专题文献数据库。覆盖理工A(数理化天地生)、理工B(化学化工能源与材料)、理工C(工业技术)、农业、医药卫生、文史哲、经济政治与法律、教育与社会科学、电子技术与信息科学方面内容。收录年限为1994年至今,6100种全文期刊的数据完整性达到98%。

●中国重要报纸全文数据库(CCND)

收录2000年以来中国国内重要报纸刊载的学术性、资料性文献的连续动态更新的数据库。收录国内公开发行的700多种重要报纸。收录年限为2000年至今,镜像站点数据每日更新。

●中国工具书集锦在线

本库除准确全面地展示纸质工具书的原貌外,主要运用内容组织和开发技术,深度挖掘纸质工具书的信息资源,以条目为基本单位,重新整合,标注,归类入库,进而形成一个使用便捷的在线参考工具书服务系统。本库遴选了国内外部分经典工具书,以辞典和百科全书为主体,尤以名家编撰者为核心,注重权威性,并突出选取对学习、科研和社会文化有重要参考价值的工具书。其覆盖范围包括马列、哲学、宗教、社科总论、政治法律、军事、经济、文教、语言、文字、文学、艺术、历史地理、自然科学、医药卫生、农业、工程、人物类。

以上数据库湖南大学图书馆已购买其镜像站版。

中国优秀博/硕士论文全文数据库(CDMD)

中国基础教育知识库(CFED)

中国医院知识库(CHKD)

中国期刊题录数据库(CJDB)

中国专利数据库(CPD)

2.1.4.2 中国知网数据库检索

三种功能:初级检索、高级检索、跨库检索(参见期刊论文与引文检索相关章节)

万方数据资源系统

万方数据资源系统(2.2.12.2.1 全文数据库

●中国数字化期刊数据库

该库是万方数据资源系统的重要组成部分,由万方数据自主建设,作为国家“九五”重点科技攻关项目,从2001年开始,以核心期刊为主线,数字化期刊已经囊括我国所有科技统计源期刊和重要社科类核心期刊,成为中国网上期刊的第一大门户,内容涵盖医药卫生、工业技术、农业科学、基础科学、社会科学、经济财政、科教文艺、哲学政法等各个领域100多个类目的5200种期刊,实现全文上网。

数字化期刊全文数据库提供所有论文的引文信息,形成各种期刊论文与引文之间的网状链接,揭示科学知识之间的交叉和关联应用关系,为科学研究提供了有力的评价工具和完整的数据环境。

该数据库提供分类检索、刊名检索、论文检索和引文检索,论文检索支持布尔逻辑检索,检索项包括全文、论文题名、作者、作者单位、刊名、出版年份、关键词和文摘等,结果直接链接到期刊主页,可以实现按刊浏览。引文检索项包括全文、被引论文、论文题名、论文作者、论文刊名和论文年份。

●中国学位论文数据库

《中国学位论文全文数据库》始建于1985年,收录自1980年以来我国近800家学位授予单位近几年来的博硕论文,涉及全国“211工程”重点高校、中国科学院、中国工程院、中国农业科学院、中国医学科学院、中国林业科学研究院等机构的重点论文,内容涵盖自然科学、数理化、天文、地球、生物、医药、卫生、工业技术、航空、环境、社会科学、人文地理等各学科领域,充分展示了中国研究生教育的庞大阵容。以及中国科学研究的整体水平和巨大的发展潜力。其中文摘已达82余万篇,论文全文已达70余万篇,并年增全文15万篇,非常适合各所大学及科研机构研究使用。

中国高等教育文献保障系统

随着世界范围的数字图书馆建设的潮流,我国国家图书馆从1995年开始跟踪国际数字图书馆的发展,1996年初申请成立数字图书馆项目,1998年由国图带头,倡议实施“中国数字图书馆工程”,极大地推动了我国数字图书馆的建设与发展。为改变我国高等教育发展滞后的状况,1997年国家在实施“211”工程时,特定安排了“中国高等教育文献保障体系(CALIS) ”项目和中国教育科研网(CERNET) 共同构筑我国高等教育的公共服务体系。

中国高等教育文献保障体系(China Academic Library &Information System,英文简称“CALIS”,的建设1998年11月正式启动。CALIS项目的建设主体为“211工程”学校,目前已扩展至非“211工程”学校。

CALIS的目标:建立网络环境下国内高校的资源共享网络,通过组团购买的

方式降低外文数据库的引进成本,利用互联网进行合作编目共享书目资源,进而推进以馆际互借和电子文献传递为主要模式的资源共享。迄今参加CALIS项目建设和获取CALIS服务的成员馆已超过500家。

在文献信息服务网络方面,CALIS建设了1个管理中心、4个全国文献信息中心、8个地区级文献信息中心,加上各“211”高校自建的校内文献保障系统,形成了“全国中心——地区中心——高校图书馆”三级文献保障模式的服务网络。

2.3.1 CALIS的资源建设

作为网络环境下的行业性文献资源保障体系,CALIS系统自正式启动以来,以“共建、共知、共享”为建设原则,采取引进与自建相结合的模式进行数字资源的建设。

2.3.1.1 引进商业数据库:

对国内开展科学研究必备的外文数据库,CALIS采用3种方式引进:第一种方式为统一拨款引进,通过CALIS全国中心面向国内首期进入“211工程”的61所高等院校免费开放,这类数据库主要有:OCLCNew First Search的基础组14个数据库、Science Online、UnCover Gategay等;第二种方式,CALIS补贴部分经费,由CALIS各个地区中心通过组团购买的方式,向本地区的CALIS成员馆开放;第

三种方式是由CALIS文理中心或工程中心牵头联合引进,向参与购买的成员馆提供网络服务,目前各个图书馆主页上显示的大部分商品数据库基本上是采用该方式引进的。CALIS已引进的数据库基本覆盖各个学科领域及各种文献类型,成为互联网上高质量的学术信息资源群。

2.3.1.2 自建特色数据库:

CALIS的自建特色数据库包括联合目录数据库、中国高校学位论文数据库、专题特色数据库、学科导航数据库。

中国高校学位论文数据库采取分布建库、统一检索的模式进行。中文学位论文通过网上直接采集电子文本的方式,逐年累积;另外通过集团采购补贴的方式,与高校图书馆与公共馆、情报所等合作,按篇选择购买国外电子版博士、硕士学位论文,集中存放在CALIS的全文服务器中。

重点学科导航数据库以教育部正式颁布的学科分类系统作为构建导航库的学科分类基础,建设一个集中服务的全球网络资源导航数据库,提供重要学术网站的导航和免费学术资源的导航。共有52个学校获得导航库参建许可。导航库建设的学科范围涉及除军事学(大类)、民族学(无重点学科)之外的所有一级学科,共78个。

2.3.2 CALIS的服务功能

公共目录检索系统:CALIS提供联机公共目录检索的数据库以各种中、外文图书与期刊数据库为主。目前可供网络检索的数据库库有:中文期刊目次、西文期刊联合目录、中文图书联合目录、西方联合目录、日文联合目录、学位论文和会议论文数据库。

联机合作编目:旨在统一标准下,通过网络合作编目,共享编目数据、共建联合目录数据库。以联机合作编目为基础,带动全国性的资源共享工作的实施。

馆际互借与文献传递服务网:其宗旨是在全国范围内建立一个教育系统的文献资源共享网络,即建立满足全国高等教育系统内读者的文献需求的联合保障体系。

网络学术资源导航:针对网络信息资源分布无序的现象,以全国高校的重点学科建设为中心,CALIS在统筹规划的基础上,联合各校的技术与人力资源,收集网上的相关学术资源,建成重点学科网络资源学科导航库,向网络用户提供免费使用。目前已建成的网络学术资源导航库基本覆盖了各个学科。

联机计算机图书馆中心(简称OCLC)

OCLC(Online Computer Library Center,Inc.),即联机计算机图书馆中心,是一个面向图书馆的非营利的组织,以推动更多的人检索世界上的信息、实现资源共享并减少使用信息的费用为主要目的。OCLC已成功地在世界范围内开展联机合作编目与文献资源共享。

OCLC始建于1967年7月5日,原名俄亥俄大学图书馆中心(Ohio College Library Center),是由俄亥俄州的50多所大学联合建立的计算机联合编目网络。历经40余年的发展,其业务范围在不断扩大,至今已成为一个世界性的网络图书馆联盟与信息服务的网络协作组织,拥有4万多个各种类型的成员馆,为80多个国家和地区服务的一个内容供应商。它是当前相当著名的信息内容的网络托管服务商,也是世界上最大的联机文献信息服务机构之一。

OCLC的内容服务包括两大块:一方面以软件出售为主导,通过为其它的实体图书馆和数字图书馆提供方便、高效、快捷、便于用户使用的工具软件,以达到实现产品价值的目的,如Asia Link set ,Passport software 等。另一方面通过提供联机数据库服务以服务于用户,其中服务主要包括合作编目、馆际互借、馆藏采集、参考咨询四个方面。同时OCLC还在研究目录和元数据服务、数字化资源存储服务、合作性的参考文献和资源共享服务等。在其所提供的各种服务中,完全是以用户为中心,如FirstSearch 等特色服务,在方便用户检索的同时,也满足了用户的潜在需求,从而在用户群中享有很高的声誉。

网址:2.4.1 OCLC的联合编目

OCLC创建的初衷是为参与的成员包通过网络实现联机合作编目,进而在成员馆之间实现共享文献资源。WorldCat是OCLC 联机联合编目数据库。它是一个全球统一目录,是世界上有关书目信息最大和最丰富的数据库,由9000多个OCLC 成员机构共同创建与维护。它集中了各个成员馆的书目和所有者信息中的5300

多万条联机记录。

2.4.2 OCLC Question Point

Question Point是由OCLC和美国国会图书馆联合开发的一个极具代表性的世界范围内的合作式虚拟参考咨询服务系统。

Question Point服务由两个部分组成:Global Network全球网络服务和Regional/Local Network本地网络服务。Global Network是一个“library to library”(图书馆对图书馆)的结构,并不面向最终用户。地区性的图书馆、信息机构联合会可以通过单个图书馆也可以通过Question Point的本地网络服务向用户提供虎拟咨询服务。Question Point的服务是集中在OCLC的服务器上运行的,因此,成员馆不需要安装客户端的软件,只需要用户名,密码以及连接互联网的能力。

Question Point提供三种版本的服务方式供成员馆选择,目前全球已有1000多家图书馆及信息服务机构在使用该系统,如美国国会图书馆、清华大学图书馆、北京大学图书馆、上海交通大学图书馆、湖南大学图书馆等,并且已得到更多图书馆的关注,因为它使不同成员馆之间在参考咨询这一信息服务领域实现资源共享。

2.4.3 OCLC New First Search

OCLC在1991年推出了First Search联机检索系统,该检索系统具有检索功能强大、信息海量储存、检索费用低等特点。First Search是一个面向最终用户设计的联机检索系统,任何技术人员只要经过半天的培训都能熟练地应用,然后可自己亲自上机操作检索适合自己需要的文献,而且可以在图书馆、办公室、试验室甚至家中等任何地方的联到Internet网的微机上使用。

1996年,国内的清华大学图书馆率先引进First Search,成立了“清华First Search”服务中心,将该检索系统推向中国用户。

1999年,OCLC对原有的检索系统进行了网络化改造,并基于Web重新设计、改造出了高质量的网络检索系统——New First Search。新的检索系统除保留First Search原有的检索功能外,增加了许多新的功能,成为一个便捷、易用性好的综合性的,以Web为基础的全球性的网络检索系统。该系统的数据库大多由美国国内的图书馆、研究院、大型公司及相关机构提供,覆盖科学技术、人文与社会科学各个学科领域。系统收录图书、期刊、会议文献、世界知名的参考与事实数据库等资源类型,既包括由OCLC成员馆馆藏的印本资源,也包括电子资源的资源类型,共有3600余种图像期刊进入了First Search系统。用户通过New First Search系统,可检索80多个数据库。1999年,CALIS引进了New First Search的13个数据库,涉及的资源类型有图书、期刊论文、电子出版物、政府

出版物、电子出版物、网络资源、重要的参考信息源、著名的工具书的网络版等,类型有全文、题录、事实、文摘等,提供给国内的“211工程”院校的用户,该检索系统的并发用户可通过网络免费检索。

国家科技图书文献中心(NSTL)

国家科技图书文献中心(NSTL,2000年6月12日2.5.12.5.2国开通文献包括NSTL订购的国外网络版期刊,面向中国内地学术界用户开放。

美国生态学会期刊、美国运筹学和管理学研究协会期刊、美国冷泉港实验室期刊、加拿大国家研究委员会期刊、中欧科学期刊、英国皇家学会期刊、英国Maney出版公司期刊

2.部分单位开通文献:美国化学学会期刊、美国物理联合会期刊、美国物

理学会期刊、美国物理联合会会议录、俄罗斯科学院期刊、北大方正中文电子图书

3.免费获取期刊:NSTL组织开发的大量互联网免费获取的全文文献,供全国各界用户使用。

如:开放获取期刊指南、网上免费全文期刊、HighWire电子期刊、生物医学中心开放获取期刊、科学公共图书馆开放获取期刊、日本电子科学与技术信息集成、巴西网上科技电子图书馆

Dialog国际联机检索系统

美国DIALOG系统是目前世界上最强大的国际联机检索系统,也是目前世界上最著名的、运作最成功的联机商业数据库系统之一,从1972年开始建立第一个商用数据库到现在,已成为拥有近600个集文献信息系统、专业信息库、事实信息和全文信息于一体的大型专业联机数据库,其内容涉及40多个语种和占世界发行总量的60%的6万多种期刊,约占全世界机读文献总量的50%以上,收录世界各国6万多种期刊中的论文、会议论文、专利说明书等5亿多条,具有很高的权威性。它拥有80多个国家约10万多个终端用户,主机系统位于美国加利福尼亚州的PALO ALTO市,是目前世界上最强大的国际联机检索系统。DIALOG的服务是收费服务。

2.6.1 DIALOG数据库的学科范围:

DIALOG学科覆盖面广,几乎涉及全部学科范围,包括综合性科学、自然科学、应用科学和工艺学,社会科学和人文科学,时事报道和商业经济等。其数据来源于各种不同的图书、报纸、杂志期刊、技术报告、会议论文、专著、专利、标准、报表、目录、手册等上的信息。其数据形式包括:文献型(文献的题录和文摘);数值型(统计表、商业财政数据等);名录字典型(手册、指南、名录等);全文型(论文、报告、新闻报道的全文等)。其中收录的科技信息以书目型文摘居多,而公司、厂商信息多为目录型数据,新闻和行业、商业报告则为全文,还有表格和图形文件等形式。信息更新频率可根据数据性质不同分为每分钟、每天、每月或每季度不等。

Dialog系统的优势不仅体现在信息资源的庞大,更在于其具有很高的权威性。Dialog 数据库的供应者均为世界各国著名专业信息机构、出版社和新闻媒体,如美国化学文摘社、D&B公司、路透社、道琼斯、标准普尔等。Dialog系统作为世界最受推崇和最权威的科技和商务信息资源,正在为150多个国家和地区的20多万专业用户提供服务。另一方面,Dialog系统提供的信息有很强的延伸性,它不仅提供即时信息,而且可以迅速回溯查找一、两年前,甚至20多年前的历史累积数据,有利于了解整个事件的来龙去脉,以及行业、技术和公司发展的各阶段的状况。Dialog系统中还收集了大量国外著名市场研究机构的报告,如EIU、Euromonitor、MAID等。30多年来,Dialog检索系统不断地在改进和完善,一直代表着世界先进水平。

2.6.2 DIALOG的一些著名数据库列举:

DIALOG的近600个数据库中,有许多极具代表性的和常用的数据库,著名的数据库如CA(化学文摘)、INSPEC(英国科学文摘)、MEDLINE(医学文献数据库)、MATHSCI(数学文献数据库)、BA(生物学文摘)、NTIS(美国政府报告)等都加入到DIALOG系统中;还有著名的几大检索数据库,如SCI(科学引文索引)、

EI(工程索引)、ISTP(科技会议录索引)、SSCI(社会科学引文索引)、AHCI (艺术与人文科学引文索引)等也都可从DIALOG系统中检索;再有世界著名的DERWENT专利数据库以及美国专利、欧洲专利、日本专利等数据库也都可在DIALOG中查询。DIALOG更有一些全文数据库,如IAC的计算机全文库、《纽约时报》和《华盛顿邮报》等的全文库等。

Dialog系统除了提供常规的联机检索服务外,还提供Knowledge Index(知识检索)、Dialog Business Connection(商界联合服务)、One Search(多文档检索服务)、Electronic Mail (电子邮件服务)、DIALORDER(原文订购服务)等专项服务。

其他大型综合性检索系统

2.7.1 ISI Web of Knowledge(知识网)是一个基于互联网建立的动态的、整合的数字化研究环境。采用“一站式”服务,提供高质量的学术信息和研究工具,帮助研究人员获取、分析和管理研究信息,以专业的检索技术辅以新一代的知识管理的技术(连接、检索和个性化)来整合、扩展和组织研究环境。其平台可跨库检索:通过一个检索入口同时检索所有数据库。如Web of Science。还可同时检索13种文摘与全文免费资源以及一些个性化的服务和开放性链接。

2.7.2 Ovid 数据库系统

美国奥维德技术公司(OVID .)1984年创立,2001年6与美国著名的学术数据库出版商银盘公司(Silver Platter)合并,组成了全球最大的电子数据库出版公司。(http:2.7.3书馆链接(离线)–找到藏有这项学术成果的图书馆;

⑤同组文章–查找用户可能看到的同属这组学术研究成果的其他文章,可能是初始版本,其中有预印本、摘要、会议论文或其他改写本;

⑥网络搜索– Google 搜索中关于该研究成果的信息;

⑦BL Direct –通过大不列颠图书馆购买文章全文。

检索方法与技巧

(1) 作者搜索

输入加引号的作者姓名:“d knuth”。要增加结果的数量,请不要使用完整的名字,使用首字母即可。如果找到太多提及该作者的论文,则可以使用作者:操作符搜索特定作者。例如,可以尝试[”]、[ 或[”]。

(2) 按标题搜索

输入加引号的论文标题:“A History of the China Sea”。Google 学术

搜索会自动查找此论文以及提及此论文的其他论文。

(3) 检索某一特定主题的最新研究进展信息

在任一搜索结果页,单击右手边的“近期文章”链接,即可显示与您搜索话题相关的最新研究进展。这部分结果根据其他相关因素排名,可帮助用户更快找到较新的研究发现。

(4) Google Scholar的高级检索

Google Scholar的高级检索包含多种检索限定方法:包括指定检索结果中必须包含全部字词、包含确切的词语、包含至少一个字词、不包含字词;对检索结果出现搜索字词位置(文章标题、文章中任何位置)进行具体规定;对特定作者所著文章的检索;对特定刊物上的文章的检索;对特定时间段内发表的文章的检索。

(5) Google Scholar的检索操作符

“+” 操作符确保您的搜索结果中包括 Google 学术搜索技术通常忽略的普通字词、字母或数字,如 []; “-” 操作符排除所有包括搜索字词的结果,如 [];短语搜索只返回包括这一确切短语的结果,如 [“北京大学”];“OR” 操作符返回包括搜索字词之一的结果,如 [];“标题:”操作符如 [] 得到的结果只包括文件名中的搜索字词。

◆Google手气不错:系统的“手气不错”功能,将提供与用户检索需求最为相关的一条检索结果,即第一个网页。当用户急于在大量的检索结果中筛选出最符合需要的检索结果时采用。例如,要查找 Stanford 大学的主页,只需在搜索字段中输入“Stanford”,然后单击“手气不错”按钮。Google 将直接进入 Stanford 大学的官方主页。

◆Google的智能纠错功能:Google的智能纠错功能是指它的错别字改正功能。错别字改正软件系统会对输入的关键词进行自动扫描, 检查有没有错别字。如果发现用其他字词搜索可能会有更好的结果,以相应提示来帮助纠正可能有的错别字。例如,搜索“互连网”,Google 会自动提示“您是不是要找:互联网”。如果您点击“互联网”,Google 将以“互联网”作为关键词进行搜索。因为Google 的错别字改正软件系统是建立在互联网上所能找到的所有词条之上,它能够提示常用人名及地名的最常见的书写方式,这是一般的错别字改正软件所不及的。

◆Google数字图书馆:Google联合美国的纽约公共图书馆、哈佛大学图书馆、牛津大学图书馆、斯坦福大学图书馆、密歇根大学图书馆,以这五个图书馆提供的馆藏资源数字化为基础,启动Google数字图书馆。此举将图书馆的传统馆藏通过数字化加工引入公共阅读领域。列入该计划的资源包括:哈佛大学图书馆提供4000册图书进行数字化;斯坦福大学图书馆提供800万册图书进行

相关主题
文本预览
相关文档 最新文档