当前位置:文档之家› 科技信息检索方法及技巧1

科技信息检索方法及技巧1

科技信息检索方法及技巧1
科技信息检索方法及技巧1

姓名:学号:

学院:化学与环境工程

专业:应用化学

论文题目:科技信息检索的方法及技巧

2011年5月30日

科技信息检索技巧及方法ScientificInformationRetrieval Methods and Skills

摘要

在信息高速发展的今天,计算机和网络技术使文献检索技术注入了新的活力和内容,也使文献检索变得日趋重要,在这种趋势下,信息检索也由过去单纯的字符匹配逐步转向面向内容,基于知识的信息检索.在这里简单介绍一下基于知识服务的信息检索的相关问题,主要包括文献的基本概念,检索模型,检索方法和效率等.

ABSTRACT

In today's rapid development of information, computer and network technologies enable documentretrieval technology has injected new vitality and content also makes it increasingly important to literature search, in this trend, simple character matching in information retrieval from the past towards content-oriented, knowledge-based information retrieval. Here briefly are based on knowledge of information retrieval service related issues, including basic concepts of literature, retrieval models, retrieval, and efficiency.

关键词:检索技巧方法

Keywords:search skills methods

文献的概念,等级

一.文献的概念

文献是记录有知识的一切载体,具体地说,文献是将知识,信息用文字,符号,图像,音频等记录在一定的物质载体上的结合体.在查新中,文献是科技文献的简称,是指通过各种手段记录下科学技术信息或知识的载体.

由上述定义可以看出,文献具有三个基本属性,即文献的知识性,记录性和物质性.它具有存贮知识,传递和交流信息的功能.

二.文献的等级

依据文献传递知识,信息的质和量的不同以及加工层次的不同,人们将文献分为四个等级,分别称为零次文献,一次文献,二次文献和三次文献.

1.零次文献

这是一种特殊形式的情报信息源,主要包括两个方面的内容:一是形成一次文献以前的知识信息,即未经记录,未形成文字材料,直接作用于人的感觉器官的非文献型的情报信息.二是未公开于社会即未经正式发表的原始的文献,或没正式出版的各种书刊资料.

2.一次文献

这是人们直接以自己的生产,科研,社会活动等实践经验为依据生产出来的文献,也常被称为原始文献(或叫一级文献),其所记载的知识,信息比较新颖,具体,详尽.

3.二次文献

二次文献也称二级文献,它是将大量分散,零乱,无序的一次文献进行整理,浓缩,提炼,并按照一定的逻辑顺序和科学体系加以编排存储,使之系统化,以便于检索利用.

4.三次文献

三次文献也称三级文献,是选用大量有关的文献,经过综合,分析,研究而编写出来的文献.(尽可能引用一次文献,经过加工的二,三次文献往往带有加工者的主观倾向,可靠性大大降低.)

三.主要文献信息源

1.科技图书

2.科技期刊

期刊(periodicals)也称杂志(journals 或magazine)

3.专利文献

4.科技报告

5.学位论文

检索国外学位论文可利用dialog国际联机系统或国际大学缩微胶卷公司(university microfilms international)编辑出版的”国际学位论文文摘”,”美国博士学位论文”以及”学位论文综合索引”等检索工具.

6.会议文献

会议文献往往代表某一学科或专业领域内最新学术研究成果,基本上反映了该学科或专业的学术水平,研究动态和发展趋势.

7.政府出版物

政府出版物是指各国政府部门及其设立的专门机构发表,出版的文件,可分为行政性文件(如法令,方针政策,统计资料等)和科技文献(包括政府所属各部门的科技研究报告,科技成果公布,科普资料及技术政策文件等),其中科技文献约占30%~40%左右.

8.标准文献

检索国内标准的检索工具主要有”中国标准化年鉴”,”中国国家标准汇编”,”国家标准和部标准目录”,”中国国家标准文献数据库”等,检索国外标准文献的检索工具主要有”国际标准文献数据库”(中国标准情报中心编),”iso国际标准目录”,”美国国家标准目录”,”英国标准年鉴”等中译本资料及各国标准的原版目录.

检索模型

信息检索模型是描述信息检索过程中文档表示,查询及其相互关系的模型.目前主要的信息检索模型有布尔模型,向量空间模型,概念模型和基于本体的信息检索模型.

1.布尔模型

布尔模型是基于集合论和布尔代数的一种简单模型,该模型为用户提供了一个容易掌握的方式,输入布尔表达式即可查询.布尔模型定义索引术语只有两种状态:匹配和不匹配,这就导致了索引术语的权重都表现为二元性,要么文档完全匹配,要么文档完全不匹配,布尔模型只能进行精确检索而不能进行模糊检索.

2.向量模型

向量空间模型是利用空间相似性来表示语义的相似性.文档和查询都用多次元向量表示,如果查询向量和文档向量距离最近,那么这个文档和这个查询的相关度就最大,匹配程度就越高.向量空间模型解决了布尔模型索引术语权重二元性的缺点,提供出符合某向量距离(即相关度数值)范围内的所有检索结果,很大程度的提升了信息检索的检全率,但倘若相关度制定的过低,则会导致检索结果数量过多,影响检索效率.

3.概率模型

概率模型基于以下理论:给定一个查询串q和集合中的文档d,概率模型来估计用户查询串q 与文档d相关的概率.概率模型假设这种概率只由查询串和文档决定.更进一步说,该模型假定存在一个所有文档的集合,即相对于查询串q的结果文档子集,这种理想的集合用R表示,集合中的文档是被预料与查询串相关的.

4.基于本体的信息检索模型

基于本体的信息检索模型是利用领域本体作为组织资源的基础.首先构建一个涵盖相关领域概念及概念之间关联的本体库,在这基础上确定领域本体的主要概念和概念之间的关系,构筑领域本体的概念模型.该模型的检索过程如下:用户提交检索的关键字,系统查询本体库,从中找到关键字涉及的各个领域,并将其所在领域及该领域下的关键字罗列给用户,用户再根据个人意图确定需要查询的领域和关键字,系统根据经过本体库规范后的请求对信息资源进行全文检索,最后将检索结果返同给用户.系统通过修正用户的查询语句,使检索系统能够”理解”人类的自然语言,充分明白用户的真正意图,达到提高检索效率的目的.

检索的方法

一.查找文献的方法分为如下三种:

1.直接法

直接利用检索工具(系统)检索文献信息的方法,这是文献检索中最常用的一种方法.它又分为顺查法,倒查法和抽查法.

(1)顺查法

按照时间的顺序,由远及近地利用检索系统进行文献信息检索的方法.这种方法能收集到某一课题的系统文献,它适用于较大课题的文献检索.例如,已知某课题的起始年代,现在需要了解其发展的全过程,就可以用顺查法从最初的年代开始,逐渐向近期查找.

(2)倒查法

倒查法是由近及远,从新到旧,逆着时间的顺序利用检索工具进行文献检索的方法.此法的重点是放在近期文献上.使用这种方法可以最快地获得最新资料.

(3)抽查法

抽查法是指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法.

2.追溯法

不利用一般的检索工具,而是利用已经掌握的文献末尾所列的参考文献,进行逐一地追溯查找”引文”的一种最简便的扩大信息来源的方法.它还可以从查到的”引文”中再追溯查找”引文”,像滚雪球一样,依据文献间的引用关系,获得越来越多的相关文献.

3.综合法

综合法又称为循环法,它是把上述两种方法加以综合运用的方法.综合法既要利用检索工具进行常规检索,又要利用文献后所附参考文献进行追溯检索,分期分段地交替使用这两种方法.即先利用检索工具(系统)检到一批文献,再以这些文献末尾的参考目录为线索进行查找,如此循环进行,直到满足要求时为止.

综合法兼有常用法和追溯法的优点,可以查得较为全面而准确的文献,是实际中采用较多的方法.对于查新工作中的文献检索,可以根据查新项目的性质和检索要求将上述检索方法融汇在一起,灵活处理.

二.文献检索途径

检索工具有多种索引,可以提供多种检索途径。一般来讲,检索途径可以分为以下四种:分类途径,主题途径,著者途径和其他途径.

1.分类途径

分类途径是指按照文献资料所属学科(专业)类别进行检索的途径,它所依据的是检索工具中的分类索引.

分类途径检索文献关键在于正确理解检索工具的分类表,将待查项目划分到相应的类目中去.一些检索工具如”中文科技资料目录”是按分类编排的,可以按照分类进行查找.

2.主题途径

主题途径是指通过文献资料的内容主题进行检索的途径,它依据的是各种主题索引或关键词索引,检索者只要根据项目确定检索词(主题词或关键词),便可以实施检索.

主题途径检索文献关键在于分析项目,提炼主题概念,运用词语来表达主题概念,是一种主要的检索途径.

3.著者途径

著者途径是指根据已知文献著者来查找文献的途径,它依据的是著者索引,包括个人著者索引和机关团体索引.

4.其他途径

其他途径包括利用检索工具的各种专用索引来检索的途径.专用索引的种类很多,常见的有各种号码索引(如专利号,入藏号,报告号等),专用符号代码索引(如元素符号,分子式,结构式等),专用名词术语索引(如地名,机构名,商品名,生物属名等).

重要专业信息资源选介

一.公共学术站点

1.中国国家图书馆(https://www.doczj.com/doc/d711616330.html,)

2.中国科学院文献信息中心(https://www.doczj.com/doc/d711616330.html,)

3.万方数据资源系统(https://www.doczj.com/doc/d711616330.html,)

4.国家科技图书文献中心(https://www.doczj.com/doc/d711616330.html,)

5.中国高校科研网(https://www.doczj.com/doc/d711616330.html,)

6.中国学术期刊网(https://www.doczj.com/doc/d711616330.html,)

二.专业学会、研究机构及专业站

三.提供学术站点的导航网站点

参考文献:

朱传方,辜清华,”化学化工文献检索与应用” 2010.6

王知滓,蒋伟伟,十五年来我国网络信息检索研究述评,情报科学,2004.4

相关主题
文本预览
相关文档 最新文档