当前位置:文档之家› 浅谈信息检索工具

浅谈信息检索工具

浅谈信息检索工具
浅谈信息检索工具

摘要

文章由信息检索的分析和发展状况出发,阐述了一些常用的信息检索工具和相关技术。然后对常用的信息检索工具做了一个简要的评价,并由此讨论了信息检索工具的现状和发展趋势。

关键词:信息检索工具、技术、评价标准、发展趋势

Abstract

Post by information retrieval and analysis of development, and expounds a number of commonly used information retrieval tools and related technologies.Then used the information retrieval tools to do a brief evaluation, and then discuss the status of information retrieval tools and trends.

Keywords: information retrieval tools, techniques, evaluation criteria, trends

第一章信息检索分析及发展状况

步入21世纪,人们对信息检索的完备、准确、快捷会有更加严格的要求和期盼,与时俱进、不断完善的信息检索技术将得到越来越广泛的应用,信息的检索与访问方式无疑将发生深刻的变化。然而网上的信息浩如烟海,一个搜索引擎很难收集全所有主题的网络信息,即使信息主题收集得比较全面,由于主题范围太宽,很难将各个主题都做得精确又专业,使得检索结果中出现太多无用的信息。如何在浩瀚的信息海洋中准确、方便、快速地找到自己所需的信息,成了一个迫切需要解决的问题。

信息检索主要是指信息的表示、存储、组织和访问,即根据用户的查询要求,从信息数据库中检索与之有关的信息资料。信息检索的目的是获取所需信息,而这要基于比较完善的检索工具和技术。

1.1 从传统检索到信息分析

目前,随着信息检索技术的发展,信息检索已经由手工检索、计算机检索发展到了网络化、智能化、认知化阶段,这一阶段的信息检索平台具备了初步的信息分析功能,从而使传统检索信息向信息分析层次发展。例如,在ISIWeb of Science检索平台上,当某一主题的检索结果出来后,检索者还可以利用该平台提供的信息分析功能,对检索结果从以下几个方面进行深入分析:①按照论文发表时间进行分析,了解不同时间阶段课题研究的状态;②按照国家分析,了解该领域的主要研究国家以及国内该领域研究情况;③按照机构分析,了解领域的主要研究机构;④按照作者分析,了解该领域的核心研究人员;⑤按照来源期刊分析,了解该领域研究论文发表的重点期刊以及对某刊物收录论文情况进一步了解;⑥按照学科进行分析,了解该课题涉及哪些学科领域以及对感兴趣学科进行更深入的分析。很显然,通过对检索结果从6个方面进行深入分析,将使读者对检索结果作进一步的深入了解。

1.2 信息检索的发展状况

信息检索经过先组式索引检索、穿孔卡片检索、缩微胶卷检索发展到计算机信息检索。计算机信息检索大致可分为脱机检索、联机检索、国际联机检索、光盘检索、超文本的网络检索几个阶段。

目前,以文献单元描述体结构为基础、手工检索方式为主导的传统文献检索已发展到以信息单元组织结构为基础、网上浏览式信息查询方式的信息检索,计算机信息检索呈现联机检索、光盘检索以及网络检索多元并存的格局,面对用户群体、互相竞争、互相融合,谋求个性化基础上的共同发展。如下表所示,传统检索技术和网上检索技术无论是在检索策略还是在检索手段上都发生了本质的变化。

传统检索技术与网上检索技术的比较

第二章信息检索工具及相关技术

2. 1 网上检索工具及相关技术

为了快速、有效地获得信息,人们非常注重信息检索工具及相关技术的研究。现在,因特网上著名的搜索引擎有Yahoo 、Alto vista 、Infoseek 和Lycos 等;中文搜索引擎有Sohoo (搜狐) 、Robot (若比邻)等。搜索引擎是Internet上提供公共检索服务的Web网站,它是新一代信息检索工具。搜索引擎的关键技术主要是“自动跟踪技术”和“指引库”。

目前,网上检索工具正向多语种化、综合化、专业化方向发展,已出现元检索工具(即检索工具的检索工具),对选择和评估更新检索工具有着不可替代的作用,多元搜索引擎(集成式的搜索引擎) 具有去重功能,对检索结果进行统一的相关评估,能实现搜索引擎间的优化组合,通过电子邮件向用户随时提供网上信息。检索界面简洁、易学易用,检索结果格式清晰、内容充实、数据更新及时,检索所提供的网页链接可靠。

2.1 文本检索与多媒体检索

按照检索的信息形式,信息检索分为文本检索和多媒体检索。即使在文本信息检索领域,全文本和超文本检索技术的作用和重要性也正在超越二次文献文本信息的检索。文本检索现在比较实用的技术是全文检索和自然语言检索。全文检索采用对全部文本内容建立索引信息的方法实现对海量文本信息的秒级查询。自然语言检索是指使用文献作者和文摘提要的编写者原来使用的语言,利用计算机进行自动标引(或少量人工干预)和自动检索文献的方法,包括文本检索、关键词检索、自然语言和自然语言与人工语言并用的检索方法。目前面向中文的全文检索已是一种成熟的技术,得到了广泛的应用。自然语言检索方面也取得了进展,主要问题集中在中文语词的切分技术上。

2.2 多媒体信息检索的关键技术

对多媒体信息检索早期的方法是基于文本描述(即对多媒体信息添加文本说明) ,现在主要研究基于内容的多媒体检索技术。

基于内容的检索指根据媒体和媒体对象的内容语义及上下文联系进行检索,它利用图像处理、模式识别、计算机视觉、图像理解等学科中的一些方法作为部分基础技术,首先进行特征抽取,再计算其相似性。

多媒体文档不同于文本文档只有单一的线性结构关系

,收录一个多媒体文档,首先要对其进行内容和结构分析,提取多媒体文档的视听、语义和结构特征,作为用户浏览和检索的依据,同时为自适应的网络传输、互动式操作提供基本依据。目前,计算机识别技术的不成熟,以及不存在通用、高效的算法已成为多媒体基于内容检索技术发展的障碍。

对多媒体内容的分析、自动摘要、索引和查询方法的研究已取得较大的进步。为解决多媒体数据的检索问题,除了可以分别利用基于关键字和基于内容等检索方法各自的优势外,还可以通过相关反馈技术(Relevant Feedback) 、语义传播技术( SemanticPropagation)以及交互学习技术(Interactive Learn2ing)把这两种方法有机地结合起来,从而大幅度地提高检索系统的检索效率。

第三章信息检索工具的评价

随着互联网上各种信息的急剧增长, 网络信息检索工具的地位越来越重要, 搜索引擎的数量、种类有了长足的发展, 特别是随着网上中文信息日益增多, 网络中文检索工具应运而生, 它们为广大用户快速、准确地查询与获取网上中文信息创造了便利的条件。面对众多的网络信息检索工具, 为了帮助用户有效的选择, 也为了对检索工具的改进和完善提供参考, 下面将探讨信息检索工具的评价标准。

3.1传统评价指标体系遇到的困难

对传统的信息检索系统进行评价时,主要的性能评价指标包括信息收录范围、查全率、查准率、响应时间、输出方式、新颖率、用户友好程度等。因特网的出现使信息环境发生了变化,传统的检索性能评价指标在对新兴的网络检索工具进行评价时遇到了很大的困难。

首先,在网络信息环境下,响应时间在相当大的程度上取决于用户使用的通讯设备、网络的拥挤程度等外部因素。就算是同一检索工具,在不同时间检索同一课题,其响应时间也会不一样,实际上该指标无太大实际意义。

其次,真实的查准率和查全率在网络环境下也很难获得。

真实的查全率,即检索出的相关文献量和文献空间中所有相关文献量的比率,对整个因特网的文献空间来说是很难计算的,甚至连估算都困难。因为网上的信息是瞬息万变的,今天存在的信息,明天就可能不在了,同时又会出现更多的新的信息,而且至今对因特网上存在的信息量的准确估算都没有公认的说法。要计算或者估算查全率,就意味着要检验检索工具返回的所有检索结果,这在数量上可能成千上万。并且,要知道整个文献空间的相关文献量也是不可能的。

真实查准率,即检索出相关文献的数量和检索出的文献总量的比率,也是很难计算的。因为对于命中结果数太大的检索课题来说,相关性判断的工作量极大,不具有现实可操作性。

再次,新颖率这个指标在网络环境下也不再是问题了。因为因特网上的信息更新的速度很快,以新闻尤甚,与学术科研有关的信息也不会在网上存在很长时间,因此检索到的信息基本上都是新颖的。新颖率这个指标也没有很大意义。

3.2 关于新的检索性能评价指标的讨论

为了解决传统的检索性能评价指标体系遇到的困难,有必要对原有的评价指标体系做一些修正,形成新的体系,以适应新的信息环境的要求。

如前所述,响应时间、新颖率、查全率和查准率等传统评价指标在全新的网络信息环境下都遇到了前所未有的困难。但是数据库的收录范围、输出格式的灵活性、数据更新频率和用户界面友好程度等传统评价指标则因为很好地适应了新环境而得以保留。此外,出现了链接的可靠性这样的新的评价指标。

但是,查准率和查全率一直是评价信息检索系统检索性能的最有说服力的指标,也是最应该保留的评价指标。查全率在网络环境下遇到的困难:

●整个网络空间的文献总量难以计算;

●整个网络空间中和检索课题相关的文献量更加难以计算;

●很多时候,检出文献中的相关文献量的计算要花费巨大的人力和物力成本。

也就是说,在网络信息环境下,计算真实查全率不具有现实可操作性。

从另一个角度来说,在网络信息环境下,进行全面的回溯检索的现实可操作性也不大,因为网络上的信息是动态存在的。网络信息动态存在的特性决定了网络信息环境下的信息检索只能求新而不能求全。如果要进行全面的回溯检索,则要求助于DIALOG这样专业的联机情报检索系统。在这种情况下,查准率似乎是更必要的检索评价指标。

前面已经讨论过,网络信息环境下的真实查准率是难于计算的。因为有的检索命中记录数太多,有时候可以多至成千上万,其相关性判断的工作量极其巨大。因此,有必要寻求一种可操作的替代办法。

比较成功的一种计算查准率的替代方法是两位美国研究人员H.Vernon Leighton和JaideepSrivastava提出的“相关性范畴”概念和“前X 命中记录查准率”。

3.3新检索性能评价指标体系的建立

新评价指标体系以“前X命中记录查准率”为核心,继承和发展了原有的评价指标体系,包括输出数据库的收录范围、格式的灵活性、数据更新频率、链接的可靠性、用户界面友好程度等。

“前X命中记录查准率”是一个易于操作的评价网络检索工具检索性能的指标。虽然“前X命中记录查准率”有着这样那样的不足,但是它确实能比较客观地反映检索工具在前X条命中记录中提供有用信息的能力。

输出格式的灵活性是网络信息检索性能评价的一个重要指标。检索工具应该能够灵活地定义检索结果输出格式。和传统检索性能评价指标相同,检索工具应该能够输出尽量多的有关信息,如标题、说明语、URL 、文件尺寸、语种等。除此之外,网络信息环境的特点使网络检索工具可以用超链接来实现检索结果的输出。例如, Excite 在每个命中记录的最后有“Searchmore like this”这一项,使得用户可以方便地找到更多的相关记录。

数据更新频率是网络信息检索性能评价的另一个重要指标。在不考虑成本的情况下,检索工具数据更

新频率当然是越快越好。如果更新频率太慢,跟不上网上信息的更新速度,就会出现死链。

链接的可靠性是网络信息检索性能评价特有的评价指标。这个指标和数据更新频率有关。显而易见,如果链接的可靠性很差,断链、死链太多,就会出现找不到原始文献的情况,那么命中记录再多也没有用。

用户界面友好程度是所有检索工具是否易于使用的衡量标准。检索工具的目的就是尽可能完美地服务于信息检索用户,简单、易用应该是检索工具永恒的特点。

第四章信息检索工具的现状与发展趋势

4.1基于网页的网络信息检索工具

网络信息检索工具的发展主要体现在进一步改进、完善检索工具和检索技术,以提高检索服务质量,改变网络信息检索不尽人意的地方。主要体现在以下几个方面:一是网络检索工具开发提供商之间的合作越来越紧密。过去一般网络检索工具提供商只依靠自己建立的数据库来提供检索服务,检索范围有限,而现在某些著名的搜索引擎购买了其他公司的数据库或者技术内核,有的与其他搜索引擎建立伙伴关系,以便用户使用。二是信息检索工具专业化及服务内容不断深化。一些检索工具已经不再盲目追求加大收录和标引量,而更加注重突出专业特色。在lycos搜索引擎目录中,我们可以看到商业搜索引擎、IT搜索引擎、人才搜索引擎、金融搜索引擎、医学搜索引擎等专业化的网络信息检索工具纷纷出现,信息检索工具的专业化已经成为一种不可逆转的趋势。

4.2 基于FTP文件的搜索工具

FTP文件搜索引擎技术还不是很成熟,但其发展非常迅速。其发展趋势主要表现在以下几个方面:一是检索功能日益丰富。天网FTP文件搜索引擎现在可以实现以文件大小、文件的上传日期以及网段(如华北网、华东网等)等多个条件的高级检索来限制检索结果;https://www.doczj.com/doc/ed1525293.html,增加了检索方式(规则表达检索、准确检索、浏览、对大小写敏感与否等),限制主机类型(是edu还是gov或者com等)、文件类型以及文件大小、日期等功能。二是检索服务的个性化。现在FTP搜索引擎研究者已经开始注意这一问题,天网ftp搜索引擎已经有了很多个性化的选项:可以设置用户不同偏好的排序方式,可以设定国外文件优先还是本国文件优先,对于国外用户是不是应该国外文件优先,是FTP上文件优先还是WWW上的文件优先,是选择中文还是英文等。https://www.doczj.com/doc/ed1525293.html,可以完成更为丰富的个性化设置,如可以选择一个主机提供一个结果、设置语言、搜索文件大小的设置、是否亮度显示搜索关键词、设置使用者语言以及键盘快捷键等。

4.3 基于网络检索工具的检索技术

这类检索工具的发展趋势主要表现在下面几个方面:一是检索结果整理的深化。如Vivisimo,

EZ2WWW,MetaCrawler等可以实现搜索结果的自动分类,用户可以利用传统的方式浏览结果,也可以利用其同屏的分类结果提示找寻自己需要的内容。通过EZ2WWW高级搜索功能可提供1000多种专项资源检索,可进行目录检索。SurfWax有一个其他元搜索引擎没有的独特功能,即点击每条结果左边的“网址揿钮”图标,可浏览该结果包括的任何页面,并显示搜索语句在文件中的位置,也可把搜索结果和文件存储起来以备后用。天网搜霸已经拥有了独特的链接检测功能,可在几秒钟内检查当前页面查询结果是否可以访问,如果标注为绿色,则链接可连通(目前仅检测页面内以http:// 和ftp://开头的链接)。二是检索界面的个性化趋势。天网搜霸和Goggle提供了IE浏览器的插件,安装后就会被嵌到IE的工具栏,用户不用登陆天网主页就可实现检索。用户可将自己喜欢的搜索引擎设置为主要搜索,也可添加自己喜欢的搜索引擎。不久前天网搜霸刚刚推出了可嵌在Windows系统任务栏上的插件,现在用户连打开IE浏览器都不需要了。Mamma 可选择使用短语检索功能、设定检索时间、设定每页可显示记录数,还提供了专门检索页面文件标题的特殊检索服务,以及通过E-mail传输检索结果的特色功能。MetaCrawler可实现搜索引擎的选择调用,基于域名、地区或国家的检索结果过滤,最长检索时间设置,每页可显示的和允许每个搜索引擎返回的检索结果数量的设定,设定检索结果排序依据(包括相关度、域名、源搜索引擎)个性化定制保存。三是智能化。ProFusion可自动实现符合特殊检索语法要求的转换。

参考文献

[1] 敬卿王群从传统信息检索到面向知识创新

[2]孙桂荣从网络信息检索工具的现状看其发展特点

[3]金芳浅谈信息检索与信息检索技术

[4]李宪民网络时代文献信息检索工具及其选择

[5]高琳龚立群网络信息检索工具的分类及其发展趋势

[6]张喜年网络信息检索工具的检索功能述略

[7]张琪玉网络信息检索工具的竞争力要素

[8]张健信息检索工具的现状与发展趋势

[9]韩圣龙网络信息检索工具评价指标

[10]史维网络信息检索工具浅析

[11]乔华网络信息检索工具透视

[12]杨爱群网络信息检索工具研究

[13]王爱玲网络中文信息检索工具的评价

[14]仇恢信息时代信息检索工具发展的新走向

[15]何俊伟丁丽珊因特网信息检索对传统信息检索的影响及对策

.

文献信息检索的含义

、文献信息检索的含义、分类、检索语言 1、文献信息检索: 文献检索含义 是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称又叫“信息的存储与检索,这是广义的信息检索。狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻。 计算机信息检索,是指以计算机技术为手段,通过光盘和联机等现代检索方式进行信息检索的方法。 一次文献 (primary document):是指作者以本人的研究成果为基本素材而创作或撰写的文献,不管创作时是否参考或引用了他人的著作,也不管该文献以何种物质形式出现,均属一次文献。 二次文献 (secondary document):是指文献工作者对一次文献进行加工、提炼和压缩之后所得到的产物,是为了便于管理和利用一次文献而编辑、出版和累积起来的工具性文献。检索工具书和网上检索引擎是典型的二次文献。 三次文献 (tertiary document):是指对有关的一次文献和二次文献进行广泛深入的分析研究综合概括而成的产物。如大百科全书、辞典等。

零次文献 它是指未经过任何加工的原始文献,如实验记录、手稿、原始录音、原始录像、谈话记录等。零次文献在原始文献的保存、原始数据的核对、原始构思的核定(权利人)等方面有着重要的作用。 用检索标识与文献的存储标识相比,如果能够取得一致,就叫"匹配",就可得到"命中文献"。 2、文献检索语言 文献检索语言是一种人工语言,用于各种检索工具的编制和使用、并为检索系统提供一种统一的、作为基准的、用于信息交流的一种符号化或语词化的专用语言。检索语言按原理可分为3大类: (1)、分类语言 它是将表达文献信息内容和检索课题的大量概念,按其所属的学科性质进行分类和排列,成为基本反映通常科学知识分类体系的逻辑系统,并用号码(分类号)来表示概念及其在系统中的位置,甚至还表示概念与概念之间关系的检索语言。 (2)、主题语言 是指经过控制的,表达文献信息内容的语词。主题词需规范,主题词表是主题词语言的体现,词表中的词作为文献内容的标识和查找文献的依据 (3)、关键词语言 指从文献内容中抽出来的关键的词,这些词作为文献内容的标识和查找目录索引的依据关键词不需要规范化,也不需要关键词表作为标

文献期刊数据库的检索及应用策略

摘要 当今社会,科学技术的发展日新月异。人类社会由工业经济社会时代向知识经济社会时代飞速发展,人们的生活越来越依赖于知识和信息。知识引起的文献总量和各类信息的快速增加,使人们不得不面对海量的文献资料和各类信息。如何将这些文献资料和信息有序地组织起来,在需要的时候迅速地查找出来,如何编制适应用户需要的检索工具来达到这一目的,这是知识时代人们面临的核心问题。如何应用文献期刊数据库来检索信息是信息检索需要掌握的方法、技巧和基本功。 关键词文献期刊;数据库;检索;应用 文献期刊数据库是目前国内外文献数据库建设的重点,是用特定符号记录知识载体的总称。承担汇集、传承人类文化知识的文献在信息时代,已成为当代社会不可或缺的重要资源。文献信息检索的对象是文献检索的目的,是得到个人所需有用信息的重要手段和特殊工具。如果说文献信息资源是一座巨大的知识宝库,检索工具就是开启宝库的钥匙。掌握检索工具的使用方法和技巧,是信息检索必备的基本功。 文献检索的基本原理是通过对大量分散无序的文献信息进行搜集、加工组织、存储建立各种检索系统,并通过一定的方法和手段使存储与检索采用的特征标识匹配获得和利用信息源。检索工具是人们查找所需文献时必须利用的各种工具。一般分为手工检索工具和机械检索(计算机检索)工具两种。 手工检索工具系指各种目录、文摘和索引等。人们直接利用这些工具进行检索的方式称为手工检索方式。利用穿孔卡片、光电检索系统、特别是电子计算机检索系统的技术设备而进行的检索行为称为机械检索。手工检索是机械检索(计算机检索)的基础,机械检索(计算机检索)是手工检索的发展。从检索原理来看,手检与机检并无差别。在检索进行之前都要进行检索课题的分析,检索工具(文摘或文档)的选用根据检索课题的要求制定检索策略,选择检索途径和检索方法,然后才能进行检索操作。 文献期刊数据库的主要功能概括为信息检索功能,如何运用文献期刊数据库检索出相关文献,正确利用检索策略是非常重要的。检索策略是计算机文献检索中必要的方法和步骤。目的在于查全、查准数据库中的专题文献。因此,它是决定检索效果的关键。在明确检索课题和检索目的后,合理选择检索途径和检索项,将检索课题转换成逻辑表达式(提问式)。计算机检索系统根据表达式规定的检索词之间的逻辑关系进行匹配检索命中的输出即为检索结果。

网络信息检索及其检索工具

摘要 进入20世纪90年代以后,互联网的发展风起云涌,人类社会的信息化、网络化进程大大加快。与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。 网络信息资源的迅猛增长,使人们获得有用信息越来越困难,网络检索工具应运而生,文章介绍了网络信息检索工具的类型和功能,提出了检索工具的发展趋势。 关键字:网络信息检索;检索工具;因特网;web资源检索

目录 摘要 .......................................................................................................................................... I 1 信息检索的定义. (1) 2网络信息检索简介 (1) 2.1网络信息检索定义 (1) 2.2 网络信息检索的原理 (1) 2.3网络信息检索与传统信息检索的区别 (2) 2.4网络信息检索技巧 (2) 3网络信息检索工具类型 (3) 3.1非web资源检索工具 (3) 3.2web资源检索工具 (3) 4网络信息检索工具的功能 (4) 5网络信息检索展望 (5) 5.1网络信息检索的展望 (5) 5.2网络信息检索工具展望 (5) 参考文献 (6)

浅谈网络信息检索及其检索工具 1 信息检索的定义 什麽是信息?信息是消息,人们在学习、工作、日常生活中随时随地都在接受和利用信息;信息是资源,它具有使用价值和价值;信息是财富,且是无价之财富;信息是生产力要素,更是一种不可估量的促进生产力发展的新动力。因此,人类社会的发展,科技技术的进步,都离不开信息资源的开发和利用。而且,信息资源的真实状况及开发利用程度,已经成为衡量一个国家经济、文化、科技以及综合国力的重要指标。我们怎样快速的查找信息和有序的整理信息?信息检索是最快的途径。 信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。 2网络信息检索简介 随着信息技术的飞速发展,信息已成为全社会的重要资源,对信息的占有程度及信息处理水平的先进程度已成为衡量一个国家或地区现代化程度的重要标志,而网络上丰富的信息在更大程度上改变了人们的工作和生活的方式。Internet是当今世界上规模最大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络,基于Internet的网络信息检索的研究,无论对研究人员还是一般用户来说,都有着很强的现实性和实用性。 2.1网络信息检索定义 网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。 2.2 网络信息检索的原理 网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。 (1)布尔逻辑模型——这是一种简单而常用的严格匹配模型。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询

信息检索原理与技术资料整理

信息检索原理与技术 资料整理 华中师范大学 信息检索原理与技术

第一章信息检索概论 1.1信息检索基础简述 1.信息:事物发出的信号所包含的内容。 2.知识:知识是人类的主观世界对客观世界的概括和反映,是大量有组织的信息,是关于 事实和思想的有组织的陈述,提供某种思考的判断和某种实验的结果。 3.知识的分类: ①“知事”(know-what):指关于事实方面的知识,也可理解为know-when、know- where,即在什么样的时间(know-when)、什么样的地点或条件下(know-where) 能解决什么样的问题。 ②“知因”(know-why):指自然原理和规律方面的科学理论,知识的产生是在专门研 究机构如实验室和大学完成的。 ③“知道怎样做的知识”(know-how):指做某些事情的技艺和能力,被称为技术情报 和商业秘密,其典型是企业开发和保存于其内部的技术诀窍或专有技术。 ④“谁以及是怎样创造知识的”(know-who):侧重对创造思想、方法、手段、过程及 特点等的了解。 4.文献:文献是记录有知识的一切载体,即知识信息必须通过文献载体进行存储和传递。 构成三要素:①构成文献内核的知识信息 ②负载知识信息的物质载体 ③记录知识信息的符号和技术 特点:知识性(本质)、传递性、动态性。 分类标准: 内容加工程度划分: ①一次文献信息:指作者以自己的研究成果为基础创作和撰写的、未经过加工的原始 文献。 ②二次文献信息:指对一次信息加工整理而成的文献,如目录、文摘、索引等各种书 目信息,它具有汇集性。 ③三次文献信息:是对一次、二次信息综合、分析等深加工的产物,如评论、进展报 告、评述、百科全书、年鉴、指南、期刊书目等。 载体形式划分:书写型、印刷型、缩微型、声像型、机读型五大类。 5.文献信息链:文献作为人类文化信息的承载物,从其产生、替代、反复被利用、再创造, 直至产生新知识,是一个不断演进的运动过程。 6.信息、知识和文献三者之间的关系(重点):信息>知识>文献 信息、知识和文献的联系在于:信息作为物质的一种普遍属性,是生物以及具有自动控制系统的机器通过感觉器官和相应的设备与外界进行交换的一切内容。它是有形的、独立于行动和决策、经过处理改变形态、物质产品、与环境无关、可以复制的; 知识作为信息的一部分,是一种特定的人类信息,也是人类社会实践经验的总结,是人的主观世界对于客观世界的概括和如实反映。它是无形的、与行动和决策相关、经过处理能改变思维、精神产品、环境改变含义、经过学习才能转让、无法复制的; 文献是知识的一部分,是进入人类社会交流系统的运动着的知识。 具体来说,三者之间的关系为:信息>知识>文献。

文献检索与应用 ( 第1次 )

第1次作业 一、单项选择题(本大题共100分,共 40 小题,每小题 2.5 分) 1. 以下哪项检索属于数据检索? A. 历史成绩超过89分的学生人数 B. 查喜黄山有多高 C. 检索关于网络技术的文献 D. 某同类产品中,那种牌号的销量最大 2. 以下哪种文献不属于零次文献? A. 实验记录 B. 手稿 C. 原始录音 D. 专利索引 3. 国际标准连续性出版物编号的缩写形式为( ) A. ISBN B. ISSN C. CNKI D. VIP 4. 布尔逻辑检索包括() A. 逻辑“与”和逻辑“异或” B. 逻辑“与”和逻辑“或” C. 逻辑“+”和逻辑“-” D. 逻辑“与”、逻辑“或”和逻辑“非” 5. 以下哪个不属于文献的出版形式分类( ) A. 图书 B. 期刊 C. 零次文献 D. 会议文献 6. 下面哪一个属于二次文献? A. 专题评述 B. 中经网数据库 C. 图书 D. 学位论文 7. 以下哪一个属于三次文献? A. 演讲稿 B. 会议论文 C. CNKI期刊数据库 D. 年鉴 8. 关于情报、知识、信息的基本概念及其之间的关系,以下描述错误的是()。 A. 知识是人类对信息本质的认识和掌握 B. 信息和知识的认识是同步的 C. 知识就是有用的信息 D. 情报是指由特定效用的传递着的知识 9. 关于信息检索,以下描述错误的是( )

A. 信息检索的类型有文献检索、数据检索和事实检索 B. “查看月球的年龄”的信息检索属于数据检索 C. “班上平均成绩超过80分的学生人数统计”属于数据检索 D. 文献检索的目的是要检索出包含所需要信息的文献 10. 关于情报、知识、信息的概念及其之间的关系,以下描述错误的是( ). A. 从时间上来看,知识滞后于信息 B. 情报具有效用性 C. 知识就是情报 D. 情报具有社会性 11. 关于检索方法的四种描述,其中描述错误的是()。 A. 检索方法分为常用法、追溯法和循环法 B. 循环法是上述追溯法和常用法的结合 C. 常用法,也叫工具法,就是利用文摘或题录等各种文献检索工具查找文献的方法 D. 常用法根据时间范围又分为顺查法和倒查法 12. 以下四项检索哪一项属于事实检索()? A. 检索关于铝合金的研究文献 B. 检索泰山有多高 C. 检索关于网络技术的文献 D. 同学中来自陕西的同学人数 13. 以下的数据库,哪一个不属于国外权威引文数据库?() A. SCI B. EI C. ISTP D. CNKI 14. 要在SCI中查找重庆大学关于远程教育研究的文献,请问以下检索式正确的是( ) A. AD=Chongqing Univ* and TI=distance education B. AD=Chongqing Univ and TI=distance education C. AD=Chongqing Univ* and AU=distance education D. AD=Chongqing Univ or TI=distance education 15. 从物理构成来讲,数字资源检索系统由()几部分构成 A. 软件和数据库 B. 硬件、软件、数据库 C. 硬件系统和软件 D. 服务器和数据库 16. IP地址由()节数字组成 A. 两 B. 四 C. 三 D. 五 17. 以下对专利的四种论述,哪一个是错误的? A. 专利是指一个国家授予创造发明人在一定的时间内对该发明创造的独占实施权,包括专利产品的生产、使用和销售.

网络信息检索与利用参考试题与答案

网络信息检索与利用 一、名词解释题: 网络信息资源:是将文字、图像、声音、动画等各种形式的信息,以数字化形式存储并借 助计算机与网络通讯设置发布,收集、组织、存储、传递、检索和利用信息资源。www:信息检索 数据库:是至少有一个文档组成并能满足某一特定目的或某一特定数据处理系统需要的一 种数据集合。 联机检索:指用户利用计算机联合通过通讯网络与世界各地的信息检索系统联机,从检索系统的数据库中查找出所需信息的过程。它允许用户以智能机对话,联机会话,这样交互的方式直接访问检索系统及数据库、检索是实时在线进行。 查全率:是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的 比例。 查准率:是指检出文献中合乎需要的文献的数量占检出文献的全部数量。 关键词:关键词又称自由词,它属于自言语言范畴。关键词是直接来自文献本身,能够反映文献主题概念,具有实际检索意义的词语。以搜索引擎为代表的基于关键词的检索工具能够利用全文索引技术。 布尔逻辑检索:又称布尔代数是指使用,and,or,not等运用符,查找含有某种词语特定 主配形式的网页。 搜索引擎:是一个可以用文件名查找文件的系统。 元搜索引擎:是一种基于搜索引擎的网络检索工具。它是将多个搜索引擎集合在一起,通过一个统一的检索界面接收并处理用户的查询提问。在进行检索时调用一个或者多个独立搜索引擎的数据库。 桌面元搜索引擎:顾名思义,桌面元搜索引擎不是通过网上调用方式在线使用,而是直接在用户的计算机上进行,相当于用户自己拥有一个元搜索引擎,所以称之为桌面元搜索引擎。 All-in-One式元搜索引擎:又称搜索引擎元目录,它将主要的搜索引擎集中起来,并按类 型或检索问题等编排组织成目录帮助导引用户根据检索需求来选择适用的搜索引擎。联 合书目数据库:联合目录是揭示报道若干个文献收藏单位的文献入藏情况,汇总若干个单 位馆藏的书目信息的目录。 参考信息:是指人名、地名、机构、事件、统计数据等一类数据,事实信息,是人们的工 作研究和日常生活中经常要查考、引用的信息。 二、简答题和论述题: 1. 网络信息资源的种类分哪几种? 答:可分为五种:1.web信息资源。其中有www有关的重要概念:(1)超文本传输协议HTTP(2)超文本标记语言HTML(3)通用资源定位程序URL(4)主页(home page)(5)链接(link)(6)浏览器 2.Telnet:是通过远程登录后,可以访问共享的远程系统中的资源。 3.FTP信息资源,是因特网适用的文件传输协议。 4.用户组信息资源,是有一

信息检索-判断题(精心整理)较全版本

判断题 1.信息素养是由信息意识、信息知识、信息能力、信息道德四个要素构成的。(A) https://www.doczj.com/doc/ed1525293.html,KI中国知网数据库可以检索到博硕士论文。(A) 3.查全率与查准率是评价检索效果的两项重要指标。(A) 4.广义的信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的需要查找出特定信息的技术和过程。(A) 5.逻辑“与”是一种用于交叉概念或者限定关系的组配,可以缩小检索范围,提高查准率。(A) 6.逻辑“或”是一种用于概念并列关系的组配,可以扩大检索范围,提高查全率。(A) 7.信息检索过程是一个检索的操作过程,如选择数据库、确定关键词、构造检索式等。(B) 8.界定问题过程首先需要根据待完成的任务,确定信息问题。然后根据信息问题,确定信息需要。(A) 9.概览性资料通常出现在我们所说的二次文献中。(B) 10.图书馆OPAC检索系统属二次文献数据库(A) 11.当检索关键词具有多个同义词和近义词时,容易造成漏检,使得查全率较低。(A) 12.对于要求一定深度、研究性的信息问题,应主要检索搜索引擎检索网络信息源。(B) 13.选择信息源是信息检索的第一步。(B) 14.PQDT 是美国Proquest公司出版的学位论文数据库。(A) 15.根据文献内容的不同加工深度可区分为一文献、二次文献和三次文献,学位论文属三次文献。(B) 16.综述文献属于二次文献(B) 17.The mammalian cell as a microorganism;-genetic and biochemical studies in vitro puck, Theodore T.(Theodore Thomas) xi,219p.illus.24cm. ISBN 0-816-26980-7 San Francisco,Holden-Day 1972 该文献类型为期刊论文。(B) 18.通过EBSCO、EI、OCLC数据库都能检索到外文期刊论文全文。(B) 19.在超星阅览器登录个人用户名后下载的图书支持拷贝到其他机器上阅读。拷贝到其他机器阅读时,需要在阅读的机器上使用下载时用户名进行超星阅览器->“注册”菜单->“用户登录”操作。(A) 20.分类途径就是按照文献的名称体系查找文献的途径。(B) 21.检索2010年经济统计数据通常应该用2010年出版的《中国统计年鉴》。(B) 22.Effect of coating whole cottonseed on performance of lactating dairy cows. Bernard,-J,K;Calhoun,M.C;Matin,S.A. Savoy, III.:American Dairy Science Association J-dairy-sci.. June 1999.v.82 p.1296-1304.该文献类型为图书。(B) 23.主题语言较适合于期刊论文、研究报告、会议论文等单篇文献的组织和检索(A) 24.分类语言适合于图书或文集的组织和检索,提供的是从学科或专业角度查找文献信息的途径,族性检索功能强。(A)

《文献信息检索与利用》考试试题答案

考试说明: ①综合成绩总分100分,分为平时成绩(占综合成绩的40%)和期末考试试卷成绩(占综合成绩的60%)。 ②要求认真审题,独立完成,试卷及作业雷同者、抄袭者和被抄袭者均不得分!!! ③要求交打印稿和电子稿。可先在电脑上做好后再打印出来,注意排版整洁清晰,字体五号字,页边距可设为2×2×2×2。 ④考卷WORD文档名称和发送EMAIL标题名一律为“学号+姓名+系部”,如:200942058丁月_计算机科学系。发送至huadanduoji@https://www.doczj.com/doc/ed1525293.html,. ⑤考试时间为9月5日—8日,8日16:30前将考试卷交任课教师处。 一、检索题(80分)。(以下题如果文字不足以说明,可以采用截图表示。) 1、搜索引擎题。(20分) (1)在中国教育网站内搜索有关“信息检索”方面的doc\pdf\ppt格式的文献,给出检索式。(5分)答:信息检索filetype:doc 信息检索filetype:ppt 信息检索filetype:pdf (2)对本专业的“门户网站”进行搜集,列出你认为最有价值的2个门户网站的名称及网址,并说明选择它的理由。(5分) 答:1)有机化学网:https://www.doczj.com/doc/ed1525293.html,/ 理由:有机化学网是国内最大的化学网站,内有最丰富的化学技术文章、资料、信息、资讯,最全面的有机化合物库,最权威的化学品供求平台 2)化学学科网:https://www.doczj.com/doc/ed1525293.html,/ 理由:化学学科网作为国内最大的教育门户网站,拥有权威、丰富、及时的独家教育资源。当前注册会员400多万人,并参与资料上传,同时有千余名一线教师共同审核维护。每日更新资料数2000多套,非常活跃。 (3)请搜索“中国商标网”网站并用该网站检索绍兴 咸亨酒店食品有限公司的商标图案和专用权期限;(5分) 答:绍兴咸亨酒店食品有限公司 商标如右图: 专用期限权: 2004 年9 月28 日至2014 年9 月27 日(4)请运用GOOGLE学术搜索,检索近3年内标题内含有“物联网”和“移动通信”方面的学术论文,请打开其中一篇论文全文,把其题名、作者、单位、中英文关键词和摘要、分类号及其一级标题复制粘贴如下。(5分) 答:题名:物联网的体系结构与相关技术研究 作者:沈苏彬范曲立宗平毛燕琴黄维 单位:南京邮电大学软件学院,江苏南京 南京邮电大学信息材料与纳米技术研究院,江苏南京 关键词:物联网;网络化物理系统;下一代网;产品电子标签;网络体系结构 摘要:物联网技术已经引起国内学术界、工业界和新闻媒体的高度重视,当前物联网的定义、

《文献信息检索》习题答案文献信息检索(答案)

《文献信息检索》习题答案 一、单选题 1、文献是记录有知识的(A) A.载体 B.纸张 C.光盘 D.磁盘 2、如果需要检索某位作者的文献被引用的情况,应该使用(C)检索。 A.分类索引 B.作者索引 C.引文索引 D.主题索引 3、下列哪种文献属于二次文献( D.) A.专利文献 B.学位论文 C.会议文献 D.目录 4、纸质信息源的载体是(D) A.光盘 B.缩微平片 C.感光材料 D.纸张 5、《中国图书馆分类法》(简称《中图法》)将图书分成( A.) A.5大部分22个大类 B.5大部分26个大类 C.6大部分22个大类 D.6大部分26个大类 6、利用文献末尾所附参考文献进行检索的方法是(C) A.倒查法 B.顺查法 C.引文追溯法 D.抽查法 7、广义的信息检索包含两个过程(B) A.检索与利用 B.存储与检索 C.存储与利用 D.检索与报道 8、中国国家标准的代码是(A) A.G B. B.CB. C.ZG D.CG 9、( D )是报道文献出版或收藏信息为主要功能的工具。 A.题录 B.索引 C.文摘 D.目录 10、逻辑运算符包括(D) A.逻辑与 B.逻辑或 C.逻辑非 D.A,B和C 11、记录是对某一实体的全部属性进行描述的结果,在全文数据库中一条记录相当于(C),在书目数据库中,一条记录相当于() A.一条文摘,一篇完整的文献 B.一条文摘,一条题录 C.一篇完整的文献,一条题录或文摘 D.一条题录,一条文摘 12、《中国学术期刊全文数据库》提供的文献内容特征检索途径有(B) A.机构 B.篇名/关键词/摘要 C.中文刊名 D.作者 13、根据反映新内容的程度从大到小,下列文献类型的排序正确的是:(A) A.会议论文,科技期刊,科技报告,科技图书 B.科技图书,科技期刊,科技报告,会议论文 C.科技报告,会议论文,科技图书,科技期刊 D.以上都不对 14、《中国科研机构数据库》、《中国科技名人数据库》属于:(B) A.书目数据库 B.指南数据库 C.全文数据库 D.数值数据库 15、下列检索工具中,主要收录化学与化工类文献的是:(D) A.SCI B.OCLC C.EI

网络信息检索期末考试试卷及答案

绵阳师范学院历史文化与旅游管理学院 第一部分(基础知识部分,共三大题,共60) 一、填空题(每空1分,共30分) 1 ?信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。 2. 知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。 3. 情报是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。 4. 文献是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。 5 ?会议文献是指在国内外学术或非学术会议上发表的论文或报告。 6 ?学位论文是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。 7.著录是对文献内容和形式特征进行选择和记录的过程。 8 ?数据检索是指特定的数值型数据为对象的检索。 9. 在印刷型资源时代,事实与数据检索工具主要依靠各类参考工具书完成各种数据或事实的查询。 10. Internet 是基于TCP/IP协议的网络。 11. 二级域名https://www.doczj.com/doc/ed1525293.html,是指教育机构。 12. 目前WW环境中使用较多的网页浏览器有Microsoft公司的IE浏览器和360公司的360安全浏览器。 13. 每种网络信息检索工具一般由信息米集子系统、数据库和检索代理软件三部分组成。 14. 大多数搜索引擎允许用户使用布尔逻辑运算符,以及与之对应的: “ +”表示限定搜索结果中必须包含的词汇,“-”表示限定搜索结果中 不能包含的词汇。 15. 一些搜索引擎提供了按链接和网域等进行搜索范围的限制,比如, 用site表示搜索结果局限于某个网站。比如,用in title 表示到某个URL地址指定的网页标题内进行检索。比如,用UnJ表示到某个URL地址指定的地址内进行检索。 16. 搜索引擎中,在普通查询词前面加一个filetype 表示对文档类型限定。或例如:访问百度文档的地址也可以达到此效果,它的网址是: https://www.doczj.com/doc/ed1525293.html,/ 17. CNKI数据库下载的全文格式很多,如:caj,pdf,nh,caa,kdh 需要下载安装CAJViewer全文浏览器软件或亚全文浏览器软件才能阅读这些资源。 18 .维普资讯网的高级检索中,查询语句“ K= (CAD+CAM*R=a械”表示的意思是查找文献或文摘中含有“机械”,并且关键词中含有CAD或CAM勺文献或文摘 19. OPAC中文或者英文的解释是联机图书馆公共检索目录 20. 国内提供电子图书服务的网络站点很多,常用的有书生之家数字图书馆、方正Apabi数字图书馆、中国数字图书馆等。 二「单项选择题(每题1分,共20 分) 1. 下面哪项不是情报构成的三 要素之一( D ) B .经过传递 D.通过购买获取 B?最主要的信息资源 D.按知识门类或专题组织、浓缩而 A ) o A. 期刊文献 B.科技报告 C?专利文献 D.学位论文 4. 报纸区别于其它文献的特征是( B )o A. 创新性 B.及时性 C.学术性 D.全面性 5. 有法律约束力和一定的时效性,经权威机构批准的规章性文献是 (A )o A.标准文献 B.学位论文 C?档案文献 D.科技报告 6. 一般存在相应二次文献的是( A ) A.期刊 B.产品样本 A.本质是知识 C?经过用户使用产生效益 2. —次文献是(A )0 A.最原始的信息资源 C.对文献的集中提炼和有序化 成 3. 下面哪一项是白色文献(

信息检索工具

浅谈信息检索工具

————————————————————————————————作者:————————————————————————————————日期: 2

摘要 文章由信息检索的分析和发展状况出发,阐述了一些常用的信息检索工具和相关技术。然后对常用的信息检索工具做了一个简要的评价,并由此讨论了信息检索工具的现状和发展趋势。 关键词:信息检索工具、技术、评价标准、发展趋势 Abstract Post by information retrieval and analysis of development, and expounds a number of commonly used information retrieval tools and related technologies.Then used the information retrieval tools to do a brief evaluation, and then discuss the status of information retrieval tools and trends. Keywords: information retrieval tools, techniques, evaluation criteria, trends

第一章信息检索分析及发展状况 步入21世纪,人们对信息检索的完备、准确、快捷会有更加严格的要求和期盼,与时俱进、不断完善的信息检索技术将得到越来越广泛的应用,信息的检索与访问方式无疑将发生深刻的变化。然而网上的信息浩如烟海,一个搜索引擎很难收集全所有主题的网络信息,即使信息主题收集得比较全面,由于主题范围太宽,很难将各个主题都做得精确又专业,使得检索结果中出现太多无用的信息。如何在浩瀚的信息海洋中准确、方便、快速地找到自己所需的信息,成了一个迫切需要解决的问题。 信息检索主要是指信息的表示、存储、组织和访问,即根据用户的查询要求,从信息数据库中检索与之有关的信息资料。信息检索的目的是获取所需信息,而这要基于比较完善的检索工具和技术。 1.1从传统检索到信息分析 目前,随着信息检索技术的发展,信息检索已经由手工检索、计算机检索发展到了网络化、智能化、认知化阶段,这一阶段的信息检索平台具备了初步的信息分析功能,从而使传统检索信息向信息分析层次发展。例如,在ISIWeb of Science检索平台上,当某一主题的检索结果出来后,检索者还可以利用该平台提供的信息分析功能,对检索结果从以下几个方面进行深入分析:①按照论文发表时间进行分析,了解不同时间阶段课题研究的状态;②按照国家分析,了解该领域的主要研究国家以及国内该领域研究情况;③按照机构分析,了解领域的主要研究机构;④按照作者分析,了解该领域的核心研究人员;⑤按照来源期刊分析,了解该领域研究论文发表的重点期刊以及对某刊物收录论文情况进一步了解;⑥按照学科进行分析,了解该课题涉及哪些学科领域以及对感兴趣学科进行更深入的分析。很显然,通过对检索结果从6个方面进行深入分析,将使读者对检索结果作进一步的深入了解。 1.2信息检索的发展状况 信息检索经过先组式索引检索、穿孔卡片检索、缩微胶卷检索发展到计算机信息检索。计算机信息检索大致可分为脱机检索、联机检索、国际联机检索、光盘检索、超文本的网络检索几个阶段。 目前,以文献单元描述体结构为基础、手工检索方式为主导的传统文献检索已发展到以信息单元组织结构为基础、网上浏览式信息查询方式的信息检索,计算机信息检索呈现联机检索、光盘检索以及网络检索多元并存的格局,面对用户群体、互相竞争、互相融合,谋求个性化基础上的共同发展。如下表所示,传统检索技术和网上检索技术无论是在检索策略还是在检索手段上都发生了本质的变化。 传统检索技术与网上检索技术的比较 传统检索技 网上检索技术 术

文献信息检索与利用

南阳理工学院(论文)2014-2015学年科目考查卷论文 文献信息检索与利用的感悟 学院(部): 专业: 学生姓名: 学号: 指导教师: 手机号码:

【摘要】21世纪是知识经济和网络时代。快捷准确,及时有效地检索和利用信息,是知识经济和网络时代对信息检索提出的新要求,也是置身21世纪的人们必须具备的基本信息素养。在这个充满机遇和挑战的时代,信息检索对我们的创意或事业能否取胜也是关键所在。以下就是我对信息检索的浅谈。 本文阐述了本人对文献检索的认识、收获及其应用,还有网络信息检索发展状况及其对文献检索的影响,探讨了教材内容体系和教学方法、手段和改革等问题,并指出了21 世纪文献检索课的发展趋势。 【关键词】信息网络文献检索网络查询工具数据库 【正文】本学期,我们学习了一门很特别而且很有用的学科,名字叫文献检索,这门课程给我带来了不少收获。文献检索课程是高校教学中不可缺少的一门课程,是素质教育中重要的组成部分,是当代大学生必须掌握的基本技能。 文献检索教育是培养我们大学生的信息意识,使我们掌握用手工方式和计算机方式从各种文献或互联网中获取知识和信息的一种科学方法学,是信息素养教育中重要的组成部分,是大学生素质教育中不可缺少的一个环节。高校的文献检索课作为我国高校情报用户教育的主要形式,是学生学习信息知识、掌握信息检索技术、普及信息素质教育的基础课,它和外语、计算机等一样是当代大学生必须掌握的基本技能。所以,对我们来说,文献检索十分有必要。而且我们必须好好掌握这样一门课程。 文献检课程从第3周开始,到14周结束,在这期间,通过网络学习,我们对计算机检索基础知识、中文数据库检索、专利基础知识及专利数据库检索、常用英文数据库检索等检索知识和方法有了一个深刻的了解;通过课下练习,我们经过实际操作,对清华数据库、维普数据库、方正电子图书数据库以及springer 数据库、ei village 2 数据库等各类中英文数据库都加深了印象。同时,学习了具体的文献检索知识,对于我们的日常的学习和工作也很有帮助,例如,当我们需要查询专业课程的相关文献用以学习的时候,我们便可以利用这些文献检索数据库来搜索到我们所需要的论文和书籍。另外,在必要的时候,为了方便搜索,我们还可以在网上申请个人图书馆,专门查询一些自己所需的不易随便下载的文

网络信息检索的工具

致力于打造高品质文档 网络信息检索的工具 [摘要] 搜索引擎是人们使用Internet信息资源的重要工具。本文对目前的中文搜索引擎进行了简要的分析,指出了其存在的缺陷和发展的方向。[关键词] 信息检索中文搜索引擎存在的问题发展方向 随着Internet信息资源的迅速增长,如何在浩瀚的信息海洋中准确、方便、快速地找到自己所需的信息,成了迫切需要解决的问题,从1995年开始出现的信息检索工具——搜索引擎很好地解决了这一问题。然而各种搜索引擎,特别是尚处于发展初期的中文搜索引擎还存在着很多的缺陷有待改进,本文旨在分析目前中文搜索引擎存在的主要问题,并为解决此类问题提出一些建议和方法。一、搜索引擎的概念和及类型 搜索引擎又称检索引擎,是指运行在Internet上,以信息资源为对象,以信息检索的方式为用户提供所需数据的服务系统,主要包括信息存取、信息管理和信息检索三大部分。 目前,中文搜索引擎主要有三种类型:目录式搜索引擎、机器人搜索引擎(又称全文搜索引擎)和元搜索引擎。 1.目录式搜索引擎。目录式搜索引擎是以人工或半人工方式收集信息,建立数据库,由编辑人员在访问了某个web站点后,对该站点进行描述,并根据站点的内容和性质将其归为一个预先分好的类别。由于目录式搜索引擎的信息分类和信息搜集有人的参与,其搜索的准确度较高,导航质量也不错。但因其人工的介入,维护量大,信息量少,信息更新不及时都使得人们利用它的程度有限。国内著名的新浪、搜狐、中文雅虎都属于这种类型。 2.机器人搜索引擎。这是一种目前运用较广泛的搜索引擎。国内以百度,google、天网为代表。它是使用自动采集软件Robot,搜集和发现信息,并下载到本地文档库,再对文档内容进行自动分析并建立索引。对于用户提出的检索要求,通过检索模块检索索引,找出匹配文档返回给用户。 机器人搜索引擎具有庞大的全文索引数据库。其优点是信息量大,范围广,较适用于检索难以查找的信息或一些较模糊的主题。缺点是缺乏清晰的层次结构,检索结果重复较多,需要用户自己进行筛选。 3.元搜索引擎。元搜索引擎是一种调用其他搜索引擎的引擎。它是通过一个统一的用户界面,帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索。中文元搜索引擎开发较少,较成熟的则更少,万纬搜索是目前有一定影响的中文元搜索引擎。 二、现阶段中文搜索引擎存在的主要问题 1.信息覆盖面有限。现阶段搜索引擎所覆盖的数据库的规模是非常有限的,据美国科学期刊Natures一篇报告中称,全球最大的搜索引擎也只能覆盖现有网页的16%。中文搜索引擎因起步慢、中文信息所占互联网全部信息的比例小(只占全部网络信息的5%)等原因在这方面尤为突出。 2.查全率不高。查全率是指检索出的相关信息量与存储在检索系统中的全部相关信息量的百分比,是判断检索系统质量的度量之一。

王乃成信息检索工具的工作原理

课题:信息检索工具的工作原理 课型:新授课 课时:1 课时 教学目标: 1.了解常用的英特网信息检索工具类型;能描述信息检索工具的基本工作原理和特点。 2.体验因特网信息检索工具的优缺点。 3. 掌握常用因特网信息检索工具的使用方法,能熟练使用信息检索工具获取所需信息。 内容分析: 本节为“因特网信息资源检索”中的重点部分,介绍了全文和目录索引类搜索引擎的工作原理,这是学习的重点。教材中通过搜索奥运信息的例子来说明在网上检索信息的过程, 以达到简化原理、帮助学生理解的目的。教学中应尽量选取贴近生活的例子来说明复杂的工 作原理,降低难度,以提高学生的检索能力为最终目的。 教学过程: 1.情境引入 已搜索一首歌曲为基础,提出问题:同学们想像一下信息检索工具该如何工作呢?有几种方法能达到,让学生们互相讨论,并展开对比讨论,选出最恰当的方法。 2.教学过程 方法一:全文搜索引擎的工作原理 (1)提出问题 ①去超市购买一枝钢笔的过程。 购物→描述商品特征→取货→交给顾客 ②利用全文搜索引擎查找夏季奥运会的由来,并观察操作的一般过程。如图 1-1 ~ 1-3 所示。 图 1-1 百度检索首页

图 1-2 百度检索结果页面 图 1-3 百度检索答案举例页面 总结 全文搜索引擎检索信息的过程: 搜索关键字或词→数据库中检索→搜索结果。 (2)通过上述范例引申 从专业的角度拓展给学生讲解搜索引擎的组成。 ①搜索器:负责定期地自动到各个网站上,把网页抓下来,并顺着上面的链接,持 续不断地抓取网页。 ②索引器:把搜索器抓来的网页进行分析,按照关键词句进行索引,并存入服务器 的数据库中。 ③检索器:面向用户,接收用户提交的查询字串,在索引数据库中查询,并将结果 反馈给用户。 巩固练习:搜索江苏省2012年高考方案 进一步总结,得出全文搜索引擎的工作包括三个过程。 ①搜索器在因特网中发现、搜集网页信息。 ②索引器对所搜集的信息进行提取和组织,并建立索引库。 ③由检索器根据用户输入的查询关键词,在索引库中快速检出相关文档,进行文档与查询内容的相关比较,对检出的结果进行排序,并将查询结果返回给用户。 方法二:目录索引类搜索引擎的基本工作原理 (1)提出问题 ①如果去学校图书馆借阅“短篇小说集”,该怎么去做,描述一般过程。 借阅图书→找书目→找相应书籍→从书架拿出 ②利用目录类搜索引擎查找“北京大学”的信息,如图 1-4 ~ 1-7所示。

智慧树,知到 文献信息检索与利用(海南联盟)章节测试【完整答案】

智慧树,知到文献信息检索与利用(海南联盟)章节测试【完整答案】 智慧树知到《文献信息检索与利用(海南联盟)》章节测试答案第一章 1、搜商的三个核心要素是 答案: 搜商意识,搜索技术,搜索工具 2、我们通常提到的三大中文数据库平台指的是 答案: 中国知网,万方平台,维普期刊 3、搜索引擎主要分为以下几类 答案: 垂直搜索引擎,全文搜索引擎,目录索引,元搜索引擎 4、以下说法你认为正确的是 答案: 搜索是一种思维,搜索是一种语法,搜索是一类网站,搜索是一种理念 5、常见的搜索引擎如: 答案: 百度,谷歌,必应 6、在搜索中我们常提到的”B,A,T”指的是 答案: 百度,阿里,腾讯 7、 Google 创立于哪一年? 答案: 1998 8、课题“Investigation on computer applications in the machine tool design”,哪些词是检索词? 答案: 2004

9、在“虫部落”社区,数据搜索可以查到是: 答案: 百度指数,微指数,搜狗指数,阿里指数 10、 2015年《高等教育信息素养框架》提出 答案: 权威的构建与情景,信息创建的过程性以及信息的价值属性,探索式及对话式学术研究,战略探索式检索 第二章 1、图书馆有哪些类型? A.国家图书馆 B.公共图书馆 C.高校图书馆 D.中小学图书馆 答案: 国家图书馆,公共图书馆,高校图书馆,中小学图书馆 2、进行书目检索只能看到书目,不能看到图书全文。 A.对 B.错 答案: 对 3、通常来说,图书馆书目检索系统可通过以下字段进行馆藏图书检索 A.题名 B.作者 C.主题词 D.分类号

2014年7月电大文献信息检索考试满分题库解析

信息检索 单选 1根据国家相关标准,文献的定义是指“记录有关(知识)的一切载体。 2以作者本人取得的成果为依据而创作的论文、报告等,并经公开发表或出版的各种文献,称为( 一次文献. ) 3利用文献后面所附的参考文献进行检索的方法称为(追溯法)。 4如果检索结果过少,查全率很低,需要调整检索范围,此时调整检索策略的方法有(用逻辑“或”或截词增加同族概念)等 5哪一种布尔逻辑运算符用于交叉概念或限定关系的组配?( 逻辑与(AND) ) 6《中国学术期刊全文数据库》的词频控制应在(文摘、全文等字段检索所得的文献量过大)场合下使用 7如果打算了解最新即时的专业学术动态,一般可参考( 专业学会网站 ) 8( 索引 )由索引款目和参照系统两大部分组成. 9搜索含有“data bank”的PDF文件,正确的检索式为:( "data bank" filetype:pdf ) 10就课题“查找‘钱伟长论教育’一文他人引用情况而言”,选择(中国知网中的中国引文数据库),可以得到相关的结果。 11“集万卷于一册,缩一年为瞬”的连续出版参考工具书是( 年鉴 ) 12按照出版时间的先后,应将各个级别的文献排列成(一次文献、二次文献、三次文献)13逻辑“与”算符是用来组配( 不同检索概念,用于缩小检索范围 )。 14如果你只想查找EXCEL表格,在谷歌(https://www.doczj.com/doc/ed1525293.html,)就可以使用( Filetype:xls )15在《中国学术期刊全文数据库》中,不可以进行(位置)检索。 16要从事物名称角度全面地查找互联网上的信息,可使用(主题)搜索引擎。 17(主题检索途径)是指通过文献信息资料的主题内容进行检索的途径。 18《中国期刊网CNKI》是(全文数据库)数据库。 19从文献的( 载体类型 )角度区分,可将文献分为印刷型、电子型文献。 20手稿、私人笔记等属于(零次)文献,辞典、手册等以以属于(三次)文献。 21逻辑算符包括( D )算符。 A.逻辑“与” B.逻辑“或” C逻辑“非” D.A,B和C 22区别于一般期刊论文或者教科书,参考工具书的突出特点是( 知识高度浓缩) 23使用百度搜索引擎查找某一课题,希望在同一网页中同时出现某两个检索词,这两个检索词之间应使用运算符(空格)。 24使用谷歌搜索引擎查找某一课题,希望网页中以词组形式出现某个检索词,应使用运算符(“”)。 25根据(刊名全称、卷、期,年份、页)去图书情报单位索取或复制期刊论文的原文。26正式出版的期刊,均冠有(ISSN )号。 27事实检索包含检索课题的(背景知识、事件过程、人物机构)等内容。 28( 百科全书 ) 被称为参考性工具书之王。

相关主题
文本预览
相关文档 最新文档