当前位置:文档之家› 信息检索工具与方法概述

信息检索工具与方法概述

信息检索工具与方法概述
信息检索工具与方法概述

张龙飞 080905238

信息检索工具与方法概述

信息社会给人们带来了浩如烟海的信息,令人们享受不尽,同时也感到无所适从。如何从泛滥的信息大潮中获有价值的东西,成了人们面临的迫切问题。因此,信息检索能力的高低,绝顶了人们发展的潜力。传统的教育模式注重书本知识的输入,不注意培养独立工作的能力和获取知识的技术和手段,结果培养出的人很难适应社会的发展。面对信息社会的挑战,现代教育应该发展人们的综合水平,提高技术手段的培养。因此,必需掌握最新的技术-----信息检索。以下是根据我个人的了解对信息检索技术进行的阐述和概括。

信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻。

那么,我们为什么要进行检索工作呢?

在科研开发领域里,重复劳动在世界各国都不同程度地存在。据统计,美国每年由于重复研究所造成的损失,约占全年研究经费的38%,达20亿美元之巨。日本有关化学化工方面的研究课题与国外重复的,大学占40%、民间占47%、国家研究机构占40%,平均重复率在40%以上;我国的重复率则更高。在这么多的信息之中要找到不重复而又有效的信息内容就必需进行检索。

要进行信息检索首先要有检索工具。检索工具是指用以报导、存贮和查找文献线索的工具。它是附有检索标识的某一范围文献条目的集合,是二次文献。一般说来,检索工具应具备以下五个条件:①明确的收录范围;②有完整明了的文献特征标识;③每条文献条目中必须包含有多个有检索意义的文献特征标识,并标明供检索用的标识;④全部条目科学地、按照一定规则组织成为一个有机整体;⑤有索引部分,提供多种必要的检索途径。

目前可供人们使用的检索工具有很多,不同的检索工具各有特点,可以满足不同的信息检索的需求。检索工具有不同的分类方法,按加工文献和处理信息的手段不同可分为:手工检索工具和机械检索工具;按照出版形式不同可分为:期刊式检索工具,单卷式检索工具,卡片式检索工具,胶卷式检索工具;按照载体形式不同可分为:书本式检索工具,磁带式检索工具,卡片式、缩微式、胶卷式检索工具。总的来说,可将检索工具分为以下四种类型。

1. 目录型检索工具

目录型检索工具是记录具体出版单位、收藏单位及其他外表特征的工具。它以一个完整的出版或收藏单位为著录单元,一般著录文献的名称、著者、文献出处等。目录的种类很多,对于文献检索来说,国家书目、联合目录、馆藏目录等尤为重要。

2. 题录型检索工具

题录型检索工具是以单篇文献为基本著录单位来描述文献外表特征(如文献题名、著者姓名、文献出处等),无内容摘要,快速报道文献信息的一类检索工具。它与目录的主要区别是著录的对象不同。目录著录的对象是单位出版物,题录的著录对象是单篇文献。

3. 文摘型检索工具

文摘型检索工具是将大量分散的文献,选择重要的部分,以简炼的形式做成

摘要,并按一定的方法组织排列起来的检索工具。按照文摘的编写人,可分为著者文摘和非著者文摘。著者文摘是指原文著者编写的文摘;而非著者文摘是指由专门的熟悉本专业的文摘人员编写而成。就其摘要的详简程度,可分为指示性文摘和报导性文摘两种。指示性文摘以最简短的语言写明文献题目、内容范围、研究目的和出处,实际上是题目的补充说明,一般在100字左右;报导性文摘以揭示原文论述的主题实质为宗旨,要做到基本上反映原文内容,讨论的范围和目的,采取的研究手段和方法与所得的结果与结论,同时也包括有关数据、公式,一般500字左右,重要文章可多达千字。

4. 索引型检索工具

索引型检索工具是根据一定的需要,把特定范围内的某些重要文献中的有关款目或知识单元,如书名、刊名、人名、地名、语词等,按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具。索引的类型是多种多样的,在检索工具中,常用的索引类型有:分类索引;主题索引;关键词索引;著者索引等。

检索的方法有很多,常用法有三种:1.顺查法:是按时间顺序由远到近逐年查找文献的方法,但要注意所查课题的研究开始年份,否则浪费时间。2. 倒查法:与顺查法相反,是按逆时间顺序由近到远逐年查找文献的方法,符合新兴学科的发展规律或有新内容的老课题,省时高效,短时间内可获一些最新资料。3. 抽查法:针对学科专业发展特点,学科发展迅速中发表论文较集中的时间,前后逐年检索。

不同的检索工具有不同的检索方法和途径,因此需熟悉每种检索工具的特点进行选择,检索途径大致分以下几种:

1.书名途径:利用书、刊、杂志名称进行查找文献,是查找文献最方便的途径。

2著者途径:是按文献著者或团体的名称译者和编者的姓名编制的索引进行查找的一种方法。

3.序号途径:利用文献的各种代码、数字编制的索引查找文献称序号途径,如专利号、科技报告的报告号等,按代码字顺或数字的次序由小到大排列。

4. 分类途径: 根据文献主题内容所属的学科属性分类编排,将类目按照学科知识体系的内在逻辑关系来排序,以学科属性为分类标准。

5. 主题途径:主题词表是标引和检索人员的共同依据,各种检索工具有各自的主题词表。

6. 关键词途径:关键词又分为“题内关键词”和“题外关键词”两种,前者仅在题目内找实质性的词作关键词,后者从文摘或正文中找出关键词。

了解了各种检索工具的特点就可以通过各种书目索引、编辑说明、分类表、主题词表、工具书等找出查找线索,将准确表达的检索提问与检索工具中的文献标识进行比较以决定文献的取舍。

目前信息检索的主要手段是手工检索和计算机检索。手工检索多以书本式或卡片式检索工具为主,计算机检索借助于计算机设备进行人机对话的方式进行检索。随着计算机网络的发展,大量的信息都经过网络在世界范围内进行传播,因此,网络检索将成为未来检索的主流方式。

网络检索工具,是指在因特网上提供信息检索服务的一类网站或服务器,其检索的对象是存在于因特网信息空间中各种类型的网络信息。一般说来,网络检索工具主要可以分为目录型工具和搜索引擎两大类。目录型检索工具是由信息管

理专业人员在广泛搜集网络资源,并进行加工整理的基础上,按照某种主题分类体系编制的一种可供检索的等级结构式目录。在每个目录类下提供相应的网络资源站点地址,使用户能通过该目录体系的引导,查找到有关的信息。其主要优点是所收录的网络资源经过专业人员的选择和组织,可以保证质量,减少了检索中的错误,从而提高了检索的准确性。而搜索引擎使用自动索引软件来发现、收集并标引网页、建立数据库。以网页形式提供给用户一个检索界面,供用户输入检索关键词、词组或短语等检索项。代替用户在数据库中查找出与其提问匹配的记录并返回结果,且按其相关度排序输出。不过搜索引擎也存在一些缺陷,例如由于人工干预过少,使其准确性较差,检索结果中可能会有很多冗余信息。关于普通大众最容易学习和使用的搜索引擎,下面介绍几种常用引擎网站和数据库,及其使用方法。

1.Google使用技巧

1.多个关键词之间只需用空格分开。

2. 没有空格切割的关键词相当于或者。

3.英文字母不区分大小写。

4. 网页查询时可以直接用网址进行查询。

5.-号可以排除无关信息,帮你搜索到更准确的内容。比如输入A -B(切记要在减号前留一个空格位)可以检索包含A,但不包含B的内容,更有利于缩小查询范围(A和B代表关键词)。

6." "使搜索结果绝对忠实于你的检索提问。比如搜索“”有时需要精确匹配整,句话包括词的顺序,那么可以把需要精确匹配的部分用" "扩起即可。

7. 在英文关键词搜索中,一些标点符号如“_”、“\”、“+”、“=”、“,”“'”也可作为短语连接符。例如:尽管没有加引号,mother_in_law仍作为专用语处理。在中文搜索时,这些标点被忽略。

2.百度使用技巧

百度在某些使用方法上和Google类似,不过,百度拥有自己的特色产品:百度百科、百度知道、百度贴吧等。利用贴吧可以在线真人互相提问并回答问题,以及组成相关主题的论坛,用来解决和讨论某些问题。百度知道可以在线提问,由系统和其他人进行回答,从而形成对某些问题解决方案。百度百科是对提问进行全方位的阐述。

最常用而且功能最强的是上面所说的百度和谷歌,其他的搜索引擎还有雅虎、腾讯、迅雷、搜狗等。除了使用搜索引擎获取信息外还可以进入数据库搜索。下面介绍数据库。

中国知识资源总库(CNKI)、重庆维普、万方数据库是应用最广泛的数据库。对他们进行一下比较:从收录情况来看,维普收录最久,万方收录时间最短,但是现刊万方收录最好,维普最近两年的很多期刊都没有了,特别是医学类的;在使用方便性上中国知网和万方差不多,维普最差;期刊上万方的期刊浏览功能做的很好。数据库检索比搜索引擎检索更加准确和专业化,能满足更高要求的信息检索。

社会在进步,信息功能也在进步,我们必须与时俱进掌握好信息检索的技巧和各种工具的使用方法,虽然方法很多,但不一定都适用于我们自身,所以我们要根据需要掌握自己的方法,这样才能在信息爆炸的时代把握正确的信息。

计算机信息检索02139自考资料

第一章信息检索概述 1.信息检索:指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。 2.根据检索手段的不同,信息检索可以分为手工检索、光盘检索、联机检索和网络检索。 3.信息检索的基本原理 通过对大量的、分散无序的文献信息是进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。 4.信息检索语言 信息检索语言是人们在加工、存储和检索信息时用来描述信息内容和信息需求的词汇或符号及其使用规则构成的供标引和检索的工具。 5.五个信息检索阶段:手工检索、机械信息检索、脱机批处理检索、联机检索、网络信息检索,后三 者统称为计算机信息检索。 6.与手工检索相比,计算机信息检索的特点表现在: (1)速度快、效率高,仅几分钟就可以从成千上万条记录中找到所需信息; (2)检索范围广,可以迅速而方便地浏览相关学科或主题的所有数据库中的记录,在 网络中,几乎每一台个人计算机都可以成为信息源; (3)检索不受时空的限制,只要拥有相应的软件和硬件设备,就可以在任何地方借助 光盘和通信网络查询所需信息。 7.信息检索的模型:就是运用数学的语言和工具,对信息检索系统中的信息及其处理过程加以翻译和 抽象,表述为某种数学公式,再经过演绎、推断、解释和实际校验,反过来指导信息检索实践。 信息检索的三个经典模型是:布尔模型、向量空间模型和概率模型。 8.信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。 9.信息检索系统是信息检索所用的硬件资源、系统软件以及信息资源集合的总和。 10.数据库由字段、记录和文档构成。 11.根据载体的不同,数据库可分为:联机数据库、光盘数据库和网络数据库三种。 12.信息检索系统评价的核心是检索性能评价。 13.检索性能评价:根据一定的评价指标对实施信息检索活动所取得的成果进行客观科学评价,以进一 步完善检索工作的过程。 评价检索效果的最主要的指标:查全率和查准率。 14.查全率 查全率是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例。 15.查准率 查准率是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。 第二章网络信息检索的方法与技术 1.布尔逻辑检索的主要运算符 布尔逻辑检索的主要运算符有:逻辑与(“AND”)、逻辑或(“OR”)、逻辑非(“NOT”)。 它们分别代表的含义是:(1)逻辑“与”。表示检索结果中必须包含所有的检索词;(2)逻辑“或”。表示检索结果中只要包含任何一个检索词即可;(3)逻辑非。表示检索结果中一定不能出现“NOT”后面的检索词。 2.邻近检索 邻近检索是用一些特定的算符来表达检索词与检索词之间的顺序和词间距的检索。 3.短语检索:短语用“”表示,检索出与“”内形式完全相同的短语,以提高检索的精度和准确度, 因而也有人称之为“精确检索” 4.截词检索 是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中,计算机会将所有含有相同部分标识的记录全部检索出来。截词符一般用“?”或“*”表示,但不同的数据库中有所差别。 常用的截词检索方法有前截词、中间截词和后截词。 5.在信息检索过程中,为了提高查全率或查准率,需要将检索范围限制在特定的字段中,即字段限制 检索。 6.模糊检索:模糊检索是指使用某一检索词进行检索时,能同时对该词的同义词、近义词、上位词、 下位词进行检索,以达到扩大检索范围、避免漏检的目的。

网络信息检索.

网络信息检索——搜索引擎篇 摘要:概述网络信息检索,主要针对搜索引擎进行比较,参考一些文献来对将来的搜索引擎进行合理的展望。 关键字:网络信息检索搜索引擎发展趋势实时搜索 网络信息检索概述 网络信息检索是指能够通过网络接受用户的查询指令,并向用户提供符合其查询要求的网络信息资源的过程。可以把网络信息检索理解为见多对象为网络信息的信息检索。(西安电子科技大学出版社《网络信息检索》 搜索引擎概述 网络信息检索的应用有搜索引擎,多媒体信息检索,话题识别与跟踪,信息过滤,问题回答五个方面。本文主要讲述搜索引擎的相关内容。 本文所称的搜索引擎是指因特网上专门提供查询服务的一类网站,这些网站通过网络搜索软件(又称为网络搜索机器人或网站登录等方式,将因特网上大量网站的页面收集到本地,经过加工处理而建库,从而能够对用户提出的各种查询做出响应,提供用户所需的信息。用户的查询途径主要包括自由词全文检索、主题词检索、分类检索及其它特殊信息的检索(企业、人名、电话黄页等。 著名搜索引擎Google,百度,yahoo中国 Google是一家美国上市公司(公有股份公司,于1998年9月7日以私有股份公司的形式创立,以设计并管理一个互联网搜索引擎。Google公司的总部称作“Googolplex”,它位于加利福尼亚山景城。Google 创始人Larry Page 和Sergey Brin 在斯坦福大学的学生宿舍内共同开发了全新的在线搜索引擎,然后迅速传播给全球的信息搜索者。Google 目前被公认为是全球规模最大的搜索引擎。

百度是中国的两位海外留学生李彦宏和徐勇博士创建的中文搜索引擎。它拥有目前世界上最大的中文信息库,总量达到1亿2千万以上,并且还在以每天几十万页的速度快速增长。2000年1月,百度公司在中国成立了他的全资子公司百度网络技术(北京有限公司。随后于同年10月成立了深圳分公司。2011年6月又在上海成立了上海办事处。2005年百度在美国的纳斯达克上市,省委当年全球资本市场上最为引人注目的上市公司,百度由此进入一个崭新的发展阶段。 Yahoo中国是网站分类目录的领头军,它以分类目录,网站检索为主,附带网页全文检索,也是目前最重要的搜索服务网站。雅虎有中文,英文等十余种语 言版本,每一版的内容互不一样。可以说,每一种不同的版本都是一种不同的,相对独立的搜索引擎。 他们各自信息搜集方式的比较 百度是最典型的一种自动搜索引擎,google是一般典型的自动搜索引擎。他们由一个成为蜘蛛的机器人程序,由四部分组成的自动索引。该搜索引擎的有点事信息量过大,更新及时,不需要人的干预,缺点是搜到信息过多,许多无用信息需要用户行结果中筛选。 Yahoo属于分类搜索引擎。Yahoo并不是单纯地提供所有网站网页的全文检索服务,而是将其收集到的网站及网页分门别类加以索引和文摘(由人工完成,以一个分层的线性目录来为用户提供按图索骥式的服务。该类搜索引擎因加入了人的智力,所以信息准确,导航质量非常高,不足之处是需要人的介入,维护量大,信息量少,信息更新不及时。 综合各个方面(本文只比较搜寻信息方式的不同,其他方面不加赘述,三大搜索引擎各具千秋。从实用性来说,google的检索功能强大、灵活,尤其是支持多种字段检索以及网页的推荐功能,并可以安用户的习惯设置检索界面;百度收录的中文信息覆盖面广、数量大,更新快,注重服务的本地化;雅虎作为指南型分类检索工具,在相对查全率方面具有优势。我们可以根据各自的生活、工作、学习的需要,选择一种适

网络信息检索

网络信息检索课程教学研究 资环学院09生师彭秀欣 摘要:随着计算机技术、通讯技术、网络技术的迅猛发展,网络信息检索已成为当今信息社会主要检索信息技术对于传统的基础教育影响越来越大,基于网络的教育教学资源剧增,成为高校文献检索课的教学重点。本文分析了《网络信息检索技术》课程的教学现状及未来发展。关键词:改革、现状、网络,优化、发展。 正文:21世纪是一个信息化、网络化的世纪,展现在我们面前的是一个以网络信息技术为核心技术的新的发展时代。网络信息技术已经渗透到社会生活的各个方面,它不仅带来信息传递和利用方式的改变,而且为人们获取和传播信息提供了方便快捷的新途径。利用计算机从网上获取信息已成为当今信息社会的主要检索方式,是当代大学生必须具备的一种素质。网络信息检索技术的发展已向文献检索课提出了严峻的挑战。引进网络信息检索新内容,并逐步建立起以网络信息资源及其检索为核心的新体系。如何利用网络信息资源已成为大学生急需学习的内容,所以,网络信息检索应成为高校文献检索课的重点,网络信息资源极其丰富、种类繁多,但由于信息过于庞大和分散,且变化十分快,给网络信息检索带来了不便,也增加了教学难度。 网络信息检索的教学目的:是要求学生具备利用计算机网络多途径获取各种专业信息的能力,增强学生的网络信息意识。网络信息检索的教学应围绕这个教学目的,紧扣网络信息资源的实用性,针对各学科专业的实际需要,选用重要而实用的核心资源。信息检索课教学的重要作用 信息检索课是一门实践性很强的课程,其检索技能的提高主要是靠对信息检索方法与技能的掌握,并通过举一反三的训练,增强学生对信息检索、获取、分析和评价的能力, 教学内容包括:Internet概述(Internet的起源与发展、Internet在中国、Internet的连接方式、TCP/IP、Internet的域名等);Internet的网络功能(E-mail、Telnet、FTP、Gopher、NetNews、BBS、WWW及其浏览器等)。这一部分教学的目的在于使学生了解和学会网络信息检索的基础知识及基本技能。

信息检索第六章计算机信息检索概

第六章计算机信息检索概述 6.1计算机信息检索的含义和特点 一、计算机信息检索的含义 计算机信息检索:人们根据特定的信息需要,按照一定的方法,利用计算机从相关的信息检索系统中识别并获取所需的信息。包括信息存储过程和信息检索过程。 二、计算机信息检索发展简史 1、脱机批处理检索:20世纪五六十年代是脱机批处理检索的试验和实用化阶段。这一时期,计算机尚未连接通信网和远程终端装置,主要利用计算机进行现刊文献的定题检索和回溯检索。当时的信息检索是脱机批处理检索,即用户向计算机操作人员提问,操作人员对提问内容进行主题分析,编写提问式输入计算机建立用户提问档,按提问档定期对新到的文献进行批量检索,并及时通知用户。同时这一阶段开始利用计算机编辑出版检索性刊物。 2、联机检索阶段:20世纪60-80年代是联机检索的试验和实用化阶段。第三代集成电路计算机,存储介质,存储容量,数据库管理,通信技术的发展为联机检索提供了技术支持。随着国际联机检索系统的发展,信息检索在这一阶段实现了远程实时检索。 3、光盘检索阶段:20世纪80年代以来,新型信息载体激光光盘在信息检索领域得到广泛应用。光盘检索操作方便,不受通信线路影响。早期是单机驱动器和单用户,为解决多用户同时检索的要求,出现了复合式驱动器,自动换盘机,光盘网络技术。 4、网络化联机检索阶段:20世纪80年代以来,随着TCP/IP协议的普遍采用,美国国家科学基金会的接入,计算机检索发展到了今天的网络化联机检索阶段。互联网具有广泛性方便性的特点,使许多联机检索系统纷纷上网,除保留原来服务项目和内容外,还增加了许多新的动态信息服务。同时以搜索引擎为核心的网上搜索技术也日益发展,成为当前最具有普遍意义的信息检索形式。 三、计算机信息检索的分类(不同标准不同类型) 1、根据所检索数据库的形式:①书目检索:查出某一主题的文献条目的检索,包括题录检索,文摘检索等②数据检索:查出有关数据的检索,以求得某一问题量化的准确数值,包括统计数据和科学数据③事实检索:查出有关事件或实在情报,以求得对某一问题的解答。④全文检索:直接利用原始文献建库进行的检索。 2、根据计算机检索服务方式:①定题检索:根据用户检索课题内容,定期从新到资料库中为用户提问进行计算机检索的服务方式。特点:定期性新颖性批处理性②回溯检索:指追索过去的信息,也可用于查找最新信息,能适应多数用户的查询需要。可用于申请专利的新颖性,科研立项的查新,撰写论文和编写教材的信息收集。③日常检索:用户根据自己的信息需求,直接利用终端检索,检索系统即使提供用户所需的信息。 3、根据检索方式:①脱机检索:成批处理检索提问的计算机检索方式,计算机检索的初期类型②联机检索:利用检索终端和通信线路,直接查询检索系统数据库的计算机检索方式③光盘检索:以光盘数据库为基础的一种独立的计算机检索,包括单机光盘检索和光盘网络检索④网络检索:利用检索工具在互联网上进行信息存取的行为,目前主要利用的信息检索系统是搜索引擎。 四、计算机信息检索的特点 手工检索:人们长期以来采用的文献信息检索的传统方法,人们借助简单的机械工具,直接凭头脑进行判断,对记录在普通载体上的资料进行相应的检索。 优点:①直观性强②灵活性高③费用比较低

计算机网络信息检索作业2

1.检索课题 (1).所学专业或专科情况? 人力资源管理是一项极为重要的工作领域,前途十分光明。国内的许多企业对人力资源管理的定位是错误的,往往把过去的人事部门换块牌子就成了人力资源部门。其实,人事部门与人力资源管理部门最大的差别在于人力资源部门除了负责招聘、管理人事档案之外,一个重要的工作就是核算人力成本,为财务部门提供人力成本的依据,并根据自己所掌握的数据对人员进行绩效考核;此外,员工培训也是人力资源部门的一项重要工作。在人才竞争趋于全球化的今天,人力资源开发与管理的工作显得格外重要,做好人的工作已经成为赢得整个世界的前提,而对人力资源管理者的能力开发,则成为一项关乎发展整个国家伯乐人才的重要工程。人力资源管理者主要负责着企业的人力资源规划,员工招聘选拔,绩效考核,薪酬福利,培训开发,劳动关系协调等工作。判断其是否合格的标准是:懂得人力资源的专业知识,能够完成人力资源的实际管理工作,还能不断开发人力资源并且创造价值。 就业方向 企事业单位及其咨询机构人力资源管理相关岗位,从事招聘、人力资源开发、考核、薪酬管理、员工培训、办公室文秘工作。 (2).国内外排名情况、前三甲是那个院校? 辽宁大学排在第十五位 国内(前三甲排名) 1 四川大学、 2 首都经济贸易大学、 3 武汉大学 国外(前三甲排名) 哈佛大学、曼彻斯特大学、多伦多大学 (3).举出一位著名院校学者、检索一下你的同名者。 人大的彭剑锋(国人民大学劳动人事学院教授、博士生导师,华夏基石管理咨询集团董事长,中国企业联合会管理咨询业委员会副主任委员。曾任中国人民大学劳动人事学院副院长,曾获第二届中国人力资源管理大奖“十佳人物”

关于网络信息检索论文

关于网络信息检索论文 信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。下面我为大家搜索整理了关于网络信息检索论文,希望对大家有所帮助。 浅谈网络信息检索的现状及其发展趋势 【摘要】随着计算机技术及网络技术的发展,网络信息检索显得越发重要。本文主要综述了网络信息检索的全文数据库、搜索引擎、互联网“超链接”等现行检索模式及它的智能化、一站式化、可视化等发展趋势。 【关键词】网络信息检索;现状;发展趋势 1、信息检索概述 信息检索(InformationRetrieval)是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要指出其中相关信息的过程,因此它的全称叫“信息存储与检索”。 随着互联网的发展,人类社会的信息化、网络化进程大大加快。当今出现的一系列新型检索模式,包括网络信息规范控制标准等为网络检索技术的未来展现了新希望,与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。 2、网络信息检索的现状 对大多数读者而言,检索并不意味着发现,而是获得。人们希望不仅仅是提供宽泛的检索结果,而应该是计算机能试图理解用户提问的意图,并对检索结果进行适当的分类和排序。但是,现有的搜索引擎大多是基于简单的关键词匹配,

不能真正理解用户的检索意图;各个搜索引擎的信息搜集和索引建立有很大的不同,每个搜索引擎平均只能涉及到整个网上资源的30%~50%,而其中真正有用的信息也只占很小的比例,这就意味着使用任何一个搜索引擎都只能检索到网络中的部分资源。目前网络检索面临一系列的挑战,网络信息量迅猛增加,人工已经无法对它们进行有效的分类、索引和利用;简单的关键词搜索,返回的信息量过大,已经让用户无法承担;网络信息组织的无序性;信息有用性评价困难;网络信息日新月异的更变;信息媒体的多样化;带宽等其它因素的制约,这些都给因特网信息的获取造成了极大的阻碍。这样就造成了要求智能化、专业化、多元化、多媒体化的网络信息检索工具出现的呼声越来越高,并且有更多的人参与到其中来。如此种种,给当今的网络信息检索研究带来了发展机遇,也给了它无限的发展空间。 3、网络信息检索的现行模式 3.1网络全文数据库检索 网络全文数据库是以全文数据为数据库对象,并在网上提供全文检索服务的数据库。按数据库的生产机构分类,可分为出版商全文期刊数据库和生产商全文期刊数据库。前者主要是那些期刊出版单位在其出版的印刷期刊基础上建立的网络电子期刊全文数据库。而后者则是由数据库生产商根据一定的主题或一定的收录范围整合一定数量的期刊出版物而产生的全文数据库。国内全文数据库主要有中国学术期刊全文数据库。 3.2网络搜索引擎检索 搜索引擎是一个专门的系统,它可以对互联网信息资源进行搜索整理和分类,并将其储存在网络数据库中供用户查询。搜索引擎包括搜集信息、分类和用户查

网络信息检索期末考试试卷及答案

第1页,共6页 第2页,共6页 学校 院系 学号 姓名 ……答……○……题……○……不……○……得……○……超……○……过……○……此……○……密……○……封……○……线…○… 绵阳师范学院历史文化与旅游管理学院 一、填空题(每空1分,共30分) 1.信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。 2.知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。 3.情报是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。 4.文献是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。 5.会议文献是指在国内外学术或非学术会议上发表的论文或报告。 6.学位论文是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。 7.著录是对文献内容和形式特征进行选择和记录的过程。 8.数据检索是指特定的数值型数据为对象的检索。 9.在印刷型资源时代,事实与数据检索工具主要依靠各类参考工具书完成各种数据或事实的查询。 10.Internet 是基于TCP/IP 协议的网络。 11.二级域名https://www.doczj.com/doc/a417108511.html, 是指教育机构。 12.目前WWW 环境中使用较多的网页浏览器有Microsoft 公司的IE 浏览器和360公司的360安全浏览器。 13.每种网络信息检索工具一般由信息采集子系统、数据库和检索代理软件三部分组成。 14.大多数搜索引擎允许用户使用布尔逻辑运算符,以及与之对应的:“+”表示限定搜索结果中必须包含的词汇,“-”表示限定搜索结果中不能包含的词汇。 15.一些搜索引擎提供了按链接和网域等进行搜索范围的限制,比如,用site 表示搜索结果局限于某个网站。比如,用intitle 表示到某个URL 地址指定的网页标题内进行检索。比如,用link 表示到某个URL 地 址指定的地址内进行检索。 16.搜索引擎中,在普通查询词前面加一个filetype 表示对文档类型限定。或例如:访问百度文档的地址也可以达到此效果,它的网址是: https://www.doczj.com/doc/a417108511.html,/ 17.CNKI 数据库下载的全文格式很多,如:caj ,pdf ,nh ,caa ,kdh 需要下载安装CAJViewer 全文浏览器软件或Vip 全文浏览器软件才能阅读这些资源。 18.维普资讯网的高级检索中,查询语句“K=(CAD+CAM )*R=机械”表示的意思是查找文献或文摘中含有“机械”,并且关键词中含有CAD 或CAM 的文献或文摘 19.OPAC 中文或者英文的解释是联机图书馆公共检索目录 20.国内提供电子图书服务的网络站点很多,常用的有书生之家数字图书馆、方正Apabi 数字图书馆、中国数字图书馆等。 二、单项选择题(每题1分,共20分) 1.下面哪项不是情报构成的三要素之一( D )。 A .本质是知识 B .经过传递 C .经过用户使用产生效益 D .通过购买获取 2.一次文献是( A )。 A .最原始的信息资源 B .最主要的信息资源 C .对文献的集中提炼和有序化 D .按知识门类或专题组织、浓缩而成 3.下面哪一项是白色文献( A )。 A .期刊文献 B .科技报告 C .专利文献 D .学位论文 4.报纸区别于其它文献的特征是( B )。 A .创新性 B .及时性 C .学术性 D .全面性 5.有法律约束力和一定的时效性,经权威机构批准的规章性文献是(A )。 A .标准文献 B .学位论文 C .档案文献 D .科技报告 6.一般存在相应二次文献的是( A )。 A .期刊 B .产品样本 C .档案 D .报纸 7.常见的事实和数据检索工具书不包括( D )。 A .百科全书 B .年鉴 C .机构指南 D .杂志 8.在信息检索语言的分类语言中,国际上使用较多的分类表是( D )。

《网络信息检索与优化技术》课程大纲

《网络信息检索与优化技术》教学大纲 一、课程基本信息 1.课程名称:网络信息检索与优化技术(Network Information Retrieval and SEO Optimizing Techniques) 2.课程管理:信息科学学院 3.教学对象:计算机科学与技术专业 4.教学时数:总时数36学时,其中理论教学18学时,实验实训18学时。 5.课程学分:2 6.课程性质:专业必修 7.课程衔接: 1)先修课程一:计算机网络技术 重要知识点:计算机组成原理,TCP/IP协议,路由和交换设备,网络编程技术,计算机网络操作系统,信息系统安全评估 2)先修课程二:软件工程 重要知识点:网络编程,面向对象程序设计与开发,数据库技术 3)后续课程:综合实训、社会实践、顶岗实习 二、课程简介 《大数据舆情分析技术》课程是计算机网络专业学生的专业必修课,也是学生将来从事舆情分析专业工作的必修课程。在大数据时代,网络已成为政府和企事业单位了解民意的重要渠道,网络舆情作为当今民情民意反映的晴雨表,其巨大的影响力不但能够左右社会上重大事件的发展走向,也能影响社会公共管理的决策。事实上,网络舆情已经成为政府决策的重要参考依据之一。 《大数据舆情分析技术》课程涵盖的知识领域广阔,包括:新闻学、媒体传播学、公共管理学、舆情管理。本课程突出案例教学特点,将多学科知识融会贯通到一起,将创新的授课内容传授给学生,学生不仅仅是一个学习者,也是一个创新思考者,更是项目的主导者。有鉴于此,本课程将围绕以下5方面内容开展教学: 1)舆情研究的历史和发展趋势; 2)网络舆情传播规律; 3)舆情管控和舆论引导; 4)舆情检测平台应用。 5)电子政务与社会化媒体的管理 网络信息检索与应用课程是计算机网络技术专业学生必修的一门重要专业课。该课程内容包括信息检索的基础知识,互联网信息检索方法和技巧、发布信息优化技巧等。学生通过本课程的学习,能够快速、准确、有效地获取网络信息资源,掌握互联网发布信息的优化技巧。这对学生积累专业知识,提高自学能力,更加高效的利用互联网资源提供了有力保障

浅谈网络信息检索的现状及其发展趋势

浅谈网络信息检索的现状及其发展趋势 【摘要】随着计算机技术及网络技术的发展,网络信息检索显得越发重要。本文主要综述了网络信息检索的全文数据库、搜索引擎、互联网“超链接”等现行检索模式及它的智能化、一站式化、可视化等发展趋势。 【关键词】网络信息检索;现状;发展趋势 1.信息检索概述 信息检索(Information Retrieval)是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要指出其中相关信息的过程,因此它的全称叫“信息存储与检索”。 随着互联网的发展,人类社会的信息化、网络化进程大大加快。当今出现的一系列新型检索模式,包括网络信息规范控制标准等为网络检索技术的未来展现了新希望,与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。 2.网络信息检索的现状 对大多数读者而言,检索并不意味着发现,而是获得。人们希望不仅仅是提供宽泛的检索结果,而应该是计算机能试图理解用户提问的意图,并对检索结果进行适当的分类和排序。但是,现有的搜索引擎大多是基于简单的关键词匹配,不能真正理解用户的检索意图;各个搜索引擎的信息搜集和索引建立有很大的不同,每个搜索引擎平均只能涉及到整个网上资源的30%~50%,而其中真正有用的信息也只占很小的比例,这就意味着使用任何一个搜索引擎都只能检索到网络中的部分资源。目前网络检索面临一系列的挑战,网络信息量迅猛增加,人工已经无法对它们进行有效的分类、索引和利用;简单的关键词搜索,返回的信息量过大,已经让用户无法承担;网络信息组织的无序性;信息有用性评价困难;网络信息日新月异的更变;信息媒体的多样化;带宽等其它因素的制约,这些都给因特网信息的获取造成了极大的阻碍。这样就造成了要求智能化、专业化、多元化、多媒体化的网络信息检索工具出现的呼声越来越高,并且有更多的人参与到其中来。如此种种,给当今的网络信息检索研究带来了发展机遇,也给了它无限的发展空间。 3.网络信息检索的现行模式 3.1 网络全文数据库检索 网络全文数据库是以全文数据为数据库对象,并在网上提供全文检索服务的数据库。按数据库的生产机构分类,可分为出版商全文期刊数据库和生产商全文

网络信息检索与应用课程教学大纲

网络信息检索与应用课程教学大纲 课程名称:网络信息检索与应用Network Information Retrieval 课程编号:14126215 课程类别:专业课 总学时数:48 课内实验时数:8 学分:2 开课单位:商学院网络技术教研室 适用专业:网络与新媒体 适用对象:四年制本科 一、课程的性质、类型、目的和任务 网络信息检索与应用课程是新媒体与信息网络专业学生必修的一门重要专业课。该课程内容包括信息检索的基础知识,期刊、图书、产品目录、专利、标准、技术报告、会议文献和学位论文文献的检索方法;综合文献(宏观文献)的检索方法,包括综述、统计数据和引文等文献的检索方法;信息检索的技巧,包括布尔逻辑等检索策略、期刊质量认证以及搜索目前数据库不提供信息的方式方法; 学生学习本课程后能够快速、准确、有效地获取网络信息资源,对学生拓宽专业知识,提高自学能力,更好适应当今网格社会有着重要意义。 通过网络信息检索与应用课程的教学,应使学生对信息资源检索基础知识、网络信息资源检索的基本方法有比较系统的认识和正确的理解和掌握,为进一步学习打下坚实的基础。 二、本课程与其它课程的联系与分工 本课程在学生了解互联网基本知识后就能学习。 三、教学内容及教学基本要求 [1]表示“了解”;[2]表示“理解”或“熟悉”;[3]表示“掌握”;△表示自学内容;○表示略讲内容; 第一章信息资源检索基础知识 第一节信息资源检索概述 信息资源[1];信息资源检索[3];信息检索系统与数据库[3] 重点:信息资源检索 难点:信息检索系统 教学手段:多媒体教学 教学方法:讲授法 作业:什么是信息资源检索? 思考题:信息检索系统包括几个部分? 第二节信息检索语言 检索语言的概念与功能[2];信息检索语言的类型[3] 重点:检索语言 难点:检索语言的类型 教学手段:多媒体教学

网络信息检索(新媒体)

西安欧亚学院 《网络信息检索》 课程大纲 适用专业:网络与新媒体专业 编制单位:网络与新媒体课程中心编制日期:2014年11月 文化传媒学院制 -1-

《网络信息检索》课程大纲 课程类别专业选修课课程代码1D216220 适用专业网络与新媒体学时学分32/2 编制人余君制定日期2014年11月审定组(人)审定日期 一、课程概述 1、课程描述: 《网络信息检索》是网络与新媒体专业的一门专业选修课程。当今社会,信息成为人类赖以生存和发展的重要资源,面对浩瀚且杂乱无序的信息海洋,为使我校大学生能够迅速及时地查询所需信息,确保我校各类国际引进课程的教学效果和教育教学方式方法改革的实施,增强学生的国际网络使用及信息检索能力,促进我校大学生地知识更新、终身学习和知识再创造,学校作为通识必修课程在全校新生开设本门课程,具有重要的意义。 本门课程主要针对大学生的特定需求,培养大学生了解各种信息资源的特点、掌握各种分类信息资源的检索工具、方法、途径、检索技巧等,进而掌握现代信息检索技术,使之能够熟练运用各种信息检索工具,获取所需要的信息,增强学生获取、评价和利用专业文献信息的能力,形成良好的信息素养,为促进学生开展自主、探究式学习,造就创新型人才起到重要作用。 2、设计思路 本门课程课堂教学的设计思路是准备采取讲练结合,以练习为主的教学模式,按照三个“三分之一”的比例设计课程并组织教学,三分之一的教学内容采取讲授方式组织教学,三分之一的内容以边讲边练的方式组织教学,三分之一的内容以训练方式组织教学。这种教学方式充分体现学校目前倡导的新课程改革精神,突出学生学习的主体地位,变传统的教师知识独白式地传递信息为学生自己去解析和吸收信息的教学模式。本课程 -2-

网络信息检索

事实数据检索板块思考题 1. 哪些金属属贵金属,重贵金属和轻贵金属是怎样区分的? 答:百度——贵金属——百度百科 贵金属:金、银、钌、铑、钯、锇、铱、铂。 2. 请查出五种农用除草剂的名称和化学结构式。 答:百度——除草剂——百度百科 百草枯C12H14C12N2 氯酸铵NaClO3 乙草胺C14H20C1NO2 甲草胺C14H20ClNO2 亚砷酸钠NaAsO2 3. 请查2000年世界处于前十位的银行。 答:百度——世界银行排名——百度快照 花旗银行,美洲银行、汇丰控股、东京三菱银行、大通曼哈顿银行、第一劝业银行、法国农业信贷银行、樱花银行、富士银行和中国工商银行。 4. 羽毛球的英文名称从何而来? 答:维基百科——羽毛球 1873年,在英国格洛斯特郡的伯明顿庄园举行了一场公开表演,引起许多人的注意,并逐渐传播开来。后来人们便以该场表演的庄园名称“伯明顿(Badminton)”来称呼这项运动,然而在华语地区该名称并未普及,而是依球具而称之为“羽毛球”运动。 5. 请查英谚“one swallow does not a summer make”的出处和含义。 答:(一燕不成夏)个别燕子早来了,不证明春天已经来临了。凭个别现象草率下判断是不智的。 6. 化学元素中的钫、镅的英文名称是以何地命名的。 答:钫法国France 镅美洲(Americas) 7. 香港科技大学(Hong Kong University of Science & Technology)建于哪年,现任校长是谁? 答:百度——香港科技大学——官网 建校于1991年现任校长:陈繁昌 8. 海洛因的密度是多少? 答:约0.65克/立方厘米 9. 1998年科学家们在人类基因组研究方面取得哪些进展? 答:以DNA测序为先导的“基因组信息工业”;DNA测序技术与计算机技术的接轨、生物芯片与基因表达研究的接轨都是基因组研究的重要突破等。 10. 我国2003---2007年国民生产总值各是多少? 答:2003 135174.0 135822.8 2004 159586.7 159878.3 2005 184088.6 183217.4 2006 213131.7 211923.5 2007 251483.2 249529.9 单位:亿元 12. “Encyclopedia”、“gazetteer”两词的来源。 答:Encyclopedia这个单词来源于希腊?νκ?κλιos(拉丁字母enkyklios)和παιδε?α(paideia)。enkyklios意为“循环的,周期性,平常的”,而paideia则指“教育”。含义是“普通教育,从字面上说就是一个想接受通才教育的人所应该学习的艺术和科学知识”。在抄录过

网络信息检索2013--B

中国矿业大学信电学院2013年 “院长杯”科技文化节 网络信息检索试题【B卷】 说明:1.本考试为闭卷考试,请考生遵守考试纪律,独立完成。 2.本次考试为上机考试,满分100分,考试时间为120分钟,未在22日下午4:30—6:30按要求提交试卷的考试成绩无效,请考生合理把握考试时间。在试卷得分相同时,由参赛者上传作答试题的先后顺序确定获奖的高低等次。 3.参赛者须完整、准确地填写相关信息,并按竞赛通知的要求作答、上传试题。(注:选择题、判断题的答案填在前面的表格里;填空题的答案填在空白处的横线上;简答题以及实践题答在每一道小题的后面。填写位置有误或格式错误,该题以零分计入成绩) 姓名班级学号分数 第一部分理论题(共50分) 一、单项选择题(每小题1分,共10分) (注:请在答题栏相应位置填写答案) 1、检索最新的学术动态方面的信息,最好用哪种检索工具书?( ) A、手册 B、年鉴 C、期刊 D、书目

2、FTP可以实现资源共享,它提供了一个免费的公共帐号()。 A、System B、administrator C、Anonymous D、必须事先申请 3、哪个数据库是我国第一个连续出版的大规模集成化、多功能的学术期刊全文文献检索系统?( ) A、CNKI B、维普科技期刊数据库 C、人大复印资料数据库 D、百度 4、按照使用地区来划分,标准的不包括以下哪种类型?( ) A、国际标准 B、国家标准 C、地区标准 D、行业标准 5、按照传递媒介来划分,下列哪项不属于情报的类型?() A、文字情报 B、战术情报 C、实物情报 D、声像情报 6、信息检索根据检索对象不同一般分为( )。 A、二次检索、高级检索、文献检索 B、分类检索、主题检索 C、计算机检索、手工检索 D、数据检索、事实检索、文献检索 7、我如果想查广东古代各市、县发生的大事,从2008年起查,要用哪种检索方法?( ) A、顺查法 B、倒查法 C、循环法 D、抽查法 8、关于WWW的说法,不正确的是()。 A、需要Web浏览器访问信息 B、采用HTML协议进行通信控制 C、可以访问多媒体信息 D、必须通过拨号网络连接方式访问 9、以下不属于三次文献的是( )。 A、综述 B、索引 C、手册 D、年鉴 10、题录Piterniek A B. Functions and capabilities of online searching systems: a checklist[C].Online Review,1989,13(6):466-469.是哪种信息类型的著录格式()。 A、期刊 B、图书 C、会议记录 D、学位论文 二、填空题(每小题2分,共20分)

信息检索论文

关于网络信息的检索 摘要:在信息技术迅速发展的推动下,传统信息服务机构和网络信息服务运营商逐步走上由信息服务向知识服务的转型之路。在这种趋势下,信息检索也由过去单纯的字符匹配逐步转向面向内容、基于知识的信息检索。在这里简单探讨一下基于知识服务的信息检索效率的基本概念和评价指标,剖析语义分析程度、信息模型、检索方法和信息收录范围等主要影响因素,最后通过一个实例,对比分析说明知识服务将提高用户信息检索的效率。 关键词:信息检索,网络信息,信息,搜索引擎 引言 进入20世纪90年代以后,互联网的发展风起云涌,人类社会的信息化、网络化进程大大加快。与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。 1信息检索概述 信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。 2网络信息检索简介 随着信息技术的飞速发展,信息已成为全社会的重要资源,对信息的占有程度及信息处理水平的先进程度已成为衡量一个国家或地区现代化程度的重要标志,而网络上丰富的信息在更大程度上改变了人们的工作和生活的方式。Internet是当今世界上规模最大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络,基于Internet的网络信息检索的研究,无论对研究人员还是一般用户来说,都有着很强的现实性和实用性。 2.1网络信息检索定义 网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。 2.2 网络信息检索的原理 网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。 ①布尔逻辑模型——这是一种简单而常用的严格匹配模型。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询结果。标准的布尔逻辑模型为二元逻辑,所搜索的文档要么与查询相关,要么与查询无关。利用这种模型进行查询,其查询结果一般没有按照内容的相关特性排序。 ②模糊逻辑模型——它在查询结果处理中引进了模糊逻辑比较,并且按照相关的优先次序排列查询结果,这样就可以克服布尔逻辑模型信息查询结果的无序性。 ③概率模型——它是基于贝叶斯概率原理而提出的,根据词条、文档间的内在联系,利用词条间和词条与文档间的概率相依性来进行信息检索。 2.3 网络信息检索的特点 ①信息检索的范围不断拓宽; ②信息检索手段更加容易; ③信息检索的途径更加灵活。 2.4网络信息检索与传统信息检索的区别

网络信息检索的现状与发展

网络信息检索的现状与发展网络信息检索的现状与发展 1.基于网页的网络信息检索工具的现状和发展趋势 页是因特网的最主要的组成部份,也是人们获取网络信息的最主要的来源,为了方便人们在大量繁杂的网页中找寻自己需要的信息,这类检索工具发展的 最快。一般认为,基于网页的信息检索工具主要有网页搜索引擎和网络分类目 录两种。网页搜索引擎是通过"网络蜘蛛"等网页自动搜寻软件搜索到网页,然 后自动给网页上的某些或全部字符做上索引,形成目标摘要格式文件以及网络 可访问的数据库,供人们检索网络信息的检索工具。网络目录则是和搜索引擎 完全不同,它不会将整个网络中每个网站的所有页面都放进去,而是由专业人 员谨慎地选择网站的首页,将其放入相应的类目中。网络目录的信息量要比搜 索引擎少得多,再加上不同的网络目录分类标准有些混乱,不便人们使用,因 此虽然它标引质量比较高,利用它的人还是要比利用搜索引擎的人少的多。但 是由于网络信息的复杂性和网络检索技术的限制,这类检索工具也有着明显的 不足。(1)随着网页数量的迅猛增加,人工无法对其进行有效的分类、索引和利用。网络用户面对的是数量巨大的未组织信息,简单的关键词搜索,返回的信息数量之大,让用户无法承受。(2)信息有用性评价困难。一些站点在网页中大量 重复某些关键字,使得容易被某些著名的搜索引擎选中,以期借此提高站点的地位,但事实上却可能没有提供任何对用户有价值的信息。(3)网络信息日新月异 的变更,人们总是期望挑出最新的信息。然而网络信息时刻变动,实时搜索几乎 不可能,就是刚刚浏览过的网页,也随时都有更新、过期、删除的可能。 2.发展趋势 网络信息检索工具的发展主要体现在进一步改进、完善检索工具和检索技术,以提高检索服务质量,改变网络信息检索不尽如意的地方。主要体现在以 下几个方面:网络检索工具开发提供商之间合作越来越紧密。过去一般网络检 索工具提供商只依靠自己建立的数据库来提供检索服务,检索范围有限,而现 在某些著名的搜索引擎在购买其他公司的数据库或者技术内核,有的与其他搜

09网络信息检索概述

第9章网络信息检索概述 【本章要点】 ●介绍网络信息资源的概念 ●阐述网络信息资源的特点与类型 ●论述网络信息资源的分别 ●分析网络信息检索的原理及方法 ●简述网络信息检索的相关标准 ●探讨网络信息检索的发展趋势 9. 1 网络信息资源分布 9.9.1网络信息资源的特点 网络信息资源(Network Information Resource)指可在互联网上发表、查询与存取利用的信息资源总和。 1.优点:(1)数量巨大,增长迅速(2)内容丰富,形式多样(3)结构复杂,分布广泛(4)开发互动,共享性强(5)传播快速,利用方便(6)更新速度快,动态性强(7)信息使用成本低 1)数量巨大,增长迅速:重要特点为海量;信息源庞杂; 2)内容丰富,形式多样:学科、领域、语言;图文、音像、软件、DB,呈现多类型、多媒体、跨地 区、跨语种等特征; 3)结构复杂,分布广泛:无统一标准规范,分布广泛;半结构化数据日趋丰富; 4)开发互动,共享性强:共享多种资源,自由传输发布;网络环境下时空范围最大化延展;交互性 表现为主动性、参与性、交谈性、和操作性; 5)传播快速,利用方便:高速信息资源传输通道辐射全球;检索和获取的便利; 6)更新速度快,动态性强:本质是动态系统,高度动态性,时效性强,更新频率快; 7)信息使用成本低:大部分免费,收费与其他相比较低。 2.缺点 1)质量参差不齐,良莠不一:开放性,发布自由; 2)分散无序,缺乏管理:宏观无序、分散、不规范,缺乏稳定性和可靠性; 3)稳定性差,精确度低,缺乏安全保障:高度动态性,无统一经营管理机构,统一的发布 标准。

9.1.2网络信息资源资源的类型(07武大简答) 按网络信息资源的媒体形式文本信息、图片信息、音频信息、视频信息、三位虚拟影像信息 按人类信息交流的方式正式出版信息、半正式出版信息、非正式出版信息 按信息的加工程度一次网络信息资源、二次网络信息资源、三次网络信息资源按网络信息的内容和用途普通型、专门资料型、数据资料型、及时资料型 按信息的表现形式全文型、数值型、书目文献型和实时活动型 按传输协议的不同WWW信息资源、Telnet信息资源、FTP信息资源、网络论 坛、Gopher信息资源 9.1.3网络信息资源的分布 9.1.3.1网络信息资源的内容 1.政府信息 2.教育科研信息 3.网上出版物 4.网络数据库 5.电子论坛和电子会议 6.网上专利信息 9.1.3.2网络信息资源分布的特征 1.离散性: 类型庞杂;发布内容自由性、任意性大,缺乏过滤、质量控制和管理机制,不同类型信息混为一体,大量不健康信息扩散,显示了网络信息资源的分散性和无序性。 2.不均衡性: 主要表现在地区分布和语言分布等方面。信息资源分布基本反映该地区经济、文化等方面的发展水平,全球:美为首发达国家大大高于发展中国家;我国:东部地区高于西部地区。网络中文信息贫乏已成为现实问题。 请谈谈互联网对信息检索的巨大影响(07华南师范论述) 补充:网络信息检索的特点 1)检索范围大 2)传统检索方法与全新网络检索技术相结合 3)用户界面友好且检索方便 4)用户透明度高 5)信息冗余大 9. 2 网络信息检索原理与方法 9.2.1网路信息检索原理 9.2.1.1网路信息检索及其特点 1.检索对象得到了极大的丰富:图文、音像、软件、DB,呈现多类型、多媒体、跨地区、跨语种等特征 2.检索空间得到了极大的扩展:检索范围覆盖整个互联网这一全球性的网络 3.检索趋于简单方便: 1)WWW提供了超链接方式,相关性较强 2)用户检索界面、检索结果提供等方面交互性良好、信息反馈功能较好 3)自然语言广泛运用,使检索日趋简洁,检索交互性提高 不足:

相关主题
文本预览
相关文档 最新文档