当前位置:文档之家› 现代信息检索技术

现代信息检索技术

现代信息检索技术
现代信息检索技术

现代信息检索技术

一、填空

1.信息按出版类型分为( 。)

2.定期(多于一天)或不定期出版的有固定名称的连续出版物是( ) 。

3.按文献的相对利用率来划分,可以把文献分为( 、、) 。

4.检索语言可分为两大类:( 、)。

5.检索国外科技会议论文的主要检索工具为( 。)

6.在万方数据资源中,检索期刊文献时主要使用( )。

7.文件ABC.001.TXT的后缀名是( ) 。文件类型是( ) 。

8.我国专利法保护的发明创造分为( )

9.在使用搜索引擎检索时,URL:ustc可以查到( ) 中带有ustc的网页。

10.查询关键词为短语"DA TA OUTPUT",可以用位置算符(W)改写为:

( ) 。

二、选择题

三、1《全国西文期刊联合目录》属于:【】

A.目录

B.题录

C.文摘

D.索引

2 在下列哪种检索工具中可以得到历年的统计数据?【】

A.字典

B.百科全书

C.年鉴

D.手册

3下列哪种图书不属于工具类图书?【】

A.科技专著

B.字典

C.手册

D.年鉴

4下列哪个数据库是开放式的数字图书馆?【】

A.万方数据

B.超星

C.维普

D ELSEVIER

5下列哪个检索系统提供了期刊和文献被引用的情况?【】

A.WEB OF SCIENCE

B.OCLC

C.ISTP

D.工程索引EI

6下列关于检索目的的说法正确的是:【】

A.避免重复研究、建设

B.了解前人的工作,以便继承发展

C.学习前人的优秀方法,提高工作效率

D.可以拿来就用

7专利权的特点有:【】

A.专有性

B.地域性

C.时效性

D.保护性

8下列标准是国际标准的有:【】

A.GB2312-80

B.ISO4084-77

C.IEC1234-89

D.京Q/JB1-79

9下列数据库中,提供期刊原文的有哪些?【】

A.学术期刊网

B.维普科技期刊

C.WEB OF SCIENCE

D.ELSEVIER

10主流的电子图书格式有哪些?【】

A.TXT

B.PDF

C.CHM

D.HTM

三简答题

1 简述零次信息、一次、二次、三次信息的概念。

2 简述数据库的概念。

3 简述信息检索原理。

4中国专利保护的期限为多长时间? 有关艺术设计类的专利属哪类?

四问答题

1叙述信息检索的一般步骤。

现代信息检索作业论文

信息社会,人们把信息、物质与能量一起称为人类社会赖以生存发展的三大要素。信息是促进社会经济、科学技术以及人类生活向前发展的重要因素。一个国家的科技进步和社会发展起来越取决于对信息的开发与利用,谁能充分开发和有效地利用信息资源,谁就能抢占科学技术发展的制高点。 社会的信息化环境使社会对人才的要求更高,信息素质成为现代化人才必备的基本素质之一。当今,信息呈爆炸式增长,不仅如此,信息载体也发生了巨大的变化,除传统纸介质信息外,每天都有大量的磁载体信息、电子版信息及各类网上信息涌现出来,这些浩如烟海的信息的多样性、离散性与无序性及其复杂的检索界面和使用方法,增加了信息利用的难度,极大地影响了人们获取信息的质量与效率。 信息检索方法是实现检索方案中的检索目标所采用的具体操作方法和手段的总称。检索的方法很多,要检索过程中应根据检索系统的功能和检索者的实际需求,灵活运用各种检索方法,以达到满意的检索效果。而检索方法大致有以下几种:1、顺查法,2、倒查法,3抽查法,4追溯法,5分段法,6浏览法。 顺查法:顺查法即根据课题所涉及的学科范围,从有关问题提出的最初年代入手,由远而近、逐年查找,直到查找的信息资料充足为止的方法。这种方法适用于对某一课题的普查,能查找到相当长时期内国内外发表的全部相关文献资料,这种方法查得的信息资料比较全面,漏查的可能性小,查全率较高。其不足之处是工作量大,费时费力。 倒查法:倒查法也称逆查法,即根据所查课题的时间范围,由近期向远期回溯查找文献资料的方法。此法适用于一些新课题、新观点、创新理论、革新技术等信息资料的检索,重点查检近期的信息资料,检索是按时间顺序由近期的新内容往远期旧内容逐年查找。其特点是速度快、效率高、省时、新颖性强,但漏查率比顺查法高,查得的信息资料不及顺查法的全面、系统不。 抽查法:抽查法是针对某一学科发展变化的特点及特定的发展阶段,查检特定时间范围内信息的一种方法。具体是以该学科文献信息发表的年代作为检索入口,来进行信息检索。此方法的特点是省时、省力,能获得较多的相关的信息资料。利用抽查法必须注意所查学科的特点及发展史,不然漏查的概率大,检索效率不高。 追溯法:追溯法是利用原始文献后面所附的参考文献和有关论著的引文注释进行追踪检索的一种方法。其检索到的文献系统性较强,内容比较集中,不足之处是漏检和误检的概率大,查检效率不高。 分段法:这是将常用法与追溯法交替使用的一种方法。既利用工具书检索文献,又利用文献后面的参考文献进行追溯,两种方法交替使用,直到满足读者需要为止。这种方法可根据文献和本单位工具书收藏的情况,分期分段交叉运用不同的查找方法,既能获得一定时期内的文献,还可节约查找时间。 浏览法:浏览法又称直接查找法。就是检索者从本专业最新核心期刊或者其他文献中直接阅读原文或浏览最新目次而获取原文的方法。因为浏览法查得的文献往往不全面、不系统,且局限性较大,所以不能作为查找文献信息的主要方法。 综上所述,文献检索方法很多,常常要因人因事而异,根据检索要求灵活应用,尽可能避免漏检和误检,以提高文献的查全率和查准率。 在浩如烟海的信息中,不设置检索点犹如大海捞针,很难找到所需要的信息资料。为了更好地利用信息,人们根据每件信息的内部和外部特征而设置了检索点,以此作为检索信息的入口。一般来说,设置的信息检索点主要有分类、主题、名称、著者、代码等。所以检索界面应该给用户提供较好的检索起始方式。没有任何内容的屏幕或空白的登陆表格都无法给用户提供有关如何开始检索过程的信息。在这一阶段,用户通常无法给出有关其信息需求的全面详细的描述。研究表明,用户倾向于以一个简短的查询作为起点,仔细观察相应结果,之后修改查询,如此循环往复。最初的查询可以看成一种“试水”,通过它可以得到有关可能返回的检索结果以及如何重构查询的信息。因此,信息存取界面的一项任务就是帮助用户选

信息检索与利用期末复习

《信息检索与利用》考试题型说明: 一、判断题(1×10) 二、单选题(1×20) 客观题要涂答题卡。 三、填空题(2×5) 四、简答题(12×3) 五、实践题(12×2) 信息检索与利用客观复习题 一、判断题 1.在构建关键词时,我们尽量不要用自然语言,而要从自然语言中提炼关键词。 (对) 2.在信息检索时查询词表述准确是获得良好搜索结果的必要前提。(对) 3.目前的搜索引擎能很好的处理自然语言。(错) 4.用户可以通过Google图书搜索在线阅读任何一本搜索到的图书。(错) 5.二次检索是指在第一次检索结果不符合要求时,重新选择检索条件再次进行检 索。(错) 6.解决读者需求的无限性和馆藏的有限性的矛盾,唯一有效的方法就是在图书馆 间建立合作机制,实现资源共享。(对) 7.关键词语言的最大优点是能用计算机进行自动抽词标引,它适合于计算机自动 编制各种类型的词索引。(对) 8.信息素养由信息意识、信息能力、信息道德三个方面内容构成,其中,信息道 德是前提,信息能力是保证,信息意识是准则。(错) 9.搜索引擎与普通网站不同的是提供一个包含搜索框的页面,它不是一个WWW网 站。(错)

10.用搜索引擎google检索专利和期刊的全文比用中国国家知识产权局专利数据 库、《维普中文科技期刊数据库》等数据库的查全率和查准率都要高。(错)11.GB/T 16159-1996,汉语拼音正词法基本规则[S].北京:中国标准出版社, 1996.该文献类型为标准文献。(对) 12.在搜索引擎中输入“项目管理”和输入““项目管理””检索结果是不一样 的。(对) 13.在搜索引擎中常用的截词符是星号“*”,通常使用右截断。如输入comput*, 将检索出computer、computing、computerized等词汇。(对) 14.通用搜索引擎,如google、baidu、bing、yahoo,并不能囊括所有的网页。(对) 15.不同类型的搜索引擎对同一个主题进行搜索会得到不同的结果。(对) 16.一次文献是指原始创作,即作者以本人的研究成果为基本材料而创作(或撰写) 的文献,主要包括期刊论文、专利说明书、会议论文、科技报告和学位论文等。 (对) 17.从一次文献、二次文献到三次文献,是文献从无序到有序、从无组织到系统化 的过程。(错) 18.题录、目录属于一次文献;期刊论文属于二次文献。(错) 19.关键词和主题词都是表征文献实质性内容的词汇,前者是经过词表规范的,后 者是未经过词表规范的自由词。(错) 20.利用某个图书馆的书刊目录查询系统(OPAC),可以了解该图书馆收藏有哪些印 刷型图书和期刊。(对) 21.截词检索相当于用逻辑“或”扩展检索的范围,可以提高检索的查全率。(对) 22.将“红外线”扩展成“远红外线”和“近红外线”运用了上下位概念扩展法。 (对)、

《现代信息检索》完整备课教案

《现代信息检索》 授课教案 2010年9月

学期授课计划说明

六安职业技术学院教案 2010~2011学年度第 1 学期编号 1 信息工程系计算机教研室任课教师熊冠静课程名称《现代信息检索》 授课章节第1 章现代信息检索概述

教学过程主要环节设计 一.导入新课: 本章基本内容 随着科学技术的飞速发展,现代社会进入了知识时代,文献信息资源层出不穷。文献信息资源的类型按载体形式可分为印刷型、缩微型、视听型、机读型。按出版形式可分为图书、连续出版物、非书资料、舆图资料以及电子资源。从文献加工处理的深度划分,可分为一次文献、二次文献、三次文献。一次文献是指直接记录观察、发现、科研成果而形成的文献。二次文献是指文献工作者对一次文献进行整理、加工、编排而形成的文献,是为报道、检索、管理、利用一次文献而出现的一种文献形式。三次文献是指根据需要对一次文献和二次文献所载的内容进行选择,经分析研究、综合加工而成的文献。 1.1 检索工具的类型与作用 检索工具是指用于报道、存储和查找文献信息资源线索的工具和设备的总称,是以一次文献为基础,在广泛收集并经过严格筛选后,对其进行描述、标引或汇集,充分揭示其物质外形特征和内容特征,并按一定的规则组织而成的。 检索工具的作用在于帮助用户及时、快速、全面、系统地查找分散在各处的文献信息资源。检索工具的类型繁多,按文献信息资源的收录范围可分为综合性检索工具和专科性检索工具两大类型;按其载体形式可分为书本式工具书、卡片检索工具、光盘检索工具以及数据库。无论是书本式工具书,还是数据库均是知识时代人们检索和获取文献信息资源的工具,都具有存储和检索两种功能。但信息存储与检索的手段不同,前者采用手工检索,后者采用计算机检索。 1.2 检索汉字常用的检字法 1.2.1 汉语拼音音序法 汉语拼音音序法是一种将汉字依照《汉语拼音方案》所规定的拼音字母顺序

《信息检索与利用》期末复习1

《信息检索与利用》期末复习 试题题型 一、填空题(每空3分,共15分) 二、选择题(每题3分,共30分) 三、判断题(每题3分,共30分) 四、简答题(共25分) 1.(12分) 2.(13分) 复习题 第一章信息资源检索基础知识 一、填空题 1.___________________________是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。信息 2.___________________________是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。知识 3.___________________________是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。情报 4.___________________________是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。文献 5.___________________________是指在国内外学术或非学术会议上发表的论文或报告。会议文献 6.___________________________是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。学位论文 7.___________________________是对文献内容和形式特征进行选择和记录的过程。著录8.___________________________是指特定的数值型数据为对象的检索。数据检索 9.___________________________是指以特定的事实为目标的检索。事实检索 10.事实与数据检索工具主要依靠各类___________________________完成各种数据或事实的查询。参考工具书 11.按照结构原理,信息检索语言可以分为_____________________、____________________、

《信息检索系统》方案

HX-2055信息检索系统方案

目录 一项目意义 (2) 二系统设计 (3) 2.1技术原理 (3) 2.2系统构架 (5) 三系统功能 (6) 3.1信息采集 (6) 3.2中文自然语言处理 (6) 3.3全文检索功能 (7) 3.4格式文件检索 (8) 3.5性能指标 (8)

一项目意义 随着互联网的快速发展,每天有数千万条信息生成,包括文字信息、图片信息、视频信息、语音信息等,通过百度、谷歌等大型商业搜索引擎可以找到自己想要的信息,但是也存在很多弊端。 百度、谷歌等大型商业搜索引擎的搜索原理是基于网络爬虫(Spider)在世界各地百万台服务器上爬取网页数据,然后存储到数据库之后展现给查询用户,随着网站数量以及网络上信息更新的快速化,这些网络爬虫不能保证把所有的信息都抓到,尤其是特殊行业的行业信息,即便是抓到了也不一定能够在众多数据中展现出来。所以,对于一个部门来讲,有必要存在一款互联网信息检索系统来检索某一个行业的信息,每天自动在各大行业网站、政府网站等数据库中检索最新信息,通过自建的网络爬虫进行目标数据的抓取、存贮、归类、展现。 通过自己的信息检索系统,可以让自己部门每天轻松地获得世界各地、各个部门都发生了什么,有哪些新的政策,方便管理层在最新的信息数据下快速做出正确的决定。 据统计,内部网上的信息每年以200%的速度增长,其中发布到互联网上的信息只占到信息量的1%-2%,而98%以上的信息是发布在内部网上的。内部网上的信息既有网页形式的,也包含其他Word、PDF、XML等多种格式的数据。因此,面对内部网中海量异构的信息资源,如何帮助用户快速找到他们所需要的信息是一个主要的技术挑战。 搜索引擎能帮助用户方便、快捷、安全地获取内部网上的信息,在满足高效的同时,更重要的是保证了较高的查全率和查准率,能提供智能化的概念扩展搜索,极大的提高工作效率。内部网搜索引擎将组织中分散管理的信息整合在一起,在组织层面上实现新的增值与共享,从而有效实现组织内容利用的最优目标。 搜索引擎的目标是实现内部网全文检索。系统可对实施了内部网站资源进行爬行,无论内部网上的数据源在何地、以何种形式存在,都能够对其快速地访问,通过准确的分词建立索引,从而实现高质量的搜索查询。搜索引擎的主要目标包括:

中国科学院大学现代信息检索课后习题答案

《信息检索导论》课后练习答案 王斌 最后更新日期 2013/9/28 第一章布尔检索 习题1-1 [*] 画出下列文档集所对应的倒排索引(参考图1-3中的例子)。 文档 1 new home sales top forecasts 文档 2 home sales rise in july 文档 3 increase in home sales in july 文档 4 july new home sales rise 习题1-2 [*] 考虑如下几篇文档: 文档1 breakthrough drug for schizophrenia 文档2 new schizophrenia drug 文档3 new approach for treatment of schizophrenia 文档4 new hopes for schizophrenia patients a. 画出文档集对应的词项—文档矩阵; 解答: breakthrough 1 0 0 0 drug 1 1 0 0 for 1 0 1 1 hopes 0 0 0 1 new 0 1 1 1

patients 0 0 0 1 schizophrenia 1 1 1 1 treatment 0 0 1 0 b. 画出该文档集的倒排索引(参考图 1-3中的例子)。 解答:参考a。 习题1-3 [*] 对于习题1-2中的文档集,如果给定如下查询,那么返回的结果是什么? a.schizophrenia AND drug 解答:{文档1,文档2} b.for AND NOT (drug OR approach) 解答:{文档4} 习题1-4 [*] 对于如下查询,能否仍然在O(x+y)次完成?其中x和y分别是Brutus和Caesar所对应的倒排记录表长度。如果不能的话,那么我们能达到的时间复杂度是多少? a.Brutus AND NOT Caesar b.Brutus OR NOT Caesar 解答: a.可以在O(x+y)次完成。通过集合的减操作即可。具体做法参考习题1-11。 b.不能。不可以在O(x+y)次完成。因为NOT Caesar的倒排记录表需要提取其他所有词项对应的倒 排记录表。所以需要遍历几乎全体倒排记录表,于是时间复杂度即为所有倒排记录表的长度的和 N,即O(N) 或者说O(x+N-y)。 习题1-5 [*] 将倒排记录表合并算法推广到任意布尔查询表达式,其时间复杂度是多少?比如,对于查询 c.(Brutus OR Caesar) AND NOT (Antony OR Cleopatra) 我们能在线性时间完成合并吗?这里的线性是针对什么来说的?我们还能对此加以改进吗? 解答:时间复杂度为O(qN),其中q为表达式中词项的个数,N为所有倒排记录表长度之和。也就是说可以在词项个数q及所有倒排记录表长度N的线性时间完成合并。由于任意布尔表达式处理算法复杂度的上界为O(N),所以上述复杂度无法进一步改进。 习题1-6 [**] 假定我们使用分配律来改写有关AND和OR的查询表达式。 a. 通过分配律将习题1-5中的查询写成析取式; 12 b. 改写之后的查询的处理过程比原始查询处理过程的效率高还是低? c. 上述结果对任何查询通用还是依赖于文档集的容和词本身? 解答: a. 析取式为:(Brutus And Not Anthony And Not Cleopatra) OR (Caesar AND NOT Anthony AND NOT Cleopatra) b. 这里的析取式处理比前面的合取式更有效。这是因为这里先进行AND操作(括号),得到的倒排记录表都不大, 再进行OR操作效率就不会很低。而前面需要先进行OR操作,得到的中间倒排记录表会更大一些。 c. 上述结果不一定对,比如两个罕见词A和B构成的查询 (A OR B) AND NOT(HONG OR KONG),假设HONG KONG一 起出现很频繁。此时合取方式可能处理起来更高效。如果在析取式中仅有词项的非操作时,b中结果 不对。 习题 1-7 [*] 请推荐如下查询的处理次序。 d. (tangerine OR trees) AND (marmalade OR skies) AND (kaleidoscope OR eyes)

文献检索期末考试卷

《信息检索与利用》试题(本科) 一、单项选择题(每题1.5分,共30分) 1. 人类社会的三大资源是(A ) (A)物质、能源、信息(B)物质、人力、资本 (C)物质、能源、管理(D)信息、管理、人力 2. 就信息与物质、能量的关系而言( D ) (A)信息是一种物质(B)信息是一种物质,同时具有一定的能量(C)信息是一种能量(D)信息既非物质,也非能量 3. 信息论的创始人是( D ) (A)美国数学家哈特莱(B)美国数学家维纳 (C)中国数学家华罗庚(D)美国数学家香农 4.信息资源的本质特征是( B ) (A)依附性与可传递性(B)知识性与共享性 (C)共享性与价值不定性(D)可传递性与共享性 5. 如果分别以检索词a、b、c在某数据库的关键词字段进行检索都能得到相

应的检索结果,结果不为0,下面哪个检索式表示检索结果数最少( A )(A)a and b and c (B)a and b or c (C)a or b or c (D)a or b and c 6. 根据加工深度来划分文献,学位论文属于( B ) (A)零次文献(B)一次文献 (C)二次文献(D)三次文献 7. CNKI 是以下哪一种称谓的简称( C ) (A)清华同方(B)重庆维普 (C)中国知识基础设施(D)中国期刊全文数据库 8. 扩大检索范围的方式是(B ) (A)使用“逻辑与”(B)使用“逻辑或” (C)使用“逻辑非”(D)使用优先运算符 9. 下列能够检索图书信息的数据库是(D ) (A)维普《中文科技期刊数据库》(B)万方数据资源系统 (C)人大复印报刊资料全文数据库(D)超星数字图书馆 10. 下列属于一次文献的正确答案是( C ) (A)专刊说明书、索引、文摘刊物(B)期刊论文、私人笔记、百科

全文检索系统整体方案

1全文检索系统方案 1.1全文检索需求 1)系统提供模糊检索、分类搜索、高级复合搜索、全文检索、图片内容 检索、跨库检索等多种检索途径; 2)支持字索引和词索引; 3)检索条件具有完整的关键词布尔逻辑运算AND、OR、NOT能力,支持 复合式布尔逻辑运算查询,并且可以配合多组左括号"("与右括号")"作 关键词查询优先级的设置; 4)提供用户多次递进查询的功能,用户可根据上一次查询关键词得到的 检索结果集,增加查询关键词与缩小搜索日期范围,而得到更准确的 查询结果集; 5)能够支持对以上文件中的中文(简体/繁体)、英文、日语、韩语内容 实现关键字检索; 6)支持对Word、TXT、PDF等多种主流文档格式全文检索,并提供开发 接口以支持特殊文档格式的全文检索; 7)在数据源数据发生更新时,能在索引库中反映出来,保证搜索的信息 为最新,即支持增量索引机制; 8)用户可自行设定时间,让系统自动定时进行更新索引; 9)对于百万级记录数的搜索以及结合模糊搜索等查询方式,搜索时间不 得超过10秒; 10)提供跨数据源、数据格式的搜索;

11)同过相关性搜索,能够把和搜索条件相关联的信息搜索出来; 12)不但能够对图片的描述信息进行搜索,还能对图片内容的检索; 13)提供COM与SOAP的搜索接口(Interface) 可让其它应用程序或查询网 页能够提供用户查询入口和查询结果的呈现,用户可通过应用程序或 浏览器访问全文检索服务器,提交查询条件,可在浏览器中查看检索 结果; 14)查询结果集中应包含结果集总数、命中的结果文件的完整路径,以及 符合关键词出现的内容片断; 15)在搜索结果集中,关键词应被标识出来,用特殊的字体及颜色和其他 文字进行区别,查询者可在查询结果片断中一目了然的看到关键词出 现的位置; 16)查询结果可按照关键词命中次数,命中结果文件的修改时间,大小等 条件进行排序; 17)可提供用户对检索命中结果文件在索引库中进行标记,从而再次检索 时,不在标记过的文件中进行查询; 1.2全文检索系统总体方案 系统将采用以下全文检索流程。

现代科技信息检索期末试题

《现代科技信息检索》期末试题 学号____________ 姓名___________ 请从以下六道试题中任选五道完成。 一、查找我校图书馆有关“信息论与编码”方面的中文图书?如果图书馆没有收藏某图书(电子版、纸本都未收藏),可从哪些途径获得该书的书目信息和馆藏信息?(20分) 二、利用我校购买的“中国知网(CNKI)”数据库进行检索:(20分) 1、查找2005年以来有关“数字信号处理“的期刊论文 2、查找作者单位为“中南民族大学电子信息工程学院”的所有期刊论文。 三、我校购买的IEEE/IEE Electronic Library数据库进收录了哪些学科的文献?利用该数据库查找“Digital Signal Processing”方面的文献。(20分) 四、影响查全率和查准率的因素分别有哪些?请结合自己的检索实践,回答如何分别提高查全率和查准率。(20分) 五、网络信息检索工具有哪些评价标准?请列出6种以上的主要指标。并以“光频检测器”为关键词,分别选用两种搜索引擎查找相关资料,参照搜索引擎评价标准,简单评价分析这两种搜索引擎。(20分) 六、动物体细胞克隆技术是世纪生物领域中最令人振奋的新技术之一,它不仅对农业与畜牧业生产具有现实意义,同时对生命科学相关领域的基础研究、临床医学和畜牧业等快速发展提出了新的研究课题。请利用你所掌握的信息源查找有关克隆技术的相关文献,完成下列提问。(20分) 1、克隆的含义是什么? 你是通过何种途径获取关于克隆含义的信息? 2、克隆技术已展示出广阔的应用前景,概括起来大致有以下四个方面: 培育优良畜种和生产实验动物 生产转基因动物; 生产人胚胎干细胞用于细胞和组织替代疗法; 复印濒危动物物种,保存和传播动物物种资源 请选择合适的文献信息源,分别就这四个方面的应用查找一篇文献,并将文献基本信息填写如下。 3、请在网上查找有关克隆技术的新闻,选取一条将其基本信息记录下来。

现代信息检索作业

运城学院 《现代信息检索》 系别:应用化学 专业:化学 班级:1101 姓名:张丹 学号:2011080145

这个学期我学习了想《现代信息检索》这门课程,从中学到了很多关于信息检索的知识,以下就是我对这门课程的总结。 信息社会,人们把信息、物质与能量一起称为人类社会赖以生存发展的三大要素。信息是促进社会经济、科学技术以及人类生活向前发展的重要因素。一个国家的科技进步和社会发展起来越取决于对信息的开发与利用,谁能充分开发和有效地利用信息资源,谁就能抢占科学技术发展的制高点。 社会的信息化环境使社会对人才的要求更高,信息素质成为现代化人才必备的基本素质之一。当今,信息呈爆炸式增长,不仅如此,信息载体也发生了巨大的变化,除传统纸介质信息外,每天都有大量的磁载体信息、电子版信息及各类网上信息涌现出来,这些浩如烟海的信息的多样性、离散性与无序性及其复杂的检索界面和使用方法,增加了信息利用的难度,极大地影响了人们获取信息的质量与效率。 信息检索方法是实现检索方案中的检索目标所采用的具体操作方法和手段的总称。检索的方法很多,要检索过程中应根据检索系统的功能和检索者的实际需求,灵活运用各种检索方法,以达到满意的检索效果。而检索方法大致有以下几种:1、顺查法,2、倒查法,3抽查法,4追溯法,5分段法,6浏览法。 顺查法:顺查法即根据课题所涉及的学科范围,从有关问题提出的最初年代入手,由远而近、逐年查找,直到查找的信息资料充足为止的方法。这种方法适用于对某一课题的普查,能查找到相当长时期内国内外发表的全部相关文献资料,这种方法查得的信息资料比较全面,漏查的可能性小,查全率较高。其不足之处是工作量大,费时费力。 倒查法:倒查法也称逆查法,即根据所查课题的时间范围,由近期向远期回溯查找文献资料的方法。此法适用于一些新课题、新观点、创新理论、革新

最新信息检索与利用试卷及答案

一、单项选择题(30分) 1.( B )的主要功能是检索、通报、控制一次文献,帮助人们在较短时间内获取较多的文献信息。7 A.零次文献B.二次文献C.一次文献D.三次文献 2.一次文献、二次文献、三次文献是按照( A )进行区分的。7 A.加工深度B.原创的层次C.印刷的次数D.评论的次数 3.从文献的( B )角度区分,可将文献分为印刷型、缩微型等。6 A.内容公开次数B.载体类型C.出版类型D.公开程度 4.具有固定名称、统一出版形式和一定出版规律的定期或不定期的连续出版物,称为( D )。8 A.图书B.会议文献C.学位论文D.期刊 5.( A )类型的专业文献出版周期最短、发行量最大、报道最迅速及时,成为多数论文发表渠道。8 A.期刊B.报纸C.会议文献D.专利 6.在公开出版物中,当前的(C )反映的信息内容可能最新。8 A.学位论文B.标准文献C.期刊论文D.报纸文献 7.当我们需要对陌生知识作一般了解时,我们可先参考( C )文献。8 A.专利B.报告C.图书D.标准 8.利用文献后面所附的参考文献进行检索的方法称为( A )。31 A.追溯法B.直接法C.抽查法D.综合法 9.中国图书馆图书分类法的分类号采用了( A )体系。34 A.拼音字母+数字B.英语字母+数字C.全部拼音字母D.全部数字 10.( B )是以报道文献出版或收藏信息为主要功能的工具。 A.题录B.索引C.文摘D.目录 11.按照顺序表述文献检索常用的五个步骤是( D )。32 A.明确要求和分析课题,选择检索系统,获取原文,确定检索途径和检索策略,实施检索以及调整检索策略B.明确要求和分析课题,获取原文,确定检索途径和检索策略,实施检索以及调整检索策略,选择检索系统C.明确要求和分析课题,实施检索以及调整检索策略,选择检索系统,获取原文,确定检索途径和检索策略D.明确要求和分析课题,选择检索系统,确定检索途径和检索策略,实施检索以及调整检索策略,获取原文12.图书分类法中,类名之间的上下位关系反映了学科概念之间的( A )关系。34 A.包含B.排斥C.延伸D.相容 13.图书分类法中,类名之间的同位类关系一般反映了学科概念之间的( B )关系。34 A.包含B.排斥c.延伸D.相容 14.分类途径是按照文献信息所属的学科门类,利用( D )进行检索的途径。29 A.学科名称B.专业名称C.分类号及其分类名D.A、B、C均可 15.如果希望查找“对用后均法进行数据处理的讨论”这个课题相关的文献,较好的检索词应该是( C )。36 A.后均法,进行,数据处理B.后均法,数据处理C.后均法,进行,数据处理,讨论D.用,后均法,进行,数据处理 16.如果希望查找“对宋词韵律的美学思考”这个课题相关的文献,较好的检索词应该是(A )。36 A.宋词,韵律,美学,思考B.宋词,韵律,美学C.宋词,美学,思考D.宋词,韵律,思考 17.逻辑“与”算符是用来组配( D )。41

信息检索与利用试卷及答案1

信息检索与利用试卷及答案1

信息检索期末试卷 班级物流1081 姓名吴新华学号1081508130 一、单项选择题(30分) 1.( B )的主要功能是检索、通报、控制一次文献,帮助人们在较短时间内获取较多的文献信息。7 A.零次文献B.二次文献C.一次文献D.三次文献 2.一次文献、二次文献、三次文献是按照( A )进行区分的。7 A.加工深度B.原创的层次C.印刷的次数D.评论的次数 3.从文献的( B )角度区分,可将文献分为印刷型、缩微型等。6 A.内容公开次数B.载体类型C.出版类型D.公开程度 4.具有固定名称、统一出版形式和一定出版规律的定期或不定期的连续出版物,称为( D )。8 A.图书B.会议文献C.学位论文D.期刊5.( A )类型的专业文献出版周期最短、发行量最大、报道最迅速及时,成为多数论文发表

渠道。8 A.期刊B.报纸C.会议文献D.专利 6.在公开出版物中,当前的(C )反映的信息内容可能最新。8 A.学位论文B.标准文献C.期刊论文D.报纸文献 7.当我们需要对陌生知识作一般了解时,我们可先参考( C )文献。8 A.专利B.报告C.图书D.标准 8.利用文献后面所附的参考文献进行检索的方法称为( A )。31 A.追溯法B.直接法C.抽查法D.综合法 9.中国图书馆图书分类法的分类号采用了( A )体系。34 A.拼音字母+数字B.英语字母+数字C.全部拼音字母D.全部数字 10.( B )是以报道文献出版或收藏信息为主要功能的工具。 A.题录B.索引C.文摘D.目录 11.按照顺序表述文献检索常用的五个步骤是( D )。32

《信息检索系统》方案

HX-2055信息检索系统方案 目录 一项目意义 随着互联网的快速发展,每天有数千万条信息生成,包括文字信息、图片信息、视频信息、语音信息等,通过百度、谷歌等大型商业搜索引擎可以找到自己想要的信息,但是也存在很多弊端。 百度、谷歌等大型商业搜索引擎的搜索原理是基于网络爬虫(Spider)在世界各地百万台服务器上爬取网页数据,然后存储到数据库之后展现给查询用户,随着网站数量以及网络上信息更新的快速化,这些网络爬虫不能保证把所有的信息都抓到,尤其是特殊行业的行业信息,即便是抓到了也不一定能够在众多数据中展现出来。所以,对于一个部门来讲,有必要存在一款互联网信息检索系统来检索某一个行业的信息,每天自动在各大行业网站、政府网站等数据库中检索最新信息,通过自建的网络爬虫进行目标数据的抓取、存贮、归类、展现。 通过自己的信息检索系统,可以让自己部门每天轻松地获得世界各地、各个部门都发生了什么,有哪些新的政策,方便管理层在最新的信息数据下快速做出正确的决定。 据统计,内部网上的信息每年以200%的速度增长,其中发布到互联网上的信息只占到信息量的1%-2%,而98%以上的信息是发布在内部网上的。内部网上的信息既有网页形式的,也包含其他Word、PDF、XML等多种格式的数据。因此,面对内部网中海量异构的信息资源,如何帮助用户快速找到他们所需要的信息是一个主要的技术挑战。

搜索引擎能帮助用户方便、快捷、安全地获取内部网上的信息,在满足高效的同时,更重要的是保证了较高的查全率和查准率,能提供智能化的概念扩展搜索,极大的提高工作效率。内部网搜索引擎将组织中分散管理的信息整合在一起,在组织层面上实现新的增值与共享,从而有效实现组织内容利用的最优目标。 搜索引擎的目标是实现内部网全文检索。系统可对实施了内部网站资源进行爬行,无论内部网上的数据源在何地、以何种形式存在,都能够对其快速地访问,通过准确的分词建立索引,从而实现高质量的搜索查询。搜索引擎的主要目标包括:(1)较高的查准率。搜索系统支持按词索引、按字索引,同时实现中文自动分词。 (2)较高的查全率。搜索系统可搜索各类异构的信息资源,包括传统的网页信息、Word、PDF、XML等不同格式的文档以及各类主流数据库的表中记录。 (3)智能化的检索结果排序。安全搜索系统应采用相关度分析技术,将用户需要的信息排在结果列表的前面,屏蔽无用和错误的信息。 二系统设计 技术原理 HX-2055互联网信息检索系统(以下简称HX-2055)是针对特殊行业、政府部门、决策部门设计的一款高效率互联网信息检索系统,采用国际一流程序算法设计,系统构架与谷歌和百度的搜索引擎拥有共同的技术特点,能够保证系统对实时信息的快速采集、归类、展现。 在当今信息爆炸的时代,每个单位或个人都在为信息的快速增长做出了各种贡献。信息的种类也在不断的扩展,越来越多的非结构化信息不断出现,包括企业的各种报表、帐单、电子文档、网站的各种元素、图片、传真、扫描影像,以及大量的多媒体的音频、视频信息等等。所有的存储数据中,有85%采用的是非结构化格式的,非结构化信息每三个月增长一倍。由于信息格式的差异很大,所以基本无法整合为统一的接口供政府工作人员或广大群众方便使用。 全文检索是计算机程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时根据建立的索引查找,类似于通过字典的检索字表查字的过程。 全文检索系统是按照全文检索理论建立起来的用于提供全文检索服务的软件系统。全文检索系统的核心则具有建立索引、处理查询返回结果集、增加索引、优

现代信息检索课程学习心得

现代信息检索课程 学习心得 系别:生命科学系 班级:0903班 姓名:马昕 学号:2009140361 指导老师:何志林

2012-06-13 现代信息检索课程学习心得 走过了大学的四分之三,即将升入大四,也即将面临毕业论文的写作,但是对于文献的检索却知之胜少,所以这学期选修了何志林老师的现代信息检索课程,这门课程给我带来了不少收获。 文献检索课程是高校教学中不可缺少的一门课程,是素质教育中重要的组成部分,是当代大学生必须掌握的基本技能。文献检索教育是培养我们大学生的信息意识,使我们掌握用手工方式和计算机方式从各种文献或互联网中获取知识和信息的一种科学方法,是信息素养教育中重要的组成部分,是大学生素质教育中不可缺少的一个环节。高校的文献检索课作为我国高校情报用户教育的主要形式,是学生学习信息知识、掌握信息检索技术、普及信息素质教育的基础课,它和外语、计算机等一样是当代大学生必须掌握的基本技能。所以,对我

们来说,文献检索十分有必要,而且我们必须好好掌握这样一门课程。 科技文献检索与论文写作这门课程是最实用的课程之一,学习这门课程的目的是学会利用信息检索如何最快最准确的搜索想要的信息。文献检索作为一种工具,能通过他人的知识而对前人研究继承,发展和创新,通过研究思路和方法的学习和借鉴来进一步进行自己的研究,对于我们以后写毕业论文会有很大的帮助。文献信息资料是学习和研究工作的基础,各项学习和研究工作都将根据我们搜集到的文献信息资料来开展。信息资源越丰富,学习和研究工作成功的可能性就越大。面对日益增长的文献资源,如何通过一种有效的方法,以最少的时间与精力来获取自己所要的信息?这就需要具备文献检索的基本技能,通过文献检索,可以获取学术动态;通过文献检索可以寻找未知问题的答案;通过文献检索可以培养信息意识、提高自学的能力,可以说,同学们平时的学习及毕业论文的写作等都与文献检索密切相关。 在此次文献检索课程中,通过老师的介绍,我不仅了解到了信息检索方面的基础知识,如文献可以分为期刊,专利,会议资料,学位论文,科技报告等,并了解到了很多检索系统,如维普数据库,中国期刊全文数据库,EI,EBSCOhost ,SpringerLink ,超星电子图书,方正Apabi电子图书等。并了解到了各种数据库的特点,如:维普数据库中主要是期刊,万方学位论文数据库的检索结果多样性,EBSCO 是全球最早推出全文在线数据库检索系统的公司之一,在SCI中则可以查到各个领域的论文,研究成果,Springer则收录了各个领域的

信息检索与利用(期末考试题)

《信息检索与利用·农业》试题 姓名申秀军学号w320206220257 专业会计学 一、单选题(20分,每题1分) 1、个人信息源又称为(B )。 A、文献信息源 B、口头信息源 C、生物信息源 D、实物信息源 2、文献是记录有知识的(A)。 A、载体 B、纸张 C、光盘 D、磁盘 3、下列哪种文献属于一次文献( A )。 A、期刊论文 B、百科全书 C、综述 D、文摘 4、下列哪种文献属于二次文献( D )。 A、专利文献 B、学位论文 C、会议文献 D、目录 5、下列哪种文献属于三次文献( C )。 A、标准文献 B、学位论文 C、综述 D、文摘 6、下列选项中属于连续出版物类型的选项有( A )。 A、人民日报 B、学位论文 C、科技期刊 D、会议文献 7、下列选项中属于特种文献类型的有( D )。 A、学位论文 B、图书 C、科技期刊 D、标准文献 8、纸质信息源的载体是(D) A、光盘 B、缩微平片 C、感光材料 D、纸张 9、《中国图书分类法》(简称《中图法》)将图书分成( A) A 5大部分22个大类 B 5大部分26个大类 C 6大部分22个大类 D 6大部分26个大类 10、《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在(A)类目下查找。 A、S类目 B、Q类目 C、T 类目 D、R类目

11、使用逻辑“与”是为了(B) A、提高查全率 B、提高查准率 C、减少漏检率 D、提高利用率 12、使用逻辑“或”是为了(A) A、提高查全率 B、提高查准率 C、缩小检索范围 D、提高利用率 13、利用文献末尾所附参考文献进行检索的方法是( C ) A、倒查法 B、顺查法 C、引文追溯法 D、抽查法 14、至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合, 称为(A)。 A、数据库 B、记录 C、字段 D、文档 15、广义的信息检索包含两个过程(B ) A、检索与利用 B、存储与检索 C、存储与利用 D、检索与报道 16、要查找李平老师所发表的文章,首选途径为( A ) A、着者途径 B、分类途径 C、主题途径 D、刊名途径 17、狭义的专利文献是指(C ) A、专利公报 B、专利目录 C、专利说明书 D、专利索引 18、中国国家标准的代码是( A ) A、GB B、CB C、ZG D、CG 19、政府出版物主要包括两大类型的文献(B ) A、专利与标准 B、行政文件与科技文献 C、图书与期刊 D、档案与标准 20、ISBN是( B)的缩写 A、国际标准刊号 B、国际标准书号 C、连续出版物代码 D、国内统一刊号 二、多选题(20分,每题2分) 1、文献的构成要素( ABC) A、信息内容 B、载体材料 C、信息符号 D、纸、光盘 2、下列各项哪些属于文献( AC ) A、图书、期刊 B、光盘、磁盘 C、光盘数据库 D、纸张 3、期刊论文的外部特征有( ABC ) A、文献题目 B、着者 C、文献出处 D、主题词 4、图书的外部特征有( BCD )

电子档案管理系统技术方案设计

实用文档 电子档案管理系统 二○一六年十月

第一章系统简介 第一节研发背景 随着各行业各领域的信息化水平的不断提高以及档案管理工作日益受到重视,档案管理信息化的重要意义和作用越来越被广泛认同。另外,随着档案管理信息化的工作全面深入地开展,人们对档案信息化的认识不断深入和提高。这样,对档案管理信息系统的定位提出了越来越高的要求,同时也面临着许多新的更高的问题。档案管理信息化主要面临着如下新的应用需求和挑战: 档案类型繁多、层出不穷。档案管理信息系统需要管理的档案种类越来越多、越来越复杂,几乎涉及到了各行各业所有的档案信息,包括实体档案和电子档案,这要求档案管理信息系统几乎要包容所有的档案实体类型和电子档案类型,并能管理好。同时,还要适当兼容将来可能出现的档案实体类型和电子档案类型。 信息档案化。各行各业的大多数单位都建立了各种信息系统,但在经过一定的产生和利用后,这些系统中的信息累计得越来越多,这些信息系统内的电子信息的出口却是一个重大问题,需要按档案管理规章制度的要求归档到档案管理系统中。 企业级应用。在较大的集团化行业或单位中,存在着多级单位管理和跨地域单位管理的要求,因而,档案管理信息系统不再是管理某一具体单位的封闭的系统,而应具有跨地域管理全集团、全行业的能力。 开放性应用。档案管理信息系统不再是一个简单的封闭的管理系统,它应是整个信息化平台中的重要应用系统。它需要与几乎所有的信息系统、尤其是业务系统进行一体化联接,实现信息的双向流动和共享。因而,要求档案系统具有良好的开放性和数据兼容能力。 档案管理工作前移,为现实工作服务。档案管理信息系统不再被认为是起到保管过期资料的作用,而被要求深入到各个业务过程中,从信息的产生阶段和现行阶段就介入,以便为现实工作服务。这样就要求档案管理工作前移,与各项工作紧密结合。 新应用要求和新技术集成。随着档案管理应用需求的不断深入,需要集成进入更多的新技术成果。这要求档案管理信息系统具有良好的可扩展性,以便集成新的应用技术。 异构数据海量存储。在档案管理范围不断扩大、应用不断深入的同时,不得不面临日益增长的海量档案数据的存储问题,并且这些档案数据是异构的多种类型的。因而,要求档案管理信息系统具备灵活高效的存储体系结构。 针对上述出现的新的问题和要求,我们在总结17年档案管理软件开发经验和技术储备的基础之上,投入了大量的人力和物力,开发和完善电子档案管理系统档案管理信息平台,并在此基础之上,开发了针对

信息检索与利用期末考试

《信息检索与利用·计算机》期末考试试题 一、单选题(20分,每题1分) 1、个人信息源又称为( C)。 A、文献信息源 B、口头信息源 C、生物信息源 D、实物信息源 2、文献是记录有知识的( A )。 A、载体 B、纸张 C、光盘 D、磁盘 3、下列哪种文献属于一次文献( A )。 A、期刊论文 B、百科全书 C、综述 D、文摘 4、下列哪种文献属于二次文献( D )。 A、专利文献 B、学位论文 C、会议文献 D、目录 5、下列哪种文献属于三次文献( C )。 A、标准文献 B、学位论文 C、综述 D、文摘 6、下列选项中属于连续出版物类型的选项有( A )。 A、人民日报 B、学位论文 C、科技期刊 D、会议文献 7、下列选项中属于特种文献类型的有( A )。 A、学位论文 B、图书 C、科技期刊 D、标准文献 8、纸质信息源的载体是( D) A、光盘 B、缩微平片 C、感光材料 D、纸张 9、《中国图书分类法》(简称《中图法》)将图书分成( A ) A 5大部分22个大类 B 5大部分26个大类 C 6大部分22个大类 D 6大部分26个大类 10、《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在( A )类目下查找。 A、S类目 B、Q类目 C、T 类目 D、R类目 11、使用逻辑“与”是为了( B) A、提高查全率 B、提高查准率 C、减少漏检率 D、提高利用率 12、使用逻辑“或”是为了( A ) A、提高查全率 B、提高查准率 C、缩小检索范围 D、提高利用率 13、利用文献末尾所附参考文献进行检索的方法是(C) A、倒查法 B、顺查法 C、引文追溯法 D、抽查法 14、至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合,称为( A )。 A、数据库 B、记录 C、字段 D、文档 15、广义的信息检索包含两个过程( B ) A、检索与利用 B、存储与检索 C、存储与利用 D、检索与报道 16、要查找李平老师所发表的文章,首选途径为( A ) A、著者途径 B、分类途径 C、主题途径 D、刊名途径 17、狭义的专利文献是指( C ) A、专利公报 B、专利目录 C、专利说明书 D、专利索引 18、中国国家标准的代码是( A ) A、GB B、CB C、ZG D、CG 19、政府出版物主要包括两大类型的文献( B ) A、专利与标准 B、行政文件与科技文献 C、图书与期刊 D、档案与标准 20、ISBN是( B )的缩写

相关主题
文本预览
相关文档 最新文档