文献检索,信息检索(5)第5章(搜索引擎)
- 格式:ppt
- 大小:2.41 MB
- 文档页数:61
信息检索与搜索引擎信息检索是指通过计算机技术来获取符合用户需求的信息的过程。
而搜索引擎作为信息检索的重要工具,能够帮助用户快速、准确地找到所需的信息。
本文将从信息检索的概念、搜索引擎的分类及工作原理等方面进行探讨。
概念解析信息检索是现代信息技术的重要组成部分,它广泛应用于各个领域,包括文献检索、互联网搜索、数据挖掘等。
它的目标是从大量的存储介质(如文件、数据库)中检索出与用户需求最相关的信息,以满足用户的信息需求。
搜索引擎是信息检索的一种应用形式,它通过索引和搜索算法,将互联网上的信息整理、分类,并根据用户输入的关键词,提供相关的搜索结果。
搜索引擎以其高效、准确的特点在互联网时代得到了广泛应用。
搜索引擎的分类根据搜索引擎的不同特点和功能,可以将其分为如下几类:1.通用搜索引擎:通用搜索引擎是指对互联网上的综合信息进行搜索,并提供与搜索内容相关的各种信息资源,如Google、百度等。
这类搜索引擎具有较好的适应性和广泛的应用范围。
2.垂直搜索引擎:垂直搜索引擎是指针对特定领域或行业的信息进行搜索的引擎。
比如,携程旅行网是面向旅游领域的垂直搜索引擎,专门提供与旅游相关的信息资源。
垂直搜索引擎在特定行业中能够提供更专业、更精准的搜索结果。
3.学术搜索引擎:学术搜索引擎主要用于学术研究领域,提供与学术论文、学术期刊等相关的搜索结果。
如Google学术、万方等。
学术搜索引擎为学术研究人员提供了方便、快捷的信息检索工具。
搜索引擎的工作原理搜索引擎的工作原理可以大致分为下面几个步骤:1.爬取和索引:搜索引擎会通过网络爬虫爬取互联网上的网页,并建立起一个庞大的网页索引库。
爬虫会按照一定的规则,将网页的内容、链接等信息收集起来。
2.分析和识别:搜索引擎对这些爬取到的网页进行分析,识别其中的关键词、链接、标题等信息。
通过对网页的结构和内容进行分析,搜索引擎能够更好地理解网页的含义和关联。
3.查询处理:当用户输入关键词进行查询时,搜索引擎会根据用户输入的内容,在索引库中找到与之相关的网页。
第1章文献信息基础知识1.1 文献信息的概念1.1.1 文献的概念(1)定义:文献是记录有知识的一切物质载体。
(2)文献三要素:知识、载体和记录。
知识决定文献的内容,载体决定文献的形态,记录则是构成文献的手段。
(3)记录内容:古今中外、历史地理、科学发明等。
(4)记录载体:甲骨、青铜器、纸介型、胶片、磁带、磁盘、光盘等。
(5)记录手段:刻、写、录等。
文献承担汇集和传承人类文化知识的重任,在信息时代的今天,更成为人类社会不可或缺的重要资源1.1.2 信息的概念定义:生物以及具有自动控制系统的机器,通过感觉器官和相应的设备与外界进行交换的一切内容。
信息的属性:普遍性。
传递性:寄载性:时效性:共享性:信息:自然信息和人工信息信息无处不在,它普遍存在于自然界、生物界和人类社会中。
人们正是通过接收来自自然界、生物界和人类社会的不同信息来区别各种事物,从而认识世界和改造世界的。
1.1.3信息、知识、情报、文献的关系信息、文献还与知识、情报有着极其密切的关系,它们之间有交叉重复但又彼此不同。
1.知识知识是人类社会实践经验的总结,是人类在认识和改造世界的社会实践中获得的对事物本身的认识。
是人的主观世界对客观世界的概括和如实反映,是人的大脑通过思维对客观事物本质与规律的认识和掌握,是对信息的认识、理解和升华,是系统化、精炼化的信息。
2.情报(Information)情报与信息在英文中为同一个词,但信息的外延比情报广,信息包括情报。
情报就是人们在一定时间内为一定目的而传递、收集的有使用价值的知识或信息,或者说是传递中的有用的知识或信息。
3.信息、知识、文献和情报的关系归纳为:信息是事物运动的状态和方式及其反映;知识是人类通过信息对自然界、人类社会以及思维方式与运动规律的认识,是人的大脑通过思维重新组合的系统化的信息;情报是对用户有用的知识信息;文献是记录有知识的载体,也是信息和情报的载体。
1.2 信息资源的分类1.2.1 信息资源的分类1.2.2 文献信息资源文献信息资源是指以文献为载体的信息资源,随着现代信息技术的发展,文献信息资源从载体、加工到内容形式都发生了很大的变化,这些可以从文献信息的各种分类形式上得到体现。
第一章(共58題)1.下列哪项工具书不是资料性工具书()。
DA.类书 B.百科全书 C.年鉴 D.索引2.下列哪项工具书是资料性工具书()。
CA.字典 B.书目 C.年鉴 D.索引3.检索工具的特点是()。
CA.完整性、分散性、查考性 B.综合性、参考性、易检性C.完整性、易检性、查考性 D.易检性、综合性、分散性4.下列哪项不是印刷版工具书的排检方法()。
BA.部首法 B.检索词 C.拼音法 D.笔画笔形法5.高级检索不包括的检索技术是()。
CA.截词检索 B.布尔逻辑检索 C.嵌入检索 D.位置检索6.布尔逻辑运算符中表示逻辑“与”的符号是()。
CA.+ B.- C. * D./7. 布尔逻辑运算符中表示逻辑“或”的符号是()。
AA.+ B.- C. * D./8. 布尔逻辑运算符中表示逻辑“非”的符号是()。
BA.+ B.- C. * D./9.高级检索的检索特点是()。
DA.组配检索、清晰检索、限定检索 B.清晰检索、限定检索、模糊检索C.组配检索、清晰检索、模糊检索 D.组配检索、模糊检索、限定检索10.“中国大学”这个检索词中,中间共嵌入了几个检索词()。
AA.3个 B.6个 C.9个 D.不确定11.WWW检索工具,主要检索WWW站点上的资源,通常称为搜索引擎,常用的搜索引擎有很多,下列哪个不是搜索引擎的网址()。
DA. B.C. D.12. 信息检索中的检索词可分为四类,下列哪一项不属于检索词的分类()。
DA.表示主题的检索词 B.表示作者的检索词C.表示分类的检索词 D.表示数据的检索词13.手册的基本特点是()。
DA.侧重揭示文献内部特征B.内容新颖,连续出版C.著录内容标明出处D.所收资料侧重基础知识,注重实用性14书目数据库主要提供的是()BA.一次文献B.二次文献C.三次文献D.零次文献15.索引数据库主要提供的是()BA.一次文献B.二次文献C.三次文献D.零次文献16.被称为“检索性文献”的文献是()BA.一次文献B.二次文献C.三次文献D.零次文献17.被称为“线索性文献”的文献是()BA.一次文献B.二次文献C.三次文献D.零次文献18.综述主要提供的是()CA.一次文献B.二次文献C.三次文献D.零次文献19.述评主要提供的是()CA.一次文献B.二次文献C.三次文献D.零次文献20.一次文献具有的特点是()AA.原创性 B.检索性 C.综合性 D.参考性21.二次文献具有的特点是()BA.原创性 B.检索性 C.综合性 D.参考性22.三次文献具有的特点是()DA.原创性 B.检索性 C.分散性 D.参考性23.被称为“参考性文献”的文献是()CA.一次文献B.二次文献C.三次文献D.零次文献24.被称为“研究文献的文献”的是()CA.一次文献B.二次文献C.三次文献D.零次文献25.被称为“原始文献”的文献是()AA.一次文献B.二次文献C.三次文献D.零次文献26.被称为“第一手资料”的文献是()AA.一次文献B.二次文献C.三次文献D.零次文献27.下列哪项是年鉴的基本特征:()BA.揭示文献内容出处B.连续出版C.以编年形式D.提供形象化资料28.供寻检、征引、辑佚历史文献之用的资料工具书称为()。
《文献信息检索》习题答案一、单选题1、文献是记录有知识的(A)A.载体 B.纸张 C.光盘 D.磁盘2、如果需要检索某位作者的文献被引用的情况,应该使用(C)检索。
A.分类索引 B.作者索引 C.引文索引 D.主题索引3、下列哪种文献属于二次文献( D.)A.专利文献 B。
学位论文 C。
会议文献 D。
目录4、纸质信息源的载体是(D)A.光盘 B。
缩微平片 C。
感光材料 D.纸张5、《中国图书馆分类法》(简称《中图法》)将图书分成( A。
)A.5大部分22个大类 B。
5大部分26个大类C.6大部分22个大类D.6大部分26个大类6、利用文献末尾所附参考文献进行检索的方法是(C)A.倒查法B.顺查法 C。
引文追溯法 D.抽查法7、广义的信息检索包含两个过程(B)A。
检索与利用 B.存储与检索 C。
存储与利用 D.检索与报道8、中国国家标准的代码是(A)A.GB。
B.CB. C。
ZG D.CG9、( D )是报道文献出版或收藏信息为主要功能的工具。
A。
题录 B。
索引 C。
文摘 D。
目录10、逻辑运算符包括(D)A.逻辑与 B。
逻辑或 C。
逻辑非 D。
A,B和C11、记录是对某一实体的全部属性进行描述的结果,在全文数据库中一条记录相当于(C),在书目数据库中,一条记录相当于()A。
一条文摘,一篇完整的文献 B。
一条文摘,一条题录C.一篇完整的文献,一条题录或文摘 D。
一条题录,一条文摘12、《中国学术期刊全文数据库》提供的文献内容特征检索途径有(B)A.机构 B。
篇名/关键词/摘要 C.中文刊名 D.作者13、根据反映新内容的程度从大到小,下列文献类型的排序正确的是:(A)A.会议论文,科技期刊,科技报告,科技图书B.科技图书,科技期刊,科技报告,会议论文C.科技报告,会议论文,科技图书,科技期刊D.以上都不对14、《中国科研机构数据库》、《中国科技名人数据库》属于:(B)A。
书目数据库B.指南数据库C。
国家开放大学电大本科《文献检索》2023期末试题及答案(试卷号:1133)国家开放大学电大本科《文献检索》2023期末试题及答案(试卷号:1133)一、单项选择题(每小题2分,共30分,每小题仅有一项答案正确,请将正确答案的序号填在括号内)1.以下对“知识”描述错误的是()。
A.是人的大脑通过思维重新组合的系统化的信息集合B.信息是知识的源泉和基础,知识是信息的升华C.知识是“熵”D.是系统化、理论化的信息2.以下文献类型哪项为三次文献?( ) A.指南B.会议录C.目录D.专利说明书3.在计算机信息检索中,提高查准率的措施不包括()。
A.减少同义词或同类相关词B.降低检索词的专指度C.增加限制概念,用逻辑“与”(and)将它们连接起来, D.使用适当的位置算符4.叙词语言与单元词语言的区别是( )。
A.前者为规范性先组式语言,后者为规范性后组式语言B.前者为规范性后组式语言,后者为规范性先组式语言C.前者为规范语言,后者为自然语言D.前者为概念组配,后者为字面组配5.检索语言中的标题词语言是一种( ) 。
A.先组式规范语言B.后组式规范语言C.非规范语言D.自然语言 6.使用《中文科技资料目录》(医药卫生)检索“肿瘤患者伴发疲劳综合症”的文献时,首先选择的检索途径应为()。
A.号码途径B.著者途径C.分类途径D.主题途径 7.目前世界上生物医学方面最著名的四大检索刊为()。
A.IM、CA、EM和SAB.IM、EM、SCI和EIC.IM、BA、CA和EMD.IM、BA、SCI和EI8.截词算符可使多个词根一致的检索词之间实现( ) 运算。
A.逻辑“与”B.逻辑“或”C.逻辑“非”D.以上都不对 9.国际专利分类法每隔一段时间会再版- -次,到1974年为第几版? ( ) A.第二版 B.第三版 C.第四版 D.第五版10.中国专利号“CN1050324A”编号中的英文字母A表示( )。
A.实用新型专利申请公告B.发明专利申请审定C.发明专利申请公开 D.外观设计专利申请公告11.在MEDLINE数据库检索中,以下检索表达式书写错误的是( )。