1-1信息检索基础知识
- 格式:ppt
- 大小:788.00 KB
- 文档页数:57
第1章信息资源检索基础知识第一部分选择题一、单项选择题。
在每小题列出的备选项中只有一项是最符合题目要求的,请将其选出。
1.文献的三个基本属性是知识性、物质性和(D)A.符号性B.交流性C.传递性D.记录性2.在信息概念的诸多层次中,最重要的两个层次是从客体出发的本体论层次和从主体出发的(B)A.客观论层次B.认识论层次C.主观论层次3.通常依据信息表达形式和所依附的载体将信息资源分为口语信息资源、体语信息资源、文献信息资源和(A)A.实物信息资源B.记录型信息资源C.多媒体信息资源D.样本信息资源4.一般是以纸张为存储载体,以印刷技术为主要记录手段,如油印、胶印、复印、激光打印等的文献信息资源是(D)A.书写型信息资源B.记录型信息资源C.声像型信息资源D.印刷型信息资源5.属于一次信息资源的是( A )A.期刊论文B.百科全书C.综述D.文摘6.文献检索工具可以进一步细分为四种检索工具:目录、文摘、索引和 ( B )A.书目B.题录C.摘要D.年鉴7.在布尔检索法中,“A or B”表示査找出( C )A.含有检索词 A同时含有检索词 B的文献B.含有检索词 A而不含检索词 B的文献C.含有 A、B之一或同时包含 AB两词的文献D.含有检索词 B而不含检索词 A的文献8.使用国家图书馆的高级检索方式,检索式“主题=(民用飞机)”的含义是(A)A.检索主题词字段含有民用飞机的记录B.检索作者字段含有民用飞机的记录C.检索标题字段含有民用飞机的记录D.检索关键词字段含有民用飞机的记录9.以刊载新闻为主的出版周期最短的定期连续性出版物是(B)A.图书B.报纸C.期刊D.会议论文10.用来组配检索词的并列关系的组配运算符是(A)A.逻辑“与”B.逻辑“或”C.逻辑“非”D.以上均不是11.以磁性材料为载体,以磁录技术为主要记录手段而形成的,如磁带、磁盘、光盘等的文献信息资源是( C )A.多媒体信息资源B.记录型信息资源C.声像型信息资源D.机读型信息资源12.二次检索指的是(C )A.第二次检索B.检索了一次之后,结果不满意,再检索一次C.在上一次检索的结果集上进行优化的检索D.与上一次检索的结果进行对比,得到的检索13.检索语言中,用未经规范化处理的自然语言词汇表达的是( D )A.标题词B.主题词C.叙词D.关键词14.检索有关“飞机”、“车辆”、“轮船”等文献,从理论上说主题词应该是( D )A.“飞机”、“车辆”、“轮船”任意一个B.“交通工具”C.“飞机”、“车辆”、“轮船”三者D.这三个词的任意一个加上“交通工具”15.位置检索主要有词位置检索、同字段检索和 ( A )A.同句检索B.F算符检索C.L算符检索D.X算符检索16.没有经过规范化处理的自然语言,通常从文献的题名、摘要或正文中直接抽取出来,能够揭示信息内容特征的具有检索意义的词汇是 ( A )A.关键词B.叙词C.单元词D.标题词17.由政府部门及其所设立的专门机构发布、出版的文献信息资料是 ( B )A.档案文献B.政府出版物C.标准文献D.科技报告18.只检索最新的信息,检索的时间跨度小,非常适合于信息跟踪,便于及时了解有关主题领域的最新发展动态的检索是 ( B )A.回溯检索B.定题检索C.计算机检索D.事实检索19.检索效果是指检索服务的有效程度,其中由检索系统完成其功能的能力确定,主要表征检索系统的性能和服务质量的是 ( C )A.服务效果B.经济效果C.技术效果D.功能效果20.对于信息检索用户来说,影响查全率和查准率的因素中不包括( D )A.检索词使用不当B.检索系统选择不恰当C.检索课题要求不明确D.检索系统内信息存储不全面21.能够反映事物之间的相关和从属派生等关系,便于用户按学科门类进行族性检索的检索语言是 ( D )A.主题语言B.代码语言C.引文语言D.分类语言23.在检索时如果检索工具不全或者检索系统收录内容不完整,为了扩大信息线索,此时可以借助于(D)A.顺查法B.倒查法C.抽查法D.回溯法24.按照标引的工作方式分类,标引可以分为人工标引、计算机辅助标引和(A)。
1.什么是信息检索?从广义的角度讲,信息检索包含信息存储和信息获取两个过程。
信息存储指通过对大量无序信息的选择和收集、著录和标引等方法,建成各种各样的信息检索工具或信息检索系统,使之成为有序化信息集合的过程。
获取是存储的逆过程,其实质是根据特定的需求,运用以组织好的检索系统,将特定的信息查找出来。
存储是获取的前提和基础,没有存储就没有获取,而获取是存储的目的,二者密切联系,互相依存,缺一不可。
狭义的信息检索是指广义的信息检索的后一个过程,即信息获取的过程,相当于人们所说的信息查检等。
具体来说,狭义的信息检索指通过一定的方法,从已存储的信息中检索出与用户提问相关的文献、数据和事实的过程,即根据用户的特定要求查找所需信息的过程。
2.信息检索效果的评价指标有哪些?(1)检索效果有效性评价,即检索技术效果的评价,是对检索系统满足检索要求的有效程度的评价,主要以查全率和查准率为评价标准。
(2)检索系统使用的评价,包括系统对用户是否需要,是否实用有多大的实用效果,即检索的社会效果的评价,需要应用社会学方法。
(3)检索费用——效率评价,即检索的经济效果的评价,包括检索系统完成检索服务的成本及时间消耗,需要应用经济学方法。
评价信息检索效果的指标主要有6个:收录范围、查全率、查准率、响应时间、用户负担和输出形式。
附:查全率=【检出相关文献信息量/检索系统中相关文献信息总量】*100%=(a/a+c)*100%查准率=【检出相关文献信息量/检出文献信息总量】*100%=(a/a+b)*100%漏检率=【漏检相关文献信息量/检索系统中相关文献信息总量】*100%=(c/a+c)*100%误检率=【误检文献信息量/检出文献信息总量】*100%=(b/a+b)*100% 3.什么是检索语言?检索语言的实质是用于表达一系列概括文献信息内容的概念及其相互关系的概念标识系统。
它可以是从自然语言中精选出来并加以规范化的一套词汇,可以是代表某种分类体系的一套分类号码,也可以是代表某一类事物的某一方面特征的一套代码(如化合物的各种代码),用于对文献内容进行主题标引、特征描述或逻辑分类。
一、单项选择题∙1、未经出版发行的或者没有进入社会交流的最原始的文献称为()∙ A 一次文献 B 二次文献 C 三次文献 D 零次文献∙2、利用文献后面所附的参考文献进行检索的方法称为( )。
∙ A 追溯法 B 直接法 C 抽查法 D 综合法∙3、根据叙词的定义,在下面一组概念中,应将( )选作叙词。
∙ A 脚踏车 B 自行车 C 单车 D 坤车∙4、EBSCO和百度的图片搜索数据库属于( )数据库。
∙ A 文字型 B 数值型 C 文字+数值型 D 多媒体型∙5、若想排除某概念,以缩小检索范围,可使用( )算符。
∙ A 逻辑“与” B 逻辑“非” C 逻辑“或” D 位置∙6、下面不是布尔逻辑算符的是∙ A NOT B 0R C AND D NEAR∙7、下列不是特种文献的有∙ A 专利文献 B 学位论文 C 政府出版物 D 电子图书∙8、以下检索算符中,能够相对实现"扩检”功能的是:∙ A and B (W) C ? D “ ”∙9、利用baidu搜索信息时,要将检索范围限制在网页标题中,应该使用的语法是:∙ A site: B intitle: C inurl: D info:∙10、已知下列书目信息:“陈享光著.货币经济学导论.北京:经济科学出版社,2000年7月,4-11”通过使用( )可以获取其原文的图书馆收藏信息。
∙ A 中国学术期刊全文数据库 B OPAC书目信息数据库 C 电子图书全文数据库 D 中文期刊目录∙11、当选用泛指的检索词或增加与检索主题概念相关的检索词并用逻辑“或”进行组配时,()就较高。
∙ A 查准率 B 查全率 C 漏检率 D 误检率∙12、布尔逻辑()是用于从某一检索范围中排除不需要的概念。
∙ A 与 B 或 C 非 D∙13、根据布拉德福文献分散定律,阅读( )文献是一种有效的情报获取方法。
∙ A 相关期刊 B 边缘期刊 C 核心期刊 D 以上三项∙14、竞争情报的内容主要有()∙ A 知已、知彼、知环境 B 全面了解本企业 C 充分了解企业的竞争对手情况 D 了解国家各项政策信息二、多项项选择题∙1、概念( )之间属于上下位关系。
信息检索1.信息检索的概念。
狭义信息检索是指用户找出有关信息的过程。
广义信息检索是将信息按照一定的方式组织和存储起来,并根据用户的需求找出有关信息的过程。
2. 信息检索的类型(1)按照检索对象的不同划分早期分为:文献检索、事实检索、数据检索。
当前三分方法:文本检索、音频与视频检索、数值检索。
(2)按检索手段划分:手工检索、机器检索3.简述信息检索的基本原理信息检索的基本原理:对信息集合与需求集合的匹配与选择。
实现信息检索,主要涉及三个关键要素:信息集合、用户信息需求、匹配选择。
一、信息集合:信息集合是指有关某一领域的,经采集、加工的信息集合体。
二、需求集合:用户的信息需求是在社会实践活动中产生的。
当人们在完成某一任务或工作时,经常觉得缺少某些知识,这就产生了信息需求。
三、选择与匹配:要在信息集合中快速获取用户所需信息,需要信息检索提供一种匹配机制,能够把需求集合与信息集合依据某种相似性标准进行比较与判断,进而选择出符合用户需要的信息。
匹配机制至少包括两个要素:第一是匹配标准,即相似性标准;第二是执行匹配的动因。
4.计算机信息检索经历了脱机检索阶段、联机检索阶段、光盘检索阶段、网络检索阶段。
5.信息检索领域的主要研究问题有哪些?⑴信息检索理论:检索语言、检索模型、标引理论、相关性理论、知识组织与表示理论⑵信息检索工具/系统:信息检索系统的结构、功能、设计开发、管理运营、应用评价等⑶信息资源及其收集、加工:信息存储、数据库⑷检索技术与方法:文本检索技术、数值检索技术、音频与视频检索技术、网络搜索技术⑸用户研究与检索策略:用户的查询心理、检索需求及其类型、用户查询信息的行为特征等、用户信息需求分析、检索式构造、相关反馈方法、检索过程调整与控制等⑹其他密切相关的自动化处理技术:自动聚类与分类、自动摘要、信息可视化、信息过滤、信息提取、机器翻译、人机交互等。
信息检索的两种研究方式:以计算机为中心和以用户为中心,以计算机为中心的IR问题是主流。