当前位置:文档之家› 信息检索期末考试复习要点

信息检索期末考试复习要点

信息检索期末考试复习要点

一.

1。(理解)信息:信息是客观事物经过感知或认识后的再现。

(理解)知识:知识是人们通过实践对客观事物及其运动过程和规律的认识.

(理解)文献:文献是记录有知识的一切载体。知识、载体和记录是构成文献的三个基本要素。

2.(记忆)信息资源的概念:信息资源是经过人类筛选、组织、加工,并可以存取和能够满足人类需求的各种媒介信息的集合。

3。(理解)图书:图书是作者围绕一个中心主题进行研究和探讨,比较成熟的定型的而不定期出版的出版物。

(记忆)连续出版物:连续出版物是一种具有统一名称、固定版式、统一开本、连续编号,汇集多位著者的多篇著述,定期不定期编辑发行的出版物.

(记忆)学位论文:是大学生或研究生为取得学位资格而提交的学术论文。

(记忆)会议文献:会议文献主要是指在国内外各类会议上宣读或交流的论文、报告或其他有关资料。

(记忆)专利文献:专利文献是实行专利制度的国家和地区及国际性专利组织在审批专利过程中产生的官方文件及其出版物的总称。

(记忆)标准文献:标准是为了在一定范围内获得最佳秩序,经协商一致制定并由公认机构批准,共同使用和重复使用的一种规范性文件。

(理解)科技报告:科技报告是各学术团体、科研机构、大学研究所等单位或个人向上级或委托单位撰写的关于某个科学研究成果的研究报告及其研究过程中的记录。

(理解)政府出版物:政府出版物是由国际组织(如联合国、世界贸易组织等)和各国中央政府及地方政府及其所属机构发表、出版的各种文献信息资料.

(理解)档案文献:档案文献是指国家机关、社会组织以及个人在社会活动和技术活动中,直接形成的具有保存价值和利用价值的文字、图片、声像等不同形式的历史记录。

(不是记忆的内容,但也不清楚要不要理解。.)产品样本:产品样本是国内外生产厂商或经销商为推销产品而印发的企业出版物。

4.(理解)一次文献信息:一次文献信息:依据作者本人的研究或研制成果创作的文献。

(理解)二次文献信息:二次文献信息:按一定的方法对一次文献进行整理加工,以使之有序化而形成的文献。

(理解)三次文献信息:又称参考性文献信息,它是在一、二次文献信息的基础上,经过综合、分析、研究等深度加工后而形成的再生文献信息.

5。(记忆)信息素质的含义:利用大量的信息工具及主要信息源使问题得到解答的技术和技能。

信息素质的内涵:(理解)信息意识;(记忆)信息能力:信息需求分析和表达能力,信息获取能力,信息分析和处理能力,信息利用能力;(理解)信息道德

6.(理解)图书馆类型:(1)国家图书馆(2)公共图书馆(3)高校图书馆(4)专业图书馆(5)其他图书馆

(理解)图书馆服务:(1)图书借阅(2)馆际互借(3)参考咨询(4)读者培训(5)图书馆服务现代化

7.(记忆)Internet应用:(1)信息获取(2)交流沟通(3)网络娱乐(4)商务交易

8.(非记忆非理解,应用)搜索引擎:(1)Google(2)百度(3)腾讯SOSO(4)新浪爱问(5)搜狐搜狗(6)网易有道

二.

1。(记忆)信息检索的含义(广):是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,全称“信息的存储与检索"。

(理解)信息存储过程:信息选择、信息著录、信息标引、信息整序

(记忆)信息检索过程:(1)分析检索需求;(2)确定检索标示;(3)选择检索系统和检索工具;(4)实施检索操作;(5)索取原始文献.

(记忆)按检索对象内容划分的信息检索类型:文献检索,数据检索,事实检索,多媒体检索

2.信息检索发展历史:(1)手工信息检索,(2)(理解)单机信息检索:使用一台计算机即可完成检索操作,无需连接其他计算机,是计算机检索的最初形式。(3)联机信息检索:(理解)代表:DIALOG检索系统。(4)网络信息检索(5)发展趋势:信息检索智能化,信息检索可视化,信息检索个性化

3.(记忆)分类检索语言含义:分类语言是一种按学科范畴和体系来划分事物的语言,它是以数字、字母符号对类目进行标识的一种语言体系,也称分类法。主要包括体系分类语言和组配分类语言两种。

(理解)国内外著名分类语言:《中国图书馆分类法》《中国科学院图书馆图书分类法》《中国人民大学图书馆图书分类法》《Dewey Decimal Classification System》《Library of Congress Classification》《Universal Decimal

Classification》《冒号分类法》《中国档案分类法》《国际专利分类法》《国际标准分类法》和《中国标准文献分类法》

(记忆)主题词检索语言概述:主题检索语言是指描述文献主题的语词标识并按字顺序列排检的检索语言。类型:标题词语言、单元词语言、叙词语言、关键词语言

(记忆)标题词语言:标题词语言是用规范化的自然语言词做标题,直接表达文献主题概念,按照标题字顺排列,并用参照系统显示标题之间关系的一种主题法。

(记忆)叙词语言:又称主题词语言,是以表达文献主题内容的概念单元为基础,经过规范化处理,可以进行逻辑组配的一种主题语言。

(记忆)自然语言:自然语言指直接取自文献本身,不经过加工和规范的语言。P72

4。(理解)信息检索技术:一,布尔逻辑检索,基础是布尔逻辑算符.二,截词检索.三,(记忆)位置检索(理解记忆4个):(1)(W)—With (W)表示在此算符两侧的检索词必须按此前后的顺序排列,顺序不许颠倒,而且两个检索词之间不许有其他的词或字母,但允许有空格和标点符号。如,information(W)retrieval可检索出information retrieval,information—retrieval。

(2)(nW)—nWord (nW)表示在此算符两侧的检索词之间允许插入n个(最大数量)实词或虚词(非用词),两个检索词的词序不能颠倒。例如,electronic(1W)resources,可检索出electronic resources,electronic information resources。

(3)(N)__Near 由(N)连接的检索项在记录中出现的顺序可以调换,即查找两个连在一起的单词. 例如,junior(N)high 可检索出junior high, high junior.

(4)(nN)__nNear (nN)表示两个词位置可以颠倒,两个词间插入词的最多数目是n个. 例如,information

(3N)retrieval,可检索出information retrieval, retrieval information,retrieval of information,retrieval of law information,retrieval of Chinese law information等,information和retrieval两个词之间最多可插入3个词.四,限制检索。五,短语检索。六,自然语言检索。七,模糊检索

5。(记忆)查全率:检出的符合要求的相关文献占全部相关文献的比例.

(记忆)查准率:检出的符合条件的相关文献占检出的全部文献的比例。

(记忆)检索策略是为实现检索目标而制定的全盘计划和方案,是对整个检索过程的谋划和指导。

三,

1。(记忆)检索工具的含义:检索工具是指用以存储、报道和为查找信息线索提供依据的工具。

(记忆)检索工具的特点:(1)、在内容上具有完整性;(2)、在编排方法上具有易检性;(3)、在目的功用上具有查考性.

2。(记忆)书目含义:是对文献信息进行著录并按照一定的次序编排而成的一种揭示与报道文献的工具

(记忆)索引含义:索引将书刊内容中所论及的篇名、语词、主题等具有检索意义的项目分别摘录出来,注明出处,按照一定的方法加以编制,供人查考的检索工具

(记忆)世界著名引文索引(1955年美国费城科学信息研究所ISI研制开发):SCI-科学引文索引.“越查越旧,越查越新,越查越深"。科学引文索引建立的宗旨;SSCI-社会科学引文索引;A&HCI-艺术与人文科学引文索引。

(记忆)文摘:文摘是以简明扼要的文字摘述文献的主要内容,注明出处,并按一定方法给予编排,以供人们查阅的兼有报道作用的文献检索工具。

3.(理解)参考型检索工具:(1)查字释义(2)查询事项(3)查询人物(4)查询地理(5)查询数据(6)引导用户读书治学

(记忆)参考性索引工具特点:(1)、内容的权威性。(2)、信息的密集性。(3)、条目的简明性。(4)、编排的特殊性(形序、音序、时序、地序等)。

(记忆)《说文解字》:东汉中期著名学者许慎编纂.我国历史上第一部系统地分析字形、解释字义的字书;《康熙字典》:中国古代字书发展史上第一部明确以“字典”命名的字书,是中国古代字典的代表作。

4.(记忆)类书含义:类书是采辑古籍中的片段或整篇资料,按类别或韵目加以编排,以供寻检、征引古代文献之用的工具书。

特点:(1)在分类体系中陈列记录已有知识的资料(2)“分类”和“陈列",是中国古代类书的核心要义(3)“区分胪列,靡所不载"(4)“事以类聚,事类相从”

功用:(1)系统收集参考资料(2)查考语词和典故出处(3)校勘考证古籍,辑录古籍佚文

5。(记忆)政书含义:是主要记载典章制度沿革变化及政治、经济、文化发展状况的史书。

“十通":《通典》、《通志》、《文献通考》、《续通典》、《续通志》、《续文献通考》《清朝通典》、《清朝通志》、《清朝文献通考》、《清朝续文献通考》

6.(记忆)年鉴含义:年鉴是系统汇集上一年度内重要事件、学科进展及各项统计资料,逐年编辑、连续出版的以供人查阅利用的参考工具书。

功能:(1)提供时事动态消息(2)提供各学科研究信息(3)提供统计数据资料(4)提供实用的指南性资料(5)提供综述及回溯性资料(6)提供书刊论文线索

7。(记忆)百科全书含义:是汇总、浓缩人类所有知识门类或某一知识门类全部知识的大型参考工具书

特点:(1)概述知识条目化(2)条目编排词典化

8.(记忆)表谱含义:表谱是查考历史大事、历史年月日与人物生卒以及官职、地域沿革的参考工具书。它包括年表、历表和专门性表谱.

四,

1.(记忆)善本:宋明时期,一般把精加校勘的书本称为善本。具有历史文物性,学术资料性,艺术代表性的原则

(理解)四库全书:经史子集

(记忆)十三经:《周易》、《诗经》、《尚书》、《周礼》、《仪礼》、《礼记》、《春秋左传》、《春秋公羊传》、《春秋谷梁传》、《论语》、《孟子》、《尔雅》、《孝经》

(理解)近代以来图书内容的变化:译书:1895年之前,译书集中在与制船造炮等近代工业有关的声光电化方面。1895年之后,译书的重点转向了社会科学,特别是有关西方的政治制度、社会学说、经济法律等方面.

(记忆)电子图书:电子图书(e-book)是指利用计算机阅读平台或手持阅读设备阅读的数字化图书。

(记忆)数字图书馆:数字图书馆是以统一的标准和规范为基础,以数字化的各种信息为底层,以分布式海量资源库群为支撑,以职能检索技术为手段,以宽带高速网络为传输渠道的,将丰富多彩的知识领域信息传递到千家万户的虚拟图书馆。

五,

1.(记忆)核心期刊:核心期刊,指那些信息密度大,文载率、引文率及利用率相对较高,代表该学科现有水平和发展方向的期刊。

(记忆)数据库:数据库是指经系统或有序的安排,并可通过电子或其他手段单独加以访问的独立的作品、数据或其他材料的集合。(《欧盟版权指令》)。类型包括:(1)文献型数据库(2)事实型数据库(3)数据型数据库

(记忆)中文期刊类型(按时间分):可将杂志分为周刊、半月刊、月刊、双月刊、季刊、半年刊、年刊等。

2。(记忆)引文索引:反映文献之间引用和被引用关系及规律的一种新型的索引工具。其作用:(1)通过文献间的引用和被引用关系,了解某一学术问题或观点的起源、发展、修正及最新的研究进展。(2)评价科学文献、学术期刊和专著的学术水平的参考工具。(3)作为科研机构和科研人员绩效评价的参考工具。

(4)作为文献检索的一种工具。

(记忆)CSSCI检索途径:主要从来源文献和被引文献两个方面向用户提供信息。来源文献检索:其检索途径有:作者、篇名(词)、关键词、作者机构、作者地区、期刊名称、学科类别、学位分类、中图分类、基金项目以及年代卷期等10余项。被引文献检索:其检索途径有:被引文献作者、篇名或书名(词)、被引文献期刊、出版社、年代和被引文献细节等。大多数检索项本身可以实现逻辑式检索,各检索项之间也提供“与"、“或”关系的组配检索.

六,

1.(记忆)特种文献含义:特种文献是一种介于图书与期刊之间的似书非书、似刊非刊的文献类型,通常在出版发行方面或获取途径方面比较特殊,因而称为特种文献.

2.(记忆)会议文献含义:会议文献主要是指在国内外各类会议上宣读或交流的论文、报告或其他有关资料。

类型:(1)、按会议文献出版时间分为会前文献、会间文献和会后文献。(2)、按会议规模分为国际性会议文献、地区性会议文献、全国性会议文献、学会或协会会议文献等.(3)、按会议的内容性质分为常会文献、报告会文献,讨论会文献等。

特点:(1)、内容新颖丰富、学术水平高。(2)、信息传递及时、速度快。(3)、会议类型较多,命名复杂,文献分散.(4)、会议文献出版形式多样、出版发行灵活,通常多以书、期刊/不定期连续出版物和科技报告3种形式出版。

3.(记忆)专利文献含义:专利文献是实行专利制度的国家和地区及国际性专利组织在审批专利过程中产生的官方文件及其出版物的总称。

类型:(1)、发明专利文献(2)、实用新型专利文献(3)、外观设计专利文献

特点:(1)、资料新颖。(2)、内容广泛。(3)、实用性强.(4)、分类逐渐趋向统一,格式标准化。

《国际专利分类法》(IPC)1968年9月1日在国际范围生效,以后每5年修订一次,现在是第八版,2006年开始实施。IPC 按照技术主题来设立类目表。首先将与发明专利有关的全部技术领域划分为八个部,部号分别用大写英文字母A到H来表示。各部按等级形式再细分为大类、小类、主组、分组,形成五级分类的结构形式.

《IPC》由9个分册组成,1-8分册分别对应八个部,第9分册是《使用指南》。在《IPC》中,八个部分别是:A:生活必需;B:作业运输;C:化学与冶金;D:纺织与造纸;E:固定建筑物;F:机械工程;G:物理;H:电学

4(记忆)美国四大科技报告:(1)PB报告(2)AD报告(3)NASA报告(4)DOE报告。

《美国政府报告通报及索引》是用来检索美国四大科技报告的主要工具.

5。(记忆)标准的含义:标准是为了在一定范围内获得最佳秩序,经协商一致制定并由公认机构批准,共同使用和重复使用的一种规范性文件。

按标准制定的主体分为:国际标准,区域标准,国家标准,行业标准,地方标准,企业标准.按标准化对象的属性分:技术标准,管理标准,工作标准。按标准的成熟程度分:强制性标准,推荐性标准。

6。(理解)(一)国际、国外标准代号及编号

国际及国外标准号形式各异,但基本结构为标准代号+专业类号+顺序号+年代号。标准代号大多采用缩写字母,例如ISO8402:1987和ISO9000-1:1994分别是ISO标准的编号。

(二)我国标准代号及编码

编号由“标准代号+顺序号+制订(或修订)年份”三部分组成。

(1)、国家标准代号,有大写汉字拼音字母构成,强制性国家标准代号为GB,推荐性国家标准的代号为GB/T.

(2)、行业标准代号,汉语拼音大写字母组成,再加上斜线T组成推荐性行业标准,如XX/T。如教育行业标准(JY)、交通行业标准(JT).

(3)、地方标准代号,大写汉语拼音DB加上省、自治区、直辖市行政区划代码的前面两位数字(北京市11、天津市12、上海市13等),再加上斜线T组成推荐性地方标准,不加斜线T为强制性地方标准。

(4)、企业标准代号,汉字大写拼音字母Q加斜线再加企业代号组成(Q/XXX),企业代号可用大写拼音字母或阿拉伯数字或者两者兼用所组成。

7.(记忆)标准文献的检索途径与方法:分类途径,主题途径,号码途径.

七,

这部分主要是理解EI,SCI的范围,类型,内容,特点,产品还有SA的分辑(A辑:物理学文摘(PA)B辑:电气与电子学文摘(EEA)C辑:计算机和控制文摘(CCA)D辑:信息技术文摘(IT) E辑:生产和制造工程学文摘)。由于内容太乱且是理解内容,所以不整理了,望大家见谅.。。

八,

1。(记忆)网络信息资源的总结:

类型:(1)、政府信息(2)教育信息(3)科研信息(4)文化信息(5)休闲娱乐信息

特点:(1)数量巨大,增长迅速(2)内容丰富,形式多样(3)结构复杂,分布广泛(4)开放互动,共享性强(5)传播迅速,利用方便(6)更新速度快,动态性强(7)信息使用成本低(8)质量参差不齐,良莠不一(9)分散无序,缺乏管理(10)稳定性差,精确度低,缺乏安全保障

网络信息资源的评价(1)目的(purpose):服务性质、服务对象等.(2)范围(scope):覆盖的主题领域,所提供信息的广度、深度、时间范围以及所包括的网络信息资源的类型。 (3)内容(content):准确性、权威性、新颖性、独特性、费用等等。

2.(记忆)搜索引擎:

原理:信息搜集(搜索器);信息处理(索引器);信息查询(用户检索界面)

特点:支持全文检索,检索功能较为全面,检索方法多样,检索结果按相关性排序,查询速度快,维护更新及时,支持关键词检索和分类目录浏览查询

搜索引擎发展趋势:个性化;智能化;专业化;多媒体化;综合集成化;跨语言检索

九,

1.记忆学术论文的含义:学术论文也称科学论文、科研论文、研究论文,是对某一学科领域中的问题进行探讨、研究,

并将形成的科学研究成果进行系统表述的文章。

2.基本格式:

(1)前置部分(题名、署名、摘要、关键词、分类号、文献标识码等)

(2)主体部分(引言、本论、结论、附注、参考文献等)

(3)附录部分

(4)结尾部分

(完整版)信息检索期末复习题及答案

《信息检索》期末复习题及答案(仅供参考) 一、判断题 1.综述和百科全书属于二次文献。(× ) 2.从文献检索的角度来看,一次文献是检索对象,二次文献是检索手段。(× ) 3.题录、目录属于一次文献;期刊论文属于二次文献。(× ) 4.主题词规范化的目的是扩大检索范围。(√) 5.在众多的信息源中,期刊是最重要的信息源。(√ ) 6.核心期刊是指经常使用的期刊。(× ) 7.关键词和主题词都是表征文献实质性内容的词汇,前者是经过词表规范的,后者是未经词表规范的自由词。(×) 8.《中国图书分类法》(简称《中图法》)是由分类号(代码)和类名来揭示信息的主题概念。(×) 9.题录型的检索工具,其著录项目包括题目、作者、文献出处、文摘。() 10.一项发明创造要获得专利权必须具备新颖性、创造性和实用性。() 二、选择题 1、广义的信息检索包含两个过程( B ) A、检索与利用 B、存储与检索 C、存储与利用 D、检索与报道 2、文献是记录有知识的()。 A、载体 B、纸张 C、光盘 D、磁盘 3、下列哪种文献属于一次文献( A )。 A、期刊论文 B、百科全书 C、综述 D、文摘 4、下列哪种文献属于二次文献( D )。 A、专利文献 B、学位论文 C、会议文献 D、目录 5、下列哪种文献属于三次文献( C )。 A、标准文献 B、学位论文 C、综述 D、文摘 6、下列选项中属于连续出版物类型的选项有(C )。 A、人民日报 B、学位论文 C、科技期刊 D、会议文献 7、下列选项中属于特种文献类型的有( D )。 A、学位论文 B、图书 C、科技期刊 D、标准文献 8、纸质信息源的载体是() A、光盘 B、缩微平片 C、感光材料 D、纸张 9、《中国图书分类法》(简称《中图法》)将图书分成( A ) A、5大部分22个大类 B、5大部分26个大类 C、6大部分22个大类 D、6大部分26个大类 10、《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在( A )类目下查找。 A、S类目 B、Q类目 C、T 类目 D、R类目

信息检索复习资料

信息检索公选课复习资料 1.信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。 2.知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。 3.情报是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。 4.文献是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。 5.会议文献是指在国内外学术或非学术会议上发表的论文或报告。 6.学位论文是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。 7.著录是对文献内容和形式特征进行选择和记录的过程。 8.数据检索是指特定的数值型数据为对象的检索。 9.按信息的加工层次分类:(含义) 一次文献:原始文献,图书、报纸、期刊、会议纪录、专利报告等 二次文献:目录、题录、索引、文摘 三次文献:论文丛集、综述、年鉴百科全书一次信息资源 (原始文献):以作者本人在生产和科研中所取得的成果为依据而创作的原始文献所传递的信息资源。 二次信息资源(检索工具):将分散的、无组织的一次信息资源,按一定的原则加工、整理、简化、组织成为系统的、便于查找利用的信息资源。 三次信息资源(参考性文献):在合理利用二次信息资源的基础上,选用一次信息资源的内容,根据一定的需要、目的进行分析、综合或浓缩重组而得到的信息。 二次信息资源与三次信息资源的区别: 对象不同:二次信息资源以“篇”或“本”为单位进行加工;三次信息资源则归纳了较多的一次信息内容 用途不同:二次信息资源为检索一次信息的工具;三次信息资源能直接提供检索答案. 10. 在印刷型资源时代,事实与数据检索工具主要依靠各类参考工具书完成各种数据或事实

信息检索复习资料(有答案版)

1.请说明一次文献、二次文献和三次文献的特点和功用。 (1)一次文献(Primary Document):通常是指原始制作,即作者以本人的研究成果为基本素材而创作(或撰写)的文献。如期刊论文、科技报告、会议论文、 专利说明书 (2)二次文献(Secondary Document):是指文献情报工作者对一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作人 员编辑、出版和积累起来的工具性的文献。二次文献的重要性在于可以帮助人 们查找一次文献。如目录、题录、文摘、索引、各种书目数据库(3)三次文献(Tertiary Document):是指利用二次文献,选用一次文献内容,经综合,分析和评述后形成的指南性文献。包括综述研究和参考工具两类。如综述、 述评、词典、百科全书、年鉴、指南数据库、书目之书目 2.请说明题录目录文摘的特点以及区别 (1)题录是揭示和报导单篇文献外表特征的工具。 特点:以单篇文献为著录对象 (2)目录是系统积累和提供图书、期刊和其它单行本的名称、收藏单位和索取号等外表特征的揭示和报导的工具。 特点:以单位出版物为著录对象,反映馆藏情况,主要揭示文献外部特征 (3)文摘是以精练的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具。 特点:带摘要的题录 3. 布拉德伏特文献文献分散定律和期刊影响因子的概念 (1)布拉德福文献分散定律:本专业文献的1/3刊登在本专业核心期刊上,另外的2/3则分散在其他的相关期刊和边缘期刊上。 如果将科技期刊按其刊载某专业论文数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个领域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2......的关系。

《信息检索》复习题+名词

《信息检索》复习题 一、名词:(每题4分,共4×6分) 1.①信息检索:是指将信息按一定的方式和存储起来,并根据信息用户的需要找出有 关信息的过程。广义的信息检索包括信息的存储和检索。 2.①文献标引:是对文献的内容特征进行分析、描述、并按照所采用的分类法和主题 法给该文献一标识符号的工作。 3.①检全率与漏检率:检索工具检索效率的评价指标。检全率=检出的相关文献/相 关文献总量。漏检率=未检出的相关文献/相关文献总量。 4.①检准率与误检率:检索工具检索效率的评价指标。检准率=检出的相关文献/检 出文献总量。误检率=检出的无关文献/检出文献总量。 5.①检索策略:是在分析情报需求实质,明确检索提问的基础上,选择检索工具,检 索途径和检索用词,并明确各词之间的逻辑关系与查找步骤的科学安排。 6.①书目之书目:或称检索工具的检索工具,是检索工具的目录,是将目录、题录、 文摘等检索工具,按照类型或取材的学科范围,或按文种等方式排列起来,并附上 简介,指出所收录检索工具的内容、特点和使用方法。 7.①文献著录:按照一定的条例或标准,将一件文献区别与其他文献的外表特征、物 质特征乃至文献摘要一一加以描述并记载下来的工作称为文献著录。 8.①文献指南:它的内容主要是介绍某一学科的期刊和其他类型的一次文献。有关这 些文献的各种检索工具和重要的参考书,信息检索的方法,以及利用图书馆的一般 方法。 9.①引得深度:是衡量检索工具编制过程中分析文献内容所达到的深度的具体质量指 标。是指一篇文献所标引的索引词数目,即指定给每篇文献的“文献标识”数目。 10.①报道时差:是指从被摘文献发表道收录尽检索工具时所经历的时间间隔,检索工 具只有尽可能的缩短报道时差,才能适应科学技术的发展和科技文献增长的需要, 使科研工作者尽快获得最新的文献资料,促进科研工作的开展;否则,报道时差过 长,检索工具本身就失去了现实意义。 11.②主题词:主题词是主题词表中表达一定概念的最小词汇单元,是自然语言中优选 出的规范化词汇,这种词汇不仅反映着一定事物的概念,而且作为事物概念的表达 形式而存在。 12.②倒排档系统:比号法和比孔法有一个共同的特点,就是这种系统是按照每类一卡、 或每词一卡的原理操作的,因此被称为“词款目录系统“或“资料从属于词之下系 统”,即作为资料的文献是编到词卡上的。这样,作为存在于标引员工作单中标引 词于文献之间的关系,在索引文档组织中已被倒排,因此这种系统又被称为倒排档 系统。 13.②ASI:查阅主题索引时,必须将索引标题和修饰语联系起来,按修饰语所带介词 的句法规则,以及学科内容的内在联系来理解,才能得到一个准确的完整的文献主 题。具体的方法是,把索引标题和用逗号分开的各部分修饰语,按照学科内容的内 在联系和修饰语所带介词的句法规则,一个个挂接起来,从而得到一个准确完整的 文献主题的自然语序,因此这种索引又称为挂接主题索引(ASI)。

文献信息检索复习总结

第一章文献信息检索基础 1.信息、文献、情报三者的内涵 信息:信息源于世界一切事物及其运动,是物质和事物存在方式和运动规律的反映。 文献:记录有知识或信息的物质载体. (记录在载体上的知识或信息) 情报:人们为一定目的而传递收集的有使用价值的知识或信息. 科技文献:记录有科技知识的载体. 2.文献外表特征包括:著者、书名、刊名、篇名、序号、国别、文种等 内容特征包括:分类、主题、分子式、结构式 3.文献的类型: 按文献自身用途和编辑出版特点分类:(十大情报源) ①图书:ISBN ②期刊:ISSN ③科技报告:四大报告:PB报告、AD报告、NASA报告、DOE报告 ④会议文献: CPCI(ISTP) 、万方数据库、CNKI会议库、SFS ⑤政府出版物: ⑥专利文献:发明专利实用新型外观设计 ⑦标准文献:国家标准行业标准地方标准 ⑧产品资料: ⑨学位论文:学士论文硕士博士 ⑩技术档案: 文献按出版发行特点: 正式出版文献:图书期刊报纸 非正式出版文献:又叫灰色文献,指不经过公开出版物流通渠道不大量发行 按文献载体分: ①印刷型:以纸张为载体,空间大. ②缩微型:以感光材料为载体,空间小.借助缩微阅读机阅读,携带不便。 ③机读型:存储在磁盘光盘上依赖计算机输出信息网络信息 ④实物型:出土文物甲骨文羊皮纸纸帛竹简象牙文字等 按文献的加工程度分类: ① 零次文献:指未经公开发表或未交流于社会的文献.如:私人笔记、实验记录、书 信、内部档案、设计草图. ② 一次文献:(原始文献) 凡是以著者本人的研究成果为依据而创作的原始文献, 公开发表或交流后,称为一次文献. 如:学报期刊(Journal)、报告(Report)、会刊 (Proceedings)、汇刊(Transactions)、译文、大部分档案等。一次文献是文献 的主体,是检索的最终目的. ③ 二次文献(工具书):是在一次文献数量激增的情况下形成的。是对一次文献进 行加工整理的产物,是为便于管理利用一次文献而编辑出版的工具性文献。如: 题录(Title)、目录(Bibliography) 、文摘(Abstracts)、索引(Index). ④ 三次文献:是在一二次文献的基础上,经过综合分析而编写出来的文献。如: 趋势(Trends)、进展(Progress)、发展(Adrances)、专题述评、动态综述及年鉴、 手册、百科全书等。

《信息的检索与利用》复习资料

《信息检索与利用》期末复习资料 试题的难易程度和题量适当,按难易程度分为三个层次:容易占40%,一般占40%,较难占20%。 一、填空题 1.__是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。信息 2.__是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。知识 3.__ 是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。情报 4.___是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。文献 5.___是指在国内外学术或非学术会议上发表的论文或报告。会议文献 6.___是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。学位论文7.___是对文献内容和形式特征进行选择和记录的过程。著录8.___是指特定的数值型数据为对象的检索。数据检索 9.___是指以特定的事实为目标的检索。事实检索 10.事实与数据检索工具主要依靠各类___完成各种数据或事实的查询。参考工具书 11.按照结构原理,信息检索语言可以分为____、___、___等多种类型。分类语言,主题语言,代码语言 12.Internet是基于___协议的网络。TCP/IP 13.二级域名https://www.doczj.com/doc/dd19201830.html,是指__。教育机构 14.目前WWW环境中使用较多的浏览器有Microsoft公司的__和Netscape公司的___。Internet Explorer,Netscape 15.FTP信息资源检索中匿名登录的用户名是___。Anonymous 16.网络信息检索工具一般由___、___、___三部分组成。信息采集子系统,数据库,检索代理软件 17.据互联网统计公司comScore发布的2007年12月世界搜索引擎市场份额前几名中,主要的搜索引擎公司有___、___、____等。谷歌(Google),雅虎(Yahoo),百度(Baidu) 18.大多数搜索引擎允许用户使用布尔逻辑运算符,以及与之对应的___表示限定搜索结果中必须包含的词汇,___表示限定搜索结果中不能包含的词汇。+,— 19.一些搜索引擎提供了按链接和网域等进行搜索范围的限制,比如,用___表示搜索结果局限于某个网站。site: 20.一些搜索引擎提供了按链接和网域等进行搜索范围的限制,比如,用____表示到某个URL地址指定的网页内进行检索。link: 21.搜索引擎中,在普通查询词后面加一个_____表示文档类型限定。filetype: 22.CNKI数据库需要下载安装______全文浏览器软件或_____全文浏览器软件才能阅读资源。CAJViewer,Adobe Reader 23.维普资讯网的高级检索中,查询语句“K=(CAD+CAM)*R=机械”表示___。文献或文摘中含有“机械”,并且关键词中含有CAD或CAM 24.万方数据库简单检索页面中默认只提供两个检索项选择框,可以通过___按钮增加检索项选择框。+ 25.___又称数据图书或eBook,是电子出版物中最常见的文献形式。电子图书 26.国内提供电子图书服务的网络站点很多,常用的有____、___、___等。超星数字图书馆,书生之家数字图书馆,北大方正Apabi 数字图书馆 27.Dialog系统提供通过____、___、___三种方式接入系统。Internet接入,Telnet远程登录,专线接入 28.若文献B引用了文献A,则文献A称为文献B的_____。引文(参考文献) 29.SCI的中文名称为_____。科学引文索引 30.SSCI的中文名称为____。社会科学引文索引31.A&HCI的中文名称为____。艺术与人文科学引文索引32.EI的中文名称为_____。工程索引 33.ISTP的中文名称为_____。科学技术会议录索引34.CSSCI的中文名称为______。中国社会科学引文索引35.____是最主要的会议文献,通过体现了学科中的新发现、新进展、新成就等。会议论文 36.学位论文一般分为两大类型,一类是____,另一类是______。理论研究型,调研综述型 37.从分类角度管理和检索专利文献的工具中,国际上广泛采用的是______。《国际专利分类法》 38.中国专利信息的检索主要通过三种方式,一是通过____,二是通过_____,三是利用______。印刷型检索工具,光盘型检索工具,网络型检索工具 39._____是对科学、技术研究结果的报告或研究进展的记录。科技报告 40.科技报告按保密程度划分为______、______、______、____、____。绝密报告,秘密报告,非密限制发行报告,非保密报告,解密报告41._____是指按照规定程序编制并经过一个公认的权威机构批准的,供在一定范围内广泛而多次使用的特种科技文献体系。标准文献 42.数据与事实型信息的检索主要通过利用_____、____和___三种途径来实现。参考工具书,数据与事实型数据库,数据与事实型资源网站 43.根据一定的社会需要,以特定的编排方式和检索方法,汇编某学科或特定范围的知识和资料,专为人们解决疑难和提供数据或事实信息为目的,作为工具使用的专供查考的特定类型的图书,称为___。 参考工具书 44.中文工具书的排检方法主要有_____、_____、_____和____四大类。字顺法,分类法,主题法,自然顺序法 二、选择题 1.下面哪项不是情报构成的三要素之一()。D A.本质是知识 B.经过传递C.经过用户使用产生效益 D.通过购买获取 2.一次文献是()。B A.最原始的信息资源 B.最主要的信息资源C.对文献的集中提炼和有序化 D.按知识门类或专题重新组织、高度浓缩而成3.下面哪一项是白色文献()。A A.期刊文献 B.科技报告 C.专利文献 D.学位论文4.报纸区别于其它文献的特征是()。B A.创新性B.及时性 C.学术性 D.全面性 5.具有法律约束力和一定的时效性,经权威机构批准的规章性文献是()。 A A.标准文献 B.学位论文C.档案文献 D.科技报告6.一般存在相应二次文献的是()。A A.期刊 B.产品样本C.档案D.报纸 7.常见的事实和数据检索工具书不包括()。D A.百科全书 B.年鉴C.机构指南 D.杂志 8.在信息检索语言的分类语言中,国际上使用较多的分类表是()。D A.中国图书馆分类法 B.人民大学图书馆分类法C.科学院图书馆分类法 D.国际十进分类法 9.传统信息资源检索技术中常用的布尔逻辑运算符中不包括()。D A.或B.与C.非D.异或 10.信息资源检索中,在已获得所需文献的基础上再利用文献末尾所附参考文献等作为检索入口查找更多文献的方法称为()。C A.顺查法B.倒查法C.回溯法D.综合法11.互联网上每台主机一般具有如下域名()。A A.主机名.机构名.网络名.最高层域名B.机构名.主机名.网络名.最高层域名 C.机构名.最高层域名.网络名.主机名D.最高层域名.网络名.机构名.主机名 12.不是网络信息资源特点的是()。D 精彩文档

信息检索复习题以及重点

信息检索复习题 1、信息检索的步骤包括:界定问题、选择信息源、制定检索策略并实施检索、评价信息、分析利用信息五个步骤。 2、文献中ISBN、ISSN分别是指:国际标准书号、国际标准刊号。 3、文献按出版形式划分为哪几种?简述之。 答:按出版类型划分:图书、期刊、特种文献:(科技报告、会议文献、专利文献、标准文献、学位论文、政府出版物、产品资料、技术档案) 4、给出“基于云计算的煤矿安全监测预警系统研究”一文的关键词。煤矿监测预警云计算数据挖掘 5、给出3种常用搜索引擎名称,什么情况下应该使用百度快照? 答:百度、Google、360、搜狗 搜索到的结果无法打开或打开速度很慢的情况下,可以使用百度快照。 6、利用百度搜索一份技术开发合同,应该在搜索框输入(技术开发合同 filetype:doc 或技术开发合同 filetype:ppt )。(提示:技术开发合同的格式:doc或pdf)。百度以“filetype:”来限制,后面是文档格式。文档可以是pdf、doc、xls、ppt等。首选gov(政府)、edu(教育)、org(非盈利性机构)、ac(学术类)网站;次选com(商业) net(网络)等 7、CNKI中国知网主要收录哪些类型的全文学术文献? 期刊文献,报纸,会议文献,国外学术文献,工具书,年鉴,专利,成果,标准文献,博士学位论文,硕士学位论文 8、查找中文全文图书和期刊文献分别有哪几个数据库? 中文全文数据库:CNKI中国知网.维普期刊资源整合服务平台.万方数据知识服务平台,读秀学术搜索 9、学位论文有哪些特点?简述之。 4)学位论文(dissertation,thesis) 指高等院校和科研机构的毕业生在获取相应学位时,必须提交的论文。 外部特征:著者、论文题名、颁发学位的机构名称、学位等级、授予年份等。 其主要辨识特征是学位名称,特征词:Ph,D,MS等。 从内容上看,学位论文具有以下四个特点:学术性,科学性,创造性,规范性 10、依据GB/T7714-2005,分别给出图书、期刊和学位论文的著录格式,并各举一例。 答:图书:标注格式:[序号]主要责任者.书名[M].版本项.出版地:出版者,出版年. 起止页码. 例子:[5] 徐祥征,彭勇主编. 计算机网络基础与Internet应用[M]. 3版. 北京: 电子工业出版社,2007. 期刊:[序号] 主要责任者.文献题名[J].刊名,年,卷(期):起止页码. 例子: [1]段明莲,陈浩元.关于GB/T7714-2005排印错误的说明[J]. 编辑学报,2006,18(3):203-205. 学位论文:[序号] 责任者.文献题名[D].授予学位地:授予学位单位,年份 例子:[1] 丁大志.复杂电磁问题的快速分析和软件实现 [D]. 南京:南京理工大学,2006. 11、文献按照载体的物理形态划分为哪几种? 答:印刷型缩微型声像型电子型 12、信息检索的三大系统是:全文检索系统、文摘检索系统、目录检索系统。 13、网上专利文献是免费的吗?国家知识产局网站可以看到中国专利全文吗? 答:是;可以。 课件重点: 高效获取信息的能力 管理海量数字信息的能力 分析、挖掘有效信息的能力 第一章信息资源概述 第二章信息检索的基本原理 第三章网络免费资源的获取 第四章专业学术资源的获取 第五章文献的整理和利用 信息(information):事物发出的消息、指令、数据等。 知识(knowledge):是人们对客观世界的认识和概括,是经过加工和提炼的信息。 情报(intelligence ):是活化了的知识,是为特定目的服务的信息。 文献(document):《中华人民共和国国家标准:文献著录总则》(GB3792.1-83) ,记录有知识的一切载体。 用文字、图形、符号、声频、视频等技术手段记录知识的载体。 可以理解为固化在一定物质载体上的知识。也可以理解为古今一切社会史料的总称。

信息检索考试复习内容

一、逻辑算符、检索式 l布尔逻辑算符:and 、or、 not(含义) 1.逻辑“与”(AND 或 *) 用于表达两个或两个以上检索词(关键词、主题词)之间的相交关系或限定关系运算。逻辑与检索能增强检索的专指性,使检索范围缩小。 2.逻辑“或”(OR或 + )用于表达两个或两个以上检索词(关键词、 主题词)之间的并列关系。运算逻辑或检索扩大了检索范围,提高检索信息的查全率。此算符适于连接有同义关系或相关关系的词。 3.逻辑“非”(NOT或-)用于表达两个或两个以上检索词(关键词、主 题词)之间中排除不需要的检索词(关键词、主题词)运算,可以缩小检索范围,增强检索的准确性。此运算适于排除那些含有某个指定检索词(关键词、主题词)的记录。但如果使用不当,将会排除有用文献,从而导致漏检。 检索式举例:题目:第三方物流信息管理系统 检索式:第三方*物流*信息*管理*系统(and) 检索入口:题目或关键词 l截词检索:是一种常用的检索技术,尤其是在西文文献的检索中,使用更为广泛。 截词检索方式可分为三种,即:后截断、前截断、中间截断。按截断的字符的数量上看,又可分有限截断与无限截断两种。 通常用* 表示无限截词。用?表示有限截词。 后截断:是最常用的一种检索技术,将截词放在一个字符串之后,以表示其后有限或无限个字符不影响之前的检索字符串的检索结果。如biolog*,可检索biologcal biologist biology等词, physic ??,可检索 physical、physicst等词。、 前截词将截词符号置于一个字符串的前方以表示其之前有限或无限个字符不影响之后的检索字符串的检索结果如*physics,可检索 physics、astrophysics、biophysics、chemiphysics、geophysics 等词。 中截词又称“ 内嵌字符截断” 。将检索字符置于一个检索词中间,而不影响前后字符串的检索结果。如:organi?ation可检索 organization、organisation。 二、检索效果评价 查全率:是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。 查全率=[检出相关文献量/文献库内相关文献总量]×100%

信息检索期末复习

信息检索期末复习 1.请利用“期刊导航”功能,找出“文学理论”类核心期刊有几种?其中排名第一的期刊是什么?19种;《文学评论》 (中国知网--期刊--期刊导航--核心期刊导航--选中--文学理论类--检索) 2.维普数据库中,查找2007年《情报科学》期刊中,有关“信息检索”的文章 维普数据库--期刊文献检索--基本检索--选中--时间:2007,刊名:情报科学,关键词:信息检索--检索 3.在维普数据库中通过“高级检索”途径查找2003-2006年刊登在核心期刊上有关“信息检索”方面的论文。 维普数据库--期刊文献检索--高级检索--选中--关键词:信息检索,时间:2003--2006,期刊范围:核心期刊--检索 4.请利用“基金导航”功能,查出我校图书馆购买的CNKI数据库中收录的“河北省地方基金”有几种? 中国知网数据库--首页浏览--特色导航--基金导航-- 5.查找到《计算机科学》2007年第8期的目录。 中国知网数据库--期刊导航--选中--刊名:计算机科学,时间:2007年第8期--检索 6.查找曾登载在《人民日报》上的一篇文章----长江水域生态渐呈“荒漠化”

中国知网数据库--资源总库--源数据库--报纸--选中--报纸名称:人民日报,题名:长江水域生态渐呈“荒漠化”--检索 7.有关材料方面的2007年举办的学术会议上发表的论文 中国知网数据库--资源总库--源数据库--会议--选中--时间:2007,关键词:材料--检索 8.找出南京财经大学的老师写的文章中哪些参考了徐从才校长的文章 维普数据库--文献引证追踪--作者索引--选中作者:徐从才--检索--被引量87--选中机构:南京财经大学--在结果中搜索 9.请检索出我校老师所发表的文章被引用4次以上的有哪些? 维普数据库--文献引证追踪--机构索引--选中机构:南京财经大学--检索 10.查找与大连理工大学-唐益萍同学同一导师的所有人的论文。 中国知网数据库--学位论文--硕士论文--选中--机构:大连理工大学,作者:唐益萍--检索 11.请检索2000-2008年期间中国所发布的有关“碳酸饮料”的国家标准。中国知网数据库--首页浏览--标准--国家标准全文--高级检索--选中时间:2000--2008,关键词:碳酸饮料--检索 12.查找CAD有关机械方面,但不包含模具的信息,用布尔逻辑关系表示其检索式并在GOOGLE中进行查找。谷歌搜索:(CAD or 机械)not 模具

信息检索复习资料

一、名词解释 1.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。 2.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。 3.数据挖掘——就是从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 4.检索策略——就是在分析课题内容实质的基础上,确定检索系统、检索途径和检索词,并科学安排各词之间的位置关系、逻辑联系和查找步骤等。 5.截词检索——是指在检索式中用专门的符号(截词符号)表示检索词某一部分允许有一定词形变化。 6.参考数据库——有时又称为书目数据库,是指包含各种数据、信息或知识原始来源和属性的数据库。 7.特种文献——是指出版发行和获取途径都比较特殊的科技文献,一般包括专利文献、会议文献、科技报告、学位论文、标准文献、政府出版物等文献类型。 8.学位论文——是高等院校或研究机构的学生为获得学位资格而提交并通过答辩委员会认可的学术性研究论文,它是随着学位制度的实施而产生的。 9.科技报告——是关于某科研项目或活动的正式报告或记录,多是研究、设计单位或个人以书面形式向提供经费和资助的部门或组织汇报其研究设计和开发项目的成果进展情况的报告。 10.电子图书——是指以电子文件形式存储在各种磁性或电子介质中,以磁盘、光盘、网络等电子媒体形式出版发行,通过计算机或便携式阅读终端进行阅读的一种新型数字化书籍。11.电子报纸—多媒体技术、网络技术和通信技术的产物,是指在排、印、投递等方面基本上实现了电子化的报纸。 12.参考工具书——是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。 13.年鉴——是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。 14.手册——是汇集某一方面常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。 15.名录——是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。 16.搜索引擎——就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。17.文献综述——是一种文献信息调研报告,又是学术论文的一种形式。它是通过全面系统的搜集某一特定研究领域的全部或大部分相关文献资料,并经过阅读、理解、分析、比较、归纳的基础上,对该课题的发展过程、发展趋势及存在的问题等,进行全面介绍、综合分析和评论而形成一种不同于一般论文的文体。 18.开放存取——又称开放访问,是国际学术界、出版界、图书情报界利用互联网进行学术信息和科研成果自由传播、免费利用的行动. 19. 一次文献:即原始文献。是作者以生产或科研为依据创作的原始文献。如专著、期刊论文、学位论文等。 20.技术档案指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有保密性和内部使用的特点。

信息检索复习

1.文献信息的类型和特点?划分文献类型的方法有哪些? 文献信息资源是人类用文字、数据、图像、声频、视频等方式 记录在一定载体上的信息资源。 特点:知识性:知识性是文献的本质,离开知识,文献便不存在。 传递性:文献能使人类的知识相互传播和发展。 动态性:文献所含的知识信息随着社会和科技的发展在不断地 运动。 划分方法:按载体材料划分:印刷型、缩微型、声像型、电子型 按撰写目的和文体划分:著作、学术论文、专利说明书、 科技报告、技术标准 按加工深度划分:零次文献、一次文献、二次文献、三 次文献、高次文献 2.一、二、三次文献信息的主要代表有哪些?它们各有何特点? 一次:专著、学术论文、专利说明书、科技报告等。具创造性的特点。可直接借鉴和参考使用,是人们检索和利用的主要对象。 二次:各种目录、索引(题录)和文摘特点:汇集性和检索性。 其重要性在于:它提供了一次文献信息资源的线索, 三次:参考工具书、百科全书、年鉴、手册、名录、评述或综述等。具有综合性强、针对性强,系统性好的特点。有较高的利用价值。 3.信息检索的类型有那几种?分别检索哪种数据? 各有何特点? 书目信息检索:相关性检索,提供线索 全文信息检索:直接查找原文 数据信息检索:查找数值型信息 事实信息检索:查找发生的事件 4. 书目信息检索的对象是什么? 标题、作者、来源出处、摘要及收藏地点 5. 信息检索的技术有哪些? 布尔检索、词位(近义)检索、截词检索、限制检索 6. 如何正确使用各种逻辑符号编写提问式,正确表达研究课题对信息的需求? 7 . 数据库的结构和类型及其特点? 参考数据库:主要存储一系列描述性信息,指引用户到另一信息源以获得完整的原始信息的一类数据库. (书目,指南)源数据库:主要存储全文、数值、结构式等信息。能直接提供原始文献信息或具体数据,用户不必再转查其它信息源的数据库

信息检索重点复习资料

第一章信息检索概述 信息检索(IR):将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。 信息素养:人们在解答问题时利用信息的技术和技能。 信息检索与文献检索的主要区别:文献检索是以获取文献信息为目的的检索,信息检索是收集,组织,存储一定范畴的信息,并根据用户需求查询文献中的信息或知识单元,比文献检索更深入。 信息检索的分类:1、根据检索手段不同可分为1)手工检索2)光盘检索3)联机检索4)网络检索 2根据检索对象形式不同可分为文本检索、数值检索、音频与视频检索。 信息检索的原理:通过对大量的分散无序的文献信息进行收集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储和检索这两个过程所采用的特征标识达到一致,以便有效的获得和利用信息源。存储是检索的基础,检索是存储的目的。 信息检索语言是人们在加工、存储和检索信息时用来描述信息内容喝信息需求的词汇或符号及其使用规则构成的供标引和检索的工具。 信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。其物理结构:是信息检索所用的硬件资源、系统软件以及信息资源集合(数据库)的总和。 信息检索语言的主要目的:把存储和检索联系起来,把标引人员和用户联系起来,以便取得共同理解,实现交流。 信息检索的历史:最早的信息检索主要依靠信息分类。

1手工检索 2机械信息检索。 3脱机批处理检索是计算机初期使用的一种检索系统 4联机检索 5光盘检索 6 网络信息检索后四者统称为计算机信息检索 信息检索的三个经典模型:1布尔模型 2向量空间模型 3概率模型 1浏览型模型:扁平式模型、结构导向模型、超文本模型 2检索型模型:结构化模型、基于内容的检索型模型。 信息检索模型是信息检索的核心。 信息检索系统:是具有信息存储和信息查询功能的一类服务设施。 信息检索系统按功能划分5种类型:文献检索系统DRS、数据库管理系统DBMS、自动问答系统QAS、管理信息系统MIS、决策支持系统DSS. 信息检索物理结构1计算机硬件2软件3数据库 信息检索的逻辑结构是指系统所包括的功能模块或子系统及其相互关系。 数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合,由字段、记录和文档构成。 数据库的载体分:联机数据库,光盘数据库,网络数据库。按内容与功能划分:指南数据库,交易数据库,全书数据库,书目数据库,字典数据库,数值数据库,图像数据库。书目和全文使用频率最高。 信息检索系统评价的核心的检索性能评价。 信息检索评价指标:1覆盖范围2查全率3查准率4响应时间5用户负担6检索结果输出格式。

信息检索复习要点

复习要点 1.什么是原文出处?获取文献全文的途径有哪些?搜索引擎,本馆资源,全国范围内的纸本馆藏,申请图书馆的文献传递 2.检索词的选择对查全率的影响(切分、删除、扩展)。 切分是对课题的语句以词为单位进行拆分,转换为检索的最小单元。 删除是对课题中不具有实质性检索意义的:虚词(如介词、连词、副词等)选择性删除:使用频率较低的词、专指性太高、过分宽泛的词、过分具体的限定词扩展:找到意思相同或相近的词汇;立足规范词,兼顾自由词;注意词的全称、简称及缩写字母;必要时应向上下位类词扩检;外来词的译写变化 3.检索字段对查全率、查准率的影响。可分为基本检索字段和辅助检索字段。 基本检索字段是指反应文献内容特征的字段。如题名、文摘、主题词等。 辅助字段是指反应文献外部特征的字段,如作者机构、来源出版物、出版年等。限制范围大小:题名<关键词≈摘要<(主题)<全文 截词检索是防止漏检,提高查全率的一种常用检索技术,主要用于英文电子资源的检索。用*或?表示。不同检索系统使用的截词符种类和功能不同。 截词是在检索词的适当位置进行截断,节省输入的字符,达到较高的查全率。根据截词符在检索词中的位置,可分为前截词、中截词和后截词。 常用的词位检索有:邻位检索和字段检索 4.每个数据库的检索技术以和所使用到得符号,以及这些检索技术对查全查准率的影响。概念交叉或概念限定关系:数据库中使用符号“* ”或“AND ” 搜索引擎中使用“空格”表示,增强了专指度,提高了查准率。 具有概念并列关系的组配:数据库中使用符号“+ ”或“OR ”搜索引擎中可在关键词之间使用“OR”连接符,对于百度是用的“| ”连接符,注意连接符与搜索词之间必须要有空格。扩大检索范围,提高了查全率。 具有概念排除关系的组配。数据库中使用“- ”或“NOT ” 搜索引擎中使用“- ”,注意前一个关键 词和减号之间必须有空格,减号和后一个关 键词之间,有无空格均可。 提高查准率,影响查全率 检索技术:1.布尔逻辑2.同义词、同名作者检索3限制检索 检索方式:传统检索,基本检索,高级检索,期刊导航 5.什么是ISSN号。国际标准连续出版物编号是根据国际标准ISO3297制定的连续出版

信息检索复习重要知识

一、名词解释(4题,20分) 目录:以一个完整的出版单位或收藏单位作为著录的基本单位,将一批著录款目按照一定的次序编排而成的一种揭示及报道文献的工具。 索引:将某一信息集合中的相关信息按照某中可查顺序排列并系统地指引给读者的一种检索工具。 年鉴:一种按年度出版,概述或反映上一年度有关领域的重大事件、重大进展和重要成果,汇集重要文献、详尽数据很统计资料的连续出版物。 手册:是汇集某一范围内基础知识和基本数据资料,以便于人们在生产、科研、教学等具体工作过程中可以经常查证的实用便览型参考工具。 OPAC:由开放的公共查询目录演化而来,是20世纪70年代末由美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。 CALIS:是经国务院批准的我国高等教育公共服务体系之一,在教育部的领导下,把国家的投资、现代图书馆理念、先进的技术手段、高校丰富的文献资源和人力资源整合起来。 信息检索:广义上,信息检索是指信息存储与查找的过程,狭义上,指信息查找的过程,信息查找是指通过查询机制从各种检索系统中查找出用户所需要的特定信息的过程。 搜索引擎:泛指网络上以一定的策略搜集信息,对信息进行组织和处理,并为用户提供信息检索服务的工具和系统,是网络资源检索工具的总称。 百科全书:是指收录了各个知识门类的知识,或者系统而完备地概述了某一知识门类知识的大型参考性工具,是最完备的参考工具,有“工具书之王”的美誉。 学位论文:学位论文是伴随着学位制度的实施而产生的,是高等院校或科研机构的毕业生为获取学位资格而撰写的学术性研究论文。 特种文献:一种介于图书与期刊之间的文献类型,通常在出版发行或获取途径方面比较特殊,因此也被称为灰色文献。 电子图书:是指以数字形式加工,通过计算机网络进行传播,,并借助于计算机或类似设备来阅读的图书,是电子出版物中最常见的文献形式。 参考工具书:是根据一定的社会需要以特定的编排方式和检索方法汇编某学科或特定范围的知识和资料,其目的是为人们解决疑难和提供数据或事实信息,是作为工具使用的专供查考的特定类型的图书。 元搜索引擎:是对搜索引擎进行搜索的搜索引擎,是对多个独立搜索引擎的整合、调用、控制和优化利用。 信息检索工具:能够让用户通过其检索出特定信息的一个工具,包括印刷型检索工具和网络信息资源检索工具。 二、不定项选择题(10题,20分) 1、信息检索方法的分类 (1)按检索对象的内容划分 A、文献检索 B、数据检索 C、事实检索 (2)按检索方式划分 A、手工信息检索 B、计算机信息检索 (3)按检索要求划分

信息检索复习讲解

《医学信息检索教程》复习(研) 第一部分信息与信息检索基础 1.根据文献的定义判断某一事物是否是文献。P3文献信息资源是以语言、文字、图像、声频、视频等方式记录在特定载体上的信息资源,简称为文献。信息资源是文献的实质内容,载体是文献的外在形式,符号、文字、声音等是人体感觉信息的媒介,记录是把知识存附在载体上形成文献的手段。其最主要的特征是拥有不依附于人的物质载体。 2.从出版形式和内容两方面考虑图书和期刊的区别。P3时效性:图书不如期刊;成熟度:期刊不如图书。图书通常提供比较系统、成熟的知识,一般包括专著、教科书、丛书、论文集和参考工具书等。期刊也叫杂志,是指具有相对固定的刊名、编辑机构及版式装帧的连续出版物,如美国的《Science》。期刊的内容通常是能反映学科领域最新的理论、方法、技术的论文、综述、病例报告等。 3.特种文献包括哪几种?电子文献包括哪几种?P3—P4 特种文献包括:政府出版物;会议文件;专利文献;科技报告;技术标准和规范;学位论文;其他(报纸、手稿、内部刊物、病历档案、技术资料、产品样本)。电子文献包括:数据库、网络文献、印刷型文献的数字化。 4.一次文献和二次文献的定义及举例。P4一次文献即原始文献,是作者以生产或科研成果为依据而创作的原始文献,如专著、期刊论文、研究报告、学位论文、发明专利等。二次文献是根据一次文献的内容和外表特征进行加工整序后的文献,如目录、索引、文摘、书目数据库、搜索引擎。 5.狭义和广义信息检索定义的区别。P5广义的信息检索包括信息的存储和信息的检索,往往又称为“信息存储与检索”。狭义的信息检索是指人们从任何信息系统中高效、准确地查找到自己所需的有用信息,而不管它以何种形式出现,或借助于什么样的媒体。 6.按信息检索的对象分类,信息检索可分为哪几类?P6文献检索、数据检索、事实检索。后两者是一种确定性检索,其检索结果可以直接回答有或无。 7.按信息组织的方式分类,信息检索可分为哪几类?P6目录检索、题录检索、文摘检索、全文检索、超文本检索、超媒体检索。 8.目录检索和题录检索有什么区别?P6 目录检索可了解某一单位或数据库是否收藏有所需的图书或期刊等出版物;题录检索是以出版物中的单篇文献为检索结果。 9.信息检索语言的定义和类型。P7—P9信息检索语言是为建立信息检索系统而创建的专门用来描述文献特征(内容特征或外表特征)和表达检索提问的一种人工语言,又称为信息存储与检索语言、标引语言、索引语言等。类型:1.分类检索语言(中图分类号属于中国最普遍);2.主题词检索语言(主题词法;关键词法两者最多)。 10.我国使用最普遍的分类检索语言是什么?《中国图书馆分类法》P7 11.《中图法》有几个基本大类?医药卫生类的分类号是什么?P8 22个基本大类“R 医药、卫生”类下分17个二级类目。 12.医药卫生二级类目有哪些?P8中药学、护理学、肾脏疾病分别归入哪个二级类目?R2;R4;R6(CNKI首页→跨库高级检索→左侧总目录→医药卫生→R2中国医学R4临床

信息检索期末复习资料

信息检索 一.名词解释 1.索引(P150):索引是将书籍、期刊等文献所刊载的论文题目、作者,以及所讨论的或设计的学科主题、名词术语、所引用的参考文献等,根据一定的需要,经过分析分别摘录出来,注明其所在书刊的页码,按一定的原则和方法排列起来的一种检索工具。 2.回溯检查法:又称追溯法、引文法、引证法,是一种跟踪查找的方式。即以文献后面所附的参考文献为线索,逐一追溯查找相关文献的方法。通过回溯法所获得的文献有助于对课题的主题背景和立论依据等内容有更深的理解。该方法获得文献针对性强、数量较多,在没有检索工具或检索工具不齐备的情况下,利用此法能够获得一些所需要的文献资料。 3.可视化:将数据库中不可见的语义关系以图像的形式可视化显示,并表达用户检索过程。一个可视化的环境为用户展示更丰富、更直观的信息,一个透明的检索过程使检索更容易、更有效。它包括检索过程的可视化和检索结果的可视化。可视化信息检索技术缩短了用户理解信息的时间,提供了感觉和思考之间的有效反馈机制,它代表着信息检索的未来,将会取代以布尔逻辑为基础的、传统的信息检索系统。 4.自动标引:是指直接通过计算机的操作处理,自动实现赋予检索标志的活动。分为自动主题标引和自动分类标引,即根据计算机内信息(标题、摘要或全文),借助算法自动给出反应主题内容的标引词和自动分配分类号。 5.全文扫描:是以从文本文档中找出与查询表示的字符串完全一致的部分为目的,检索结果返回包含查询字符串的文本及其位置的检索技术。 6.查全率:查全率是指从检索系统检出的与某课题相关的文献信息数量与检索系统中实际与该课题相关的文献信息总量之比。对于数据库检索系统,查全率为检索出的款目数与数据库中满足用户检索式需求的款目数之比;而对于互联网信息检索系统来说,文献总量是很难计算的,甚至连估算都困难。在这里人为因素的影响比较大。相对查全率=(专业人员检出文献的数量数/全部实际检出文献集合并集中文献数量) *100% 7.图像信息抽取:是指从数字图像中抽取包括基于文本的特征(说明,注释等关键词)和视觉特征或底层特征(颜色,文理,形状等),作为图像的特征描述,支持信息检索。 8.信息过滤:是指根据一定的标准运用一定的工具从动态的网络信息流中选取用户需要的信息或剔除用户不需要的信息的方法和过程。信息过滤的依据是信息与用户信息需求的相关性。 9.逻辑算符:又称布尔逻辑算符,是利用布尔代数中的逻辑运算符来描述检索词之间的关系。逻辑算符的作用是把若干飞检索词或词组连接起来,构成一个检索式的基本框架,指定文献的检索词必须出现或不出现的条件。常见的有三种,逻辑与(AND或*)、逻辑或(OR或+)、逻辑非(NOT或-)。其功能是将代表单一概念的一些检索组配起来形成检索式,表达一个信息的整体概念。 10.元搜索引擎:通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作,是对分布于网络的各种检索工具的全局控制机制。 二.分析判断题 1.从狭义角度讲,信息检索包括的过程。 情报的检索(工具)(从信息集合中找出信息的过程,相当于人们通常所说的信息查询);存储和检索;表示、存储、组织、存取 2.系统中的高频词在检索中所起的作用。 3.自动标引的含义。 自动标引是指直接通过计算机的操作处理,自动实现赋予检索标志的活动。分为自动主题表扬你和自动分类标引,即根据计算机内信息(标题、摘要或全文),借助算法自动给出反应主题内容的标引词和自动分配分类号。

相关主题
文本预览
相关文档 最新文档