当前位置:文档之家› 信息检索文字题复习提纲(名词解释、举例、简答、论述)

信息检索文字题复习提纲(名词解释、举例、简答、论述)

信息检索文字题复习提纲(名词解释、举例、简答、论述)

信息检索复习题

1、信息检索的原理是什么?

(1)广义信息检索原理:

在存储过程中,专门负责信息检索系统和数据库建立的人从各种各样的信息资源中,收集有用的信息,对有用的信息进行主题内容的分析,找出能够全面、准确表达主题内容的概念,借助于检索语言(通常是检索词表)把分析出来的概念转换成检索系统所采用的词语,或者直接使用自然语言,再按照一定的规则和方式将这些有用的信息组织成可供件所用的数据库,并存储在一定的介质上。

(2)狭义信息检索原理:

狭义信息检索的原理就是广义信息检索中信息检索过程的那部分原理。信息检索基本原理中的核心部分就是用户所使用的检索词或者由检索词和运算符所组成的检索式与数据库中的检索词及其逻辑关系之间的比较和匹配机理。两者相匹配的信息被检索出来(命中),不相匹配的信息被拒绝。*

2、信息检索有哪些工具?

按处理信息手段分:手工检索工具、计算机检索工具。

按著录方式分:目录型(国家书目、馆藏书目、联合书目、专题书目)、题录型、文摘型(指示性、报道性、评论性)、索引型(主题索引、分类索引、著者索引)。

3、信息检索的途径和方法有哪些?

(1)信息检索途径

分类途径:按学科分类体系来检索文献信息。从分类途径检索文献信息,主要是利用分类目录和分类索引。它以知识体系为中心,比较能体现学科系统性,反映学科与事物的隶属、派生与平行关系,便于从学科所属的范围来查找文献资料,并可起到“触类旁通”的作用。

题名途径:是根据文献名称包括书名、刊名、篇名等来检索文献的途径。一些检索系统中提供题名字顺检索途径,如书名目录、刊名

目录、篇名索引等。

(2)信息检索方法

追溯法:也称引文法,是利用综述或已经掌握文献所附的引文注

释和参考文献目录作为线索逐一追查原文,再利用这些原文所附的参考文献目录逐一扩检,产生滚雪球效果。

直接法:又称常用法,是直接利用检索工具检索文献的方法。它

又分为顺查法(由远及近)、倒查法(由近及远)和抽查法(重点时间段进行)。

综合法:又称循环法。即利用检索工具查到某些文献,又利用这

些文献所附的参考文献追溯查找,如此循环下去,直到满足检索要求为止。是直接法和追溯法的结合。

4、什么是信息检索语言?有哪些类型?

(1)概念:

检索语言是根据信息检索的需要而创制的,能够唯一地表达各种

概括文献信息内容的概念,能够显示概念之间的相互关系,并便于进行系统排列,便于将标引语言和检索用语进行相符性比较的人工语言。它是一种受控语言,依据一定的规则对自然语言进行规范,将其编制成表,供信息标引以及检索时使用。*

(2)类型:

分类检索语言:依据分类法,以学科体系为基础,按类目编排的

检索语言。

主题检索语言:主题语言是以语词作为概念标识,按字顺编排的

检索语言。它又包括叙词语言和关键词语言,以及较早使用的标题词语言和单元词语言。

另外,按检索词的规范化程度分为人工语言和自然语言;按组配

方式分为先组式语言和后组式语言。

5、信息检索的过程是什么?

(1)课题分析,明确查找目的与要求。包括学科范围、年代范围、出版类型、语种、数量,分析检索信息的特点及检索信息内容的主题概念。

(2)选择检索工具。手工检索要确定具体的工具书;计算机检索则要确定检索数据库。

(3)确定检索途径和方法。以数据库检索为例:

A.选择字段(题名、文摘、著者、机构等)。

B.填写检索词。

C选择逻辑算符。

D.执行检索。

E.结果显示。有题录、题录+文摘、全文等由检索者选择。

(4)调整检索策略。重复(3),再次检索。

(5)根据文献线索,找到原文。全文数据库可进行存盘、打印或发电子邮件等。

6、信息检索的有关概念有哪些?

①加权检索:在每个提问词后给定一个数值表示其重要程度,这个数值称为权,在检索时,先查找这些检索词在数据库记录中是否存在,然后计算存在的检索词的权值总和,权值之和达到或超过预先给定的阈值,该记录即为命中记录。

②异构检索:也称跨库检索,是一个集成的、可同时对多个数据库进行一站式检索的综合检索平台。用户可以只通过一个检索窗口,就能对该图书馆拥有的多个数据库同时进行检索。*

③字段检索:是一种用于限定提问关键词在数据库记录中出现的区域,控制检索结果的相关性,提高检索效果的检索方法,它多以字段限定的方式实现,即指定检索词出现的字段,被指定的字段也称检索入口,检索时系统只对指定字段进行匹配运算,提高了效率和查准率。

④原文检索:”原文“是指数据库中的原始记录,原文检索可以说是一种不依赖词表而直接使用自由词的检索方法。检索时,使用位置算符连接检索词,并规定运算符的级别——记录级、字段级、子字段级和位置检索。

⑤查全率:检索结果中计算机输出的相关文献数与计算机数据库中相关文献的总数之比。

⑥查准率:检索结果中,输出的相关文献数与输出的文献总数之比。

⑦误检率:是与查准率相对应的概念,也是评价检索效果的指标。

⑧漏检率:是与查全率相对应的一个概念,,是评价检索效果的指标。

7、什么是信息资源?

(1)广义信息资源

广义的信息资源是指信息活动中各种要素的总称,既包括信息本身,也包括与信息相关的人员、设备、技术和资金等各种因素。(2)狭义信息资源

狭义信息资源只限于信息本身不包括其他因素。

(3)图书馆学:

以图书馆学的角度,信息资源的内涵和外延主要包括以下4各方面:

①信息资源应当是信息的集合。

②信息资源应当是有用信息的集合。

③信息资源应是经过人类组织的、有序的、可存取的信息集合。

④信息资源应包括各种文献载体形式。如文字、声像、数字信息(4)定义

因此,信息资源应定义为:信息资源是经过人类筛选、组织、加工,并可存取和能够满足人类需求的各种信息的集合。

8、信息资源的类型及特点有哪些?

(1)类型

①按信息的载体和传输形式分:体载信息资源;实物信息资源;文献信息资源;网络信息资源。

②按载体形式分:印刷型;缩微型;电子型;声像型。

③按出版形式分:图书、期刊、报纸、会议文献、科技报告、学位论文、专利文献、标准文献、技术档案、产品样本。即通常所说的“十大信息情报源”。

(2)特点

①稀缺性

②不可独占性

③不可分性

④不同一性

⑤驾驭性

9、解释检索信息与信息资源之间的关系。*/**

①信息资源指人类社会信息活动中积累起来的以信息为核心的各类信息活动要素(信息技术、设备、设施、信息生产者等)的集合。信息资源是实现信息检索的对象、范围和载体。

②信息检索则是指将各种信息资源按一定方式组织、存储,并通过人为的手段和工具进行查询和调用的过程。信息检索是实现信息资源管理和利用的有效方式。

③两者互为一个有机的整体,对信息资源的管理是信息检索要实现的目标,而信息检索则是实现信息资源管理的手段。

10、说明信息资源利用的意义。*/**

①能够满足信息用户需求;

②使信息组织与评价得以充分应用;

③对信息资源开发者提出新挑战。

11、评价信息资源的指标是什么?

(1)可靠性——内容要求:立论科学、论据充分、数据精确、阐述完整、技术成熟、参考价值较大。形式要求:作者、出版社资料来源等。外界反应效果。

(2)先进性——内容有新发现、新创造等;刊物著名;时间新。

(3)适用性——符合国情;适合一定范围的读者参考等。

12、数据库的类型有哪些?

(1)按存储介质分:磁带数据库、磁盘数据库、光盘数据库等。

(2)按数据存取方法分:关系型数据库、层次型数据库、网络型数据库。

(3)按数据库内容分:文献型、数据型、事实(字典)型、图像型、多媒体型。其中文献型数据库又分为:索引型、书目型、全文型

等。

13、网络信息资源的类型有哪些?

(1)按网络传输协议分:wab信息资源、FTP信息资源、telnet 信息资源、用户服务组信息资源等。

(2)按出版物类型分:电子图书、电子期刊、电子报纸等。14、中文综合数据库有哪些?利用它们能检索到哪些信息?

(1)CNKI:能够查询期刊杂志、博士论文、硕士论文、会议论文、报纸、工具书、年鉴、专利、标准、国学、海外文献等多种信息资源。

(2)万方:集纳了各个学科的期刊、学位、会议、外文期刊、外文会议等类型的学术论文、法律法规、科技成果、专利、标准和地方志。

(3)维普:专注于中文科技期刊的收录与加工。

15、中文报纸有哪些数据库?

(1)报刊整合数据库

①全国报刊索引数据库

②人大复印报刊资料数据库

③华文报刊文献数据库

④金报兴图报纸、期刊数据库

⑤中国重要报纸全文数据库(CNKI)

(2)专项报纸数据库

①红色报刊档案数据库

②瀚堂近代报刊

③爱如生中国近代报刊库

(3)各大报纸数据库

①《人民日报》图文数据库

②《光明日报》数据库

③《经济日报》全文检索系统

④《大公报:1902-1949》

⑤《申报》

16、检索中文图书可利用哪些数据库?

①超星电子图书馆

②书生之家数字图书馆

③方正Apabi数字图书馆

④读秀图书搜索与阅读平台

⑤中国国家图书馆

⑥CALIS中国高等教育文献保障系统

17、外文综合数据库有哪些?利用他们能检索到什么信息?

①ScienceDirect数据库:爱思唯尔(Elseiver)收录了物理学与工程、生命科学、健康科学、社会科学与人文学科四大领域的学术期刊文献(全文)。

②Springer Link数据库:斯普林格发行电子学术期刊(全文)、电子图书、丛书、参考工具书和回溯文档等资源的检索和服务。

③ProQuest数据库:包含了经济管理商业期刊、综合期刊、回溯期刊、医学与健康期刊、历史研究期刊、文学与语言学期刊、新闻与报纸、科技期刊、艺术研究期刊等文献文摘检索平台和服务。(原剑桥科学文摘CSA数据库并入ProQuest数据库)

④Ei Compendex数据库:收录了在工程技术领域具有学术价值的非纯理论期刊论文的文摘。

⑤SCI数据库:收录了覆盖科学与技术(偏侧重基础科学)的图书、期刊论文、会议论文和其他各类型的文献。

⑥Scopus数据库:涵盖了生命科学、自然科学、医学和社会科学四个领域的期刊、会议记录和商业出版物等文摘和索引,是全球最大的文摘和引文数据库。

18、外文学科数据库有哪些?

(1)数理科学类

①SPIE数据库的检索

②AIP/APS数据库检索

(2)地质与矿业工程类

①GSW数据库检索

②SPE数据库检索

(3)冶金与材料工程类

①Maney数据库检索

(4)机械与仪器仪表类

①ASME数据库检索

②SAE数据库检索

(5)动力与核能工程类

①ANS数据库检索

(6)电气电子与信息工程类

①IEL数据库检索

②INSPEC数据库检索

(7)化学工程类

①ACS数据库检索

(8)轻工纺织与食品工程类

①TTI数据库检索

②FSTA数据库检索

(9)土木建筑与水利工程类

①ASCE数据库检索

②IWA数据库检索

(10)管理工程类

①Emerld数据库检索

②ABI/INFORM数据库检索

19、检索外国的标准、专利、学位论文、技术报告有那些数据库可利用?

(1)专利文献检索

①DII数据库检索

②WIPO数据库检索

(2)科技报告检索

①NTIS数据库检索

②STINET数据库检索

③DOE information Bridge数据库检索

④NTRS数据库检索

(3)会议文献检索

①ISTP数据库检索

(4)学位论文检索

①PQDT数据库检索

②NDLTD数据库检索

(5)标准文献检索

①NSSN数据库检索

②ISO标准检索

③IEC标准检索

④ITU标准检索

20、系统相关性的评价因素有哪些?*

(1)信息源的领域覆盖范围;

(2)信息组织的结构化程度;

(3)信息检索语言的规范性;

(4)索引方法和工具的选择;

(5)检索结果的匹配程度;

(6)系统数据库存储的覆盖率;

(7)系统查询方式/检索界面:快速检索、专家检索、高级检索;(8)系统检索形式和语义的相关。

21、用户相关性的评价因素有哪些?*

(1)信息用户特性:包括年龄、职业、教育和认知水平、专业知识水平等;

(2)信息需求表达:检索式表达和非检索式表达;

(3)用户认知心理:用户心理预期和满意度;

(4)时间、地点、情景等外部环境因素。

22、比较因特网检索和数据库检索的异同,谈谈你的认识。**

(1)相同:两者都需要运用计算机系统进行检索,速度相差不大,相比于传统的检索方式更加便捷。

(2)不同:

①从搜索过程看,因特网检索门槛低,操作简单,属于人人可用的免费检索方式;而数据库检索要求具有一定的专业知识水平,操作相对复杂,一些专业数据库需要收费。这展现出了网络检索相比于数据库检索在检索门槛更低、操作更加便捷、检索成本更低等优势。

②从检索结果看,因特网检索能够搜寻大量网上存在的文献和资源,既包括专业性的学术文献,又包括新闻报道和网友看法,相关性和权威性较差,但信息覆盖范围广泛,结果较为模糊;专业数据库则只收录了各类学术论文和特种文献,信息覆盖范围相对较小,但数据库文献的相关性和权威性较高,结果较为精确。因此,在结果上,专业数据库和网络检索各有优劣,网络检索结果覆盖范围广但精确性差差,专业数据库结果相关性和权威性较好但覆盖范围小。

(3)认识:

因特网检索和数据库检索在检索途径上具有相似性,但数据库检

索操作相对复杂,但结果相对精确;因特网检索操作简单,但结果模糊,各有优势和缺点。在实际检索过程中,我们应该综合运用数据库检索和网络检索相结合的方式,提高检索的检全率和检准率。

(可从准确性、先进性、及时性等指标入手评价更优越或科学。)23、你认为信息检索的重要性表现有哪些?**

(1)避免重复研究或走弯路。研究人员在选题开始就必须进行信息检索,了解别人在该项目上已经做了哪些工作,哪些工作目前正在做,谁在做,进展情况如何等。这样,用户就可以在他人研究的基础上进行再创造,从而避免重复研究,少走或不走弯路。

(2)节省研究人员的时间,提高研究效率。信息检索是研究工作的基础和必要环节,成功的信息检索无疑会节省研究人员的大量时间,使其能用更多的时间和精力进行科学研究。

(3)是获取新知识的捷径。掌握信息检索方法,有助于培养能力型和创造型人才的自学能力和独立研究能力,找到一条吸收和利用大量新知识的捷径,把大家引导到更广阔的知识领域中去,对未知世界进行探索。

注:*号代表答案信息不准确;**号代表无标准答案。

(完整版)信息检索期末复习题及答案

《信息检索》期末复习题及答案(仅供参考) 一、判断题 1.综述和百科全书属于二次文献。(× ) 2.从文献检索的角度来看,一次文献是检索对象,二次文献是检索手段。(× ) 3.题录、目录属于一次文献;期刊论文属于二次文献。(× ) 4.主题词规范化的目的是扩大检索范围。(√) 5.在众多的信息源中,期刊是最重要的信息源。(√ ) 6.核心期刊是指经常使用的期刊。(× ) 7.关键词和主题词都是表征文献实质性内容的词汇,前者是经过词表规范的,后者是未经词表规范的自由词。(×) 8.《中国图书分类法》(简称《中图法》)是由分类号(代码)和类名来揭示信息的主题概念。(×) 9.题录型的检索工具,其著录项目包括题目、作者、文献出处、文摘。() 10.一项发明创造要获得专利权必须具备新颖性、创造性和实用性。() 二、选择题 1、广义的信息检索包含两个过程( B ) A、检索与利用 B、存储与检索 C、存储与利用 D、检索与报道 2、文献是记录有知识的()。 A、载体 B、纸张 C、光盘 D、磁盘 3、下列哪种文献属于一次文献( A )。 A、期刊论文 B、百科全书 C、综述 D、文摘 4、下列哪种文献属于二次文献( D )。 A、专利文献 B、学位论文 C、会议文献 D、目录 5、下列哪种文献属于三次文献( C )。 A、标准文献 B、学位论文 C、综述 D、文摘 6、下列选项中属于连续出版物类型的选项有(C )。 A、人民日报 B、学位论文 C、科技期刊 D、会议文献 7、下列选项中属于特种文献类型的有( D )。 A、学位论文 B、图书 C、科技期刊 D、标准文献 8、纸质信息源的载体是() A、光盘 B、缩微平片 C、感光材料 D、纸张 9、《中国图书分类法》(简称《中图法》)将图书分成( A ) A、5大部分22个大类 B、5大部分26个大类 C、6大部分22个大类 D、6大部分26个大类 10、《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在( A )类目下查找。 A、S类目 B、Q类目 C、T 类目 D、R类目

信息检索-简答题

. '. 1. 请解释信息、知识、文献的概念,并简述三者之间的关系 答:信息是物质存在的一种方式、形态或运动状态,也是事物的一种普遍性,一般指数据、消息中所包含的意义,可以使消息中所描述事件中的不定性减少。 知识是人体对客观事物的认识和经验的总各和。是人类通过信息对自然界、对人类社会的认识,是人的大脑通过思维重新组合的系统化的信息集合。 文献是用文字、图形、符号、声频等手段记录有人类知识信息的一切载体。 它们三者之间既有联系,又有区别,在一定的条件下还可以相互转换。知识是信息的一部分。但信息不直接等同于知识,信息慢知识产生与形成的基础。知识是人类大脑活动的产物,是一种升华的信息——高级信息。而文献则是记录知识的一切载体,是社会信息知识的积累、存贮和传递的工具,又是社会活动、科学活动的记录,是确认人们在社会活动、科学活动及发明创造中的地位和取得成果水平的基本手段与标志。 2. 在数据库检索中,当检出的文献数量较少时,分析其可能原因,以及采用何种对应措施,才能增大文献信息的检出量?(至少列举5种情况) 答:造成检索结果信息量少的原因有:选用了不规范的主题词或某些产品的俗称,商品名称作为检索词;同义词、相关词、近义词没有运用全;上位概念或下为概念没有完整运用;字段限定太多;逻辑“与”、“非”用得过多;检索概念专指度过高等。这种情况要考虑扩大检索范围,提高检索结果的查全率,调整检索策略的方法如下:(1)选全同义词与相关词并用逻辑“或”将他们连接起来,增加网罗度。(2)减少逻辑“与”和逻辑“非”运算,丢掉一些次要的或者太专指的概念。(3)去除某些字段限制。(4)增加上位概念。(5)重新选择更合适的数据库。(6)调整位置算符,由严变松。(7)增加破词算符的使用。 3、核心期刊的主要特点? 答:少数刊载某一学科大量质量专业论文的期刊称为核心期刊,其主要特点:(1)刊载专业文献密度高,信息含量高。(2)水平较高,代表本学科的最新发展水平。(3)出版相对稳定,所载文献寿命较长。(4)利用率和被引率较高。

文献检索期末复习提纲

文献 定义为记录有知识的一切载体三要素:知识、载体、记录知识决定文献的内容,载体决定文献的形态,记录则是构成文献的手段记录:记录符号(文字)记录手段(印刷) 情报 定义是人们搜集到的能为我们所用的新知识或新信息具有知识性,传递性,效用性 文献,知识,情报的三者关系 信息是起源,是基础,它包含了知识和情报是它们共同的本质联系的组带。文献则是信息、知识、情报的存储载体和重要的传播工具,是重要的知识源、情报信息源,它是信息、知识、情报存储的重要方式。信息、知识、情报的主要部分被包含在文献之中。文献上记录的信息、知识不全是情报;信息、知识、情报也不全是以文献形式记录。具有十分密切的联系,但也有明显的区别。 文献信息源 定义是用一定的记录手段将系统化的信息内容储存在纸张、胶片、磁带、磁盘和光盘等物质载体上而形成的一类信息源。 文献信息源根据其载体、出版形式及加工深度 1、按物质载体和记录形式划分例印刷型:优点便于直接阅读,使用方便缺点是较笨重、存储密度低、收藏占用空间大、加工保存等花费人力物力较大 2、按出版形式和内容划分分为:图书、期刊、报纸、科技报告、会议文献、专利文献、标准文献、学位论文、政府出版物、产品样本资料和技术档案3按加工深度和内容性质划分主要(1)一次文献。指作者以本人在生产、科研或理论探讨中所获得的第一手资料为基本素材撰写的文献,如会议文献、学位论文等注意:综述不是一次文献(2)二次文献。指将分散的无组织的一次文献进行收集、提炼、浓缩、加工、整理,并按一定的科学方法,组织编排、编辑出版的文献,如书本式目录、题录等 美国信息素养:1信息知识2信息意识、3信息能力4信息道德P9 信息素养教育的重要意义 1信息素养教育可为学生终身学习奠定基础2信息素养教育可以培养学生认识、判断、评价和利用信息的能力3信息素养教育可以提高学生的创新能力4信息素养教育可以规范学生的信息活动行为 信息检索系统 指根据特定的信息需求而建立起来的一种有关信息收集、加工、存储和检索的程序化系统,其主要目的是为人们提供信息服务。构成:检索文档、系统规范、检索设备、操作人员 目录 是以单位出版物为著录对象,所谓单位出版物是指以文献独自的名称作为一个完整的出版单位的出版物。 通常包括出版物名称、责任者(著者、编者、译者)、出版项(出版者、出版地、出版时间、版次等)和稽核项(页数、开本、价格等)

信息检索文字题复习提纲(名词解释、举例、简答、论述)

信息检索复习题 1、信息检索的原理是什么? (1)广义信息检索原理: 在存储过程中,专门负责信息检索系统和数据库建立的人从各种各样的信息资源中,收集有用的信息,对有用的信息进行主题内容的分析,找出能够全面、准确表达主题内容的概念,借助于检索语言(通常是检索词表)把分析出来的概念转换成检索系统所采用的词语,或者直接使用自然语言,再按照一定的规则和方式将这些有用的信息组织成可供件所用的数据库,并存储在一定的介质上。 (2)狭义信息检索原理: 狭义信息检索的原理就是广义信息检索中信息检索过程的那部分原理。信息检索基本原理中的核心部分就是用户所使用的检索词或者由检索词和运算符所组成的检索式与数据库中的检索词及其逻辑关 系之间的比较和匹配机理。两者相匹配的信息被检索出来(命中),不相匹配的信息被拒绝。* 2、信息检索有哪些工具? 按处理信息手段分:手工检索工具、计算机检索工具。 按著录方式分:目录型(国家书目、馆藏书目、联合书目、专题书目)、题录型、文摘型(指示性、报道性、评论性)、索引型(主题索引、分类索引、著者索引)。 3、信息检索的途径和方法有哪些? (1)信息检索途径 分类途径:按学科分类体系来检索文献信息。从分类途径检索文献信息,主要是利用分类目录和分类索引。它以知识体系为中心,比较能体现学科系统性,反映学科与事物的隶属、派生与平行关系,便于从学科所属的范围来查找文献资料,并可起到“触类旁通”的作用。 题名途径:是根据文献名称包括书名、刊名、篇名等来检索文献的途径。一些检索系统中提供题名字顺检索途径,如书名目录、刊名目录、篇名索引等。 (2)信息检索方法

追溯法:也称引文法,是利用综述或已经掌握文献所附的引文注 释和参考文献目录作为线索逐一追查原文,再利用这些原文所附的参考文献目录逐一扩检,产生滚雪球效果。 直接法:又称常用法,是直接利用检索工具检索文献的方法。它 又分为顺查法(由远及近)、倒查法(由近及远)和抽查法(重点时间段进行)。 综合法:又称循环法。即利用检索工具查到某些文献,又利用这 些文献所附的参考文献追溯查找,如此循环下去,直到满足检索要求为止。是直接法和追溯法的结合。 4、什么是信息检索语言?有哪些类型? (1)概念: 检索语言是根据信息检索的需要而创制的,能够唯一地表达各种 概括文献信息内容的概念,能够显示概念之间的相互关系,并便于进行系统排列,便于将标引语言和检索用语进行相符性比较的人工语言。它是一种受控语言,依据一定的规则对自然语言进行规范,将其编制成表,供信息标引以及检索时使用。* (2)类型: 分类检索语言:依据分类法,以学科体系为基础,按类目编排的 检索语言。 主题检索语言:主题语言是以语词作为概念标识,按字顺编排的 检索语言。它又包括叙词语言和关键词语言,以及较早使用的标题词语言和单元词语言。 另外,按检索词的规范化程度分为人工语言和自然语言;按组配 方式分为先组式语言和后组式语言。 5、信息检索的过程是什么? (1)课题分析,明确查找目的与要求。包括学科范围、年代范围、出版类型、语种、数量,分析检索信息的特点及检索信息内容的主题概念。 (2)选择检索工具。手工检索要确定具体的工具书;计算机检索则要确定检索数据库。 (3)确定检索途径和方法。以数据库检索为例: A.选择字段(题名、文摘、著者、机构等)。

信息检索与利用复习资料(整理2016.1)

信息检索与利用复习资料 (一)、名词解释 1、INTERNET(因特网):Internet:因特网。泛指由多个计算机网络相互连接而成的一个网络,它是在功能和逻辑上组成的一个大型网络。采用TCP/IP协议。 2、SCI: SCI是科学引文索引的英文缩写首字母。SCI是一个引文数据库,收录全世界出版的数、理、化、农、林、医、生命科学、天文、地理、环境、材料、工程技术等自然科学各学科的核心期刊。 3、报刊:报刊是指报纸和期刊的总称,是属于连续出版物,它具有统一的题名,定期或不定期以连续分册形式出版,有卷期或年月标识,并且计划无限期连续出版。报纸以刊载新闻和评论为主,期则围绕某一学科和某些学科或某一研究对象,由多篇文献资料编辑而成。 4、标准文献。广义的标准文献包括标准的原始文件及检索工具书等。狭义的标准文献仅指带有标准号的标准、规范、规程等技术标准。 5、超文本:超文本是在普通文本的基础上增加了链接功能的一种文本。用户只要用鼠标点击页面上有特殊颜色或有下划线的文字时,就会出现新的解释或访问更多的信息。 6、分类途径:是指按文献内容的学科分类体系查找文献信息的途径。一般说来,一种检索工具的编制都须按学科建立自己的分类体系,其收录的文献按分类目录中的排序进行编排,这样的编排的结果可将同一学科的文献集中,便于按学科查找文献。 7、技术档案:指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有保密性和内部使用的特点。 8、检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等。它是根据检索的需要而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言。 9、竞争情报:竞争情报是20世纪80年代在国际上迅速发展起来的一种信息业务,是关于竞争环境、竞争对手和竞争策略的情报研究。 10、科学文献:文献:凡是人类的知识用文字、图形、代码、符号、声频、视频等方式和技术手段记载在一定载体上的每一件记录,统称为文献。而把记录科学知识的每一份物质载体称为科学文献, 11、目录:是图书、期刊或其他单位出版物外表特征的揭示与报道。它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉及书中的章节或期刊中具体的文章。 12、全文搜索引擎。全文搜索引擎是使用自动索引软件来搜集和标引网页资源、建立数据库,以Web形式提供查找网络资源的一种网络信息检索工具。 13、索引:索引是将一种或一批相关书刊内容中的篇目、字句、人名、地名、事件、分子式等摘出,按一定的方法编排,并指明其在原书中的位置,为读者提供查找线索的工具书。索引是记录期刊、报纸、文集、论丛、会议录等文献所包含的论文题目、撰述者,将其摘录出来,并注明其出处,按照一定的原则编制而成,形成查寻文献篇名的检索工具。 14、图书馆目录:图书馆目录是提示、识别和检索馆藏文献信息的工具,也是宣传图书、辅导阅读的工具,是读者迅速、准确、有效地检索所需文献资料的向导,被喻为“打开人类知识宝库的钥匙”。 15、网络信息资源。以电子形式存储于成千上万台计算机组成的网络中的信息资源,它包括各类数据、电子文件、学术论文、图书、软件、商业活动等各种信息。 信息检索。是从大量相关信息中利用人—机系统等各种方法加以有序识别与组织以便及时找出用户所需部分信息的过程。 16、网络信息资源:以电子形式存储于成千上万台计算机组成的网络中的信息资源,它包括各类数据、电子文件、学术论文、图书、软件、商业活动等各种信息。 17、网站:网站是某些单位或个人为了一定目的、为用户提供某些方面的服务,在Internet设置的站点,这些服务主要有Web服务、Ftp服务和Email服务等。 18、文献检索:以文献或其索引、文摘为检索对象,目的是核实已知文献的不确切项目,如著者名,年代、出处等,或查检某课题原始文献的线索及它们的具体收藏情况。 19、文献信息资源:文献是记录有知识的一切载体。文献信息资源是以文字、图形、符号、声频、视频等方

文献检索复习题(名解 简答)

文献检索复习题 一、名词解释 1.二次文献信息:二次文献也称二级文献,它是将大量分散、零乱、无序的一次文献进行整理、浓缩、提炼,并按照一定的逻辑顺序和科学体系加以编排存储,使之系统化,以便于检索利用。 2.学科化服务:指图书馆设专人与某一学科专业作为对口单位建立联系,在院系、学科专业与图书馆之间架起一座桥梁,相互沟通,为用户主动地,有针对性的收集和提供文献信息的服务。 3.网络电子图书:以电子图书形式发行,以互联网为流通渠道,以数字内容为流通介质,以网上交易为主要支付手段的图书。 4.专利文献:是实行专利制度的国家、地区及国际性专利组织在审批专利过程中产生的官方文件及其出版物的总称。 5.引文分析法:引文分析法,就是利用各种数学及统计学的方法进行比较、归纳、抽象、概括等的逻辑方法,对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析,以揭示其数量特征和内在规律的一种信息计量研究方法。 6.书目数据库:是指存储某些或某一个领域的二次文献书目数据的一类数据库。 7.个性化导读服务:又称阅读指导服务,是图书馆针对各类型读者,采取各种措施主动诱导读者的阅读行为,提高其阅读意识,阅读能力和阅读效益的一种教育活动。 8.双词频控制检索:指对一个检索项中的两检索词分别实行词频控制,也就是一个检索项使用了两次词频控制。是针对单项双词组合检索而设置的。 9.专利法:专利法是确认发明人(或其权利继受人)对其发明享有专有权,规定专利权人的权利和义务的法 10.网络信息资源:网络信息资源是指通过计算机网络可以利用的各种信息资源的总和。具体的说是指所有以电子数据形式把文字、图像、声音、动画等多种形式的信息存储在光、磁等非纸介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。 11.参考数据库:指为用户提供信息线索的数据库,它可以指引用户获取原始信息。参考数据库包括书目数据库(Bibliographic Database)和指南数据库(Referral Database)。 12.情报调研:指图书馆根据某一特定任务的要求,广泛收集文献,必要时在实地考察的基础上,对收集来的文献资料进行分析对比、推断、归纳整理,掌握其内部变化的规律与周围事物的联系,了解它的过去、现状并预测未来发展的趋势,或提出解决问题的建议和措施等的研究过程。 13.多项双词逻辑组合检索:多项是指可选择多个检索项; 双词是指一个检索项中可输入两个检索词(在两个输入框中输入),每个检索项中的两个词之间可进行五种组合。 14.引文:就是参考文献。

信息检索复习题附答案绝对正确!!

《信息检索》课理论考试复习题 一、选择题: A 1、从对文献的生产加工与组织层次来看,文献可以分成一次文献、二次文献和三次文献。一次文献主要有(A) A、专著、报纸、期刊 B、书目、索引、文摘 C、百科全书、年鉴、手册 2、《中图法》共分为五个基本部类,(B)个大类。 A二十五B、二十二C、二十八 3、按照《中图法》的分类原则,文学类和哲学、宗教类分别用汉语拼音字母(C)表示。 A GHB、E、DC、I、B 4、根据主题词表所规定的以反映文献内容的主题词为标志,从主题的角度检索文献资料的途径是(C) A、著者途径 B、文献名途径 C、主题途径 5、著录一批相关的图书或报刊文献的基本特征,按照一定次序编排而成的揭示和报道文献的工具书是(B) A文摘B、书目C索引 6、按照文献的知识内容及所属学科性质而分类和检索文献信息的途径是(A) A、分类途径 B、主题途径 C、著者途径 7、信息检索中,以课题起始年代为起点,按时间顺序由远而近逐期查找文献的方法是(C) A、倒查法 B、追溯法 C、顺查法 8、在各种大型电子全文图书系统中,国内影响较大的主要有(B) A、人大复印资料数据库 B、超星数字图书馆 C、学位论文数据库 9、美国《科学引文索引》是最具权威的国际性检索系统之一,简称是(A) A SCIB、SSCIC、EI 10、目前世界上最大的连续动态更新的中国期全文数据库是(B) A维普中文期刊数据库B、CNKI中国学术期刊数据库 C万方数字化期刊数据库 11、集各种类型工具书之大成,被称为“工具书之王”的工具书是(C)

A、类书 B、年鉴 C、百科全书 12、汇集某一学科或多学科的文献信息资料,按照特定的体例和排检方法编排,专供人们查 阅、征引或解决疑难问题的一种专门文献是(A) A、工具书 B、标准文献 C、专利文献 13、联机检索分为(B)联机检索和检索结果与反馈3个阶段。 A、简单检索 B、检索准备 C、高级检索 14、内容比较成熟、资料比较系统、有完整定型的装帧形式的出版物是(C) A、技术报告 B、政府出版物 C、图书 15、按信息检索的手段划分的信息检索类型是(C) A、数据检索 B、计算机信息检索 C、事实检索 B 1、美国《科学引文索引》是最具权威的国际性检索系统之一,简称是:(C) A.SSCI B.CSSCI C.SCI通 2、本馆电子图书系统有(B)。 A.书生之家古藤堡计划 B.书生之家电子图书超星电子图书C,超星电子图书 Ebrary电子图书 3、汇萃人类已有的一切门类知识或某一门类知识的完备工具书是?(A) A.百科全书 B.年鉴 C.类书 4.按编制方式,《中图法》属于何种分类语言?(C) A.混合分类语言 B.组配分类语言 C.等级体系分类语言 5.通常情况下,国外数据库的字段代码AUABLA分别指(A)。 A.著者字段文摘字段语种字段 B.编者字段著者单位关键词字段 C.分类号 机构来源公司 6.下列哪一种文献是高等院校和科研院所的本科生、研究生为获得学位资格(学士、硕士和博士)而撰写的学术性较强的研究论文,是在学习和研究中参考大量文献进行科学研究的 基础上而完成的。(C) A.科技报告 B.专利文献 C.学位论文 7.利用书刊名称或文献的篇名为线索进行信息检索的途径是:(B) A.分类途径 B.文献名途径 C.著者途径

网络信息检索与利用参考试题与答案复习进程

网络信息检索与利用 一、名词解释题: 网络信息资源:是将文字、图像、声音、动画等各种形式的信息,以数字化形式存储并借助计算机与网络通讯设置发布,收集、组织、存储、传递、检索和利用信息资源。 www: 信息检索 数据库:是至少有一个文档组成并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。 联机检索:指用户利用计算机联合通过通讯网络与世界各地的信息检索系统联机,从检索系统的数据库中查找出所需信息的过程。它允许用户以智能机对话,联机会话,这样交互的方式直接访问检索系统及数据库、检索是实时在线进行。 查全率:是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例。 查准率:是指检出文献中合乎需要的文献的数量占检出文献的全部数量。 关键词:关键词又称自由词,它属于自言语言范畴。关键词是直接来自文献本身,能够反映文献主题概念,具有实际检索意义的词语。以搜索引擎为代表的基于关键词的检索工具能够利用全文索引技术。 布尔逻辑检索:又称布尔代数是指使用,and,or,not等运用符,查找含有某种词语特定主配形式的网页。 搜索引擎:是一个可以用文件名查找文件的系统。 元搜索引擎:是一种基于搜索引擎的网络检索工具。它是将多个搜索引擎集合在一起,通过一个统一的检索界面接收并处理用户的查询提问。在进行检索时调用一个或者多个独立搜索引擎的数据库。 桌面元搜索引擎:顾名思义,桌面元搜索引擎不是通过网上调用方式在线使用,而是直接在用户的计算机上进行,相当于用户自己拥有一个元搜索引擎,所以称之为桌面元搜索引擎。All-in-One式元搜索引擎:又称搜索引擎元目录,它将主要的搜索引擎集中起来,并按类型或检索问题等编排组织成目录帮助导引用户根据检索需求来选择适用的搜索引擎。 联合书目数据库:联合目录是揭示报道若干个文献收藏单位的文献入藏情况,汇总若干个单位馆藏的书目信息的目录。 参考信息:是指人名、地名、机构、事件、统计数据等一类数据,事实信息,是人们的工作研究和日常生活中经常要查考、引用的信息。 二、简答题和论述题: 1.网络信息资源的种类分哪几种? 答:可分为五种:1.web信息资源。其中有www有关的重要概念:(1)超文本传输协议HTTP (2)超文本标记语言HTML(3)通用资源定位程序URL(4)主页(home page)(5)链接(link)(6)浏览器 2.Telnet:是通过远程登录后,可以访问共享的远程系统中的资源。 3.FTP信息资源,是因特网适用的文件传输协议。 4.用户组信息资源,是有一组对某一个特定主题有共同兴趣的网络用户组成的电子论坛。 5.RSS信息资源,它是一种用于共享新闻

信息检索重点

一、信息检索四要素 1、信息检索的前题:信息意识 2、信息检索的基础:信息源 3、信息检索的核心:信息获取能力 4、信息检索的关键:信息利用 二、信息基本特征:普遍性、客观性、扩散和传递性、增值性(创新)、可存贮性和可压缩性、可知性(信息能力)和共享性 知识属性:意识性、信息性、实践性、继承性、渗透性 情报属性:针对性、知识性、时间性、传递性、效用性 信息、知识、情报的关系:信息经过人脑思维加工,即认识飞跃产生知识,情报属于知识的范畴。广义的情报是信息的传递,因此,情报具有信息和知识两种性质。 三、按载体不同分为: 口头信息源、实物信息源、文献信息源 四、文献信息源:

1、按出版形式不同可分为十种类型: 图书、期刊、科技报告、会议文献、政府出版物、专利文献、标准、产品资料、学位论文、技术档案 2、按记录信息的材料可分为三种类型: 纸印本文献、缩微型文献、机读型文献 3、按加工深度不同可划分为四种: 零次文献、一次文献、二次文献、三次文献 四者之间的关系:从零次文献到三次文献,是一个从分散的原始文献加工整理系统化的过程。零次文献是一次文献的素材,一次文献是基础,是检索的对象;二次文献是检索一次文献的工具;三次文献是一次文献的浓缩,是情报信息的重要来源。 五、信息检索系统类型: ⑴根据检索目标和检出文献信息形式的不同: 文献检索、数据检索、事实检索 ⑵根据具体检索手段不同: 手工检索、机械检索

六、检索步骤: 分析研究课题 确定检索范围和检索标识 选定检索工具 确定检索途径 查找和获取原始文献 七、信息检索的方法: ⒈常用法:是利用检索工具查找文献的方法. ⑴顺查法⑵倒查法⑶抽查法 ⒉追溯法:从已知的现有文献后所列参考文献入手,逐一追查原文,从这些原文后所列参考文献再逐一追查,不断扩检的查找方法 ⒊循环法:指追溯法常用法混合使用的方法。 八、信息检索的途径: ⒈根据外表特征划分著者途径;书名、篇名、刊名途径;序号途径

信息检索考试题及答案

一、名词解释 0、文献及其要素 “文献”是泛指“有历史价值或参考价值的图书资料。” 要素:1、构成文献内核的信息、知识、数据、事实 2、载体信息、知识、数据、事实的物质载体。 3、记录信息、知识、数据、事实的符号系统。 1、专利文献 专利文献是实行专利的国家、地区及国际专利组织在批审专利过程中产生的官方文件及出版物,包括专利说明书、专利权利要求书、专利公报、专利分类表、专利检索工具等。 2、三大检索系统 三大检索系统是:SCI(《科学引文索引》,英文全称为Science Citation Index)是美国科学情报研究所(Institute for Scientific Information,简称ISI)出版的一部世界著名的期刊文献检索工具,其出版形式包括印刷版期刊和光盘版及联机数据库,现在还发行了互联网上Web版数据库。 EI是美国《工程索引》(TheEngineeringIndex)的简称。EI创刊于1884年,由美国工程情报公司(EngineeringInformationCo.)出版发行。EI是工程技术领域内的一部综合性检索工具,报道内容包括:电类、自动控制类、动力、机械、仪表、材料科学、农业、生物工程、数理、医学、化工、食品、计算机、能源、地质、环境等学科。 ISTP是IndextoScientific&TechnicalProceedings的缩写,是美国科学情报研究所的网络数据库WebofScienceProceedings中两个数据库(ISTP和ISSHP)之一。专门收录世界各种重要的自然科学及技术方面的会议,包括一般性会议、座谈会、研究会、讨论会、发表会等的会议文献,涉及学科基本与SCI相同。(自己总结一下)3、二次文献 二次文献又称二级次文献,它是文献检索工具,能比较全面、系统地反映某个学科、专业或专题在一定时空范围内的文献线索,是积累、报道和检索文献资料的有效手段. 4、受控语言 受控语言是一种规范化的人工语言,包括具有较强族性检索功能的分类语言和具有较强特性检索功能的主题语言。 5、信息素质:是指一个人的信息需求、信息意识、信息知识、信息道德、信息能 力方面的基本素质。 6、Cali s:calis是中国高等教育文献保障系统的简称,是经国务院批准的我国高等教 育公共服务体系之一。它以系统化、数字化的学术信息资源为基础,以先进的数字图书馆技术为手段,建立包括文献获取环境、参考咨询环境、教学辅助环境、科研环境、培训环境和个性化服务环境在内的六大数字服务环境,为高等院校教学、科研和重点学科建设提供高效率、全方位的文献信息保障与服务,成为中国经济和社会发展的重要基础设施。 7、引文追溯法:追溯法是指不利用一般的检索工具,而是利用已经掌握的文献末尾所 列的参考文献,进行逐一地追溯查找“引文”的一种最简便的扩大情报来源的方法。它还可以从查到的“引文”中再追溯查找“引文”,像滚雪球一样,依据文献间的引用关系,获得越来越多的内容相关文献。 8、同引文献:与本文有相同参考文献的文献,与本文有共同研究背景或依据的文献。

信息检索复习(名词解释)教案

1、同句检索是要求参加检索运算的两个词必须在同一自然句中出现,其先后顺序不受限制。 2、查全率:是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量信息检索系统检出相关文献能力的尺度,可用下面的公式表示: 查全率=(检出相关文献量/系统中相关文献总量)*100% 3、查准率:是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统精确度的尺度,可用以下公式表示: 查准率=(检出相关文献量/检出文献总量)*100% 4、漏检率:是指漏检相关文献量与在检索系统中相关文献总量的比率,是衡量信息检索系统漏检文献的尺度,可用下面的公式表示: 漏检率=(漏检相关文献量/系统中相关文献总量)*100% 5、跨库检索:可同时检索多个平台上的多种资源,输入一个检索式,便可以看到多个数据库的查询结果。 6、单库检索:在选定的单一数据库中进行检索。 7、经典论文优先:被引用数比较多,或者文章发表在档次比较高的杂志上等经典的、有价值的文献优先排在前面。 8、相关度优先:和查询的条件内容最相关的文献优先排在前面。 9、最新论文优先:发表时间比较新的文献优先排在前面。 10、精确匹配:检索结果中包含与检索词完全相同的词语 11、模糊匹配:检索结果包含检索词或检索词中的词素 12、顺查法是根据有关课题的起始年代利用选定的检索工具由远及近的进行逐年查找。 13、倒查法从最新时间查找起,直到满足检索要求为止。 14、抽查法是针对有关学科的发展特点,抽查某些特定时期的文献信息。 15、二次检索是指在前一次检索结果的范围内,继续进行检索。 16、定题检索 SDI (selective dissemination of information)查找有关特定主题最新信息的检索。 17、回溯检索 RS (retrospective search)查找一段时期内有关特定主题信息的检索。 数据库的基本复习: 数据收录文献范围,有哪些数据库? 二、信息检索的原因 1、信息检索是获取知识的途径 2、信息检索是科学研究的向导 3、信息检索是终身教育的基础 信息检索语言与检索途径 (1)分类语言(2)主题语言(3)分类主题一体化语言(4)代码语言(5)引文语言 1、内容特征检索途径 (1)分类途径(2)主题途径(3)分类主题途径 2、外部特征检索途径 (1)责任者途径(2)题名途径(3)序号途径(4)引文途径 第二节事实数据信息的检索工具 一、字典、词典(辞典)二、百科全书三、手册四、年鉴五、名录 第三节文献检索工具简介 一、目录型检索工具;题录型检索工具;文摘型检索工具 第四节索引介绍 著者索引、主题索引(关键词索引)、分类索引、题名索引、其他索引

《信息检索与利用》复习资料 - 副本

《信息检索与利用》复习资料 试题的难易程度和题量适当,按难易程度分为三个层次:容易占40%,一般占40%,较难占20%。 一、填空题 1.__是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。信息 2.__是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。知识 3.__ 是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。情报4.___是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。文献 5.___是指在国内外学术或非学术会议上发表的论文或报告。会议文献 6.___是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。学位论文 7.___是对文献内容和形式特征进行选择和记录的过程。著录 8.___是指特定的数值型数据为对象的检索。数据检索 9.___是指以特定的事实为目标的检索。事实检索 10.事实与数据检索工具主要依靠各类___完成各种数据或事实的查询。参考工具书 11.按照结构原理,信息检索语言可以分为____、___、___等多种类型。分类语言,主题语言,代码语言 12.Internet是基于 ___协议的网络。TCP/IP 13.二级域名https://www.doczj.com/doc/7719326849.html,是指__。教育机构 14.目前WWW环境中使用较多的浏览器有Microsoft公司的__和Netscape公司的___。Internet Explorer,Netscape 15.FTP信息资源检索中匿名登录的用户名是___。Anonymous 16.网络信息检索工具一般由___、___、___三部分组成。信息采集子系统,数据库,检索代理软件17.据互联网统计公司comScore发布的2007年12月世界搜索引擎市场份额前几名中,主要的搜索引擎公司有___、___、____等。谷歌(Google),雅虎(Yahoo),百度(Baidu) 18.大多数搜索引擎允许用户使用布尔逻辑运算符,以及与之对应的___表示限定搜索结果中必须包含的词汇,___表示限定搜索结果中不能包含的词汇。+,— 19.一些搜索引擎提供了按链接和网域等进行搜索范围的限制,比如,用___表示搜索结果局限于某个网站。 site: 20.一些搜索引擎提供了按链接和网域等进行搜索范围的限制,比如,用____表示到某个URL地址指定的网页内进行检索。link:

信息检索名词解释

信息检索名词解释 信息检索(Information retrieval,IR)是指从大规模数据集中 找出与用户需求相关的信息的过程。以下是一些与信息检索相关的重要名词解释: 1. 文档(Document):信息检索中的基本单位,可以是文本、图片、音频、视频等形式的数据。 2. 查询(Query):用户提出的一个或多个关键词或短语,用 于描述其信息需求。 3. 检索(Retrieval):在信息检索系统中,通过匹配查询和文 档之间的相关性,找出最相关的文档。 4. 相关性(Relevance):衡量查询和文档之间匹配程度的度量,用于判断文档是否与查询相关。 5. 评价(Evaluation):对信息检索系统性能进行定量和定性 评估的过程,通常通过与人工判定相关性的比较来衡量。 6. 召回率(Recall):信息检索系统检索到的相关文档数占所 有相关文档数的比例,衡量系统的查全性能。 7. 精确率(Precision):信息检索系统检索到的相关文档数占 所有检索到的文档数的比例,衡量系统的查准性能。 8. F-度量(F-Measure):综合考虑召回率和精确率的度量指

标,通过调和平均计算,可以较好地衡量系统的全面性和准确性。 9. 布尔模型(Boolean model):一种基本的信息检索模型,根据查询中的布尔运算符(AND、OR、NOT)对文档进行匹配。 10. 向量空间模型(Vector space model):一种常用的信息检索模型,将文档和查询表示为向量,在向量空间中计算它们之间的相似度。 11. 词语权重(Term weight):表示一个词语在文档中的重要性的权重,常用的计算方法有词频、逆文档频率等。 12. 倒排索引(Inverted index):一种常用的索引结构,以词语为关键字,记录词语出现在哪些文档中,加快检索速度。 13. 停用词(Stop word):在信息检索中,指那些对判定一个文档是否与查询相关没有帮助的常见词语,如“a”、“and”、“the”等。 14. 查询扩展(Query expansion):对查询进行修改或补充,以提高系统的召回率和精确率。 15. 排名(Ranking):根据文档与查询的相关性,将文档按照相关性从高到低进行排序,以提供给用户最有用的结果。

信息检索考试重点

信息检索 考试类型:闭卷考试题型:单项选择、判断、名词解释、应用〔信息检索过程〕 考试重点: 1、文献:文献是记录知识的一切载体。但凡用文字、图形、符号、声频、视频记录下来,具有存贮和传递知识功能的一切载体都称为文献。 2、文献类型:印刷型缩微型视听型机读型 3、知识:是在人们对信息进行分析的基础上提供的解决方案。知识管理的主要目的是使信息能够服务于人们的行动和决策。 4、信息:是凭借人的认知能力和经验对数据进行选择、评价、组织和分析的结果。信息管理主要是解决数据的相关性、系统化和标准化的问题。 5、数据:指离散孤立的互不关联的事实、文字、数据和符号,这些资料之间缺乏相关性。 6、文献级次: 零次文献〔灰色文献〕:指非正式出版物或非正式渠道交流的文献。 一次文献〔原始文献〕:但凡著者在科学研究,生产实践中根据科研成果,发明创造撰写的文献,称为一次文献。一次文献是文献的主体,是最基本的情报源,是文献检索的对象。 二次文献:它是将分散、无序的一次文献,按照一定的原则进行加工,整理、提炼、组织,使之成为便于存贮、检索的系统。如目录等检索工具。 三次文献:它是在利用二次文献的基础上,选用一次文献的内容,进行分析、概括、综合研究和评价而编写出来的文献。它又可分为综述研究类和参考工具类两种类型。前者如动态综述、学科总结、专题述评、进展报告等;后者如年鉴、手册、大全等。三次文献源于一次文献,又高于一次文献,属于一种再创性文献。三次文献一般来说系统性好,综合性强,内容比较成熟,常常附有大量的参考文献,有时可作为查阅文献的起点。 高级文献:电脑型文献,如:PTF、HTM等。 7、十大文献源 1图书(Books) 2期刊(Periodicals)或(Journal,Magazine) 3科技报告(Technical reports) 4政府出版物 5会议文献(Conference papers) 6专利文献:(patents) 7学位论文(Thesis,Dissertation) 8技术标准(Technical standards) 9科技档案 (document) 10产品样本 8、文献检索:从大量的文献中查找与特定课题有关的文献的过程。 9、检索语言是根据信息检索的需要,专门用于各种手工和电脑化的文献信息检索与存贮系统描述文献主题概念和研究课题主题概念的表达检索提问的人工语言。检索语言又称为索引语言、存贮与检索语言、文献语言、文献工作语言、标引语言、标引符号、标识系统等等。 9、检索方法:常用法:顺查法、倒查法、抽查法。 追溯法:最新引文法。 循环法〔分段法〕:常用法+追溯法 10、检索步骤:分析课题--选择检索系统--检索途径--检索标识--检索方法--查找文献线索--获取原文 11.信息检索的涵义:从广义上讲,信息检索包括两个过程, 一是信息存储(information storage),即信息的标引、加工和存储过程: 二是信息检索(information retrieval),即信息用户的查找过程。 从狭义上讲,信息检索仅指后一部分。 信息检索的本质是一个匹配的过程,即用户的信息需求和信息存储的信息集合进行比较和选择的过程 12、信息存储和检索过程的基本原理

信息检索名词解释

一、名词解释 信息检索:信息检索最普通的理解就是信息查找..它是将信息按一定的方式组织起来;并根据信息用户的需求查找出有关的信息的过程和技术..信息检索又叫做信息存储与检索information storage and retri..信息检索可以分为事实检索、数据检索、文献检索.. 特性检索:也称强相关性检索;强调向用户提供高度对口的信息..强调检索的准确性;对检索结果的数量不作要求.. 族性检索:也成弱相关性检索;强调向用户提供系统、完整的信息..注重检索的全面性;要求检索出一段时间期限内有关特定主题的所有信息;对准确性要求较低.. 特种文献:特种文献是一种不以书刊形式出版的文献;一般不公开发行;它包括专利文献、会议资料、科技报告、技术标淮、学位论文、政府出版物、产品样本及其说明书等..其特点是内容涉及面广、种类多、数量大、报道快、参考价值高.. OPAC:联机图书馆公共检索目录;有开放的公共查询目录演化而来;是20世纪70年代末美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统.. 参考工具书:是指根据人们的需要;把某一范围的知识或资料加以分析、综合或浓缩;并按一定的排检方法编排;以备查阅、参考;用以解决有关事实和数据方面的疑难问题的图书..

年鉴:是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料;提供详尽的事实、数据和统计数字;反映近期政治、经济发展的动向及科学文化进步的年度出版物.. 手册:是汇集某一方面常需要查考的基本知识和数据资料;以供读者手头随时翻检的一种工具书.. 名录:是汇集机构名、人名、地名等专名基本情况和资料的一种工具书..搜索引擎:就是通过运行一个不断在网络上通过域名扫描和各种链接的软件;自动获得大量站点页面的信息;并按照一定规则归类整理;从而形成数据库;用以提供查询的站点.. 图书:论述或介绍某一领域知识的出版物.. 期刊:期刊一般是指名称固定、开本一致的定期或不定期连续出版物..期刊论文内容新颖;报道速度快;信息含量大;是传递科技情报、交流学术思想最基本的文献形式.. 学位论文:学位论文是指为申请硕士、博士等学位而提交的学术论文..学位论文的质量参差不齐;但都是就某一专题进行研究而作的总结;多数有一定的独创性.. 连续出版物:具有统一题名、印有编号或年月顺序号、定期或不定期在无期限内连续出版、发行的出版物..包括期刊、报纸、年鉴连续出版的丛书和会议录等;但不包括在一个有期限内以连续分册形式出版的着作.. 二、简答

文献检索复习提纲

《文献检索》复习提纲 一、文献信息概述 1、文献是记录有知识的一切载体。文献的构成要素:知识信息、负载知识信息的载体。文献的本质属性:知识性、传递性、动态性。 2、依据文献的加工程度,文献可分为哪些类型,每种类型的含义是什么? 答:根据文献的加工程度划分,文献可分为:零次文献、一次文献、二次文献、三次文献。零次文献是指未以公开形式出版或未经正式渠道流通的文献,如文章草稿、私人笔记等;一次文献是作者以生产或研究成果为依据而创作的原始文献,如期刊论文、学位论文、专著等;二次文献是指将无序的一次文献进行收集、整理、著录,并以规定的格式编制成,为便于管理和查找文献的工具,即检索工具。如目录、题录或索引、文摘等;三次文献是指在利用二次文献的基础上,对一次文献的内容经阅读研究,浓缩提炼而编写成的文献,如专题综述、百科全书、年鉴、指南等。(参见教材第11 页) 3、我国早在三四千年以前的殷商时代就有了最早的图书—甲骨文。图书及期刊的特点:(教材第9 页)。 4、图书、期刊、报纸、专利文献、标准文献、会议文献、学位论文、科技报告的文献类别代码分别是什么? 答:图书:M ;期刊:J;报纸:N;专利文献:P; 标准文献:S;会议文献:C;学位论文:D;科技报告:R 5、结合实际谈一谈培养大学生文献信息检索技能的重要性和必要性。 答案要点:(1)开发智力资源,推动社会发展;(2)继承前人成果,避免重复研究;(3)提高自学能力,培养创新人才;(4)节省科研时间,提高工作效率。[ 要求:在论述的过程中应结合知识经济、学习型社会、素质教育等方面的实际,表达观点应理论与实际紧密结合,条理清晰,自圆其说。切忌仅答要点。] 二、文献信息检索的基本原理 1、简述文献信息检索的原理。 答:信息检索的实质是信息用户的需求和一定的信息集合的比较和选择的过程,即匹配的过程。包括两个过程: (1)存储过程:标引员广泛收集信息,形成检索标识,把这些标识按一定方法组织成形成各种检索系统,即信息源的形成过程。 (2)检索过程:检索人员分析课题,用检索提问标识,从检索系统中查获所需的信息。

相关主题
文本预览
相关文档 最新文档