课堂作业1 信息检索基本知识
- 格式:doc
- 大小:36.00 KB
- 文档页数:2
信息检索基础知识考点整理●2.1 信息检索的概念与原理●2.1.1 信息检索的概念(重要)●2.1.2 信息检索的原理●信息检索原理就是将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配,选取两者相符或部分相符的信息予以输出●信息检索的类型●1.文献检索●2.数据检索●3.事实检索●2.1.3 信息检索的意义/作用(重要)●1.信息检索是有效利用信息资源,实现其最大价值的科学方法●2.信息检索是再学习的工具,是获取知识的有效途径●3.信息检索能有效地提高科研工作的效率,节省人力、物力及时间●2.1.4 信息检索的历程●1.手工检索●2.计算机检索●2.2 信息检索系统(重要)●2.2.1 信息检索系统的概念●1.信息检索系统的含义●2.信息检索系统的工作原理●2.2.2 信息检索系统的构成●1.信息选择子系统●2.信息索引子系统●3.词表管理子系统●4.用户接口子系统●5.匹配子系统●2.2.3 信息检索系统的分类●1.手工检索系统●1.书本式的手工检索系统●2.卡片式的手工检索系统●2.计算机检索系统●1.硬件●2.软件●3.数据库●1.参考数据库●1.书目数据库●2.指南数据库●2.源数据库●1.数值数据库●2.文本—数值数据库●3.全文数据库●4.术语数据库●5.图像数据库●6.多媒体数据库●2.3 信息检索方法(重要)●1.直接浏览法●直接查找法●2.常用法●顺查●倒查●抽查●3.追溯法●4.综合法(分段查找法、循环法、交替法)●2.4 信息检索效果(重要)●2.4.1 信息检索效果评价●信息检索效果的概念●1.检索结果有效性评价●2.检索系统实用性的评价●3.检索费用—效率评价●信息检索效果评价对于信息检索系统的建设和发展的意义●信息检索效果评价的核心问题是建立一套切实可行的评价指标●1.查全率和查准率●2.误检率和漏检率●3.响应时间●其他与检索效果相关的指标●2.4.2影响信息检索效果的因素●1.标引的质量●2.检索途径的数量●3.检索策略的优劣●4.检索人员的素质。
信息检索知识点信息检索考点整理 1 、信息检索的概念广义的信息检索就是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储与检索两个过程; 而狭义的信息检索仅指有序化信息的检索查找。
2. 信息检索的原理就就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡就是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就就是初步命中检索所需的信息。
3 、为什么说信息存储与检索就是两个不可分割的有机体?检索的全过程包括存储与检索两个过程,存储与检索就是相辅相成、不可分割的。
存储过程主要就是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要就是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程就是存储过程的逆过程。
因此,检索者只有在全面了解存储者就是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4 、信息检索的方法 (1)顺查法 (2)倒查法 (3)抽查法(4)追溯法 (5)循环法 5 、信息检索的途径 (1)内部特征途径a) 分类途径 b) 主题途径 (2)外部特征途径 a) 题名途径 b) 著者途径 c) 文献编号途径 d) 检索途径 e) 机构检索法 f) 引文检索途径 6 、布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2) 可操作性强,应用广泛;(3) 构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4) 能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7 、概率排序原则: 如果一个检索系统对用户的每个检索提问的反应就是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果就是最好的。
第一章信息检索基础知识一.概述1.信息与文献信息知识的分类:已掌握的知识和需查询的知识。
信息的定义:信息是事物运动的状态与方式,是物质的一种属性,并且借助于一定的物质载体传输和储存。
这里有几个词组需说明:事物:泛指一切可能研究的对象(包括物质的和精神的)。
运动:泛指一切意义上的变化(机械运动、化学运动、思维运动和社会运动)运动方式:在时间上所呈现的过程和规律:运动状态:在空间上所展示的形状和态势。
信息已成为与物质、能量同样重要的三大资源之一。
信息是一种原料,人类接受外界大量信息后,经过实践活动和大脑的思维机制加工提炼后变成有用的知识(知识的认识程度)。
文献:将知识记录并保持在一定的载体上,就形成了文献。
文献信息是文献所表达的内载信息,以文字、符号、声像信息为编码的人类精神信息,也是经过人们筛选、归纳和整理后记录下来的信息。
科技文献是科学技术研究成果的记录,积累了许多有用的事实、数据、理论、方法和科学假设,反映了科学技术研究的进展和水平,是科学信息的主要来源。
2.信息的特点(1)普遍性;信息是无处不在,无时不在的,c从宏观的宇宙天体到微观粒子,从自然界到人类社会,万事万物都是信息的母体;(2)时效性:信息的获得和传送需要时间,信息反映的总是特定时刻事物的运动状态和方式,当人们获得信息后,它反映的是某段时间的事物,是一种历史纪录,如果传递很慢,信息就会失去应有的价值;(3)传递性:指信息的空间和时间效应,信息可以从一个地方传到另一个地方,从一个时期传到另一个时期;信息的传递决定了信息的可扩散性,信息是通过各种渠道、媒介传播和扩散;(4)共享性:信息在传播和使用的过程中,载体本身的信息并不因此而减少,信息资源的共享将极大地推进人类文明的发展;(5)可转换性:信息的物质载体形态是可以相互转移变换的;信息在一定条件下可以转化为物质、能量、时间、金钱、效益、质量等;(6)可伪性:在人们得到信息后,必须进行分析判断和筛选,以便正确享用信息。
《信息检索》课堂作业Ⅰ2017年10月11日东九楼B401一、单选题。
1.查找某一年的新闻、事件、数据和统计资料,应该用(C)类参考工具书。
A.手册B.统计资料C.年鉴D.百科全书2.刘志强,我国农业生态环境可持续发展评价及对策[J],农业系统科学与综合研究,2001,17(3):24-26。
该参考文献的17(3):24-26的含义应该是(C)。
A.第17卷第3页第24-26行。
B.第17期第3页第24-26行。
C.第17卷第3期第24-26页。
D.第17卷第3部分第24-26页。
3.ISSN0023-1231是(B)。
A.国际标准书号B.国际标准刊号C.图书分类号D.专利号二、填空题。
1.综述、年鉴属于三次文献,目录、文摘属于二次文献。
2.信息检索常用的十大信息源是指图书、期刊、专利文献、科技报告、会议文献、学术论文、标准文献、技术档案、政府出版物、产品资料。
3.美国政府四大报告指的是PB、NASA、AD和DOE报告。
三、判断题。
1.信息素养包含信息意识、信息能力和信息伦理三个方面。
(√)2.专利通常比期刊、学位论文等信息类型报道科技产品更快、更详细,所以被称为“企业的技术百科全书”。
(√)3.检索2006年经济统计的数据通常应该用2006年出版的《中国统计年鉴》。
(×)四、写出下列题录的文献出版类型,并说明识别标识。
1.X.Gai,S.Sun,M.F.Wheeler and H.Klie,A time stepping scheme for coupledreservoir flow and geomechanics on non-matching grids,In:Proceedings of the 2005 SPE Annual Technical Conference and Exhibition,Dallas,Texas,USA,October 9-12,2005.(SPE97054)答:会议论文。
1、信息检索的定义:是指将信息按一定的方式组织和存储起来,并根据信息用户的需求找出相关的信息的过程和技术。
信息检索的作用:a:节省查找文献的时间。
b:有利于文献专题查找。
c:克服语言障碍。
2、信息:所有事物的存在方式和运动状态以及关于所有事物的存在方式和运动状态的陈述。
信息的特征:普遍性、客观性、抽象性、依附性、可加工性、传递性、共享性。
信息的作用:(1)信息是人类社会生存的条件,信息是人类社会发展的资源(2)信息是主客体的中介,信息是思维的材料(3)信息是组织的保证,信息的管理的基础(4)信息是决策的依据,信息是控制灵魂文献的特点:(1)数量急剧增长(2)内容交叉重复(3)专业文献出版分散(4)文献老化加快(5)文献语种繁多(6)文献载体形态增加文献类型:(一)按照载体的形式不同,文献可分为:1、印刷型2、缩微型3、声像型4、电子型(二)按照内容、性质和加工深度的不同,文献可分为:1、一次文献2、二次文献3、三次文献4、零次文献(三)根据性质、特点和出版形式的不同,文献可分为:1、科技图书2、科技期刊3、科技报告4、政府出版物5、会议文献6、专利文献7、学位论文8、标准文献9、科技档案10、产品样本a、主题语言主题检索语言是用语词来表达文献主题概念,它不管各语词之间相互关系如何,一律按字顺排列成主题词表,故称主题检索语言。
分为标题词语言、关键词语言和叙词型语言三种。
○2关键词语言:由于关键词语言能适应使用计算机的需要,因而大大加速了文献标引过程,缩短了检索工具出版的时间,便于用来检索最新文献,大大增加了检索点,使用灵活方便。
查准率和查全率较低。
○3叙词型语言:用途较广,既适合于手工检索,又适合计算机检索语言。
6、信息检索的途径:书名途径,著者途径,序号途径,分类途径,主题途径。
7、信息检索方法:(一)常用法所谓常用法,顾名思义是检索中最为常用的方法,指利用成套的检索工具检索文献信息的方法,也称之为工具法。
信息检索的基本知识:
“检索(Retrieval)”即“查找”之意。
1950年莫尔斯(Calvin N.Mooers)在《把信息检索看做是时间性的通讯》中,首次提出“信息检索”(Information Retrieval)一词。
信息检索亦称情报检索、文献检索。
通俗地说,信息检索就是信息用户为处理解决各种问题而查找、识别、获取相关的事实、数据、知识的活动及过程。
我们可以这样定义“信息检索”:从信息集合中迅速、准确地查找出所需信息的程序和方法。
这里所说的信息集合指的是有组织的信息整体。
它可以是数据库的全部记录,也可以是某种检索工具,还可以是某个图书馆的全部馆藏。
信息检索也就是从数据库、检索工具以及馆藏中查找所需信息的活动。
信息检索的基本知识
信息检索是一种重要的技术,它用于从大量的数据中提取所需信息。
以下是一些信息检索的基本知识:
•索引:信息检索的首要步骤是构建索引。
索引是一个按关键字组织的数据结构,用于快速定位和访问文档。
•关键字:关键字是进行信息检索的基本单位。
它们可以是单个词或短语,根据检索目的和搜索引擎的功能来确定。
•搜索引擎:搜索引擎是信息检索的核心工具。
它利用索引和算法来找到与用户查询相关的文档,并按相关性排序。
•查询:用户通过查询向搜索引擎提供信息需求。
查询可以是简单的关键字、短语,也可以是复杂的语句。
•相关性:搜索引擎根据文档与查询的匹配程度计算相关性。
相关性分数用于确定排名,从而决定返回给用户的搜索结果顺序。
除了以上基本知识,信息检索还涉及更多高级技术:
•倒排索引:倒排索引是一种常用的索引结构,它将关键字映射到包含这些关键字的文档列表中,以支持快速的搜索。
•词频和权重:搜索引擎通常根据关键字在文档中出现的频率和位置,以及其他因素来计算关键字的权重。
•自然语言处理:信息检索利用自然语言处理技术来理解用户查询和文档内容,以提高搜索效果。
•评估和优化:为了提供更好的搜索结果,搜索引擎需要不断评估和优化算法,以适应不断变化的用户需求和文档集合。
总结起来,信息检索是一门复杂而关键的技术,它在数字化时代具有重要意义。
了解信息检索的基本知识对于学习和使用搜索引擎、开发相关应用都非常有帮助。
课堂作业1 信息检索基本知识
一、填空题 A
1.信息素质是个体能够认识到何时需要信息且能够有效地______、______和
______信息的________。
2.美国大学与研究型图书馆协会(ACRL)批准并颁布的《高等教育信息素质能
力标准》包括____个一级指标和_____个二级指标。
3.文献是记录有知识和信息的一切载体。
其3个基本要素是__________、
__________、________________。
4.按信息内容的加工层次来分类,信息分为______________、_____________、
___________________、________________。
5.信息检索的本质是信息用户的________和一定的信息集合的_______和
_______的过程,即“匹配”的过程。
6.检索语言按内容性质划分为______语言和_______语言。
7.依据信息检索手段划分,信息检索方法通常可以分为_____检索和________
检索两大类。
8.根据文献外部特征的检索途径主要有________途径、________途径、______
途径等。
9.检索策略是指检索步骤的__________和____________。
10.信息检索效果评价的主要指标是__________和____________。
一、填空题B:指出文献类型并说明标识项含义
1.Gomathi, S. Sankara; Bhagyaveni, M.A. Simulation of scalability and congestion control of broadband intelligent networks.①Information
Technology Journal ② v 7, n 2, 2008, p 306-312③
其中,①是_______________②是_______________③是
________________
该篇文献类型是________________
2.Sliwinski, Przemyslaw; Chorazyczewski, Artur.①Image processing with JPEG2000 coders. Proceedings of SPIE - The International Society for Optical Engineering②, v 7000, Optical and Digital Image Processing, 2008, p 70001G③其中,①是______________②是_______________③是________________ 该篇文献类型是________________
3.Nevio Benvenuto, Giovanni Cherubini. Algorithms for communications systems and their applications①Chichester ; Hoboken, NJ : J. Wiley, c2002.②1285 p. : ill. ; 25 cm . ISBN: 0470843896 ③
其中,①是________________②是________________③是
______________
该篇文献类型是________________
4.Dong,Jiaxiang,Rule-based planning for automated endodontic treatment:From
dental radiography, three-dimensional computer modeling to tool selection and path control ①, Ph.D. ②COLUMBIA UNIVERSITY ③, 2003,295p.
其中,①是_______________②是_______________③是________________
该篇文献类型是________________
5. Villasenor-Gonzalez, L. ; Lamont, L. Military V oice Services over Wireless ATM Networks: ATM Adaptation Layer Study; Technical rept.Defence Research Establishment, Ottawa (Ontario).①ADA395810, DREO-TR-2001-059, CRC-RP-2001-02 ②Mar 2001, 74p③
其中,①是_______________②是_______________③是________________
该篇文献类型是________________。