科技信息检索基础知识
- 格式:pptx
- 大小:166.88 KB
- 文档页数:32
信息检索知识点信息检索考点整理 1 、信息检索的概念广义的信息检索就是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储与检索两个过程; 而狭义的信息检索仅指有序化信息的检索查找。
2. 信息检索的原理就就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡就是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就就是初步命中检索所需的信息。
3 、为什么说信息存储与检索就是两个不可分割的有机体?检索的全过程包括存储与检索两个过程,存储与检索就是相辅相成、不可分割的。
存储过程主要就是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要就是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程就是存储过程的逆过程。
因此,检索者只有在全面了解存储者就是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4 、信息检索的方法 (1)顺查法 (2)倒查法 (3)抽查法(4)追溯法 (5)循环法 5 、信息检索的途径 (1)内部特征途径a) 分类途径 b) 主题途径 (2)外部特征途径 a) 题名途径 b) 著者途径 c) 文献编号途径 d) 检索途径 e) 机构检索法 f) 引文检索途径 6 、布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2) 可操作性强,应用广泛;(3) 构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4) 能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7 、概率排序原则: 如果一个检索系统对用户的每个检索提问的反应就是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果就是最好的。
第一章信息检索基础知识一.概述1.信息与文献信息知识的分类:已掌握的知识和需查询的知识。
信息的定义:信息是事物运动的状态与方式,是物质的一种属性,并且借助于一定的物质载体传输和储存。
这里有几个词组需说明:事物:泛指一切可能研究的对象(包括物质的和精神的)。
运动:泛指一切意义上的变化(机械运动、化学运动、思维运动和社会运动)运动方式:在时间上所呈现的过程和规律:运动状态:在空间上所展示的形状和态势。
信息已成为与物质、能量同样重要的三大资源之一。
信息是一种原料,人类接受外界大量信息后,经过实践活动和大脑的思维机制加工提炼后变成有用的知识(知识的认识程度)。
文献:将知识记录并保持在一定的载体上,就形成了文献。
文献信息是文献所表达的内载信息,以文字、符号、声像信息为编码的人类精神信息,也是经过人们筛选、归纳和整理后记录下来的信息。
科技文献是科学技术研究成果的记录,积累了许多有用的事实、数据、理论、方法和科学假设,反映了科学技术研究的进展和水平,是科学信息的主要来源。
2.信息的特点(1)普遍性;信息是无处不在,无时不在的,c从宏观的宇宙天体到微观粒子,从自然界到人类社会,万事万物都是信息的母体;(2)时效性:信息的获得和传送需要时间,信息反映的总是特定时刻事物的运动状态和方式,当人们获得信息后,它反映的是某段时间的事物,是一种历史纪录,如果传递很慢,信息就会失去应有的价值;(3)传递性:指信息的空间和时间效应,信息可以从一个地方传到另一个地方,从一个时期传到另一个时期;信息的传递决定了信息的可扩散性,信息是通过各种渠道、媒介传播和扩散;(4)共享性:信息在传播和使用的过程中,载体本身的信息并不因此而减少,信息资源的共享将极大地推进人类文明的发展;(5)可转换性:信息的物质载体形态是可以相互转移变换的;信息在一定条件下可以转化为物质、能量、时间、金钱、效益、质量等;(6)可伪性:在人们得到信息后,必须进行分析判断和筛选,以便正确享用信息。
一、什么是信息、文献?简要说明信息、知识、文献三者之间的关系。
1、信息、知识和文献的概念信息是由事物发出的、体现它存在和运动状态的信号和消息。
广义的信息是物质、能量存在和运动状态的表征。
狭义的信息是人类社会共享的一切知识、学问以及从客观现象中提炼出来的各种消息的总和,即现代信息。
知识是人类在改造客观世界实践中所取得的认识和经验的总和,是信息的一部分。
文献是记录有知识的一切载体。
即用文字、图形、符号或声频等技术手段记录知识信息的物质载体,或称固化在载体上的的知识信息。
2、三者关系二、科技信息检索的意义有哪些?当今世界是一个信息的世界,开放的世界,掌握的知识信息多,掌握知识信息少的人就是一种挑战;获得的知识信息快,获得知识信息慢的人就将会是一种冲击,一种压力。
因为知识信息,于人的智能开发具有决定性的作用。
一个大学生要施展其才智,仅仅依靠教师课堂传授的知识远远不够的。
必须在接受课堂传授的知识的基础上,在学习的过程中培育出独立自学和研究的能力。
这种能力的培养,是建立在充分占有信息的基础之上的。
如何去占有信息,了解、熟悉信息检索的途径和方法,合理地利用检索信息将是一条必由之路。
因为通过检索信息,它会向人们提供打开信息宝库的钥匙,指引信息所在的方向。
三、信息按出版类型和加工程度来划分分别有哪些类型?按信息的出版类型划分(1)科技图书(2)科技期刊(3)科技报告(4)会议文献(5)专利文献(6)学位论文(7)标准文献(8)政府出版物(9)产品样本按信息被加工程度划分(1)一次信息(2)二次信息(3)三次信息(4)零次信息四、什么叫检索语言?按检索词的规范化程度分哪两种类型的检索语言?检索语言,又称标引语言、索引语言、信息检索语言等,是根据检索需要而编制的一种人工语言。
按检索词的规范化程度可分为:自然语言和受控语言。
五、分类语言的优缺点有哪些?了解《中图法》结构。
分类语言的优点:体系分类语言是以学科划分类目,符合人们认识事物的规律和处理事物的习惯。