第四章信息检索原理与检索语言
- 格式:ppt
- 大小:421.00 KB
- 文档页数:3
第一章信息检索概论思考题:1.什么是信息?简述信息的特点和分类?我们认为,信息是事物或事物之间不确定性的量度,即负熵。
掌握的信息越多,所需认识的事情的确定性就会越少。
信息由信源,信宿和信道(载体)构成。
信息的特点:(1)客观真实性:客观、真实是信息的最重要的本质特性(2)普遍性:信息是物质的普遍属性,物质是具有普遍性,所以信息也拥有该特性(3)针对性:信息的作用和价值可以随着接受者的不同而不同(4)传递性:过程:信息源(信息的发出者)——>编码—>信道(载体)—>译码—>信宿(信息的接收者)信息源:是信息的发出者信宿:是信息的接收者信息的传播是双向的,多维的。
信息源和信宿是相对的,也是可以相互转换的。
信道:就是在传播过程中,编码经过的物理通道(5)时效性:指信息发出、接收到利用的时间间隔及效率,也包括信息的本身更新速度。
客观物质不断的变化,反映事务的运动状态和运动方式的信息也会发展变化一般而言,随着时间的推移,信息的价值会逐渐减少也有反例:如考古信息(恐龙、古钱币),年代越久,使用价值越大衡量信息的时效性参数不只是时间参数,还有地理环境(6)可转换性:信息可以从一种形态转换成另一种形态(7)可处理性(可识别性):可以通过人们的感觉器官所感知,也可以通过仪表、器械来检测进而予以识别。
(8)可共享性:指同一内容的信息可以在同一时间里被若干个用户使用,此时信息载体本身的信息量不会被磨损、消失信息的类型:(1)按信息表现形式划分,可分为文字信息,图象信息,数值数据信息,语音信息。
▪文字信息:文字是人们为了实现信息交流、通信联系所创造的一种约定的形象符号。
▪图象信息:图象(形)是一种视角信息,它比文本信息直接,易于理解。
如,一幅画、一部电影。
▪数值数据信息:数值数据是“信息的数字形式”或“数字化的信息形式”。
▪语音信息:人讲话实际是大脑的某种编码形式的信息转换成的语言信息的输出,是一种最普遍的信息表现形式。
第一章绪论1.1 信息素养与信息教育信息素养,又称信息素质、信息能力,是一个综合性的整体概念,它是将信息意识、信息道德、信息需求动力、信息工具和信息源以及信息评估、吸收与利用有机结合而获得的一种综合能力。
1.2 信息的基本概念信息与知识、情报、文献的联系与区别:信息是指对各种事物的存在方式、运动状态和相互联系特征的一种表达和陈述,是自然界、人类生活和人类思维活动普遍存在的一切物质和事物的属性。
知识来源于信息,是信息的一部分。
是一种特定的人类信息,信息只有经过科学的系统的加工才能上升为知识。
情报是为了解决一个特定问题所需的知识,是激活了的知识,是知识经传递并起作用的部分。
有三个基本属性:知识性、传递性和效用性。
它虽然属于信息的范畴,但不是一般的信息,而是一种特定信息。
文献是记录有信息的一切载体,文献中蕴含着大量的知识和信息,这些知识、信息被用户利用时就转化为情报。
情报源于知识,知识源于信息,文献是信息、知识情报的主要载体形式。
1.3 信息源与信息媒体信息源,就是信息的来源,即人们在科研活动中、日常工作以及其他一切社会实践中所产生的成果和各种原始资料,以及对这些成果和原始资料加工整理而得到的成品等,是能为满足人们特定需要而产生信息的源泉。
按照其存在形式可分为三类:口头信息源、实物信息源和文献信息源。
一次信息媒体:即原始信息媒体或第一手资料,主要是指报道新发明、新创造、新知识、新技术的原始资料,以及直接记载的科研成果调查报告经验总结等,通常亦称原始文献、一次文献。
如期刊文献、会议文献、科技报告/研究报告、专利文献、学位论文、政府出版物、标准文献、科技档案、产品资料等。
第二章信息检索系统概述2.1信息检索系统类型计算机检索系统:其核心是数据库,它是由一个或多个文档构成的大量数据的集合。
按计算机检索系统所含信息资源内容的形式不同分为五种类型:1书目型数据库:存某个学科领域的二次文献信息(文摘或题录)的数据库,提供原始文献信息的梗概和线索。
第二章信息与信息资源第一节信息、知识、情报和文献一、信息、知识、情报和文献的1、信息信息是客观存在的事物现象,是生物体或具有一定功能的机器可以感知的客观事物发出的一切有意义的信号和信息。
2、知识知识就是人类认识的成果或结晶,知识也就是信息,是信息的高级形式。
3、情报情报是指用不同的方法和手段,在有效的时间内所获得的有针对性和有价值的知识。
4、文献人们用文字、图形、符号、声频和视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或设置在感光胶片上,或录制在胶片上,或存储在磁带、磁盘上。
这种附着在各种载体上的知识,统称为文献。
文献就是记录有知识的一切载体。
5、信息社会建立在以知识生产、分配、加工和利用基础的新型社会。
第二节信息资源的类型一、按出版形式分1、图书2、期刊3、科技报告4、会议文献5、学位论文6、专利文献7、标准文献8、技术档案9、产品资料10、政府出版物二、按加工内容的深度分1、零次文献未经公开发表或未交流的文献2、一次文献是指以作者本人的研究成果为依据而创作的原始文献。
如学术报告、报刊论文、科研报告、学位论文、档案资料、会议论文等。
3、二次文献二次文献是对具有信息检索价值的一次文献进行搜集、整理、加工、提炼,按一定顺序组织起来的文献。
主要包括书目、索引、文摘、题录等。
是用来报道和检索一次文献的检索工具或检索系统。
4、三次文献是指利用二次文献,搜集大量一次文献进行研究,经过系统整理综合分析而撰写出来的文献。
主要包括综述、年鉴、词典、手册等。
第三章信息检索第一节信息检索概述一、信息检索的定义广义的讲,信息检索就是将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。
它包括信息存储和检索两个过程。
狭义的讲,信息检索是从信息集合中找出所需要的过程,即信息的检索过程。
二、信息检索原理信息检索的基本原理就是将信息存储和检索两个过程中的存储特征标识和检索提问标识进行对比,二者匹配达到一致,即可获取符合条件的信息。