电子信息检索第一章 信息检索概述
- 格式:ppt
- 大小:361.52 KB
- 文档页数:42
第一章信息检索概述1. 信息检索的概念。
狭义信息检索是指用户找出有关信息的过程。
广义信息检索是将信息按照一定的方式组织和存储起来,并根据用户的需求找出有关信息的过程。
2. 信息检索的类型(1)按照检索对象的不同划分早期分为:文献检索、事实检索、数据检索。
当前三分方法:文本检索、音频与视频检索、数值检索。
(2)按检索手段划分:手工检索、机器检索3.简述信息检索的基本原理信息检索的基本原理:对信息集合与需求集合的匹配与选择。
实现信息检索,主要涉及三个关键要素:信息集合、用户信息需求、匹配选择。
一、信息集合:信息集合是指有关某一领域的,经采集、加工的信息集合体。
二、需求集合:用户的信息需求是在社会实践活动中产生的。
当人们在完成某一任务或工作时,经常觉得缺少某些知识,这就产生了信息需求。
三、选择与匹配:要在信息集合中快速获取用户所需信息,需要信息检索提供一种匹配机制,能够把需求集合与信息集合依据某种相似性标准进行比较与判断,进而选择出符合用户需要的信息。
匹配机制至少包括两个要素:第一是匹配标准,即相似性标准;第二是执行匹配的动因。
4.计算机信息检索经历了脱机检索阶段、联机检索阶段、光盘检索阶段、网络检索阶段。
5.信息检索领域的主要研究问题有哪些?⑴信息检索理论:检索语言、检索模型、标引理论、相关性理论、知识组织与表示理论⑵信息检索工具/系统:信息检索系统的结构、功能、设计开发、管理运营、应用评价等⑶信息资源及其收集、加工:信息存储、数据库⑷检索技术与方法:文本检索技术、数值检索技术、音频与视频检索技术、网络搜索技术⑸用户研究与检索策略:用户的查询心理、检索需求及其类型、用户查询信息的行为特征等、用户信息需求分析、检索式构造、相关反馈方法、检索过程调整与控制等⑹其他密切相关的自动化处理技术:自动聚类与分类、自动摘要、信息可视化、信息过滤、信息提取、机器翻译、人机交互等。
信息检索的两种研究方式:以计算机为中心和以用户为中心,以计算机为中心的IR 问题是主流。
第一章信息检索概论思考题:1.什么是信息?简述信息的特点和分类?我们认为,信息是事物或事物之间不确定性的量度,即负熵。
掌握的信息越多,所需认识的事情的确定性就会越少。
信息由信源,信宿和信道(载体)构成。
信息的特点:(1)客观真实性:客观、真实是信息的最重要的本质特性(2)普遍性:信息是物质的普遍属性,物质是具有普遍性,所以信息也拥有该特性(3)针对性:信息的作用和价值可以随着接受者的不同而不同(4)传递性:过程:信息源(信息的发出者)——>编码—>信道(载体)—>译码—>信宿(信息的接收者)信息源:是信息的发出者信宿:是信息的接收者信息的传播是双向的,多维的。
信息源和信宿是相对的,也是可以相互转换的。
信道:就是在传播过程中,编码经过的物理通道(5)时效性:指信息发出、接收到利用的时间间隔及效率,也包括信息的本身更新速度。
客观物质不断的变化,反映事务的运动状态和运动方式的信息也会发展变化一般而言,随着时间的推移,信息的价值会逐渐减少也有反例:如考古信息(恐龙、古钱币),年代越久,使用价值越大衡量信息的时效性参数不只是时间参数,还有地理环境(6)可转换性:信息可以从一种形态转换成另一种形态(7)可处理性(可识别性):可以通过人们的感觉器官所感知,也可以通过仪表、器械来检测进而予以识别。
(8)可共享性:指同一内容的信息可以在同一时间里被若干个用户使用,此时信息载体本身的信息量不会被磨损、消失信息的类型:(1)按信息表现形式划分,可分为文字信息,图象信息,数值数据信息,语音信息。
▪文字信息:文字是人们为了实现信息交流、通信联系所创造的一种约定的形象符号。
▪图象信息:图象(形)是一种视角信息,它比文本信息直接,易于理解。
如,一幅画、一部电影。
▪数值数据信息:数值数据是“信息的数字形式”或“数字化的信息形式”。
▪语音信息:人讲话实际是大脑的某种编码形式的信息转换成的语言信息的输出,是一种最普遍的信息表现形式。
第一章信息检索概述1,什么是信息检索?它有哪些主要类型?信息检索指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程。
有目的和组织化的信息存取活动,其中包括“存”和“取”两活动。
旧分类方法:文献检索、事实检索、数据检索新分类方法:文本检索、数值检索、音/视频检索2,试分析阐述信息检索的基本原理,信息集合、需求集合、匹配与选择,信息检索三阶段及期特点?答:即信息集合与需求集合的匹配与选择。
(1)信息集合是指有关某一领域的,经采集、加工的信息的集合。
形成可供用户访问与检索的对象,在某种意义上说,它是以一种公共知识结构,它有可能弥补某个特定用户的知识结构缺陷,即可以向用户提供所需要的知识或信息,或是获取知识的线索,或者提供某种信息区激活人脑中存储的知识。
(2)需求集合:用户的信息需求是在社会实践活动中产生的。
众多用户不同形态的信息需求的汇集,就形成了需求集合的存在。
信息需求的产生与满足,是实施信息检索行为的前提与基础,也是实施信息检索行为的目的所在。
(3)选择与匹配:面对信息集合与需求集合,如何在两者之间建立起了解与沟通的桥梁,以便能够从信息集合中快速获取用户所需要或所缺少的信息与知识呢?这就需要信息检索提供一种“匹配”机制。
它的主要功能在于:能够把需求集合与信息集合依据某种相似性标准进行比较与判断,进而选择出符合用户需要的信息。
这里,我们要求匹配机制至少包括两个要素:一是匹配标准,即相似性标准;二是执行匹配的动因。
3,信息检索主要经历了哪些不同的发展阶段?各阶段有何特点?(1)手工检索阶段,主要特点可以概括为印刷文献(图书、期刊、会议、专利、学位论文)为主要检索对象;以各类文摘、题录、和目录性工具书为可利用的主要检索工具;以图书馆的参考咨询部门为开展信息检索服务的中心机构。
(2)计算机化检索阶段(脱机批处理检索时期、联机实时检索时期、联机网络化与多元化检索时间),主要特点:以各类机读数据库为检索对象;各类信息中心,联机服务中心作为新兴的信息服务部门而存在;信息检索用户逐渐由专业检索人员(检索中介)向个人终端用户转移和扩散。
《信息检索教案》PPT课件第一章:信息检索概述1.1 信息检索的定义解释信息检索的概念和意义强调信息检索在学术研究和日常生活的重要性1.2 信息检索的类型介绍不同类型的信息检索方法,如手工检索、计算机检索等解释各种检索方法的优缺点和适用场景1.3 信息检索的流程介绍信息检索的基本步骤,如确定检索需求、选择检索工具等提供实用的检索技巧和策略,帮助学生更有效地获取信息第二章:检索工具与数据库2.1 检索工具的类型介绍不同类型的检索工具,如目录、索引、文摘等强调各种检索工具的特点和适用场景2.2 数据库的类型介绍不同类型的数据库,如文献数据库、全文数据库等解释各种数据库的优缺点和适用场景2.3 检索工具与数据库的选择提供选择检索工具和数据库的依据和方法强调选择合适的工具和数据库对信息检索的重要性第三章:网络信息检索3.1 搜索引擎的使用介绍搜索引擎的概念和原理讲解如何有效地使用搜索引擎进行信息检索3.2 学术搜索引擎的使用介绍学术搜索引擎的概念和特点讲解如何利用学术搜索引擎获取学术信息3.3 社交媒体与网络信息检索介绍社交媒体在信息检索中的应用强调社交媒体在获取实时信息和社交网络分析中的价值第四章:信息检索技巧与策略4.1 检索关键词的选择讲解如何选择合适的检索关键词提供关键词选择的方法和技巧4.2 布尔逻辑检索介绍布尔逻辑检索的概念和原理讲解如何运用布尔逻辑提高检索效果4.3 短语检索与位置算符介绍短语检索和位置算符的概念和用法强调短语检索和位置算符在精确检索中的重要性第五章:信息检索实践与应用5.1 学术研究中的应用讲解信息检索在学术研究中的重要性演示如何利用信息检索进行文献综述和实证研究5.2 日常生活中的应用讲解信息检索在日常生活中的应用案例强调信息检索对提高生活质量的重要性5.3 信息检索的道德与法律问题介绍信息检索中的道德和法律问题,如版权、隐私等强调信息检索时应注意的道德和法律规范第六章:特定信息类型的检索6.1 图像和多媒体信息的检索介绍如何检索图像和多媒体信息演示使用图像搜索引擎和多媒体数据库的技巧6.2 统计数据的检索讲解如何检索统计数据介绍使用政府统计网站和专业统计数据库的方法6.3 专利信息的检索介绍如何检索专利信息演示使用专利数据库进行检索的步骤和技巧第七章:信息评估与批判性思维7.1 信息评估的标准讲解评估信息质量的标准和原则强调批判性思维在信息评估中的重要性7.2 识别信息源的可靠性介绍如何识别和评估信息源的可靠性分析不同类型信息源的可信度和偏见7.3 信息批判性思维的实践讲解如何运用批判性思维分析信息演示通过信息检索进行批判性思维实践的案例第八章:信息素养与终身学习8.1 信息素养的概念解释信息素养的内涵和外延强调信息素养在现代社会的重要性8.2 培养信息素养的策略介绍培养个人信息素养的策略和方法强调终身学习在维持和提升信息素养中的作用8.3 信息素养的实践应用讲解信息素养在个人和专业生活中的应用演示如何利用信息素养解决实际问题第九章:信息检索的未来趋势9.1 与信息检索介绍在信息检索中的应用探讨如何改变信息检索的方式9.2 大数据与信息检索讲解大数据对信息检索的影响探讨大数据时代信息检索的新挑战和新机遇9.3 未来信息检索技术的发展趋势预测未来信息检索技术的发展方向强调终身学习的重要性以适应不断变化的技术环境第十章:综合实践与案例分析10.1 综合实践项目设计设计一个综合实践项目,要求学生应用所学信息检索技能提供项目实施步骤和评估标准10.2 案例分析与讨论提供几个案例分析,要求学生应用信息检索技能解决问题鼓励学生进行讨论,分享他们的思考和经验10.3 课程总结与展望总结整个课程的重点和难点展望信息检索领域的发展前景,鼓励学生持续学习和探索重点解析本文教案主要涵盖了信息检索的概述、检索工具与数据库的选择、网络信息检索、信息检索技巧与策略、信息检索实践与应用、特定信息类型的检索、信息评估与批判性思维、信息素养与终身学习、信息检索的未来趋势以及综合实践与案例分析等十个章节。
第一章信息检索概述常见问题1.什么叫文献?信息、知识、文献三者的关系如何?答:文献是记录有知识的一切物质载体。
具体地说是用文字、图形、符号、声频、视频等技术手腕记录人类知识的一切物质载体。
信息、知识、文献之间的关系是事物发出信息,信息经人脑形成知识。
只有将自然现象和社会现象的信息通过加工,上升为对自然和社会进展客观规律的熟悉,这种再生信息才组成知识。
知识信息被记录在载体上,形成文献。
二、什么叫一次文献、二次文献、三次文献?彼此之间有什么关系?举例说明。
答:凡是以著者本人的体会、研究或研制功效为依据而撰写的原始文献,经公布发表或交流后,称为一次文献。
一次文献是文献的主体,是最大体的信息源,是文献检索的对象。
其特点是论述比较具体、详细和系统化,有观点、有事实、有结论。
一样括期刊论文、专著、研究报告、会议文献、学位论文、说明书、技术标准、技术、科技报告等。
二次文献是通过对一次文献的、提炼和浓缩而形成的。
它将大量分散、无序的信息转变成有序的、便于的系统。
文献被紧缩成条款,也称记录(entry, reference, citation, record),并以必然的序列组织起来,成为可用于查找一次文献的工具。
二次文献也称二手资料,它包括目录、题录、文摘和索引等检索工具,可对一次文献进行报导和线索指引。
三次文献是对一次文献和二次文献进行聚集、综合、分析、详述等深度加工而形成的。
它包括手册、百科全书、年鉴、名录、指南等参考工具书。
还有二次书目、指南和综述性、评论性文献都属三次文献范围。
从一次文献、二次文献到三次文献的加工反映了文献的集中和有序化进程,而用户对原始文献的索求那么往往是一个逆向的进程。
3、依照文献的媒体形式的不同,文献有哪些类型?它们的特点是什么?答:依照文献媒体形式的不同,文献可分为以下几种形式:⑴型(printed form):也称介型(paper type), 是一种以纸介质为载体、以书写或印刷方式为记录手腕而形成的文献类型。
信息检索复习思考题第一部分:信息检索概述1、信息资源的概念及其特点是什么?答:信息资源是人类存储与载体(包括人脑)上的已知或未知的可利用的信息。
信息中的载体信息和主体信息是使信息资源的最基本的组成部分。
特点:客观性,寄载性,传递性,动态性,相对性,增长性,共享性,规模性。
2、简述信息资源的类型。
答:按照信息资源的开发程度来区分,可分为潜在信息资源与现实信息资源两大类。
现实信息资源又可分为口语信息资源、体语信息资源、实物信息资源、文献信息资源、网络信息资源和多媒体信息资源。
3、什么是信息检索?其类型是什么?答:信息检索包括存储与检索两个部分。
存储是对有关信息进行选择、并对信息特征进行著录标引和组织,建立信息数据库;检索则根据提问制定策略和表达式,利用信息数据库。
这里要理解概念分析。
概念分析即将概念转化成系统语言,是存储与检索共有的过程,因此从这个意义上说,信息存储是信息检索的逆过程,两者是不可分割的一个整体。
类型:1.按检索内容分,有数据信息检索、事实信息检索和文献信息检索2.按组织方式分,可有全文检索、超文本检索和超媒体检索3.按检索手段分,有手工检索和机器检索4、信息检索的研究内容有哪些?答:1.检索理论研究2.检索语言研究3.数据库研究4.著录法研究5.标引和组织法研究6.检索系统研究7.检索策略研究8.检索服务研究第二部分:信息检索理论与方法1、如何制定检索策略?答:1.选择检索系统2.确定检索词3. 构造检索表达式4.实施检索策略2、检索词有哪些?答:1)表示主题的检索词标题词,单元词,叙词,关键词2)表示作者的检索词作者姓名、机构名3)表示分类的检索词分类号4)表示特殊意义的检索词ISBN、ISSN、引文标引词3、信息检索方法主要有哪些?常规检索法、回溯检索法、循环检索法4、据文献的内部特征和外部特征,有哪些信息检索途径?据文献外部特征和内部特征,信息检索途径分为两大类:1.以文献的外部特征为检索途径1)题名途径2)责任者途径3)号码途径2.以文献内容为检索特征1)分类途径2)主题检索3)分类主题索引5、解释著录、著录法、款目、标引。
信息检索第一章信息检索的基础理论第一节基础概念一、信息概述(一)信息的定义:信息指的是事物的存在方式和运动状态,是对客观世界中各种事物变化和特征的反映,是客观事物之间相互作用和联系的表征,是客观事物经过感知或认识后的再现。
世界三大基本要素:信息物质能量(二)信息的特征1.客观性①信息来源于物质,又不是物质本身;它从物质的运动中产生出来,又可以脱离物质相对独立地存在。
②信息业来源于精神世界,但又不限于精神的领域。
③信息是具体的,并且可以被人所感知、提取、识别,可以传递、存储、变换、显示、检索和利用。
2.普遍性3.可存储性4.可传递性5.扩散性6.共享性7.时效性(三)信息的功能1.经济功能①运用信息可以使非资源转化为资源创造财富。
②使用信息取代劳动力、资金、材料等资源创造财富,实现经济效益倍增。
③直接让信息作为商品在市场流通中创造财富。
④通过信息进行科学决策,减少失误,创造财富。
2.管理与协调功能5M资源:人、财、物、设备、管理办法信息的管理与协调功能在组织活动中的作用:①传递整个组织的运行目的,有效管理5M资源。
②调节和控制物质流和能源流的数量、方向和速度。
③传递外界对系统的作用,保持组织的内部环境稳定。
3.选择和决策功能4.研究与开发功能二、知识1.知识的概念:知识是人类社会实践经验的总结,是人的主观世界对于客观世界的概括和如实反映,是人类对自然界、人类社会以及思维方式与运动规律的认识。
2.知识的类型①显性知识和隐性知识。
②实体知识和过程知识。
③核心知识和非核心知识。
三、情报1.情报的概念:情报是具有特定传递对象的特定知识货有价值的信息。
2.情报的特征①动态性②按特定的方式传递③为特定目的服务的④常常有一定的时效性和机密性3.情报的类型零次情报:私人笔记、手稿、设计草图、会议记录、口头言论等。
一次情报:调查报告、研究报告、科学论文、专利说明书、会议文献、专著等。
二次情报:书目、索引、文摘等三次情报:综述、专题评论、年度总结、研究进展报告、数据手册、专业年鉴等。
第一章信息检索第一节信息检索概述一、信息与信息检索(一)信息的概念在我们的工作生活中,信息无处不在,无时不有,无人不用。
但信息的概念,再各个学科中的定义确不尽相同。
通常认为,信息指音讯、消息、泛指人类社会传播的一切内容。
对于出版专业技术人员来说,无论是选题策划、审稿、编辑、校对。
还是营销发行,处处都要用到信息。
与编辑出版工作有关的信息主要有两类:一类是进入编辑流程的稿件中所包含的信息;另一类是各种与出版物内容有关的信息,包括国内外形式,法律法规、党和国家的政策方针,市场信息,作译者信息,相关知识领域的动态信息,以及与编辑、宣传、促销等出版全程策划有关的信息等。
本章所讲的信息主要涉及前一类信息。
对这类信息的检索、核实,目的在于保证高建忠所传递的信息正确无误。
而后一类信息的采集和处理,再第二章讲述。
(二)信息检索的概念信息检索的概念,有广义和狭义之分。
广义上,指将信息通过一定的方式组织和存储起来,并根据用户的需求找出所需信息的过程和技术。
这包含了存储和检索两个环节。
存储过程是利用检索语言对信息进行标引,形成特征标识并输入检索工具,为检索提供有规律的检索途径。
检索可以说是存储的逆过程,即利用检索语言对检索提问进行标引,再按检索途径,对提问标引与信息的特征标识进行匹配,并从检索工具中输出。
简言之,就是用户根据自身的信息需求,搜寻存储在检索工具中的信息,进行比较、选择、匹配的过程。
狭义的信息检索仅指检索这一环节,本章所述也是狭义的信息检索。
(三)信息检索的类型信息检索可以根据检索对象的不同和操作方式的不同来进行划分。
1.根据检索对象的不同来划分根据检索对象的不同,信息检索可分为事实型信息检索、数据型信息检索和文献型信息检索。
在实际工作中,出版专业技术人员都会遇到。
事实型信息检索是以特定的事实或只是为检索对象,如某一事物(事件)的性质、定义、原理以及发生的时间、地点、过程等。
可利用的工具有百科全书、词典、年鉴、手册及相应的数据库和网络资源。
信息的基本概述一信息:1.信息的特征(5个普遍性与客观性、依存性与传递性、可知性与共享型、可扩充性与可压缩性、时效性与滞后性)2.数据信息、知识、文献、情报、智慧DIKW模型看截图3.信息检索的概念与本质(匹配过程)本质:是用户的信息需求和信息集合的匹配过程,进而满足用的信息需求的过程二信息资源(定义信息资源是人类在认识世界和改造世界过程中产生、整理、记录的有用信息的集合)1.信息资源的类型按时间的产生顺序先导信息资源、即时信息资源、滞后信息资源按传播形式口头信息资源、文献信息资源、实物信息资源按载体形式书写型、印刷型、缩微型、视听型、数字型按出版形式(十大科技情报源)图书、期刊、会议文献、学位论文、专利文献、科技报告、标准文献、技术档案、产品资料、政府出版物按加工深度(零次一次,二次)一次文献知识的首次固化期刊论文、标准、报告、文献等:是依据作者本人的科研成果而撰写的首次记录科研成果的原始文献二次文献检索工具题录,目录,书录,文摘,索引:是对分散的无组织的一次文献进行加工整理、压缩、提炼、简化、整理的产物三次文献直接提供答案百科全书,词典,手册:对大量一次文献经过综合、分析、提炼撰写而成零次文献实验数据,观察记录,手稿等:是形成一次文献之前的信息、知识、情报、即未公开记录或未公开与社会的最原始的文献,或没有正式的发表的文字材料信息资源的特点能够重复使用、具有整合性、具有流动性、共享性、实效性、动态性、不可分性、支配性信息资源的作用可以减少物质与能量的作用,从而极大提高社会劳动生产率,有利于实现国民经济的可持续发展。
信息资源已经成为了当今社会的核心资源。
信息资源的开发利用,可有效降低社会的运营成本三信息社会(概述与内容包括哪三类资源)信息素养的三个层次:基础性、自我满足性、自我实现性信息素养(IL)(定义美国图书馆协会:具有信息素养的人能够知道什么时候需要信息,能够有效的识别、获取、评价、和利用所需要的信息)信息素养的内涵:信息意识对信息的敏感程度,有效发现信息需求,是人们产生信息需求,形成信息动机和兴趣的动力和源泉信息知识信息的基本知识(相关理论、知识与方法),信息技术和知识(信息技术原理)等信息能力获取、理解、处理、表达、评价、利用、创新等信息法律与道德(又称信息伦理)了解利用信息所涉及的经济、法律和社会问题,合理、合法地获取和利用信息第二章信息检索绪论一信息检索概述信息检索概念广义:存储和查询将信息按一定的方式组织和存储,并根据信息用户需求查找所需信息的过程侠义:查询从信息集合中查询信息用户所需信息的过程(仅指从已经存贮的具有检索功能的信息集合中查询出所需要的信息的过程)信息检索原理信息需求与信息集合:匹配检索者将检索提问式与存储与检索系统的文献标引词进行匹配对比,取得一致性即为最符合要求的结果信息检索类型信息检索内容对象数据、事实、文献信息检索组织方式全文、超文本、超媒体信息检索的手段手工与计算机信息检索步骤6个分析课题明确需求、选择检索工具或数据库、确定检索方法、确定检索途径、查找文献检索、获取原始文献。