第3章 信息检索基本理论
- 格式:ppt
- 大小:4.39 MB
- 文档页数:98
信息检索基本理论信息检索基本理论信息、知识、文献及其之间的关系信息源信息检索及分类信息检索原理信息检索语言信息检索技巧信息检索方法信息检索的策略与步骤源于拉丁字informatio 。
港台地区又译为资讯。
辞海1989 年版的解释为音讯、消息。
信息论创始人香农(non ): 信息是用于消除信宿对信源发出何种消息的不确定性的东西. 控制论的创始人维纳(N.Wiener ):信息是人们同外部世界进行交换的内容的名称。
信息既不是物质也不是能量国家标准对信息的定义:物质存在的一种方式,一般指数据、消息中所包含的意义,可以使消息中所描述的事件的不定性减少。
狭义:主体通过各种认知方法获得并经过收集、记录、处理后以某种形式存储起来的事实或数据。
信息的特性:物质性、传递性、可扩充性、共享性、价值不定性。
知识(knowledge )概念:是人类社会实践的总结,是人的主观世界对客观世界的如实反映。
分类:按载体分:隐性知识和显性知识。
按领域分:哲学知识,社会科学和自然科学。
按用途分:科学知识,技术知识和文化知识。
同信息的关系:将反映自然现象和社会现象的信息经过加工,上升为对自然和社会发展客观规律的认识。
文献(document) 国际标准化组织《文献情报术语国际标准》对文献的描述是:“为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,摄制在感光片上,或录到唱片上,或存贮在磁盘上,这种附着在各种载体上的记录统称为文献”我国颁布的《中华人民共和国国家标准??文献著录总则》对文献定义为:“文献是记录有知识和信息的一切载体。
”三者的关系信息源(information sources )信息源概念源:“水流起头的地方”(《现代汉语词典》)信息源:信息的来源、出处。
广义的信息广义的信息源的概念“万物皆是信息源”狭义的信息狭义的信息源的概念信息源的类型按信息源产生的时间顺序来划分:先导信息源、即时信息源、滞后信息源。
第三章计算机信息检索计算机信息检索的发展计算机检索主要经历了以下四个阶段(1)脱机检索阶段(1954-1964年)早期应用系统,利用单台计算机,以磁带作为存储介质,进行的批量或定题检索。
已基本淘汰。
脱机检索(Offline Retrieval),即批处理检索,1946年世界上第一台电子计算机问世后,20世纪50年代初就有人开始研究其在信息检索领域的应用。
1954年,美国海军武器实验站图书馆在一台电子管计算机上建立了世界上第一个计算机检索系统。
(2)联机检索阶段(20世纪60年代-80年代)进入20世纪60年代,计算机检索进入了实用和全面发展阶段。
20世纪60年代末,数据通讯网络出现,大容量计算机分时系统和强功能检索软件研制成功,使脱机检索发展到联机检索并迅速得到了推广。
20世纪70-80年代,联机检索得到迅速发展,一些联机检索系统开始向公众提供商业性服务,如DIALOG、ESA、ORBIT、BRS等许多世界著名的联机检索系统相继投入商业性运营。
联机检索的优缺点:直接利用国内外大量规范化得专业数据库进行信息检索,迅速地查到相关信息。
有较高的查全率和查准率,但联机费用较高,而且需要熟练地检索技能。
(3)光盘检索阶段 1983年,出现了一种新的存储器,CD-ROM光盘。
光盘检索具有储量极大而体积微小,要求设备简单,可随地安装,使用方便、易于操作,检索费用低(不需要昂贵的联机检索通讯费用),具有可随时修改检索策略而具有很高的查全率和查准率等优点,因而至今仍被世界各地广泛应用。
(4)网络化检索阶段进入20世纪90年代,随着卫星通讯、公共数据通讯、光缆通讯技术以及信息高速公路事业在全世界的迅猛发展,计算机情报检索走向了全球大联网。
网上资源具有信息的时效性、内容的广泛性、访问的快速性、搜索的网络性和资源的动态性五大特点,那么要及时、准确、有效地获取与自身需求相关的实用信息,对所有网络用户都非常具有挑战性。
计算机信息检索原理计算机信息检索是指人们在计算机检索网络或终端上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需要的信息,然后再由终端设备显示和打印的过程。
1. 信息资源有用的、有序的信息集合。
有用性和有序性是信息资源的两个重要特征。
2. 信息资源的类型实物信息资源体载信息资源文献信息资源网络信息资源文献信息检索课涉及的检索对象:文献信息资源、网络信息资源3. 信息资源的级别信息资源是分级的,以文献信息资源为例,分为一次文献、二次文献和三次文献。
一次文献:论文、著作、教材、专著。
(原始文献)二次文献:是将众多分散无序的一次文献进行加工、整理,并对其主要的外部特征和内容特征进行压缩进而组织成的一个有序化的文献信息集合,其功能在于帮助读者查找一次文献。
二次文献一般也称检索工具,如图书的书目、论文的索引和磁盘、光盘、数据库的目录等都属于二次文献范围。
三次文献:述评、综述、学科总结、年鉴、手册、进展、指南等。
三次文献也称高次情报,获得一篇较高水平的综述或述评,可以使读者以最快的速度、最省力的方法掌握特定信息。
4. 信息获取流程一次文献二次文献三次文献5.信息检索定义信息检索又称信息存贮与检索,是指工作人员按一定方式将信息组织、存储起来,并针对用户需求找出所需信息的过程。
对信息用户来说,信息检索指信息的查找过程。
6.信息的定义信息不是事物本身,是事物的特征和状态。
7.文献定义“文献是记录有信息的一切载体,它以文字、图形、图象、符号、声频、视频为记录手段,将一定信息记录在物质载体上,形成的存储或传播信息的工具。
[10]”8.文献信息/网络信息的特征信息、载体(网址)、记录手段是文献信息三大特征。
9. 文献信息的检索路径检索路径一定要围绕信息、载体(网址)和记录手段这三大特征展开描述。
从文献信息特征出发,检索路径要覆盖DOI号、题名、关键词、主题词、分类号、文摘、正文、作者、作者单位、基金项目等特征。
从文献载体特征出发,检索路径要覆盖ISSN号、ISBN号、AN号、网址、刊名、年、卷、期、页、出版者、出版地等特征。
从记录手段出发,检索路径要覆盖、语言、文字、图形、图象、声音、视频等特征。
第三章信息检索的基本理论目的要求了解信息检索系统的概念;了解手工信息检索系统的类型;熟悉手工信息检索系统的结构;掌握手工信息检索系统的著录格式和常用的手工信息检索系统的信息检索方法。
掌握计算机信息检索系统的构成和类型;掌握信息检索语言的基本类型;掌握信息检索原理。
第一节信息检索系统一、信息检索系统的概述信息检索系统是指由一定的设备和信息集合构成,具有一定存储、检索与传送技术设备,提供一定的存贮与检索方法及检索服务功能的工作系统。
简单地说,信息检索系统即信息的存贮和检索的系统。
广义:信息检索系统是包括了从信息采集到检索全过程的服务体系。
狭义:信息技术系统就是用户检索信息时所使用的检索工具。
信息检索系统具有输入功能、存贮功能、处理功能、输出功能及控制功能。
根据信息存贮和检索所设备和手段的不同,信息检索系统可分为两大类型,即:手工信息检索系统和计算机信息检索系统。
目前,信息检索系统已从传统的手工检索系统发展到计算机网络信息检索系统。
二、手工信息检索系统1、手工信息检索系统的类型书本式检索工具(期刊式检索工具、单卷式检索工具、附录式检索工具)和卡片式检索工具。
期刊式检索工具:指在一个题名之下,定期连续发行的一种检索工具。
它具有及时性、连续性和稳定性的特点。
例如各种文摘杂志、索引刊物、连续的馆藏目录等。
这种形式的检索工具,及时反映新出版、新发表、新入藏的文献信息,它随着新文献的不断出现而不断连续出版,保持与文献的平行发展关系。
因此科研工作者为了掌握和了解本学科的科研动态,定期查阅期刊式检索工具是一种非常有效的方法。
同时由于期刊式检索工具的连续性的特点,不少期刊式检索工具,每到一定时间累积后,对于回溯检索极为方便。
单卷式检索工具:这种检索工具多数是以一定的专题内容而编印的,选题一般具有独立的意义。
它专业性强,收集的文献比较集中,往往积累反映一个相当长时间的文献,并以特定范围的读者作为对象。
单卷式检索工具收录文献一般比较全面系统,排列组织比较切合专业研究的需要,因此,对于专题文献检索比较方便,使用价值较高。
第三章文献信息检索基本知识随着信息技术的发展,互联网的应用得到广泛普及,信息环境发生了相当大的变化,应用现代化技术手段获取各种信息、知识成为高等院校师生与广大科技工作者的一种必备知识和技能。
为此,首先就必须了解文献信息检索的基本知识。
第一节信息检索的基本原理一、信息检索的概念信息检索(Information Retrieval)全称为“信息存储与检索”(Information Storage and Retrieval),其概念有广义和狭义之分。
广义上认为,信息检索包括文献信息的存储和检索两个方面,即一个完整的信息检索系统由信息存储子系统和信息检索子系统两部分组成。
信息存储子系统:首先对一定数量的信息进行筛选,把能够描述文献信息的外部特征和内部特征进行加工、整理,使之有序化,形成信息特征标识集合,然后将之存储在某种载体上,编制成为检索工具或建立一个数据库。
信息检索子系统:根据信息用户的特定需求,对用户需求进行主题分析,利用一定的检索方法和检索技术,对存储子系统中的特征标识进行比对,把需要的文献线索或知识信息从系统中查找出来的过程,即信息检索。
这就是通常人们所说的信息检索过程,也就是狭义上的信息检索。
信息存储与信息检索是意义不同却又相互联系、相互依存、不可分割的两个过程。
信息存储是为了检索,信息检索又必须先有信息存储。
如果没有存储,检索就无法实现;没有检索,信息存储也就变得没有意义。
所以说存储是检索的前提和基础,检索是存储的目的。
信息检索系统的工作原理如图3-1所示。
图3-1 信息检索系统的工作原理二、 信息检索的类型信息检索可以按不同的划分标准划分为不同的类型。
(一)、 根据检索内容划分根据检索信息内容不同可划分为文献信息检索、事实信息检索和数据信息检索。
1、文献信息检索(document retrieval ):是以文献(包括目录、索引、文摘等二次文献或全文)为检索对象,查找有关文献的出处和收藏处等信息,都属于文献信息检索范畴。