第一章 信息检索理论基础
主要知识点
(一)信息检索原理 (二)信息检索技术 (三)信息检索系统 (四)信息检索语言 (五)信息检索方法 (六)信息检索评价 (七)信息检索与数字图书馆
信息检索技术—信息检索常用技术
(1)布尔检索技术:它是利用布尔逻辑算符进行检索词 或代码的逻辑组配,是现代信息检索中最常使用的一种方法 。
信息存储(标引)过程
检
原始
信息特
索
信息特
检
文献
征提取
标
征标识
检索系统
索
信息
检索提
识
检索提
结
需求
问表达
系
问标识
标识匹配
果
统
信息检索过程
信息检索原理—信息检索及其发展
(1)信息检索(Information Retrieval)是“一种时间性的 通讯形式”,“在时间上从一个时刻通往一个较晚的时刻, 而在空间上可能还在同一地点” 。这一看法,揭示了信息 存储与获取两个环节是一种延时性的通讯形式。
(3)向量空间检索模型:向量检索是以向量的方式确定检 索内容的方法,系统中的每一篇文献和每个提问均用等长的向 量表示。如:文献集合中的第i篇文献用Di = ( T1, T2, T3, …, Tm ) 表示,其中T1, T2, T3, …, Tm为系统中所有标引词集合;提问集 合中的第j个提问用Qj = ( T1, T2, T3, …, Tm )表示;Tk表示文献向 量或提问向量中的第k个分量,即文献表示或提问式中所含的第 k个标引词或检索词。
按照狭义的理解,信息 是 信用 息来是消物除质不存定在性的的一东 西 种。 方按式照、广形义态的或理运解动, 又 状有 态两,种也认是识事:物从的本一体 意 种义 普上遍说属,性信,息一泛般指指一 切 数事 据物、运消动息的中状所态包和含运 动 的的 意方义式,。可从以认使识消论息的 意 中所义描上说述,事件信的息不是定关于 事 性物 减运少动。状态和运动方 式的反映。