第三章 计算机检索基础知识
- 格式:ppt
- 大小:2.56 MB
- 文档页数:39
第三章计算机检索基本知识第一节计算机检索概论一、计算机信息检索的含义:计算机检索是指人们在计算机或计算机检索网络的终端机上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出需要的信息,继而再由终端设备显示或打印的过程手工检索:人查找书本式检索工具(文献条目)计算机检索:人检索指令计算机查找数据库(文献条目)相同点:均需经过标引,提炼出文献标识不同点:前者按主题词、分类、著者等进行编排;后者按文档号编排(检索时自动生成索引文档)手工检索的特点(和计算机检索相比较):优点:1.发展早,可检索的时间范围广2.所有内容都呈现在读者面前,容易对比并发现新的线索缺点:1.查找繁琐,效率低下2.只能查找原文的线索,无法直接获取全文3.检索途径相对较少,且无法灵活地编制检索策略计算机检索系统:检索者,检索终端(PC机,同时也是输出端),网络(或通信电缆),数据库存储服务器检索终端服务器(数据库终端通信网INTERNET结果返回结果输出计算机检索系统的类型脱机信息检索系统----单台计算机;定期(一个或半个月)检索一次;专职检索人员统一处理,用户接触不到计算机;用作大批量的定题信息检索联机信息检索系统----一台主机带多个终端,相互独立的终端可同时进行检索;对用户的提问能及时处理,用户可随时修改提问;通过专用信息网,可跨国家进行检索光盘信息检索系统:数据存储在光盘(一种用激光记录和读取信息的盘片),通过检索软件,利用计算机和光盘驱动器进行检索。
可形成光盘检索网络。
网络化(internet)信息检索系统:同联机检索系统的主机和用户终端的主从关系不同,客户机和服务器是对等的关系计算机检索的发展脱机批处理检索时期Off-lineBatchProcessing(1954---1964)联机实时检索时期On-line Real Time(1965--- 1975)联机网络化与多元化检索时期 (1976---1990)Internet 网络化检索时期 (1990---至今) 二、数据库字段(field)在前面的课中讲过电子型信息资源,包括机读数据库(网络数据库、光盘数据库)和网络信息资源等。
计算机信息检索基础知识一、布尔逻辑与检索功能当人们使用计算机在数据库检索系统或互联网中进行检索时,常常需要用多个概念所对应的多个关键词的组合进行检索,仅用一个概念对应的关键词很难完成复杂内容关系的检索要求。
通常,一个检索要求中涉及到的多个概念之间与布尔逻辑的“与”、“或”、“非”都可以通过分析找到明确的对应关系。
即使用关键词和反应关键词之间关系的布尔逻辑运算符、通配符等相关组配符号(含逻辑算符、优先符即括号、位置算符以及英文检索时常用的截词符或通配符),我们就可以将现实中需要检索的内容或翻译成计算机、网络能够认识的形式或语言,输入到计算机中进行检索,得到我们所要的信息资料,完成检索。
下面简单介绍布尔逻辑中的三个基本运算“与”、“或”、“非”。
1、逻辑“与”计算机检索中“与”逻辑关系的常见表示有:“与”、“AND”、“and”、“*”等。
逻辑“与”关系的含义:表示概念A和概念B之间的相交关系,经过“与”运算处理后的表达式:“概念A”AND“概念B”表示一种同时含有概念A和概念B成份的内容,它已经既不是概念A,也不是单纯的概念B了,该操作使关注的范围缩小了。
如下图所示公共的阴影部分。
例如:概念A=艺术,概念B=舞蹈,则概念A、概念B的“AND”逻辑表达式:“概念A”AND“概念B”也即“艺术”AND “舞蹈”则表示要检索那些既讲艺术同时又提到舞蹈的信息资源,或者主要讲舞蹈同时又提到艺术的文献信息资源。
2、逻辑“或”计算机检索中“或”逻辑关系的常见表示有:“或”、“OR”、“or”、“+”等。
逻辑“或”关系的含义:表示概念A或概念B本身或者两者之间的叠加关系。
经过“或”运算处理后的表达式:“概念A”OR“概念B”表示含有“概念A”或含有“概念B”或两个概念都包含,该操作使关注的范围扩大了。
如下图所示所有的阴影部分。
例如:概念A=艺术,概念B=舞蹈,则概念A、概念B的“OR”逻辑表达式:“概念A”OR“概念B”也即“艺术”OR “舞蹈”则表示要检索那些含有艺术,或者含有舞蹈,或者两者都涉及的文献信息资源。