第三章网络信息检索工具
- 格式:doc
- 大小:124.00 KB
- 文档页数:14
《信息检索教案》PPT课件第一章:信息检索概述1.1 信息检索的定义解释信息检索的概念和意义强调信息检索在学术研究和日常生活的重要性1.2 信息检索的类型介绍不同类型的信息检索方法,如手工检索、计算机检索等解释各种检索方法的优缺点和适用场景1.3 信息检索的流程介绍信息检索的基本步骤,如确定检索需求、选择检索工具等提供实用的检索技巧和策略,帮助学生更有效地获取信息第二章:检索工具与数据库2.1 检索工具的类型介绍不同类型的检索工具,如目录、索引、文摘等强调各种检索工具的特点和适用场景2.2 数据库的类型介绍不同类型的数据库,如文献数据库、全文数据库等解释各种数据库的优缺点和适用场景2.3 检索工具与数据库的选择提供选择检索工具和数据库的依据和方法强调选择合适的工具和数据库对信息检索的重要性第三章:网络信息检索3.1 搜索引擎的使用介绍搜索引擎的概念和原理讲解如何有效地使用搜索引擎进行信息检索3.2 学术搜索引擎的使用介绍学术搜索引擎的概念和特点讲解如何利用学术搜索引擎获取学术信息3.3 社交媒体与网络信息检索介绍社交媒体在信息检索中的应用强调社交媒体在获取实时信息和社交网络分析中的价值第四章:信息检索技巧与策略4.1 检索关键词的选择讲解如何选择合适的检索关键词提供关键词选择的方法和技巧4.2 布尔逻辑检索介绍布尔逻辑检索的概念和原理讲解如何运用布尔逻辑提高检索效果4.3 短语检索与位置算符介绍短语检索和位置算符的概念和用法强调短语检索和位置算符在精确检索中的重要性第五章:信息检索实践与应用5.1 学术研究中的应用讲解信息检索在学术研究中的重要性演示如何利用信息检索进行文献综述和实证研究5.2 日常生活中的应用讲解信息检索在日常生活中的应用案例强调信息检索对提高生活质量的重要性5.3 信息检索的道德与法律问题介绍信息检索中的道德和法律问题,如版权、隐私等强调信息检索时应注意的道德和法律规范第六章:特定信息类型的检索6.1 图像和多媒体信息的检索介绍如何检索图像和多媒体信息演示使用图像搜索引擎和多媒体数据库的技巧6.2 统计数据的检索讲解如何检索统计数据介绍使用政府统计网站和专业统计数据库的方法6.3 专利信息的检索介绍如何检索专利信息演示使用专利数据库进行检索的步骤和技巧第七章:信息评估与批判性思维7.1 信息评估的标准讲解评估信息质量的标准和原则强调批判性思维在信息评估中的重要性7.2 识别信息源的可靠性介绍如何识别和评估信息源的可靠性分析不同类型信息源的可信度和偏见7.3 信息批判性思维的实践讲解如何运用批判性思维分析信息演示通过信息检索进行批判性思维实践的案例第八章:信息素养与终身学习8.1 信息素养的概念解释信息素养的内涵和外延强调信息素养在现代社会的重要性8.2 培养信息素养的策略介绍培养个人信息素养的策略和方法强调终身学习在维持和提升信息素养中的作用8.3 信息素养的实践应用讲解信息素养在个人和专业生活中的应用演示如何利用信息素养解决实际问题第九章:信息检索的未来趋势9.1 与信息检索介绍在信息检索中的应用探讨如何改变信息检索的方式9.2 大数据与信息检索讲解大数据对信息检索的影响探讨大数据时代信息检索的新挑战和新机遇9.3 未来信息检索技术的发展趋势预测未来信息检索技术的发展方向强调终身学习的重要性以适应不断变化的技术环境第十章:综合实践与案例分析10.1 综合实践项目设计设计一个综合实践项目,要求学生应用所学信息检索技能提供项目实施步骤和评估标准10.2 案例分析与讨论提供几个案例分析,要求学生应用信息检索技能解决问题鼓励学生进行讨论,分享他们的思考和经验10.3 课程总结与展望总结整个课程的重点和难点展望信息检索领域的发展前景,鼓励学生持续学习和探索重点解析本文教案主要涵盖了信息检索的概述、检索工具与数据库的选择、网络信息检索、信息检索技巧与策略、信息检索实践与应用、特定信息类型的检索、信息评估与批判性思维、信息素养与终身学习、信息检索的未来趋势以及综合实践与案例分析等十个章节。
第三章网络信息检索第一节网络信息检索的基本方法1、布尔逻辑检索逻辑检索是一种比较成熟、较为流行的检索技术。
逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符,主要的运算符有:(1)逻辑―与‖逻辑―与‖用AND(或﹡)表示。
检索词A、B若用逻辑―与‖相连,即A AND B(A*B),则表示同时含有这两个检索词才能被命中。
例如,要检索儿童教育的文献,检索逻辑式可表示为:child AND education(2)逻辑―或‖逻辑―或‖用OR(或+)表示。
检索词A、B若用逻辑―或‖相连,即A OR B(A+B),则表示只要含有其中一个检索词或同时含有这两个检索词的文献都将被命中。
例如,要检索―计算机‖或―机器人‖方面的文献,检索逻辑式可表示为:computer OR robot. (3)逻辑―非‖逻辑―非‖用NOT(AND NOT,BUT NOT)(或-)表示。
检索词A、B若用―非‖相连,即A NOT B(A-B),则表示被检索文献在含有检索词A而不含有检索词B时才能被命中。
例如,要检索有关―能源‖方面的文献,但涉及―核能‖方面的文献不要,检索逻辑式可表示为:energy NOT nuclear(energy –nuclear)。
1、搜索引擎的定义搜索引擎是提供给用户进行关键词、词组或自然语言检索的工具,简言之,搜索引擎就是一种在因特网上查找信息的工具。
用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果反馈给用户。
搜索引擎一般都有固定的显示格式,内容详简程度不一,常常带有URL、题名、标题、关键词、摘要(文本描述摘录)、超链接文件大小、检索结果总数、相关度估计、评论等。
搜索引擎的检索结果一般按查询的相关程度进行排列,最相关的通常排在最前面。
2、搜索引擎的常用检索方法(1)简单搜索(simple search)指输入一个单词(关键词),提交搜索引擎检索后反馈结果。
它也叫单词搜索。
第三章网络信息检索工具【知识框架】信息检索的一般流程网络经贸信息资源的概念与类型网络资源查询方法及检索工具▪按检索机制分:目录型(Subject directory, catalogue)索引型:搜索引擎(Search Engine)混合型(Hybrid tools)▪按检索内容分:综合型专题型特殊型▪按包含检索工具数量分:单一型(Singular search tools)集合型(Collective search tools):元搜索引擎(Metasearch Engine或Megasearch Engine 目录型检索工具(Subject directory catalogue)搜索引擎(Search Engine)▪单一搜索引擎▪集成搜索引擎检索工具的工具——指南类检索工具和元搜索引擎▪(一)网络资源指南(Resource Guide)也称学科门户SIG▪(二)元搜索引擎集合式搜索引擎、索引式搜索引擎▪(三)手工检索工具的“工具书指南”、网址簿网络版参考咨询工具(Reference Tools)智能搜索代理和搜索软件补充教材第二章:检索工具与语言检索策略【主要内容】1、信息资源检索的一般流程分析问题▪问题分类▪分析已知和欲知信息▪分析需求主题▪广泛利用文献▪选择检索范围选择检索工具▪熟悉各种检索工具从检索工具中查找所需信息获取原文2、网络信息资源的概念和类型1)按传输方式分:●WWW●FTP●Usenet/Newsgroup●LISTSERV/Mailing List●Telnet●Gopher●WAIS2)按内容加工一次加工信息▪网上图书、期刊、报纸、专利、政府出版物、会议资料等 二次加工信息▪文摘索引数据库、搜索引擎、网站导航等三次加工信息▪百科全书、手册指南等参考型网站3)格式与后缀3、网络检索工具的分类按检索机制分:▪目录型(Subject directory, catalogue)▪索引型:搜索引擎(Search Engine)▪混合型(Hybrid tools)按包含检索工具数量分:▪单一型(Singular search tools)▪集合型(Collective search tools):元搜索引擎(Metasearch Engine或Megasearch Engine4、目录型检索工具(Subject directory catalogue)1)网络资源目录这是一种独立型检索工具,网站自身包含可检索的数据库。
网络资源目录又称网站目录、分类站点目录、专题目录或主题指南、站点导航系统、主题词典型检索工具等。
这是一种将网络资源搜集后,按某种分类法进行组织整理,并和检索法集成在一起的信息检索方式。
特点:▪人工设计和编制的、供检索的等级结构式目录(指南、导航系统)▪所收录资源经过鉴选和组织▪减少了检索中的噪音,提高了检索的准确性▪数据库的规模相对较小▪新颖性不强,(会有“死链接”dead link)▪用户要熟悉其分类体系目录型检索工具比较适合于查找综合性、概括性的主题概念,或对检索准确度要求较高的课题原理:网络资源目录一般:▪采用人工方式采集网络信息;▪通常以某种分类体系为依据,将网络信息资源分为若干领域的主体范畴,然后再细分为各学科专题目录。
网络资源目录的分类通常采用主题分类法、学科分类法、体系分类法。
一个网络资源目录包括许多层,第一层是总目录,将网络资源分成若干领域的主题范畴,然后链接到第二层专题目录,再链接到第三层子目录,依次而下,直至具体的信息资源,形成一个由信息链组成的树状结构。
有代表性的目录型检索工具:Yahoo 分类目录检索;开放目录项目(Open Directory Project ,简称ODP);5、搜索引擎(Search Engine)特点:-收录、加工信息的范围广、速度快;-检索功能强,一般可称为网络资源的关键词索引;-检索时直接输入关键词或词组、短语,无需判断类目归属,比较方便;-标引过程缺乏人工干预,准确性较差-检索误差(噪音)较大搜索引擎适合于检索特定的信息,及较为专、深、具体或类属不明确的课题工作过程:单一搜索引擎的结构一般由三部分构成:信息采集、索引数据库、用户检索。
用户所熟悉的只是占搜索引擎很小部分的人机交互界面——用户通过这一界面输入需要检索的信息,系统则反馈给用户相关的信息。
构成搜索引擎主要内容的是不为用户熟悉的后台部分,即作为搜索软件程序的“Robot”、“Crower”、“Spider”。
这类程序能自动地在网上漫游,从一个或一组URL开始访问,并进行本地索引,同时记录该URL所指的HTML文件中所有的新的URL链接,不停地以找到的URL为起点进行本地索引,直到再没有满足条件的新的URL地址或超出了某些限制。
自动采集信息是搜索引擎的主要功能。
自动索引程序要对HTML文档中的超文本标记进行分析,提取出符合用户需要的主要内容,并存放在信息库中。
这些软件会定期或不定期地拷贝所访问的国际互联网主机的内容,然后由提供检索服务的公司或单位统一进行标引和组织。
自动索引程序将采集和标引的信息汇集成索引数据库,并随时顺着链接跟踪网上新加入的主页,为其建立索引,这是搜索引擎提供检索服务的基础。
不同检索工具的数据库一般根据各自的信息资源采集的范围和侧重点设计而成,分类体系差别较大,没有统一的、严格的标准,收录的范围不一样,规模也不一样。
数据库收录的内容一般有:网站的名称、标题、网址URL、网页的长度、相关的超文本链接点、关键词、内容简介或摘要等。
工作原理:搜索引擎通常使用两种技术实现信息检索。
▪一是使用网站分类技术,即把网站进行树状的归类,对每个网站都有简略的描述(如雅虎)。
其优点是为网络信息导航带来方便;缺点是这种描述不能深入到网站内部,造成信息丢失。
•二是使用全文检索技术,全文处理的对象是文本,通过网页抓取程序对大量网页数据建立由字(词)组成的倒排索引,以便使用户用关键词对文档进行查询,系统则返回含该关键词的网页。
6、单一搜索引擎的结构单一搜索引擎的结构一般由三部分构成:信息采集、索引数据库、用户检索.7、检索工具的工具——指南类检索工具和元搜索引擎1)网络资源指南(Resource Guide)网络资源指南,一般被称为指南类检索工具, “网络检索工具的工具”,是为用户筛选质量好、效率高、符合需求的网络检索工具,并指出检索途径和方法的网络指南。
特点:网络指南多为大范围的网络链接,一般不直接提供检索结果,但却为人们检索其他各类网络信息提供重要的检索入口。
这类指南可以克服搜索引擎检索结果杂乱的弱点,通过对网络专业信息资源的挖掘、采集、加工、整理和序化重组,形成一个专门为专业用户服务的信息资源指南,使检索更为系统、有序、快捷。
这类指南使用的名称也多种多样,如虚拟图书馆的“咨询中心”、资源链接中心、资源索引(Resources Index)等。
2)学科信息门户学科信息门户,亦称门户网站、信息门户(Subject Information Gateway),是将特定学科领域的信息资源、工具和服务集成为整体,为用户提供可靠的网络学科信息导航、方便的信息检索和服务入口。
作用:通常为用户提供对因特网上信息和应用的“密集”访问方式,将来自不同信息源的信息集中在一个页面上,帮助用户通过统一的入口检索不同网站的信息,而无需逐个访问单独的网站。
这种信息组织方式,再加上个性化服务和各种附加服务(如公共信息、邮件、信息订阅等),逐渐演变成为网络信息检索的又一高质量工具。
特点:1)在线提供对若干站点和文档的链接;2)通过人工筛选信息;3)智能地产生包括注解和评论在内的内容描述信息(如元数据),有的提供信息的分类和主题标引;4)智能地构建分类浏览结构;5)支持手工构建单个信息资源的(书目)元数据。
与搜索引擎的比较:学科信息门户:▪主要不是通过自动化手段来获取和组织信息,而是采用人工选择和标引保证信息的质量,使之在数量上少而精;▪在信息组织上采取分类浏览结构;▪在检索手段上不仅支持传统的基于数据库的字段检索、截断检索等功能,还支持在主题词表、后控词表支持下的智能检索.3)元搜索引擎元搜索引擎又称为集合式搜索引擎、索引式搜索引擎,它将多个搜索引擎集成在一起,并提供一个统一的检索界面。
当用户发出检索请求后,通过转义在多个单一搜索引擎中查询,对查询结果进行处理(归并、删除重复、校验连接、按相关度排列结果),然后返还给用户。
换言之,这是一种“引擎的引擎”,或“引擎指南”,使用户能在更广的范围内,更方便快捷地进行检索。
这类搜索引擎的代表是WebCrawler、InfoMarket等。
元搜索引擎的类型:元搜索引擎可分为三种类型:搜索引擎目录、多元搜索引擎和多元搜索引擎的其他衍变形式。
搜索引擎目录▪这是一种采用关键词检索、非独立型的检索工具。
▪它把主要的搜索引擎集中在一起,并按类型或检索问题编排组织成目录,帮助用户根据需要来选择适合的搜索引擎。
搜索引擎目录集中罗列检索工具,使用户能方便地选择相应的工具进行检索,检索的还是某一搜索引擎的数据库,与普通单一搜索引擎的检索是一样的。
常用的搜索引擎目录有ALL-in-one、CUSI、iTools!、悠游、北极星等;还有:iTools: /;百度常用搜索导航:/life/;多元搜索引擎▪这也是一种采用关键词检索、非独立型的检索工具。
多元搜索引擎将多个搜索引擎集成在一起,提供一个统一的检索界面,并将一个检索提问同时发给多个搜索引擎,同时检索多个数据库。
用户输入检索式后,检索工具将其译码,将检索式同时传送到几个搜索引擎,再将检索结果统一汇集整理后提交给用户。
较有代表性的元搜索引擎:Dogpile: Metacrawler: /: 万纬搜索: /多元搜索引擎的其他衍变形式▪(1)“一站式搜索引擎”(one-stop search engine)没有多元搜索引擎的调度机制和显示机制,因此不能综合显示结果。
在编制原理上它与网络资源目录的原理极为相似,在一级标题下列出二级标题,甚至三级标题。
用鼠标点击各级标题得到搜索该主题的搜索网页或网站,然后再根据网站的检索原理进行检索。
这种检索工具除可采用标题检索外,还可以使用关键词进行检索。
这类检索工具主要有:▪Web-search( )、▪ ( )、▪ ( )等。
▪(2)链接多个搜索引擎的搜索引擎的工作原理是用户在检索框中输入检索式后,检索式同时在几个搜索引擎上运行,然后在一祯屏幕上显示出在几个搜索引擎上检索的结果。
与上述多元搜索引擎不同的是,它不是利用显示机制综合检索结果,而只是列出搜索引擎的名称及网址,并在搜索引擎下列出检索结果。
这类检索工具有:Dogpile ()等.8、网络版参考咨询工具(Reference Tools)书目类检索工具有报道出版信息的出版商网站、在版书目数据库、出版在线;报道文献收藏信息的数字图书馆目录、联机目录。