信息检索语言及其利用.
- 格式:ppt
- 大小:3.72 MB
- 文档页数:50
信息检索的方法
1. 通过关键词检索:将用户输入的关键词与文本中的内容进行比对,找出包含这些关键词的段落或句子,作为检索结果。
2. 通过全文检索:将用户输入的关键词在整个文本中进行匹配,找出与关键词相关的段落或句子。
3. 通过索引检索:建立一个索引库,包含文本中的关键词及其所在的位置信息。
用户输入关键词后,直接在索引库中查找,减少搜索时间。
4. 通过相似度匹配:将用户输入的关键词与文本中的内容进行相似度计算,找出与输入最相似的段落或句子。
5. 通过语义分析:利用自然语言处理技术,对用户输入的关键词进行语义分析,将其转化为与文本内容相匹配的查询语句,进行检索。
6. 通过文本分类检索:对文本进行分类,用户输入关键词后首先确定查询的文本类别,再在该类别下进行检索。
7. 通过专家系统检索:建立一个专家系统,根据用户输入的关键词,系统能够根据预先设定的规则和知识库提供相关的检索结果。
8. 通过链接分析:根据文本之间的链接关系,找出与输入关键词相关联的文本内容,作为检索结果。
9. 通过用户反馈的改进:根据用户对检索结果的反馈,不断优化检索算法,提高检索效果。
10. 通过深度学习方法:利用深度学习模型,对文本内容进行分析和建模,找出与用户输入关键词相关的内容。
第六章文献信息检索与利用第一节文献信息检索基础知识随着科学技术日新月异地发展,人类步入了信息时代,人们交流、学习及生活的方式已随之发生了巨大的变化。
在这些变化中,我们时刻感受着文献信息资源的多元化利用及信息的多样化服务。
如今,文献信息资源已同物质资源、能源资源并列成为现代社会资源的三大支柱。
文献信息作为一种资源在社会生产和人类生活中起着越来越重要的作用,特别是对中小学生进一步拓展知识视野,有效地提升自我学习能力方面成为了一项必备的基本素养。
为了更好地掌握这项技能,从小学起就对学生进行信息教育,提高利用信息意识和获取信息技能,掌握文献信息的相关知识是很必要的。
一、文献信息检索概述1.文献信息检索的概念文献信息检索是从文献信息资源集合中找出所需文献信息的过程。
从广义上讲,文献信息检索包括两个过程:一是文献信息的存储过程。
存储是选择文献信息、按规范化语言文本揭示与描述文献信息内、外特征并使其有序化。
即对大量有关信息集中起来,并对信息的外表特征和内容特征进行著录、标引和组织,经过整理、分类、归纳等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。
二是文献信息检索过程。
检索是系统根用户提问按规范化语言进行概念转换,经逻辑匹配输出与提问相关的文献信息。
即是指运用编制好的检索工具或检索系统,查找出满足读者要求的特定信息。
狭义的检索是指依据一定的方法,从已经组织好的大量有关文献集合中,查找并获取特定的相关文献的过程。
综上所述,文献信息检索就是将文献信息按照一定的方式组织和存储起来,并能根据用户的需求,找出其相关文献信息的过程。
2.文献信息检索类型文献信息检索按不同的标准可以划分为不同的类型,下面介绍两种目前比较普遍的划分方法。
(1)按文献信息检索存储和检索内容划分。
按文献信息检索存储和检索内容划分:可分为文献型检索、事实型检索和数据型检索。
①文献型检索:是指利用文摘、题录、索引、目录等二次文献信息,查找文献线索和根据文献线索查找原始文献。
一、判断题1.检索语言专门用于计算机的信息检索系统,其实质是表达一系列概括信息内容的概念及其相互关系的概念标识系统。
错2.检索系统通常以书本、卡片、表册的集合形式出现,如:书目、索引、文摘、年鉴、手册等。
错3.百科全书属于二次信息。
错4.在信息社会中,一个人如果不具备良好的信息素养、没有掌握现代信息技术的基础知识和基本技能,就会成为“信息盲”。
对5.信息检索就是所有信息用一定的方法被预先组织存储起来的,我们就用该工具和该系统提供的检索方法把它找出来。
检索工具和检索方法就是“索宝图”,帮助我们找到这些宝藏。
对6.相对于传统社会的信息环境来说,如今人类所面对的主要问题不是信息知识的匮乏和停滞,而是信息总量的无限膨胀。
对7.1989年,美国图书馆协会在一份《关于信息素养的总结报告》中提出,具有信息素质的学生必须具有的能力是:能够有效地、高效地获取信息;能够熟练地、批判地评价信息;能够精确地、创造地使用信息。
错8.美国未来学家阿尔温·托夫勒在《第三次浪潮》(1980年)中把第二次浪潮即工业化社会的特征归纳为规格化、专业化、同步化、集中化、最优化和集权化这6个相互联系的方面。
错9.后组式检索语言指表达文献主题概念的标识,在编制检索语言词表和标引文献时不预先组配,而是在检索时,根据实际需要,按照级配规则临时进行组配的检索语言。
对10.索引与目录的主要区别在于:目录是对某一种出版物作整体的著录,索引可将文献所包括的若干信息分析摘录出来作为排检标识。
对11.一般地说,仅文献信息的外表特征可成为检索的切入点。
错12.网络搜索引擎是一种专门为组织与检索网络信息资源使用的检索工具,也是数据库一种特殊形式。
对13.信息的查询首先需要人工或借助一些智能工具,如爬虫根据需要有目的地收集所需的信息资源。
错14.信息检索依据检索方式可以划分为:传统手工检索、计算机数字化信息检索和书目检索。
错15.检索语言是用来描述文献特征和表达检索提问的一种自然语言。
信息检索与利用_C一单选题1. 我国最早的词典是()《字林》《史籀篇》《说文解字》《尔雅》本题分值: 5.0用户得分: 5.0用户解答:《尔雅》标准答案:《尔雅》2. 现有文献记载中我国最早的群书目录是()《别录》《汉书·艺文志》《七略》《兵录》本题分值: 5.0用户得分: 5.0用户解答:《兵录》标准答案:《兵录》3. 根据用户提出的课题,提供某一时间以前文献的检索方式称为()回溯性检索定题检索顺排档检索机械检索本题分值: 5.0用户得分: 5.0用户解答:回溯性检索标准答案:回溯性检索4. 用户在与检索系统交流时,常常不能正确而完整地描述出自己的信息需要,这种状态即是“知识的非常状态”。
提出该观点的学者是()。
R.莫里斯N.J.贝尔金P.英格维森M.陶伯A.肯特本题分值: 5.0用户得分: 5.0用户解答:N.J.贝尔金标准答案:N.J.贝尔金5. 信息素质这一概念最早是由美国信息产业协会主席()于1974年在给美国政府的报告中提出来的。
Paul ZurkowskyV. BushC.N.MooersF.W.HortonC.E.Shannon本题分值: 5.0用户得分: 5.0用户解答:Paul Zurkowsky标准答案:Paul Zurkowsky6. 我国第一部有系统的字典是()。
《尔雅》《说文解字》《康熙字典》《字林》《史籀篇》本题分值: 5.0用户得分: 5.0用户解答:《说文解字》标准答案:《说文解字》7. ()是有语法、语义关联的信息结构。
符号数据信息知识本题分值: 5.0用户得分: 5.0用户解答:知识标准答案:知识8. 情报是激活了的()。
信息数据知识符号本题分值: 5.0用户得分: 5.0用户解答:知识标准答案:知识9. 共性最强的一种检索途径是()分类途径主题途径著者途径专用途径本题分值: 5.0用户得分: 5.0用户解答:著者途径标准答案:著者途径10. 揭示文献外表特征的是()书目文摘索引题录本题分值: 5.0用户得分: 5.0用户解答:书目标准答案:书目二判断题1. 随着缩微文献、声像资料以及大量电子文献的发展,传统的纸质文献将会迅速地退出历史舞台。
信息检索与利用一、解释Internet的概念Internet的全称是Inter-network,中文译成因特网、互联网或网际网,是通过通信媒介连接的世界性计算机网络的总称。
二、陈述接入Internet的基本方式1.利用电话线和通讯软件拨号连接;2.利用SLIP或PPP协议与一台上网主机连接;3.网络连接三、熟悉Internet提供的服务1.电子邮件(E-mail) ;2.文件传输(FTP);3.远程登录(Telnet);4.网络新闻(USENET);5.网络检索工具Gopher、WAIS、Archie等;6.万维网(WWW);7.电子公告栏(BBS);8.网上寻呼(ICQ);9.网上聊天(IRC)。
四、熟悉E-mail、FTP、Telnet、WWW的基本概念及使用(一)电子邮件1.概念:一种通过Internet与其它用户进行联系,方便、快捷、价廉的现代化通信手段。
2.电子邮件系统的功能:邮件起草与编辑、发送邮件、收信通知、读取与检索邮件、答复与转发邮件、退信说明及邮箱管理等。
3.电子邮件的地址:userid@hostname,地址中不能有空格。
4.电子邮件的格式:邮件头(mail header)和邮件体(mail body)。
(二)FTP1.概念:提供了任意两台计算机之间相互传输文件的功能。
2.常用命令:put和Mput命令;Ascii和Binary命令;(三)Telnet是指在网络通讯协议Telnet的支持下,用户的计算机通过Internet暂时成为远程计算机终端的过程。
(四)WWW1.概念:WWW是World Wide Web的缩写,也被简称为3W或Web,通常译为全球网、万维网。
它是一个把信息检索技术与超文本(Hyper Text)技术相融合而形成的环球信息系统。
超文本有两个含义:其一是信息的表达形式;其二是信息间的连接方式。
2:URL:URL(Uniform Resource Locator)是指统一资源定位器,实际是一个标识文件类型及所在WWW地址的字符串。