信息检索分类
- 格式:pptx
- 大小:332.87 KB
- 文档页数:19
信息检索按检索对象可分为:1)文献检索(包括题录、文摘和全文);2)数据检索(包括数据、表格、公式等);3)事实检索(以某一客观事实为检索对象,查找某一事物发生时的时间、地点及过程的检索)?定题服务(意义)文献分类:一)按出版形式可分为:1)图书(50页以上的印刷方式或其他方式或单独刊物的出版物,eg:专著、汇编书、多卷书、丛书等;正式出版的图书都会有一个国际标准书号ISBN); 2)期刊:每一种期刊都有一个连续出版物编号或称国际标准刊号ISSN【附:?维普——期刊;CNKI,万方——期刊、学位论文、报纸、图书】二)按载体形式分类:1)印刷型文献/纸质型文献;2)机读型文献——1、缩微型(缩微胶卷、缩微平片),2、视听型文献(录像带、VCD、英语磁带等),3、数字化文献(光盘、磁带、数据流带等)印刷型和数字化型是主要的文献载体形式文献的级别:1)一级文献(原始文献,一般指作者的原始创作,eg数据库提供的原文,专著、期刊论文、学位论文、研究报告、会议论文、专利文献等)2)二次文献(统称检索工具,文献检索的主要工具和手段(题录、目录、索引、文摘等)3)三次文献(年鉴、进展、述评、综述等)【灰色文献/零次文献——未公开的最原始的文献】检索工具的种类——按著录格式分类:1)目录,即书目(典藏目录、联合目录);2)索引(题录,即概要,指检索工具所著录的篇目、著者、出处、语种等,但不包括文摘);3)文摘信息组织:主题词组织法——美国国立医学图书馆编制的医学主题词表MeSH是目前最权威、最常用的标准主题词表(Pubmed、中国生物医学文献数据库均采用);《中国图书馆分类法》即《中图法》是目前国内常用的体系分类语言。
截词检索:*代表一或多个字符;?代表任意一个字符;2)字段限制检索:制定检索提问在特定字段中出现,只有在指定的字段中出现与检索提问相同的记录才能被检索出来。
Eg.“提问”【字段名】;如、HIF U 【TIAB】获得信息——每条列表对应一个网页且应包含以下三个要素:标题,URL—检索出的每一条信息的地址、网址,摘要第一个搜索导航工具——雅虎——目录式(1)引号可以避免搜索引擎拆分关键词(2)《》百度的特殊用法:书名号会出现在搜索结果中;不会被拆分百度、google常用语法:1)filetype——特定文档类型的搜索。
一、名词解释信息检索:信息检索最普通的理解就是信息查找。
它是将信息按一定的方式组织起来,并根据信息用户的需求查找出有关的信息的过程和技术。
信息检索又叫做信息存储与检索(information storage and retri)。
信息检索可以分为事实检索、数据检索、文献检索。
特性检索:也称强相关性检索,强调向用户提供高度对口的信息。
强调检索的准确性,对检索结果的数量不作要求。
族性检索:也成弱相关性检索,强调向用户提供系统、完整的信息。
注重检索的全面性,要求检索出一段时间期限内有关特定主题的所有信息,对准确性要求较低。
特种文献:特种文献是一种不以书刊形式出版的文献,一般不公开发行,它包括专利文献、会议资料、科技报告、技术标淮、学位论文、政府出版物、产品样本及其说明书等。
其特点是内容涉及面广、种类多、数量大、报道快、参考价值高。
OPAC:联机图书馆公共检索目录,有开放的公共查询目录演化而来,是20世纪70年代末美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。
参考工具书:是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。
年鉴:是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。
手册:是汇集某一方面常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。
名录:是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。
搜索引擎:就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。
图书:论述或介绍某一领域知识的出版物。
期刊:期刊一般是指名称固定、开本一致的定期或不定期连续出版物。
信息检索的分类
信息检索是一种通过计算机技术实现的信息获取方式,它采用特定的搜索策略在大量
的信息资源中查找并提取相关的信息,并将其成果呈现给用户。
信息检索可以按不同的标
准进行分类,以下是常见的几种分类方式。
一、基于目的分类
根据信息检索的目的不同,可以将其分为两大类:一是用于学术研究的信息检索(包
括学术论文、科研报告、专著等学术性文献的检索);二是面向大众需求的信息检索(包
括新闻资讯、生活服务、娱乐娱乐等信息资源的检索)。
信息检索的数据源范围是信息检索的重要参数之一,通常分为以下三类:
1.全文检索:全文检索是指将整个文本作为检索对象,即将文本中的所有词语构成一
个关键词表,在该表中查找符合搜索条件的文本记录。
2.区域检索:区域检索是指将文本分成若干段落或区域,然后在这些段落或区域中进
行检索。
3.元数据检索:元数据检索是指利用文本资源的元数据进行检索,包括标题、作者、
创建日期、文件格式、主题分类等。
根据不同的检索目标,可以将信息检索分为两类:
1.内容检索:即检索某个主题、关键词等相关的文本内容。
2.地址检索:即找到与某个主题、关键词等相关的网址、链接等地址信息。
综上所述,信息检索根据目的、范围、技术和检索目标等不同标准可以分为不同类型,但是信息检索目的都是为了快速、准确获取所需信息,以满足不同用户群体的信息需求。
信息检索的种类信息检索是指使用计算机技术,通过输入关键词等方式,获取网络中的相关文本、数据和图像等信息的过程。
信息检索由于其重要性和广泛应用,已经发展出了多种检索分类。
本文将介绍信息检索的五种分类。
1. 文本检索文本检索是信息检索中最常见的形式。
这种检索是指用户输入关键词,然后计算机返回文本文件中包含这些关键词的所有文件。
文本检索可以通过基本类型、布尔运算符或者向量空间模型(VSM)等方法进行操作,其有利于搜索具有某些特定主题的文档,是最基本的信息检索。
2. 图像检索图像检索是指使用图像描述或样本图片查询相关图片的过程。
图像检索非常重要,因为纯文本检索无法满足人们对照片和其他图像的搜索需求。
图像检索可能涉及到基于颜色、文本、纹理、形状等方面的各种特征,并选择相应的图像来用于搜索。
3. 音频检索音频检索是指使用计算机技术检索音频文件,包括闻起来很棒的歌曲和其他类型的声音剪辑。
音频检索算法通常分为两种类型:基于内容的检索和基于元数据的检索。
此外,用户也可以从网络信息库中搜索他们想要的音频,比如在一些音乐网站上搜索本地或全球性的音频。
4. 视频检索视频检索是一种查询视频文件的方法,可以检索包含关键字的视频文件。
与图像检索类似,视频检索的算法通常需要基于视觉、颜色、文本、音频等多种特征进行,从而能够实现更准确的检索。
5. 数据库检索数据库检索是指通过结构化查询语言(SQL)搜索关系数据库中的记录。
这种检索可以是基于关键词、數值等方式搜索数据,也可以是基于特定的数据库软件检索;除此之外,还可以实现通过网络收集的信息库上进行搜索。
总之,信息检索是现代计算机和网络技术中的一个重要组成部分,随着信息存储和收集的不断增加,信息检索的重要性也在不断提高。
越来越多的互联网用户对信息检索进行了更为广泛的尝试,从而开拓了新的检索领域和方法。
信息检索概念及分类
一、概念
信息检索(Information Retrieval)是用户进行信息查询和获取的主要方式,是查找信息的方法和手段。
狭义的信息检索仅指信息查询(Information Search)。
即用户根据需要,采用一定的方法,借助检索工具,从信息集合中找出所需要信息的查找过程。
广义的信息检索是信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户特定的需要将相关信息准确的查找出来的过程。
又称信息的存储与检索。
一般情况下,信息检索指的就是广义的信息检索。
二、分类
(一)按存储与检索对象划分,信息检索可以分为:
文献检索
数据检索
事实检索
以上三种信息检索类型的主要区别在于:数据检索和事实检索是要检索出包含在文献中的信息本身,而文献检索则检索出包含所需要信息的文献即可。
(二)按存储的载体和实现查找的技术手段为标准划分:
手工检索
机械检索
计算机检索
其中发展比较迅速的计算机检索是“网络信息检索”,
也即网络信息搜索,是指互联网用户在网络终端,通过特定的网络搜索工具或是通过浏览的方式,查找并获取信息的行为。
(三)按检索途径划分:
直接检索
间接检索。
信息检索的分类与方法在信息时代,我们可以轻松地获得各种信息,但如何快速、准确地检索出我们所需的信息,成为了一个很重要的问题。
为此,人们研究出了许多信息检索的方法。
本文将介绍信息检索的分类与方法。
一、信息检索的分类信息检索可以分为传统信息检索和Web信息检索两种。
1.传统信息检索传统信息检索是指在计算机出现之前,人们借助书籍、报纸、杂志等传统媒介查找信息的方式。
这种方式需要人们手动进行检索,费时费力,效率低下,但它在信息分类、存储、管理等方面做得很好,有很强的逻辑性和系统性。
2.Web信息检索Web信息检索是指在计算机及互联网出现之后,利用搜索引擎等工具进行信息检索。
这种方式利用了互联网的优势,能够获取到最新、最广泛的信息,检索速度快、效率高。
但由于互联网信息量巨大,存在大量的垃圾信息和重复信息,对信息质量的判断和筛选需要更为谨慎。
二、信息检索的方法信息检索的方法可以分为主动检索和被动检索两种。
1.主动检索主动检索是指用户主动搜索目标信息的过程,在搜索引擎中输入关键词进行检索。
这种方式需要用户自行选择关键词并输入,检索结果与关键词的选择和输入方式密切相关,所以需要用户有一定的专业知识和筛选能力。
2.被动检索被动检索是指用户被动接收与目标信息相关的信息的过程。
这种方式有多种形式,例如RSS订阅、新闻推送等,用户只需要选择自己感兴趣的信息源,订阅相关信息即可,无需关注具体的检索方法,检索结果自动推送给用户。
这种方式对用户的专业知识要求较低,但需要用户对信息源的筛选和选择有一定的认知和判断能力,以保证接收到的信息质量。
三、信息检索的技巧为了使信息检索更加精确、高效,我们应该掌握以下几项技巧:1.选择合适的搜索引擎不同的搜索引擎有不同的检索范围和优势,我们应该根据所需信息的特点和自身的需求选择合适的搜索引擎。
例如:谷歌适用于多语种和涉及面广的检索;百度适用于国内的信息检索。
2.使用关键词合适的关键词可以直接影响检索结果的质量和准确性,我们应该根据具体情况选择合适的关键词。
文献信息检索类型
文献信息检索类型主要分为以下几种:
1. 主题检索:根据文献的主题内容进行检索,常用的检索词有主题词、关键词、分类号等。
2. 作者检索:根据文献的作者进行检索,常用的检索方式有作者姓名、作者机构等。
3. 标题检索:根据文献的标题进行检索,常用的检索方式有全文标题、副标题、主题词等。
4. 出版物检索:根据文献的出版物进行检索,常用的检索方式有期刊名称、出版社、出版年份等。
5. 摘要检索:根据文献的摘要进行检索,常用的检索方式有全文摘要、关键词等。
6. 全文检索:根据文献的全文进行检索,常用的检索方式有全文索引、全文检索等。
以上是文献信息检索的常见类型,不同类型的检索方式适用于不同的情况,需要根据具体情况选择合适的检索方式。
文献:记录信息和知识的一切载体。
文献检索:以文献为检索对象,查找含有用户所含信息的文献。
文摘:是将论文或专著的内容加以浓缩,以精炼的语言把文献信息的重要内容,学术观点,数据及结构准确的描述下来并按一定目录规则与排列起来,供读者查阅的一种信息系统.核心期刊是科技期刊中少数高质量的特定期刊,指各学科领域刊载本专业高水平学术论文,能反映本学科最新研究成果及前沿研究状况与发展趋势的期刊,其载文率、被引用率以及参考利用价值都很高.浏览法:直接浏览最新期刊,特别是核心期刊上的一次文献。
追溯法:当查到一篇参考价值较大的新文献后,以文献后面附的参考文献为线索,由近及远,进行逐一追踪的方法。
顺查法:是由旧到新的查找。
多用于已知所查主题起始年代。
倒查法:是由新到旧的查找。
多用于查找新课题或某课题的新内容。
抽查法:有选择地在某课题文献发表较集中的年限查找。
多用于事先了解该学科或课题的发展历史背景。
循环法:又称分段法,是交替使用“常用法”和“追溯法”来进行检索的综合检索方法。
即利用检索工具查到一批文献资料,又利用这些文献所附的参考文献追溯查找。
信息:是客观存在的事物现象,是生物体或有一定功能的机器可以感知的客观事物发出的一切有意义的信号和消息。
特点:客观性、可认知性、传递性、时效性知识:是人们对自然界、人类社会中各种信息进行思维分析、加工提炼、并加以系统和深化而形成的信息集合。
情报:用不同的方法和手段,在有效的时间内所获得的有针对性和有价值的信息或知识。
特点:传递性、时效性查全率:在信息检索结果中,检索出的相关信息占信息检索系统中相关信息的比例.查准率:是指系统进行检索时,系统中检出的相关文献量与检出的文献总量的比率。
数据库:是计算机存储设备上按一定方式存储的相互关联的数据集合,同时又反作用于新形象检索.搜索引擎:指根据一定的策略、运用特定的计算机程序搜索互联网上的信息,对信息进行组织和处理后显示给用户,是为用户提供检索服务的系统。
文献信息检索系统的分类文献信息检索系统的核心是数据库,而数据库本身又常以收录内容及功能的不同划分为如下几种类型。
1.书目型数据库(bibliographic database)主要是指二次文献数据库,包括各种机读版的题录型、文摘型的数据库。
如《中国生物医学文献数据库》(SinoMed)、MEDLINE等。
它们提供了可满足用户多种信息检索需求的有关文献的各种特征,如文献的篇名、著者、出处(包括刊名、年、卷、期、页码)、摘要、收藏单位等。
不仅可以告知用户其所需文献的线索一题录(包括篇名、著者、出处),更可以提供整篇文献内容浓缩的替代品一文摘。
因此,这是文献检索中最常用的一种数据库。
2.事实数值型数据库( fact-date database)主要为用户提供有关事物、人物、机构等方面的事实性信息和数值型数据。
例如万方数据资源系统中的事实型数据库《中国科研机构数据库》《中国科技信息机构数据库》《中国高等院校及中等专业学校数据库》,美国国立癌症研究所的关于癌症治疗信息的医生咨询数据库(PDQ),反映药物处方信息的《医师案头参考书》(Physicians'Desk Reference, PDR)等。
电子化的参考工具书,如词典、百科全书指南等也属于事实型数据库的范畴。
3.全文型数据库(full-text database)是将文献全文的全部内容转化为计算机可以识别、处理的信息单元而形成的数据集合。
全文型数据库对文献的字、词、句,乃至段落等进行更深层次的编辑加工,允许用户采用自然词语以及截词、邻近算符等匹配方法,方便快速地查到所需的文献,并能直接获取文献原文。
例如CNKI的学术文献总库、万方数据资源系统中的数字化期刊、EIsevier Science电子期刊全文库。
因此,全文型数据库是集文献线索的查询和文献全文的提供于一体,实现了毕其功于一役的一站式信息服务。
4.知识型数据库(knowledge database)一种疾病,不仅有一个概念性的界定,而且涉及病因、病理、诊断、治疗等相关知识;一种药物,不仅有其化学结构上的名称或命名,而且有药理作用、药效动力、副作用、适应证、使用方法等相关知识; -项检查,不仅有其概要性描述,而且涉及原理、检测值的解释、临床意义、操作方法、正常值范围、适用范围等一系列相关知识。
信息检索1.信息检索的概念。
狭义信息检索是指用户找出有关信息的过程。
广义信息检索是将信息按照一定的方式组织和存储起来,并根据用户的需求找出有关信息的过程。
2. 信息检索的类型(1)按照检索对象的不同划分早期分为:文献检索、事实检索、数据检索。
当前三分方法:文本检索、音频与视频检索、数值检索。
(2)按检索手段划分:手工检索、机器检索3.简述信息检索的基本原理信息检索的基本原理:对信息集合与需求集合的匹配与选择。
实现信息检索,主要涉及三个关键要素:信息集合、用户信息需求、匹配选择。
一、信息集合:信息集合是指有关某一领域的,经采集、加工的信息集合体。
二、需求集合:用户的信息需求是在社会实践活动中产生的。
当人们在完成某一任务或工作时,经常觉得缺少某些知识,这就产生了信息需求。
三、选择与匹配:要在信息集合中快速获取用户所需信息,需要信息检索提供一种匹配机制,能够把需求集合与信息集合依据某种相似性标准进行比较与判断,进而选择出符合用户需要的信息。
匹配机制至少包括两个要素:第一是匹配标准,即相似性标准;第二是执行匹配的动因。
4.计算机信息检索经历了脱机检索阶段、联机检索阶段、光盘检索阶段、网络检索阶段。
5.信息检索领域的主要研究问题有哪些?⑴信息检索理论:检索语言、检索模型、标引理论、相关性理论、知识组织与表示理论⑵信息检索工具/系统:信息检索系统的结构、功能、设计开发、管理运营、应用评价等⑶信息资源及其收集、加工:信息存储、数据库⑷检索技术与方法:文本检索技术、数值检索技术、音频与视频检索技术、网络搜索技术⑸用户研究与检索策略:用户的查询心理、检索需求及其类型、用户查询信息的行为特征等、用户信息需求分析、检索式构造、相关反馈方法、检索过程调整与控制等⑹其他密切相关的自动化处理技术:自动聚类与分类、自动摘要、信息可视化、信息过滤、信息提取、机器翻译、人机交互等。
信息检索的两种研究方式:以计算机为中心和以用户为中心,以计算机为中心的IR问题是主流。