信息检索的种类
- 格式:docx
- 大小:37.10 KB
- 文档页数:2
信息检索按检索对象可分为:1)文献检索(包括题录、文摘和全文);2)数据检索(包括数据、表格、公式等);3)事实检索(以某一客观事实为检索对象,查找某一事物发生时的时间、地点及过程的检索)?定题服务(意义)文献分类:一)按出版形式可分为:1)图书(50页以上的印刷方式或其他方式或单独刊物的出版物,eg:专著、汇编书、多卷书、丛书等;正式出版的图书都会有一个国际标准书号ISBN); 2)期刊:每一种期刊都有一个连续出版物编号或称国际标准刊号ISSN【附:?维普——期刊;CNKI,万方——期刊、学位论文、报纸、图书】二)按载体形式分类:1)印刷型文献/纸质型文献;2)机读型文献——1、缩微型(缩微胶卷、缩微平片),2、视听型文献(录像带、VCD、英语磁带等),3、数字化文献(光盘、磁带、数据流带等)印刷型和数字化型是主要的文献载体形式文献的级别:1)一级文献(原始文献,一般指作者的原始创作,eg数据库提供的原文,专著、期刊论文、学位论文、研究报告、会议论文、专利文献等)2)二次文献(统称检索工具,文献检索的主要工具和手段(题录、目录、索引、文摘等)3)三次文献(年鉴、进展、述评、综述等)【灰色文献/零次文献——未公开的最原始的文献】检索工具的种类——按著录格式分类:1)目录,即书目(典藏目录、联合目录);2)索引(题录,即概要,指检索工具所著录的篇目、著者、出处、语种等,但不包括文摘);3)文摘信息组织:主题词组织法——美国国立医学图书馆编制的医学主题词表MeSH是目前最权威、最常用的标准主题词表(Pubmed、中国生物医学文献数据库均采用);《中国图书馆分类法》即《中图法》是目前国内常用的体系分类语言。
截词检索:*代表一或多个字符;?代表任意一个字符;2)字段限制检索:制定检索提问在特定字段中出现,只有在指定的字段中出现与检索提问相同的记录才能被检索出来。
Eg.“提问”【字段名】;如、HIF U 【TIAB】获得信息——每条列表对应一个网页且应包含以下三个要素:标题,URL—检索出的每一条信息的地址、网址,摘要第一个搜索导航工具——雅虎——目录式(1)引号可以避免搜索引擎拆分关键词(2)《》百度的特殊用法:书名号会出现在搜索结果中;不会被拆分百度、google常用语法:1)filetype——特定文档类型的搜索。
信息检索复习题第1章信息:狭义是指适用通信、存储或处理的形式来表示的知识或消息,即用语言、文字、数字、符号、图像、声音、情景、表情、状态等方式传达的内容。
信息资源是企业生产及管理过程中所涉及的一切文件、资料、图表和数据等信息的总称。
信息资源与企业的人力、财力、物力和自然资源一样同为企业的重要资源,而且是企业发展的战略资源。
文献:是记录知识的一切载体,是指将知识、信息、利用文字、符号、图像、音频等技术手段记录在一定的物质载体上。
文献的三个基本属性:即文献的知识性、记录性和物质性。
它具有储存知识、传递和交流信息的功能。
文献的类型:1、按照文献的载体形态来划分:分为印刷型、微缩型、声像型和电子型。
2、按文献的出版形式划分:分为图书、期刊、会议文献、科技报告、学位论文、技术标准、专利文献。
在正式出版图书封底都有一个ISBN叫国际标准书号。
在正式出版期刊封面都有一个ISSN叫国际标准编码。
特种文献又称丛刊,或不定期的连续出版物,是出版形式比较特殊的一种文献类型。
P5科技报告:记录某一科研项目调查、实验、研究的成果或进展情况的报告,又称研究报告、报告文献。
会议文献:在学术会议上宣读和交流的论文、报告及其他有关资料,会议文献多数以会议录的形式出现,特点:传递情报比较及时,内容新颖,专业型和针对性强,种类繁多,出版形式多样,会议文献分为:会前、会中和会后3中。
政府出版物:各国政府及其所属机构出版的,有官方性质的文献,又称官方出版物,是指有政府机关负责编辑印刷的,并通过各种渠道发送或出售的文字、图片、及磁带、软件等。
其他类型资料:包括产品样品、档案文献、灰色文献和视听资料等。
按照文献产生的次序与被加工整理的深度划分:可将文献分为零次文献、一次文献、二次文献、三次文献。
一次文献:是人们直接以自己的生产、科研、社会活动等实践经验为依据生产出来的文献,也称原始文献,其所记载的知识信息比较新颖、具体、详尽。
信息检索:是指信息按照一定的方式组织起来,并根据信息用户的需要找出有关信息过程和技术,狭义的信息检索是指信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程。
一、名词解释信息检索:信息检索最普通的理解就是信息查找。
它是将信息按一定的方式组织起来,并根据信息用户的需求查找出有关的信息的过程和技术。
信息检索又叫做信息存储与检索(information storage and retri)。
信息检索可以分为事实检索、数据检索、文献检索。
特性检索:也称强相关性检索,强调向用户提供高度对口的信息。
强调检索的准确性,对检索结果的数量不作要求。
族性检索:也成弱相关性检索,强调向用户提供系统、完整的信息。
注重检索的全面性,要求检索出一段时间期限内有关特定主题的所有信息,对准确性要求较低。
特种文献:特种文献是一种不以书刊形式出版的文献,一般不公开发行,它包括专利文献、会议资料、科技报告、技术标淮、学位论文、政府出版物、产品样本及其说明书等。
其特点是内容涉及面广、种类多、数量大、报道快、参考价值高。
OPAC:联机图书馆公共检索目录,有开放的公共查询目录演化而来,是20世纪70年代末美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。
参考工具书:是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。
年鉴:是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。
手册:是汇集某一方面常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。
名录:是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。
搜索引擎:就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。
图书:论述或介绍某一领域知识的出版物。
期刊:期刊一般是指名称固定、开本一致的定期或不定期连续出版物。
一、信息的定义1、定义不同的学科、从不同的的角度对信息有不同的解释。
广义的说,信息就是消息。
一切事物的存在都有消息。
2、信息的类型及特征(1)可识别性信息是可以识别的,识别又可分为直接认别和间接识别,直接认别是指通过感官的识别,间接识别是指通过各种测试手段的识别。
不同的信息源有不同的识别方法。
(2)可存储性信息是可以通过各种方法存储的。
(3)可扩充性信息随着时间的变化,将不断扩充。
(4)可压缩性人们对信息进行加工、整理、概括、归纳就可使之精练,从而浓缩。
2、信息的类型及特征(5)可传递性信息的可传递性是信息的本质等征。
(6)可转换性信息是可以由一种形态转换成另一种形态。
(7)特定范围有效性信息在特定的范围内是有效的,否则是无效的。
二、知识1、定义:是人类对信息、对客观事物规律的认识,它是人们在社会实践中积累起来的经验。
人们对事物由表及里、由现象到本质、由感性到理性的认识深化,便形成了知识。
知识是信息内容的组成部分。
2、知识的基本属性实践性规律性渗透性继承性实践性社会实践是一切知识产生的基础和检验知识的标准,科学知识对时间有重大指导作用.规律性人们对时间的认识是一个无限的过程,人们获得知识在一个层面上揭示了事物及其运动的规律性。
渗透性随着知识门类的增多,各种知识可以相互渗透,形成许多新的门类,形成科学知识的网终结够体系。
继承性每一次新知识的产生,既使原有知识的深化和发展,又是更新的知识产生的基础和前提。
知识被记录或被物化为劳动产品后,可以世代相传和利用。
三、情报1、概念情报是指被传递的知识或事实,是知识的激活,是运用一定的媒体(载体),越过空间和时间传递给特定用户,解决科研,生产中的具体问题所需要的特定知识和信息.情报是活化了的知识,即被利用的知识.2、情报的基本属性知识性与信息性:情报必须具有实质内容,凡人们需要的各种知识或信息都可成为情报的内容。
针对性:任何知识和信息,人们不利用、不知道其存在,就不能成为情报。
文献:记录信息和知识的一切载体。
文献检索:以文献为检索对象,查找含有用户所含信息的文献。
文摘:是将论文或专著的内容加以浓缩,以精炼的语言把文献信息的重要内容,学术观点,数据及结构准确的描述下来并按一定目录规则与排列起来,供读者查阅的一种信息系统.核心期刊是科技期刊中少数高质量的特定期刊,指各学科领域刊载本专业高水平学术论文,能反映本学科最新研究成果及前沿研究状况与发展趋势的期刊,其载文率、被引用率以及参考利用价值都很高.浏览法:直接浏览最新期刊,特别是核心期刊上的一次文献。
追溯法:当查到一篇参考价值较大的新文献后,以文献后面附的参考文献为线索,由近及远,进行逐一追踪的方法。
顺查法:是由旧到新的查找。
多用于已知所查主题起始年代。
倒查法:是由新到旧的查找。
多用于查找新课题或某课题的新内容。
抽查法:有选择地在某课题文献发表较集中的年限查找。
多用于事先了解该学科或课题的发展历史背景。
循环法:又称分段法,是交替使用“常用法”和“追溯法”来进行检索的综合检索方法。
即利用检索工具查到一批文献资料,又利用这些文献所附的参考文献追溯查找。
信息:是客观存在的事物现象,是生物体或有一定功能的机器可以感知的客观事物发出的一切有意义的信号和消息。
特点:客观性、可认知性、传递性、时效性知识:是人们对自然界、人类社会中各种信息进行思维分析、加工提炼、并加以系统和深化而形成的信息集合。
情报:用不同的方法和手段,在有效的时间内所获得的有针对性和有价值的信息或知识。
特点:传递性、时效性查全率:在信息检索结果中,检索出的相关信息占信息检索系统中相关信息的比例.查准率:是指系统进行检索时,系统中检出的相关文献量与检出的文献总量的比率。
数据库:是计算机存储设备上按一定方式存储的相互关联的数据集合,同时又反作用于新形象检索.搜索引擎:指根据一定的策略、运用特定的计算机程序搜索互联网上的信息,对信息进行组织和处理后显示给用户,是为用户提供检索服务的系统。
信息检索的种类
信息检索是指使用计算机技术,通过输入关键词等方式,获取网络中
的相关文本、数据和图像等信息的过程。
信息检索由于其重要性和广
泛应用,已经发展出了多种检索分类。
本文将介绍信息检索的五种分类。
1. 文本检索
文本检索是信息检索中最常见的形式。
这种检索是指用户输入关键词,然后计算机返回文本文件中包含这些关键词的所有文件。
文本检索可
以通过基本类型、布尔运算符或者向量空间模型(VSM)等方法进行操作,其有利于搜索具有某些特定主题的文档,是最基本的信息检索。
2. 图像检索
图像检索是指使用图像描述或样本图片查询相关图片的过程。
图像检
索非常重要,因为纯文本检索无法满足人们对照片和其他图像的搜索
需求。
图像检索可能涉及到基于颜色、文本、纹理、形状等方面的各
种特征,并选择相应的图像来用于搜索。
3. 音频检索
音频检索是指使用计算机技术检索音频文件,包括闻起来很棒的歌曲
和其他类型的声音剪辑。
音频检索算法通常分为两种类型:基于内容
的检索和基于元数据的检索。
此外,用户也可以从网络信息库中搜索
他们想要的音频,比如在一些音乐网站上搜索本地或全球性的音频。
4. 视频检索
视频检索是一种查询视频文件的方法,可以检索包含关键字的视频文件。
与图像检索类似,视频检索的算法通常需要基于视觉、颜色、文本、音频等多种特征进行,从而能够实现更准确的检索。
5. 数据库检索
数据库检索是指通过结构化查询语言(SQL)搜索关系数据库中的记录。
这种检索可以是基于关键词、數值等方式搜索数据,也可以是基于特
定的数据库软件检索;除此之外,还可以实现通过网络收集的信息库
上进行搜索。
总之,信息检索是现代计算机和网络技术中的一个重要组成部分,随
着信息存储和收集的不断增加,信息检索的重要性也在不断提高。
越
来越多的互联网用户对信息检索进行了更为广泛的尝试,从而开拓了
新的检索领域和方法。