第5章中文文献信息检索(简约版)
- 格式:ppt
- 大小:5.07 MB
- 文档页数:10
第5章图书文献信息检索1. 图书是人们获取何种知识的文献?如何获取其出版信息及内容信息?答:图书是人们为系统传授知识或经验出版的文献,是我们获取各种知识的重要文献资源。
随着网络技术的普及,获取图书出版及其内容等信息,可通过以下几个途径:(1)综合性图书(出版)网站;(2)各出版社机构网站;(3)网上书店;(4)利用搜索引擎等。
2. 通过网络可获取图书的那些信息?图书原文获取的途径有哪些?答:通过网络可以获得图书得ISBN、书名、定价、出版社、作者、出版日期、开本、装帧、版次、内容简介、封面等多种信息图书原文获取有三种途径:(1)通过直接购买或邮购等方式获得所需图书。
(2)通过向他人或图书收藏单位(包括各类图书馆、文献信息中心等)借阅,包括远程传递等。
(3)直接在网上下载(或直接网上阅读)电子图书。
3. 通过本校图书馆馆藏目录(OPAC)检索海岩的小说或查询有关google的书籍,写出书名和索取号、复本量、馆藏位置及状态(在不在馆,是否可借)。
答:以本校河南工业职业技术学院为例,检索海岩的小说,其检索步骤如下:(1)登陆河南工业职业技术学院网站进入图书馆主页,点击主页上方“读者服务”栏目下的“书目检索”,进入馆藏OPAC检索界面;(2)选择左侧字段选项“作者”检索,并在右侧对应的检索框中输入“海岩”,点击检索;(3)检索结果:26条记录,前5条记录分别是:①你的生命如此多情,I247.5/1256,新区社科二,复本3,在馆;②玉观音,I247.5/1257,新区社科二,复本3,2本在馆;③永不瞑目,I247.5/40,书库2-2,复本3,在馆;④便衣警察,I235.2/3,新区社科二,复本2,在馆;⑤一场风花雪月的事,I235.2/4,新区社科二,复本1,在馆。
4.到清华大学图书馆或中国国家图书馆的馆藏目录检索“关于汶川大地震”方面图书。
写出书名、书号、作者、出版年代及主要内容等。
答:选用《中国国家图书馆的馆藏目录》,检索步骤如下:(1)进入中国国家图书馆(/)主页。
文献信息检索基础知识一.基本概念1.文献:定义:文献是记录有知识或信息的一切载体。
具体地说文献是以文字、符号、图形、声频、视频等手段将信息、知识记录在各种载体上所形成的物质实体。
即记录有信息、知识的纸张、胶片、磁带、磁盘、光盘及一些网络资源都可以称之为文献。
文献的主要功能是存储信息、传递信息。
文献的特征:包括文献的内容特征和文献的外表特征两个方面。
2.信息:定义:信息是事物运动的状态与方式的反映。
简言之,信息就是事物发出的消息。
人与人间传递信息可通过:肢体语言、口头语言、书面语言等。
信息的特征:①普遍性;②时效性;③客观性;④可加工性;⑤共享性;⑥可变换性;⑦传递性;⑧可转化性3.知识:关于知识的定义亦有种种,西方20世纪60年代以来一直流行的说法是经济合作与发展组织(OECD)在《以知识为基础的经济》专题报告中所提的知识定义:“4个W”:● Know what (知道是什么)——关于事实方面的知识。
● Know why(知道为什么)——关于自然原理和规律方面的知识。
● Know how(知道怎么做)——关于技能或能力方面的知识。
● Know who(知道谁有知识)——关于到哪里寻求知识的知识。
定义:知识是人类认识的成果和结晶,是人类在认识和改造世界的社会实践中获得的对事物本质的认识和经验的总和。
这是广义的知识概念。
知识具有主观性、抽象性、客观性的特点。
二.文献的基本类型与特征对文献类型的划分,由于所选标准以及分析方法不同,有各种不同的划分方法,一般可按下面几种情况来划分。
1根据载体材料、存储技术和传递方式的不同:印刷型(又称纸制文献、印本文献)以纸张为载体,用印刷方式(雕版印刷、活字印刷、石印、照相影印、计算机排印)记录知识的文献,是传统的文献形式,也是现代的文献信息资源的主要形式之一。
印刷型文献因方便实用,直观性强,是人类交流和传播信息的主要形式。
缺点:存储的信息密度低,占据空间大,难以实现加工和利用的自动化,不便于对其进行长期管理和长期保存。
第五章信息检索的基本方法5.1 布尔逻辑检索Boolean logic由GEORGE BOOLE 1815-1864提出,目前大多数搜索引擎都采用与AND,*,&或OR,+ ,︱非NOT,—,!逻辑“与”:用关系词AND表示(可写作“*”或“&”)。
逻辑“与”表示AND 所连接的两个检索词必须同时在结果中出现才满足检索条件。
逻辑“或”:用关系词OR表示(可写作“+”或“︱”),逻辑“或”表示OR所连接的两个检索词只要有一个能出现在结果中就算满足了检索条件。
逻辑“非”:用关系词NOT表示(可写作“and not”“—”或“!”),逻辑“非”表示NOT后面的那个检索词一定不能在检索结果中出现。
例如:校庆AND 武汉大学高等教育* 中国湖南OR 湖北移动学习+ 泛在学习大学NOT 武汉大学玉米–甜玉米例如,用GFsoso检索,电子AND 读书笔记电子读书笔记OR 读书笔记软件5.2 位置限制检索临近检索(Proximity Search)以Dialog为例,收900多个数据库(1)PRE/0,P/0 表示前后词序不能颠倒,中间不能插入其他词,但可以插入符号。
With, (W)例如:Wuhan P/0 University(2)PRE/#,P/# 表示前后词序不能颠倒,中间可插入一定数量的单词,即插入#个单词。
例如:Wuhan P/1 University检索结果:Wuhan Medical University;Wuhan Agriculture University;Wuhan Technology University;(3)NEAR/0,N/0 表示前后词序可以颠倒,但中间不能插入单词。
例如:Wuhan N/0 University检索结果:Wuhan University;Wuhan – University;Wuhan ,University University, Wuhan; University-Wuhan; University Wuhan(4)NEAR/#,N/# 表示前后词序可以颠倒,中间可以插入#个单词。
文献检索课件word版大纲第一章文献信息基本知识第二章文献信息检索原理第三章中文工具书介绍第四章计算机信息检索第五章光盘检索第六章Internet网络检索第七章搜索引擎第八章网上数据库介绍第一章文献信息基本知识第一节文献的概念和功能一、文献的定义信息:信息是客观事物存在的方式或运动状态,以及关于客观存在方式或运动状态的陈述。
知识:知识是人们对客观事物存在和运动规律的认识。
文献:任何人类的知识用文字、图形、符号、声频、视频的手段记录下来的东西。
统统可称为文献。
文献也可称为固化在一定载体上的知识。
二、文献的功能存贮知识的功能;传递和交流信息的功能;保存知识的功能第二节文献的分类一、按文献载体的形式划分:刻写型,印刷型,缩微型,视听型,电子型二、按文献的级别划分:1.一次文献又称原始文献,是以著者本人的研究工作或研究成果为依据撰写创作的论著、论文、技术说明等。
创造性、原始性、分散性2.二次文献是人们把大量的、分散的、无序的一次文献收集起来,按照一定的方法进行加工、整理,使之系统化便于查找而形成的文献。
汇集性、检索性、系统性3.三次文献是选用大量有关的文献,经过综合、分析、研究而编写出来的文献。
综合性、价值性、针对性4.零次文献三、按文献的出版形式划分1.图书2.期刊3.会议文献4.学位论文5.研究报告6.专利文献7.政府出版物8.标准文献9.产品样本10.技术档案第三节文献资源的发展趋势及国内文献资源的分布一、世界文献资源的发展趋势1.文献资源数量急剧增长;2.文献资源的文种繁多;3.文献资源的载体形式趋向多样化;4.文献资源的出版分散;5.文献资源的内容交叉重复;6.文献资源的有效使用寿命缩短。
二、国内文献资源的分布1.文献资源类型的分布:①图书和期刊;②专利、档案、标准文献;③会议文献、科技报告、政府出版物和产品目录等特种文献2.文献资源收藏系统的分布①公共图书馆系统②高校图书馆系统③科技文献信息系统3.国内文献资源的地理分布第二章文献信息检索原理第一节文献信息检索原理一、文献信息检索的定义信息检索(Information Retrieval)(广义上):将信息按一定的方式组织和存储起来,并根据用户的需要找出有关的信息的过程和技术。
第1章信息资源概论1、信息资源的涵义:信息资源是经过人类主观或客观处理了的,并且能够被传播或传输的文字、声音、图像、数据。
2、信息资源的类型及各自的特点(1)电子信息资源的特点:存储形式多样化;资源数字化;可交流程度高;方便利用;内容丰富;载体容量大。
(2)纸质文献资源的特点:携带、书写、保存方便;直观性;以纸质为载体的艺术作品的不可替代性;纸质文献作为收藏品的不可替代性。
第2章信息存储与检索基础1、信息存储与检索的基本原理为了促进信息资源的充分交流和有效利用,使用户在信息集合中快速、精确、全面地获得特定需要的信息资源,必须要对广泛、大量、分散、无序的信息进行搜集、记录、组织、存储,以建成各种信息存取系统。
用户则根据检索需要,将需求转变为系统所能识别的检索式,再与存取系统中表征信息资源特征的标识进行逐一的相符性匹配与比较,两者完全一致或部分一致时,即为命中信息,可按用户要求从存取系统中输出。
2、信息存储与检索的历程信息存储与检索走过了文献检索、情报检索的历程,并且正在向着知识检索的领域迈进3、信息检索通常包括的四种类型1)关于文献的检索;2)关于某事实或事项的知识检索;3)关于数值或数据的情报检索;4)关于图像信息的信息检索.4、索引的概念索引(Index)是存取信息资源“地址”或“出处”的标识系统,是信息存储与检索的基本形式。
索引的基本功能是指示知识点在正文或文献款目中的位置。
传统的文本式检索工具通常由两部分组成,即文摘正文部分和辅助索引部分。
①②③分别代表什么1.)索引标题词2.)说明语3.)地址参考项6、引文索引的概念引文索引是近30年来出现的一种新型的索引形式。
其特点是,把一系列具有引用与被引用关系的科学文献以多向线性的方式联系起来,提供一个以引证关系为依据来检索文献的新途径。
引文索引的主要职能是,回答某作者的论文曾经被哪些人的文章所引证,这些文章何时发表在何种刊物上。
第3/4章信息存取途径与检索策略1、布尔逻辑算符用户利用逻辑算符构造检索式,可将一些具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索需求。