信息检索与参考工具书共63页文档
- 格式:ppt
- 大小:5.88 MB
- 文档页数:63
参考工具书简介参考工具书包括字词典、百科全书、年鉴、手册、名录、表谱、图录等类型,通常用于数据信息检索和事实信息检索。
一、字、词典字典、词典在英语中通称为dictionary,是人们经常使用的工具书。
汉语里,字和词是不同的概念,因此有字典和词典之分。
字典是汇集单字,注明其字形、读音、意义和用法;词典主要解释词语的概念、意义和用法。
字词典按所收内容分为语文性和知识性两大类。
(一)语文性字词典:主要供学习语言文字之用,又可分为综合性字词典和专门性字词典。
1、综合性字词典,对字的音、形、义和词汇的意义、用法全面加以解释。
如《新华字典》、《汉语大字典》、《王码字典》、《现代汉语词典》、《Oxford of English Language》等。
2、专门性字词典,只收某一类的字、词,或只解释字或词形、音、义的某个方面。
如《成语词典》、《汉语虚词词典》、《简明同义词典》、《中国民间方言词典》。
(二)知识性词典:知识性词典包括百科词典、专科词典。
1、百科词典,汇集各学科重要的术语和概念加以解释,提供最基本的知识。
如《辞海》、《中国百科大辞典》等。
2、专科词典,收录一个学科或专门领域的术语、概念、专名加以解释,系统地反映专业知识的概要。
专科词典所提供的知识往往比百科词典更为详尽。
如《哲学大辞典》、《中国艺术家辞典》、《中国古今地名大辞典》等。
此外,还可按语种划分为单语词典和多语词典。
如上述各种字(词)典都属于单语词典。
多语词典是两种或两种以上语种间的对译词典。
如《英汉大词典》、《汉英科技大辞典》等。
(三)字词典举例(1)《说文解字》,东汉许慎撰,中华书局1963年、1984年据清陈昌治改刻本缩印出版,这是我国第一部正规字典。
《说文解字》分为540个部首,汇集9353个当时通用汉字,另有重文1163个字。
每字首先说解字义,然后分析文字形体构造,最后注音。
《说文解字》是我国系统分析字形从而考究文字本义的重要著作,至今仍是研究古文字学和古汉语重要的工具书。
第五章参考工具书的使用5.1图书与知识型信息检索一、书目、索引、文摘书目:图书或报刊目录的简称。
它著录和揭示一批相关的文献,按一定的次序编排而成,是一种登记报道宣传文献的检索工具。
索引:把一种或多种文献中具有检索意义的内容,按一定顺序加以编排并注明出处以供查检的工具。
文摘:以简明扼要的文字对文献原文的摘述。
将论文或书籍的主要观点论据数据等摘录出来,并按一定方式编排,是当代报道学术动态的简捷明快的方法,也是一种文献检索和阅读的工具。
共同:①都是线索性工具书②都是揭示和检索原始文献的工具,一般需同原始文献配合使用③都是对原始文献的描述和揭示,作用在于方便读者检索原始文献。
不同(主要体现在著录的深度和详略上):①揭示对象:书目以每一种完整的文献为揭示对象;索引以文献里的事项或知识单元为揭示对象;文摘以论文或书籍为揭示对象②著录项目和提要:书目的著录项目强调版本发行事项,提要介绍文献内容和作者评论得失和考证;文摘的著录项目包括基本项目和文献摘要,摘要是对文献原文的高度浓缩不加评论③作用:书目报道文献阅读指导指示藏所,索引指向示址作用,文摘指向示址作用报道功能。
(一)书目1、书目的产生和发展:书目曾有多种称谓:录,略,志,簿,考,书目,提要等。
西汉刘向编成中国第一部题解式书目《别录》,其子刘歆编成中国第一部综合的群书目录《七略》,现存最早的史志目录是《汉书.艺文志》唐宋元明清是我国古典目录学的发展时期。
近代目录学有了较大发展,数量增多种类丰富。
2、书目的类型(不同的划分标准构成不同的书目类型)主要有:①登记书目:反映一国一地在一定历史时期或一定范围的出版收藏情况的登记统计性书目。
②馆藏书目:揭示报道一个图书馆或其他信息机构所收藏的各种文献的总的书目。
③推荐书目:针对特定读者或特定目的,围绕某一主题,选择推荐有关文献,用以指导阅读而编制的书目。
④书目之书目:将书目索引文摘汇集在一起而编制的一种特殊书目类型。
第四章参考工具书概述4.1参考工具书的概念和特点一、参考工具书的概念参考工具书:根据特定的需要,广泛汇集有关的知识资料或文献信息,按便于检索的方法编排,以备查考的工具性图书。
二、我国工具书的产生与发展起源于先秦时代,汉代是工具是正式产生并奠定基础的时期,明清时期是古代工具书大集成时期。
近代以来①工具书的内容:从集中古代典籍的整理和诠释转为注意记述一些新事物②2、编排特殊,便于查检:工具书具有科学的编排形式和高效率的检索方法。
把大量知识信息组织成大小不等的单元,并且有严密的结构体系以覆盖有关的知识领域和文献范围,以简驭繁逻辑性组织性强。
工具书的排检方法有部首法笔画法笔顺法号码法等。
3、准确可靠,权威性强:①收录确定可靠公认权威观点概念②论述精炼出处详明③及时修订再版以更新补充新内容4.2参考工具书的种类与排检方法一、参考工具书的种类二、参考工具书的结构参考工具书的结构:参考工具书的整体构成形式和各部分的基本体制,大体上由序和跋(前言和后记)、凡例或说明、正文、辅助索引、附录补遗五部分构成。
三、参考工具书的排检方法排与检是相互联系的,对工具书的编纂者来说是编排方法对工具书的使用者来说是检索方法,所以统称为排检方法。
(一)按字顺排列:按工具书的字形或读音将工具书中的条目加以编排包括形序法和音序法。
1、形序法:根据汉字形体结构的特点加以排列的方法。
(1)部首法:根据汉字形体结构的特点,利用其偏旁的同一性来编排条目的方法。
是我国(3)笔顺法:利用汉字的笔顺作为排检方法。
汉字的基本笔形是点横竖撇捺,两种或两种以上基本笔形连用又组成复杂的折笔。
现在笔顺法作为笔画法的补充。
优点:使用简单缺点:①书写习惯不同笔画和起笔有时很难确定②现行工具书中某些字的笔顺有分歧使用笔顺法应掌握汉字的一半规律。
(4)号码法:是形序法的一种变形。
把汉字分成若干种笔形,用阿拉伯数字作为代码,然后把每个字的笔形代码连接为号码,再依号码大小排列。
第四章工具书概述4.1工具书及其概念1、检索工具概述(1)检索工具的定义、特点检索工具是指用以存储、报道和检索文献的工具。
因此,它具有存储和检索的功能。
一般必须具备四个条件:①必须详细著录文献的外部特征和内容特征;②必须具有既定的检索标识,如主题词、分类号、著者姓名和文献序号等;③必须根据标识的顺序,系统地、科学地排列文献,使其成为一个有机的整体;④能够提供多种检索途径。
(2)什么是工具书?(定义见课件)2、工具书的特点:工具书的功用:它以其高密度的知识性、高精度的资料性、高效率的检索性和高频率的查考性成为人们学习和工作必备的工具。
总的来说它的功用是:指示读书门径,解决疑难问题,提供参考文献,节省时间精力。
3、工具书的类型:(1)检索工具的类型根据不同的划分标准可以分为不同的类型。
按收录的范围分:综合性、专业性、单一性型;按出版与载体形式分:印刷型(又分期刊、单卷和附录)、卡片型、磁带型、光盘型和缩微型;按著录方式分:目录、题录、文摘(这是最常见的划分方式);按检索方式分:手检、机检;按编著方式分:书目、索引、文摘、辞书、年鉴、百科全书。
在这里,为了便于掌握应用,我们依据检索工具的出版形式、汇编内容和所完成的检索类型,把检索工具书分成两大类型:提供知识的参考性工具书和提供文献线索的检索性工具书。
(2)参考工具书及类型:参考性工具书包括辞书、类书、政书、百科全书、年鉴、手册、表谱、图录、名录等。
(3)检索工具书及类型:检索性工具书包括书目、索引、文摘等。
(4)参考工具书与检索工具书的区别:二者既有联系又有区别:内容都是知识的高度浓缩和积累,但检索性工具书是对文献的特征做简赅(gāi该)的记载,属于二次文献的范畴,而参考性工具书则主要对知识进行精要的说明,属于三次文献的范畴;二者多是以纸张为载体的出版物,但前者多为期刊形式,出版周期短,及时性较强,而后者主要是图书形式或年鉴一类连续出版型的,出版周期长,稳定性较强;二者都是以供人查寻为目的,但前者提供的情报只是有关文献的线索,必须根据这些线索再查原谅,而后者提供的情势是具体的事实和数据,检索的结果可以直接利用。
信息检索与搜索引擎技术手册第一章概述信息检索(Information Retrieval,IR)是指根据用户需求,从大规模的文本集合中检索出相关信息的过程。
而搜索引擎则是将信息检索技术应用到互联网上的一种工具。
本手册将介绍信息检索与搜索引擎技术的基本原理、关键技术以及应用案例。
第二章信息检索基础2.1 信息检索的定义与目标信息检索是指在大规模文本集合中,根据用户的查询需求,从中检索出与查询相关的信息。
其目标是提供准确、全面、快速地响应用户查询的结果。
2.2 检索系统的组成一个典型的信息检索系统通常由以下几个组成部分构成:用户接口、查询处理器、索引构建器、索引存储器和检索器。
2.3 检索模型信息检索中常用的检索模型包括布尔模型、向量空间模型和概率检索模型。
布尔模型是最早的检索模型,通过布尔运算符组合查询与文档特征进行匹配;向量空间模型将文档和查询表示为向量,并通过向量相似度计算确定检索结果;概率检索模型则基于统计概率理论,通过估计查询与文档的相关性来进行排序。
第三章搜索引擎技术3.1 网络爬虫网络爬虫是搜索引擎的基础,通过自动访问互联网上的网页并抓取其内容,建立起搜索引擎的索引库。
3.2 网页索引与排名搜索引擎通过建立索引库来存储爬取到的网页内容。
在用户发起查询后,搜索引擎通过索引库中的关键词与查询匹配,然后根据一定的排名算法来确定返回结果的优先级。
3.3 查询处理查询处理是搜索引擎中的关键环节,包括对用户查询的分词、词法分析、查询扩展等技术。
通过对查询的处理,可以提高搜索引擎的准确性和用户体验。
3.4 相关性排序搜索引擎根据查询与文档的相关性来对搜索结果进行排序,以便用户能够快速找到最相关的信息。
相关性排序算法包括TF-IDF、PageRank等。
第四章搜索引擎的应用4.1 互联网搜索引擎互联网搜索引擎是最常见的搜索引擎类型,如Google、百度等。
它们通过对互联网上的网页内容进行索引,为用户提供全面的搜索服务。
第1章信息资源概论1、信息资源的涵义:信息资源是经过人类主观或客观处理了的,并且能够被传播或传输的文字、声音、图像、数据。
2、信息资源的类型及各自的特点(1)电子信息资源的特点:存储形式多样化;资源数字化;可交流程度高;方便利用;内容丰富;载体容量大。
(2)纸质文献资源的特点:携带、书写、保存方便;直观性;以纸质为载体的艺术作品的不可替代性;纸质文献作为收藏品的不可替代性。
第2章信息存储与检索基础1、信息存储与检索的基本原理为了促进信息资源的充分交流和有效利用,使用户在信息集合中快速、精确、全面地获得特定需要的信息资源,必须要对广泛、大量、分散、无序的信息进行搜集、记录、组织、存储,以建成各种信息存取系统。
用户则根据检索需要,将需求转变为系统所能识别的检索式,再与存取系统中表征信息资源特征的标识进行逐一的相符性匹配与比较,两者完全一致或部分一致时,即为命中信息,可按用户要求从存取系统中输出。
2、信息存储与检索的历程信息存储与检索走过了文献检索、情报检索的历程,并且正在向着知识检索的领域迈进3、信息检索通常包括的四种类型1)关于文献的检索;2)关于某事实或事项的知识检索;3)关于数值或数据的情报检索;4)关于图像信息的信息检索.4、索引的概念索引(Index)是存取信息资源“地址”或“出处”的标识系统,是信息存储与检索的基本形式。
索引的基本功能是指示知识点在正文或文献款目中的位置。
传统的文本式检索工具通常由两部分组成,即文摘正文部分和辅助索引部分。
①②③分别代表什么1.)索引标题词2.)说明语3.)地址参考项6、引文索引的概念引文索引是近30年来出现的一种新型的索引形式。
其特点是,把一系列具有引用与被引用关系的科学文献以多向线性的方式联系起来,提供一个以引证关系为依据来检索文献的新途径。
引文索引的主要职能是,回答某作者的论文曾经被哪些人的文章所引证,这些文章何时发表在何种刊物上。
第3/4章信息存取途径与检索策略1、布尔逻辑算符用户利用逻辑算符构造检索式,可将一些具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索需求。