2第二章 文献检索基础(正式版)
- 格式:pdf
- 大小:166.14 KB
- 文档页数:45
---------------------------------------------------------------最新资料推荐------------------------------------------------------医学文献信息检索(完整版)Nacl-星星-Clarence医学文献信息检索第一章绪论 1. 一个国家的综合国力在一定程度上将体现为信息的拥有量、处理能力和利用水平,即信息水平、信息能力、信息素质、信息潜能的总和。
2. NIQ-----国家信息化指标(国家智商)3. 医学生信息素养:个体能够认识到何时需要信息,能够检索、评估和有效利用信息的综合能力。
包括:信息意识、信息知识、信息能力、信息道德 4. 信息能力:活动+积累+表达+甄别+利用(终极目的) 5. 信息意识是前提,信息能力是核心,信息道德是方向。
6. 文献信息检索:教会医学生查找文献信息,提高检索、筛选、分析、评价、管理和综合利用文献信息的能力,最终使文献信息为我所用。
包括信息存储和信息检索两个环节。
7. 手工检索:常用法、追溯法、浏览法计算机检索:浏览法、搜索法、技术法 8. 外表特征途径:题名、著者、机构名、编号内容特征途径:分类、主题、代码第二章文献信息检索基础(一)基本概念概念信息信息是物质存在的一种知识人类对客观世界的正确情报为了解决某一特定问题而被传递的知识和事实,是被激活了的知识。
文献记录有知识的一切载体。
1/ 11凡属于人类的知识,用文字、图形、符号、声频、视频等手段记录保存下来,并用以交流传播的一切物质的载体。
方式、形态或运动状态,认识,是社会生产实践和是事物的一种普遍属性,科学研究的概括和总结,定义一般指数据、消息中包含的意义,可以使消息中所描述事件的不定性减少。
是人脑加工、整理序列化的信息。
特征基本要素客观性、动态性、依存性、规律性、实践性、渗透性、可传递性、共享性信源信宿媒介(语言、载体、信道)继承性、信息性知识性、传递性、效用性知识或信息经过传递使用产生效益知识内容记录手段载体信息是知识的源泉,知识是系统化、理论化的信息;联系情报是活化了的知识信息,是动态的、传递的知识;文献是信息、知识和情报通过某种手段记录储存在某种物质载体上而形成的外在表现形式。
文献检索复习要点—Jinying第一章绪论信息、知识、情报及三者关系;文献,文献按载体划分,文献按出版形式划分,文献级次(各级次的概念、代表文献及异同);ISBN和ISSN(概念、组成及检验方法)信息含义:是客观事物本质特征千差万别的反映。
是物质存在方式、形态或运动状态的反映。
(P3-P4)知识的概念:是人类通过信息对自然界,人类社会及思维方式与运动规律的认识与概括,是人的大脑通过思维重新组合和系统化了的信息,是信息中最有价值的部分。
情报的定义:为了解决一个特定问题从一定文献资料中提取或经过传递获得的知识。
情报的三个基本属性:知识性传递性针对性信息,知识,情报之间的关系从信息,知识和情报的定义可以看出,信息无处不在,信息的范围很大,信息中被人们认识的部分成为知识,而知识中被人们用来解决问题的部分成为情报,因此信息,知识和情报的关系是前者包含后者的关系。
ISBN:(P8) 概念:即国际标准书号,它是由10位数字组成,共分4段,其间用“—”相连,组成:1组号2出版社号3书序号4校验码算法:用1分别乘ISBN前12位中的奇数位,用3乘以偶数位,所得结果之和除以10可得,值的范围为0—9文献的含义:记录有知识的一切载体,包含知识内容、信息符号、载体材料、记录方式四个基本要素(P5)文献按载体划分:1印刷型2缩微型3视听型4电子型(P5-P6)文献按出版形式划分:1.图书2.连续出版物(期刊、报纸)3.会议文献4.学位论文5.科技报告6.专利文献7.标准文献8.政府出版物9.产品样本10.技术档案(P7-P11)文献级次:人类开发、利用文献的先后顺序。
(P6-P7)1零次文献:非正式出版物或非正式渠道的最原始的文献。
如日记、手稿、个人通信、口头言论2.一次文献:依据作者本人的研究或研制成果创作的文献。
如图书、期刊论文、会议论文3二次文献:按一定的方法对一次文献进行整理加工,使之有序化而形成的文献。
如目录、索引、文摘4三次文献:围绕某个专题或出于特定目的,根据二次文献提供的线索,选用大量一次文献的内容,进过筛选分析综合和浓缩等深度加工而形成的文献。
第二章中文科技信息检索工具与图书馆利用参考工具书(Reference Book)是根据一定的社会需要,以特定的编排形式和检索方法,为人们迅速提供某方面的基本知识(如字、词、文句、数据等)或文献资料线索,专供查询的特定类型的图书。
如辞典、年鉴、百科全书等。
参考工具书特点:查考性:参考工具书的编辑目的是供读者查考,而不是为了一般阅读,通过这类图书,人们可以简便而迅速地找到自己需要的知识信息。
概括性:参考工具书博采群书,对大量的原始材料加以取舍排比,浓缩出简明扼要的内容完整性:在一定的学科范围内收集的资料应全面、完备,能解疑释难。
易检性:参考工具书全部条目按照某种特定的方式组织成一个完整的体系,查检方便,一般附有多种索引,供人们从各个不同途径查找所需要的知识信息参考工具书作用:指示读书门径:书目提要、推荐书目、导读书目,能评价图书的得失,指导读书的方法和步骤。
解决疑难问题:工具书中的字典、词典、百科全书、年鉴、手册等,能帮助人们解决各种疑难问题。
提供参考资料提供丰富知识,便于掌握学术信息。
传播思想、文化知识。
参考工具书结构与编排:参考工具书一般有序、凡例说明、正文、辅助索引和附录等五部分组成。
序(前言):主要说明工具书的编辑目的,评论工具书的内容、特色、版本的演变及工具书的使用价值。
凡例说明(使用说明):主要说明本书的编排方式、著录格式以及使用方法等。
是指导读者迅速准确地使用工具书的指南。
正文:是参考工具书的主体部分。
正文的编排是否合理、科学、易于查检,是衡量工具书质量优劣的重要方法。
排检方式一般有五种 :(a)字顺法:是将参考工具书的内容按字、词的顺序系统组织排列的一种方法。
是参考工具书最主要的编排方法。
中文字顺法分为形序、音序、和号码3种排检方式。
形序又分笔画笔顺及部首法。
(b) 分类法:将全书的知识信息单元按照学科系统或事务性质进行分类并加以排列。
这种方法便于文献资料的族性检索,在查检到所需文献资料的同时,还可以获取大量的同类信息,使检索者对某一范围内的文献信息有一系统的了解。
第二章文献信息检索基础第一节文献信息检索的概念与过程一、文献信息检索的作用文献信息检索的作用主要体现在以下两方面。
1.充分利用文献信息资源,避免重复劳动科学研究具有继承和创造两重性,科学研究的两重性要求科研人员在探索未知或从事研究工作之前,应该尽可能地占有与之相关的文献信息,即利用文献检索的方法,充分了解国内、国外,前人和他人对拟探索或研究的问题已做过哪些工作?取得了什么成就?发展动向如何?等等。
这样才能做到心中有数,防止重复研究,将有限的时间和精力用于创造性的研究中。
因此,文献信息检索是科学研究必不可少的前期工作。
2.为人们更新知识,实现终生学习提供门径在当代社会,人们需要终生学习,不断更新知识,才能适应社会发展的需求。
美国工程教育协会曾估计,学校教育只能赋予人们所需知识的20%~25%,而75%~80%的知识是走出学校后,在研究实践和生产实践中根据需要,不断再学习而获得的。
因此,掌握文献信息检索的方法与技能,是形成合理知识和更新知识的重要手段,是做到无师自通、不断进取的主要途径。
二、文献信息检索的概念1.信息检索的概念:信息具有共享性。
信息资源共享(information resource sharing)是当今社会的一个发展趋势。
为了分享人类共同的知识财富、研究成果,人们必须通过一种科学的方法从取之不尽的信息资源中去识别和获取所需要的那部分信息,这个过程就是信息检索(information searching)。
信息检索在信息处理和增值中具有重要意义。
信息的检索、利用和创造是一个循环和增值的过程,人们通过检索获得信息,经过处理筛选出自己需要的部分,在利用信息的过程中又创出新的信息,这些信息经过核准后又被标引、组织进检索工具,再提供人们使用,信息在这个循环的处理过程中不断得到扩充,它的增长是没有穷尽的。
如下图所示:保留/信息检索的概念有狭义和广义之分。
从广义上讲,信息检索应该包括信息的存贮与检索两方面的含义。
信息的存贮(information storing): 将信息按一定的方式组织起来,是指信息的有序化、系统化。
信息的检索 (information retrieval): 根据用户的需要,从系统化的有序信息集合中准确查找出特定相关信息的过程。
即信息的“查询”。
信息的存贮方式与检索方式是对应的。
对于信息检索而言,当前更普遍使用的术语是信息存取。
信息存取 (information access): "Assess" 该词源于计算机学科领域,指计算机访问文档或数据集的方式。
信息存取是将所有信息的存贮、检索活动与先进的计算机技术融合在一起,并将其引入信息检索的范畴。
它从本质上拓宽了信息检索的内涵与应用。
如果检索的对象是文献,那么就属于文献检索。
从狭义上讲,信息检索指的主要就是信息的“查询”。
2.信息检索的类型:(1)根据检索对象的不同,信息检索可以分为数据检索、事实检索、文献信息检索、文献全文检索、。
①数据检索数据检索以具有数量性质,并以数值形式表示的数据为检索对象。
这些数据都是经过有关学科领域的专家学者仔细挑选、反复验证、认为准确可靠,并且可以被人们直接使用。
因此这些数据也可以看作是浓缩型的信息。
因此,数据信息检索是一种确定性检索。
例如,查找各种物质的物理化学常数、各种统计数据和工程数据等属于数据检索的范畴。
②事实检索事实检索以事实为检索对象。
所谓“事实”又包括各种事件、事情发生的时间、地点、起因、经过、结局和预后,也包括对事物或事项本原的检索。
检索的结果是有关某一检索课题的具体答案,因此,事实检索也是一种确定性检索。
但事实信息检索过程中所得到的事实、概念、思想、知识等非数值性信息和一些数值性信息须进行分析、推理,才能得到最终的答案,因此要求检索系统必须具有一定的逻辑推理能力和自然语言理解功能。
目前,较为复杂的事实检索课题仍需人工才能完成。
例如,“有哪些海外华人得过诺贝尔奖?”“中国发明专利历年的申请案中,国外来华申请历年所占的百分比是多少?”这些事实信息,就需要对历年的数据进行统计,然后进行比较分析,才能得出具体答案。
③文献信息检索(简称“文献检索”)文献信息检索:以文献的题名、作者、摘要、来源出处、专利号、标准号、收藏处所等文献信息为检索对象,简称“文献检索”。
检索的结果是与检索课题相关的一系列文献信息(相关文献线索),检索结果不直接解答课题用户提出的技术问题,只提供与之相关的文献线索供参考,用户通过阅读后才决定取舍,因此,书目信息检索是一种相关性检索。
例如,调查“甲壳素水解制壳聚糖”的国内外专利技术有哪些,就属文献检索的范畴。
文献检索又有广义和狭义之分。
从广义上讲,文献检索也包括文献的存贮与检索两方面的含义。
文献的存贮(document storing): 是指将分散的、无组织的一次文献按一定的方式组织起来,使之有序化、系统化,并形成文献检索工具的过程。
文献的检索 (document retrieval): 则是根据用户的需要,从文献检索工具(系统化的有序文献信息集合)中准确查找出相关文献信息的过程。
即文献的“查询”。
从狭义上讲,文献检索指的就是文献的“查询”。
即:指根据一定的需要和目的,利用有关的检索工具,按照一定的方法、途径和步骤,查找出用户在特定时间和条件下所需文献信息的过程。
④文献全文检索(简称“全文检索”)全文检索以科研论文或专利说明书等文献的全文为检索对象,简称“全文检索”。
检索的结果是与课题相关的原始文献的全部文本,检索结果也不能直接解答用户提出的技术问题,因此,全文信息检索也是一种相关性检索,它是在文献信息检索基础上进行的更深层次的内容检索。
通过对全文的阅读,可进行技术内容及研究方向的对比分析,掌握与研究课题的相关程度,为研究的创新点提供参考与借鉴。
综上所述,数据检索是从存贮有大量数据、图表的检索系统中获取数值性数据,检索工具为各种手册、年鉴、图谱、表谱等参考工具书以及数值型数据库检索系统;事实检索是从存贮有大量知识信息、事实信息的检索系统中获取某一事实的具体答案,检索工具为各种字典、辞典、百科全书、年鉴和名录等参考工具书以及事实型数据库检索系统;文献检索是从存贮有题名项、作者项、出版项或文摘项的检索系统中获取有关的文献线索,检索工具为各种书目、文摘和索引等检索期刊或相应的文献信息数据库检索系统;全文检索是从存贮整份文献(整篇论文、专利说明书乃至整本著作)的全文检索系统中获取原始文献的全文,检索工具为各种全文数据库、电子图书馆或者专利说明书全文数据库系统。
(2)根据信息组织方式的不同,信息检索可以分为文本检索、超文本检索、超媒体检索。
①文本检索(Full Text Retrieval):是针对存贮于数据库中的整本图书、整篇文章中的任意内容进行的检索。
文本检索可以根据读者的需要获取文本数据库中的有关章、节、段、句、词等任何信息进行。
检索结果即可以是文本自身,也是可以对文本进行各种统计分析的结果。
例如,“《红楼梦》一书中‘贾宝玉’一共出现过多少次?”等问题就可以通过文本检索加以回答。
②超文本检索(Hyper Text Retrieval):是指对计算机网络节点中所存贮的文本信息以及超连接文本信息进行的检索。
它强调网络中心与网络节点之间的语义联接结构,依靠系统提供的复杂工具进行图示穿行和节点展示,提供浏览时查询以及跨库检索。
③超媒体检索(Hyper Media Retrieval):是指对存贮于计算机和计算机网络中的文本、图像、声音等多种媒体信息的检索。
它具有多维存贮结构,采用方向性链接。
与超文本检索一样,它也可以提供浏览时查询以及跨库检索。
(3)根据检索技术手段的不同,信息检索可以分为:手工检索(手检)和计算机检索(机检)①手工检索(manual retrieval):多使用印刷型或书本型检索(paper-based retrieval)工具,早期有检索卡片,现在使用最多的是检索期刊,它们定期地将最新收集到的信息加以汇总、组织和报道。
手工检索的技术要求不高,以人的劳动为本,由人来翻阅,由人来进行比较、选择,完成匹配。
手工检索工具能提供的检索途径十分有限,检索结果往往不尽人意。
②计算机检索(computer-based retrieval):技术含量高,它是通过计算机对数据库系统的操作来实现的。
计算机检索不仅需要先进的技术设施,也要求较高的人的文化素质。
检索系统包括:计算机主机设备、外部存贮器、输入输出设备、终端设备、通信设备等硬件设施,还需要控制、检索软件系统,包括:通信软件、操作系统、应用程序等,以实现对数据库的信息存取。
检索过程是在人与机器的合作、协同下完成的,它们经常用实时的(real time )、交互的(interactive )的方式从计算机存贮的大量数据中自动分拣出用户所需要的信息。
计算、比较、选择的匹配任务是由机器来执行的,而人则是整个检索方案的设计者和操纵者。
这里,检索的本质没有变,变化的是信息的媒体形式、表示方式、存贮结构、存取方式。
计算机检索又可以细分为光盘检索、联机检索和网络检索。
③ 计算机检索的优势计算机检索明显优于手工检索,主要表现为检索的信息量大、数据更新快、检索功能强、检索结果输出的多样性等。
检索的信息量大:且不说大型机器的海量存贮,一张普通光盘的信息存贮量就达650M ,相当于几十万页的印刷性图书。
计算机若与全球网络相连,就能获得世界范围的信息。
数据更新快:计算机处理与电子传输的速度快、数据的动态、及时更新、检索的实时性都是手检工具无法比拟的。
检索功能强:机检系统可提供很多检索途径,对一个检索途径还可以同时取若干个检索属性值,从多点交叉切入,有多重限定,有多种组合方式,允许人机交互,能达到高效、高精度的检索效果。
并具有多库检索,多媒体和多种知识检索功能。
检索结果输出的多样性:用户可以选择各种输出形式和输出格式,比如屏幕显示、拷贝、下载、打印等都是常用的方式,输出的内容、格式和形式可选择或自行定义。
总的趋势是机检方将逐步取代手检方式。
当前许多经典的印刷型工具都有与其相对应的电子数据格式、数据库,印刷工具则成了电子数据加工输出的“副产品”,许多新生的数据库不再与印刷型工具有缘,仅有其电子版本。
三、文献检索的过程文献检索的基本过程是:通过对大量的、分散无序的原始文献信息进行搜集、加工、整序,建立各种各样的检索系统,并根据用户的需要,从中查找出用户所需特定的文献信息(文献线索)。
文献检索的关键在于通过一定的方法和手段使文献的存贮与检索这两个过程所采用的特征标识(检索标识)保持一致,以便有效地获得和利用文献资源。
其中存贮是为了检索,而检索是存贮的根本目的所在。
文献存贮和检索的全过程如下图所示:原始文献加工文摘款目整序检索语言检索课题分析检索表达式检索系统规范化检索结果→↑→→→加工↑输入检索标识智能匹配→→文献信息的存储过程→文献信息的检索过程存贮的过程,主要对信息源进行搜集、加工和整序。