信息检索与利用概论(研究生-文献检索)基本概念
- 格式:doc
- 大小:105.50 KB
- 文档页数:11
、文献信息检索的含义、分类、检索语言1、文献信息检索:文献检索含义是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称又叫“信息的存储与检索,这是广义的信息检索。
狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻。
计算机信息检索,是指以计算机技术为手段,通过光盘和联机等现代检索方式进行信息检索的方法。
一次文献(primary document):是指作者以本人的研究成果为基本素材而创作或撰写的文献,不管创作时是否参考或引用了他人的著作,也不管该文献以何种物质形式出现,均属一次文献。
二次文献(secondary document):是指文献工作者对一次文献进行加工、提炼和压缩之后所得到的产物,是为了便于管理和利用一次文献而编辑、出版和累积起来的工具性文献。
检索工具书和网上检索引擎是典型的二次文献。
三次文献(tertiary document):是指对有关的一次文献和二次文献进行广泛深入的分析研究综合概括而成的产物。
如大百科全书、辞典等。
零次文献它是指未经过任何加工的原始文献,如实验记录、手稿、原始录音、原始录像、谈话记录等。
零次文献在原始文献的保存、原始数据的核对、原始构思的核定(权利人)等方面有着重要的作用。
用检索标识与文献的存储标识相比,如果能够取得一致,就叫"匹配",就可得到"命中文献"。
2、文献检索语言文献检索语言是一种人工语言,用于各种检索工具的编制和使用、并为检索系统提供一种统一的、作为基准的、用于信息交流的一种符号化或语词化的专用语言。
检索语言按原理可分为3大类:(1)、分类语言它是将表达文献信息内容和检索课题的大量概念,按其所属的学科性质进行分类和排列,成为基本反映通常科学知识分类体系的逻辑系统,并用号码(分类号)来表示概念及其在系统中的位置,甚至还表示概念与概念之间关系的检索语言。
文献(docume nt)指的是在存贮、检索、利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存贮有信息或数据的载体。
以文字、图形、符号、声频、视频、电磁信号等手段记录和传播知识的载体就是文献。
检索策略检索策略(Retrie val Strate gy),是指为实现检索目标而制定的全盘计划或方案,是对整个检索过程的谋划与指导。
数据库数据库(Databa se)是至少由一种文档组成的,能够满足某种特定目的或特定数据处理系统需要的数据集合。
通俗地讲,数据库就是按照一定方式存贮的相互关联的信息集合。
目录目录(Catalo g)是以完整的出版单元(如一种图书、一种期刊)为单位,按照一定次序编排的对文献信息进行描述和报道的工具,也称书目。
目录对文献的描述比较简单,每条记录的字段主要包括:文献题名、责任者、出版事项、分类号、主题词等。
禁用词禁用词(STOP WORD)是指不表达实际意义的虚词,如冠词、介词、连词等。
通常在检索系统生成索引的过程中会忽略这些虚词。
所以,检索时如关键词中间出现这些禁用词,会被检索系统忽略。
1.信息检索答:信息检索是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程,又叫信息储存与检索,这是广义的信息检索。
狭义的信息检索则是仅指该过程的后半部分,即从信息集合中找出所需信息的过程。
2.追溯法(引文法)答:利用参考文献进行深入查找相关文献的方法。
追溯法包括两种方法: 一种是利用原始文献所附的参考文献进行追溯;另一种是利用引文索引检索工具进行追溯。
3.三次文献答:是在对有关的一次文献和二次文献进行分析研究的基础上,通过综合概括而编写出的文献,是文献信息研究的成果和产物,具有参考性和指导性。
文献信息检索与利用信息检索与利用是信息领域的一项重要任务,涉及到检索和利用各种类型的信息源,包括文献、数据库、网络资源、社交媒体等,以满足信息需求和支持决策。
本文将着眼于文献信息检索与利用,介绍文献检索的基本概念、检索工具和检索技巧,并探讨文献利用的方法与技巧,以提高文献检索与利用效率和实用价值。
一、文献检索的基本概念1. 文献定义及其分类文献是指以书写形式记载下来的各种信息,包括书籍、期刊、报纸、学位论文、研究报告、专利、标准、技术资料等,其特点是具有较高的准确性、权威性和可信度。
文献按照出版载体、出版形式和内容特征划分,可以分为印刷文献、电子文献、政府文件、商业文献、学术文献、非学术文献等。
2. 文献检索的定义及意义文献检索是指通过一系列的检索策略和工具,筛选和获取与特定研究主题相关的文献信息的过程。
文献检索的意义在于:可以快速获取大量的相关文献信息,提高研究的效率和准确性;可以发现新的知识点和研究趋势,有助于科学研究和学术交流;可以拓宽学术信息来源,增加研究的深度和广度。
3. 文献检索的基本步骤文献检索一般包括以下基本步骤:(1)明确研究主题和目的,制定检索计划和策略;(2)选择合适的文献检索工具和数据库,如中英文文献数据库、学位论文数据库、专利数据库等;(3)设置检索关键词和检索语法,如采用布尔运算符(AND、OR、NOT)或括号来组合检索词;(4)执行检索操作,并对检索结果进行筛选和评估,包括去重、排除不相关文献、确定重要文献等;(5)阅读和理解检索到的文献内容,提取有用信息和数据,支持自己的研究和决策。
二、文献检索工具文献检索工具是实现文献检索的重要支撑,常见的文献检索工具有以下几种:1. 图书馆目录图书馆目录是指图书馆所收藏的各种文献信息,如书名、作者、出版社、题名、分类号等,通过书名、作者、题名等关键词来检索和查找相关文献。
图书馆目录的优点是全面性强,对于印刷文献和中文文献的获取有很好的覆盖率;缺点是速度慢,检索方式单一,难以处理大量文献信息。
信息检索基础学习目标1.掌握信息、情报、文献、知识的基本概念2.了解文献的类型、特点3.知道数据库的类型与结构4.掌握信息检索的途径、步骤5.理解检索式的编写与检索策略的调整6.熟悉信息网络技术与网络信息检索第一章信息检索与利用概论第一节信息学信息学是研究信息的获取,处理,传递和利用规律性的一门学科。
(一)信息(Information)美国-克劳德·申农(C.Shannon)。
1948年,《通信的数学理论》—―信息‖解释为―两次不定性之差‖,即通信的意义在于消除某种不定性。
该论文成为信息论诞生的标志。
定义1:信息是物质运动规律总和,即不是物质,也不是能量。
定义2:信息论的创始人申农(Shannon )认为:―信息是能用来消除不确定性的东西‖或―信息是确定性的增加” 。
定义3:信息是客观事物状态和运动特征的一种普遍形式。
钟义信1988年《信息科学原理》信息定义为:事物的运动状态和状态变化的方式。
被国内多数教材接受采用。
(二)信息的特征1.普遍性2.传递性3.依存性:信息必须依附于一定的物质形式上(如声波、电磁波、纸张、化学材料、磁性材料等),不可能脱离物质而单独存在。
4.相对性:客观上信息是无限的,但对于信息用户来说,人们实际获得的信息问题有限的。
同一信息对不同认知水平的用户所产生的作用和有效性也不同。
5.可加工性:信息可以加工处理,可以压缩、扩充和叠加,也可以变换形态。
6.时效性7.可共享性:信息与物质,能量显著不同的是。
信息在传递过程中并不是―此消彼长‖,同一信息可以在同一时间被多个主体共有,而且还能够无限的复制、传递,它可以共享。
(三)信息的作用1.信息是人类认识客观世界及其发展规律的基础。
2.信息的基本功能,主要表现为信息的认识功能。
3.信息是科学研究的必要备件。
4.信息是管理和决策的主要参考依据。
5.信息是社会发展的资源。
(四)知识、情报和文献1、知识Knowledge知识是人类认识的成果,它是在实践的基础上产生又经过实践检验的对客观实际的反应。
知识具备的特征:被证实的justified,真的true,被相信的believed(1)知识认识观、知识信息观知识认识观:知识就是对事物的属性与联系的认识,表现为对事物的知觉、表象、概念、法则等心理形式。
即是说,知识是对事物本质及联系的认识。
据此,知识分为:直接知识和间接知识。
----仅属于“有形知识范畴”。
知识信息观(当代知识观):知识是人类通过信息对自然界、生物界、人类社会运动规律的认识和概括,是人的大脑通过思维重新集成整合的系统化信息,是信息中最有价值的部分。
即使说,信息是产生知识的原材料,知识是信息加工的抽象化产物。
-----揭示了知识的信息本质(明确信息与意会信息),适应了信息化时代社会经济与科学技术进步的趋势与要求。
有形知识(显性知识,Explicit knowledge):个人具有有意识的提取线索,能直接用语言表达,便于与他人共享,以命题和命题网为其表征的明确信息。
无形知识(隐性知识,Tacit knowledge):个人不具有有意思的提取线索,不能用语言系统表达,不便与他人共享,以活动中的发生式系统为其表征的意会信息。
获取无形信息的办法:在实践的特定情境中,注意观察、体验他人的行为方式,从他人的观点出发来看待事物,进行领悟式情境学习。
(2)知识的分类——(经济合作与发展组织OECD《以知识为基础的经济》)①关于事实方面的知识,即know-what,类似于数据。
②关于客观原理和自然规律方面的知识,即know-why,类似于科学等。
③关于某些事情的技艺、能力,即know-how,类似于智能、技能。
④涉及谁知道如何做某些事情的信息,及know –who,类似于信息。
2、情报Intelligence ,Information:是指传递着的在特定效用的知识。
三个基本属性:①知识性:根据知识的定义和特性,知识去除了糟粕的信息,并且具有可实践性。
②传递性:没有被激活的知识只能发挥知识的价值,而不能体现情报的价值。
③效用性:情报最大的特点是可以发挥比其作为知识更为巨大的作用。
3、文献Literature ,Document:记录有知识的一切载体。
文献本身并不是知识,其包含的内容才是知识。
文献要素:知识内容、信息符号、载体材料,记录方式。
信息符号、载体材料和记录方式都影响知识内容的获取和利用。
概念间的关系:属种关系。
信息是属概念,知识和情报是信息之下具有交叉的种概念。
信息、知识、情报、文献四者的关系(五)信息源信息源是个人为满足其信息需要而获得信息的来源。
信息类型保存性:正式记录的信息源、非正式记录的信息源时间:先导(天气预报)、实时(现场直播)、滞后(报纸)表现形式:文字、图像、数值、语音内容:社会科学、自然科学、科技信息源存储载体:刻写型、印刷型、缩微型、声像型、机读型。
★★按产生次序和加工程度划分(重要):零次、一次、二次、三次信息理解各层次信息的含义,根据各层次信息的特点能够判断不同出版类型的信息、文献分别属于什么层次的信息和文献。
1.零次信息;从信息理论上来讲,零次信息是信息的一个部分,是一切信息产生的源信息。
即客观存在于社会生活中,通过人的视觉,触觉,听觉等形成的言语,神情,动作,气氛等表象形式。
其主体是口头信息及行为表现,包括广义的网络语言。
在此基础上延伸到记录在非正规物理载体上的未经任何加工处理的源信息叫做零次信息,Eg书信,论文手稿,笔记,实验记录,会议记录等。
2.一次信息:又称原始信息,它是人类社会实践活动中直接产生或得到的各种数据,概念,知识,经验及其总结。
人们直接以自己的生产,科研,社会活动等实践经验为依据生产出来的文献,这些文献是脑力劳动的正式产品,是科研成果的一种主要表达形式,代表新知识,组成了可供交流的系统性信息。
一次信息在整个文献中是数量最大,种类最多,所包括的新鲜内容最多,使用最广,影响最大的文献,Eg期刊论文,专利文献,科技报告,会议录,学位论文等。
一次信息的特点:创造性;原始性;多样性。
3.二次信息:指根据实际需要,按照一定的科学方法,将特定范围内的分散的一次信息进行加工整理使之简化和有序化而形成的文献信息。
它能较为全面系统的反映某学科某专业文献想线索,是检索一次信息的工具。
Eg书目,题录,索引和文摘等。
二次信息的特点:集中性;工具性;系统性4.三次信息:指通过二次信息提供的线索,选用一次信息的内容,进行分析,综合,改编,重组和综合概况生成的信息。
Eg专题评述,动态综述,系统评价,进展报告,学科年度总结,年鉴,指南,百科全书等。
三次信息的特点:综合性;针对性;科学性按出版类型划分:1.图书:有专著,教科书,论文集,会议汇编等。
2.期刊:Journal,又称杂志,是有固定刊名,以期,卷,号或年,月为序,定期或不定期连续出版的印刷读物。
特点为出版周期短,报道速度快,数量大,内容多,发行面广。
3.科技报告:是关于某项科学研究和革新成果的报告或研究过程重点阶段进展状况的实际记录。
内容高度专门化,有一定的保密性。
以单行本的形式出版。
4.专利文献5.会议文献6.政府出版物7.学位论文:特点为论文的水平和质量差别较大,论题比较专一,阐述系统,具体,有一定的独创性观点,且经过一点的审查,故有一点的参考价值。
8.标准文献9.产品样本10.科技档案二、信息需要与行为(一)信息需要指人们在从事各项实践活动的过程中,为解决所遇到的问题而产生的对信息的需求。
是信息行为发生的基础。
信息需要的特征:1.广泛性:人类的实践活动的广泛性也决定了信息需要是普遍存在着的心理现象。
2.社会性:信息需要的产生和发展是由社会环境和社会活动决定的。
所以信息需求不仅仅是个体的特性,而且主要是一种社会需要。
3.发展性:社会实践活动的发展,社会现象日趋复杂,刺激了信息需要的日益增长。
4.多样性:信息用户的知识结构、专业、地位、职责等的多样性决定了信息需要千差万别,即使对于同一信息用户,在不同的时间、地点和环境条件下,由于具体任务的变化,其信息需要也会有很大的差别。
★信息需要的层次(重要):1.未知的信息需要:没有或没有意识到自己处于信息需要的状态,属于客观信息需要。
2.潜在的信息需要:人们认识到而未表达出来的信息需要3.现实的信息需要:当人们意识到信息需要,而且明确表达出来的信息需要的内容:对信息本身的需要是用户信息需要的最终目标。
人们在从事各种社会活动的过程中,为了解决所遇到的问题,就需要了解情况,增长知识,及时做出有效的决策。
由于信息本身的诸多属性,用户对信息的需求也涉及到许多方面。
各类信息用户的需要特点:各类信息用户的信息需要在内容上、质量和数量上、类型上根据解决问题的属性均有所区别。
(二)信息行为:信息行为是人们满足自己信息需要的社会活动的过程。
用户的信息行为主要有信息检索行为、信息的选择行为和信息利用行为。
(1)信息检索行为信息检索行为,指的是用户自己查找、采集和寻求所需要信息的活动(2)信息选择行为信息选择行为指的是信息采集者从某一信息群中把符合自己需要的一部分信息挑选出来的过程。
信息选择的核心标准就是相关性和适用性。
(3)信息利用行为信息利用是用户寻求信息的根本目的。
信息利用行为指的是用户利用信息解决其所面临问题的过程。
(三)信息检索信息检索是指为达到某一特定目的,将信息源与用户需求连接起来,查寻、鉴别、选择并确定相关信息的过程。
广义的信息检索包括信息的存储和信息的检索,所以又称为―信息存储与检索‖。
信息的存储主要包括对在一定专业范围内的信息选择基础上进行信息特征描述、加工并使其有序化。
在现代信息检索技术条件下,信息检索从本质上讲,就是指人们希望从一切信息集合中高效、准确地查询到自己感兴趣的有用信息,而不管它以何种形式出现,或借助于什么样的媒体。
信息检索至少包括三层含义:(1)是按某一主题或某一特征从信息源或数据中查找到相关的信息及其获取线索,如OPAC 检索(2)是为解决某一问题从信息源或数据库中获取隐含于文献中的事实、数据、图像或理论等未知的知识,如全文检索(3)是将查寻的信息及其知识进行分析加工,提供给用户使用,如科技查新信息检索经历了三个发展时期:手工检索时期,机械检索时期,计算机检索时期。
信息检索的意义1)信息控制的手段2)获取知识的门径,学习的助手3)科学研究的工具和指南4)决策与管理的支持与参考第二节信息素养1989年,美国图书馆协会对信息素养定义为:具有信息素养的人能够知道什么时候需要信息,能够有效地获取、评价和利用所需要的信息。
标准一:有信息素养的学生确定所需信息的性质和范围标准二:有信息素养的学生有效地获取所需信息标准三:有信息素养的学生批判性地评价采集资料的信息及信息源,决定是否需要调整最初的信息需求和/或寻求更多信息源,并创建一个新的研究过程。