文献检索基本知识
- 格式:doc
- 大小:1.12 MB
- 文档页数:11
第一、二章定义:信息P3 文献(记录有知识的一切载体) 信息检索P49 信息检索语言P57 知识点:1、信息的分类(按加工深度分)P6一次文献信息:二次文献信息:卡片、目录、索引、文摘等检索工具书三次文献信息:手册、百科全书、年鉴、名录、指南等参考工具书(能区别,能举例)2、文献检索分类:P49按检索方式分:手工检索机器检索按检索对象分:✹文献检索如:查找“会计电算化在企业中的应用”方面的信息或文章。
✹事实检索如:禽流感最早出现在哪些国家✹数据检索如:某一年我国的自然出生人数和死亡人数。
(注:多出现在填空、选择、判断题,要会举例,会区别)3、信息检索主要方法:P51-521)顺查法(时间上,远→近)常用法:2)逆查法(时间上,近→远)3)抽查法(抽查一定时期的资料)追溯法:循环法:4、信息检索效果评价P53查全率查准率漏检率误检率响应时间输出方式5、检索语言按基本属性分为P57✹分类检索语言(在我国,分类检索语言以《中国图书馆分类法》为代表)✹主题检索语言《中图法》知识:P60-61✹将所有知识分为五个基本部类:马克思主义、列宁主义、毛泽东思想、邓小平理论部类;哲学、宗教部类;社会科学部类;自然科学部类;综合性图书部类。
✹在五个基本部类基础上分为22个大类(要求掌握A/B/C/D/E/F/G/H/I/J/K 这几大类能区别、能举例)主题检索语言知识:关键词:语言是自然语言,直接取自文献的题名、文摘等,或者取自全文.未经规范化,漏检率和误检率较高,质量较差。
优点是容易标引、快速、客观叙词:又叫主题词,自然语言中优选出来并经过规范化处理的名词术语。
最主要的特性是组配性----概念组配。
主要应用于计算机检索。
标题词:单元词:第三章定义:文献检索工具P74 手工检索工具:P75( 也可能出现在填空、选择。
) 知识点:1、区别:检索工具书(二次文献)书目、题录、索引、文摘。
参考工具书(三次文献)辞书、百科全书、年鉴、手册、类书、政书、表谱、图录、名录、大全、概况、汇编(能举例、能辨别)2、标引:简单了解标引分分类标引、主题标引、非主题标引。
第二章文献检索基本知识一、文献检索的基本概念信息检索:广义:将信息按照一定的方式组织和存储起来,并根据用户的需求找出有关信息的过程。
狭义:指用户找出有关信息的过程。
信息检索的类型(根据不同的检索对象):数据检索:检索的结果是数据。
如某种材料的电阻;某变压器的参数;化学分子式、数据图表等<手册>事实检索:检索的结果是事实结论。
查询某一事物(事件)的性质、定义、原理以及发生的时间、地点过程等。
如某产品是哪个厂家生产,哪个牌子的最好;第一颗人造卫星是什么时候升空的<年鉴>文献检索:检索的结果是文献资料。
查找相关文献的内容、出处、收藏单位等。
如系统地查找水压伺服控制阀原理方面的相关文献<论文>自然语言:自然表达某一概念的语言,没有强制性的规定。
通俗地说,就是对于一个概念你想怎么表达就怎么表达。
在文献检索中,关键词(key words)等用的就是自然语言.人工语言:人为规定的概念表达语言。
通俗地说就是对于一个概念你必须使用规定的语言来表达。
在文献检索中,主题词(subject)通常用的就是人工语言图书分类号1、中国图书馆图书分类法(中图法)为全国公共图书馆和信息研究所等机构所采用,是我国通用的综合性书资料分类法。
1973年试用版,1975年第一版,1980年第二版,1990年第三版,1999年第四版。
共分22个大类例如:A马、列、毛、邓B哲学、宗教S农业科学T工业技术TN无线电电子学电信技术TN.3半导体技术中国图书馆分类法(中图法)2、中国科学院图书馆分类法(科图法)目前中科院系统和部分高等院校采用。
1958年第一版,1980年第二版、1994年第三版。
例如:00 马、毛10 哲学20 社会科学总论21 历史历史学73 电技术、电子技术76 冶金学3、中国人民大学图书馆分类法(人大法)部分图书馆和信息资料机构使用该分类法1953年第一版,1980年第五版,1989年第版增订本,1996年第六版例如:1马、列、毛2哲学11工程技术15历史4、国外主要分类法:杜威十进制分类法(Decimal Classification,简称《杜威法》或DC,DDC)国际十进制法(Universal Decimal Classification,简称或UDC)美国国会图书馆图书分类法(Library of CongressClassification,简称《国会法》或LC)概念匹配:计算机计算机电脑微机PC 机文字匹配:计算机计算机电脑电脑微机微机输入输出使用人工语言通常为概念匹配使用自然语言通常为文字匹配四、检索工具定义:是人们用来存储、报道和查找文献的工具。
文献检索知识一、文献检索的涵义文献检索的概念有狭义和广义之分。
狭义的检索(Retrieval)是指依据一定的方法,从已经组织好的大量有关文献集合中,查找并获取特定的相关文献的过程。
这里的文献集合,不是通常所指的文献本身,而是关于文献的信息或文献的线索。
如果真正要获取文献中所记录的信息,那么还要依据检索所取得的文献线索索取原文。
广义的检索包括信息的存储和检索两个过程(Storage and Retrieval)。
信息存储是指工作人员将大量无序的信息集中起来,根据信息源的外表特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。
而检索是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。
依据检索对象的不同,文献检索可分为三种类型:(1)以查找文献线索为对象的文献检索;(2)以查找数值与非数值混合情报为对象的事实检索;(3)以查找数据、公式或图表为对象的数据检索。
二、文献检索的基本原理信息检索的基本原理是:通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。
其中存储是为了检索,而检索又必须先进行存储。
存储的过程,主要对信息源进行标引,将其外表和内容的特征(如文献的标题、作者、来源和主题等)用特定的检索语言转化为一定的标识(如主题词、分类号和类目名称等),再将这些标识按一定的顺序编排后输入检索系统,从而为检索提供有规可循的途径。
为了保证文献信息能存得进、取得出,就必须使文献存储所依据的规则与文献信息检索所依据的规则尽量做到一致。
也就是说,为了检索过程的顺利进行和达到较高的检索效率,除了在存储和检索过程的各个环节必须依据一定的方法和规则外,还必须有统一的检索语言和名称规范作为存储人员和检索人员的共同依据。
查全率指用户找到的符合信息需求的信息线索记录数,占其应该找到的符合信息需求的信息线索记录数的百分比。
查准率指用户找到的符合信息需求的信息线索记录数占其找到的符合检索条件的信息线索记录数的百分比。
增加检出文献量的技巧1.多用单元词少用多元词,提高查全率。
单元词指意义上不能再拆分的词,如“儿童”;几个单元词组成的词称为多元词,如“智障儿童”。
2.尽量多使用同义词、近义词,包括俗称、学名、缩写等。
如检索词为“维生素E”时,应增加“维E”、“维他命E”等词;在EI数据库中运用作者检索时,其姓名拼写有多种写法。
3.利用叙词表获得关键词的上位、下位词。
检索词为“食用油”时,可增加棕榈油、棉籽油等下位词,如果研究食用油提炼技术,可参考非食用油提炼技术,检索词可修改为“油”。
4.少用含义过于偏窄或过于宽泛的词。
最好不要把发展、研究、综述、趋势、分析等作为检索词,否则将会造成文献漏检。
5.试查相关数据库,以初步检索借鉴相关文献的用词,扩展、变更检索词。
某同学查找有关用模式识别方法进行信息分类的文献时,仅使用classification作为检索词,在找到的文献中,发现有些文献还同时使用了category,因此决定增加category作为检索词。
6.英文检索词可借助Google翻译、中国知网(CNKI)的工具书等。
截词符截词符主要用于合并拼写相似的同义词、近义词、同根词,提高检出文献量,如:数据库中查找中药的文献,“中草药”、“中药”、“中成药”为同义词,都可以作为检索词,在中国知识产权局专利数据库中,上述三词可简化为“中%药”EI数据库中查找manage、manager、management的文献时,可以使用manage*,表示前面三词。
不同检索工具采用不同截词符,一般*或%为无限截词,截掉多个字符,?或#为有限截词,截掉了0或1个字符。
邻近算符以Web of Science为例,位置算符same、near/X、onear/X的应用:computer same design表示目标文献中的两词必须出现在同一个地址字段中。
文献的分类一、普通文献1、图书⑴、图书的特点①、内容比较系统,全面,成熟,可靠;②、出版周期较长,传递信息速度较慢。
⑵、示例:找汉武帝的兴衰和重大历史事件,应该在《史记》汉武帝本纪中查找。
2、报纸⑴、报纸的特点①、可随时阅读,不受时间限制,不会如电视或电台节目般错过指定时间报导的讯息;②、互相传阅,读者人数可以是印刷数的几倍;③、即使阅读或理解能力较低的人,亦可相应多耗时间,吸收报章的讯息;④、因特网崛起,网上版报纸的传阅力较传统印刷品报章强。
⑵示例:查找新闻“哈马斯加沙银行总部被炸”的事件,应该在人民日报查找。
3、期刊⑴、期刊的特点①、报道及时期刊与图书相比较,出版周期短,刊载论文的速度快、数量大、内容新颖、发行与影响面广,能及时反映国内外科学技术的新成果、新水平、新动向。
②、内容广泛期刊发表的文献,大多数是原始论文,提供的资料包括研究方法、仪器装置、结果讨论和参考文献等。
此外,期刊还刊登文献述评、动态介绍、会议消息,书评和新书预告、产品广告等,内容十分丰富。
不仅如此,其它类型的文献,也常常在期刊上发表,如会议论文、科技报告、学位论文等,重要的专利在期刊上也常有报告。
③、连续出版期刊连续出版,不仅有利于情报的传递,而且它们所积累的大量文献,历史地、系统地记录了某一学科或某一研究对象的发展过程。
期刊每期都有目录,卷末或年末编有各种索引,有的期刊还出版多卷或多年的累积索引,便于文献情报检索。
⑵示例:找湿地系统的生态作用与全球变暖的关系研究,在期刊《绿色科技》中查到。
二、特殊文献1、专利文献⑴、专利文献的特点:①、数量巨大、内容广博。
②、集技术、法律、经济信息于一体。
专利文献记载技术解决方案,确定专利权保护范围,披露专利权人、注册证书所有人权利变更等法律信息。
同时,依据专利申请、授权的地域分布,可分析专利技术销售规模、潜在市场、经济效益及国际间的竞争范围。
是一种独一无二的综合科技信息源。
③、反映新的科技信息。
1.信息的定义:信息,是事物存在方式、运动状态及其特征的反应,是事物发出的信号、消息。
2.信息的特征:(1)载体依附性(2)无限共享性(3)永不枯竭性(4)开发增值性(5)应用时效性(6)存在普遍性3.知识的定义:信息是知识的源泉和基础,知识是信息的升华和结果,系统化、理论化的信息就称为知识。
4.知识的分类:(1)Know What(2)Know Why(3)Know How(4)Know Who5.文献的定义:文献,记录有知识的一切载体。
6.文献的四要素:(1)信息内容(2)信息符号(3)记录方式(4)载体材料信息、知识、情报、文献四者之间的关系:信息是产生知识的原料,知识是被人类优化、理论化后的信息集合,式存储和传递信息、知识的载体。
7.信息源的类型:(按信息源存在形式分):(1)个人信息源(2)组织机构信息源(3)事物型信息源(4)文献型信息源(5)电子型信息源文献型信息源:1)图书:是指内容比较成熟、资源比较系统、有完整定型装帧形式的出版物。
要较全面、系统地获取某一专一的知识,参阅图书是行之有效的方法。
优点:成熟可靠、系统全面。
缺点:知识陈旧。
2)期刊:与图书相比,期刊出版发行速度快,内容新颖、丰富,但是不系统。
(按信息源内容加工深度分):定义、例子、特点(1)零次文献:未经出版发行或未进入社会交流的最原始的文献。
如:私人笔记、底稿、手稿、个人通信、新闻稿等特点:内容新颖、但不成熟,不公开交流,难以获得。
(2)一次文献:以作者本人取得的成果为依据而创作的论文、报告等经公开发表或出版的各种文献,习惯上称为原始文献。
如:期刊论文、专利说明书、技术标准等。
特点:在形式上具有多样性,在内容上具有原创性,在出处上具有分散性。
内容新颖丰富,叙述具体详尽,参考价值大,但数量庞大、分散。
(3)二次文献:是按照特定目的对一定范围或科学领域的大量分散的、无组织的一次文献进行鉴别、筛选、分析、归纳和加工整理重组而成的系统的、有序的、方便查找使用的浓缩简化产物,即所谓的检索工具。
第二章文献检索基本知识一、文献检索的基本概念信息检索:广义:将信息按照一定的方式组织和存储起来,并根据用户的需求找出有关信息的过程。
狭义:指用户找出有关信息的过程。
信息检索的类型(根据不同的检索对象):数据检索:检索的结果是数据。
如某种材料的电阻;某变压器的参数;化学分子式、数据图表等<手册>事实检索:检索的结果是事实结论。
查询某一事物(事件)的性质、定义、原理以及发生的时间、地点过程等。
如某产品是哪个厂家生产,哪个牌子的最好;第一颗人造卫星是什么时候升空的<年鉴>文献检索:检索的结果是文献资料。
查找相关文献的内容、出处、收藏单位等。
如系统地查找水压伺服控制阀原理方面的相关文献<论文>信息检索(Information Retrieval)与文献检索(Document Retrieval)是两个不同的概念,文献检索是信息检索的一种最基本的、最主要的形式。
二、检索语言:根据信息检索需要创造的一种人工语言描述文献外部特征的语言题名语言:一般按题名字顺逐字排检著者语言:一般按姓前名后的字顺逐字排检号码语言:如专利号、标准号、ISBN号、ISSN号描述文献内容特征的语言分类语言:根据学科内容等对文献进行分类。
如图书分类号、国际专利分类号、标准分类号等主题语言:自然语言,人工语言自然语言:自然表达某一概念的语言,没有强制性的规定。
通俗地说,就是对于一个概念你想怎么表达就怎么表达。
在文献检索中,关键词(key words)等用的就是自然语言.人工语言:人为规定的概念表达语言。
通俗地说就是对于一个概念你必须使用规定的语言来表达。
在文献检索中,主题词(subject)通常用的就是人工语言图书分类号1、中国图书馆图书分类法(中图法)为全国公共图书馆和信息研究所等机构所采用,是我国通用的综合性书资料分类法。
1973年试用版,1975年第一版,1980年第二版,1990年第三版,1999年第四版。
共分22个大类例如:A马、列、毛、邓B哲学、宗教S农业科学T工业技术TN无线电电子学电信技术TN.3半导体技术2、中国科学院图书馆分类法(科图法)目前中科院系统和部分高等院校采用。
1958年第一版,1980年第二版、1994年第三版。
例如:00 马、毛 10 哲学20 社会科学总论 21 历史历史学 73 电技术、电子技术 76 冶金学3、中国人民大学图书馆分类法(人大法)部分图书馆和信息资料机构使用该分类法1953年第一版,1980年第五版,1989年第版增订本,1996年第六版 例如:1 马、列、毛2 哲学11 工程技术 15 历史 4、国外主要分类法:杜威十进制分类法(Decimal Classification ,简称《杜 威法》或DC ,DDC )国际十进制法(Universal Decimal Classification,简称 或UDC)美国国会图书馆图书分类法(Library of Congress Classification,简称《国会法》或LC )三、文献检索的原理:提问(检索)语言 匹配 文献标识语言情报工作人员四、检索工具定义:是人们用来存储、报道和查找文献的工具。
因此它具有存储和检索的功能 特点:详细地著录了文献的外部特征和内容特征具有既定的检索标识,如主题词、分类号、作者姓名等 全部文献根据标识系统地科学地排列,成为一个有机的整体提供多种检索途径检索工具的形式:书本式检索工具期刊式:连续性,具有期刊的出版特点单卷式:独立性,以一定的专题为内容附录式:不单独出版,附于书刊之后卡片式检索工具:(很少用)缩微式检索工具:(很少用)机读式的检索工具:(磁带等已很少用)现在常用的检索工具如网络、光盘数据库等检索工具的类型:1、目录型检索工具:按一定次序编排,仅提供检索线索常见的几种目录型检索工具1)国家书目:是一种不加选择地记载一个国家出版的全部图书的目录,可反映一个国家的出版业水平2)馆藏目录:同图书馆、情报所等单位自己编制的本馆藏书、资料的目录3)联合目录:是汇总若干图书馆或其它收藏单位所藏书的目录4)出版社目录:是根据出版社出版的图书或书店发行的图书馆编制而成的目录2、文摘型检索工具:简明扼要地报道文献内容的检索工具,不包括对原文的补充、解释或评论。
文摘可以揭示文献内容,吸引读者阅读原文。
是二次文献的核心,检索工具的主体。
文摘的类型:报道性文摘:文献的核心内容,一般为400-500字,必要时可增至1000-2000字。
有时读文摘可取代读原文。
指示性文摘:又称简介,对标题的补充说明,起到解题的作用。
不能替代阅读原文。
专用文摘:指各种专业文摘机构根据各自的专业特点和读者要求而规定的文摘形式。
所反映的不是原文内容的全部观点,而是与本专业有关的那一部分。
文摘型检索工具著录格式3、题录型检索工具:题录:由一组著录项目构成的一条文献记录。
与目录的区别:目录以一个完整的出版单位为著录单位,题录通常以“篇”为基本著录单位,所提示的文献深度较目录强与文摘的区别:不带文摘,其他一样。
所揭示的文献深度不如文摘,但较文摘快,可以弥题录型著录格式4、文献指南和书目之书目文献指南:主要是介绍某一类型的一次文献的检索方法,以及介绍利用图书馆的一般方法。
如《参考书指南》书目之书目:检索工具的目录。
注:对于计算机检索来说,有的数据库可以直接获取全文,称为全文型数据库,即全文型的检索工具中文科技文献常见检索工具(手工)举例:《全国总书目》-----查找国内出版图书的基本工具《外国科学技术新书征订目录》-----查找外国原版新书的工具《全国西文期刊联合目录》-----查找西文期刊最全的工具《全国报刊索引》(自然科学版)------查找报刊论文的题录式检索工具,容量最大,门类最广《中国学术会议文献通报》-----以文摘、题录的形式报道全国科技会议论文《中国专利公报》------查找国内专利的检索工具五、检索途径(和检索语言相对应,也是手工检索工具的编排方式):已知文献线索:著者途径(著者名、机构名)题名途径(书刊名、文献名)序号途径(标准号、专利号)未知文献线索:分类途径(分类号)主题途径(主题词):用表达内容方面的词作检主题检索手工检索:查找主题词(通常按字顺排列)计算机检索:在题名.关键词等字段中输入表达检索内容的词智能控制and 机床1数控机床智能控制系统鲁棒性策略研究2神经网络在数控机床智能控制中的应用检索过程:分析研究课题◊选择检索工具◊确定检索途径,选择检索方法◊查找文献线索◊获取原文原文索取方式去馆藏单位借阅或复印(由近及远的原则)本馆◊馆际互借合作单位、本市公共信息服务机构◊其他地区包括国外馆际互借*网上全文下载(计算机检索)联机借阅:通过联机直接向原文单位发出借阅命令(如OCLC系统)联机订购:由联机检索系统和信息公司联手提供服务(网络数据库、电子期刊等)论文的参考文献、文摘型数据库等找到文献线索后◊图书馆是否购买全文的电子版文献◊网上是否有免费的全文下载(较少)◊本馆馆藏◊馆际互借(或自已到相关信息服务机构复印)中科院图书馆、国家图书馆——书刊借阅及复印国家图书文献中心——网上原文传递清华大学等高校图书馆借书证——自已去借六、参考工具书(属于三次文献)工具书是一种将汇集、编著或译述的材料,按特定的方法加以编排,以供解释疑难时查考之用的图书从汉代的《尔雅》《说文》至今,中文工具书已有2000多年的历史工具书的特点内容上具有完整性在编排方法上具有易检性目的功用上具有查考性辞书:字典、词典、辞典的统称词和辞的区别:收录语文词汇为主的称词典;收录术语、专有名词、学科性词汇为主的称辞典网上资源——词典 ()OneLook dictionaries ()Your Dictionary ()Oxfordreference ()字典网(/zi.htm)百科全书:百科全书是知识的总汇,是一切知识门类广泛的概述性著作。
包括综合性百科全书(如中国大百科全书)专业性的百科全书(如中国企业百科全书)是否有一部优秀的综合性的百科全书,常常是衡量一个国家科学文化发展水平的尺度百科全书由若干条目组成。
条目是百科全书的基本知识单元,是独立的概念或完整的知识主题。
也是基本的检索单元。
条目一般包括条头、释文、参考书目此外还有前言、插图、附录(如大事年表)和索引等现代百科全书的特点:1、概述知识条目化2、条目编排词典化:按标题的字母顺序排列;有完整的检索系统3、百科全书内容要求较强的稳定性,具体指标:全书70—80%的内容能够有大约10年的参阅价值。
为了适应知识不断更新的需要,现代百科全书修订制度主要有再版制、补卷制、连续修订制4、百科全书由专家撰写、审定,具有较高的可靠性和权威性。
其内容浩瀚,往往要投入大量的人力、物力,需较常的出版时间,因此,它难以及时反映最新科技研究动向及发展,为此,不少百科全书出版社出版相应的百科年鉴来作补充现代百科全书往往逐年编辑出版年鉴,及时反映年度大事、学科进展、事实数据。
形式上,年鉴不是对百科全书的直接修订,但内容上补充百科全书的不足,为全面修订积累资料百科全书的编排:1、分类编排:按学科分类(较少采用)2、字顺编排:按条目首字的拼音或笔画顺序3、分类和字顺相结合的编排方式中国的百科全书:20世纪初传入我国,80年代发展起来典型代表:《中国大百科全书》该书由中国大百科全书出版社出版,从1980年开始到1993年陆续完成。
这是我国第一部现代大型综合性百科全书,其总编辑委员会有100多专家组成,撰稿2万人。
全书共有条目7.8万,文字125百万,插图5万,内容有许多与科学技术有关。
全书按学科共分为74卷,其中73卷为正文,1卷为索引。
正文包括:数学、物理学(2卷)、力学、化学(2卷)、天文学、地质学、固体地球物理学.测绘学.空间科学、大气科学.海洋科学.水文科学、地理学、中国地理、世界地理、生物学(3卷)、现代医学(2卷)、中国传统医学、农业(2卷)、水利、交通、矿冶、机械工程(2卷)、土木工程、建筑.园林.城市规划、电工、电子学与计算机(2卷)、自动控制与系统工程、航空.航天、化工、轻工、纺织、环境科学经济学(3卷)、财政.金融.税收.物价、哲学(2卷)、宗教、心理学、政治学、社会学、法学、军事(2卷)、民族、中国历史(3卷)、外国历史(2卷)、考古学、中国文学(2卷)、外国文学(2卷)、美术(2卷)、音乐.舞蹈、戏剧、戏曲.曲艺、电影、教育、语言.文字、新闻.出版、文物.博物馆、图书馆学.情报学.档案学、体育。
《中国大百科全书》简明版1998年又出版了第2版(简明版) (ISBN: 7-5000-5903-5),全书共12卷,按拼音顺序编排光盘版1999年北京东方鼎电子有限公司制作了中国大百科全书图文数据光盘,集74卷书于24张光盘之内,共收66个学科,条目77895条,约12568万字,绘制图表49765幅,具有分类目录检索,主题词目录检索,拼音目录检索,外文目录检索,模糊检索等十余种检索功能,等于拥有了一个小型家庭图书馆。