《中国分类主题词表》电子版文献标引分析
- 格式:pptx
- 大小:206.79 KB
- 文档页数:27
第四讲主题法与主题标引一、主题法的概念所谓主题法就是直接以表达文献的语词作为检索标识,以字顺为主要检索途径,并通过参照系统等方法揭示词间关系的标引和检索文献的方法。
所谓主题,通常指文献论述的对象,包括事物、问题、现象等。
而经过选择,用来表达文献主题的语词,称为主题词。
――《文献分类法主题法导论》/马张华,候汉清编著,北京图书馆出版社,1999.7二、主题法的特征:目前各国采用的主题法存在多种形式,但一般都具有如下特征:1.都是以特定的事物、问题、现象,即主题为中心集中图书资料的。
主题法不象分类法那样需要受学科体系的限制,而是直接从主题对象的角度揭示图书资料的。
2.都是以语词作为检索标识的。
3.都是以字顺方式作为主要检索途径的。
虽然根据揭示词义关系的需要,主题法也采用范畴、词族等方式组织主题词,但字顺方式始终是它的主要排检依据。
4.一般都是通过详尽的参照系统等方式揭示主题词之间的关系的。
为克服字顺排列不能揭示主题词之间联系的局限,主题法发展了完备的参照系统,并备有词族索引、范畴索引、轮排索引等多种辅助索引,从而在主题词之间建立起充分的语义联系。
5.主要是用来处理文献资料、编制各类检索工具及检索系统的。
分类法通常用以组织文献排架和组织分类检索工具;主题法则一般不用于组织图书,只广泛用于组织各种检索工具,不仅可以利用它编制各类供手检使用的书目索引,也可以用来建立计算机检索系统,进行机械检索。
三、主题法的类型主题法的类型可以有许多不同的划分方法,按照主题词的选词方式,习惯上可以分为标题法、元词法、叙词法、关键词法;按照其使用时组配的先后,则可以分为先组式主题法和后组式主题法。
1.标题法标题法是最早出现的一种主题法类型。
它是一种以标题词作为文献主题标识的标引和检索的主题法。
所谓标题词,亦称标题,是指经过规范化处理的,用来标引文献的词或词组,通常为比较定型的事物名称。
标题法是一种在手工检索工具的基础上发展起来的,采用列举方式的主题法。
《中国图书馆分类法》第五版说明《中国图书馆分类法》第五版,是为适应信息环境、技术环境和社会环境的变化而对第四版所做的修订,其新增类目1631多个,修改类目5200多个,停用或直接删除类目2500个,补充了新主题、新概念,调整完善了类目体系,增加了复分标记等,将类表的科学性、实用性有机地统一起来,充分反映和体现了信息组织、知识组织、文献组织的工具性,更好地满足文献标引、信息、知识、文献的检索需求。
其修订特点主要有:1 确定了特别处理的大类、重点修订大类和局部调整大类根据用户使用意见、《分类法研究与修订调研报告》以及“修订报告”对《中图法》第4版存在问题的分析,此次修订确定“A马克思主义、列宁主义、毛泽东思想、邓小平理论”为特别处理的大类,“F经济”、“TP自动化技术、计算机技术”、“U交通运输”为重点修订大类,“D政治、法律”、“G文化、科学、教育、体育”、“TS轻工业、手工业、生活服务业”等与政治、经济、文化、生活、计算机技术相关类为局部调整大类。
最后的修订结果也基本体现了这些修订重点。
A类:推荐选择使用法。
规定若不集中A大类文献,可按文献性质及学科内容分散处理。
对A类均给出选择使用类号并在D大类增设了相关类。
如:马克思、恩格斯、列宁、斯大林的综合性著作及其研究可入D33/37的“\|0”;毛泽东、邓小平的综合性著作及其研究可入D2\|0;马列主义、毛泽东思想研究,专论、专题汇编及其研究入有关各类。
例:马列主义研究入D0\|0,毛泽东思想研究入D610.0,邓小平理论研究入D610.1,邓小平论文艺入I0,毛泽东传入K827=73等。
F类:增删改类目数最多。
(1)新增类目230多个。
直接增加主题概念类目,如F0\|08西方经济学(总论)、F209涉外经济管理、F26产业经济、F719.52博彩业、彩票业、F740.46国际贸易代理等;对某一类目扩充加细、增加下位类,如F271企业体制、F49信息产业经济、F590.7各类型旅游、F840.6各种类型保险等;修改某一类目的类名,调整其下位类,并扩充其他类目,如F25物流经济、F241劳动力与人力资源、F272企业管理(总论)、F293城市土地经济、房地产经济、F713.36电子商务等。
文献检索的含义文献信息检索或情报检索,是指将文献信息按一定的方式组织和储存起来,并能根据用户的需要取出所需特定信息的整个过程。
它的全名为信息存储与检索。
通常所说的信息查询或检索只是名称的后一半,或是"狭义"的信息检索。
文献检索分为数据检索:以文献中的数据为对象的一种检索。
如某公式、某化学分子式等。
事实检索:以文献中的事实为对象,检索某一事物发生的时间、地点或过程文献检索:以文献为对象,查找某个课题的有关文献的一种检索。
用检索标识与文献的存储标识相比,如果能够取得一致,就叫"匹配",就可得到"命中文献"。
文献检索语言文献检索语言是一种人工语言,用于各种检索工具的编制和使用、并为检索系统提供一种统一的、作为基准的、用于信息交流的一种符号化或语词化的专用语言。
因其使用的场合不同,检索语言也有不同的叫法。
例如在存储文献的过程中用来标引文献,叫标引语言;用来索引文献则叫索引语言;在检索文献过程中则为检索语言。
检索语言按原理可分为3大类:(1)、分类语言它是将表达文献信息内容和检索课题的大量概念,按其所属的学科性质进行分类和排列,成为基本反映通常科学知识分类体系的逻辑系统,并用号码(分类号)来表示概念及其在系统中的位置,甚至还表示概念与概念之间关系的检索语言。
《中国图书馆图书分类法》是我国图书分类法的基础,中图法把一切知识门类按"五分法"分为马列、毛泽东思想;哲学;社会科学;自然科学;综合性图书这五大部类。
在此基础上建成由22个大类组成的体系系列。
(2)、主题语言是指经过控制的,表达文献信息内容的语词。
主题词需规范,主题词表是主题词语言的体现,词表中的词作为文献内容的标识和查找文献的依据。
(3)、关键词语言指从文献内容中抽出来的关键的词,这些词作为文献内容的标识和查找目录索引的依据关键词不需要规范化,也不需要关键词表作为标引和查找图书资料的工具。
中国生物医学文献系统采用《医学主题词表》我国生物医学文献系统采用《医学主题词表》1. 前言我国生物医学文献数据库是我国最大的生物医学科技文献数据库之一,其涵盖了医学领域的广泛内容,包括临床医学、基础医学、卫生医学、预防医学等多个学科领域。
而《医学主题词表》作为我国生物医学文献系统的标准索引系统,对于高质量、深度和广度兼具的中文文章的撰写来说,具有非常重要的意义。
2. 《医学主题词表》的简介《医学主题词表》是我国生物医学文献系统采用的一种主题词表索引系统,是我国医学科技情报研究所和美国国家医学图书馆合作编制的,是我国生物医学文献数据库和我国生物医学期刊数据库的主题标引工具,也是我国生物医学文献评台的核心标引体系之一。
该主题词表按照一定的规则对文献内容进行标引,并进行汇编成册,为广大医学工作者提供了方便快捷的检索服务。
3. 《医学主题词表》的深度和广度《医学主题词表》涵盖了临床医学、基础医学、卫生医学、预防医学等多个学科领域,其深度和广度覆盖了医学领域的方方面面。
不仅包括了一些常见疾病、症状和治疗方法,还包括了一些新的医学进展、技术和研究成果。
如果我们能够熟练地运用《医学主题词表》,就能够更全面地了解医学领域的最新发展和研究成果。
4. 在文章中的应用在撰写中文文章时,我们可以通过多次提及《医学主题词表》中的术语和关键词来增加文章的专业性和权威性。
在介绍某一疾病的病因、症状和治疗方法时,可以使用《医学主题词表》中规定的标准术语,这样更有利于读者对文中内容的理解和接受。
我们还可以根据《医学主题词表》中的分类体系,对文章内容进行更系统化和科学化的整理,使文章更加严谨和有条理。
5. 个人观点和理解作为一名文献写手,我认为熟练地运用《医学主题词表》是非常重要的。
它不仅可以提高文章的质量,还有利于读者对文章内容的理解和接受。
在撰写高质量、深度和广度兼具的中文文章时,我们应该充分利用《医学主题词表》,不仅能够为文章增色不少,还可以让文章更具学术价值和实用性。
汉语主题词表摘要该词表是 1974 年作为“汉字信息处理系统工程”的配套项目开始编制,并在研究和借鉴国外叙词表编制技术的基础上,根据国际标准 ISO2788《单语种叙词表编制规则》,经过近 9000 人 5 年时间的工作,于 1980 年编成问世。
该词表具有科学性和实用性,其编制技术达到了国际先进水平,因而在 1985 年荣获国家科学技术进步奖二等奖。
目录1基本内容2简介3汉语主题词表4国务院公文主题…目录1基本内容2简介3汉语主题词表4国务院公文主题…收起编辑本段基本内容我国第一部大型的综合性的叙词表,由中国科技信息研究所和北京图书馆负责主持,1975 年开始编制,1980 年正式出版。
分为社会科学、自然科学和附表 3 卷,共 10 个分册,全表收录主题词 108568 个。
其中正式主题词 91158 个,非正式主题词 17410 个,词族数 3707 个,一级范畴数 58 个,二级 674 个,三级 1080 个。
中国编制的大型综合性中文叙词表。
中国科学技术信息研究所与北京图书馆主编,1980 年科学技术文献出版社出版。
共收正式叙词 91158 条,非叙词 17410 条,范畴类目分为三级。
1991 年自然科学部分出增订本,增补新词 8221 条,删除不适用词 5434 条。
《汉语主题词表》分 3 卷10 册:第一卷(2 册)为社会科学部分,第二卷(7 册)为自然科学部分,两部分均包括字顺主表、范畴索引、词族索引和英汉对照索引,第三卷为附表,包括世界各国政区名称、自然地理区划名称、组织机构名称及人物名称。
《汉语主题词表》涵盖各个学科专业,收词量大,编制体例规范,对推动中国主题标引工作的开展和促进专业叙词表的编制起了重要作用。
1985年获国家科学技术进步二等奖。
一部大型的综合性中文叙词表,它包括了人类知识的所有门类,分 3 卷 10 个分册出版,共收叙词 11 万条。
该词表主要供电子计算机系统存储和检索文献用,亦可用来组织卡片式主题目录和书本式主题索引。
张琪玉文库□ OF分类号—主题词对应表(《检索语言讲座》第6讲)1 分类号—主题词对应表的功能和类型1.1 分类法与主题法的互补及分类标引与主题标引的联系分类法的主要特点是从学科、专业角度集中文献,以及它在检索文献上的系统性。
主题法的主要特点是从事物角度集中文献,以及它在检索文献上的直接性。
两者各有特长,功能互补,而不能互相取代。
所以,最好给检索者提供两种检索途径, 任其根据检索要求的具体情况选用。
同时,分类标引过程中的主题分析与主题标引过程中的主题分析,两者虽有差异,但基本上是相同的。
所以,如果把分类标引与主题标引结合起来,不但可节省人力,还可互相参照,更透彻地了解文献的主题内容,提高标引的准确性。
再者,分类表如果备有类目索引(可从主题途径查类目),词表如果备有分类索引(可从分类途径查词),则使用更为方便。
1.2 分类号—主题词对应表的特殊功能分类号—主题词对应表,正是根据上述需要而设计的一种标引工具。
它一般具有分类号—主题词对应表和主题词—分类号对应表两个部分,前者相当于一部完整的分类表和词表的分类索引,后者相当于一部完整的词表和分类表的类目索引。
利用这种对应表,可在文献标引过程中同时作分类标引和主题标引两项工作,也可在只有分类检索系统或只有主题检索系统的情况下从另一途径进行间接检索。
1.3 分类号—主题词对应表的类型分类号—主题词对应表大体可分为两种主要类型:一种是分面组配分类表与主题词表(叙词表)的对应,一般称为“分面叙词表”,如我国的《教育主题词表》,其两个主要组成部分是字顺叙词表和分面分类表。
另一种是体系分类表与主题词表的对应,称为“分类主题词表”或直接称为“对应 表”,如《中国分类主题词表》、《中国图书馆图书分类法(R类)与医学主题词表 (MeSH)、中医药学主题词表对应表》。
后者是一种体系分类表与两种主题词表对 应。
《中国图书馆图书分类法教育专业分类表》也属此种对应表,但只有分类号—主 题词对应表一个组成部分。
文献主题标引规则
文献主题标引规则是指在对文献进行主题标引时所遵循的一系列规则和原则。
其目的是为了提高文献检索的准确性和效率,使用户更快地找到自己需要的信息。
以下是文献主题标引规则的一些基本原则:
1.标引应准确反映文献的主题内容,突出文献的主要特点。
2.标引应简明扼要、清晰明了,用词应具有较高的代表性和概括性。
3.标引应符合语义逻辑,标引词之间应具有一定的逻辑关系和语义关联。
4.标引应尽可能使用标准化的主题词表或分类法,以便于不同用户之间的交流与理解。
5.标引应注意避免歧义、重复和混淆等问题,确保标引结果的准确性和可靠性。
总之,文献主题标引规则是一个非常重要的标引工作方面,需要考虑众多因素,并且需要不断更新和完善,以满足用户的需求。
二十世纪国内外有较大影响的主题词表一.主题词和主题词表主题词表又称叙词表,是将文献标引人员或用户的自然语言转换成规范化语言的一种术语控制工具;它是概括各门或某一门专业学科领域并由语义相关,族性相关的术语组成的可不断扩充的规范化词表。
主题词表通常包括标题表、元词表等不同类型。
它是编制主题标引和文献信息检索系统的主要依据。
中国图书情报学界习惯上又常把叙词称为主题词。
主题词表是文献机构进行信息处理的工作规范和技术标准。
它是对重复性事物和概念所作的统一规定。
二.国内影响较大的主题词表(1)《航空科技资料主题词表》简称《航空词表》1964年公布,是我国第一部叙词表。
是一部用于存储检索航空航天情报资料的专用主题词表。
中国原第三机械工业部第628所编制。
1964年出版的版本是一部先组式的标题表,由“分类主题表”、“主标题汉语拼音字顺索引”和“(子标题)副表”组成。
“分类主题表”的范畴分类采取两级类目,共划分为6个大类、38个小类。
小类下再依拼音字顺编排标题。
1971年第一次修订时,该表已转变为后组性质的叙词表了。
1977年第二次修订后的词表,收词条10000个,其中正式主题词7900个,非正式主题词2100个。
1982年又出版了“增补更正表”增补正式主题词545个,非正式主题词711个。
其体系结构主要包括:字顺主题表、分类主题索引、主题族系索引、主题字顺索引(简表)和型号主题索引。
其范畴分类采取两级类目、大类32个、小类212个。
揭示主题词之间语义关系的参照项主要有:用(Y)、代(D)、属(S)、分(F)、参(C)等。
其特点为:①结构体系和词间关系比较完备;词族成族比较符合ISO2788标准。
②对文献的标引规则、标引方法、目录组织等方面,制定了较系统、详细的使用说明。
③编制了短小的简表,供标引和查词之用。
④与《美国国家航空航天局叙词表》具有较大兼容性,动态性较好。
⑵《中国分类主题词表》中国第一部大型综合性分类主题一体化主题词表。
2023年-2024年图书分类理论考试题库及答案单选题L诸主题是()的图书,按著者所要阐明的主题归类。
A、比较关系B、并列关系C、应用关系参考答案:A2.主题法用()表达各种概念,并按字顺进行排列。
A、语词B、分类号C、索书号参考答案:A3.目前,分类主题一体化检索语言有四种模式:分面叙词表、叙词表式索引、()及集成叙词表。
《中国分类主题词表》属分类表一一叙词表对照索引。
A、分类表B、叙词表对照索引C、分类表一一叙词表对照索引参考答案:C4.《仿杜威书目十类法》,是一部用标记符号代表类目的新型分类法,摆脱了四分法的束缚,分类体系(),是一部适合一般图书馆类分图书的综合性分类法。
A、以一馆藏书为限B、不再以一馆藏书为限C、分学部和政部两类参考答案:B5.将图书中重要的章节分析出来单独归入有关门类,称为()。
A、分析分类B、附加分类C、完全分类参考答案:A6.西汉末年刘向、刘歆编制的()是我国第一部综合性的系统反映国家藏书的分类目录。
它所反映的分类体系,是我国最早的一部图书分类法。
A、七志B、七略C、晋中经部参考答案:B7.分类主题一体化,即分类法向着和主题法一体化的方向发展。
也就是说,分类语言和叙词语言在概念(术语)系统、参照系统、标识系统、索引系统等方面实现了(),两种或两种以上的词表融合为一个统一体。
A、兼容B、统一C、一致参考答案:A8.凡经过改编、改写的图书,应按改写后的内容重新审定归类。
文艺作品从一种体裁改写成另一种体裁的,按()归类。
A、改写前后的体裁均可B、原体裁C、改写后的体裁参考答案:C9.《美国国会图书馆分类法》(LCC),是美国国会图书馆于1901年推出的一种()分类法。
国会图书馆出版发行的卡片式款目和机读目录均用该法标引。
A、字母式B、数字式C、字母数字混合式参考答案:C10.在编制技术上,()运用了按图书内容分类和按形式分类的标准,将两者有机地结合起来;创造性地运用了互著别裁的方法。
汉语主题词表摘要该词表是1974年作为“汉字信息处理系统工程”的配套项目开始编制,并在研究和借鉴国外叙词表编制技术的基础上,根据国际标准 ISO2788《单语种叙词表编制规则》,经过近9000人 5年时间的工作,于1980年编成问世。
该词表具有科学性和实用性,其编制技术达到了国际先进水平,因而在1985年荣获国家科学技术进步奖二等奖。
目录1基本内容2简介3汉语主题词表4国务院公文主题…目录1基本内容2简介3汉语主题词表4国务院公文主题…收起编辑本段基本内容我国第一部大型的综合性的叙词表,由中国科技信息研究所和北京图书馆负责主持,1975年开始编制,1980年正式出版。
分为社会科学、自然科学和附表3卷,共10个分册,全表收录主题词108568个。
其中正式主题词91158个,非正式主题词17410个,词族数3707个,一级范畴数58个,二级674个,三级1080个。
中国编制的大型综合性中文叙词表。
中国科学技术信息研究所与北京图书馆主编,1980年科学技术文献出版社出版。
共收正式叙词91158条,非叙词17410条,范畴类目分为三级。
1991年自然科学部分出增订本,增补新词8221条,删除不适用词5434条。
《汉语主题词表》分3卷10册:第一卷(2册)为社会科学部分,第二卷(7册)为自然科学部分,两部分均包括字顺主表、范畴索引、词族索引和英汉对照索引,第三卷为附表,包括世界各国政区名称、自然地理区划名称、组织机构名称及人物名称。
《汉语主题词表》涵盖各个学科专业,收词量大,编制体例规范,对推动中国主题标引工作的开展和促进专业叙词表的编制起了重要作用。
1985年获国家科学技术进步二等奖。
一部大型的综合性中文叙词表,它包括了人类知识的所有门类,分3卷10个分册出版,共收叙词 11万条。
该词表主要供电子计算机系统存储和检索文献用,亦可用来组织卡片式主题目录和书本式主题索引。
编辑本段简介《汉语主题词表》由主表(字顺表)、附表和辅表组成。
一、主题标引程序主题标引,是指用语词标识(即标题词、主题词、单元词、关键词)来表达信息载体主题的操作过程。
主题标引程序包含两个过程,即:①分析信息主题一一弄清信息载体有多少主题?是什么主题?主题的构成因素和相互关系;②用语词标识表达载体主题,也就是将分析出来的主题概念转换成语词标识。
1、分析信息主题信息载体主题概念绝大多数是由若干个概念因素构成的,每一个概念因素,用一个主题词来表达。
表达同一个主题的多个主题词,联结成一个词串,也可以称为标引句。
在一个词串中的词,一般是按逻辑次序排列的。
按逻辑次序排列的词串,是一种层次结构。
也就是说,标引句是按语意从泛指到专指层层展开、层层深入具体化的。
2、用主题词表达信息载体主题用主题词表达信息载体主题(主题词标引)的基本要求是:掌握主题标引的特点;选择适当的标引方式;遵守主题词表的规定;遵守主题词的组配规则;遵守主题词串的词序规则。
现分述如下:标引环节主题词标引可归纳为两个环节:(1)针对所分析出的信息载体主题的各个构成因素,从词表中选出最合适的(在词表范围内最专指的)标引用词。
(2)将选出的标引用词组成合理的词串一一能正确表达信息载体主题的标引句。
二.机读数据的主题标引在我国图书馆,中文图书的主题标引一般采用《汉语主题词表》或《中国分类主题词表》。
,外文图书的主题标引则多采用美国的LCSH。
为建立馆藏图书的机读目录,应该遵守中华人民共和国文化行业标准《中国机读目录格式》。
虽然《中国机读目录格式》中主题字段的规定明显受到LCSH的影响(UNIMARC的主题字段是依据LCSH规定的),但是,使用《汉表》为机读目录作主题标引时仍然应该依据它的规定。
1、机读目录的主题字段及子字段《格式》的“主题分析块”包括“主题标目””主题分析”和“分类号”三部分。
其中的“主题标目”部分,主要是依据主题标目的主标目(导词)所表达概念的范畴划分出多个主题字段,具体如下:600个人名称主题601团体名称主题602家族名称主题604名称(作者)和题名主题605题名主题606学科名称(论题)主题607地名主题610非控制主题词每一个字段又相应分出若干子字段。