信息检索05-主题语言
- 格式:ppt
- 大小:628.50 KB
- 文档页数:1
文献检索主题语言
文献检索主题语言是指用于描述文献主题内容的语言。
这种语言主要用于文献检索系统中,帮助用户准确、快速地找到他们所需的文献。
以下是一些常见的文献检索主题语言的类型:
1.关键词语言:这是最简单、最常用的主题语言之一。
在文献检索
系统中,关键词语言通常用于描述文献的主题内容,以便用户可以通过输入关键词来搜索相关文献。
2.主题词语言:主题词语言是指一组经过规范化的词语,用于描述
文献的主题内容。
在文献检索系统中,主题词语言通常用于精确匹配用户查询和文献内容。
3.自然语言:自然语言是指人类日常使用的语言,如中文、英文等。
在文献检索系统中,自然语言通常用于对文献进行全文检索,以便用户可以通过输入自然语言句子或段落来搜索相关文献。
4.元数据语言:元数据语言是指用于描述文献的元数据的语言,如
作者、出版日期、期刊名称等。
在文献检索系统中,元数据语言通常用于对文献进行分类和排序,以便用户可以按照特定标准(如出版时间、重要性等)筛选相关文献。
5.受控词汇表语言:受控词汇表语言是指一组经过规范化的词语,
用于描述文献的主题内容,并具有一定的上下文关系。
在文献检索系统中,受控词汇表语言通常用于精确匹配用户查询和文献内容,并可避免同义词、近义词等问题。
总之,选择合适的文献检索主题语言可以提高文献检索的准确性和效率,帮助用户快速找到所需文献。
主题检索语言的特点(叙词法的特点):直接性:即直接用自然语言名词术语作为标识符号,最直观、最方便,一目了然。
专指性:是指解释和查找文献主题的深度而言。
集中性:主题检索语言对反映同一主题的各个方面的文献可以达到高度集中的效果。
多元性:是指对文献主题内容采用多个主题词进行组配标引和检索,揭示与查找该文献的途径多,从而提高对文献的揭示能力和利用率。
适应性:通过增补新的主题词或通过组配,主题检索语言在表达新概念的文献和新的研究课题的资料时具有很强的适应能力。
标引就是对文献主题分析的结果赋予检索标识的过程。
主题标引:是一种将文献主题的自然语言形态,转换为主题法语言形态(叙词、标题词、关键词、单元词)的标引,这是建立主题检索系统的依据。
分类标引:是一种将文献主题的自然语言形态,转换为分类语言形态的标引,即转换成分类号码的一种标引,这是建立分类检索系统的依据。
浅标引:是一种标引深度较浅的主题标引,主要用于手工检索系统,即把文献中最重要的概念作为主题标识的标引。
深标引:是一种标引深度较深的主题标引,主要用于计算机检索系统,它反应文献中主要的和次要的概念。
标引深度是指对一片文献所赋予的全部检索标识的数量。
就主题标引而言,则指标引一篇文献平均所给予的主题词的数量。
标引等级是指将文献中的概念根据主次按等级划分,分为三个等级,一级概念标引1.一级概念标引,也称主要标引。
仅仅揭示文献的主要论点。
2.二级概念标引,也称次要标引。
3.三级概念标引,也称不要标引。
2.加权标引:是指一种采用打星号的方式区分主要、次要标引的方法。
既为所标引主题词确定IM和NIM词的过程。
加权标引的目的是突出文献重点,划分标引等级。
主题分析概念:是指根据文献存储与检索的要求,对文献内容进行分析,从中提炼主题概念,确定主题类型、剖析主题结构和确定概念间关系的过程主题分析的意义在于使标引者尽可能的掌握一定的分析方法,遵循共同的分析步骤,客服因分析不一致造成的标引不一致,保证标引的初始环节达到较高的一致性主题标引的原则一、基本原则(一)真实性(二)客观性(三)全面性(四)准确性(五)专指性(六)一致性二、选词原则(一)首选专指词(二)次选组配词(三)选择上位词或靠近义词(四)标引自由词三、选词注意事项(一)随时注意主题词的增删,尽量使用新词表。
检索语言检索语言(Retrieval Language)就是组织文献与检索文献时所使用的语言。
也就是说,文献存储时,文献的内容特征(如分类、主题)和外表特征(如书名、刊名、篇名、号码、著者等)按照一定的语言来描述,检索文献时的提问也按照一定的语言来加以表达。
这种在文献的存储和检索过程中,共同使用、共同遵循的语言就是检索语言。
实质上它是标引和检索之间的约定语言,是人与检索系统对话的基础,检索的匹配就是通过检索语言的匹配来实现的。
使用检索工具和检索系统必须掌握检索语言,它是掌握和提高检索技能的基础。
检索语言的基本成分是检索词。
按检索词的规范化程度和组配程序,检索语言可分为自然语言(Natural Language)和人工语言(Artificial)两种。
自然语言采用的检索词是未加工整理和规范过的,即平常采用的关键词,这种语言又称作关键词语言(Keyword Language)。
人工语言采用经过规范化的词,规定一个词表示一种事物,例如规定“aircraft”表示飞机,而不用“air plane”、“plane”和“aeroplane”,以做到文献存储和检索的一致性。
信息检索语言是根据检索需要而创制的人工语言,也称检索标识系统,专门用于各种手工和计算机信息检索系统。
从不同角度检索文献,就有不同种类的检索语言,常用的有主题语言和分类语言,下面分别加以论述。
(一)分类语言分类语言是用分类号和相应分类款目来表达各种概念的,它以学科体系为基础将各种概念按学科性质和逻辑层次结构进行分类和系统排序。
分类语言能反映事物的从属派生关系。
便于按学科门类迸行族性检索。
分类语言中最常见的是体系分类语言,它按照学科体系从综合到一般、从复杂到简单、从高级到低级的逻辑次序逐级展开,世界著名的分类法有:《国际专利分类表》(IPC)、《杜威十进分类法》(DDC)、《美国国会图书馆图书分类法》(LC)、《中国图书馆图书分类法》(中图法)和《中国科学院图书馆图书分类法》(科图法)。