信息组织资料
- 格式:doc
- 大小:84.50 KB
- 文档页数:5
信息组织信息组织是通过一定的工具和技术将无序的信息组织成一个有序系统的方法。
信息超载就是指系统或个人所接受的信息超过其自身的处理能力或信息未能有效利用的状况。
信息超载就是人们拥有过多的没有消化或不可能消化的信息。
信息超载的结果导致信息生态环境的变化,信息接受效率降低,信息浪费。
信息污染信息污染,又称信息传播噪音。
它是指在有用信息中夹杂着大量无用信息,甚至是有害信息,从而加大筛选和组织信息的难度,影响信息传播的效果。
知识组织?文献检索文献检索(是以文献为检索对象的信息检索。
它为用户提供的是与用户的信息需求相关的文献信息,它的目的是相关文献的出处和收藏处所。
这些文献可以是涉及某一主题、学科、著者、文种、年代的文献。
文献检索的结果提供与课题相关的数篇文献的线索或原文供用户参考。
数据检索数据检索(是以数值或图表形式表示的数据为检索对象的信息检索。
数据检索是一种确定性检索。
信息用户检索到各种数据是经过专家测试、评价、筛选过的,可直接用来进行定量分析。
事实检索是以从文献中抽取的事项为检索内容的信息检索。
事实检索(其检索对象既包括非数值信息,也包括一些数据信息,针对查询要求,由检索系统进行分析、推理后,再输出最终结果。
语法信息组织、语义信息组织、语用信息组织语法信息组织是以信息的形式特征为依据组织信息的方法,如字顺组织法、代码组织法、地序组织法、时序组织法等。
语义信息组织是以信息内容或本质特征为依据组织信息的方法,我们常用的分类组织法、主题组织法就属这一层次。
语用信息组织是以信息的效用特征为依据组织信息的方法,如根据信息的权值、概率等组织信息的方法。
对于科学信息来说,最本质的是语义信息组织法,其他两个层次的组织方法也有其特别的作用,它们构成相互补充的信息组织方法体系。
信息组织包括哪些内容?从广义上来说,信息组织的内容包括信息搜集与选择、信息分析与揭示、信息描述与加工、信息整理与存储。
对信息的描述与揭示以及序化是信息组织的中心内容。
信息组织复习资料1.文献著录标准:名解:国家或国际范围内,对文献著录的原则、内容、格式等作出具有一定约束力的规范。
目前国际上影响最大,使用最广泛的著录标准有ISBD和AACR.2.文献标引:信息资源的标引,也称文献标引,是指分析文献的内容属性以及相关外表属性,并用特点语言表达分析出的属性或特征,从而赋予文献检索标识的过程。
两个环节:1.主题分析2.转换标识3.先组式语言,后组式语言:依标识组合时间的先后,可将标引语言分为先组式语言、后组式语言、散组式语言。
先组式语言是指标识在编表时(标引前)就已组合好,标引或检索时不必或较少进行组配的标引语言;后组式语言是指标识主要供组配使用。
而且标引时不将标识组配在一起,到检索时才将标识组配起来的标引语言;散组式语言是指标识主要供组配使用,而且标引时就要表达主题概念的若干个标识组配在一起的标引语言。
4.信息组织的阶段及划分?按职能把信息组织的发展分为三个阶段 a.清册职能时期 b.查检职能时期 c.组织职能时期按组织对象把信息组织的发展分为三个阶段 a.文献组织阶段 b.信息组织阶段c.知识组织阶段。
5.语义信息组织方法:(1)分类组织法(2)主题组织法语用信息组织方法:(1)权重值组织法(2)概率组织法P24判断目前的组织方法属于语义还是语用组织方法。
6.网络信息环境对传统信息组织方式的冲击主要体现在以下方面:(1)信息量剧增以及信息传递速度的加快(2)信息种类增多,数据库成分复杂化,过去主要适用于文本信息的信息组织方法已不敷使用(3)用户成分发生很大变化,用户要求信息组织方式的透明化,易用化。
(4)网络信息资源共享要求信息组织标准化、兼容化。
7 .a.一次信息:①超文本方法②自由文本方法③主页方式b.二次信息:①搜索引擎方法②主题树方法8.主题树方法组织信息资源的优点:a.主题树屏蔽了网络资源系统相对于用户的复杂性,提供了一个基于树浏览的简单易用的网络信息检索与利用界面b.信息检索由用户按照规定的范畴分类系,逐级查看,按图索骥,目的性强,查准率高.c.采用树型目录结构诅咒信息资源,具有严密的系统性和良好的可扩充性.9.下位类:经过一次划分所形成的一系列概念称为子类或下位类上位类:被划分的类称为母类或上位类。
安徽省图书资料系列职称考试《信息组织》重点知识第一章绪论第一节信息组织概述 1.网络信息资源网络信息资源是以计算机技术、通信技术、多媒体技术相互融合而形成的Internet及其他网络获取的各种有用的信息资源。
2.信息组织是指对信息包括文献信息和网络信息的一种序化或整序。
即依据一定的科学规则和方法通过对信息外在特征和内容特征的描述和序化实现无序信息向有序信息的流转从而保证用户对信息的有效获取、利用以及信息的有效流通和组合。
3.信息组织的理论基础:信息组织的理论基础主要包括系统论、信息论、控制论符号学与编码理论语言学逻辑学、科学分类和目录学等。
4.信息组织的内容:广义的信息组织内容包括信息搜集与选择、信息分析与标引、信息描述与加工、信息整理与存储。
狭义的信息组织内容包括信息标引、信息描述和信息排序。
5.信息组织的功能●描述、揭示、报导信息特征的整序功能。
●再现、重组信息单元联系的增值优化功能。
●规范、控制信息流向的社会目标功能。
●方便、有效提供的用户利用目标功能。
6.信息标引含义信息标引是依据一定的标引规则在对信息资源内容属性进行分析的基础上给出信息资源属性的检索标识过程。
7.信息标引过程包括两个主要环节主题分析与转换标识。
●信息标引类型●●按照信息标引所用的检索语言可主要分为分类标引和主题标引两种类型。
●●按照使用标引设备可分为手工标引、自动标引和机助标引 8.信息资源描述信息资源描述是依据一定的规则和技术标准对信息资源的外部特征和部分内容特征进行全面描述并给予记录的过程。
9.信息排序信息排序内容主要包括信息资源描述款目记录的排序和信息资源的排序组织。
10.信息组织的必要性 1现今各类信息资源由于数量大、种类多、来源广加剧了信息增长与使用的矛盾。
2解决这一矛盾的根本方法是开发信息资源其基本内容与环节包括信息组织、检索和利用。
3信息组织是信息检索与利用的基础为人们查找、选择和获取信息提供了方法和工具。
主题法的含义主题,主要指信息资源论述的主题对象,包括事物、问题、现象等。
经过选择,用来表达信息资源主题的语词,称为主题词。
所谓主题法,一般是指直接以表达主题内容的语词作检索标识、以字顺为主要检索途径、并通过参照系统等方法揭示词间关系的标引和检索信息资源的方法。
主题法一般都具有下述特征:1、直接以语词作为检索标识。
主题法不像分类法那样,以一种抽象的号码系统作检索标识,而是直接选用自然语言中的语词进行标引和检索。
2、以字顺作为主要检索途径。
虽然主题法往往也采用按范畴、词族等方式组织主题词,但字顺方式始终是它的主要排检依据。
我国的主题检索系统通常是根据汉字特点,按照拼音或笔画笔顺进行排检的;因此在使用主题法检索时,只要知道检索对象的名称,就可以按相应的排检方式进行查找。
在机检系统中,一般可以直接输入语词,由计算机进行查找,通用性好。
以特定的事物、问题、现象,即主题为中心集中信息资源。
分类法由于受学科体系的限制,从不同学科角度研究,同一对象的信息资源是分散在各知识门类中的,主题法则是直接从主题对象的角度揭示信息资源。
4、往往是通过详尽的参照系统等方式揭示主题词之间关系。
按照字顺排列不能必然揭示主题概念之间的联系,为了克服这一局限,主题法发展了完备的参照系统,通过在主题词下设置用、代、属、分、参等多种参照项,建立起“隐蔽的分类体系”。
与分类法相比,主题法的特点是可以集中与一个主题有关的各个方面的信息资源,检索的直接性、通用性好,适合于进行各种专指检索,在性能上具有与分类法相互补充的特点。
主题法通常不用于组织图书,只广泛用于组织各种检索工具,不仅可以利用它编制各类供手检使用的书目索引,同时也可以用来建立计算机检索系统,进行机检。
按照主题法的选词方式,可以分为标题法、元词法、叙词法、关键词法;1、标题法标题词,亦称标题,并非指文献“标题”中的词,是指经过词汇控制,用来标引文献的词或词组,通常为比较定型的事物名称。
信息检索需求的多样化(1)文献检索:是以文献为检索对象的信息检索。
它为用户提供的是与用户的信息需求相关的文献信息,它的目的是相关文献的出处和收藏处所。
文献检索的结果是提供与课题相关的数篇文献的线索或原文,供用户参考.(2)数据检索:是以数值和图表形式表示的数据为检索对象的信息检索。
数据检索是一种确定性检索.(3)事实检索:是以从文献中抽取的事项为检索内容的信息检索。
信息标引:就是对信息内容进行分析并充分而有效地予以揭示。
揭示信息的内容是检索信息、利用信息的前提条件。
从学科属性揭示信息内容就是分类标引,从主题特征揭示信息内容就是主题标引。
准确标引信息要求准确的内容分析,否则就会出现错误标引。
信息系统组织:信息通过特征描述和内容揭示,获得了表示信息的标识,但这只是针对某一文献和信息单元的,把这些信息有序地组织起来才完成了信息组织的过程,这个过程就是信息系统组织。
信息系统组织是把描述和标引的信息实体和信息记录组织成一个有序的系统。
一、信息组织方法:(一)按组织对象分:文献实体组织与信息内容组织(二)按信息组织的层次分:语法信息组织、语义信息组织与语用信息组织(三)常用信息组织方法:1.分类组织法 2.主题组织法 3.集成组织法三、信息组织手段1、人工组织2、自动组织1、分类检索语言:分类检索语言习惯简称分类语言或分类法,分类检索语言语族主要有三个语支,即(1)等级体系分类语言(2)分析综合分类语言(3)半分析综合分类语言。
2、主题检索语言(1)标引词语言(2)单元词语言(3)叙词语言检索语言词汇控制的意义:检索语言构成材料就是词汇,把词汇按某种方式组织起来构成检索语言词典,它是标引和检索的工具。
检索语言的词汇控制又称规范化处理。
由于表述信息内容的词汇非常庞杂,日常的自然语言词汇并非都能准确表达信息的学科和主题内容。
自然语言缺点(1)词汇的同义现象。
(2)词汇的多义现象。
(3)词汇语义不清或语义不确定。
信息组织期末复习资料1.信息组织、文献目录、索引、检索语言的基本概念。
信息组织:亦称为信息资源组织,是根据使用的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等进行分析、选择、处理、序化,并以适当的方式加以提供的方式。
文献目录:通常是以各种媒体的文献单元为对象,对其进行记录、报道与揭示的工具,包括文献收藏目录和书目。
索引:是以文献集合中的文献单元或文献中的信息单元为揭示对象的检索工具。
检索语言:是一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统。
2.信息组织与信息检索的关系。
信息组织是信息检索的基础和前提;信息检索是信息组织的目的和归宿,是信息组织的反向过程。
3.信息资源组织的类型。
按组织对象分为信息资源和检索工具;按检索工具的类型分为目录、索引、数据库和网络搜索引擎;按照标识特征和提供的检索途径分:题名检索工具、责任者检索工具、分类检索工具、主题检索工具、按照引文关系的检索工具;按照组配方式分:先组式检索工具、后组式检索工具;按照是否控制:受控检索工具、自然语言检索工具;4.检索工具的类型(依据对象与特点划分)。
按照检索工具的对象和特点,可以分为文献目录、索引、机读数据库和网络搜索引擎。
①文献目录:以各种类型的文献单元为对象,对其进行揭示、报道的工具。
包括:(1)文献收藏目录——以一个或多个文献单位收藏的文献为对象加以描述和揭示;(2)书目——通常以某一领域、地域、或时限内出版的文献为对象进行组织和揭示,也可以根据应用需要编制,为用户提供较为全面的文献信息。
②索引:是以文献或文献集合中包括的信息内容为其揭示单元的工具,包括期刊索引、书后索引等;③机读数据库:是由文献资源为对象的机读记录的有序集合,是一种依托现代计算机技术、以机读形式建立的检索系统。
包括:(1)参考数据库——书目数据库收录文献目录或索引数据;全文库收入文献全文,可进行文本检索;(2)源数据库——包括事实数据、数值数据、图像数据等类型。
信息组织1.信息组织:根据信息检索的需要,以各种类型的信息资源为对象,运用适宜的工具和方法,依据一定的标准和规则,通过对信息外在特征和内容特征的表征和排序,实现无序信息流向有序信息流的转换,从而使信息集合达到科学组合,保证用户对信息的有效获取和利用。
2.信息组织的层次:有序化、优化(重组)3.信息组织的功能:基本功能:全面揭示和再现信息的外在特征和内容特征,科学反映和描述信息的特色。
增值优化功能:信息单元、数据依据逻辑方法再现和重组的过程是一个序化增值过程。
目标功能:减少信息间的相互干扰,控制信息的运动方向,有效地将信息组织起来,形成一定的成果。
社会功能:通过信息合理而规范的组织,能有效控制信息流向,从而实现一定的社会目标。
4.信息组织的要求:内容有序化、流向明确化、流速适度化、数量精简化、质量最优化5.信息组织方法:1. 以信息资源的外部特征为检索依据,提供从资源外在形式进行检索的途径。
描述法(著录、编目)2. 以表达信息资源主题内容的标识为依据,提供从资源内容角度进行检索的途径。
分类法和主体法6.信息组织的内容:(按活动类型分)信息选择、信息分析、信息描述和揭示、信息储存(按层次分)描述报道、有序化并控制、揭示开发、浓缩增值、聚集重组7.信息组织的成果:目录、索引、数据库、搜索引擎8.目录:著录一批相关的文献,按一定的次序编排而成的一种登记、报道和宣传文献实体和虚拟信息的检索工具。
包括文献收藏目录和书目9.索引:索引是将原始文献中某些重要的或有意义的信息,如书名、刊名、篇名、主题、人名、地名等分别摘录出来,进行标引,再按一定方式编排,并注明出处,以供检索的工具。
信息组织描述法1.2.信息描述:根据信息组织的目的和信息检索的要求,按照一定的信息管理规则和技术标准,将存在于某一物理载体上的信息资源的形式特征和部分内容特征进行全面描述并给予记录的过程。
3.描述性编目(Descriptive Cataloguing):是对文献的外部特征进行识别、分析、选择,并予以记录成为款目,继而将款目按一定顺序组织成为目录或书目的过程。
《信息组织》考试重点第一章绪论第一节信息组织概述1.网络信息资源:网络信息资源是以计算机技术、通信技术、多媒体技术相融合而形成的英特网及其他网络获取的各种有用的信息资源。
2.信息组织:是指对信息(包括文献信息和网络信息)的一种序化或整序。
即依据科学规则和方法,通过对信息外在特征和内容特征的描述和序化,实现无序信息向有序信息的流转,保证用户对信息的有效存取、利用以及信息的有效流通和组合。
3.信息资源:人类社会经济活动中经过加工处理有序化并大量积累后的有用信息的集合4.信息组织的理论基础:信息组织的理论基础只要包括系统论、信息论、控制论、符号论与编码理论,语言学,逻辑学,科学分类和目录学等。
5.信息组织的内容:广义的信息组织内容包括信息搜集与选择、信息分析与标引、信息描述与加工、信息整理与存储。
狭义的信息组织包括信息标引、信息描述、信息排序。
6.信息组织的功能:1.揭示、描述、报道、信息特征的整序功能。
2.再现、重组信息单元联系的增值优化功能。
3.规范、控制信息流向的社会目标功能4.方便、有效提供用户利用目标功能。
7.信息资源种类:体裁、文献、实物、网络四种8.信息标引:依据一定的标引规则,在对信息资源内容属性进行分析的基础上,给出信息资源属性的检索标识过程。
9.信息标引过程的两个重要环节:主体分析和转换标识。
10.信息标引类型:按照信息标引所用的检索语言可分为分类标引和主题标引。
按照使用标引设备,可分为手工标引、自动标引和机助标引。
11.分类标引:依据特定的分类法和分类规则,按信息资源内容的学科属性赋予分类检索标识,揭示和组织信息资源的方法。
12.文献分类标引:是依据本单位所采用分类法和分类规则,按文献的学科内容属性及其他显著特征,分门别类地、系统的揭示和组织文献的方法。
内容包括:编制文献分类表、进行分类标引、建立分类检索体系和检索工具。
13.主题标引:是指对信息进行主题分析,依据特定的主题法和主题标引规则,直接用主题语言表达分析出的主题,赋予信息主题检索标识的过程。
资料收集与整理技巧:有效获取与组织信息一、有效获取信息的途径信息获取是资料收集和整理的基础,只有准确、全面地获取到所需的信息,才能进行有针对性的整理和利用。
以下是几种有效获取信息的途径:1. 图书馆资源图书馆是获取信息的重要场所,拥有丰富的书籍、期刊、报纸和其他资源。
通过图书馆的目录系统、索书号和馆藏信息,可以快速找到自己需要的资料。
同时,图书馆还提供许多电子资源,如数据库、电子书和期刊,可以进行在线检索和下载。
2. 在线搜索引擎互联网是目前获取信息最为广泛的途径之一,搜索引擎是其中最常用的工具。
通过关键词搜索,可以迅速找到相关的网页、文章、图片和视频等多种形式的信息。
在使用搜索引擎时,需选用权威可信的搜索引擎,并注意筛选和验证信息的真实性。
3. 学术期刊数据库学术期刊数据库是研究者获取学术信息的重要资源。
比如,CNKI、Web of Science、Scopus等数据库,提供了大量优质的学术论文和期刊文章。
通过设定筛选条件和关键词,可以快速找到自己需要的研究成果和学术信息。
二、整理信息的方法与技巧获取到信息后,接下来的关键是对信息进行整理和归纳,以便后续的利用和参考。
以下是几种整理信息的方法与技巧:1. 分类整理根据信息的性质和内容,进行分类整理是一种常见的方法。
可以根据主题、时间、地点、作者等因素来划分信息的类别,以便后续的查找和利用。
可使用文件夹、标签、目录或电子文档等工具进行分类整理。
2. 概要提取在整理信息时,可以将重点和核心部分提取出来,形成概要。
通过概要可以快速了解信息的要点和结论,方便后续的回顾和查阅。
可以使用摘要、关键词、提纲或笔记等方式进行概要提取。
3. 将信息转换成图表或图像对于大量数据和统计信息,可以将其转换成图表或图像的形式。
通过直观的图形展示,可以更好地理解和比较不同数据之间的关系和变化趋势。
常见的图表形式有柱状图、折线图、饼图等。
三、有效组织信息的工具和技巧有效组织信息是实现信息利用和共享的关键步骤,下面是几种有效组织信息的工具和技巧:1. 电子文档管理工具电子文档管理工具可以帮助我们整理和管理大量电子文件。
2022年秋季学期信息管理与信息系统专业《信息组织》课程期末复习提纲一﹑复习方法以本复习提纲作为复习的主要线索,掌握提纲中所涉及的各知识点。
二、参考资料1 马张华《信息组织》第三版清华大学出版社2022年5月第3版2 《信息组织》网络课件注:教材与课件在编排顺序和内容详略上有所不同,具体的对应关系见学期初挂在论坛上的“学习指导”。
所以在复习时请以教材为主,配合使用网络课件。
三、考试方式与试卷结构采用闭卷方式。
考试的具体形式包括:名词解释、填空题、选择题、问答题。
名词解释――主要帮助掌握术语体系;为了方便复习,本课程提供完整的名词复习范围。
填空和选择――帮助掌握基本知识;问答题――帮助掌握内容的深度了解。
四、各章节知识点第一章一、名词解释信息组织、文献目录、索引、检索语言二、简答题1.信息组织与信息检索的关系。
(了解)2.根据对象与特点划分,检索工具有哪些类型(掌握)3.两种基本检索途径及其特点(掌握)4.传统检索系统中对信息资源处理的基本做法。
(掌握)第二章一、名词解释检全率、检准率二、简答题(了解)1、评价一个信息组织系统应考虑的基本因素。
2、信息组织中的规范控制主要有哪些方法。
第三四章一、、名词解释信息描述、元数据、检索点、MARC格式二、几个典型的信息描述规范,如《文献著录总则》、《都柏林核心集》的基本描述项目(了解)三、简答题:信息描述的作用有哪些(了解)第五章分类法第一节一、名词解释信息资源分类、等级列举式分类法、分面组配式分类法二、简答题1. 简述信息资源分类的特征、作用。
(了解)2. 信息资源分类法的含义是什么?分为哪几种类型?(要求能根据实例判断类型)(掌握)第二节一、名词解释基本部类、复分表(了解)、顺序标记制、层累标记制、八分法、双位制、预留空号法、类目索引(掌握)二、简答题1、分类法的结构组成及各部分的作用。
(掌握)2、类目体系的结构组成。
(掌握)3、复分表的作用。
(了解)4、标记符号的要求、种类、编号制度、常用标记技术(掌握)5、类目索引的几种常见类型及其定义。
信息组织整理资料信息组织整理资料(注:基于个人观点,具体依据课本)名词解释1、标题法P116标题法:用规范化的自然语言语词作标题,直接表达文献主题概念,按照标题字顺排列,并用参照系统显示标题之间关系的一种主题法。
2、单元词法P117单元词法:又称元词法,它是以取自自然语言、经过规范化处理的单元词作标识,通过单元词的字面组配来表达主题概念的一种主题法。
3、词形控制词形控制:指对同义不同型的词优选其中的一种形式作叙词,以避免信息分散而降低查全率,有利于字顺排列。
4、词义控制词义控制:主要是对多义词、同型异义词和词义含糊而导致理解不一的词进行处理,使叙词的词义具有单一性和明确性。
5、文献文献是指在存储、检索、利用或者传递记录的过程中,可以作为一种单元处理的,在载体内、载体上或者依附载体而存储有信息或数据的载体、或称其为固化在一定物质载体上的知识。
6、分面分析所谓分面分析,就是将一个特定的知识领域的主题按其不同的属性分解成为若干不同的组面,每个组面代表主题的一个方面。
7、分面引用次序所谓分面引用次序,就是由类目合成新主题时的组配次序。
不同的知识领域的主题构成形式不同,组配次序也不尽相同,将组面的引用次序加以固定就是分面公式或组配公式。
8、基本的层累制所谓基本的层累制,就是标记制度总体上使用层累制编号,但根据类目实际展开情况和配号的需要又可以有所变通,不严格地采用层累制编号,这样标记符号的位数就不一定与类目的等级相对应了。
9、信息组织信息组织是通过一定的工具和技术将无序的信息组织成有序系统的方法。
二、选择题:1、信息组织的目标是建立有效信息系统,从而便于信息的检索和利用。
2、检索语言一般称为情报检索语言,随着信息检索范围的扩大以及信息概念的更加普及,也称之为信息检索语言;其他概念名称还有标引语言、索引语言、信息表示语言、信息组织语言或知识组织语言。
P143、信息检索系统检索效率评价P34~35对系统总体评价主要有三种方法:效果评价、费用/效果评价、费用/效益评价。
信息组织名词解释信息组织名词解释1. 2. 3. 4. 5. 6. 7. 8. 9.检索语言:般称为情报检索语言(Information Retrival Language,IRL),随着信息检索范围的扩大以及信息概念的更加普及,也有称之为信息检索语言;其他的概念名称还有标引语言、索引语言、信息表示语言、信息组织语言或知识组织语言等。
张琪玉教授系统建立了情报检索语言及其相关概念的体系,并使其规范化,统一了概念名称。
他对情报检索语言的定义是:“根据情报检索的需要而创制的,专门用于各种手工的和计算机化的文献情报存贮检索系统,能够唯一地表达各种概括文献情报内容的概念(主题概念),能够显示概念之间的相互关系,并便于进行系统排列,便于将标引用语和检索用语进行相符性比较的人工语言”。
10. 计算语言学:是在语言学、数学、计算机科学、自动化技术和认知科学的基础上发展起来的。
是一门通过建立形式化的数学模型,来分析、处理自然语言,并在计算机上用程序来实现分析和处理的过程,从而达到以机器模拟人的部分乃至全部语言能力的目的的学科。
计算语言学应用于许多领域,例如:机器翻译、文本分类、信息检索、信息提取、语音合成、语音识别和人机接口等。
11. 句法结构:按某一语言的句法规则把自由形式的词放在一起的结果称为句法结构。
句法结构有关系意义和外部形式。
关系意义就是句法结构的语法意义,分为显性意义和隐性意义。
检索语言句法既研究句法结构的显性意义,更注重对句法结构隐性意义的研究。
例如句法手段的运用,即引用次序和控制符号,就是在对句法结构隐性意义分析的基础上确定的。
12. 引用次序:引用次序(Citation Order),或称组配次序 (Combination Order),和语言学中的词序这一术语相对应。
引用次序是检索语言重要句法手段之一。
引用次序主要有四类,即“显著性引用次序”、信息标引:信息标引即对信息内容进行分析并充分而有效地予以揭示。
(1)名词a 轮排转换(2):依次把检索语句中每一个有检索意义的词轮流排列在检索位置上。
b.分析标引(10):分析标引是一种根据资源中部分片段或集合型资源的构成单元进行的标引。
c.职能符号(2):一种表示主题标识在组配中的句法职能而规定的辅助符号。
d.层累制(5):是按照类目相应的等级配置相应位数的号码,类号可以反映类目次序和等级的标记制度。
e.标记符号(5):是分类法中标记类目的次序、关系和位置的符号。
f.同义控制(2):是对字面形式不同而含义相同的词进行控制,使检索系统中一个概念只有一个词语表达。
包括对同义词、准同义词及部分专指词与泛指词进行的控制。
同义控制常用的方法是在几个词中选取一个作为规范词,在规范词和非规范词之间建立用代参照,便于用户从非规范词找到规范词。
同义控制的作用是。
g词义控制(2):是对同形异义词和语义含糊的词进行控制,使词义明确,一个词语只表示一个概念,以控制一词多义现象。
词义控制常用的方法是在词后加限义词,在词下增加含义注释和范围注释。
h.联系符号(2):是一种揭示同一文献主题之间联系强度的符号,可以防止主题词之间出现误组配。
i.描述控制(2):即对描述记录的内容、描述方进行的控制。
包括描述项目、描述文字、描述级别、描述格式的控制。
j.句法控制(2):是根据信息资源标引和检索的需要,按照一定的组词造句规则,对检索词的组合方式做出的规定。
常见的句法措施有确定引用次序、使用辅助符号和句式转换。
k.范畴索引(8):范畴索引又称分类索引、范畴表,是一种按照词汇所属的学科或专业范畴编制的概略分类系统,是从分类角度查找叙词的辅助工具。
l.引用次序(2):是指复合主题标引和检索时,各个主题因素的组合次序。
在分类法中引用次序是指类目划分标准使用的先后次序或各主题分面在组配时的先后次序;在主题法中是指字顺检索系统中主标题与各级子标题组合的次序m.检准率(2):是指检出的相关信息资源的数量,占检出的全部信息资源数量的比例。
用公式表示为:检准率=检出的相关信息资源数/检出的信息资源总数×100%n.轮排(2):是指把一串多词素的检索词包含的各个有检索意义的词素轮流排列在检索入口位置的方法。
o.叙词法(8):叙词法是一种从自然语言中精选出来的、经过严格规范处理的叙词作为文献主题的标识,通过概念组配的方式表达文献主题的主题法。
(2)复习重要知识点A常识性知识1)信息组织类型中以内容特征形成的检索工具类型(1):以信息资源的主题内容特征为检索依据,提供从资源内容进行检索的途径,主要有分类法、主题法。
2)词汇控制方法(2):词汇控制的主要措施是什么?(1)词汇控制:即根据标引和检索的需要,对自然语言中的的词汇进行优选、规范、揭示相关性的过程。
(2)词汇控制的主要措施包括:A同义控制,是对字面形式不同而含义相同的词进行控制,使检索系统中一个概念只有一个词语表达。
包括对同义词、准同义词及部分专指词与泛指词进行的控制。
同义控制常用的方法是在几个词中选取一个作为规范词,在规范词和非规范词之间建立用代参照,便于用户从非规范词找到规范词。
同义控制的作用是可以克服一义多词的自然语言现象,把相同内容或特征的信息资源集中在一起。
B词义控制,是对同形异义词和语义含糊的词进行控制,使词义明确,一个词语只表示一个概念,以控制一词多义现象。
词义控制常用的方法是在词后加限义词,在词下增加含义注释和范围注释。
C词间关系控制,是揭示词汇之间的等级、等同、相关关系,使之成为语义相关的系统。
在主题法中词间关系控制采用设置参照、倒置标题、主标题-副标题以及编制词汇索引系统,如词族索引、范畴索引、轮排索引等。
分类语言主要通过类目体系显示词语间的从属、并列、相关关系,用类目参照显示语词概念的横向联系。
(3)词汇控制还应包括词量控制、词组选择与使用控制、词汇专指度控制等。
3)文献分类法类目之间的关系(5)文献分类法类目之间有哪些关系,它们的表现有哪些?(1)类目之间的关系主要有:从属关系,即类目体系中一个类与其直接区分出来的子类之间的关系;并列关系,是类目体系中同位类之间构成的关系;交替关系,是指交替类目与相应的使用类目之间形成的关系;相关关系,是指类目之间除从属、并列、交替等关系之外其他联系;(2)上述关系在类目体系中体现为:从属、并列关系是类目体系的主要关系,揭示类目之间的纵向联系,类目从属关系以上位类、下位类表现出来,类目并列关系以同位类表现出来;类目交替关系、类目相关关系是类目体系主要关系的补充,揭示了类目之间的横向联系;在类目体系中,交替关系以交替类目与使用类目体现出同一关系主题内容的资源的可选择性;相关关系以类目参照体现类目之间的交叉等联系。
5)《汉语主题词表》中标示词间关系的符号(8):在《汉语主题词表》中,等同关系用“用”(Y)“代”(D)两个符号表示,等级关系用“属”(S)、“分”(F)、“族”(Z)三种符号表示,相关关系用“参”(C)表示。
符号“Y”用于非叙词之下,用来指向对应的叙词;符号“D”用于正是叙词之下,用来指向被替代的非叙词。
“F”为分项指示符,表示该项叙词为款目词的下位词,“S”为属项指示符,表示该项叙词为款目词的上位词,“Z”为族首词符号,表示该项叙词为族首词,亦即一组有等级关系的叙词中外延最宽的词。
6)《汉语主题词表》词族索引的排列(8,实习用书)同族词按族首词字序排,族首词以下的词在族首词下按字序排。
8)先组式与后组式信息组织工具(2,8)先组式指在编表时标识已经确定,不能在标引或检索时改变标识,这类工具主要有等级体系分类法、标题法。
后组式是指标识在编表时是非固定的,在标引或检索时组配表达一个主题,如叙词法、单元词法、关键词法、分面组配分类法等。
9)主题法的类型(8):主题法的类型主要有标题法、元词法、叙词法、关键词法等。
10)叙词法吸取了其他检索语言哪些技术;(8):叙词法吸取了元词法的组配技术,把元词法的字面组配和反记法发展为概念组配与倒排档;它也吸取了体系分类法的学科分类和等级结构的方法,编制了范畴索引、词汇索引和词汇分类表;同时它广泛吸取了先组式标题和参照方法、关键词法的轮排技术、分面分类法的分面技术等,使之成为最具优势的检索语言。
11)概念组配与字面组配的区别(8):概念组配与字面组配的主要区别是:(1)两者的本质不同,前者重在拆义,后者在于拆词。
它是利用构词法进行词的分拆与组合。
概念组配本质是在概念分析的基础上进行概念的综合;如“经济伦理学”字面组配是经济+伦理学;概念组配是经济学+伦理学等。
(2)两者的词汇单元不同。
字面组配一般采用单元词,它是不能再分的词汇单元,而叙词则以表达事物的基本概念为基础进行组配的。
如“雪崩二极管”,在单元词法中须分解为“雪崩”、“二极管”,叙词法中“雪崩二极管”可作为词组保留。
12) 叙词与关键词及单元词在词组配方面最主要的区别:1.结构完备,词汇控制严格;采用概念组配,免了字面组配带来的一些误差,保证了组配寓意的准确性。
设置了完善的参照系统,同时使用多种方法现实概念间的关系,有利于提高查全率和查准率。
2.组配准确,标引能力强、能准确、专指地标引和揭示各种主题内容;灵活的叙词组配,使叙词语言有较强的表达能力,能专指、及时地表达复杂、新颖的主题。
3.检索效率高,允许多因素检索、多途径检索,使检索具有灵活性。
4.对检索系统的适应能力强,能同时使用于标识单元方式与文献单元方式的检索系统,能较好地适应机检系统和手检系统的需要。
13)分类法的复分表按其使用范围可分为哪些类型(5):按其适用范围,复分表可以分为通用复分表和专类复分表。
14) 分类法与主题法,在学科系统性和专指性上哪个更好(8):分类法系统行好,主题法专指性好15) 《汉语主题词表》中的叙词字顺表与词族索引在排列方面的区别(8):字顺表的编制要点:1.字顺表通常以收录普通叙词为主,同时也适应收录一定数量的专有叙词、2.为了查找方便,一些大型表还编有字顺索引和入口词表以及专有叙词表。
3.在叙词款目的参照项目中,等级关系的现实方式之一是仅显示最直接的上位词和下位词以及族首词,另一种方式是在族首词下现实所有的下位词。
词组索引的编制要点:1.一般收录字顺表中按等级关系处理的叙词,非序词和未按等级关系处理的叙词不收入,2.通常选择外延宽泛、具有实际检索意义的叙词作为族首词3. 对于词族的规模,一般一个词族收录到34-40个下位为宜。
4.词组的显示,通常一族首词为标目,按虚词册等级排列,常以“.”表示类目的级别,级别越深,“.”越多.5.当一个叙词属于多个词族时,可同时反映.16) 《汉语主题词表》中非叙词的作用;(8):1.在叙词表中作为入口词,引向正式叙词2.在语义网条件下,可以与自然语言系统连接。
17) 概念的外延与内涵的关系。
(2):内涵指概念的含义,即概念所反映的对象的本质属性的总和。
外延则是指具有该属性的事物对象,即概念所包含的范围。
18) 在主题法中一般能够轮排的主题因素;一般是主体因素{包括主题因素中的研究对象、材料、方法等}19) 在CNMARC中,个人名称主题、团体名称主题和普通主题在哪些字段(10)1.个人名称(规范化的名词形式),人601团体名称主题字段。
2.机构名称(学校、公司、政府机构、研究所等),入601团体名称主题字段。
3.会议名称填入601会议名称主题字段。
4.作品名称填入605题名主题字段。
5.一般学科名称填入“606论题性主题”字段。
其中,子字段次序为:$a主体因素(除论题付分外)$x通用因素(包括论题复分)位置因素时间因素文献类型因素。
6.新增词记录在“610非空主题词字段”。
B重要问题1).主题法中同义控制的内容;(2,8):同义控制的内容包括同义词之间的控制和准同义词之间的控制。
一般同义词之间的控制方法是选取较通用的一个作为正式叙词;学名与俗称、新称与旧称、全称与简称、不同译名、产品型号与代号等词汇的控制,一般选择学名、新称、全称、规范译名、产品型号等作为正式叙词;词组与对应的组配形式之间,一般选取对应的组配形式;准同义词之间的控制主要有近义词的优选,即选通用的词作为叙词;反义词之间的优选一般选表示正面含义的词为叙词;太专指词并入泛指词。
2)用《中图法》归入相应的基本大类,谈你应用的分类规则。
A.美学在建筑艺术中的应用( TU )B.计算机技术对教育的影响( G )。
C.英汉艺术大词典( J )。
D.生活方式与现代流行病( R )。
E.体育心理学 ( G )。
F.计算机程序设计( TP )G.物理(高中课本)( G )H.郭敬明小说选(I)I.教育心理学( G )(2)A题应用了应用关系的多主题文献标引规则,即一个主题(美学)应用到另一主题(建筑艺术)按应用到的主题归类;B题运用了影响关系的多主题文献归类原则,即一个主题(计算机技术)影响另一主题(教育),按受影响的主题归类;C题运用了字词典的归类原则,即专科词典归入各个学科;D题运用了因果关系的多主题文献归类原则,即一个主题是因(生活方式),另一主题(流持病)是果,按结果方面的主题归类;E题应用了专科心理学的归类原则,即普通心理学入B类,专科心理学当入各个学科。