信息组织原理--信息标引
- 格式:ppt
- 大小:234.50 KB
- 文档页数:95
信息组织第一部分信息组织的基本原理一.熟悉和掌握1.信息组织:信息组织是为了方便人们检索、获取信息而将庞杂、无序的信息进行系统化和有序化的过程。
信息组织的内容包括信息收集与选择、信息分析与揭示、信息描述与加工、信息整理与存储。
对信息的描述与揭示以及序化是信息组织的中心内容。
2.信息标引:信息标引就是对信息内容进行分析并充分而有效地予以揭示。
从学科属性揭示信息内容就是分类标引,从主题特征揭示信息内容就是主题标引。
3.信息组织方法:(1)按组织对象分:文献实体组织与信息内容组织文献实体组织的对象是文献,这里的文献指的是传统的信息资源类型,主要指印刷型的出版物,如图书、期刊、会议论文、科技报告等。
文献实体组织是把这些文献及其著录和标引记录组织成一个有序的系统,如图书的分类排架系统、分类目录、主题目录等。
信息组织的本质是信息内容的组织。
(2)按信息组织的层次分:语法信息组织、语义信息组织与语用信息组织语法信息组织是以信息的形式特征为依据组织信息的方法,如字顺组织法等。
语义信息组织是以信息内容或本质特征为依据组织信息的方法,分类组织法、主题组织法就属这一层次。
语用信息组织是以信息的效用特征为依据组织信息的方法,如根据信息的权值、概率等组织信息的方法。
对于科学信息来说,最本质的是语义信息组织法。
4.常用信息组织方法*(1)分类组织法:根据某一特定的分类体系和逻辑结构组织信息的方法。
以内部特征为主。
分类组织法建立了信息的层级和关联体系,便于浏览检索。
(2)主题组织法:通过揭示信息主题特征并有序组织的方法。
主题法通过建立主题概念的范畴、族系和关联关系,显示信息的结构体系。
主题组织法根据所使用的主题检索语言又分为标题法、单元词法、叙词法、关键词法和自然语言组织法。
本体组织法也是。
(3)集成组织法:每种信息组织方法都有其特有的功用,有些组织方法功能是互补的,如将多种方法结合起来使用会达到更好的效果。
如分类主题一体化的组织方法、规范组织方法与自然语言组织法的结合等。
第一章1、信息采集:是指根据特定的目标和要求,将分散在不同时空域的有关信息,通过特定的手段和措施采掘和汇聚的过程。
它涉及一切信息工作中的信息采集活动,包括企业和其他组织的管理者们为了实现决策、管理和控制等目标所进行的信息采集。
2、信息采集渠道:①大众传播媒体②文献③政府机构④合作伙伴⑤消费者⑥信息中介结构3、信息采集方法:问卷调查、访谈、实验研究、文献收集4、信息组织与信息检索的关系:信息检索是根据特定的需求,运用某种检索工具,按照一定的方法,从大量的信息中查找出所需信息的过程。
对信息检索进行完整描述,一般必须包括信息组织和检索两个方面。
在信息检索系统中,信息组织是依据信息资源的主题内容和特征,将无序的信息组织成有序集合。
信息组织是信息检索的基础和前提。
信息组织根据用户需要,以信息资源的一定单元为处理对象,依据预先制定的规范,对其特征加以记录,并进行标引和必要的记录,然后将这些信息记录,按照规定的方式输入检索系统。
第二章1、信息组织:就是人们根据信息本身特点,运用适宜的工具和方法,依据一定的标准或规则,对其进行加工整理,排列组合,使之有序化、系统化、规律化、高级化,增强信息对象的表现效能和运用效能,以满足人们信息需求的过程和活动。
2、信息组织基本内容:按照信息组织的活动类型分“信息选择、信息分析、信息描述与揭示、信息存储”按照信息组织的流程分“信息的筛选和鉴别、信息的分类和排序、信息的著录和标引、信息的编目和组织、信息的分析和研究”3、信息描述与揭示方法:一是著录,主要描述文献信息的形式特征;二是标引,主要揭示文献信息的内容特征。
4、信息组织的类型:信息组织可归为语法信息组织、语义信息组织和语用信息组织三大类型。
从广义上看,信息采集阶段的信息组织主要是一种语用信息组织;信息组织阶段的信息组织属综合型信息组织;信息检索和开发阶段的信息组织则属于优化型语用信息组织。
5、一次信息、二次信息、三次信息:一次信息是人们研究或创造性成果的直接记录,一般指公开出版的图书、期刊论文、研究报告、会议文献、学位论文、专利说明书、网上未经过处理的电子化信息等。
知识点汇总第一章1、信息组织的定义以用户需求为导向,依据信息体自身的属性特征,信息工作者或用户按照一定的原则、方法和技术,将杂乱无章的信息整理成为有序的信息集合的活动和过程.2、信息组织的原理基本原理:如果有若干自然状态的无序信息资料,将这些信息资料按照某种属性特征排列成一个序列,并且需要使用信息资料的用户能将自己的需求转换成相应的信息资料属性特征,并在排列后的信息资料序列中找到自己所需要的信息资料。
信息组织由信息著录标引(信息描述揭示)和信息序化两个工作环节组成。
3、信息组织的内容一般而言,信息组织包括四项内容。
1。
信息筛选(甄别有用信息,剔除无用信息)2.信息分析(对信息的内外部特征进行细化、挖掘、加工整理并归类)3.信息描述与揭示(对信息资源的部分主题内容、形式特征及物质形态等描述维度进行分析、选择、记录的过程)4。
信息整序与存储(按照一定的格式和顺序存储在特定的载体中)4、信息组织的类型按信息的认识层次划分,信息组织有三种类型1.语法信息组织(研究语言符号之间的形式范畴的结构规则,如:字顺法、代码法、地序法、时序法)2.语义信息组织(研究信息的内容特征的组织方法,如:分类法、主题法)3。
语用信息组织(研究环境与使用者的不同而不断变化的信息群,如:权重值信息组织法、概率组织法)5信息组织的作用控制整序提升品质传播利用节约成本第二章1、熵(entropy)最早是热力学上的一个符号,是一种测量在动力学方面不能做功的能量综述。
熵指的是混乱的程度,负熵是物质系统有序化、组织化、复杂化状态的一种量度。
香农第一次将“熵”引入到信息论中,在信息论中,“熵”可以用作某件事不确定度的量度.信息量越大,体系结构越规则,功能越完善,熵就越小.利用熵的概念,可以从理论上研究信息的计量、传递、变换、存储等活动。
学术界目前普遍接受的观点是“信息即负熵”。
2、逻辑学原理在信息组织中的应用概念之间的关系(图略):相容关系同一关系:是指有相同外延的两个概念之间的关系。
信息检索需求的多样化(1)文献检索:是以文献为检索对象的信息检索。
它为用户提供的是与用户的信息需求相关的文献信息,它的目的是相关文献的出处和收藏处所。
文献检索的结果是提供与课题相关的数篇文献的线索或原文,供用户参考.(2)数据检索:是以数值和图表形式表示的数据为检索对象的信息检索。
数据检索是一种确定性检索.(3)事实检索:是以从文献中抽取的事项为检索内容的信息检索。
信息标引:就是对信息内容进行分析并充分而有效地予以揭示。
揭示信息的内容是检索信息、利用信息的前提条件。
从学科属性揭示信息内容就是分类标引,从主题特征揭示信息内容就是主题标引。
准确标引信息要求准确的内容分析,否则就会出现错误标引。
信息系统组织:信息通过特征描述和内容揭示,获得了表示信息的标识,但这只是针对某一文献和信息单元的,把这些信息有序地组织起来才完成了信息组织的过程,这个过程就是信息系统组织。
信息系统组织是把描述和标引的信息实体和信息记录组织成一个有序的系统。
一、信息组织方法:(一)按组织对象分:文献实体组织与信息内容组织(二)按信息组织的层次分:语法信息组织、语义信息组织与语用信息组织(三)常用信息组织方法:1.分类组织法 2.主题组织法 3.集成组织法三、信息组织手段1、人工组织2、自动组织1、分类检索语言:分类检索语言习惯简称分类语言或分类法,分类检索语言语族主要有三个语支,即(1)等级体系分类语言(2)分析综合分类语言(3)半分析综合分类语言。
2、主题检索语言(1)标引词语言(2)单元词语言(3)叙词语言检索语言词汇控制的意义:检索语言构成材料就是词汇,把词汇按某种方式组织起来构成检索语言词典,它是标引和检索的工具。
检索语言的词汇控制又称规范化处理。
由于表述信息内容的词汇非常庞杂,日常的自然语言词汇并非都能准确表达信息的学科和主题内容。
自然语言缺点(1)词汇的同义现象。
(2)词汇的多义现象。
(3)词汇语义不清或语义不确定。
信息标引与信息描述的关系
信息标引和信息描述是信息组织过程中的两个重要环节,它们之间有着密切的关系。
信息描述是信息标引的前提和基础。
在信息标引之前,需要对信息资源进行详细的描述,以便能够准确地揭示和表达信息的内容和特征。
信息描述的结果将直接影响信息标引的效果和准确性。
例如,在信息描述时,需要对文献进行词汇分析、文本内容抽词或分类等处理,这为后续的标引提供了基础。
信息标引是信息描述的进一步发展和深化。
在信息描述的基础上,需要对信息资源进行标引,以便能够方便地检索和利用信息。
信息标引的结果将直接影响信息检索的效果和质量。
例如,在信息标引时,需要根据信息资源的特征和需求,选择合适的标引规则和算法,以便能够准确地表达信息的内容和主题。
因此,信息标引和信息描述是相互依存、相互促进的。
只有做好信息描述,才能为后续的信息标引提供良好的基础;只有做好信息标引,才能充分发挥信息检索的功能和作用。
信息资源组织最基本的两种方法
信息资源组织最基本的两种方法主要是:
1. 信息标引:这是通过分析信息的内容属性及相关的外表属性,并用某种检索语言表达分析出的属性或特征,从而赋予信息或文献检索标识的过程。
这种方法主要针对信息或文献的内容进行组织。
2. 信息描述:也称为信息源描述,它是根据信息组织和检索的需要,对信息源的主题内容、形式特征、物质形态进行分析、选择、记录的活动。
这种方法主要针对信息或文献的外表属性进行组织。
这两种方法的主要区别在于,信息标引主要关注信息的内容属性,通过分析和表达信息的主题概念来揭示和组织信息;而信息描述则更注重信息的外在属性和形式特征,通过记录和分析信息的物质形态和形式特征来组织和描述信息。
在实际应用中,这两种方法经常结合使用,以实现对信息资源的全面、有效的组织和管理。
第一章导言1、信息组织:亦称为信息资源组织,是根据信息检索的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等的分析、选择、处理、序化,并以适当的方式加以提供的活动。
2、信息组织的目的:是根据使用需要建立起信息资源收藏系统和检索工具,以便信息资源开发和利用。
作为一种为了检索利用的需要对信息资源进行有序化组织的活动,它是与信息检索活动密切联系的。
3、信息组织与信息检索的关系(P3)(1)信息组织是信息检索的基础和前提。
(2)信息检索是信息组织的出发点和归宿。
总之,信息组织与信息检索是密切联系,相辅相成的两个环节。
要使信息组织取得较好的效果,必须充分了解系统的检索需要,根据信息资源的特点和用户的使用要求加以实施。
4、按照检索工具的对象和特点,可以分为以下类型:(1)文献目录:是以文献集合中的文献单元为对象,对其进行记录、报道与揭示的工具,包括文献收藏和数目。
前者以一个或多个文献单位收藏的文献为对象加以描述和揭示;后者则以某一领域、地域或者时限内出版的文献为对象进行组织,为用户提供较为全面的文献信息。
(2)索引:是以文献集合中的文献单元或者文献中的信息单元为揭示对象的检索工具,包括图书索引、期刊索引、报纸索引、专利索引、标准索引、档案索引、会议文献索引、词语索引、书后索引等。
(3)机读数据库:是由文献资源为对象的机读记录的有序集合。
这是一种依托现代计算机技术,以机读形势建立的索引系统。
(4)网络搜索引擎:这是一种以网络信息资源为研究对象的检索系统,实际上是数据库的一种特殊形式。
5、按照依据的标识特征,检索工具可以分为两种:一类以信息资源的外部特征为检索依据,提供从资源形势出发进行检索的途径。
常见的这类标识包括:责任者名、题名、机构名、出版地、出版社、标准书号、专利号、档案号、文献登录号等。
另一类则以表达信息主题内容标识为依据,提供从内容角度进行检索的途径。
主要有分类法和主题法两种.分类法以表达信息资源内容的标记符号为标识,按照主题之间的关系进行系统组织;主题法直接以表达文献内容的词语为标识,依据主题字顺等方式检索途径。
信息著录与信息标引一、什么是信息著录1、定义。
“文献是记录有知识的一切载体。
著录是指在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。
著录的结果是款目,它是反映文献内容和形式特征的著录项目的组合。
”通常意义上讲的著录就是指,按照某种标准化的格式和要求(如MARC),对文献的某些被规定的特征进行描述(如责任者、题名、出版社等),形成一条一条的信息描述项,最后著录的结果就是一条关于该信息资源的书目数据记录。
2.主要类型。
信息著录就是按照某种规则揭示某一信息资源的主要特征,给出信息资源的缩影。
因此对所有的信息资源类型都可以进行著录。
录音资料、电影与录像资料、微缩品、测绘制图资料、电子资源都可以进行著录,但最早也是最普遍的著录形式还是纸质书籍的著录。
3、信息著录的主要方式。
以图书的著录为例。
为了更好的实现信息资源的共享,著录时通常是遵循统一的格式,如,最常见的MARC。
MARC会给出所要著录的款目、使用的符号和代码、著录的格式、著录款目的顺序以及特殊情况下的处理方式(如多责任者、多语种、信息不详、信息明显错误等)。
编目人员要做的就是按照规定,使用受控的语言,逐条填写个款目的内容。
(当然有些款目是不必要填写的,也有相应规定。
)图一、图二给出了MARC工作界面的截图和一条完成的书目记录。
二、信息著录的意义。
1、信息组织的意义。
信息著录是信息组织的一种具体的方法,信息组织实现的意义也就是其所有具体方法的意义,当然也包括信息著录。
信息组织是使无序信息有序化的过程,起最终目的是使主体(人)能够“更好”的利用信息。
这里的“更好”包括更加方便、快捷的检索信息、准确定位所需的特定信息、获得最有价值的信息等,这些也都是信息著录可以实现的效果。
2、信息著录本身的意义。
除了信息著录作为信息组织的具体方式而具有的普遍的意义,它作为一种区别于其他信息组织方式的具体的方法,同时具有它本身的特殊功能。
信息著录所要解决的问题是揭示某一信息整体的、完整的、概要的特征,既包括外在的信息载体的特征的揭示,也包括内在的信息内容特征的揭示。
信息组织知识点信息组织是指对不同信息进行整理、分类和管理,以便于有效地获取和利用这些信息。
在当今信息爆炸的时代,信息组织显得尤为重要。
下面将介绍几个关于信息组织的知识点。
一、知识组织体系知识组织体系是将不同的知识按照一定的规则和分类原则进行整合和组织的框架。
一个好的知识组织体系可以提高信息的查找效率和利用效率。
1.1 主题分类法主题分类法是按照信息的主题内容进行分类的方法。
它可以将不同主题的信息分门别类地进行整理和组织,便于用户查找和利用。
常见的主题分类法有十进制分类法、国际十进制分类法等。
1.2 地理分类法地理分类法是按照信息所在地域进行分类的方法。
这种分类法常用于图书馆对地理信息资源的组织。
通过地理分类法,用户可以方便地查找到所需的地理信息。
1.3 时间分类法时间分类法是按照信息所属的时间进行分类的方法。
该分类法常用于历史文献的整理和组织。
通过时间分类法,用户可以追溯某一时间段内的相关信息。
二、信息分类与标引信息分类与标引是将信息进行分类和添加标识,以便于查找和利用。
下面介绍两种常见的信息分类与标引方法。
2.1 专业词表专业词表是为了方便用户查找和利用相关信息而编制的词汇表。
它通过对信息进行关键词提取和整理,形成一份有针对性的词汇表。
用户可以根据专业词表中的关键词快速找到感兴趣的信息。
2.2 索引索引是根据信息内容、知识点等特点对信息进行关键词提取和分类整理的工作。
通过索引,用户可以根据关键词快速找到所需的信息。
三、信息检索技巧信息检索技巧是指根据用户需求,使用合适的方法和技巧进行信息查找和筛选的过程。
下面介绍几种常用的信息检索技巧。
3.1 关键词检索关键词检索是指根据用户需求,使用关键词进行信息查找的方法。
用户可以通过在搜索引擎或数据库中输入相关关键词,快速找到所需的信息。
3.2 高级检索高级检索是在关键词检索的基础上,使用更加精确和复杂的搜索方法进行信息查找。
用户可以根据具体需求设置各种搜索条件,如时间、作者、地区等,提高信息检索的准确性和效率。
信息组织知识点汇总知识点汇总第一章1、信息组织的定义以用户需求为导向,依据信息体自身的属性特征,信息工作者或用户按照一定的原则、方法和技术,将杂乱无章的信息整理成为有序的信息集合的活动和过程。
2、信息组织的原理基本原理:如果有若干自然状态的无序信息资料,将这些信息资料按照某种属性特征排列成一个序列,并且需要使用信息资料的用户能将自己的需求转换成相应的信息资料属性特征,并在排列后的信息资料序列中找到自己所需要的信息资料。
信息组织由信息著录标引(信息描述揭示)和信息序化两个工作环节组成。
3、信息组织的内容一般而言,信息组织包括四项内容。
1.信息筛选(甄别有用信息,剔除无用信息)2.信息分析(对信息的内外部特征进行细化、挖掘、加工整理并归类)3.信息描述与揭示(对信息资源的部分主题内容、形式特征及物质形态等描述维度进行分析、选择、记录的过程)4.信息整序与存储(按照一定的格式和顺序存储在特定的载体中)4、信息组织的类型按信息的认识层次划分,信息组织有三种类型1.语法信息组织(研究语言符号之间的形式范畴的结构规则,如:字顺法、代码法、地序法、时序法)2.语义信息组织(研究信息的内容特征的组织方法,如:分类法、主题法)3.语用信息组织(研究环境与使用者的不同而不断变化的信息群,如:权重值信息组织法、概率组织法)5信息组织的作用控制整序提升品质传播利用节约成本第二章1、熵(entropy)最早是热力学上的一个符号,是一种测量在动力学方面不能做功的能量综述。
熵指的是混乱的程度,负熵是物质系统有序化、组织化、复杂化状态的一种量度。
香农第一次将“熵”引入到信息论中,在信息论中,“熵”可以用作某件事不确定度的量度。
信息量越大,体系结构越规则,功能越完善,熵就越小。
利用熵的概念,可以从理论上研究信息的计量、传递、变换、存储等活动。
学术界目前普遍接受的观点是“信息即负熵”。
2、逻辑学原理在信息组织中的应用概念之间的关系(图略):相容关系同一关系:是指有相同外延的两个概念之间的关系。
信息组织第一章绪论第一节信息组织概述一、信息组织基本理论(一)信息资源1、信息资源的含义:狭义信息资源是指人类社会经济活动中经过加工处理有序化并大量积累后的有用信息的集合。
2、信息资源的种类:载体信息资源、文献信息资源、实物信息资源、网络信息资源3、文献信息资源:指记录有只是信息的一切载体。
4、网络信息资源:指以计算机技术、通信技术、多媒体技术相互融合而形成的Internet 及其他网络获取的各种有用的信息资源。
(二)信息组织信息组织是指对信息(包括文献信息和网络信息)的一种序化或整序。
即依据一定的科学规则和方法,通过对信息外在特征和内容特征的描述和序化,实现无序信息向有序信息的流转,从而保证用户对信息的有效获取、利用、以及信息的有效流通和组合。
1、信息组织的理论基础信息组织的理论基础包括系统论、信息论、控制论、符号学、编码理论、语言学、逻辑学、科学分类和目录学等。
2、信息组织的内容狭义的信息组织内容包括信息标引、信息描述和信息排序3、信息组织的功能1)描述、揭示、报道信息特征的整序功能2)再现、重组信息单元联系的增值优化功能3)规范、控制信息流向的社会目标功能4)方便、有效提供用户利用目标功能(三)信息标引信息标引是依据一定的标引工具和规则,在对信息资源内容属性或其他特征进行分析的基础上,给出信息资源属性的检索标识过程。
信息标引过程包括两个主要环节:一是主题分析,即在了解和确定文献内容特征及某些外部特征的基础上,提炼出主题概念;二是转换标识,即用专门的检索语言(标引语言)中的标识表达主题概念,构成检索标识。
信息标引检索语言包括分类语言和主题语言,检索标识包括分类标识和主题标识。
2、信息标引类型1)分类标引和主题标引分类标引:依据特定的分类法和分类规则,按信息资源内容的学科属性赋予分类检索标识,揭示和组织信息资源的方法。
文献分类标引:依据本单位所采用的分类法和分类规则,按文献的学科内容属性及其他显著属性特征,分门别类地、系统地揭示和组织文献的方法。
《信息组织》知识点汇总《信息组织》知识点汇总第⼀章第⼀节、信息组织的必要性1.信息组织:根据信息检索的需要,以⽂本及各种类型的信息资源为对象,通过对其内容特征等的分析、选择、标引、处理,使其有序化并以适当⽅式加以提供的活动。
2.信息检索:根据检索需要,从检索系统中检出相应信息资源的过程。
3.信息资源:通常指⼀切以记录形式存在的信息载体,只是⽐较⽽⾔,更侧重于对新型媒体形式的强调。
(可以是图书、期刊、报纸、论⽂,也可以是⽹络上的电⼦资源)4.信息组织与信息检索有什么关系?(1)信息组织是信息检索的基础和前提,只有对信息资源进⾏处理和有序化信息系统之后,才能准确有效查找相关信息资源;(2)信息检索则是信息组织出发点与归宿,⽤户的检索需要是组织信息的主要依据。
第⼆节、信息组织的形式和检索途径1.⽂献组织的基本排列⽅式:⼀般有两种基本排列⽅式,其⼀为:(固定排列法)和(按⼀定意义的次序排列。
)(固定排列法,如档案、博物馆的收藏、光盘、录⾳带、缩微品。
按⼀定意义的次序排列,如图书、期刊等)2.按照检索⼯具的对象和特点,可以分为(⽂献⽬录)、(索引)、(机读数据库)、(⽹络搜索引擎)四种类型。
3.按照标识特征,检索⼯具可以分哪两种基本类型?(1)以信息资源的外部特征(形式特征)为检索依据,提供以信息资源形式特征为标识检索途径。
常见的信息资源形式特征有责任者名(即作者和与资源形成相关的⼈或机构,如译者、改编者、修订者等)、题名、机构名、标准书号、专利号、⽂献登录号(或顺序号)等。
(2)以信息资源的主题内容特征为检索依据,提供从资源内容进⾏检索的途径,主要有(分类法)、(主题法)。
4.按照系统中所⽤的标识是否进⾏控制,检索⼯具可以分为(受控检索系统)与(⾃然语⾔检索系统)。
5.按照系统中标识组配的特点,检索系统可以分为(先组式和后组式两种)。
6.检索⼯具还可以按照采⽤的形式,分为卡⽚式、书本式、缩微式、电⼦⽅式等。