第五章 信息组织
- 格式:docx
- 大小:16.68 KB
- 文档页数:2
1信息组织:根据信息检索的需要,以文本及信息资源各种类型为对象,通过对其内容、特征的分析、选择、标引、处理使其有序化集合的过程2信息外部特征:信息的物理载体直接反应的信息对象构成信息的外在的形式的特征3信息内部(内容)特征:信息所包含的内容4信息组织的发展:清册职能;查检职能;组织职能5信息组织的步骤:信息选择;信息分析;信息的描述与揭示;信息的存储6信息组织的意义:a它是信息资源管理的重要环节b是信息资源检索利用的基础c是信息增值的过程d解决信息利用困难与信息需求的矛盾7信息组织的方法:描述(外部特征)标引(内部特征包括分类标引,主题标引)见13,148信息组织的研究内容:1信息资源组织的理论研究及一般问题2分类法、主题法及其他情报检索语言3信息描述规范的基本理论,方法研究,包括信息描述规范原理,类型,特点,发展4标引理论与基础,各种标引方式5信息资源组织的方法6信息资源组织的环境9信息组织面临网络环境下的任务:1研究探讨网络环境下的信息组织面临的问题,改造,优化现行的信息组织的方法,寻找各种增加信息组织功能的新方法和更佳的结合模式,为提高信息组织效率和水平以及适应能力提供理论基础和技术基础,实现对网络资源的有效控制和科学管理2探索信息媒体所载有的知识信息单元的系统组织与检索利用间的规律,充分揭示信息特征与信息之间的关系3研究探讨信息组织与相关学科的渊源关系,基础关系和理论借鉴关系10信息描述:针对传统文献,它就是文献的描述性编目,或称著录。
广义的信息描述包括信息标引,狭义的是指对信息的外部特征的描述即不包括对信息内容的揭示性标引11信息标引:对信息内容进行分析并充分而有效地予以揭示12信息系统组织:把经描述和标引的信息实体和信息记录组织成一个有序的系统13信息组织方法:按组织对象分:文献实体组织与信息内容组织;按信息组织的层次分:语法信息组织;语义信息组织;语用信息组织14常用信息组织方法:分类组织法;主题组织法;集成组织法15分类组织法:根据某一特定的分类体系和逻辑结构组织信息的方法,以内部特征为主,层次,联系清楚,族性检索16主题组织法:通过揭示信息主题特征并有序组织的方法,分为标题法,单元词法,叙词法,关键词法17情报检索语言IRL:根据情报检索的需要而创制的,专门用于各种手工的和计算机化的文献情报存贮检索系统,能够唯一地表达各种概括文献情报内容的概念(主题概念),能够显示概念之间的相互关系,并便于进行系统排列,便于将标引用语和检索用语进行相符性比较的人工语言18系统的基本特征:整体性,关联性,等级结构性,动态平衡性,时序性19手工信息检索系统:优点:操作简单,费用低,查准率高;缺点:耗时多,效率较低20联机信息检索系统的信息资源丰富且质量较高21光盘信息检索系统:解决单机检索系统数据存储量少的缺点,它的数据库基本与联机信息检索系统相似,绝大多数就是联机信息检索系统的数据库的不同表现形式22互联网信息检索系统的主要特点1检索范围极大2超文本检索3界面友好4良好的反馈能力与快速响应能力优点:速度快,成本低缺点:信息检索的效率差些,检索的准确性与全面性较低,漏检与误检有时非常突出趋势:自由标引与规范控制相结合基本服务:文档查询服务,基于菜单的信息检索服务(Gopher)基于关键词的文档检索服务(WAIS)基于超文本的搜索引擎服务21信息检索系统有6个子系统:信息选择子系统;标引子系统;词表子系统;检索子系统;用户与系统之间的交互子系统;匹配子系统22概念之间的关系:指概念间外延上的关系,有相容(属种关系,同一关系,交叉关系)不相容(矛盾,反对,并列)23信息资源描述:从信息资源的外部识别特征进行揭示的方法,也就是根据一系列的规范,条例与标准对信息资源的识别特征进行分析,选择与记录传统文献--著录,编目网络信息资源--元数据作用:识别,定位,检索,选择24分类检索对分类法的基本要求:1要有一个清晰,明了的分类大纲;2类目划分的层次要适当;3类目划分的标准要易于理解;4在一定范围按主题集中信息;5在浏览中需要导航和指引25信息分类法的类型(一)按处理信息的对象,可分为文献分类法,学科分类法,网络信息分类法,事物分类法,其他信息分类法(二)按编制结构形式,分为列举式分类法(等级体系分类法),组配式分类法(分面组配分类法),体系-组配式分类法26信息描述工作:要求:准确,规范,完备程序(步骤):查重;描述;标引;复核27类:一组具有共同属性的事物的总称,在信息资源分类体系中成为类目,表示类目概念的名称成为类名28分类:以实物的本质属性或其他显著属性为根据,把各种事物聚合成类的过程29信息资源分类:根据信息资源的内容属性和其他有检索意义的特征,对信息资源进行分门别类的系统揭示和组织的方法,其实质是区分和类聚作用:1进行资源组织:实体文献的分类排架;2建立分类检索工具(系统):分类目录,索引,应用于手工方式和计算机检索系统,大型综合性文献分类法往往为多个检索工具使用30分类法(分类检索语言)的表现形式是分类表性质:按学科属性字母,号码为标记符号系统31等级体系分类法优点:1结构显示直观,易于把握,便于使用;2标记简明,适于分类排架,也可以组织分类检索工具,实用性强;3能按学科,专业角度检索文献,并以知识分类角度揭示信息资源缺点;1揭示专门主题能力差,不能充分揭示信息资源中大量存在的细小专深主题;2类目结构的线性排列无法客观反应多维的知识空间和事物的多向成类性;3类目表具有一定的凝固性,不便于跟随时代需要变化,不能根据现代科学的发展生成的类,难以与学科发展同步;4篇幅巨大,对类表的管理要求较高代表:《美国国会图书馆分类法》LCC;《杜威十进分类法》DDC/DC;中图法CLC32分面组配分类法:根据概念的分析与综合的原理,将概括文献、信息、事物的主题概念组成“知识大纲—分面—亚面—类目“的结构,按一定规则,通过各个分面内类目之间的组合来表达文献主题的一种分类法优点:1用较少的概念(类目)组配出大量专深复杂主题;2标记表达性强,可根据不同需要,调整组配次序,进行多元检索;3类表结构灵活,易于跟上时代科学发展,表达新的复杂主题;4类表篇幅较小,便于管理,增补和修订缺点:1隐含的类目体系不够直观2标引难度较高,需专业素养3分面标记成分复杂,号码较长,不适合组织文献排架,主要用于组织检索工具代表《冒号分类法》CC《布利斯书目分类法》BC233体系-组配式分类法:在等级分类法的基础上,引入分面分析和组配技术所形成的分类法结构模式。
信息组织第一部分信息组织的基本原理一.熟悉和掌握1.信息组织:信息组织是为了方便人们检索、获取信息而将庞杂、无序的信息进行系统化和有序化的过程。
信息组织的内容包括信息收集与选择、信息分析与揭示、信息描述与加工、信息整理与存储。
对信息的描述与揭示以及序化是信息组织的中心内容。
2.信息标引:信息标引就是对信息内容进行分析并充分而有效地予以揭示。
从学科属性揭示信息内容就是分类标引,从主题特征揭示信息内容就是主题标引。
3.信息组织方法:(1)按组织对象分:文献实体组织与信息内容组织文献实体组织的对象是文献,这里的文献指的是传统的信息资源类型,主要指印刷型的出版物,如图书、期刊、会议论文、科技报告等。
文献实体组织是把这些文献及其著录和标引记录组织成一个有序的系统,如图书的分类排架系统、分类目录、主题目录等。
信息组织的本质是信息内容的组织。
(2)按信息组织的层次分:语法信息组织、语义信息组织与语用信息组织语法信息组织是以信息的形式特征为依据组织信息的方法,如字顺组织法等。
语义信息组织是以信息内容或本质特征为依据组织信息的方法,分类组织法、主题组织法就属这一层次。
语用信息组织是以信息的效用特征为依据组织信息的方法,如根据信息的权值、概率等组织信息的方法。
对于科学信息来说,最本质的是语义信息组织法。
4.常用信息组织方法*(1)分类组织法:根据某一特定的分类体系和逻辑结构组织信息的方法。
以内部特征为主。
分类组织法建立了信息的层级和关联体系,便于浏览检索。
(2)主题组织法:通过揭示信息主题特征并有序组织的方法。
主题法通过建立主题概念的范畴、族系和关联关系,显示信息的结构体系。
主题组织法根据所使用的主题检索语言又分为标题法、单元词法、叙词法、关键词法和自然语言组织法。
本体组织法也是。
(3)集成组织法:每种信息组织方法都有其特有的功用,有些组织方法功能是互补的,如将多种方法结合起来使用会达到更好的效果。
如分类主题一体化的组织方法、规范组织方法与自然语言组织法的结合等。
信息组织复习资料第一章信息组织引论1、信息组织:信息组织是对信息资源对象进行收集、加工、整合、存储使之有序化、系统化的过程。
组织信息的目的是为了检索信息、利用信息。
2、信息组织的诞生与发展:(1)按职能划分信息组织发展阶段1)清册职能时期2)查检职能时期3)组织职能时期(2)按组织对象划分信息组织发展阶段1)文献组织阶段2)信息组织阶段3)知识组织阶段3、信息组织的理论基础(P8)1)系统论a)系统是处于一定相互关系中并与环境发生关系的各组成部分的总体b)整体大于部分之和2)耗散结构理论a)一种自组织结构b)系统内各组成部分有强烈的相互作用c)相互影响、制约,与环境发生交互d)使自身保持稳定,动态有序的活结构3)协同论a)海尔曼·哈克4、信息组织的方法基础(P9)1)语言学a)一种符号系统(形式和内容)b)词(词组)词形、发音、语义、语用2)逻辑学a)形式逻辑b)数理逻辑c)辩证逻辑3)知识分类学a)信息资源的知识分类b)知识分类体系(图书馆图书分类)5、自动分类标引(P15):是指由计算机代替人工对文献信息进行分类,赋予其分类标识,以描述文献主题内容的活动。
分为:1)自动归类自动归类是指先分析待分类对象中的特征,将其与各种类别中对象具有的共同特征进行比较,再将待分类对象归入特征最近的一类并赋予其相应的分类号。
自动归类根据使用的技术通常分为基于词的自动分类(词典法)和基于专家系统的自动分类(知识法)。
2)自动聚类自动聚类是指从待分类对象中提取特征,再将提取的全部特征进行比较并按一定原则将具有相同或相近特征的对象定为一类,设法使各类中包含的对象大体相等。
一般是在语词共现的基础上,通过词频统计和相似性比较加以聚类的。
6、自动主题标引技术(P16):自动主题标引是指由计算机自动确定语词标识来表达信息资源主题的过程,包括1)自动抽词标引:是指直接从原文中抽取词或者短语作为标引词来描述信息资源的主题内容。
第一章信息与信息管理题型:一、选择题2X10分二、判断题2X10分三、名词解释4X5分四、简答题5X4分五、论述题10X2分1.信息的定义•本体论层次的信息:事物存在的方式和运动状态的表现形式。
•认识论层次的信息:主体所感知或表述的事物存在的方式和运动状态。
2.信息管理的概念•信息管理(狭义)就是对信息本身的管理,即采用各种技术方法和手段(如分类、主题、代码、计算机处理等)对信息进行组织、控制、存贮、检索和规划等,并将其引向预定目标;•信息管理(广义)不单单是对信息的管理,而是对涉及信息活动的各种要素(信息、人、机器、机构等) 进行合理的组织和控制,以实现信息及有关资源的合理配置,从而有效地满足社会的信息要求。
3.信息管理的对象信息管理的对象主要包括信息资源和信息活动。
•信息资源:狭义的信息资源等同于知识、资料和消息,即指信息本身的集合。
广义的信息资源是指信息、信息技术和信息人员的有机集合。
•信息活动:与信息的产生、记录、传播、收集、加工、处理、存储、检索、传递、吸收、分析、选择、评价、利用以及系统开发、技术更新、运行维护、管理决策等与信息行为有关的全部社会活动统称为信息活动。
即是信息资源的开发利用过程。
第二章信息交流1. 共时交流与历时交流⏹ 共时信息交流或横向信息交流的主要功能是克服交流的空间障碍,达到及时的信息共享;⏹ 历时信息交流或纵向信息交流的主要功能在于消除交流的时间障碍,填补过去和现在的鸿沟,将古代与现代联系起来,为继承和发展提供条件。
2.信息栈(1)定义:是信息从S向R流动过程中所经过的环节。
(2)信息栈的特征与职能根据信息栈W的功能特征将其分为时间栈和空间栈。
•时间栈主要实现信息的时间传递,有档案馆、博物馆、图书馆、美术馆、文献中心等;•空间栈主要实现信息的远距离传递,有新闻、报纸、互联网、邮政系统、广播电视等。
3.社会代理(1)定义:是指信息交流双方(S或R)在信息交流过程中由于无法直接将信息传递给另一方(R或S),于是将信息交流行为转移到社会中的信息栈,由信息栈代理S或R来传递交流信息,从而完成信息交流。
第一章信息组织导言(一)信息组织的必要性①信息组织的概念;所谓信息组织,亦称为信息资源组织,是根据使用的需要,以文本及各种类型的信息资源对象,通过对其内容特征等进行分析、选择、处理、序化,并以适当的方式加以提供的活动。
②信息资源的概念。
(二)信息组织的形式和检索途径①文献组织的基本排列方式;文献组织一般有两种基本排列方式,其一为固定排列法,其二为按一定意义的次序排列。
②检索工具的类型按照检索工具的对象和特点文献目录索引机读数据库网络搜索引擎按照依据的标识特征,检索工具可以分为以下两种基本类型一类以信息资源的外部特征为检索依据,提供从资源形式出发进行检索的途径。
另一类则以表达信息资源主题内容的标识为依据,提供从内容角度进行检索的途径按照系统中所用的标识是进行控制,检索工具可以分为受控检索系统与自然语言检索系统两种。
按照系统中标识组配的特点,检索系统可以分为先组织式和后组织式(三)信息组织的处理方式和研究内容①检索语言的概念;检索语言是一种由表达信息资源主题概念及相互关系的词汇及规则组成的人工语言系统,国内亦称情报检索语言。
②知识组织系统的概念。
知识组织系统通常指经过组织的知识结构表达的工具,它试图包含组织信息和促进知识管理的各种类型的词表,其范围从传统的地名表、同义词表,到新型的知识组织工具。
四、本章关键问题掌握信息组织、信息资源、检索语言和知识组织系统的基本概念,理清信息组织和信息检索的关系,能够按标识特征和检索途径区分检索工具类型,了解信息资源处理的基本方法。
第二章信息组织原理(一)对信息组织的要求①检全率、检准率的概念和计算方法。
检全率亦称查全率、命中率,指系统实施检索时检出的与某一检索提问相关的信息资源量与检索系统中与该提问相关的实有信息资源总量之比。
检准率亦称查准率、相关率,指系统实施检索时检索出的与某一检索提问相关的信息资源量与检出的信息资源总量之比(二)信息组织中的控制与规范①句法控制的主要方法;句法控制是指根据信息资源标引和检索的需要,通过一定的组词造句的规则,对检索语词的组合方式作出规定。
信息组织学复习资料第一篇:信息组织学复习资料第2章信息组织概述1.λ信息组织的内涵信息组织(information organization)就是人们根据信息本身特点,运用适宜的工具和方法,依据一定的标准或规则,对其进行加工整理,排列组合,使之有序化、系统化、规律化、高级化,增强信息对象的表现效能和运用效能,以满足人们信息需求的过程和活动。
λ从层次上看,信息组织包括了序化和优化两个层次,序化是基础,优化是延伸。
2.信息组织要素λ属性与序、规范和操作是信息组织的两对基本要素,是信息组织进行的依据,信息组织学科体系就是建立在这些要素之上。
(1)属性λ属性反映了信息的本质特征事物的属性总体上可以分为外在属性和内在属性,在信息组织工作中,外在属性称为外表特征,内在属性称为内容特征。
λλ信息组织的过程就是按照事物属性之间的同一性、包容性、交叉性和排斥性等关系对信息实施序化的过程。
(2)序λ序是事物的一种结构形式,是指事物或系统的各个结构要素之间的相互关系以及这种关系在在时空中的表现,即事物发展中的时间序列及排列组合、聚类状态、结构层次等空间序列。
(3)规范λ有序无序是针对一定参照系而言的,这个参照系就是规范。
信息组织规范主要包括:λ①基本术语规范;②有关信息技术规范(信息交换格式、程序设计与数据库语言、网络标准与协议等);③信息组织技术规范(如信息描述规则、信息代码、信息标引规则和信息组织成果编排规则等);④其他相关规范。
(4)操作λ操作指根据信息资源的内容和特征,对信息资源进行描述、标引,并将其组织进相应系统的过程。
λ这一操作一般是依据一定的信息资源描述处理的规范,对信息资源的特征和内容进行分析、归纳、选择、记录,并在此基础上将其组织进信息资源集合和检索工具。
3.信息描述规范λ描述项目规范:如题名、责任者、出版社、关键词等传统文献著录时基本描述项目分为9个大项。
依次为:题名和责任者项目;版本项;文献特殊细节项;出版发行项;载体形态项;丛编项;附注项;文献标准编号及有关记载项;提要项。
1、信息组织含义:亦称信息整序,是利用一定的规则、方法和技术对信息的外部特征和内
容特征进行揭示和描述,并按给定的参数和序列公式排列,使信息从无序集合转化为有序集合的过程。
2、信息组织内容:信息选择,目的就是从采集到的、处于无序状态的信息流中甄别出有用
的信息,剔除无用的信息。
信息分析,是按照一定的逻辑关系从语义、语用和语法上对选择过的信息内、外特征进行细化、挖掘、加工整理并归类的信息活动。
信息描述与揭示,信息描述亦称信息资源描述,是指根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。
信息存贮,是将经过加工整理序化后的信息按照一定的格式与顺序存贮在特定的载体中的一种信息活动。
3、信息组织的3大特性:第一,信息组织的渗透性,指信息组织存在于各种信息揭示、存
贮和检索活动之中。
第二,信息组织的依附性,指信息组织无法独立存在,它要以信息的识别、揭示等活动为前提。
第三,信息组织的增效性,是指信息组织可以增加信息传播、检索、利用的效率,是其他信息加工活动和利用的保障。
4、信息组织的4大原则:第一、客观性原则,客观存在的信息本身;与条件变化和环境变
化保持客观一致性。
第二,系统性原则。
第三,目的性原则,必须围绕用户的信息需求开展工作。
第四,现代化原则,思想观念现代化和技术手段现代化。
5、信息组织的标准化,包括:基本术语标准;有关信息技术标准;信息组织技术标准;其
他相关标准。
6、信息组织最基础的理论仍然是语言学、逻辑学和知识分类。
7、知识分类:是一门研究知识体系结构的学问
8、耗散结构理论:信息系统是一个开放的系统,系统不断与外界进行物质和能量的交换,
熵趋于最小值,能量远离平衡,混乱度最小,从原来无序结构转为一种时间、空间和功能上的有序结构。
9、自组织系统:凡是能够不再借助于外部控制而实现从无序到有序的转变,并维持稳定有
序状态的系统。
10、突变理论:是指系统的熵可以增加也可以减少,这种熵增、熵减可以在宏观无限小
的时间内突然产生。
11、元数据:是关于数据的数据,关于信息的信息,或描述数据的数据,它是专门用来
描述数据的特征和属性,也是描述和组织信息资源、发现信息资源的语言和工具。
12、著录:是指在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过
程。
著录的结果是款目。
13、标目:是从文献内容和形式的某一特征指引排检线索的著录项目。
14、文献著录标准化:是指在国家或国际范围内,对文献著录的原则、内容、格式等作
出具有一定约束力的规范。
15、信息标引:原来多称文献标引,是指分析文献的内容属性及相关外表属性,并用特
定语言表达分析出的属性或特征,从而赋予文献检索标示的过程。
包括两个环节:一是主题分析,二是转换标识。
16、分类语言,也称分类法。
它是用分类号表达主题概念,依据知识分类将主题概念组
织、排列成类目体系,主要以类目体系的自身结构显示概念之间关系的标引语言。
17、主题语言,又称主题法。
它是一种由受控的自然语言语词直接表达主题概念,按语
词字顺序列主题概念,主要用参照显示概念之间关系的标引语言。
18、分类标引:是指对文献进行主题分析,用分类语言表达出分析出的主题,赋予文献
分类检索标识的过程。
19、主题标引:是对文献进行主题分析,用主题语言表达分析出的主题,赋予文献主题
检索标识的过程。
20、MARC:机器可读目录。
21、SGML:是一种元语言,是用来描述置标语言的语言,适用于电子文档交换、文档
管理和文档发布。
22、文献型信息4个组织方法分类组织法,主题组织法,引用组织法,文献型信息的
宏观组织。
23、运用较为广泛的四种网络信息资源的组织方法:第一,文件方式,文件是计算机保
存处理结果的基本单位。
第二,数据库方式,数据库技术是从计算机系统中文件系统的基础上发展起来的对大量规范化数据进行管理的一种技术。
所谓数据库组织方式,是指将所有已获得的网络信息资源以固定的记录格式存贮,用户通过关键词及其组配查询,就可以找到所需要的信息线索,并通过信息线索直接连接到相应的网络信息资源。
第三,主题树组织方式,就是将信息资源按照某种实现确定的概念体系结构,分门别类地逐层加以组织,用户通过浏览的方式逐层加以选择,层层遍历,直至找到所需的信息线索,并通过信息线索直接找到相应的网络信息资源。
第四,超媒体方式,超媒体技术是超文本技术与多媒体技术的结合,它将文字、图表、声音、图像、视频等多媒体信息以超文本方式组织起来,使人们可以通过高度链接的网络结构在各种信息库中自由航行,找到所需要的任何媒体的信息。
24、知识组织:是对文献中所含内容进行分析,找到人们创造与思考的相互影响及联系
的结点,像地图一样把她们标记出来(即知识地图),以展示知识的有机结构,为人们直接提供创造时所需要的知识。
25、数据仓库:是将整个机构内的数据以统一形式集成存贮在一起,便于针对一定主题
的、集成的、时变的、非破坏性的数据进行集中分析。
“面向主题的、集成的、稳定的、不同时间的数据集合,用以支持经营管理中的决策制定过程”。
26、联机分析处理(OLAP):是一种友好而灵活的工具,它允许用户以交互方式浏览数
据仓库,对其中的数据进行多维分析,及时地从变化和不太完整的数据中提出与企业经营活动有关的信息。
27、知识表示:是指把知识客体中的知识因子和知识关联表示出来,以便人们识别和理
解知识。
28、专家系统的核心是知识库系统,知识库中的知识存贮方式及其推理输出规则,即为
专家系统的知识表示方式。