第五章 信息组织
- 格式:docx
- 大小:16.68 KB
- 文档页数:2
1信息组织:根据信息检索的需要,以文本及信息资源各种类型为对象,通过对其内容、特征的分析、选择、标引、处理使其有序化集合的过程2信息外部特征:信息的物理载体直接反应的信息对象构成信息的外在的形式的特征3信息内部(内容)特征:信息所包含的内容4信息组织的发展:清册职能;查检职能;组织职能5信息组织的步骤:信息选择;信息分析;信息的描述与揭示;信息的存储6信息组织的意义:a它是信息资源管理的重要环节b是信息资源检索利用的基础c是信息增值的过程d解决信息利用困难与信息需求的矛盾7信息组织的方法:描述(外部特征)标引(内部特征包括分类标引,主题标引)见13,148信息组织的研究内容:1信息资源组织的理论研究及一般问题2分类法、主题法及其他情报检索语言3信息描述规范的基本理论,方法研究,包括信息描述规范原理,类型,特点,发展4标引理论与基础,各种标引方式5信息资源组织的方法6信息资源组织的环境9信息组织面临网络环境下的任务:1研究探讨网络环境下的信息组织面临的问题,改造,优化现行的信息组织的方法,寻找各种增加信息组织功能的新方法和更佳的结合模式,为提高信息组织效率和水平以及适应能力提供理论基础和技术基础,实现对网络资源的有效控制和科学管理2探索信息媒体所载有的知识信息单元的系统组织与检索利用间的规律,充分揭示信息特征与信息之间的关系3研究探讨信息组织与相关学科的渊源关系,基础关系和理论借鉴关系10信息描述:针对传统文献,它就是文献的描述性编目,或称著录。
广义的信息描述包括信息标引,狭义的是指对信息的外部特征的描述即不包括对信息内容的揭示性标引11信息标引:对信息内容进行分析并充分而有效地予以揭示12信息系统组织:把经描述和标引的信息实体和信息记录组织成一个有序的系统13信息组织方法:按组织对象分:文献实体组织与信息内容组织;按信息组织的层次分:语法信息组织;语义信息组织;语用信息组织14常用信息组织方法:分类组织法;主题组织法;集成组织法15分类组织法:根据某一特定的分类体系和逻辑结构组织信息的方法,以内部特征为主,层次,联系清楚,族性检索16主题组织法:通过揭示信息主题特征并有序组织的方法,分为标题法,单元词法,叙词法,关键词法17情报检索语言IRL:根据情报检索的需要而创制的,专门用于各种手工的和计算机化的文献情报存贮检索系统,能够唯一地表达各种概括文献情报内容的概念(主题概念),能够显示概念之间的相互关系,并便于进行系统排列,便于将标引用语和检索用语进行相符性比较的人工语言18系统的基本特征:整体性,关联性,等级结构性,动态平衡性,时序性19手工信息检索系统:优点:操作简单,费用低,查准率高;缺点:耗时多,效率较低20联机信息检索系统的信息资源丰富且质量较高21光盘信息检索系统:解决单机检索系统数据存储量少的缺点,它的数据库基本与联机信息检索系统相似,绝大多数就是联机信息检索系统的数据库的不同表现形式22互联网信息检索系统的主要特点1检索范围极大2超文本检索3界面友好4良好的反馈能力与快速响应能力优点:速度快,成本低缺点:信息检索的效率差些,检索的准确性与全面性较低,漏检与误检有时非常突出趋势:自由标引与规范控制相结合基本服务:文档查询服务,基于菜单的信息检索服务(Gopher)基于关键词的文档检索服务(WAIS)基于超文本的搜索引擎服务21信息检索系统有6个子系统:信息选择子系统;标引子系统;词表子系统;检索子系统;用户与系统之间的交互子系统;匹配子系统22概念之间的关系:指概念间外延上的关系,有相容(属种关系,同一关系,交叉关系)不相容(矛盾,反对,并列)23信息资源描述:从信息资源的外部识别特征进行揭示的方法,也就是根据一系列的规范,条例与标准对信息资源的识别特征进行分析,选择与记录传统文献--著录,编目网络信息资源--元数据作用:识别,定位,检索,选择24分类检索对分类法的基本要求:1要有一个清晰,明了的分类大纲;2类目划分的层次要适当;3类目划分的标准要易于理解;4在一定范围按主题集中信息;5在浏览中需要导航和指引25信息分类法的类型(一)按处理信息的对象,可分为文献分类法,学科分类法,网络信息分类法,事物分类法,其他信息分类法(二)按编制结构形式,分为列举式分类法(等级体系分类法),组配式分类法(分面组配分类法),体系-组配式分类法26信息描述工作:要求:准确,规范,完备程序(步骤):查重;描述;标引;复核27类:一组具有共同属性的事物的总称,在信息资源分类体系中成为类目,表示类目概念的名称成为类名28分类:以实物的本质属性或其他显著属性为根据,把各种事物聚合成类的过程29信息资源分类:根据信息资源的内容属性和其他有检索意义的特征,对信息资源进行分门别类的系统揭示和组织的方法,其实质是区分和类聚作用:1进行资源组织:实体文献的分类排架;2建立分类检索工具(系统):分类目录,索引,应用于手工方式和计算机检索系统,大型综合性文献分类法往往为多个检索工具使用30分类法(分类检索语言)的表现形式是分类表性质:按学科属性字母,号码为标记符号系统31等级体系分类法优点:1结构显示直观,易于把握,便于使用;2标记简明,适于分类排架,也可以组织分类检索工具,实用性强;3能按学科,专业角度检索文献,并以知识分类角度揭示信息资源缺点;1揭示专门主题能力差,不能充分揭示信息资源中大量存在的细小专深主题;2类目结构的线性排列无法客观反应多维的知识空间和事物的多向成类性;3类目表具有一定的凝固性,不便于跟随时代需要变化,不能根据现代科学的发展生成的类,难以与学科发展同步;4篇幅巨大,对类表的管理要求较高代表:《美国国会图书馆分类法》LCC;《杜威十进分类法》DDC/DC;中图法CLC32分面组配分类法:根据概念的分析与综合的原理,将概括文献、信息、事物的主题概念组成“知识大纲—分面—亚面—类目“的结构,按一定规则,通过各个分面内类目之间的组合来表达文献主题的一种分类法优点:1用较少的概念(类目)组配出大量专深复杂主题;2标记表达性强,可根据不同需要,调整组配次序,进行多元检索;3类表结构灵活,易于跟上时代科学发展,表达新的复杂主题;4类表篇幅较小,便于管理,增补和修订缺点:1隐含的类目体系不够直观2标引难度较高,需专业素养3分面标记成分复杂,号码较长,不适合组织文献排架,主要用于组织检索工具代表《冒号分类法》CC《布利斯书目分类法》BC233体系-组配式分类法:在等级分类法的基础上,引入分面分析和组配技术所形成的分类法结构模式。
信息组织第一部分信息组织的基本原理一.熟悉和掌握1.信息组织:信息组织是为了方便人们检索、获取信息而将庞杂、无序的信息进行系统化和有序化的过程。
信息组织的内容包括信息收集与选择、信息分析与揭示、信息描述与加工、信息整理与存储。
对信息的描述与揭示以及序化是信息组织的中心内容。
2.信息标引:信息标引就是对信息内容进行分析并充分而有效地予以揭示。
从学科属性揭示信息内容就是分类标引,从主题特征揭示信息内容就是主题标引。
3.信息组织方法:(1)按组织对象分:文献实体组织与信息内容组织文献实体组织的对象是文献,这里的文献指的是传统的信息资源类型,主要指印刷型的出版物,如图书、期刊、会议论文、科技报告等。
文献实体组织是把这些文献及其著录和标引记录组织成一个有序的系统,如图书的分类排架系统、分类目录、主题目录等。
信息组织的本质是信息内容的组织。
(2)按信息组织的层次分:语法信息组织、语义信息组织与语用信息组织语法信息组织是以信息的形式特征为依据组织信息的方法,如字顺组织法等。
语义信息组织是以信息内容或本质特征为依据组织信息的方法,分类组织法、主题组织法就属这一层次。
语用信息组织是以信息的效用特征为依据组织信息的方法,如根据信息的权值、概率等组织信息的方法。
对于科学信息来说,最本质的是语义信息组织法。
4.常用信息组织方法*(1)分类组织法:根据某一特定的分类体系和逻辑结构组织信息的方法。
以内部特征为主。
分类组织法建立了信息的层级和关联体系,便于浏览检索。
(2)主题组织法:通过揭示信息主题特征并有序组织的方法。
主题法通过建立主题概念的范畴、族系和关联关系,显示信息的结构体系。
主题组织法根据所使用的主题检索语言又分为标题法、单元词法、叙词法、关键词法和自然语言组织法。
本体组织法也是。
(3)集成组织法:每种信息组织方法都有其特有的功用,有些组织方法功能是互补的,如将多种方法结合起来使用会达到更好的效果。
如分类主题一体化的组织方法、规范组织方法与自然语言组织法的结合等。
信息组织复习资料第一章信息组织引论1、信息组织:信息组织是对信息资源对象进行收集、加工、整合、存储使之有序化、系统化的过程。
组织信息的目的是为了检索信息、利用信息。
2、信息组织的诞生与发展:(1)按职能划分信息组织发展阶段1)清册职能时期2)查检职能时期3)组织职能时期(2)按组织对象划分信息组织发展阶段1)文献组织阶段2)信息组织阶段3)知识组织阶段3、信息组织的理论基础(P8)1)系统论a)系统是处于一定相互关系中并与环境发生关系的各组成部分的总体b)整体大于部分之和2)耗散结构理论a)一种自组织结构b)系统内各组成部分有强烈的相互作用c)相互影响、制约,与环境发生交互d)使自身保持稳定,动态有序的活结构3)协同论a)海尔曼·哈克4、信息组织的方法基础(P9)1)语言学a)一种符号系统(形式和内容)b)词(词组)词形、发音、语义、语用2)逻辑学a)形式逻辑b)数理逻辑c)辩证逻辑3)知识分类学a)信息资源的知识分类b)知识分类体系(图书馆图书分类)5、自动分类标引(P15):是指由计算机代替人工对文献信息进行分类,赋予其分类标识,以描述文献主题内容的活动。
分为:1)自动归类自动归类是指先分析待分类对象中的特征,将其与各种类别中对象具有的共同特征进行比较,再将待分类对象归入特征最近的一类并赋予其相应的分类号。
自动归类根据使用的技术通常分为基于词的自动分类(词典法)和基于专家系统的自动分类(知识法)。
2)自动聚类自动聚类是指从待分类对象中提取特征,再将提取的全部特征进行比较并按一定原则将具有相同或相近特征的对象定为一类,设法使各类中包含的对象大体相等。
一般是在语词共现的基础上,通过词频统计和相似性比较加以聚类的。
6、自动主题标引技术(P16):自动主题标引是指由计算机自动确定语词标识来表达信息资源主题的过程,包括1)自动抽词标引:是指直接从原文中抽取词或者短语作为标引词来描述信息资源的主题内容。
第一章信息与信息管理题型:一、选择题2X10分二、判断题2X10分三、名词解释4X5分四、简答题5X4分五、论述题10X2分1.信息的定义•本体论层次的信息:事物存在的方式和运动状态的表现形式。
•认识论层次的信息:主体所感知或表述的事物存在的方式和运动状态。
2.信息管理的概念•信息管理(狭义)就是对信息本身的管理,即采用各种技术方法和手段(如分类、主题、代码、计算机处理等)对信息进行组织、控制、存贮、检索和规划等,并将其引向预定目标;•信息管理(广义)不单单是对信息的管理,而是对涉及信息活动的各种要素(信息、人、机器、机构等) 进行合理的组织和控制,以实现信息及有关资源的合理配置,从而有效地满足社会的信息要求。
3.信息管理的对象信息管理的对象主要包括信息资源和信息活动。
•信息资源:狭义的信息资源等同于知识、资料和消息,即指信息本身的集合。
广义的信息资源是指信息、信息技术和信息人员的有机集合。
•信息活动:与信息的产生、记录、传播、收集、加工、处理、存储、检索、传递、吸收、分析、选择、评价、利用以及系统开发、技术更新、运行维护、管理决策等与信息行为有关的全部社会活动统称为信息活动。
即是信息资源的开发利用过程。
第二章信息交流1. 共时交流与历时交流⏹ 共时信息交流或横向信息交流的主要功能是克服交流的空间障碍,达到及时的信息共享;⏹ 历时信息交流或纵向信息交流的主要功能在于消除交流的时间障碍,填补过去和现在的鸿沟,将古代与现代联系起来,为继承和发展提供条件。
2.信息栈(1)定义:是信息从S向R流动过程中所经过的环节。
(2)信息栈的特征与职能根据信息栈W的功能特征将其分为时间栈和空间栈。
•时间栈主要实现信息的时间传递,有档案馆、博物馆、图书馆、美术馆、文献中心等;•空间栈主要实现信息的远距离传递,有新闻、报纸、互联网、邮政系统、广播电视等。
3.社会代理(1)定义:是指信息交流双方(S或R)在信息交流过程中由于无法直接将信息传递给另一方(R或S),于是将信息交流行为转移到社会中的信息栈,由信息栈代理S或R来传递交流信息,从而完成信息交流。
第一章信息组织导言(一)信息组织的必要性①信息组织的概念;所谓信息组织,亦称为信息资源组织,是根据使用的需要,以文本及各种类型的信息资源对象,通过对其内容特征等进行分析、选择、处理、序化,并以适当的方式加以提供的活动。
②信息资源的概念。
(二)信息组织的形式和检索途径①文献组织的基本排列方式;文献组织一般有两种基本排列方式,其一为固定排列法,其二为按一定意义的次序排列。
②检索工具的类型按照检索工具的对象和特点文献目录索引机读数据库网络搜索引擎按照依据的标识特征,检索工具可以分为以下两种基本类型一类以信息资源的外部特征为检索依据,提供从资源形式出发进行检索的途径。
另一类则以表达信息资源主题内容的标识为依据,提供从内容角度进行检索的途径按照系统中所用的标识是进行控制,检索工具可以分为受控检索系统与自然语言检索系统两种。
按照系统中标识组配的特点,检索系统可以分为先组织式和后组织式(三)信息组织的处理方式和研究内容①检索语言的概念;检索语言是一种由表达信息资源主题概念及相互关系的词汇及规则组成的人工语言系统,国内亦称情报检索语言。
②知识组织系统的概念。
知识组织系统通常指经过组织的知识结构表达的工具,它试图包含组织信息和促进知识管理的各种类型的词表,其范围从传统的地名表、同义词表,到新型的知识组织工具。
四、本章关键问题掌握信息组织、信息资源、检索语言和知识组织系统的基本概念,理清信息组织和信息检索的关系,能够按标识特征和检索途径区分检索工具类型,了解信息资源处理的基本方法。
第二章信息组织原理(一)对信息组织的要求①检全率、检准率的概念和计算方法。
检全率亦称查全率、命中率,指系统实施检索时检出的与某一检索提问相关的信息资源量与检索系统中与该提问相关的实有信息资源总量之比。
检准率亦称查准率、相关率,指系统实施检索时检索出的与某一检索提问相关的信息资源量与检出的信息资源总量之比(二)信息组织中的控制与规范①句法控制的主要方法;句法控制是指根据信息资源标引和检索的需要,通过一定的组词造句的规则,对检索语词的组合方式作出规定。
信息组织学复习资料第一篇:信息组织学复习资料第2章信息组织概述1.λ信息组织的内涵信息组织(information organization)就是人们根据信息本身特点,运用适宜的工具和方法,依据一定的标准或规则,对其进行加工整理,排列组合,使之有序化、系统化、规律化、高级化,增强信息对象的表现效能和运用效能,以满足人们信息需求的过程和活动。
λ从层次上看,信息组织包括了序化和优化两个层次,序化是基础,优化是延伸。
2.信息组织要素λ属性与序、规范和操作是信息组织的两对基本要素,是信息组织进行的依据,信息组织学科体系就是建立在这些要素之上。
(1)属性λ属性反映了信息的本质特征事物的属性总体上可以分为外在属性和内在属性,在信息组织工作中,外在属性称为外表特征,内在属性称为内容特征。
λλ信息组织的过程就是按照事物属性之间的同一性、包容性、交叉性和排斥性等关系对信息实施序化的过程。
(2)序λ序是事物的一种结构形式,是指事物或系统的各个结构要素之间的相互关系以及这种关系在在时空中的表现,即事物发展中的时间序列及排列组合、聚类状态、结构层次等空间序列。
(3)规范λ有序无序是针对一定参照系而言的,这个参照系就是规范。
信息组织规范主要包括:λ①基本术语规范;②有关信息技术规范(信息交换格式、程序设计与数据库语言、网络标准与协议等);③信息组织技术规范(如信息描述规则、信息代码、信息标引规则和信息组织成果编排规则等);④其他相关规范。
(4)操作λ操作指根据信息资源的内容和特征,对信息资源进行描述、标引,并将其组织进相应系统的过程。
λ这一操作一般是依据一定的信息资源描述处理的规范,对信息资源的特征和内容进行分析、归纳、选择、记录,并在此基础上将其组织进信息资源集合和检索工具。
3.信息描述规范λ描述项目规范:如题名、责任者、出版社、关键词等传统文献著录时基本描述项目分为9个大项。
依次为:题名和责任者项目;版本项;文献特殊细节项;出版发行项;载体形态项;丛编项;附注项;文献标准编号及有关记载项;提要项。
知识要点第一章绪论1、什么是信息组织?(理解)信息组织:对信息资源对象进行收集、加工、整合、存储使之有序化、系统化的过程。
2、信息组织的发展阶段——按组织对象划分(理解)按组织对象划分信息组织经历了三个阶段:文献组织阶段、信息组织阶段、知识组织阶段文献组织阶段——组织对象:传统文献实体,不涉及文献内容本身。
信息组织阶段——组织对象:从广度上,以纸质信息为中心转向以电子媒介信息为中心;从深度上,除了对文献实体进行组织,还要深入信息内容。
知识组织阶段——组织对象:从显性知识扩展到隐性知识。
知识组织直接给用户提供直观的、可操作的系统化知识。
不再局限于利用片面的信息来满足用户的需求,而是对用户的需求系统分析,向用户提供全面、完善的解决方案。
按职能划分信息组织经历了三个阶段(补充):清册职能时期查检职能时期组织职能时期3、网络信息组织的基本方法(掌握)①文件方式•一般用于局域网内的非结构化信息组织。
•优点:通过FTP协议进行传输,简单方便•缺点:以文件为单位共享和传输信息会使网络负载越来越大②自由文本方式•主要用于全文数据库的组织•对非结构化的文本信息进行组织和处理的方式•能够完整地反映出一次文献的全貌•通过计算机自动进行文献信息的处理和组织,支持全文检索。
③数据库方式•一般用于结构化/规范化信息组织。
•优点:最小存取单位是字段,从而大大降低网络数据传输的负载。
•缺点:对非结构化信息处理难度大•数据库方式是当前普遍使用的网络信息资源的组织方式。
④主页方式•网页一般通过HTML语言规则将文本、图像、声音、视频等各种类型的信息集合在一起。
⑤超文本方式⑥主题树方式•主题树方式是一种可供检索和查询的等级式主题目录。
它以人工方式或半自动方式搜集信息,然后将信息资源按照某种事先确定的概念体系结构,分门别类地逐层加以组织。
•主题树方式不太适合大型的综合性的网络信息资源系统,而较适合专题指引库的建立。
⑦搜索引擎方式⑧指引库方式• 指引库,也称导航库。
第一章1.信息组织的驱动力-信息检索工具的变化AltaVista混合型例如:yahoo、intute等专题型例如:博客检索、专业检索特殊型图片、地图、ftp等集合型检索工具例如dogpile、2.信息组织1概念:信息组织,也叫信息整序,是利用一定的规则、方法和技术对信息的外部特征和内容特征进行揭示和描述,并按给定的参数和序列公式排列,使信息从无序集合转换为有序集合的过程;2外部特征:信息的物理载体直接反映的信息对象,构成信息的外在的、形式的特征题名、作者、出版社、日期等内部特征:信息包含的内容,由主题词、关键词或其它知识单元表达3按信息表现形式划分:文字信息组织、图像信息组织、声音信息组织、视频信息组织按信息加工程度划分:一次信息组织、二次信息组织、三次信息组织按信息的传播载体划分:文献信息组织、非文献信息组织3.信息组织的两大思想两种思想的内容及比较分析1分类方法:根据信息的学科体系特征来序列信息的一种方法体系、类目关系;如中国图书馆分类法Yahoo分类目录门户网站分类频道——分类搜索浏览2主题方法:根据文献主题特征来组织排列信息的一种方法,由受控的自然语言语词直接表达主题概念;百度,Google ——搜索引擎3比较分析:分类法系统性强,满足族性检索,符合人们的思维与检索习惯,分类目录浏览主题法直观,满足特性检索,提供了一种直接面向对象、事实或概念的信息组织方法第二章PPT11.分类:是指以事物的本质属性或非本质属性为根据,将属性相同的事物集合成类,将属性不同的事物区别开来的过程;是人们认识事物、区别事物,并在此基础上组织事物的一种科学方法2.分类法的类型构成原理是重点1体系分类法概念:它是主要依据概念划分与概括原理,将绝大多数表达信息内容及形式特征的概念列举为类目,通过概念的层层划分和隶属,构成一个类目等级体系,一般为每个类目配上相应号码分类号作标识的分类工具;特点:按学科、专业集中文献,并从知识分类角度揭示各类文献在内容上的区别和联系,提供从学科分类检索文献信息的途径;使用最广的分类法类型不足:体系分类法的类目是列举式的,而要详尽无遗地列举一切事物概念,在事实上是不可能的;体系分类法的类目体系是单线排列的,这也就限制了使一个复杂的文献主题概念得到多向成类的可能性;2组配分类法概念:是分类表中只收录简单类目概念,并按分面结构组织和排列类目;分类时,则针对信息内容及相关特征,从若干分面中找出相应的类目类号进行组配分类的工具;原理:是基于概念的可分析性和可综合性构成的;一个复杂的主题概念可以用若干个简单概念标识的组配来表达;体系分类法所采取的某些方法复分表等已经孕育着组配分类法的胚胎;组配分类法的基本方法,犹如整个分类表全由复分表组成;一篇文献的分类标识,就全由复分表中的号码按照一定的规则构成;组配分类号是分段的,如果将各段调换位置,也不会改变其含义,因此可以实行轮排,达到按任何一个特征集中文献和从多种角度检索文献的目的;3组配分类法与体系分类法的差异:组配分类法的分类标识是散组式的,组合的,可以分拆的,诸因素可以变换位置;体系分类法的分类标识是定组式的,固定的,不可分拆的,诸因素不可变换位置;3.分类语言的体系结构1宏观结构:即它的各个组成部分及其之间的组织方法、相互联系和作用的方式;微观结构:即类目的构成要素及其组织;PPT21.中国图书馆分类法其它:杜威十进分类法DDC国际十进分类法UDC国会图书馆分类法LCC冒号分类法CC(1)标记符号和标记制度:是采用汉语拼音字母拉丁字母与阿拉伯数字相结合的混合号码,采用的标记制度是基本上的层累制;层累制的两个缺点:一是类号位数随类目等级增加,类目愈细,类号愈长;二是类号的容纳性有限,同位类多于所用符号的基数时,需要有变通方法,而且同级号码的中间和前面难以扩充新号;(2)辅助符号知道怎么回事就行了,看看PPT推荐符号“a”:有“a”的类号排在不带“a”的相同类号之前总论复分号“-”:“-”排在“0”之前;G25-61,应排在G250之前;组配符号“:”:用于联结两个相关联的主类号,合成一个组配类号;识字教育:党员训练=党员识字教育(3)其他八分法(4)分段及“.”的使用PPT31.网络信息组织分类法重点目前,Internet主要以两种方式采用分类法进行信息组织:a)基本以人工标引方式采用现有的文献分类法;b)以人工标引或自动标引方式采用自编的分类系统;2.自编分类系统特点:重视以事物为中心设置类目类目收录范围宽泛多重列类、重复反映排列方式简便直接以语词组织信息更新迅速不足:类目设置缺乏规律性类目归属存在着不合理现象同位类排列不能揭示类间关系横向关系揭示上存在不一致部分类名不确切分类规则有待完善第三章1.1主题语言:是一种抽象概念,没有一种具体语言叫主题语言;它用语词来表达各种概念,将各种概念完全按字母顺序排列,而不管其相互关系;包括标题法、单元词法、叙词法和关键词法等;它们统称为主题法系统;2标题法、单元词法和叙词法都要对取自自然语言的语词加以规范化,而关键词法一般认为是直接使用自然语言不加规范也要进行某种程度的规范化处理;2.主题法的特征:直接以语词作为检索标识以字顺作为主要检索途径以主题为中心集中信息资源通过参照系统等方式揭示主题词之间的关系3.主题法与分类法的差异:主题概念表达的形式与效果不同直观不通用,通用不直观标识所揭示信息的角度不同学科角度、事物角度标引方法有所不同分类号、受控词作用范围有所不同索引、排架4.标题语言的特点美国国会图书馆标题表特点:1用受控的自然语言语词作标识,直观地表达主题概念,直接地标引文献;2以字顺序列组织标识,提供直接的主题检索途径,有利于进行特性检索;3主要用参照系统间接显示标题所表达的主题概念之间的关系,形成语义网络;它能为选用标题进行标引和检索提供一定方便;4按事物集中文献,而不是按学科、专业集中;因此,标题语言适合于从事物出发的检索,不适合于从学科出发的检索,不便族性检索;如:关于“茶的贸易”、“茶的栽培”、“茶的焙制”的信息,分别用“茶-贸易”、“茶-栽培”、“茶-焙制”标引;5提供先组式的主题标识,标识含义比较明确,选用标识比较容易;但是,多途径检索的可能性较小;6标引所用的标题不必都是标题表所列举的现成标题;允许必要时自拟标题表达新的或没有列出的主题概念,适应能力较强;标题的类型:不用背,结合例子记(1)单级标题:一个词或者一个词组;肝,肝硬变;(2)带说明语的单级标题;期刊,化学的(3)多级标题;肿瘤-治疗(4)倒置标题;低速飞机飞机,低速(5)带限定词的标题;“图书馆学辞典”、“橘树” 括号内是限定词5.标题表的结构:主表的款目结构和副表区分标题表即标题词表,它是标题词的汇编,是一部标题词典;1标题;它位于标题词款目的起始处,决定款目在标题表中的排检位置;标题可以取正写的形式,也可以取逆写的形式即倒置标题;2标识;它往往是标题对应的分类号或标题词款目的编号字顺序号;3注释;4参照;它包括与标题等价的非标题以及有关的下位标题、上位标题、相关标题以及其他方法指示,用以揭示标题与标题之间的联系,以便用户查词、选词;5副标题;有些主标题后带有副标题,可以看成是对主标题含义的限定和对主标题下着录文献的划分;一是复分标题表或副标题表,它相当于分类语言的各种复分表,只供与主表中的主标题结合使用,也叫标题细分表、子标题表;二是复分标题索引,与复分标题表不同,它只是提供直接查找复分标题的字顺途径,没将复分标题从主表中抽出;三是标题分类范畴表,它是将主表中的标题按照某种分类体系予以排列,在各类目下列出相应的标题,便于从学科、专业角度出发查词、选词;一部标题表可以没有副表、也可以有一种或两种副表;6.单元词法1概念及特点:单元词法脱胎于标题法,它是作为对标题法先组式标识的改革而出现的;单元词语言是主题法系统中的一种后组式语言;同标题法一样,也是以取自自然语言并经过规范化处理的语词作为标识,来表达文献所论及或涉及的事物的;2基本原理:任何一个复合概念--完整的、具体的、复杂的概念,都可分解为若干单元概念--更为一般的、单纯的概念,而每个单元概念一般只需用一个单词单纯词或合成词来表达; 标题法的词组复词标题、倒置标题、带子标题的标题、带说明语的标题、带限定词的标题等所表达的任何一个复杂的概念文献主题,都可用一些单词--单元词的组合或组配来表达;3关联符号:4不足:由于单元词语言强调标识的单元性,因而对词组的分解实质上是字面分拆,单元词的组配基本上是字面组配;这样,单元词组配时会产生偏差,造成误检;为了解决这个问题固然可以使用联系符号和职能符号,但是,这会增加标引和检索的复杂性;7.叙词语言1基本原理:①保留了单元词法单词组配的基本原理;②采用了组配分类法的概念组配来代替单元词法的字面组配,以及适当采用标题法的预先组配方法即采用词组,以克服某些词分拆后再组配时产生意义失真的缺点;③采用了标题法对语词进行严格规范化的方法,以保证词与概念的一一对应;这是标题法的基本方法之一;单元词法对单元词的规范方法也取自标题法;④采用并进一步完善了标题法的参照系统,采用了体系分类法的基本原理编制叙词分类索引范畴索引和等级索引词族索引,采用了与关键词法类似的方法编制叙词轮排索引,从多方面显示叙词间的相关关系,以保证准确、全面地选用叙词进行标引和检索;概念组配是决定着它的特点和性能的基本原理;2叙词表的结构体系:一般是由一个主表和若干辅表构成的;主表是叙词表的主体,包括的内容最全,对每个叙词的着录也比较完备,所以可独立存在;辅表是为方便叙词表使用而编制的各种辅助索引,包括的内容不全,着录也比较简略,所以不能独立存在;3叙词表的款目款目叙词项,在汉语叙词表中除了款目叙词外,一般还有其汉语拼音和对应的外语英语译名;标注项,包括款目叙词所属范畴的范畴号、款目词的序号、族首词符号、部分款目词的含义注释、历史注释事项注释和用法注释等;参照项,最多的包括“代”参照项非正式叙词、“分”参照项下位叙词、“属”参照项上位叙词、“族”参照项族首词、“参”参照项相关叙词,有的叙词只有其中的几项或一项,少数叙词没有参照项,称为“无关联词”;当“属”项参照词为族首词时,一般不重复“族”项参照;8.关键词语言的特点优点:1标引时无需主题分析和查看词表,简便易行,因而降低对标引人员的要求,节省了大量人力;2标引和索引编制易于实现自动化,从而显着节省时间,大大缩短检索系统信息组织和报导的时差,保证信息报导和传递的及时性;3关键词是文献中使用的自然语词,表达主题比较直观、专指,可以保证较高的查准率查全率不高;缺点:1由于关键词法直接采用文献中的自然语词作关键词,对自然语言中大量存在的等同关系词不加规范统一,也不显示等同关系,使相同主题文献常常因作者用词不同而被分排各处且无联系,导致漏检的可能性较大;2关键词法不显示关键词之间的等级关系和相关关系,难以进行族性检索,特性检索的查全率也不高;3为了加速和简化检索工具的编制过程,关键词多限于从文献标题中抽取;由于一些标题对文献内容的表达不充分或不准确,会使关键词检索有一定的漏检或误检;4在机编索引情况下,由于机械地抽词和轮排,其中有不少关键词款目是不起检索作用而徒增篇幅的;总结:主要掌握主题语言的概念,种类,特点及其3种语言的概念特点及宏微观结构;。
信息组织第一章绪论第一节信息组织概述一、信息组织基本理论(一)信息资源1、信息资源的含义:狭义信息资源是指人类社会经济活动中经过加工处理有序化并大量积累后的有用信息的集合。
2、信息资源的种类:载体信息资源、文献信息资源、实物信息资源、网络信息资源3、文献信息资源:指记录有只是信息的一切载体。
4、网络信息资源:指以计算机技术、通信技术、多媒体技术相互融合而形成的Internet 及其他网络获取的各种有用的信息资源。
(二)信息组织信息组织是指对信息(包括文献信息和网络信息)的一种序化或整序。
即依据一定的科学规则和方法,通过对信息外在特征和内容特征的描述和序化,实现无序信息向有序信息的流转,从而保证用户对信息的有效获取、利用、以及信息的有效流通和组合。
1、信息组织的理论基础信息组织的理论基础包括系统论、信息论、控制论、符号学、编码理论、语言学、逻辑学、科学分类和目录学等。
2、信息组织的内容狭义的信息组织内容包括信息标引、信息描述和信息排序3、信息组织的功能1)描述、揭示、报道信息特征的整序功能2)再现、重组信息单元联系的增值优化功能3)规范、控制信息流向的社会目标功能4)方便、有效提供用户利用目标功能(三)信息标引信息标引是依据一定的标引工具和规则,在对信息资源内容属性或其他特征进行分析的基础上,给出信息资源属性的检索标识过程。
信息标引过程包括两个主要环节:一是主题分析,即在了解和确定文献内容特征及某些外部特征的基础上,提炼出主题概念;二是转换标识,即用专门的检索语言(标引语言)中的标识表达主题概念,构成检索标识。
信息标引检索语言包括分类语言和主题语言,检索标识包括分类标识和主题标识。
2、信息标引类型1)分类标引和主题标引分类标引:依据特定的分类法和分类规则,按信息资源内容的学科属性赋予分类检索标识,揭示和组织信息资源的方法。
文献分类标引:依据本单位所采用的分类法和分类规则,按文献的学科内容属性及其他显著属性特征,分门别类地、系统地揭示和组织文献的方法。
《信息组织》知识点汇总第一章第一节、信息组织的必要性1.信息组织:根据信息检索的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等的分析、选择、标引、处理,使其有序化并以适当方式加以提供的活动。
2.信息检索:根据检索需要,从检索系统中检出相应信息资源的过程。
3.信息资源:通常指一切以记录形式存在的信息载体,只是比较而言,更侧重于对新型媒体形式的强调。
(可以是图书、期刊、报纸、论文,也可以是网络上的电子资源)4.信息组织与信息检索有什么关系?(1)信息组织是信息检索的基础和前提,只有对信息资源进行处理和有序化信息系统之后,才能准确有效查找相关信息资源;(2)信息检索则是信息组织出发点与归宿,用户的检索需要是组织信息的主要依据。
第二节、信息组织的形式和检索途径1.文献组织的基本排列方式:一般有两种基本排列方式,其一为:(固定排列法)和(按一定意义的次序排列。
)(固定排列法,如档案、博物馆的收藏、光盘、录音带、缩微品。
按一定意义的次序排列,如图书、期刊等)2.按照检索工具的对象和特点,可以分为(文献目录)、(索引)、(机读数据库)、(网络搜索引擎)四种类型。
3.按照标识特征,检索工具可以分哪两种基本类型?(1)以信息资源的外部特征(形式特征)为检索依据,提供以信息资源形式特征为标识检索途径。
常见的信息资源形式特征有责任者名(即作者和与资源形成相关的人或机构,如译者、改编者、修订者等)、题名、机构名、标准书号、专利号、文献登录号(或顺序号)等。
(2)以信息资源的主题内容特征为检索依据,提供从资源内容进行检索的途径,主要有(分类法)、(主题法)。
4.按照系统中所用的标识是否进行控制,检索工具可以分为(受控检索系统)与(自然语言检索系统)。
5.按照系统中标识组配的特点,检索系统可以分为(先组式和后组式两种)。
6.检索工具还可以按照采用的形式,分为卡片式、书本式、缩微式、电子方式等。
第三节.信息组织的处理方式和研究内容1.检索语言:一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,也称情报检索语言。
1、信息组织含义:亦称信息整序,是利用一定的规则、方法和技术对信息的外部特征和内
容特征进行揭示和描述,并按给定的参数和序列公式排列,使信息从无序集合转化为有序集合的过程。
2、信息组织内容:信息选择,目的就是从采集到的、处于无序状态的信息流中甄别出有用
的信息,剔除无用的信息。
信息分析,是按照一定的逻辑关系从语义、语用和语法上对选择过的信息内、外特征进行细化、挖掘、加工整理并归类的信息活动。
信息描述与揭示,信息描述亦称信息资源描述,是指根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。
信息存贮,是将经过加工整理序化后的信息按照一定的格式与顺序存贮在特定的载体中的一种信息活动。
3、信息组织的3大特性:第一,信息组织的渗透性,指信息组织存在于各种信息揭示、存
贮和检索活动之中。
第二,信息组织的依附性,指信息组织无法独立存在,它要以信息的识别、揭示等活动为前提。
第三,信息组织的增效性,是指信息组织可以增加信息传播、检索、利用的效率,是其他信息加工活动和利用的保障。
4、信息组织的4大原则:第一、客观性原则,客观存在的信息本身;与条件变化和环境变
化保持客观一致性。
第二,系统性原则。
第三,目的性原则,必须围绕用户的信息需求开展工作。
第四,现代化原则,思想观念现代化和技术手段现代化。
5、信息组织的标准化,包括:基本术语标准;有关信息技术标准;信息组织技术标准;其
他相关标准。
6、信息组织最基础的理论仍然是语言学、逻辑学和知识分类。
7、知识分类:是一门研究知识体系结构的学问
8、耗散结构理论:信息系统是一个开放的系统,系统不断与外界进行物质和能量的交换,
熵趋于最小值,能量远离平衡,混乱度最小,从原来无序结构转为一种时间、空间和功能上的有序结构。
9、自组织系统:凡是能够不再借助于外部控制而实现从无序到有序的转变,并维持稳定有
序状态的系统。
10、突变理论:是指系统的熵可以增加也可以减少,这种熵增、熵减可以在宏观无限小
的时间内突然产生。
11、元数据:是关于数据的数据,关于信息的信息,或描述数据的数据,它是专门用来
描述数据的特征和属性,也是描述和组织信息资源、发现信息资源的语言和工具。
12、著录:是指在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过
程。
著录的结果是款目。
13、标目:是从文献内容和形式的某一特征指引排检线索的著录项目。
14、文献著录标准化:是指在国家或国际范围内,对文献著录的原则、内容、格式等作
出具有一定约束力的规范。
15、信息标引:原来多称文献标引,是指分析文献的内容属性及相关外表属性,并用特
定语言表达分析出的属性或特征,从而赋予文献检索标示的过程。
包括两个环节:一是主题分析,二是转换标识。
16、分类语言,也称分类法。
它是用分类号表达主题概念,依据知识分类将主题概念组
织、排列成类目体系,主要以类目体系的自身结构显示概念之间关系的标引语言。
17、主题语言,又称主题法。
它是一种由受控的自然语言语词直接表达主题概念,按语
词字顺序列主题概念,主要用参照显示概念之间关系的标引语言。
18、分类标引:是指对文献进行主题分析,用分类语言表达出分析出的主题,赋予文献
分类检索标识的过程。
19、主题标引:是对文献进行主题分析,用主题语言表达分析出的主题,赋予文献主题
检索标识的过程。
20、MARC:机器可读目录。
21、SGML:是一种元语言,是用来描述置标语言的语言,适用于电子文档交换、文档
管理和文档发布。
22、文献型信息4个组织方法分类组织法,主题组织法,引用组织法,文献型信息的
宏观组织。
23、运用较为广泛的四种网络信息资源的组织方法:第一,文件方式,文件是计算机保
存处理结果的基本单位。
第二,数据库方式,数据库技术是从计算机系统中文件系统的基础上发展起来的对大量规范化数据进行管理的一种技术。
所谓数据库组织方式,是指将所有已获得的网络信息资源以固定的记录格式存贮,用户通过关键词及其组配查询,就可以找到所需要的信息线索,并通过信息线索直接连接到相应的网络信息资源。
第三,主题树组织方式,就是将信息资源按照某种实现确定的概念体系结构,分门别类地逐层加以组织,用户通过浏览的方式逐层加以选择,层层遍历,直至找到所需的信息线索,并通过信息线索直接找到相应的网络信息资源。
第四,超媒体方式,超媒体技术是超文本技术与多媒体技术的结合,它将文字、图表、声音、图像、视频等多媒体信息以超文本方式组织起来,使人们可以通过高度链接的网络结构在各种信息库中自由航行,找到所需要的任何媒体的信息。
24、知识组织:是对文献中所含内容进行分析,找到人们创造与思考的相互影响及联系
的结点,像地图一样把她们标记出来(即知识地图),以展示知识的有机结构,为人们直接提供创造时所需要的知识。
25、数据仓库:是将整个机构内的数据以统一形式集成存贮在一起,便于针对一定主题
的、集成的、时变的、非破坏性的数据进行集中分析。
“面向主题的、集成的、稳定的、不同时间的数据集合,用以支持经营管理中的决策制定过程”。
26、联机分析处理(OLAP):是一种友好而灵活的工具,它允许用户以交互方式浏览数
据仓库,对其中的数据进行多维分析,及时地从变化和不太完整的数据中提出与企业经营活动有关的信息。
27、知识表示:是指把知识客体中的知识因子和知识关联表示出来,以便人们识别和理
解知识。
28、专家系统的核心是知识库系统,知识库中的知识存贮方式及其推理输出规则,即为
专家系统的知识表示方式。