信息组织原理--分类组织
- 格式:ppt
- 大小:166.50 KB
- 文档页数:50
信息组织第一部分信息组织的基本原理一.熟悉和掌握1.信息组织:信息组织是为了方便人们检索、获取信息而将庞杂、无序的信息进行系统化和有序化的过程。
信息组织的内容包括信息收集与选择、信息分析与揭示、信息描述与加工、信息整理与存储。
对信息的描述与揭示以及序化是信息组织的中心内容。
2.信息标引:信息标引就是对信息内容进行分析并充分而有效地予以揭示。
从学科属性揭示信息内容就是分类标引,从主题特征揭示信息内容就是主题标引。
3.信息组织方法:(1)按组织对象分:文献实体组织与信息内容组织文献实体组织的对象是文献,这里的文献指的是传统的信息资源类型,主要指印刷型的出版物,如图书、期刊、会议论文、科技报告等。
文献实体组织是把这些文献及其著录和标引记录组织成一个有序的系统,如图书的分类排架系统、分类目录、主题目录等。
信息组织的本质是信息内容的组织。
(2)按信息组织的层次分:语法信息组织、语义信息组织与语用信息组织语法信息组织是以信息的形式特征为依据组织信息的方法,如字顺组织法等。
语义信息组织是以信息内容或本质特征为依据组织信息的方法,分类组织法、主题组织法就属这一层次。
语用信息组织是以信息的效用特征为依据组织信息的方法,如根据信息的权值、概率等组织信息的方法。
对于科学信息来说,最本质的是语义信息组织法。
4.常用信息组织方法*(1)分类组织法:根据某一特定的分类体系和逻辑结构组织信息的方法。
以内部特征为主。
分类组织法建立了信息的层级和关联体系,便于浏览检索。
(2)主题组织法:通过揭示信息主题特征并有序组织的方法。
主题法通过建立主题概念的范畴、族系和关联关系,显示信息的结构体系。
主题组织法根据所使用的主题检索语言又分为标题法、单元词法、叙词法、关键词法和自然语言组织法。
本体组织法也是。
(3)集成组织法:每种信息组织方法都有其特有的功用,有些组织方法功能是互补的,如将多种方法结合起来使用会达到更好的效果。
如分类主题一体化的组织方法、规范组织方法与自然语言组织法的结合等。
信息组织知识要点知识要点第⼀章绪论1、什么是信息组织?(理解)信息组织:对信息资源对象进⾏收集、加⼯、整合、存储使之有序化、系统化的过程。
2、信息组织的发展阶段——按组织对象划分(理解)按组织对象划分信息组织经历了三个阶段:⽂献组织阶段、信息组织阶段、知识组织阶段⽂献组织阶段——组织对象:传统⽂献实体,不涉及⽂献内容本⾝。
信息组织阶段——组织对象:从⼴度上,以纸质信息为中⼼转向以电⼦媒介信息为中⼼;从深度上,除了对⽂献实体进⾏组织,还要深⼊信息内容。
知识组织阶段——组织对象:从显性知识扩展到隐性知识。
知识组织直接给⽤户提供直观的、可操作的系统化知识。
不再局限于利⽤⽚⾯的信息来满⾜⽤户的需求,⽽是对⽤户的需求系统分析,向⽤户提供全⾯、完善的解决⽅案。
按职能划分信息组织经历了三个阶段(补充):清册职能时期查检职能时期组织职能时期3、⽹络信息组织的基本⽅法(掌握)①⽂件⽅式⼀般⽤于局域⽹内的⾮结构化信息组织。
优点:通过FTP协议进⾏传输,简单⽅便缺点:以⽂件为单位共享和传输信息会使⽹络负载越来越⼤②⾃由⽂本⽅式主要⽤于全⽂数据库的组织对⾮结构化的⽂本信息进⾏组织和处理的⽅式能够完整地反映出⼀次⽂献的全貌通过计算机⾃动进⾏⽂献信息的处理和组织,⽀持全⽂检索。
③数据库⽅式⼀般⽤于结构化/规范化信息组织。
优点:最⼩存取单位是字段,从⽽⼤⼤降低⽹络数据传输的负载。
缺点:对⾮结构化信息处理难度⼤数据库⽅式是当前普遍使⽤的⽹络信息资源的组织⽅式。
④主页⽅式⽹页⼀般通过HTML语⾔规则将⽂本、图像、声⾳、视频等各种类型的信息集合在⼀起。
⑤超⽂本⽅式⑥主题树⽅式主题树⽅式是⼀种可供检索和查询的等级式主题⽬录。
它以⼈⼯⽅式或半⾃动⽅式搜集信息,然后将信息资源按照某种事先确定的概念体系结构,分门别类地逐层加以组织。
主题树⽅式不太适合⼤型的综合性的⽹络信息资源系统,⽽较适合专题指引库的建⽴。
⑦搜索引擎⽅式⑧指引库⽅式指引库,也称导航库。
第一章1、信息采集:是指根据特定的目标和要求,将分散在不同时空域的有关信息,通过特定的手段和措施采掘和汇聚的过程。
它涉及一切信息工作中的信息采集活动,包括企业和其他组织的管理者们为了实现决策、管理和控制等目标所进行的信息采集。
2、信息采集渠道:①大众传播媒体②文献③政府机构④合作伙伴⑤消费者⑥信息中介结构3、信息采集方法:问卷调查、访谈、实验研究、文献收集4、信息组织与信息检索的关系:信息检索是根据特定的需求,运用某种检索工具,按照一定的方法,从大量的信息中查找出所需信息的过程。
对信息检索进行完整描述,一般必须包括信息组织和检索两个方面。
在信息检索系统中,信息组织是依据信息资源的主题内容和特征,将无序的信息组织成有序集合。
信息组织是信息检索的基础和前提。
信息组织根据用户需要,以信息资源的一定单元为处理对象,依据预先制定的规范,对其特征加以记录,并进行标引和必要的记录,然后将这些信息记录,按照规定的方式输入检索系统。
第二章1、信息组织:就是人们根据信息本身特点,运用适宜的工具和方法,依据一定的标准或规则,对其进行加工整理,排列组合,使之有序化、系统化、规律化、高级化,增强信息对象的表现效能和运用效能,以满足人们信息需求的过程和活动。
2、信息组织基本内容:按照信息组织的活动类型分“信息选择、信息分析、信息描述与揭示、信息存储”按照信息组织的流程分“信息的筛选和鉴别、信息的分类和排序、信息的著录和标引、信息的编目和组织、信息的分析和研究”3、信息描述与揭示方法:一是著录,主要描述文献信息的形式特征;二是标引,主要揭示文献信息的内容特征。
4、信息组织的类型:信息组织可归为语法信息组织、语义信息组织和语用信息组织三大类型。
从广义上看,信息采集阶段的信息组织主要是一种语用信息组织;信息组织阶段的信息组织属综合型信息组织;信息检索和开发阶段的信息组织则属于优化型语用信息组织。
5、一次信息、二次信息、三次信息:一次信息是人们研究或创造性成果的直接记录,一般指公开出版的图书、期刊论文、研究报告、会议文献、学位论文、专利说明书、网上未经过处理的电子化信息等。
知识点汇总第一章1、信息组织的定义以用户需求为导向,依据信息体自身的属性特征,信息工作者或用户按照一定的原则、方法和技术,将杂乱无章的信息整理成为有序的信息集合的活动和过程.2、信息组织的原理基本原理:如果有若干自然状态的无序信息资料,将这些信息资料按照某种属性特征排列成一个序列,并且需要使用信息资料的用户能将自己的需求转换成相应的信息资料属性特征,并在排列后的信息资料序列中找到自己所需要的信息资料。
信息组织由信息著录标引(信息描述揭示)和信息序化两个工作环节组成。
3、信息组织的内容一般而言,信息组织包括四项内容。
1。
信息筛选(甄别有用信息,剔除无用信息)2.信息分析(对信息的内外部特征进行细化、挖掘、加工整理并归类)3.信息描述与揭示(对信息资源的部分主题内容、形式特征及物质形态等描述维度进行分析、选择、记录的过程)4。
信息整序与存储(按照一定的格式和顺序存储在特定的载体中)4、信息组织的类型按信息的认识层次划分,信息组织有三种类型1.语法信息组织(研究语言符号之间的形式范畴的结构规则,如:字顺法、代码法、地序法、时序法)2.语义信息组织(研究信息的内容特征的组织方法,如:分类法、主题法)3。
语用信息组织(研究环境与使用者的不同而不断变化的信息群,如:权重值信息组织法、概率组织法)5信息组织的作用控制整序提升品质传播利用节约成本第二章1、熵(entropy)最早是热力学上的一个符号,是一种测量在动力学方面不能做功的能量综述。
熵指的是混乱的程度,负熵是物质系统有序化、组织化、复杂化状态的一种量度。
香农第一次将“熵”引入到信息论中,在信息论中,“熵”可以用作某件事不确定度的量度.信息量越大,体系结构越规则,功能越完善,熵就越小.利用熵的概念,可以从理论上研究信息的计量、传递、变换、存储等活动。
学术界目前普遍接受的观点是“信息即负熵”。
2、逻辑学原理在信息组织中的应用概念之间的关系(图略):相容关系同一关系:是指有相同外延的两个概念之间的关系。
分类法与主题法一、分类法分类系统分为聚类和归类两个子系统:聚类是指按照信息资源的特点和使用需要,通过区分和类聚建立起类目体系的过程;归类是指依据建立的分类体系进行类分信息资源的过程。
聚类的结果是建立科学、合理的、类目体系,如各种文献分类法等,聚类是归类的前提条件,是分类组织的重要依据和工具;而归类系统则是聚类系统的具体应用,它体现了聚类过程的实际存在意义。
信息资源分类法的类型按照编制方式分为:等级列举式、分面组配式、列举——组配式。
(一)等级列举组配式等级列举式分类法是一种将所有的类目组织成一个等级系统,并且采用尽量列举的方式编制的分类法。
类目体系组成一个树状结构,按照划分的层次,列举详细类目,以缩格表示类目等级关系,最后形成一个等级链。
常见的有《杜威十进制分类法》(DDC)、《中图法》等。
(1)杜威十进分类法(Dewey Decimal Classification,DDC)杜威十进分类法是广为全球各地图书馆使用的分类法。
这个分类系统最早在1873年时Melvil Dewey有此分类构想,而于1876年正式出版。
负责DDC出版的是Forest Press,而它于1988年成为OCLC下的一个部门。
DDC已被全球超过135个国家的图书馆使用,并且被翻译逾30种语言,包括阿拉伯文、中文、法文、希腊文、希伯来文、意大利文、波斯文、俄文、西班牙文及土耳其文等。
在美国,有95%的公共图书馆及学校图书馆、25%的学院及大学图书馆及20%的专门图书馆使用DDC。
此外,DDC更能用来组织网际网络上的各种资源。
杜威十进制图书分类法于1876年首次发表,历经22次的大改版后,内容已有相当程度的修改与扩充。
最新的版本为2004年版。
该分类法以三位数字代表分类码,共可分为10个大分类、100个中分类及1000个小分类。
除了三位数分类外,一般会有两位数字的附加码,以代表不同的地区、时间、材料或其他特性的论述,分类码与附加码之间则以小数点“.”隔开。
一、信息组织概述信息组织:根据信息检索与获取的需要,采用一定的规则技术与方法,对信息进行揭示与序化的过程.核心内容是对信息的描述、揭示与序化。
知识分类:包括学科分类和事物分类,能将客观世界千差万别的事物以及各种学科根据当代科学认识的最新成就构成一个严密的、有科学认识意义的体系.类目:类是指具有某种共同属性特征的事物的集合,在文献分类法中称为类目,是构成分类法的基本单元,其中表示类目的名称叫做类名,类目的代号称为分类号。
文献分类标准:又称文献分类根据,是指划分某类文献所依据的某种属性特征。
一般文献分类均以文献的学科属性为主要标准,而以文献的其他属性为辅助标准。
这些属性包括文献类型、载体形态、时代、地狱或使用对象等。
选用何种分类标准以及分类标准的应用次序直接影响分类体系的结构与分类表的质量。
文献分类:依据一定的分类体系(文献分类法),根据文献的内容属性和其他特征,对文献分门别类的、系统地组织与揭示的方法。
列举信息组织的常用法方法:1.分类组织法:是根据某一特定的分类体系和逻辑结构组织信息的方法。
其原理是按照一定的知识概念体系的梳妆等级结构或分面结构组织信息,从而使信息按学科、专业或组面等逻辑顺序排列,形成信息的逻辑分类整序体系。
2.主题组织法:直接以表示文献主题的语词做标识,提供字顺检索途径,并主要采用参照系统揭示词间关系的标引和检索文献的方法。
3。
集成组织法:将多种信息组织方法结合起来使用的方法,如分类主题一体化组织方法。
简述分类法的主要类型1。
体系分类法是直接体现知识分类的等级制概念的标志系统,主要依据概念的划分与概括的原理,将概括文献信息内容及外表特征的概念进行逻辑分类和系统排列,并赋予类号的方式建立起来概念,是一种将类目层层划分、等级分明的标记系统。
2.组配分类法主要依据概念的分析与综合原理,将文献、信息、事物的主题概念组成“知识大纲-分面—亚面—类目”的结构,按照一定的组配规则,通过各个分面类目之间组配来表达文献主题的一种分类法.《冒号分类法》、《布里斯书目分类法》是典型代表。
信息组织第一章信息组织概述一、名词解释1.信息组织2.分类组织法3.主题组织法4.知识分类5.类目6.关键词法7.文献分类标准8.文献分类二、简答与论述题1.列举信息组织的常用方法2.简述分类法主要的类型3.简述确定分类标准及其运用次序的依据4.简述主题法的含义及其特征5.依据构成原理划分,主题法有哪些类型?第二章体系分类法一、名词解释1.体系分类法2.基本部类3.基本大类4.上位类5.下位类6.类系7.类列8.交替类目9.多重类列法10.层类标记制11.顺序标记制12.分面标记制13.百分法14.八分法15.对应编号法16.字母标记制17.借号法18.复分表19.通用复分表20.分类法索引二、简答与论述题1.简述体系分类法中主表类目之间的关系2.简述交替类目的作用及启用交替类目的方法3.简述标记符号的含义、种类及其对类目体系的作用4.简述体系分类法中的标记符号的性能5.简述标记制度的基本类型6.简述复分表的类型7.简述类目仿分的含义及其形式8.简述类目注释的类型9.简述《中国图书馆分类法》复分组号加“0”的规则10.试析《中国图书馆分类法》的标记符号与标记制度第三章组配分类法一、名词解释1.组配分类法2.分面组配分类法3.分面分析4.分面符号5.分面公式6.回溯标记制7.分面标记制8.分面引用次序9.冒号分类法的五个几本范畴二、简答与论述题1.简述组配分类法的构成原理2.简述组配分类法的基本类型3.简述CC的标记制度4.试析体系分类法与分面分类法的异同点第四章叙词法一、名词解释1.叙词法2.概念组配3.字面组配4.入口词表5.轮排索引6.等同关系7.范畴索引8.词组索引9.等同率10.等级关系全显示二、简答与论述题1.简述叙词法的基本原理2.列举概念组配的主要类型3.简述词间关系的种类4.简述叙词表的宏观结构5.列举叙词表的评价指标6.试述网络环境下《汉语主题词表》的应用与发展第五章分类主题一体化词表一、名词解释1.《分面叙词表》2.《中国分类主题词表》二、简答与论述题1.简述分类主题一体化词表的原理2.试分析主题一体化词表的优势3.简述分类主题一体化词表的类型4.试析《中国分类主题词表》的结构与主要功能第六章国内外其他主要分类法一、名词解释1.DDC2.LCC3.UDC4.克特字顺号码二、简答与论述题1.简述《中档法》的宏观结构2.列举DDC类目注释的类型3.列举说明UDC辅助符号的类型4.简介LCC中克特字顺号码的主要用途5.请比较《中图法》、《科图法》、《人大法》、DDC、UDC、LCC、CC的标记制度第七章分类法及主题词表的电子化与网络化1.简述《中图法》电子版的功能与检索方法2.简述《中国分类主题词表》WEB版的功能3.简述WebDewey的使用方法4.试比较WebDewey及Classification Web的异同第八章网络信息资源的组织一、名词解释1.主题指南2.网络叙词表3.知识组织系统4.NKOS二、简答与论述题1.谈谈传统分类法在网络信息资源组织中的优势2.简述主题指南编织的原理与原则3.简述网络叙词表的基本类型4.简述知识组织系统的含义和类型5.论析数字图书馆知识组织的发展方向第九章本体的创建与应用1.简述本体的含义与特征2.简述本体构建的主要方法与程序3.简述本体的主要应用领域4.试选择一种本体构建工具尝试构建一个领域本体第十章文献标引的基本规则与方法一、名词解释1.文献标引2.主题标引3.整体标引4.全面标引5.重点标引6.综合标引7.分散标引8.互见标引9.分析标引10.分类法使用本二、简答与论述题1.简述确定文献分类法的使用本的方法2.简述文献分类标引的基本规则3.简述文献分类标引工作的程序4.简述文献改编的原则与方法5.简述主题标引的步骤6.简述选择标引词的基本规则7.简述主题词组配的规则第十一章各类型与各学科文献标引方法一、名词解释1.多卷书2.丛书3.集中标引4.分散标引二、简答与论述题1.简述多卷书的标引方法2.简述丛书的标引方法3.分别列举应用关系、影响关系以及因果关系主题文献的标引方法4.简述工具书的标引方法第十二章信息组织环境的变化与发展趋势1.分析当前信息环境的主要特点及其对信息组织产生的影响2.试分析信息组织的热点和发展趋势3.列举信息组织可视化的工具..。
信息组织的基本原理
信息组织是信息科学中的重要领域,它涉及到如何对信息进行分类、组织、存储和检索。
信息组织的基本原理包括以下几个方面:
1. 分类原则:信息分类是信息组织的基础。
分类的原则包括形式、内容、用途等。
形式分类是按照物体的形态、大小、颜色等特征进行分类;内容分类是按照主题、内容、语言等进行分类;用途分类是按照使用的目的进行分类。
2. 分类结构:分类结构是信息组织中的重要组成部分。
分类结构包括层次结构、网状结构和标签结构等。
层次结构是按照一定的层次关系进行分类,如图书馆中的分类法;网状结构是按照多个属性进行分类,如电商网站上的商品分类;标签结构是按照标签进行分类,如博客中的标签分类。
3. 元数据:元数据是描述信息的数据。
元数据包括数据的属性、关系、来源、格式等。
元数据的作用是提高信息组织的效率,并且方便信息的共享和交流。
4. 数据标准化:数据标准化是信息组织的重要手段。
数据标准化是指制定统一的数据规范,以便不同系统之间的数据交换和共享。
数据标准化可以提高数据的可靠性和准确性,并且方便数据的管理和维护。
5. 检索原则:检索是信息组织的重要环节。
检索原则包括可靠性、准确性、全面性和实用性。
可靠性是指检索的结果应该是可靠的、正确的;准确性是指检索的结果应该是符合要求的;全面性是指检索
应该涵盖所有相关的信息;实用性是指检索的结果应该是实用的、能够满足用户的需求。
信息组织的基本原理是信息组织的基础,它们对于信息组织的效率、准确性和可靠性起着重要的作用。
了解和掌握这些原理,有助于提高信息组织的水平和技能。
分类法与主题法一、分类法分类系统分为聚类和归类两个子系统:聚类是指按照信息资源的特点和使用需要,通过区分和类聚建立起类目体系的过程;归类是指依据建立的分类体系进行类分信息资源的过程。
聚类的结果是建立科学、合理的、类目体系,如各种文献分类法等,聚类是归类的前提条件,是分类组织的重要依据和工具;而归类系统则是聚类系统的具体应用,它体现了聚类过程的实际存在意义。
信息资源分类法的类型按照编制方式分为:等级列举式、分面组配式、列举——组配式。
(一)等级列举组配式等级列举式分类法是一种将所有的类目组织成一个等级系统,并且采用尽量列举的方式编制的分类法。
类目体系组成一个树状结构,按照划分的层次,列举详细类目,以缩格表示类目等级关系,最后形成一个等级链。
常见的有《杜威十进制分类法》(DDC)、《中图法》等。
(1)杜威十进分类法(Dewey Decimal Classification,DDC)杜威十进分类法是广为全球各地图书馆使用的分类法。
这个分类系统最早在1873年时Melvil Dewey有此分类构想,而于1876年正式出版。
负责DDC出版的是Forest Press,而它于1988年成为OCLC下的一个部门。
DDC已被全球超过135个国家的图书馆使用,并且被翻译逾30种语言,包括阿拉伯文、中文、法文、希腊文、希伯来文、意大利文、波斯文、俄文、西班牙文及土耳其文等。
在美国,有95%的公共图书馆及学校图书馆、25%的学院及大学图书馆及20%的专门图书馆使用DDC。
此外,DDC更能用来组织网际网络上的各种资源。
杜威十进制图书分类法于1876年首次发表,历经22次的大改版后,内容已有相当程度的修改与扩充。
最新的版本为2004年版。
该分类法以三位数字代表分类码,共可分为10个大分类、100个中分类及1000个小分类。
除了三位数分类外,一般会有两位数字的附加码,以代表不同的地区、时间、材料或其他特性的论述,分类码与附加码之间则以小数点“.”隔开。