第三章 信息分布
- 格式:docx
- 大小:25.89 KB
- 文档页数:7
页眉信息分类和标识管理办法第一章总则为有利于公司信息的识别、保护和利用,加强公司信息的安全管理,特制第一条订本管理办法。
第二条本管理办法适用于公司所有信息的管理。
第二章组织机构与职责第三章信息分类的定义第三条公司信息分类和标识的目的:1. 通过对公司信息按无形性质(非财务)进行分类和标识,促进信息的增值利用,提高信息的利用率;2. 促进信息分布的合理化、促进非结构化信息向结构化数字信息的转换,降低信息管理成本;3. 掌握公司信息状态,明确信息的使用方法、保存方式、放置位置、安全分类和责任人等,加强信息的管理,为信息系统的日常与应急工作提供基本资料;4•根据各种信息的敏感度和重要性的不同,制定对信息各种相应的分类保护措施,对各类信息实施适当程度的保护。
第四条信息指公司在生产、经营和管理过程中,所需要的以及所产生的,用以支持(或指导、或影响)公司生产、经营和管理的一切有用的数据和资料等非财务的无形,其范围包括如下现在的和历史的信息:1. 公司的域名、网络拓扑结构、网络IP地址及分配规则、企业标准编码;2. 公司投资开发的(或具有独立知识产权的)程序软件的源代码、支持程序软件、外购软件的使用许可证记录、系统平台基础数据等;页眉3. 系统配置数据、系统授权信息、口令文件、密钥及算法文件、系统说明文档、用户手册等系统基础数据;4. 各类专业系统的应用数据库及数据文件、业务报表等系统业务数据;5. 各类专业系统的运行方案、运行记录、变更记录等系统运行数据以及应急计划;6. 各类专业的规划、方案与策略、业务流程、业务规范、操作规程等管理数据;7. 技术图纸、技术文档、工程资料等项目数据;8. 其他纸介质的重要办公文件(信件)、图象、影象、录音和照片等非结构化办公资料;9. 单个员工拥有的专家技能和经验等隐性数据。
第五条公司信息的安全分类:信息按信息的敏感度分类为机密信息、秘密信息、对内公开信息、对外公开信息。
信息分布规律的特点
1. 信息分布规律的特点之一就是不均衡呀!就好比财富在社会中的分布,总是有一些地方信息超级丰富,而有些地方却信息匮乏。
比如在繁华的大城市,各种资讯铺天盖地,可在一些偏远的小乡村,消息就没那么灵通啦。
你说是不是这个理儿?
2. 它还有个特点是动态变化的哟!这就像天气一样,一会儿晴天一会儿阴天。
比如网络热点,今天这个话题火得一塌糊涂,明天可能就换成另一个了。
想想看,前阵子某个事件火得不行,过一阵儿可能就没啥人提了,不就是这样吗?
3. 信息分布规律存在集聚性呢!就如同人们喜欢聚居在某些地方一样。
像一些特定的行业领域,就会聚集大量相关的信息。
比如科技行业,那里的信息集中度多高呀,而其他与之不太相关的地方就很难有这么丰富的此类信息,难道不是吗?
4. 具有关联性这个特点也很重要呀!就好像朋友之间会互相影响。
比如你对某个领域感兴趣,那么和这个领域相关的信息就会更容易被你发现和获取。
就好像你喜欢音乐,那关于音乐的各种信息就会不知不觉围绕着你,很神奇吧?
5. 还有个特点是分层性呢!这可以类比成社会阶层呀。
高层的信息可能更全面、更深入,而底层的信息可能就比较基础和浅显。
比如说在一个学术领域,专家们掌握的信息和普通爱好者的肯定不一样,这很容易理解吧?
6. 信息分布规律的传播性也不容小觑呀!就像病毒的传播似的,一旦开始就很难阻止。
一个好的创意或者新闻,很快就能传遍各个角落。
比如一个有趣的视频,很容易就在大家的手机里传开了,不是吗?
我觉得呀,了解这些信息分布规律的特点太重要了,能让我们更好地去获取和利用信息,在这个信息爆炸的时代不迷失方向!。
第三章信息分布第一节信息产生与分布中的马太效应1、马太效应:在社会信息流的产生、传递和利用过程中,信息及其相关因素常常表现出明显的核心趋势和集中趋向,如少数出版社成为某类图书的权威出版机构,为数不多的科学期刊因刊载了某学科领域的大量论文而成为该学科的核心期刊等,这就是信息产生与分布中的马太效应。
2、信息分布中的核心趋势和集中取向(1)核心趋势:如高产作者群体的形成、期刊信息密度增大、高频词汇的确立等都是信息生产主体的主观期望与采取实际步骤的结果。
(2)集中取向:如一篇论文多次被引、一个网站被众多用户点击,某些图书频繁地被借阅,这种富集是社会选择和影响的结果。
(3)二者的效果是一致的,仅仅是积累的程度不一样。
前者可能是相乘的累积,后者是相加的累积;前者是主动选择,后者是被动接受;前者是自增生过程,后者倾向大变量分布过程。
3、马太效应的积极意义和负面影响(06简答)(1)积极意义:①在实际工作中,利于突出重点、摒弃平均,为信息源的选择、获取、评价和利用提供依据,为降低信息管理成本、提高信息利用效益提供指导和方法。
②在理论上,利于认识信息集中和分散的特征、趋势和规律,发现信息管理学的基础性定律。
(2)负面影响①马太效应描述信息对象的优势和劣势过度积累,容易使信息工作者按简单的优劣进行信息的选择、评价、传播和利用,因循守旧、不思进取,按经验和简单的规则从事复杂多变的信息管理工作。
②马太效应所形成的信息分布富集有时仅仅是表面的、外在的,有的优势积累过程中带有突发性和受统计学因素的影响,使得信息价值失真。
③若过分注重马太效应所形成的核心信息源,就会忽略分布在其他信息源中有价值的信息;若任核心信息源的优势过度积累而不加控制,高度专门化,其所含的信息就会越来越单一,会使其丧失更多的用户。
④马太效应青睐名人、拒绝新人的习惯势力不利于新人成长,限制了新思想、新知识和新信息的产生和传播。
第二节信息生产者分布规律1、洛特卡定律(1)定义:实际上是科学论文在作者上集中与分散的分布现象。
习题信息与信息管理[重要概念]信息知识负熵语法信息语用信息语义信息信息流社会信息化信息社会GII “三金”工程信息管理文件管理信息资源管理知识管理[简答1、如何理解通讯领域信息的含义2、简述数据、信息、知识之间的关系。
3、简述信息的特征和分类。
4、试分述信息管理四个典型阶段。
信息交流【简答】1、简述信息交流的含义与特征。
2、理解信息交流与认识过程。
3、信息交流有哪些条件和要素。
4、怎样理解信息交流与传播中的栈以及信息交流传递中的代理。
5、简述S、R、T信息守恒的含义。
6、了解信息扩散原理的内容。
7、简述两种信息变异的形式和原因。
第三章信息分布【简答】1、何谓马太效应2、掌握信息生产者分布规律:洛特卡定律和普赖斯定律,写出定律的公式并画出曲线图3、掌握信息离散分布规律:布拉德福定律和齐夫定律,写出定律的公式并画出曲线图4、掌握信息对时间的分布规律:指数增长律和逐渐过时律,写出定律的公式并画出曲线图5、利用本章中的规律分析一个实际案例第四章信息获取【简答】1、信息源的类型划分和特点。
2、信息评价的一般指标选取。
3、直接评价和间接评价的性能比较。
4、信息搜集的原则和方法。
5、调查的方法和实施。
第五章信息组织【简答】1、信息组织包括哪些基本内容?2、信息组织的理论基础是什么?3、信息描述的主要方法有哪些?4、简要描述网络信息资源组织的相关标准。
5、简要描述主题法和分类法的特点。
6、网络信息资源组织与传统信息资源组织有哪些突破?7、知识组织的演进和发展。
第六章信息检索【简答】1、简述信息检索的类型与特性。
2、简述信息检索的四种模型。
3、检全率与检准率的相互关系是如何的。
4、简述信息检索的技术与方法。
5、试用常用的几种搜索引擎。
第七章信息服务【简答】1、简述信息服务的内容和主要方式。
2、互联网的信息服务功能包括哪些。
3、简述信息用户及其信息需求研究的任务与内容。
4、简述用户信息行为的特征。
5、调查用户及其需求有哪些方法。
信息分布中的各种定律归纳概括知识的产生于传播。
)某一学科领域中的相关论文在期刊中的分布是不均匀的,而且具有明显的集中与分散规律。
布拉福德定律揭示了论文在科学期刊中的分布。
如果将一篇较长文章(约5
000字以上)中每个词按其
出现频次递减排列起来
(高频词在前,低频词在
后),并用自然数给这些词
编上等级序号,出现频次
最高的为1级,其次为2
级……这样一直到D级,如
果用f表示词在文章中出
现的频次,用r表示词的
等级序号,则有:
fr=c(c为常数) 通过词汇分频分布来揭示信息
分布规律
高产作者中一位最低产的作者发表的论文
献随时间增长的规律。
文献增长与时间成指数函数的
关系。
勒希尔考察了不同质量级别的文献增长状
况,认为文献的数量与其质量有关。
他定义
λ(0≤λ≤1)为文献的质量级别,则不同级
别上的文献量为[F(t)]λ。
他给λ的具体
值如下:
λ=1:至少是一般文献(实际代表所有文献)
λ=3/4:至少是有意义的文献
λ=1/2:至少是重要的文献
λ=1/4:至少是非常重要的文献
λ=0:第一流的文献
对于第一流的文献(即λ=0),文献数量为
lnF(t)。
最初生长或繁殖很快,。
第三章信息分布1、信息产生与分布中的“马太效应”:在社会信息流的产生、传递和利用过程中,我们发现信息及相关因素常常表现出明显的核心趋势和集中取向。
(马太效应真实概括了人类社会生活中的惯性,描述了优势和劣势的积累过程:一经存在有优势,这种优势局面就会不断增加,反正若处于劣势,则这种不利条件也会继续加剧。
)2、马太效应A积极意义:(1)在实际的信息管理工作中,它可以帮助我们突出重点、摒弃平均,为信息源的选择、获取、评价和利用提供依据,为降低信息管理成本,提高信息利用效益提供指导和方法。
(2)在理论上,可以帮助我们认识信息集中和分散的特征、趋势和规律,发现信息管理学的基础性定律。
B负面影响:(1)信息的优势和劣势过度积累,容易使信息工作者因循守旧、不求变革创新,按经验和简单的规则从事复杂多变的信息管理工作(2)马太效应所形成的信息分布富集有时仅仅是表面的、外在的。
(3)核心信息源是马太效应优势积累的结果,但过分注重核心信息源,就会忽略分布在其他信息源中有价值的信息,造成过度专门化,这是信息管理和信息服务之大忌。
(4)信息生产者的成长和数量无疑对信息的产生和分布具有较大影响,马太效应青睐名人、拒绝新人的习惯不利于信任成长。
C由以上分析可知,马太效应的积累要适度,不能任其发展,为保证信息的产生和分布计较科学合理,适当的干预是必需的。
3、普赖斯的平方根定律:受洛特卡定律的启示,普赖斯提出了核心生产者分布的“平方根定律”,即在某一特定领域中,全部论文的半数系由该领域中全部作者的平方根的那些人撰写的。
“那些人”无疑是核心或高产的。
4、信息离散分布规律:是信息的重要属性,它表现为信息的内容单元以不同的方式,从不同的角度,分布于各种载体中。
(它具有复杂的机理,本质上是由信息的生产和利用决定的)5、布拉德福定律:或称为布氏定律,如果将科学期刊按其刊载某个学科主题的论文数量以递减顺序排列起来,就可以在所有这些期刊中区分出载文率最高的“核心”部分和包含着与核心部分同等数量论文的随后几区,这时核心区和后继各区中所含的期刊数成1:a:a2的关系。
6、普赖斯曲线:(指数增长率)第四章信息获取1、信息源:人们在科研活动、生产经营活动、文化活动和其他一切活动中所产生的成果和各种原始记录,以及对这些成果和原始记录加工整理所得的成品都是借以获取信息的源泉,简称信息源。
2、记录型信息源:包括由传统介质和各种现代介质记录和存贮的知识信息3、记录型信息源地位:不仅在目前,而且在今后相当长的时期内,印刷型仍然是最基本的信息源。
4、一次信息,凡是在科研、生产、经营、文化及其他各类活动中生产的原始信息;二次信息,是对一次信息进行加工整理后产生的一类信息。
三次信息,是在一、二次信息的基础上,经过分析、综合而产生的信息。
5、实物信息源:由实物携带和存贮的知识信息。
6、智力型信息源:主要是指人脑存贮的知识信息,包括人们掌握的各类知识、诀窍、技能和经验,有的可以用语言和文字明确表达和记录,有的则难以明确表达和记录,故又称为隐性知识。
7、隐性知识8、零次信息源:是人们通过直接交流获得的信息,是信息客体的内容直接作用于人的感觉的结果,而不像记录型信息和实物型信息那样通过某种无患子载体的记录形式发生作用。
9、有价值的信息:是在特定的问题和状态中被利用并有效发挥其功能的信息,是实现某种目标所需要的知识,是进行决策和选择所必需的资料。
10、有价值的信息应该有的6个条件:能够及时地以适当的方式提供解决问题所需要的依据;信息符合用户需求的内容;信息的可信赖程度高;信息具有综合性;信息容易获取;信息的费用与目标吻合。
11、直接评价法:就是按照有价值的信息应当具备的一般条件或标准,从不同角度和侧面对信息源的价值给予评分评价。
总的来说,这种方法十分粗浅,不能准确地揭示信息源的真正价值,这是因为:第一,对各指标的评分带有极大的主观性,完全取决于信息工作者个人对信息源的认识和了解。
第二,信息源的价值只有在实际利用中才得到真正体现,这种评定方法完全不考虑信息源在实际利用中的真正动态,因而不能正确反映信息源的价值。
第三,上述五项指标也还是不够完备的。
尽管如此,还是可用来作评价,作为信息收集和传递信息的一个参考判据。
12、间接评价法:是通过信息用户来评价信息源。
以调查表的形式调查用户对信息源的需求和利用情况,然后由信息工作者对调查所得到的数据进行统计分析和对比,对信息源的价值做出评定。
特点:需要信息用户密切配合,工作量大,但评价结果较为客观。
13、交叉检验:一般把从各个方面获得同一信息,并进行比较评价的方法叫做“交叉检验”。
14、信息经济性评价的3个要点:所需信息存在率的评价;所需信息适合率的评价;所需信息可靠性的评价。
15、信息再现率,从信息库中检索到的相关信息的比例。
适合率,真正所需的信息的比例。
机构信息存在率,16、信息获取的效率指标及各自定义:采全率,用来衡量切题信息搜集的完整程度,指某一信息系统(信息库)所含的全部切题性信息(对该系统的全体用户而言)在当时系统内外所有切题信息中所占的比例。
采准率,用来衡量信息搜集的针对性,指某一信息系统(信息库)所含的全部切题信息(对该系统的全体用户而言)在当时该系统所有信息中所占比例。
及时率,用来衡量信息搜集的速度,即在最短的时间内完成信息搜集过程的能力。
费用率,用来衡量信息搜集的资金效率,指用于信息库中单位信息的费用的最低能力。
劳动好费率,指信息系统搜集到的单位信息所耗费的最低劳动量,可用搜集过程所有环节的劳动消耗总数来计算。
17、信息搜集的5个原则:针对性,系统性,预见性,科学性,计划性。
第五章信息组织1、信息组织含义:亦称信息整序,是利用一定的规则、方法和技术对信息的外部特征和内容特征进行揭示和描述,并按给定的参数和序列公式排列,使信息从无序集合转化为有序集合的过程。
2、信息组织内容:信息选择,目的就是从采集到的、处于无序状态的信息流中甄别出有用的信息,剔除无用的信息。
信息分析,是按照一定的逻辑关系从语义、语用和语法上对选择过的信息内、外特征进行细化、挖掘、加工整理并归类的信息活动。
信息描述与揭示,信息描述亦称信息资源描述,是指根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。
信息存贮,是将经过加工整理序化后的信息按照一定的格式与顺序存贮在特定的载体中的一种信息活动。
3、信息组织的3大特性:第一,信息组织的渗透性,指信息组织存在于各种信息揭示、存贮和检索活动之中。
第二,信息组织的依附性,指信息组织无法独立存在,它要以信息的识别、揭示等活动为前提。
第三,信息组织的增效性,是指信息组织可以增加信息传播、检索、利用的效率,是其他信息加工活动和利用的保障。
4、信息组织的4大原则:第一、客观性原则,客观存在的信息本身;与条件变化和环境变化保持客观一致性。
第二,系统性原则。
第三,目的性原则,必须围绕用户的信息需求开展工作。
第四,现代化原则,思想观念现代化和技术手段现代化。
5、信息组织的标准化,包括:基本术语标准;有关信息技术标准;信息组织技术标准;其他相关标准。
6、信息组织最基础的理论仍然是语言学、逻辑学和知识分类。
7、知识分类:是一门研究知识体系结构的学问8、耗散结构理论:信息系统是一个开放的系统,系统不断与外界进行物质和能量的交换,熵趋于最小值,能量远离平衡,混乱度最小,从原来无序结构转为一种时间、空间和功能上的有序结构。
9、自组织系统:凡是能够不再借助于外部控制而实现从无序到有序的转变,并维持稳定有序状态的系统。
10、突变理论:是指系统的熵可以增加也可以减少,这种熵增、熵减可以在宏观无限小的时间内突然产生。
11、元数据:是关于数据的数据,关于信息的信息,或描述数据的数据,它是专门用来描述数据的特征和属性,也是描述和组织信息资源、发现信息资源的语言和工具。
12、著录:是指在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。
著录的结果是款目。
13、标目:是从文献内容和形式的某一特征指引排检线索的著录项目。
14、文献著录标准化:是指在国家或国际范围内,对文献著录的原则、内容、格式等作出具有一定约束力的规范。
15、信息标引:原来多称文献标引,是指分析文献的内容属性及相关外表属性,并用特定语言表达分析出的属性或特征,从而赋予文献检索标示的过程。
包括两个环节:一是主题分析,二是转换标识。
16、分类语言,也称分类法。
它是用分类号表达主题概念,依据知识分类将主题概念组织、排列成类目体系,主要以类目体系的自身结构显示概念之间关系的标引语言。
17、主题语言,又称主题法。
它是一种由受控的自然语言语词直接表达主题概念,按语词字顺序列主题概念,主要用参照显示概念之间关系的标引语言。
18、分类标引:是指对文献进行主题分析,用分类语言表达出分析出的主题,赋予文献分类检索标识的过程。
19、主题标引:是对文献进行主题分析,用主题语言表达分析出的主题,赋予文献主题检索标识的过程。
20、MARC:机器可读目录。
21、SGML:是一种元语言,是用来描述置标语言的语言,适用于电子文档交换、文档管理和文档发布。
22、文献型信息4个组织方法分类组织法,主题组织法,引用组织法,文献型信息的宏观组织。
23、运用较为广泛的四种网络信息资源的组织方法:第一,文件方式,文件是计算机保存处理结果的基本单位。
第二,数据库方式,数据库技术是从计算机系统中文件系统的基础上发展起来的对大量规范化数据进行管理的一种技术。
所谓数据库组织方式,是指将所有已获得的网络信息资源以固定的记录格式存贮,用户通过关键词及其组配查询,就可以找到所需要的信息线索,并通过信息线索直接连接到相应的网络信息资源。
第三,主题树组织方式,就是将信息资源按照某种实现确定的概念体系结构,分门别类地逐层加以组织,用户通过浏览的方式逐层加以选择,层层遍历,直至找到所需的信息线索,并通过信息线索直接找到相应的网络信息资源。
第四,超媒体方式,超媒体技术是超文本技术与多媒体技术的结合,它将文字、图表、声音、图像、视频等多媒体信息以超文本方式组织起来,使人们可以通过高度链接的网络结构在各种信息库中自由航行,找到所需要的任何媒体的信息。
24、知识组织:是对文献中所含内容进行分析,找到人们创造与思考的相互影响及联系的结点,像地图一样把她们标记出来(即知识地图),以展示知识的有机结构,为人们直接提供创造时所需要的知识。
25、数据仓库:是将整个机构内的数据以统一形式集成存贮在一起,便于针对一定主题的、集成的、时变的、非破坏性的数据进行集中分析。
“面向主题的、集成的、稳定的、不同时间的数据集合,用以支持经营管理中的决策制定过程”。
26、联机分析处理(OLAP):是一种友好而灵活的工具,它允许用户以交互方式浏览数据仓库,对其中的数据进行多维分析,及时地从变化和不太完整的数据中提出与企业经营活动有关的信息。