从信息到知识
- 格式:doc
- 大小:49.31 KB
- 文档页数:6
从数据到知识发现需要经过哪些步骤?数据到知识发现是一个多步骤的实践过程,它涉及收集、整理和分析数据,以从中提取有价值的知识和见解。
这个过程对于许多领域来说都是至关重要的,包括科学研究、商业分析和决策制定。
在当今信息爆炸的时代,我们面临着大量的数据,但这些数据本身并没有直接的意义。
为了从数据中获得有用的知识,我们需要经过一系列的步骤和方法。
下面将介绍从数据到知识发现的主要步骤。
请注意,这里我们讨论的是泛指的数据到知识发现过程,具体的步骤和方法可能因应用领域的不同而有所变化。
以下是一般情况下涉及的几个主要步骤。
第一步是收集相关的数据。
这可以通过多种途径实现,例如实地观察、调查问卷、记录仪器等等。
收集的数据可以是定量数据(如数字或测量结果)或定性数据(如文字描述或图片)。
数据的收集需要明确目的和研究问题,并选择合适的采样方法和数据来源。
这些数据可以来源于现有的数据库、文献研究、网络爬虫等。
在收集到数据后,下一步是对数据进行整理和清洗。
这些步骤包括去除重复数据、处理异常数据、填补缺失值等。
数据整理的目标是使数据变得可靠、一致和易于分析。
常用的数据整理和清洗工具包括电子表格软件、编程语言和统计软件。
数据整理的过程需要注意数据保密和隐私的问题,确保数据的合法性和安全性。
当数据整理完毕后,接下来的步骤是对数据进行分析和挖掘。
这涉及使用统计分析、数据挖掘和机器研究等方法,以发现其中的模式、关联和趋势。
数据分析和挖掘的目的是从数据中提取有意义的信息和知识。
通过使用适当的分析工具和技术,可以揭示数据背后隐藏的规律,并生成可视化图表和报告供进一步解释和应用。
数据分析和挖掘得出的知识需要进一步被提取和应用。
这可以通过总结发现的模式、建立模型和预测等方式实现。
提取的知识可以帮助决策者做出更明智的决策和规划。
根据具体的应用领域,知识的应用方式也会有所不同。
它可以用于改进产品设计、优化运营流程、预测市场趋势、支持科学研究等。
信息构建1从信息构建到知识构建信息构建(InformationArchitecture,IA)是20世纪70年代中期兴起、90年代末期得到广泛推崇和快速发展的一种信息组织和管理的理论,其理论和实践在这几年不断地得以完善。
对IA的发展状况有众多的认识,如:有学者将IA的发展划分为前络时代的IA和络时代的IA;有学者认为,信息构建的发展经历了3代:第一代信息构建重点是把系统当作是个别组织中的独立应用;第二代信息构建的重点是把系统当作个别组织中各个组成部分的集成装置;第三代信息构建的重点是把信息当作支持IT工具和技术的公司资源。
在IA研究蓬勃发展的同时,以从事信息构建工作为职业的信息建筑师队伍不断壮大,信息构建的正规教育在高等院校不断兴起,民间和社会团体对IA也投入了相当大的热情,信息构建的应用范围和影响力正在逐步扩大。
在信息构建不断深入发展过程中,我们注意到一个事实,那就是人们常常谈及从信息构建到知识构建的发展趋势。
知识构建的概念是伴随着信息构建的研究出现的,尽管常常被人们提及,但对它的深入研究还不多见。
本文从信息构建与知识构建的异同、信息构建到知识构建转化的条件以及从信息构建到知识构建的趋势这几个基础的方面来研究信息构建和知识构建的关系,以期引起国内对知识构建问题的进一步深入研究,并最终能形成指导和组织机构管理实践的理论、方法、工具和产品,推动从信息构建到知识构建的发展。
知识构建(KnowledgeArchitecture,KA)是信息构建在20世纪90年代末期广泛兴起以后出现的一个比信息构建更加新的词汇。
一般而言,知识构建是基于IA基础之上的信息构建形式,它具有知识组织、知识导航、知识标识和知识检索的功能,是使知识更易于理解和吸收的工作理念、工作过程和工作方法。
要将信息构建与知识构建相关联,就必须谈及信息资源的开发链,即从“事实—数据—信息—知识—智慧—创新”的发展过程,从信息资源开发链来看,KA提供的是信息资源开发链较高层次的信息或就是知识本身,提供的是知识服务,它更突出人与内容的结合。
信息数据智慧知识从小到大排列1988年,著名组织理论学家,运筹学和系统思维研究的先驱罗素·艾克夫在一次大会上提出了人类智慧的金字塔。
这个金字塔分为四层,底层是数据,然后往上依次是信息、知识和智慧。
这个金字塔很好理解,我们这个世界有太多的数据,却没有多少智慧。
金字塔的每一层,都从它下面的那一层吸取价值。
底层的数据本身没有价值,而通过处理的数据,我们得到了有用的信息。
作者说数据和信息关系,就像葡萄园和葡萄酒的关系一样。
而从信息中提炼,我们获得了知识。
信息是结构化的数据,而知识则是可付诸行动的信息,比如我们根据实时路况发明了导航地图就是将信息转化为知识的过程。
然后在知识基础上,我们不断提炼成和抽象出了智慧。
这看似一个完美的金字塔,至少在过去数千年人类历史中,我们都是依靠这样的方式积累知识和智慧的。
从数据到信息、从信息到知识、从知识到智慧。
从信息到知识
院(系)名称:
专业名称:
学生姓名:
学号:
二○一三年四月
摘要
从信息到知识的转化主要经历四个步骤,数据、信息、知识到智慧。
认清这四者之间的概念和关系。
本文分析、归纳了数据、信息、知识和智慧的定义,提出了对这些概念的认识了解,并对他们之间的关系进行了详细分析。
本文认为数据通过接受、记忆转化为信息,信息通过分析思考变为知识,而知识通过集成、内化为智慧。
关键词:数据;信息;知识;智慧
从信息到知识
1.数据、信息、知识与智慧的含义
从图中我们可以看到,数据是知识阶层中最底层也是最基础的一个概念。
数据是形成信息,知识和智慧的源泉。
关于数据的定义,比较典型的我们可以看到以下几种:
1.数据是对现实生活的理性描述,尽可能地从数量上反映现实世界。
也包括汇总、排序、比例、等等处理。
2.数据(Data) [Applehans, Globe&Laugero,1999]认为数据是一系列外部环境的事实,是未经组织的数字、词语、声音和图像等。
3.据是计算机程序加工的“原料”。
4.数据泛指对客观事物的数量、属性、位置及其相互关系的抽象表示,以适合于用人工或自然的方式进行保存、传递和处理。
以下介绍一个关于数据、信息、知识到智慧的实例:
信息系统角度的传统划分——数据努力/价值
Effort/ Value
数据
Data 信息
Informa
知识
Knowled
企业智慧
Corporate Wisdom
时间
Time
乔纳森•吴(Jonathan Wu)
(1)数据。
例如,一个杂货店收集和存储了有关顾客购物的交易数据,包括如下的数据元素:货物名称、数量、价格、日期等(见表1.1)。
交易处理系统存储了大量的相关数据,为更高层次的理解奠定了基础。
表1.1 交易数据实例
货物名称数量价格日期登记号店员ID会员卡ID 尿布 1 4.99 11/1/2000001 213 1209
信息系统角度的传统划分——信息
(2) 信息。
例如,不同货物名称、数量和价格就提供了被购货物的信息,包括货物种类、数量和价格等。
通过计算每种货物的销售额,就可以进行货物销售额排序。
表1.2 数据积聚形成信息
货物名称数量价格销售总额啤酒265 6.85 1815.25
谷物430 3.90 1677.00
面包850 1.59 1351.50
牛奶1100 1.20 1320.00
尿布200 4.99 998.00
信息系统角度的传统划分——分析
(3) 分析。
将不同的数据元素积聚形成信息是很有用的,同时,将数据分离和重新组织将能够提升信息的价值,这就是进行信息分析的意义。
例如,可以对杂货店中存储的信息按照特定的时间周期进行分析,可以得到有价值的分析结果,尿布和啤酒的销售受到时间周期的影响,而谷物、面包和牛奶则保持稳定的销售态势。
表1.3 对信息的分析
货物名称时期1时期2时期3时期4数量价格销售总额啤酒35 75 100 55 265 6.85 1815.25 谷物110 110 100 110 430 3.90 1677.00
面包 200 215 235 200 850 1.59 1351.50 牛奶 200 300 300 300 1100 1.20 1320.00 尿布
10
20
50
120
200
4.99
998.00
信息系统角度的传统划分——知识
4) 知识。
知识不同于数据、信息及分析,它可以来源于数据、信息和分析的任一层次,同时也可以从现有知识中通过一定的逻辑推理而得到。
商业智能应用具有数据挖掘能力,能够从数据中发现隐藏的趋势以及不寻常的模式。
例如,通过对杂货店的数据进行称为规则归纳的数据挖掘,可以得到如下一条结论:买尿布的顾客通常有一半时候也买啤酒。
尿布和啤酒初看起来毫无关联,但是通过数据挖掘得到了这种隐含的模式,这就是知识。
(3) 智慧。
智慧可以说是基于知识基础上的一种判断、谋略或行动。
(专家与大家有何不同)
通过对杂货店数据的挖掘分析,得到了一种隐含的顾客购买模式。
通过这个知识,杂货店主就可以对数据集合进行调查分析,从而开发一系列的销售模式(见表1.4)。
在时期1、2、3,啤酒的销售除了遵循顾客购买模式——买尿布的顾客通常有一半时候也买啤酒——的销售量外,还有额外销售,但在时期4却没有额外销售。
这样可以通过分析时期4相对于时期3的啤酒销售情况,制定特定的销售策略来提高时期4的啤酒销售量,同时也通过分析时期2的尿布和啤酒的购买情况,以发现是什么导致了额外啤酒销售的产生。
识别购买模式
表1.4 识别购买模式
通过利用知识,对于数据的更高层次的理解就被创造出来了,形成了一种智慧并
货物名称 时期1
时期2
时期3
时期4
总数量
啤酒 35 75 100 55 265 尿布 10 20 50 120 200 啤酒的关联购买数
5
15
25
55
100
转化为了价值。
二.知识什么是知识?作为比数据,信息更高阶层的知识有哪些特点,在对此进行分析之前我们看一看理论界都有哪些经典的定义:
1.知识是让从定量到定性的过程得以实现的、抽象的、逻辑的东西。
2.“知识”是一种流动性质的综合体:其中包括结构化的经验、价值、以及经过文字化的信息。
3.国际经济合作组织组编的《知识经济》(knowledge based economy,1996)中对知识的界定,采用了西方20世纪60年代以来一直流行的说法——知识就是知道了什么(Know-what )、知道为什么(Know-why )、知道怎么做(Know-how )、知道谁(Know-who )。
这样的界定可以概括为“知识是4个W ”。
4.Harris(1996)将知识定义为:知识是信息、文化脉络以及经验的组合 知识之所以在数据与信息之上,是因为它更接近行动,它与决策相关。
我们认为这些知识的经典定义都有其价值和意义,信息虽给出了数据中一些有一定意义的东西,但它往往会在时间效用失效后价值开始衰减,只有通过人们的参与对信息进行归纳,演绎,比较等手段进行挖掘,使其有价值的部分沉淀下来,并于已存在的人类知识体系相结合,这部分有价值的信息就转变成知识。
四。
智慧。
智慧是知识层次中的最高一级。
它同时也是人类区别于其他生物的重要特征。
1.定义智慧时,英国科学家图灵做出了贡献,如果一台机器能够通过称之为图灵实验的实验,那它就是智慧的,图灵实验的本质就是让人在不看外型的情况下不能区别是机器的行为还是人的行为时,这个机器就是智慧的。
2.智慧(Wisdom ) -知识的选择(Selection )应对的行动方案可能有多种,但(战略)选择哪个靠智慧。
行动则又会产生新的智慧。
3.Arthur Anderson 管理顾问公司认为智慧乃以知识为根基,加上个人的运用能力、综合判断、创造力及实践能力来创造价值。
数 据
(语 法)
知识
(效 用)
信息
(语 义)
智慧
(创 造)
2.数据、信息、知识与智慧的含义
数据、信息、知识到智慧是人类认识客观事物过程中不同阶段的产物。
从数据到信息到知识再到智慧,是一个从低级到高级的认识过程,层次越高,外延、深度、含义、概念化和价值不断增加。
在数据、信息、知识智慧中,低层次是高层次的基础和前提,没有低层次就不可能有高层次,数据是信息的源泉,信息是知识的子集,知识是智慧的基础和条件。
同时,前者是后者的基础和前提,而后者对前者的获取具有一定的影响。
参考文献
[1] 荆宁宁.程俊瑜数据、信息、知识与智慧,情报科学 2005年12月第23卷第12期;
[2] 国际经济合作组织组编的《知识经济》(knowledge based economy,1996)中对知识的界定
[3] 惠普信息管理实施部门的高级主管乔纳森·吴(Jonathan Wu) 热门技术的安全命门之:BI和SaaS
[4] 徐剑红现代教育学第六讲深入理解学习过程 ppt。