数据密集型科学发现及其哲学问题_黄欣荣
- 格式:pdf
- 大小:666.49 KB
- 文档页数:7
论科学技术学的研究纲领
黄欣荣
【期刊名称】《科学学与科学技术管理》
【年(卷),期】2005(26)12
【摘要】科学技术学是以科学技术系统整体为对象、以认识科学技术的性质和规
律为目的,并采用人文社会科学的视角和方法,从哲学、基础科学、应用科学和应用
技术四个层面对科学技术进行全面的人文社会科学维度研究的一个新学科群。
这些研究构成了内容丰富、结构完整的学科体系。
走向科学技术学,要尽量继承和发展
自然辩证法、科学技术与社会研究、科学学和技术学等现有学科的成果,并尽快实
现组织化和建制化。
【总页数】4页(P50-53)
【关键词】科学技术学;研究纲领;科学技术
【作者】黄欣荣
【作者单位】江西财经大学人文学院
【正文语种】中文
【中图分类】G304
【相关文献】
1.从文献计量学、科学计量学到科学技术计量学--关于科学技术计量学的概念及其研究内容 [J], 罗式胜
2.试论术语学的建构是一种“科学研究纲领”的思想--兼评“交流(交际)术语学”
在术语学发展中的作用 [J], 邱碧华
3.一种自然科学现象学如何可能?:基于先验现象学对自然化的现象学的研究纲领的改造 [J], 张昌盛
4.浅析西方术语学发展历程——介绍“术语学是一种‘科学研究纲领’”的思想[J], 邱碧华
5.从强纲领到社会学有限主义——爱丁堡学派研究纲领的转变述评 [J], 胡杨因版权原因,仅展示原文概要,查看原文内容请购买。
元宇宙的哲学探索——从信息社会到宇宙大脑
黄欣荣
【期刊名称】《理论探索》
【年(卷),期】2022()2
【摘要】元宇宙的提出迅速掀起了一场热潮,它不完全是一场商业炒作,也不完全是新瓶装旧酒,而是一系列信息新技术的综合统一。
元宇宙将20世纪中叶以来各种信息技术对信息社会的盲人摸象式局部描述进行了系统的综合集成,刻画了信息社会的统一生态图景。
元宇宙试图用数据语言建构一个自然实在宇宙的数据投影,生成一个新的数据虚拟宇宙,在超越自然宇宙之“身”基础上建构一个宇宙之“心”。
在元宇宙时代,人类将成为新“造物主”,用数据创造一个全新的虚拟世界,并在这个数字虚拟世界中自由发挥人类的创造力。
【总页数】7页(P5-11)
【作者】黄欣荣
【作者单位】江西财经大学马克思主义学院
【正文语种】中文
【中图分类】N02
【相关文献】
1.从吠檀多哲学的“摩耶说”来看宇宙的意义--以维韦卡南达哲学的宇宙论为例
2."整个宇宙"或者"一个宇宙"可以是无限的吗?——析一个存在于哲学界的关于宇
宙观的逻辑矛盾3.宇宙的哲学与哲学的宇宙4.多宇宙与平行宇宙\r——论漫威宇宙电影的时间哲学逻辑
因版权原因,仅展示原文概要,查看原文内容请购买。
《数据科学思维与大数据智能分析技术》课程思政元素第一章数据科学时代第一节引言一、授课内容进入21世纪,随着云计算、物联网、大数据、人工智能蓬勃发展,引发了一场关于“数据密集型科学发现”(data-intensive scientific )的新的科学范式的思考与辩论,即所谓“第四科学范式”(fourth science paradigm)。
已逝的计算机图灵奖获得者、著名数据库专家Jim Gray 博士,于2007年在加州山景城召开的NRC-CSTB(National Research Council-Computer Science and Telecommunications Board)大会上所做演讲中提出,把数据密集型科学从第三范式(计算科学)中单独区分开来,进而作为一种新的科研范式,源于该研究方式不同于基于数学模型的传统研究方式,这就是数据科学第四范式。
自此,确立了科学研究上,先后历经了实验、理论、计算和数据四种科学范式。
二、实施过程(一)思政元素类型:创新思维(二)课堂教学方法:1.教学手段:采用PPT、案例分析法等形式。
2.课程思政融入点:知识点中的第四科学范式出现与批判性思维相契合,从而引申出思政案例。
三、思政元素内容数据科学第四范式的诞生,体现创新与批判性思维(一)元素内容批判性思维(Critical thinking)是指通过信息和批判来进行合理判断的能力。
批判(Critique)应该是有根据的(well-grounded)、有充分理由的(well-reasoned)、有充分判断的(well-judged)、以及基于对信息的详细分析、评估和评价的。
批判性思维可能涉及许多批判性思维特质和技能,可能包括问题理解和解决方案的深度,问题范围和解决方案的广度,对于问题求解途径的直觉或者洞见,对于“假设”的情景分析和对结果富有想象力的思考,引入新观点和创造更好的设计方案的创造力,对于各种可能性和替代性的好奇心,获取思路、选项和行为时的灵活性,对于不同的想法、新的机会和灵感的开明性,对可能的后果和替代方面进行推理,对于假设和经验性总结的正当性进行验证,为辩论提供合理的论据,寻求真理的过程与结果的一致性,以及为达成更好和更深刻的理解而进行反思、自我评估和自我改进。
大数据技术的伦理反思
黄欣荣
【期刊名称】《新疆师范大学学报(哲学社会科学版)》
【年(卷),期】2015(036)003
【摘要】大数据正向我们扑面而来,我们正快速进入大数据时代.大数据要求实现数据的自由、开放和共享,我们的时代也因此被称为“共享时代”,但因此我们也时刻暴露在“第三只眼”的监视之下,由此带来了个人隐私保护的隐忧,产生了大数据时代人类的自由与责任问题并对传统伦理观带来了新挑战.
【总页数】8页(P46-53)
【作者】黄欣荣
【作者单位】江西财经大学管理哲学研究中心,江西南昌330013
【正文语种】中文
【中图分类】B82
【相关文献】
1.大数据技术在高校教学中的应用——评《大数据技术原理与应用》(第2版)
2.大数据技术在高校教学中的应用——评《大数据技术原理与应用》(第2版)
3.大数据技术的"隐私"与"知悉"伦理反思
4.网络直播视角下的网络伦理反思与建构
5.符号幻象的伦理反思
因版权原因,仅展示原文概要,查看原文内容请购买。
大数据时代的思维变革黄欣荣(江西财经大学管理哲学研究中心,南昌330013)摘要:大数据正向我们扑面而来,世界正急速地被推入大数据时代。
随着大数据时代的来临,人类的思维方式也将产生巨大的改变,因此我们必须从以往的小数据思维迅速转换成大数据思维,以适应这场急速的变革。
大数据思维具有整体性、多样性、平等性、开放性、相关性和生长性等特征,从本质上来说它是一种复杂性思维,但它得到了技术的实现,因而影响更加巨大和深远。
关键词:大数据;大数据思维;思维变革;复杂性中图分类号:N03The Thinking Revolution in Big Data EraHuang Xin-rong(Research Cencenter of Management Philosophy,Jiangxi University of Finance and Economics,Nanchang330013,China)Abstract:Big Data rushing toward us,the world is rapidly pushed into the big data era.With the advent of the big data era,the human’s thinking way will be revolution,so we must be quickly converted from small data thinking into big data thinking to accommodate this rapid change.Thinking of big data has the features of integrity, diversity,equality,openness,relevance and growth.Essentially,the big data thinking is a kind of complexity thinking,but it has been achieved in technology,thus its affecting will be greater and far-reaching than the complexity thinking.Keywords:big data;Big Data thinking;thinking revolution;complexity作者简介:黄欣荣(1962—),江西赣州人,哲学博士,江西财经大学管理哲学研究中心主任,马克思主义学院教授,博士生导师,研究方向:复杂性哲学、技术哲学、管理哲学。
复杂性研究的虚拟方法
黄欣荣
【期刊名称】《江南大学学报(人文社会科学版)》
【年(卷),期】2008(007)003
【摘要】虚拟方法是科学研究的一种重要方法.由于复杂性科学的研究对象--复杂系统的高度复杂性,使用传统的实物实验方法难于实现,因此更倚重于虚拟实验的方法,而计算机的出现为这种虚拟实验提供了实现的手段.在复杂性研究中,复杂适应系统、人工生命、涌现等复杂系统的研究都依赖于虚拟方法来进行实验.虚拟实验和虚拟方法已成为一种新的重要实验形式和研究方法.
【总页数】5页(P5-9)
【作者】黄欣荣
【作者单位】江西财经大学,人文学院,江西南昌,330013
【正文语种】中文
【中图分类】N94
【相关文献】
1.虚拟经济波动复杂性研究 [J], 李俊青
2.基于关系数据库的多维数据模型实现方法及复杂性研究 [J], 杜文晟;
3.复杂性研究的社会仿真模拟方法述评与展望 [J], 夏德龙
4.中医证候及辨证施治复杂性研究的思路与方法 [J], 陈启龙;苏式兵
5.分形方法及其意义──系统空间形态与结构复杂性研究的方法 [J], 吴彤
因版权原因,仅展示原文概要,查看原文内容请购买。
数据密集型科学交流研究与发展趋势黄鑫;邓仲华【期刊名称】《数字图书馆论坛》【年(卷),期】2016(000)005【摘要】With the approaching of the data-intensive paradigm for science, the content and mode of scholarly communication is changing. Research on Scholarly Communication Development in the Environment of Data-intensive Paradigm for Science is important to understand the needs of scientists, promote scientific innovation and accelerate the dissemination of scientific payoffs.This paper firstly summarizes the history of scholarly communication based on paper, network and Open Access environment, and then discusses the future of scholarly communication based on the features of the data-intensive paradigm for science.%数据密集型科学研究范式已经来临,科学交流的内容和模式也在发生变化,研究数据密集型科研环境下的科学交流发展可以充分了解科研工作者在科研活动中的新需求,在推动科研创新、加速科研成果传播方面具有重要意义。
在归纳总结传统纸质科学交流、网络科学交流和开放存取科学交流的基础上,结合数据密集型科研范式的特性,提出几点数据密集型科学交流的发展趋势。
光明日报/2014年/12月/3日/第015版理论周刊・学术大数据时代的哲学变革江西财经大学管理哲学研究中心黄欣荣近年来,大数据这个原本陌生的专业词汇迅速进入大众视野,掀起了一场新的数据技术革命。
大数据正在改变我们的生产、生活、教育、思维等诸多领域以及认识、理解世界的方式,作为时代精神精华的哲学,应该及时对这场数据革命做出全面的回应和批判,深入分析大数据对我们的世界观、认识论、方法论、价值观和伦理观将带来的深刻变革。
数据本质与世界观革命。
所谓数据就是有根据的数字编码,它与人类关系十分密切。
早在古埃及,人们就知道用数据来计量财富和记录日常生活。
文艺复兴之后,数据又被用于描述物理现象和自然规律。
不过,在中外哲学史上,数据一般被看作刻画事物关系的参数,很少被看作是世界的本质,唯有古希腊哲学家毕达哥拉斯提出了“数是万物的本原”的思想,将数据提高到本体论高度。
但随着大数据时代的来临,数据从作为事物及其关系的表征走向了主体地位,即数据被赋予了世界本体的意义,成为一个独立的客观数据世界。
继记录日常生活、描述自然科学世界之后,数据被用于刻画人类精神世界,这是数据观的第三次革命。
大数据认为,世界的一切关系皆可用数据来表征,一切活动都会留下数据足迹,万物皆可被数据化,世界就是一个数据化的世界,世界的本质就是数据。
因此,哲学史上的物质、精神的关系变成了物质、精神和数据的关系。
过去只有物质世界才能用数据描述,实现定量分析的目标,而现在,大数据给人类精神、社会行为等主观世界带来了描述工具,从而能够实现人文社会科学的定量研究。
总之,大数据通过“量化一切”而实现世界的数据化,这将彻底改变人类认知和理解世界的方式,带来全新的大数据世界观。
但人类的精神世界能完全被数据化吗?精神世界的数据化是否会降低人的主体地位?这也是我们在大数据时代必须回应的哲学问题。
数据思维与方法论变革。
大数据带来了思维方式的革命,它对传统的机械还原论进行了深入批判,提出了整体、多样、关联、动态、开放、平等的新思维,这些新思维通过智能终端、物联网、云存储、云计算等技术手段将思维理念变为了物理现实。
2015年第3期总第99期江西财经大学学报JOURNAL OF JIANGXI UNIVERSITY OF FINANCE AND ECONOMICSNO.3,2015Serial NO.99———————————————收稿日期:2014-12-17基金项目:国家社会科学基金重点项目“大数据技术革命的哲学问题研究”(14AZX006)作者简介:黄欣荣,江西财经大学教授,博士生导师,哲学博士,主要从事大数据哲学、复杂性哲学、管理哲学研究,联系方式32478179@qq.com。
一、引言思想政治教育既是一门重要的大学政治课程,同时也是大学生管理的一项重要实践活动。
我国高校历来特别重视大学生的思想政治教育,并取得了重要的理论研究成果和卓有成效的教育实践效果(郑永延,2010)。
[1]但是,随着科学技术的发展,思想政治教育的环境、手段和方法论等都将发生重大的变化。
例如,20世纪90年代迅速发展和普及的互联网技术就曾给传统的思想政治教育带来了诸多的挑战和机遇,并引发了思想政治教育方法论的变革(郭莉和黄柯,2012)。
[2]近年来,大数据又像旋风一样迅速刮遍了全世界,我们迅速地进入了大数据时代。
利用大数据技术,以往难于客观化、数据化的人类精神世界也变得像客观物质世界一样可用数据来进行客观描述和认识(周靖祥,2014),[3]这就为我们的大学生思想政治教育研究和实践带来了革命性的技术手段。
在被称为大数据元年的2013年,思想政治教育工作者马上发表了5篇相关论文,初步论述了大数据技术对思想政治教育的意义,例如,梁家峰(2013)的《适应与创新:大数据时代的高校思想政治教育工作》。
[4]2014年相关论文发表则增到26篇,并更加全面地将大数据引入思想政治教育研究和实践中,例如周淑敏(2014)的《浅谈大数据在高校思想政治教育中的运用》,王国军和刘爽(2014)的《大数据时代的大学生思想政治教育研究》等。
[5-6]然而,这些研究主要论述了大数据应用于思想政治教育的意义、可能性以及大数据对思想政治教育工作带来的挑战与机遇,缺乏从思想政治教育方法论的视角和高度对大数据引发的大数据对思想政治教育方法论的变革黄欣荣(江西财经大学马克思主义学院,江西南昌330013)摘要:正在到来的大数据时代给我们的工作、生活和教育等各个方面带来了新的思维方式和认识方法,也给大学生的思想政治教育带来了新的科学方法论。
第13卷第2期2014年3月 江南大学学报(人文社会科学版)Journal of Jiangnan University(Humanities &Social Sciences) Vol.13 No.2Mar. 2014 【哲学政治学】 [收稿日期]2013-11-10[作者简介]黄欣荣(1962-),江西赣州人,哲学博士,教授,博士生导师,主要研究方向为复杂性哲学、技术哲学、管理哲学。
大数据技术对科学方法论的革命黄欣荣(江西财经大学管理哲学研究中心,江西南昌330013)[摘 要]大数据技术的兴起对传统的科学方法论带来了挑战和革命。
大数据方法论走向分析的整体性,实现了还原论与整体论的融贯;承认复杂的多样性,地方性知识获得了科学地位;突出事物的关联性,非线性问题有了解决捷径,由此复杂性科学提出的科学方法论原则通过大数据得到了技术的实现,从而给科学方法论带来了真正的革命。
[关键词]大数据技术;科学方法论;整体性;多样性;关联性[中图分类号]NO3;N941[文献标识码]A[文章编号]1671-6973(2014)02-0028-06 大数据,这个原本属于专业人员的词汇,近年来走进了大众的视野,对我们的工作、生活和思维产生了巨大的影响。
[1]大数据技术不但掀起了一场新技术革命,让我们的时代迅速进入信息时代,而且对传统的科学方法论带来了巨大的挑战,给我们带来了许多新的科学方法和技术手段,因此我们有必要从科学方法论的角度反思这场新技术革命的意义和影响。
一、大数据技术的兴起2013年被称为中国大数据时代的元年。
从这一年开始,大数据(Big data)这个词铺天盖地出现在各种媒体;有关大数据的图书迅速出版且发行量巨大,而大数据的富豪们,如百度的李彦宏、腾讯的马化腾、阿里的马云等,更是成了家喻户晓的神话般的数字财富人物。
如今,大数据彻底地改变了我们的工作和生活方式。
对一般老百姓来说,大数据的最大影响莫过于网购。
从确定到模糊--科学划界的历史嬗变
黄欣荣
【期刊名称】《科学·经济·社会》
【年(卷),期】2003(021)004
【摘要】科学划界问题是西方科学哲学的中心问题,各派对这个问题都有所涉及和回答,然而答案却各不相同,而且从逻辑实证主义、批判理性主义的单一确定的绝对标准经历史主义的相对标准,到无政府主义和后现代哲学的消解标准,划界标准越来越模糊,信心也越来越动摇.
【总页数】5页(P58-62)
【作者】黄欣荣
【作者单位】清华大学,科学技术与社会研究中心,北京,100084
【正文语种】中文
【中图分类】N031
【相关文献】
1.基于模糊相似测量和模糊映射改进的模糊支持向量机对不确定性信息处理 [J], 王宇凡;梁工谦;杨静
2.高阶模糊性现象的一种证实主义刻画\r——论确定性算子在模糊性研究中的角色[J], 王海若
3.众包能力对新产品开发模糊前端绩效的影响——模糊前端不确定性的中介作用[J], 裴旭东; 王伯英; 黄聿舟; 李娜
4.科学划界:从清晰到模糊 [J], 艾志强
5.基于消除不确定性的模糊聚类方法的模糊神经网络 [J], 王萌;肖创柏
因版权原因,仅展示原文概要,查看原文内容请购买。
收稿日期:2015-10-09基金项目:国家社会科学基金重点课题(2014A Z X 006)作者简介:黄欣荣(1962-),男,江西赣州人,教授,博士,博士生导师,主要从事大数据哲学㊁复杂性哲学研究㊂第30卷第6期2015年11月长沙理工大学学报(社会科学版)J O U R N A LO FC H A N G S HA U N I V E R S I T Y O FS C I E N C E &T E C H N O L O G Y (S O C I A LS C I E N C E )V o l .30N o .6N o v.2015大数据的语义㊁特征与本质黄欣荣(江西财经大学管理哲学研究中心,江西南昌㊀330013)[摘要]大数据是一个热门词汇,但大数据究竟是什么?目前学术界和产业界都比较模糊㊂从混乱的语义中做出语义分析,并从基本特征㊁哲学本质中进一步揭示大数据的涵义,这些工作对大数据技术的发展以及大众对大数据的理解都具有重要的意义㊂[关键词]大数据;语义;特征;本质[中图分类号]N 031㊀㊀[文献标识码]A㊀㊀[文章编号]1672-934X (2015)06-0005-07D O I :10.16573/j.c n k i .1672-934x .2015.06.001T h e S e m a n t i c s ,F e a t u r e a n dE s s e n c e o fB i g Da t a HU A N G X i n -r o n g(M a n a g e m e n tP h i l o s o p h y R e s e a r c hC e n t e r ,J i a n g x iU n i v e r s i t y o f Fi n a n c e a n dE c o n o m i c s ,N a n c h a n g ,J i a n gx i 330013,C h i n a )A b s t r a c t :B i g d a t a i s a h e a t e d l y d i s c u s s e dw o r d a t p r e s e n t ,b u tw h a t t h e h e l l i s b i g d a t a ?T h e a n s w e r t o i t i s r e l a t i v e l yv a g u e i na c a d e m i c c i r c l e a sw e l l a s i n i n d u s t r y .S e m a n t i c a n a l y s i sv i a c o n f u s e ds e m a n t i c s a n d t h e f u r t h e r r e v e a l i n g in s e m a n t i c s o f b i g d a t a f r o mb a s i c f e a t u r e a n d p h i l o s o p h i c a l e s s e n c eh a v e i m p o r t a n t s i g n i f i c a n c e f o r t h ed e v e l o p m e n t o f b i g d a t a t e c h n o l o g y a n d p u b l i cu n d e r s t a n d i n g on i t .K e y wo r d s :b i g d a t a ;s e m a n t i c s ;f e a t u r e ;e s s e n c e ㊀㊀随着大数据时代的来临,(B i g D a t a )这个词近年来成了关注度极高和使用极频繁的一个热词㊂然而,与这种热度不太对称的是,大众只是跟随使用,对大数据究竟是什么并没有真正的了解㊂学术界对大数据的涵义也莫衷一是,很难有一个规范的定义㊂虽然说大数据时代刚刚来临,对大数据的涵义有着不同的理解完全是正常的,但对哲学工作者来说,我们还是有必要对其做一个比较系统的比较和梳理,以便大众更好地把握大数据的内涵和本质㊂㊀㊀一㊁大数据的语义分析早在1980年,著名未来学家阿尔文㊃托夫勒在其‘第三次浪潮“一书中就描绘过未来信息社会的前景并强调了数据在信息社会中的作用㊂随着信息技术特别是智能信息采集技术㊁互联网技术的迅速发展,各类数据都呈现出急剧爆发之势,计算机界因此提出了 海量数据 的概念,并突出了数据挖掘的概念和技术,以便从海量的数据中挖掘出需要的数据成了一种专5网络出版时间:2015-11-24 15:04:12网络出版地址:/kcms/detail/43.1447.C.20151124.1504.001.html门的技术和学科,为大数据的提出和发展做好了技术的准备㊂2008年9月,‘自然“杂志推出了 大数据 特刊,并在封面中特别突出了 大数据专题 ㊂2009年开始,在互联网领域, 大数据 一词已经成了一个热门的词汇㊂不过,这个时候的 大数据 概念与现在的 大数据 概念,虽然名字相同,但内涵和本质有着巨大的差别,而且主要局限于计算机行业㊂2011年6月,美国著名的麦肯锡咨询公司发表了一份‘大数据:下一个创新㊁竞争和生产力的前沿“的研究报告㊂在这份报告中,麦肯锡公司不但重新提出了大数据的概念,而且全面阐述了大数据在未来经济㊁社会发展中的重要意义,并宣告大数据时代的来临㊂由此,大数据一词很快越出学术界而成为社会大众的热门词汇,麦肯锡公司也成为大数据革命的先驱者㊂2012年的美国大选中,奥巴马团队成功运用大数据技术战胜对手,并且还将发展大数据上升为国家战略,以政府之名发布了‘大数据研究与发展计划“,让专业的大数据概念变为家喻户晓的词汇㊂美国的G o o g l e㊁F a c e b o o k㊁A m a z o n以及中国的百度㊁腾讯和阿里巴巴,这些数据时代的造富神话更让大众知晓了大数据所蕴藏的巨大商机和财富,成为世界各国政府和公司追逐的对象㊂2012年2月11日,‘纽约时报“发表了头版文章,宣布大数据时代已经降[1]㊂2012年6月,联合国专门发布了大数据发展战略,这是联合国第一次就某一技术问题发布报告㊂英国学者维克托㊃舍恩伯格的‘大数据时代“一书则对大数据技术及其对工作㊁生活和思维方式进行了全面的普及,因此大数据及其思维模式在全世界得到了迅速的传播[2]㊂从国内来说,涂子沛的‘大数据:正在到来的数据革命“让国人及时了解到国际兴起的大数据热,让我们与国际同行保持了同步[3]㊂大数据究竟是什么意思呢?从字面来说,所谓大数据就是指规模特别巨大的数据集合,因此从本质上来说,它仍然是属于数据库或数据集合,不过是规模变得特别巨大而已,因此麦肯锡公司在上述的咨询报告中将大数据定义为: 大小超出常规的数据库工具获取㊁存储㊁管理和分析能力的数据集㊂ [4]维基百科对大数据这样定义:B i g D a t a i s a n a l l-e n c o m p a s s i n g t e r mf o r a n y c o l l e c t i o n o f d a t a s e t ss ol a r g eo rc o m p l e xt h a t i tb e c o m e s d i f f i c u l t t o p r o c e s su s i n g t r a d i t i o n a ld a t a p r o-c e s s i n g a p p l i c a t i o n s㊂中文维基百科则说: 大数据,或称巨量资料,指的是所涉及的数据量规模巨大到无法通过人工在合理时间内截取㊁管理㊁处理,并整理成为人类所能解读的信息㊂世界著名的美国权威研究机构G a r t n e r对大数据给出了这样的定义: 大数据是需要新处理模式才能具有更强的决策力㊁洞察发现力和流程优化能力的海量㊁高增长率和多样化的信息资源㊂ [5](P6)百度百科则基本引用G a r t n e r对大数据的定义,认为大数据,或称巨量资料,指的是需要新处理模式才能具有更强的决策力㊁洞察发现力和流程优化能力的海量㊁高增长率和多样化的信息资产㊂英国大数据权威维克托则在其‘大数据时代“一书中这样定义: 大数据并非一个确切的概念㊂最初,这个概念是指需要处理的信息量过大,已经超出了一般电脑在数据处理时所能使用的内存量,因此工程师们必须改进处理数据的工具㊂ [6](P8) 大数据是人们获得新认知㊁创造新的价值的源泉;大数据还是改变市场㊁组织机构,以及政府与公民关系的方法㊂ [6](P9)J o h n W i l e y图书公司出版的‘大数据傻瓜书“对大数据概念是这样解释的: 大数据并不是一项单独的技术,而是新㊁旧技术的一种组合,它能够帮助公司获取更可行的洞察力㊂因此,大数据是管理巨大规模独立数据的能力,以便以合适速度㊁在合适的时间范围内完成实时分析和响应㊂ [7]大数据技术引入国内之后,我国学者对大数据的理解也一样五花八门,不过跟国外学者的理解比较类似㊂最早介入并对大数据进行了比较深入研究的三位院士的观点应该具有一定6长沙理工大学学报(社会科学版)㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第30卷的代表性和权威性㊂邬贺铨院士认为: 大数据泛指巨量的数据集,因可从中挖掘出有价值的信息而受到重视㊂ [8]李德毅院士则说: 大数据本身既不是科学,也不是技术,我个人认为,它反映的是网络时代的一种客观存在,各行各业的大数据,规模从T B到P B到E B到Z B,都是以三个数量级的阶梯迅速增长,是用传统工具难以认知的,具有更大挑战的数据㊂ [9]而李国杰院士则引用维基百科定义: 大数据是指无法在一定时间内用常规软件工具对其内容进行抓取㊁管理和处理的数据集合 ,认为 大数据具有数据量大㊁种类多和速度快等特点,涉及互联网㊁经济㊁生物㊁医学㊁天文㊁气象㊁物理等众多领域㊂ [10]我国最早介入大数据普及的学者涂子沛在其‘大数据:正在到来的数据革命“中,将大数据定义为: 大数据是指那些大小已经超出了传统意义上的尺度,一般的软件工具难以捕捉㊁存储㊁管理和分析的数据㊂ [3](P57)由于涂子沛的著作发行量比较大,因此他对大数据的这个界定也具有一定的影响力㊂从国内外学者对大数据的界定来看,虽然目前没有统一的定义,但基本上都从数据规模㊁处理工具㊁利用价值三个方面来进行界定:①大数据属于数据的集合,其规模特别巨大;②用一般具;③大数据具有重大的经济㊁社会价值㊂㊀㊀二、大数据的4V特征我们从大数据的概念中很难把握大数据的属性和本质,因此国内外学者都在大数据概念的基础上继续深入探讨大数据的基本特征,其中最有代表性的是大数据的3V特征或4V特征㊂所谓大数据的3V或4V特征是指大数据所具有的三个或四个以英文字母V打头的基本特征㊂所谓的3V是指V o l u m e(体量)㊁V a r i-e t y(多样)㊁V e l o c i t y(速度),这三个V是比较公认的,基本上没有争议[11]㊂而4V是在3V的基础上再加上一个V,而这个V究竟是什么,目前有比较大的争议㊂有人将V a l u e(价值)作为第四个V,而有人将V e r a c i t y(真实)当作第四个V[5](P16)㊂笔者曾经将V a l u e当作第四个V[12],但现在则认为V e r a c i t y似乎更能代表大数据的第四个基本特征㊂(一)V o l u m e(数据规模巨大)大数据给人印象最深的是数据规模巨大,以前也被称为海量,因此大数据的所有定义中必然会涉及大数据的数据规模,而且特别指出其数据规模巨大,这就是大数据的第一个基本特征:数据规模巨大㊂从古埃及开始,人们就学会了丈量土地㊁记录财产,数据由此产生㊂古埃及㊁巴比伦㊁古希腊都用纸草㊁陶片作为数据记录的工具,数据规模极其有限㊂古代中国也很早就有丈量土地和记录财富的历史,先是用陶片㊁竹片㊁绢布等做记录工具,后来有了纸张㊁印刷术等,各种数据更容易被记录,于是就有了 学富五车 的知识人,以及 汗牛充栋 的图书收藏机构㊂不过古人引以自豪的事情如今看来只是 小儿科 ㊂如今大数据的规模究竟有多大呢?虽然没有一个确切的统计数字,但我们可以举例描述其规模㊂现在一天内在T w i t t e r上发表的微博就达到2亿条,7个T B的容量,50亿个单词量,相当于‘纽约时报“出版60年的单词量㊂阿里巴巴通过其交易平台积累了巨大的数据,截至2014年3月,阿里已经处理的数据就达到100P B,等于104857600个G B的数据量,相当于4万个西雅图中央图书馆,580亿本藏书的数据[8]㊂腾讯Q Q目前拥有8亿用户,4亿移动用户,在数据仓库存储的单机群数量已达到4400台,总存储数据量经压缩处理以后在100P B左右,并且这一数据还在以日新增200T B到300T B,月增加10%的数据量增长,腾讯的数据平台部门正在为1000个P B做准备㊂随着大数据时代的来临,各种数据呈爆炸性增长㊂从人均每月互联网流量的变化就可以窥见一斑㊂1998年网民人均月流量才1M B,到2000年达到10M B,到2008年平均一个网民72015年第6期黄欣荣:大数据的语义㊁特征与本质是1000M B,到2014年是10000M B㊂在芯片发展方面,有一个著名的摩尔定律,说的是每18个月,芯片体积要减小一半,价格降一半,而其性能却要翻一倍㊂在数据的增长速度上,有人也引用摩尔定律,认为大概18个月或2年,世界的数据量就要翻一番㊂2000年,全世界的数据存储总量大约800000P B,而预计到2020年,世界的数据存储量将达到35Z B[11](P5)㊂以前曾有人提出知识爆炸论而备受争议,而如今的数据暴增已是摆在我们面前的现实㊂(二)V a r i e t y(数据类型多样)大数据并不仅仅表现在数据量的暴增及数据总规模的庞大无比,最为关键的是,在大数据时代,数据的性质发生了重大变化㊂在小数据时代,数据的涵义和范围是狭义的㊂所谓数据,其原意是指 数+据 ,即由表示大小㊁多少的数字,加上表示事物性质的属性,即所谓的计量单位㊂狭义的数据指的是用某种测量工具对某事物进行测量的结果,而且一定是以数字和测量单位联合表征㊂但在大数据时代,数据的涵义和属性发生了重大变化,数据的范围几乎无所不包,除了传统的 数+据 之外,似乎能被0和1符号表述,能被计算机处理的都被称为数据[13]㊂也可以说,大数据时代就是信息时代的延续与深入,是信息时代的新阶段㊂在大数据时代,数据与信息基本上是同义词可以用数据表述,任何数据都是信息㊂这样数据的范围得到了巨大的扩展,即从狭义的数字扩展到广义的信息㊂传统的数据属于具有结构的关系型数据,也就是说数据与数据之间具有某种相关关系,数据之间形成某种结构,因此被称为结构型数据㊂例如,我们的身份证都是按照19位的结构模式进行采集和填写数据,手机号码都是11位的数据结构,而人口普查㊁工业普查或社会调查等数据采集都是事先设计好固定项目的调查表格,按照固定结构填写,否则因无法做出数据处理而被归入无效数据㊂在大数据时代,除了这种具有预定结构的关系数据之外,更多的是属于半结构和无结构数据㊂所谓半结构就是有些数据有固定结构,有些数据没有固定结构,而无结构数据则没有任何的固定结构㊂结构数据是有限的,而半结构和无结构数据却几乎是无限的㊂例如,文档资料㊁网络日志㊁音频㊁视频㊁图片㊁地理位置㊁社交网络数据㊁网络搜索点击记录㊁各种购物记录等等,一切信息都被纳入数据的范围而带来了大数据的数据类型多样的特征,也因此带来了所谓的海量数据规模㊂(三)V e l o c i t y(数据快捷高效)大数据的第三个特征是数据的快捷性,指的是数据采集㊁存储㊁处理和传输速度快㊁时效高㊂小数据时代的数据主要是依靠人工采集而来,例如天文观测数据㊁科学实验数据㊁抽样调查数据以及日常测量数据等㊂这些数据因为依靠人工测量,所以测量速度㊁频次和数据量都受到一定的限制㊂此外,这些数据的处理往往也是费钱费力的事情,比如人口普查数据,因为涉及面广,数据量大,每个国家往往只能10年做一次人口普查,而且每次人口普查数据要经过诸多部门和人员多年的统计㊁处理才能得到所需的数据㊂人口普查数据公布之时,人口情况早已发生了巨大的变化㊂在大数据时代,数据的采集㊁存储㊁处理和传输等各个环节都实现了智能化㊁网络化㊂由于智能芯片的广泛应用,数据的采集实现了完全智能化和自动化,数据的来源从人工采集走向了自动生成㊂例如上网自动产生的各种浏览记录,社交软件产生的各种聊天㊁视频等记录,摄像头自动记录的各种影像,商品交易平台产生的交易记录,天文望远镜的自动观测记录等等㊂由于数据采集设备的智能化和自动化,自然界和人类社会的各种现象㊁思想和行为都被全程记录下来,因此形成了所谓的 全数据模式 ,这也是大数据形成的重要原因㊂此外,数据的存储实现了云存储,数据的处理实现了云计算,数据的传输实现了网络化㊂因此,所有数据都从原来的静态数据变为动态数据,从离线数据变为在线数据,通过快速的数据采集㊁传输8长沙理工大学学报(社会科学版)㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第30卷和计算,系统可以做出快速反馈和及时响应,从而达到即时性㊂(四)V e r a c i t y(数据客观真实)大数据的第四个特征是数据的真实性[5](P16)㊂数据是事物及其状态的记录,但这种记录也因是否真实记录事物及其状态而产生了数据真实性问题㊂由于小数据时代的数据都是人工观察㊁实验或调查而来的数据,人的主观性难免被渗透到数据之中,这就是科学哲学中著名的 观察渗透理论 ㊂我们在观察㊁实验或问卷调查的时候,首先就要设置我们采集数据的目的,然后根据目的设计我们的观察㊁实验手段,或者设计我们的问卷以及选择调查的对象,这些环节中都强烈渗透着我们的主观意志㊂也就是说,小数据时代,我们先有目的,后有数据,因此,这些数据难免被数据采集者污染,很难保持其客观真实性㊂但在大数据时代,除了人是智能设备的设计和制造者之外,我们人类并没有全程参与到数据的采集过程中,所有的数据都是由智能终端自动采集㊁记录下来的㊂这些数据在采集㊁记录之时,我们并不知道这些数据能用于什么目的㊂采集㊁记录数据只是智能终端的一种基本功能,是顺便采集㊁记录下来的,并没有什么目的㊂有时候甚至认为这些数据属于数据垃圾或数据尘埃,先记录下来,究竟有什用,以后再说㊂也就是说,在大数据时代,我们是先有数据,后有目的㊂这样,由于数据采集㊁记录过程中没有了数据采集者的主观意图,这些数据就没有被主体污染,也就是说,大数据中的原始数据并没有渗透理论,因此确保了其客观真实性,真实反映了事物及其状态㊁行为㊂㊀㊀三、大数据的哲学本质大数据究竟是什么这个问题,仅仅从语义和特征来回答,似乎并没有完全揭示出大数据的本质㊂大数据时代的来临,最重要的是给我们带来了数据观的变革,只有从哲学世界观的视角分析大数据的世界观或数据观,才能真正回答大数据究竟是什么[14]㊂简单说来,大数据作为一场数据革命,除了带来海量数据,并且这些数据具有4V特征之外,更重要的是大数据带来的数据世界观㊂在大数据看来,万物皆数据,万物皆可被数据化,大数据刻画了世界的真实环境,并且带来了信息的完全透明化,我们的世界变成了一个透明的世界㊂(一)在大数据看来,万物皆由数据构成,世界的本质是数据世界究竟是什么?这是哲学家长期关注的重大问题㊂从古希腊哲学家泰勒斯开始,哲学家们就开始探索世界的本原,并从b e g i n n i n g (起源)和e l e m e n t(要素)两个维度进行了回答[15]㊂早期自然哲学家曾经把水㊁火㊁土㊁气㊁原子分别作为本原,而后期的人文哲学家则基本上将人类精神作为本原㊂马克思主义哲学正是从b e g i n n i n g的维度将历史上的所有哲学分为唯物主义和唯心主义,在这一维度,物质和精神是对立的,只能二者选一㊂从e l e m e n t的维度看,物质和精神都是构成世界的要素,而且以往的哲学家和科学家基本都认为也只有这两者才是构成世界的终极要素㊂但刚刚兴起的大数据则认为,除了以往认为的物质和精神之外,数据是构成世界的终极要素之一,即构成世界的三大终极要素是物质㊁精神和数据㊂英国大数据权威维克托㊃舍恩伯格甚至认为,世界万物皆由数据构成,数据是世界的本质[6](P125)㊂万物皆数据,数据是世界的本质,世界上的一切,无论是物质还是意识,最终都可以表述为数据,这样数据就成了物质㊁意识的表征,甚至将物质和意识关联统一起来㊂古希腊哲学家毕达哥拉斯从音乐与数字㊁几何图形与数字的关系中发现了数据的重要性,提出了 数是万物本原 的思想,强调了数据对世界构成的意义以及对世界认知的影响㊂无独有偶,老子在数千年前就认识到数据的世界终极本质,在‘周易“中就提出了 道生一,一生二,二生三,三生万物 的思想,把世界的生成与数据联系起来㊂特别是在‘易传“中的阴阳八卦图中,从阴阳两极相92015年第6期黄欣荣:大数据的语义㊁特征与本质反相成,从阴阳两仪,到八卦㊁六十四卦象等,由此不断演化,最后生成整个世界㊂两千多年以前的毕达哥拉斯和‘周易“都不约而同地揭示了数据与万物的关系,以及世界的数据本质,充分强调了数据在世界构成中的重要地位㊂但是,在随后的两千多年的历史长河中,数据在人类生活和科学认知中虽然越来越重要,而且也有莱布尼兹㊁康德㊁马克思等哲学家关注过数据的重要性,不过总体来说,哲学家们对数据基本上是忽视的㊂随着大数据时代的来临,数据才获得到了应有的地位,哲学家们才又想起毕达哥拉斯和‘周易“的数据世界观㊂可以说,大数据时代的来临是毕达哥拉斯和‘周易“所提出的数据世界观的当代回响㊂(二)在大数据看来,世界万物皆可被数据化,大数据可实现量化一切的目标数据是对世界的精确测度和量化,是认知世界的科学工具㊂自从发明了数字和测量工具,人类就不断地试图对世界的一切进行数据测量㊁精确记录㊂古埃及时期,由于尼罗河泛滥,人们每年需要重新丈量土地,于是发现了数据的秘密,并发明了测量技术㊂于是,数据成了测量㊁记录财富的工具,人们日常生活所接触的大量物品㊁财产都可以用数据来表征,这个时期的数据可被称为 财富数据 ㊂文艺复兴之后,人们逐渐发明了望远镜㊁显微镜㊁量器具㊂随着测量技术的进步,测量与数据被广泛应用于科学研究之中㊂例如天文学家第谷对天文现象进行了大量的观察记录,并积累了大量的天文数据㊂随后,力学㊁化学㊁电磁学㊁光学㊁地学㊁生物学等,各门学科都通过测量走上了数据化㊁精确化的道路㊂各门科学积累大量的科学数据,并借助于数据,各种自然现象都实现了可测量㊁可计算的精确化㊁数据化的目标,自然科学各学科也完成了其科学化的历程㊂这个时期可被称为 科学数据 时期㊂由于人类意识的复杂性,人类及其社会的测量和数据化成为量化一切的拦路虎㊂社会科学虽然引进自然科学方法,但其数据的客观性往往招致质疑,而人文学科更是停留在思辨的道路上㊂在传统方法遇到困难的地方,大数据却可以大显身手㊂大数据用海量数据来测量㊁描述复杂的人类思想及其行为,让人类及其社会也彻底被数据化,这些数据可被称为 人文数据 ㊂所以,大数据时代将数据化的脚步向前迈进了一大步,在财富数据化㊁科学数据化的基础上,实现了人文社会行为的数据化㊂因此,从大数据来看,数据是物质的根本属性,世界万物皆可被数据化,其一切状态和行为都可以用数据来表征,量化一切是大数据的终极目标㊂(三)大数据全面刻画了世界的真实状态,科学研究不必再做理想化处理真实㊁全面地认知世界是人类的一种理想,同时也是摆在人类面前的一道难题㊂真实的世界,无论是自然界还是人类社会,都极为复杂,需要极其繁多的参数才能准确㊁全面地对其进行描述㊂但是,由于过去没有先进的数据采集㊁存储和处理技术,于是不得不对复杂的研究对象进行 孤立㊁静止㊁还原 的简单化处理㊂所谓孤立就是把对象与环境的所有联系都切断,让其成为一个孤立的研究对象,免得受外界的侵扰㊂所谓静止,就是将本来运动变化的对象做一时间截面,然后就以这一时点的状态代表所有时点的状态㊂所谓还原是指将复杂的现象逐渐返回到几个简单的要素或原点,然后从要素的性质和状态推演出系统的性质和状态㊂复杂对象经过简单化处理之后,虽然我们能够认识和把握对象的某些性质和状态,但毕竟经过了简单㊁粗暴的理想化处理,它已经不能真正反映真实对象和真实世界㊂大数据技术使用了无处不在的智能终端来自动采集海量的数据,并用智能系统处理㊁存储海量数据,不再需要对研究对象做孤立㊁静止和还原的简单化处理,而是将对象完全置于真实环境之中,有关对象的大数据全面反映了复杂系统各个要素㊁环节㊁时态的真实㊁全面状态㊂这样,在大数据时代,我们可以在真实㊁自然的状态下研究复杂的对象㊂大数据记录了真实环01长沙理工大学学报(社会科学版)㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第30卷。