当前位置:文档之家› 计算社会学

计算社会学

不可重复的自述性数据。新的科学技术,比如视频监控(video surveillance )[1]、电子邮件和“智能”名徽(“smart ” name badges ),可以提供一段时长中的每时每刻的交互图景,这幅图景提供了人们关系间的结构和内容等信息。比如,通过电子邮件的数据来研究群体交互,这样可以解决如下人类通信的时空动态特性问题:这些工作组是达到了一个几乎没有改变的平衡状态,还是在随着时间大幅度变化[2]?什么样的交互模式代表着具有高成效的群组和个人?从我们收到消息和内容的多样性是否能预示我们的能力和表现[3]?面对面的群组互动可以通过“社会计量器”(sociometers )来进行评估。这样的电子设备可以佩戴在身上,用来捕获物理上的接近、位置、移动和其他方面的个体行为和群体互动。这些设备采集回的数据可能会引发一些有趣的问题,比如,一个组织内(成员间)互相接近的模式和通信模式,以及与具有高效表现的个人和群体相联系的流动模式[4]。

我们也能了解到一个社区的“宏观”社会网络看起来是什么样的[5],并且是如何随着时间演化的。电话公司拥有用户多年的通话模式记录,像谷歌和雅虎这样的电子商务门户网站收集全球的即时通讯数据。这些信息是否可以描绘出一幅社会级通信模式的综合图景?这些交互通过怎样的方式影

作者:大卫·拉泽尔 等译者:孟 雷 秦 兵

计算社会科学

*

关键词:计算社会科学

* 2009年2月,以哈佛大学大卫·拉泽尔为首的15位美国知名大学教授联名在美国《科学》(Science)杂志上发表了题为“计算社会科学”的具有里程碑意义的论文,论文宣告:随着人们能够收集和分析大规模的人类行为数

据并从中发现个人和群体行为的模式,一个新的研究领域“计算社会科学”诞生了。本文译自美国《科学》杂志2009年2月第6期文章Computational social science。https://www.doczj.com/doc/7d4157245.html,/cgi/content/full/323/5915/721/DC1

我们生活在网络之中。我们定期查收电子邮件,在各处拨打移动电话,刷卡乘坐公交车,并且使用信用卡购物。我们在公众场所的活动可能被视频摄像机记录,医疗信息可能会存储成电子文件。我们可以发布博客任人浏览,还可以通过社交网络来维持友谊。上述种种活动都留下了数字踪迹。通过这些数字踪迹可以描绘出个人和群体行为的综合图景,这有可能会改变我们对于生活、组织、社会的理解。

收集和处理海量数据的能力已改变了诸如生物学和物理学这样的领域。但是数据驱动的“计算社会科学”(Computational Social Science )的出现却太过缓慢了。在经济学、社会学和政治学的顶级刊物上几乎没有这一领域的论文发表。但是计算社会科学正在显露端倪——它出现在谷歌和雅虎这样的互联网公司中,也出现在美国国家安全局这种政府机构中。计算社会科学可能会变成私人公司和政府机构的专属领域。或许会有另外一种情况,出现占有私有数据的特权学术研究群体,他们使用私有数据发表的论文是无法被批驳和复现的。上述两种情形对于积累、验证和传播知识这些长远的公众利益不会有任何益处。

基于一个开放的学术环境,计算社会科学通过加强对个体和群体的认知会给社会带来哪些益处?是什么阻碍了计算社会科学的出现?

迄今为止,对人类相互影响的研究主要靠那些

响着经济生产力和公众健康?跟踪人们的行动也变得越来越简单[6]。移动电话使我们有可能在大范围内跟踪人在一段时间内的移动和物理邻近[7]。这样的数据可以揭示流行病传播的内在机理:一些病原体,比如流感病毒,是如何由物理接近推动而在人群中传播的?

互联网提供了一个完全不同的渠道来了解人们在说什么和如何进行联系[8]。比如,在刚刚过去的政治大选,跟踪政治辩论、谣言、政治立场和其他话题在博客中的传播[9],以及个体在互联网上“冲浪”的行为[10],从而可以从他们所进行的搜索中了解选民的关切。虚拟世界在本质上使我们可以捕获个体行为完整记录,可以为研究提供丰富的机会,实现以其他方法无法实现或不被人们接受的实验[11]。相似地,社交网络提供了独一无二的机会去了解一个人在网络中的地位对其方方面面的影响,从他们

的品味到他们的情绪再到他们的健康[12],在此自然语言处理则提供了更强的能力来组织和分析来自互联网和其他资源的海量文本[13]。

简而言之,一个计算社会科学正在出现,它充分发挥了(互联网)在前所未有的广度、深度和范围上收集和分析数据的能力。但是,固有的障碍会限制该学科的发展。目前网络环境可以提供万亿字节级别的,能描述每一分钟的交互情况和整个人群个体的位置的数据,但现有的描述人类行为的方法并非在此基础上发展起来的。现有的社会网络理论,大部分都是基于一次性的“快照式”的数据,一般都只包含几十个人,这样的理论对于包含了地点、财务交易和通信信息的百万人大规模纵向数据集又能够告诉我们什么呢?这些海量的,正在出现的关于人们如何进行交互的数据集当然为群体人类行为的研究提供了有价值的新视角,但是我们现有的研究方法可能不适用。

在计算社会科学的发展中还有很大的体制性障碍。从研究方法层面分析,在物理学和生物学里的调查目标在观察和干预过程中带来的挑战不同于社会科学。夸克和细胞既不会介意我们发现它们的秘密,也不会对于我们在研究过程中改变它们的环境发出抗议。在基础设施上,从社会学到计算社会科学的变化幅度要超过从生物学到计算生物学,这在很大程度上是由于需要解决分布式监控、许可权获取和加密等问题。在社会科学领域里可用的资源还比较少,即使社会科学部门到计算机科学或工程部门之间物理上的(还有就是行政上的)距离也比其他科学要大。

或许最棘手的挑战在于数据的访问和隐私。这些社会科学所感兴趣的大部分数据是私有的(比如移动电话和金融交易信息)。在美国在线(A O L)公司泄露其许多用户“匿名”搜索记录之后,随之而来的混乱凸显了在通过私有公司共享个人数据过程中对个人和公司可能带来的潜在风险[14]。为了推动研究同时又保护消费者的隐私,为公司提供可信赖性的保障,需要建立工业界与学术界合作和数据共享的经得起考验的模式。更一般地讲,妥善地处理隐私问题至关重要。最近美国国家研究理事会(U.S. National Research Council)关于地理信息系统数据的报告强调指出,即使对于采取谨慎匿名处理后的数据依然可以从中抽取出个人资料[15]。去年,美国国家卫生研究院(U.S. National Institutes of Health)和英国惠康基金会(Wellcome Trust)突然将一部分图1 来自博客(blogosphere)空间的数据:上图是一个政治博客群的链接结构(从2004年开始),红色节点代表保守派,蓝色节点代表自由派。橙色链接从自由派博客指向保守派,紫色链接反之。每个博客节点的大小反映了指向该博客的其他博客的数量。复制自文献[8]。

译文

基因数据库从在线访问列表中删除[16]。这些数据看起来是匿名的,只是简单地报告了特定遗传标记的总出现率。但是,研究发现基于从数据库中收集的每个个体得到的完整数据的统计威力,仍有潜在的可能性进行去匿名化(deanonymi z ation )[17]。

一个小小的戏剧性的破坏隐私事件就可能会产生能够将计算社会科学这一新兴研究领域扼杀的规则和法规,因此需要程序、技术和规则组成的一种自律机制来实现既降低风险又保留进行研究的可能性。作为这种自律机制的基石,美国伦理审查委员会委员(U.S. Institutional Review B oards )必须增强他们的技术知识来了解产生侵权和个人伤害的可能性,因为新的危害的产生条件会不同于现存的模式。许多伦理审查委员会成员可能没有能力去评估复杂数据有可能被去匿名化的可能性。再者,伦理

审查委员看来有必要对创建一个安全的、集中式的数据基础设施进行监管。目前,已有的数据集分散于许多群体,这些群体对于数据安全和各种不同的协议的处理能力和理解力参差不齐。研究者本身必须开发出能够保护隐私同时又能保留对研究来说不可或缺的数据的技术。这样的系统,反过来,可能

会对管理用户隐私和数据安全的产业有用[18]

最后,计算社会科学的出现与其他刚刚出现的交叉学科(比如可持续性科学)都需要发展一套培养新学者的机制。终身教职委员会和编辑委员会需要了解和奖励那些发表跨学科文章所做的努力。作为开端,计算社会科学需要的是社会和计算机科学家团队的工作。长远地看,需要考虑学术界是要培养计算社会科学家,还是要培养懂计算机的社会科学家和懂社会学的计算机科学家组成的团队。认知科

CCF@U-52:陕西师范大学

2011年5月13日,“CCF 走进高校” 活动在陕西师范大学举行。北京大学“百人计划”、“教育部机器感知与智能重点实验室”、信息科学技术学院博士生导师袁晓如研究员作了“谈可视化与可视分析研究进展 ”的精彩报告。报告会由计算机科学学院副院长吴振强副教授主持,院长李永明教授出席报告会,学院相关教师及研究生聆听了本次报告会。

袁晓如研究员在报告中介绍可视化的由来及主要应用领域,从如何通过引入信息可视化和人机交互的新手段分析处理复杂科

学数据,构建人与数据沟通的桥梁;介绍了复杂高维时空数据可视分析技术,介绍了可视化分析在大气模拟数据、地震目录数据、交通轨迹数据等领域的应用。还介绍了北京大学在可视化方面的研究成果及国际研究进展情况,可视化领域的主要研究方向,指出了可视化领域的一些科学问题。袁晓如研究员与计算机科学学院师生进行了亲切的沟通和交流,生动、细致地解答了同学们的提问。报告会上,师生提问踊跃,气氛热烈,袁晓如研究员的精彩回答博得了全场的阵阵掌声。

本次“CCF 走进高校”活动提高了研究生对可视化研究领域的认识,对同学们的职业规划发展有很大的启发,为学习与就业起到了帮助作用。 (余)

[1] D. Roy et al., “The Human Speech Project,” Proceedings

of the 28th Annual Conference of Cognitive Science Society, Vancouver, B C, Canada, 26 to 29 July 2009

[2] J. P. Eckmann et al. Proc. Natl. Acad. Sci. U.S.A. 101,

14333 (2004)参考文献

译者 孟 雷

哈尔滨工业大学计算机学院社会计算与信息检索研究中心博士生。

lmeng@https://www.doczj.com/doc/7d4157245.html,

学的出现为计算社会科学的发展提供了一个有力的模式。认知科学所涉及的领域从神经生物学到哲学再到计算机科学,已经吸引了数目可观的资源来投资创立一个共同的领域,并且为过去一代公共物品(public good )1做出了很大的贡献。我们认为计算社会科学也具备同样的潜力,并且值得获得类似的投资。■作者:

大卫·拉泽尔(David Lazer)

哈佛大学(Harvard University, Cambridge, MA, USA.)

阿历克斯·彭特兰(Alex Pentland)

麻省理工学院(Massachusetts Institute of Technology, Cambridge, MA, USA.)

拉达·阿达米克(Lada Adamic)

密歇根大学(University of Michigan, Ann Arbor, MI, USA.)

思南·阿尔(Sinan Aral)

麻省理工学院(Massachusetts Institute of Technology, Cambridge, MA, USA.),纽约州立大学(New York University, New York, NY, USA.)

艾伯特·巴拉巴斯(Albert-László Barabási)

跨学科科学研究中心(Interdisciplinary Scientific Research, Seattle, WA,USA.)

德文·布鲁尔(Devon Brewer)

跨学科科学研究中心(Interdisciplinary Scientific Research, Seattle, WA,USA.)

尼古拉斯·克里斯塔(Nicholas Charistakis)

哈佛大学(Harvard University, Cambridge, MA, USA.)

诺士·康卓科特(Noshir Contractor)

美国西北大学(Northwestern University, Evanston, IL, USA.)

詹姆斯·福勒(James Fowler)

加州大学圣地亚哥分校(University of California¨CSan Diego, La Jolla, CA, USA)

1

公共管理科学的一个术语,亦可译成“公共品”。指公共使用或消费的物品和服务,其特征是非竞争性和非排他性。

译者 秦 兵

CCF高级会员。哈尔滨工业大学计算机学院社会计算与信息检索研究中心教授。主要研究方向为社会计算、文

本挖掘。 qinb@https://www.doczj.com/doc/7d4157245.html,

迈伦·葛特曼(Myron Gutmann)

密歇根大学(University of Michigan, Ann Arbor, MI, USA.)

托尼·贾巴尔(Tony Jebara)

哥伦比亚大学(Columbia University, New York, NY, USA)

格雷·金(Gary King

哈佛大学(Harvard University, Cambridge, MA, USA.)

迈克尔·梅西(Michael Macy)

康奈尔大学(Cornell University, Ithaca, NY, USA.)

戴博·罗伊(Deb Roy)

麻省理工学院(Massachusetts Institute of Technology, Cambridge, MA, USA.)

马歇尔·冯·阿尔斯泰恩(Marshall Van Alstyne)

麻省理工学院(Massachusetts Institute of Technology, Cambridge, MA, USA.),波士顿大学(Boston Univer-sity, Boston, MA, USA.)

更多参考文献:https://www.doczj.com/doc/7d4157245.html,/cccf

封面报道

引言

各种迹象表明,继物理计算和生物计算之后,社会计算可能成为科学计算研发的新焦点,形成新的方向和领域。造成这一趋势的最大和根本性原因就是互联网的出现及其不断深入和普及。每时每刻,世界各地数亿人口游历于网上,工作生活于真实的“虚”空间里,这一事实本身就是人类发展历史上的一个奇迹。而且,按照互联网研发先驱者的思路,这一奇迹也是一场规模空前的“社会计算”。虽然目前还很难预测互联网对人类生活的最终影响是什么,但我们可以肯定这将在人们之间建立一种新型的“远程”社会关系,从面对面的传统交流到数字操纵的网络交往,必将深刻地修改我们已有的社会模式。而且,随着基于网络行为的不断演化和发展,其隐含的后果将是深远的,必将深刻影响未来人们的交往方式和相互关系以及社会的组织形式和活动机制。

尽管无法确切地知道未来的网络社会形态会是怎样,但很明显,网上社会团体的组织及其影响的形成已变得非常容易,而且其动态变化更快更难以预测,其组织形式更广泛更深不可测。正是由于这一背景,使得社会计算成为信息工作者所不得不面对的一个新的重要领域。正如今天离不开物理计算,因为目前我们所涉及的物质的质量、速度和尺度都远远超出了人类常识所能处理的范围;我们离不开生物计算;因为目前生物研究已不是简单的统计计王飞跃

中国科学院自动化研究所

社会计算的意义及其展望

算能够完成的。网络的出现,加上现代交通工

具和管理知识水平的不断提高,使得单凭经验

与直觉已无法管理复杂动态的现代化网络社

会,从而使社会计算成为社会管理与发展所必

须面对且必不可少的科学工具。

例如,网络化社会下的社会安全就是一个

越来越突出的问题。不但普通人在生活工作中

利用网络,恐怖和犯罪组织也在利用。正如原

子弹的出现改变了现代战争的概念,互联网的

建立,也将深刻地改变我们关于社会治安的传

统概念。原子弹的威力在于其残酷程度极高,

杀伤范围极广,完成破坏时间极短,机动能力

极强;同原子弹类似,通过网络发送危害社会

的信息也具有成本代价极低,影响范围极广,

完成时间极短,机动能力极强的特征。目前已

发生的网络现象,从计算机病毒的传播,到普

通人通过在网上的怪异行为而一夜成为“名

人”,都说明了我们必须正视网络社会的态势

及其影响。目前,这些网络现象还可以被看成

是社会的“良性”肿瘤,但我们必须利用人文

社会知识,深入进行关于数字网络化社会状态

及其动态趋势的研究,为对付将来网络上可

能出现的危害性更大更广的“恶性”社会肿瘤

作好准备。有些学者甚至认为,原子弹和网络

的出现,将使战争和灾难从传统的物质杀人,

变为能量杀人,进而演化为信息杀人。显然,

社会计算正是解决此类重大问题的关键技术之

一。

可以设想,随着数字政府和数字社会进程

的不断深入,未来每一个人自落生之时,除了关键词:社会计算 人工世界

1

万尼瓦尔·布什(Vannevar Bush),1890-1974年,在计算机领域有许多前瞻性的贡献。

2

约瑟夫·卡尔·罗奈特·里克利德(Joseph Carl Robnett Licklider),1915-1990年,发表了著名的计算机研究论文《人机共生关系》,从而提出了分时操作系统的构想,并第一次实现了计算机网络的设想。3

道格拉斯·恩格尔巴特(Douglas Englebart),鼠标的发明者。4

曼哈顿计划(Manhattan Project)是1942年第二次世界大战期间美国陆军部开发核武器项目的代号。5

Advanced Research Projects Agency 6

Defense Advanced Research Projects Agency 7

ARPANET网,互联网的前身,是第一代计算机网络,始于美国国防部的科研项目。

其物理本体之外,可能还会有与之对应的“数字”映像,分别存在于现实社会和“虚拟”社会(Cyberspace)之中,相互动态对应和作用。我国游历于网络空间的人数已达上亿,从一个方面为这一假想提供了佐证。如何利用这一数字化的“虚拟”社会,如何在其中植入真正人类的人文价值,如何实现“虚拟”与真实社会之间的有益有效互动,为人类社会和自然生态的发展提供科学和人性的新方法和新手段,将是社会计算研究的一个重要课题和长久方向。

社会计算:互联网的原始动机和必然结果

我们认为,实现社会计算的功能是产生互联网的最初动机,而形成社会计算的学科将是网络普及的必然结果。为了说明这一观点,我们不妨回顾一下互联网先驱们当时的发展思路。

布什(Bush)1、里克利德(Licklider)2

和恩格尔巴特(Englebart)3是公认的互联网的主要先驱者,其中布什和里克利德还被认为是催生互联网的第一和第二号人物。尽管这三位学者都没有亲自参与现代互联网的创立和万维网的发展,特别是布什,更是早在互联网出现之前就已去世,但他们的思想和远见是后来许多互联网和万维网技术发明的源泉,而且目前的技术只是实现他们想法的开端而已,还有许多更有意义的设想目前并没有实现。对本文而

言,更重要的是他们的人文思想和与社会计算相关的远见。

布什尽管没有赢得与其成就相当的名声,但他的确是现代科学史上一位传奇性的人物。二战之前,布什作为美国麻省理工学院(MIT)的一名研究人员负责模拟计算机的研制;二战时,他是卡内基梅隆大学(C M U)的前身卡内基学院的院长,美国参战之后,他写信向罗斯福总统建议将科学家组织起来参加战时的军事研究,并成为国家国防研究委员会和后来的科学研究和发展局的负责人,协调指挥六千多名科学家从事军事研发,其中最著名的项目就是曼哈顿计划4。布什当时被美国公众认为是“决定胜败的人”和由政府支持大规模科研机制的始作俑者;二战末期,布什提交了一份给美国总统的著名报告《科学:无边的新领域(Science:The Endless Frontier)》,建议了后来成立的国家科学基金会(NSF)和国防部先进研究项目署(ARPA 5,也就是目前的DARPA 6,直接组织了互联网的前身阿帕网

7

的实施),并在美国的登月计划和星球大战

(Strategic Defense Initiative,SDI )的实施中起了关键性的作用。布什还是高科技产业化的先驱,在为波士顿著名的128号公路(Route 128)高科技走廊奠定基础的同时,通过他的研究生泰尔曼(Terman)帮助创立了今日举世闻名的加州硅谷。而且,他自己也是美国“爱国者”导弹的制造商雷神公司的共同创始人。

布什的工作为包括阿帕网在内的许多“Big Science”项目创造了条件,这也是许多人把

封面报道

他看成是互联网第一号先驱的重要原因。但布什的直接影响是他于1945年发表的科技散文《随便我们想(As We May Think)》,特别是文中提出的通过关联加强人记忆能力的装置“memex”,被认为是个人计算机的原始模型。实际上,应当说个人计算机至今还是“memex”的初步实现。一批科研工作者把这篇散文作为他们的“圣经”和信息时代的基本教程。正是读了布什的散文,当时驻扎在菲律宾的士兵,鼠标的发明人恩格尔巴特才意识到利用计算机来管理信息而不仅仅是处理数字的无比潜力。后来恩格尔巴特在里克利德的支持下直接参与了阿帕网的实施。此外,超文本(Hypertext)的主要发明人纳尔逊(Nelson)也把他的工作归功于布什散文的启示。个人计算机的出现被看成是“memex”的一种简化,而万维网更被看成是其初级实现方式,时下风行的“博客”更能从他的散文中看到其影子。布什是今天电脑化文明(Cyberculture)真正的先知者,用历史学家雪莱(Sherry)的话说,“想理解比尔·盖茨(Bill Gates)和比尔·克林顿(Bill Clinton)的世界,就要从认识布什开始”。

以上所述,加上今天已经发生在我们眼前的一切,应当足以唤起我们对布什的思想与建议的信心、重视与关注。尽管其散文中的许多想法目前都已在不同的程度上得到了实现,但它所隐含的宏大图景(“Big Picture”),即社会计算或计算的社会化,今天只能说是“初露端倪”,而且还没有被信息工作者所充分认识和重视。虽然布什没有明确地提出“社会计算”一词,但他散文的主要动机和思路都是围绕着三点展开的:(1)个人计算的集成化;(2)群体计算的可能性和重要性;(3)历史性计算的可能性和重要性。把“集成深度计算”、“群体广度计算”和“历史经验计算”合成起来,就是我们所希望的社会计算的实质。

我们提倡社会计算的一个主要动机与目的就是把传统上限于语言层次和静态的知识,不管是书本上还是社会上、解析型还是经验型、历史的还是现实的,都使之数字化、网络化和动态化,并用于各种复杂社会问题的建模、分析和决策支持。通过布什的散文,可以看出这也是布什的主要动机与目的。既然大家都公认他的散文是催生互联网的原始动因,而社会计算的思想是他写作散文的动力,因此我们也可以说社会计算是互联网产生的原始动机。

里克利德和恩格尔巴特的工作,加上今天互联网所带来的现实,更使我们认识社会计算也将是互联网所导致的必然结果。同布什一样,里克利德对互联网的贡献是思想性的。他的专业背景是心理学,但受布什的影响,对计算机产生了极大的兴趣。在不清楚计算机到底能做什么的情况下,里克利德成功地劝说其所在的建筑声学设计公司花巨资购买了2台早期计算机,后来使其成为一家著名的计算机咨询公司,并于1968年赢得ARPA建造ARPANET的合同。1960年,里克利德发表了开创性的工作“人机合作(Man-Computer Symbiosis)”,1962年应邀加入ARPA,主管行为科学和命令与控制两个部门,开始为实施ARPANET铺路。1968年,里克利德和泰勒(Taylor)合作发表了题为“计算机作为交流工具(The Computer as a Communication Device)”的科普性文章,以散文和卡通的形式勾画出了ARPANET和互联网的基本结构、原理、协议和过程。除了这些重大思路之外,里克利德还提出了JAVA式网络软件思想和“未来图书馆”、分时系统以及类似于万维网的“预先认知系统(Procognitive System)”的设想。在他的眼里,计算机及其网络就是“一种可建模的可塑或可铸介质,一种前提可流成结论的动态介质,最重要的,一种大家都可以贡献并试验的公共介质”。显然,里克利德的这些思想,是实现社会计算功能的基础和保障。

里克利德从人与人、人与机、人与物理和精神实体的互动角度隐含地阐明了社会计算的意义和实现途径。恩格尔巴特则进一步发挥,从人的智力扩展的角度作了更为深刻具体的说明。二战之后,恩格尔巴特在伯克利完成了电气工程博士学位并留校任教,后因不愿从事常规的研究项目而转入斯坦福研究所(SRI),开始了他称之为“扩展人类智力”的研究工作。1962年,他完成给A R P A的著名报告《增强人类智慧:一个概念架构(Augmenting Human Intellect: A Conceptual Framework)》。这项极具创新性的工作与社会计算是何种关系,报告的第一段表述得再明白不过了。特别是恩格尔巴特指出:必须在所有计算技术的进展中融入心理和组织发展学,而且,还提出了涉及社会计算核心的“人工物品与社会文化语言活动共同演化”的概念,可谓高瞻远瞩。

从鼠标的发明、第一个超文本系统N L S (oNLine System)的成功开发,到以NLS为基础在里克利德的领导下参与ARPANET的实施、提出国家信息中心的设想;从建立自己的实验室“扩展研究中心”,到实验室被SRI出售辗转至麦道公司并于1989被麦道无理关闭,再到以提高社会的“群体智商”水平为目标创立公益性质的自励研究院(Bootstrape Institute),恩格尔巴特一生都在为实现他理想中的计算模式而努力,并常因其思想“超前其时代20年”而备受一些人的挖苦与讽刺。恩格尔巴特后期的许多工作,如超媒体、多窗口、文件版本控制、计算机辅助会议系统、分布式客户服务器结构、开放超文件系统等,都已成为今天的社会软件的基础,得到广泛的应用,相信这些成果也会是下一步社会计算的基石。

回顾和反思布什、里克利德和恩格尔巴特的工作,他们的思路和远见可以使我们更加全面地理解社会计算与互联网的内在关系,更进一步体会社会计算的意义和作用,更清楚地认识社会计算在未来信息和知识社会中的地位和功能。我们不应忘记恩格尔巴特的女儿曾就他因思想超前于人而受到误解和打击之事所说过的话:“问题是,当他在继续指向未来的时候,人们仍然在考察他过去的成就”。

社会计算的认识与现状

何谓社会计算?目前对此还没有一个认识一致的明确定义。我们认为,可以从两个方面或角度看待社会计算:一个是从计算机或更广义的信息技术在社会活动中的应用——这一角度多限于技术层面而且有较长的历史;另一个是从社会知识,或更具体的人文知识在计算机或信息技术中的使用和嵌入,反过来提高社会活动的效益和水平——这方面的工作刚刚兴起,涉及较深的社会人文理论和内容。

从计算技术到社会活动这一角度出发,社会计算的主要内容就是设计、实施和评估促进人与人之间的交流、协调和合作的各种信息技术。其方式是以人和活动为中心,其主要方法来自多学科的交叉,如心理学、人类学、广告学、工程学等等,其主要手段包括现场观察、采访、实验可用性测试、启发式初排、人物情景假想等等,其目的就是利用先进的信息技术达到高度有效的交流。例如,通过移动计算和普适计算,使每个人能够与一个把所有人都连通到一个社团的巨大信息网保持不断的联系。在此,社会计算主要考虑四类关系:(1)同系统的关系;(2)系统策划的合作关系;(3)同团体的关系;(4)团体中人与人的关系。这方面有关的早期研究工作可参见由舒勒(Schuler)于1994年在CACM8上组织的社会计算专题。当时关注的重点是软件的社会性质、社会作用、社会影响和社会现象。目前如

8 Communications of Association for Computing Machinery,《美国计算机学会通讯》

封面报道

火如荼正值兴旺的博客技术在许多方面体现了社会计算的特征,加上从网络游戏到创意产业的计算文化产业,已引起相关企业的极度关注。以微软为首的大公司目前正集中力量在这一方向进行社会计算的研究,并于2004年起连续举办了“社会计算论坛(Social Computing S y m p o s i u m)”。除微软以外,I B M、英特尔、富士-施乐、惠普、帕洛阿尔托研究中心(PARC9)、三菱、MITRE、美国电报电话公司(AT&T)、诺基亚(Nokia)、美国国家航空航天局(NASA10)和Google等都在从事社会计算的研发工作,许多大学也开始设立社会计算方面的实验室和研究中心。

社会计算的另一种认识是从社会人文到信息技术的角度出发的,即将人文理论嵌入信息系统,反过来促进人类的社会活动。十多年前由东欧社会变革引发了兰德研究人员提出“人工社会”的概念,以便研究信息设施对社会与文化,特别是“封闭”社会与文化的冲击和影响,可以认为是社会计算向面对真正社会问题转化的开始。几年前的“9·11”恐怖事件催生了亚利桑那大学研究人员发起“情报与安全信息学(ISI11)”的研究。虽然这些工作都没有明确提及社会计算这一概念,但却极大地推动了对社会计算的这种新的认识。

兰德公司研究人员在其关于人工社会的报告中认为:在下几个年代里,最重要的政策制定将发生在信息技术与社会变化的交界处。政府应当寻求各种控制或利用信息技术对社会影响的政策。然而,目前我们关于信息技术对不同文化、不同社会结构的影响的了解,不足以确保我们能够制定出正确的政策。利用人工社会研究信息技术对于不同文化群体和不同社会结构的影响与冲击,正是兰德提出人工社会方法的动机。在此基础上,我们就可以把计算机作为各类社会实验室,对不同的政策进行试验评估,从而了解各类信息技术和基础信息设施对社会的影响。兰德研究人员认为,人工社会的研究应是一项长期的任务,成为社会和政府功能整体的一部分,成为社会理论发展和未来政策制定的基础。

激发兰德提出这一研究报告的主要原因是信息技术在上个世纪80年代末东欧各国发生的一系列政治事件中所发挥的关键作用。这些事件表明:信息技术对于“封闭社会”的影响巨大,已引发(或更直接地煽动起)一场根本性的政治权利的转移。而且,在可以预见的将来,在能够规划的最远处,没有其它的东西能够比信息技术的发展和利用更快地改变世界,就连人口和生态的趋势也不能如此深刻和迅速地改变世界。今天,信息技术有了巨大的发展,但兰德报告中所提的许多问题依然存在,我们还必须进一步研究信息技术对社会的影响。随着网络化数字政府和数字社会的深入发展,把人工社会的思想引入社会计算的研究时机已经成熟,而且势在必行。

从美国的“9·11” 、西班牙的“3·11”,到目前英国的“7·7”,促进社会计算这一方向认识的另一个重大因素是国际恐怖事件。自“9·11”事件之后,世界各国,特别是美国和西欧国家,都扩大和加速开展了有关社会安全方面的科学研究。2002年,美国白宫颁布了“国土安全的国家战略”报告。同年,美国家研究委员会公布了“使国家更安全:科学和技术在反恐中的角色” 的报告。次年,美国家科学基金会宣布,强制性资助在信息技术及安全策略方向所展开的有关中长期国家安全的研究。在此背景下,美国在2003年率先提出“情报与安全信息学”的概念,并于2003年和2004年由美国家科学基金会、情报与安全机构资助

9 Palo Alto Research Center

10 National Aeronautics and Space Administration

11 Intelligence and Security Informatics

召开两次ISI国际研讨会议。2005年始,IEEE与美国家科学基金会合办IEEE ISI国际年会。

ISI研究只是将新型计算方法和手段应用于社会问题的一个具体例子。种种迹象表明,随着数字化和网络化的不断普及深入,各类社会问题的数量化和实时化分析变得日益迫切和重要。国际上大型计算方法的研究和应用已从传统的科学计算、热门的生命或生物计算,扩展到社会计算,即以计算手段研究习惯上被认为是政治社会学中的定性问题,形成计算研究与应用的新焦点。在一定意义下,ISI领域的出现就是基于从人文到科学之社会计算兴起的前奏,也将为许多更新的社会计算问题研究奠定基础。

我们更关心的是社会计算的第二种认识,即如何将人文知识嵌入社会计算,利用计算技术研究传统意义上的政治社会学问题,使静态的人文知识动态化,使定性的讨论数字化,使孤立的知识网络化,最终使社会的发展和规划科学化。

人工世界与社会计算的科学意义

波普尔(Popper)12是当代最伟大的科学哲学家之一,其基本信念就是非确定性的形而上学意识,认为知识是通过心灵的经验演绎而成,即由我们面对的问题及解决问题的过程而产生的。在他的诸多工作中,许多直接与社会计算和复杂系统的研究相关。而他的许多论述和断言,特别是对历史循环论和整体论的批判,从表面看都是对目前许多复杂性研究思想的否定。因此,尽管我们不见得同意波普尔的思想和观念,但必须对其予以重视,从而建立社会计算和复杂系统研究的坚实基础。

首先,波普尔继承了休谟(Hume)对经验科学中归纳方法的否定,因为归纳法认为一个科学的假说可以通过不断可重复的具体观察来检测和验证,但按照归纳法需要无数个这样的肯定结果才能证明一个理论的正确性,这样无数个肯定观察在实际生活中是不现实的。为此,波普尔提出通过“证伪准则”演绎性地验证一个假说是否科学正确,即通过寻求一个假说的可观察的反例来对其验证,没有相反的证据就成为假说正确的证明。按照波普尔的“证伪准则”来界定科学与非科学,如果一个理论有可能与经验观察不一致,才可能是科学的;反过来,如果一个理论事先与所有的经验观察都一致,就是非科学的。在这一准则之下,弗洛伊德的心理分析就是非科学的。当然,波普尔自己也指出,按照他的准则所界定的非科学理论不是没有启发作用的,更不是没有用途的,特别是一时不能证伪的理论,通过不断修正和精化以及技术与时代的进步,后来可能也可以证伪,从而成为科学的理论。

其次,尽管波普尔认可休谟对归纳法的批判的正确性,并进一步认为归纳法实际上从未被真正的科学家使用过,但不接受归纳法一定导致休谟的怀疑论。波普尔认为培根和牛顿对“纯”观察在理论形成的初期阶段的第一位重要性的坚持完全是误导,因为所有的“观察”都是有选择并受理论影响的,根本就不存在“纯”的或不受理论影响的观察。此外,没有观察能免除出错的可能性。他的这一观点动摇了在归纳法和观察的基础上能够区别科学与非科学的传统观念,恰恰相反,波普尔认为没有属于科学的唯一方法。同时,波普尔还相信科学与几乎所有其它的人类和生命活动一样,主要是由求解问题组成。在他看来,科学开始于问题而不是观察,而且他再三强调,没有唯一的方式,没有单一的方法,比如归纳法,可以

12Karl Popper,1902-1994年,英国科学哲学家,批判理性主义创始人,著有《科学发现的逻辑》、《猜想与反驳》、《客观知识》、《开放社会及其敌人》等。

封面报道

起到通向科学理论之道路的功能。这一观点得

到了爱因斯坦的肯定响应:“没有通向高度普

遍的科学定律之逻辑途径。这些定律只能基于

如对经验对象的理性热爱之类的东西,通过直

觉来获得。”

在研究社会计算的基础理论时,必须考虑波普尔的观点,尽管我们并不认为他的观点

是唯一正确的。因为社会计算,特别是含有人为因素的复杂系统研究,首先归类于经验科学,其次目前几乎所有的理论与方法都是以归纳方法为思想基础的。按照波普尔的“证伪准则”,目前关于复杂性的理论还不能称为真正的“科学”。造成这一状况的主要问题是实验,特别是可控可重复的客观实验的困难,进而导致通过实例进行观察的困难。改善这一状况的一个可能的途径是利用波普尔关于现实由三个世界组成的思想。波普尔构造了一个现实的模型,由三个世界组成,即物理世界1、心理世界2和人工物品的世界3。我们把这三个世界称之为客观世界、主观世界和人工世界。在此基础上进一步深入,形成自成体系的理论,使实验、观察、演绎、证伪等成为可能,使社会计算和复杂系统理论“科学”化。

对于前两个世界,人们没有异议,但对于人工世界,并没有成为一个普遍接受的观念。人工世界由以下三部分组成:

(1)世界3.1-已在物理上实现的人工对象;

(2)世界3.2-已在心理上认识的人工对象;

(3)世界3.3-人工世界中未知的对象。

尽管我们无法对其意义和作用进行十分确定的阐述,但我们可以从实用的角度认为社会物理学、社会心理学和社会计算学是世界3的产物,分别对应于世界3.1、3.2和3.3,而且彼此之间有相当的重叠,如图1所示。这一认识可使我们更加放开地利用人工社会的模型,以计算机作为实验手段,在人工世界里对涉及社会计算的假说进行检验和论证,演绎性地对其“科学”性进行界定。

实际上,从中国先秦时的名学家到古希腊的哲学家,其思想和论著中都隐含世界3的萌芽。特别是对波普尔影响极大的英国哲学家休谟,其早期的思想结晶《人性论(Treatise of Human Nature)》就是由认识、感情和伦理三部分分别成书的,在思想上与世界的三个构成对应。近代物理学中的平行宇宙的观念,特别是第四层次的平行数学世界,也为我们利用人工世界进行研究提供了思想上和逻辑上的支持。这样做的另一个支撑是库恩的“不可公度,不可比较,不可交流”的观点,尽管是针对自然科学理论提出的,但其在社会复杂系统中的作用会放大许多倍,使我们不得不考虑不断实验和不断改进综合集成的社会计算研究方式。

然而,从工程和实用角度,利用人工世界的观念建立研究社会计算的理论体系的最根本的动因,就是社会事件和过程的不可重现性或不可重复性。一个社会事件,一种社会现象——从城市的交通到经济的发展过程,从企业管理到政党执政,其经历与经验都是如此。因此,以人工模型为基础,利用“计算机游戏”的科学版本进行实验并获取经验和感觉,在一定意义就是对世界1和世界2中对应对象的一个补充和替代,甚至是“等价”置换。而社会计算是实现这一目标的关键手段之一。

从人工社会到计算实验和平行系统

从社会人文的角度研究社会计算问题,是一项困难而有意义的工作。这方面的工作,将图1 社会计算学与人工世界

与复杂系统的研究密不可分。因此,本节将讨论如何借鉴复杂系统研究已有的成果,特别是复杂系统分析的计算理论,建立社会计算的理论框架体系。

由于社会计算不可避免地涉及关于人与社会及其相关人文知识的系统,因此,相对于有限资源,在本质上,无法对社会计算系统通过独立分析其各部分的行为而确定其整体行为,也不能在大时间和空间范围内预先确定其行为。这就表明我们必须用整体论而不是还原论来研究社会计算问题;可能性而不是确定性,应成为社会计算研究的主要特征。同时,我们必须考虑将“主观性的倾向”引入社会计算,正视这方面研究的主观性和心理作用。所以,在研究复杂社会计算问题时,我们应当认识到:(1)必须采用整体论的观点考虑问题;(2)复杂社会计算问题不存在“一劳永逸”的解决方案;(3)社会计算问题不存在一般意义下的最优解,更不存在唯一的最优解,应当接受有效解决方案的概念。基于此,我们应当在“不断探索和改善”的原则下,寻求社会计算问题的有效解决方案。这一思路与基于经验的“摸着石头过河”解决复杂社会问题的方法异曲同工。我们的任务是使其科学化、系统化和综合化,进而在“不断探索和改善”的原则下,利用人工系统、计算实验、平行系统等方法和理论,结合从定性到定量的综合集成方法和并行分布式高性能计算技术,建立社会计算研究的理论和方法体系。

我们认为,与人工社会,计算实验和平行系统相对应的哲学与科学基础就是社会物理学、社会心理学和社会计算学,如图2所示。

基于人工系统的社会计算建模方法

对于许多复杂系统,特别是涉及社会与人的复杂系统,迄今为止,我们还是无法建立描述其行为的有效方法和模型。基于人工社会的人工系统方法,是目前这方面的一个有意义的尝试。采用这一方法对社会计算所涉及的复杂问题进行建模时,不再完全以逼近某一实际的复杂系统的程度为唯一的标准,而是把模型也认为是一种“现实”,是实际复杂系统的一种可能的代替形式和另一种可能的实现方式,而实际系统也只是可能出现的现实中的一种,其行为与模型的行为“不同”但却“等价”。这就是利用人工系统研究社会计算问题的思想基础。

人工系统方法并不排除逼近客观系统,对许多实际应用,这仍是我们追求的目标。行为“等价”的思想,是在极端或不可能情况下退而求之的折中方案。目前,人工系统建模的核心方法是基于代理的描述,主要由三部分组成,即代理、环境和规则。代理即人工社会中的“人”和物,具有自己的内部状态、行为规则,并可以随着时间、交流和外部世界的变化而变化。环境或空间是代理赖以生存的地方,是它们“生命”的舞台,可以是实际的物理环境,也可以是虚拟的数学或计算机过程,一般表示为由代理活动的场所所形成的网格;最后,规则是代理、场所本身,代理之间,场所之间,代理与场所之间“行事处世”的准则和步骤,从简单的代理活动规则,到复杂的文化、战争和贸易规则。

计算实验与社会计算的分析和评估

研究社会计算问题时,目前大多是采用

图2 社会计算和社会复杂系统研究的基础构成

封面报道

被动的观察和统计方法,很难对其研究对象进

行主动的“试验”,更不用说是“重复性”试验或“实验”了。即使做了试验,其中的主观和不可控制、不可观察因素也太多了,从而往往使结果和结论不具有一般性。由于无法全部用解析推理的方法分析社会计算问题,因此,如何解决复杂社会计算研究中的“实验”问题,成为推动这一领域进一步发展的关键之一。而前面所述的人工系统,为解决社会计算的“实验”问题提供了一种思路和方法。即利用人工系统,我们可以把计算机作为实验的一种手段,从而可以用较容易操纵和重复的形式,进行各种各样的精确可控的实验,对社会计算的各种影响因素进行“量化”的分析和估计。

计算实验是计算仿真随着计算技术和分析方法进一步发展而必须迈上的一个更高的台阶。将计算实验用于社会计算的研究,传统的计算机模拟就变成了“计算机实验室”里的“试验”过程。同物理实验一样,在计算实验中,我们也必须面对实验的标定、设计、分析和验证等基本问题。首先是计算实验的标定问题。主要包括单个代理行为模型的标定、环境模型的标定和自我发展及交往规则的标定。标定的目的是使得人工计算模型与所研究的实际系统尽可能在结构、规模和组织上保持一致,从而能在定性和定量上有相似可比的行为和现象。当然,在计算实验中,我们并不苛求计算实验现象与实际发生的现象相同。其次是计算实验的设计、分析和验证。在这方面,统计学中成熟的实验设计和分析方法完全可以直接用于计算实验学中。最后,计算实验也必须遵循复制(replication)、随机化(randomization)和分块化(blocking)这三个实验设计的基本原理,以保证计算实验学在社会计算的分析中的实际有效性。对于复杂社会问题中各种因素影响的分析,以及决策参数的制定等,这一点尤为重要。平行系统与社会计算的实现

将人工系统与实际系统同时运行,即组成社会计算问题的平行系统。通过平行系统中人工与实际事件的相互对应和参照,实现对现实系统的有效控制与管理、对相关行为和政策的实验与评估、对有关人员和系统的培训与改进等等。社会计算平行系统的主要目的,是通过实际系统与人工系统的相互连接,对二者之间的行为进行对比和分析,完成对各自未来的状况的“借鉴”和“预估”,相应地调节各自的管理与控制方式,落实复杂社会问题有效解决方案或者学习和培训目标的实施问题等。为了有效利用平行系统这一结构,我们必须首先建立针对社会计算的多目标、多有效解决方案的评估体系。其次,借鉴成熟的自适应控制理论,特别是参考模型自适应控制方法,建立平行系统内部的反馈机制和对应的控制及自适应算法,以及利用计算实验对实际系统的组成与行为进行辨识和控制的方法。同时,基于优化理论,特别是区间滚动优化方法,我们还可以建立社会计算平行系统的摄动分析和序贯优化方法。最后,通过建立平行系统运行的基本框架和人工系统与实际系统相互作用的过程及协议,我们可以实现平行系统的不同组合运行模式,例如:实验和评估、学习与培训、管理与控制等等。显然,在社会计算平行系统的运行框架中,各种反馈控制方法,特别是自适应控制的思想,都能够得到应用。这方面工作的具体化将是社会计算平行系统未来的一个主要的研究方向。

展望

科学与技术的有机融合,已为我们人类带来了巨大的财富,大大提高了我们的物质生活水平。我们将有更多的时间关注人之本质性

的需求,而科学、技术与人文之有机的交融,也就变成必须面对的重大问题。社会计算就是促进这一交融的一条十分具体而现实的途径。互联网和现代通信与交通技术的出现,大大简化了人与人、人与社会之间的交往过程,降低了其成本;反过来,也更容易使有些人脱离社会,在一个自我“封闭”的个人空间中生活,甚至成为反社会的因素。因此,如何利用人文知识设计更加人性化个体化的网络与通信环境,使人类在享用高新技术的同时,能够更好地发挥优良的人文传统,促进社会团体与自然生态的和谐发展,而不是走向反面,助长人性中负面因素的极度膨胀,进而危害人类自身,

王飞跃

博士,中国科学院自动化研究所复杂系统与智能科学重点实验室主任。主要研究领域为智能系统和复杂系统的建模、分析和控制。2003年当选IEEE Fellow,2004年当选IEEE Intelligent Transportation Systems Society主席、国家自然科学基金委员会信息科学部专家评审组成员、中国旅美科技协会主席。

这将是一项重要而长期的基础性研究工作。这项工作的完成,将不可避免地依赖于科学、技术和人文的有机融合,依赖于社会计算的发展与深入。

社会计算还将是人类与社会系统的危机/灾害控制研究的关键之一。社会计算对和谐社会的建设、科学发展观的落实、中华民族的伟大复兴,具有十分重要的影响和意义。我们应当认识到这是一项长期的事业,甚至是“千秋大业”,因为一定意义上社会计算的研究就是网上社会基础功能设施全面建设的开端。

“万世之国,必有万世之宝”。这也应是从事社会计算研究的态度和意义。

参考文献

本文所引文献大部分都见于下列文章:

[1] 王飞跃,史帝夫·兰森,从人工生命到人工社会——复杂社会系统研究的现状和展望,复杂系统与复杂

科学,2004, 1(1): 33-41.

[2] 王飞跃,计算实验方法与复杂系统行为分析和决策评估,系统仿真学报,2004, 16(5): 893-897.[3] 王飞跃,平行系统方法与复杂系统的管理和控制,控制与决策,2004, 19(5): 485-489.[4] 王飞跃,关于复杂系统研究的计算理论与方法,中国基础科学,2004, 6(41): 3-10.

[5] 王飞跃,社会计算:科学、技术与人文的数字化动态交融,中国基础科学,2005, 7(47): 5-12.

[6] 王飞跃,关于社会物理学的意义及其方法讨论,复杂系统与复杂科学,2005, 2(3): 1-12.

随着信息数字化和网络化的进程不断加快,人们的行为轨迹越来越多地被记录下来,这使得利用计算技术观察和研究社会成为可能。2009年2月,美国哈佛大学大卫·拉泽(D avi d L a ze r)等15位美国

学者在《科学(S ci e nc e)》上联合发表了一篇具有里程碑意义的文章“Computational S ocial S ci e nc e”。该文指出:“计算社会科学”这一研究领域正在兴起,人们将在前所未有的深度和广度上自动地收集和利用数据,为社会科学的研究服务。

正如“计算语言学”又称为“自然语言处理”一样,“计算社会科学”又可以叫作“社会计算”,字面不同的术语其侧重点略有不同,但概念基本一致。本文遵从近年来国内学者的习惯,使用“社会计算”一词。

一般而言,社会计算是指社会行为和计算系统交叉融合而成的一个研究领域,研究的是如何利用计算系统帮助人们进行沟通与协作,如何利用计算技术研究社会运行的规律与发展趋势。

“利用计算系统帮助人们进行沟通与协作”是指帮助人们在互联网上建设虚拟社会,对现实社会中人与人的关系进行复制和重构,使人们更紧密地联系在一起,随时随地互相通讯,以协作的方式生产知识。这方面的研究包括社会网络服务、群体智慧等。

“利用计算技术研究社会运行的规律与发展趋势”,是指以社交网络和社会媒体为研究对象,从中发现社会关系、社会行为的规律,预测政策实施的可行性。社会学鼻祖奥古斯特·孔德最初定义社会学时,希望社会学能够使用类似物理学的方法,成为经得起科学规则考验的一门学科,互联网背景下的社会计算使这一理念具有了现实可行性。这方面的研究包括社会网络分析、内容计算、人工社会等。

研究内容

社交网络服务

谈到社交网络服务(S ocial Ne t w or k Se rvic e,SNS),就会让人想起时下最热门的Fac eb oo k。社交网络服务研究的是利用信息技术构建虚拟空间,实现社会性的交互和通信。社交网络服务还有一种解释是社会网络软件(S ocial Ne t w or k S oft w ar e),电子邮件、网络论坛等许多传统网络工具都可以视为一种社会软件。

在社交网络服务的网站上,人们以认识朋友的朋友的方式,扩展自己的人脉。国内最有名的社交网络服务网站是“人人网”,他们从实践中总结出以下值得重点关注的研究点:社会关系强度、信息的绝对价值和相对价值、新鲜事排序算法、隐私性以及社会化搜索。

群体智慧

群体智慧(Coll e ctiv e Int e lli ge nc e)的典型应用是“维基百科”和“百度知道”。这些互联网平台系统不仅帮助用户相互沟通联系,更重要的是将用户组织起来,发挥他们的群体智慧,以协作的方式一起创造、加工和分享知识。

2005年,美国卡耐基梅隆大学的路易斯·冯·安

刘挺

哈尔滨工业大学

方兴未艾的社会计算关键词:社会计算

(L ui s Von A h n)提出“人本计算(H uman Compu-tation)”的思想,用验证码、游戏等方式调动网民的热情,使众多的人脑自觉不自觉地参与到计算任务中,轻松地解决了本来非常耗时耗力的问题。这也是群体智慧的体现。

知识获取是一切智能系统的瓶颈,传统的依靠专家编辑知识的方式效率太低,无法满足大规模真实信息处理的需求。在网络社会的大背景下,群体智慧的出现为知识获取提供了一条崭新的充满希望的道路。如何巧妙地设计用户界面以激发用户的参与热情,如何克服人脑计算的不精确性,如何将人脑和电脑最佳地结合起来,都是值得深入研究的问题。

社会网络分析

社会网络分析(S ocial Ne t w or k Anal ys i s)依据网络理论看待社会,节点是网络中的独立角色,边是社会关系,社会网络就是由节点和边构成的一张图,这张图往往非常复杂,节点之间的关系类型多种多样。

社会网络分析的典型例子是社区计算。中科院计算技术研究所的研究工作指出:社区是社会信息网络的普遍现象,大规模信息网络中的一些社会化特征在全局层面往往具有稳定的统计规律。如何度量、发现和利用这些规律是大规模社会信息网络分析与处理的一个基础问题。一般而言,社区结构是度量和利用这些特性的基本单元。因此,发现一个网络中有意义的、自然的、相对稳态的社区结构,对网络信息的搜索与挖掘、信息的推荐以及网络演化与扩散的预测具有重要价值。

内容计算

除社会网络外,社会媒体也是分析理解社会的重要素材,如新闻、论坛、博客、微博等。由于它们都以语言文字为主要展示形式,因此从事内容计算(Cont e nt Computin g)研究的学者需要掌握语言分析技术。当前内容计算的热点包括舆情分析、人际关系挖掘、微博应用等。

舆情分析传统上,对舆情的研究主要有两种方法:一是观察思辨,二是问卷调查。前者缺乏数据支持,后者采集的数据量亦有限。互联网技术为舆情分析提供了全新的技术路线,通过对各种社会媒体的跟踪与挖掘,结合传统的舆论分析理论,可以有效地观察社会的状态,并能辅助决策,及时发出预警。

基于内容的人际关系挖掘互联网中蕴含着大量公开的人名实体和人际关系信息。利用文本信息抽取技术可以自动地抽取人名,识别重名,自动计算出人物之间的关系,进而找出关系描述词,形成一个互联网世界的社会关系网。微软亚洲研究院的“人立方”就是一个典型系统。

微博应用如果说“人人网”是中国的Fac eb oo k,那么“新浪微博”则是中国的T w itt e r。近来“新浪微博”发展迅猛,2010年11月时,用户数为5000万,到2011年3月,用户数已突破1亿,在四个月内翻了一倍。“微博”同时具有“社会网络”和“媒体平台”的属性,它催生了信息生产和传播方式的革命,对社会事件和人们的意识已产生了很大影

2011 中国计算机大会(CCF C N CC 2011)筹备工作会议于2011年3月初在深圳举行。主办单位中国计算机学会和承办单位中国科学院深圳先进技术研究院,就大会的组织架构、任务分工等进行了细致讨论和确定。https://www.doczj.com/doc/7d4157245.html,f-cncc2011.or g(戴)

专栏

响。“微博”明确地定位为平台,它提供开放的API 接口,积极支持第三方应用的发展,基于“微博”的研究与开发必将成为未来一段时期学术界和产业界的热点。

人工社会

社会计算的一个重要使命是对复杂社会问题建立计算模型,进行实验分析并提供决策支持。利用计算机模拟手段测试和验证社会经济政策的效果,已成为一个公共政策领域的迫切需求,这些需求催生了“人工社会(Artificial S oci e t y )”、“平行社会”等诸多相关领域的研究。

通过建立各种人工社会,构造相应的平行系统,为“全面、综合、可持续的科学发展观”提供了一种可行的分析和评估方法,并应用于复杂社会系统的管理与控制,可以为将要到来的数字化社会和数字化政府管理奠定基础。中科院自动化所是“人工社会”这一研究课题的积极倡导者和实践者。

社会计算面临的挑战

社会计算方兴未艾,生机勃勃,却也面临诸多挑战:

个人数据整合 同一个人在不同场合、不同终

端上留下的各种行为记录目前都散落在不同的存储节点上,要整合这些信息,不但涉及技术问题,更涉及复杂的管理问题。

巨量数据存储 为大规模人类行为进行全面实

时的记录,需要巨大的数据存储和管理能力,当前的计算机系统还无法满足这一需求。

个人隐私保护 出于隐私保护方面的考虑,

大型互联网公司往往不敢向学术界公开用户日志,致使学术界对社会计算的研究遇到用户数据采集方面的严重困难。匿名化处理是一种解决方案,但好事者依然可以从匿名后的数据中发现个人行为的轮廓,使匿名化处理失效。

研究成果保密 如果揭示出某种社会关系或

某个组织的运行规律,是否会受到相关个人和组

织的质疑或反对呢?对研究成果要达到何等保密程度呢?

学术队伍组织 由于背景各异,如何使计算机

专家和社会科学领域的专家相互理解,密切配合,一道推进社会计算的研究,并非易事。同时,如何建设社会计算学科,培养既懂计算科学,又懂社会科学的人才,也是亟待探索的话题。

结语

社会计算是一个方兴未艾的多学科交叉领域,网络科学、复杂系统、数据挖掘、社会学、管理科学、语言处理、信息检索等不同背景的学者从不同的角度对社会计算进行了研究。社会计算的研究横跨文理,为社会科学提供了一条革命性的计算之路,其研究成果对于社会管理、社会生活都将产生重大影响。随着学术界、产业界和政府对社会计算的认识不断加深,关注度不断提高,社会计算正逐步进入蓬勃发展的阶段。■

刘 挺

CCF高级会员,本刊编委,YOCSEF 副主席(2011~2012)。哈尔滨工业大学教授。主要研究方向为信息检索,自然语言处理。 tliu72@https://www.doczj.com/doc/7d4157245.html,

参考文献

[1] D avi d L a ze r , e t al. Computational S ocial S ci e nc e, S ci-e nc e, vol. 323, no. 5915, F eb ruar y 2009, pp. 721~723[2] L ui s von A h n , e t al. r e CAPTC H A: H uman-B a sed C h ar-act e r Re co g nition via Web Se curit y M e a s ur es, S ci e nc e, Vol. 321, no. 5895, Se pt e m be r 2008, pp. 1465-1468[3] 《中国至2050年信息科技发展路线图》,中国科

学院信息领域战略研究组,科学出版社,2009.9: 138~141

[4] 李国杰,关于网络社会宏观信息学研究的一些思考,

中国计算机学会通讯, vol. 2, no. 2, 2006

[5] 李晓明、祝建华, 让社会科学插上信息技术的翅膀,

中国计算机学会通讯, vol. 2, no. 2, 2006

[6] 王飞跃,社会计算:科学·技术·人文,中国基础科

学,2005年第7卷第5期,第5~12页

什么是社会感知计算

随着嵌入式设备、无线传感网络、移动计算等技术的快速发展,集成感知、计算和通信能力的普适智能系统已经逐步融入到人类的日常生活中。普适计算技术,确切地说是传感技术和情境感知(Conte x t Aware)技术,以前所未有的方式增强了人们收集、分析和利用数据的广度和深度。

生活在由通信网、互联网、传感网等相互融合所形成的混合网络环境中的人类,留下的数字足迹汇聚成为一幅复杂的个体和群体行为图景,这些图景对于理解并支持人类的社会活动[1]具有重要的帮助作用。

2005年美国MIT科学家亚历克斯·彭特兰(Ale x Pentland)在IEEE Computer杂志上发表了题为“So-cially Aware Computation and Communication”的论文[2],首次提出了社会感知计算的思想。文章通过对人际交往中的社会情境(Social Conte x t),如说话声调、面部动作和姿势进行量化,并以可视化呈现,以此促进人们的社会交往。2009年2月彭特兰和哈佛科学家大卫·拉泽(David Lazer)等在美国《科学》杂志(Science)上撰文阐述了通过收集和分析海量现实生活数据流理解个体、组织和社会[1],其思路和目标与社会感知计算不一而同,但是更侧重于计算和分析。

迄今社会感知计算已经得到学术界的广泛关注,并研究开发出一些系统和应用,但还没有统一明确的定义。我们在此给出一般性定义。社会感知计算(Socially Aware Computing)是通过人类社会生活空间日渐部署的大规模多种类传感设备,实时感知识别社会个体的行为,分析挖掘群体社会交互特征和规律,辅助个体社会行为,支持社群的互动、沟通和协作,从而高效地支持社会目标的实现。社会感知计算的核心在于“感知”二字,有两层涵义,首先感知物理世界(Sensing),然后觉察并做出响应(Aware)。

与基于单一万维网数据或用户调查数据的社会计算(Social Computing)[3]或社会网络分析(Social Network Analysis)[4]不同,社会感知计算强调利用先进计算机科学技术感知现实世界个体行为和群体交互,理解人类社会活动模式,并为个体和群体交互提供智能辅助和支持。

如图1所示,社会感知计算借助普适环境新型智能设备和技术可以感知物理世界实时、连续的

於志文周兴社

西北工业大学

社会感知计算

关键词:社会感知计算普适计算

图1 连接宏观社会和物理世界的社会感知计算

现场数据,经过分析和处理,获得个体和群体的交互信息,为宏观社会提供决策依据。反过来,社会感知计算从宏观社会接受理论指导,通过普适环境大量作动器和智能设备,直接反馈并作用于物理世界,辅助支持人类的社会活动。因此,我们认为社会感知计算是连接宏观社会和物理世界的真正桥梁。

社会感知计算的起源和发展

人类从未停止过对自身及其所处社会的探究。人类行为的感知理解和社会交互的规律认识,一直是科学界关注的重大基础研究问题。从研究方法和数据获取的角度,围绕这一主题的研究经历了四个主要阶段。

早期研究人员通过书面问卷调查、面谈和第三方观察,收集人类活动和社会现象数据,采用统计归纳法,分析理解人类活动规律和特征[5]。这种方法通常只能小范围采样,其缺点是数据量少,很难具备广泛代表性;且只是一个静态的截面数据;另外这种方法获得的调查数据可能不太准确,因为数据常常带有个人主观偏见。

计算机的发明,为分析人类行为和社会现象提供了高效的计算和仿真工具,程序模拟法应运而生[6]。通过Agent的自下而上的编程,给每个Agent 设置一定的初始条件和互动规则,让Agent之间、Agent与环境之间进行互动,模拟现实世界的社会交互,最后对互动结果进行分析。这种方法不需要调查数据,就可以进行仿真实验,但需要经典理论和假设的支撑,以设定初始条件和互动规则。

进入互联网时代,万维网的出现,尤其是万维网社区、博客、论坛等为研究人员分析在线行为和社会网络提供了海量数据来源,社会计算得以蓬勃发展,社会软件和应用不断涌现,如网民行为模式挖掘、网络舆情分析和网络反恐[7~8]。基于万维网数据的研究方法,相对于早期的书面问卷调查,可以获得大规模数据;但是在线行为属于虚拟行为,与真实世界具有时空特征的人类移动和交互有着本质的差别。

普适计算的出现极大地丰富和增强了研究人员获取数据的途径和能力,社会感知计算正是在社会计算需求和普适计算技术发展的推动下问世的,或者说是社会计算与普适计算的融合产物。社会感知计算通过大规模多种类传感设备,包括普适传感器(RFID、运动传感器、音视频传感器等)、智能手机(GPS、通话记录、短信收发),结合电子邮件、We b(DBLP、论坛)等,能够获取关于人类社会行为和交互的大规模、客观、实时、连续、动态的现场数据,为人类行为理解和交互规律认识的研究提供坚实基础。除了分析理解之外,社会感知计算还强调从个体、群体和社会三个层面为人类行为和交互提供智能辅助和支持。

由彭特兰创立并领导的MIT人类动力学实验室(Human Dynamics La b)是最早从事社会感知计算的研究机构之一。2004年开始的Reality Mining项目通过搜集94位智能手机用户连续9个月的位置和通话记录,分析用户的日常行为模式、人际关系等,得出的最新研究成果发表在2009年美国科学院院刊(PNAS)上[9]。将手机数据比作一面文化镜子,通过分析不同国家、不同地域(城市和乡村)手机用户的数据,理解不同文化背景人群的社会经济状态、生活节奏、移动性、对社会突发事件的反应[10]。利用可穿戴社会测量传感器(Sociometric Badge),感知个体移动、说话、邻近等数据,分析员工个性和组织行为[11]。

无独有偶,美国东北大学也以移动手机为感知手段,研究社交网络特征。2008年英国自然杂志(Nature)发表了他们的研究成果[12],通过分析手机移动网络数据,发现人的移动轨迹具有高度的时空规律性,从整体上看用户的位移分布接近于幂律模型。该研究成果可用于提高社会生活或生产的效率,例如针对处于集散节点的人进行疫苗接种,可能会有效地防止疾病的传播。

在社会感知智能辅助和支持系统方面,英国Lancaster大学[13]提出“可穿戴社群(Weara b le Commu-nity)”概念,为增强现实世界面对面社会交互而利用可穿戴计算设备建立和维护社交网络。其智能辅

助支持体现在两个方面:(1)从数字交互到社会交互,如设备的频繁相互发现而推荐交往;(2)从社会交互到数字交互,如两个谈话的人交换电子名片。欧盟AMI项目[14]进行了“增强多方交互”方面的研究,如在智能会议系统中,通过感知并可视化成员的发言和注视行为,发现主导者,平衡参与度,实时获取和解释科学合作行为,提高交叉学科团队协作过程的创造性。日本东京大学的DeaiE x-plorer系统[15],从万维网论文数据库中动态抽取特定部分,生成社交网络,显示在大型触摸屏上,让会议参加者发现他们之间的联系,利用RFID(Radio Frequency Identification,射频识别)技术,知晓彼此在会场的大致位置,促进学术交流。

社会感知计算的主要研究内容

社会感知计算的研究内容主要包含以下五个方面:

现实世界实时数据感知利用现实物理世界部署的大规模多种类传感设备实时感知物理世界社会个体的活动原始数据。研究不同模态数据的语义表示和关联。研究大规模感知数据的汇聚、融合和存储。

人类行为与交互分析研究个体行为识别,分析其行为特性和规律。在个体行为、移动性和社会交互数据的基础上,利用社会网络分析、机器学习、数据挖掘等方法,研究分析群体社会交互,如群体形成、组织结构、群体活动、交流模式及其动态演化。

社会交互高效支持在了解个体社会行为、群体社会交互状态和规律的前提下,研究社会交互高效智能支持策略和机制。具体技术包括个性化推荐、社会交互状态可视化、群体协作支持、智能决策等。

社会感知计算软件框架和方法学研究社会感知计算基础软件框架,为系统的开发、测试和部署提供支撑;研究社会感知计算方法论,制订系统设计原则,从系统观的角度指导模型和算法的设计;研究社会感知计算系统判断和评价的标准和方法。

社会感知计算应用研究社会感知计算理论和技术在不同领域的应用。社会感知计算可以应用在很多重要领域,如健康卫生(传染病防范)、公共安全(突发事件预警)、大规模系统工程(群体协作支持)、智能交通管理(道路交通协同监测)、城市规划与发展(人口、资源、环境预测与规划)等。

总结与展望

科学家对真理的不懈探索,推动了技术进步和社会发展,反过来新的技术和应用又影响并改变了科学家研究的内容和方法。社会感知计算正是在普适计算技术的发展下问世,由此产生新的科学问题,新的研究方法、工具和数据,使得感知物理世界,分析社会交互,支持宏观社会成为可能。

社会感知计算为中国计算机科学的研究与发展带来机遇,通过计算机科学与人文社会科学、认知科学、社会心理学的交叉融合,感知揭示人类社

2009年浪潮集团公司资助”CCF YOCSEF青年科学家奖”,该奖一经设立就得到业界的高度认可,评奖取得了成功。今年6月举行的常务理事会决定将此奖上升为学会奖”CCF青年科学家奖”,浪潮集团将继续出资赞助该奖。

该奖评出后将于每年一度的年终CCF颁奖会上颁发。

相关主题
文本预览
相关文档 最新文档