美国政府NIST大数据互操作性框架的特点研究及启示
- 格式:pdf
- 大小:1.77 MB
- 文档页数:10
52中国电信业CHINA TELECOMMUNICATIONS TRADE欧美个人数据跨境流动博弈之路当前,大国间数据治理规则的竞争日趋激烈,“技术即权力,数据即主权”已经成为多国共识。
欧美传统跨大西洋伙伴关系在数据跨境传输问题上进行了多年博弈,也历经了多次坎坷。
此前欧美双方曾两次合作,分别于2000年签订《安全港协议》以及2016年签订《隐私盾协议》。
两项协议的核心思路都是为了督促美国解决个人数据流动和监管中出现的多重问题。
但两项协议先后因欧盟法院基于美国情报机构的电子监听活动而宣布无效。
随后,欧盟委员会和美国政府就新的数据转移协议开始了长达数年的协商,以解决欧盟法院提出的问题。
安全港协议时期(2000年—2015年)2000年12月,美国商业部与欧盟建立了《安全港协议》,借此美国得到了欧盟“局部性”的充分性认定。
此后的15年间,《安全港协议》成为了欧美间数据跨境流动的规范性标准。
依托该协议,谷歌(Google)、脸书(Facebook)等4000多家美国企业可以自由地将欧盟用户的数据传输至美国进行存储及分析。
欧美间建立了阶段性稳定的跨大西洋数据流动机制。
2013年,美国“棱镜门”丑闻《欧盟—美国数据隐私框架》 带来的启示的曝光迅速引发欧洲社会的不满和忧虑。
2015年,奥地利隐私保护人士马克斯·施雷姆斯(Max Schrems)控告脸书不当传输用户数据,参与美国情报机构的监控计划,并最终上诉至欧盟法院(被称为“Schrems I 案”)。
当年10月,欧盟法院支持施雷姆斯的申诉,认为《安全港协议》未能确保欧盟公民数据免受美国政府的“干预”,最终裁定《安全港协议》无效。
隐私盾协议时期(2016年—2020年)《安全港协议》的失效严重扰乱了欧美之间稳定的数据跨境流动规制,引发了跨大西洋■ 杨瑛瑛 王怡青 ︱ 文2023年7月10日,欧盟委员会批准了一项新的跨大西洋数据传输协议《欧盟—美国数据隐私框架》(EU-U.S. Data Privacy Framework)。
美国数字政府战略及启示作者:金江军来源:《信息化建设》2012年第08期美国数字政府战略介绍主要目标美国数字政府战略包括三大目标:一是使美国人民和流动性加强的劳动力随时、随地、通过任何设备访问高质量的数字政府信息和服务。
二是确保美国政府适应新的数字世界,抓住机遇,以智慧、安全和实惠的方式采购和管理设备、应用和数据。
三是开发政府数据以刺激全国的创新,改进政务服务的质量。
基本原则美国数字政府战略坚持如下四个原则:(1)以信息为中心改变传统管理文件的形式,而是管理开放数据和内容的碎片,这些碎片可以被标记、共享和安全,并且可以以对客户最有用的方式组合和表达。
(2)共享平台帮助美国政府各部门内部以及部门之间的雇员一起工作,以降低成本,精简部门,应用一致的标准,并且以一致的方式创建和分发信息。
(3)以客户为中心围绕客户需求,创建、管理数据,通过网站、移动应用、原数据集以及其他分发模式提供数据,允许客户在任何时候以任何他们希望的方式构建、分享和消费信息。
(4)安全和隐私平台确保安全地分发和使用服务,保护信息和隐私。
主要任务根据上述四个原则,美国政府提出了相应的规划方案。
在信息中心方面,美国政府将使开放数据、内容和网络应用程序接口(Web API)作为新的默认(New Default)方式,可以通过Web API获取现有的高价值的数据和内容。
OMB将与来自各政府部门的代表一起,为联邦政府制订开放数据、内容和Web API政策,为改进的互操作开发指南、标准和最佳实践。
在共享平台方面,美国政府将建立一个数字化服务创新中心和顾问团队,建立一个跨部门治理机制以改进数字化服务的提供,统一政府部门的资产管理和采购工作。
数字化服务创新中心负责识别共享的、开放的内容管理系统(CMS)解决方案,帮助政府机构开发Web API,启动共享移动应用开发项目。
顾问团队负责帮助数字化服务创新中心优化共享服务需求,促进现有政策和最佳实践的共享,识别并推荐变化以帮助消除政策和标准方面的鸿沟。
美国政府数据开放共享的经验与启示作者:周千荷吕尧韩杰超孙小越来源:《网络空间安全》2020年第10期摘要:美国是信息技术的领先者,政府信息化、数字化程度高。
为提高政府数据利用价值,提升政府工作效率,促进数据共享,以及为社会组织和民众所使用,美国在政府数据开放方面开展一系列举措。
文章介绍了美国政府在推动数据开放共享方面开展的工作,分析了美国政府数据开放共享的特点,希望通过分析借鉴其成功经验,为我国更好地开展政府数据开放共享与合作提供参考。
关键词:政府数据;开放共享;政府治理中图分类号: TP309 文献标识码:A1 引言随着全球开放数据运动的迅猛发展,各国政府越来越重视政府数据的开放共享与合作。
政府数据的利用不仅仅能打破“数据孤岛”、整合资源、提升政府工作效率,还能为社会组织和民众所利用,有效地提高数据的再利用价值。
美国作为全球开放数据运动的领先者,在加强开放政府数据与合作共享方面一直走在世界前列,本文希望通过分析美国经验做法,为我国政府数据开放共享与合作提供参考和借鉴。
2 美国政府数据开放共享综述对于政府数据开放,美国是全球最坚定的倡导者和实践者之一。
美国认为,数据是具有价值的国家资本,理应向公众及社会开放,进而充分实现其价值。
1789年,美国国会制定了《管家法》,对美国政府政务公开做出规定,但数据开放的效果并不理想。
进入20世纪,人们逐渐对政府数据公开产生需求,于是美国国会于1946年通过《联邦行政程序法》,规定行政机构必须向公众提供行政资料,然而该法在标准厘定等方面存在缺陷,因此也阻碍了政府数据的开放共享。
改变这一状况的是1966年通过的《信息自由法》,作为美国政府数据公开的里程碑,该法规定了行政机关向民众提供行政数据的义务,并指出“政府信息公开是原则,不公开是例外”。
随后,美国出台并完善了一系列有关政府数据公开的法律法规,为政府数据开放共享打下坚实基础。
除了加强顶层设计,美国政府还通过投资核心技术开发为政府数据开放提供支持。
中美两国在大数据政策领域的对比研究【摘要】本文通过对中美两国大数据政策领域的对比研究,分析了两国在大数据政策制定和执行方面的背景和现状。
通过对比分析中美大数据法律法规、个人数据隐私保护、大数据产业发展和大数据安全管理的政策差异,发现了两国在政策制定和执行方面的异同点。
在总结了中美大数据政策的异同点,并提出了对未来发展的启示和建议。
研究发现,中美在大数据政策方面存在一些差异,但也有共同点。
对此,本文从政策层面提出了一些建议,以促进中美大数据政策的发展和合作。
通过本文研究,可以更好地了解中美两国在大数据政策领域的差异和共同点,为未来的政策制定和执行提供参考和借鉴。
【关键词】中美大数据政策,对比研究,背景现状,法律法规,个人数据隐私保护,产业发展,安全管理,异同点总结,未来发展,建议。
1. 引言1.1 中美两国在大数据政策领域的对比研究随着信息技术的快速发展和大数据时代的到来,大数据已经成为世界各国经济社会发展的重要驱动力。
中美作为世界上最大的两个经济体,在大数据政策领域备受关注。
中美两国在大数据政策方面有许多相似之处,同时也存在一些明显的差异。
中美大数据政策的对比研究可以帮助我们更好地了解两国在这一领域的立法、监管和发展方向,为未来制定更加科学有效的政策提供参考。
本文将从中美大数据政策的背景和现状、大数据法律法规的对比分析、个人数据隐私保护政策差异、大数据产业发展政策对比以及大数据安全管理政策比较等方面展开讨论,旨在深入挖掘中美两国在大数据领域的共同点和差异点,总结中美大数据政策的异同,探讨对未来发展的启示,并提出对中美大数据政策的建议。
通过这些研究,我们可以更好地促进中美在大数据领域的合作与交流,推动全球大数据产业的发展。
2. 正文2.1 中美大数据政策的背景和现状在当今信息化时代,大数据已经成为各国经济和社会发展的重要驱动力之一。
中美作为世界上两大经济体,在大数据政策领域也有各自的背景和现状。
从背景来看,中国作为全球最大的互联网市场之一,拥有庞大的数据资源和庞大的互联网用户群体。
国外产业共性技术创新平台建设的经验分析及其对我国的启示薛捷, 张振刚(华南理工大学)摘要:对共性技术的基本特点和概念进行了分析研究, 对美国、日本、欧盟和韩国在产业共性技术开发方面的基本情况和发展经验进行了归纳总结。
在此基础之上, 提出我国在共性技术开发中政府应该发挥主导作用, 同时在共性技术开发上应该采用“ 官产学研”合作组织的形式。
关键词:共性技术; 官产学研合作; 创新平台一、引言关于产业共性技术的定义, 现在国内外的学术界还没有一个确定的概念。
美国国家标准与技术研究院( NIST) 将共性技术定义为科学现象的一个概念、要素, 或进一步的观察, 其具有被应用于广泛的产品和生产过程的潜力。
国内学者李纪珍在其研究中认为,产业共性技术是指在很多领域内已经或未来可能被普遍应用, 其研发成果可共享并对整个产业或多个产业及其企业产生深度影响的一类技术。
而马名杰、胡小江、项哲学等学者在研究中则强调, 共性技术是一种竞争前技术( Pre- competitive) , 介于基础研究和应用研究之间, 是基础研究形成商业应用的基础, 并能够在一个或多个行业中得以广泛应用。
由上述学者和机构对于产业共性技术所给出的定义我们可以看出,虽然表述有所不同, 但是都突出了共性技术的一些共同特点, 如共性技术处于竞争前阶段, 具有很强的关联性和广泛的适用性, 同时由于其具有强烈的外部性可能导致严重的组织失灵和市场失灵等。
基于这些特点, 本研究认为, 共性技术作为“ 竞争前阶段”的技术,具有准公共品的性质, 其衔接了基础研究和面向市场的商业技术开发, 能应用于一个或多个行业, 是产业技术进步和产业发展的基础, 也是提升产业自主创新能力的根本和基础, 具有很强的经济带动作用和巨大的社会效益。
进入20 世纪90 年代, 世界各国对关系本国产业发展的共性技术采取各种形式的政策支持成为一种潮流, 为更好地推进我国产业共性技术的发展, 本文将深入研究美国、欧盟、日本、韩国等国家和地区在产业共性技术创新平台建设方面的特点和经验, 同时,结合我国产业发展的实际对我国产业共性技术创新平台的建设进行研究, 提出可供借鉴的方面, 以期为我国的共性技术创新平台建设提供有力的政策指导。
国外政府数字化转型政策比较研究国外政府数字化转型政策比较研究近年来,随着信息技术的不断发展和应用,各国政府纷纷开始推行数字化转型政策,以提高公共服务效率、加强治理能力、增强社会发展活力。
本文将对几个国家的数字化转型政策进行比较研究,探讨其相似之处和差异,以及带来的成效和问题。
一、美国政府数字化转型政策美国一直以信息技术的强国而著称,其数字化转型政策经验值得借鉴。
美国政府数字化转型政策的核心是推动开放数据和数据共享,以促进创新、提升公共服务效率,并拉近政府与公众的距离。
首先,美国政府倡导开放数据政策,通过数据的公开和可访问性,鼓励公民、企业、学术界和非政府组织利用数据创新。
此外,政府还通过建立开放数据平台和数据标准,提供开放的数据资源和工具,以支持全社会参与数字化转型。
其次,美国政府致力于发展数据共享机制,通过数据的整合和共享,提高公共部门间的协同作用,避免信息孤岛和重复投入。
例如,美国政府建立了数据共享标准和架构,鼓励各部门主动分享数据,实现互动合作,提升制度整体效能。
再次,美国政府注重推动数字化公民参与,通过开展在线公民参与平台和社交媒体互动,增强政府与公民之间的互动和沟通。
政府利用数字化手段收集公民意见和需求,提出政策建议和改进措施,并借助社交媒体等渠道与公民保持实时联系,加强政府信任度和公共服务满意度。
二、英国政府数字化转型政策英国政府一直积极推行数字化转型,以强化政府服务和数据驱动决策,提高公共部门效率和满意度。
首先,英国政府大力推行电子政务,鼓励公民利用在线服务进行政府事务办理。
政府提供一站式的在线服务平台,将传统的政务服务数字化,提供更加便捷的服务。
此外,政府还致力于构建云计算和大数据基础设施,以实现政府数据的集中存储和共享,提高数据的利用效率。
其次,英国政府注重数据治理和隐私保护。
政府建立了数据保护和隐私政策框架,保障公民数据的安全和隐私,加强数据的管理和使用规范。
此外,政府还推动数据开放和透明度,鼓励公民监督和参与政府数据的利用,保障公共服务的公正性和透明度。
美国数字政府建设的实践研究与经验借鉴随着信息技术的快速发展,数字政府已成为全球各国政府改革的重要方向之一。
数字政府的发展旨在通过信息技术的应用来提高政府的运行效率、服务水平和公共参与度,实现政府治理的现代化和智能化。
美国作为发达国家,在数字政府建设方面一直处于领先地位,其数字政府建设的实践经验对其他国家的政府建设具有很强的借鉴意义。
本文将对美国数字政府建设的实践进行研究,并从中提炼出经验,以期为其他国家的数字政府建设提供借鉴。
一、美国数字政府建设的概况1.1 政策导向:政府先进化法案的出台美国在数字政府建设方面的实践经验可以追溯到上世纪90年代,当时美国政府出台了“政府先进化法案”(Clinger-Cohen Act),这是美国政府第一次对信息技术进行全面管理的法案。
该法案要求各个政府机构必须建立信息技术投资管理机制,确保信息技术的投资能够服务于政府的战略目标。
这一法案的出台为美国数字政府的建设奠定了法律基础。
1.2 机构建设:数字政府办公室的成立为了协调和推动全国范围内的数字政府建设工作,美国政府成立了国家数字政府办公室(Office of Electronic Government),并任命首席信息官(CIO)负责国家数字政府战略的制定和实施。
国家数字政府办公室的主要职责包括:制定数字政府的战略规划和政策,推动政府信息系统的整合和互操作,鼓励政府机构加强信息技术的应用。
1.3 技术建设:数字化基础设施的完善在数字政府建设过程中,美国政府加大了对数字化基础设施的投入,包括政府网站、电子政务服务、数据中心等的建设和改造。
政府大力推动云计算、大数据、人工智能等新兴技术在政府部门的应用,以提高政府数据的利用率和效益。
1.4 服务手段:数字化服务的普及为了提高政府服务的便利性和效率,美国政府大力推动数字化服务的普及。
在社保、医疗保健、税收等领域,政府已经推出了各种在线服务平台,方便公民和企业进行操作和办理业务,极大地提高了服务水平。
美国情报界数据管理的流程、框架及启示下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。
文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by theeditor.I hope that after you download them,they can help yousolve practical problems. The document can be customized andmodified after downloading,please adjust and use it according toactual needs, thank you!In addition, our shop provides you with various types ofpractical materials,such as educational essays, diaryappreciation,sentence excerpts,ancient poems,classic articles,topic composition,work summary,word parsing,copy excerpts,other materials and so on,want to know different data formats andwriting methods,please pay attention!美国情报界的数据管理:流程、框架与全球启示随着数字化时代的到来,数据已成为情报界的核心资产,尤其是在美国,其情报机构在全球安全与情报工作中扮演着关键角色。
大数据技术在美军中的应用及启示随着信息化时代的到来,大数据技术逐渐成为各个领域的关键工具,其中也包括美军。
美军作为世界上最强大的军事力量之一,自然也在大数据技术的应用上走在了前沿。
本文将探讨大数据技术在美军中的应用及对我们的启示。
1. 战略决策支持大数据技术在美军中最重要的应用之一就是战略决策支持。
美军通过收集和分析海量的数据,能够更准确地了解战场情况、敌方实力和行动意图,从而在战场上制定更加精准的作战计划。
美军使用大数据技术进行情报分析,可以及时识别敌方军事动向,为军事行动提供准确的情报支持。
2. 武器系统优化大数据技术在美军中还应用于武器系统的优化。
通过收集和分析武器系统的运行数据,美军可以发现武器系统的潜在问题,并及时进行调整和优化。
通过大数据技术,美军可以实现对武器系统的远程监控和维护,从而提高了武器系统的可靠性和作战效能。
3. 人员管理和训练大数据技术在美军中还应用于人员管理和训练。
通过对士兵训练和作战表现的数据进行分析,可以发现士兵的优势和不足,并制定针对性的训练计划。
大数据技术还可以用于人员管理,包括对军事人员的健康状况、心理状态等进行监测和分析,从而保障军事人员的身心健康。
4. 物资支持和后勤保障大数据技术在美军中还应用于物资支持和后勤保障。
通过对物资运输、仓储、消耗等数据进行分析,美军可以实现对物资的精准调配和有效管理,从而提高了物资的利用率和后勤保障能力。
二、大数据技术在美军中的启示1. 整合多源数据美军的大数据技术应用给我们一个很重要的启示,那就是整合多源数据。
在现代战争中,情报来源多样化,包括卫星侦察、无人机监视、情报网收集等多种渠道。
我们需要充分整合这些数据,通过大数据技术进行综合分析,提高军事情报的获取和利用效率。
2. 提高决策精准度美军的大数据技术应用还告诉我们,大数据技术可以提高决策的精准度。
在现代战争中,信息量巨大,而且信息的准确性和及时性对决策的影响巨大。
通过大数据技术,可以更加准确地了解战场情况和敌情,为决策提供更为可靠的支持。
大数据技术在美军中的应用及启示随着科技的飞速发展,大数据技术在各个领域得到了广泛应用,包括军事领域。
美军作为世界上最强大的军事力量之一,自然也积极采用大数据技术来提升作战效能和战场决策能力。
下面我将介绍大数据技术在美军中的应用及其对我们的启示。
大数据技术在情报领域的应用对于美军的情报收集和分析工作至关重要。
美军利用大数据技术来收集、分析和处理各种军事情报数据,从而提升对敌方战力、行动意图以及战场态势的了解。
通过对大数据的深入分析,美军能够更准确地预测对手的行动,并做出相应的部署和战略决策。
大数据技术在战略规划和指挥控制方面的应用也为美军带来了巨大的优势。
美军通过大数据技术对作战指挥控制系统进行优化和升级,使指挥官能够更高效、更准确地掌握各个部队的行动情况,并及时做出相应的调整和指挥。
大数据技术还能帮助美军进行作战规划和决策分析,提升作战效能和成功率。
大数据技术还在态势感知和作战模拟方面发挥着重要作用。
通过对大数据模型的搭建和分析,美军能够实时了解战场态势和敌我双方的兵力分布、装备情况等信息,从而更好地进行态势感知和作战部署。
大数据技术还能够帮助美军进行实时的作战模拟,预测不同战略和战术方案的效果,提前做出调整和优化,减少战争风险。
上述应用可以给我们带来以下几点启示。
大数据技术的应用需要具备强大的数据收集和分析能力。
只有拥有大量、多样化的数据,并有能力对其进行深入分析,才能发挥大数据技术的优势。
我们需要加强数据的收集和整理工作,提升数据的精准性和实时性。
大数据技术的应用需要支持强大的计算和存储能力。
大数据技术会产生海量的数据,对计算和存储能力提出了极高的要求。
我们需要增加计算和存储设备的投入,并采用高效的算法和技术来提升计算和存储效能。
大数据技术的应用需要有强大的安全保障措施。
军事领域的数据涉及到国家安全和军事机密,因此安全性成为大数据技术应用的重中之重。
我们需要加强数据的保护和安全管理,确保敌人无法获取军事数据,并采取措施防止数据泄露和滥用。
美国NIST发布隐私框架1.0版该工具将有助于优化数据的有益使用,同时保护个人隐私。
我们的社会已然成为数据驱动型社会,有一项棘手的平衡行为要执行即:构建使用个人数据的创新产品和服务,同时保护人们的隐私。
为了帮助组织保持这种平衡,美国国家标准技术研究院(NIST)提供了一种用于管理隐私风险的新工具。
该机构在一月份发布了NIST隐私框架 1.0版:通过企业风险管理改善隐私的工具。
该框架是与众多利益相关者合作,一路从草案版本到最终确定发布版本开发而来的,为希望改进其使用和保护个人数据方法的组织提供了一组有用的隐私保护策略。
该出版物还提供了有关隐私风险管理概念以及隐私框架与NIST网络安全框架之间关系的说明。
标准与技术商务部副部长兼NIST主任Walter G. Copan认为:“在当今的数字时代,隐私比以往任何时候都重要,隐私框架的开发已经获得了强有力的支持,这表明迫切需要工具来帮助组织构建提供真正价值并保护人们隐私的产品和服务。
”个人数据包括公司在正常业务过程中可能会收集和使用的有关特定个人的信息,例如其地址或社会安全号码。
可以使用此数据来标识提供该数据的人员,所以组织必须经常采取措施以确保不会以可能使人难堪、危害或损害客户的方式滥用这些数据。
NIST隐私框架不是法律或法规,而是一种自愿性工具,可以帮助组织管理因其产品和服务而引起的隐私风险,并证明其符合可能影响它的的法律,例如《加州消费者隐私法》和欧盟的通用数据保护条例。
它可以帮助组织确定他们想要实现的隐私结果,然后确定需要采取的行动的优先级。
NIST的高级隐私政策顾问兼框架负责人Naomi Lefkovitz说:“您会在框架中找到构建模块,可以帮助您实现隐私目标,其中可能包括组织需要遵循的法律。
如果您想考虑如何通过更具隐私保护性的产品或服务来提高客户信任度,则该框架可以帮助您做到这一点。
但是我们将其设计为对任何法律均不可知,因此无论您的目标是什么,它都能为您提供帮助。
NIST SSDF解读一、概述NIST SSDF(NIST Standard Statistical and Structural Database Framework)是一种用于统计和结构数据库管理的标准框架。
该框架由美国国家标准技术研究所(NIST)开发,旨在提供一种通用的数据模型和标准接口,以支持各种统计和结构数据库的集成和互操作。
本文将对NIST SSDF进行深入解读,探讨其背景、目的、核心概念、数据模型和标准接口等方面。
二、背景与目的随着大数据时代的到来,各种统计和结构数据库的数量和规模不断扩大,这些数据库在政府、学术界、工业界等多个领域得到了广泛应用。
然而,由于缺乏统一的框架和标准,这些数据库之间的集成和互操作存在诸多困难。
为了解决这一问题,NIST SSDF应运而生。
NIST SSDF的目的是提供一种通用的数据模型和标准接口,以支持各种统计和结构数据库的集成和互操作。
通过使用SSDF,不同来源的数据库可以更容易地进行数据交换、共享和整合,从而提高数据处理效率和数据质量。
此外,SSDF还有助于推动统计和结构数据库领域的技术创新和应用拓展。
三、核心概念NIST SSDF的核心概念包括数据元素(Data Element)、变量(Variable)、数据集(Dataset)和元数据(Metadata)。
1. 数据元素(Data Element):数据元素是构成SSDF数据模型的基本单元,它包含了特定实体的某一方面或某一属性的信息。
例如,一个人的人口信息可以由多个数据元素组成,如姓名、性别、出生日期等。
2. 变量(Variable):变量是用于描述数据元素的一组属性,它定义了数据元素的取值范围和数据类型。
变量可以是定量的(数值型变量)或定性的(分类变量)。
3. 数据集(Dataset):数据集是由一组相关数据元素组成的集合,它可以包含一个或多个变量。
数据集通常用于表示某一特定主题或领域的数据。
In the 21st century, data is gold. It is what underpins some of the biggest companies in the world, including Amazon, Facebook, and Google. The need for gathering and using data has become a major economic driver, spawned a cybercriminal underworld, and pushed technological advancement to gather ever-increasing amounts of data, faster and more efficiently.在21世纪,数据就是黄金。
它支撑起了世界上的巨无霸公司,包括亚马逊、Facebook和谷歌。
对数据收集和利用的需求不仅演化成为主要的经济驱动力,而且也催生出网络犯罪的地下世界。
这些需求还推动了技术进步,实现更加快速、高效地收集不断增长的数据量。
过去20年,很多组织已经找到了收集和利用客户数据的信息技术方法,但只有很少组织花时间来关注这些数据的收集和利用是如何影响个人隐私的。
过去数年,政府一直致力控制个人数据资料的收集和牟利。
越来越多的、旨在规范个人数据的收集、管理、存储及保护等法律的出台,就反映了这种强烈的情绪。
欧盟的《一般数据保护条例》(General data protection Regulation,简称GDPR)颇具代表性。
上月末,美国商务部国家标准与技术研究院(NIST)发布了一个新的隐私保护框架。
它提供了一系列策略,以改进隐私保护实务,建立与客户的信任关系,遵守与日俱增的隐私保护法规。
这份以《通过企业风险管理改善隐私保护的工具》为副标题的隐私保护框架,与2014年NIST发布的《网络安全框架》相配套,为各类组织保护隐私实务提供指引。
美国NIST《⽹络安全框架》中⽂版(⽔平有限,翻译粗糙,仅供参考)为改善关键基础设施⽹络安全框架Version 1.0国家标准与技术研究所February12, 2014TableofContentsExecutiveSummary (1)1.0 Framework Introduction (3)2.0 FrameworkBasics (7)3.0 HowtoUsetheFramework (13)AppendixA:FrameworkCore (18)AppendixB:Glossary (37)AppendixC:Acronyms (39)ListofFiguresFigure1:FrameworkCoreStructure (7)Figure2:NotionalInformationandDecisionFlowswithinanOrganization (12)ListofTablesTable1:FunctionandCategoryUniqueIdentifiers (19)Table2:FrameworkCore (20)执⾏摘要美国的国家安全和经济安全取决于关键基础设施的可靠运作的。
⽹络安全威胁攻击⽇益复杂和关键基础设施系统的连接,把国家的安全,经济,风险公众安全和健康。
类似的财务和声誉风险,⽹络安全风险影响到公司的底线。
它可以驱动多达费⽤及影响收⼊。
它可能会损害⼀个组织的创新,以获得并保持客户的能⼒。
为了更好地解决这些风险,总统于2013年2⽉12⽇,其中规定“[I] t是美国的政策,加强国家的安全和弹性颁布⾏政命令13636,”改善关键基础设施的⽹络安全。
“关键基础设施和维护,⿎励⾼效,创新,和经济繁荣,同时促进安全,保安,商业机密,隐私和公民⾃由。
“在制定这项政策的⽹络环境,执⾏命令为⾃愿风险的发展需要基于⽹络安全框架 - ⼀套⾏业标准和最佳实践,帮助企业管理⽹络安全风险。
NIST网络安全控制目录迎来新突破:去除“联邦”表述,不再仅限于“网络”E安全8月20日讯美国国家标准与技术研究所(简称NIST)决定将“联邦”一词从其网络安全与隐私控制法规目录当中去除,而此项举措正是经历了长期拖延之后,最终于本周提出的一系列整改建议之一"络安全与隐私控制法规"最新修订NIST研究员罗恩·罗斯解释称,这是因为“目前包括美国联邦、各州以及地方政府与私营部门在内的各个方面都在使用同样的技术方案,而且也面临着同样的网络威胁。
”经过长达半年的漫长过程,NIST的研究人员们意识到这份控制目录除了对于美国联邦政府机构等传统“客户群体”极具意义以外,其它各方也可能同样从中获得重要的启发与指引。
因此,他们决定将这份名为《联邦信息系统与各组织安全与隐私控制》的目录(简称NIST SP-800-53)变更为《信息系统与各组织安全与隐私控制》,即删去“联邦”这一表述。
SP 800-53的上一次修订发生在2015年,不过最后一次完整重写则在2013年。
作为这份新草案的主要作者之一的罗斯在外媒采访当中表示,“目前还有其它一些对此抱有兴趣的社区可以自主利用本目录中提供的控制手段,并借此获得助益。
我们希望新草案能够受到各行业以及学术界内新受众的青睐”,甚至可以超越美国边界,因为这类资料“在全球范围内拥有大量受众群体。
”整合隐私控制罗斯同时指出,新目录还对所有变更进行了标记,其中包括将隐私控制整合至目录当中,这使其拥有了“独一无二”的比较优势。
“没有任何其它文件能够如此全面地将网络安全与隐私”整合至同一份指南当中。
罗斯认为,这一点在物联网技术蓬勃发展的背景之下显得尤为重要。
如果大家正在设计物联网设备或者智能家居,意味着其将把所有计算能力推向边缘网络。
从传统角度讲,边缘位置的安全性、保密性、完整性以及可访问性一直受到高度关注,而如今物联网与智能家居设备中驻留的个人数据同样需要隐私保护,二者可以相互加强。
收稿日期:2019-06-12基金项目:国家社会科学基金重大项目 大数据环境下政务信息资源归档和管理研究 (项目编号:17ZDA293)㊂作者简介:张斌(1967-),男,教授,博士生导师,研究方向:信息资源管理㊁知识管理㊂张臻(1989-),男,讲师,研究方向:信息管理与网络安全治理㊂通讯作者:王露露(1993-),女,博士研究生,研究方向:信息资源管理㊂㊃情报理论与前瞻观点㊃美国政府NIST大数据互操作性框架的特点研究及启示张㊀斌1㊀王露露1㊀张㊀臻1,2(1.中国人民大学信息资源管理学院,北京100872;2.北京电子科技学院管理系,北京100070)摘㊀要:[目的/意义]对美国政府大数据互操作性框架提出的背景㊁具体内容和主要特点进行分析与总结,以期为我国制定大数据参考框架㊁促进跨界合作提供有益的参考㊂[方法/过程]以内容分析法和文本分析法为主要研究方法,以从美国NIST官网获得的公开政策㊁研究报告等作为主要数据来源,从数据层㊁框架层㊁角色层和应用层等方面分析总结美国大数据参考框架的特点㊂[结果/结论]分析发现:NIST构建了一个具有较强参考性与适用性的大数据概念框架,着重体现了大数据范式的前后变化并鼓励挖掘大数据应用的可能性㊂启示我国政府在制定大数据参考框架时,应当在理论层面达成共识的前提下,关注可参考价值与利益相关者的开发需求,同时在需求与价值之间构建起映射关系㊂关键词:大数据;政府;参考框架;概念模型;利益相关者DOI:10.3969/j.issn.1008-0821.2019.11.001 中图分类号 G201㊀文献标识码 A㊀文章编号 1008-0821(2019)11-0003-10CharacteristicsofNISTBigDataInteroperabilityFrameworkandItsEnlightenmentZhangBin1㊀WangLulu1㊀ZhangZhen1,2(1.SchoolofInformationResourceManagement,RenminUniversityofChina,Beijing100872,China;2.SchoolofManagement,BeijingElectronicScience&TechnologyInstitute,Beijing100070,China)Abstract:[Purpose/Significance]ThroughtheanalysisonthebackgroundandcontentofNISTBigDataInteropera⁃bilityFramework,themaincharacteristicsweresummarizedtoprovidebeneficialadviceforthebigdatadevelopmentinChina.[Method/Process]Withthemethodsofcontentanalysisandtextanalysis,fromtheaspectsofdatalayer,framelayer,rolelayer,andapplicationlayer,theanalysisandsummaryonNISTBigDataInteroperabilityFrameworkweremadebasedonthedataofpublicpolicyandresearchreportmainlycollectedfromtheNISTofficialwebsites.[Result/Con⁃clusion]ItisfoundthatNISTestablishedacomparativelyperfectreferenceframework,andemphasisonthechangesinthebigdataparadigmandencouragethepossibilityofbigdataapplications.Whenformulatingthebigdatareferenceframe⁃work,Chinacanpayattentiontothereferencevalueandthedevelopmentneedsofstakeholdersunderthepremiseofreac⁃hingaconsensusonthetheoreticallevel,andbuildamappingrelationshipbetweendemandandvalue.Keywords:bigdata;government;referenceframework;conceptualmodel;stakeholder㊀㊀大数据已成为推动经济发展㊁完善社会治理㊁提升政府服务和监管能力的新动力和新途径㊂各国在积极制定和实施大数据发展战略的过程中,面临一个重要挑战就是如何处理好跨部门㊁跨领域的大3 2019年11月第39卷第11期现代情报JournalofModernInformationNov.,2019Vol 39㊀No 11数据管理问题从而发挥大数据的基础性和战略性价值㊂2016年5月,美国国家标准与技术研究院(NationalInstituteofStandardsandTechnology,简称NIST)发布了大数据互操作性框架(NISTBigDataInteroperabilityFramework)并于2018年3月进行了更新[1],以适应新阶段的发展要求㊂美国的NIST大数据互操作性框架针对的是跨部门大数据管理与应用问题,本文通过分析与研究该框架,对面临同样发展困境的我国大数据发展具有一定的参考价值㊂以 大数据+互操作/参考框架/参考架构/标准/概念模型 为检索关键词,笔者在中国知网检索到了87篇相关文献,在Springer㊁ScienceDirect和EBSCO检索到了323篇相关文献㊂通过中外对比,发现在关键词分布上国内外呈现出较为明显的区别㊂国内文献重点关注的是大数据指导标准的建立,譬如,肖筱华等[2]和张群[3]对当前国内大数据标准体系及标准研制情况的研究㊂相较而言,大数据参考架构和概念模型的研究成果不如标准多,但是也占据了较高的比例,譬如,郑大庆等综合了大数据治理的内部要素和外部应用特征构建了一个大数据治理参考框架[4]㊂国外文献相较于标准制定,更偏重于对参考架构的研究,NadalS等遵循软件工程原则细化了大数据系统的参考模型,并用它创建支持Semantic-aware大数据系统的软件参考体系架构[5]㊂PääkkönenP等认为将Twitter㊁Linke⁃dIn和Facebook等大数据开发案例的方法抽取到统一概念模型上尚且存在研究空白,因此,对已公布大数据用例实现架构进行了分析,由此提出了大数据系统的技术独立参考架构[6]㊂笔者认为,国家标准和行业标准提供的是相对具体的指导,在大数据范式尚处于探索阶段时,宏观概念层次的参考架构可以为大数据领域的创新提供更多的空间,抽象化的体系也更加有利于不同技术㊁组织和资源的融合与交流,然而,国内对该主题的研究尚显得较为薄弱,这为本文提供了研究空间㊂另外,笔者未发现以NIST大数据参考性框架为研究对象的文章,因此,本文以该框架作为介绍与分析的对象,具有一定的研究意义㊂本文选择美国NIST大数据互操作性框架作为研究对象的主要原因如下:第一,该框架旨在促进政府各部门㊁学界与企业之间开展有效合作,所针对的问题是当前大数据发展过程中所有国家政府都需要面临的问题,大数据的概念之所以成立,在于数据通过有机㊁大规模集合可达成量变引起质变,该特性决定了必须进行跨部门㊁跨界合作,而在合作过程中的优劣互补㊁利益协调等问题同样困扰着我国政府部门㊂第二,2016年10月,习近平在主持中央政治局第三十六次集体学习时指出: 以数据集中和共享为途径,建设全国一体化国家大数据中心,推进技术融合㊁业务融合㊁数据融合,实现跨层级㊁跨地域㊁跨系统㊁跨部门㊁跨业务的协同管理和服务[7] ㊂该指导理念与美国政府 大数据研究和发展计划 的核心原则有共通之处,都强调了对国家大数据开展工作进行集中指导与统一规划㊂NIST大数据互操作性框架是美国 大数据研究和发展计划 的政策产物,与我国自上而下的工作部署方向相一致,因此,可为我国的大数据战略开展提供一定的参考㊂第三,该计划于2016年形成,截至目前已实施了两年多的时间,在这期间并未废止且在向第二阶段推进,可见该框架具有较强的可行性;同时,该框架还对第三阶段的工作重点提前进行了规划,对于未来大数据的趋势形成了一定的洞见,因此,也具有一定的前瞻性㊂1 提出背景1 1㊀大数据的潜在价值催生合作需求早在2002年,为了对大容量的流数据进行实时数据分析,美国政府就开发大规模可拓展的集群基础设施与IBM公司展开合作[8]㊂由此带动IBM后续开发的IBMInfoSphereStream和IBMBigData等大数据产品受到了美国政府和企业的广泛欢迎㊂2009年,美国政府Data gov网站开始运行,大大推动了美国的政府信息公开和数据开放㊂所建设的数据仓库整合了涵盖交通㊁经济㊁卫生保健㊁教育和人类服务等领域的数据以及多个应用的数据源[9]㊂2010年,总统科学技术顾问委员会在其‘设计数字化未来:联邦资助的网络和信息技术研究与开发(DesigningaDigitalFuture:FederallyFundedResearchandDevelopmentinNetworkingandInformationTechnology)“报告中明确阐述了美国4 2019年11月第39卷第11期美国政府NIST大数据互操作性框架的特点研究及启示www.xdqb.netNov.,2019Vol 39㊀No 11即将实施大数据战略㊂2012年,奥巴马政府启动 大数据研究和发展计划(BigDataResearchandDevelopmentInitiative) ,总投资为2亿美元,计划涉及80多个合作项目,要求多个联邦部门共同参与,包括白宫科技政策办公室,国家科学基金会,国家卫生研究院,国防部,国防高级研究项目局,能源㊁健康和人类服务部以及美国地质调查局㊂该计划明确要求产业界㊁研究型大学和非营利组织与联邦政府合作,最大限度地利用大数据带来的机遇[10]㊂由上述发展趋势及其政策要求可见,当前美国无论是政府部门㊁商业界,还是学术界,都已经充分认识到大数据在推动经济社会发展和增进人类福祉等方面的潜在价值㊂美国已从总统层面开始推动各个部门之间积极开展合作,同时,美国政府也与IBM㊁Aamazon㊁Google等公司展开合作,从技术研发㊁产业应用等方面共同推动大数据的发展㊂因此,可以说,大数据的潜在价值已促使利益相关者之间广泛构建和发展合作关系㊂1 2㊀大数据技术应用带来挑战和问题尽管跨部门和跨界合作的政策环境已经基本具备,但是在具体的实施过程中却面临着诸多问题与挑战,主要表现为两个方面:一是在大数据的几大关键问题上尚未达成共识㊂NIST大数据公共工作小组(BigDataPublicWorkingGroup,NBD-PWG)认为,未达成共识的问题包括:1)哪些属性可以用来界定大数据解决方案;2)大数据与传统数据环境的应用流程有何区别;3)大数据环境的基本特征是什么;4)新环境如何与当前部署的体系结构进行集成;5)为加速部署强大的大数据解决方案,需要解决哪些核心科学㊁技术和标准化问题带来的挑战㊂二是尚未形成足够的大数据应用能力[11]㊂美国白宫科技政策办公室前主任霍尔德伦(JohnPHoldren)认为:美国拥有大量善于生成数据的机构,但作为一个国家,还没有充分发挥我们的能力来共享潜在竞争资源㊁协作分析与分享经验[12]㊂不同于其他物质型的国家资产,他们所对应的实现场景和所具备的价值是清晰可见的,大数据属于信息导向型资产,需要多元化的利益主体共同参与,通过持续的试验与探索才可以发现其潜在的应用价值,因此,需要足够的协作经验与顶层指导为大数据战略的开展保驾护航㊂根据2012年 大数据研究和发展计划 要求,NIST开始着手制定大数据互操作性框架,以促进大数据有关专业力量间的合作,进一步确保大数据的安全和有效应用㊂2013年1月15 17日,NIST举办了 云与大数据论坛 ,专门成立了大数据公共工作组负责开发大数据互操作性框架㊂2016年5月11日,NIST正式发布了大数据互操作性框架1 0版本,将美国的大数据发展分为3个阶段,不同阶段的工作任务对应参考框架的特定环节㊂2018年3月23日,NIST又对大数据互操作性框架进行了更新,明确指出当前美国大数据的发展已步入第二阶段[13]㊂2 核心概念界定要在大数据关键领域达成共识,确保利益相关者合作项目的顺利开展,必然要进行核心概念的界定㊂因此,该框架的目标之一是形成基于共识的理论范式,为实际操作的交流消除误区,同时也促进对大数据技术有更深刻的理解与认知,扩大其影响力㊂尽管大数据具有很多特征,但是大体量(Vol⁃ume)㊁多样性(Variety)㊁时效性(Velocity)和可变性(Variability)的 4V 特征真正推动了新型数据密集型并行架构的产生,并且决定了对大数据系统的整体设计和大数据生命周期模型的构建㊂基于大数据的 4V 特征,NIST将大数据界定为: 大数据由大量数据集组成,主要集中在数量㊁种类㊁速度和/或可变性等特征上,这些数据集通过建设可扩展架构可实现高效的存储㊁操作和分析㊂ 值得注意的是,NIST在概念界定中强调了各个特征之间的相互作用关系,同时重点关注了为了满足所需性能和成本效率需求可以使系统架构变得可扩展㊂ 系统架构可拓展 通常被描述为垂直或水平拓展两种思路,垂直拓展意味着增加处理速度㊁存储和内存的系统参数,以获得更高的性能㊂这种方法受到物理能力的限制,其改进需要引入更复杂的元素(例如,硬件和软件),无疑会增加现实过程中的时间和经济成本㊂另一种方法是使用水平扩展,即利用集成的分布式单个资源作为单个系52019年11月第39卷第11期现代情报JournalofModernInformationNov.,2019Vol 39㊀No 11统,而这种横向扩展才是大数据革命的核心㊂同时,NIST也将与大数据系统设计相关的子概念进行了界定,譬如,大数据范例(BigDataParadigm)包括跨水平耦合的独立资源分布数据系统,旨在提供有效处理大量数据集所需的可扩展性[14]㊂3㊀美国的NIST大数据互操作性框架及其特征㊀㊀NIST大数据互操作性框架的开展以NIST大数据参考架构(NISTBigDataReferenceArchitecture,NBDRA)的构建过程为主线,分为以下3个阶段:第一阶段,确定高级别大数据参考架构关键组件,这些组件是技术㊁基础架构和供应商当前所不可知的㊂第二阶段,定义NBDRA组件之间的通用接口㊂第三阶段,通过通用接口构建大数据通用应用程序来验证NBDRA㊂不同的发展阶段对应不同的框架版本,指导相应阶段大数据公共工作小组目标的实现㊂NIST大数据互操作性框架主要由概念㊁分类㊁应用案例和一般要求㊁安全和隐私㊁架构白皮书调查㊁参考架构和标准路线图七大主题组成,这些主题并非随意选择,是由大数据公共工作小组通过调查与研究所得㊂本文在进行介绍性分析时,并未按照该框架的主题顺序展开,原因在于各个主题之间前后逻辑顺序与相互关联性较弱,不便于在文章中进行系统性分析与特征总结㊂因此,笔者对各个主题进行了整合与概括,将其分为数据层㊁框架层㊁角色层和应用层㊂3 1㊀数据层:关注新旧数据范式的变化理解大数据工程首先需要理解数据本身的特征㊂通过检查不同颗粒度的数据在数据资源中所占的比例情况,可以更好地看到数据是怎样改变了大数据范式以及不同数据层级需要重点解决的问题㊂因此,NIST提供了基于不同数据粒度的数据特征分析,见图1㊂数据特征层级模型(DataCharacter⁃isticHierarchy)将大数据的数据状态分为数据㊁文件㊁数据集和多个数据集4个层次㊂数据层在新的大数据范式中没有发生大的变化,还是通过自身的数据类型和其他上下文数据(或元数据),元数据提供关于数据的历史记录等进行理解㊂数据层关注的是数据格式㊁数据价值和图1㊀数据特征层级模型[15]㊀词汇表㊁元数据和语义㊁质量和真实性㊂数据会被分配到描述具体实体㊁事件或者事物的文件中,即文件层㊂在文件层,体现出了大数据带来的变化,譬如,在非结构化的文本中,1个数据文件可以指的是1个短语或者句子㊂该层次关注的是文件格式㊁复杂性㊁容量㊁元数据和语义㊂文件分组后即形成了数据集,数据集层次也体现了大数据带来的变化㊂例如,在非结构化文本中,数据集指的是完整的文档㊂该层次关注的是质量与一致性㊂对多个数据集的关注即形成了集成或融合多个数据集的需求,该层次体现的是大数据的多样性㊂大量的数据集不能总是转换成一个集成结构,例如,大量的天气数据无法都转换在同一个时空网格上㊂由于无法将大容量数据集简单复制到规范化结构中,因此正在开发新的技术来根据业务需求来集成数据㊂例如,在非结构化文本中,多个数据集可以同时引用一个文档集合㊂该层次关注的是个体数据集的标识㊂3 2㊀框架层:提高系统框架的可参考性制定统一的参考框架(ReferenceArchitec⁃tures)可以通过权威的信息来源,为某个主题领域存在的多样化的系统架构和解决方案提供指导并给予一定的约束[16]㊂鉴于大数据领域的复杂性,NIST专门推出了大数据参考框架(NISTBigDataReferenceArchitecture,NBDRA)㊂为此,专职工作小组调查了目前支持大数据框架的领先企业或个人发布的大数据平台,并对收集到的资料进行了分析,从中提炼出了当前普遍的大数据开发架构之间的一致性,并将调查结果形成了白皮书,即架构白皮书调查(ArchitecturesWhitePaperSurvey)[15]㊂6 2019年11月第39卷第11期美国政府NIST大数据互操作性框架的特点研究及启示www.xdqb.netNov.,2019Vol 39㊀No 11NIST大数据架构主要由2个坐标轴㊁5个角色与2个底层结构组成㊂首先,该框架围绕信息价值(InformationValue)横轴和信息技术价值(Infor⁃mationValueTechnology)纵轴展开㊂沿着横轴,通过数据收集㊁保管㊁分析和可视化等价值链后续流程来创建价值㊂沿着纵轴,通过提供网络平台㊁基础设施㊁应用工具和其他IT服务来创建价值,这些服务用于承载和操作大数据,以支持所需的数据应用程序㊂其次,5个角色指的是系统协调员(SystemOrchestrator)㊁数据提供者(DataProvid⁃er)㊁数据用户(DataConsumer)㊁大数据框架提供者(BigDataFrameworkProvider)和大数据应用提供者(BigDataApplicationProvider)㊂在这些角色中,需要注意的是,大数据应用程序提供者和大数据框架提供者使用 Provider 一词表示这些组件在系统中提供或实现特定的技术功能,并非普遍意义上的 提供 ㊂总体上看,这5个角色是在任何大数据系统中都必然存在的技术角色㊂其中,系统协调员负责定义所需的数据应用程序活动,并将其集成到一个可操作的垂直系统中;数据提供者负责将新的数据或信息导入大数据系统;大数据应用提供商负责执行数据生命周期,满足安全㊁隐私需求和系统编配定义需求;大数据框架提供商负责建立计算框架,在转换特定应用的同时,保护彼此数据的隐私和完整性;数据用户指的是终端用户及其使用大数据应用程序成果的其他外部系统㊂最后,容纳5个角色的2个底层结构分别是隐私与安全(SecurityandPrivacy)㊁管理(Management),这两个底层结构是所有大数据系统都必不可少的,负责为系统的所有组件提供保护隐私与安全的职能和管理的服务㊂此外,图2中的服务应用代表软件的可编程接口, DATA 表示数据在组件之间通过引用或者直接的物理流动, SW 表示在处理流程中大数据软件工具发生转移㊂图2㊀NIST大数据参考概念模型[17]㊀3 3㊀角色层:增强参考架构的适用性在传统的数据项目中,数据系统一般是由一个组织进行主持㊁开发㊁部署和资源承载,而在大数据时代,系统的开发布局则是转变成为分布式的㊂由2 3的大数据参考框架可见,在系统中会出现多种技术角色,这些角色可以是个人㊁组织㊁硬件或者软件,某个角色可以固定在某个业务实体中,也可以由不同的业务实体共同实现,无需指定具体的7 2019年11月第39卷第11期现代情报JournalofModernInformationNov.,2019Vol 39㊀No 11参与角色或在合作情况下划分清晰的业务边界㊂因此,大数据系统需要适用于各种不同的业务环境,既要满足紧密集成的企业系统,又要适应松散耦合㊁依赖不同利益相关者合作的垂直行业㊂NIST构建的大数据互操作性框架就是为了达成上述需求,他们认为在大数据系统开发项目中, 角色(Roles) 与 演员(Actors) 之间的关系与电影角色类似,某个角色可以由不同的演员来承担,而不同的演员也可以重复扮演同一个角色,同样地,某个活动可以由不同的行动者来承担,而不同的行动者也可以承担多种活动㊂为此,NIST提出了基于NBDRA系统的 角色 与 演员 样本分类体系(RolesandaSamplingofActorsintheNBDRATaxonomy),具体参见图3㊂NBDRA 角色 与 演员 分类体系中的7个角色是由2 3的大数据参考框架中的5个角色与2个底层结构组成,即系统协调员㊁数据提供者㊁数据用户㊁大数据框架提供者㊁大数据应用提供者㊁隐私与安全和管理角色组成㊂图3㊀基于NBDRA系统的 角色 与 演员 样本分类体系[17]㊀㊀㊀7个角色的含义与职能如下:1)系统协调员负责提供并确保系统必须满足的总体需求,包括策略㊁治理㊁体系结构㊁资源㊁业务需求㊁监视或审计等㊂虽然该角色的出现早于大数据系统,但在大数据范式中,一些与之相关的设计活动实则已经发生了变化,应当进行相应的调整与更新㊂2)数据提供者负责为自己或者其他角色提供数据㊂NIST提出的这一概念本身并不新鲜,但是大数据带来了强大的数据收集和分析功能,为该角色创建数据价值开辟了新思路㊂此外,政策环境也为该角色提供了助力,美国政府积极倡议开放数据,作为公共数据管理者的联邦机构也应积极承担数据提供者的角色㊂3)数据用户是大数据系统的价值输出所在㊂正常情况下,数据用户收获的价值应当与大数据提供者提供的服务相对接㊂该角色受大数据系统的影响较小,较为明显的相互作用主要在于反馈市场需求㊂4)大数据框架提供者拥有大数据应用程序提供者在创建特定应用程序时所需要的一般资源或服务,包括基础架构框架㊁数据平台框架和处理框架等㊂大部分情况下,该角色提供的是多种技术的混合实现,这是大数据所带来的新变化,也是未来需要关注的新领域㊂5)大数据应用程序提供者按照数据生命周期执行具体的操作,满足系统协调者提出的需求,同时满足安全和隐私需求㊂该角色是将大数据框架内的一般功能结合起来产生特定数据系统的地方㊂6)隐私与安全角色主要开展的活动时隐私与安全的政策制定与监控,需要与系统协调员在政策㊁需求和审计等方面进行合作,还需要在系8 2019年11月第39卷第11期美国政府NIST大数据互操作性框架的特点研究及启示www.xdqb.netNov.,2019Vol 39㊀No 11统开发㊁部署和操作方面,与大数据应用程序提供者和大数据框架提供者进行交互㊂7)管理角色是为了顺应大数据的4V特征而建立的多样性㊁复杂性和多功能平台,主要用于存储㊁处理和管理复杂数据㊂该角色既涉及处理大数据环境下的系统相关,也要处理大数据环境下的数据相关㊂3 4㊀应用层:挖掘大数据应用的可能性如果将大数据系统视为一个黑箱,想要尽可能地输出更多的数据价值,就必须从源头掌握大数据最新的技术㊁面临的挑战㊁市场发展等相关情况,从而向黑箱输入更加合理的需求,因此,应当重视挖掘大数据应用的更多可能性,应用问题也是大数据发展过程中较为突出的一大挑战㊂NIST为此专门进行了相关调研,形成了一份跨利益相关者的需求清单,该清单列举了九大基础应用领域,分别是:政府运行㊁商业活动㊁国防㊁医疗与生命科学㊁深度学习和社交媒体㊁研究生态系统㊁天文学和物理学㊁地球㊁环境与基地科学和能源九大领域㊂基于上述九大领域,NIST又从中归纳出了七大数据需求,使之更有延伸空间和概括性㊂具体的需求是:数据资源(如,数据大小㊁文件格式㊁增长率㊁静态或动态);数据转换(如,数据融合㊁分析);功能(如,软件工具㊁平台工具㊁硬件条件);数据使用(如,以文本㊁表格㊁可视化和其他格式处理结果);安全性和隐私;生命周期管理(如,策划㊁转换㊁质量检查㊁分析前处理)和其他需求㊂针对七大需求,可以与2 3的系统架构的7个角色相对应,形成数据需求 NBDRA组件映射表,具体参见表1㊂表1㊀数据需求 NBDRA组件映射表[18]数据需求系统架构组件数据资源ң数据提供者数据转换ң大数据应用程序提供者功㊀㊀能ң大数据框架提供者数据使用ң数据用户安全和隐私ң安全和隐私底层架构生命周期管理ң系统协调者㊁管理底层架构其他需求ң所有组件和底层架构值得注意的是,在挖掘大数据应用可能性的同时,也要注意隐私和安全的保护㊂NIST将大数据系统中的隐私与安全分为以下5种情况,分别是数据保密性㊁数据来源㊁系统状况㊁公共政策㊁社会和跨组织主题㊂前3种情况大致符合传统的数据机密性㊁完整性和可用性要求,在大数据范式下,又被重新定位为需要并行考虑的大数据隐私与安全问题㊂4㊀对我国的启示4 1㊀以可控性为前提,在概念层面达成局部共识我国国务院2015年8月印发的‘促进大数据发展行动纲要“将大数据界定为: 以容量大㊁类型多㊁存取速度快㊁价值密度低为主要特征的数据集合,正快速发展为对数量巨大㊁来源分散㊁格式多样的数据进行采集㊁存储和关联分析,从中发现新知识㊁创造新价值㊁提升新能力的新一代信息技术和服务业态 [19]㊂无论国内还是国外,当前对于大数据尚未有一个公认的定义,不同的定义基本是从大数据的3V或者4V等特征出发,3V与4V都是当前在大数据领域较为普遍地达成共识的大数据特征描述,除了之前提到的4V,此处的3V指的是大体量(Volume)㊁多样性(Variety)和时效性(Velocity)㊂总之,各界学者试图通过这些特征的阐述和归纳试图给出其定义[20],包括本文研究的NIST大数据框架㊂尽管如此,在概念上对大数据形成局部共识还是十分必要的,一方面,在实践过程中,利益相关者需要致力于构建同一个解决方案,相互之间需要共同语言进行交流与理解,方可使各方作用于同一着力点,尽量减少沟通问题和扩大参与范围;另一方面,大数据解决方案与大数据的特征是密不可分的,大数据的特征决定了大数据应用方案的创新,大数据思维带来了不同粒度层次的数据价值的变化,这些是在具体实施过程中无法绕开的理解性问题,必须在特定工作范围内达成一定的共识㊂笔者认为,在实践过程中,对于概念的界定,应以可控性为重点,以适用人群为导向,达成局部的共识,不必过度拘泥于具体的表述㊂任何范式在最初的时候概念都是纲要性的,探索性的概念界定不一定是完美的㊂因此,从大数据的3V或者4V92019年11月第39卷第11期现代情报JournalofModernInformationNov.,2019Vol 39㊀No 11。