大数据标准体系规划与路线图(2018-2020)
- 格式:doc
- 大小:376.58 KB
- 文档页数:15
大数据、云计算系统高级架构师课程学习路线图大数据之Linux+大数据开发篇项目部分大数据之阿里云企业级认证篇大数据之Java企业级核心技术篇大数据之PB级别网站性能优化篇项目部分大数据之数据挖掘\分析&机器学习篇项目部分大数据之运维、云计算平台篇项目部分c:\iknow\docshare\data\cur_work\javascript:open53kf()课程体系北风大数据、云计算系统架构师高级课程课程一、大数据运维之Linux基础本部分是基础课程,帮大家进入大数据领域打好Linux基础,以便更好地学习Hadoop,hbase,NoSQL,Spark,Storm,docker,openstack等众多课程。
因为企业中的项目基本上都是使用Linux环境下搭建或部署的。
1)Linux系统概述2)系统安装及相关配置3)Linux网络基础4)OpenSSH实现网络安全连接5)vi文本编辑器6)用户和用户组管理7)磁盘管理8)Linux文件和目录管理9)Linux终端常用命令10)linux系统监测与维护课程二、大数据开发核心技术- Hadoop 2。
x从入门到精通本课程是整套大数据课程的基石:其一,分布式文件系统HDFS用于存储海量数据,无论是Hive、HBase或者Spark数据存储在其上面;其二是分布式资源管理框架YARN,是Hadoop 云操作系统(也称数据系统),管理集群资源和分布式数据处理框架MapReduce、Spark应用的资源调度与监控;分布式并行计算框架MapReduce目前是海量数据并行处理的一个最常用的框架。
Hadoop 2。
x的编译、环境搭建、HDFS Shell使用,YARN 集群资源管理与任务监控,MapReduce编程,分布式集群的部署管理(包括高可用性HA)必须要掌握的。
1)大数据应用发展、前景2)Hadoop 2。
x概述及生态系统3)Hadoop 2。
x环境搭建与测试1)HDFS文件系统的架构、功能、设计2)HDFS Java API使用3)YARN 架构、集群管理、应用监控4)MapReduce编程模型、Shuffle过程、编程调优1)分布式部署Hadoop2.x2)分布式协作服务框架Zookeeper3)HDFS HA架构、配置、测试4)HDFS 2.x中高级特性5)YARN HA架构、配置6)Hadoop 主要发行版本(CDH、HDP、Apache)1)以【北风网用户浏览日志】数据进行实际的分析 2)原数据采集 3)数据的预处理(ETL) 4)数据的分析处理(MapReduce)课程三、大数据开发核心技术—大数据仓库Hive精讲hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。
40特别 报道S P E C I A LP L A NBIG DATA 大数据“大数据+”模式牵手“制造业+”——乌镇大数据产业园片区建设“路线图”出炉近日,嘉兴桐乡市出台了《中国(浙江)自由贸易试验区嘉兴联动创新区乌镇大数据产业园片区建设实施方案》,希望通过探索乌镇大数据产业园片区乌镇区块“大数据+”模式和桐乡经济开发区区块“制造业+”模式的结合与创新,进一步推动高质量外资集聚地建设,全力把乌镇大数据产业园片区打造成浙江乃至全国最具发展活力的数字经济产业发展高地。
区域范围乌镇大数据产业园区总规划面积为25.66平方公里,由以乌镇镇为核心的北区部分和以桐乡经济开发区为主导的南区部分组成。
北部区块面积7.32平方公里,四至范围为:北至嘉湖公路,南至规划运河大道,西至湖盐线(姚太线),东至杜家木桥港。
南部区块面积18.34平方公里,四至范围为:北至灵安港,南至高桥大道和高铁线,西至灵安路—张家石桥港,东至人民路、迎宾大道和乌镇大道。
乌镇大数据产业园片区规划图目标定位探索乌镇大数据产业园片区乌镇区块“大数据+”模式和桐乡经济开发区区块“制造业+”模式的结合与创新,推动乌镇大数据产业园片区与长三角先进地区的产业、人才对接,努力成为数字经济集群产业发展的先进示范地。
20222025推动能在乌镇大数据产业园片区落地推广的全国自贸区改革试点经验应复尽复,全面推广;积极向上争取省级及以上经济社会管理权限下放,在片区内联动共享;引进世界500强、全球行业龙头企业和跨国公司区域总部型项目3个以上;加速建设浙江中韩(桐乡)国际合作产业园;对外贸易水平进一步提升,基本形成投资贸易便利、法制环境规范、金融服务完善的营商环境。
力争提供创新案例2个以上,推动区域改革协同、创新协同,推进片区高质量发展,探索形成可复制、可推广的创新试点经验3条以上;引进世界500强、全球行业龙头企业和跨国公司区域总部型项目5个以上,建成全省乃至全国最具吸引力的数字经济开放创新示范区。
2024年贵州专业技术继续教育公需科目考试试题及答案单选题01、种业种植的收益远高于农产品生产,但其中的难点不包括(C)。
A、研究周期长B、跨学科领域C、人员匮乏D、投资额巨大02、下列选项中,关于党的二十大报告中提出的构建新发展格局的理解,表述不正确的是(B)。
A、是适应我国发展新阶段要求、贯彻新发展理念塑造国际合作和竞争新优势的必然选择B、是被迫之举和权宜之计C、是以全国统一大市场基础上的国内大循环为主体,不是各地都搞自我小循环D、是具有显著制度优势和坚实改革基础的03、党的二十大报告中明确提出,在人才建设方面的基本要求是 (A)。
A、聚天下英才而用之B、深化人才发展体制机制改C、营造环境04、元宇宙的英文是Metaverse,这个词最早起源尼尔·斯蒂芬森的小说(C)。
A、《佐迪亚克》B、《神经漫游者》C、《雪崩》05、1930年冬,中央交通局开通上海至中央苏区的第一条地下交通路线,设有(D)和闽西两个交通大站、三个交通中站和多个交通小站。
A、汕头B、长汀C、武汉D、香港06、下面对人工智能是通用目的战略技术(Generalpurposetechnologies)描述不正确的是(D)。
A、通用目的技术是使能技术(enablingtechnology),但不是完整的最终解决方案B、人工智能犹如历史上蒸气机、电力、计算机和互联网等发明创造,是一种通用使能技术,正深刻地以史无前例速度改变人类社会和经济发展C、人工智能天然具备推动学科交叉的潜力,其与不同学科专业知识结合,形成AlI+X的新研究格局D、人工智能是通用目的技术,因此就是解决方案的全部,与其他技术没有任何联系07、红色交通线,是指中国共产党在领导革命斗争中,根据需要开辟和建立的人、财、物转运输送和(A)的秘密交通路线。
A、通信联络B、情报传送C、武器装备D、信息资料08、以纯休闲为核心的农业受到很大冲击,核心原因在于其无法满足农业的(D)。
单选:()正在成为科学技术研究的典型特征。
A.数据精细型B.数据密集型C.数据分散型D.数据智能型答案:B单选:()安全的主要功能是发现异常、跟踪溯源、反制、威慑。
A.边界B.终端C.应用D.舆情答案:A单选:()不属于智慧康养平台的体系化优化方向。
A.路程规范化B.可支付体系C.品牌化D.连锁化答案:A单选:()的心灵是敏感的,准备接受一切美好的东西。
A.青少年B.少年儿童C.青年D.中年答案:B单选:()的主要目标是力争实现我国数字经济治理体系更加完善。
A.2025年B.2030年C.2035年D.2050年答案:A单选:()发展速度之快、辐射范围之广、影响程度之深前所未有,正在成为重组全球要素资源、重塑全球经济结构、改变全球竞争格局的关键力量。
A.绿色经济B.农业经济C.数字经济D.工业经济答案:C单选:()负责指导做好“大思政课”全媒体宣传工作。
A.国家文物局B.生态环境部C.中央网信办D.国家卫生健康委答案:C单选:()集成分布式网络、加密算法、智能合约等多种技术,基于不易篡改、可追溯等特点,有望解决数字空间的信任和安全问题,推动互联网从传递信息向传递价值变革,重构数字产业体系。
A.数字孪生B.虚拟现实C.5GD.区块链答案:D单选:()集中体现了一个国家基于文化而具有的凝聚力和生命力,以及由此产生的吸引力和影响力。
A.文化软实力B.文化向心力C.文化影响力答案:A单选:()就是计算能力,指的是数据的处理能力。
A.超高清视频B.虚拟现实C.IPv6+D.算力答案:D单选:()决定着发展的动力,进而决定着发展速度、效能和可持续性。
A.创新B.协调C.绿色D.开放答案:A单选:()马克思主义理论区别于其他理论的显著特征。
A.社会性B.理论性C.实践性D.科学性答案:C单选:()年,国务院学术委员会、教育部批准设立国家安全学一级学科,并纳入新设立的交叉学科门类,这是国家安全学建设的又一个里程碑。
大数据标准体系规划与路线图
(2018-2020)
(征求意见稿)
指导单位:xx省经济和信息化委员会
编制单位:xx省大数据标准化技术委员会工作组
年月
一、xx省大数据标准体系
(一)编制原则
以《xx省促进大数据发展行动计划2016-2020》及《珠江三角洲国家大数据综合实验区建设实施方案》为基础,以继承、发展、创新、提高为出发点,全面梳理国际标准、国家标准、行业标准及地方标准,结合大数据技术及产业发展现状与趋势分析,建立适应xx省大数据产业发展需求的标准体系。
标准体系建设遵循以下原则:
急用先行、成熟先上。
对大数据领域急需的开放共享、交易流通等标准重点投入,先行研制;对国内外已有的数据分析、处理、数据质量、数据安全等相关国际标准及研究成果,优先支持等同转化。
面向需求、注重实效。
从产业信息化和产业数字化发展的要求出发,面向我省电子政务、电子商务及重点行业的数字化服务需求,把规范服务行为、提升服务质量、培育新型服务模式为抓手,调动行业各参与方推进标准化工作的积极性,提升标准的科学性、合理性和有效性。
资源整合、统筹规划。
以培育并形成完善的大数据服务市场为总体目标,明确标准化工作思路、内容及具体的推进措施,整合数据资源,统筹产业规划,破除数据孤岛,强化应用服务,保障大数据标准服务体系目标清晰、技术可行、结果可见。
(二) 标准体系框架图
大数据标准体系
1 技 术
0 基 础
3 工 具 2 安 全 21 通用要求 22 隐私保护
. . . . .
5 管 理
4 应 用 . . . . .
51数据运维 52数据治理
43 数据交易 41 数据开放 13检测与评估
12 处理与分析关键技术 11 数据质量
. . . . .
45 数据应用 42 数据共享 44 数据访问 06 语义分析 03 参考
架构
02 术语 05 元素集 04 元数据
01 总则 32 应用类工具
31 系统类工具 . . . . . .
132 风险检测
. . . . .
. . . . . . . .
311 平台基础设施
312 预处理工具
314 分布式计算工具
315 数据库
316 平台管理类工具
313 存储类工具
321 应用分析智能工具
322 可视化展示工具
. . . . . . . .
421 数据开放总则 422 数据开放目录 423 数据开放平台
. . . . .
131 模型评估
.
. . . . . . . .
451 电子政务大数据 454科学大数据 452 工业大数据 453电子商务大数据
大数据标准体系框架图
. . . . .
. . . . .
111 通用数据 112 主数据
113 事务数据 114 产品
数据 121 数据收集 122
数据预
处
理
123 数据分析
124 数据可视化
. . . . . 125 区块链 . . . . . 07 分类分级
(三)标准体系说明
1. 标准体系设计依据
按照国家《信息化发展战略纲要》、《关于促进大数据发展行动纲要》、《大数据产业发展规划(2016-2020年)》、《关于运用大数据加强对市场主体服务和监管的若干意见》及xx省《xx省促进大数据发展行动计划(2016-2020年)》、《珠江三角洲国家大数据综合试验区建设实施方案》等政策文件对标准化工作的要求,制定xx省大数据标准体系。
标准体系共划分为“基础—技术—安全—工具—应用—管理”等6个子体系。
2. 标准体系框架明细
标准体系采用树形结构,分层级展开,层与层之间是包含与被包含关系,平行层之间是平行并列关系。
第一层是大数据通用标准体系。
包括基础类标准(0)、技术类标准(1)、安全类标准(2)、工具类标准(3)、应用类标准(4)、管理类标准(5)。
第二层的分类情况及原则如下所述:
(0)基础标准为整个标准体系提供包括总则、术语、参考架构、元数据、元素集、语义分析、分类分级等通用的基础性标准。
(1)技术类标准主要是对大数据相关的技术进行标准化规范。
包括:数据质量标准、数据处理与分析关键技术标准、数据评估技术标准等。
其中数据质量标准主要参考ISO8000数据质量系列标准,该系列标准主要是对数据质量的把控,
并根据当前我省大数据产业发展需求,等同或修改后采用国际标准;数据处理与分析关键技术标准主要是针对数据从收集到使用过程中的关键技术进行规范;检测与评估技术主要是针对数据挖掘过程中的方法和工具及数据本身进行的包括模型、风险、等保等方面的评估。
(2)安全类标准主要是针对通用的安全和大数据环境下隐私数据的保护,其中通用要求基于信息安全技术的系列标准;隐私数据则重点针对智能移动设备存储数据及与信息主体利益密切相关的数据。
(3)工具类标准主要是从数据使用过程中的过程性工具和终端应用类工具进行规范,主要包括系统类工具和应用类工具;系统类工具标准细分为平台基础设施、预处理工具、存储类工具、分布式计算工具、数据库、平台管理类工具等;应用类工具包括应用分析工具、可视化工具等。
(4)应用类标准从发挥数据价值的角度出发,将应用分为数据访问、开放、共享、交易及行业应用等环节。
行业应用类标准主要针对电子政务、工业、电子商务、医疗、科研等领域共性或专用的大数据应用标准进行研制。
(5)管理类标准是大数据标准的重要支撑,贯穿于数据生命周期的各个阶段。
该部分主要是包括数据运维和数据治理,其中数据运维包括数据库维护、运行维护、运行安全及大数据系统及相关工具等方面的运维及服务等方面的标准;数据治理包括数据资产管理、大数据解决方案设计、数据管理能力成熟度评价等。