当前位置:文档之家› 大数据技术与应用

大数据技术与应用

大数据技术与应用
大数据技术与应用

附件25 :

高职电子信息大类大数据技术与应用赛项

技能竞赛规程、评分标准及选手须知

一、竞赛内容

赛项名称:大数据技术与应用

赛项内容:以大数据技术与应用为核心内容,重点考察参赛选手在Hadoop 平台环境下,对于大规模并行数据处理以及内存计算技术的应用能力。具体包括:

1. 掌握Hadoop 平台环境部署与基本配置,了解基于大数据计算平台的常见应用;

2 .综合利用numpy 、pandas 、matplotlib 、scikit 模块和MapReduce 技术、分布式存储系统HDFS 、分布式计算框架MapReduce/Yarn 、数据仓库Hive 、Python 等开发语言工具和技术,匹配和连接数据源,实现大数据的采集,提取、清洗、转换、分析、挖掘操作,产生分析结果,并且实现可视化呈现。

3.依据项目应用需求和分析结果,完成数据分析报告的编写。

二、竞赛方式

本赛项为团体赛,每支参赛队由 3 名参赛选手组成。

三、竞赛时量

竞赛时间 4 小时,竞赛连续进行。

四、名次确定办法名次确定办法原则上按照竞赛总成绩从高分到低分排序确立选手名次。总成绩相同时,完成时间较短者名次列前;成绩和完成时间均相同时,操作过程较规范者名次列前。

五、评分标准与评分细则

1.评分标准

本赛项总分为100 分,采取分项计分制(表1)。

表1考核环节及评分标准

2 ?评分细则

竞赛成绩评定实行“裁判长合权负责制”,负责组织评分裁判进行成绩评定。评分裁判负责对参赛队伍(选手)的比赛作品、比赛表现按赛项评分标准进行评定。成绩评定根据竞赛考核目标、内容对参赛队或选手在竞赛过程中的表现和最终成果做出评价。

本赛项的评分方法为现场评分和结果评分,现场评分为5分,由现场裁判根据参赛队的操作规范以及综合表现情况进行评分;结果评分为95分,依据赛项评价标准,对参赛选手提交的竞赛成果进行评分。

六、赛点提供的设施设备仪器清单

1 .竞赛设备

包括硬件环境(表2)和软件环境(表3)

表2竞赛硬件环境

表3竞赛软件环境

2 .竞赛技术平台

比赛技术平台:《北京四合天地大数据实训管理系统》。

学生可以“随时、随地”在一套系统中进行多种类型的大数据相关内容的训

练及比赛,并且可以在线进行操作系统级的真机模拟训练测试、充分体验和掌握大数据相关技能。

教师(裁判)可以方便组织和安排大数据实训(竞赛),并且可以实时了解学生的训练及竞赛状态。训练、竞赛完毕后,教师(裁判)可以查看每位学生的测评报告,并且了解各个学生对大数据相关知识点和操作技能的掌握情况。

3 .办公物品

参赛选手U盘、签字笔;裁判用时钟、计算器、铅笔、钢笔、橡皮、订书机、打印机等其他物品。

七、选手须知

(一)选手自带工具清单

选手不允许携带任何工具。

(二)主要技术规程及要求

包括竞赛项目基础标准(表4 )和软件开发标准(表5 )。

表4 竞赛项目基础标准

表5软件开发标准

(三)选手注意事项

1.参赛选手应严格遵守赛场规章、操作规程和工艺准则,保证人身及设备安全,接受裁判员的监督和警示,文明竞赛。

2 .参赛选手应按照规定时间抵达赛场,凭身份证(或户口簿)、学生证(或学籍证明),以及统一发放的参赛证,完成入场检录、抽签确定竞赛工位号,不得迟到和早退。

3.参赛选手进入赛场前,须将身份证、学生证交由检录人员统一保管,不得带入场内。参赛证始终佩戴,以备检查。

4 .参赛选手凭竞赛工位号进入赛场,不允许携带任何书籍和其他纸质资料,竞赛统一提供草稿纸。不允许携带任何电子设备及通信工具和存储设备(如U 盘),竞赛统一提供计算机以及应用软件。

5 .参赛选手应在规定的时间段进入赛场,认真核对竞赛工位号,在指定位置就座。

6 .参赛选手入场后,赛场工作人员与参赛选手共同确认操作条件及设备状况,填写相关确认文件,并由参赛队长确认签字(签竞赛工位号)。

7.参赛选手在收到开赛信息前不得提前启动操作。在竞赛过程中,确因计算机软件或硬件故障,致使操作无法继续的,经裁判长确认,予以启用备用计算机。

8.参赛选手需及时保存工作记录。对于因各种原因造成的数据丢失,由参赛选手自行负责。

9.参赛队所提交的答卷采用竞赛工位号进行标识,不得出现地名、校名、姓名、参赛证编号等信息,否则取消竞赛成绩。

10 .竞赛过程中,因严重操作失误或安全事故不能进行比赛的(例如因人为操作原因发生短路导致赛场断电的、造成设备不能正常工作的),现场裁判员有权中止该队比赛。

11 .参赛期间,选手连续工作,餐饮等由赛场统一提供。午饭不离场,食品、饮水等由赛场统一提供。选手休息、就餐和如厕时间均计算在比赛时间内。

12 .在参赛期间,选手应注意保持工作环境及设备摆放符合企业生产“5S” (即整理、整顿、清扫、清洁和素养)的原则,如果过于脏乱,裁判长有权酌情处置。

13 .在比赛中如遇非人为因素造成的设备故障,经裁判确认后,可向裁判长申请补足排除故障的时间。

14. 参赛队提前结束比赛,应向现场裁判举手示意,由裁判员记录竞赛终止时间。竞赛终止后,不得再进行任何与竞赛有关的操作。

15 .竞赛操作结束后,参赛选手需要根据任务书要求,将相关成果文件拷贝至U 盘,填写结束比赛相关确认文件,并由现场裁判和参赛队长共同签字确认竞赛相关确认文件及U 盘内容(签竞赛工位号)。因参赛选手未能按要求,将

相应的文档等上传到平台指定位置及U 盘的,竞赛成绩计为零分。

16 .竞赛时间结束,选手应全体起立,结束操作。将资料和工具整齐摆放在操作平台上,经工作人员清点后可离开赛场,离开赛场时不得带走任何资料。

17 .参赛选手不得因各种原因提前离开赛场。如确因不可抗因素需要离开赛场的,须向现场裁判员举手示意,经裁判员许可并完成记录后,方可离开。

18 .凡在竞赛期间内提前离开的选手,不得返回赛场。

19 .在竞赛期间,未经赛项组委会批准,参赛选手不得接受其他单位和个人进行的与竞赛内容相关的采访。参赛选手不得将竞赛的相关信息私自公布。

20 .符合下列情形之一的参赛选手,经裁判组裁定后中止其竞赛:

(1 )不服从裁判员/ 监考员管理、扰乱赛场秩序、干扰其他参赛选手比赛,裁判员应提出警告,二次警告后无效,或情节特别严重,造成竞赛中止的,经裁判长确认,中止比赛,并取消竞赛资格和竞赛成绩。

(2)竞赛过程中,由于选手人为造成计算机、仪器设备及工具等严重损坏,负责赔偿其损失,并由裁判长裁定其竞赛结束与否、是否保留竞赛资格、是否累计其有效竞赛成绩。

(3)竞赛过程中,产生重大安全事故、或有产生重大安全事故隐患,经裁判员提示没有采取措施的,裁判员可暂停其竞赛,由裁判长裁定其竞赛结束,保留竞赛资格和有效竞赛成绩。

大数据应用技术课程介绍

大数据应用技术网络课程 1课程目标 通过讲解几种主流大数据产品和技术的特性、实现原理和应用方向,并组织实习项目,使学员了解并初步掌握目前流行的大数据主流技术(采集、存储、挖掘等),了解其特点以及使用的场景,具备一定的大数据系统架构能力,并能自行开展简单的大数据应用开发。 2课程内容 本次课程讲解的大数据产品和技术包括:hadoop、storm、flume等,其中以hadoop为主要培训内容。 3培训课程列表 1.hadoop生态系统 (1)HDFS (2课时) (2)MapReduce2 (2课时) (3)Hive (1课时) (4)HBase (2课时) (5)Sqoop (1课时) (6)Impala (1课时) (7)Spark (4课时) 2.Storm流计算(2课时) 3.Flume分布式数据处理(2课时) 4.Redis内存数据库(1课时) 5.ZooKeeper (1课时) 4培训方式 学员以观看录像、视频会议等方式进行学习,搭建集中环境供大家实习,并设置作业和答疑环节。每周视频课程约2个课时,作业和实习时间约需2-3小时,课程持续10周左右。

5课程内容简介 大数据技术在近两年发展迅速,从之前的格网计算、MPP逐步发展到现在,大数据技术发展为3个主要技术领域:大数据存储、离线大数据分析、在线大数据处理,在各自领域内,涌现出很多流行的产品和框架。 大数据存储 HDFS、HBase 离线大数据分析 MapReduce、Hive 在线大数据处理 Impala、Storm(流处理)、Spark、Redis(内存数据库)、HBase 数据采集 Flume等 辅助工具 Zookeeper等 5.1Hadoop 1)HDFS 介绍: Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同 时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的 系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大 规模数据集上的应用。HDFS放宽了一部分POSIX约束,来实现流式读取文件系统 数据的目的。HDFS是Apache Hadoop Core项目的一部分。 培训内容: HDFS设计的思路 HDFS的模块组成(NameNode、DataNode) HADOOP Core的安装 HDFS参数含义及配置 HDFS文件访问方式 培训目标: 使学员掌握HDFS这个HADOOP基础套件的原理、安装方式、配置方法等2)MAPREDUCE 介绍: MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",和它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会

计算机网络技术专业大数据应用方向

计算机网络技术专业(大数据应用方向) 人才培养方案 一、专业名称与代码 (一)专业名称:计算机网络技术(大数据应用方向) (二)专业代码:610202 二、入学要求 高中阶段教育毕业生或具有同等学力者。 三、修业年限 全日制3年。实行弹性学制,学生可通过学分认定、积累、转换等办法,在2-6年内完成学业。 四、职业面向 五、培养目标及培养规格 (一)培养目标 培养思想政治坚定、德技并修、全面发展,适应区域经济建设和社会发展各产业领域岗位需要,具有良好的职业素质,掌握大数据系统运维、大数据采集与处理、Python大数据分析、数据可视化等方向等知识和技术技能,面向大数据应用领域的高素质技术技能人才。 (二)培养规格 1.素质 (1)具有正确的世界观、人生观、价值观; (2)崇尚宪法、遵守法律、遵规守纪;具有社会责任感和参与意识;

(3)具有良好的职业道德和职业素养; (4)崇德向善、诚实守信、爱岗敬业,具有精益求精的工匠精神; (5)尊重劳动、热爱劳动,具有较强的实践能力; (6)具有质量意识、绿色环保意识、安全意识、信息素养、创新精神; (7)具有较强的集体意识和团队合作精神,能够进行有效的人际沟通和协作,与社会、自然和谐共处; (8)具有职业生涯规划意识; (9)具有良好的身心素质和人文素养; (10)具有良好的生活习惯、行为习惯和自我管理能力。 2.知识 (1)计算机及网络系统的维护和管理的知识; (2)云计算与大数据环境的配置与运维的知识; (3)中小型数据库的安装、配置、维护、管理的知识; (4)数据采集、清洗、分析、存储各阶段的系统配置和程序开发技术; (5)WEB系统开发、数据可视化WEB图表知识; (6)网站前台界面设计与与制作以及模板设计与开发; (7)具有技术推广和用户支持所需要的市场营销和人际交往知识。 3.能力 具有包括口语和书面表达能力,解决实际问题的能力,终身学习能力,信息技术应用能力,独立思考、逻辑推理、信息加工能力等。 (1)具有计算机及网络操作与应用能力; (2)具有大数据操作与应用能力; (3)具有一定的中小型大数据项目运维及管理能力; (4)具有较强的数据分析及故障排错检测的能力; (5)具有一定的大数据项目招投标能力; (6)具有较强的中小型大数据项目预、决算能力; (7)具有一定的大数据项目招标、投标、签订合同的能力; (8)具有编写大数据相关技术文档和管理相关技术文档的能力; (9)具有较强Hadoop 技术框架操作以及程序设计能力; (10)能够对数据进行常规的统计分析、报表分析能力。 六、典型工作任务与职业能力 215 / 13

大数据技术及应用题库

大数据技术及应用题库 单选题: 1从大量数据中提取知识的过程通常称为(A)。 a. . 数据挖掘 b. . 人工智能 c. . 数据清洗 d. . 数据仓库 2下列论据中,能够支撑“大数据无所不能”的观点的是(A)。 A、互联网金融打破了传统的观念和行为 B、大数据存在泡沫 C、大数据具有非常高的成本 D、个人隐私泄露与信息安全担忧 3数据仓库的最终目的是(D)。 a. . 收集业务需求 b. . 建立数据仓库逻辑模型 c. . 开发数据仓库的应用分析 d. . 为用户和业务部门提供决策支持 4大数据处理技术和传统的数据挖掘技术最大的区别是(A)。

a. . 处理速度快(秒级定律) b. . 算法种类更多 c. . 精度更高 d. . 更加智能化 5大数据的起源是(C)。 a. . 金融 b. . 电信 c. . 互联网 d. . 公共管理 6大数据不是要教机器像人一样思考。相反,它是(A)。 a. . 把数学算法运用到海量的数据上来预测事情发生的可能性 b. . 被视为人工智能的一部 c. . 被视为一种机器学习 d. . 预测与惩罚 7人与人之间沟通信息、传递信息的技术,这指的是(D)。 a. . 感测技术 b. . 微电子技术 c. . 计算机技术 d. . 通信技术

8数据清洗的方法不包括(D)。 a. . 缺失值处理 b. . 噪声数据清除 c. . 一致性检查 d. . 重复数据记录处理 9. 下列关于舍恩伯格对大数据特点的说法中,错误的是(D) A. 数据规模大 B. 数据类型多样 C. 数据处理速度快 D. 数据价值密度高 10规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指的是(D)。 a. . 富数据 b. . 贫数据 c. . 繁数据 d. . 大数据 11大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的(D)。 a. . 新一代信息技术 b. . 新一代服务业态

大数据分析技术与应用_实验2指导

目录 1实验主题 (1) 2实验目的 (1) 3实验性质 (1) 4实验考核方法 (1) 5实验报告提交日期与方式 (1) 6实验平台 (1) 7实验内容和要求 (1) 8实验指导 (2) 8.2 开启Hadoop所有守护进程 (2) 8.2 搭建Eclipse环境编程实现Wordcount程序 (3) 1.安装Eclipse (3) 2.配置Hadoop-Eclipse-Plugin (3) 3.在Eclipse 中操作HDFS 中的文件 (7) 4.在Eclipse 中创建MapReduce 项目 (8) 5.通过Eclipse 运行MapReduce (13) 6.在Eclipse 中运行MapReduce 程序会遇到的问题 (16)

1实验主题 1、搭建Hadoop、Eclipse编程环境 2、在Eclipse中操作HDFS 3、在Eclipse中运行Wordcount程序 4、参照Wordcount程序,自己编程实现数据去重程序 2实验目的 (1)理解Hadoop、Eclipse编程流程; (2)理解MapReduce架构,以及分布式编程思想; 3实验性质 实验上机内容,必做,作为课堂平时成绩。 4实验考核方法 提交上机实验报告,纸质版。 要求实验报告内容结构清晰、图文并茂。 同学之间实验报告不得相互抄袭。 5实验报告提交日期与方式 要求提交打印版,4月19日(第10周)之前交到软件学院412。 6实验平台 操作系统:Linux Hadoop版本:2.6.0或以上版本 JDK版本:1.6或以上版本 Java IDE:Eclipse 7实验内容和要求 (1)搭建Hadoop、Eclipse编程环境; (2)运行实验指导上提供的Wordcount程序; (3)在Eclipse上面查看HDFS文件目录; (4)在Eclipse上面查看Wordcount程序运行结果; (5)熟悉Hadoop、Eclipse编程流程及思想; 程序设计题,编程实现基于Hadoop的数据去重程序,具体要求如下: 把data1文件和data2文件中相同的数据删除,并输出没有重复的数据,自己动手实现,把代码贴到实验报告的附录里。 设计思路: 数据去重实例的最终目标是让原始数据中出现次数超过一次的数据在输出文件中只出现一次。具体就是Reduce的输入应该以数据作为Key,而对value-list则没有要求。当Reduce 接收到一个时就直接将key复制到输出的key中,并将value设置成空值。在MapReduce流程中,Map的输出 经过shuffle过程聚集成后会被交给Reduce。所以从设计好的Reduce输入可以反推出Map输出的key应为数据,而

大数据技术与应用专业建设

大数据技术与应用专业建设 调研报告 自党的十八大以来,我国提出了实施国家大数据战略的重大决策。国务院和相关部门先后印发了《促进大数据发展行动纲要》、《大数据产业发展规划(2016~2020年)》等指导性文件。各部门、各地方高度重视,据不完全统计,我国已有20多个省级地方和10余个部委出台了本地区、本行业大数据发展规划,我国大数据发展已经正式驶入快车道。 2015年9月5日经李克强总理签批,国务院印发《促进大数据发展行动纲要》(以下简称《纲要》),系统指导我国大数据发展的国家顶层设计和总体部署大数据发展工作。《纲要》提出从政府大数据、新兴产业大数据、安全保障体系三个方面着手推进大数据领域十大工程建设,将我国大数据发展推向了另一个制高点。 职业教育服务经济与社会发展,必须紧跟产业发展步伐,随着经济增长方式转变而“动”,跟着产业结构调整升级而“走”,围着企业技能型人才需求而“转”,适应市场的需求而“变”。在大数据技术飞速发展的今天,职业教育必须紧跟大数据产业发展步伐。为了更好地了解相关行业企业对大数据人才的需求,促进大数据技术与应用专业教学及专业建设,大数据技术与应用专业教学资源库建设团队在国内外针对大数据在行业企业的需求开展了调研。

一、调研目的 1、了解大数据行业企业对大数据技术与应用专业人才的需求倾向、人才需求规格预测、就业预测、人才的市场定位等; 2、了解大数据行业企业对大数据技术与应用专业人才培养模式、培养目标的意见,以及对专业知识、岗位分工、职业技能等的要求; 3、了解往届相关专业毕业生在工作单位的表现及用人单位对往届毕业生的工作、岗位能力评价; 4、与相关企业建立校企合作模式,促进教学与社会实践的联系,为大数据技术与应用专业教学资源库的专业建设、课程体系建设及培养模式寻找更完善的发展方向。 二、调研方式 1.问卷调查:印制问卷涵寄或面交,请企业相关人员作答。 2.实地调研:教师到企业和用人单位实地调研。 3.座谈调研:邀请用人单位的技术人员、管理人员到系里开展座谈交流。 4.网上调查:到网上搜索有关人才需求、课程设计、教学计划等信息。 三、国内外大数据发展现状 (一)大数据产业呈现爆炸式增长 由IDC和EMC联合发布的《The Digital Universe of Opportunities : Rich Data and the Increasing Value of Internet of Things》研究报告中指出,2011年全球数据总量已达到1.8ZB,并将以每两年翻一番的速度增长,

大数据技术与应用专业详细解读

大数据技术与应用专业详细解读 大数据技术与应用专业是新兴的“互联网+”专业,大数据技术与应用专业将大数据分析挖掘与处理、移动开发与架构、人软件开发、云计算等前沿技术相结合,并引入企业真实项目演练,依托产学界的雄厚师资,旨在培养适应新形势,具有最新思维和技能的“高层次、实用型、国际化”的复合型大数据专业人才。 专业背景 近几年来,互联网行业发展风起云涌,而移动互联网、电子商务、物联网以及社交媒体的快速发展更促使我们快速进入了大数据时代。截止到目前,人们日常生活中的数据量已经从TB(1024GB=1TB)级别一跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别,数据将逐渐成为重要的生产因素,人们对于海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来。大数据时代,专业的大数据人才必将成为人才市场上的香饽饽。当下,大数据从业人员的两个主要趋势是:1、大数据领域从业人员的薪资将继续增长;2、大数据人才供不应求。 图示说明:2012-2020年全球数据产生量预测 专业发展现状 填补大数据技术与应用专业人才巨大缺口的最有效办法无疑还需要依托众多的高等院校来培养输送,但互联网发展一日千里,大数据技术、手段日新月异,企业所需要的非常接地气的人才培养对于传统以培养学术型、科研型人才为主要使命的高校来说还真有些难度。幸好这个问题已经被全社会关注,政府更是一再提倡产教融合、校企合作来创办新型前沿几

乎以及“互联网+”专业方向,也已经有一些企业大胆开始了这方面的创新步伐。据我了解,慧科教育就是一家最早尝试高校校企合作的企业,其率先联合各大高校最早开设了互联网营销,这也是它们的优势专业,后来慧科教育集团又先后和北京航空航天大学、对外经济贸易大学、贵州大学、华南理工大学、宜春学院、广东开放大学等高校在硕、本、专各个层次开设了大数据专业方向,在课程体系研发、教学授课及实训实习环节均有来自BAT以及各大行业企业一线的技术大拿参与,所培养人才能够很好地满足企业用人需求。 专业示例 笔者在对慧科教育的大数据技术与应用专业做了专门研究,共享一些主要特色给大家参考: 1.培养模式 采用校企联合模式,校企双方(即慧科教育集团和合作校方)发挥各自优势,在最大限度保证院校办学特色及专业课程设置的前提下,植入相应前沿科技及特色人才岗位需求的企业课程。 2.课程体系 笔者对慧科教育的大数据技术与应用做了专门研究,现分享一下慧科专业共建的课程给大家参考。慧科教育集团的专业课程重在培养学生的理论知识和动手实践能力,学生在完成每个学期的理论学习后,至少有两个企业项目实战跟进,让学生在项目中应用各类大数据技术,训练大数据思路和实践步骤,做到理论与实践的充分结合。 大数据专业的课程体系包括专业基础课、专业核心课、大数据架构设计、企业综合实训等四个部分。

大数据技术及应用题库

大数据技术及应用题库单选题: 1 从大量数据中提取知识的过程通常称为(A)。 a. . 数据挖掘 b. . 人工智能 c. . 数据清洗 d. . 数据仓库 2 下列论据中,能够支撑“大数据无所不能”的观点的是( A )。 A、互联网金融打破了传统的观念和行为 B、大数据存在泡沫 C、大数据具有非常高的成本 D、个人隐私泄露与信息安全担忧 3 数据仓库的最终目的是(D)。 a. . 收集业务需求 b. . 建立数据仓库逻辑模型 c. . 开发数据仓库的应用分析 d. . 为用户和业务部门提供决策支持 4 大数据处理技术和传统的数据挖掘技术最大的区别是(A)。 a. . 处理速度快(秒级定律)

b. . 算法种类更多 c. . 精度更高 d. . 更加智能化 5 大数据的起源是( C )。 a. . 金融 b. . 电信 c. . 互联网 d. . 公共管理 6 大数据不是要教机器像人一样思考。相反,它是( A )。 a. . 把数学算法运用到海量的数据上来预测事情发生的可能性 b. . 被视为人工智能的一部 c. . 被视为一种机器学习 d. . 预测与惩罚 7 人与人之间沟通信息、传递信息的技术,这指的是(D)。 a. . 感测技术 b. . 微电子技术 c. . 计算机技术 d. . 通信技术

8 数据清洗的方法不包括(D)。 a. . 缺失值处理 b. . 噪声数据清除 c. . 一致性检查 d. . 重复数据记录处理 9. 下列关于舍恩伯格对大数据特点的说法中,错误的是(D) A. 数据规模大 B. 数据类型多样 C. 数据处理速度快 D. 数据价值密度高 10规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指 的是(D)。 a. . 富数据 b. . 贫数据 c. . 繁数据 d. . 大数据 1大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分 析,从中发现新知识、创造新价值、提升新能力的(D)。 a. . 新一代信息技术 b. . 新一代服务业态 c. . 新一代技术平台 d. . 新一代信息技术和服务业态

大数据技术及应用.doc

A:2015 年 8 月 31 日:《促进大数据发展行动纲要》B: 2015 年 12 月 29 日:《“互联网+”行动的指导意见》C: 2017 年 7 月 8 日:《新一代人工智能发展规划》D: 2017年4月10日:《云计算发展三年行动计划(2017- 2019 年)》E: 2015 年5 月 8 日:《中国制造2025》 2.【判断题】人工采集效率低、成本高、错误多。自动化采集 靠技术实现,效率高、采集的数据量大。对错 3.【多选题】数据资源向信息、知识、价值转换的流程可以概 括成 5 个环节:()()()()()正确答案:[A,B,C,D] A:数据采集B:数据存储C: 数据处理D: 数据分析与挖掘E: 知识应用 4.【判断题】由于数据采集都是在多点进行的,数据存储也从 传统中央磁盘存储变成分布式云存储。云存储的优点是容量大、 费用低。对错

5.【判断题】数据是所表达的对象或事件的信息的载体,记录 了对象的属性特征。对错 6.【多选题】数据采集可以划分为()和()。 A: 人工采集B:自动化采集 7.【多选题】大数据有 3 个显著的特征: A:数据规模大B:数据变化快C:数据类型复杂 8.【多选题】大数据时代是()()()() 4 大技术领域齐 头并进发展的时代,也可称作“大智移云”时代。 A:大数据B:人工智能C: 移动互联网(或物联网) 云计算

9.【判断题】目前大数据存储的另一趋势是向数据中心集中, 以便于大数据的管理、集成和综合分析。对错 10.【多选题】大数据的产生是由于信息技术及应用的不断发 展和进步的几个阶段: A: 从信息系统应用的发展来看,80 年ERP系统用于企业管理,数据规模在MB;B: 90 年度信息技 术用于客户管理,即CRM 系统,数据规模达到GB 级;C: 2000 年互联网时代的Web技术使企业数据达到TB级;D: 近年来,互联网+物联网在企业中应用使数据达到PB级

《大数据分析方法与应用》教学大纲

《大数据分析方法与应用》课程教学大纲 课程代码:090542008 课程英文名称:Big Data Analysis: Methods and Applications 课程总学时:40 讲课:40 实验:0 上机:0 适用专业:应用统计学 大纲编写(修订)时间:2017.6 一、大纲使用说明 (一)课程的地位及教学目标 本课程是应用统计学专业的一门专业课,通过本课程的学习,可以使学生学会选用适当的方法和技术分析数据,领会大数据分析方法和应用,掌握复杂数据的分析与建模,使学生能够按照实证研究的规范和数据挖掘的步骤进行大数据研发,为就业与继续深造打下必要而有用的基础。 (二)知识、能力及技能方面的基本要求 1.基本知识:掌握数据挖掘流程、随机森林树的回归算法、基于预测强度的聚类方法、朴素贝叶斯分类、高维回归及变量选择、图模型等。 2.基本能力:要求能在真实案例中应用相应的方法。 3.基本技能:掌握复杂数据的分析与建模。 (三)实施说明 1. 本大纲主要依据应用统计学专业2017版教学计划、应用统计学专业专业建设和特色发展规划和沈阳理工大学编写本科教学大纲的有关规定并根据我校实际情况进行编写的。 2. 课程学时总体分配表中的章节序号在授课过程中可酌情调整顺序,课时分配仅供参考。打“*”号的章节可删去或选学。 3. 建议本课程采用课堂讲授、讨论相结合的方法开展教学,通过讨论等方式强化重点,通过分散难点,使学生循序渐进的掌握难点。 4.教学手段:建议采用多媒体等现代化手段开展教学。 (四)对先修课的要求 本课程的先修课程:应用多元统计分析。 (五)对习题课、实践环节的要求 通过案例讲解算法,鼓励学生演示分析思路和分析收获,使学生有机会诊断问题,并学会选用适当的方法和技术分析数据。 (六)课程考核方式 1.考核方式:考查 2.考核目标:在考核学生基础知识、基本技能,基本能力的基础上,重点考核学生的分析能力、解决实际问题能力。 3.成绩构成:本课程由平时成绩和结课报告的质量评定优、良、中、及格和不及格。 (七)参考书目: 《大数据分析:方法与应用》,王星编,清华大学出版社,2013. 二、中文摘要 《大数据分析方法与应用》是高等学校应用统计学专业的一门选修的专业课。本课程着重介绍了统计学习、数据挖掘和模式识别等领域的各种大数据分析方法。课程主要内容包括大数据分析概述、数据挖掘流程、随机森林树、基于预测强度的聚类方法、贝叶斯分类和因果学习、高

成电求实专技网2019年度公需科目大数据应用技术答案

大数据起源于() A、金融 B、电信 C、互联网 D、医疗 第一个提出大数据概念的公司是() A、微软 B、谷歌 C、麦肯锡 D、亚马逊 ()规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理。 A、贫数据 B、大数据 C、富数据 D、繁数据 大数据的本质是() A、数据收集 B、数据挖掘 C、数据关联 D、洞察价值 大数据的最显著特征() A、数据规模大 B、数据类型多 C、数据处理速度快 D、数据价值密度高 海军人员通过对前人航海日志的分析,绘制了新的航海路线图,标明大风与洋流可能发生的地点。这一操作体现大数据思维中的() A、在数据基础上倾向与全体数据而不是抽样数据 B、在数据规模上强调相对数据而不是绝对数据 C、在分析效果上更讲究效率而不是绝对精确 D、在分析方法上更注重相关分析而不是因果分析

下列对大数据特点的说法中,错误的是() A、数据规模大 B、数据价值密度高 C、数据类型多样 D、数据处理速度快 当前社会中,最为突出的大数据环境是() A、互联网 B、物联网 C、综合国力 D、自然资源 下列关于大数据中计算机存储容量单位的说法中,错误的是() A、1KB<1MB<1TB B、基本单位是字节(Byte) C、一个汉字需要2个字节的存储空间 D、容纳一个英文字符需要2个字节 计算机存储容量单位换算中,错误的是() A、1KB=1024Byte B、1MB=1024KB C、1TB=1024MB D、1PB=1024TB 大数据时代,数据使用的关键是() A、数据收集 B、数据存储 C、数据分析 D、数据再利用 下列论据中,能够支撑“大数据无所不能”的观点是() A、“互联网+医疗”打破传通的观念和行为 B、大数据存在泡沫 C、大数据具有非常高的成本 D、个人隐私泄露与信息安全担忧

大数据技术与应用专业讲课稿

大数据技术与应用专业 建设方案 北京四合天地科技有限公司 2018年6月

目录 1项目背景 (4) 1.1行业背景 (4) 1.2政策导向 (5) 2人才培养方案 (6) 2.1行业人才需求 (6) 2.2大数据岗位设置 (9) 2.2.1Hadoop运维工程师 (9) 2.2.2大数据开发工程师 (9) 2.2.3数据采集工程师 (10) 2.2.4系统开发工程师 (11) 2.3大数据人才基本技能要求 (11) 2.4人才培养目标 (12) 2.5人才培养策略 (12) 3教学现状分析 (13) 3.1教学科研难以保证 (13) 3.2实训环境缺失 (13) 3.3实训内容不足 (13) 4课程体系建设 (14) 4.1培养目标 (14) 4.2课程设置 (14) 5实训室建设 ............................................................................................... 错误!未定义书签。 5.1设计理念..................................................................................................... 错误!未定义书签。 5.1.1以就业为导向...................................................................................... 错误!未定义书签。 5.1.2以能力为本.......................................................................................... 错误!未定义书签。

大数据处理技术的总结与分析

数据分析处理需求分类 1 事务型处理 在我们实际生活中,事务型数据处理需求非常常见,例如:淘宝网站交易系统、12306网站火车票交易系统、超市POS系统等都属于事务型数据处理系统。这类系统数据处理特点包括以下几点: 一就是事务处理型操作都就是细粒度操作,每次事务处理涉及数据量都很小。 二就是计算相对简单,一般只有少数几步操作组成,比如修改某行得某列; 三就是事务型处理操作涉及数据得增、删、改、查,对事务完整性与数据一致性要求非常高。 四就是事务性操作都就是实时交互式操作,至少能在几秒内执行完成; 五就是基于以上特点,索引就是支撑事务型处理一个非常重要得技术. 在数据量与并发交易量不大情况下,一般依托单机版关系型数据库,例如ORACLE、MYSQL、SQLSERVER,再加数据复制(DataGurad、RMAN、MySQL数据复制等)等高可用措施即可满足业务需求。 在数据量与并发交易量增加情况下,一般可以采用ORALCERAC集群方式或者就是通过硬件升级(采用小型机、大型机等,如银行系统、运营商计费系统、证卷系统)来支撑. 事务型操作在淘宝、12306等互联网企业中,由于数据量大、访问并发量高,必然采用分布式技术来应对,这样就带来了分布式事务处理问题,而分布式事务处理很难做到高效,因此一般采用根据业务应用特点来开发专用得系统来解决本问题。

2数据统计分析 数据统计主要就是被各类企业通过分析自己得销售记录等企业日常得运营数据,以辅助企业管理层来进行运营决策。典型得使用场景有:周报表、月报表等固定时间提供给领导得各类统计报表;市场营销部门,通过各种维度组合进行统计分析,以制定相应得营销策略等. 数据统计分析特点包括以下几点: 一就是数据统计一般涉及大量数据得聚合运算,每次统计涉及数据量会比较大。二就是数据统计分析计算相对复杂,例如会涉及大量goupby、子查询、嵌套查询、窗口函数、聚合函数、排序等;有些复杂统计可能需要编写SQL脚本才能实现. 三就是数据统计分析实时性相对没有事务型操作要求高。但除固定报表外,目前越来越多得用户希望能做做到交互式实时统计; 传统得数据统计分析主要采用基于MPP并行数据库得数据仓库技术.主要采用维度模型,通过预计算等方法,把数据整理成适合统计分析得结构来实现高性能得数据统计分析,以支持可以通过下钻与上卷操作,实现各种维度组合以及各种粒度得统计分析。 另外目前在数据统计分析领域,为了满足交互式统计分析需求,基于内存计算得数据库仓库系统也成为一个发展趋势,例如SAP得HANA平台。 3 数据挖掘 数据挖掘主要就是根据商业目标,采用数据挖掘算法自动从海量数据中发现隐含在海量数据中得规律与知识。

大数据技术与应用专业人才培养方案

附件: 2017年大数据技术与及用人才培养方案 一、培养目标 本专业培养适应生产、建设、服务和管理第一线需要的,德、智、体、美等方面全面发展的,具有大数据行业对应岗位必备的科学文化知识及相关专业知识,以大数据系统运维与管理、数据处理、数据分析、应用系统开发能力为目标,系统掌握大数据技术与应用专业基本理论、大数据分析挖掘与处理、移动开发与架构、软件开发、云计算技术等前沿技术,旨在培养适应新形势下新兴的“互联网+”专业,具有良好职业道德和敬业精神的高素质技能型专门人才。 二、学制及招生对象 (一)学制:三年 (二)招生对象:高中毕业生和中职毕业生 三、人才培养规格 (一)职业面向、预期工作岗位名称 1.主要岗位 本专业大数据基础类岗位:大数据文档编写、大数据采集清洗与转换; 大数据技术类岗位:大数据系统搭建与运维、海量数据库管理、大数据软件开发、大数据可视化、大数据分析; 2.相关岗位 大数据销售服务类岗位:大数据营销、大数据呼叫、大数据售后服务。 3.进阶岗位 大数据技术公司管理岗位和高级技术岗位 (二)起薪标准 4500元/月 (三)人才质量标准 1.知识要求 毕业生应具有大数据技术与应用专业必要的基础理论知识,掌握从事本专业领域实际工作的基本能力和基本技能;具备适应生产、管理、服务一线岗位需要的工作能力,具备良好的职业道德与素养。

①掌握本专业培养目标所要求的基础理论知识、专业知识和技能; ②具备一定的英语知识,能够借助工具书阅读理解本专业所使用的常用计算机英语, 包括技术性文档和资料; ③掌握计算机方面的专业基础知识,能适应信息化建设; ④掌握Linux平台下大数据平台搭建,数据库系统搭建、优化、管理等方面的专业技 能; ⑤掌握大数据技术与应用专业基本的专业技能,能满足大数据岗位的基本素质。 2.能力要求 通过三年的学习,学生应具备从事本专业领域相关工作的能力。 ①熟练操作办公自动化软件; ②具备计算机组装、计算机软硬件故障的判断与定位以及故障排除的能力。 ③具备办公自动化设备维护的能力;具备数据库系统管理维护的能力; ④具备非结构化数据处理能力; ⑤具备数据仓库管理基本能力; ⑥具备OOP程序设计能力; ⑦具备Web应用开发能力; ⑧具备Linux Server、Hadoop项目管理维护的能力; ⑨具备数据挖掘、数据清洗、数据可视化的处理能力。 3.素质要求 ①政治思想素质: 热爱祖国,拥护党的基本路线。遵纪守法,善于独立思考,勇于创新的精神。具备良好的职业道德与素养。 ②文化素质: 具有一定的文化素质修养,诚实守信、礼貌待人、为人谦逊的文明习惯;具有自尊自强、爱岗敬业、勤奋好学、追求进步的品格;具备良好的人际交往与勾通和工作协调能力。 ③业务素质: 掌握大数据技术与应用专业的基础理论知识;掌握计算机组装与维护、办公自动化软件操作、办公自动化设备维护、计算机网络系统维护及管理、关系型/非关系型数据库系统维护及管理、Windows/Linux服务器系统配置管理等方面、各类大数据平台搭建管理维护的专业技能的能力。

大数据技术原理与应用 林子雨版 课后习题答案

第一章 1.试述信息技术发展史上的3次信息化浪潮及具体内容。 2.试述数据产生方式经历的几个阶段 答:运营式系统阶段,用户原创内容阶段,感知式系统阶段。 3.试述大数据的4个基本特征 答:数据量大、数据类型繁多、处理速度快和价值密度低。 4.试述大数据时代的“数据爆炸”的特性 答:大数据时代的“数据爆炸”的特性是,人类社会产生的数据一致都以每年50%的速度增长,也就是说,每两年增加一倍。 5.数据研究经历了哪4个阶段?

答:人类自古以来在科学研究上先后历经了实验、理论、计算、和数据四种范式。 6.试述大数据对思维方式的重要影响 答:大数据时代对思维方式的重要影响是三种思维的转变:全样而非抽样,效率而非精确,相关而非因果。 7.大数据决策与传统的基于数据仓库的决策有什么区别 答:数据仓库具备批量和周期性的数据加载以及数据变化的实时探测、传播和加载能力,能结合历史数据和实时数据实现查询分析和自动规则触发,从而提供对战略决策和战术决策。 大数据决策可以面向类型繁多的、非结构化的海量数据进行决策分析。 8.举例说明大数据的基本应用 答: 9.举例说明大数据的关键技术

答:批处理计算,流计算,图计算,查询分析计算 10.大数据产业包含哪些关键技术。 答:IT基础设施层、数据源层、数据管理层、数据分析层、数据平台层、数据应用层。 11.定义并解释以下术语:云计算、物联网 答:云计算:云计算就是实现了通过网络提供可伸缩的、廉价的分布式计算机能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT资源。 物联网是物物相连的互联网,是互联网的延伸,它利用局部网络或互联网等通信技术把传感器、控制器、机器、人类和物等通过新的方式连在一起,形成人与物、物与物相连,实现信息化和远程管理控制。 12.详细阐述大数据、云计算和物联网三者之间的区别与联系。

大数据技术原理及应用

大数据技术原理及应用 (总10页) -CAL-FENGHAI.-(YICAI)-Company One1 -CAL-本页仅作为文档封面,使用请直接删除

大数据技术原理及应用 大数据处理架构—Hadoop简介 Hadoop项目包括了很多子项目,结构如下图 Common 原名:Core,包含HDFS, MapReduce和其他公共项目,从Hadoop 版本后,HDFS和MapReduce分离出去,其余部分内容构成Hadoop Common。Common为其他子项目提供支持的常用工具,主要包括文件系统、RPC(Remote procedure call) 和串行化库。 Avro Avro是用于数据序列化的系统。它提供了丰富的数据结构类型、快速可压缩的二进制数据格式、存储持久性数据的文件集、远程调用RPC的功能和简单的动态语言集成功能。其中,代码生成器既不需要读写文件数据,也不需要使用或实现RPC协议,它只是一个可选的对静态类型语言的实现。Avro系统依赖于模式(Schema),Avro数据的读和写是在模式之下完成的。这样就可以减少写入数据的开销,提高序列化的速度并缩减其大小。 Avro 可以将数据结构或对象转化成便于存储和传输的格式,节约数据存储空间和网络传输带宽,Hadoop 的其他子项目(如HBase和Hive)的客户端和服务端之间的数据传输。 HDFS HDFS:是一个分布式文件系统,为Hadoop项目两大核心之一,是Google file system(GFS)的开源实现。由于HDFS具有高容错性(fault-tolerant)的特点,所以可以设计部署在低廉(low-cost)的硬件上。它可以通过提供高吞吐率(high throughput)来访问应用程序的数据,适合那些有着超大数据集的应

大数据技术与应用

附件25: 高职电子信息大类大数据技术与应用赛项 技能竞赛规程、评分标准及选手须知 一、竞赛容 赛项名称:大数据技术与应用 赛项容:以大数据技术与应用为核心容,重点考察参赛选手在Hadoop平台环境下,对于大规模并行数据处理以及存计算技术的应用能力。具体包括: 1. 掌握Hadoop平台环境部署与基本配置,了解基于大数据计算平台的常见应用; 2.综合利用numpy、pandas、matplotlib、scikit 模块和MapReduce技术、分布式存储系统HDFS、分布式计算框架MapReduce/Yarn、数据仓库Hive、Python 等开发语言工具和技术,匹配和连接数据源,实现大数据的采集,提取、清洗、转换、分析、挖掘操作,产生分析结果,并且实现可视化呈现。 3.依据项目应用需求和分析结果,完成数据分析报告的编写。 二、竞赛方式 本赛项为团体赛,每支参赛队由3名参赛选手组成。 三、竞赛时量 竞赛时间4小时,竞赛连续进行。 四、名次确定办法 名次确定办法原则上按照竞赛总成绩从高分到低分排序确立选手名次。总成绩相同时,完成时间较短者名次列前;成绩和完成时间均相同时,操作过程较规者名次列前。 五、评分标准与评分细则 1.评分标准 本赛项总分为100分,采取分项计分制(表1)。

2.评分细则 竞赛成绩评定实行“裁判长合权负责制”,负责组织评分裁判进行成绩评定。评分裁判负责对参赛队伍(选手)的比赛作品、比赛表现按赛项评分标准进行评定。成绩评定根据竞赛考核目标、容对参赛队或选手在竞赛过程中的表现和最终成果做出评价。 本赛项的评分方法为现场评分和结果评分,现场评分为5分,由现场裁判根据参赛队的操作规以及综合表现情况进行评分;结果评分为95分,依据赛项评价标准,对参赛选手提交的竞赛成果进行评分。

大数据技术及其应用

大数据技术及其应用 xxxx 摘要:大数据的概念由来已久,但在多数人眼中大数据就是数据大,甚至有时和云计算混为一谈。本文主要对大数据的定义进行重新的认识,并将其与云计算加以区别。而在大数据流行的今天,大数据究竟带来了什么有利的影响,或者说它将有什么样的前景。这些问题都将在文中一一列举。 关键字:大数据云计算发展应用 Abstract:The concept of big data has a long history, but in most eyes data is large, and sometimes confused and cloud computing. This article mainly to the understanding of the definition of big data, and tries to distinguish and cloud computing. Popular and in large data today, what brought the big data beneficial effect, or it will have what kind of future. All these problems will be enumerated in this paper. Key word :Big Data Cloud computing Development Application 引言 从引爆之日到今天,大数据似乎成了万灵药,从总统竞选到奥斯卡颁奖、从web安全到灾难预测,正如那句俗语:“当你手里有了锤子,什么都看上去像钉子。”当IT经理成功部署一套Hadoop系统后,任何事看上去都与大数据有关(事实也是如此)。 但是,究竟什么是大数据呢? 如果说大数据就是数据大,或者侃侃而谈4个V,又或者拿Google和Amazon举例,技术流可能会聊起Hadoop和Cloud Computing,不管对错,只是无法勾勒对大数据的整体认识,不说是片面,但至少有些管窥蠡测、隔衣瘙痒。 大数据是互联网发展到现今阶段的一种表象或特征,在以云计算为代表的技术创新大幕的衬托下,这些原本很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值。 想要系统的认知大数据,必须要全面而细致的分解它,这里从三个层面来开:第一层面是理论,理论是认知的必经途径,也是被广泛认同和传播的基线。

浅谈大数据技术及应用教案资料

浅谈大数据技术及应 用

浅谈大数据技术及应用(黑体小二) 哈尔滨商业大学管理学院物流工程2015 王兴哲 摘要:大数据的概念由来已久,但在多数人眼中大数据就是数据大,甚至有时和云计算混为一谈。本文主要对大数据的定义进行重新的认识,并将其与云计算加以区别。而在大数据流行的今天,大数据究竟带来了什么有利的影响,或者说它将有什么样的前景。这些问题都将在文中一一列举 关键词:大数据云计算应用 浅谈大数据技术及应用 1 引言 大数据这一术语正是产生在全球数据爆炸增长的背景下,用来形容庞大的数据集合。与传统的数据集合相比,大数据通常包含大量的非结构化数据,且大数据需要更多的实时分析。此外,大数据还为挖掘隐藏的价值带来了新的机遇,同时给我们带来了新的挑战,政府机构最近也宣布了一项加快大数据进程的重大计划,各行各业也都在积极讨论大数据的吸引力。 大数据时代的到来,是全球知名咨询公司麦肯锡最早提出的,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”近几年大数据一词的持续升温也带来了大数据泡沫的疑虑,大数据代表了互联网的信息层(数据海洋),是互联网智慧和意识产生的基础。包括物联网,传统互联网,移动互联网在源源不断的向互联网大数据层汇聚数据和接受数据。 2 大数据的定义 一般意义上,大数据是指无法在有限时间内用传统IT 技术和软硬件工具对其进行感知?获取?管理?处理和服务的数据集合。大数据技术描述了新一代的技术和架构体系,通过高速采集?发现或分析,提取各种各样的大量数据的经济价值。大数据的特点可以总结为 4 个 V,即volume(体量浩大)?variety(模态繁多)?velocity(生成快速)和value(价值巨大但密度很低)。大数据价值链可分为4个阶段:数据生成?数据 采集?数据储存以及数据分析。数据分析是大数据价值链的最后也是最重要的阶段,

《大数据技术及应用》教学大纲

二、课程的性质、目的和任务 《大数据技术及应用》是计算机相关专业大学本科生及研究生选修的一门专业课程,通过本课程学习,使学生能较系统地掌握大数据的基本知识、原理和方法,初步具备大数据的应用、开发的能力,为从事大数据分析、建模、可视化奠定基础。目的是让学生了解并掌握四个领域即大数据系统的起源及系统特征;大数据系统的架构设计及功能目标设计;大数据系统程序开发;企业大数据案例分析的内容,同时利用真机实验环节以及大数据实训一体机来提升学生对大数据开发的实践能力; 本课程重点让学生掌握三个方面的内容: (1)基础篇:主要包括HDFS使用操作、MapReduce开发;、HBase数据库的开发; (2)核心篇:YARN架构、Spark集群计算、Spark机器学习、Hive数据仓库开发; (3)应用篇:医药大数据案例分析。 三、课程教学目标 (一)总体目标

掌握大数据分析的基本理论、技术,了解大数据分析的典型应用场景、掌握如何分析数据、解决问题、完成相关研究的方法,具有创新和独立思意识。(二)具体目标 通过本课程的学习,学生应达到如下目标: 1.知识与技能 (1)了解大数据平台搭建的步骤,掌握大数据的存储、分析的原理; (2)了解大数据分析的典型应用场景,例如文本挖掘、Web广告、聚类、推荐系统、Web链接分析、社交网络大数据分析、频繁项集; (3)理解大数据分析和挖掘的基本理论技术; (4)能获取、处理、分析和应用大数据资源。 2.过程与方法 (1)经过对大数据领域的探索,学会用大数据思维认识、分析和解决问题。 3.情感与态度 (1)通过探究活动,养成认真严谨的学习态度; (2)通过师生、生生互动交流,体验大数据的价值和魅力。 四、教学内容及教学基本要求 第一章大数据概述 (一)教学目的 通过本章的学习掌握大数据基本概念,理解大数据的处理流程,了解大数据在行业中的应用和未来趋势。 (二)教学要求 1、解释大数据基本概念; 2、分析大数据的分析处理流程; 3、知道大数据技术应用场景和前景。 (三)教学内容 第一节大数据的概述知识要点:大数据的定义和特征。 第二节大数据分析的过程、技术及工具知识要点:大数据的采集、存储方式、分析技术、展示及应用。 第三节大数据的价值和影响知识要点:大数据在各行各业的重大价值、挑战与风险。

相关主题
文本预览
相关文档 最新文档