基于大数据的学习分析及其系统
- 格式:pdf
- 大小:1.40 MB
- 文档页数:2
基于Hive的大数据分析与可视化技术研究一、引言随着互联网和信息技术的快速发展,大数据已经成为当今社会中不可忽视的重要资源。
大数据分析技术的发展为企业决策、市场营销、风险控制等领域提供了强大支持。
在大数据分析中,Hive作为一种基于Hadoop的数据仓库工具,为用户提供了方便、高效的数据查询和分析功能。
本文将探讨基于Hive的大数据分析与可视化技术研究。
二、Hive简介Hive是一个建立在Hadoop之上的数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。
通过Hive,用户可以方便地进行数据的存储、查询和分析,而无需编写复杂的MapReduce程序。
Hive使用类似SQL的查询语言——HiveQL,使得用户可以通过简单的SQL语句来操作海量数据。
三、大数据分析技术1. 数据采集与清洗在进行大数据分析之前,首先需要进行数据采集和清洗工作。
数据采集是指从各个数据源中获取原始数据,而数据清洗则是对原始数据进行去重、筛选、格式化等处理,以确保数据质量和准确性。
2. 数据存储与管理大数据通常以分布式存储的方式进行管理,Hadoop是其中最流行的解决方案之一。
Hadoop分布式文件系统(HDFS)可以存储海量数据,并通过MapReduce等计算框架进行并行计算。
3. 数据处理与分析在数据存储完成后,就可以利用Hive进行数据处理和分析。
通过编写HiveQL查询语句,用户可以对存储在Hive中的数据进行统计、聚合、筛选等操作,从而得出有用的信息和结论。
4. 可视化展示大数据分析结果往往需要以直观形式展示给用户或决策者。
可视化技术可以将复杂的数据转化为图表、报表等形式,帮助用户更直观地理解和分析数据。
常用的可视化工具包括Tableau、Power BI等。
四、基于Hive的大数据分析与可视化技术研究1. 数据导入与处理首先,将原始数据导入HDFS中,并创建对应的Hive表。
然后通过编写HiveQL查询语句,对数据进行清洗、转换和聚合操作,以便后续分析使用。
基于大数据的学生学习行为分析及其对学习效果的影响研究方案:基于大数据的学生学习行为分析及其对学习效果的影响1. 研究背景与目的随着信息技术的快速发展,大数据技术的应用已经渗透到各个领域。
在教育领域,大数据技术的应用也逐渐引起人们的关注。
本研究旨在基于大数据技术,对学生的学习行为进行深入分析,并探究学习行为对学习效果的影响,从而为提高学生学习效果提供有力的参考。
2. 研究方法本研究将采用以下方法进行实验和调查:2.1 数据采集2.1.1 研究对象选择一所学校或一所大学作为研究对象,选取不同年级和专业的学生作为样本。
2.1.2 数据采集工具使用学校教务系统或在线学习平台的学生数据库作为数据源,获取学生的学习行为数据,包括但不限于在线学习时间、学习课程、学习地点等。
2.2 数据处理与分析2.2.1 数据清洗对采集到的学生学习行为数据进行清洗和去噪,排除异常值和重复值,并对数据进行分类整理。
2.2.2 数据分析方法采用统计学方法、机器学习算法和数据挖掘技术对数据进行分析。
具体分析方法包括但不限于:聚类分析、关联规则挖掘、时间序列分析等。
2.2.3 分析指标根据研究目标,选择合适的分析指标,如学习成绩、学习进度、学习参与度等,对学习行为与学习效果之间的关系进行量化分析。
3. 方案实施3.1 实验组与对照组设计将样本随机分为实验组和对照组,实验组采用新的学习方法或策略,对照组采用传统的学习方法。
通过对比两组学生的学习行为和学习效果,评估新的学习方法或策略对学习效果的影响。
3.2 实验方法实验组和对照组学生在学习过程中,使用学习记录的方式采集学生的学习行为数据。
对实验组学生进行访谈或问卷调查,获取学生对新学习方法或策略的主观评价。
3.3 数据采集时长根据实验进度和研究周期,设定数据采集的时间段,一般建议至少持续一个学期以上。
4. 数据整理和分析4.1 数据整理对采集到的数据进行整理,并构建学生学习行为数据集。
有关智慧教室系统的参考文献智慧教室系统是一种基于先进技术的教育手段,旨在提供更高效、更互动的教学环境。
它结合了信息技术、网络技术和教育理念,为学生和教师创造了全新的学习和教学体验。
为了更深入地了解智慧教室系统及其最新发展,我收集了以下几篇参考文献。
1. "智慧教室系统构建与应用研究",于XX年发表于《教育信息化与现代教育技术》杂志。
本文从理论和实践的角度,探讨了智慧教室系统的构建和应用。
作者重点介绍了智慧教室系统的结构、功能和关键技术,并结合实际案例讨论了智慧教室系统的优势和存在的问题,为智慧教室系统的进一步研究和推广提供了有益的参考。
2. "智慧教室系统中的虚拟现实技术研究",于XX年发表于《教育技术研究》杂志。
本文就虚拟现实技术在智慧教室系统中的应用进行了全面的研究。
作者详细阐述了虚拟现实技术的原理和特点,并介绍了将虚拟现实技术应用于智慧教室系统中的方法和效果。
文章指出,虚拟现实技术可以为教师提供更丰富、更真实的教学资源,同时激发学生的学习兴趣和主动性。
3. "智慧教室系统下基于大数据的学习分析研究",于XX年发表于《现代教育技术》杂志。
本文重点关注大数据在智慧教室系统中的应用和学习分析。
作者介绍了智慧教室系统中数据的采集、存储和处理方法,并探讨了如何利用大数据技术实现对学生学习情况的全面分析。
该研究对教师提供个性化、有针对性的学习指导具有较高的实用性和参考价值。
4. "智慧教室系统对学生学习效果的影响研究",于XX年发表于《现代教育技术与教育信息化》杂志。
本文通过实证研究的方法,对智慧教室系统对学生学习效果的影响进行了深入探讨。
作者设计了相应的实验,并分析了学生在智慧教室系统下的学习表现和成绩变化。
研究结果表明,智慧教室系统的应用能够显著提高学生的学习效果和兴趣,为学校推广智慧教室系统提供了有力的实证依据。
以上是我收集的关于智慧教室系统的参考文献。
学习心得随着我国整体教育信息化的不断推进,各类教育资源公共服务平台不断建设并完善,在这些平台上汇集了大量的教学资源、学习者和教育者,构成了我国在线学习平台的教育大数据。
在线学习平台可以记录学习者和教育者在整个教学过程的各类动态数据,记录真实的教学过程,并利用大数据的分析技术,准确地分析目前的教育教学实际情况,然后对学习者推送合适的学习资源和个性化学习建议,帮助教育者更加了解每一位学习者,进行有针对性的教学,助推整个教育的个性化和可量化。
由于当前大部分的在线学习平台对整个学习过程的监测不够,所以笔者认为大数据概念和技术的引入,可以给整个在线学习平台带来革命性的改变,带来一种全新的视角和教育理念。
然而,在线学习平台上存储的数据众多且复杂,面对这种情况,我们应该如何去收集、分析,并充分运用它呢?本文对基于在线学习平台的学情大数据进行了具体分析。
随着国家整体教育信息化程度的不断推进,很多在线学习平台都得到蓬勃发展。
步入大数据时代后,在线学习平台更是逐渐受到人们的重视。
面对在线学习平台里的庞大数据,我们应该充分挖掘和利用这些动态学习数据。
具体步骤如下:第一,数据的收集。
收集的数据包含两个部分:一是学习者的静态信息。
它除了关于学习者自身的个人信息,如年纪、身份、学历等外,还有学习者平时的学习习惯、学习结果等,包括学习者自己选择的哪些课程、在论坛区当中的发帖和讨论回复别人的帖子数据、学习者浏览视频的次数频率、鼠标点击以及时间停留的数据等。
二是动态数据。
这包括学员搜索的关键词、浏览内容及次数、课程学习实践、练习时间、翻看讨论内容时间、下载文件、拖动滚动条次数、视频暂停次数、课程各个章节视频播放时间、各个章节视频使用情况、浏览器收藏记录等。
单个学员日均在线时间、登录的频率数目、日均浏览视频的次数、日均浏览互动论坛区的频率数目、发帖数量和回帖数量等,都可以通过学习者学习过程的行为数据得到。
数据收集的方法主要是采用系统日志的采集,如Facebook里面的scribe,它能够从各种日志源上收集日志,然后存储到一个中央存储系统,以便进行集中统计和分析。
大数据及其处理系统研究综述引言随着科技的快速发展,大数据已成为当今社会的重要组成部分,对各行各业产生了深远的影响。
大数据技术是指通过采集、存储、处理、分析等手段,从海量的数据中提取有价值的信息和知识,服务于各个领域。
本文将对大数据及其处理系统进行深入研究和分析,以期为相关领域的发展提供参考和借鉴。
大数据的概念及特点大数据是指规模巨大、结构复杂、高速增长的数据集合,具有数量庞大、类型多样、实时性强、价值密度低等特征。
这些数据来自于各种来源,包括互联网、社交媒体、企业数据库等。
大数据的特点可以归纳为四个方面:量(Volume)、速度(Velocity)、多样性(Variety)和真实性(Veracity)。
量:指数据的规模庞大,以ZB、EB、TB为单位来衡量。
速度:指数据的产生和处理速度非常快,具有实时性。
多样性:指数据类型多样,包括结构化数据、非结构化数据、半结构化数据等。
真实性:指数据的来源和准确性难以保证,需要进行数据清洗和验证。
大数据处理系统的研究大数据处理系统是指用于对大数据进行采集、存储、处理和分析的技术系统。
以下是大数据处理系统的研究重点:1. 数据存储和管理在大数据时代,数据的存储和管理成为了一个重要的问题。
分布式文件系统如Hadoop的HDFS和Google的GFS是常用的数据存储技术,它们可以将数据分散存储在多台机器上,实现数据的可靠性和可扩展性。
此外,数据库技术如NoSQL和NewSQL也得到了广泛的应用,它们可以处理结构化和非结构化的数据,具有高性能、高扩展性和高可用性。
2. 数据处理和分析数据处理和分析是大数据处理系统的核心。
批处理和流处理是两种常见的大数据处理方式,批处理主要解决大规模的结构化数据问题,如Hadoop的MapReduce;流处理则主要解决实时性问题,如Apache 的Storm和Flink。
分析技术包括机器学习、数据挖掘、统计学习等,可以对数据进行深入的分析和挖掘,发现数据中的模式和规律。
教育大数据分析与决策支持系统近年来,随着计算机和数学技术的发展,大数据的概念已经成为人们谈论的热门话题。
而在教育领域,教育大数据已经逐渐成为大家关注的领域。
教育大数据分析是指基于大数据技术对教育数据进行系统分析、挖掘、应用和推理,以发现其中的规律和价值,进而提供有益的决策支持。
而教育大数据分析与决策支持系统,则是利用教育大数据进行教育决策支持和评估的一种系统化的手段。
在这篇文章中,我们将探讨教育大数据分析与决策支持系统的重要性,应用场景以及其未来发展趋势。
一、教育大数据分析与决策支持系统的重要性教育大数据分析与决策支持系统的重要性在于,其能够从海量、复杂、多样化的教育数据中挖掘出有价值的信息,为教育机构提供科学、便捷、真实、客观的数据分析依据,从而指导教育决策。
例如,可以通过数据分析来了解学生的学习状态,并根据学生的学习情况对教学策略进行优化。
通过数据分析可以了解学生所需要的课程内容,以便课程开发者设计更加符合学生需求的课程,从而提高学生的学习效果。
又例如,通过数据分析可以了解教师的授课质量及其教学效果,以便教育管理者可以针对性地对教师进行培训和素质提升。
因此,教育大数据分析与决策支持系统的重要性不可忽视。
二、教育大数据分析与决策支持系统的应用场景教育大数据分析与决策支持系统的应用场景非常广泛。
我们可以将其应用到以下几个方面:1. 学生成绩分析。
学生成绩是最常见的教育数据之一。
通过对成绩分析可以掌握学生的学习状态和成绩分布情况,并需要针对性地优化课程设计和教学策略。
2. 课程开发和优化。
通过收集学生在学习中的数据,可以分析学生学习曲线及相关数据,提高教育机构对教学质量的掌控,并为课程开发者提供有用的数据参考。
3. 教师培训和评估。
通过对教师授课的数据进行分析,可以评估教师授课的效果,从而为教师的培训和考核提供更科学的依据。
4. 教育决策支持。
教育大数据分析与决策支持系统还可以为教育管理者提供决策支持,进而减少教育资源的浪费,提高教育效果。
海螺预测预警系统简介海螺预测预警系统是一种基于大数据分析和机器学习算法的系统,旨在提供海洋环境中的预测和预警服务。
该系统可以帮助海洋研究人员、渔民和海洋工作者预测海洋中的各种事件,包括风暴、潮汐、海浪、海水温度等,并及时发出预警,以保障人们的生命安全和财产安全。
功能海螺预测预警系统具有以下主要功能:1. 数据收集和存储海螺预测预警系统会定期从各个海洋观测站和传感器中收集海洋环境数据,包括海水温度、风速、风向、海浪高度等,并将这些数据存储在数据库中用于后续的分析和预测。
2. 数据分析和建模海螺预测预警系统利用大数据分析和机器学习算法对收集到的海洋环境数据进行分析和建模。
系统会根据历史数据和实时数据,通过各种算法进行数据挖掘和模式识别,以识别出不同的海洋事件及其可能的发生时间和区域。
3. 预测和预警基于数据分析和建模的结果,海螺预测预警系统可以预测不同的海洋事件,并及时发出预警。
系统可以根据用户设定的参数,自动发送预警信息到用户的手机或电子邮件中,提醒用户采取相应的安全措施。
4. 数据可视化和报告海螺预测预警系统还提供数据可视化和报告功能。
用户可以通过系统的图表和图像界面,直观地了解海洋环境数据的趋势和变化。
系统还可以生成详细的报告,包括预测结果、预警信息和数据分析结果,供用户参考和分析。
应用海螺预测预警系统可以广泛应用于各个海洋相关领域,包括但不限于:•海洋研究:海洋科学家可以利用该系统的预测和预警功能,帮助他们更好地理解海洋系统的变化和演变。
•渔业管理:渔民可以利用该系统的预测和预警功能,规避恶劣的海洋环境,以确保渔船和渔业资源的安全。
•海上交通:船舶和海上平台的拥有者可以利用该系统的预测和预警功能,规划航行路线和安排工作计划。
•海岸防御:沿海地区的居民和政府可以利用该系统的预测和预警功能,采取适当的防护措施,减少风暴和海浪带来的灾害损失。
总结海螺预测预警系统是一种基于大数据分析和机器学习算法的海洋环境预测和预警系统。
大数据分析技术及其应用随着信息时代的发展,大数据已经成为各行各业中不可或缺的资源。
大数据的海量、高速和多样化特点给传统数据处理方式带来巨大冲击,因此,人们迫切需要新的大数据分析技术来应对这一挑战。
本文将从数据挖掘、机器学习和人工智能等方面,探讨大数据分析技术的应用及其重要性。
一、大数据分析技术概述大数据分析技术是指利用各种算法和技术来处理和分析大数据,从中提取有价值的信息和知识。
其核心在于数据挖掘、机器学习和人工智能等技术的应用。
通过对大量数据的深入研究和分析,我们可以发现其中的规律和趋势,为决策和创新提供有力支持。
二、数据挖掘在大数据分析中的应用数据挖掘是大数据分析中最常用的技术之一。
它包括聚类分析、分类分析、关联规则挖掘等方法,通过对大量数据的处理和分析,挖掘出其中的潜在知识。
通过数据挖掘,我们可以发现隐藏在海量数据中的模式和规律,为企业决策提供科学依据。
比如,通过对顾客购买记录的分析,可以为企业提供个性化推荐服务,提高客户满意度和销售额。
三、机器学习在大数据分析中的应用机器学习是利用计算机算法来使计算机具有学习能力,通过学习和优化算法来提高模型的准确性和性能。
在大数据分析中,机器学习可以应用于分类、回归、聚类等问题。
例如,通过对大量图像的训练和学习,机器学习可以实现图像识别和人脸识别等技术,广泛应用于安防、智能交通等领域。
四、人工智能在大数据分析中的应用人工智能是指通过模拟人脑的智能行为和思维方式来实现机器智能。
在大数据分析中,人工智能可以应用于自然语言处理、语音识别、智能推荐等方面。
通过人工智能技术,我们可以从海量数据中提取有价值的信息,并根据用户的需求进行个性化推荐。
例如,通过智能推荐系统,我们可以根据用户的历史浏览记录和兴趣,给出符合其喜好的推荐商品或内容。
五、大数据分析技术的应用案例大数据分析技术在各行各业都有广泛的应用。
以电商领域为例,通过对用户的购买行为、浏览记录进行分析,可以实现个性化推荐,提高销售额和用户满意度。
教育大数据分析平台及其在教学管理中的应用一、教育大数据分析平台简介在当今信息化时代,大数据技术已经成为了世界各行各业的趋势。
在教育领域,也出现了许多不同形式的教育大数据分析平台,它们使得教育管理者能够更全面地收集和分析数据,并据此设计更有效的教育管理体系。
教育大数据分析平台是一种利用数据仓库和智能分析技术,将各个环节的数据进行融合、分析和利用的系统。
该系统可以广泛地应用于教育领域的各个方面,如教育资源共享、学生学习行为分析、教育管理决策分析等。
二、教育大数据分析平台在学生学习行为分析中的应用1.行为数据的获取和分析教育大数据分析平台能够收集学生在课堂和线上学习过程中留下的大量数据,如观看视频的时间、答题的速度和准确率、查阅资料的次数等。
基于这些数据,系统可以从多个维度分析学生的学习行为,如何根据学生的行为特点来规划教学内容,提高学生的学习效果等。
2.学生学习过程的监控和分析教育大数据分析平台可以实时监控学生的学习过程,通过分析学生在学习过程中的状态,如集中注意力、思考等规律,运用大数据分析方法深入挖掘学生学习的特点和问题,提高学生学习的效率和效果,优化学生学习的过程。
三、教育大数据分析平台在教学评价中的应用1.学生素质档案管理和教学评价学生素质档案是学校评价体系中的重要组成部分,能够更具体地记录每个学生的学习成果、能力和兴趣等信息。
教育大数据分析平台能够自动记录学生在学习过程中产生的数据,并根据学生素质档案中的各项指标来对学生进行评价,更深入地了解学生的各方面情况。
2.教师教学评价和反馈教育大数据分析平台不仅仅能够帮助学校对学生的学习情况进行快速、准确的评价,同时也可以对教师的教学进行全方位的评价和反馈。
系统根据教师的教学记录和心理测量数据,来进行教育管理,优化教学策略。
四、教育大数据分析平台在教学管理中的应用1.学校管理和决策分析教育大数据分析平台能够为学校决策者提供多层次的数据分析和报表功能,为学校管理提供有力支持。
Data Base Technique •数据库技术Electronic Technology & Software Engineering 电子技术与软件工程• 153【关键词】大数据 学习分析 系统近年来,随着社会快速发展,使得数据数量呈爆炸性增加,从而进入到大数据时代。
由于大数据具有数量庞大、内容多样,传递速度较快等特点,使其得到了广泛的应用,其中当然也包括教育行业。
教育行业通过对大数据的应用,开发出了智能化学习分析系统,通过该系统的应用,可以提升各方面人员的学习效率。
因此,对基于大数据的学习分析及其系统基于大数据的学习分析及其系统文/谢晓广进行研究具有重要意义,更为在学习分析系统中提升对大数据进行应用奠定良好基础。
1 智能化学习的需求分析1.1 动态与静态分析典型场景在学习过程中,主要由两种分析方式构成,一种为动态分析,即学生在利用信息化技术学习时,能够自主对学生情况进行分析,以掌握其具体要求,如学生学习过程中,在某个模块上停留了很长时间,则表明其对这一模块感兴趣,或者是很难对该内容进行理解,针对这一分析结果,系统即可向该学生提供相应的学习资料,以确保提升学习效果。
另一种为静态分析,即在整个学习环境内,以日、星期、月、年等为基准,分析学生学习相关的信息,通过这些信息的分析,以了解学生对系统的应用情况,从而为系统进一步优化提供良好支持。
1.2 不同用户的需求分析对于学习分析系统用户来说,可以将其分成四种类型,每种类型的用户对系统具有不同要求。
1.2.1 教师教师作为知识的传授者,注重学生的学习情况,需要针对学生的学习情况,及时调整教学方案。
然而在以往阶段当中,教师很难利用传统的技术,获取学生的全面实际情况,只能利用自身的教学经验进行观察与判断,使得分析出来的结果存在一定差异,导致其制定出来的方案不一定符合学生实际要求。
此外,即使可以准确掌握学生的实际情况,但由于精力与时间有限,也很难根据每个学生的不同特点,采用合理的教育方式。
因此,教师对学习分析系统应用时,主要用来对学生情况进行分析,并对不同学生的需求采用相应的教育方案。
1.2.2 学生作为学习的主要参与者,应通过学习分析系统的应用,掌握自己学习情况,获得更多学习资源,并对学习方法进行调整。
1.2.3 教育决策者通过这一系统的应用,应获得整个学习方面的信息,才会从宏观角度出发,对整个教育工作进行优化。
1.2.4 研究学者费标签、饮食标签等。
通过挖掘标签以及设定权重,我们就可以用模型完整的表示一个大学生。
3.4 画像聚类聚类,顾名思义就是“物以类聚,人以群分”,其主要思想是按照特定标准把数据集聚合成不同的簇,使同一簇内的数据对象的相似性尽可能大,同时,使不同簇内的数据对象的差异性尽可能大。
就本文而言,聚类就是把相似的大学生分到同一组。
谱聚类(Spectral Clustering)是一种基于图论的聚类方法——将带权无向图划分为两个或两个以上的最优子图,使子图内部尽量相似,而子图间距离尽量距离较远,以达到常见的聚类的目的。
谱聚类的图模型可解释为:无向带权图模型G=<V ,E>,每一条边上的权重w ij 为两个顶点的相似度,定义相似度矩阵W 和度矩阵D 和邻接矩阵A ,有拉普拉斯矩阵L=D −A 。
基于Python 实现谱聚类算法流程如下:(1)利用欧氏距离计算距离矩阵;(2)利用kNN 计算邻接矩阵A 。
(3)由邻接矩阵A 计算度矩阵D 和拉普拉斯矩阵L ,并标准化L →D −1/2LD −1/2。
(4)对L →D −1/2LD −1/2进行特征值分解,得到特征向量H nn ;(5)将H nn 当作样本送入K-means 进行聚类,获得聚类结果C=(C 1, C 2, ..., C n )。
4 总结针对高校智慧校园系统产生的海量数据,探究大学生画像的应用具有重要的现实意义。
本文通过描述数据采集、用户建模、标签挖掘、画像聚类等一系列流程构建大学生画像集合,可以为每一位大学生提供个性化、精准的学习规划和校园服务。
参考文献[1]李光耀,宋文广,谢艳晴.智慧校园学生画像方法研究[J].现代电子技术,2018,6(41):161-167.[2]董潇潇,胡延,陈彦萍.基于校园大数据的大学生行为画像研究与分析[J].计算机与数字工程,2018,6(46):1200-1204.[3]赵国亮,陈晓军,李思奇,吴傲.基于数据分析高校学生自画像的初探[J].数字技术与应用,2017,08:233-234.[4]齐怀峰.大数据背景下高校贫困生类别的判定[J].高校辅导员学刊,2016.10:74-77.[5]刘柏岩.精准画像在高校学生事务精细化管理方面的运用[J].教育教法探讨与实践,2017,12:263-265.[6]/html/2018/xxgg_0521/17575.html 海南师范大学校园大数据应用平台.[7]刘友超,张曦煌.基于自然最近邻相似图的谱聚类[N].计算机应用研究,2018,V37网络版.[8]https:///a/231884382_197042,基于用户画像的聚类分析.作者简介张海华(1980-),男,河北省衡水市人。
研究生,高级职称。
研究方向为大数据、机器学习、信息系统。
作者单位1.深圳大学信息中心 广东省深圳市 5180602.深圳大学心理与社会学院 广东省深圳市 5180603.衡水学院现代教育技术管理中心 河北省衡水市 053000<<上接152页154 •电子技术与软件工程 Electronic Technology & Software Engineering数据库技术• Data Base Technique通过该系统内数据的采集,以促进研究活动的进行。
2 智能化学习分析的面向目标2.1 学习资源管理目前,在我国教育事业当中,存在数量庞大的学习资源,有效对这些资源进行管理,可以为学习活动的开展提供重要帮助。
然而,实际上,对学习资源管理时,主要以消除“孤岛信息”为目标,而构建出相应的数据库,并采用分布式的方式,对其进行储存从而在物理层次上,对学习资源进行了整合。
但由于并未从学习资源管良性角度出发对其进行管理,导致这些资源管理的效率不是很高,用户对这些学习资源应用时,很难提取出全面、准确的资源,从而影响系统的应用效率。
同时,以往对学习资源管理时,很难同时开展多项计算活动,导致系统无法同时为多个用户提供资源,也表明资源管理效率不是很高。
因此,在大数据背景下,应对学习资源管理问题进行优化。
2.2 学习过程在学习人员学习过程中,涵盖非常丰富的信息,如学习能力、学习效果等,通过这些信息的分析,可以准确了解其学习情况,如根据用户的登录时长,以及系统在线时间的分析,判断出其学习的意愿;针对系统的回应时间,判断出用户的是否专心;根据学习相关频率,判断出用户使用该系统时,是以学习为主,还是以其他方面的交谈为主等。
总之,这样对学习过程进行分析,能够确定出合理的变量与模型,以加强对学习人员的学习状况,从而为学习方案的高进提供良好帮助。
2.3 动态知识地图构建在智能化知识管理系统内。
知识地图是其中非常重要的组成部分,其可以将整个学习过程当中涉及到的人员与资源等结合到一起,以构建出动态的网络。
虽然,不同人员对知识地图的解释略有差异,但本质上基本相同,具体来说,主要包括以下两个方面:(1)均是通过可视化的手段,反映出知识间存在的关系;(2)均认为其是一个导航系统,通过其能够反映出知识的来源,从而为用户创造出信息交流的空间,使得知识能够被更多的人员获取。
所以说,在学习服务当中,知识地图至关重要。
然而,对知识地图应用时,由于后台数据计算量较大,传统技术很难达到这一要求。
针对这一问题,即可通过对大数据技术的应用,构建出良好的知识地图,以提升学习服务的效果。
3 基于大数据的学习分析系统3.1 功能组件目前,常见的学习细分析系统通常是利用Hadoop 技术开发的,其主要由以下几个部分构成:(1)Sqoop 。
主要为SQL 与HDFS 间,对数据转换的Aaache 开源框架工具,通过其可以将整个数据库与Hadoop 结合到一起,从而形成良好的互补。
当前现有的学习分析系统内,存储了很多类型的数据,其中关系数据非常关键,若想要有效对该类型数据进行应用,则需要使用Sqoop ;(2)Flume 。
是一个日志聚合系统,其可以根据实际需求,确定出数据的发送者,以使数据能够得到介绍,同时还具备一定的处理能力,使数据符合实际需求。
也就是说,该模块运行时,从应用方着手,向Hadoop HDFS 方发送相应数据;(3)Map Reduce 框架。
主要由两部分构成,一个是Ext :DIS ,其主要针对学习资源的相应模型,确定出相应的检索方案,另一个为Ext :DRC ,其主要是分析大数据;(4)E-HDFS 框架,主要完成学习大数据的管理工作;(5)HBase ,即数据库,主要为系统的分析提供数据支持。
3.2 主要功能3.2.1 学习信息的记录与分析学习分析系统运行时,需要通过学习过程数据的采集与分析,从而掌握学习的实际情况。
所以,在该系统当中,应包含学习信息的记录与分析功能。
根据Web 环境内,学习分析服务器的实际情况,提供普适的学习分析数据汇聚接口,并通过Hadoop Pig ,或者是Hiv 与Flume 的方式,对所有信息进行收集、分析。
在这一功能当中,主要由三部分构成,(1)数据汇聚模块,主要从整个学习环境当中,收集到相应的学习信息,将其传递给Flume 节点;(2)Flume 模块,其将采集到的学习信息传送至Hadoop 集群;(3)Hadoop 集群模块,其主要对数据进行分析,并将得到的结果导入到HBaxe 内,使得用户可以对相关信息进行查询。
3.2.2 学习资源的管理在学习分析系统内,还具备良好的学习资源管理功能,系统可以将学习相关的信息进行有效存储,用户对该系统进行应用时,可以针对自身的实际需求,快速获得相应信息,同时还可以对学习资源展开全面分析,从而建立出良好的知识地图,并为用户提供高质量的学习服务。
该功能也有三个部分构成:(1)通过学习大数据存储模型,获取相关的学习资源;(2)将其传入到Hadoop 集群内,由该模块分析数据;(3)利用MapRsducer 模块进行处理,从而得出相应的结果。
3.2.3 学习干预与开放式服务作为学习分析系统当中的重要组成部分,学习干预可以判断出学习人员的行为方式,并针对学习人员的实际情况,对其进行相应的干预,以转变学习人员的不良行为,从而提升学习人员的学习效果。
这些干预涉及很多方面,如资源的发送,科学的学习方案确定,不良学习改进方案的确定等。