【高校辅导员优秀论文范例】大数据思维下科学化开展新生适应性教育的研究与探索
- 格式:docx
- 大小:66.03 MB
- 文档页数:7
大数据思维下科学化开展新生适应性教育的研究与探索
一、 引言
随着信息技术的飞速发展,结构化、非结构化的信息和数据无时无刻不在快速产生和积累,大数据时代已经来临。2013年被称为中国大数据元年[6],大数据理念已渗透到人们学习、工作和生活的方方面面[3],大数据处理技术已在各行各业中发挥着关键的支撑作用。在这样的大背景和新形势下,高等教育也必将迎来数据浪潮带来的历史机遇,产生深刻变革。
当代在校大学生多是“90后”、“95后”的新生代,道德观念多元化、价值判断趋利化、主体意识个性化、心理素质脆弱化等特点日益凸显[7],传统的学生工作模式和工作规律已经不能完全与当代大学生个性化成长成才需求相适应;同时,网络的普及使得当代大学生越发表现出“知识都在网络上,思想都在博客上,朋友都在QQ上,情感都在短信上,时间都在微信上”的特点,因此,运用传统的调查问卷方式采集的学生数据与“最真实”的学生信息拟合度较低,分析结果科学化程度难以保证。而运用大数据思维,可以避开学生的“防御心理”,通过信息平台隐式地收集、处理学生“最自然”的行为数据,利用科学的数据分析方法动态地、有预见性地得出学生总体特征和个体差异,构建学生元数据库和个性图谱,为学生工作科学化开展提供理论支撑。
因此,运用大数据思维开展大学生思想政治教育工作,借助数据分析技术帮助我们跟踪每一个个体的数据、发现真正的学生[5],是新时期高校学生工作发展的必然方向,也是提高学生工作科学化水平的必然要求。本文以新生适应性教育为切入点,基于北京航空航天大学“梦拓计划”,通过平台研发、数据采集、模型构建和特征提取,将“Mentor”的静态信息数据与新生“梦拓组队”的动态行为数据进行集成分析,归纳出新生整体性的心理特征和实际需求,从而为新生适应性教育工作提出科学化建议。
二、 研究内容
(一) “梦拓计划”及信息平台
国外学者Martin和Hanrahan[4]研究认为,大学生在本科一年级(特别是入校后的适应期)时的学习生活情况,对大学四年的学习、工作以及毕业后的发展差异分化的贡献率占到了整体的53%;同样,北京航空航天大学招生就业部门有研究表示,90%的大学优秀毕业生在大一时就表现突出、成绩优秀。这说明大学四年中,一年级学生工作至关重要;做好一年级学生的适应性教育,帮助和引导他们找到有效的大学学习方法和生活方式意义重大。同时,Henry J. Eyring[2]在《The Innovative University》一书中提到,大学教育的价值在于“师生之间”、“生生之间”的面对面、自由互动式的交流。
为此,北京航空航天大学基于“朋辈教育”的理念,在新生入学后实行“梦拓计划”:选拔优秀的二年级本科生作为“Mentor”,通过开展文化体验课等交流活动帮助一年级新生更好地适应大学生活,以达到开拓视野、提高素养、共同进步的目标。
为支撑“梦拓计划”顺利实施,改变传统的“指派式”的学生工作模式,我们研发了“梦拓”信息平台,新生可根据自己的兴趣点和实际需求在平台中自由选择“Mentor”。图1表示了信息平台的总体架构:
图1 “梦拓”信息化平台架构图
如图1所示,数据层记录学生“Mentor组队”过程中的行为数据,用以分析学生总体特征和每个人的个性特征图谱。目前该平台已经应用到北京航空航天大学计算机学院、软件学院、知行书院、宇航学院四个单位,共采集1039人的静态信息数据和动态行为数据,统计结果如图2所示:
图2 数据采集规模统计图
(二) “Mentor”特征向量提取
本文对数据库中“Mentor”简介进行特征标签标注(与后台日志时间戳一一映射),采用分词系统进行分词处理并得到163个代表“Mentor”特征的离散关键词,并利用LDA模型[1]对关键词进行特征分析。LDA特征分析原理如图3所示:
大球运动小球运动体育活动艺术鉴赏文化旅游摄影创作编程语言科技竞赛技术发明班干部学生会党支部0.5 Mentor1: 成绩优异,乐于助人,篮球 Mentor2:音乐,摄影,旅游,电影 Mentor3: 足球,好爽,聚会,山东 Mentor4:编程,科技,Java,冯如杯 Mentor5:班长,学生会,党员,朋友1.0特征1:体育特征2:社交特征3:文艺特征4:专业
图3 特征提取原理图
利用LDA模型对163个关键词进行特征分析,通过对比后台日志时间戳对参数进行调优,最终聚类出最受新生关注的七大“Mentor”特征,构成“Mentor”七维核心特征优势向量,每个分量代表着“Mentor”可能具备的特征项。本文将“Mentor”特征向量表示如下:
[文艺,体育,学习,工作,专业(技术),休闲,社交]
基于聚类得到的样本数据,本文进一步统计得到七维核心特征优势向量占比(即拥有某个分量特征的人占总人数的百分比)分别为[9.71%, 8.01%, 8.98%, 13.83%, 10.68%, 3.40%, 20.87%],占比排序为[4,6,5,2,3,7,1]。图4直观地表示了“Mentor”七维核心特征优势及相应分量占比:
图4 “Mentor”七维核心特征优势及所占分量比
分析分量占比数据,可以看出新生对“Mentor”特征的倾向:新生群体整体偏向选择外向交友型和工作能力突出型的学长学姐作为自己的“Mentor”,具备较强专业能力特征的“Mentor”占比也比较高;另一方面,本文结合北航实际情况将“Mentor”性别作为一个特殊的影响因子加入到研究中,并发现“女性Mentor”在实际组队过程中非常受欢迎,这在一定程度上影响了一般情况下的组队行为,可能与北航男女比例的特殊性有一定关系。(本文研究数据中,“Mentor”男女比例为1.56:1,女生占比为39.1304348%,各学院详细男女数量见图2)
(三) 新生动态行为数据处理模型构建
本文在研究过程中,采用北航“梦拓”信息平台数据库中已记录的用户操作时间戳、相关操作日志以及网页访问日志共计2万余条操作数据,涵盖了新生访问平台的各类操作以及对于数据库访问的慢日志统计下的选择信息。基于以上行为数据,利用数据扫描处理工具Scanner对大量日志文本数据进行扫描处理,去除噪声数据(例如管理员操作的数据等)后对有效区间内的数据进行处理,得到如图5所示的新生操作热度曲线图:
图5 组队时段新生操作数随时间变化曲线图
由图5可以看出:新生发生组队行为的操作次数随时间推移不断减少,曲线总体呈现出类似热度曲线的下降趋势(即降温过程),符合客观规律。在此基础上,本文根据降温原理构建分量热度模型,利用数据拟合方法进行数据分析,期望得到新生所选“Mentor”的每个特征分量热度值并排序,以更科学地挖掘学生的行为特性和兴趣关注点。 现将分量热度模型描述如下:
时间刻度:以组队时间的开始和结束为界,对时间线进行均分后得到若干具有一定粒度的时间段;为每个时间段赋予的时间标识值,即为时间刻度值;
热度权重:即每个阶段的热度的量化的衡量值。(本文中最高热度定为100,最低热度定为0,可以用操作数归一化到0-100)。
为确定某时间刻度值的热度权重,本文研究发现:时间刻度值小的(时段靠前)比时间刻度值大的(时段靠后)特征更受欢迎,故权重值高;反之权重值低。
由上可知:时间刻度值与热度权重负相关。本文将二者进行二次拟合,得到如图6所示的拟合曲线:
图6组队时段热度权重与时间刻度二次拟合曲线图
现将采用的公式描述如下:
总体热度公式:
W=K*(A*T2+B*T+C)
其中,W表示热度权重,K表示归一化系数,T表示时间刻度,C为常数。图6所示时间段(242-258)参数分别为:K=5.46,A=0.0528,B=-27.123,C=3489.90。
某向量分量的热度值可用该分量在该刻度下被选择数量与热度权重之积的累加和表示:
H=∑(𝑁∗𝑊)
其中,H表示分量热度值,N表示分量数目,W表示分量热度权重。分量数目如图7所示: 图7 组队过程中分量数目统计图
以“242-258”的时间刻度范围为例,通过计算得到的最终结果如表1所示。表1表示出了新生对“Mentor”特征优势的倾向程度排序,由高到低依次为:工作、社交、体育、学习、专业、文艺、休闲。但这只是一个中间过程,并不能代表最终结果。
表1 七维核心特征优势各项热度值表
时间刻度 文艺 体育 学习 工作 专业 休闲 社交
242 199.98 599.94 299.97 399.96 0.00 0.00 699.93
243 0.00 366.87 275.15 458.59 183.44 91.72 366.87
244 0.00 252.07 84.02 336.09 84.02 84.02 252.07
245 76.90 153.81 0.00 230.71 76.90 0.00
153.81
246 211.09 281.45 0.00 211.09 211.09 0.00 0.00
247 64.40 128.79 64.40 321.98 321.98 0.00 257.59
248 0.00 59.01 118.01 236.03 59.01 0.00 59.01
249 108.39 54.19 54.19 0.00 0.00 0.00 54.19
250 0.00 99.92 99.92 99.92 0.00 149.88 149.88
251 46.30 46.30 185.20 185.20 0.00 0.00 0.00
252 43.22 43.22 43.22 43.22 86.43 0.00 172.87
253 40.71 0.00 0.00 0.00 0.00 0.00 40.71
254 77.56 38.78 38.78 38.78 77.56 0.00 116.34
255 37.43 37.43 37.43 37.43 74.86 0.00 112.28
256 36.65 73.30 0.00 36.65 36.65 0.00 36.65
257 0.00 109.36 0.00 109.36 0.00 0.00 0.00
258 0.00 36.83 0.00 36.83 36.83 0.00 36.83
H 942.63 2381.27 1300.30 2781.83 1248.77 325.62 2509.03
Rank 6 3 4 1 5 7 2
(四) 综合量化分析
由于七维核心特征优势向量的每一个分量所占比重各不不同,因此所具有的热度值不具有可比性,要得到最终的倾向性排序,需要进行归一化综合量化分析。结果如表2所示:
表2 综合量化结果
优势 文艺 体育 学习 工作 专业 休闲 社交
热度值 942.63 2381.27 1300.30 2781.83 1248.77 325.62 2509.03
占比 9.71% 8.01% 8.98% 13.83% 10.68% 3.40% 20.87%
综合分 9708 29729 14480 20114 11693 9577 12022
排名 6 1 3 2 5 7 4
表2给出了“Mentor”七维核心特征优势向量中每一个分量的受关注程度排序,由高到低依次为:体育、工作、学习、社交、专业、文艺、休闲。
三、结论与建议
根据以上研究结果,结合北航学生工作实际情况,可以得出: