基于深度学习的学习者情感识别与应用
- 格式:doc
- 大小:40.00 KB
- 文档页数:11
基于深度学习的自然语言处理技术在情感分析中的应用研究摘要:本文综合探讨了深度学习在自然语言处理(NLP)领域中的应用,特别是在情感分析方面的发展和应用。
论文首先介绍了自然语言处理的基本概念及其与深度学习结合的背景。
随后,详细分析了深度学习技术在情感分析中的具体应用,包括但不限于卷积神经网络(CNN)、循环神经网络(RNN)和长短期记忆网络(LSTM)。
通过实例研究和现有文献的综合分析,本文展示了深度学习技术在提高情感分析准确性和效率方面的潜力。
最后,对当前的挑战和未来的发展方向进行了展望。
关键词:自然语言处理、深度学习、情感分析、卷积神经网络、循环神经网络、长短期记忆网络在信息时代,数据的海量增长带来了前所未有的挑战和机遇。
特别是文本数据,作为信息传递的主要媒介,蕴含着丰富的情感和意图。
自然语言处理(NLP),作为计算机科学和人工智能的一个重要分支,旨在使计算机能够理解、解释和操作人类语言。
随着深度学习技术的兴起,NLP领域经历了革命性的变化,尤其是在情感分析这一子领域。
本文旨在全面分析深度学习技术在情感分析中的应用,并评估其效果。
我们将重点关注几种主要的深度学习模型,如卷积神经网络(CNN)、循环神经网络(RNN)和长短期记忆网络(LSTM),并探讨它们如何在不同的情感分析场景中被应用和优化。
1.自然语言处理和深度学习概述自然语言处理是一门跨学科领域,它结合了计算机科学、人工智能和语言学,目的是让计算机能够理解、解释和生成人类语言。
NLP的应用广泛,包括机器翻译、情感分析、语音识别、文本挖掘等。
它涉及一系列复杂的任务,如语法分析、语义理解和语境解释。
传统上,这些任务依赖于规则和统计方法,但这些方法在处理复杂和非结构化的语言数据时常常受限。
深度学习是机器学习的一个分支,它通过模仿人脑中神经网络的结构和功能来处理数据。
深度习模型由多层(或“深度”)的神经网络组成,能够从大量数据中学习复杂的模式和特征。
基于深度学习的人脸表情分析与情绪识别系统设计人类表情是沟通和交流的重要方式之一。
识别人脸表情和情绪可以帮助计算机系统更好地理解人类情感,从而实现更智能的交互。
近年来,深度学习技术在计算机视觉领域取得了巨大的进展,尤其在人脸表情分析和情绪识别方面有着广泛的应用。
本文将介绍基于深度学习的人脸表情分析与情绪识别系统的设计原理和方法。
1. 引言人的情绪表达是非常复杂的,通过人脸表情可以传达出愤怒、快乐、悲伤等各种情感信息。
传统的人脸表情分析方法需要手动提取特征,其准确性和鲁棒性受到了限制。
而深度学习技术能够自动提取和学习特征,为人脸表情分析和情绪识别提供了新的解决方案。
2. 数据集准备构建一个强大的人脸表情分析与情绪识别系统首先需要大量的标记数据集。
这些数据集应涵盖多种表情和情绪,以保证系统的泛化能力和准确性。
常用的数据集有FER2013,CK+,JAFFE等。
数据集的预处理包括人脸检测和对齐,以确保输入的人脸图像质量和准确性。
3. 基于深度学习的人脸表情分析人脸表情分析的核心是通过深度学习模型自动提取表情特征并进行分类。
常用的深度学习模型包括卷积神经网络(CNN),递归神经网络(RNN)和卷积递归神经网络(CRNN)等。
在训练过程中,需要使用标记数据集对模型进行监督学习,通过最小化损失函数来优化模型参数。
4. 情绪识别技术情绪识别是人脸表情分析的一个重要应用。
通过分析人脸表情,系统可以判断出人的情绪状态,如高兴、悲伤、生气等。
深度学习方法在情绪识别上取得了显著的成果。
通常采用卷积神经网络进行特征提取和分类,同时结合长短期记忆网络(LSTM)来捕捉时间序列信息。
5. 实验与评估为了评估基于深度学习的人脸表情分析与情绪识别系统,可以使用交叉验证或独立测试集的方式进行实验。
通过比较系统分类结果与人工标记的真实情况,可以计算系统的准确率、召回率和F1值等指标来评估系统性能。
6. 应用和挑战基于深度学习的人脸表情分析与情绪识别系统在实际应用中有广泛的前景。
基于深度学习的情感分析模型研究情感分析是自然语言处理领域中的一个重要任务,旨在通过对文本进行分析和理解,识别出文本中所表达的情感倾向。
随着深度学习技术的不断发展,基于深度学习的情感分析模型逐渐成为研究的热点。
一、引言深度学习是一种人工智能领域的机器学习方法,通过模拟人脑神经网络的结构和功能,实现对大规模数据的学习和分析。
情感分析作为一种文本挖掘技术,可以广泛应用于社交媒体分析、产品推荐、舆情监测等领域。
本文将重点探讨基于深度学习的情感分析模型,并分析其优势和挑战。
二、基于深度学习的情感表示方法在情感分析中,如何准确地表示文本中的情感成为一个关键问题。
基于深度学习的情感表示方法通过构建深度神经网络模型来提取文本中的情感特征。
例如,卷积神经网络(CNN)可以通过一系列卷积层和池化层,逐层提取句子中的局部语义信息,得到句子的情感表示。
而循环神经网络(RNN)则通过建立循环结构对句子进行逐词处理,可以保留句子中的时序信息。
三、基于深度学习的情感分类模型情感分类是情感分析的核心任务,主要是将文本分为正面情感、负面情感或中性情感。
基于深度学习的情感分类模型可以通过构建多层网络结构,自动学习句子中的情感表示并进行分类。
例如,长短时记忆网络(LSTM)是一种常用的循环神经网络模型,在情感分类任务中取得了较好的效果。
通过引入门控机制,LSTM可以有效地捕捉句子中的长距离依赖关系,提升情感分类的准确性。
四、基于深度学习的情感强度预测模型除了情感分类,情感分析还可以预测文本中的情感强度。
基于深度学习的情感强度预测模型通过回归模型实现,将文本分为不同的情感级别,如低强度、中强度和高强度等。
例如,多层感知机(MLP)是一种常用的前馈神经网络模型,在情感强度预测任务中取得了一定的效果。
通过多个隐藏层的组合,MLP可以构建一个非线性映射模型,从而有效地进行情感强度的预测。
五、基于深度学习的情感分析应用基于深度学习的情感分析在多个领域有着广泛的应用。
基于深度学习的文本情感分析与情绪识别技术研究一、引言在如今信息爆炸的时代,人们每天处理着大量的文本数据,这些文本数据中蕴含着丰富的情感和情绪信息。
因此,利用计算机技术对文本进行情感分析和情绪识别具有重要意义。
本文将探讨基于深度学习的方法在文本情感分析和情绪识别方面的技术研究。
二、文本情感分析技术研究1. 情感分析概述情感分析是指对文本中的情感进行自动分析和识别的过程。
它通常分为两类:情感极性分析和情感目标分类。
情感极性分析是用来判断文本的情感态度是积极的、消极的还是中性的;情感目标分类则是将文本中表达的情感与特定的情感目标联系起来。
2. 传统的情感分析方法传统的情感分析方法主要依赖于人工构建的特征以及机器学习算法。
人工构建的特征包括词袋模型、n-gram模型和情感词典等,而机器学习算法主要包括支持向量机(SVM)和朴素贝叶斯(Naive Bayes)等经典算法。
3. 基于深度学习的情感分析方法近年来,深度学习技术的快速发展为文本情感分析带来了新的突破。
深度学习模型可以自动从原始文本中学习有用的特征表示,无需依赖于人工构建的特征。
常见的基于深度学习的情感分析模型包括卷积神经网络(CNN)和长短期记忆网络(LSTM)等。
三、文本情绪识别技术研究1. 情绪识别概述情绪识别是指通过分析文本中的语义和语境信息,识别出文本所表达的情绪类别。
情绪类别通常包括愉快、悲伤、愤怒、惊讶等。
2. 传统的情绪识别方法传统的情绪识别方法主要依赖于人工定义的规则和特征。
例如,通过构建情感词典,并利用词频统计等方法进行情绪识别。
然而,传统方法的效果受限于人工定义的规则和特征的质量。
3. 基于深度学习的情绪识别方法基于深度学习的情绪识别方法可以从文本中学习到更丰富、更有表达力的语义特征表示。
通过使用深层的神经网络模型,如循环神经网络(RNN)和注意力机制(Attention),情绪识别模型能够更好地捕捉文本中的情感和情绪信息。
基于多模态深度学习的情感识别技术研究1.引言情感识别一直是自然语言处理领域的一个重要问题。
近年来,随着社交网络等大数据应用的兴起,情感识别技术得到了更广泛的应用。
目前,情感识别技术主要基于文本分析和语音分析,但是这些方法的准确度和效率都有一定的局限性。
随着深度学习技术的不断发展,人们开始探索基于多模态深度学习的情感识别技术,这在很大程度上提升了情感识别的效果和精度。
2.文本情感识别方法文本情感识别是情感识别中比较成熟的一种技术。
传统的文本情感识别方法主要基于机器学习算法,例如支持向量机(SVM)、朴素贝叶斯(Naive Bayes)等。
这些方法可以对文本进行特征抽取和分类,但是准确度和鲁棒性方面都存在一定的问题。
随着深度学习技术的广泛应用,人们开始使用神经网络模型进行文本情感识别。
近年来,基于多层感知机的情感分析方法取得了很好的效果。
比如,快速文本情感分类器(FastText)就是一种基于神经网络的情感分析方法。
该方法主要利用词向量表示和矩阵运算,可以实现高效的情感识别。
此外,基于递归神经网络(RNN)的情感识别方法也得到了广泛研究。
在这种方法中,RNN能够从上下文信息中获取语义特征,并对情感进行分类。
这种方法具有一定的泛化能力和鲁棒性,但是计算速度较慢。
3.语音情感识别方法随着智能语音助手等语音交互应用的普及,语音情感识别也成为了热门的研究领域。
传统的语音情感识别方法主要基于声学特征的分析。
例如,基于高斯混合模型(GMM)的语音情感识别方法就是一种常见的声学特征分析方法。
该方法通过对语音信号的频率、能量、谐波等声学特征进行分析,提取出特征向量,并使用GMM进行情感分类。
这种方法需要大量的语音样本进行训练,且对噪声等干扰较为敏感。
近年来,基于深度学习的语音情感识别方法也得到了广泛研究。
在这种方法中,神经网络模型可以对语音信号进行特征提取和分类。
例如,基于卷积神经网络(CNN)的语音情感识别方法就可以从语音信号中提取出频谱、光谱等特征,并对情感进行分类。
《基于深度学习的方面级情感分析研究》一、引言情感分析是自然语言处理(NLP)的一个重要应用领域,其主要目标是判断和分析文本、句子或词汇所蕴含的情感色彩。
传统的情感分析研究主要集中在整个文本的情感倾向判断上,然而在许多应用场景中,人们往往需要对文本的某个或某些具体方面进行情感分析,即方面级情感分析(Aspect-based Sentiment Analysis,ABSA)。
本文旨在研究基于深度学习的方面级情感分析技术,通过挖掘文本的细粒度情感信息,为实际应用提供更加精准的情感分析结果。
二、深度学习在方面级情感分析中的应用深度学习技术为方面级情感分析提供了新的思路和方法。
在传统的情感分析中,往往需要手动提取特征,而深度学习技术可以自动从原始数据中学习到有用的特征表示,从而提高了情感分析的准确性和效率。
在方面级情感分析中,深度学习技术主要应用于以下几个方面:1. 词汇和句子的情感极性判断。
通过训练深度学习模型,使其能够从大量文本数据中学习到词汇和句子的情感极性信息,从而判断出文本中各个方面的情感倾向。
2. 方面级情感提取。
通过使用卷积神经网络(CNN)或循环神经网络(RNN)等深度学习模型,可以从文本中自动提取出与特定方面相关的情感信息,从而实现方面级情感分析。
3. 情感分类和情感强度判断。
通过使用深度学习模型对文本进行分类和回归分析,可以判断出文本的情感分类和情感强度信息,从而为方面级情感分析提供更加全面的信息。
三、基于深度学习的方面级情感分析模型本文提出了一种基于深度学习的方面级情感分析模型,该模型主要包括以下部分:1. 数据预处理。
将原始文本数据进行清洗、分词、去除停用词等预处理操作,以便后续的模型训练和分析。
2. 特征提取。
使用卷积神经网络(CNN)或循环神经网络(RNN)等深度学习模型,从预处理后的文本数据中自动提取出有用的特征信息。
3. 方面级情感提取。
将提取出的特征信息输入到注意力机制等模型中,对与特定方面相关的情感信息进行筛选和提取。
开题报告范文基于深度学习的人脸表情识别与情感分析研究开题报告一、研究背景和意义随着计算机视觉和人工智能的发展,人脸表情识别和情感分析在各个领域的应用越来越广泛。
人脸表情识别和情感分析是指通过对人脸表情进行分析和判断,进而获取人的情感状态。
这项研究在情感计算、心理学、医疗健康、人机交互等领域有着重要的意义。
人脸表情具有丰富的信息,能够传递人的情感状态和内心感受。
通过深度学习技术,可以对人脸表情进行准确的识别和分类,进一步实现情感分析。
人工智能识别和分析人脸表情的能力,能够帮助社会各个领域更好地了解人的情感状态,为决策提供参考依据,改善人机交互体验,甚至在医疗健康领域推动情感治疗的发展等。
二、研究目标本研究旨在基于深度学习的方法,对人脸表情进行识别和情感分析。
结合计算机视觉和人工智能的技术,建立一个高精度的人脸表情识别模型,并探索通过情感分析深入理解人的情感状态。
具体研究目标包括:1. 构建一个准确的人脸表情识别模型。
通过深度学习算法,使用大规模的人脸表情数据集进行训练,提高模型的分类准确率。
2. 开发一个高效的人脸情感分析系统。
基于人脸表情识别模型,实现对人的情感状态进行实时分析和判断。
3. 探索人脸表情识别和情感分析在实际应用中的价值。
将研究成果应用于特定领域,例如人机交互、娱乐产业、医疗健康等,评估其效果和社会价值。
三、研究内容和方法1. 数据采集和预处理。
收集大规模的人脸表情数据,并进行数据清洗、标注和划分训练集和测试集。
2. 深度学习模型设计与训练。
选择合适的深度学习框架和网络结构,对人脸表情数据进行训练,优化模型的泛化能力和鲁棒性。
3. 情感分析算法研发。
基于训练好的人脸表情识别模型,将其应用于情感分析任务,并进行特征提取、情感分类和情感量化等工作。
4. 系统开发与优化。
将研究成果转化为实际应用系统,提升系统的实时性、准确性和用户友好性。
5. 应用评估和实验验证。
将研究成果应用于相关领域,进行实地测试和评估,验证模型和系统的性能和效果。
基于深度学习的图像情感分析研究近年来,随着深度学习技术的快速发展,基于深度学习的图像情感分析逐渐成为计算机视觉领域的热门研究方向。
图像情感分析旨在通过计算机自动识别图像中所传达的情感信息,从而对人类情感进行理解和分析。
这种技术的发展潜力在于其在多领域中的应用,如广告推荐系统、智能辅助决策以及智能图像搜索等。
一、深度学习在图像情感分析中的应用深度学习是一种模仿人脑中神经网络结构和工作原理的机器学习方法。
在图像情感分析中,深度学习模型以大量数据为训练集,通过多层次、非线性的神经网络结构来学习图像特征,并通过提取高层次的表示来实现情感分析任务。
首先,深度学习模型通过卷积神经网络(Convolutional Neural Networks, CNN)对图像进行特征提取。
通过一系列的卷积层、池化层和激活函数层,CNN可以自动提取出图像的局部和全局特征,从而准确地表达图像中的情感信息。
其次,深度学习模型利用循环神经网络(Recurrent Neural Networks, RNN)来捕捉图像中的时序信息。
RNN模型能够对图像中的相关动态进行建模,从而识别出图像中的情感变化和情感表达方式。
最后,深度学习模型通过使用递归神经网络(Recursive Neural Networks, RecursiveNN)来处理图像的结构信息。
递归神经网络能够对图像中的分层关系进行学习,从而更好地理解图像中的情感表达。
二、深度学习模型在图像情感分析中的性能评估为了评估深度学习模型在图像情感分析中的性能,研究者通常使用准确率(Accuracy)、召回率(Recall)、精确率(Precision)和F1分数(F1-score)等指标来进行衡量。
准确率是模型在识别图像中情感信息时的正确率,即被正确分类的图像数目与总图像数目的比例。
召回率是模型正确识别情感的比例,即被正确分类的情感图像数目与所有情感图像数目的比例。
精确率是模型正确识别情感图像的比例,即被正确分类的情感图像数目与被分类为该情感的总图像数目的比例。
基于深度学习的多模态数据融合与情感识别技术研究多模态数据融合与情感识别技术在当今社会中起着越来越重要的作用。
随着互联网和社交媒体的普及,人们在日常生活中产生的数据变得越来越多样化和丰富化。
这些数据包括文本、语音、图像和视频等多种形式的内容。
为了更好地理解人类情感和行为,多模态数据融合与情感识别技术应运而生。
多模态数据融合与情感识别技术主要是通过将不同形式的数据整合在一起,从而获得更全面、准确的情感信息。
深度学习作为一种强大的人工智能算法,为多模态数据融合与情感识别技术提供了有力的支持。
首先,多模态数据融合是将来自不同模态的数据信息进行有效组合,形成更加全面和准确的情感识别结果。
例如,我们可以将文本、语音、图像和视频等数据进行融合,从而更全面地捕捉到人类的情感表达。
基于深度学习的多模态融合方法通常包括两个步骤:特征提取和特征融合。
在特征提取阶段,深度学习模型可以自动学习到数据中潜在的情感特征。
而在特征融合阶段,深度学习模型可以将提取出的特征进行融合,得到更全面的情感识别结果。
其次,情感识别是一项关键的任务,它可以帮助我们更好地理解人类情感和行为。
基于深度学习的情感识别方法通常采用循环神经网络(RNN)或卷积神经网络(CNN)等模型。
这些模型可以自动学习到数据中的情感信息,并准确地判断出人类的情感状态。
此外,深度学习模型还可以通过迁移学习的方法,将在其他任务上训练得到的知识迁移到情感识别任务中,从而提高情感识别的准确性和稳定性。
基于深度学习的多模态数据融合与情感识别技术在许多领域具有广泛的应用前景。
首先,在社交媒体分析中,多模态数据融合与情感识别技术可以帮助我们更好地理解用户在社交网络上的情感表达。
这对于电商平台和广告公司等进行用户行为分析和用户情感分析至关重要。
其次,在医疗领域,多模态数据融合与情感识别技术可以帮助医生和医学研究人员更好地理解患者的情感状态,并提供个性化的医疗服务。
此外,在智能交通系统中,多模态数据融合与情感识别技术可以帮助我们更好地理解驾驶员的情感状态,从而提高交通安全性和驾驶体验。
龙源期刊网 http://www.qikan.com.cn 基于深度学习的学习者情感识别与应用 作者:徐振国 张冠文 孟祥增 党同桐 来源:《电化教育研究》2019年第02期
[摘; ;要] 情感能够影响和调节学习者的注意、记忆、思维等认知活动,学习者情感的准确识别是构建智慧学习环境中和谐情感交互的基础,更是判断学习者学习状态的重要手段。传统学习者情感识别方法存在识别率低、算法复杂、鲁棒性差等问题,并且容易丢失面部表情特征的关键信息。文章提出一种基于卷积神经网络的学习者情感识别方法,该网络包括3个卷积层、3个池化层和1个全连接层。然后在自主搭建的大规模学习者情感数据库中进行了训练和实验,实验结果表明该方法能够快速、准确的识别学习者情感。未来,该方法可应用到智慧学习环境建设中,为完善学习者模型、实现情感交互、挖掘学习行为等提供技术支撑。
[关键词] 深度学习; 学习者情感; 情感识别; 智慧学习环境; 情感交互; 卷积神经网络 [中图分类号] G434; ; ; ; ; ; [文献标志码] A 一、引; ;言 智慧学习环境注重培养学习者的创新能力、问题求解能力、决策力和批判性思维能力等高阶能力,认知活动在培养过程中起着至关重要的协调与控制作用[1]。情感是由外界刺激引起的心理反应,能够影响和调节注意、知觉、表象、记忆、思维和语言等认知活动。研究表明,学习过程中的积极情感有助于激发学习动机、培养学习兴趣,促进认知过程;而消极情感则会影响耐心度、注意力,阻碍认知过程[2]。另外,智慧学习环境以学习者为中心,打破了传统的教学模式,强调以MOOCs、微课、博物馆等为学习资源的泛在学习和无缝学习。学习者多借助电子书包等移动设备进行自主学习和协作学习,师生在时空上多处于准分离状态,难以感受对方的情感,普遍存在“情感缺失”问题。学习者情感能够影响学习兴趣和效率,其准确识别是构建智慧学习环境中和谐情感交互的基础,更是判断学习者学习状态的重要手段,对促进学习者的智慧学习具有重要意义。
2016年《地平线报告(高等教育版)》指出,情感计算(Affective Computing)将在未来四到五年内得到普遍应用[3]。学习者情感识别作为情感计算的重要内容,研究者主要围绕生理信号、心理测量、外显行为对其开展研究[4]。美国学者梅拉比安(Albert Mehrabian)指出,感情表达=7%的言辞+38%的声音+55%的面部表情[5]。心理学家艾克曼(Paul Ekman)的研究表明,从面部表情到单一具体情感状态映射的准确率为88%[6]。可见,学习者情感表达方式中,面部表情起到了非常关键的作用。并且实践应用中,通过学习设备自带摄像头捕捉学习者的面部表情,进而识别学习者情感状态,要比其他方法更加自然可行。
传统学习者面部表情识别算法主要包括图像预处理、特征提取、特征选择、分类器构建等过程,面部表情的视觉情感特征需要显式的表达和提取,并依赖经验或运气对其进行挑选。龙源期刊网 http://www.qikan.com.cn 这无疑增加了识别难度,并且可能会丢失原图像的关键特征信息。随着技术的快速发展,深度学习(Deep Learning,DL)成为人工智能领域重要的机器学习算法。深度学习将图像特征提取与神经网络的模糊分类相结合,省略前期复杂的图像预处理和特征提取过程,使之不再依赖人工精心设计的显式特征提取方法,在提高性能、泛化能力的同时,也提高了识别算法的鲁棒性[7]。深度学习已在医学图像处理、自然语言处理等领域获得应用,但在教育领域的应用尚需进一步研究。本研究自建大规模学习者情感数据库,并提出基于深度学习的学习者情感识别方法,以期提高学习者情感的识别效率和准确率,为智慧学习环境中和谐情感交互提供技术支撑,促进学习者轻松、投入和有效的学习。
二、相关研究 自2006年以来,深度学习在算法、理论和应用等方面取得了巨大成功,已然成为人工智能和大数据领域的发展引擎。情感能力是人类智能的重要标志,赋予计算机识别、理解和表达情感的能力,是人工智能未来前进的方向。通过梳理深度学习、学习者情感识别的发展历程及相关研究,既可为本研究的开展提供有价值的借鉴,也可为弥补现有研究的不足提供切入点。
(一)深度学习 迄今人工神经网络(Artificial Neural Networks,ANN)大致经历了三个阶段,第一个阶段始于20世纪40年代至60年代的控制论。但其无法处理“异或”问题,并且此时的计算机缺乏足够的计算能力,无法满足神经网络长时间的运行需求。第二个阶段始于20世纪80年代末期,鲁姆哈特(David Rumelhart)等学者提出反向传播(Back Propagation,BP)算法[8],雖然克服了“异或”问题,并使两层神经网络所需的复杂计算量降低,但受限于数据获取的瓶颈,普遍存在过拟合等问题。随着计算机性能的显著提升以及大数据时代的到来,2006年,加拿大的辛顿(Geoffery Hinton)等研究者在Science上发表了一篇文章,提出一种被称为“深度置信网络”(Deep Belief Network,DBN)的神经网络模型以实现数据降维[9]。文章的核心观点为:(1)有着较多隐层的神经网络结构具有独特的特征学习能力,能够较好地获取图像更本质的特征;(2)可通过“逐层初始化”来克服深层神经网络的训练难度。自此,开启了人工智能领域的深度学习时代。2016年3月,阿尔法围棋(Alphago)以4:1的比分战胜韩国围棋名将李世石,引起全世界关注的同时,深度学习、神经科学等概念也进入普通公众的视野。
深度学习属于机器学习(Machine Learning,ML),本质上是对拥有深层结构的模型进行训练的一类方法的统称。目前主流的深度学习模型有深度置信网络(Deep Belief Networks,DBN)、循环神经网络(Recurrent Neural Networks,RNN)、卷积神经网络(Convolutional Neural Networks,CNN)等。1998年,美国学者勒存(Yann Lecun)等提出基于梯度学习的CNN算法,并将其运用于手写数字字符识别[10]。2012年,在ImageNet大规模视觉挑战赛中,辛顿等学者凭借CNN获得图像分类和目标定位任务的冠军。自此,CNN得到学界的关注和持续研究。CNN最初受脑神经科学研究的启发,模仿视觉神经中简单细胞和复杂细胞的视觉信息处理过程,用卷积操作模拟简单细胞对不同方向边缘信息的处理过程,用池化操作模拟复杂细胞累积相近的简单细胞的处理结果[11]。CNN支持将图像的像素值直接作为输入值,隐龙源期刊网 http://www.qikan.com.cn 式地获得图像抽象的特征信息,而不必事先对图像进行预处理以及显式地提取图像特征,避免了复杂的特征提取和人工选择过程,并且CNN对图像的平移、缩放、旋转等变换以及光照、遮挡物等敏感问题具有较高鲁棒性。因此,CNN在手写字符识别、人脸识别、车牌字符识别等领域得到了广泛应用,目前已成为人工智能领域的重要方法。深度学习和CNN的关系如图1所示。
(二)学习者情感识别 情感是人们在社会活动中对客观事物所持的态度体验,是人们对客观事物的一种特殊的心理反映形式,它在人的思想認识及行为表现中发挥着重要作用[12]。学习者情感多指学习者在学习过程中由学习内容、学习画面等刺激产生的内心体验及相应的外部表现。近年来,随着情感计算的发展,研究者基于不同的情感理论已提出许多种学习者情感识别方法。目前,学习者情感识别主要围绕生理信号分析、心理测量分析、外显行为分析等三类方法展开研究。其中,基于外显行为的方法又分为基于面部表情的方法、基于语音表情的方法和基于姿势表情的方法等。
1. 基于面部表情的学习者情感识别研究 孙波等研究者依据艾克曼提出的面部表情编码系统(Facial Action Coding System,FACS)构建基于面部表情识别的情感分析框架SLE-FER,包括感知层、传输层、数据层、分析层和应用层,并利用张量分解算法进行表情识别[1]。詹泽慧结合眼动追踪与面部表情识别,提出基于智能Agent的远程学习者情感与认知识别模型,将眼动追踪与表情监控迭代识别、情感与认知过程相耦合,以提高识别准确率[13]。荷兰开放大学的巴雷尼(KiavashBahreini)等学者提出通过网络摄像头和麦克风改善学习者学习的框架FILTWAM,FILTWAM根据学习者的面部表情及语言表达识别学习者情感并及时提供反馈[14]。印度的雷(Arindam Ray)等学者采用面部表情及生理信息相结合的方法识别学习者情感,其中生理信息包括心率、皮肤电传导、血容量压力,基于此,他们探讨了学习过程中情感的变化,以及如何使用情感反馈来改善学习体验[15]。
2. 基于其他方法的学习者情感识别研究 乔向杰等研究者根据OCC模型理论,提出基于认知评价的学生情感识别模型,采用模糊推理方法实现对学习事件的期望度推理,并通过构建动态贝叶斯网络对所构建的模型进行了计算机仿真测试和评估[16]。黄焕认为,学习者发布的微博内容带有情感特征,对其分析能够获得学习者当时的情感状态,因此,提出一种基于学习者微博分析的情感建模方法[17]。台湾的陈志铭(Chih-Ming Chen)等学者采用基于生理信息检测的情感估计系统emWave来估计学习者的情感状态[18]。巴西雅克(Patricia Jaques)等学者借助信念、愿望、意图模型在教育环境中实施情感判断过程,他们采用基于情感认知理论并可通过计算实现的心理学OCC模型,从而根据学习者的行为推断出学习者的情感[19]。