作文自动评分总结
- 格式:docx
- 大小:18.82 KB
- 文档页数:5
英语作文评卷小结
在进行英语作文评卷时,教师通常会关注以下几个关键方面:
1. 内容完整性:评估学生是否按照题目要求涵盖了所有必要的内容点。
2. 组织结构:检查文章是否有清晰的开头、中间和结尾,段落之间是
否有逻辑性的过渡。
3. 语法准确性:分析学生使用时态、语态、主谓一致等语法规则的准
确性。
4. 词汇运用:评价学生使用的词汇是否恰当,是否有尝试使用高级词汇。
5. 拼写和标点:检查文章中的拼写错误和标点符号使用是否正确。
6. 创造性和原创性:鼓励学生展示他们独特的观点和创造性思维。
7. 语言风格:评估语言是否适合作文的类型和目的,例如,正式或非
正式,描述性或议论性。
8. 格式和呈现:注意文章的格式是否符合要求,包括页边距、字体大
小和行距等。
9. 个人反馈:为每个学生提供个性化的反馈,指出他们的强项和需要
改进的地方。
10. 总结评语:在评卷的最后,给出一个总结性的评价,包括作文的
整体质量、学生的表现以及今后努力的方向。
在评卷过程中,教师应该保持公正和一致性,确保每个学生都得到公平的评价。
同时,教师的反馈应该具有建设性,旨在帮助学生提高写作技能,而不仅仅是指出错误。
通过这种方式,学生可以从作文评卷中获得宝贵的学习经验,从而在未来的写作中取得进步。
作文评估总结范文在学习过程中,作文评估是一项非常重要的任务。
作文评估不仅仅是对学生作文水平进行量化的评判,更重要的是为学生提供了发现问题、改进写作能力的机会。
作为一名语文教师,我经常进行作文评估,并总结出了一些经验和方法。
首先,在进行作文评估之前,我会精心挑选作文题目,确保其具有一定的启发性和思考性。
作文题目应该能够引导学生展开思维,激发他们的想象力和写作能力。
例如,我会设置一些开放性的题目,让学生自由表达自己的观点和见解。
这样不仅可以培养学生的思辨能力,还能够展示学生的个性和创造力。
其次,在评估学生的作文时,我会注重多层次的评价。
除了评估作文的基本要素,如语法、拼写、结构等方面,我还会对作文的内容、思路、逻辑等方面进行评价。
这样的评价方式能够更全面地了解学生的写作能力和思考水平,从而为他们提供更有针对性的指导与帮助。
然后,在进行作文评估之后,我会给每位学生详细地反馈意见。
这些反馈意见既包括对作文的肯定与赞扬,也包括对作文中存在问题的指出和建议。
我会尽可能地给予学生鼓励和肯定,同时也会针对他们的不足之处提出具体的改进意见,帮助他们更好地提高写作能力。
此外,我还会将学生的作文分类保存,形成作文库。
这样一方面可以让学生不断地回顾和反思自己的作文,另一方面也可以为后来的评估和教学提供范文参考。
作文库中的范文不仅可以用来展示学生的优秀作品,还可以作为教学材料,让学生在模仿中提高自己的写作水平。
最后,在进行作文评估总结时,我会结合学生的实际情况,总结出一些常见的问题和改进方向。
我会针对学生在词汇运用、句子结构、段落组织、篇章结构等方面的不足,提出具体的改进建议。
同时,我也会鼓励学生多读优秀的作品,提高自己的语言表达能力和写作技巧。
综上所述,作文评估不仅是一次对学生作文水平的评判,更是一次对他们写作能力的培养和提高的机会。
在作文评估中,我们应注重启发性和思考性的题目设置,多层次的评价方式以及详细的反馈意见。
作文智能评价The emergence of AI technology has brought significant changes to various fields, including the assessment of writing. With the development of natural language processing algorithms, AI has been able to provide intelligent evaluations of written compositions. This technological advancement has both advantages and disadvantages for students and educators.人工智能技术的出现给各个领域带来了巨大的变革,包括作文评估。
随着自然语言处理算法的发展,人工智能已经能够提供对写作作品的智能评估。
这种技术进步对学生和教育工作者来说既有利有弊。
On the one hand, AI tools can provide instant feedback on grammar, spelling, and structure, helping students improve their writing skills efficiently. This immediate response can be particularly useful for self-paced learners who may not have access to real-time guidance from teachers. Additionally, AI assessment systems can standardize the evaluation process, ensuring a fair and unbiased review of all students' submissions.一方面,人工智能工具可以即时提供有关语法、拼写和结构的反馈,帮助学生有效地提高写作技巧。
语文作文自评模板范文初中初中语文作文自评。
作文题目,我的暑假生活。
今年暑假,我度过了愉快而充实的两个月。
在这个假期里,我不仅参加了各种丰富多彩的活动,还学到了许多新知识,收获了不少成长和进步。
在这篇作文中,我将对自己的暑假生活进行自我评价,总结自己的优点和不足之处,为自己今后的学习和生活指明方向。
首先,我觉得我在这个暑假里充分利用了时间,参加了各种有意义的活动。
比如,我参加了学校组织的夏令营活动,结交了许多新朋友,还学到了很多有趣的知识。
我还参加了一些社会实践活动,比如志愿者活动、社区服务等,让我更加懂得了奉献和感恩。
同时,我还参加了一些文化课程的学习,比如英语培训班、书法班等,让我在假期里也能充实自己的头脑。
其次,我觉得我在这个暑假里也有一些不足之处。
比如,我有时候会因为玩游戏而耽误了学习时间,导致作业堆积,影响了学习效果。
还有,我在学习上有时候会有些懒惰,不够主动,需要老师和家长的督促才能完成任务。
这些都是我需要改进的地方,我会在今后的学习中加以改正,争取做到更好。
最后,我觉得在这个暑假里,我最大的收获就是成长了许多。
我学会了更多的自理能力,比如学会了独立洗衣、独立做饭等,让我更加懂得了生活的不易。
我还学会了更多的社交能力,能够更好地和人相处,处理人际关系。
我还学会了更多的学习方法,知道了怎样更好地学习,更高效地完成任务。
总的来说,这个暑假对我来说是一个收获颇丰的假期。
我在这个假期里不仅度过了快乐的时光,还学到了很多东西,收获了不少成长和进步。
在今后的学习和生活中,我会更加努力,更加用心,争取做到更好,成为一个更好的自己。
作文自、互评量化评分标准
作者:阅卷者:总分:
一、文章内容理解:(10分)
1、读了本文后,我认为该文的内容是:
2、对本文写作内容的评价:
(1)详细新颖(8-10分)(2)平淡无奇(5-8分)(3)过简不实(0-5分)
二、文章主题理解:(15分)
1、我认为该文的主题是:
2、对本文主题的评价:
(1)符合话题,中心深刻(10-15分)(2)基本切题,主题平淡(5-10分)(3)脱离主题,不知所云(0-5分)
三、文章结构分析:(10分)
1、构思新颖,层次分明(7-10分)
2、平铺直叙,缺少变化(4-6分)
3、结构混乱,层次不清(0-3分)
四、文章语言分析:(10分)
1、整体语言分析(5分)
(1)生动形象,流畅精彩(4-5分)
(2)较为通顺,但无亮点(2-3分)
(3)语句不通,错误连篇(0-2分)
2、开头结尾评价:(5分)
(1)新颖有文采(3-5分)(2)千篇一律,没有新意(0-3分)
五、文章的书写情况:(5分)
1、端正整洁(3-5分)
2、潦草涂改(0-3分)
补充:1、缺题目,扣2分
2.不足600字,每少50字扣1分,最多扣2分
3、错别字每3个扣一分重现的不计,最多扣2分
4. 400字以上文章,按以上标准评分,扣字数分(少50字扣1分)
400字以下的文章,25分以下评分,不再扣字数分
200字以下的文章,10分以下评分,不再扣字数分
只写一两句话的,给1分或2分。
只写标题的给1分或2分。
中考语文作文自动评分系统的设计与实现随着技术的发展,人工智能已经在许多领域中发挥出重要作用,包括教育领域。
自动作文评分系统作为一种应用人工智能技术的工具,可以大大提高教育效率,减轻教师负担。
然而,现有的自动作文评分系统往往针对特定场景设计,对于跨提示场景的评分效果不佳。
因此,研究面向跨提示场景的自动作文评分技术具有重要的理论和实践价值。
自动作文评分技术的研究始于上世纪九十年代,主要基于语言学和机器学习的原理。
近年来,随着深度学习技术的发展,尤其是自然语言处理(NLP)和计算机视觉(CV)的进步,自动作文评分技术取得了显著的进步。
然而,这些研究大多集中在特定领域的文本评分,如英语作文、数学证明题等,对于跨提示场景的评分研究仍然较少。
针对跨提示场景的自动作文评分技术研究,需要解决两大核心问题:一是如何构建一个通用的评分模型,能够适应不同的作文类型和提示场景;二是如何有效地从不同来源的提示中提取信息,以支持跨场景的评分。
在构建通用评分模型方面,可以采用深度学习技术,如Transformer 或BERT等预训练语言模型,作为作文评分的基础模型。
这些预训练模型经过大量文本的训练,具有强大的文本理解能力,可以适应不同的作文类型和提示场景。
同时,可以通过微调(fine-tuning)等技术,根据具体的作文评分需求对模型进行优化。
在提取跨场景提示信息方面,可以采用多任务学习(multi-task learning)或迁移学习(transfer learning)等技术。
这些技术可以将从一个场景中学习到的知识迁移到其他场景,从而有效地利用不同来源的提示信息。
还可以利用自然语言处理技术,如命名实体识别(NER)、关系提取(RE)等,从文本中提取关键信息,如人物、事件、地点等,以支持跨场景的评分。
面向跨提示场景的自动作文评分技术研究具有重要的理论和实践价值。
通过采用深度学习、多任务学习和迁移学习等技术,可以构建一个通用的评分模型,有效地从不同来源的提示中提取信息,以支持跨场景的评分。
英语作文自动评分系统【篇一:作文自动评分总结】李艳老师和葛诗利老师《大学英语作文自动评分中分级词表的效度研究》中提出了作文分级词表的思想,而这可以通过改进或者调整已有的词表来获得。
目前自然语言处理中准确率最高的、也是最基本的研究就是词汇分析,词汇分析一般包括词长分布、词汇分布和词汇丰富性等。
词汇分布:一篇作文中的词汇占某一分级词表每个级别词汇的比例。
laufernation的3个级别的词表。
clec中国学习者英语语料库spss软件包的单因素方差分析(anova)spss多元线性回归分数档的精确率和召回率,总体准确率和误判率个分数精确率=本为x档作文并且被评为x档作文的数量/所有被评为x档作文的总数*100 精确率越高,说明作文被评为该分数档的可信度越高laufernation 以词族为计算单位,词频概貌文秋芳以类符为计算单词,称为词频广度倪岚以形符为计算单位词频分布准确率都是30%左右徐剑和梁茂成《对集中英汉机器翻译系统的测评》翻译系统在译文输出方面已经比较成熟,源语言的语义识别方面还不如人意。
80年代,机器翻译研究863智能型英汉翻译系统—“译星一号”评估标准:系统功能,操作的难易度及译文质量(包括译文的忠实度、译语的可懂度和译文的可接受性)欧共体评估:识别(译文的得懂度、忠实度、连贯度、有用性、读取速度和译文的可接受性)和语言方面(句子结构和语义的连贯性、词汇评价、翻译错误)可懂度、忠实度和译文的可接受性梁茂成和李刚《英汉机器翻译中人称代词的处理》徐州师范大学外语系汉语术语分析语,词序、虚词等来表达各种语法关系;英语属于综合语,通过词本身的形态变化来表示英语中人称代词的使用频率要远远高于汉语汉语属于孤立性语言,英语为粘着性语言原因:1. 汉语表示所属关系的物主代词往往可以省略2. 英语中大量使用反身代词反身代词:(译星对反身代词处理较为得当)1. 英语较汉语大量使用反身代词2. 汉语反身代词具有独立的指称功能,英语则依附于其他代词或名次,无独立的指称功能。
作文评卷工作总结_工作总结一、工作回顾在对评分标准的理解和掌握方面,我认真学习了相关文件和资料,深入研究评分细则和评分要点,使自己的评卷标准更加准确、客观、公正。
在实际评卷中,我能够根据标准和要求,严格评价学生的作文,做到了公正客观。
我还结合学生的实际情况,对他们提出针对性建议,帮助他们提高作文水平。
在评卷效率方面,我不断提高了自己的工作效率。
通过不断的实践和总结,我总结了一套高效的评卷流程,确保在规定的时间内完成作文评卷任务。
在日常工作中,我注重细节,提高了评卷质量,让学生得到更准确的评价和更精准的指导。
在评审讨论方面,我积极参与了评审讨论,提出了自己的看法和建议。
通过与同事的交流和讨论,我不断开阔自己的思维,拓宽了自己的视野,提高了专业素养和能力。
在评审讨论中,我学习了很多宝贵的经验,也分享了自己的心得体会,形成了团队的合力,为评卷工作提供了更多的思路和方法。
二、已取得的成绩三、存在的问题和不足在工作中,我也发现了自己的一些问题和不足。
我在评审讨论中还需要提高自己的表达能力和沟通能力,更好地表达自己的观点和看法。
我的评卷能力还需进一步提高,需要更深入地挖掘作文的内涵和亮点,给学生更具有针对性的指导。
我需要继续不断地学习和提升自己,增强自己的专业知识和工作能力。
四、改进措施五、工作展望展望未来,我将继续坚持学习和提升自己,提高作文评卷的水平和质量。
我将努力加强与同事的交流和合作,共同提高评审质量,为学生提供更好的评价和指导。
我还将不断学习新知识,拓展自己的视野,提高自己的专业素养和工作能力,为学生的成长和发展尽自己的一份力量。
过去一年是我工作中的收获年,也是我成长中的一年。
在未来的工作中,我将继续努力,不断提高自己的专业能力,为作文评卷工作做出更大的贡献。
相信在领导的指导和同事们的支持下,我一定能够更好地完成作文评卷工作,为学生的成长和发展贡献自己的力量。
儿童作文自动评分系统研究随着时代的进步,教育方式也在悄然改变,传统的作文教学模式也逐渐被淘汰。
儿童作文自动评分系统是一种新型的作文教学方法,它可以为学生提供更好的作文辅导和评价机制。
本文将从以下几个方面探讨儿童作文自动评分系统的研究。
一、儿童作文自动评分系统的发展历程儿童作文自动评分系统源于人工智能技术的发展。
早在20世纪60年代,人们就开始研究用计算机来评价作文,但是当时计算机技术不够发达,无法实现精确的评价。
直到21世纪初,人工智能技术的飞速发展,作文自动评分系统才开始逐渐发挥作用。
目前,儿童作文自动评分系统已经成为了作文教学的重要工具之一。
二、儿童作文自动评分技术的核心原理儿童作文自动评分系统采用了人工智能技术,其核心原理是通过计算机分析作文的文字特征和语法结构,从而评估出作文的质量。
主要包括词汇使用、语法正确性、篇章结构、语言流畅度等方面。
对于儿童作文来说,自动评分技术的难点在于需要考虑年龄、语言水平、作文主题等多重因素。
同时也要考虑到评分的标准化,保证评分结果的公正准确性,并且能够提供有效的作文反馈。
三、儿童作文自动评分系统的优缺点儿童作文自动评分系统的优点很明显,它能够为儿童提供更加科学、高效、便捷的作文教学方式。
一方面,通过与人工智能交互,儿童可以更直观地了解自己作文的优缺点,提高自我评价能力,从而逐渐掌握写作技巧。
另一方面,儿童作文自动评分系统还能够提高作文评价的标准化和公正性,从而减少人为因素的干扰。
不过,儿童作文自动评分系统的缺点也不容忽视。
首先,儿童作文自动评分系统必须基于大量的样本数据才能有较高的准确性,因此需要花费大量的时间和资源来训练模型,这将会增加成本。
其次,作文自动评分系统可能会忽视作文的感性因素,这些因素对于儿童的写作能力具有重要的促进作用,因此需要综合考虑。
四、结语随着人工智能技术的不断发展,儿童作文自动评分系统将会成为未来教育的主流方式之一。
虽然这项技术仍处于不断探索和完善的过程中,但是其将使得作文教学更加科学合理,并能够提高作文评价的准确性和标准化。
作文评卷工作总结_工作总结在过去的一段时间里,我的工作重心主要围绕着对作文的评卷工作展开。
在这一过程中,我对于自己的工作方法以及能力得到了深刻的反思和提高,并且在完成评卷工作的同时,也从中获得了一些有益的经验。
首先,对于评卷工作,我发现一个良好的评分标准是十分关键的。
在评卷的过程中,我需要考虑的因素包括语言的准确性、思路的流畅性、逻辑的高度和思想的深度等等。
针对这些评分项,我对自己的评分标准有了更为明确的认识,并且也将它们贯彻到我的评卷工作中。
这样,不仅使我更加客观严谨,也为学生的作文提供了更加公正合理的评价。
其次,我在评卷过程中遇到了一些常见的问题,例如评分试题事先未给出评分标准的情况下,评卷随意性较大导致评分不公。
为了解决这些问题,我注意提高自己的专业素养,识别和分析成绩分布,对分数偏高或偏低的试卷进行仔细审查,确保每份作文都得到公正评价。
同时,我也在评卷过程中积极听取别人的意见和建议,并在合理的范围内进行调整加分或减分,确保评分结果是公正合理的。
此外,在评卷工作中,我始终坚持用心、耐心、细心、公正地评判每份作文,并且尽可能地对学生的优点或不足进行指正和提醒。
在这一过程中,我逐渐认识到作文评卷不只是一个狭隘的分数题,而是一项涉及到学生心理、思维方面的复杂任务。
因此,我在评卷工作中注重对学生的心理反应和情感体验进行考虑,增强学生对作文评价的认同感和信任感,激发他们在作文中的创造力和灵性追求。
综上所述,我的作文评卷工作总结包括三个方面:一是要制定清晰的评分标准,确保评判过程合理公正;二是要注意解决评卷中的常见问题,提高自己的专业素养,确保作文评卷的公正性和准确性;三是要从学生的学习需求出发,用心、耐心、细心、公正地评判每份作文,并且关注学生的心理和情感变化。
相信在今后的评卷工作中,我会更加注重这些方面,以提高作文评卷工作的质量和学生的写作能力。
作文评卷工作总结_工作总结
在作文评卷工作中,我始终坚持公正、公平的原则,严格遵守评卷规则,做到客观、公正的评价每一篇作文。
在评卷过程中,我尽量剔除主观意识,严格遵守评卷规范和标准,全面、客观地评价每一篇作文。
我也注重把握作文的主题思想,引导学生深入思考,不偏袒不偏听,秉公执法,认真对待每一份作文。
这样的做法在一定程度上确保了作文评卷工作的公正性和客观性,也得到了学生和家长的认可和支持。
在作文评卷工作中,我注重挖掘每篇作文的闪光点,充分发挥每一篇作文的潜能。
在评卷过程中,我不仅仅着眼于作文的问题和不足,更要抓住作文的亮点和特色,充分发挥每一篇作文的潜能。
我也注重对学生的作文进行激励和指导,鼓励学生在作文中大胆表现自己的特点和个性,引导学生树立正确的写作观念和方法。
通过这样的方法,我不仅提高了作文评卷工作的积极性和主动性,也鼓励了学生的写作兴趣和写作能力。
在作文评卷工作中,我还注重细节管理,严格把控评卷质量。
在评卷过程中,我要求自己认真仔细地审题、审卷,对每一篇作文都要进行认真评判,不能草率从事,严防差错。
我还要求自己要及时总结经验,不断提高评卷水平,确保评卷的准确性和合理性。
通过这样的方法,我提高了作文评卷工作的效率和质量,赢得了学生和家长的信任和尊重。
作文评卷工作是一项重要而细致的工作,需要我们具备严谨的态度、细致的工作、公正的原则。
在今后的工作中,我将继续加强自身的专业修养,不断提高评卷水平,确保作文评卷工作的科学、规范和公正。
愿我们共同努力,共同进步,为学生成长成才做出更大的贡献。
读书破万卷 下笔如有神 李艳老师和葛诗利老师 《大学英语作文自动评分中分级词表的效度研究》 词表的思想,而这可以通过改进或者调整已有的词表来获得。
目前自然语言处理中准确率最高的、 也是最基本的研究就是词汇分析, 长分布、词汇分布和词汇丰富性等。
词汇分布:一篇作文中的词汇占某一分级词表每个级别词汇的比例。 级别的词表。 CLEC中国学习者英语语料库 SPSS软件包的单因素方差分析( ANOVA) SPSS多元线性回归 分数档的精确率和召回率,总体准确率和误判率 个分数精确率=本为X档作文并且被评为 X档作文的数量/所有被评为 X档作文的总数*100 精确率越高,说明作文被评为该分数档的可信度越高 Laufer&Natio n 以词族为计算单位,词频概貌 文秋芳以类符为计算单词,称为词频广度 倪岚以形符为计算单位词频分布 准确率都是30%左右 徐剑和梁茂成《对集中英汉机器翻译系统的测评》 翻译系统在译文输出方面已经比较成熟,源语言的语义识别方面还不如人意。 80年代,机器翻译研究 863智能型英汉翻译系统一“译星一号” 评估标准:系统功能,操作的难易度及译文质量(包括译文的忠实度、 译语的可懂度和译文 的可接受性) 欧共体评估:识别(译文的得懂度、忠实度、连贯度、有用性、读取速度和译文的可接受性) 和语言方面(句子结构和语义的连贯性、词汇评价、翻译错误) 可懂度、忠实度和译文的可接受性
梁茂成和李刚《英汉机器翻译中人称代词的处理》 徐州师范大学外语系 汉语术语分析语,词序、虚词等来表达各种语法关系; 英语属于综合语,通过词本身的形态变化来表示 英语中人称代词的使用频率要远远高于汉语 汉语属于孤立性语言,英语为粘着性语言 原因: 1. 汉语表示所属关系的物主代词往往可以省略 2. 英语中大量使用反身代词 反身代词:(译星对反身代词处理较为得当) 1. 英语较汉语大量使用反身代词 2. 汉语反身代词具有独立的指称功能, 英语则依附于其他代词或名次, 无独立的指称功能。 英汉第二人称代词的差异 You是你还是你们? 英语代词的预指功能 人称代词在机器翻译中的处理 1. 调整语法信息库(代词的主要作用是代替名词) 2. 条件句
自动评分技术
陆军,梁颖红,陆玉清,李斌,姚建民 《多分类器融合技术在自动作文评分中的应用》
中提出了作文分级 词汇分析一般包括词 Laufer&Nation 的 3 个 读书破万卷 下笔如有神 分类器:贝叶斯、K近邻和支持向量机 自动作文评分(Automated Essay Scoring,AES) 国外主观题自动评分系统: E-rater、IEA(Intelligent Essay Assessor)、PEG(Project Essay Grade)
国内最早涉足作文评分领域:梁茂成教授 中国学习者英语语料库(Chinese Learner English Corpus )对作文中的错误进行了详细标注、 分类和统计 作文内容的特征(作文中的单词和短语,即通常的 Uni-Gram、Bi-Gram和Tri-Gram模型) 考察作文的主题和内容 语言学特征: 浅层的语言学特征(句子个数、句子平均长度、单词平均长度、单词个数)考察作文的形式 复杂的语言学特征(作文中的语法、单词的词性、连接词、各种类型错误个数)考察作文的 语法、连贯性和错误 特征筛选:文档频率(Docume nt Freque ncy, DF )、信息增益(In formation Ga in,IG )、统计 量(Chi-square
Statistic, CHI) 文本分类算法 朴素贝叶斯(Na?/e Bayes)假定各种特征之间相互独立。性能不稳定,易受分类任务的影 响。 K近邻(K-Nearest Neighbor)要求有较高质量的训练集, K值确定比较难 支持向量机(Support Vector Machine,SVM )基于结构风险最小化理论 评价分类结果的好坏:准确率 p、召回率r和F1测度
R 二2 p r /(p r)
E-rater商用机器评分系统,准确率计入相邻分数 所有分类方法的效果都要低于它们在其他方面的分类效果 原因:四级作文本身的特点和各分数作文的篇章数的分布情况 结束语: 语言学特征更能体现作文的水平 NLP技术
曹亦微,杨晨 《使用潜语义分析的汉语作文自动评分研究》 评分方式 1. 依靠精确的分析和提取反映文章质量的指标进行评分,指标大多是语法层面上的; (PEG) 2. 另一种是整体评分,综合使用了文章的词语使用、论述结构、句法结构以及内容和语义 等方面的特征(e-rater:统计方法+自然语言处理技术)。 潜语义(LSA, late nt Sema ntic An alysis )
葛诗利,陈潇潇 《文本聚类在大学英语作文自动评分中应用》 文本聚类把作文按内容的相似程度聚集到一起, 形成一棵内密外疏的聚类树。识别跑题作文 文秋芳:“作文内容能够解释作文总体质量 56%的差异” 内容评价:采用文本自动层级聚类 优点:不需要事先基于大规模标注训练集构建评价模型
PEG侧重结构分析,较高的评分准确率,忽略内容,更多地注重表面结构 IEA只基于潜伏语义分析测量的是“文本的内容和学生作文中所传达的只是,而不是作文 的风格或语言”,适用于本族语作文(基本没有较大语言失误)一单独的潜伏语义分析用于 外语作文评分显然不够 BETSY基于文本分类技术 E-rater, IntelliMetric ,语言质量和内容兼顾,适用外语作文自动评分 读书破万卷 下笔如有神 E-rater内容分析采用了向量空间模型,作文首先转化为词频的向量,再合并语言质量得分 层级聚类:自底向上(Bottom-up合并聚类)和自顶向下(Top-down分割聚类) 常见文档聚类算法:
k-mea ns算法(分割) 凝聚层级算法(Hierarchical Agglomerative Clustering , HAG 层级算法) 建立特征向量 TF-IDF (Term Frequency-
lnverse Document Frequency)
葛诗利,陈潇潇 《大学英语作文自动评分研究中的问题及对策》 四个难题:评分标准、针对性、通用性和人机界面的划分 作文自动评分研究使用技术: 计算机统计技术、自然语言处理技术、 信息检索技术和人工智 能技术 马希文计算机解决问题前提条件: 第一,必须把待解决的问题形式化 第二,这种问题必须是可计算的 第三,这种问题必须有一个合理的复杂度,要避免指数爆炸 语言:人工选取特征和机器统计加权 非英语专业大学生作文语言使用特征:词汇、短语、句法、搭配和错误 PEG统计文章长度、各种词类的数量、词长的变化(浅层文本特征) IEA使用词汇统计,实义词的统计 E-rater基于词汇统计(内容),浅层文本特征(语言) 把内容评分转换为词汇向量的统计比较 针对语言使用的评分,低分段评分准确率非常高,中、高分段,尤其是高分段准确率较低
梁茂成、文秋芳 《国外作文自动评分系统评述及启示》 信度(reliability )效度(validity) PEG( Project Essay Grade)重语言形式 实现步骤:变量提取一多元回归分析一多元回归得到的 beta值代入计算机程序换算出作文 得分 IEA (Intelligent Essay Assessor)重作文内容 矢量空间模型(Vector Space Model VSM )过滤干扰信息,提取数据中的潜在语义结构 潜在语义结构 词汇项(即词汇)一文档矩阵 term-by-docume nt matrix
之后对矩阵进行奇异值分解( Singular Value Decomposition , SVD )把原来矩阵分解为三个 不同矩阵,再重建一个新的维度较少的矩阵 E-rater既重形式又重内容一一个模块结构的混合评分系统 基于线性回归模型 三个模块: 第一模块,话语(discourse)结构,即篇章结构,依靠搜索提示词( In summary…)实 现 第二模块,句法多样性(syntactic variety )—分析语言质量 第三模块,内容(content)分析模块,通过矢量空间模型,观察作文中是否包含了足够 的与作文题目高度相关的主题词。 不足: a) 对语言质量的分析主要考虑的知识作文的句法多样性, (语言质量的分析应该包 括:词汇、句法、语言的准确性) b) 与IEA相比,内容质量分析模块显然尚有提高的余地( E-rater基于主题词分析 技术,IEA使用潜伏语义分析法是一种降维技术,可以有效去除文本中的干扰 信息) c) 篇章结构分析模块靠搜索作文中的 In conclusion等话语标记语,容易被考生识 破,导致不利的反拨作用( wash back effect) 评价评分的合理:评分的效度 评分模型中的内核技术问题