人机交互过程中认知负荷的综合测评方法
- 格式:doc
- 大小:94.50 KB
- 文档页数:18
优化人机交互的交互效果评估方法随着技术的进步和人工智能的快速发展,人机交互已经成为现代社会中不可或缺的一部分。
人机交互的效果直接影响到用户的体验和产品的竞争力。
因此,如何优化人机交互的交互效果评估方法成为了一个重要的课题。
一、用户调查用户调查是一种较为常见且直接的评估方法,通过收集用户的反馈来评估人机交互的效果。
调查可以包括问卷调查、面试、焦点小组讨论等形式。
用户调查能够在最直接的方式上获取用户的需求和意见,从而改进产品的设计和功能。
在进行用户调查时,需要注意调查的目标和问题的设计。
目标明确能够帮助研究者更好地了解用户需求,问题的设计要简洁明了,避免引导性的问题。
此外,还需要注意样本的选择,合理的样本选择能够代表目标用户群体,以避免采集到的数据失真。
二、用户体验测试用户体验测试是一种模拟真实场景的评估方法,通过让用户在特定环境中完成特定任务,观察和记录用户的行为和反馈来评估交互效果。
用户体验测试可以由专业的研究员进行,也可以邀请普通用户参与。
在用户体验测试中,需要设置明确的任务,以测试用户在特定情境下的行为。
同时还需要记录用户的操作过程和反馈,在测试过程结束后进行数据分析和总结,提供优化建议。
此外,还需要注意测试环境的模拟和数据的分析方法的科学性。
三、眼动追踪技术眼动追踪技术是一种通过追踪用户的眼部运动来评估交互效果的方法。
通过分析用户的注视点、注视持续时间等数据,可以了解用户对界面元素的关注度和交互操作的困难程度,从而优化人机交互设计。
眼动追踪技术的应用可以帮助设计者发现界面中存在的问题,比如不明显的点击区域、无关信息的干扰等。
同时,眼动追踪技术还可以帮助设计者确定用户对特定功能的关注度,从而进行优先级的排序和调整。
四、生理指标检测生理指标检测是一种通过测量用户的生理反应来评估交互效果的方法。
比如心率、皮肤电反应、肌电反应等。
通过分析这些生理指标的变化,可以了解用户对交互过程中的情绪和压力变化,有助于设计者进行改进。
人机交互评估方法人机交互评估是指对人与机器之间的交互过程进行评估和改进的方法和技术。
在现代社会中,人机交互已经成为了日常生活和工作中不可或缺的一部分。
因此,评估人机交互的质量和效果对于提高用户体验和工作效率至关重要。
本文将介绍几种常见的人机交互评估方法,帮助人们更好地理解和应用这些方法。
1. 用户调研用户调研是人机交互评估中最重要的一步。
通过收集用户的需求、偏好和反馈意见,可以了解用户的使用习惯和期望,从而为设计优化提供指导。
这可以通过开展问卷调查、面对面交流、观察用户行为等方式来实现。
在进行用户调研时,应该尽可能地招募真实的用户代表,从而保证评估结果的准确性和可靠性。
2. 任务分析任务分析旨在理解用户在特定场景中的任务需求和行为。
通过对用户进行任务分析,可以确定他们在使用系统或应用时的目标、步骤和操作。
任务分析可以通过观察用户从事特定任务、访谈用户、绘制任务流程图等方式进行。
任务分析的结果可以为界面设计和功能优化提供指导,从而实现更好的人机交互体验。
3. 专家评审专家评审是指邀请相关领域的专家对系统或应用进行评估。
专家评审可以从界面设计、交互流程、功能实现等多个方面对系统进行评估。
专家评审通常以专家小组讨论或对系统进行逐个评分的形式进行。
通过专家评审,可以发现设计中的问题、提出改进建议,以及预测和规避一些潜在的交互问题。
4. 任务绩效评估任务绩效评估是一种通过让用户参与特定任务,以评估其完成任务的效果和效率的方法。
通过实际操作和测量用户在特定任务中的表现,可以获得一些重要的性能指标,如任务完成时间、错误率等。
任务绩效评估可以帮助评估人机交互的效果和用户体验,并发现和解决一些可优化的问题。
5. 用户体验测试用户体验测试旨在模拟真实的使用场景,通过观察用户在使用过程中的表现和反馈意见,评估用户对系统的满意度和易用性。
用户体验测试可以通过实验室环境或现场使用环境进行,可以采用定量和定性的数据来评估用户的需求和体验。
人机交互设计中的认知负荷研究随着人类社会的不断进步和科技的不断发展,信息技术的应用已经成为了现代社会的核心。
人机交互则是信息技术的重要分支之一,人机交互设计中的认知负荷研究则是一个被广泛关注的研究领域。
一、认知负荷的定义和类型认知负荷是指一个人在执行某项任务时所要承受的心理上的压力和负担,可分为三种类型:1. 想象认知负荷:指人们在执行任务时必须凭借自己的想象力来进行思考的认知负荷,比如图像设计、场景构想等。
2. 记忆认知负荷:指人们在执行任务时必须将大量的信息存储在短期记忆中,并需要在任务执行中不断进行检索和使用的认知负荷,比如密码记忆、信息查询等。
3. 处理认知负荷:指人们在执行任务时需要进行信息的加工和处理,而这种信息处理通常需要进行信息组织、筛选、比对、推理等,是认知负荷中最为复杂和重要的部分。
二、认知负荷与人机交互设计的关系人机交互设计是一种针对用户体验的设计,它关注如何让用户在使用技术时更加舒适、简单、自然。
但在设计中忽略了用户的认知负荷,就会导致用户在使用过程中出现困难和错误,影响到用户的使用满意度。
因此,在人机交互设计中,认知负荷的研究和优化越来越受到重视。
设计者需要充分理解用户认知负荷的特点和类型,以此来针对用户的需求设计出更加合适的交互界面和功能模块,从而尽可能地减少用户的认知负荷,提高用户的使用效率和体验感。
三、认知负荷的测量方法由于认知负荷是一种心理上的抽象概念,人们需要根据一定的测量方法和评价标准来进行评估和研究。
目前,主要的认知负荷测量方法包括命题式、问卷式和生理信号测量等。
其中,命题式方法要求被试者进行一些特定任务,在任务完成后,根据任务难度、完成时间、错误数量等来评估被试者的认知负荷水平;问卷式方法则是利用被试者的主观感受来评估其认知负荷水平;生理信号测量则是通过测量被试者的脑电波、心率等生命信号来评估其认知负荷水平。
四、认知负荷在人机交互设计中的应用在人机交互设计中,设计者可以采用一些措施来减少用户的认知负荷,具体方法如下:1. 界面设计要简洁明了,避免过多的信息呈现。
信息输入评估方法在人机交互测试中扮演着重要角色。
本文将简要介绍几种常用的信息输入评估方法,包括肌电信号分析、眼动追踪技术和键盘输入分析。
这些方法可以帮助我们更好地理解和改进人机界面设计,提高用户体验。
1. 肌电信号分析肌电信号分析是通过测量肌肉电活动来评估用户在信息输入过程中的状态和表现。
这种方法可以帮助我们了解用户的手指和手臂肌肉活动情况,从而评估他们在输入设备上的操作效果。
通过分析肌电信号的变化,我们可以判断手指的运动范围、速度和精度,以及用户是否受到疲劳或不适。
肌电信号分析可以与其他评估方法结合使用,为人机交互设计提供更全面的数据支持。
2. 眼动追踪技术眼动追踪技术通过追踪用户的眼睛运动来评估信息输入过程中的注意力分配和目标定位。
这种方法可以帮助我们分析用户浏览界面的顺序和模式,了解他们在输入过程中如何寻找和定位目标。
通过眼动追踪,我们可以得出用户对不同元素的关注程度,识别界面中的注意力热点和冷点,从而调整布局和设计,提高用户的操作效率和满意度。
眼动追踪技术还可以揭示用户的认知负荷和注意力分散情况,为界面优化和任务分配提供指导。
3. 键盘输入分析键盘输入分析是通过分析用户在输入过程中的键盘操作来评估他们的输入效率和准确性。
这种方法可以帮助我们了解用户的击键速度、错字率以及常用快捷键的使用情况。
通过键盘输入分析,我们可以识别用户的操作习惯和错误模式,从而改进键盘布局和快捷键设置,提高用户的输入效率和舒适度。
此外,键盘输入分析还可以帮助我们评估不同输入设备的性能和响应速度,为用户选择提供参考和建议。
综上所述,在人机交互测试中,信息输入评估方法是提高用户体验的关键环节。
肌电信号分析、眼动追踪技术和键盘输入分析都可以为我们提供宝贵的数据和见解,帮助我们了解用户在输入过程中的表现和需求,从而优化人机界面设计,提升用户满意度。
未来,我们可以进一步探索和应用更多先进的评估方法,以逐步完善人机交互体验。
人机负荷评价方案一、背景随着科技的不断发展,人们的生活水平和工作方式发生了翻天覆地的变化。
人机交互已经成为了我们日常生活和工作中不可或缺的一部分。
然而,随着人机交互的不断深入和扩展,人机之间的关系也愈加复杂,人的身心健康问题也随之显现。
机械操作、电脑操作、生产作业、开车行驶等等工作方式,不仅涉及到人的生命安全,还可能引发人的身心问题,这就需要我们及时提出人机负荷评价方案。
二、定义人机负荷评价是指评价并测量人在不同的状况和任务下,身心健康、行为表现和生产效率等多方面指标的变化,以及从系统、设计、人员等几个不同角度对人机交互过程中的负荷进行评估。
三、评价指标1. 生理学指标生理学指标是评价人机交互中人体生理变化的指标,如心率、呼吸频率、生理前兆等。
通过测量这些指标,我们可以了解到人在不同的工作状态下,身体是否承受得起负荷。
2. 心理学指标心理学指标是评价人机交互中人体心理变化的指标,如注意力、情绪等。
人们在工作中面临很多压力和挑战,这些指标能够帮助我们了解人的情绪和行为表现。
3. 行为学指标行为学指标是评价人机交互过程中人体行为表现的指标,如误操作率、反应时间等。
通过测定这些指标,我们可以获得有关行为表现和行为技能的信息。
4. 主观评估主观评估是通过用户的调查、反馈和评估的方式了解人机交互的效果。
这种评估方法主要基于参与者的主观体验和反馈,可以更好地了解人的感受和看法。
四、方案人机负荷评价方案通常涉及五个方面:系统、设计、人员、工作环境及任务类型。
1. 系统从系统角度,我们需要评估系统设计过程中的可用性、易用性、稳定性、响应时间等。
系统的好坏直接关系到用户的使用体验和工作效率。
2. 设计从设计角度,我们需要评价设计的人性化程度、操作方式和流程、信息展现等。
设计好的所操作和信息展示可以直接影响到人的工作效率和情绪。
3. 人员从人员角度,我们需要评估人员的行为动作以及操作经验,培训和教育需要严格执行,确保人员具备良好的技能和知识,并且能够顺利应对突发情况。
作者简介:喻国明(1957—),男,上海人,北京师范大学新闻传播学院教授,北京师范大学传播创新与未来媒体实验平台主任,博士生导师,主要从事认知神经传播学、传媒经济学、舆论学研究;杨 雅(1988—),女,天津人,北京师范大学新闻传播学院副教授,北京师范大学认知神经传播学实验室副主任,主要从事媒介技术与社会发展、认知传播效果研究;修利超(1984—),男,河北承德人,北京师范大学认知神经传播学实验室副主任,工程师,主要从事认知神经传播学研究;程思琪(1992—),女,湖南岳阳人,暨南大学新闻与传播学院讲师,北京师范大学心理学部博士后,主要从事认知传播效果研究;郭婧一(1992—),女,山东济南人,北京师范大学认知神经科学与学习国家重点实验室、IDG/麦戈文脑科学研究院博士后,主要从事认知神经传播学、网络新媒体与社会发展研究;刘 晗(1997—),女,云南昆明人,北京师范大学新闻传播学院博士研究生,主要从事认知传播效果研究;苏健威(1996—),男,河北张家口人,北京师范大学新闻传播学院博士研究生,主要从事认知神经传播学、游戏与扩展现实研究。
2023 10No 10,2023 学 术 探 索AcademicExploration2023年10月Oct.,2023认知负荷超载场景下人机协同与信任的有效性评测模式———以飞行员应急条件下的认知场景为例喻国明1,杨 雅1,修利超2,程思琪3,郭婧一4,刘 晗1,苏健威1(1.北京师范大学 新闻传播学院;2.北京师范大学 认知神经传播学实验室,北京 100875;3.暨南大学 新闻与传播学院,广东 广州 510632;4.北京师范大学 认知神经科学与学习国家重点实验室、IDG/麦戈文脑科学研究院,北京 100875)摘要:本项研究基于飞行员应急条件下认知状态,研究人机协同决策方法和干预训练策略。
研究基于“应急条件监测和定级—飞行员认知脑荷状态实时评估—人机协同决策模式定级—控制风险、优化决策、保证任务完成”的思路,提出更具动态性、针对性、适应复杂非线性应急场景的人机协同决策方案。
如何进行人机交互设计评估人机交互设计评估是现代技术应用的重要环节,它的目的是判断一个产品或系统在用户使用过程中的易用性和用户满意度。
通过评估,可以发现并改进现有产品的问题,提供更好的用户体验,提高产品的竞争力。
本文将介绍人机交互设计评估的基本原则和方法,并分享一些实用的评估工具和技巧。
评估原则:1. 用户参与:评估过程中应该充分考虑用户的需求和反馈,他们的参与是评估的核心。
2. 多样性:在评估中应当包括不同类型的用户,以确保评估结果的全面性和有效性。
3. 简洁性:评估方法应尽量简单易行,减少用户和评估者的工作量,提高效率。
4. 结果可复现性:评估结果应该是可复现的,不同的评估者在相同环境下应该得到相似的结果。
评估方法:1. 用户测试:通过招募实际用户来参与产品的使用,观察和记录用户在使用过程中的行为、反应和问题。
用户测试可以检查产品的易用性和用户满意度,并提供改进意见。
2. 专家评估:由专业人员对产品进行评估,根据他们的经验和专业知识判断产品的可用性和设计质量。
专家评估比较适合在产品早期或没有足够用户时进行。
3. 问卷调查:设计和发送问卷给用户,了解他们对产品的看法和反馈。
问卷调查能够收集大量的意见和数据,并可以进行统计和分析。
4. 任务分析:将产品的使用过程拆解成一个个具体任务,然后观察和分析用户在每个任务中的行为和反应。
任务分析可以揭示用户在使用过程中遇到的问题和难点。
实用工具和技巧:1. 视频录制:使用摄像头或屏幕录像工具记录用户的行为和操作过程,以便后续分析和评估。
2. 原型工具:使用原型工具创建交互式原型,让用户在真实的环境中体验产品,收集反馈和意见。
3. 眼动仪:通过眼动仪记录用户的注视点和注意力分布,分析用户在使用过程中的视觉注意点。
4. 用户情感评估:除了评估功能和易用性,还可以考虑用户的情感反应,例如使用情感量表或情感识别技术。
人机交互设计评估是一个复杂而细致的过程,需要评估者具备丰富的经验和专业知识。
人机负荷评价方案背景与意义随着科学技术的不断发展,现代社会中机器在生产生活中扮演着越来越重要的角色,而人机交互是机器工作的重要方式。
人机交互的优劣直接影响到操作者的工作效率、人机系统的可靠性以及用户的生产体验等方面。
因此,如何评价人机交互是否合理成为了一项非常重要的研究内容。
方法与过程基于人机交互的需求,可以从以下几个方面进行人机负荷评价:1. 生理负荷评价生理负荷评价是指从人类生理学的角度对人机交互行为进行评价。
针对人类生理承受能力,需要对人体生理反应、视觉负荷、听觉负荷、肢体负荷、脑电波等进行测量。
在实际工作场景中,可以采用心率变异性检测、眼动仪等科学手段对人体负荷进行评估,从而对人机交互的可持续性和持久性做出合理的评价。
2. 心理负荷评价心理负荷评价是指对人的心理状态进行评价,反映了人对任务的主观认识和反应状况。
心理负荷的恰当度是衡量人的工作效果、情绪和精神健康的一项重要指标。
通常,可以采用心理量表、警觉性量表、情绪检测、任务完成时间等方法对心理负荷进行评估。
3. 机械操作负荷评价机械操作负荷评价是指对机械操作的工作情况进行评估,反映了任务对机械的要求和机械特性的匹配程度。
通常,可以采用操作难度评估、键盘输入法速度、鼠标操作速度等方法对机械操作负荷进行评估。
同时,可以通过人机互动的交互方式和界面设计,对机械操作负荷进行优化和改善。
结论与建议对人机负荷进行科学评价和合理优化,既可以提高操作者的工作效率和质量,又可以提高机械设备和人机系统的可靠性和安全性。
在实践中,可以结合人机设计、工作环境和机械设备等方面,对人机负荷评价进行全面考虑,从而制定出更加合理的方案,使人机交互达到更高的效率和安全性。
人机交互界面设计中用户认知负荷评估的方法与效果研究随着科技的不断发展和智能设备的普及应用,人机交互界面设计变得越来越重要。
用户认知负荷评估是其中的一个关键环节,它可以帮助设计师了解用户在使用界面时所面临的认知压力,并提供指导,最大限度地降低用户的认知负荷。
本文将探讨人机交互界面设计中用户认知负荷评估的方法与效果研究。
首先,要了解用户认知负荷评估的方法,我们需要了解认知负荷的概念。
认知负荷是指在完成一项任务时,人脑所承受的认知压力。
这个压力包括各种信息输入和处理的要求,以及大脑对于这些信息的理解和判断。
当认知负荷过高时,用户可能会失去集中注意力、出现疲劳,并且任务完成的质量也会下降。
目前,常用的用户认知负荷评估方法主要包括客观指标和主观评估。
客观指标是通过记录用户在完成任务过程中的生理数据,如心率、脑电图等,来评估其认知负荷。
这些客观指标可以从生理反应上反映用户在任务过程中的认知压力程度,为界面设计提供量化的数据支撑。
然而,客观指标的应用存在其局限性,例如需要专业设备和技术支持,以及生理数据的解释和分析依赖于专业知识。
相比之下,主观评估的方法更为常用。
主观评估是通过用户自我报告的方式来获取其认知负荷情况。
常用的主观评估方法包括问卷调查、自我评价量表和半结构化访谈等。
问卷调查是一种常见的主观评估方法,可以通过用户对某些问题的选择或打分来评估其认知负荷。
自我评价量表是一种更为细致和详细的主观评估方法,包括多个评价维度,如认知需求、认知流畅度和认知负担等。
半结构化访谈能够提供更为深入和全面的评估结果,通过与用户的对话来发现隐藏的认知负荷和潜在问题。
然而,由于主观评估方法受主观性和主观偏见的影响,其结果可能存在一定的偏差。
因此,将客观指标与主观评估相结合,可以提高评估的准确性和可靠性。
例如,可以通过客观指标初步评估用户的认知负荷,然后与用户进行面谈,了解他们的主观感受,以及可能造成负荷增加或减少的原因。
在进行用户认知负荷评估时,还需要考虑一些其他因素,以保证评估的有效性和可行性。
人机负荷评价方案背景随着科技的发展和生产力的提高,人们对机器和设备的依赖越来越高,同时也给人机交互带来了更高的负荷。
如何评价人机负荷,保障人的健康和工作效率,成为了当前必须解决的重要问题。
目的设计一套基于人机交互的负荷评价方案,可以从人类视觉、听觉、肌肉等多方面来评价人机交互的负荷情况,以此为基础探讨如何改善当前的人机交互环境。
方案1. 视觉方面评价人眼对颜色、亮度、对比度、闪烁频率等有明显的反应,而在电子设备和机器交互过程中,这些参数都会对人的视觉造成影响。
因此,我们可以设计一个可视化的界面,记录并分析人在不同环境下对各种参数的反应,比如亮度、色温、色彩饱和度等,以此来评价人的视觉负荷。
2. 听觉方面评价人类听觉的范围和敏感度是有限的,如果长时间处在高噪声环境下,会造成耳朵的受损和注意力的分散。
因此,在评价人机负荷时,要考虑清晰度、声音频率、噪声强度等因素,设计出适合人类听觉的交互界面和声音设置。
3. 肌肉方面评价人体的肌肉能力是有限的,如果长时间处于一种姿势或动作中,会对肌肉和身体造成不良影响。
因此,要在设计机器、设备和交互界面时,考虑人体的负荷和力量需求,降低长时间处在不健康的姿势中造成的对策疲劳和损伤。
4. 综合评价应用科学的评价方法,将视觉、听觉、肌肉等方面评价的数据进行综合分析,得出人机交互的综合负荷,从而得出相应的风险和改进建议,使得人机交互都更加健康和舒适。
结论人机负荷的评价和调整是人机交互设计的重要部分。
一个良好的人机交互环境,可以极大地提高工作效率和人的健康,减少事故和伤害发生。
这套人机负荷评价方案,具有简洁明了、科学严谨等特点,可以为未来的人机交互设计提供有力指导和支持。
心理学报2009, Vol 141, No 11, 35-43A cta Psychologica S in icaDO I :10. 3724/SP. J. 1041. 2009. 0003535收稿日期:2007-11-133全国教育科学“十一五”规划教育部重点课题(DCA080141 、浙江省自然科学基金资助项目(Y604275 、浙江省哲学社会科学规划后期资助项目(08HQZZ038 资助。
通讯作者:许百华, E 2mail:bhxu305@zju. edu . cn人机交互过程中认知负荷的综合测评方法3李金波许百华(浙江大学心理与行为科学学院, 杭州310028摘要设计模拟网络引擎搜索和心算双任务实验, 分析主观评定、绩效测量和生理测量三类评估指标对认知负荷变化的敏感性; 采用因素分析、BP 神经网络和自组织神经网络三种建模方法, 探索人机交互过程中认知负荷的综合评估建模方法。
结果显示:心理努力、任务主观难度、注视时间、注视次数、主任务反应时、主任务正确率6个指标对认知负荷变化敏感; 采用多维综合评估模型对双任务作业认知负荷进行测量总体上比采用单一评估指标的测量更为有效。
BP 网络和自组织神经网络两种神经网络模型对认知负荷的测量结果优于传统的因素分析方法。
关键词人机交互; 评估; 认知负荷; 神经网络; 建模分类号B841. 21前言随着计算机和自动化技术的发展, 人在人机系统中的职能发生了很大变化, 状态的监控任务, ( 大加重。
、杂人机系统中, 容易出现认知负荷过高, 甚至超负荷现象。
过高的认知负荷将严重影响人的工作效率、操作可靠性和身心健康, 进而影响整个人机系统的效率和可靠性。
因此, 认知负荷已成为人机系统评价的主要指标之一。
最早对认知负荷开展研究的是美国心理学家M iller (1956 。
此后, 国外一些学者对认知负荷的含义、结构和测评方法进行了大量的研究。
Cooper (1990 将认知负荷定义为在特定的作业时间内施加于个体的工作记忆的心理活动总量。
Paas 和van Merrienboer (1994 认为认知负荷由多维度构成, 是执行一项具体任务时施加于个体认知系统的负荷。
认知负荷目前尚不能直接进行测量, 而只能用间接的方法对其进行评估。
常用的评估技术有任务绩效测量、主观评定和生理测量等三大类(Paas &Mer 2rienboer, 1994; B runken, Plass &Leutner, 2003;Faircl ough, Chris, Dan 2iel A lan, 2berg, 2006 。
它的基本假设是, 随着作业难度的提高, 对人的信息加工资源的需求相应地增加, 当认知负荷对个体的要求超出其可支配的资源总量时, 作业绩效将出现不同程度的下降。
主任务测量常用的指标有操作准确性、反应时、信号漏失率和虚报率等。
次任务测量采用双任务作业情境, 要求作业者除执行主作业外再完成一项额外的作业(次作业 , 通过考察双任务作业情境下次作业绩效受影响的程度(相对于单任务情境来间接评价主作业的认知负荷。
生理测量是通过测定作业者在进行指定作业过程中出现的生理反应来间接地评估认知负荷, 常用的生理指标有瞳孔直径、心率和事件相关电位等(Chirs, Daniel &A lan, 2007; Ahlstr om &Fried man 2berg, 2006 。
主观评定技术是由作业者根据主观感受与体验来评估认知负荷, 通常涉及个体知觉到的心理努力、任务难度和时间压力等方面。
上世纪80年代以来, 国外一些研究者相继开发出了多种认知负荷主观评定方法, 如Paas 和Van Merrienboer (1994 使用九级评定量表测量被试在理解任务材料上投入心理努力的程36心理学报41卷度, 进而对认知负荷进行评估。
Kalyuga, Chandler和S weller (1997 使用由作业者自我报告任务难度的方法来测量认知负荷。
此外, Sal omon (1983 、Tabbers (2004 、Paul (2006 等也分别提出了相类似的认知负荷主观评定方法。
已有的研究表明, 上述3类测评技术各有优点和局限性。
例如, 主任务测量比较直接, 对作业本身无干扰, 但只在中等负荷水平时较敏感; 次任务测量相对比较敏感, 效度较高, 但容易对主任务产生干扰。
此外, 任务绩效与认知负荷的关系不一定是简单的线性关系。
例如, Meister (1976 将认知负荷等同于任务需求, 发现任务需求与工作绩效之间是曲线的关系; 而W aard (1996 则认为, 任务需求与任务绩效之间呈“倒U ”形的关系。
主观评定无干扰, 操作简便, 但要求被试采用内省的方法来评定负荷水平, 因而容易出现较大的偏差。
此外, 主观评定结果与个体特征、认知策略以及个体的心理和生理状况等多种因素有关, 即使同一个人对同样的任务, 在不同的作业时间段也有可能出现不同的评定结果。
Paas 和Van Merrienboer (1994 卷为例, 觉, 的关联程度, 于任务过难, (Reed, Bur 2t on &Kelly, 1985 。
同样, Kalyuga, Chandler 和S weller 使用让个体自我报告任务难度差异方法所得出的结果也很可能是由于所需要完成的任务难度、个体个人能力水平等原因造成的。
生理测量指标具有客观性和实时性, 但是它们与认知负荷之间只是间接的联系, 并且也可能会受到注意或情感等方面因素的影响(B runken, Steinbacher &Plass, 2002 。
因此, 由认知负荷引起的某一生理指标的变化可能会被其它因素放大或缩小; 而且不同的任务可能会产生不同的生理反应, 一项生理指标对某一类任务适用, 而对另一类任务则可能不适用。
一般认为, 不同测评技术分别适用于不同的情境、不同的负荷水平范围。
因此, 利用多种技术对认知负荷作综合评估以替代基于单一方法或指标的评估是比较合理的选择; 同时, 认知负荷的多维度特性也决定了对其作综合评估的必要性。
近年来, 国外一些学者运用多指标综合评估方法在心理工作负荷(Men 2talWorkl oad 的测评中进行了一些探索性研究。
这些研究以多个单一评估指标的测量结果作为依据, 采用一定的建模技术对心理工作负荷进行多维度综合评估。
目前在这一领域较常用的建模技术主要有因素分析、回归分析和人工神经网络建模等。
例如, Kilseop 和Myung (2005 运用主成分分析将三种生理指标(脑电、眼动和心率和主观负荷组合成一个综合评估指数, 发现综合指数较单项指标能更准确地区分不同难度任务中被试的负荷水平。
此外, 他们还通过回归分析来考察主观负荷与生理指标之间的关系, 以生理指标的测量结果来预测被试的主观评定的负荷状况。
人工神经网络简称神经网络, 在国外有关的研究中, 运用神经网络模型对负荷进行多维度综合评估主要有两种模式。
一种模式是将主观负荷、作业绩效指标或生理指标的测量结果作为网络的输入项, 通过建立不同的神经网络模型对负荷进行评估或等级划分。
例如, Roger, Robecca 和Gory (2003 , 收集了5个绩效指标作为输入项BP 神经网络模型, 66. 9%~96. 0% N (2001 在一项飞行作业的30个EEG 指标的测量, 然后运用主成分分析法将这些指标归并为少数的几个指标, 以它们作为网络的输入项建立起自组织神经网络模型。
结果显示, 借助自组织神经网络模型能比较准确地预测信息加工要求不同的任务中负荷发生的变化。
此外, 其他的研究者利用相类拟的方法也得到了较理想的结果(Laine, Bauer &J r Tef 2frey, 2002; Noel, Bauer &Lanning, 2005; Gr ootjen, Neerincx &Velt m an, 2006; Shayeghi, Shayanfar, 2006; Shayne, Penel ope &Andre w, 2007 。
第二种模式是将影响负荷的主要因素作为输入项, 通过建立神经网络模型, 对不同任务难度条件下被试的负荷状况进行评估。
例如, D ing 和Sheue (1999 将影响监控作业的跨度(Span 、差异度(discri m inate 、可预测度(p redict 和注意转换(transfer attenti on 4个因素作为输入项建立BP 神经网络对负荷进行评估, 并将神经网络评估结果与负荷上限值进行比较, 超过上限值就认为是超负荷, 并据此对监控作业过程中的负荷状况进行实时分析和任务的动态分配。
但从总体上来看, 国外学者利用神经网络对负荷进行评估或等级划分还处于起步阶段, 并且已有的研究中, 任务条件各异, 神经网络输入变量不同, 因而所得的结果也难以进行比较。
此外, 有的研究者还运用多层次模糊综合评价方法对负荷进行综合评估研究(Currie, 1997 。
1期李金波等:人机交互过程中认知负荷的综合测评方法37在认知负荷综合评估方面, 国外学者也进行了一些尝试, 如Paas 和van Merrienboer (1993 、Tuovinen 和Paas (2004 将心理努力与主任务绩效这两类指标结合起来对认知负荷进行综合测评, 获得了利用单一评估指标无法得到的许多重要信息。
他们还发现, 采用多种技术对认知负荷进行多维综合评估可显著提高评估敏感性。
但到目前为止, 对认知负荷的综合评估研究还是零碎的, 缺乏建模方法的系统研究和不同方法之间的比较研究。
在国内, 目前还未见这方面的研究报道。
借鉴国外已有的多指标综合评估方法在心理工作负荷测评中的运用, 本研究拟结合复杂人机系统中视觉信息加工作业的特点, 通过模拟实验, 分析主观评定、绩效测量和生理测量三类评估指标对认知负荷变化的敏感性, 然后基于经筛选的认知负荷评估指标的测量结果, 分别采用因素分析、BP 神经网络和自组织神经网络三种建模方法, 构建双任务作业中认知负荷的多维综合评估模型, 并对这三种综合评估模型进行比较, 2方法2. 1擎搜索(Chen, , 在计算机屏幕上相继呈现二幅画面, 第一幅画面呈现搜索目标, 包括要搜索的产品名称和两个指定特征(如形状、颜色 ; 第二幅画面呈现搜索结果, 包括5个与搜索目标同类型的产品, 每个产品包含4个方面的特征(如品牌、颜色、形状和价格。
告知被试5个产品中有1至4个符合搜索目标要求的目标项, 要求被试查找出所有的目标项, 同时记住目标项的另外二个特征(如品牌和价格 ; 第二幅画面呈现时间为16秒, 被试完成搜索后按键或在16秒后第二幅画面消失, 被试口头报告搜索到的各个目标项的另外二个特征。