信号检测论——评价法
- 格式:doc
- 大小:88.00 KB
- 文档页数:7
信号检测论1 引言信号检测论是信息论的一个重要分支,1954年,美国心理学家W·P·Tanner和J·A·Swets 把它运用于人的知觉过程,使心理物理学方法发展到一个新的阶段。
信号检测论不仅测定人对信号的反应,也测定人对噪音的反应,因此能够将人的感受性与其判断标准区分开,并且分别用不同的数量来表示,这是它优于古典心理物理学方法的地方。
信号检测论有三个基础实验程序,即有无法、评价法、迫选法,其中,评价法可以在相同的时间获得被试更多的信息。
因为评价法不仅要求被试对有无信号做出判断,还要求被试按规定的等级做出评价,即说明每次判断的把握有多大。
在信号检测论中,根据击中率与虚报率可以绘制ROC曲线,又称操作特征曲线、等感受性曲线,是以虚报率为横坐标,以击中率为纵坐标,可以形象的看出随着标准的变化,击中率与虚报率也相应地发生变化的情景。
本次实验使用的是有无法,目的是检验当呈现信号和噪音的先验概率发生变化时,对被试的辨别力(d’)和判定标准(β)是否都有影响,并学习绘制ROC曲线。
2 方法2.1 被试某大学本科生,女生一名,年龄20岁。
2.2 仪器两套数字卡片(SN和N),各100张,卡片正面写有1或2位的数字。
二个数字总体分布见表1。
表1 数字分布表A(N)B(SN)数字 f 数字 f20 1 24 119 1 23 118 3 22 317 6 21 616 12 20 1215 17 19 1714 20 18 2013 17 17 1712 12 16 1211 6 15 610 3 14 39 1 13 18 1 12 1n 100 100平均数14 18标准差 2 22.3 程序⑴确定五种SN呈现的先验概率,分别是10%、30%、50%、70%、90%,为了消除顺序效应。
⑵以先验概率为10%的实验为例,主试将100张SN洗匀,顺次抽取5张,再将总体N洗匀,顺次抽45张,组成50张的样本,最后将这50张样本洗匀即可。
《实验心理学》实验报告实验名称评价法—信号侦查论姓名卓京鸿实验时间2011-11-23 15:10:22 学号实验地点成绩实验仪器计算机和Psykey中信号侦查论---评价法实验目的通过图片再认,学习信号侦察论及其基础程序评价法。
指导老师1实验内容、目的、意义实验内容:信号检测论是现代心理物理学最重要的内容之一,它的出现彻底改变了以往人们对阈限的理解,将个体的感受性和主观的动机、反应偏好等加以区分,从而解决了传统心理物理学无法解决的问题。
信号检测论其本质是一种统计决策程序。
辨别力d':亦称感觉敏感性。
不受情绪、期望、动机等变数影响。
d'值高说明辨别力强。
实验目的:通过对本实验的操作,学习实验的基础程序。
信号侦察论有三个基础实验程序,即有无法、迫选法和评价法。
其中,评价法可以在相同的时间内获得被试更多的信息。
通过对本实验数据的处理,进一步学习对实验数据的处理和绘制ROC曲线。
实验意义:信号侦察论不仅测定人对信号的反应,也测定人对噪音的反应,因而能够将人的感受性与其判断标准区分开,并且分别用不同的数量来表达。
在评价法中,不仅要求被试对有无信号作出判断,还要求按规定的等级作出评价,即说明每次判断的把握有多大。
因而可测得本人的感受性与辨别性,从而更好地了解实验过程与实验内容。
2方法与步骤本实验用图片再认来做评价法实验。
刺激有两套:一套是识记过的图片,共60张(每个图片内容不同)作为信号SN;另一套是没有识记过的图片,共60张(每个图片也不同,但与相应的第一套相似),作为噪音N。
每张图片呈现时间为2000ms,图片呈现之间的间隔时间为1000ms。
第一步,先让被试识记第一套图片,计算机屏幕随机呈现每张图片2s,间隔1s,60张图片连续呈现;第二步,把这60张识记过的图片与第二套60张图片混在一起,仍按上述的方法呈现给被试,让被试判断是否是刚才识记过的,并按照规定的五个等级按键作出评价。
1代表0%的把握刚才看到,2代表25%的把握刚才看到,3代表50%的把握刚才看到,4代表75%的把握刚才看到,5代表100%的把握刚才看到。
运用信号检测论的评价法对再认能力的测量俞德霖福建师范大学心理学院摘要:使用信号检测论的评价法,分为5级确信程度,对受测者再认能力进行测量。
受测者在先定概率为0.5的情况下四种判断标准(C1-C4)的d’分别为1.22,1.18,1.41,1.39,β分别为0.65,1.34.,2.26,3.75。
d’的平均值为1.30,β的平均值为2.00。
并绘制了ROC曲线。
关键词:再认能力信号检测论ROC曲线1 引言信号检测论( Signal Detection Theory ,简称SDT)借助于数学的形式描述“接收者”在噪音背景中信号的接收问题。
传统心理物理学实验无法测出被试的反应倾向性,也无法把被试的反应倾向性和辨别力区分开来。
信号检测论把刺激的判断看成是对信号的侦察和做出选择的过程。
这样在同一过程中就出现了两个独立的指标,一个是辨别力指标d又称感受性,它取决于个体的感觉辨别能力,值越大则表明感受性越强;另一个指标是反应偏向β,又称判断标准,它受到利益得失、动机、态度等因素的影响,值越大表明个体的判断标准越苛刻。
在信号检测论实验中通过测量和计算不仅能够将被试的辨别力和反应倾向性区分开来, 同时以独立的数据来分别表达它们。
记忆实验有再认和回忆二种形式。
再认是判断当前的刺激物是否是己被感知过的某种信息。
回忆是要求如实再现以前感知过的信息。
因此,它们都各具特点。
一般而言,再认只要能记住信息的一部分就能正确回答, 而回忆就必须完全记住全部信息。
这二种形式是日常生活中常见的, 它们能从不同侧面反映记忆能力。
由于再认记忆一直被看作一个阈限过程,因此可以使用信号检测论范式。
辨别力指标d代表再认能力,而反应偏向β则代表采取的判断标准。
信号检测论有三个基本方法,即有无法、迫选法和评价法。
评价法可以在相同的时间内获得被试更多的信息。
在评价法中,不仅要求被试对有无信号作出判断,还要求按规定的等级作出评价,即说明每次判断的把握有多大。
传统心理物理法一、最小变化法I 特点:探索从感觉不到到感觉到的转折点和从感觉到到感觉不到的转折点1、刺激是由递减和递增的两个系列组成2、递增和递减系列交替出现3、每个系列的起始点不同4、每个系列的转折点就是该系列的绝对阈限5、每个系列绝对阈限的算术平均值就是绝对阈限II 阈限的测定1、绝对阈限的测定实验过程:刺激由递增和递减两个系列组成,每次呈现刺激后让被试报告他是否有感觉,寻找被试由一类反应到另一类反应的转折点,即在多重刺激时,由有感觉变为无感觉,或由无感觉变为有感觉。
每一个系列的转折点就是该系列的绝对阈限。
当被试说不清时,意义与之前的判断相反。
阈限计算:转折处对应的两个刺激强度的中点就是阈限,绝对阈限就是系列所有阈限的平均值。
2、差别阈限的测定实验过程:用极限法测定差别阈限时,每次要呈现两个刺激,让被试比较,其中一个是标准刺激,即刺激是固定的,其强度大小不变;另一个是比较刺激,又称变异刺激,即刺激的强度按由小到大或由大而小的顺序排列。
标准刺激在每次比较时都出现,比较刺激按照递增或递减系列与标准刺激匹配呈现,直到被试的反应发生转折。
被试以口头报告方式表示四类反应,当比较刺激大于标准刺激时记录为“+”;当比较刺激等于标准刺激时记录“=”;当比较刺激小于标准刺激时记录“—”;表示怀疑可记作“?”.阈限计算:在上限和下限之间的距离为不肯定间距,取平均上下限的不肯间距的一半为差别阈限。
不肯定间距的中点为主观相等点,理论上应与标准刺激相等,但实际上两者有一定的差距,这个差距被称为常误。
III 误差及其控制习惯误差:被试因习惯于由原先的刺激所引起的感觉或感觉状态,而对新的刺激作了错误的判断。
期望误差:被试因过早期望将要来临的刺激而导致错误的判断。
采用递增递减交替进行的设计能抵消这两种错误。
练习误差:由于实验多次重复,被试逐渐熟悉了实验情景,对实验产生了兴趣和学习效果,导致反应速度加快和准确性逐步提高的一种系统误差。
信号检测论——评价法姓名(小组成员:)摘要:本实验选取了两名上师大心理系本科生,两名被试均为女性,采用了信号检测论的评价法考察了两名被试对汉字再认的准确性和判断标准。
实验发现:(1)信号检测论的评价法是一种进行记忆再认研究的有效工具;(2)在同一种判断标准下,被试二的击中率和虚报率均高于被试一;(3)在同一种判断标准下,被试一的判定标准β要大于被试二的,辨别力要小于被试二的。
关键词:信号检测论评价法;ROC曲线;辨别力d’;判定标准β1 导言信号检测论是现代心理物理学最重要的内容之一,它的出现彻底改变了以往人们对阈限的理解,将个体客观的感受性和主观的动机、反应偏好等加以区分,从而解决了传统心理物理学所无法解决的问题[1]。
信号检测论认为:被试觉察信号有一个中枢神经效应,这种效应随着每次剌激呈现,时刻都在变化。
信号总是在噪音的背景上产生,信号的影响和噪音的影响都被假定为正态分布,这两种分布由于信号比噪音微弱增强,故有一定的重叠,而使信号和噪音都可能引起同一程度的感觉。
人类觉察是建立在统计决策论的基础上。
就是说被试选择一个标准,当给定的刺激超过这个标准时,被试就反应“有”,否则则说“元”,而这个反应标准的选择由很多因索(如感受性、利益得失、动机、态度、情绪、意志等)决定。
这个反应标准就是阈限,而不是感觉本身的东西,它包括两个独立指标:一个是反应偏向,可用似然比值(B)或报告标准(C)来表示,它包括利益得失、动机、态度等因素;另一个是感觉辨别力指标(d’),表示感知能力。
信号检测论有三个基础的实验程序:有无法、迫选法和评价法。
评价法又称多重决策法,或评级量表法。
这一方法呈现刺激的方式同有无法一样,对信号和噪音的先验概率和奖惩办法,都可以随实验要求,由主试确定。
但对被试的要求有所不同,对被试的反应不是简单的“有”或”无”的方式,而是将被试从“有信号”到“无信号”这一感觉的连续体,规定出不同的感觉评价等级。
信号检测论——评价法姓名(小组成员:)摘要:本实验选取了两名上师大心理系本科生,两名被试均为女性,采用了信号检测论的评价法考察了两名被试对汉字再认的准确性和判断标准。
实验发现:(1)信号检测论的评价法是一种进行记忆再认研究的有效工具;(2)在同一种判断标准下,被试二的击中率和虚报率均高于被试一;(3)在同一种判断标准下,被试一的判定标准β要大于被试二的,辨别力要小于被试二的。
关键词:信号检测论评价法;ROC曲线;辨别力d’;判定标准β1 导言信号检测论是现代心理物理学最重要的内容之一,它的出现彻底改变了以往人们对阈限的理解,将个体客观的感受性和主观的动机、反应偏好等加以区分,从而解决了传统心理物理学所无法解决的问题[1]。
信号检测论认为:被试觉察信号有一个中枢神经效应,这种效应随着每次剌激呈现,时刻都在变化。
信号总是在噪音的背景上产生,信号的影响和噪音的影响都被假定为正态分布,这两种分布由于信号比噪音微弱增强,故有一定的重叠,而使信号和噪音都可能引起同一程度的感觉。
人类觉察是建立在统计决策论的基础上。
就是说被试选择一个标准,当给定的刺激超过这个标准时,被试就反应“有”,否则则说“元”,而这个反应标准的选择由很多因索(如感受性、利益得失、动机、态度、情绪、意志等)决定。
这个反应标准就是阈限,而不是感觉本身的东西,它包括两个独立指标:一个是反应偏向,可用似然比值(B)或报告标准(C)来表示,它包括利益得失、动机、态度等因素;另一个是感觉辨别力指标(d’),表示感知能力。
信号检测论有三个基础的实验程序:有无法、迫选法和评价法。
评价法又称多重决策法,或评级量表法。
这一方法呈现刺激的方式同有无法一样,对信号和噪音的先验概率和奖惩办法,都可以随实验要求,由主试确定。
但对被试的要求有所不同,对被试的反应不是简单的“有”或”无”的方式,而是将被试从“有信号”到“无信号”这一感觉的连续体,规定出不同的感觉评价等级。
然后让被试根据对所呈现刺激的自信度情况,报告有信号(或元信号)的评定等级。
一般评价从有信号到无信号这一感觉连续体的等级可划分为六个;六个等级含义为:第一等级,非常肯定有信号出现;第二等级,一般肯定有信号出现;第三等级,可能有信号出现;第四等级,可能无信号出现;第五等级,一般肯定无信号出现:第六等级,非常肯定无信号出现[2]。
信号检测理论中的评价法在心理学实验中的应用是非常广泛的,如在研究“知道感”任务中的图片和字词的感受性和判断标准的实验中,该实验考察了在“知道感”(FOK)任务中的字词和图片的感受性和判断标准的差异。
实验运用Hart的“回忆一FOK判断一再认”(RIR)范式,用字词和图片作为刺激材料,采用两种不同的加工水平,并根据信号检测论中的评价法对结果进行分析。
结果表明,在知道感任务中,只有在线索回忆正确百分率和FOK判断等级上表现出了图片优势效应,而再认正确率和FOK准确性则没有图片优势;而且,不论是深加工还是浅加工,被试对字词和图片的感受性都没有显著性差异,但判断标准的变化较为复杂,且受加工水平的影响较大,显示出图片优势效应的产生与被试的反应偏向有关[3]。
又如在汉字再认能力心理指标d’与θ的比较中可以看出,信号检测论的评价法可以直接引进模糊数学集值统计的方法处理试验所采集到的数据,求出θ(平均置信度)。
θ与d’相比较,除了具有“灵敏度高、不受β影响的优点外,l) θ比d’意义更清晰、更明确,在某些特殊情况下,θ表征汉字再认能力似乎更接近被试实际再认能力;2) θ能够区别“击中”能方和“正确否定”能力;3)评价法的每一人次判断试验是集值统计试验,由于θ的计算原理不强求原始数据趋于正态分布,故可适当减少试验重复次数[4]。
在再认指标的探讨中,记忆研究的再认法传统上常用计算保持量作为再认的指标,而信号检测论则用计算辨别力指数d’作为再认的指标。
它们各有特点,又各有局限性。
本文从理论和实验上探讨了这些问题,并提出修正的计算方法,同时还分析了应用模糊集合统计处理信号检测论评价法的结果,计算再认程度函数作为再认的指标,比传统的指标及d’更具优越性:(1)比较符合心理判断的实际;(2)无须信号检测论的基本假设;(3)可排除判断标准的影响,有利于不同被试个体再认能力的比较[5]。
经过查阅前人的实验研究,我们发现信号检测论的评价法主要是应用于再认测验的研究。
我们本次实验的目的是通过比较被试对汉字再认的准确性和判断标准,学习用评价法进行信号检测论实验。
2 方法2.1被试:两名上师大心理系本科生,均为女性2.2仪器与材料2.2.1仪器:计算机及PsyTech心理实验系统软件2.2.2材料:信号汉字100个,噪音汉字100个2.3程序2.3.1登录并打开PsyTech心理实验软件主界面,选中实验列表中的“信号检测论(评价法)”。
双击呈现实验简介,点击“进入实验”到“操作向导”。
实验者可进行参数设置:改变刺激呈现时间等参数或默认参数。
点击“开始实验”呈现本实验指导语。
2.3.2第一次指导语是:这是一个用评价法进行的信号检测论实验。
实验开始后屏幕会逐个呈现一系列汉字,请你认真看并尽量记住这些汉字。
当你明白了上述指导语的意思后,就点击下面的“正式实验”按钮“开始”。
2.3.3被试按任意键后,实验先呈现100个作为信号的汉字,被试只看并记忆,不作其它反应。
呈现完毕,点“确定”再次出现指导语。
第二次指导语是:下面屏幕将再次逐个呈现一系列汉字。
其中一半是你刚才看过的,一半是没有看过的。
请你对这些呈现的汉字作出判断,是否你刚才看过的,并用鼠标对你判断的肯定程度作等级评价。
如果100%肯定看过,请点击“1”;如果觉得可能(75%肯定)看过,请点击“2”;如果觉得不能确定(50%肯定)看到过,请点击“3”;如果觉得可能(25%肯定)没看过,请点击“4”;如果100%肯定没有看过,请点击“5”。
当你明白了上述实验的步骤后,就请点击下面的“正式实验”按钮“开始”。
2.3.4将另外100个作为噪音的汉字与原来呈现过的汉字混合后再次随机呈现。
被试按照实验指导语要求对每个呈现的汉字作出是“信号”还是“噪音”的判断,并要求被试按五个等级评价。
2.3.5实验结束,点击结束提示语中的确定可直接查看结果,也可以换被试继续实验,以后在主界面“数据”菜单中查看。
2.4数据处理:采用了EXCEL 2003进行数据处理3 结果3.1计算两名被试五种评价等级下将刺激判断为信号和噪音的概率表1:被试一五种评价等级下对刺激的判断评判标准肯定看过可能看过不能确定可能没看过肯定没看过信号0.310.220.150.140.18噪音0.080.130.220.340.23被试一对判断为“肯定看过”的信号汉字的概率为0.31,噪音汉字的概率为0.08;被试一对判断为“可能看过”的信号汉字的概率为0.22,噪音汉字的概率为0.13;被试一对判断为“不能确定”的信号汉字的概率为0.15,噪音汉字的概率为0.22;被试一对判断为“可能没看过”的信号汉字的概率为0.14,噪音汉字的概率为0.34;被试一对判断为“肯定没看过”的信号汉字的概率为0.18,噪音汉字的概率为0.23。
表2:被试二五种评价等级下对刺激的判断评判标准肯定看过可能看过不能确定可能没看过肯定没看过信号0.560.280.050.070.04噪音0.170.260.120.350.10被试二对判断为“肯定看过”的信号汉字的概率为0.56,噪音汉字的概率为0.17;被试二对判断为“可能看过”的信号汉字的概率为0.28,噪音汉字的概率为0.26;被试二对判断为“不能确定”的信号汉字的概率为0.05,噪音汉字的概率为0.12;被试二对判断为“可能没看过”的信号汉字的概率为0.07,噪音汉字的概率为0.35;被试二对判断为“肯定没看过”的信号汉字的概率为0.04,噪音汉字的概率为0.10。
3.2计算两名被试四种判断标准下的击中率和虚报率表3:被试一四种判断标准下的击中率和虚报率判断标准C1 C2 C3 C4击中率0.31 0.53 0.68 0.82虚报率0.08 0.21 0.43 0.77被试一在判断标准一下的击中率为0.31,虚报率为0.08;在判断标准二下的击中率为0.53,虚报率为0.21;在判断标准三下的击中率为0.68,虚报率为0.43;在判断标准四下的击中率为0.82,虚报率为0.77。
表4:被试二四种判断标准下的击中率和虚报率判断标准C1 C2 C3 C4击中率0.56 0.84 0.89 0.96虚报率0.17 0.43 0.55 0.90被试二在判断标准一下的击中率为0.56,虚报率为0.17;在判断标准二下的击中率为0.84,虚报率为0.43;在判断标准三下的击中率为0.89,虚报率为0.55;在判断标准四下的击中率为0.96,虚报率为0.90。
3.3计算两名被试相应的辨别力d’和判定标准表5:被试一四种判断标准下的辨别力和判定标准判断标准C1 C2 C3 C4辨别力0.91 1.56 0.64 0.18判定标准 2.37 1.38 0.91 0.87被试一在判断标准一下的辨别力为0.91,判定标准为2.37;在判断标准二下的辨别力为1.56,判定标准为1.38;在判断标准三下的辨别力为0.64,判定标准为0.91;在判断标准四下的辨别力为0.18,判定标准为0.87。
表6:被试二四种判断标准下的辨别力和判定标准判断标准C1 C2 C3 C4辨别力 1.10 1.17 1.10 0.47判定标准 1.56 0.62 0.48 0.49被试二在判断标准一下的辨别力为1.10,判定标准为1.56;在判断标准二下的辨别力为1.17,判定标准为0.62;在判断标准三下的辨别力为1.10,判定标准为0.48;在判断标准四下的辨别力为0.47,判定标准为0.49。
3.4根据五个等级反应的次数,以评价等级数为横坐标,以次数为纵坐标,画出信号与噪音对比关系的直方图被试一对判断为“肯定看过”的信号汉字数量为31,噪音汉字的数量为8;被试一对判断为“可能看过”的信号汉字数量为22,噪音汉字的数量为13;被试一对判断为“不能确定”的信号汉字的数量为15,噪音汉字的数量为22;被试一对判断为“可能没看过”的信号汉字的数量为14,噪音汉字的数量为34;被试一对判断为“肯定没看过”的信号汉字的数量为18,噪音汉字的数量为23。
被试二对判断为“肯定看过”的信号汉字的数量为56,噪音汉字的数量为17;被试二对判断为“可能看过”的信号汉字的数量为28,噪音汉字的数量为26;被试二对判断为“不能确定”的信号汉字的数量为5,噪音汉字的数量为12;被试二对判断为“可能没看过”的信号汉字的数量为7,噪音汉字的数量为35;被试二对判断为“肯定没看过”的信号汉字的数量为4,噪音汉字的数量为10。