张厚粲 第四章 差异量数
- 格式:ppt
- 大小:685.00 KB
- 文档页数:36
第4章差异量数1.度量离中趋势的差异量数有哪些?为什么要度量离中趋势?答:(1)度量离中趋势的差异量数有全距、四分位差、百分位差、平均差、标准差与方差。
差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称离散量数(measures of dispersion)。
(2)度量离中趋势的必要性在心理和教育研究中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。
这些特殊性常表现为数据的变异性。
因此,只用集中量数不可能真实地反映出它们的分布情形。
为了全面反映数据的总体情况,除了必须求出集中量数外,这时还需要使用差异量数。
2.各种差异量数各有什么特点?答:(1)标准差计算最严密,它根据全部数据求得,考虑到了每一个样本数据,测量具有代表性,适合代数法处理,受抽样变动的影响较小,反应灵敏。
缺点是较难理解,运算较繁琐,易受极端值的影响。
(2)方差的描述作用不大,但是由于它具有可加性,是对一组数据中造成各种变异的总和的测量,通常采用方差的可加性分解并确定属于不同来源的变异性,并进一步说明各种变异对总结果的影响。
因此,方差是推论统计中最常用的统计量数。
(3)全距计算简便,容易理解,适用于所有类型的数据,但它易受极值影响,测量也太粗糙,只能反映分布两极端值的差值,不能显示全部数据的差异情况,仅作为辅助量数使用。
(4)平均差容易理解,容易计算,能说明分布中全部数值的差异情况,缺点是会受两极数值的影响,但当数据较多时,这种影响较小,因有绝对值也不适合代数方法处理。
(5)百分位差易理解,易计算,不易受极值影响,但不能反映出分布的中间数值的差异情况,也仅用作补助量数。
(6)四分位差意义明确,计算方便容易,对极端值不敏感,较不受极端值影响。
当组距不确定,其他差异量数都无法计算时,可以计算四分位差。
但是,四分位差无法反映分布中所有数据的离散状况,不适合使用代数方法处理,受抽样变动影响较标准差大。
心理学解答心理学考研第一章1.名词概念(1)随机变量答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。
(2)总体答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。
(3)样本答:样本是从总体中抽取的一部分个体。
(4)个体答:构成总体的每个基本单元。
(5)次数是指某一事件在某一类别中出现的数目,又称作频数,用f表示。
(6)频率答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。
(7)概率答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。
其描述性定义。
随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。
(8)统计量答:样本的特征值叫做统计量,又称作特征值。
(9)参数答:又称总体参数,是描述一个总体情况的统计指标。
(10)观测值答:随机变量的取值,一个随机变量可以有多个观测值。
2.何谓心理与教育统计学?学习它有何意义?答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。
具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
(2)学习心理与教育统计学有重要的意义。
①统计学为科学研究提供了一种科学方法。
科学是一种知识体系。
它的研究对象存在于现实世界各个领域的客观事实之中。
它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。
要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。
统计学正是提供了这样一种科学方法。
统计方法是从事科学研究的一种必不可少的工具。
第一章绪论1.描述统计(descriptive statistics)主要研究如何将实验或调查得到的大量数据进行图表整理或简缩成有代表性的数字(即统计量数),使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。
2.描述统计只限于对试验样本所得观测数据的统计分析,不考察其总体的特性。
3.推论统计(inferential statistics)是以描述统计为基础,从而解决由局部到全体的推论问题,即通过对一组统计量的计算分析,推论该组数据所代表的总体特性。
4.变量(variables):一个可以取不同数值的物体属性/事件。
5.事前无法预期结果的变量——随机变量6.观测值(原始取值):事后测定的某一结果。
7.概念理解:[涉及“实验”] 自变量(及其各水平)& 因变量(及相应的反应指标);[涉及“调查”,粗略对应于] 属性变量& 反应变量8.计数资料(count data):计算个数的数据,(如人口数,学校数,男女数等)9.计量资料(measurement data):借助于一定的测量工具或一定的测量标准而获得的数据(如分数,身高,体重,IQ)10.称名数据(nominal data):只区分属性或类别上的不同,只可计数,不能排序(性别,学科,职业)11.等级/顺序数据(ordinal data):可排序,但无相等单位,不能加减。
(等级评定,受教育程度,职称)12.等距数据(interval data):具有相等单位,无绝对零的数据,能加减不能乘除。
13.比率数据(ratio data):既表明量的大小,又具有相等单位,可以加减乘除,具有绝对零点。
14.称名数据和顺序数据合称为离散数据。
15.等距数据和比率数据合称为连续数据。
16.离散数据(discrete data)又称为不连续数据,这类数据在任何两个数据点之间所取的数据的个数是有限的。
17.连续数据(continuous data)指任意两个数据点之间都可以细分出无限多个大小不同的数值。
目 录第一部分 考研真题精选一、单项选择题二、多项选择题三、简答题四、综合题第二部分 章节题库第1章 绪 论第2章 统计图表第3章 集中量数第4章 差异量数第5章 相关关系第6章 概率分布第7章 参数估计第8章 假设检验第9章 方差分析第10章 χ2检验第11章 非参数检验第12章 线性回归第13章 多变量统计分析简介第14章 抽样原理及方法第一部分 考研真题精选一、单项选择题1已知某小学一年级学生的体重平均数21kg,标准差3.2kg,身高平均数120cm,标准差6.0cm,则下列关于体重和身高离散程度的说法正确的是( )。
[统考2019研]A.体重离散程度更大B.身高离散程度更大C.两者离散程度一样D.两者无法比较【答案】A【解析】计算体重和身高的变异系数,CV体重=(3.2/21)×100%=15.2%,CV身高=(6/120)×100%=5%。
由此可知体重离散程度更大。
2已知某正态总体的标准差为16,现从中随机抽取一个n=100的样本,样本标准差为16,则样本平均数分布的标准误为( )。
[统考2019研]A.0.16B.1.6C.4D.25【答案】B【解析】总体正态,且方差已知,则样本平均数的分布为正态分布,标准误SE=σ/sqr(n)=16/10=1.6。
3如果学生参加压力量表测试的分数服从正态分布,平均数为5,标准差为2,那么分数处在5和9之间的学生百分比约为( )。
[统考2019研]A.34%B.48%C.50%D.68%【答案】B【解析】计算原始分数为5的标准分数Z1=0,原始分数为9的标准分数Z2=2,已知±1.96包含95%的个体,则可估计p(0<Z<2)=0.48。
4对样本平均数进行双尾假设检验,在α=0.10水平上拒绝了虚无假设。
如果用相同数据计算总体均值的置信区间,下列描述正确的是( )。
[统考2019研]A.置信区间不能覆盖总体均值B.置信区间覆盖总体均值为10%C.置信区间覆盖总体均值为90%D.置信区间覆盖总体均值为0.9%【答案】C【解析】置信度即置信区间覆盖总体均值的概率,题干说明置信度为1-α=0.90。
心理学(师姓名学号专业范)年级 11级课程实验心理学实验时间2012.5.18 同组人姓名成绩用恒定刺激法测定重量差别阈限()(西南大学心理学院,重庆,400715)摘要:本实验通过被试对重量的判别学习用恒定刺激法测定差别阈限。
采用一名大学生为被试,以100克为标准刺激,以88克到112克间隔为4克的7个重量作为比较刺激,要求被试做轻相等重三类判断反应,测量被试对重量的差别感觉阈限。
实验通过作S-P图用直线内插法求得差别阈限。
结果表明,此被试的差别阈限为5.4克。
关键词:恒定刺激法重量差别阈限1 引言:恒定刺激法(或固定刺激法)(method of constant stimulus)又叫正误法(true-false method)、次数法(frequency method),它是心理物理学中最准确、应用最广的方法。
重量差别阈限是指刚好(或有50%的试验次数)能让被试产生重量差异感受的两个刺激之间的最小重量差异值,在重量感受方面具体表现为重量差异感受的变化与实际重量的变化之间的不同步性。
换言之,对于重量不同的无励磁机,能引起被试的重量差异感受所需的重量变化值(即重量差别阈限)不同,而且两者之间比例是恒定的。
恒定刺激法:又叫正误法、次数法,它是心理物理学中最准确、应用最广的方法。
其具体作法为:(1)主试从预备实验中选出少数刺激,一般是5到7个,所选定的刺激最大强度被感觉到的可能性应不低于 95%,刺激的最小强度被感觉到的可能性应不高于 5%;(2)选定的每种刺激呈现50到200次;(3)刺激呈现的次序事先经随机安排,不让被试知道。
用以测量绝对阈限时,则无需标准值;如用以确定差别阈限或等值时,则需包括一个标准值;(4)此法在统计结果时必须求出各个刺激变量引起某种反应(有、无或大、小)的次数,并根据出现次数来定阈限。
在用直线内插法求绝对阈限时,只要将刺激作为横坐标,以正确判断的百分数作为纵坐标,画出曲线。
标准正态分布:P162标准正态分布又称为u分布,是以0为均数、以1为标准差的正态分布,记为N(0,1)F分布:P189基于正态分布建立起来的,:设X、Y为两个独立的随机变量,X服从自由度为m的卡方分布,Y服从自由度为n的卡方分布,这2 个独立的卡方分布被各自的自由度除以后的比率这一统计量的分布即F=(x/m)/(y/n)服从自由度为(m,n)的F-分布,上式F 服从第一自由度为m,第二自由度为n的F分布。
品质相关:用于表示R*C(行*列)表的两个变量之间的关联程度。
包括:四分相关、fai 相关、列联表相关。
相对位置量数:是通过描述一个数据在其总体中所处位置的情况来反映其差异程度。
集中量数:主要用来描述一组数据的集中趋势。
四分位数:把所有数值由小到大排列并分成四等份,处于三个分割点位置的得分就是四分位数。
百分位数:将一组数据从大到小排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。
可表示为:一组n个观测值按数值大小排列如,处于p%位置的值称第p百分位数。
标准分数:又称基分数或Z分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。
Z=(X-μ)/σ 其中X-μ为离均差,σ表示标准差假设检验:假设检验有Z检验、T检验、配对检验、比例检验、秩和检验、卡方检验等假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。
两类错误:当检验结果为拒绝无效假设时,应注意有发生I类错误的可能性,即错误地拒绝了本身成立的H0,发生这种错误的可能性预先是知道的,即检验水准那么大;当检验结果为不拒绝无效假设时,应注意有发生II类错误的可能性,即仍有可能错误地接受了本身就不成立的H0,发生这种错误的可能性预先是不知道的,但与样本含量和I类错误的大小有关系。
统计量:样本的特征值。
虚无假设:(想要拒绝之假设)按事实推论相反方向所陈述的假设,其叙述变项间没有差异,没有影响,没有关系,但若经统计考验方法证实推翻虚无假设,则可获得与事实相符的结论。