当前位置:文档之家› 心理统计学

心理统计学

心理统计学
心理统计学

心理统计学

前言:本课程主要考察各种统计方法在不同的心理和教育研究中应用的条件和具体方法,及其统计计算结果的解释。考试也主要在这两块,大家可以着重复习。重点章节是第三章至第八章。

另:复习心统很枯燥,但是坚持下去你就不挂科了。。。。

等下你看到不想看的时候就回来看这句话吧。。。

题型:

1.选择:20X1=20分

2.填空:8X1=8分

3.判断:10X1=10分

4.名词解释:5X3=15分

5.问答:5X5X=15分

6.计算:4题共12分

一:概念

1.数据类型:(一)观测方法和来源:①计数数据—计算个数的数据,具有独立的分类单

位,如人口数、学校数

②测量数据—借助于一定的测量工具或一定的测量

标准而获得的数据,如身高、体重

(二)反映的测量水平:①称名数据—某一事物与其他事物在属性上的不同或类别上的差异,具有独立的单位,其数值一般都取整数形式,只计算个数,不说明事物之间差异的大小,如性别、颜色类别

②顺序数据—既无喜爱南瓜灯单位,也无绝对零的

数据,是按实物某种属性的大小或多少,按次序将各个事物加以排列后获得的数据资料,如喜爱程度、能力等级、兴趣等

③等距数据—有相等单位,但无绝对零的数据,如

温度、智商等。只能使用加减运算,不能使用乘除运算

④比率数据—既表明量的大小,也有相等的单位,

同时还具有绝对零点。如身高、体重、反应时等

(三)是否具有连续性:①离散数据—又称不连续数据,在任何两个数据点之间所取的数值的个数有限,如球赛分数、班级个数等

②连续数据—任意两个数据点之间都可以细分出无

限多个大小不同的数值,如年龄、长度、重量等

2.变量:心理与教育实验、观察、调查中想要获得的数据,数据获得前用“X”表示,即

为一个可以取不同数值的物体的属性或时间,其数值具有不确定性,如头发的颜色、自信心。

3.观测值:一旦确定了某个值,就称这个值为某一变量的观测值,即具体数据

4.随机变量:取值之前不能预料取到什么值的变量

5.常数:与变量相反的

6.总体:又称母全体、全域,指具有某种特征的一类事物的全体。总体是所欲研究的某一

类对象的全体,总体的大小随研究的问题而改变

7.个体:构成总体的每个基本单位

8.样本:从总体中抽取的一部分个体

9.次数:某一事件在某一类别中出现的数目,又称为频数

10.比率:两个数的比;当所比的两个数中,分子所表示的事物是做分母的那个数(基数)

所表示事物的一部分时,比率又称为比例

11.频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的

次数被这一组数据总个数去除

12.概率:又称几率或然率,用P表示,指某一事件在无限的观测中所能预料的相对出现的

次数,也就是某一事物或某种情况在某一总体中出现的比率,是反映某一事件发生可能性大小的量

13.参数:又称总体参数,描述一个总体情况的统计指标,代表总体的特征,是一个常数

14.统计量:样本的那些特征值,也称特征值。代表样本的特性,是一个变量

15.集中量数:对一组数据集中趋势的度量,就是确定描述一组数据这种特点的代表性的统

计量。用于描述数据集中程度的统计量,就是集中量数

16.平均差:次数分布中所有原始数据与平均数绝对离差的平均值,用A.D.或M.D.表示

17.方差:也称变异数、均方,是每个数据与该组数据平均数之差乘方后的均值,即离均差

平方后的平均数

18.标准差:即方差的平方根。

19.标准分数:又称基分数或Z分数,是以标准差为单位表示一个原始分数在团体中所处位

置的相对位置量数

20.相关系数:两列变量间相关程度的数字表现形式,或者说是用来表示相关关系强度的指

21.概率的加法定理:两个互不相容事件A、B之和的概率,等于两个事件概率之和,写作

P(A+B)=P(A)+P(B)

22.概率的乘法定理:适用于几种情况组合的概率,即几种事件同时发生的情况,公式写作

P(AB)=P(A)X(B)

23.标准误:平均数分布的标准差,也称平均数的标准误,有时用SE表示

24.点估计:用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,所以估计

的结果也以一个点的数值来表示

25.区间估计:根据估计量以一定可靠程度推断总体参数所在的区间范围,它是用数轴上的

一段距离表示未知参数可能落入的范围,它虽不具体指出总体参数等于什么,但能指出未知总体参数落入某一区间的概率有多大

26.置信区间:在某一置信度时,总体参数所在的区域距离或区域长度。其上下二端点值称

置信界限

27.显著性水平:估计总体参数落在某一区间时,可能犯错误的概率,用α表示。有时也称

为意义阶段、信任系数等。1-α为置信度或置信水平。

28.假设检验:通过样本统计量得出的差异做出一般性结论,判断总体参数之间是否存在差

异,这种推论的过程称作假设检验

29.对立假设或者责备假设:在进行任何一项研究时,都需要根据已有的理论和经验事先对

研究结果作出一种预想的希望证实的假设,这种假设称科学假设,统计术语称研究假设,记作H1

30.虚无假设:在统计学中不能对H1 真实性直接检验,需要建立与之对立的假设,就是虚

无假设,也称无差假设、零假设、原假设,记作H0

31.Ⅰ型错误:拒绝H0 时所犯的错误,即虚无假设H0 本来是正确的,却拒绝了H0 ,这类

错误也称α型错误

32.Ⅱ型错误:接受H0 时所犯的错误,即虚无假设H0 本来是不正确的,却接受了H0 ,这

类错误也称β型错误

33.事后检验:当虚无假设被拒绝的结果一旦出现,就必须对各实验处理组的多队平均数进

一步分析,做深入比较,判断究竟哪一对或者哪几对的差异显著,哪几对不显著,确定两变量关系的本质

34.单侧检验:强调某一方向的检验

35.双侧检验:只强调差异而不强调方向性的检验

二:理解

(一)统计图表:主要考察各种图表适用于什么情况。

1.次数分布表:①简单次数分布表--依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。关于态度、兴趣、偏好等测验结果可以制成此表,计数数据和连续数据都可用,但更适合计数数据。

②分组次数分布表--当数据量很大时,把所有数据先划分为若干分组区间,之后将数据按其数值大小规划到相应的组别内,分别统计各个组别中包含的数据个数。适用于连续数据。

③相对次数分布表--将次数分布表中各组实际次数转换为相对次数,即用频数比率或百分比来表示次数。

④累加次数分布表--把各组的次数由下而上或由上而下累加在一起,最后一组的累加次数等于数据的总次数。心理实验中对感知阀限、各种心理量表的编制等都可使用。

⑤双列次数分布表--对有联系的两列变量用同一个表表示其次数分布。

⑥不等距次数分布表---适用于如工资级别、年龄分组等不等距情况。

2.次数分布图:①直方图--以矩形的面积表示连续性随机变量次数分布的图形,显示数据分布的情况会更生动、直观。而没有画矩形,只使直方图包围的面积成封闭的图形,叫组织图。

②次数多边形图--表示连续性随机变量次数分布的线形图。对次数的轮

廓显示得更好,如果样本很大还可以描绘出一条分布曲线,并可据此找到次数分布的经验公式。

③累加次数分布图--累加直方图、累加曲线

3.其他类型统计表:①简单表--只列出名称、地点时序或统计指标名称的统计表。

②分组表--只有一个分类标志的统计表,如年龄。

③复合表--统计分组的标志有两个(双向表)或两个以上(三个称为三向表)的表。

4.其他类型统计图:①条形图--主要用于表示离散型数据资料,即计数资料。分为,简单条形图、分组条形图、分段条形图三种。

②圆形图--又称“饼图”,主要描述间断性资料,目的是为显示各部分在整体中所占的比重大小,以及各部分之间的比较。

③线形图--更多适用于连续性资料,能较好表示两个变量之间的函数关系,或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的情形。

④散点图--用相同大小圆点的多少或疏密表示统计资料数量大小以及变化趋势的图。

(二)集中量数:主要考察各种集中量数适用于什么情况,不会单独考,但是是基础,所以会和其他的一起考。

1.平均数的特点:①在一组数据中每个变量与平均数之差(离均差)的总和等于0.

②在一组数据中,每一个数都加上一常数C,则所得的平均数为原来的平均数加常数C。

③在一组数据中,每一个数都乘以一个常数C所得的平均数为原来的平均数乘以常数C。

2.平均数的优点:①反应灵敏②计算严密③计算简单④简单易解⑤适合于进一步用代数方法演算⑥较少受抽样变动的影响

3.平均数的缺点:①易受极端数据的影响②若出现模糊不清的数据时,无法计算。

4.加权平均数:有些数据单位权重不相等时,计算平均数就要用加权平均数。权数是指各变量在构成总体中的相对重要性。公式参考书本P68-69

5.几何平均数:①一组数据中有少数数据偏大或偏小,数据的分布呈偏态时。心理物理学的等距与等比量表实验中,只能用几何平均数。

②一组数据彼此间变异较大,几乎是按一定的比例关系变化时。如学生人数的增长数等,都要用几何平均数计算平均比率。公式参考课本P70。

6.调和平均数:主要用来描述学习速度方面的问题,公式参考书本P73。

(三)差异量数:主要考察各种差异量数适用于什么情况,不会

单独考,但是是基础,所以会和其他的一起考。

1.百分位差:①百分位数是指量尺上的一个点,在此点一下,包括数据分布中全部数据各数的一定百分比,第P百分位数就是指在其值为P的数据一下,包括分布中全部数据的百分之p。而百分位差就是用P10和P90之间的距离作为差异量数。

②百分等级是一种相对位置量数,就是利用百分位数的计算公式计算出任意分数在整个分数分布中所处的百分位置。

③四分位差是百分位差的一种,指在一个次数分配中,中间50%的次数的距离的一半。在两极端数据不清楚时,可以计算四分位差,但其稳定性差。不适合代数方法运算,反应不够灵敏。

2.平均差:是次数分布中所有原始数据与平均数绝对离差的平均值,可较好的反映次数分布的离散情况,属于一种低效差异量数,在统计实践中不太常用。公式参考书本P86。

3.方差与标准差:主要了解其公式及概念。概念参考上面,公式参考书本P87。

4.方差与标准差的性质:①方差是对一组数据中各种变异的综合的测量,具有可加性和可分解性。

②标准差是一组数据方差的平方根,它不可以进行代数运算,但有以下特性:(1)每一个观测值都加一个相同常数C后,计算得到的标准差等于原标准差。

(2)每一个观测值都乘以一个相同常数C后,所得的标准差等于原标准差乘以这个常数

(3)以上两点相结合,每一个观测值都乘以用一个常数C(不等于0),再加上一个常数d,所得的标准差等于原标准差乘以这个常数C。

5.方差与标准差的意义:①反应灵敏②计算公式严密确定③容易计算④适合代数运算

⑤受抽样变动影响小⑥简单明了

6.差异系数:知道什么时候用,无需记公式但要认得。

适用情况:①同一团体不同观测值离散程度的比较。

②对于水平相差较大,但进行的是用一种观测的各种团体,进行观测值离散程度的比较。

7.标准分数:非常重要,记住概念、公式还有例子。

①概念参考上面,公式参考书本P95。

②性质:1.无实际单位,是以平均数为参照点,以标准差为单位的一个相对量。

2.一组原始分数转换得到的Z分数可以是正值,也可以是负值。Z 分数的平均数也为零

3.一组原始数据中,各个Z分数的标准差为1.

4.若原始分数呈正态分布,则转换得到的所有Z分数值的均值为0,标准差为1的标准正态分布。

③优点:可比性、可加性、明确性、稳定性

④应用:1.用于比较几个分属性质不同的观测值在各自数据分布中相对位置

的高低。(所谓相对位置,一是指某原始数据以平均数为中心以标准差为单位所处距离的远近与方向;二是指某原始数据在该组数据分布中的位置,即在该数据以下或以上的数据各有多少。)

2.计算不同质的观测值的总和或平均值,以表示在团体中的相对位置。

3.表示标准测验分数。(以上应用的例子参考书本98-100)

8.差异量数的选用:会用就可以了。

①通过比较,标准差、方差价值较大,应用较广泛,因此为高效差异量。而其他差异量数如全距、平均差、百分位差和四分位差等缺点较明显,为低效差异量。

②如何选用:参考书本P103

(四)相关关系:用于描述双变量数据相互之间的关系。比较重要。

1.相关系数:①相关系数r的取值范围介于-1.00至+1.00之间,它是一个碧绿,常用小数形式表示。

②其“+、-”号表示双变量数列之间的相关的方向,正值表示正相关,负值表示负相关。

③相关系数r=+1.00时表示完全正相关,r=-1.00时表示完全负相关。r=0时表示完全独立,也就是零相关,即无任何联系。

④相关系数取值的大小表示相关的强弱程度。

2.积差相关(皮尔逊相关):(1)适用条件:①要求成对数据,即若干个体中每个个体都有两种不同的观测值,如每个学生的算术和语文成绩。

②两列变量各自总体的分布都是正态,即正态双变量,至少两个变量服从的分布是接近正态的单峰分布。

③两个相关的变量是连续变量,也即两列数据都是测量数据。

④两列变量之间的关系应是直线性的。

(2)公式:无需记,但要认得且会用,参考书本P1113-120。

3.等级相关:(1)斯皮尔曼等级相关:知道其适用条件,计算及解释结果。

①使用条件:只有两列变量,而且属于等级变量性质的具有线性关系的资料,主要解决称名数据和顺序数据的相关问题。

②公式:无需背,但知道如何用,参考书本P123-128。注重看例子及其解释。

(2)肯德尔W系数:知道什么时候用即可。

①是表示多列等级变量相关程度的一种方法,适用于两列以上的等级变量,即让K个被试对N件事务或N种作品进行等级评定。

②例子参考书本P130。

(3)肯德尔U系数:适用于对K个评价者的一致性进行统计分析,例子参考课本P132。

4.点二列相关:了解其适用条件,公式以及解释。较重要。

(1)适用条件:考察两列观测值一个为连续变量,另一个为“二分”称名变量之间相关程度的统计方法,多用于评价由是非类测验题目组成的测验的内部一致性等问题。

(2)公式及例子解释:参考书本P135。此相关关系结合例子会比较好理解。

5.二列相关:知道什么时候用即可,参考例子理解。P137.

6.多列相关:知道什么时候用即可,参考例子理解。P140.

7.四分相关、Φ系数、列联表相关:知道什么时候用即可,参考例子理解。P141-P145

8.如何选择合适的相关系数:参考书本P147的表格理解。

9.相关系数值的大小与相关程度描述:参考书本P150的图片。

(五)概率分布:是后面两章的基础。重要。

1.正态分布:(1)公式:参考书本P161,无需记,但要认得会用。

(2)特征:①正态分布的形式是对称的(但对称的不一定是正态的),它的对称轴是经过平均数点的垂线。

②正态分布的中央点(即平均数点)最高,然后逐渐向两侧下降,曲线的形式是先向内弯,然后向外弯,拐点位于正负1个标准差处,曲线两端的靠近基线处无限延伸,但终不能与基线相交。

③正态曲线下的面积为1,由于它在平均数处左右对称,故过平均数点的垂线将正态曲线下的面积划分为相等的两部分,即各为0.50

④正态分布是一族分布。它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。

⑤正态分布中各差异量数值相互间有固定比率,参考P163

⑥正负1.96个标准差之间,包含总面积的95%;正负2.58个标准差之间,包含总面积的99%。

(3)正态分布表的使用:会看即可。

(4)应用:①化等级评定为测量数据

②确定测验题目的难易度

③在能力分组或等级评定时确定人数

④测验分数的正态化(以上应用参考书本P167-173例子理解)

2.二项分布:主要掌握其应用。

二项分布主要用于解决含有机遇性质的问题,所谓机遇问题,即指在实验或调查中,实验结果可能是由于猜测而造成的,如选择题目的回答。区分由猜测而造成的结果与真实的结果之间的界限。应用例子理解参考书本P181

3.样本分布:主要需了解什么时候用什么分布,如果看了不是很懂的话,可先浏览一遍

下面的内容,之后看第六部分参数估计以及第七部分假设检验的内容,里面会有例子理解,最后再回来看这里,就会明白了。

(1)正态分布及渐进正态分布:①总体分布为正态,方差已知,样本平均数的分布为正态分布。

②总体分布非正态,但方差已知,这时当样本足够大时(n>30),其样本平均数的分布为渐进正态分布

③自正态分布的总体中抽取容量为n的样本,当n足够大时(n>30),样本方差及标准差的分布,渐趋于正态分布

(2)t分布:是统计分析中应用较多的一种随机变量函数的分析。

①当总体分布为正态,方差未知时,样本平均数的分布为t 分布。

②当总体分布为非正态而其方差又未知时,若满足n>30这一条件,样本平均数的分布近似为t分布。

(3)χ2(卡方)分布:是刻画正态变量二次型的一种重要分布,在统计分析中应用于计数数据的假设检验以及样本方差与总体方差差异是否显著的检验。

(4)F分布:自一个正态总体中随机抽取容量为n1和n2两个样本,其方差的比率分布为F分布。

(六)参数估计:本章结合例子理解会比较容易。重要。

1.含义:当在研究中从样本获得一组数据后,如何通过这组信息,对总体特征进行估计,也就是如何从局部结果推论总体的情况,称为总体参数估计。

2.良好估计量的标准:①无偏性--用多个样本的统计量作为总体参数的估计值,其偏差的平均数为0

②有效性--当总体参数的无偏估计不止一个统计量时,方差越小越好。

③一致性--当样本容量无限增大时,估计值应能够越来越接近它所估计的总体参数,估计值越来越精确,逐渐趋近于真值。

④充分性--指一个容量为n的样本统计量,是否充分地反映了全部n个数据所反映的总体信息。如平均数就可以。

3.区间估计:就是根据样本分布理论,用样本分布的标准误(SE)计算区间长度,解释总体参数落入某置信区间可能的概率。

4.总体平均数的估计:①总体方差已知时,对总体平均数的估计---参考P203例7-1、7-2

②总体方差未知时,对总体平均数的估计---参考P204例7-3、7-4

5.标准差与方差的区间估计:①标准差的区间估计--参考P206例子

②方差的区间估计--参考P207-208例子

③二总体方差之比的区间估计---参考P209例子

6.第四节相关系数的区间估计和第五节比率及比率差异的区间估计,老师说重点的时候没有提到,但是其中涉及了各种分布的应用,如果第五部分不是很理解的同学,可以看下其中的例子理解下。

(七)参数估计:本章结合例子理解会比较容易。重要。

1.了解假设检验、虚无假设、备择假设、两类错误的含义。上面第一模块有写。

2.两类错误的关系:①α+β不一定等于1

②在其他条件不变的情况下,α与β不可能同时减小或增大。

③统计检验力,即1-β,假如真实差异很小,某个检验仍能以较大的把握接受它,就说这个检验的统计检验力比较大。(还是不懂的话看P227)

3.单侧检验与双侧检验的区别:了解其含义就可知道,概念在第一模块。

4.假设检验的步骤:①根据问题要求,提出虚无假设和备择假设。

②选择适当的检验统计量。

③规定显著性水平α,即如果虚无假设正确却把它当成错误的加以拒绝,犯这类错误的概率就是α。

④计算检验统计量的值。

⑤作出决策:根据显著性水平α和统计量的分布,查相应的统计表,查找接受域和拒绝域的临界值,用计算出的统计量的具体值与临界值相比较,作出接受虚无假设或拒绝虚无假设的决策。

5.平均数的显著性检验:需知道各种情况使用什么方法进行检验。

①总体正态分布、总体方差已知:用样本平均数分布的标准误按正态分布去计算临界比率,并从正态分布表中查出临界点的值。参考P231-232例子理解。

②总体正态分布、总体方差未知:原理与上面相同,只是计算标准误的时候,要用无偏估计量代替标准差。这时临界比率的分布服从t分布,因此此时所进行的检验称作t检验。参考P233例子理解。

③总体非正态分布:当样本容量较大时可近似地用Z检验,如果n<30,就只能用非参数方法或对数据进行转换。

6.平均数差异的显著性检验:同样需理解各种情况使用什么方法进行检验。

(1)两个总体都是正态分布、两个总体方差都已知

①独立样本的平均数差异检验:参考P236例子理解

②相关样本的平均数差异检验:参考P237例子理解

(2)两总体都是正态分布、两总体方差都未知

①独立样本的平均数差异检验:1.两个总体方差一致或相等。P238例子。

2.两个总体方差不齐性。P240例子理解。

②相关样本的平均数差异检验:1.相关系数未知。P241例子理解。

2.相关系数已知。P242例子理解。

(3)两个总体非正态分布:①独立样本的平均数差异检验

②相关样本的平均数差异检验(了解即可)

以上内容理解整理可参考书本P244表格。

7.第四节之后的内容老师说重点时没提到,要以防万一的话就看下吧。

(八)方差分析:主要需知道用在什么地方。

1. 组间变异与组内变异:①组间变异--由于接受不同的实验处理而造成的各组之间的变异,可以用两个平均数之间的离差表示,可以看做是组间平均数差异大小的一个指标,两组平均数的差异越大,组间变异就越大。

②组内变异---由组内各被试因变量的差异范围决定的,主要指由实验误差,或组内被试之间的差异造成的变异。

2.方差分析的基本假定:①总体正态分布

②变异的相互独立性

③各实验处理内的方差要一致

3.与方差分析有关的实验设计:了解两种设计师怎样设计的,能够区分,知道怎么做。

①组间设计---把被试分成若干组,每组分别接受一种实验处理,有几种实验处理,被试也就相应的被分为几组,即不同的被试接受自变量不同水平的实验处理。

②组内设计---又称被试内设计,是指每个被试都要接受所有自变量水平的实验处理。

③混合设计--一般涉及两个以上自变量,其中每个自变量的实验设计各不相同,如一个用组间设计,一个用组内设计。

4.事后检验:知道概念,明白为什么要做。

方差分析的主要目的是通过F检验讨论组间变异在总变异中的作用,借以对两组以上的平均数进行差异检验,得到一个整体性的检验结果。如果方差分析F检验的结果表明差异显著,拒绝了虚无假设,就表明几个实验处理组的两两比较中至少有一堆平均数间的差异达到了显著水平,至于是哪一对,方差分析并没有回答。

虚无假设被拒绝的结果一旦出现,就必须对各实验处理组的多对平均数进一步分析,做深入比较,判断究竟是哪一对或哪几对的差异显著,哪几对不显著,确定两变量关系的本质,这就是事后检验。

(九)χ2(卡方)检验:

1.χ2检验的假设(前提条件):①分类相互排斥,互不包容

②观测值相互独立

③期望次数的大小---每一个单元格中的期望次数应该至少在5个以上。

2.χ2检验的类别:①配合度检验---用来检验一个因素多项分类的实际观察数与某理论次数是否接近。

②独立性检验---用来检验两个或两个以上因素各种分类之间是否有关联或是否具有独立性的问题。

③同质性检验---主要目的是在于检定不同人群母总体在某一变量的

反应是否具有显著差异,当用同质性检验检测双样本在单一变量的分布情形,如果两样本没有差异,就说两个母体是同质的,反之,是异质的。

(十)线性回归:主要需知道线性回归与相关回归的关系与区别

关系与区别:①回归分析和相关分析均为研究及度量两个或两个以上变量之间关系的方法。

②从广义上说,相关分析包括回归分析,但严格地讲,二者有区别。

③回归分析是以数学方式表示变量间的关系,而相关分析则是检验或度量这些关系的密切程度,两者相辅相成。

④如果通过相关分析显示出变量间的关系非常密切,则通过所求的归回模型可获得相当准确的推算值。

⑤确定变量之间是否存在这关系,是回归与相关分析的共同起点。

⑥当旨在分析变量之间关系的密切程度时,一般用相关系数,这个过程叫相关分析。倘若研究的目的是确定变量之间数量关系的可能形式,找出表达它们之间依存关系的合适的数学模型,并用这个数学模型来表示这种关系,就叫做回归分析。

(十一)多变量统计分析简介:主要需知道因素和水平是什么。

1.因素:是指实验中的自变量。当研究中包括一个自变量时就称单因素设计,包含两个自变量时就称二因素设计,相应的方差分析程序称为二因素方差分析,有三个自变量的设计就称为三因素设计,相应的方差分析程序称为三因素方差分析。一般两个以上自变量的实验设计统称为多因素实验。

2.水平:一个因素的不同情况称为这一因素的不同水平。如考察男女儿童在数理推理能力方面的差异,则这个实验就是两因素实验。其中一个因素是儿童的性别,它有男、女两种水平,另一个因素是数理推理能力,它有高、中、低三中水平。

注:本资料只涉及老师说的重点部分。

技术有限,如有错误,自己修改。

心理统计学公式

若n为奇数,则Md为第「个数 2 X n X n 1 若n 为偶数,则Md 2- 2 b.有重复数据 b1.重复数没有位于数列中间 方法与无重复数一样 b2.重复数位于数列中间若重复数的个数为奇数若重复个数为偶数 先将数据从小到大(从大到小)排列 三、众数 a.皮尔逊经验公式:分布近似正态探M。:3Md -2X 算术平均数、中位数、众数三者的关系探 在正态分布中:X=Md=M O 四分位差:a未分组数据Q =Q^ Q1 2 b分组数据2 f——Xi Qi = 1* --------- j------ X i 二?平均差— 1. 原始数据计算公式:氷D _》X_X n If Xc-乂2. 次数分布表计算公式:AD = ----------------- n 三.方差和标准差的定义式:探 S2 原始数据导出公式 、算术平均数 1.原始数据计算公式探 X i n 1 X X n 2.简捷公式 1—— X = AM x' n 、中位数(中数) 1.原始数据计算法探 a.无重复数据一.全距R (又称极差):探R = Xmax — Xmin P 百分位数的计算方法:I Pp为所求的第P个百分位数 Lb为百分位数所在组的精确下限 f为百分位数所在组的次数 Fb为小于Lb的各组次数的和 N为总次数 i为组距 百分等级:P R -10°F b f(x 一Lb) R n [ b i 」 在负偏态分布中:X ::: Md ::: M O 四、其它集中量数 1. 加权平均数(Mw)探 W t X, + Xj + - + W,X n 2. 几何平均数(Mg)探 M g 7 X i X2 X n 3、调和平均数 (MH)____________ 1 丄(丄+丄』 N V X1X2X3X4 'X i S2 1X 2 次数分布表计算公式 S2 、fg-X)2 n 导出公式 、2 If X c2代f X c f > = - n i n 丿 If X f(X ci-X)2 n 2 在正偏态分布中: X Md M O

现代心理与教育统计学第07章习题解答

1. 何谓点估计与区间估计,它们各有哪些优缺点? 点估计就是总体参数不清楚时,用一个特定的值,即样本统计量对总体参数进行估计,但估计的参数为数轴上某一点。 区间估计是用数轴上的一段距离来表示未知参数可能落入的范围,它不具体指出总体参数是多少,能指出总体未知参数落入某一区间的概率有多大。 点估计的优点是能够提供总体参数的估计值,缺点是点估计总以误差的存在为前提,且不能提供正确估计的概率。 区间估计的优点是用概率说明估计结果的把握程度,缺点是不能确定一个具体的估计值。 2以方差的区间估计为例说明区间估计的原理 根据χ2分布: 总体方差的.95或.99置信区间为: 即总体参数(方差)落入上述区间的概率为1-α,其值为95%或99% 3.总体平均数估计的具体方法有哪些? 总体方法为点估计好区间估计,区间估计又分为: (1) 当总体分布正态方差已知时,样本平均的分布为正态分布,故依据正态分布理论估计其区间;(2)当总体分布正态方差未知时,样本平均数的分布为T 分布,依据T 分布理论估计其区间;(3)当总体非分布正态方差未知时,只有在n 大于30时渐近T 分布,样本平均数的分布渐近T 分布,依据T 分布理论估计其区间。 4总体相关系数的置信区间,应根据何种分布计算? 应根据Fisher 的Z 分布进行计算 5.解 依据样本分布理论该样本平均数的分布呈正态 其标准误为: 其置信区间为: 该科成绩的真实分数有95%的可能性在78.55----83.45之间。 6.解:此题属于总体分布正态总体方差未知的情形,故样本平均数的分布呈T 分布 其标准误为: 用df=99差T 值表,然后用直线内插法求得t α/2=1.987 其置信区间为: 该学区教学成绩的平均值有95%的可能在78.61---81.39之间。 7解:此题属于总体分布正态总体方差已知 计算标准误 ()()222212221σσσχnS S n X X n =-=-=-∑()()22/121222/2111)(ααχσχ----<<-n n S n S n 25.116 5===n x σσ45 .8355.7825.1*96.18125.1*96.1812/2/<<+<<-?+<

心理统计学答案

心理统计答案 一单项选择题:1-5 DCADB 6-10 DCDAA 11-15 CBDCA 二多项选择题:1.ABD 2.ABCD 3.BCD 4.ABC 5.ABCD 6.AC 7.ACD 8.ABCD 9.CD 10.ABCD 一、名词解释题 1.统计总体是指统计研究对象的全体,它是由一系列客观存在的在某些性质上相同的基本单位组成的集合体。(2分) 总体单位是指组成统计总体的具体单位。(2分) 2.定义:组距式数列中各组上限与下限的中点值。(2分)其公式为:组中值=(上限+下限)/2(2分) 3.综合指数是总指数的基本形式,它是由两个总量指标对比形成的指数。(2分)凡是一个总量指标可以分解为两个或两个以上因素指标的乘积,将其中一个或者一个以上的因素固定下来,仅观察其中一个因素指标的变动程度,这样的总指数就称为综合指数。(2分) 4.时间数列是一种统计数列,它是将反映某类现象在时间上变化和发展的一系列指标数值,按其时间先后顺序排列而成的统计数列。又称动态数列。(4分) 5.就是为了实现特定的目标,根据客观的可能性,在占有一定信息的经验基础上,借助一定工具、技巧和方法,对影响目标实现的诸因素进行准确的计算和判断选优后,对未来行动作出决定。(4分) 四、简答题 1.(1)统计标志与指标间的联系: ①汇总关系。指标值是由众多的总体单位的数量标志值汇总而来的。 ②转换关系。转换关系取决于总体与总体单位之间的转换。根据研究目的的不同,总体单位转换为总体时,则数量标志也转换为指标;而当总体转换为总体单位时,其指标也就转换为数量标志了。 (2)标志与指标的区别: ①说明对象不同。指标是说明总体特征的,而标志是说明总体单位特征的。 ②表现形式不同。统计指标都是用数值表示的,而统计标志可以用数值表示,也可以用文字表示,后者即是品质表示。 2.(1)确定调查目的和任务; (2)确定调查对象、调查单位和报告单位; (3)确定调查项目; (4)制定调查表;

心理统计学公式总结

心理统计学公式总结 一、集中量 1.算术平均数:X??X X??fXNNNi ?n1)2fmd? 2.中位数:Md?Lmd?( 3.众数:M??3Md?2X 4.加权算术平均数:XW? 5.几何平均数:Xg? 6.调和平均数:XH? 二、差异量 1.四分差:QD?N?WX ?W X1X2?XN N1?XQ3?Q1 2 2X?X?2.平均差:MD?N3.标准差:?X?? N24.方差:?2X? ?N5.差异系数:CV??XX100% 6.百分等级分数:PR??Fb???f(X?Lb)?100?N i?7.标准分数:Z? X?X?X 三、相关量1.积差相关系数:r??XY?nXY n?x?y6?D2n(n2?1) 2.斯皮尔曼等级相关系数:rR?1?2?23.肯德尔和谐系数:rW? 式中:SSR??R? 123nK(n?n)12SSR4.点二列相关系数:rpb?Xp?Xq?tpq 5.二列相关系数:

rb?Xp?Xqpq ?tY6.多系列相关系数:rs??[(Y?Y)X] (Y?Y)??pLH2LHt7.四分相关系数:rt?cos(180?bc1?ad) 8.Φ相关系数:r??ad?bc(a?b)(a?c)(b?d)(c?d) 9.列联相关系数:c? 四、推断统计?2 N??2XXn?X1.二项分布概率:P?Cpq n2.二项分布平均数:??np 3.二项分布标准差:??npq Ne12??(X??)22?24.正态分布曲线:Y??2? 5.标准正态分布曲线:Y?e?Z22 6.平均数抽样分布标准误:?X??n??Xn?1 五、总体平均数的显著性检验 1.?已知:Z?X??? nX??2.?未知但n>30:Z??X n?1 3.?未知但n≤30:t?X???Xn?1 六、平均数差异的显著性检验 1.相关大样本:Z?X1?X2?2X1??2X2 ?2r?X1?X2n?1 df?n?1 2.相关小样本:t?X1?X2?2X1??2X2?2r?X1?X2n?13.独立大样本:Z?X1?X2?2X1n14.独立小样本:t???2X2

现代心理与教育统计学的复习资料

第一章心理与教育统计学基础知识 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 比率数据 2、变量、随机变量、观测值 变量是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、总体、个体和样本 需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数

5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章统计图表 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表

将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图(frequency polygon )是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 %100 N f

心理统计学公式

第三章集中量数 一、算术平均数 1.原始数据计算公式※ 121 1n n i i X X X X X n n =+++==∑ 2.简捷公式 二、中位数(中数) 1. 原始数据计算法※ a. 无重复数据 b.有重复数据 b1.重复数没有位于数列中间 方法与无重复数一样 b2.重复数位于数列中间 若重复数的个数为奇数 若重复个数为偶数 先将数据从小到大(从大到小)排列 三、众数 a. 皮尔逊经验公式:分布近似正态※ 算术平均数、中位数、众数三者的关系※ 在正态分布中: 在正偏态分布中: 在负偏态分布中: 四、其它集中量数 1. 加权平均数(Mw)※ 2. 几何平均数(Mg)※ 3、调和平均数(MH) 第四章离散量数 一.全距 R (又称极差):※ R =Xmax -Xmin 百分位数的计算方法: Pp 为所求的第P 个百分位数 Lb 为百分位数所在组的精确下限 f 为百分位数所在组的次数 Fb 为小于Lb 的各组次数的和 N 为总次数 i 为组距 百分等级: 四分位差:a 未分组数据 b 分组数据 二.平均差 1. 原始数据计算公式:※ 2. 次数分布表计算公式: 三.方差和标准差的定义式:※ 原始数据导出公式 次数分布表计算公式 导出公式 个数为第 则为奇数若2 1 ,+n Md n 2 ,1 22 ++= n n X X Md n 则为偶数若X n X ∑=1' 1x n AM X ∑+=X Md M o 23-≈O M Md X ==O M Md X >>O M Md X <

心理统计公式汇总

心理统计公式汇总 心理学考研分为:心理学学硕和心理学专硕(又称“应用心理硕士”、“心理专硕”)。心理学学硕和心理学专硕考试科目不同,但是都会考察到心理学统计,(部分自主命题院校不考察心理学统计,考生需要提前了解院校信息。)无论是对本专业还是跨专业心理学考研的同学而言,心理学统计始终是比较难懂的一块。博仁教育老师为考生分章节整理出心理学统计公式,方便考生进行复习与记忆。 第三章集中量数 1、几个集中量数的公式计算一览表

【组中值的计算】 第四章差异量数

第五章相关关系

第六章概率分布 1、几个基本概念 (1)概率:表明随机事件出现的可能性大小的客观指标。 (2)后验概率(统计概率): 先验概率(古典概率): (3)概率分布:对随机变量取值的概率分布的情况用数学方法(函数)描述。 2、概率的基本性质: ※概率的公理系统: 任何一个随机事件的概率都是非负的; 在一定条件下必然发生的必然事件概率为1; 在一定条件下必然不发生的事件,即不可能事件的概率为0. ※概率的加法定理 ※概率的乘法定理 3、概率的分布类型划分

4、几个重要分布 ★正态分布 (1)特征: ①正态分布的形式是对称的,对称轴是经过平均数的垂线。 ②正态分布的中央点即平均数最高,然后逐渐向两侧下降;曲线形式先向内弯,再向外弯,拐点位于正负1个标准差处,曲线两端向基线无线靠近,但不相交。 ③正态曲线下面积为1。 ④正态分布是一族分布。平均数决定其位置,标准差决定其形态。标准差越小,曲线越狭高。 ⑤正态分布中各差异量数值间有固定比率。 ⑥正态曲线下,标准差和概率(面积)有一定的数量关系。 (2)正态分布表的利用 ①已知Z分数求概率p,即已知标准分数求面积。 ②已知概率P求Z分数。 ③已知概率或Z求概率密度y,即曲线的高。【直接查表即可。注意已知的y是位于中间部分,还是两尾。】 (3)次数分布是否为正态的检验方法 (4)正态分布理论在测验中的应用 ①化等级评定为测量数据 ②标准测验题目的难易度 ③在能力分组或等级评定时确定人数 ④测验分数的正态化 二项分布(贝努里分布) (1)几个重要概念理解

现代心理与教育统计学答案

第一章 1名词概念 (1)随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。(2)总体 答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A 的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。

心理统计学重要知识点

《心理统计学》重要知识点 第二章 统计图表 简单次数分布表的编制:Excel 数据透视表 列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel 数据透视表 直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel 图表向导的柱形图来绘制 散点图(Scatter plot ):主要用于直观描述两个连续性变量的关系状况和变化趋向。 条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据的次数分布情况。 简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。 复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。 圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。 线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势; 第三章 集中量数 ● 集中趋势和离中趋势是数据分布的两个基本特征。 ● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。 ● 集中量数:描述数据分布集中趋势的统计量数。 ● 离中趋势:是指数据分布中数据分散的程度。 ● 差异量数:描述数据分布离中趋势(离散程度)的统计量数 ● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d ) 1.算术平均数(简称平均数,M 、X 、Y ):n x X i ∑= Excel 统计函数AVERAGE 算术平均数的重要特性: (1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i (2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后, 那么,变量Y 2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。中位数上下的数据 出现次数各占50%。 3.众数(mode ,M O ):一组数据中出现次数最多的数据。 4.算术平均数、中数、众数之间的关系。 5.加权平均数:i i i n n n w w w x w w w w x w x w x M ∑∑=++++++= ΛΛ212211

心理统计公式汇总

心理统计公式汇总 第三章集中量数1、几个集中量数的公式计算一览表 平均数(M) 算术平均数 (M) 未分组:1 = n i i X X n = ∑ 分组数据:i ci i f X M f ? = ∑ ∑ 加权平均数 (单位权重不相 等的情况) i i i W X Mw W ? = ∑ ∑ 几何平均数 (解决增长率的 问题) lg lg i X Mg N = ∑ ;1 1 N N X Mg X - =; 1 ,, N N Mg X X = 调和平均数 (解决速度的问 题) 倒数的算术平均数的倒数: 1 H i N M X = ∑ ; 中数(Md) 未分组: 无重复值 N=奇数:中数即 1 2 N+ 位置的数; N=偶数:中数即中间两个数的平均数; 有重复值 若重复值没有位于中间,则求法与无重复值时 一致; 若重复值位于中间,则(P62): 图示: 思路:①连续性数字,不是一个点,是一个区 间; ②有几个重复的,则将组距除以几; 分组d() 2 b b Md N i M L F f =+-? 众数(Mo) 1、直接观察法。 2、公式法。(皮尔逊经验法&金式插补法) ①皮尔逊经验法:o32 M Md M =-; ②金式插补法:a b a b f Mo L i f f =+? + ; 【组中值的计算】

第四章 差异量数 百分位数(点) 100b p b P N F P L i f ?-=+?; 百分等级 未分组:(10050) 100R R P N -=- 分组:()100 []b R b f X L P F N i -= ?+ 四分位差 31 = 2 Q Q Q -; (Q3与Q1即P25与P75) 平均差 未分组:..i i X A D n n X x -= = ∑∑ 分组:..f x A D n = ∑;(IxI 为各组中点值对平均数离差的绝对值) 方差与 标准差 未分组:① 2 2 2 ()s X X N N x -= = ∑∑; ②原始数据代入:2 2 2 2 2 2 () ()s N N X X X X N N -= -= ∑∑∑∑ 分组: 2 2 2 ()c f X X f N N x s -= = ∑ ∑ 2 2 s ()f i N fd d N = -?∑∑ 总方差与总标准差: 2 2 2;()i i i i T i T i i N s N d s d X X N += =-∑∑∑ 标准差 的应用 差异 系数 100%s CV X = ? 标准 分数 X X x Z s s -= = 第五章 相关关系

现代心理与教育统计学复习资料

现代心理与教育统计学 复习资料 Revised as of 23 November 2020

1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。

统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、 次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 %100 N f

心理统计学重要知识点

心理统计学重要知识点 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

《心理统计学》重要知识点 第二章 统计图表 简单次数分布表的编制:Excel 数据透视表 列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel 数据透视表 直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel 图表向导的柱形图来绘制 散点图(Scatter plot ):主要用于直观描述两个连续性变量的关系状况和变化趋向。 条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据的次数分布情况。 简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。 复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。 圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。 线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势; 第三章 集中量数 ● 集中趋势和离中趋势是数据分布的两个基本特征。 ● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。 ● 集中量数:描述数据分布集中趋势的统计量数。 ● 离中趋势:是指数据分布中数据分散的程度。 ● 差异量数:描述数据分布离中趋势(离散程度)的统计量数 ● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d ) 1.算术平均数(简称平均数,M 、X 、Y ):n x X i ∑ = Excel 统计函数AVERAGE 算术平均数的重要特性: (1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i (2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后, 那么,变量Y 2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。中 位数上下的数据出现次数各占50%。 3.众数(mode ,M O ):一组数据中出现次数最多的数据。 4.算术平均数、中数、众数之间的关系。

现代心理与教育统计学复习资料

第一章 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。

4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 %100 N f

(三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 四、其他统计图表 条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。 圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。

心理统计学名词解释

心统名词解释: 统计学:是研究如何搜集、整理、分析反映事物总体的数字资料,并以此为依据,对总体特征进行推断的原理和方法。 教育统计学:是运用数理统计的原理和方法研究教育问题的一门应用科学。它提供各种统计方法的应用条件,对统计计算结果进行解释。 随机变量:表示随机现象各种结果的变量。 总体:是具有某(些)共同特征的总和。 样本:是从总体中抽取的作为观测对象的一部分个体。 描述性统计(Descriptive Statistics):研究如何整理实验或调查得到的大量数据,找出这些数据的分布特征。 集中量(CENTRAL TENDENCY):是代表一组数据典型水平或集中趋势的量。 (种类:平均数(MEAN) ; 中位数(MEDIAN) ; 众数(MODE)等) 中位数:是位于依一定大小顺序排列的一组数据中央位置的数值,大于及小于这一数值各有一半数据分布着。 众数:是集中量的一种指标,用Mo表示,它有理论众数和粗略众数两种。理论众数是指与频数分布曲线最高点相对应的横坐标上的一点。粗略众数是指一组数据中频数出现最多的那个数。 差异量:表示一组数据变异程度或离散程度的量称为差异量。 四分位数:将一组已排序的数据按个数四等分的百分数,分别是位于25%,50%,75%的百分位数。 相关量:相关系数? 相关:两个变量之间不精确、不稳定的变化关系。 推断统计(Inferential Statistics):根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测。 二项分布:重复进行n次二项试验后不同成功次数x所对应的概率分布。 正态分布:如果随机变量X的概率密度函数为f(x)=(自己写公式),则称X服从正态分布。t分布:又称“学生分布”,如果随机变量t的概率密度函数为f(t)=(自己写公式),则称t服从t分布。 自由度:总体参数估计量中变量值独立自由变化的个数。 简单随机抽样:从总体中完全以随机形式抽取若干个个体组成一个样本。在抽取过程中,总体中每个个体被抽到的概率是均等的,并且在任何一个个体被抽取之后总体内成分不变。分层随机抽样:按有关的因素或指标经总体划分为互不重叠的几个层,再从各层中独立地抽取一定数量的个体,最后将从各层中抽取的个体合在一起,组成一个样本。 机械抽样:先将总体中的所有个体按顺序编号,然后每隔一定的间隔抽取个体,组成样本。整群抽样:以整群为单位的抽样方法,即从总体中抽取的个体同属于某个群体。 标准误:样本统计量的标准差,例如:样本平均数的标准差。 点估计:根据样本的观察值计算出一个与θ相应的估计值,用这个估计值直接作为对参数θ的估计。 区间估计:根据样本的观察值计算出两个估计值θ1^和θ2^,,用区间(θ1^,θ2^)作为参数θ可能的取值范围,并指出参数θ落在这一区间的概率。 无偏性:若E(θ^)=θ,则θ^为θ的无偏估计量。(意思到了就OK) 有效性:多个无偏估计量中方差最小的最有效。(同上) 一致性:若limθ^(n→+∞)=θ,则称θ^为θ的一致估计量。(lim式子格式自己理一下)

现代心理与教育统计学课后题完整版78975

第一章绪论 1.名词解释 随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量 总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体 次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示 频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示概率:又称机率。或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率统计量:样本的特征值叫做统计量,又叫做特征值 参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标 观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据 2.何谓心理与教育统计学?学习它有何意义 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 3.选用统计方法有哪几个步骤? 首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的 其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要 第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4.什么叫随机变量?心理与教育科学实验所获得的数据是否属于随机变量 随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量 5.怎样理解总体、样本与个体? 总体N:据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定 样本n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用n表示,又叫样本容量。特点:①样本容量越大,对总体的代表性越强②样本不同,统计方法不同 总体与样本可以相互转化。 个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点

张厚粲现代心理与教育统计学第4版知识点总结课后答案

第1 章绪论 1.1 复习笔记 本章重点 ?心理与教育统计的研究内容 ?选择使用统计方法的基本步骤 ?统计数据的基本类型 ?心理与教育统计的基本概念 一、统计方法在心理和教育科学研究中的作用 (一)心理与教育统计的定义与性质 1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。 (二)心理与教育科学研究数据的特点 1.心理与教育科学研究数据与结果多用数字形式呈现。 2.心理与教育科学研究数据具有随机性和变异性。 3.心理与教育科学研究数据具有规律性。 4.心理与教育科学研究的目标是通过部分数据来推测总体特征。 (三)学习心理与教育统计应注意的事项 1.学习心理与教育统计学要注意的几个问题: (1)学习心理与教育统计学时,必须要克服畏难情绪。心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。 (2)在学习时要注意重点掌握各种统计方法使用的条件。 (3)要做一定的练习。 2.应用心理与教育统计方法时要做到: (1)克服“统计无用”与“统计万能”的思想,注意科研道德。 (2)正确选用统计方法,防止误用和乱用统计。 二、心理与教育统计学的内容 心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别: (一)分类一 依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。如图1-1 所示:

0272《心理统计学》2016年6-7月期末考试指导.

0272《心理统计学》2016年6-7月期末考试指导 一、考试说明 本课程闭卷考试,满分100分,考试时间90分钟。可能的考试题型包括: 1、单项选择题 2、判断题 3、简答题 4、计算题 5、综合应用题 二、重点复习内容 (一)绪论 1、心理学统计学的内容:描述统计、推论统计、实验设计。其中,描述统计的指标包括数据的集中趋势,数据的离散趋势和数据间的相关 2、数据的种类 按照测量的水平,可以划分为称名变量、等级变量、等距变量和比率变量。 (1)称名变量,是指根据事物的某一特征,用来划分、区别事物的不同种类所形成的变量。这类数码并无数量和序列的含义,不能进行数量化分析,不能做加减乘除的运算。 (2)等级变量,在对事物进行分类过程中,依据事物某种属性程度的大小排列顺序形成的变量。等级变量既无相等单位,也无绝对零,不同组的等级变量间不能进行加减乘除的运算。(3)等距变量,是指在观测标识事物某一特定属性时,具有相对参照点、有相等单位的变量。可以进行加减运算,但是由于等距变量的参照点是相对的,即无绝对零点,因此不能进行乘除的运算。例如,测量温度的℃。 (4)比率变量,是指既有相等单位又有绝对零参照点的变量,如身高、体重、反应时、各种感觉阈值的物理量等。这类变量可以进行加减乘除的运算。 (二)统计图表 1、次数分布表:各种次数分布的列表形式和图示形式。次数分布包括简单次数分布、分组次数分布、相对次数分布、累积次数分布等。 2、编制次数分布表的步骤 (1)求全距:从最大值的数据中减去最小值的数据,所得差数就是全距。用符号R表示(2)定组数 (3)求组距:指每一组的间距,用符号i表示。 (4)定组限:指各组数据在数值上的起点值和终点值。 (5)求组中值:各组实际上限数值与实际下限数值的中点数值,即上、下限数值的平均值。(6)归类划记:将原始观测值按照一定的顺序逐一归组。 (7)记录各组次数(f)。 (8)核对,抄录新表。 3、连续变量的单位是无限的,例如整数180的实上限和下限分别为179.5和180.5,而测量数据8.35的下实限是8.345。 4、累加次数分布表:如果想知道某个数值以下或以上的数据的数目,就要用累加次数。 5、次数分布图:编制次数分布表与绘制次数分布图,对于了解一组数据的分布情况,平均水平,差异情况等非常有用。由于数据的性质不同,有时实验结果的次数分布图上会出现双峰。 (三)集中量数 集中量数主要用来描述一组数据的集中趋势,常用的代表性的集中量数有算术平均数、中数、众数。 1、算术平均数:又称平均数,是集中量数中性能最好的一个统计量,一般用M表示。

现代心理与教育统计学

心理统计学 第一章概述 描述统计 定义:研究如何把心理与教育科学实验或调查得来的大量数据科学的科学的加以整理概括和表述 作用:使杂乱无章的数字更好的显示出事物的某些特征,有助于说明问题的实质. 具体内容:1数据分组:采用图与表的形式. 2计算数据的特征值:集中量数(平均数中数)离散量数(方差) 3计算量事物间的相关关系:积差相关(2列 3列多列) 推断统计 定义:主要研究如何利用局部数据(样本数据)所提供的信息,依据数理统计提供的理论和方法,推论总体情形。 作用:用样本推论总体. 具体内容:1如何对假设进行检验。 2如何对总体参数特征值进行估计。 3各种非参数的统计方法。 心理与教育统计基础概念 数据类型 一从数据来源来划分 1计数数据:计算个数或次数而获得的数据。(都是离散数据) 2测量数据:借助一定测量工具或测量标准而获得的数据。(连续数据) 二根据数据所反映的测量水平 1称名数据(分类) 定义:指用数字代表事物或数字对事物进行分类的数据。

特点:数字只是事物的符号,而没有任何数量意义。 统计方法:百分数次数众数列联相关卡方检验等。(非参检验) 2顺序数据(分类排序) 定义:指代事物类别,能够表明不同食物的大小等级或事物具有的某种特征的程度的数据。(年级) 特点:没有相等单位没有绝对零点.不表示事物特征的真正数量。 统计方法:中位数百分位数等级相关肯德尔和谐系数以及常规的非参数检验方法。 3等距数据(分类排序加减(相等单位))(真正应用最广泛的数据) 定义:不仅能够指代物体的类别等级,而且具有相等的单位的数据.(成绩温度) 特点:真正的数量,能进行加减运算,没有绝对零点 ,不能进行乘除计算。 统计方法:平均数标准差积差相关 Z检验 t检验 F检验等。 4比率数据(分类排序加减法乘除法(绝对零点)) 定义:表明量的大小,也具有相等单位,同时具有绝对零点。(身高反应时) 特点:真正的数字,有绝对零点,可以进行加减乘除运算。 在统计中处理的数据大多是顺序数据和等距数据. 三按照数据是否具有连续性 离散数据连续数据 变量观测值随机变量 变量:指心理与教育实验观察调查种想要获得的数据。数据获得前用“x”表示,即为一个可以取不同熟知的物体的属性或事件,其数值具有不确定性,因而称为变量。观测值:是研究中确定的某一变量的取值。 随机变量:表示随机现象各种结果的变量称为随机变量 三总体样本个体

心理统计学题

心理统计学复习提纲 一.选择题 1. 下面哪个统计量不能用来描述数据的离散程度( c )。 A. 极差 B. 标准差 C. 标准分数 D. 四分差 2.假设学生数学成绩服从正态分布,描述学生性别与数学成绩之间的相关用( d )。 A. 积差相关 B. 肯德尔相关 C. 二列相关 D. 点二列相关 3.某班级一次英语考试成绩服从正态分布,全班平均成绩为70分,标准差为8分,一个学生成绩为80分,他在全班的名次为( b )z=(80-70)/8=1.25,查表0.89 A. 前10% B.前 20% C.后10% D. 后20% 4.有一学生的成绩低于平均成绩一个标准差,请问他在该班的百分位是:a A. 16% B. 36% C.50 % D. 84% 5.计算列联相关系数的适应资料为 b A. 等级数据 B. 计数数据 C.二分变量 D. 等距数据 6.总体方差已知的标准误计算公式为 a A. n σ B. 1-n S n C. n s n 1 - D. 1-n σ 7.变异系数可以描述:d A. 集中趋势 B. 差异显著性 C. 百分位数 D.不同测量的离散程度 8.肯德尔和谐系数一般常用来表示:a A.评分者信度 B.题目一致性 C.题目难度 D.测验效度 9.研究为完全随机取样设计,需检验两组平均数是否存在显著差异,已知其分布为非正态,n >20,请问用哪种统计方法最合适? b A.符号检验(相关) B.秩和检验(独立) C.T检验 D.χ2检验 10.下列那些数据可计算平均数:a A. 同质等距数据 B. 等级数据 C. 出现相同数值多的数据 D. 数值成倍变化的数据 11.两因素析因设计中,计算自由度的公式中,哪一个是求交互作用的?d A. npq-1 B. p-1 C. (p-1)(q-1)n D. (p-1)(q-1) 12.考察年龄(p=3)性别( q=2)在某知觉测验中是否存在交互作用,设计采用:a A. 完全随机化区组设计 B. 析因设计 C. 嵌套设计 D. 拉丁方设计 13.有一考察性别因素和三种教学方式教学效果差异的研究,实验是随机取样,随机分组,各组人数相同。请问 用何统计分析方法处理结果?c A. 区组设计的方差分析 B.裂区设计方差分析 C. 析因设计方差分析 D.判别分析 14.有一研究为完全随机取样设计,需检验两组平均数是否存在显著差异,已知其分布为正态,n >30,请问用 哪种统计方法最合适?c A.符号检验 B. 秩和检验 C.T检验 D.χ2检验 15.两因素完全随机试验设计中,下述计算自由度的公式中,哪一个是求误差项的 b A. npq-1(总自由度) B. n -1 C.(p-1)(q-1)n D. (p-1)(q-1) 16.为了考察三种刺激条件下,被试反应时之间是否存在差异,一研究者分别选取5个年龄段的被试各3个, 来考察三种刺激条件下被试反应时的差异,此种设计为( b ).

相关主题
文本预览
相关文档 最新文档