张厚粲现代心理与教育统计学第4版知识点总结课后答案
- 格式:docx
- 大小:5.03 MB
- 文档页数:304
第8章假设检验一、单项选择题1.理论预期实验处理能提高某种实验的成绩。
一位研究者对某一研究样本进行了该种实验处理,结果未发现处理显著的改变实验结果,下列哪一种说法是正确的?()A.本次实验中发生了Ⅰ型错误B.本次实验中发生了Ⅱ型错误C.需要多次重复实验,严格设定统计决策的标准,以减少Ⅰ型错误发生的机会D.需要改进实验设计,提高统计效力,以减少Ⅱ型错误发生的机会【答案】D【解析】总体的真实情况往往是未知的,根据样本推断总体,有可能犯两类错误:①虚无假设H0本来是正确的,但拒绝了H0,这类错误称为弃真错误,即Ⅰ型错误,这类错误的概率以α表示;②虚无假设H0本来不正确但却接受了H0,这类错误称为取伪错误,即Ⅱ型错误,这类错误的概率以β表示。
本次实验H0的正确性未知,所以只是可能出现Ⅱ型错误。
2.以下关于假设检验的命题,哪一个是正确的?()A.如果H0在α=0.05的单侧检验中被接受,那么H0在α=0.05的双侧检验中一定会被接受B.如果t的观测值大于t的临界值,一定可以拒绝H0C.如果H0在α=0.05的水平上被拒绝,那么H0在α=0.01的水平上一定会被拒绝D.在某一次实验中,如果实验者甲用α=0.05的标准,实验者乙用α=0.01的标准。
实验者甲犯Ⅱ型错误的概率一定会大于实验者乙【答案】A【解析】A项,单侧时H0被接受,说明t的观测值的绝对值小于0.05临界值,那一定也会小于0.025的临界值了,也就是双侧的临界值,因此双侧的时候一定会被接受。
B项,如果t值为负,则小于临界值才能拒绝H0。
C项,在α=0.05的水平上显著的在α=0.01上可能不显著。
D项,因为α+β不一定等于1,β还受其他因素的影响。
3.假设检验中的第二类错误是()。
A.原假设为真而被接受B.原假设为真而被拒绝C.原假设为假而被接受D.原假设为假而被拒绝【答案】C【解析】总体的真实情况往往是未知的,根据样本推断总体,有可能犯两类错误:①虚无假设H0本来是正确的,但拒绝了H0,这类错误称为弃真错误,即Ⅰ型错误,这类错误的概率以α表示;②虚无假设H0本来不正确但却接受了H0,这类错误称为取伪错误,即Ⅱ型错误,这类错误的概率以β表示。
现代⼼理与教育统计学(张厚粲)课后习题答案现代⼼理与教育统计学(张厚粲)课后习题答案第⼀章绪论(略)第⼆章统计图表(略)第三章集中量数4、平均数约为36.14;中位数约为36.635、总平均数为91.726、平均联想速度为5.27、平均增加率约为11%;10年后的毕业⼈数约有3180⼈8、次数分布表的平均数约为177.6;中位数约为177.5;原始数据的平均数约为176.7第四章差异量数5、标准差约为1.37;平均数约为1.196、标准差为26.3;四分位差为16.037、5cm组的差异⽐10cm组的离散程度⼤8、各班成绩的总标准差是6.039、次数分布表的标准差约为11.82;第⼀四分位为42.89;第三四分位为58.41;四分位差为7.76第五章相关关系5、应该⽤肯德尔W系数。
6、r=0.8;r R=0.79;这份资料只有10对数据,积差相关的适⽤条件是有30对以上数据,因此这份资料适⽤等级相关更合适。
7、这两列变量的等级相关系数为0.97。
8、上表中成绩与性别有很强的相关,相关系数为0.83。
9、r b=0.069⼩于0.2.成绩A与成绩B的相关很⼩,成绩A与成绩B的变化⼏乎没有关系。
10、测验成绩与教师评定之间有⼀致性,相关系数为0.87。
11、9名被试的等级评定具有中等强度的相关,相关系数为0.48。
12、肯德尔⼀致性叙述为0.31。
第六章概率分布4、抽得男⽣的概率是0.355、出现相同点数的概率是0.1676、抽⼀⿊球与⼀⽩球的概率是0.24;两次皆是⽩球与⿊球的概率分别是0.36和0.167、抽⼀张K的概率是4/54=0.074;抽⼀张梅花的概率是13/54=0.241;抽⼀张红桃的概率是13/54=0.241;抽⼀张⿊桃的概率是13/54=0.241;抽不是J、Q、K的⿊桃的概率是10/54=0.1858、两个正⾯,两个反⾯的概率p=6/16=0.375;四个正⾯的概率p=1/16=0.0625;三个反⾯的概率p=4/16=0.25;四个正⾯或三个反⾯的概率p=0.3125;连续掷两次⽆⼀正⾯的概率p=0.18759、⼆项分布的平均数是5,标准差是210、(1)Z≥1.5,P=0.5-0.43=0.07(2)Z≤1.5,P=0.5-0.43=0.07(3)-1.5≤Z≤1.5,p=0.43+0.43=0.86(4)p=0.78,Z=0.77,Y=0.30(5)p=0.23,Z=0.61,Y=0.33(6)1.85≤Z≤2.10,p=0.482—0.467=0.01511、(1)P=0.35,Z=1.04(2)P=0.05,Z=0.13(3)P=0.15,Z=-0.39(4)P=0.077,Z=-0.19(5)P=0.406,Z=-1.3212、(1)P=0.36,Z=-1.08(2)P=0.12,Z=0.31(3)P=0.125,Z=-0.32(4)P=0.082,Z=-0.21(5)P=0.229,Z=0.6113、各等级⼈数为23,136,341,341,136,2314、T分数为:73.3、68.5、64.8、60.8、57、53.3、48.5、46.4、38.2、29.515、三次6点向上的概率为0.054,三次以上6点向上的概率为0.06316、回答对33道题才能说是真会不是猜测17、答对5⾄10到题的概率是0.002,⽆法确定答对题数的平均数18、说对了5个才能说看清了⽽不是猜对的19、答对5题的概率是0.015;⾄少答对8题的概率为0.1220、⾄少10⼈被录取的概率为0.1821、(1)t0.05=2.060,t0.01=2.784(2)t0.05=2.021,t0.01=2.704(3)t0.05=2.048,t0.01=2.76322、(1)χ20.05=43.8,χ20.0,1=50.9(2)χ20.05=7.43,χ20.0,1=10.923、(1)F0.05=2.31,F0.01=3.03(2)F0.05=6.18,F0.01=12.5324、Z值为3,⼤于Z的概率是0.0013525、⼤于该平均数以上的概率为0.0826、χ2以上的概率为0.1;χ2以下的概率为0.927、χ2是20.16,⼩于该χ2值以下概率是0.8628、χ2值是12.32,⼤于这个χ2值的概率是0.2129、χ2值是15.92,⼤于这个χ2值的概率是0.0730、两⽅差之⽐⽐⼩于F0.05第七章参数估计5、该科测验的真实分数在78.55—83.45之间,估计正确的概率为95%,错误概率为5%。
第7章参数估计一、单项选择题1.()表明了从样本得到的结果相比于真正总体的变异量。
A.信度B.效度C.置信区间D.取样误差【答案】D【解析】A项,信度是指测量结果的稳定性程度。
B项,效度是指一个测验或量表实际能测出其所要测的心理特质的程度。
C项,置信区间,也称置信间距,是指在某一置信度时,总体参数所在的区域距离或区域长度。
D项,取样误差是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全局指标的绝对离差。
抽样误差不是由调查失误所引起的,而是随机抽样所特有的误差。
2.样本平均数的可靠性和样本的大小()。
A.没有一定关系B.成反比C.没有关系D.成正比【答案】D【解析】样本平均数的标准差与总体标准差成正比,与样本容量的平方根成反比。
计算公式为:x SE Nσ=式中σ为总体标准差,N 为样本的大小。
在一定范围内,样本量越大,样本的标准误差越小,则该样本平均数估计总体平均数的可靠性越大。
因此样本平均数的可靠性与样本的大小成正比。
3.样本容量均影响分布曲线形态的是()。
A.正态分布和F 分布B.F 分布和t 分布C.正态分布和t 分布D.正态分布和χ2分布【答案】B【解析】t 分布是一种左右对称、峰态比较高狭,分布形状会随样本容量n-1的变化而变化的一族分布:①当样本容量趋于∞时,t 分布为正态分布,方差为1;②当n-1>30以上时,t 分布接近正态分布,方差大于1,随n-1的增大而方差渐趋于1;③当n-1<30时,t 分布与正态分布相差较大,随n-1减少,离散程度(方差)越大,分布图的中间变低但尾部变高。
χ2分布是一个正偏态分布,随每次所抽取的随机变量X 的个数(n 的大小)不同,其分布曲线的形状不同,n 或n-1越小,分布越偏斜。
df 很大时,接近正态分布,当df→∞时,χ2分布即为正态分布。
F 分布形态是一个正偏态分布,它的分布曲线随分子、分母的自由度不同而不同,随df 1与df 2的增加而渐趋正态分布。
第一章1名词概念(1)随机变量答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。
(2)总体答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。
(3)样本答:样本是从总体中抽取的一部分个体。
(4)个体答:构成总体的每个基本单元。
(5)次数是指某一事件在某一类别中出现的数目,又称作频数,用f表示。
(6)频率答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。
(7)概率答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。
其描述性定义。
随机事件A在所有试验中发生的可能性大小的量值,称为事件A 的概率,记为P(A)。
(8)统计量答:样本的特征值叫做统计量,又称作特征值。
(9)参数答:又称总体参数,是描述一个总体情况的统计指标。
(10)观测值答:随机变量的取值,一个随机变量可以有多个观测值。
2何谓心理与教育统计学?学习它有何意义?答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。
具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
(2)学习心理与教育统计学有重要的意义。
①统计学为科学研究提供了一种科学方法。
科学是一种知识体系。
它的研究对象存在于现实世界各个领域的客观事实之中。
它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。
要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。
统计学正是提供了这样一种科学方法。
统计方法是从事科学研究的一种必不可少的工具。
②心理与教育统计学是心理与教育科研定量分析的重要工具。
目 录第一部分 考研真题精选一、单项选择题二、多项选择题三、简答题四、综合题第二部分 章节题库第1章 绪 论第2章 统计图表第3章 集中量数第4章 差异量数第5章 相关关系第6章 概率分布第7章 参数估计第8章 假设检验第9章 方差分析第10章 χ2检验第11章 非参数检验第12章 线性回归第13章 多变量统计分析简介第14章 抽样原理及方法第一部分 考研真题精选一、单项选择题1已知某小学一年级学生的体重平均数21kg,标准差3.2kg,身高平均数120cm,标准差6.0cm,则下列关于体重和身高离散程度的说法正确的是( )。
[统考2019研]A.体重离散程度更大B.身高离散程度更大C.两者离散程度一样D.两者无法比较【答案】A【解析】计算体重和身高的变异系数,CV体重=(3.2/21)×100%=15.2%,CV身高=(6/120)×100%=5%。
由此可知体重离散程度更大。
2已知某正态总体的标准差为16,现从中随机抽取一个n=100的样本,样本标准差为16,则样本平均数分布的标准误为( )。
[统考2019研]A.0.16B.1.6C.4D.25【答案】B【解析】总体正态,且方差已知,则样本平均数的分布为正态分布,标准误SE=σ/sqr(n)=16/10=1.6。
3如果学生参加压力量表测试的分数服从正态分布,平均数为5,标准差为2,那么分数处在5和9之间的学生百分比约为( )。
[统考2019研]A.34%B.48%C.50%D.68%【答案】B【解析】计算原始分数为5的标准分数Z1=0,原始分数为9的标准分数Z2=2,已知±1.96包含95%的个体,则可估计p(0<Z<2)=0.48。
4对样本平均数进行双尾假设检验,在α=0.10水平上拒绝了虚无假设。
如果用相同数据计算总体均值的置信区间,下列描述正确的是( )。
[统考2019研]A.置信区间不能覆盖总体均值B.置信区间覆盖总体均值为10%C.置信区间覆盖总体均值为90%D.置信区间覆盖总体均值为0.9%【答案】C【解析】置信度即置信区间覆盖总体均值的概率,题干说明置信度为1-α=0.90。
第6章概率分布一、单项选择题1.对随机现象的一次观察为一次()。
A.随机实验B.随机试验C.教育与心理实验D.教育与心理试验【答案】B【解析】在一定条件下可能发生也可能不发生的现象称为随机现象。
对于随机现象的一次观察可以看做一次试验,这样的试验称为随机试验。
随机试验的结果称为随机事件。
2.让64位大学生品尝A,B两种品牌的可乐并选择一种自己比较喜欢的。
如果这两种品牌的可乐味道实际没有任何区别,有39人或39人以上选择品牌B的概率是(不查表)()。
A.2.28%B.4.01%C.5.21%D.39.06%【答案】B【解析】二项分布是指试验仅有两种不同性质结果的概率分布。
即各个变量都可归为两个不同性质中的一个,两个观测值是对立的,因而二项分布又可说是两个对立事件的概率分布。
已知μ=np=64×0.5=32,σ==⨯⨯=640.50.54npqZ=(X-μ)/σ=(39-32)/4=1.75;又因为Z0.05=1.65,Z0.05/2=1.96,所以有39人或39人以上选择品牌B的概率应该在2.5%~5%之间。
3.某个单峰分布的众数为15,均值是10,这个分布应该是()。
A.正态分布B.正偏态分布C.负偏态分布D.无法确定【答案】C【解析】平均数(M)、中数(M d)和众数(M o)三者的关系:①在正态分布中,M、M d和M o相等,在数轴上完全重合;②在正偏态分布中M>M d>M o;③在负偏态分布中M<M d<M o。
众数大于均值,该分布为负偏态分布。
4.t分布比标准正态分布()。
A.中心位置左移,但分布曲线相同B.中心位置右移,但分布曲线相同C.中心位置不变,但分布曲线峰高D.中心位置不变,但分布曲线峰低,两侧较伸展【答案】D【解析】当样本容量趋于∞时,t分布为正态分布,方差为1;当n-1>30以上时,t分布接近正态分布,方差大于1,随n-1的增大而方差渐趋于1;当n-1<30时,t 分布与正态分布相差较大,随n-1减少,离散程度(方差)越大,分布图的中间变低但尾部变高。
第9章方差分析一、单项选择题1.假设80个被试被分配到5个不同的实验条件组,那么要考虑各组被试在某症状测量上的差异,F比率的df各为()。
A.5,79B.5,78C.4,79D.4,75【答案】D【解析】方差分析的组间自由度df B=k-1=5-1=4,组内自由度df W=k(n-1)=5×(16-1)=75。
2.以下关于事后检验的陈述,哪一项是不正确的?()A.事后检验是我们能够比较各组,发现差异发生在什么地方B.多数事后检验设计中都控制了实验导致误差C.事后检验中的每一个比较都是相互独立的假设检验D.Scheffe检验是一种比较保守的事后检验,特别适用于各组n不等的情况【答案】C【解析】如果方差分析F检验的结果表明差异显著,拒绝了虚无假设,就表明几个实验处理组的两两比较中至少有一对平均数间的差异达到了显著水平,至于是哪一对,方差分析并没有回答。
虚无假设被拒绝的结果一旦出现,就必须对各实验处理组的多对平均数进一步分析,做深入比较,判断究竟是哪一对或哪几对的差异显著,哪几对不显著,确定两变量关系的本质,这就是事后检验。
这个统计分析过程也被称作事后多重比较。
3.某项调查选取三个独立样本,其容量分别为n1=10,n2=12,n3=15,用方差分析法检验平均数之间的显著性差异时,其组内自由度为()。
A.2B.5C.36D.34【答案】D【解析】方差分析的组内自由度df W=df T-df B=(N-1)-(K-1)=N-K=(10+12+15)-3=34。
4.某年级三个班的人数分别为50,38,42人,若用方差分析方法检验某次考试平均分之间有无显著性差异,那么组间自由度为()。
A.127B.129C.2D.5【答案】C【解析】方差分析的组间自由度df B=k-1=3-1=2。
5.完全随机设计的方差分析适用于()。
A.三个及其以上独立样本平均数差异的显著性检验B.方差齐性检验C.三个及其以上相关样本平均数差异的显著性检验D.两个样本平均数差异的显著性检验【答案】A【解析】完全随机设计是指组间设计,通常把被试分成若干个组,每组分别接受一种实验处理,有几种实验处理,被试也就相应的被分为几组,即不同的被试接受自变量不同水平的实验处理。
第12章线性回归一、单项选择题1.如果实验得到遗传与儿童多动行为的相关系数是0.5,这意味着有多少儿童多动行为的变异会被除遗传外的其他变量解释?()A.25%B.50%C.75%D.无法确定【答案】C【解析】相关系数的平方等于回归平方和在总平方和中所占比例。
决定系数r2=0.25,表明变量儿童多动行为的变异中有25%是由遗传的变异引起的,或者说有25%可以由遗传的变异解释,有75%是除遗传外的其他变量解释。
2.XY两个变量间呈正相关,R=0.76,其回归是()。
A.拟合的一条线B.准确的两条线C.确定的一条线D.拟合的两条线【答案】A【解析】建立回归模型实际上就是根据已知两变量的数据求回归方程。
如果两个变量之间存在着线性关系,则两个变量间的关系就可以拟合直线模型。
此处只有一个相关关系,因此二者的回归是拟合的一条直线。
3.当XY间相关程度很小时,从X推测Y的可靠性就()。
A.很小B.很大C.中等D.大【答案】A【解析】相关系数是用来描述双变量数据相互之间关系的指标,因此相关程度越小,X 推测Y的可靠性越小。
4.从人类学角度,首先发现回归现象的是()。
A.达尔文B.高尔顿C.高斯D.瑟斯顿【答案】B【解析】“回归”一词,最先是由高尔顿在研究身高与遗传问题时提出。
1855年,他发表了一篇文章《遗传的身高向平均数方向的回归》,分析儿童身高与父母身高之间的关系,发现父母的身高可以预测子女的身高,当父母越高或越矮时,子女的身高会比一般儿童高或矮,他将子女与父母身高的这种现象拟合出一种线性关系。
尽管这是一种拟合较好的线性关系,但仍然存在例外现象:矮个的人的儿子比其父要高,身材较高的父母所生子女的身高将回降到人的平均身高。
换句话说,当父母身高走向极端(或者非常高,或者非常矮)的人的子女,子女的身高不会像父母身高那样极端化,其身高要比父母们的身高更接近平均身高。
高尔顿选用“回归”一词,把这一现象叫做“向平均数方向的回归”。
第1 章绪论1.1 复习笔记本章重点✓心理与教育统计的研究内容✓选择使用统计方法的基本步骤✓统计数据的基本类型✓心理与教育统计的基本概念一、统计方法在心理和教育科学研究中的作用(一)心理与教育统计的定义与性质1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。
前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。
心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。
类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
(二)心理与教育科学研究数据的特点1.心理与教育科学研究数据与结果多用数字形式呈现。
2.心理与教育科学研究数据具有随机性和变异性。
3.心理与教育科学研究数据具有规律性。
4.心理与教育科学研究的目标是通过部分数据来推测总体特征。
(三)学习心理与教育统计应注意的事项1.学习心理与教育统计学要注意的几个问题:(1)学习心理与教育统计学时,必须要克服畏难情绪。
心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。
(2)在学习时要注意重点掌握各种统计方法使用的条件。
(3)要做一定的练习。
2.应用心理与教育统计方法时要做到:(1)克服“统计无用”与“统计万能”的思想,注意科研道德。
(2)正确选用统计方法,防止误用和乱用统计。
二、心理与教育统计学的内容心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别:(一)分类一依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。
如图1-1 所示:图1-1 心理与教育统计研究内容1.描述统计描述统计(descriptive statistics)主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。
具体内容有:(1)数据如何分组,如何使用各种统计图表描述一组数据的分布情况。
(2)怎样计算一组数据的特征值,简缩数据,进一步描述一组数据的全貌。
(3)表示一事物两种或两种以上属性间相互关系的描述及各种相关系数的计算及应用条件,描述数据分布特征的峰度及偏度系数的计算方法等等。
2.推论统计推论统计(inferential statistics)主要研究如何通过局部数据所提供的信息,推论总体的情形。
这是统计学中较为重要、也是应用较多的内容。
包括以下几个方面:(1)如何对假设进行检验,即各种各样的假设检验,包括大样本检验方法(Z 检验),小样本检验方法(t 检验),各种计数资料的检验方法(百分数检验,x2 检验等),变异数分析的方法(F检验),回归分析方法等等。
(2)总体参数特征值的估计方法,即总体参数的估计方法。
(3)各种非参数的统计方法等等。
3.实验设计实验设计(experimental design)主要目的在于研究如何科学地、经济地以及更有效地进行实验,它是统计学近几十年发展起来的一部分内容。
作为一个严谨的实验研究,在实验以前就要对研究的基本步骤、取样的方法、实验条件的控制、实验结果数据的统计分析方法等做出严格的规定。
4.描述统计、推论统计、和实验设计之间的关系心理与教育统计的这几部分内容之间有着密切联系。
描述统计是推论统计的基础,推论统计离不开描述统计计算获得的特征值。
描述统计只是对数据进行一般的分析归纳,如果不进一步应用推论统计作进一步分析,描述统计的结果就不会产生更大的价值和意义,达不到统计分析的最终目的和要求。
同样,只有良好的实验设计才能使获得的数据具有意义,进一步的推论统计才能说明问题。
一个好的实验设计,也必须符合基本的统计方法要求,否则,再好的设计,如果事先没有确定适当的统计处理方法,在处理研究结果时可能会遇到许多麻烦问题。
(二)分类二依据心理与教育统计研究的问题实质来划分,可将心理与教育统计学的内容划分为:1.描述一件事物的性质。
2.比较两件事物之间的差异。
3.分析影响事物变化的因素。
4.一件事物两种不同属性之间的相互关系。
5.取样方法等。
三、心理与教育统计学的发展(一)统计学的发展历程统计学(statistics)作为一门科学始于19 世纪。
但统计工作自古就有,源于统治者治理国家的需要。
这类统计是记录或描述已经发生的各种现象,可以称为描述性统计。
1.随着科学进步,近百年来,在概率论基础上逐步形成了推测性的数理统计。
19 世纪中期奠定了概率论的理论基础。
(1)统计学的理论基础——概率论与正态分布曲线方程的产生①16 世纪,伽利略提出概率论的基础理论。
②17 世纪中期,法国数学家帕斯卡和费马创立概率论,为统计学的发展创立了重要的理论基础。
③17 世纪末18 世纪初,瑞士数学家贝努里创立了贝努里定理,为发现正太分布概率创造了条件。
④1733 年莫弗推导出“正态曲线方程”。
⑤高斯首次提出“正态分布曲线”。
⑥19 世纪初,泊松推广贝努里定理,提出“大数定理”。
(2)数理统计的产生与发展——描述统计学与推论统计学数理统计的发展经历了两个阶段:描述统计学与推论统计学。
描述统计学产生于20 世纪20 年代之前,以高尔顿(Frarmis Galton,1822~1911)和皮尔逊(Karl Pearson,1857~1936)为代表。
推论统计学产生于20 年代之后,以费舍(Ronald Aylmer Fisher,1890~1962)为代表。
①19 世纪末,在生物学、优生学、心理学研究中,高尔顿探索简化数据的途径及方法,提出了中位数、百分位数、四分差等描述统计学的相关概念。
②1908 年,由于受大样本理论的限制,英国数理统计学家格赛特(w illiam S ealy Goss et,1876~1937),开始建立小样本理论,提出了一种根据样本资料估计均数的检验方法,即t 分布理论,开辟了在样本数目较小的情况下进行统计推论的新途径,t 检验已成为今天应用得非常广泛的统计检验方法之一。
③英国的费舍是推论统计真正的创始者,他是20 世纪初对统计学作出最大贡献的科学家。
他将皮尔逊及格赛特的工作发扬光大,对t 分布给出理论论证,最先提出F 分布理论,后被命名为 F 分布,使方差分析系统化。
一战后,费舍在农业实验中首倡“实验设计”,提出随机化概率,建立了点估计与随机化估计的理论,发展确立了推论统计思想,使统计方法应用更为广泛。
④二战以后,非参数方法、序列分析、随机过程的研究、小样本分布这些都逐渐被认识和应用。
多元统计理论与方法被应用到各种实际研究中去,数理统计产生了许多应用分支学科,为工农业生产及科学研究开辟了广阔的应用前景。
同时,实践的发展又为数理统计的发展提出了很多新课题。
(二)统计在心理与教育研究中的应用作为一门应用统计分支学科,心理与教育统计基本上是随着数理统计的发展而发展的;同时心理与教育研究的发展也不断充实着统计学的方法。
许多现代统计学理论最初是来自心理与教育研究的。
例如,因子分析源出于心理学,x2 理论来自社会科学的研究。
1.英国的高尔顿最早将统计方法应用于心理学研究,首创回归原理。
他的学生皮尔逊也将相关系数及x2 检验等应用于心理与教育研究中。
2.同时期英国的心理学家斯皮尔曼(Charles Edward Spearman,1863~1945)对心理统计的发展做了很多工作,延伸了相关系数的概念,导出等级相关系数的计算方法。
1904 年,又提出因子分析的思想,用统计方法处理心理实验结果。
3.贡献较大的有卡特尔、桑代克、瑟斯顿等人。
1904 年,桑代克出版《心理与社会测量》一书,极力提倡以心理学与统计学为工具而研究教育学,推广运用统计方法研究心理与教育方面的实验结果。
20 世纪20 年代,瑟斯顿等人对因素分析在心理学研究中的广泛应用也作了很大贡献。
4.20 世纪初,统计学作为一门课程在美国的经济学科中被讲授,正式实施统计学教育。
一战后,统计学全方位进入各个领域。
30 年代,心理科学研究开始强调利用统计学,高等院校开设心理与教育统计课程。
40 年代,普遍应用于研究心理与教育问题。
(三)心理与教育统计在中国的发展与应用1.心理与教育统计学在辛亥革命以后传到我国。
当时心理与教育统计、心理与教育测量都作为高等、中等师范院校的必修课程,有一大批专家、学者从事这方面的研究、讲授工作,出版了不少关于教育统计方面的译著、专著。
2.20 世纪80 年代以后,心理与教育统计学开始复苏。
在二十多年中,我国的心理与教育统计学科在教学、研究、培养人才等各方面取得了非常丰硕的成果。
3.目前,心理与教育统计学的教学和研究进入稳步快速发展时期。
四、心理与教育统计基础概念(一)数据类型根据不同的分类标准,心理与教育科学研究中的数据可以区分为不同的类型。
1.从数据的观测方法和来源划分,研究数据可区分为计数数据和测量数据两大类。
(1)计数数据(count data),是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,一般都取整数形式。
(2)测量数据(mea surement data),又称计量数据是指借助于一定的测量工具或一定的测量标准而获得的数据。
2.根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型。
(1)称名数据(nominal data)只说明某一事物与其他事物在属性上的不同或类别上的差异,它具有独立的分类单位,其数值一般都取整数形式,只计算个数,并不说明事物之间差异的大小,在教育和心理类调查研究中,有关被试属性的调查资料,大多属于这类数据。
(2)顺序数据(ordinal data)是指既无相等单位,也无绝对零的数据,是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。
如学生的等级评定、喜爱程度、品质等级、能力等级、兴趣等。
这种数据不具有相等单位,也没有绝对零点,只能排出一个顺序,不能指出相互间的差别大小这类数据不能进行加减乘除运算。
(3)等距数据(interval data)是有相等单位,但无绝对零的数据,如温度、各种能力分数、智商等。
只能使用加减运算,不能使用乘除运算。
(4)比率数据(ratio data)既表明量的大小,也有相等的单位,同时还具有绝对零点,如身高、体重、反应时、各种感觉阈值的物理量等都属于这种数据类型。