心理统计学讲义
- 格式:pdf
- 大小:12.40 MB
- 文档页数:154
【课程讲义】第五章相关系数【教学目标】明确相关是描述两个变量之间关系的量数;掌握相关的种类;掌握各种相关系数的计算、适用条件;掌握相关在教学实践中的运用;掌握对相关系数的解释。
【学习方法】了解、理解与掌握。
【重点难点】各种相关系数的使用条件、计算及应用【讲义内容】前面章节中研究的问题,基本上都是属于单变量的数量变化关系。
而教育和心理现象中的数量关系,并不仅仅是单变量的变化关系,在很多方面体现出的是一个变量与另一个变量或多个变量之间的变化关系。
如:学生学习成绩与学生智商的关系;学生学习成绩与学习动机的关系;家庭环境与学生学业成绩之间的关系等等。
本章主要讨论两个变量或两列数据之间相关的数量关系。
第一节相关概述一、相关的含义事物总是相互联系的,它们之间的关系多种多样。
分析起来,大概有以下几种情况:一种是因果关系,即一种现象是另一种现象的因,而另一种现象则是果。
例如学习的努力程度是学习成绩好坏的因(至少是部分的因);在一定刺激强度范围内,刺激强度经常是反应强度的因等等。
第二种是共变关系,即表面看来有联系的两种事物都与第三种现象有关,这时两种事物之间的关系,便是共变关系。
例如春天出生的婴儿与春天栽种的小树,就其高度而言,表面上看来都在增长,好像有关,其实,这二者都是受时间因素影响在发生变化,在它们本身之间并没有直接的关系。
第三种是相关关系,即两类现象在发展变化的方向与大小方面存在一定的关系,但不能确定这两类现象之间哪个是因,哪个是果;也有理由认为这两者并不同时受第三因素的影响,即不存在共变关系。
具有相关关系的两种现象之间,关系是较复杂的,甚至可能包含有暂时尚未认识的因果关系及其共变关系在内。
例如,同一组学生的语文成绩与数学成绩的关系,即属于相关关系。
二、相关的种类统计学中所讲的相关是指具有相关关系的不同现象之间的关系程度。
相关的种类可以从不同角度划分,从其变化方向来看,两个变量之间的相关可以分为:1.正相关。
【课程讲义】第四章差异量数【教学目标】明确差异量数是描述数据离中趋势的一种量数,它与集中量数一起描述数据的全貌;明确标准差是所有差异量数中代表性最好的;掌握各种差异量数的概念、性质、计算方法、适用条件。
【学习方法】了解、理解、计算与应用。
【重点难点】差异量数的概念及适用条件;各种差异量数的计算方法;标准分数及百分等级的概念、适用条件及计算方法。
【讲义内容】前一章讨论的集中量数反映的是一组数据的集中趋势,代表一组数据的一般水平。
但是客观事物总是千差万别的,一组数据中不是所有的数值都与一般水平相等,而是有的高些,有的低些,彼此参差不齐。
描述一组数据波动情况的量数成为差异量数。
差异量数常用来衡量集中量数的代表性程度。
差异量数越大,则集中量数的代表性越小;差异量数越小,则集中量数的代表性越大。
差异量数分为:绝对差异量数和相对差异量数绝对差异量数:标准差,方差,四分差;相对差异量数:差异系数另外,本章还讲到相对地位量数:标准分数,百分等级。
第一节标准差一、标准差的概念及适用条件(一)概念标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数,再求算术平方根。
标准差的计算公式为:n XS2)(X-∑=(4.1)X为算术平均数,n为数据的个数。
(二)适用条件1.与算术平均数配合使用,与算术平均数的适用条件相同。
即一组数据的一般水平适合用算术平均数描述时,其离散程度宜用标准差描述;2.计算其他统计量时,如差异系数,标准分数,相关系数等,需要用到标准差;3.在推论统计中,尤其是进行方差分析时,常用方差表示数据的离散程度。
二.标准差的计算方法(一)未分组资料标准差的计算方法1.基本公式法用标准差的定义n XS2)(X-∑=,计算标准差。
例1 某校四年级举行数学竞赛,一班、二班分别派九名选手参加,成绩如下表。
试比较两个班的成绩。
4-1 四年级一班九名学生竞赛成绩统计表4-2 四年级二班九名学生竞赛成绩统计表解:先求年级一班的平均数和标准差。
【课程讲义】第四章差异量数【教学目标】明确差异量数是描述数据离中趋势的一种量数,它与集中量数一起描述数据的全貌;明确标准差是所有差异量数中代表性最好的;掌握各种差异量数的概念、性质、计算方法、适用条件。
【学习方法】了解、理解、计算与应用。
【重点难点】差异量数的概念及适用条件;各种差异量数的计算方法;标准分数及百分等级的概念、适用条件及计算方法。
【讲义内容】前一章讨论的集中量数反映的是一组数据的集中趋势,代表一组数据的一般水平。
但是客观事物总是千差万别的,一组数据中不是所有的数值都与一般水平相等,而是有的高些,有的低些,彼此参差不齐。
描述一组数据波动情况的量数成为差异量数。
差异量数常用来衡量集中量数的代表性程度。
差异量数越大,则集中量数的代表性越小;差异量数越小,则集中量数的代表性越大。
差异量数分为:绝对差异量数和相对差异量数绝对差异量数:标准差,方差,四分差;相对差异量数:差异系数另外,本章还讲到相对地位量数:标准分数,百分等级。
第一节标准差一、标准差的概念及适用条件(一)概念标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数,再求算术平方根。
标准差的计算公式为:n XS2)(X-∑=(4.1)X为算术平均数,n为数据的个数。
(二)适用条件1.与算术平均数配合使用,与算术平均数的适用条件相同。
即一组数据的一般水平适合用算术平均数描述时,其离散程度宜用标准差描述;2.计算其他统计量时,如差异系数,标准分数,相关系数等,需要用到标准差;3.在推论统计中,尤其是进行方差分析时,常用方差表示数据的离散程度。
二.标准差的计算方法(一)未分组资料标准差的计算方法1.基本公式法用标准差的定义n XS2)(X-∑=,计算标准差。
例1 某校四年级举行数学竞赛,一班、二班分别派九名选手参加,成绩如下表。
试比较两个班的成绩。
4-1 四年级一班九名学生竞赛成绩统计表4-2 四年级二班九名学生竞赛成绩统计表解:先求年级一班的平均数和标准差。
【课程讲义】第二章教育统计资料的整理【教学目标】明确数据的概念与种类;明确统计资料整理的意义;明确统计表与图是对数据的初步、描述处理;掌握次数分布表的和次数分布图的制作方法。
【学习方法】了解、理解与掌握。
【重点难点】统计图表的种类及应用,次数分布表和次数分布图的制作。
【讲义内容】在教育科学研究中,一般都是先获得大量的观测数据。
这些数据虽然乍看起来纷乱无章,但经过整理可以提供大量规律性知识和有用的信息,成为发展科学与指导实践的重要依据。
在整理数据的过程中,第一步是对数据的特点和种类加以分析,制定出简单明了的统计图表。
统计表和统计图是在表示数据上非常有用的两种不同形式。
它们的优点都在于一目了然,使它所欲表现的信息容易被人们理解和接受。
本章主要介绍数据的有关概念、教育统计资料整理的意义和方法,以及如何对数据进行初步整理,以及各种统计图表的作用与制定方法。
第一节数据的概念与种类一、数据的概念与特点统计是对大量的数量关系的总和与汇总,借此反应被研究对象的现状、特点、发展变化的趋势、相互间关系及其规律。
数据作为数量关系的表现形式,是统计调查、统计整理和统计分析的基础材料,因此,首先应对数据的概念和种类有初步了解。
所谓数据,即是带有单位的数,它是通过对具体事物进行技术或者测量所得到的描述事物特征的数量依据。
由于客观事物始终处于运动变化和发展过程中,对其某一特征的观察或测量得到的数据总是变化的,这种标定统计事项某一特征的量成为变量。
与变量相对应的恒定不变的量,成在教育科学领域中,大量研究工作是通过科学实验或调查进行的,研究工作者必须对所欲研究的事物进行观察或通过一定的手段进行测量,然后将观察和测量的结果用一定的数量化方式加以表示,如果观察和测量的结果可靠、准确,那么,这些数据就能够在一定程度上反映出研究对象的特征,但是这些数据所提供的信息,并不一目了然。
在科学研究中搜集到的这些数据,都是以一个个分散的数字形式出现的。
第七章 方差分析、统计效力方差分析原理:综合的F检验应用:两个以上平均数之间的差异检虚无假设:H0:μ1 = μ2 = μ3方差可分解,实验数据的总变异分解为若干不同来源的分变异,一般分为组内变异和组间变异组内变异:实验误差、被试差异等组间变异:不同实验条件造成的变异考察F = 组间均方/ 组内均方的显著性方差分析的前提总体正态分布变异互相独立各实验条件的方差齐性方差分析的步骤a. 求总和方、组间和方、组内和方b. 求总自由度、组间自由度、组内自由度c. 求组间均方、组内均方d. 计算F观测值e. 列方差分析表f. 查F表求F临界值g. 作判断符号系统K = 处理条件或组的数目n i = 第i 组的被试数目,若每组被试相等,则为n N = Σn i = 总被试数T i = ΣX ij = 每个组分数值的和 G = ΣX ij = 所有分数的总和 P = 每个被试的观察数目 单因素完全随机方差分析例:检验三个不同的学习方法的效应。
将学生随机分配到3个处理组 方法 A :让学生只读课本, 不去上课. 方法 B :上课,记笔记,不读课本.方法 C :不读课本,不去上课, 只看别人的笔记解:虚无假设H 0:μ1 = μ2 = μ3 ,三种方法学习效果没有差异 备择假设:至少有一个组和其他不同G=30, N=15, 215G ==, 2106,3XK ==∑SS 总= ΣX 2 - G 2 / N =106 – 900 / 15 = 106 – 60 = 46 SS 组内= SS 1 + SS 2 + SS 3 = 6 + 6 + 4 = 16SS组间= Σ(T2/n i) - G2/N = 52/5 + 202/5 + 52/5 - 302/15 = 5 + 80 + 5 –60 = 30实际SS组间可以用SS总- SS组内快速求得,但不推荐df总= N – 1 = 15 -1 = 14df组内= N –K = 15 - 3 = 12df组间= K – 1 = 3 – 1 = 2MS组内= SS组内/ df组内= 16/12 = 1.333MS组间= SS组间/ df组间= 30/2 = 15F obs = MS组间/ MS组内= 15 / 1.333 = 11.25F0.05(2, 12) = 3.88F obs = 11.25 > F0.05(2, 12) = 3.88所以拒绝H0,至少有一组和其他不同事后检验N-K检验HSD检验Scheffe检验……注意:不能用两两之间t检验,P = 1 - (1 - α)n,例如本例P = 1 - (1 –0.05)3 = 0.143随机区组设计的方差分析又称重复测量方差分析,单因素组内设计,相关组设计,被试内设计解:G = 305.5,N = 32,ΣX2 = 2934.91,K = 4, n = 8SS总= ΣX2 - G2 / N = 2934.91 –305.52 / 32 = 18.33SS组内= SS1 + SS2 + SS3 + SS4 = 2.8 + 3.14 + 1.535 + 1.429 = 8.894SS组内= SS被试间+ SS误差SS被试间=Σ(P2/K) - G2/N = 1544.49/4 + 1482.25/4 + 1584.04/4 + 1310.44/4 + 1303.21/4 + 1444/4 + 1755.61/4 + 1274.49/4 - 305.52/32 = 8.062SS误差= SS组内- SS被试间= 8.894 - 8.062 = 0.832SS组间= Σ(T2/n i) - G2/N = 80.82/8 + 79.62/8 + 75.42/8 + 69.72/8 –305.52/32 = 816.08 + 792.02 + 710.645 + 607.261 –2916.57 = 9.436df总= N – 1 = 32 -1 = 31df组内= N –K = 32 - 4 = 28df组间= K – 1 = 4 – 1 = 3df被试= n – 1 = 8 – 1 = 7df误差= df组内–df被试= 28 –7 = 21MS误差= SS误差/ df误差= 0.832/21 = 0.040MS组间= SS组间/ df组间= 9.436/3 = 3.145F obs = MS组间/ MS误差= 3.145 / 0.040 = 78.63F0.01(3, 21) = 4.87F obs = 78.63 > F0.01(3, 21) = 4.87所以拒绝H0,至少有一组和其他不同事后检验:略协方差分析在某些实际问题中,有些因素在目前还不能控制或难以控制,如果直接进行方差分析,会因为混杂因素的影响而无法得出正确结论。
【课程讲义】第三章集中量数【教学目标】明确一批数据的特征包括两个方面的内容:集中趋势、离散性;明确集中量数是描述数据集中趋势的量数,可以作为一批数据的代表值;明确算术平均数是所有集中量数中运用最广泛、最优的量数;明确各种集中量数的含义、计算方法、使用条件、性质及优缺点。
【学习方法】了解、理解、计算与应用。
【重点难点】算术平均数的概念及适用条件;算术平均数的计算方法;中位数的概念及适用条件;中位数的计算方法。
【讲义内容】前一章所讲的统计分组、统计表、统计图等,只是对研究工作中所获得的数据进行初步整理,其目的是对数据的性质、分布特征、差异情况及数据的一般规律有一直观和形象的认识。
因此说这一步还不是应用统计方法的步骤。
为了进一步发现和表示一组数据的规律性,需要计算出一些能够反映这组数据的统计特征的数字——称为统计量或特征数。
对于一组数据来讲,最常用的统计量有两类。
一类是表现数据集中性质或集中程度的,另一类是表现数据分散性质或分散程度的。
数据的集中情况指一组数据的中心位置。
集中趋势的度量,即确定一组数据的代表值。
描述数据集中情况的统计量有多种,包括算术平均数、中数、几何平均数等。
由于这些统计量的作用在于度量数据的集中趋势,因此它们都称为集中量数。
本章主要介绍几种常用的集中量数。
集中量数只描述数据的集中趋势和典型情况,它还不能说明一组数据的全貌。
数据除典型情况之外,还有变异性的特点。
对于数据变异性即离中趋势进行度量的一组统计量,称作差异量数,这些差异量数有方差、标准差、全距、平均差、四分差及各种百分差等等,下一章中将对常用的差异量数进行介绍。
第一节 算术平均数一、算术平均数的概念和适用条件(一)概念算术平均数一般简称为平均数或均数(Mean )。
只有在与其他几种集中量数如几何平均数、加权平均数相区别的时候,才把它叫做算术平均数。
如果平均数是由X 变量计算的,就记为X (读作X 杠),若由Y 变量求得,则记为Y 。
心理统计学(全套课件)第一部分:心理统计学导论一、引言心理统计学是心理学研究中的重要工具,它帮助我们从大量数据中提取有意义的信息,以便更好地理解人类行为和心理过程。
本课程将介绍心理统计学的基本概念、原理和方法,以及如何运用这些工具来分析心理学数据。
二、心理统计学的基本概念1. 变量:在心理学研究中,变量是指可以被测量的特征或属性。
变量可以分为连续变量和离散变量,以及自变量和因变量。
2. 数据:数据是变量的具体值,可以是数值型数据或非数值型数据。
3. 样本与总体:样本是从总体中抽取的一部分个体,而总体是所有可能个体的集合。
4. 随机抽样:随机抽样是从总体中随机抽取样本的过程,以确保样本能够代表总体。
三、描述性统计1. 频数分布:频数分布是描述数据分布情况的一种方法,它显示了每个数值或数值区间出现的次数。
2. 集中趋势:集中趋势是指数据分布的中心位置,常用的指标有均值、中位数和众数。
3. 离散程度:离散程度是指数据分布的分散程度,常用的指标有方差、标准差和变异系数。
四、推断性统计1. 概率与概率分布:概率是描述事件发生可能性大小的数值,概率分布是描述随机变量取值的概率分布情况。
2. 假设检验:假设检验是通过对样本数据进行统计分析,来判断总体参数是否符合某种假设的方法。
3. 参数估计:参数估计是通过对样本数据进行统计分析,来估计总体参数的方法。
五、心理统计学软件1. SPSS:SPSS是一种常用的心理统计学软件,它提供了丰富的数据分析功能,包括描述性统计、推断性统计、数据管理等功能。
2. R语言:R语言是一种开源的统计编程语言,它提供了强大的数据分析功能,包括数据可视化、机器学习等功能。
心理统计学是心理学研究中的重要工具,它帮助我们从大量数据中提取有意义的信息,以便更好地理解人类行为和心理过程。
本课程将介绍心理统计学的基本概念、原理和方法,以及如何运用这些工具来分析心理学数据。
通过学习本课程,学生将能够掌握心理统计学的基本知识和技能,为今后的心理学研究打下坚实的基础。
【课程讲义】第三章集中量数【教学目标】明确一批数据的特征包括两个方面的内容:集中趋势、离散性;明确集中量数是描述数据集中趋势的量数,可以作为一批数据的代表值;明确算术平均数是所有集中量数中运用最广泛、最优的量数;明确各种集中量数的含义、计算方法、使用条件、性质及优缺点。
【学习方法】了解、理解、计算与应用。
【重点难点】算术平均数的概念及适用条件;算术平均数的计算方法;中位数的概念及适用条件;中位数的计算方法。
【讲义内容】前一章所讲的统计分组、统计表、统计图等,只是对研究工作中所获得的数据进行初步整理,其目的是对数据的性质、分布特征、差异情况及数据的一般规律有一直观和形象的认识。
因此说这一步还不是应用统计方法的步骤。
为了进一步发现和表示一组数据的规律性,需要计算出一些能够反映这组数据的统计特征的数字——称为统计量或特征数。
对于一组数据来讲,最常用的统计量有两类。
一类是表现数据集中性质或集中程度的,另一类是表现数据分散性质或分散程度的。
数据的集中情况指一组数据的中心位置。
集中趋势的度量,即确定一组数据的代表值。
描述数据集中情况的统计量有多种,包括算术平均数、中数、几何平均数等。
由于这些统计量的作用在于度量数据的集中趋势,因此它们都称为集中量数。
本章主要介绍几种常用的集中量数。
集中量数只描述数据的集中趋势和典型情况,它还不能说明一组数据的全貌。
数据除典型情况之外,还有变异性的特点。
对于数据变异性即离中趋势进行度量的一组统计量,称作差异量数,这些差异量数有方差、标准差、全距、平均差、四分差及各种百分差等等,下一章中将对常用的差异量数进行介绍。
第一节 算术平均数一、算术平均数的概念和适用条件(一)概念算术平均数一般简称为平均数或均数(Mean )。
只有在与其他几种集中量数如几何平均数、加权平均数相区别的时候,才把它叫做算术平均数。
如果平均数是由X 变量计算的,就记为X (读作X 杠),若由Y 变量求得,则记为Y 。