心理统计学-课程讲义4
- 格式:doc
- 大小:431.50 KB
- 文档页数:24
心理统计串讲资料第一章绪论第一节心理统计的作用和内容心理统计是统计学的原理和数学方法在心理学领域中的应用(填空)第二节心理统计的内容²心理统计分描述统计和推论统计两大部份²描述统计:是把实验中所得到的数据进行概括性的整理,从中得出实验者可利用的信息。
描述统计还常用表和图将实验数据形象地表示出来。
描述统计的指标有三类:集中量数、差异量数和数据间的相关。
²推论统计:就是从样本的数量特征去推论总体的数量特征。
它包括一系列的统计程序:推论的假设、推论的方法步骤和检验推论的可靠性的各种方法等。
²描述统计和推论统计是两个相互联系的部分。
对样本数据的描述和归纳是进一步推论的基础在描述统计准确无误的基础上的推论才具有科学的价值。
第二章数据的初步整理第一节实验数据的类型²计数数据:是准确数,它是一个一个数出来的。
数据形式为计数数据的变量称为离散型变量。
²测量数据:是近似数。
测量数据是通过测量工具得到的。
数据形式为测量数据的变量,称为连续性变量。
²上限:就是一个数的最末位加上半个单位。
²下限:就是一个数的最末位减去半个单位。
第二节用表整理实验数据²常用的表格有三种:原始数据表、次数分布表、实验结果表²全距:就是数据中最大数值的上限与最小数值下限的差。
²组距:就是某一组数据上限与下限的差。
²中点:符号X’。
假设数据均匀地分布在组距之间,这一组数值的代表点叫中点。
它是这一组数值的上限与下限中间一点的数值。
公式比例:符号小写p。
部份比全部的比值就是比例。
比例是将全部数据作为一个整体。
定总量为1,部份为分量,分量总是总量的几分之几,用小数或分数表示,比例值永远小于1.第三节用图表达实验数据²图分为平面图和立体图。
²横轴称为X轴(横坐标),纵轴称为Y轴(纵坐标)。
X轴与Y轴垂直交于零点,横坐标常用于表示心理实验中的自变量(刺激变量)。
【课程讲义】第四章差异量数【教学目标】明确差异量数是描述数据离中趋势的一种量数,它与集中量数一起描述数据的全貌;明确标准差是所有差异量数中代表性最好的;掌握各种差异量数的概念、性质、计算方法、适用条件。
【学习方法】了解、理解、计算与应用。
【重点难点】差异量数的概念及适用条件;各种差异量数的计算方法;标准分数及百分等级的概念、适用条件及计算方法。
【讲义内容】前一章讨论的集中量数反映的是一组数据的集中趋势,代表一组数据的一般水平。
但是客观事物总是千差万别的,一组数据中不是所有的数值都与一般水平相等,而是有的高些,有的低些,彼此参差不齐。
描述一组数据波动情况的量数成为差异量数。
差异量数常用来衡量集中量数的代表性程度。
差异量数越大,则集中量数的代表性越小;差异量数越小,则集中量数的代表性越大。
差异量数分为:绝对差异量数和相对差异量数绝对差异量数:标准差,方差,四分差;相对差异量数:差异系数另外,本章还讲到相对地位量数:标准分数,百分等级。
第一节标准差一、标准差的概念及适用条件(一)概念标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数,再求算术平方根。
标准差的计算公式为:n XS2)(X-∑=(4.1)X为算术平均数,n为数据的个数。
(二)适用条件1.与算术平均数配合使用,与算术平均数的适用条件相同。
即一组数据的一般水平适合用算术平均数描述时,其离散程度宜用标准差描述;2.计算其他统计量时,如差异系数,标准分数,相关系数等,需要用到标准差;3.在推论统计中,尤其是进行方差分析时,常用方差表示数据的离散程度。
二.标准差的计算方法(一)未分组资料标准差的计算方法1.基本公式法用标准差的定义n XS2)(X-∑=,计算标准差。
例1 某校四年级举行数学竞赛,一班、二班分别派九名选手参加,成绩如下表。
试比较两个班的成绩。
4-1 四年级一班九名学生竞赛成绩统计表4-2 四年级二班九名学生竞赛成绩统计表解:先求年级一班的平均数和标准差。
第四章重点知识本章核心概念:1、差异量数分为:绝对差异量数和相对差异量数2、绝对差异量数:标准差:标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数,再求算术平方根。
方差:标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数四分差:四分差通常用符号Q来表示,指在一个次数分配中,中间50%的次数的全距之半,也就是上四分点与下四分点之差的一半。
3、相对差异量数:差异系数:差异系数,又称变异系数、相对标准差等,使一组数据标准差与平均数的比率。
通常用符号CV表示。
4、另外,本章还讲到相对地位量数:标准分数,百分等级。
标准分数:它是一个数与平均数之差除以标准差所得的商数,它无实际单位。
百分等级:指任意分数在整个分数分布中所处的百分位置。
本章重点难点:差异量数的概念及适用条件;各种差异量数的计算方法;标准分数及百分等级的概念、适用条件及计算方法。
知识要点详情:一、标准差1、概念及计算公式方差的平方根,用s或SD表示,若用σ表示,是指总体的标准差。
方差与标准差是最常用的描述次数分布离散程度的差异量数。
2、标准差的适用条件(1)与算术平均数配合使用,与算术平均数的适用条件相同。
即一组数据的一般水平适合(2)用算术平均数描述时,其离散程度宜用标准差描述;(3)计算其他统计量时,如差异系数,标准分数,相关系数等,需要用到标准差;(4)在推论统计中,尤其是进行方差分析时,常用方差表示数据的离散程度。
3、标准差的计算方法(1)基本公式法(2)原始数据法(3)分组资料标准差的计算方法(4)由各部分的标准差合成总标准差的计算方法4、方差和标准差的意义方差与标准差是表示一组数据离散程度的最好的指标。
其值越大,说明离散程度大,其值小说明数据比较集中,它是统计描述与统计分析中最常应用的差异量数。
它基本具备一个良好的差异量数应具备的条件:①反应灵敏;②有一定的计算公式严密确定;③容易计算;④适合代数运算;⑤受抽样变动的影响小;⑥简单明了。
心理统计学目录一、描述统计 (3)(一)、统计图表 (3)1.统计图 (3)2.统计表 (3)(二)、集中量数 (3)1.算术平均数 (3)2.中数 (3)3.众数 (4)(三)、差异量数 (4)1.离差与平均差 (4)2.方差与标准差 (4)(四)、相对量数 (5)1.百分位数 (5)2.百分等级 (5)3.标准分数 (6)(五)、分布性状-偏态和峰度 (6)(六)、相关量数 (6)1.积差相关 (6)2.斯皮尔曼等级相关 (7)3.肯德尔等级相关 (8)4.点二列相关 (9)5.二列相关 (9)6.Φ相关 (10)7.相关系数差异的显著性检验 (10)8.数据类型与相关系数类型 (10)二、推断统计 (11)(一)、推断统计的数学基础 (11)1.概率 (11)2.概率分布 (11)3. 样本平均数分布 (14)4. 抽样原理与抽样方法 (14)(二)、参数估计 (14)1.点估计、区间估计与标准误 (14)2.总体平均数的估计 (14)3.标准差与方差的估计 (15)(三)、假设检验 (15)1.假设检验的原理 (15)2.样本与总体平均数差异的检验 (15)3.两样本平均数差异的检验 (16)4.方差齐性的检验 (17)5.卡方检验 (18)6.非参数检验 (20)(四)、方差分析 (21)1.方差分析的原理与基本过程 (21)2.完全随机设计(独立组设计)的方差分析 (22)3.随机区组设计(重复测量设计)的方差分析 (22)4.协方差分析 (24)5.多因素方差分析 (24)6.事后检验 (24)(五) 、统计功效与效果量 (25)(六)、一元线性回归分析 (26)1.一元线性回归方程的建立、检验及应用 (26)2.可化为一元线性回归的曲线方程 (27)(七)、多元统计分析初步 (28)1. 多元线性回归分析 (28)2. 主成分分析 (28)3. 因素分析 (29)一、描述统计(一)、统计图表1.统计图条形图、帕累托图(曲线函数二阶导数正负转折点位于前半段为正偏态,位于后半段则为负偏态)、饼图、环形图、直方图、箱线图、垂线图(将同一样本或类别的多个取值的散点用一条垂线连接起来,用垂线的长度和垂线上的各个点来反映某个样本或类别取值的差异及其分布状况)、误差图(以均值为中心,加减一定倍数的标准差绘制而成,展示多个样本或分类的不同取值的分布状况和离散状况)、散点图、雷达图(可先对数据进行标准化处理)、轮廓图(折线图)。
《心理统计学》理论教学大纲(供四年制本科应用心理学使用)Ⅰ前言《心理统计学》是应用心理学专业学生一门重要的专业课程,它是专门为处理实验、调查数据而开设的。
是研究数据分布、抽样、描述统计、及进行统计推断的学科。
主要是通过集中量数、离散量数指标来描述数据特征,并通过假设检验和特定的数学模型来进行统计推断,以得出基于概率的统计结论。
掌握了该门课程的理论和方法,可为实验心理学、心理学研究方法等课程打下良好的基础,同时有助于深入理解普通心理学、心理学史、变态心理学等课程的知识及理论,最后还可以作为毕业论文写作的利器来完成科学性较好的论文。
本大纲适用于四年制本科应用心理学专业学生。
现将大纲使用中有关问题说明如下:一为了使教师和学生更好地掌握教材,大纲每一章节均由教学目的、教学要求和教学内容三部分组成。
教学目的注明教学目标,教学要求分掌握、熟悉和了解三个级别,教学内容与教学要求级别相对应,并统一标示(核心内容即知识点以下划实线,重点内容以下划虚线,一般内容不标示)便于学生重点学习。
二教师在保证大纲核心内容的前提下,可根据不同教学手段,讲授重点内容和介绍一般内容,有的内容可留给学生自学。
三总教学参考学时为78学时, 其中理论54学时,实验24学时;理论与实验学时之比2.25:1。
四教材:《心理统计学》,姚应水,人民卫生出版社,第2版,2013年8月。
II 正文第一章绪论一、教学目的使学生了解学习心理统计学的作用和意义,掌握心理统计学的基本概念、心理统计资料的类型,熟悉心理统计工作的基本步骤,以对心理统计学有初步的认识。
二、教学要求(一)掌握心理统计学的基本概念、心理统计资料的类型。
(二)熟悉心理统计工作的基本步骤。
(三)了解心理统计学的作用和意义。
三、教学内容(一)心理统计学的作用和意义:统计学与心理统计学的概念、心理统计学的主要作用、学习心理统计学的意义。
(二)心理统计学的基本概念:变量和变量值、同质和变异、总体与样本、参数和统计量、误差、概率。
心理统计学(全套课件)第一部分:心理统计学导论一、引言心理统计学是心理学研究中的重要工具,它帮助我们从大量数据中提取有意义的信息,以便更好地理解人类行为和心理过程。
本课程将介绍心理统计学的基本概念、原理和方法,以及如何运用这些工具来分析心理学数据。
二、心理统计学的基本概念1. 变量:在心理学研究中,变量是指可以被测量的特征或属性。
变量可以分为连续变量和离散变量,以及自变量和因变量。
2. 数据:数据是变量的具体值,可以是数值型数据或非数值型数据。
3. 样本与总体:样本是从总体中抽取的一部分个体,而总体是所有可能个体的集合。
4. 随机抽样:随机抽样是从总体中随机抽取样本的过程,以确保样本能够代表总体。
三、描述性统计1. 频数分布:频数分布是描述数据分布情况的一种方法,它显示了每个数值或数值区间出现的次数。
2. 集中趋势:集中趋势是指数据分布的中心位置,常用的指标有均值、中位数和众数。
3. 离散程度:离散程度是指数据分布的分散程度,常用的指标有方差、标准差和变异系数。
四、推断性统计1. 概率与概率分布:概率是描述事件发生可能性大小的数值,概率分布是描述随机变量取值的概率分布情况。
2. 假设检验:假设检验是通过对样本数据进行统计分析,来判断总体参数是否符合某种假设的方法。
3. 参数估计:参数估计是通过对样本数据进行统计分析,来估计总体参数的方法。
五、心理统计学软件1. SPSS:SPSS是一种常用的心理统计学软件,它提供了丰富的数据分析功能,包括描述性统计、推断性统计、数据管理等功能。
2. R语言:R语言是一种开源的统计编程语言,它提供了强大的数据分析功能,包括数据可视化、机器学习等功能。
心理统计学是心理学研究中的重要工具,它帮助我们从大量数据中提取有意义的信息,以便更好地理解人类行为和心理过程。
本课程将介绍心理统计学的基本概念、原理和方法,以及如何运用这些工具来分析心理学数据。
通过学习本课程,学生将能够掌握心理统计学的基本知识和技能,为今后的心理学研究打下坚实的基础。
【课程讲义】第四章差异量数【教学目标】明确差异量数是描述数据离中趋势的一种量数,它与集中量数一起描述数据的全貌;明确标准差是所有差异量数中代表性最好的;掌握各种差异量数的概念、性质、计算方法、适用条件。
【学习方法】了解、理解、计算与应用。
【重点难点】差异量数的概念及适用条件;各种差异量数的计算方法;标准分数及百分等级的概念、适用条件及计算方法。
【讲义内容】前一章讨论的集中量数反映的是一组数据的集中趋势,代表一组数据的一般水平。
但是客观事物总是千差万别的,一组数据中不是所有的数值都与一般水平相等,而是有的高些,有的低些,彼此参差不齐。
描述一组数据波动情况的量数成为差异量数。
差异量数常用来衡量集中量数的代表性程度。
差异量数越大,则集中量数的代表性越小;差异量数越小,则集中量数的代表性越大。
差异量数分为:绝对差异量数和相对差异量数绝对差异量数:标准差,方差,四分差;相对差异量数:差异系数另外,本章还讲到相对地位量数:标准分数,百分等级。
第一节标准差一、标准差的概念及适用条件(一)概念标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数,再求算术平方根。
标准差的计算公式为:n XS2)(X-∑=(4.1)X为算术平均数,n为数据的个数。
(二)适用条件1.与算术平均数配合使用,与算术平均数的适用条件相同。
即一组数据的一般水平适合用算术平均数描述时,其离散程度宜用标准差描述;2.计算其他统计量时,如差异系数,标准分数,相关系数等,需要用到标准差;3.在推论统计中,尤其是进行方差分析时,常用方差表示数据的离散程度。
二.标准差的计算方法(一)未分组资料标准差的计算方法1.基本公式法用标准差的定义n XS2)(X-∑=,计算标准差。
例1 某校四年级举行数学竞赛,一班、二班分别派九名选手参加,成绩如下表。
试比较两个班的成绩。
4-1 四年级一班九名学生竞赛成绩统计表4-2 四年级二班九名学生竞赛成绩统计表解:先求年级一班的平均数和标准差。
得X =73,从而∑(X —X )2=1786,又由于N=9,所以算得的标准差为09.1491786)(X 2==-∑=N X S 再求四年级二班的平均数和标准差。
得X =73,从而∑(X —X )2=5948,又由于N=9,所以算得的标准差为71.2595984)(X 2==-∑=N X S 以上可知,两班的平均数都为73分,说明两班的平均水平相同。
但由于一班的标准差为14.09, 一班的标准差为25.71,说明两班的差异水平很不同。
一班的差异程度较小,平均分数73分代表性就大些;二班的差异程度较大,平均分数73分代表性就小些。
2.原始数据法222)()(X NX NX NX S ∑∑-=-∑= (4.2)推导过程为:()()NX X X X NX XS i i i∑∑+-=-=22222=NX X X X i i∑∑∑+-222式中NX X i∑=且为定数=∑=22X N X 上式可继续整理:NX N X X X S i i∑∑+-=2222=NN X N X N X Xi i ii∑∑∑∑⋅+⋅⎪⎪⎭⎫ ⎝⎛-22)(2 =()()NNX NX Xiii2222∑∑∑+-=()N N X X ii∑∑-22=22⎪⎪⎭⎫ ⎝⎛-∑∑N X NXi i或()N X X N i i 22∑∑-例2 用原始计算法计算表4-1资料的标准差。
解:原始数据为:92,90,83,80,75,70,62,55,50。
用计算器可直接计算出∑X=657,∑X 2=49747,N=9代入公式(4.2),得09.14)9657(949747)(222=-=∑-∑=N X N X S(二)分组资料标准差的计算方法对于次数分布表中的数据,以组中值作为各组的代表值,计算公式为:NX X f S C 2)(-∑=(4.3)其中,C X 为各组对应的组中值,f 为每个组对应的次数,N 为总次数。
例3 某年级144名学生的语文成绩如下表,求其标准差。
解:将算得的∑2)(X X f C -=3483.16(其中X =52.8),N=144,代入公式(4.3),得92.414416.3483)(2==-∑=N X X f S C用上面的公式求标准差,需要先求出平均数,计算比较麻烦且影响结果的准确性,因此,在实际应用中,往往可以直接通过组中值,而不必计算平均数,来求标准差,对于分组数据,直接计算标准差的公式为:22)(NfX N fX S C C ∑-∑= (4.4)例4 某校初一随机抽取60名学生测验其心理健康知识,成绩如表4-4,求其标准差。
4-4 60名学生心理健康知识成绩表解:将算得的∑C fX =4185,∑f 2CX =298375及N=60代入公式(4.4),得 39.10)604185(60298375)(222=-=∑-∑=N fX N fX S C C(三)由各部分的标准差合成总标准差的计算方法已知总体中各部分的标准差,可以用下面的公式合成总的标准差:tii i t N d S N S )(22+∑= 其中,t S 为总的标准差,t N 为总体中数据的个数,i S 为各部分数据的标准差,i d 为各部分平均数与总平均数的差,即:t X X d i i -=;kkk t N N N X N X N X N X ++++++=ΛΛ212211,k t N N N N +++=Λ21,i X 为各部分数据的平均数。
例 5 某年级四个班的学生人数分别为50人,52人,48人,51人。
期末数学考试各班的平均成绩为90分,85分,88分,92分,标准差分别为6分,5.5分,7分,8.2分。
求四个班 成绩的标准差。
解:设51,48,52,504321====N N N N92,88,85,904321====X X X X 则 432144332211N N N N X N X N X N X N X t ++++++=514852509251884885529050+++⨯+⨯+⨯+⨯==893899218988489851899044332211=-=-=-=-=-=-=-=-==-=-=t X X d t X X d t X X d t X X d因此24.751485250)32.8(51])1(7[48])4(5.5[52)16(50)()()()()(2222222243212424123231222222121122=+++++-++-+++=++++++++++=+∑=N N N N d S N d S N d S N d S N N d S N S t i i i t即:全年级数学成绩的标准差为7.24分四、方差和标准差的意义方差与标准差是表示一组数据离散程度的最好的指标。
其值越大,说明离散程度大,其值小说明数据比较集中,它是统计描述与统计分析中最常应用的差异量数。
它基本具备一个良好的差异量数应具备的条件:①反应灵敏,每个数据取值的变化,方差或标准差都随之变化;②有一定的计算公式严密确定;③容易计算;④适合代数运算;⑤受抽样变动的影响小,即不同样本的标准差或方差比较稳定;⑥简单明了,这一点与其他差异量数比较稍有不足,但其意义还是较明白的。
除上述之外,方差还具有可加性特点,它是对一组数据中造成各种变异的总和的测量,能利用其可加性分解并确定出属于不同来源的变异性(如组间、组内等)并可进一步说明每种变异对总结果的影响,是以后统计推论部分常用的统计特征数。
在描述统计部分,只需要标准差就足以表明一组数据的离中趋势了。
标准差比其他各种差异量数具有数学上的优越性,特别是当已知一组数据的平均数与标准差后,便可知占一定百分比的数据落在平均数上下各两个标准差,或三个标准差之内。
对于任何一个数据集合,至少有211h-的数据落在平均数的h (大于1的实数)个标准之内(切比雪夫定理)。
例如某组数据的平均数为50,标准差是5,则至少有75%(2211-)的数据落在50±2×5=40—60之间,至少有88.9%(2311-)的数据落在50±3×5=35—65之间(h=2,211h -=2211-=43=75%,h=3,211h -=2311-=98=88.9%)。
如果数据是呈正态分布,则数据将以更大的百分数落在平均数上下两个标准差之内(95%)或三个标准差(99.7%)。
小结:标准差是描述一组数据离散趋势大小的统计指标,定义为一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数,再求算术平方根,即:n X S 2)(X -∑= 。
对于一组原始数据求标准差的方法有两种:(1)用定义计算,nX S 2)(X -∑=;(2)用原始数据直接计算:22)(NX NXS∑∑-=。
对于分组数据,可以用组中值作为每组数据的代表,用公式:NX X f S C 2)(-∑=或22)(N fX N fX S C C∑-∑=计算标准差;如果已知各部分的观测个数,均值和标准差,总的标准差可以通过公式:ti i i t N d S N S )(22+∑=计算得到。
第二节 四分差一、四分差的概念及适用条件(一)概念四分差通常用符号Q 来表示,指在一个次数分配中,中间50%的次数的全距之半,也就是上四分点与下四分点之差的一半。
即:213Q Q Q -=(4.6) 其中,Q 1为四分之一的分位点,即该分数以下的数据个数占总数据个数的四分之一,Q 3为四分之三的分位点,即该分数以下的数据个数占总数据个数的四分之三。
(二)适用条件通常与中位数配合使用。
即一组数据的集中趋势适宜用中位数描述时,差异情况要用四分差描述。
1. 一组数据中有极端数据出现时;2. 一组数据的两端有个别数据模糊不清或分组资料有不确定组限时。
二、四分差的计算不管是为分组的资料还是分组资料,计算四分差的基本公式都是根据定义,即:213Q Q Q -=。
只不过计算Q 1和Q 3的方法对于不同资料稍有不同。
(一)未分组资料Q 1和Q 3的计算方法首先将一组数据从大到小排序,然后用数据个数N 除以4,则第)214(+N 位置对应的数据为第一个四分位点Q 1,第)2143(+N 位置对应的数据为第三个四分位点Q 3。
例6 求下18个数据的四分差:51,60,,58,63,74,88,66,70,71,75,81,86,52,57,61,65,90,77。
解:先将18个数据按从小到大的顺序排列:51,52,57,58,60,61,63,65,66,70,71,74,75,77,81,86,88,90。
然后确定31,Q Q 的值由于N=18,所以,1Q 应为521418=+,即第5个位置所对应的数据60;3Q 为14214318=+⨯,即第14个位置对应的数据为77。