现代心理与教育统计学复习资料
- 格式:docx
- 大小:40.85 KB
- 文档页数:6
第一章绪论1.描述统计(descriptive statistics)主要研究如何将实验或调查得到的大量数据进行图表整理或简缩成有代表性的数字(即统计量数),使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。
2.描述统计只限于对试验样本所得观测数据的统计分析,不考察其总体的特性。
3.推论统计(inferential statistics)是以描述统计为基础,从而解决由局部到全体的推论问题,即通过对一组统计量的计算分析,推论该组数据所代表的总体特性。
4.变量(variables):一个可以取不同数值的物体属性/事件。
5.事前无法预期结果的变量——随机变量6.观测值(原始取值):事后测定的某一结果。
7.概念理解:[涉及“实验”] 自变量(及其各水平)& 因变量(及相应的反应指标);[涉及“调查”,粗略对应于] 属性变量& 反应变量8.计数资料(count data):计算个数的数据,(如人口数,学校数,男女数等)9.计量资料(measurement data):借助于一定的测量工具或一定的测量标准而获得的数据(如分数,身高,体重,IQ)10.称名数据(nominal data):只区分属性或类别上的不同,只可计数,不能排序(性别,学科,职业)11.等级/顺序数据(ordinal data):可排序,但无相等单位,不能加减。
(等级评定,受教育程度,职称)12.等距数据(interval data):具有相等单位,无绝对零的数据,能加减不能乘除。
13.比率数据(ratio data):既表明量的大小,又具有相等单位,可以加减乘除,具有绝对零点。
14.称名数据和顺序数据合称为离散数据。
15.等距数据和比率数据合称为连续数据。
16.离散数据(discrete data)又称为不连续数据,这类数据在任何两个数据点之间所取的数据的个数是有限的。
17.连续数据(continuous data)指任意两个数据点之间都可以细分出无限多个大小不同的数值。
第1 章绪论1.1 复习笔记本章重点✓心理与教育统计的研究内容✓选择使用统计方法的基本步骤✓统计数据的基本类型✓心理与教育统计的基本概念一、统计方法在心理和教育科学研究中的作用(一)心理与教育统计的定义与性质1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。
前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。
心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。
类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
(二)心理与教育科学研究数据的特点1.心理与教育科学研究数据与结果多用数字形式呈现。
2.心理与教育科学研究数据具有随机性和变异性。
3.心理与教育科学研究数据具有规律性。
4.心理与教育科学研究的目标是通过部分数据来推测总体特征。
(三)学习心理与教育统计应注意的事项1.学习心理与教育统计学要注意的几个问题:(1)学习心理与教育统计学时,必须要克服畏难情绪。
心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。
(2)在学习时要注意重点掌握各种统计方法使用的条件。
(3)要做一定的练习。
2.应用心理与教育统计方法时要做到:(1)克服“统计无用”与“统计万能”的思想,注意科研道德。
(2)正确选用统计方法,防止误用和乱用统计。
二、心理与教育统计学的内容心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别:(一)分类一依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。
现代心理与教育统计学复习资料赵晨鹰老师覃瑞整理(21267529)徐建平和张厚粲主编第三版第一章绪论课程简介:先行课程为数学、普通心理学,后续课程为实验心理学、心理测量学、心理学研究方法、(研究型)毕业论文等。
心理统计可分为三种类别(最常见的分类方法P8):第一部分是“描述统计”,包括数据整理、集中&离中&相关量数的计算等。
第二部分是“推论统计”,包括统计估计、假设检验等(以概率分布为基础)。
第三部分是“实验设计”,包括样本抽取、被试分组等。
描述统计 : 1统计图表 2集中量数3差异量数 4相关关系概率分布(推论统计的基础)推论统计 :1参数估计 2假设检验 3方差分析(涉及部分“实验设计”) 4 χ2检验 5非参数检验线性回归(进而建立“数学模型”)多变量统计分析简介实验设计 :抽样原理及方法心理统计学(Psychological Statistics)是研究在心理实验或调查中如何收集、整理、分析数字资料,以及如何根据这些资料所传递的信息作出科学推论的应用统计学分支。
随机性数据资料~随机现象P3 (vs. 确定现象)①试验之前已知存在多种可能结果,但不能预料哪种结果会出现;②在相同条件下可以重复该试验。
理论统计学 vs. 应用统计学心理科学研究数据的特点 P2 1、分散性:数据结果均以一个个分散的数字形式呈现。
2、变异性/随机性:观测数据总在一定范围内随机波动变化。
3、规律性:通过重复观测可发现其变化具有一定的特征与规律。
心理科学研究的目标就是在分析部分数据的基础上来推测其相应总体的特征。
一、描述统计(descriptive statistics) P8描述统计主要研究如何将实验或调查得到的大量数据进行图表整理或简缩成有代表性的数字(即统计量数),使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。
据分组、图表制作。
②统计量/特征值P21的计算。
第一章绪论1.描述统计(descriptive statistics)主要研究如何将实验或调查得到的大量数据进行图表整理或简缩成有代表性的数字(即统计量数),使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。
2.描述统计只限于对试验样本所得观测数据的统计分析,不考察其总体的特性。
3.推论统计(inferential statistics)是以描述统计为基础,从而解决由局部到全体的推论问题,即通过对一组统计量的计算分析,推论该组数据所代表的总体特性。
4.变量(variables):一个可以取不同数值的物体属性/事件。
5.事前无法预期结果的变量——随机变量6.观测值(原始取值):事后测定的某一结果。
7.概念理解:[涉及“实验”] 自变量(及其各水平)& 因变量(及相应的反应指标);[涉及“调查”,粗略对应于] 属性变量& 反应变量8.计数资料(count data):计算个数的数据,(如人口数,学校数,男女数等)9.计量资料(measurement data):借助于一定的测量工具或一定的测量标准而获得的数据(如分数,身高,体重,IQ)10.称名数据(nominal data):只区分属性或类别上的不同,只可计数,不能排序(性别,学科,职业)11.等级/顺序数据(ordinal data):可排序,但无相等单位,不能加减。
(等级评定,受教育程度,职称)12.等距数据(interval data):具有相等单位,无绝对零的数据,能加减不能乘除。
13.比率数据(ratio data):既表明量的大小,又具有相等单位,可以加减乘除,具有绝对零点。
14.称名数据和顺序数据合称为离散数据。
15.等距数据和比率数据合称为连续数据。
16.离散数据(discrete data)又称为不连续数据,这类数据在任何两个数据点之间所取的数据的个数是有限的。
17.连续数据(continuous data)指任意两个数据点之间都可以细分出无限多个大小不同的数值。
目 录第一部分 考研真题精选一、单项选择题二、多项选择题三、简答题四、综合题第二部分 章节题库第1章 绪 论第2章 统计图表第3章 集中量数第4章 差异量数第5章 相关关系第6章 概率分布第7章 参数估计第8章 假设检验第9章 方差分析第10章 χ2检验第11章 非参数检验第12章 线性回归第13章 多变量统计分析简介第14章 抽样原理及方法第一部分 考研真题精选一、单项选择题1已知某小学一年级学生的体重平均数21kg,标准差3.2kg,身高平均数120cm,标准差6.0cm,则下列关于体重和身高离散程度的说法正确的是( )。
[统考2019研]A.体重离散程度更大B.身高离散程度更大C.两者离散程度一样D.两者无法比较【答案】A【解析】计算体重和身高的变异系数,CV体重=(3.2/21)×100%=15.2%,CV身高=(6/120)×100%=5%。
由此可知体重离散程度更大。
2已知某正态总体的标准差为16,现从中随机抽取一个n=100的样本,样本标准差为16,则样本平均数分布的标准误为( )。
[统考2019研]A.0.16B.1.6C.4D.25【答案】B【解析】总体正态,且方差已知,则样本平均数的分布为正态分布,标准误SE=σ/sqr(n)=16/10=1.6。
3如果学生参加压力量表测试的分数服从正态分布,平均数为5,标准差为2,那么分数处在5和9之间的学生百分比约为( )。
[统考2019研]A.34%B.48%C.50%D.68%【答案】B【解析】计算原始分数为5的标准分数Z1=0,原始分数为9的标准分数Z2=2,已知±1.96包含95%的个体,则可估计p(0<Z<2)=0.48。
4对样本平均数进行双尾假设检验,在α=0.10水平上拒绝了虚无假设。
如果用相同数据计算总体均值的置信区间,下列描述正确的是( )。
[统考2019研]A.置信区间不能覆盖总体均值B.置信区间覆盖总体均值为10%C.置信区间覆盖总体均值为90%D.置信区间覆盖总体均值为0.9%【答案】C【解析】置信度即置信区间覆盖总体均值的概率,题干说明置信度为1-α=0.90。
心理统计学第一章概述描述统计定义:研究如何把心理与教育科学实验或调查得来的大量数据科学的科学的加以整理概括和表述作用:使杂乱无章的数字更好的显示出事物的某些特征,有助于说明问题的实质。
具体内容:1数据分组:采用图与表的形式。
2计算数据的特征值:集中量数(平均数中数)离散量数(方差)3计算量事物间的相关关系:积差相关(2列3列多列)推断统计定义:主要研究如何利用局部数据(样本数据)所提供的信息,依据数理统计提供的理论和方法,推论总体情形。
作用:用样本推论总体。
具体内容:1如何对假设进行检验。
2如何对总体参数特征值进行估计。
3各种非参数的统计方法。
心理与教育统计基础概念数据类型一从数据来源来划分1计数数据:计算个数或次数而获得的数据。
(都是离散数据)2测量数据:借助一定测量工具或测量标准而获得的数据。
(连续数据)二根据数据所反映的测量水平1称名数据(分类)定义:指用数字代表事物或数字对事物进行分类的数据。
特点:数字只是事物的符号,而没有任何数量意义。
统计方法:百分数次数众数列联相关卡方检验等。
(非参检验)2顺序数据(分类排序)定义:指代事物类别,能够表明不同食物的大小等级或事物具有的某种特征的程度的数据。
(年级)特点:没有相等单位没有绝对零点。
不表示事物特征的真正数量。
统计方法:中位数百分位数等级相关肯德尔和谐系数以及常规的非参数检验方法。
3等距数据(分类排序加减(相等单位))(真正应用最广泛的数据)定义:不仅能够指代物体的类别等级,而且具有相等的单位的数据。
(成绩温度)特点:真正的数量,能进行加减运算,没有绝对零点,不能进行乘除计算。
统计方法:平均数标准差积差相关Z检验t检验F检验等。
4比率数据(分类排序加减法乘除法(绝对零点))定义:表明量的大小,也具有相等单位,同时具有绝对零点。
(身高反应时)特点:真正的数字,有绝对零点,可以进行加减乘除运算。
在统计中处理的数据大多是顺序数据和等距数据。
三按照数据是否具有连续性离散数据连续数据变量观测值随机变量变量:指心理与教育实验观察调查种想要获得的数据。
2021级《现代教育与心理统计学》期末考试复习要点一、题型(一)多项选择题(每题2分,共30分)(II)填空题(每题1分,共10分)(III)名词释义(每题3分,共12分)(IV)简短回答题(每题6分,共24分)(五)计算题(第1题6分,第2题8分,第3题10分,共24分)第一章为绪论第二节:心理与教育统计的内容(描述统计、推论统计、实验设计的定义及地位)第四节:心理学和教育统计学的基本概念(随机变量、样本、参数和统计学的数据类型、概念和特征)第二章统计图表第二节频率分布表(计算分组距离和分组中值,编制分组频率分布表的步骤)第三节频率分布图(直方图、条形图、圆形图、散点图、适用数据)第三章集中量数第一节:算术平均值(计算、性质、平均值的优缺点以及计算和应用原则)第二节:中值和模式(计算、优缺点和两者的应用)第三节:其他集中量数(总平均数的计算)--平均数、众数、中数的关系第四章差异数量第二节:平均差、方差与标准差(计算公式、使用条件、方差和标准差的意义)第三节:标准差的应用(差异系数、标准分数的计算公式及具体应用)第四节差异量的选择(比较各种差异量的优缺点,如何选择差异量)第五章差异量数第一节:相关性和散点图(相关系数的定义、取值范围、类型和散点图)第二节:产品差异相关性(适用数据和计算公式)第三节:斯皮尔曼等级和肯德尔等级相关(适用资料、计算公式)第四节:点二列相关和二列相关(适用资料)第六章:概率分布第一节:概率的基本概念(概率的取值范围、加法和乘法定理、分布类型)第二节:正态分布(正态分布的特征、正态分布理论在测验中的应用)第四节:抽样分布(样本平均数的分布、t分布的特点、f分布的特点)第七章参数估计第一节:点估计、区间估计与标准误(良好估计量的标准、置信区间与显著性水平的概念、区间估计与标准误的计算)第二节:总平均值的估算(估算总平均值的步骤和计算)第八章假设检验第一节假设检验的原则(无效假设和替代假设,假设检验中的两种错误,一边)检验和双侧检验、假设检验的步骤)第二节均值的显著性检验第三节平均数差异的显著性检验第1四章抽样原则和方法第一节抽样的基本原则(随机化原则)第二节几种重要的随机抽样法。
张厚粲《现代心理与教育统计学》(第3版)笔记和课后习题(含考研真题)第一部分复习笔记本章重点ü心理与教育统计的研究内容ü选择使用统计方法的基本步骤ü统计数据的基本类型ü心理与教育统计的基本概念一、统计方法在心理和教育科学研究中的作用(一)心理与教育统计的定义与性质1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(applied statistics)两部分。
前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。
心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。
类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
(二)心理与教育科学研究数据的特点1.心理与教育科学研究数据与结果多用数字形式呈现2.心理与教育科学研究数据具有随机性和变异性3.心理与教育科学研究数据具有规律性4.心理与教育科学研究的目标是通过部分数据来推测总体特征(三)学习心理与教育统计应注意的事项1.学习心理与教育统计学要注意的几个问题(1)学习心理与教育统计学时,必须要克服畏难情绪。
心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。
(2)在学习时要注意重点掌握各种统计方法使用的条件。
(3)要做一定的练习。
2.应用心理与教育统计方法时要做到:(1)克服“统计无用”与“统计万能”的思想,注意科研道德。
(2)正确选用统计方法,防止误用和乱用统计。
概念(1)随机变量:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。
(2)总体:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。
(3)样本:样本是从总体中抽取的一部分个体。
(4)个体:构成总体的每个基本单元。
(5)次数:是指某一事件在某一类别中出现的数目,又称作频数,用f表示。
(6)频率:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。
(7)概率:概率论术语,指随机事件发生的可能性大小度量指标。
其描述性定义。
随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。
(8)统计量:样本的特征值叫做统计量,又称作特征值。
(9)参数:又称总体参数,是描述一个总体情况的统计指标。
(10)观测值:随机变量的取值,一个随机变量可以有多个观测值。
2何谓心理与教育统计学?学习它有何意义?答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。
具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
(2)学习心理与教育统计学有重要的意义。
①统计学为科学研究提供了一种科学方法。
科学是一种知识体系。
它的研究对象存在于现实世界各个领域的客观事实之中。
它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。
要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。
统计学正是提供了这样一种科学方法。
统计方法是从事科学研究的一种必不可少的工具。
②心理与教育统计学是心理与教育科研定量分析的重要工具。
凡是客观存在事物,都有数量的表现。
现代心理与教育统计学复习资料第一章心理与教育统计学基础知识1、数据类型称名数据计数数据离散型数据顺序数据等距数据测量数据连续型数据比率数据2、变量、随机变量、观测值变量就是可以挑相同值的量。
统计数据观测的指标都就是具备变异的指标。
当我们用一个量则表示这个指标的观测结果时,这个指标就是一个变量。
用来表示随机现象的变量,称为随机变量。
一般用大写的x或y表示随机变量。
随机变量所取得的值,称为观测值。
一个随机变量可以有许多个观测值。
3、总体、个体和样本须要研究的同质对象的全体,称作总体。
每一个具体内容研究对象,称作一个个体。
从总体中抽出的用以推测总体的部分对象的集合称为样本。
样本中包含的个体数,称为样本的容量n。
通常把容量n≥30的样本称作大样本;而n<30的样本称作大样本。
4、统计数据量和参数统计数据指标平均数标准差相关系数回归系数统计数据量srb参数μσρβ5、统计误差误差就是测量得值与真值之间的差值。
测出数值=真值+误差统计误差归纳起来可分为两类:测量误差与抽样误差。
由于采用的仪器、测量方法、读数方法等问题导致的测出值与真值之间的误差,称作测量误差。
由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差第二章统计图表一、数据的整理在展开整理时,如果没充裕的理由证明某数据就是由实验中的过错导致的,就无法轻而易举将其确定。
对于个别极端数据与否该剔出,应当遵从三个标准差法则。
二、次数原产表中(一)简单次(频)数分布表(二)相对次数分布表将次数原产表各组的实际次数转变为相对次数,即为用频数比率(f/n)或百分比f)去则表示次数,就可以做成相对次数原产表中(?100%n(三)累加次数分布表(四)双列次数分布表双列次数原产表中又称有关次数原产表中,就是对存有联系的两列变量用同一个表中则表示其次数原产。
所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。
三、次数分布图并使一组数据特征更加直观和归纳,而且还可以对数据的原产情况和变动趋势并作粗略的分析。
简单次(频)数分布图――直方图、次数多边形图累加次数分布图――累加直方图、累加曲线(一)简单次数分布图--直方图(二)简单次数分布图-次数多边图次数原产多边形图(frequencypolygon)就是一种则表示连续性随机变量次数原产的线形图,属次数分布图。
凡是等距分组的可以用直方图则表示的数据,都需用次数多边图去则表示。
绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。
(三)递增次数分布图―递增直方图(四)递增次数分布图――递增曲线四、其他统计图表条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。
圆形图:就是用作则表示间断型资料比例的图形。
圆形的面积则表示一组数据的整体,圆中扇形的面积则表示各组成部分所占到的比例。
各部分的比例通常用百分比则表示。
线形图用来表示连续型资料。
它能表示两个变量之间的函数关系;一种事物随另一种事物变化的情况;某种事物随时间推移的发展趋势等。
基于线形图,既可对有关统计变量进行数量比较,又可分析发展的趋势。
图表就是用相同小小圆点的多少或梳密则表示统计资料量大小以及变化趋势的图。
第三章集中量数集中量数用以整体表现数据资料的典型水平或分散趋势(centraltendency)。
常用的分散量包含算术平均数、加权平均数、中位数和众数等等。
一、算术平均数算术平均数(arithmeticaverage)一般简称为平均数(average)或均数、均值(mean)。
一般用m,或者用x表示。
算术平均数是最常用的集中量(一)算术平均数的计算公式1x1?x2xn1nx??xx???xinnni?1(二)算术平均数的意义算术平均数就是应用领域最广泛的一种分散量。
它就是“真值”(truescore)的最佳估计值。
真值就是充分反映某种现象的真实水平的分数。
由于测量过程中的各种偶然因素的影响,真值往往很难获得。
在实际测量中,往往采用“多次测量,取平均数”的方法,用平均数去估计真值。
(三)算术平均数的优缺点优点:反应灵敏、存有公式严格确认、通俗易懂易懂、适宜代数运算缺点:容易受两极端数值的影响;一组数据中有模糊不清的数值时无法计算。
(四)计算和应用算术平均数的原则同质性原则:算术平均数就可以用作则表示同类数据的分散趋势。
平均数与个体数值相结合的原则:在解释个体特征时,既要看平均数,也要结合个体的数据。
平均数与标准差、方差结合原则:叙述一组数据时既要分析其分散趋势,也必须分析线性程度。
二、中位数中位数(median)又称为中数,是按顺序排列的一组数据中位于中间位置的数。
中位数是常用集中量的一种。
一般用md或mdn表示(一)中位数的计算方法1、原始数据计算法一组数据中并无重复数值的情况首先将一组数据按顺序排列xn?xn1n122若n为奇数,则md为第个数;若n为偶数,则md?222、次数原产表中计算法nimdlbfb2fmd公式中:lb为中位数所在组的准确上限fb为中位数所在组下限以下的累积频数n为数据总和fmd为中位数所在组的频数i为组距(二)中位数的特点及应用中位数就是根据全部数据的个数去确认其边线的,意义通俗易懂,对按顺序排列的数据来说,排序中位数也比较难。
中位数不受到两端极端数据的影响,但反应不灵敏,也不适宜进一步代数运算的建议。
通常用作以下情况:1、一组数据中有极端数据时;2、一组数据中存有个别数据不清楚、不确切时;3、资料属等级性质时。
三.众数众数(mode)用mo表示,有两种定义:理论众数就是所指与频数原产曲线最高点相对应当的横坐标上的一点;粗略众数就是一组数据中发生次数最少的那个数。
众数也是一种集中量,也可用来表示一组数据的集中趋势。
众数的计算方法(观察法寻找粗略众数)未分组数据中出现次数最多的数即为众数。
次数原产表,频数最多那一组数据的组中值,即为为众数。
四、算术平均数、中位数、众数三者的关系在正态分布中:x?md?mo在正偏态分布中:x?md?mo在负偏态分布中:x?md?mo五、其它集中量数(一)加权平均数加权平均数就是相同比重数据(或平均数)的平均数,通常用则表示。
其计算公式存有两xw种:?wi?xi?ni?xxw?xw??wi?ni(二)几何平均数几何平均数(geometricmean)就是n个数值连乘积的n次方根,用mg或xg则表示。
计算公式为:mg?nx1?x2xn当数据的分布呈偏态时,可用几何平均数表示该组数据的集中趋势。
几何平均数的变式xnxnx2x3n?1n?1mgx1x2xn?1x1两边取对数,得1lgxnlgx1lgmgn1注意:几何平均数计算的是平均的变化情况,如果要计算平均增长率,需要从几何平均数中减去基数1。
几何平均数的应用领域:1.直接应用基本公式计算几何平均数存有少数极端数据,数据呈圆形偏态原产;心理物理学中的等距与等比量表实验中.(基准[3-8]p72)2.应用几何平均数的变式计算按一定比例变化的一列数据,通常用以谋平均值变化率例如平均值增长率.基准[3-9][3-10][3-11]p73(三)调和平均数n调和平均数(harmonicmean),用符号mh表示.也叫倒数平均数.公式为:mh?1?xi调和平均数的应用自学速度方面的问题.调和平均数在叙述速度方面的分散趋势时,强于其他分散量在有关研究自学速度的实验设计中,反应指标通常Aripuan两种形式;1、工作量固定,记录各被试完成相同工作所用的时间.例[3-13][3-14]p762、学习时间一定,记录一定时间内各被试完成的工作量,例[3-15]第四章差异量数描述数据离散程度的统计量称为差异量。
差异量越大,表明数据越分散、不集中;差异量越大,说明数据越分散,变动范围越大。
一组数据的离散程度,常常通过数据的离中趋势特点进行分析。
一、全距、四分位距和百分位距(一)全距r(range)全距就是一组数据中的最大值(maximum)与该组数据中最小值(minimum)之差,又称极差。
r=xmax-xmin(二)百分位高(百分位距)百分位差是指两个百分位数(percentile)之差。
常用的百分位距有两种:用几个百分位距能较好地充分反映一组数据的差异程度。
对于任何一组观察值,只要任意指定一个位置,就可以求出这个位置的数应该是多少;----百分位数恰好相反,如果得出一个数,也可以算出它必须在哪个边线.---百分等级百分位数--频数原产中相对于某个特定百分点的完整分数,它说明在原产中高于该分数的个案占到总频数的百分比。
百分等级分数--频数分布中低于特定原始分数的频数百分比。
(三)四分位距q?q1四分位距就是第一个四分位数与第三个四分位数之高的一半,计算公式为q?32(四)平均差平均差(averagedeviation或者meandeviation)是指一组数据中,每一个数据与该组数据的平均数离差的绝对值的算术平均数,通常用ad或md表示。
原始数据计算公式?x?xad?n(五)方差和标准差方差(又称作变异数、均方)。
就是则表示一组数据线性程度的统计数据指标。
通常样本的方差用s2则表示,总体的方差用?2则表示。
标准差(standarddeviation)是方差的算术平方根。
一般样本的标准差用s表示,则表示。
总体的标准差用标准差和方差是描述数据离散程度的最常用的差异量。
1、样本方差及标准差定义公式22?x?x??x?x?2s?s?nn2、总体方差及标准差的定义公式22x??2xnn2?x?xs?就是总体σ的无偏估算n?1。