心理统计复习笔记
- 格式:doc
- 大小:45.00 KB
- 文档页数:5
心理统计知识点完整版整理1、描述统计:主要研究如何让整理心理与教育科学实验或调查得来的大量数据。
描述一组数据的全貌,表达一件事物的性质。
2、推论统计:主要研究如何通过局部数据提供的信息,推论总体的情形。
3、根据数据反映的测量水平,将数据分类:称名数据、顺序数据、等距数据、比率数据(书P16概念、举例)是否具有连续性离散数据、连续性数据。
4、连续数据:任意两个数据点之间都可以细分出无限个大小不同的数值。
5、统计量:样本的那些特征值,代表样本的特性。
6、参数:描述一个总体情况的统计指标,代表总体特性是一个常数。
7、组限:分组区间即一个组的起点值和终点值之间的距离;组下限:起点值;组下限:终点值。
组限分类:表述组限,精确组限8、散点图:用相同大小圆点的多少或疏密表示统计资料数量大小以及变化趋势的图。
9、算数平均数的使用原则:同质性原则,平均数与个体数值相结合的原则,平均数与标准差、方差相结合的原则。
10、中数:按顺序排列在一起的一组数据中居于中间位置的数。
11、众数:指在次数分布中出现次数最多的那个数的数值。
12、皮尔逊平均数、中数和众数三者间的关系:Mo=3Md-2M0(M平均数Md中数Mo众数)13、平均差:次数分布中所有原始数据平均数绝对离差的平均值。
14、方差、标准差公式:15、标准差:方差的平方根…..16、差异系数的使用情况:1、标准差的单位不同;2、虽然标注差的单位相同,但两样本的水平不同。
17、标准分数:又称基分数或Z分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。
优点:标准分数从分数对平均数的相对低位。
该分组的离中趋势两个方面来表示原始分数的地位。
18、事物之间的相互关系:因果关系,共变关系,相关关系19、积差相关的公式:20、肯德尔W系数:适用于两列以上的等级变量;使用情况:A、原始数据资料的获得一半采用等级评定法,让K个被试对N件事物或N种作品进行等级评定,每个评价者都能对N件事物(或作品)的好坏、优劣、喜好、大小、高低登排出一个等级顺序。
概念之迟辟智美创作(1)随机变量:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量.(2)总体:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体.(3)样本:样本是从总体中抽取的一部份个体.(4)个体:构成总体的每个基本单位.(5)次数:是指某一事件在某一类别中呈现的数目,又称作频数,用f暗示.(6)频率:又称相对次数,即某一事件发生的次数除以总的事件数目,通经常使用比例或百分数来暗示.(7)概率:概率论术语,指随机事件发生的可能性年夜小怀抱指标.其描述性定义.随机事件A在所有试验中发生的可能性年夜小的量值,称为事件A的概率,记为P(A).(8)统计量:样本的特征值叫做统计量,又称作特征值.(9)参数:又称总体参数,是描述一个总体情况的统计指标.(10)观测值:随机变量的取值,一个随机变量可以有多个观测值.2何谓心理与教育统计学?学习它有何意义?答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科.具体讲,就是在心理与教育研究中,通过调查、实验、丈量等手段有意地获取一些数据,并将获得的数据按统计学原理和步伐加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法.(2)学习心理与教育统计学有重要的意义.①统计学为科学研究提供了一种科学方法.科学是一种知识体系.它的研究对象存在于现实世界各个领域的客观事实之中.它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系.要提高对客观事实观测及分析研究的能力,就必需运用科学的方法.统计学正是提供了这样一种科学方法.统计方法是从事科学研究的一种必不成少的工具.②心理与教育统计学是心理与教育科研定量分析的重要工具.凡是客观存在事物,都有数量的暗示.凡是有数量暗示的事物,都可以进行丈量.心理与教育现象是一种客观存在的事物,它也有数量的暗示.虽然心理与教育测量具有多变性而且旨起它发生变动的因素很多,难以准确丈量.可是它究竟还是可以丈量的.因此,在进行心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的.心理与教育统计就是对心理与教育问题进行定量分析的重要的科学工具.③广年夜心理与教育工作者学习心理与教育统计学的具体意义.a.可经顺利阅读国内外先进的研究功效.b.可以提高心理与教育工作的科学性和效率.c.为学习心理与教育丈量和评价打下基础.?答:一项实验研究结果要用何种统计方法去分析,需要对实验数据进行认真的分析.只有做到对数据分析正确,才华对统计方法做出正确地选用.选用统计方法可以分为以下步伐:(1)首先,要分析一下实验数据是否合理,即所或得的数据是否适合用统计方法去处置,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边缘的数据加以统计处置是毫无意义的.(2)其次,要分析实验数据的类型.分歧数据类型所使用的统计方法有很年夜差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要.(3)第三,要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件.4.什么叫随机变量?心理与教育科学实验所获得的数据是否属于随机变量?答:(1)在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量.(2)心理与教育科学实验所获得的数据属于随机变量.心理与教育科学研究数据具有随机性和变异性.科学研究中因观测人员、观测工具、观测条件的变动而具有随机变动的现象.在心理和教育科学领域,研究获得的数据资料也具有一定随机性质.观测数据的这种特点,称为变异性.即便使用同一种丈量工具,观测同一事物,只要是进行多次,那么获得的数据就不会完全相同.随着丈量工具的完善和精确,数据的这种随机性变动就更明显.例如,人们对同一年级或同一年龄儿童甚至对同一个人进行同一学科的学业测试,或对同一个心理特点进行评量、观察屡次,获得的数据绝不会全然相同,这些数据总是在一定的范围内变动.造成数据变异的原因,出自观测过程中一些偶然的不成控制的因素,称随机因素.随机因素使丈量发生的误差称作随机误差.由于这种随机误差的存在,使得在相同条件下观测的结果常常不止一个,而且事前无法确定,这是客观世界存在的一种普遍现象,人们称这类现象为随机现象.在教育和心理科学的各类研究中,研究的对象是人的内在的种种心理现象,不单由客观上一些偶然因素会引起丈量误差,由实验者和被试主观上一些不成控制的偶然因素也会造成丈量误差,这些偶然因素+分复杂,因而造成的随机误差就更年夜,也就是使心理与教育科学研究中获得的数据具有更明显的变异性.5.怎样理解总体、样本与个体.答:根据其各自的界说,我们可以用下面这个图来暗示.年夜圆暗示研究对象的全体,也就是总体;年夜圆中的小圆暗示其中一个样本,年夜圆中所有的点代表的是样本.6、统计量与参数之间有何区别和关系.答:(1)参数是描述总体情况的统计指标;样本的特征值称作统计量.(2)区别:1参数是从总体中计算获得的量数,代表总体特征,一个常数.统计量是从一个样本中计算获得的量数,它描述一组数据的情况,是一个变量,随样本的变动而变动.2参数经常使用希腊字母暗示,样本统计量用英文字母暗示.(3)联系:1参数通常是通过样本特征值来预测获得,(7、谜底略)8、下述一些数据,哪些是丈量数据?哪些是计数数据?其数值意味什么?(1)17. 0千克(2 ) 89. 85厘米(3) 199. 2秒(4) 17人(5) 25本(6 ) 93. 5答:上面的数据中丈量数据有:(1) 17.0千克(2 ) 89. 85厘米(3 ) 199. 2秒(6)93. 5分计数数据有:(4) 17人(5) 25本(2) 17. 0千克、89. 85厘米、199. 2秒、93. 5分,这些数据是借助一定的重量、长度、时间或一定的丈量标准而获得数据,分别代表事物的重量、长度、时间或者分数.9符号代表的意义(课本20页)(1)总体平均数,期望值(2)样本平均数(3)总体之间的相关系数 (4)样本间的相关系数 (5)总体标准差(6)样本标准差(7)总体间的回归系数(8)有限个体数目的总体 (9)样本容量,样本年夜小1.统计分组应注意哪些问题?答:进行统计分组时需要注意下列问题:(1)分组要以被研究对象的实质特性为基础面对年夜量原始数据进行分组时,有时需要先做初步的分类,分类或分组一定是要选择与被研究现象的实质的关的特性为依据,才华确保分类或分组的正确.在心理与教育学研究方面,专业知识的了解和熟悉对分组的正确进行有重要的作用.例如在学业成果研究中按学科性质分类,在整理智力检验结果时,按言语智力、把持智力和总的智力分数分类等.(2)分类标识表记标帜要明确,要能包括所有的数据对数据进行分组时,所依据的特性称为分组或分类的标识表记标帜.整理数据时,分组标志要明确并在整理数据的过程中前后一致.这就是说,关于被研究现象实质特性的概念要明确,不能既是这个又是那个.另外,所依据的标识表记标帜必需能将全部数据包括进去,不能有遗漏,也不能中途改变.2、直条图或叫条形图:主要用于暗示离散型数据资料,即计数资料.详见课本45页.3、圆形图或叫饼图:主要用于描述间断性资料,目的是为显示多部份在整体中所占的比重年夜小,以及各部份之间的比力.:统计学的原理和数学的方法在心理学领域中的运用.描述统计和推理统计两年夜部份.3.实验数据可分为两类:准确数和近似值.4.确定组距以后,要考虑最小的一组从哪开始.显然,最小的一组应包括整个系列中的最小数值.5.在心理实验中经常使用的表格有三类:原始数据挂号表,经过分组整理的次数分布表,带有对实验结果总结性质的表6.暗示实验结果的图有:平面图和立体图.7.平面图一般分为:曲线图和直方图两类.8.平面图有两个坐标,横坐标代表心理实验中的安慰变量或自变量,纵坐标代表反应变量或因变量.当横坐标代表的数量是连续的,可画曲线图或直方图;当横坐标代表的数量不是连续的变量,而是分歧类别时,就只能画直方图,其纵坐标必需从0开始.上限.算术平均数.明显的集中趋势指标,但众数不如平均数和中数稳定.12.分组不适合会呈现双峰,可调整组距.真正的双峰呈现的原因是_有两种性质分歧的数据_.13.在偏斜的分布中,平均数总是处于偏斜的一端,而中数则永远把一个分布曲线下的面积分成相等的两部份.14. q2-q1<q3-q2时,分布向右偏斜;q2-q1=q3-q2时,分布向对称;q2-q1>q3-q2时,分布向_左(哪方年夜则朝哪方偏斜)偏斜.15.暗示两个变量之间相关性质和水平的图,叫散布图.如果图中所有的点形成一条直线,说明是一个完全正相关的散布图;如果是椭圆,这个椭圆越窄,说明相关水平越_高_____.16.从样本估计总体是以概率原则为基础的,如果样本中只包括随机误差就不致发生对总体偏性的估计;如果样本中还包括系统误差在内,就会发生偏性估计.17.当一个总体中的成份只分成两类时,根据传统,把_希望获得的结果,发生的概率叫P;不希望获得的结果发生的概率叫q.18.在一系列正态分布中,有一个标准的正态分布,其平均数为_0,标准差为_ 119.当实验数据有___二组____以上时,而且都是__不连续_____的变量时,要检验各组间的不同是否显著就需要用c2分布进行计算.20.统计结果检验时:1 ) w2为0. 14_时,实验效果较强,统计结果可信.2 ) w2为0. 16_时,实验效果中等,统计结果可信度一般.3 ) w2为0. 01_时,实验效果很差,统计结果不成信.21.用d值说明实验效果时:1) d是0.2时,实验效果较小; 2) d;是0.5时,效果中等; 3)d>>0. 8_时,效果较年夜.概念1.描述统计:是对成组数据概括的描述.描述统计的指标有三类:数据的集中趋势,数据的离中趋势,数据间的相关.2.推论统计:方法包括从样本的数量特性推测总体数量特性的一系列问题:推论假设,推论的各种方法和步伐,以及检验推测可靠性的各种方法.3.组距:每一组上限和下限的差.(组距习上经常使用2, 3, 5, 10, 204.中点:在某一组的下限和上限傍边的那一点.5.集中趋势:是代表一系列数据的典范水平的数字指标,代表集中趋势的指标有平均数,中数和众数.6.平均数(x):是一组数据总和的平均值.7.中数(mdn):一系列按年夜小顺序排列的数据中的一个点,在这个系列中有一半数据在这个点以上,有一半数据在这个点以下.8.众数(mo):在一系列数据中呈现次数最多的那个数.9.全距:一个分布中最年夜的数值的上限减去最小数值的下限,就获得全距.(全距年夜,说明这组数据分散;全距小,则较集中.使用时注意:1、无极端值;2,比力两个分布的全距时,当两个分布所包括数据的数目相等或差未几时才华使用)10.离中趋势:是暗示一组数据分散水平的指标,经常使用的指标有:全距,四分差,平均差和标准差.(如果离中趋势很小,说明数据分布都在平均数附近变动,因此平均数的代表性很年夜;如果离中趋势太年夜,说明数据分布太分散)11.四分差(q):是数据的离中趋势的指标之一,四分差说明按年夜小顺序排列的一系列数据中间50%个数据的分散水平.(如果一个分布中间部份的数据比力集中,则两个四分点q3与q1就离得近些,a的值就小些.)12.百分点:某次数分布中处于某百分品级的数值.13.百分品级:某数值在某次数分布中所处的位置.14.平均差(ad):一个分布中每个变量和平均数的差的绝对值的平均值.15.标准差:s2开方后的正值就叫标准差,是数据的离中趋势的指标之一.16.离中系数(CV):用相对量来暗示数据分散水平的数字指标. :指相关是否密切,可分为无相关;部份相关;完全相关.18.相关:是描述两种数量关系的一个指标,如果一个变量随另一个变量的增加(减小)而增加(减小),则两个变量之间存在着相关.19. z分数(标准分数):是以标准差为单位所暗示的原始分数(x)与平均数的偏离,也可以说是一个以标准差为单位来暗示的偏离分数.20.总体;某类事物的全部称为总体.21.样本:从全部抽出的部份叫样本.22.推论统计:从局部推测全部,从样本推测总体的统计法式.23.随机抽选样本:指总体中每个成份都有同等的机会被抽选.24.分层抽样:用分层抽样的方法,必需对总体有一定的了解,事先对影响所研究问题的诸因素做适当安插.25.样天职布:从很多个样本中算出的很多个平均数的次数分配叫样天职布.26.正态分布:是一个中间高,两侧逐渐下降,两端永远不与横轴相交,两侧完全对称的钟形曲线.27.平均数的标准误(sx):为了和单个样本的标准差有所区别,把样天职布的标准差称做平均数的标准误.28.自由度(df):能够自力变动的数据的数目.29.平均数差的标准误(sxd ):分别从两个总体中抽取出的多个样本平均数的差(xd)的分布,这个分布的标准差叫做平均数差的标准误. 30.虚无假设(ha):除概率以外不加任何其它假定,即假设二总体的平均数不同为O31.备则假设(ha):假设两个总体平均数之间不同中除抽样误差外,还包括有两个总体平均数之间的不同,即备则假设是个总体平均数之间不同不为O32.显著性生水平(P):我们所选择的推翻虚无假设的概率叫做检验的显著性水平.33.第一类毛病:当虚无假设不应推翻时而被推翻了,这意味着把样本的平均数分歧认为是代表了总体平均数的不同.34.第二类毛病:当应该推翻虚无假设时而不推翻,这意味着把样本的平均数分歧是代表总体平均数的分歧这一事实给否认了.35.显著性检验:通过样本平均数的分歧来推论总体平均数是否真正存在分歧,并确定存在何种水平.36.回归:当两种变量间存在着一定水平的相关时,一种变量有向另一种变量的平均数趋近的现象,这种现象叫回归.37.回归方程式:从一变量的数值预测另一变量的相应数值的直线方程式,当两个变量部份相关时,有两个回归方程式.38.回归系数(byx):由x变量预测Y变量的回归方程式的斜率.39.c2检验:是实际观察次数与假设次数偏离水平的指标.40.方差分析:根据组间和组内方差的比值,来比力两组或多组数据的不同是否到达显著.41.组间变异:在两组之间所发生的因变量的变异,就是系统变异,也就是由自变量引起的变异.因为这种变异发生在两组之间,所以又叫组间变异.42.组内变异:同一组内的因变量的变异,就不是由于自变量的情况分歧引起的,而只是由于未加控制的变量引起的.因为这种变异发生在同一组内,所以叫做组内变异.43.组间设计:每个被试只介入1个水平的实验44.组内实际:每个被试介入所有水平的实验.45.主效应:自变量所引起的平均数不同46.交互作用:一个自变量对反应变量的影响因另一个自变量的变动而发生1,伽利略提出了概率论的基本理论;法国数学家帕斯卡和费马创建了概率论,未统计学的发展奠基了重要基础;贝奴里定理的发生,为发现正态概率分布缔造了条件;棣莫弗推导出“正态曲线方程”;皮尔逊发表了频率曲线理论和积差相关;斯皮尔曼提出品级相关;肯德尔W系数和U系数;格赛特T分布理论;费舍是推论统计真正的开创者,最先提出F分布理论,使方差分析系统化;凯特勒他将统计方法应用于教育学和社会学的研究;斯内德克提出方差分析;克一瓦氏H检验是一种非参数方差分析方法,它与参数方法中的完全随机资料方差分析相对应;费里德曼双向品级方差分析可解决随机区组实验设计的非参数检验问题2:从数据的观测方法和来源划分,研究数据可分为计数数据和丈量数据两年夜类;根据数据反映的丈量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型;按照数据是否具有连续性,把数据分为离散数据和连续数据3:统计表的儿个组成要素:表号、名称、标目、数字、表注. 4:统计图的组成部份:图号及图题、图目、图尺、图形、图例、图注5:次数分布显示初步整理后一组数据的分布情况主要暗示数据在各个分组区问内的散布情况,可分为简单次数分布、分组次数分布、相对次数分布、累计次数分布.6:经常使用的次数分布图有直方图、次数多边形图及累加次数分布图.7:其它经常使用的统计图的类别:直方图、条形图、圆形图、线形图、散点图:条形图又分为简单条形图、分组条形图、分段条形图8:其它经常使用统计表类型:简单表、分组表、复合表9:用来描述数据集中趋势和离中趋势的统计量分别称为集中量数和不同量数.10:集中量数包括:算数平均数、中数、众数、加权平均数、儿何平均数、调和平均数等.12:平均数的优缺点:优点:反应灵敏、计算严密、计算简单、简明易解、适合于进一步用代数方法演算、较少受抽样变动的影响;缺点:易受极端数据的影响、若呈现模糊不清的数据时,无法计算平均数.13:计算和应用平均数的原则:同质性原则、平均数与个体数值相结合的原则、平均数与标准差、发差相结合的原则14:不同量数就是对一组数据的变异性,即离中趋势特点进行怀抱和描述的统计量.15:不同量数有:全距、四分位差、白一分位差、平均差、标准差与方差16:相关类别为:正相关、负相关、零相关17:质量相关分为:点二列相关、二列相关及多系列相关18:品质相关:主要分为四分相关、C相关、列联表相关19:概率:是标明随机事件呈现可能性年夜小的客观指标就是概率,概率的界说有两种即后验概率和先验概率20:概率分布类型:160页离散分布与连续分布、经验分布与理论分布、基本随机变量分布与抽样分布21“概率分布:是指对随机变量取值的概率分布情况用数学方法(函数)进行描述22:连续分布:是指连续随机变量的概率分布,即丈量数据的概率分布,它用连续随机变量的分布函数描述它的分布规律23:离散分布:离散随机变量的分布又称作离散分布24:经验分布:是指根据观察或实验所获得的数据而编制的次数分布或相对频率分布25:理论分布:一是随机变量概率分布的函数一数学模型,二是按某种数学模型计算出的总体的次数分布26:抽样分布:是样本统计量的理论分布,样本统计量有:平均数、两平均数之差、方差、标准差、相关系数、回归系数、白一分比率等.27:正态分布:也称常态分布或常态分配,是连续随机变量概率分布的一种,正态分布N C0,1)称为标准正态分布,它的平均值是0,标准差是1.28:二项分布:是指试验仅有两种分歧性质结果的概率分布,具体界说是:设有N次试验,各次试验是彼此自力的,每次试验某事件呈现的概率都是P,某事件不呈现的概率都是q(即是1-P).则对某事件呈现X次(0,1,2,3.0 0 o n)的概率分布为为29:除标准正态Z分布外,儿种罕见的抽样分布包括X的平方分布,T分布,F分布.30:点估计:是用样本统计量来估计总体参数,因为样本统计量为数值上某一点值,估计的结果也以一个点的数值暗示,所以称为点估计.31:良好估计量的特性:无偏性、有效性、一致性、充沛性犯:区问估计:就是根据估量值以一定可靠水平推断总体参数所在的区问范围,它是用数轴上的一段距离暗示未知参数可能落入的范围,他虽不具体指出总体参数即是什么,但能指出未知总体参数落入某一区问的概率有多年夜33:置信区问:也称置信问距,是指在某一置信度时,总体参数所在的区域距离或区域长度.置信区问的上下两端点值称为置信界限.34:显著性水平是指估计总体参数落在某一区问时,可能犯毛病的概率,用符号a暗示35:假设检验:通过样本统计量得出的不同做出一般性结论,判断总体参数之问是否存在差异,这种推论过程称作假设检验,它的基本任务就是事先对总体参数或总体分布形态做出一个假设,然后利用样本信息来判断原假设是否合理,从而决定是否接收原假设.假设检验包括“参数检验”和“非参数检验”.36:参数假设检验:若进行假设检验时总体的分布形式已知,需要对总体的未知参数进行假设检验;非参数假设检验:若对总体分布形式37:方差分析:主要功能在于分析实验数据中分歧来源的变异对总变异的贡献年夜小,从而确定实验中的白变量是否对因变量有重要影响38:方差分析的基来源根基理:综合虚无假设和部份虚无假设、方差的可分解性39:平方和:指观测数据与平均数离差的平方总和40:总变异被分解为“组问变异”和“组内变异"41:组问变异:主要指由于接受分歧的2而造成的各组之问的变异,可以用两个平均数之问的不同暗示42:组内变异:是由组内各被试因变量的不同范围决定的,主要指由实验误差、或组内被试之问的不同造成的变异.43:发差分析的基本假定:总体正态分布、变异的相互自力性、各实验处置内的方差要一致44:组内设计:又称被试内设计,是指每个被试都要接受所有白变量水平的实验处置45:完全随机设计的方差分析:就是对单因素组问设计的方差分析,在这种实验研究设计中,各种处置的分类仅以单个实验变量为基础,因而把它称为单因素方差分析或单向方差分析46:随机区组设计的方差分析:根据被试特点把被试划分为儿。
心理统计学知识点完整版资料整理1.数据的概念:在心理统计学中,数据是指信息的收集和组织形式。
数据可以是数字,也可以是文字或符号。
数据的收集可以通过实验、调查、观察等方式进行。
2.数据的分布:在心理统计学中,数据的分布是指通过统计方法和图表来展示数据的特征和规律。
常用的数据分布包括正态分布、偏态分布、均匀分布等。
3.描述性统计:描述性统计是用来描述和总结数据的方法。
常见的描述性统计包括均值、中位数、众数、标准差、变异系数等。
4.推论统计:推论统计是根据样本数据来对总体进行推断的方法。
推论统计主要包括参数估计和假设检验两个方面。
5.参数估计:参数估计是用样本数据来估计总体参数的值。
常见的参数估计方法包括点估计和区间估计。
6.假设检验:假设检验是用来判断总体参数是否满足一些假设的方法。
其中包括设置原假设和备择假设、选择显著性水平、计算统计量、确定拒绝域等步骤。
7.相关分析:相关分析用来研究两个或多个变量之间的关系。
其中最常用的是皮尔逊相关系数,可以用来衡量变量之间的线性相关程度。
8.回归分析:回归分析用来研究一个或多个自变量和因变量之间的关系。
通过回归分析可以得到回归方程,进而预测因变量的值。
9.方差分析:方差分析是一种用来研究多个样本之间差异的方法。
方差分析可以判断不同组之间的均值是否存在显著差异。
10.非参数统计:非参数统计是一种不依赖于总体参数的方法。
非参数统计主要包括秩次统计和分布自由度较小的统计方法。
11.实验设计:实验设计在心理统计学中扮演着重要的角色。
良好的实验设计可以保证实验的可靠性和有效性,并排除干扰因素。
12.抽样方法:抽样方法是指如何从总体中选取样本的方法。
常见的抽样方法包括随机抽样、系统抽样、整群抽样等。
以上是心理统计学的一些主要知识点的简要整理。
了解这些知识点可以帮助我们更好地理解和应用统计方法来分析心理学中的数据。
当然,心理统计学的内容还非常广泛,还有更多的知识点值得深入学习和研究。
现代心理与教育统计学复习资料第一章心理与教育统计学基础知识1、数据类型称名数据计数数据离散型数据顺序数据等距数据测量数据连续型数据比率数据2、变量、随机变量、观测值变量就是可以挑相同值的量。
统计数据观测的指标都就是具备变异的指标。
当我们用一个量则表示这个指标的观测结果时,这个指标就是一个变量。
用来表示随机现象的变量,称为随机变量。
一般用大写的x或y表示随机变量。
随机变量所取得的值,称为观测值。
一个随机变量可以有许多个观测值。
3、总体、个体和样本须要研究的同质对象的全体,称作总体。
每一个具体内容研究对象,称作一个个体。
从总体中抽出的用以推测总体的部分对象的集合称为样本。
样本中包含的个体数,称为样本的容量n。
通常把容量n≥30的样本称作大样本;而n<30的样本称作大样本。
4、统计数据量和参数统计数据指标平均数标准差相关系数回归系数统计数据量srb参数μσρβ5、统计误差误差就是测量得值与真值之间的差值。
测出数值=真值+误差统计误差归纳起来可分为两类:测量误差与抽样误差。
由于采用的仪器、测量方法、读数方法等问题导致的测出值与真值之间的误差,称作测量误差。
由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差第二章统计图表一、数据的整理在展开整理时,如果没充裕的理由证明某数据就是由实验中的过错导致的,就无法轻而易举将其确定。
对于个别极端数据与否该剔出,应当遵从三个标准差法则。
二、次数原产表中(一)简单次(频)数分布表(二)相对次数分布表将次数原产表各组的实际次数转变为相对次数,即为用频数比率(f/n)或百分比f)去则表示次数,就可以做成相对次数原产表中(?100%n(三)累加次数分布表(四)双列次数分布表双列次数原产表中又称有关次数原产表中,就是对存有联系的两列变量用同一个表中则表示其次数原产。
所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。
心理统计学笔记(1)基本概念总体:具有某些共同的、可观测特征的一类事物的全体,构成总体的每个基本单元称为个体样本:由于不能或没必要对整个总体进行研究,我们只能从总体中选择出一些个体代表总体,这些个体的集合叫样本变量:本身是变化的或者对于不同个体有不同值得特征或条件常量:本身不变且对不同的个体的值也相同参数:描述总体的数值,它可以从一次测量中获得,也可以从总体的一系列测量中推论得到比例:全组中取值为X的比例,p=f/N插值法:一种求两个已知数值之间中间值的方法,其假设所求解点附近数据呈线性变化统计量:描述样本的数值,与参数的获得方式相同随机取样:从总体抽取样本的一种策略,要求总体中的每一个个体被抽到的机会均等取样误差:样本统计量与相应的总体参数之间的差距偏态分布:分数堆积在分布的一端,而另一端成为比较尖细的尾端,其与对称分布对应次数分布:一批数据在某一量度的每一个类目所出现的次数情况离散型变量:由分离的、不可分割的范畴组成,临近范畴之间没有值存在连续型变量:在任何两个观测值之间都存在无限多个可能值,它可被分割成无限多个组成部分(2)学习建议①将注意放在概念上,心理统计应该是一门概念性的科学,而非纯数学。
②一定要将统计方法与心理学研究的情景结合起来学习。
③弄懂一个概念再开始学习下一个,心理统计中的概念应用性较差却是之后做题的基础。
④做题按照推荐格式能避免出错几率。
(3)统计检验总表数据类型单样本问题独立样本比较相关样本比较多组样本的比较相关问题独立样本重复测量等距型总体正态分布单样本t/z检验独立样本t/z检验相关样本t检验独立样本方差分析重复测量方差分析Pearson积差相关分布形态未知大样本下的相应的t/z检验大样本下的相应的t/z检验大样本下的相应的t检验转化为顺序型转化为顺序型顺序型符号检验法曼-惠特尼U检验维尔克松T检验克-瓦氏单向方差分析弗里德曼双向等级方差分析Spearman等级相关命名型χ2匹配度检验χ2独立性检验符号检验法χ2独立性检验χ2独立性检验一、描述统计描述统计是指用来整理、概括、简化数据的统计方法,侧重于描述一组数据的全貌,表达一件事物的性质。
《心理统计学》总复习要点第一章、第二章基本概念及次数分布表第一节基本概念一、基本概念1.连续变量与离散变量(不连续变量)变量分为连续变量与离散变量(不连续变量)。
连续变量则可以在量表上的任何两点加以细分,可以取得无限多个大小不同的数值。
不连续变量又称离散变量或间断变量,则在量表上的任何两点中只能取得有限个数值。
是一种只能取特殊值而不能取任何值的变量,它代表一个点,而不是一段距离。
2.总体、样本、个体总体是指具有某一种特征的一类事物的全体,构成总体的每一个基本元素称为个体,在总体中按一定规则抽取的一部分个体,称为总体的一个样本。
二、测量水平心理测量的工具一般可以分为四种水平,它们是由测量工具——量尺的水平决定的,量尺也称为尺度。
(一)量尺(Ratio Measurement)用这样的量尺测量出的数据,可以进行加、减、乘和除运算。
这种测量水平的数据特征是有相等单位和绝对零点。
用这种量尺测量得到的数据变量为比率(或等比)变量。
(二)等距量尺(Interval Measurement)只有相等单位,没有绝对零点,这种测量工具称为等距量尺。
等距量尺测出的数据可以进行加和减的运算,而不能进行乘和除的运算。
但是,等距数据的差值可以进行乘、除运算,因为等距数据的差值有一个绝对零点,两个数值相等,差值即为零。
用这种量尺测量得到的数据变量为等距变量。
(三)顺序量尺(Ordinal Measurement)顺序量尺又叫等级量尺,它的特点是:既无绝对零点,又无相等单位。
用这种量尺对研究对象进行测量,只能给对象排个顺序。
顺序量尺的测量结果原则上不能进行加、减、乘、除四则运算。
如有必要的话,只能进行不等式运算。
用这种量尺测量得到的数据变量为顺序变量。
(四)分类量尺(Nominal Measurement)分类测量不包含任何类间数量关系的假定,仅仅是把测量对象分为相同或相异,但在性质上没有哪一类较大,哪一类较小之分。
即无大小之分,也无等级之分。
心理统计知识点总结一、概率论基础1. 概率的概念概率是描述不确定事件发生的可能性大小的数学工具。
在心理统计学中,概率的概念是最为基础的,它是研究随机事件发生规律的重要工具。
对于心理学研究中的一些数据,比如随机实验结果、样本分布等,都可以用概率论的方法来进行研究和分析。
2. 随机变量和概率分布随机变量是描述随机试验结果的一种数学抽象,它是对可能的试验结果的一种量化描述。
概率分布则是用来描述随机变量可能取值的规律。
心理学研究中常见的随机变量有多种类型,比如二项分布、正态分布等,它们都可以用来描述心理学中一些随机试验的结果。
3. 样本空间和事件空间在概率论中,样本空间是指随机试验中所有可能结果的集合,而事件空间则是样本空间中的一个子集,表示某一特定事件发生的可能性。
在心理学研究中,样本空间和事件空间的概念是用来描述研究对象的各种可能结果和事件的可能发生的空间。
4. 条件概率和贝叶斯定理条件概率是指在某一事件发生的条件下,另一事件发生的概率。
贝叶斯定理则是用来描述两个事件之间的相互关系的定理。
在心理学研究中,条件概率和贝叶斯定理可以用来分析一些复杂的事件之间的概率关系,从而揭示心理学中一些复杂事件之间的规律。
二、描述统计学1. 中心趋势的度量中心趋势是用来描述一组数据集中趋向于集中的程度。
心理学研究中,常用的中心趋势度量有均值、中位数、众数等。
这些度量方法可以用来描述一组数据的集中趋势,从而揭示一组数据的集中程度。
2. 离散程度的度量离散程度是用来描述一组数据分散程度的度量。
心理学研究中,常用的离散程度度量有标准差、方差、极差等。
这些度量方法可以用来度量一组数据的分散程度,从而揭示一组数据的分散程度。
3. 正态分布和假设检验正态分布是一种最为常见的概率分布,它在心理学研究中有着重要的应用。
假设检验则是用来检验一组数据是否符合某种特定分布的方法。
在心理学研究中,正态分布和假设检验可以用来判断一组数据是否符合正态分布,从而进行后续的统计分析。
第一章绪论统计学内容(凑字数):(1)描述统计(整理数据):第二章图表第三章集中量数第四章差异量数第五章相关(2)推论统计(推断总体):第七章参数估计;第八第十第十一章假设检验。
(3)实验设计(取样,实验条件控制,结果分析):第九章方差第十二章回归第十三章因子分析第十四章样本选择数据类型:(1)观测方法:计数数据:能数出来的计量数据:用工具量的(2)测量水平:称名数据:类别顺序数据:类别、次序--------心理测验的原始数据是这个等距数据:类别、次序、相差程度-------心理测验数据都会转换成这个等比数据:类别、次序、相差程度、相差比例(3)是否连续:离散数据:非连续,有个数能数出来连续数据:中间可以无限细分出无数个值第二章图表统计表:(1)次数表:简单次数分布表:无论什么类型数据只要用来记录次数就可,数据少时使用分组次数分布表:同样只要记录次数就能用,数据多时使用相对次数分布表:用比率和百分数表示次数。
累加次数分布表:需知道某个数据以下和以上人数时使用。
双列次数分布表:两列变量的次数用同一个表来表示。
不等距次数分布:无法等距分组时使用。
(2)其他表:简单表:无分类分组表:一个分类复合表:多个分类统计图:(1)次数图:直方图(表分布):横坐标连续数据,纵坐标频次次数多边图:直方图条条去掉连成线就是这个。
比直方图轮廓好易看出规律。
累加次数分布图:横坐标(等距数据以上)分组区间;纵坐标(任何记录次数的数据)累加次数累加曲线:累加次数分布图曲线化。
可更好的看出数据的形态(正态,偏态)(2)其他图:条形图(表内容):对计数或离散数据进行描述圆形图(表内容):不连续的数据-----------可以按比例分的数据线形图(表变化):连续型数据进行描述散点图(表相关):横坐标可计数可离散,纵坐标必须连续数据茎叶图(表分布和保留具体数值):两位数的数据次数箱型图(表数据离散状况)第三章集中量数:一组数据的最佳代表值算数平均数:最好的集中量数,能用就用这个(1)何时不能使用:有极端数值时,有模糊数据时。
一、数据类型1、称名数据(类别变量):用数字表示个体在属性上的特征或类别上的不同的变量,如性别(0,1)、学校类型、门牌号,一般为整数。
2、顺序变量:用数字表示个体在某个有序状态中所处的位置、层次或水平的变量。
该类型 数据不具有相等单位即第一名和第二名之间的身高差数值不等于第二名与第 三名之间的身高差,因此不能进行加减乘除运算,如考试排名、工资级别、 奖牌榜等。
3、等距数据:取值具有“距离”特征的变量。
即有相等单位也能进行加减运算,但是没有 绝对零,如温度。
4、比率数据:即表明量的大小,也有测量单位,同时还具有绝对零点的变量,如身高、体 重、面积、反应时等,可进行加、减、乘、除运算。
二、地位量数、集中量数、差异量数的概念与分类:1、地位量数:表明研究对象某一属性的数量化指标—原始变量在其所处分布中地位的量数, 称为地位量数。
包括百分位分数、百分等级分数、标准分数、T 分数、Z 分数。
2、集中量数:用来描述一组数据集中趋势的统计量数。
包括算术平均数、几何平均数、加权平均数、调和平均数、中数和众数。
3、差异量数亦称为离中量数,表示数据分散程度的统计量,反映的是各变量值远离其中心值的程度。
包括全距、平均差、方差、标准差、差异系数。
三、集中量数各自的特点(优缺点)1、算术平均数的优缺点:优点:①反应灵敏 ②计算严密 ③计算简单 ④简明易解 ⑤可作进一步演算 ⑥较少受抽样影响缺点: ①易受极端数据的影响 ②不能有模糊不清的数据 ③不能用不同质的数据 2、中数的优缺点:优点:计算简单、不受极端数据的影响缺点: ①误差较大 ②受抽样变动影响较大,不如平均数稳定 ③反应不灵敏 ④难以作进一步的代数运算 3、众数的优缺点:优点:概念简单明了,容易理解缺点:①不稳定,受分组和样本变动的影响 ②反应不够灵敏③只是一个估计值 ④不能作进一步代数运算=和≠()()()()11222222--=--=-=-=∑∑∑∑n X X S n X X S NX N X i i i i 样本方差和样本标准差总体方差和总体标准差μσμσ四、平均数与标准差的性质1、算术平均数的性质①一组数据的每一个数与平均数的差(离均差)的总和等于零;②一组数据的每一个数加上常数c ,其平均数为原来的平均数加常数c ; ③一组数据的每一个数乘以常数c ,其平均数为原来的平均数乘常数c ; ④一组数据的每一个数乘以常数c ,再加上一个常数d 其平均数为原来的平均数乘常数c 再 加上常数d ;2、标准差的性质:①每个观测值都加一个相同的常数C 后,计算得到的标准差等于原标准差②每个观测值都乘以一个相同的常数C 后,计算得到的标准差等于原标准差乘以这个常数 ③每一个观测值都乘以一个相同的常数C (C ≠0),再加上一个常数d 所得的标准差等于原标准差乘以一个常数方差和标准差是表示一组数据离散程度的最好指标。
1、黄底的是听录音自己加上去的(因看不到,无法知道所加是否正确)。
第一章绪论心理统计:心理统计是研究心理学科的科学方法和工具,是统计学的原理和数学方法在心理学领域中的应用。
心理统计分为描述统计和推论统计两大部分。
描述统计:是把实验中所得到的数据进行概括的整理,得出实验者可利用的信息,用表和图将实验数据形象地表示出来,描述统计的指标有三类,即集中量数、离中量数和数据间的相关。
集中量数,是指一组数据具有代表性的指标,如,平均数、中数、众数。
离中量数,表示一组数据分散程度的指标,如,四分差,标准差,方差。
数据间的相关,是表示成对的两组数据之间的关系的指标。
进行心理实验是为了发现心理现象的客观规律。
心理统计将研究对象的全部称为总体,从总体中抽出的参与实验的部分称为样本。
推论统计就是从样本的数量特征去推论总体的数量特征。
它包括一系列的统计程序:推论的假设、推论的方法步骤和检验推论的可靠性的各种方法等。
描述统计和推论统计是相辅相成,描述统计是推论统计的基础,只有描述统计准确无误,推论统计才具有意义。
第二章数据的初步整理实验数据的类型:计数数据:是准确数,它是一个一个数出来的。
数据形式为计数数据的变量称为离散型变量。
测量数据:是近似数。
测量数据是通过测量工具得到的。
数据形式为测量数据的变量,称为连续性变量。
上限:就是一个数的最末位加上半个单位。
下限:就是一个数的最末位减去半个单位。
用表整理实验数据常用的表格有三种:原始数据表(原始记录表)、次数分布表、实验结果表 全距:就是数据中最大数值的上限与最小数值下限的差。
组距:就是某一组数据上限与下限的差。
中点:符号X’。
假设数据均匀地分布在组距之间,这一组数值的代表点叫中点。
它是这一组数值的上限与下限中间一点的数值。
(计算中点的简单方法是两个数相加,除以2)组距组距=组上限=组下限下限上限中点=21212-++比例:符号小写p 。
部份比全部的比值就是比例。
比例是将全部数据作为一个整体。
概念(1)随机变量:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量.(2)总体:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。
(3)样本:样本是从总体中抽取的一部分个体。
(4)个体:构成总体的每个基本单元.(5)次数:是指某一事件在某一类别中出现的数目,又称作频数,用f表示。
(6)频率:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。
(7)概率:概率论术语,指随机事件发生的可能性大小度量指标.其描述性定义。
随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A).(8)统计量:样本的特征值叫做统计量,又称作特征值。
(9)参数:又称总体参数,是描述一个总体情况的统计指标。
(10)观测值:随机变量的取值,一个随机变量可以有多个观测值。
2何谓心理与教育统计学?学习它有何意义?答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。
具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
(2)学习心理与教育统计学有重要的意义.①统计学为科学研究提供了一种科学方法.科学是一种知识体系。
它的研究对象存在于现实世界各个领域的客观事实之中. 它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系.要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。
统计学正是提供了这样一种科学方法.统计方法是从事科学研究的一种必不可少的工具.②心理与教育统计学是心理与教育科研定量分析的重要工具.凡是客观存在事物,都有数量的表现.凡是有数量表现的事物,都可以进行测量。
第一章:描述性统计统计:描述性统计descriptive statistics推断性统计inferential statistics#描述性统计主要是对一组给定的测量数据进行总结的方法,而推断性统计是把对给定数据的测量结果推广到更大的潜在数据集的方法。
变量variable和常量constant变量:连续变量continuous variable & 离散变量discrete variable一个具有有限水平但相邻水平之间不再可能赋值的变量被称为离散变量。
一个可以无穷小精确度来测量的变量(至少在理论上,可是求两个任意小的测量水平之间的中间值)被称为连续变量。
自变量indepentent variable & 因变量dependent variable称名/类别量尺(nominal/categorical scale):数字是强制定义的,不可计算。
顺序/等级量尺(ordinal scale):不是简单分类,而是有一定顺序。
然而,这些排名数字并不能看作真正的数值,因为等级之间不是等距的。
研究者在对这类的数据进行数学运算时,已经假设它们是等距数据了。
等距和等比量尺(interval and ratio scales):不但具有等距特征,而且还兼具等比特征的量尺被称之为等比量尺。
尽管所有等比量尺都有等距特征,但有些量尺只有等距特征而不具备等比特征。
这些量尺被称为等距量尺。
等距量尺是没有真正零点的。
E.g. 摄氏和华氏温度,IQ值等。
#不能混淆变量和用来测量变量的量尺。
同一个变量可以用多种量尺来测量,例如:测量温度可以用顺序量尺(第一热,第二热),也可以用等距量尺(摄氏/华氏度),还可以用等比量尺(开尔文,有绝对零度)。
尽管在终极意义上,所有量尺都是离散的,但是具有很多水平的量尺通常被认为是连续的,而水平相对少的量尺则当作离散处理。
而用于测量离散变量的量尺总是离散的。
参数统计(parameter statistics)和非参数统计:基于分布及其参数的统计方法叫参数统计。
第一章实验设计——组被试实验设计第一节实验设计的概述一、实验设计的定义(略)二、实验设计的类型(一)按照实验设计的精确程度划分1.前试验设计(1)只选一组实验对象进行试验,或者只有实验组,而没有对照组。
(2)选择两组对象,但是两组对象在实验之前就有区别。
2.准实验设计没有前试验设计好,但是与精确实验设计接近3.精确实验设计完全消除了无关因素的影响,其实验结果完全真实可靠(二)按照考察因素的多少划分1.单因素设计比如:研究酒精对人的记忆力的影响,可以把酒精分为低浓度、中等浓度和高浓度酒精,被试分别分到这三个组。
(单因素多水平,毕业论文中经常使用)2.双因素设计酒精学习能力4(三)按照被试的人数的多少来划分1.组被试实验设计一般>=100-200;临床上比较少2.单被试实验设计第二节组被试实验设计一、单因素实验设计(一)前试验设计t检验P>.05 没有显著差异缺点:①实验组不能代表总体②练习对实验结果的影响③精神状态④自然成熟,特别是对少年儿童的研究⑤环境因素的影响,如噪音t检验 P<.05 有显著差异缺点:实验前两组如果不处于同一水平,实验后的差异那是必然的(二)准实验设计1.单组随机前后测实验设计分组方式:随机最大优点:样本可以代表总体t检验2.双组随机后测试实验设计缺点:有多大的变化是由实验干预引起的,无法知道3.双组随机前后测实验设计分组方式:随机4.双组随机匹配后测设计分组方式:随机匹配优点:分组的时候根据某一个因素,匹配分成了两组,被试间的差异缩小了“-”代表没有施测优点:从理论上来说,因为是随机分组,所以Y2和Y3结果是没有差异的,增加控制组2之后,使得实验结果变得更加精确如例中,如果没有控制组2的话,认为提高的记忆单词的数量是(85-68=17),然而我们发现控制组2的存在证明,其实提高了的数量是(85-70=15),这其中的差异2个可能是由于无关变量造成的。
6.苏勒门四组实验设计7.多组随机后测试实验设计表1 实验组(E)二、双因素实验设计根据两个因子的相关程度的高低两个相关因子的实验设计(析因设计)(一)雅茨设计(yates design)2×2析因设计。
集中量数和差异量数一、数据的集中量数:要描述存在于组别之间的普遍差异的方法,就是要找出典型的或平均水平的数据代表。
二、集中趋势定义:反映频数分布中大量数据向某一点集中的情况,描述这种特点的统计量称为集中量数。
1.测度集中趋势就是寻找数据水平的代表值或中心值2.确定集中趋势并没有统一的、标准化的方法。
因为没有一种测量集中趋势的代表性数值可以适用于所有情况。
集中趋势的一般性目的是找出单一的最具有代表性的数值。
3. 低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据;三、集中量数包括:1.算术平均数Mean:集中趋势的测度值之一;最常用的测度值;一组数据的均衡点所在【天平】;易受极端值的影响;用于数值型数据,不能用于定类数据和定序数据。
算术平均数是“真值”的最佳估计值优点a)反应灵敏。
观测数据中任何一个数值或大或小的变化,甚至细微的变化,在计算平均数时,都能反应出来;b)计算严密。
计算平均数有确定的公式,不管何人在何种场合,只要是同一组观测数据,计算的平均数都相同;c)计算简单。
计算过程知识应用简单的四则运算;d)简明易解。
平均数概念简单明了,较少数学抽象容易理解;e)适合于进一步用代数方法演算。
在求解其他统计特征值,如离均差、方差、标准差的计算时,都要应用平均数;f)较少受抽样变动的影响。
观测样本的大小或个体的变化,对计算平均数影响很小。
在来自同一总体逐个样本的集中量数中,平均数的波动同样小于其他量数的波动,因此它总是最可靠、最正确的量数。
缺点1.易受极端数据的影响;2.因为计算平均数是需要每一个数据都加入计算。
在次数分布中只要有一个数据含糊不清,都无法计算平均数。
在这种情况下,一般采用中数作为该组数据的代表值,描述其集中趋势计算和应用算术平均数的原则•同质性原则:算术平均数只能用于表示同类数据的集中趋势。
•平均数与个体数值相结合的原则:在解释个体特征时,既要看平均数,也要结合个体的数据。
1、黄底的是听录音自己加上去的(因看不到,无法知道所加是否正确)。
第一章绪论心理统计:心理统计是研究心理学科的科学方法和工具,是统计学的原理和数学方法在心理学领域中的应用。
心理统计分为描述统计和推论统计两大部分。
描述统计:是把实验中所得到的数据进行概括的整理,得出实验者可利用的信息,用表和图将实验数据形象地表示出来,描述统计的指标有三类,即集中量数、离中量数和数据间的相关。
集中量数,是指一组数据具有代表性的指标,如,平均数、中数、众数。
离中量数,表示一组数据分散程度的指标,如,四分差,标准差,方差。
数据间的相关,是表示成对的两组数据之间的关系的指标。
进行心理实验是为了发现心理现象的客观规律。
心理统计将研究对象的全部称为总体,从总体中抽出的参与实验的部分称为样本。
推论统计就是从样本的数量特征去推论总体的数量特征。
它包括一系列的统计程序:推论的假设、推论的方法步骤和检验推论的可靠性的各种方法等。
描述统计和推论统计是相辅相成,描述统计是推论统计的基础,只有描述统计准确无误,推论统计才具有意义。
第二章数据的初步整理实验数据的类型:计数数据:是准确数,它是一个一个数出来的。
数据形式为计数数据的变量称为离散型变量。
测量数据:是近似数。
测量数据是通过测量工具得到的。
数据形式为测量数据的变量,称为连续性变量。
上限:就是一个数的最末位加上半个单位。
下限:就是一个数的最末位减去半个单位。
用表整理实验数据常用的表格有三种:原始数据表(原始记录表)、次数分布表、实验结果表 全距:就是数据中最大数值的上限与最小数值下限的差。
组距:就是某一组数据上限与下限的差。
中点:符号X’。
假设数据均匀地分布在组距之间,这一组数值的代表点叫中点。
它是这一组数值的上限与下限中间一点的数值。
(计算中点的简单方法是两个数相加,除以2)组距组距=组上限=组下限下限上限中点=21212-++比例:符号小写p 。
部份比全部的比值就是比例。
比例是将全部数据作为一个整体。
第一章
心理统计学是运用统计学的一般原理和方法研究心理科学领域数量关系的一门科学•心理与教育科学研究数据的特点数据与结果多用数字形式呈现
•数据具有随机性和变异性
•数据具有规律性
•心理科学研究的目标是通过部分数据来推断总体特征
描述统计
推断统计
数据类型
根据数据来源
计数数据count data是以计算个数或次数获得的,多为整数
测量评估数据measurement data借助测量工具或评估方法对事物某种属性派给数字后所获的数据
根据数据所反映的变量的性质
几个概念:
一,总体:性质相同的一类事物的全体。
个体:构成总体的每一基本单位或单元。
样本:总体中抽出的部分个体。
二,次数:某一事件在某一类别中出现的数目,又称频数。
比率:两个数的比。
也称为比例,用百分数表示。
频率:又称相对次数,即某一事件的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据数目的总数除。
频率常用比例来表达,有时也用百分数表示。
概率:又称机率或然率,常用符号P表示。
是指某事件在无限的观测中所能预料的相对出现的次数。
就是某一事物或某种情况在某一总体中出现的比率。
概率常用比例表示。
三,参数(总体参数)总体特性;统计量(特征值)样本特性。
第二章
重点:
直方图:分组的连续性数据;面积为数据的多少和大小;坐标轴为刻度值;没有间隙。
条形图:离散型数据资料,即计数数据或称名数据;直条的长短或高低表示数据的多少和大小;坐标轴是分类轴;有间隔。
圆形图:间断性资料,显示各部分在整体中所占的比重大小,以及个部分之间的比较
线形图:连续性资料,两个变量之间的函数关系,描述某现象在时间上的发展趋势,或一种现象随另一种现象变化的情形
散点图:表示统计资料大小以及变化趋势,表示两种现象间相关程度。
第五章
一.积差相关(皮尔逊积差相关)
需满足的条件:1.要求成对的数据。
2.两列变量各自总体的分布都是正态,即正态双变量,至少两个变量俯冲的分布应是接近正态的单峰分布。
3.两个相关的变量是连续变量。
4.两列变量之间的关系是线性的。
二.等级相关(斯皮尔曼等级相关)
适用数据:1.两列变量是属于等级变量性质的有线性关系的资料(主要用于解决称名数据和顺序数据的相关问题)。
2.有些虽属等距或等比性质的连续变量数据单起分布不是正态的资料。
三.肯德尔等级相关
A.肯德尔和谐系数(W系数)
原始数据资料的获得一般采用等级评定法,即让K个被试对N件事物进行等级评定。
B.肯德尔一致行系数(U系数)
K个被试对N件事物进行等级评定,但使用的方法是对偶法。
四.点二列相关
两列数据一个为连续变量(点数据)而且分布是正态的,另一个为"二分"称名变量(二分型数据)。
五.二列相关
两列数据均属于正态分布,其中一列变量为等距或等比的测量数据,另一列变量为人为划分的二分变量。
六.多列相关
两列正态变量资料,其中一列为等距或等比的测量数据,另一列被人为划分为多种类型,称为名义变量。
七.品质相关
用于表示R X C (行X 列)表的两个变量之间的关联程度。
A.四分相关
两个变量都是连续的正态变量,且每个变量的变化都被人为地划分为两种类型。
B.PHI系数
两个相互关联着的变量分布都是真正的二分变量.适用资料是除四分相关之外的四格表(计数)资料,是表示两因素分类资料相关程度最常用的一种相关系数。
C.列联表系数
Chapter 1
Descriptive statistics: Psychologists use descriptive statistics to summarize and make understandable-to describe-a group of numbers from a reasearch study.
The purpose of descriptive statistics is to make a group of numbers easy to understand Tables and graphs
Inferential statistics : Psychologists use inferential statistics to draw conclusions and make inferences that are based on the numbers from a research study,but go beyond these numbers
The differences among variable ,value and score
Variable Condition or characteristic that can have different values
Value Number or category
Score A particular person’s value on a variable
A numeric variable has values that are numbers that tell you the degree or extent of what the variable measures;
A nominal variable has values that are different categories and have no particular numeric order.
Frequency Tables ( Grouped frequency tables)
Frequency graphs
Histograms: the height of each bar is the frequency of each value in the frequency table. All the bars are put next to each other with no space in between.
A bar graph: a nominal variable
Frequency Polygon (need the extra values to make the line start and end at zero frequency so that the line and the bottom of the graph together make a closed figure/a polygon) Histograms&Frequency polygons
(a)similar :both show the frequency table visually, with heights for each value for the
frequency of that value.
(b)Different:A histogram uses bars;a frequency polygon is a line graph.
Frequency ditribution: unimodal , bimodal,multimodal ,rectangular distribution(having no
peak)
Symmetrical and skewed distribution (skewed to the right or
left:positively skewed or negtively skewed) Floor /ceiling effect
Normal and kurtotic distribution(how much the shape of a
distribution differs from a normal curve in terms of whether its tails
are heavier or lighter than the normal curve.)。