当前位置:文档之家› 现代心理与教育统计学笔记

现代心理与教育统计学笔记

现代心理与教育统计学笔记
现代心理与教育统计学笔记

概念

(1) 随机变量:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。

(2) 总体:总体(population) 又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。

(3) 样本:样本是从总体中抽取的一部分个体。

(4) 个体:构成总体的每个基本单元。

(5) 次数:是指某一事件在某一类别中出现的数目,又称作频数,用 f 表示。

(6) 频率:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。

(7) 概率:概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A 在所有试验中发生的可能性大小的量值,称为事件 A 的概率,记为P(A) 。

(8) 统计量:样本的特征值叫做统计量,又称作特征值。

(9) 参数:又称总体参数,是描述一个总体情况的统计指标。

(10) 观测值:随机变量的取值,一个随机变量可以有多个观测值。

2 何谓心理与教育统计学?学习它有何意义?

答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。

(2)学习心理与教育统计学有重要的意义。

①统计学为科学研究提供了一种科学方法。科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。

②心理与教育统计学是心理与教育科研定量分析的重要工具。凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理与教育现象是一种客观存在的事物,它也有数量的表现。虽然心理与教育测量具有多变性而且旨起它发生变化的因素很多,难以准确测量。但是它毕竟还是可以测量的。因此,在进行心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与教育统计就是对心理与教育问题进行定量分析的重要的科学工具。

③广大心理与教育工作者学习心理与教育统计学的具体意义。

a?可经顺利阅读国内外先进的研究成果。

b. 可以提高心理与教育工作的科学性和效率。

c. 为学习心理与教育测量和评价打下基础。

3. 先用统计方法有哪几个步骤? 答:一项实验研究结果要用何种统计方法去分析,需要对实验数据进行认真的分析。只有做到对数据分析正确,才能对统计方法做出正确地选用。选用统计方法

可以分为以下步骤:

(1) 首先,要分析一下实验数据是否合理,即所或得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的。

(2) 其次,要分析实验数据的类型。不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要。

(3) 第三,要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件。

4?什么叫随机变量?心理与教育科学实验所获得的数据是否属于随机变量?

答:(1)在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。

(2)心理与教育科学实验所获得的数据属于随机变量。心理与教育科学研究数据具有随机性和变异性。

科学研究中因观测人员、观测工具、观测条件的变化而具有随机变化的现象。在心理和教育科学领域,研究获得的数据资料也具有一定随机性质。观测数据的这种特点,称为变异性。即便使用同一种测量工具,观测同一事物,只要是进行多次,那么获得的数据就不会完全相同。随着测量工具的完善和精确,数据的这种随机性变化就更明显。例如,人们对同一年级或同一年龄儿童甚至对同一个人进行同一学科的学业测试,或对同一个心理特点进行评量、观察多次,得到的数据绝不会全然相同,这些数据总是在一定的范围内变化。造成数据变异的原因,出自观测过程中一些偶然的不可控制的因素,称随机因素。随机因素使测量产生的误差称作随机误差。由于这种随机误差的存在,使得在相同条件下观测的结果常常不止一个,并且事前无法确定,这是客观世界存在的一种普遍现象,人们称这类现象为随机现象。在教育和心理科学的各类研究中,研究的对象是人的内在的种种心理现象,不仅由客观上一些偶然因素会引起测量误差,由实验者和被试主观上一些不可控制的偶然因素也会造成测量误差,这些偶然因素+分复杂,因而

造成的随机误差就更大,也就是使心理与教育科学研究中得到的数据具有更明显的变异性。

5。怎样理解总体、样本与个体。

答:根据其各自的定义,我们可以用下面这个图来表示。大圆表示研究对象的全体,也就是总体;大圆中的小圆表示其中一个样本,大圆中所有的点代表的是样本。

6、统计量与参数之间有何区别和关系。

答:(1)参数是描述总体情况的统计指标;样本的特征值称作统计量。

(2) 区别:1参数是从总体中计算得到的量数,代表总体特征,一个常数。统计量是从一个样本中计算得到的量数,它描述一组数据的情况,是一个变量,随样本的变化而变化。2参数常用希腊字母表示,样本统计量用英文字母表示。

(3) 联系:1参数通常是通过样本特征值来预测得到,(7、答案略)

8、下述一些数据,哪些是测量数据?哪些是计数数据?其数值意味什么?

(1)17. 0 千克(2 ) 89. 85 厘米⑶ 199. 2 秒(4) 17 人(5) 25 本(6 ) 93. 5

答:上面的数据中测量数据有:(1) 17.0千克(2 ) 89. 85厘米(3 ) 199. 2秒(6)

93. 5 分

计数数据有:(4) 17人⑸25本(2) 17. 0千克、89. 85厘米、199. 2秒、93. 5

分,

这些数据是借助一定的重量、长度、时间或一定的测量标准而获得数据,分别代表事物的重量、长度、时间或者分数。

9符号代表的意义(课本20页)

(1)总体平均数,期望值⑵样本平均数(3)总体之间的相关系数⑷样本间的相关系数(5)总体标准差⑹样本标准差(7)总体间的回归系数(8)有限个体数目的总体(9)样本容量,样本大小

1?统计分组应注意哪些问题?答:进行统计分组时需要注意下列问题:

(1)分组要以被研究对象的本质特性为基础

面对大量原始数据进行分组时,有时需要先做初步的分类,分类或分组一定是要选择与被研究现象的本质的关的特性为依据,才能确保分类或分组的正确。在心理与教育学研究方面,专业知识的了解和熟悉对分组的正确进行有重要的作用。例如在学业成绩研究中按学科性质分类,在整理智力测验结果时,按言语智力、操作智力和总的智力分数分类等。

(2)分类标志要明确,要能包括所有的数据

对数据进行分组时,所依据的特性称为分组或分类的标志。整理数据时,分组标志要明确并在整理数据的过程中前后一致。这就是说,关于被研究现象本质特性的概念要明确,不能既是这个又是那个。另外,所依据的标志必须能将全部数据包括进去,不能有遗漏,也不能中途改变。

2. 直条图或叫条形图:主要用于表示离散型数据资料,即计数资料。详见课本45页。

3. 圆形图或叫饼图:主要用于描述间断性资料,目的是为显示多部分在整体中所占的比重大小,以及各部分之间的比较。

1?心理统计方法:统计学的原理和数学的方法在心理学领域中的运用。

2. 心理统计方法包括描述统计和推理统计两大部分。

3?实验数据可分为两类:准确数和近似值。

4. 确定组距以后,要考虑最小的一组从哪开始。显然,最小的一组应包含整个系列中的最小数值。

5. 在心理实验中常用的表格有三类:原始数据登记表,经过分组整理的次数分布表,带有对实验结果总结性质的表

6. 表示实验结果的图有:平面图和立体图。

7. 平面图一般分为:曲线图和直方图两类。

8. 平面图有两个坐标,横坐标代表心理实验中的刺激变量或自变量,纵坐标代表反应变量或因变量。当横坐标代表的数量是连续的,可画曲线图或直方图;当横坐标代表的数量不是连续的变量,而是不同类别时,就只能画直方图,其纵

坐标必须从0开始。

9. 累加次数分布图的横坐标是各组数据的上限。

10. 平均数指的是算术平均数。

11. 众数是最明显的集中趋势指标,但众数不如平均数和中数稳定。

12. 分组不适合会出现双峰,可调整组距。真正的双峰出现的原因是_有两种性

质不同的数据_。

13. 在偏斜的分布中,平均数总是处于偏斜的一端,而中数则永远把一个分布曲线下的面积分成相等的两部分。

14. q2-q1

q3-q2时,分布向_左(哪方大则朝哪方偏斜)偏斜。

15. 表示两个变量之间相关性质和程度的图,叫散布图。如果图中所有的点形成

一条直线,说明是一个完全正相关的散布图;如果是椭圆,这个椭圆越窄,说明

相关程度越_高______ 。

16. 从样本估计总体是以概率原则为基础的,如果样本中只包括随机误差就不致产生对总体偏性的估计;如果样本中还包括系统误差在内,就会产生偏性估计。

17. 当一个总体中的成分只分成两类时,根据传统,把_希望得到的结果,发生

的概率叫P;不希望得到的结果发生的概率叫q。

18. 在一系列正态分布中,有一个标准的正态分布,其平均数为_0,标准差为_ 1

19. ______________________ 当实验数据有―二组 ___________ 以上时,而且都是—不连续的变量时,要检

验各组间的差异是否显著就需要用c2分布进行计算。

20. 统计结果检验时:

1 ) w2为0. 14—时,实验效果较强,统计结果可信。

2 ) w2为0. 16—时,实验效果中等,统计结果可信度一般。

3 ) w2为0. 01—时,实验效果很差,统计结果不可信。

21. 用d值说明实验效果时:

1) d是0.2时,实验效果较小;2) d;是0.5时,效果中等;3) d>>0. 8_时,效果较大。概念1. 描述统计:是对成组数据概括的描述。描述统计的指标有三类:数据的集中趋势,数据的离中趋势,数据间的相关。

2. 推论统计:方法包括从样本的数量特性推测总体数量特性的一系列问题:推论假设,推论的各种方法和步骤,以及检验推测可靠性的各种方法。

3. 组距海一组上限和下限的差。(组距习上常用2, 3, 5, 10, 20

4. 中点:在某一组的下限和上限当中的那一点。

5. 集中趋势:是代表一系列数据的典型水平的数字指标,代表集中趋势的指标有平均数,中数和众数。

6. 平均数(x):是一组数据总和的平均值。

7. 中数(mdn): —系列按大小顺序排列的数据中的一个点,在这个系列中有一

半数据在这个点以上,有一半数据在这个点以下。

8. 众数(mo):在一系列数据中出现次数最多的那个数。

9. 全距:一个分布中最大的数值的上限减去最小数值的下限,就得到全距。(全

距大,说明这组数据分散;全距小,则较集中。使用时注意:1、无极端值;2,

比较两个分布的全距时,当两个分布所包含数据的数目相等或差不多时才能使

用)

10. 离中趋势:是表示一组数据分散程度的指标,常用的指标有:全距,四分

差,平均差和标准差。(如果离中趋势很小,说明数据分布都在平均数附近变动,因此平均数的代表性很大;如果离中趋势太大,说明数据分布太分散)

11. 四分差(q):是数据的离中趋势的指标之一,四分差说明按大小顺序排列

的一系列数据中间50%个数据的分散程度。(如果一个分布中间部分的数据比较集中,则两个四分点q3与q1就离得近些,a的值就小些。)

12. 百分点:某次数分布中处于某百分等级的数值。

13. 百分等级:某数值在某次数分布中所处的位置。

14. 平均差(ad): 一个分布中每个变量和平均数的差的绝对值的平均值。

15. 标准差:s2开方后的正值就叫标准差,是数据的离中趋势的指标之一。

16?离中系数(CV):用相对量来表示数据分散程度的数字指标。

17?相关程度:指相关是否密切,可分为无相关;部分相关;完全相关。

18?相关:是描述两种数量关系的一个指标,如果一个变量随另一个变量的增加(减小)而增加(减小),则两个变量之间存在着相关。

19. z分数(标准分数):是以标准差为单位所表示的原始分数(x)与平均数

的偏离,也可以说是一个以标准差为单位来表示的偏离分数。

20. 总体;某类事物的全部称为总体。

21. 样本:从全部抽出的部分叫样本。

22. 推论统计:从局部推测全部,从样本推测总体的统计程序。

23. 随机抽选样本:指总体中每个成分都有同等的机会被抽选。

24. 分层抽样:用分层抽样的方法,必须对总体有一定的了解,事先对于影响所研究问题的诸因素做适当安排。

25. 样本分布:从很多个样本中算出的很多个平均数的次数分配叫样本分布。

26. 正态分布:是一个中间高,两侧逐渐下降,两端永远不与横轴相交,两侧完全对称的钟形曲线。

27. 平均数的标准误(sx):为了和单个样本的标准差有所区别,把样本分布的标准差称做平均数的标准误。

28. 自由度(df):能够独立变化的数据的数目。

29. 平均数差的标准误(sxd ):分别从两个总体中抽取出的多个样本平均数的差(xd)的分布,这个分布的标准差叫做平均数差的标准误。

30. 虚无假设(ha):除概率以外不加任何其它假定,即假设二总体的平均数差异为0

31. 备则假设(ha):假设两个总体平均数之间差异中除了抽样误差外,还包括

有两个总体平均数之间的差异,即备则假设是个总体平均数之间差异不为O

32. 显著性生水平(P):我们所选择的推翻虚无假设的概率叫做检验的显著性水平。

33. 第一类错误:当虚无假设不应推翻时而被推翻了,这意味着把样本的平均数差别认为是代表了总体平均数的差异。

34. 第二类错误:当应该推翻虚无假设时而不推翻,这意味着把样本的平均数差别是代表总体平均数的差别这一事实给否认了。

35. 显著性检验:通过样本平均数的差别来推论总体平均数是否真正存在差别,并确定存在何种水平。

36. 回归:当两种变量间存在着一定程度的相关时,一种变量有向另一种变量的平均数趋近的现象,这种现象叫回归。

37. 回归方程式:从一变量的数值预测另一变量的相应数值的直线方程式,当两个变量部分相关时,有两个回归方程式。

38. 回归系数(byx):由x变量预测Y变量的回归方程式的斜率。

39. C2检验:是实际观察次数与假设次数偏离程度的指标。

40. 方差分析:根据组间和组内方差的比值,来比较两组或多组数据的差异是否达到显著。

41. 组间变异:在两组之间所产生的因变量的变异,就是系统变异,也就是由自变量引起的变异。因为这种变异发生在两组之间,所以又叫组间变异。

42. 组内变异:同一组内的因变量的变异,就不是由于自变量的情况不同引起的,而只是由于未加控制的变量引起的。因为这种变异发生在同一组内,所以叫做组内变异。

43. 组间设计:每个被试只参加1个水平的实验

44. 组内实际:每个被试参加所有水平的实验。

45?主效应:自变量所引起的平均数差异

46?交互作用:一个自变量对反应变量的影响因另一个自变量的变化而发生

1,伽利略提出了概率论的基本理论;法国数学家帕斯卡和费马创立了概率论,未统计学的

发展奠定了重要基础;贝奴里定理的产生,为发现正态概率分布创造了条件;棣莫弗推导出“正态曲线方程”;皮尔逊发表了频率曲线理论和积差相关;斯皮尔曼提出等级相关;肯德尔W 系数和U系数;格赛特T分布理论;费舍是推论统计真正的创始者,最先提出F分布

理论,使方差分析系统化;凯特勒他将统计方法应用于教育学和社会学的研究;斯内德克提

出方差分析;克一瓦氏H检验是一种非参数方差分析方法,它与参数方法中的完全随机资料方差分析相对应;费里德曼双向等级方差分析可解决随机区组实验设计的非参数检验问题

2:从数据的观测方法和来源划分,研究数据可分为计数数据和测量数据两大类;根据数据

反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型;按

相关主题
文本预览
相关文档 最新文档