现代心理与教育统计学笔记
- 格式:docx
- 大小:41.30 KB
- 文档页数:9
现代心理与教育统计学复习资料第一章心理与教育统计学基础知识1、数据类型称名数据计数数据离散型数据顺序数据等距数据测量数据连续型数据比率数据2、变量、随机变量、观测值变量就是可以挑相同值的量。
统计数据观测的指标都就是具备变异的指标。
当我们用一个量则表示这个指标的观测结果时,这个指标就是一个变量。
用来表示随机现象的变量,称为随机变量。
一般用大写的x或y表示随机变量。
随机变量所取得的值,称为观测值。
一个随机变量可以有许多个观测值。
3、总体、个体和样本须要研究的同质对象的全体,称作总体。
每一个具体内容研究对象,称作一个个体。
从总体中抽出的用以推测总体的部分对象的集合称为样本。
样本中包含的个体数,称为样本的容量n。
通常把容量n≥30的样本称作大样本;而n<30的样本称作大样本。
4、统计数据量和参数统计数据指标平均数标准差相关系数回归系数统计数据量srb参数μσρβ5、统计误差误差就是测量得值与真值之间的差值。
测出数值=真值+误差统计误差归纳起来可分为两类:测量误差与抽样误差。
由于采用的仪器、测量方法、读数方法等问题导致的测出值与真值之间的误差,称作测量误差。
由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差第二章统计图表一、数据的整理在展开整理时,如果没充裕的理由证明某数据就是由实验中的过错导致的,就无法轻而易举将其确定。
对于个别极端数据与否该剔出,应当遵从三个标准差法则。
二、次数原产表中(一)简单次(频)数分布表(二)相对次数分布表将次数原产表各组的实际次数转变为相对次数,即为用频数比率(f/n)或百分比f)去则表示次数,就可以做成相对次数原产表中(?100%n(三)累加次数分布表(四)双列次数分布表双列次数原产表中又称有关次数原产表中,就是对存有联系的两列变量用同一个表中则表示其次数原产。
所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。
张厚粲《现代心理与教育统计学》(第 3 版)笔记和课后习题详解第 1 章绪论一、统计方法在心理和教育科学研究中的作用(一)心理与教育统计的定义与性质1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
3 .统计学大致分为理论统计学(theoretical statistics )和应用统计学(applied statistics )两部分。
前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。
心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。
类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
(二)心理与教育科学研究数据的特点1.心理与教育科学研究数据与结果多用数字形式呈现2.心理与教育科学研究数据具有随机性和变异性3.心理与教育科学研究数据具有规律性4.心理与教育科学研究的目标是通过部分数据来推测总体特征(三)学习心理与教育统计应注意的事项1.学习心理与教育统计学要注意的几个问题(1)学习心理与教育统计学时,必须要克服畏难情绪。
心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。
(2)在学习时要注意重点掌握各种统计方法使用的条件。
(3)要做一定的练习。
2.应用心理与教育统计方法时要做到:(1)克服“统计无用”与“统计万能”的思想,注意科研道德。
(2)正确选用统计方法,防止误用和乱用统计。
二、心理与教育统计学的内容心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别。
(一)依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。
一二章、绪论现代统计学之父:皮尔逊描述统计与推断统计描述统计主要研究如何整理、描述数据的特征。
推断统计主要研究如何通过局部数据所提供的信息推论总体特征。
变量类型定类变量:如,性别、学号、颜色类别、教学方法。
特征:没有绝对零点,没有测量单位。
变量值之间有“相等”和“不等”的关系,但没有大小之分,不能比较大小,更不能进行加、减、乘、除四则运算。
定序变量:程度、等级和水平。
如,比赛名次、品质等级、喜爱程度特征:既无零点、又无测量单位。
变量的值之间具有“等于”或“不等于”关系、序关系(优于、先于、劣于、后于等),四则运算没有意义。
定比变量:除了可以说出名称和排出大小,还能算出差异大小量的变量。
如温度、测验成绩、智商。
特征:有相等的测量单位,无绝对零点。
考试成绩为零不表示没有一点知识。
可进行加减运算,乘除运算则无意义。
定距变量:如身高、重量、学生人数。
既有测量单位,又有绝对零点,可进行计算。
降低偏差:利用随机抽样 降低变异性:用大一点的样本三、描述统计一、频数:某一事件在某一类别中出现的次数。
频数分布类型:正态,正(负)偏态,正(反)J 形,U 形分布。
分布性质;集中(分散)程度,偏度和峰度不同。
偏态系数:数据的对称性 峰态系数:数据的峰度二、集中量数:包括算术平均数M 、中位数d M 、众数0M (用众数代表一组数据,可靠性较差,不过,众数不受极端数据的影响,并且求法简便)、加权平均数W M 、几何平均数g M 、调和平均数H M 。
组数据中有少数数据偏大或偏小,数据的分布呈偏态时,应用几何平均数。
算数平均数的性质(算法必须会):(1)每一个变量加减或乘除一个数之后,均值也相应增加。
(2)变量值与均值的离均差之和为零。
(3)变量值与均值的离均差平方和为最小值。
三、离散量数:全距R 、四分位差Q 、平均差A.D 、方差(样本统计量,2S 总体参数2σ)、标准差(s 或者SD)、百分位差全距:全部数据中的最大值与最小值的差 ,描述了数据分布的范围 。
《现代心理与教育统计学》(第4版)笔记和课后习题详解第1章绪论1.1复习笔记本章重点ü心理与教育统计的研究内容ü选择使用统计方法的基本步骤ü统计数据的基本类型ü心理与教育统计的基本概念一、统计方法在心理和教育科学研究中的作用(一)心理与教育统计的定义与性质1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。
前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。
心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。
类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
(二)心理与教育科学研究数据的特点1.心理与教育科学研究数据与结果多用数字形式呈现。
2.心理与教育科学研究数据具有随机性和变异性。
3.心理与教育科学研究数据具有规律性。
4.心理与教育科学研究的目标是通过部分数据来推测总体特征。
(三)学习心理与教育统计应注意的事项1.学习心理与教育统计学要注意的几个问题:(1)学习心理与教育统计学时,必须要克服畏难情绪。
心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。
(2)在学习时要注意重点掌握各种统计方法使用的条件。
(3)要做一定的练习。
2.应用心理与教育统计方法时要做到:(1)克服“统计无用”与“统计万能”的思想,注意科研道德。
(2)正确选用统计方法,防止误用和乱用统计。
张厚粲《现代心理与教育统计学》(第3版)笔记和课后习题详解第1章绪论一、统计方法在心理和教育科学研究中的作用(一)心理与教育统计的定义与性质1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(applied statistics)两部分。
前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。
心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。
类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
(二)心理与教育科学研究数据的特点1.心理与教育科学研究数据与结果多用数字形式呈现2.心理与教育科学研究数据具有随机性和变异性3.心理与教育科学研究数据具有规律性4.心理与教育科学研究的目标是通过部分数据来推测总体特征(三)学习心理与教育统计应注意的事项1.学习心理与教育统计学要注意的几个问题(1)学习心理与教育统计学时,必须要克服畏难情绪。
心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。
(2)在学习时要注意重点掌握各种统计方法使用的条件。
(3)要做一定的练习。
2.应用心理与教育统计方法时要做到:(1)克服“统计无用”与“统计万能”的思想,注意科研道德。
(2)正确选用统计方法,防止误用和乱用统计。
二、心理与教育统计学的内容心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别。
(一)依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。
张厚粲《现代心理与教育统计学》第3版笔记和课后习题含考研真题详解第14章抽样原理及方法14.1复习笔记本章重点✓各类抽样方法的概念✓抽样原理✓抽样方法的应用✓确定样本容量的方法在心理、教育以及其他领域的调查研究中,绝大部分不可能也没有必要对研究总体中的每个个体逐一进行调研。
一般是从中抽取一部分个体作为研究样本,应用参数估计或假设检验等统计方法,从样本的研究结果对总体特征进行推论。
这种推论的可靠性,一方面依赖于研究过程中无关变量的控制和数据处理的准确性,另一方面则依赖于样本的代表性。
一、抽样的意义和原则(一)抽样调查研究的意义1.抽样调查的概念(1)从总体中抽取部分个体组成样本,对样本进行观察或实验,获得样本信息,进而推断未知总体情况,称为抽样调查。
(2)抽样调查分为非概率抽样调查和概率抽样调查两大类。
①非概率抽样调查是依据调查者的经验有目的地挑选一部分个体组成样本,然后根据对样本的观察来推断总体的基本情况。
典型调查和重点调查就是常见的非概率抽样。
它常常不能作为推断未知总体参数的依据,而且不能计算调查结果的理论精确度和可靠程度。
②概率抽样调查则要求总体中每个个体被抽中的概率是已知的。
这样,研究者就可以根据概率论的原理,随机地抽取部分个体组成样本,然后利用各种推断统计的方法进行参数估计和假设检验,并能计算出调查结果的理论精确度和可靠程度。
(3)任何一个抽样调查都可能产生误差。
调查的总误差可以分为两部分:非抽样误差和抽样误差。
非抽样误差指漏报、错报、测量误差以及在调查结果的登录、汇总等环节上产生的误差,其误差大小很大程度上取决于调查的组织工作是否完善;抽样误差则是根据样本信息来推断总体信息时产生的随机误差。
2.抽样调查的作用(1)节省人力及费用(2)节省时间,提高调查研究的时效性(3)保证研究结果的准确性(二)抽样的基本原则1.随机化(randomization)是抽样研究的基本原则。
随机化原则,是指在进行抽样时,总体中每一个体是否被抽取,并不由研究者主观决定,而是每一个体按照概率原理被抽取的可能性是相等的。
1随机变量:在统计学上把取值之前;不能准确预料取到什么值的变量;称为随机变量..2总体:总体population又称为母全体或全域;是具有某种特征的一类事物的总体;是研究对象的全体..3样本:样本是从总体中抽取的一部分个体..4个体:构成总体的每个基本单元..5次数:是指某一事件在某一类别中出现的数目;又称作频数;用f表示.. 6频率:又称相对次数;即某一事件发生的次数除以总的事件数目;通常用比例或百分数来表示..7概率:概率论术语;指随机事件发生的可能性大小度量指标..其描述性定义..随机事件A在所有试验中发生的可能性大小的量值;称为事件A的概率;记为PA..8统计量:样本的特征值叫做统计量;又称作特征值..9参数:又称总体参数;是描述一个总体情况的统计指标..10观测值:随机变量的取值;一个随机变量可以有多个观测值..2何谓心理与教育统计学学习它有何意义答:1心理与教育统计学是专门研究如何运用统计学原理和方法;搜集、理、分析心理与教育科学研究中获得的随机性数据资料;并根据这些数据资料传递的信息;进行科学推论找出心理与教育统计活动规律的一门学科..具体讲;就是在心理与教育研究中;通过调查、实验、测量等手段有意地获取一些数据;并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理;最后得出结论的一种研究方法..2学习心理与教育统计学有重要的意义..①统计学为科学研究提供了一种科学方法..科学是一种知识体系..它的研究对象存在于现实世界各个领域的客观事实之中..它的主要任务是对客观事实进行预测和分类;从而揭示蕴藏于其中的种种因果关系..要提高对客观事实观测及分析研究的能力;就必须运用科学的方法..统计学正是提供了这样一种科学方法..统计方法是从事科学研究的一种必不可少的工具..②心理与教育统计学是心理与教育科研定量分析的重要工具..凡是客观存在事物;都有数量的表现..凡是有数量表现的事物;都可以进行测量..心理与教育现象是一种客观存在的事物;它也有数量的表现..虽然心理与教育测量具有多变性而且旨起它发生变化的因素很多;难以准确测量..但是它毕竟还是可以测量的..因此;在进行心理与教育科学研究时;在一定条件下;是可以对心理与教育现象进行定量分析的..心理与教育统计就是对心理与教育问题进行定量分析的重要的科学工具..③广大心理与教育工作者学习心理与教育统计学的具体意义..a.可经顺利阅读国内外先进的研究成果..b.可以提高心理与教育工作的科学性和效率..c.为学习心理与教育测量和评价打下基础..3.先用统计方法有哪几个步骤答:一项实验研究结果要用何种统计方法去分析;需要对实验数据进行认真的分析..只有做到对数据分析正确;才能对统计方法做出正确地选用..选用统计方法可以分为以下步骤:1首先;要分析一下实验数据是否合理;即所或得的数据是否适合用统计法去处理;正确的数量化是应用统计方法的起步;如果对数量化的过程及其意义没有了解;将一些不着边际的数据加以统计处理是毫无意义的..2其次;要分析实验数据的类型..不同数据类型所使用的统计方法有很大差别;了解实验数据的类型和水平;对选用恰当的统计方法至关重要..3第三;要分析数据的分布规律;如总体方差的情况;确定其是否满足所选用的统计方法的前提条件..4.什么叫随机变量心理与教育科学实验所获得的数据是否属于随机变量答:1在统计学上把取值之前;不能准确预料取到什么值的变量;称为随机变量..2心理与教育科学实验所获得的数据属于随机变量..心理与教育科学研究数据具有随机性和变异性..科学研究中因观测人员、观测工具、观测条件的变化而具有随机变化的现象..在心理和教育科学领域;研究获得的数据资料也具有一定随机性质..观测数据的这种特点;称为变异性..即便使用同一种测量工具;观测同一事物;只要是进次;那么获得的数据就不会完全相同..随着测量工具的完善和精确;数据的这种随机性变化就更明显..例如;人们对同一年级或同一年龄儿童甚至对同一个人进行同一学科的学业测试;或对同一个心理特点进行评量、观察多次;得到的数据绝不会全然相同;这些数据总是在一定的范围内变化..造成数据变异的原因;出自观测过程中一些偶然的不可控制的因素;称随机因素..随机因素使测量产生的误差称作随机误差..由于这种随机误差的存在;使得在相同条件下观测的结果常常不止一个;并且事前无法确定;这是客观世界存在的一种普遍现象;人们称这类现象为随机现象..在教育和心理科学的各类研究中;研究的对象是人的内在的种种心理现象;不仅由客观上一些偶然因素会引起测量误差;由实验者和被试主观上一些不可控制的偶然因素也会造成测量误差;这些偶然因素+分复杂;因而造成的随机误差就更大;也就是使心理与教育科学研究中得到的数据具有的变异性..5..怎样理解总体、样本与个体..答:根据其各自的定义;我们可以用下面这个图来表示..大圆表示研究对象的全体;也就是总体;大圆中的小圆表示其中一个样本;大圆中所有的点代表的是样本..6、统计量与参数之间有何区别和关系..答:1参数是描述总体情况的统计指标;样本的特征值称作统计量..2区别:1参数是从总体中计算得到的量数;代表总体特征;一个常数..统计量是从一个样本中计算得到的量数;它描述一组数据的情况;是一个变量;随样本的变化而变化..2参数常用希腊字母表示;样本统计量用英文字母表示..3联系:1参数通常是通过样本特征值来预测得到;7、答案略8、下述一些数据;哪些是测量数据哪些是计数数据其数值意味什么117. 0千克2 89. 85厘米3 199. 2秒4 17人5 25本6 93. 5答:上面的数据中测量数据有:1 17.0千克2 89. 85厘米3 199. 2秒6 93. 5分计数数据有:4 17人5 25本2 17. 0千克、89. 85厘米、199. 2秒、分;这些数据是借助一定的重量、长度、时间或一定的测量标准而获得数据;分别代表事物的重量、长度、时间或者分数..9符号代表的意义课本20页1总体平均数;期望值 2样本平均数 3总体之间的相关系数 4样本间的相关系数5总体标准差 6样本标准差 7总体间的回归系数 8有限个体数目的总体9样本容量;样本大小1.统计分组应注意哪些问题答:进行统计分组时需要注意下列问题:1分组要以被研究对象的本质特性为基础面对大量原始数据进行分组时;有时需要先做初步的分类;分类或分组一定是要选择与被研究现象的本质的关的特性为依据;才能确保分类或分组的正确..在心理与教育学研究方面;专业知识的了解和熟悉对分组的正确进行有重要的作用..例如在学业成绩研究中按学科性质分类;在整理智力测验结果时;按言语智力、操作智力和总的智力分数分类等..2分类标志要明确;要能包括所有的数据对数据进行分组时;所依据的特性称为分组或分类的标志..整理数据时;分组标志要明确并在整理数据的过程中前后一致..这就是说;关于被研究现象本质特性的概念要明确;不能既是这个又是那个..另外;所依据的标志必须能将全部数据包括进去;不能有遗漏;也不能中途改变..2、直条图或叫条形图:主要用于表示离散型数据资料;即计数资料..详见课本45页..3、圆形图或叫饼图:主要用于描述间断性资料;目的是为显示多部分在整体中所占的比重大小;以及各部分之间的比较..1.心理统计方法:统计学的原理和数学的方法在心理学领域中的运用..2.心理统计方法包括描述统计和推理统计两大部分..3.实验数据可分为两类:准确数和近似值..4.确定组距以后;要考虑最小的一组从哪开始..显然;最小的一组应包含整个系列中的最小数值..5.在心理实验中常用的表格有三类:原始数据登记表;经过分组整理的次数分布表;带有对实验结果总结性质的表6.表示实验结果的图有:平面图和立体图..7.平面图一般分为:曲线图和直方图两类..8.平面图有两个坐标;横坐标代表心理实验中的刺激变量或自变量;纵坐标代表反应变量或因变量..当横坐标代表的数量是连续的;可画曲线图或直方图;当横坐标代表的数量不是连续的变量;而是不同类别时;就只能画直方图;其纵坐标必须从0开始..9.累加次数分布图的横坐标是各组数据的上限..10.平均数指的是算术平均数..11.众数是最明显的集中趋势指标;但众数不如平均数和中数稳定..12.分组不适合会出现双峰;可调整组距..真正的双峰出现的原因是_有两种性质不同的数据_..13.在偏斜的分布中;平均数总是处于偏斜的一端;而中数则永远把一个分布曲线下的面积分成相等的两部分..14. q2-q1<q3-q2时;分布向右偏斜;q2-q1=q3-q2时;分布向对称;q2-q1> q3-q2时;分布向_左哪方大则朝哪方偏斜偏斜..15.表示两个变量之间相关性质和程度的图;叫散布图..如果图中所有的点形成一条直线;说明是一个完全正相关的散布图;如果是椭圆;这个椭圆越窄;说明相关程度越_高_____..16.从样本估计总体是以概率原则为基础的;如果样本中只包括随机误差就不致产生对总体偏性的估计;如果样本中还包括系统误差在内;就会产生偏性估计..17.当一个总体中的成分只分成两类时;根据传统;把_希望得到的结果;发生的概率叫P;不希望得到的结果发生的概率叫q..18.在一系列正态分布中;有一个标准的正态分布;其平均数为_0;标准差为_ 119.当实验数据有___二组____以上时;而且都是__不连续_____的变量时;要检验各组间的差异是否显着就需要用c2分布进行计算..20.统计结果检验时:1 w2为0. 14_时;实验效果较强;统计结果可信..2 w2为0. 16_时;实验效果中等;统计结果可信度一般..3 w2为0. 01_时;实验效果很差;统计结果不可信..21.用d值说明实验效果时:1 d是0.2时;实验效果较小;2 d;是0.5时;效果中等;3 d>>0. 8_时;效果较大..概念1.描述统计:是对成组数据概括的描述..描述统计的指标有三类:数据的集中趋势;数据的离中趋势;数据间的相关..2.推论统计:方法包括从样本的数量特性推测总体数量特性的一系列问题:推论假设;推论的各种方法和步骤;以及检验推测可靠性的各种方法..3.组距:每一组上限和下限的差..组距习上常用2; 3; 5; 10; 204.中点:在某一组的下限和上限当中的那一点..5.集中趋势:是代表一系列数据的典型水平的数字指标;代表集中趋势的指标有平均数;中数和众数..6.平均数x:是一组数据总和的平均值..7.中数mdn:一系列按大小顺序排列的数据中的一个点;在这个系列中有一半数据在这个点以上;有一半数据在这个点以下..8.众数mo:在一系列数据中出现次数最多的那个数..9.全距:一个分布中最大的数值的上限减去最小数值的下限;就得到全距..全距大;说明这组数据分散;全距小;则较集中..使用时注意:1、无极端值;2;比较两个分布的全距时;当两个分布所包含数据的数目相等或差不多时才能使用10.离中趋势:是表示一组数据分散程度的指标;常用的指标有:全距;四分差;平均差和标准差..如果离中趋势很小;说明数据分布都在平均数附近变动;因此平均数的代表性很大;如果离中趋势太大;说明数据分布太分散11.四分差q:是数据的离中趋势的指标之一;四分差说明按大小顺序排列的一系列数据中间50%个数据的分散程度..如果一个分布中间部分的数据比较集中;则两个四分点q3与q1就离得近些;a的值就小些..12.百分点:某次数分布中处于某百分等级的数值..13.百分等级:某数值在某次数分布中所处的位置..14.平均差ad:一个分布中每个变量和平均数的差的绝对值的平均值..15.标准差:s2开方后的正值就叫标准差;是数据的离中趋势的指标之一..16.离中系数CV:用相对量来表示数据分散程度的数字指标..17.相关程度:指相关是否密切;可分为无相关;部分相关;完全相关..18.相关:是描述两种数量关系的一个指标;如果一个变量随另一个变量的增加减小而增加减小;则两个变量之间存在着相关..19. z分数标准分数:是以标准差为单位所表示的原始分数x与平均数的偏离;也可以说是一个以标准差为单位来表示的偏离分数..20.总体;某类事物的全部称为总体..21.样本:从全部抽出的部分叫样本..22.推论统计:从局部推测全部;从样本推测总体的统计程序..23.随机抽选样本:指总体中每个成分都有同等的机会被抽选..24.分层抽样:用分层抽样的方法;必须对总体有一定的了解;事先对于影响所研究问题的诸因素做适当安排..25.样本分布:从很多个样本中算出的很多个平均数的次数分配叫样本分布..26.正态分布:是一个中间高;两侧逐渐下降;两端永远不与横轴相交;两侧完全对称的钟形曲线..27.平均数的标准误sx:为了和单个样本的标准差有所区别;把样本分布的标准差称做平均数的标准误..28.自由度df:能够独立变化的数据的数目..29.平均数差的标准误sxd :分别从两个总体中抽取出的多个样本平均数的差xd的分布;这个分布的标准差叫做平均数差的标准误..30.虚无假设ha:除概率以外不加任何其它假定;即假设二总体的平均数差异为O31.备则假设ha:假设两个总体平均数之间差异中除了抽样误差外;还包括有两个总体平均数之间的差异;即备则假设是个总体平均数之间差异不为O32.显着性生水平P:我们所选择的推翻虚无假设的概率叫做检验的显着性水平..33.第一类错误:当虚无假设不应推翻时而被推翻了;这意味着把样本的平均数差别认为是代表了总体平均数的差异..34.第二类错误:当应该推翻虚无假设时而不推翻;这意味着把样本的平均数差别是代表总体平均数的差别这一事实给否认了..35.显着性检验:通过样本平均数的差别来推论总体平均数是否真正存在差别;并确定存在何种水平..36.回归:当两种变量间存在着一定程度的相关时;一种变量有向另一种变量的平均数趋近的现象;这种现象叫回归..37.回归方程式:从一变量的数值预测另一变量的相应数值的直线方程式;当两个变量部分相关时;有两个回归方程式..38.回归系数byx:由x变量预测Y变量的回归方程式的斜率..39.c2检验:是实际观察次数与假设次数偏离程度的指标..40.方差分析:根据组间和组内方差的比值;来比较两组或多组数据的差异是否达到显着..41.组间变异:在两组之间所产生的因变量的变异;就是系统变异;也就是由自变量引起的变异..因为这种变异发生在两组之间;所以又叫组间变异..42.组内变异:同一组内的因变量的变异;就不是由于自变量的情况不同引起的;而只是由于未加控制的变量引起的..因为这种变异发生在同一组内;所以叫做组内变异..43.组间设计:每个被试只参加1个水平的实验44.组内实际:每个被试参加所有水平的实验..45.主效应:自变量所引起的平均数差异46.交互作用:一个自变量对反应变量的影响因另一个自变量的变化而发生1;伽利略提出了概率论的基本理论;法国数学家帕斯卡和费马创立了概率论;未统计学的发展奠定了重要基础;贝奴里定理的产生;为发现正态概率分布创造了条件;棣莫弗推导出“正态曲线方程”;皮尔逊发表了频率曲线理论和积差相关;斯皮尔曼提出等级相关;肯德尔W系数和U系数;格赛特T分布理论;费舍是推论统计真正的创始者;最先提出F分布理论;使方差分析系统化;凯特勒他将统计方法应用于教育学和社会学的研究;斯内德克提出方差分析;克一瓦氏H检验是一种非参数方差分析方法;它与参数方法中的完全随机资料方差分析相对应;费里德曼双向等级方差分析可解决随机区组实验设计的非参数检验问题2:从数据的观测方法和来源划分;研究数据可分为计数数据和测量数据两大类;根据数据反映的测量水平;可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型;按照数据是否具有连续性;把数据分为离散数据和连续数据3:统计表的儿个组成要素:表号、名称、标目、数字、表注..4:统计图的组成部分:图号及图题、图目、图尺、图形、图例、图注5:次数分布显示初步整理后一组数据的分布情况主要表示数据在各个分组区问内的散布情况;可分为简单次数分布、分组次数分布、相对次数分布、累计次数分布..6:常用的次数分布图有直方图、次数多边形图及累加次数分布图..7:其它常用的统计图的类别:直方图、条形图、圆形图、线形图、散点图:条形图又分为简单条形图、分组条形图、分段条形图8:其它常用统计表类型:简单表、分组表、复合表9:用来描述数据集中趋势和离中趋势的统计量分别称为集中量数和差异量数..10:集中量数包括:算数平均数、中数、众数、加权平均数、儿何平均数、调和平均数等..12:平均数的优缺点:优点:反应灵敏、计算严密、计算简单、简明易解、适合于进一步用代数方法演算、较少受抽样变动的影响;缺点:易受极端数据的影响、若出现模糊不清的数据时;无法计算平均数..13:计算和应用平均数的原则:同质性原则、平均数与个体数值相结合的原则、平均数与标准差、发差相结合的原则14:差异量数就是对一组数据的变异性;即离中趋势特点进行度量和描述的统计量..15:差异量数有:全距、四分位差、白一分位差、平均差、标准差与方差16:相关类别为:正相关、负相关、零相关17:质量相关分为:点二列相关、二列相关及多系列相关18:品质相关:主要分为四分相关、C相关、列联表相关19:概率:是表明随机事件出现可能性大小的客观指标就是概率;概率的定义有两种即后验概率和先验概率20:概率分布类型:160页离散分布与连续分布、经验分布与理论分布、基本随机变量分布与抽样分布21“概率分布:是指对随机变量取值的概率分布情况用数学方法函数进行描述22:连续分布:是指连续随机变量的概率分布;即测量数据的概率分布;它用连续随机变量的分布函数描述它的分布规律23:离散分布:离散随机变量的分布又称作离散分布24:经验分布:是指根据观察或实验所获得的数据而编制的次数分布或相对频率分布25:理论分布:一是随机变量概率分布的函数一数学模型;二是按某种数学模型计算出的总体的次数分布26: 抽样分布:是样本统计量的理论分布;样本统计量有:平均数、两平均数之差、方差、标准差、相关系数、回归系数、白一分比率等..27:正态分布:也称常态分布或常态分配;是连续随机变量概率分布的一种;正态分布N C0;1称为标准正态分布;它的平均值是0;标准差是1.28:二项分布:是指试验仅有两种不同性质结果的概率分布;具体定义是:设有N次试验;各次试验是彼此独立的;每次试验某事件出现的概率都是P;某事件不出现的概率都是q等于1-P..则对于某事件出现X次0;1;2;3.0 0 o n的概率分布为为29:除了标准正态Z分布外;儿种常见的抽样分布包括X的平方分布;T分布;F分布..30:点估计:是用样本统计量来估计总体参数;因为样本统计量为数值上某一点值;估计的结果也以一个点的数值表示;所以称为点估计..31:良好估计量的特性:无偏性、有效性、一致性、充分性犯:区问估计:就是根据估量值以一定可靠程度推断总体参数所在的区问范围;它是用数轴上的一段距离表示未知参数可能落入的范围;他虽不具体指出总体参数等于什么;但能指出未知总体参数落入某一区问的概率有多大33:置信区问:也称置信问距;是指在某一置信度时;总体参数所在的区域距离或区域长度..置信区问的上下两端点值称为置信界限..34:显着性水平是指估计总体参数落在某一区问时;可能犯错误的概率;用符号a表示35:假设检验:通过样本统计量得出的差异做出一般性结论;判断总体参数之问是否存在差异;这种推论过程称作假设检验;它的基本任务就是事先对总体参数或总体分布形态做出一个假设;然后利用样本信息来判断原假设是否合理;从而决定是否接收原假设..假设检验包括“参数检验”和“非参数检验”..36:参数假设检验:若进行假设检验时总体的分布形式已知;需要对总体的未知参数进行假设检验;非参数假设检验:若对总体分布形式37:方差分析:主要功能在于分析实验数据中不同来源的变异对总变异的贡献大小;从而确定实验中的白变量是否对因变量有重要影响38:方差分析的基本原理:综合虚无假设和部分虚无假设、方差的可分解性39:平方和:指观测数据与平均数离差的平方总和40:总变异被分解为“组问变异”和“组内变异"41:组问变异:主要指由于接受不同的2而造成的各组之问的变异;可以用两个平均数之问的差异表示42:组内变异:是由组内各被试因变量的差异范围决定的;主要指由实验误差、或组内被试之问的差异造成的变异..43:发差分析的基本假定:总体正态分布、变异的相互独立性、各实验处理内的方差要一致44:组内设计:又称被试内设计;是指每个被试都要接受所有白变量水平的实验处理45:完全随机设计的方差分析:就是对单因素组问设计的方差分析;在这种实验研究设计中;各种处理的分类仅以单个实验变量为基础;因而把它称为单因素方差分析或单向方差分析46:随机区组设计的方差分析:根据被试特点把被试划分为儿个区组;再根。
概念(1)随机变量:在统计学上把取值之前,不克不及精确预感取到什么值的变量,称为随机变量.(2)总体:总体(population)又称为母全部或全域,是具有某种特点的一类事物的总体,是研讨对象的全部.(3)样本:样本是从总体中抽取的一部分个别.(4)个别:构成总体的每个根本单元.(5)次数:是指某一事宜在某一类别中消失的数量,又称作频数,用f暗示.(6)频率:又称相对次数,即某一事宜产生的次数除以总的事宜数量,通经常应用比例或百分数来暗示.(7)概率:概率论术语,指随机事宜产生的可能性大小器量指标.其描写性定义.随机事宜A在所有实验中产生的可能性大小的量值,称为事宜A的概率,记为P(A).(8)统计量:样本的特点值叫做统计量,又称作特点值.(9)参数:又称总体参数,是描写一个总体情形的统计指标.(10)不雅测值:随机变量的取值,一个随机变量可以有多个不雅测值.2何谓心理与教导统计学?进修它有何意义?答:(1)心理与教导统计学是专门研讨若何应用统计学道理和办法,汇集.整理.剖析心理与教导科学研讨中获得的随机性数据材料,并根据这些数据材料传递的信息,进行科学推论找出心理与教导统计运动纪律的一门学科.具体讲,就是在心理与教导研讨中,经由过程查询拜访.实验.测量等手腕有意地获取一些数据,并将得到的数据按统计学道理和步调加以整顿.盘算.绘制图表.剖析.断定.推理,最后得出结论的一种研讨办法.(2)进修心理与教导统计学有重要的意义.①统计学为科学研讨供给了一种科学办法.科学是一种常识体系.它的研讨对象消失于实际世界各个范畴的客不雅事实之中.它的重要义务是对客不雅事实进行猜测和分类,从而揭示储藏于个中的各种因果关系.要进步对客不雅事实不雅测及剖析研讨的才能,就必须应用科学的办法.统计学恰是供给了如许一种科学办法.统计办法是从事科学研讨的一种必不成少的工具.②心理与教导统计学是心理与教导科研定量剖析的重要对象.凡是客不雅消失事物,都稀有量的表示.凡是稀有量表示的事物,都可以进行测量.心理与教导现象是一种客不雅消失的事物,它也稀有量的表示.固然心理与教导测量具有多变性并且旨起它产生变更的身分许多,难以精确测量.但是它毕竟照样可以测量的.是以,在进行心理与教导科学研讨时,在必定前提下,是可以对心理与教导现象进行定量剖析的.心理与教导统计就是对心理与教导问题进行定量剖析的重要的科学对象.③宽大心理与教导工作者进修心理与教导统计学的具体意义.a.可经顺遂浏览国表里先辈的研讨成果.b.可以进步心理与教导工作的科学性和效力.c.为进修心理与教导测量和评价打下基本.?答:一项实验研讨成果要用何种统计办法去剖析,须要对实验数据进行卖力的分析.只有做到对数据剖析精确,才干对统计办法做出精确地选用.选用统计办法可以分为以下步调:(1)起首,要剖析一下实验数据是否合理,即所或得的数据是否合实用统计方法行止理,精确的数量化是应用统计办法的起步,假如对数量化的进程及其意义没有懂得,将一些不着边沿的数据加以统计处理是毫无意义的.(2)其次,要剖析实验数据的类型.不合数据类型所应用的统计办法有很大差别,懂得实验数据的类型和程度,对选用恰当的统计办法至关重要.(3)第三,要剖析数据的分布纪律,如总体方差的情形,肯定其是否知足所选用的统计办法的前提前提.4.什么叫随机变量?心理与教导科学实验所获得的数据是否属于随机变量?答:(1)在统计学上把取值之前,不克不及精确预感取到什么值的变量,称为随机变量.(2)心理与教导科学实验所获得的数据属于随机变量.心理与教导科学研讨数据具有随机性和变异性.科学研讨中因不雅测人员.不雅测对象.不雅测前提的变更而具有随机变更的现象.在心理和教导科学范畴,研讨获得的数据材料也具有必定随机性质.不雅测数据的这种特色,称为变异性.即便应用统一种测量对象,不雅测统一事物,只如果进行多次,那么获得的数据就不会完整雷同.跟着测量对象的完美和精确,数据的这种随机性变更就更明显.例如,人们对统一年级或统一年纪儿童甚至对统一小我进行统一学科的学业测试,或对统一个心理特色进行评量.不雅察多次,得到的数据毫不会全然雷同,这些数据老是在必定的规模内变更.造成数据变异的原因,出自不雅测进程中一些有时的不成掌握的身分,称随机身分.随机身分使测量产生的误差称作随机误差.因为这种随机误差的消失,使得在雷同前提下不雅测的成果常常不止一个,并且事前无法肯定,这是客不雅世界消失的一种广泛现象,人们称这类现象为随机现象.在教导和心理科学的各类研讨中,研讨的对象是人的内涵的各种心理现象,不但由客不雅上一些有时身分会引起测量误差,由实验者和被试主不雅上一些不成掌握的有时身分也会造成测量误差,这些有时身分+分庞杂,因而造成的随机误差就更大,也就是使心理与教导科学研讨中得到的数据具有更明显的变异性.5.如何懂得总体.样本与个别.答:根据其各自的界说,我们可以用下面这个图来暗示.大圆暗示研讨对象的全体,也就是总体;大圆中的小圆暗示个中一个样本,大圆中所有的点代表的是样本.6.统计量与参数之间有何差别和关系.答:(1)参数是描写总体情形的统计指标;样本的特点值称作统计量.(2)差别:1参数是从总体中盘算得到的量数,代表总体特点,一个常数.统计量是从一个样本中盘算得到的量数,它描写一组数据的情形,是一个变量,随样本的变更而变更.2参数经常应用希腊字母暗示,样本统计量用英文字母暗示.(3)接洽:1参数平日是经由过程样本特点值来猜测得到,(7.答案略)8.下述一些数据,哪些是测量数据?哪些是计数数据?其数值意味什么?(1)17. 0千克(2 ) 89. 85厘米(3) 199. 2秒(4) 17人(5) 25本(6 ) 93. 5答:上面的数据中测量数据有:(1) 17.0千克(2 ) 89. 85厘米(3 ) 199. 2秒(6)93. 5分计数数据有:(4) 17人(5) 25本(2) 17. 0千克.89. 85厘米.199. 2秒.93. 5分,这些数据是借助必定的重量.长度.时光或必定的测量尺度而获得数据,分别代表事物的重量.长度.时光或者分数.9符号代表的意义(教材20页)(1)总体平均数,期望值 (2)样本平均数 (3)总体之间的相干系数 (4)样本间的相干系数 (5)总体尺度差 (6)样本尺度差 (7)总体间的回归系数 (8)有限个别数量标总体 (9)样本容量,样本大小1.统计分组应留意哪些问题?答:进行统计分组时须要留意下列问题:(1)分组要以被研讨对象的本质特点为基本面对大量原始数据进行分组时,有时须要先做初步的分类,分类或分组必定是要选择与被研讨现象的本质的关的特点为根据,才干确保分类或分组的精确.在心理与教导学研讨方面,专业常识的懂得和熟习对分组的精确进行有重要的感化.例如在学业成绩研讨中按学科性质分类,在整顿智力磨练成果时,按言语智力.操纵智力和总的智力分数分类等.(2)分类标记要明白,要能包含所有的数据对数据进行分组时,所根据的特点称为分组或分类的标记.整顿数据时,分组标志要明白并在整顿数据的进程中前后一致.这就是说,关于被研讨现象本质特点的概念要明白,不克不及既是这个又是谁人.别的,所根据的标记必须能将全部数据包含进去,不克不及有漏掉,也不克不及半途转变.2.直条图或叫条形图:重要用于暗示离散型数据材料,即计数材料.详见教材45页.3.圆形图或叫饼图:重要用于描写间断性材料,目标是为显示多部分在整体中所占的比重大小,以及各部分之间的比较.:统计学的道理和数学的办法在心理学范畴中的应用.描写统计和推理统计两大部分.3.实验数据可分为两类:精确数和近似值.4.肯定组距今后,要斟酌最小的一组从哪开端.显然,最小的一组应包含全部系列中的最小数值.5.在心理实验中经常应用的表格有三类:原始数据登记表,经由火组整顿的次数分布表,带有对实验成果总结性质的表6.暗示实验成果的图有:平面图和立体图.7.平面图一般分为:曲线图和直方图两类.8.平面图有两个坐标,横坐标代表心理实验中的刺激变量或自变量,纵坐标代表反响变量或因变量.当横坐标代表的数量是持续的,可画曲线图或直方图;当横坐标代表的数量不是持续的变量,而是不合类别时,就只能画直方图,其纵坐标必须从0开端.上限.算术平均数.明显的分散趋向指标,但众数不如平均数和中数稳固.12.分组不合适会消失双峰,可调剂组距.真正的双峰消失的原因是_有两种性质不合的数据_.13.在偏斜的分布中,平均数老是处于偏斜的一端,而中数则永久把一个分布曲线下的面积分成相等的两部分.14. q2-q1<q3-q2时,分布向右偏斜;q2-q1=q3-q2时,分布向对称;q2-q1>q3-q2时,分布向_左(哪方大则朝哪方偏斜)偏斜.15.暗示两个变量之间相干性质和程度的图,叫分布图.假如图中所有的点形成一条直线,解释是一个完整正相干的分布图;假如是椭圆,这个椭圆越窄,解释相干程度越_高_____.16.从样本估计总体是以概率原则为基本的,假如样本中只包含随机误差就不致产生对总体偏性的估计;假如样本中还包含体系误差在内,就会产生偏性估计.17.当一个总体中的成分只分成两类时,根据传统,把_愿望得到的成果,产生的概率叫P;不愿望得到的成果产生的概率叫q.18.在一系列正态分布中,有一个尺度的正态分布,其平均数为_0,尺度差为_ 119.当实验数据有___二组____以上时,并且都是__不持续_____的变量时,要检验各组间的差别是否明显就须要用c2分布进行盘算.20.统计成果磨练时:1 ) w2为0. 14_时,实验后果较强,统计成果可托.2 ) w2为0. 16_时,实验后果中等,统计成果可托度一般.3 ) w2为0. 01_时,实验后果很差,统计成果不成信.21.用d值解释实验后果时:1) d是0.2时,实验后果较小; 2) d;是0.5时,后果中等; 3)d>>0. 8_时,后果较大.概念1.描写统计:是对成组数据归纳分解的描写.描写统计的指标有三类:数据的分散趋向,数据的离中趋向,数据间的相干.2.推论统计:办法包含从样本的数量特点推想总体数量特点的一系列问题:推论假设,推论的各类办法和步调,以及磨练推想靠得住性的各类办法.3.组距:每一组上限和下限的差.(组距习上经常应用2, 3, 5, 10, 204.中点:在某一组的下限和上限当中的那一点.5.分散趋向:是代表一系列数据的典范程度的数字指标,代表分散趋向的指标有平均数,中数和众数.6.平均数(x):是一组数据总和的平均值.7.中数(mdn):一系列按大小次序分列的数据中的一个点,在这个系列中有一半数据在这个点以上,有一半数据在这个点以下.8.众数(mo):在一系列数据中消失次数最多的谁人数.9.全距:一个分布中最大的数值的上限减去最小数值的下限,就得到全距.(全距大,解释这组数据疏散;全距小,则较分散.应用时留意:1.无极端值;2,比较两个分布的全距时,当两个分布所包含数据的数量相等或差不久不多时才干使用)10.离中趋向:是暗示一组数据疏散程度的指标,经常应用的指标有:全距,四分差,平均差和尺度差.(假如离中趋向很小,解释数据分布都在平均数邻近变动,是以平均数的代表性很大;假如离中趋向太大,解释数据分布太疏散)11.四分差(q):是数据的离中趋向的指标之一,四分差解释按大小次序分列的一系列数据中心50%个数据的疏散程度.(假如一个分布中心部分的数据比较分散,则两个四分点q3与q1就离得近些,a的值就小些.)12.百分点:某次数分布中处于某百分等级的数值.13.百分等级:某数值在某次数分布中所处的地位.14.平均差(ad):一个分布中每个变量和平均数的差的绝对值的平均值.15.尺度差:s2开方后的正值就叫尺度差,是数据的离中趋向的指标之一.16.离中系数(CV):用相对量来暗示数据疏散程度的数字指标.:指相干是否亲密,可分为无相干;部分相干;完整相干.18.相干:是描写两种数量关系的一个指标,假如一个变量随另一个变量的增加(减小)而增长(减小),则两个变量之间消失着相干.19. z分数(尺度分数):是以尺度差为单位所暗示的原始分数(x)与平均数的偏离,也可以说是一个以尺度差为单位来暗示的偏离分数.20.总体;某类事物的全部称为总体.21.样本:从全部抽出的部分叫样本.22.推论统计:从局部推想全部,从样本推想总体的统计程序.23.随机抽选样本:指总体中每个成分都有一致的机遇被抽选.24.分层抽样:用分层抽样的办法,必须对总体有必定的懂得,事先对于影响所研讨问题的诸身分做恰当安插.25.样本分布:从许多个样本中算出的许多个平均数的次数分派叫样本分布.26.正态分布:是一个中心高,两侧逐渐降低,两头永久不与横轴订交,两侧完整对称的钟形曲线.27.平均数的尺度误(sx):为了和单个样本的尺度差有所差别,把样本分布的尺度差称做平均数的尺度误.28.自由度(df):可以或许自力变更的数据的数量.29.平均数差的尺度误(sxd ):分别从两个总体中抽掏出的多个样本平均数的差(xd)的分布,这个分布的尺度差叫做平均数差的尺度误.30.虚无假设(ha):除概率以外不加任何其它假定,即假设二总体的平均数差别为O31.备则假设(ha):假设两个总体平均数之间差别中除了抽样误差外,还包含有两个总体平均数之间的差别,即备则假设是个总体平均数之间差别不为O32.明显性生程度(P):我们所选择的颠覆虚无假设的概率叫做磨练的明显性程度.33.第一类错误:当虚无假设不该颠覆时而被颠覆了,这意味着把样本的平均数不同以为是代表了总体平均数的差别.34.第二类错误:当应当颠覆虚无假设时而不颠覆,这意味着把样本的平均数不同是代表总体平均数的不同这一事实给否定了.35.明显性磨练:经由过程样本平均数的不同来推论总体平均数是否真正消失不同,并肯定消失何种程度.36.回归:当两种变量间消失着必定程度的相干时,一种变量有向另一种变量的平均数趋近的现象,这种现象叫回归.37.回归方程式:从一变量的数值猜测另一变量的响应数值的直线方程式,当两个变量部分相干时,有两个回归方程式.38.回归系数(byx):由x变量猜测Y变量的回归方程式的斜率.39.c2磨练:是实际不雅察次数与假设次数偏离程度的指标.40.方差剖析:根据组间和组内方差的比值,来比较两组或多组数据的差别是否达到明显.41.组间变异:在两组之间所产生的因变量的变异,就是体系变异,也就是由自变量引起的变异.因为这种变异产生在两组之间,所以又叫组间变异.42.组内变异:统一组内的因变量的变异,就不是因为自变量的情形不合引起的,而只是因为未加掌握的变量引起的.因为这种变异产生在统一组内,所以叫做组内变异.43.组间设计:每个被试只介入1个程度的实验44.组内实际:每个被试介入所有程度的实验.45.主效应:自变量所引起的平均数差别46.交互感化:一个自变量对反响变量的影响因另一个自变量的变更而产生1,伽利略提出了概率论的根本理论;法国数学家帕斯卡和费马创立了概率论,未统计学的成长奠基了重要基本;贝奴里定理的产生,为发明正态概率分布创造了前提;棣莫弗推导出“正态曲线方程”;皮尔逊揭橥了频率曲线理论和积差相干;斯皮尔曼提出等级相干;肯德尔W系数和U系数;格赛特T分布理论;费舍是推论统计真正的创始者,最先提出F分布理论,使方差剖析体系化;凯特勒他将统计办法应用于教导学和社会学的研讨;斯内德克提出方差剖析;克一瓦氏H磨练是一种非参数方差剖析办法,它与参数办法中的完整随机材料方差剖析相对应;费里德曼双向等级方差剖析可解决随机区组实验设计的非参数磨练问题2:从数据的不雅测办法和起源划分,研讨数据可分为计数数据和测量数据两大类;根据数据反应的测量程度,可把数据区分为称名数据.次序数据.等距数据和比率数据四种类型;按照数据是否具有持续性,把数据分为离散数据和持续数据3:统计表的儿个构成要素:表号.名称.标目.数字.表注.4:统计图的构成部分:图号及图题.图目.图尺.图形.图例.图注5:次数分布显示初步整顿后一组数据的分布情形重要暗示数据在各个分组区问内的散布情形,可分为简略次数分布.分组次数分布.相对次数分布.累计次数分布.6:经常应用的次数分布图有直方图.次数多边形图及累加次数分布图.7:其它经常应用的统计图的类别:直方图.条形图.圆形图.线形图.散点图:条形图又分为简略条形图.分组条形图.分段条形图8:其它经常应用统计表类型:简略表.分组表.复合表9:用来描写数据分散趋向和离中趋向的统计量分别称为分散量数和差别量数.10:分散量数包含:算数平均数.中数.众数.加权平均数.儿何平均数.折衷平均数等.12:平均数的优缺陷:长处:反响敏锐.盘算周密.盘算简略.简明易解.合适于进一步用代数办法演算.较少受抽样变动的影响;缺陷:易受极端数据的影响.若消失隐约不清的数据时,无法盘算平均数.13:盘算和应用平均数的原则:同质性原则.平均数与个别数值相联合的原则.平均数与尺度差.发差相联合的原则14:差别量数就是对一组数据的变异性,即离中趋向特色进行器量和描写的统计量.15:差别量数有:全距.四分位差.白一分位差.平均差.尺度差与方差16:相干类别为:正相干.负相干.零相干17:质量相干分为:点二列相干.二列相干及多系列相干18:品德相干:重要分为四分相干.C相干.列联表相干19:概率:是标明随机事宜消失可能性大小的客不雅指标就是概率,概率的界说有两种即后验概率和先验概率20:概率分布类型:160页离散分布与持续分布.经验分布与理论分布.根本随机变量分布与抽样分布21“概率分布:是指对随机变量取值的概率分布情形用数学办法(函数)进行描写22:持续分布:是指持续随机变量的概率分布,即测量数据的概率分布,它用持续随机变量的分布函数描写它的分布纪律23:离散分布:离散随机变量的分布又称作离散分布24:经验分布:是指根据不雅察或实验所获得的数据而编制的次数分布或相对频率分布25:理论分布:一是随机变量概率分布的函数一数学模子,二是按某种数学模子盘算出的总体的次数分布26:抽样分布:是样本统计量的理论分布,样本统计量有:平均数.两平均数之差.方差.尺度差.相干系数.回归系数.白一分比率等. 27:正态分布:也称常态分布或常态分派,是持续随机变量概率分布的一种,正态分布N C0,1)称为尺度正态分布,它的平均值是0,尺度差是1.28:二项分布:是指实验仅有两种不合性质成果的概率分布,具体界说是:设有N次实验,各次实验是彼此自力的,每次实验某事宜消失的概率都是P,某事宜不消失的概率都是q(等于1-P).则对于某事宜消失X次(0,1,2,3.0 0 o n)的概率分布为为29:除了尺度正态Z分布外,儿种罕有的抽样分布包含X的平方分布,T分布,F分布.30:点估计:是用样本统计量来估计总体参数,因为样本统计量为数值上某一点值,估计的成果也以一个点的数值暗示,所以称为点估计.31:优越估计量的特点:无偏性.有用性.一致性.充分性犯:区问估计:就是根据估计值以必定靠得住程度揣摸总体参数地点的区问规模,它是用数轴上的一段距离暗示未知参数可能落入的规模,他虽不具体指出总体参数等于什么,但能指出未知总体参数落入某一区问的概率有多大33:置信区问:也称置信问距,是指在某一置信度时,总体参数地点的区域距离或区域长度.置信区问的高低两头点值称为置信界线.34:明显性程度是指估计总体参数落在某一区问时,可能犯错误的概率,用符号a暗示35:假设磨练:经由过程样本统计量得出的差别做出一般性结论,断定总体参数之问是否消失差异,这种推论进程称作假设磨练,它的根本义务就是事先对总体参数或总体分布形态做出一个假设,然后应用样本信息来断定原假设是否合理,从而决议是否吸收原假设.假设磨练包括“参数磨练”和“非参数磨练”.36:参数假设磨练:若进行假设磨练时总体的分布情势已知,须要对总体的未知参数进行假设磨练;非参数假设磨练:若对总体分布情势37:方差剖析:重要功效在于剖析实验数据中不合起源的变异对总变异的进献大小,从而肯定实验中的白变量是否对因变量有重要影响38:方差剖析的基起源基本理:分解虚无假设和部分虚无假设.方差的可分化性39:平方和:指不雅测数据与平均数离差的平方总和40:总变异被分化为“组问变异”和“组内变异"41:组问变异:重要指因为接收不合的2而造成的各组之问的变异,可以用两个平均数之问的差别暗示42:组内变异:是由组内各被试因变量的差别规模决议的,重要指由实验误差.或组内被试之问的差别造成的变异.43:发差剖析的根本假定:总体正态分布.变异的互相自力性.各实验处理内的方差要一致44:组内设计:又称被试内设计,是指每个被试都要接收所有白变量程度的实验处理45:完整随机设计的方差剖析:就是对单身分组问设计的方差剖析,在这种实验研讨设计中,各类处理的分类仅以单个实验变量为基本,因而把它称为单身分方差剖析或单向方差剖析46:随机区组设计的方差剖析:根据被试特色把被试划分为儿个区组,再根据实验变量的程度数在每一个区组内划分为若干个小区,统一区组随机吸收不合的处理.这类实验设计的原则是统一区组内的被试应尽量同质47:试比较完整随机设计与随机区组设计的优.缺陷?随机区组设计因为统一区组接收所有实验处理,使实验处理之问有相干组设计,或称被试内设计.与完整随机设计比拟,其最大长处是斟酌到个别差别的影响.这种因为被试之问性质不合导致产生的差别就称为区组效应.随机区组设计可以将这种影响从组内变异平分别出来,从而进步效力.但是这种设计也出缺少,重要表示为划分区组艰苦,假如不克不及包管统一区组内尽量同质,则有消失更大误差的可能. 48:当全部实验中的个别差别知道后,就可以算出个别差别造成的变异,即区组变异.这时总平方和被分化为三部分:被试问平方和.区组平方和.误差项平方和。
现代心理与教育统计学知识点心理统计学第一章概述描述统计定义:研究如何把心理与教育科学实验或调查得来的大量数据科学的科学的加以整理概括和表述作用:使杂乱无章的数字更好的显示出事物的某些特征,有助于说明问题的实质。
具体内容:1数据分组:采用图与表的形式。
2计算数据的特征值:集中量数(平均数中数)离散量数(方差)3计算量事物间的相关关系:积差相关(2列 3列多列)推断统计定义:主要研究如何利用局部数据(样本数据)所提供的信息,依据数理统计提供的理论和方法,推论总体情形。
作用:用样本推论总体。
具体内容:1如何对假设进行检验。
2如何对总体参数特征值进行估计。
3各种非参数的统计方法。
心理与教育统计基础概念数据类型一从数据来来划分 1计数数据:计算个数或次数而获得的数据。
(都是离散数据)2测量数据:借助一定测量工具或测量标准而获得的数据。
(连续数据)二根据数据所反映的测量水平 1称名数据(分类)定义:指用数字代表事物或数字对事物进行分类的数据。
特点:数字只是事物的符号,而没有任何数量意义。
统计方法:百分数次数众数列联相关卡方检验等。
(非参检验)2顺序数据(分类排序)定义:指代事物类别,能够表明不同食物的大小等级或事物具有的某种特征的程度的数据。
(年级)特点:没有相等单位没有绝对零点。
不表示事物特征的真正数量。
统计方法:中位数百分位数等级相关肯德尔和谐系数以及常规的非参数检验方法。
3等距数据(分类排序加减(相等单位))(真正应用最广泛的数据)定义:不仅能够指代物体的类别等级,而且具有相等的单位的数据。
(成绩温度)特点:真正的数量,能进行加减运算,没有绝对零点,不能进行乘除计算。
统计方法:平均数标准差积差相关 Z检验 t检验 F检验等。
4比率数据(分类排序加减法乘除法(绝对零点))定义:表明量的大小,也具有相等单位,同时具有绝对零点。
(身高反应时)特点:真正的数字,有绝对零点,可以进行加减乘除运算。
在统计中处理的数据大多是顺序数据和等距数据。
概念(1)随机变量:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。
(2)总体:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。
(3)样本:样本是从总体中抽取的一部分个体。
(4)个体:构成总体的每个基本单元。
(5)次数:是指某一事件在某一类别中出现的数目,又称作频数,用f表示。
(6)频率:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。
(7)概率:概率论术语,指随机事件发生的可能性大小度量指标。
其描述性定义。
随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。
(8)统计量:样本的特征值叫做统计量,又称作特征值。
(9)参数:又称总体参数,是描述一个总体情况的统计指标。
(10)观测值:随机变量的取值,一个随机变量可以有多个观测值。
2何谓心理与教育统计学学习它有何意义答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。
具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
(2)学习心理与教育统计学有重要的意义。
①统计学为科学研究提供了一种科学方法。
科学是一种知识体系。
它的研究对象存在于现实世界各个领域的客观事实之中。
它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。
要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。
统计学正是提供了这样一种科学方法。
统计方法是从事科学研究的一种必不可少的工具。
②心理与教育统计学是心理与教育科研定量分析的重要工具。
凡是客观存在事物,都有数量的表现。
凡是有数量表现的事物,都可以进行测量。
心理与教育现象是一种客观存在的事物,它也有数量的表现。
虽然心理与教育测量具有多变性而且旨起它发生变化的因素很多,难以准确测量。
但是它毕竟还是可以测量的。
因此,在进行心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。
心理与教育统计就是对心理与教育问题进行定量分析的重要的科学工具。
③广大心理与教育工作者学习心理与教育统计学的具体意义。
a.可经顺利阅读国内外先进的研究成果。
b.可以提高心理与教育工作的科学性和效率。
c.为学习心理与教育测量和评价打下基础。
3.先用统计方法有哪几个步骤答:一项实验研究结果要用何种统计方法去分析,需要对实验数据进行认真的分析。
只有做到对数据分析正确,才能对统计方法做出正确地选用。
选用统计方法可以分为以下步骤:(1)首先,要分析一下实验数据是否合理,即所或得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的。
(2)其次,要分析实验数据的类型。
不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要。
(3)第三,要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件。
4.什么叫随机变量心理与教育科学实验所获得的数据是否属于随机变量答:(1)在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。
(2)心理与教育科学实验所获得的数据属于随机变量。
心理与教育科学研究数据具有随机性和变异性。
科学研究中因观测人员、观测工具、观测条件的变化而具有随机变化的现象。
在心理和教育科学领域,研究获得的数据资料也具有一定随机性质。
观测数据的这种特点,称为变异性。
即便使用同一种测量工具,观测同一事物,只要是进行多次,那么获得的数据就不会完全相同。
随着测量工具的完善和精确,数据的这种随机性变化就更明显。
例如,人们对同一年级或同一年龄儿童甚至对同一个人进行同一学科的学业测试,或对同一个心理特点进行评量、观察多次,得到的数据绝不会全然相同,这些数据总是在一定的范围内变化。
造成数据变异的原因,出自观测过程中一些偶然的不可控制的因素,称随机因素。
随机因素使测量产生的误差称作随机误差。
由于这种随机误差的存在,使得在相同条件下观测的结果常常不止一个,并且事前无法确定,这是客观世界存在的一种普遍现象,人们称这类现象为随机现象。
在教育和心理科学的各类研究中,研究的对象是人的内在的种种心理现象,不仅由客观上一些偶然因素会引起测量误差,由实验者和被试主观上一些不可控制的偶然因素也会造成测量误差,这些偶然因素+分复杂,因而造成的随机误差就更大,也就是使心理与教育科学研究中得到的数据具有更明显的变异性。
5。
怎样理解总体、样本与个体。
答:根据其各自的定义,我们可以用下面这个图来表示。
大圆表示研究对象的全体,也就是总体;大圆中的小圆表示其中一个样本,大圆中所有的点代表的是样本。
6、统计量与参数之间有何区别和关系。
答:(1)参数是描述总体情况的统计指标;样本的特征值称作统计量。
(2)区别:1参数是从总体中计算得到的量数,代表总体特征,一个常数。
统计量是从一个样本中计算得到的量数,它描述一组数据的情况,是一个变量,随样本的变化而变化。
2参数常用希腊字母表示,样本统计量用英文字母表示。
(3)联系:1参数通常是通过样本特征值来预测得到,(7、答案略)8、下述一些数据,哪些是测量数据哪些是计数数据其数值意味什么(1)17. 0千克(2 ) 89. 85厘米(3) 199. 2秒(4) 17人(5) 25本(6 ) 93. 5答:上面的数据中测量数据有:(1) 千克(2 ) 89. 85厘米(3 ) 199. 2秒(6)93. 5分计数数据有:(4) 17人(5) 25本(2) 17. 0千克、89. 85厘米、199. 2秒、93. 5 分,这些数据是借助一定的重量、长度、时间或一定的测量标准而获得数据,分别代表事物的重量、长度、时间或者分数。
9符号代表的意义(课本20页)(1)总体平均数,期望值(2)样本平均数(3)总体之间的相关系数(4)样本间的相关系数(5)总体标准差(6)样本标准差(7)总体间的回归系数(8)有限个体数目的总体(9)样本容量,样本大小1.统计分组应注意哪些问题答:进行统计分组时需要注意下列问题:(1)分组要以被研究对象的本质特性为基础面对大量原始数据进行分组时,有时需要先做初步的分类,分类或分组一定是要选择与被研究现象的本质的关的特性为依据,才能确保分类或分组的正确。
在心理与教育学研究方面,专业知识的了解和熟悉对分组的正确进行有重要的作用。
例如在学业成绩研究中按学科性质分类,在整理智力测验结果时,按言语智力、操作智力和总的智力分数分类等。
(2)分类标志要明确,要能包括所有的数据对数据进行分组时,所依据的特性称为分组或分类的标志。
整理数据时,分组标志要明确并在整理数据的过程中前后一致。
这就是说,关于被研究现象本质特性的概念要明确,不能既是这个又是那个。
另外,所依据的标志必须能将全部数据包括进去,不能有遗漏,也不能中途改变。
2、直条图或叫条形图:主要用于表示离散型数据资料,即计数资料。
详见课本45页。
3、圆形图或叫饼图:主要用于描述间断性资料,目的是为显示多部分在整体中所占的比重大小,以及各部分之间的比较。
1.心理统计方法:统计学的原理和数学的方法在心理学领域中的运用。
2.心理统计方法包括描述统计和推理统计两大部分。
3.实验数据可分为两类:准确数和近似值。
4.确定组距以后,要考虑最小的一组从哪开始。
显然,最小的一组应包含整个系列中的最小数值。
5.在心理实验中常用的表格有三类:原始数据登记表,经过分组整理的次数分布表,带有对实验结果总结性质的表6.表示实验结果的图有:平面图和立体图。
7.平面图一般分为:曲线图和直方图两类。
8.平面图有两个坐标,横坐标代表心理实验中的刺激变量或自变量,纵坐标代表反应变量或因变量。
当横坐标代表的数量是连续的,可画曲线图或直方图;当横坐标代表的数量不是连续的变量,而是不同类别时,就只能画直方图,其纵坐标必须从0开始。
9.累加次数分布图的横坐标是各组数据的上限。
10.平均数指的是算术平均数。
11.众数是最明显的集中趋势指标,但众数不如平均数和中数稳定。
12.分组不适合会出现双峰,可调整组距。
真正的双峰出现的原因是_有两种性质不同的数据_。
13.在偏斜的分布中,平均数总是处于偏斜的一端,而中数则永远把一个分布曲线下的面积分成相等的两部分。
14. q2-q1<q3-q2时,分布向右偏斜;q2-q1=q3-q2时,分布向对称;q2-q1>q3-q2时,分布向_左(哪方大则朝哪方偏斜)偏斜。
15.表示两个变量之间相关性质和程度的图,叫散布图。
如果图中所有的点形成一条直线,说明是一个完全正相关的散布图;如果是椭圆,这个椭圆越窄,说明相关程度越_高_____。
16.从样本估计总体是以概率原则为基础的,如果样本中只包括随机误差就不致产生对总体偏性的估计;如果样本中还包括系统误差在内,就会产生偏性估计。
17.当一个总体中的成分只分成两类时,根据传统,把_希望得到的结果,发生的概率叫P;不希望得到的结果发生的概率叫q。
18.在一系列正态分布中,有一个标准的正态分布,其平均数为_0,标准差为_ 119.当实验数据有___二组____以上时,而且都是__不连续_____的变量时,要检验各组间的差异是否显着就需要用c2分布进行计算。
20.统计结果检验时:1 ) w2为0. 14_时,实验效果较强,统计结果可信。
2 ) w2为0. 16_时,实验效果中等,统计结果可信度一般。
3 ) w2为0. 01_时,实验效果很差,统计结果不可信。
21.用d值说明实验效果时:1) d是时,实验效果较小; 2) d;是时,效果中等; 3) d>>0. 8_时,效果较大。
概念1.描述统计:是对成组数据概括的描述。
描述统计的指标有三类:数据的集中趋势,数据的离中趋势,数据间的相关。
2.推论统计:方法包括从样本的数量特性推测总体数量特性的一系列问题:推论假设,推论的各种方法和步骤,以及检验推测可靠性的各种方法。
3.组距:每一组上限和下限的差。
(组距习上常用2, 3, 5, 10, 204.中点:在某一组的下限和上限当中的那一点。
5.集中趋势:是代表一系列数据的典型水平的数字指标,代表集中趋势的指标有平均数,中数和众数。
6.平均数(x):是一组数据总和的平均值。
7.中数(mdn):一系列按大小顺序排列的数据中的一个点,在这个系列中有一半数据在这个点以上,有一半数据在这个点以下。