教育统计学复习资料

  • 格式:docx
  • 大小:100.47 KB
  • 文档页数:8

下载文档原格式

  / 8
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

教育统计学

一、基本概念

1、随机变量

具有以下三个特性的现象,成为随机变量。第一,一次试验有多中可能结果,其所有可能结果是已知的;第二,试验之前不能预料哪一种结果会出现;第三,在相同的条件下可以重复试验。随机现象的每一种结果叫做一个随机事件。我们把能表示随机现象各种结果的变量称为随机变量。

四种类型:

(1)称名量表。学号、电话号码不能进行数学运算(也不能大小比较)

(2)顺序量表。名次。能力大小。不能运算

(3)等距量表。可以做加减,不能乘除。无绝对0。成绩

(4)等比量表。可做乘除法。要有绝对零。

2、数据:随机变量的观察值。

类型:数据来源;随机变量的取值情况

点计数据(计算数据所获得的数据)度量数据(用一定工具测量获得的数据)

间断性随机变量和连续性随机变量(数据的单位之间可以再划分成无限多个细小的单位。)3、表示间断变量的统计图

(1)直条图:用直条的长短表示数量的图形。用来比较性质相似的间断性资料。

(2)圆形图:用来表示间断性资料构成比的图形。

4、表示连续变量的统计图

(1)线形图:用来表示连续性资料。它能表示两个变量之间的函数关系:一种事物随另一种事物变化的情况;某种事物随时间推移的发展趋势等。

(2)频数分布图:直方图、多边图和累积多边图。

散点图用于两连续变量的相关分析。

集中量

5、算术平均数的应用及其优缺点

优点:反应灵敏;严密确定;简明易懂,计算方便;适合代数运算;受抽样变动的影响较小。用样本数据推断总体集中量时,是总体平均数的最好估计值。

缺点:易受极端数值的影响;一组数据中某个数值的大小不够确切就无法计算算术平均数。差异量

6、百分位数是位于以hhbna一定顺序排列的一组数据中某一百分位置的数值。

7、方差和标准差的应用及其优缺点

方差是指离差平方的算术平均数。

方差和标准差的优点:反应灵敏,随任何一个数据的变化而表示;有确定的值;计算简单;适合代数计算,不仅求方差和标准差的过程中可以进行代数运算,而且可以将几个方差和标准差综合成一个总的方差和标准差;用样本数据推断总体差异量时,方差和标准差是最好的估计量。

8、标准差和差异系数的区别:

全距、四分位距、平均差及标准差都是带有与原观察值相同单位的名数,称为绝对差异量。这种差异量对两种单位不同,或单位相同而两个平均数相差较大的资料,都无法比较差异的大小,必须用相对差异量(即差异系数)进行比较。差异系数是指标准差与其算术平均数的百分比。它是没有单位的相对数。

概率

9、后验概率:以随机事件A在大量重复试验中出现的稳定频率制作为随机事件A概率的估计值,这样寻得的概率称为后验概率。

先验概率:是通过古典概率模型加以定义的,故又称为古典概率。古典概率模型要求满足两个条件:(1)试验的所有可能结果是有限的;(2)每一种可能结果出现的可能性(概率)相等。

10、简述正态分布的主要应用

答:(1)将原始分数转换成标准分数

标准分数的意义:第一,各科标准分数的单位是绝对等价的;第二、标准分数的正负和大小可以反映出考生在全体考分中所处的地位。

(2)确定录用分数线

(3)确定等级评定的人数

(4)品质评定数量化

11、简述Z分数的应用

答:Z分数的应用主要有:①表示各原始数据在数据组中的相对位置;②对于正态数据,可表示该数据以下或以上数据的比例,具体说可以求解诸如分数线问题或人数比例问题;③表示标准化测验的分数;④用于异常值的取舍。

12、t分布与正态分布的异同

同:t分布基线上的t值从-∞-+∞;从平均数等于0处,左侧t值为负,右侧t值为正;

曲线以平均数处为最高点向两侧逐渐下降,尾部无限延伸,永不与基线相接,呈单峰对称形。异:t分布的形态随自由度的变化呈一簇分布形态(即自由度不同的t分布形态也不同)。自由度逐渐增大时,t分布逐渐接近正态分布。

五、抽样分布(某一种统计量的概率分布)

13、平均数抽样分布的几个定理

(1)从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体的平均数。(2)容量为n的平均数在抽样分布上的标准差,等于总体标准差除以n的方根

(3)从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。(4)虽然总体不呈正态分布,如果样本容量较大,反映总体μ和σ的样本平均数的抽样分布,也接近于正态分布。

14、抽样分布是统计推断的理论依据。在实际工作中,抽取一个随机样本根据一定的概率来推断总体的参数。根据样本得出的值和总体参数的值存在差距,这是由于抽样误差的缘故。抽样误差我们用抽样分布上的标准差来表示,因此,某种统计量在抽样分布上的标准差称为该种统计量的标准误。如平均数抽样分布的标准差称为平均数的标准误。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大,所以标准误是统计推断可靠性的指标。

标准差是样本数据方差的平方根,它衡量的是样本数据的离散程度。

标准误是样本均值的标准差,衡量的是样本均值的离散程度。而在实际的抽样中,习惯用样本均值来推断总体均值,那么样本均值的离散程度(标准误)越大,抽样误差就越大。所以用标准误来衡量抽样误差的大小。

总体平均数的估计

15、什么叫总体参数的点估计和区间估计两者有何区别?

①点估计:用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计。②区间估计:以样本统计量的抽样分布(概率分布)为理论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。区间估计涉及置信水平和置信区间。

16、什么叫总体参数的无偏性估计,有效性,估计和一致性估计?

①用某一个样本统计量的值估计总体参数的值时,总会有所偏差,有的大于总体参数,有的小于总体参数,如果一切可能的样本统计量的值与总体参数值偏差的平均值为零,这种统计量就是总体参数的无偏估计。②当总体不止有一种无偏估计量时,某一种估计量的一切可能样本值的方差小者为有效性高,方差大者为有效性低。比如:x-是总体u的最有效估计量③当样本容量无限增大时,估计量的值越来越接近它所估计的总体参数值,这种估计量是总体参数的一致性估计量。X-是u的一致性估计量。

17、假设检验的基本原理

利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,称为假设检验。