教育统计学
- 格式:doc
- 大小:459.00 KB
- 文档页数:14
第一章:概述
一、教育统计学的含义
(一)什么是统计学
A统计学是研究随机现象的数量规律性的一门数学分支。自然界中有两类现象:a.确定现象b.随机现象。随机现象的规律性可用概率论来描述,起源于(法)帕斯卡对赌博现象的研究。
B数理统计学:以概率论为基础
C应用统计学:是数理统计学理论在各个学科领域中的应用。
(二)什么是教育统计学
探讨如何将统计学的原理和方法应用于研究教育现象中数量关系的科学。根据不同功能可划分为:
1.统计设计:研究如何科学全面地搜集统计数据以确保统计结论的可靠性。如:如何进行随机抽样,如何设计实验等。
2.描述统计:研究如何对搜集到的统计数据进行分析整理,以显示数量关系,如:计算数据的集中度、离散度等。
3.推断统计:研究如何利用样本数据来推测和判断未知的总体特征,如总体参数估计、假设检验等。
二、几个基本概念
(一)变量与变量值
A变量:可以定量并能取不同数值的事物的某种特征。
B变量值:变量具体的数值如考试的分数、智力水平
C变量的类型:
①类别变量:只是用数字来代表事物或对事物进行分类,数字没有任何数值意义。不能做量化分析,无大小意义,只表明类别。如性别男1 女2
②顺序变量:表明类别的大小或某种属性的多少。主要用于分等论级和分类。仅表示等级,不表示某种属性的真正量和绝对值。无参照点(没有绝对零度)和相等单位。如:五点评分:ABCDE
③等距变量:存在大小关系,无绝对零点,但存在相对零点。可进行数学运算、有相等单位。如IQ
④比率变量:有相等单位和绝对零点,可以知道事物之间的某种特点上相差多少及他们之间的倍数关系。如长度
(二)总体与样本
A总体:具有某种特征的个体总和例如大学生、中学生、女性、男性,包括有限总体和无限总体。总体的量化特征称为总体参数。如总体平均数
B样本:从总体中抽取的观察对象。样本容量(>30称为大样本,<30称为小样本),样本的量化特征称为样本统计量,如样本平均数。(研究分布关系越大越好;研究事物关系越小越好)
第二章:原始数据的整理
一、次数分布表
(一)分类
1.简单次数分布表:又称简单频叔分布表,根据不同组别数据出现频数编制而成。
2.相对次数分布表:又称相对频数分布表,根据不同组别数据出现相对频数编制而成。
3.累积次数分布表:又称累积频数分布表,根据不同组别数据出现累计频数编制而成。
4.累计相对次数分布表:又称累计相对频数分布表,根据不同组别数据出现累积相对频数编制而成。
表格一:某校大一新生英语测验得分次数分布表表格二:某校大一新生英语测验累计次数分
(二)次数分布表的制作方法
1.求全距:全距指的是全部观察值中最大值与最小值之差。
2.决定组数和组距:a 一般不少于5组,也不要超过15组,常见的是10组。B 组距指的是每一个组内包含的距离(用i 表示)c 斯特奇斯(H.A.Sturges )根据经验公式: i=Max-Min/1+
3.322logN 3决定组限:组限是每一组的起点值和终点值。
4.登记次数。(三线表) 二、次数分布图
(一)将次数分布表中的数据以图的形式表现出来。 (二)分类:
1.简单次数分布图——直方图
2.简单次数分布图——折线图
3.累积次数分布图 (S 形)
4.累积相对次数分布图 图一样,纵坐标不一样
第三章:集中量和差异量 一、集中量:是代表一组数据典型水平或集中趋势的量
集中量包括:算数平均数、加权平均数、几何平均数、中位数、众数等。 (一)算数平均数
1.算术平均数是所有观察值的总和除以总频数所得之商,简称为平均数或均数。 ①根据原始数据求平均数:
n
X
X n
i ∑==
1
i
②根据相对次数分布表求平均数
∑∑===
k i i
k
i f
X f
X 1
1
i
i
f i --- 频数
x
i----组中值
例1:计算下表计算其算术平均值
表格一:某校大一新生英语测验得分次数分布表
2.算术平均数的优缺点:
A 优点:反应灵敏;严密确定,简明易懂,计算方便;适合代数运算;总体平均数的最好估计值。
B 缺点:a 易受极端数值的影响 b 数据中某个数值的大小不够确切或缺失就无法计算。 (二)中位数
1.中位数(Md )是位于一定顺序排列的一组数据中央位置的数值,在这一数值的上、下各有一半的频数分布着。
2.根据次数分布表求中位数
)N -(0.5N l ⨯+=f
i
L Md L:中位数所在组的下限 N :总频数
Nl :小于中位数所在组下限的频数总和 I :表示组距 F :中位数所在组的频数
例2:计算例1中数据的中位数
中位数适用于以下情况: 一组数据中有极端数值; 一组数据中有个别数据不确切; 百分位数
百分位数:一组从小到大排列的数据中某一百分位置所对应数值
)N -(pN l ⨯+=p
p p f i
L P
例3:同样是上表,求25%所对应的数值。
(三)众数
众数(Mo )是指一组数据中频数出现最多的那个数。 1.根据原始数据求众数 2.根据次数分布表求众数:
i f f f L M l
u u
o ⨯++=
L :频数最多组的下限 fu:众数所在组上限后一组的频数 Fl :众数所在组下限前一组的频数