一、算术平均数
1.原始数据计算公式※
2.简捷公式
二、中位数(中数)
1. 原始数据计算法※
a. 无重复数据
b.有重复数据
b1.重复数没有位于数列中间
方法与无重复数一样
b2.重复数位于数列中间
若重复数的个数为奇数
若重复个数为偶数
先将数据从小到大(从大到小)排列
三、众数
a. 皮尔逊经验公式:分布近似正态※
算术平均数、中位数、众数三者的关系※
在正态分布中:
在正偏态分布中:
在负偏态分布中:
四、其它集中量数
1. 加权平均数(Mw)※
2. 几何平均数(Mg)※
3、调和平均数(MH)
第四章离散量数
一.全距 R (又称极差):※ R=Xmax-Xmin 百分位数的计算方法:
Pp为所求的第P个百分位数Lb为百分位数所在组的精确下限f 为百分位数所在组的次数
Fb为小于Lb的各组次数的和
N为总次数
i为组距
百分等级:
四分位差:a未分组数据
b分组数据
二.平均差
1. 原始数据计算公式:※
2. 次数分布表计算公式:三.方差和标准差的定义式:※
原始数据导出公式
次数分布表计算公式
导出公式
总标准差的合成:
四.相对差异量※
差异系数
标准分数(基分数或Z分数)
或
第六章概率分布后验概率:
先验概率
概率的加法定理※
概率的乘法定理※
正态分布曲线函数(概率密度函数)
公式:
y= 概率密度,即正态分布的纵坐标 = 理论平均数
= 理论方差
= ; e = (自然对数)
x = 随机变量的取值 (- < x < )
标准正态分布
将正态分布转化成标准正态分布的公式※
次数分布是否为正态分布的检验方法
皮尔逊偏态量数法
T分数
麦克尔创建 T=10Z+50
二项分布
二项分布的平均数为※
二项分布的标准差为※
t 分布※
2分布
F分布
第七章参数估计
平均数区间估计的计算
①总体正态,σ已知(不管样本容量大小),或总
体非正态,σ已知,大样本※
平均数离差的的抽样分布呈正态,平均数的置信区间为:
②总体正态,σ未知(不管样本容量大小),或总
体非正态,σ未知,大样本
平均数离差的抽样分布为t分布,平均数的置信区间为:
③总体正态,σ未知,大样本
平均数的抽样分布接近于正态分布,用正态分布代替t分布近似处理:
④总体非正态,小样本可不能进行参数估计,
即不能根据样本分布对总体平均数进行估计。
标准差分布的标准差:
二、方差的区间估计
根据χ2分布:
得出总体方差与置信区间
三、两总体方差之比的区间估计
根据F分布,可估计二总体方差之比的置信区间
第八章假设检验※
H0 : m m0H0 : m m0双侧Z检验统计决断规则※
∣Z∣与临界值比较P值显著性检验结果
∣Z∣<P>不显著保留H0,拒绝H1
≤∣Z∣<≥P>显著*在显著性水平拒绝H0,接受H1
∣Z∣≥P≤非常显著*
*
在显著性水平拒绝H0,接
受H1
单侧t检验统计决断规则※
∣t∣与临界值比较P值显著性检验结果
∣t∣<t(df)P>不显著保留H0,拒绝H1
t(df)≤∣t∣<t(df)≥P>显著*在显著性水平拒绝H0,接受H1
∣t∣≥t(df)P≤非常显著**在显著性水平拒绝H0,接受H1
平均数差异的显著性检验
两个总体都是正态分布、两个总体方差都已知
总体标准差已知条件下,平均数之差的抽样分布
服从正态分布,以Z作为检验统计量,计算公式
为:
⑴两样本相关
⑵两样本独立
⑴相关样本的平均数差异检验
建立假设:虚无假设:u1=u2(或uD=0);备选假设: u1u2 (或uD 0);选择检验统计量并计算
Z分布
确定检验形式
双侧
单侧
进行统计推断—查表寻找相应的临界值比较Z与Z,从而确定该样本的P是否为小概率,即是否P<。2)独立样本平均数差异的显著性检验
检验步骤:
建立假设:虚无假设:u1=u2(或uD=0);备选假设: u1u 2 (或uD 0);
选择检验统计量并计算
Z分布
进行统计推断—查表寻找相应的临界值比较Z’与Z,从而确定该样本的P是否为小概率,即是否P<。2.两总体正态,两总体方差未知
⑴两样本相关t检验
检验步骤:
建立假设:
虚无假设:u1=u2(或uD=0);备选假设: u2u1 (或 0uD );
选择检验统计量并计算
T分布
确定检验形式
双侧 or单侧
进行统计推断—查表寻找相应的临界值比较T’与T,从而确定该样本的P是否为小概率,即是否P<。方差齐性检验
分布形态F:
自由度:df1=n1-1 df2=n2-1 df=n-2(相关样本,查T表)
建立假设:
虚无假设:
备选假设:
F分布
独立样本相关样本
T分布※
抽样分布的标准误:柯克兰-柯克斯t检
近似临界值的计算
两总体非正态,n1和n2大于30(或50)
⑴两样本相关
⑵两样本独立
第五章相关量数
协方差公式
积差相关系数公式
积差相关系数的原始数据计算公式
肯德尔等级相关
Ri:代表评价对象获得的K个等级之和N:代表被等级评定的对象的数目
K:代表等级评定者的数目
肯德尔U系数N为被评价事物的数目,即等级数;
K为评价者的数目;
rij为对偶比较记录表中i>j(或i 点二列相关 二列相关 四分相关 Φ相关系数计算公式※ 列联表相关 方差分析的目的是要分析观测变量的变异是否主要是由控制因素造成还是由随机因素造成的,以及控制变量的各个水平是如何对观测变量造成影响的。当F值较大时,说明由控制因素造成的变异显著大于随机因素造成的,也就是说不同水平下的各总体均值有显著差异 方差分析中的方差齐性检验,常用哈特莱 (Hartley)所提出的最大F值检验法,其计 算公式为 各组容量不等时,用最大的n计算自由度: 方差分析的基本步骤:※建立假设: 虚无假设:u1 =u1……=uk; 备选假设:至少两个总体的平均数不相等; 计算平方和※ 总平方和: 组间平方和 组内平方和 计算自由度※ dfb =K-1 dfw =N-K 计算均方※ MSb= SSb /(K-1) MSw = SSw /(N-K) 计算F值:※F= MSb / MSw 查表求理论F值 进行统计推断—查表寻找相应的临界值比较F与F ,从而确定该样本的P是否为小概率,即是否P<。 随机区组设计的方差分析将变异来源分解为组间变异、区组变异和误差变异三部分: 随机区组设计方差分析的计算公式※ 分解平方和※ 总平方和 组间平方和 区组平方和 误差平方和 分解自由度※ 总自由度可以分解为组间、区组和误差自由度总自由度 组间自由度 区组自由度 误差自由度 计算方差 组间方差 区组方差 误差方差 计算F值 组间方差与误差方差的F比值 区组方差与误差方差的F比值 完全随机设计的q检验 公式中MSW为组内均方,na、nb为两个样本的容量随机区组设计的q检验 两因素方差分析的步骤 建立假设: 假设一: 假设二: 假设三:A*B之间不存在交互作用; 计算离差平方和 计算自由度 dfT=nK-1=N-1 dfb=K-1 dfw=K(n-1) =N-KaKb dfA=Ka-1 dfB= Kb-1 dfA*B= dfb- dfA- dfB =(Ka-1)(Kb-1) 计算均方 查表求临界值 进行统计推断 列出方差分析表 方差分析的效应大小与统计效力 单因素组间方差分析的效应大小的计算公式 χ2分布 如果正态总体的平均数未知,需要用样本平均数作为总体平均数的估计值,这时公式变为: 此时,χ2分布的自由度为df =n-1。 χ2检验的计算公式※ χ2的连续性校正 当df=1时,其中只要有一个组的理论频数小于5,就要运用耶茨(Yates)连续性校正法,计算公式为 双向表χ2检验的计算※ 双向表χ2检验中,理论频数的计算公式为 由实际频数直接计算 独立样本四格表χ2检验※ 缩减公式 或由理论频数计算 或由实际频数计算 校正公式 当 df =1,样本容量总和N>40时,应对χ2 值进行耶茨校正。 缩减公式 相关样本四格表χ2检验的计算中,只需要用到A和D。 校正公式 当 df =1 时,任一格的理论次数<5,N>20(根据对检验结果要求的严格程度决定),应对χ2 值进行连续性校正。 非参数检验 在零假设条件下,二项分布的平均数和标准差分别为 统计量的计算公式为 为了使计算结果更接近正态分布,可用校正公式计算 大样本情况 当样本容量n>25时,二项分布接近于正态分布,因此有 检验统计量可计算为 当n1和n2都大于10,二项分布接近于正态分布,其平均数和标准差分别为: 检验统计量计算为 克-瓦氏单向等级方差分析 统计量计算公式为回归分析 回归系数的计算公式为※ 求直线的截距 由回归系数公式的计算中可得※另一组计算公式为 原始数据计算回归系数公式 相关系数及两样本标准差计算公式