5.均值比较及差异性检验

  • 格式:ppt
  • 大小:351.50 KB
  • 文档页数:34

下载文档原格式

  / 34
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(2)两总体方差未知且不同情况下,T统计 两总体方差未知且不同情况下, 量计算公式为
T统计量仍然服从T分布,但自由度采用 统计量仍然服从T分布, 修正的自由度, 修正的自由度,公式为
从两种情况下的T统计量计算公式可以看出, 从两种情况下的T统计量计算公式可以看出, 如果待检验的两样本均值差异较小, 值较小, 如果待检验的两样本均值差异较小,t值较小, 则说明两个样本的均值不存在显著差异; 则说明两个样本的均值不存在显著差异;相 值越大, 反,t值越大,说明两样本的均值存在显著差 异。
5.2 单样本 检验 单样本T检验
SPSS单样本T SPSS单样本T检验是检验某个变量的总体均 单样本 值和某指定值之间是否存在显著差异。 值和某指定值之间是否存在显著差异。统计 的前提是样本总体服从正态分布。 的前提是样本总体服从正态分布。也就是说 单样本本身无法比较, 单样本本身无法比较,进行的是其均数与已 知总体均数间的比较。 知总体均数间的比较。
用户可以指定一个或多个变量作为分组变 如果分组变量为多个, 量。如果分组变量为多个,还应指定这些分 组变量之间的层次关系。 组变量之间的层次关系。层次关系可以是同 层次的或多层次的。 层次的或多层次的。同层次意味着将按照各 分组变量的不同取值分别对个案进行分组; 分组变量的不同取值分别对个案进行分组; 多层次表示将首先按第一分组变量分组, 多层次表示将首先按第一分组变量分组,然 后对各个分组下的个案按照第二组分组变量 进行分组。 进行分组。
均值比较的使用前提
使用SPSS的均值比较过程进行统计分析时, 的均值比较过程进行统计分析时, 使用 的均值比较过程进行统计分析时 对使用的数据有一定要求: 对使用的数据有一定要求: 1. 因变量必须是数值型变量; 因变量必须是数值型变量; 2. 自变量可以使数值型或短字符型变量(8 自变量可以使数值型或短字符型变量( 字符以内); 字符以内);
单样本T检验的零假设为H 单样本T检验的零假设为H0:总体均值和指 定检验值之间不存在显著差异。 定检验值之间不存在显著差异。 采用T检验方法,按照下面公式计算T 采用T检验方法,按照下面公式计算T统计 量:
基本操作步骤: 基本操作步骤: 1.选择单样本 检验对话框; 选择单样本T检验对话框 选择单样本 检验对话框;
独立样本T检验的零假设H 独立样本T检验的零假设H0为两总体均值之 间不存在显著差异。 间不存在显著差异。 在具体的计算中需要通过两步来完成: 在具体的计算中需要通过两步来完成: 第一,利用F 第一,利用F检验判断两总体的方差是否相 同; 第二,根据第一步的结果,决定T 第二,根据第一步的结果,决定T统计量和 自由度计算公式,进而对T 自由度计算公式,进而对T检验的结论作出判 断。
社会科学统计软件SPSS教程 教程 社会科学统计软件 第五章 均值比较及差异性检验
在科学研究中经常采用通过样本来分析总 体的方法, 体的方法,因为对总体的研究在很多情况下 不现实或没有必要, 不现实或没有必要,因此常常是从总体中抽 取一定数量的样本, 取一定数量的样本,从对样本观察或实验结 果的特征来对总体的特征进行估计和推断。 果的特征来对总体的特征进行估计和推断。
5.1 Mean过程 过程 5.2 单一样本 检验 单一样本T检验 5.3 独立样本 检验 独立样本T检验 5.4 两配对样本 检验 两配对样本T检验 5.5 正态分布检验
5.1 Means过程 过程
Means过程是SPSS Means过程是SPSS计算各种基本描述统计量 过程是SPSS计算各种基本描述统计量 的 过 程 。 与 计算 某 一样 本 总体 均 值相 比 , Means过程其实就是按照用户指定条件 过程其实就是按照用户指定条件, Means过程其实就是按照用户指定条件,对样 本进行分组计算均数和标准差, 本进行分组计算均数和标准差 , 如按性别计 算各组的均数和标准差。 算各组的均数和标准差。
SPSS将自动计算T SPSS将自动计算T值,由于该统计量服从 将自动计算 个自由度的T分布,SPSS将根据 将根据T n−1个自由度的T分布,SPSS将根据T分布表给 值对应的相伴概率值。 出t值对应的相伴概率值。如果相伴概率值小 于或等于用户设想的显著性水平α 则拒绝H0 H0, 于或等于用户设想的显著性水平α,则拒绝H0, 认为两总体均值之间存在显著差异。相反, 认为两总体均值之间存在显著差异。相反, 相伴概率大于显著性水平α 则不拒绝H0 H0, 相伴概率大于显著性水平α,则不拒绝H0,可 以认为两总体均值之间不存在显著差异。 以认为两总体均值之间不存在显著差异。
( Analyze - Compare Means – One Sample T Test )
2. 选择比较变量,指定均值数值、置信区间 选择比较变量,指定均值数值、 和缺失值处理; 和缺失值处理; 3. 对输出结果进行比较分析; 对输出结果进行比较分析;
5.3 独立样Biblioteka Baidu 检验 独立样本T检验
独立样本是指两个样本之间彼此独立没有 任何关联, 任何关联,两个独立样本各自接受相同的测 量,研究者的主要目的是了解两个样本之间 是否有显著差异存在。 是否有显著差异存在。
5.5 正态分布检验
正态分布是统计分析中最为重要的分布。 正态分布是统计分析中最为重要的分布。 在SPSS中,正态分布的考察方法有:计算偏 中 正态分布的考察方法有: 度和峰度系数进行分析,绘制直方图或P-P图 度和峰度系数进行分析,绘制直方图或 图 进行观察,进行假设检验( 样本检验)。 进行观察,进行假设检验(K-S样本检验)。 样本检验
5.4 配对样本 检验 配对样本T检验
配对样本T 配对样本T检验是根据样本数据对样本来自 的两配对总体的均值是否有显著性差异进行 推断。一般用于同一研究对象( 推断。一般用于同一研究对象(或两配对对 分别给予两种不同处理的效果比较, 象)分别给予两种不同处理的效果比较,以 及同一研究对象(或两配对对象) 及同一研究对象(或两配对对象)处理前后 的效果比较。前者推断两种效果有无差别, 的效果比较。前者推断两种效果有无差别, 后者推断某种处理是否有效。 后者推断某种处理是否有效。
在统计分析过程中, 在统计分析过程中,很重要的一点是对抽 样的样本必须有代表性, 样的样本必须有代表性,即每个个体都有同 等概率被抽中。但由于抽样误差的存在, 等概率被抽中。但由于抽样误差的存在,在 抽样过程中不可避免会抽到一些数值较大或 较小的个体导致样本统计量与总体参数之间 有所不同,所造成的问题就是: 有所不同,所造成的问题就是:某个样本能 否认为是来自某个确定均值的总体。 否认为是来自某个确定均值的总体。
理论步骤: 理论步骤: 1.判断两个总体的方差是否相同 . SPSS采用 采用Levene F方法检验两总体方差是否相 SPSS采用Levene F方法检验两总体方差是否相 同。
2.根据第一步的结果,决定T统计量和自由 .根据第一步的结果,决定 统计量和自由 度计算公式 (1)两总体方差未知且相同情况下,T统计 两总体方差未知且相同情况下, 量计算公式为
检验的基本思路: 检验的基本思路:原假设为样本取自服从 正态分布的总体, 正态分布的总体,用Ai表示正态分布下某一 数值的累积相对频数, 数值的累积相对频数,Oi表示样本频数的相 应值, 检验是以A 应值,K-S检验是以 i和Oi的绝对差异为基础 检验是以 其检验统计量为: 的,其检验统计量为: 若原假设成立, 若原假设成立,则每次抽样研究中所得到 值应当不会偏离0太远 的K值应当不会偏离 太远。 值应当不会偏离 太远。
两配对样本T检验的零假设H0为两总体均值 两配对样本T检验的零假设H0为两总体均值 H0 之间不存在显著差异。 之间不存在显著差异。 首先求出每对观察值的差值, 首先求出每对观察值的差值,得到差值序 然后对差值求均值; 列;然后对差值求均值;最后检验差值序列 的均值,即平均差是否与零有显著差异。 的均值,即平均差是否与零有显著差异。如 果平均差和零有显著差异, 果平均差和零有显著差异,则认为两总体均 值间存在显著差异;否则, 值间存在显著差异;否则,认为两总体均值 间不存在显著差异。 间不存在显著差异。
在正态或近似正态分布的计量资料中, 在正态或近似正态分布的计量资料中,经 常在使用统计描述过程分析后, 常在使用统计描述过程分析后,还要进行组 与组之间平均水平的比较。本章介绍的T 与组之间平均水平的比较。本章介绍的T检验 方法, 方法,主要应用在两个样本间比较且只能进 行一个或两个样本间的比较。 行一个或两个样本间的比较。如果需要比较 两组以上样本均数的差别, 两组以上样本均数的差别,则需使用方差分 析方法。 析方法。
检验前提条件: 检验前提条件: 两个样本应是互相独立的, 1. 两个样本应是互相独立的,即从总体中 抽取一批样本对从同一总体抽取的另一样本 没有任何影响,两组样本个案数目可以不同, 没有任何影响,两组样本个案数目可以不同, 个案顺序可以随意调整。 个案顺序可以随意调整。 样本来自的总体应该服从正态分布。 2. 样本来自的总体应该服从正态分布。
K-S单样本检验是一种分布拟合优度的检 单样本检验是一种分布拟合优度的检 验,其方法是讲一个变量的累计分布函数与 特定分布进行比较。 特定分布进行比较。K-S单样本检验一共可 单样本检验一共可 以检验4种比较常见的统计分布 即正态分布, 种比较常见的统计分布, 以检验 种比较常见的统计分布,即正态分布, 均匀分布,泊松分布和指数分布。 均匀分布,泊松分布和指数分布。
在分析结果中,SPSS还自动给出了两样本均 在分析结果中,SPSS还自动给出了两样本均 值差值的估计标准误差( 值差值的估计标准误差(Std. Error Difference)。在方差相同的情况下, )。在方差相同的情况下 Difference)。在方差相同的情况下,估计 标准误差的计算方法是
在方差不相同的情况下, 在方差不相同的情况下,估计标准误差的计 算方法是
T检验的基本原理是:首先假设零假设H0成 检验的基本原理是:首先假设零假设H 即样本间不存在显著差异, 立,即样本间不存在显著差异,然后利用现 有样本根据t 分布求得t 有样本根据t 分布求得t值,并据此得到相应 的概率值p p≤α 则拒绝原假设, 的概率值p,若p≤α,则拒绝原假设,认为两 样本间存在显著差异。 样本间存在显著差异。
Means过程的计算公式为: Means过程的计算公式为: 过程的计算公式为
基本操作过程: 基本操作过程: 1. 选定 选定Means过程对话框; 过程对话框; 过程对话框
(Analyze-Compare Means-Means) )
2. 选择自变量与分组变量(也可加入层变 选择自变量与分组变量( 量); 3. 对Means过程的分析结果进行比较分析; 过程的分析结果进行比较分析; 过程的分析结果进行比较分析
两配对样本T检验的前提要求: 两配对样本T检验的前提要求: 两个样本应是配对的。在应用领域中, 1. 两个样本应是配对的。在应用领域中, 主要的配对资料包括:具有年龄、性别、 主要的配对资料包括:具有年龄、性别、体 病况等非处理因素相同或相似者。 重、病况等非处理因素相同或相似者。首先 两个样本的观察数目相同, 两个样本的观察数目相同,其次两样本的观 察值顺序不能随意改变。 察值顺序不能随意改变。 样本来自的两个总体应服从正态分布。 2. 样本来自的两个总体应服从正态分布。
为了方便计算出各种情况下K值所对应的 为了方便计算出各种情况下 值所对应的 概率大小,统计软件还往往会将K值转化为 值转化为Z 概率大小,统计软件还往往会将 值转化为 值: 并进一步根据一定公式计算出P值 并进一步根据一定公式计算出 值,其大小 的意义与K值相同 值相同。 的意义与 值相同。
示例:使用数据文件“ 示例:使用数据文件“sales.sav”,对销售收 ” 益(Revenue)进行正态分布检验。 )进行正态分布检验。