第4讲教育统计应用2:几种假设检验的Excel实现
- 格式:ppt
- 大小:667.00 KB
- 文档页数:68
如何通过Excel假设检验提高数据分析能力在当今数据驱动的时代,数据分析能力成为了一项至关重要的技能。
Excel 作为一款广泛使用的电子表格软件,不仅能进行数据的整理和计算,还具备强大的假设检验功能,帮助我们从数据中挖掘出有价值的信息,做出更明智的决策。
接下来,让我们一起深入探讨如何通过Excel 假设检验来提高数据分析能力。
一、理解假设检验的基本概念假设检验是一种统计方法,用于根据样本数据来判断关于总体的某个假设是否成立。
在数据分析中,我们常常需要回答诸如“新产品的销量是否显著高于旧产品?”“不同营销渠道的效果是否有差异?”等问题,这时候就可以运用假设检验。
假设检验通常包括原假设(H0)和备择假设(H1)。
原假设一般是我们想要否定的假设,比如“新产品和旧产品的销量没有差异”;备择假设则是我们想要证明的假设,比如“新产品的销量显著高于旧产品”。
二、Excel 中常用的假设检验工具1、 t 检验t 检验用于比较两个独立样本的均值是否有显著差异,或者检验单个样本的均值是否与给定的常数有显著差异。
在 Excel 中,可以通过“数据分析”工具中的“t 检验:平均值的成对二样本分析”或“t 检验:双样本等方差假设”等来实现。
2、 z 检验当样本量较大(通常 n > 30)且总体标准差已知时,我们可以使用z 检验。
Excel 中虽然没有直接提供 z 检验的功能,但可以通过公式和函数来计算 z 值和相应的 p 值。
3、方差分析(ANOVA)如果要比较三个或更多个样本的均值是否有显著差异,就需要使用方差分析。
Excel 的“数据分析”工具中有“方差分析:单因素方差分析”的选项,可以方便地进行计算。
三、假设检验的步骤1、提出假设明确原假设和备择假设,这是假设检验的起点。
2、选择合适的检验方法和统计量根据数据的特点、样本大小、总体方差是否已知等因素,选择 t 检验、z 检验或方差分析等方法,并确定相应的统计量。
3、确定显著性水平显著性水平通常用α表示,常见的取值有 005 和 001。
Excel 在假设检验和方差分析中的应用
一、Excel 在假设检验中的应用
例1:某机械厂生产某型号螺栓,正常生产螺栓口径如从与平均数x ,方差2σ=36mm 的正态分布。
现在从新批量的螺栓中抽取10只实测计算样本方差为42mm ,试以显著性水平α=0.05检验总体方差是否显著提高了。
分析:此题是对总体方差进行假设检验,已知总体服从正态分布,且总体方差和样本方差均已知,因此我们选择2χ统计量。
Excel 进行分析:
1、录入相关指标及数据。
2、计算检验统计量2χ。
在B5单元格输入公式“=B2*B4/B3”。
3、计算临界值()12-n αχ。
在B6单元格输入公式“=CHIINV(0.05,9)”。
4、计算P-值。
在B7单元格输入公式“=CHIDIST(10.5,9)”。
5、根据以上结果由检验统计量2χ<临界值()12-n αχ,或者P-值>显著性水平α,得出检验统计量的观测值落在接受域,因而接受原假设,认为总体方差没有显著提高。
二、Excel 在方差分析中的应用
具体操作见课本。
使用Excel进行假设检验在假设检验中最常用的检验规则是计算检验统计量的实际值和临界值,通过实际值和临界值的对比得出检验结论;或者计算统计量实际值的p-值,通过p-值和显著性水平α的对比得出结论。
假设检验中使用的数据可以分为两种情况:一是经过统计汇总的数据,已经得到了样本均值和标准差(或者总方差已知);二是原始数据。
在前一种情况下需要解决的计算问题是计算统计量的临界值,或者根据统计量的实际值计算p-值;在后一种情况下则可以使用统计软件直接得出统计量的临界值和检验的p-值。
top↑检验统计量临界值的计算在已知样本的均值、标准差(或者总方差已知)时,可直接计算出检验统计量的值,然后使用Excel或其他软件计算统计量的临界值,通过实际值与临界值的对比得出检验结论。
用Excel计算统计量的临界值时需要特别注意两个方面的问题。
一是检验的类型:是双侧检验、左侧检验还是右侧检验?双侧检验和单侧检验计算临界值时对显著性水平处理方式不同,双侧检验要求每一侧的尾部面积为α/2,而单侧检验要求在拒绝域一侧的尾部面积为α。
二是在Excel中正态分布、t分布和F分布累积分布反函数中对概率参数的要求不同,注意分清楚这个参数与显著性水平的关系。
[例6.7] 某机器制造的产品厚度应为5厘米。
为了了解机器的性能是否良好,从产品中随机抽取10件,样本均值为5.3厘米,样本标准差为0.3厘米。
已知总体服从正态分布,试以0.05和0.01的显著性水平总体均值是否等于5厘米。
根据题意这里应该使用t统计量。
检验统计量等于。
在这个例子中应该使用双侧检验,95%的临界值在Excel中应该使用公式“=TINV(0.05,9)”计算,结果为2.2622。
99%的临界值为“=TINV(0.01,9)”等于3.2498。
因此,检验的结论是,在0.05显著性水平下拒绝零假设,在0.01的显著性水平不能拒绝零假设。
[例6.8] 一手机厂商声称其某种型号的手机在完全充电的情况下待机时间在150小时以上。
电子表格Excel在中小学教育统计中的应用MicrosoftOffice是广大微型计算机用户家喻户晓的集成应用软件,Excel是其中最为重要的组成部分之一,它的主要用途是处理电子表格,在数据处理上能高效地实现办公自动化。
由于Excel界面直观、明了,易于操作,它提供了十分有效的统计函数和必要的数据统计分析工具,是不可多得的计算机辅助教育统计分析的应用软件。
这里我们简要地介绍Excel在中小学教育统计分析中的应用,以供参考。
一、Excel常用的统计函数Excel提供了大量的统计函数,利用Excel内部的统计函数可处理教育统计中的许多简单的统计问题,如进行数据统计、核对等。
现列举一些常用的统计函数及其使用方法。
注意:所有函数、公式的输入都必须在英文输入法状态下完成,否则公式无效。
(一)巧用身份证号码:1、从输入的18位身份证号的出生年月计算公式:=CONCATENATE(MID(E2,7,4),"/",MID(E2,11,2),"/",MID(E2,13,2))。
2、用出生年月来计算年龄公式:=TRUNC((DAYS360(H6,"2009/8/30",FALSE))/360,0)。
3、从输入的身份证号码内让系统自动提取性别,可以输入以下公式:=IF(LEN(C2)=15,IF(MOD(MID(C2,15,1),2)=1,"男","女"),IF(MOD(MID(C2,17,1),2)=1,"男","女"))公式内的“C2”代表的是输入身份证号码的单元格。
二、直接输入公式计算。
1、加减乘除及带括号的计算,在结果目标单元格内可直接输入单元格名称和运算符号即可。
2、进行乘方和开方的计算:(1)指数操作符“^”求某个数的乘方也可以用指数操作符“^”,如计算5的-2次方,也可以写为:=5^-2公式返回0.04。
利用Excel假设检验解决实际问题的案例分析在当今的数据驱动时代,数据分析和决策制定变得日益重要。
Excel 作为一款广泛使用的电子表格软件,不仅在数据整理和计算方面表现出色,还提供了强大的统计分析功能,其中假设检验就是解决实际问题的有力工具之一。
假设检验是一种基于样本数据来判断关于总体的某个假设是否成立的统计方法。
它在商业、金融、医疗、科研等众多领域都有着广泛的应用。
接下来,我们将通过几个具体的案例来展示如何利用 Excel 中的假设检验功能解决实际问题。
案例一:产品质量改进假设某工厂生产一种电子元件,其平均使用寿命的目标值为 5000 小时。
为了提高产品质量,工厂采取了一项新的生产工艺。
从改进后的生产线上随机抽取了 50 个电子元件进行测试,得到样本的平均使用寿命为 5100 小时,样本标准差为 200 小时。
那么,能否认为新的生产工艺显著提高了产品的平均使用寿命呢?在 Excel 中,我们可以使用 t 检验来解决这个问题。
首先,我们提出假设:原假设(H0):新生产工艺下产品的平均使用寿命没有提高,即μ ≤ 5000 小时。
备择假设(H1):新生产工艺下产品的平均使用寿命有所提高,即μ > 5000 小时。
然后,在 Excel 中选择“数据分析”工具,找到“t 检验:平均值的成对二样本分析”。
输入相关数据,得到 t 统计量和 p 值。
假设显著水平(α)为 005,如果 p 值小于 005,我们就拒绝原假设,认为新的生产工艺显著提高了产品的平均使用寿命;如果 p 值大于 005,则不能拒绝原假设。
案例二:营销活动效果评估一家电商企业开展了一次促销活动,想知道这次活动是否显著提高了产品的平均销售额。
活动前,产品的平均日销售额为 10000 元。
活动期间,随机抽取了 30 天的销售额数据,样本平均日销售额为 12000 元,样本标准差为 3000 元。
同样,我们先提出假设:原假设(H0):促销活动没有显著提高产品的平均销售额,即μ ≤ 10000 元。
[实训四]假设检验一、简介:假设检验是统计推断中的重要内容。
以下例子利用Excel的正态分布函数NORMSDIST、判断函数IF 等,构造一张能够实现在总体方差已知情况下进行总体均值假设检验的Excel 工作表。
二、操作步骤:1.构造工作表。
如图附-15 所示,首先在各个单元格输入以下的内容,其中左边是变量名,右边是相应的计算公式。
2. 为表格右边的公式计算结果定义左边的变量名。
选定A3:B4,A6:B8,A10:A11,A13:A15 和A17:B19 单元格,选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“最左列”选项,然后点击“确定”按扭即可。
图附-153.输入样本数据,以及总体标准差、总体均值假设、置信水平数据。
如图附-16 所示。
4.为样本数据命名。
选定C1:C11 单元格,选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“首行”选项,然后点击“确定”按扭,得到如图附-16 中所示的计算结果。
图附-16三、结果说明:如图附-16 所示,该例子的检验结果不论是单侧还是双侧均为拒绝Ho 假设。
所以,根据样本的计算结果,在5%的显著水平之下,拒绝总体均值为35 的假设。
同时由单侧显著水平的计算结果还可以看出,在总体均值是35 的假设之下,样本均值小于等于31.4 的概率仅为0.020303562。
四、双样本等均值假设检验(一)简介:双样本等均值检验是在一定置信水平之下,在两个总体方差相等的假设之下,检验两个总体均值的差值等于指定平均差的假设是否成立的检验。
我们可以直接使用在Excel 数据分析中提供双样本等均值假设检验工具进行假设检验。
以下通过一例说明双样本等均值假设检验的操作步骤。
例子如下,某工厂为了比较两种装配方法的效率,分别组织了两组员工,每组9 人,一组采用新的装配方法,另外一组采用旧的装配方法。
18个员工的设备装配时间图附-17 中表格所示。
根据以下数据,是否有理由认为新的装配方法更节约时间?图附-17(二)操作步骤:以上例子可按如下步骤进行假设检验。