EXCEL均数差异显著性检验
- 格式:ppt
- 大小:1.27 MB
- 文档页数:71
上节对一组试验数据通过平方和与自由度分解,将所估计的处理均方与误差均方作比较,由F测验推论处理间有显著差异。
但我们并不清楚那些处理间存在差异,故需要进一步做处理平均数间的比较。
一个试验中k个处理平均数间可能有k(k-1)/2个比较,因而这种比较是复式比较亦称为多重比较(multiple comparisons)。
多重比较有多种方法,本节将介绍常用的三种:最小显著差数法(LSD法)、复极差法(q法)和Duncan氏新复极差法(SSR法)。
【最小显著差数法(LSD法)、复极差法(q法)和Duncan氏新复极差法(SSR法)本质上都属于t检验法。
因此,使用这三种方法必须满足方差齐性。
因为使用T检验是有条件的,其中之一就是要符合方差齐次性,这点需要F检验来验证。
方差齐次性检验(Homogeneity-of-variance)结果,从显著性慨率:各组方差无差异),c说明各组的方差在看,p>0.05,接受零假设(零假设Ha=0.05水平上没有显著性差异,即方差具有齐次性。
这个结论在选择多重比较方法时作为一个条件(方差齐次时有齐次时的多重比较法,非齐次时有非齐次时的多重比较法)。
比较计算所得F值与某显著水平(如0.05)下F值,可得处理间差异是否显著。
若处理间差异显著,则需进一步比较哪些处理间差异是显著的。
也就是只有在方差分析中F检验存在差异显著性时,才有比较(多重比较)的统计意义。
进行方差分析时需要满足独立样本、方差齐性、正态分布等条件,如果方差不具备齐性(F检验),可首先进行数据转换,如通过对数变换、平方根变换、倒数变换、平方根反正弦变换等方法变换后再进行方差齐性检验,若还不行只能进行非参数检验。
】7.2.1 最小显著差数法最小显著差数法(least significant difference,简称LSD法),LSD 法实质上是t测验。
其程序是:在处理间的F测验为显著的前提下,计算出显著水平为α的最小显著差数;任何两个平均数的差数如其绝对值≥,即为在α水平上显著;反之则为不显著。
1.新建exel文档,输入以下数值(原数据为:均数1±标准差1;均数2±标准差2;均数3±标
准差3)
2.选中均数
3.点菜单,插入-图表
4.选择柱形图
5.在图表选项中,去掉网格线
6.去掉“图例",在“数据标志”选项卡,选中“显示值”
在第一行数据(2.46,6.58,4.5)直条上右键点击,就是蓝色直条上右键点击选择“数据系列格式”
选择-误差线Y-正偏差-自定义,然后点击自定义的+号右边的图标.
选择第一行的标准差,按顺序:标准差1-3
点击右边的图标返回,点“确定”,误差线显示如下
如上添加第二行误差线。
下面手动修改条形图上方的数值修改数值,将鼠标移动到数值的框上拖动到条形图上方。
昨晚学习一篇论文的时候,结果表格中多出了一个p value,猜测了一下是比较两组实验的显著性差异之用。
但是直到离开实验室也没有彻底弄懂它的具体意义和计算方法。
今天上午应用Excel的双因素方差分析终于学会了如何求解两个序列的p value,以后自己在做实验的时候也应该尽量考虑一下统计这个数据。
在网上找了一下,下面这段问答中有p值的解释,还有一些其他有用的概念。
收藏与此了。
-----------------------------------------问:自由度是什么?怎样确定?答:(定义)构成样本统计量的独立的样本观测值的数目或自由变动的样本观测值的数目。
用df表示。
自由度的设定是出于这样一个理由:在总体平均数未知时,用样本平均数去计算离差(常用小s)会受到一个限制——要计算标准差(小s)就必须先知道样本平均数,而样本平均数和n都知道的情况下,数据的总和就是一个常数了。
所以,“最后一个”样本数据就不可以变了,因为它要是变,总和就变了,而这是不允许的。
至于有的自由度是n-2什么的,都是同样道理。
在计算作为估计量的统计量时,引进一个统计量就会失去一个自由度。
通俗点说,一个班上有50个人,我们知道他们语文成绩平均分为80,现在只需要知道49个人的成绩就能推断出剩下那个人的成绩。
你可以随便报出49个人的成绩,但是最后一个人的你不能瞎说,因为平均分已经固定下来了,自由度少一个了。
简单点就好比你有一百块,这是固定的,已知的,假设你打算买五件东西,那么前四件你可以随便买你想买的东西,只要还有钱的话,比如说你可以吃KFC可以买笔,可以买衣服,这些花去的钱数目不等,当你只剩2块钱时,或许你最多只能买一瓶可乐了,当然也可以买一个肉松蛋卷,但无论怎么花,你都只有两块钱,而这在你花去98块那时就已经定下来了。
问:X方检验中自由度问题答:在正态分布检验中,这里的M为N、平均数和标准差。
因为我们在做正态检验时,要使用到平均数和标准差以确定该正态分布形态,此外,要计算出各个区间的理论次数,我们还需要使用到N。
Excel 财务应用方差分析基本知识任何复杂的事物,其中往往会有许多因素互相制约又互相依存。
方差分析的目的是通过数据分析找出对该事物有显著影响的因素,各因素之间的交互作用,以及显著影响因素的最佳水平等。
方差分析是在可比较的数组中,把数据间总的“变差”按各指定的变差来源进行分解的一种技术。
对变差的度量,采用离差平方和。
方差分析方法就是从总离差平方和分解出可追溯到指定来源的部分离差平方和,这是一个很重要的思想。
在进行方差分析的过程中,由于各种因素的影响,研究所得的数据呈现波动状。
造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。
若方差分析拒绝了检验假设,只能说明多个样本总体均数不相等或不全相等。
如果要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。
●多个样本均数间两两比较多个样本均数间两两比较常用q检验的方法,即Newman-kueuls法,其基本步骤如图7-1所示。
图7-1 q检验方法流程图●多个实验组与一个对照组均数间两两比较多个实验组与一个对照组均数间两两比较,若目的是减小第II类错误,最好选用最小显著差法(LSD法);若目的是减小第I类错误,最好选用新复极差法,前者查t界值表,后者查q'界值表。
1.方差分析的基本思想通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
下面用一个简单的例子来说明方差分析的基本思想:如某克山病区测得11例克山病患者和13名健康人的血磷值(mmol/L)如下:患者:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11健康人:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87问该地克山病患者与健康人的血磷值是否相同?从以上资料可以看出,11个患者与13个健康人的血磷值各不相同,如果用离均差平方和(SS)描述其围绕总均数的变异情况,则总变异有以下两个来源:●组内变异即由于随机误差的原因使得各组内部的血磷值各不相等。
可编辑修改精选全文完整版一、单个样本平均数的u 检验 1. u 检验u 检验(u -test ),就是在假设检验中利用标准正态分布来进行统计量的概率计算的检验方法。
Excel 中统计函数(Ztest )。
有两种情况的资料可以用u 检验方法进行分析:✓ 样本资料服从正态分布 N (μ,σ2),并且总体方差σ2已知;✓ 总体方差虽然未知,但样本平均数来自于大样本(n ≥30)。
【例4-1】某罐头厂生产肉类罐头,其自动装罐机在正常工作时每罐净重服从正态分布N (500,64)(单位,g )。
某日随机抽查10瓶罐头,得净重为:505,512,497,493,508,515,502,495,490,510。
问装罐机当日工作是否正常?(1) 提出假设无效假设H 0:μ=μ0=500g ,即当日装罐机每罐平均净重与正常工作状态下的标准净重一样。
备择假设H A :μ≠μ0,即罐装机工作不正常。
(2)确定显著水平α=0.05(两尾概率)(3)构造统计量,并计算样本统计量值样本平均数:均数标准误:统计量u 值:(4)统计推断 由显著水平α=0.05,查附表,得临界值u 0.05=1.96概率P>0.05,故不能否定H 0 ,所以,当日装罐机工作正常。
2.t 检验 t 检验(t -test )是利用t 分布来进行统计量的概率计算的假设检验方法。
它主要应用于总体方差未知时的小样本资料(n<30)。
其中, 为样本平均数,为样本标准差,n 为样本容量。
[例4-2]用山楂加工果冻,传统工艺平均每100g 加工500g 果冻,采用新工艺后,测定了16次,得知每100g 山楂可出果冻平均为520g ,标准差12g 。
问新工艺与老工艺在每100g 加工果冻的量上有无显著差异?(1)提出无效假设与备择假设 ,即新老工艺没有差异。
,即新老工艺有差异。
(2)确定显著水平 α=0.01(3=520g所以(4)查临界t 值,作出统计推断 由df =15,查t 值表(附表3)得t 0.01(15)=2.947,因为|t |>t 0.01, P <0.01, 故应否定H 0,接受H A , 表明新老工艺的每100g 加工出的果冻量差异极显著。
Excel统计方法一、计量资料的常用统计描述指标1.平均数平均数表示的是一组观察值(变量值)的平均水平或集中趋势。
平均数计算公式:式中:X为变量值、Σ为总和,N为观察值的个数。
2.标准差(S) 标准差表示的是一组个体变量间的变异(离散)程度的大小。
S愈小,表示观察值的变异程度愈小,反之亦然,常写成。
标准差计算公式:式中:∑X2为各变量值的平方和,(∑X)2为各变量和的平方,N-1为自由度3.标准误(S⎺x)标准误表示的是样本均数的标准差,用以说明样本均数的分布情况,表示和估量群体之间的差异,即各次重复抽样结果之间的差异。
S⎺x愈小,表示抽样误差愈小,样本均数与总体均数愈接近,样本均数的可靠性也愈大,反之亦然,常写作。
标准误计算公式:二、计数资料的常用统计描述指标1.率和比率是一种表示在一定条件下某种现象实际发生例数与可能发生该现象的总数比,用来说明某种现象发生的频率。
比是表示事物或现象内部各构成部分的比重。
率和比计算公式:2.率和比的标准误率和比的标准误是抽样造成的误差,表示样本百分率和比与总体百分率和比之间的差异,标准误小,说明抽样误差小,可靠性大,反之亦然。
( p为率的标准误,P为样本率,当样本可靠且有一定数量的观察单位时可代替总体率。
N为样本观察例数)三、显著性检验抽样实验会产生抽样误差,对实验资料进行比较分析时,不能仅凭两个结果(平均数或率)的不同就作出结论,而是要进行统计学分析,鉴别出两者差异是抽样误差引起的,还是由特定的实验处理引起的。
1.显著性检验的含义和原理显著性检验即用于实验处理组与对照组或两种不同处理的效应之间是否有差异,以及这种差异是否显著的方法。
2.无效假设显著性检验的基本原理是提出“无效假设”和检验“无效假设”成立的机率(P)水平的选择。
所谓“无效假设”,就是当比较实验处理组与对照组的结果时,假设两组结果间差异不显著,即实验处理对结果没有影响或无效。
经统计学分析后,如发现两组间差异系抽样引起的,则“无效假设”成立,可认为这种差异为不显著(即实验处理无效)。
《生物统计学》复习题一、填空题(每空1分,共10分)1.变量之间的相关关系主要有两大类:(因果关系),(平行关系)2.在统计学中,常见平均数主要有(算术平均数)、(几何平均数)、(调和平均数)3.样本标准差的计算公式(1)(2--=∑nXXS)4.小概率事件原理是指(某事件发生的概率很小,人为的认为不会发生)5.在标准正态分布中,P(-1≤u≤1)=(0。
6826)(已知随机变量1的临界值为0.1587)6.在分析变量之间的关系时,一个变量X确定,Y是随着X变化而变化,两变量呈因果关系,则X称为(自变量),Y称为(依变量)二、单项选择题(每小题1分,共20分)1、下列数值属于参数的是:A、总体平均数B、自变量C、依变量D、样本平均数2、下面一组数据中属于计量资料的是A、产品合格数B、抽样的样品数C、病人的治愈数D、产品的合格率3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是A、12B、10C、8D、24、变异系数是衡量样本资料程度的一个统计量。
A、变异B、同一C、集中D、分布5、方差分析适合于,数据资料的均数假设检验。
A、两组以上B、两组C、一组D、任何6、在t 检验时,如果t = t0、01,此差异是:A、显著水平B、极显著水平C、无显著差异D、没法判断7、生物统计中t检验常用来检验A、两均数差异比较B、两个数差异比较C、两总体差异比较D、多组数据差异比较8、平均数是反映数据资料性的代表值。
A、变异性B、集中性C、差异性D、独立性9、在假设检验中,是以为前提。
A、肯定假设B、备择假设C、原假设D、有效假设10、抽取样本的基本首要原则是A、统一性原则B、随机性原则C、完全性原则D、重复性原则11、统计学研究的事件属于事件。
A、不可能事件B、必然事件C、小概率事件D、随机事件12、下列属于大样本的是A、40B、30C、20D、1013、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是A、0.11B、8.64C、2.88D、0.3214、在假设检验中,计算的统计量及事件发生的概率之间存在的关系是。
《试验设计与统计方法》实验教学大纲一、说明1、本门课程实验的性质任务、目的与要求生物统计学实验课是将生物统计学的基本理论、基本方法应用于实践的一门应用性学科,是动物科学专业的必修课。
由于统计学是利用统计方法统计分析生产记录、调查研究和科学试验等数据资料,涉及大量复杂的计算。
在计算机技术日益普及的今天,统计软件的使用使得计算变得简单、快捷和准确。
因此,要求学生在全面系统地理解生物统计基本理论的同时,通过生物统计实验课的学习,熟练掌握利用统计软件进行统计分析的基本操作,提高学生分析问题和解决问题的能力,为今后从事科学研究工作奠定基础。
本课程若受计算机、统计软件等因素的限制,实验则以课堂演示讲解为主,学生动手为辅。
2、本门课程实验项目设置情况二、各实验项目教学要求实验一统计计算器的使用一.实验目的与要求熟悉fx-3600P 统计计算器的键盘各部分名称与功能,掌握标准差运算与回归运算的操作过程;在此基础上进一步讲授常用计算器统计功能键的使用,要求学生掌握自己的计算器的统计运算操作。
二.实验内容(一)fx-3600P 统计计算器的使用1.键盘各部分的名称与功能2.寄存器3.统计运算操作过程(二)常用计算器的统计运算操作1.选择运算状态2.输入数据3.求结果实验二数据整理与基本分析一.实验目的与要求熟悉Excel数据分析模块的安装;基本函数运算;熟悉SPSS数据的基本录入格式;掌握用Excel和SPSS软件对数据分组描述、基本特征和常见统计图绘制的方法。
二.实验内容(一) Excel(2000)数据分析模块及函数功能简介;数据的录入格式;资料基本特征值计算。
1.Excel(2000)数据分析模块及函数功能简介2.分析工具库的安装3.利用直方图绘制统计图形4.描述统计分析(二) SPSS软件(11.0)简介,SPSS数据录入格式,利用SPSS进行资料基本特征值计算、绘制统计图形。
1.SPSS软件简介2.SPSS数据录入格式3.利用SPSS进行资料基本特征值计算、绘制统计图形三.上机操作习题:课本例题、课后习题。