关于假设检验中的假设 (1)
- 格式:doc
- 大小:53.00 KB
- 文档页数:2
实验7 假设检验(一)一、实验目的:1.掌握重要的参数检验方法(单个总体的均值检验,两个总体的均值检验,成对样本的均值的检验,两个总体方差的检验,二项分布总体的检验);2.掌握若干重要的非参数检验方法(Pearson拟合优度 2检验,Kolmogorov-Smirnov单样本和双样本检验)。
二、实验内容:练习:要求:①完成练习并粘贴运行截图到文档相应位置(截图方法见下),并将所有自己输入文字的字体颜色设为红色(包括后面的思考及小结),②回答思考题,③简要书写实验小结。
④修改本文档名为“本人完整学号姓名1”,其中1表示第1次实验,以后更改为2,3,...。
如文件名为“09张立1”,表示学号为09的张立同学的第1次实,法1Alt,即完法2:图标,工具。
)1.2.H0:H1:alternative hypothesis: true mean is not equal to 22595 percent confidence interval:172.3827 211.9173sample estimates:mean of x192.15P=0.002516<0.05,拒绝原假设,认为油漆工人的血小板计数与正常成年男子有差异3.(习题5.2)已知某种灯泡寿命服从正态分布,在某星期所生产的该灯泡中随机抽取10 只,测得其寿命(单位:小时)为1067 919 1196 785 1126 936 918 1156 920 948求这个星期生产出的灯泡能使用1000小时以上的概率。
解:源代码及运行结果:(复制到此处,不需要截图)> x<-c(1067, 919, 1196, 785, 1126, 936, 918, 1156, 920, 948)> p<-pnorm(1000,mean(x),sd(x))> 1-p[1] 0.4912059结论:这个星期生产出的灯泡能使用1000小时以上的概率为0.49120594.(习题5.3)为研究某铁剂治疗和饮食治疗营养性缺铁性贫血的效果,将16名患者按年龄、体重、病程和病情相近的原则配成8对,分别使用饮食疗法和补充铁剂治疗的方法,3个月后测得两种患者血红资白如下表所示,问两种方法治疗后的患者血红蛋白有无差异?H0:H1:5.,分别测试验组与对照组空腹腔血糖下降值(mmol/L)(1)检验试验组和对照组的的数据是否来自正态分布,采用正态性W检验方法(见第3章)、Kolmogorov-Smirnov检验方法和Pearson拟合优度 2检验;解:提出假设:H0:认为国产四类新药阿卡波糖股嚢与拜唐苹股嚢对空腹血糖的降糖效果不同H1:认为国产四类新药阿卡波糖股嚢与拜唐苹股嚢对空腹血糖的降糖效果相同①正态性W检验方法源代码及运行结果:(复制到此处,不需要截图)>x<-c(-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.6 0,2.50,6.00,-1.4)> shapiro.test(x)Shapiro-Wilk normality testdata: xW = 0.9699, p-value = 0.7527>y<-c(3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3②结论:试验组p=0.9771>0.05,对照组p=0.9368>0.05,所以检验试验组和对照组的的数据是来自正态分布③Pearson拟合优度 2检验源代码及运行结果:(复制到此处,不需要截图)>x<-c(-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.6 0,2.50,6.00,-1.4)> A<-table(cut(x,br=c(-6,-3,0,3,6,9)))> p<-pnorm(c(-3,0,3,6,9),mean(x),sd(x))> p> p<-c(p[1],p[2]-p[1],p[3]-p[2],p[4]-p[3],1-p[4])> p> chisq.test(A,p=p)Chi-squared test for given probabilitiesdata: AX-squared = 0.56387, df = 4, p-value = 0.967Warning message:In chisq.test(A, p = p) : Chi-squared近似算法有可能不准>y<-c(3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3 .10,1.70,-2.00)> B<-table(cut(y,br=c(-2,1,2,4,7)))> p<-pnorm( c(-2,1,2,4,7),mean(y),sd(y))> p> p(2H0:H1:t = -0.64187, df = 38, p-value = 0.5248alternative hypothesis: true difference in means is not equal to 095 percent confidence interval:-2.326179 1.206179sample estimates:mean of x mean of y2.065 2.625结论:p=0.5248>0.05,不拒绝原假设,两组数据均值没有差异②方差不同模型源代码及运行结果:(复制到此处,不需要截图)>x<-c(-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.6 0,2.50,6.00,-1.4)>y<-c(3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3 .10,1.70,-2.00)> t.test(x,y)Welch Two Sample t-testdata: x and yt = -0.64187, df = 36.086, p-value = 0.525alternative hypothesis: true difference in means is not equal to 095 percent confidence interval:(3解:提出假设:H0:试验组与对照组的方差相同H1:试验组与对照组的方差不相同源代码及运行结果:(复制到此处,不需要截图)>x<-c(-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.6 0,2.50,6.00,-1.4)>y<-c(3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3 .10,1.70,-2.00)> var.test(x,y)F test to compare two variancesdata: x and yF = 1.5984, num df = 19, denom df = 19, p-value = 0.3153alternative hypothesis: true ratio of variances is not equal to 195 percent confidence interval:0.6326505 4.0381795sample estimates:ratio of variances1.598361结论:p= 0.3153>0.05,不拒绝原假设,试验组与对照组的方差相同6.(习题5.5)为研究某种新药对抗凝血酶活力的影响,随机安排新药组病人12例,对照组病人10例,(1(2(3解:(1H0:H1:H0:H1:> y<-c(162, 172 ,177 ,170 ,175, 152 ,157 ,159, 160 ,162)> ks.test(y,"pnorm",mean(y),sd(y))One-sample Kolmogorov-Smirnov testdata: yD = 0.22216, p-value = 0.707alternative hypothesis: two-sidedWarning message:In ks.test(y, "pnorm", mean(y), sd(y)) :Kolmogorov - Smirnov检验里不应该有连结(2)检验两组样本方差是否相同;提出假设:H0:两组样本方差相同H1:两组样本方差不相同源代码及运行结果:(复制到此处,不需要截图)> x<-c(126,125,136,128,123,138,142,116,110,108,115,140)> y<-c(162, 172 ,177 ,170 ,175, 152 ,157 ,159, 160 ,162)> var.test(x,y)F test to compare two variancesdata: x and yF = 1.9646, num df = 11, denom df = 9, p-value = 0.32alternative hypothesis: true ratio of variances is not equal to 1(3H0:H1:7.靠,随机抽选了400名居民,发现其中有57人是老年人。
设总体2(,)N ξμσ~,其中参数μ,2σ为未知,试指出下面统计假设中哪些是简单假设,哪些是复合假设:(1)0:0,1H μσ==; (2)0:0,1H μσ=>; (3)0:3,1H μσ<=; (4)0:03H μ<<; (5)0:0H μ=.解:(1)是简单假设,其余位复合假设设1225,,,ξξξL 取自正态总体(,9)N μ,其中参数μ未知,x 是子样均值,如对检验问题0010:,:H H μμμμ=≠取检验的拒绝域:12250{(,,,):||}c x x x x c μ=-≥L ,试决定常数c ,使检验的显著性水平为解:因为(,9)N ξμ~,故9(,)25N ξμ~ 在0H 成立的条件下,00053(||)(||)53521()0.053cP c P c ξμξμ-≥=-≥⎡⎤=-Φ=⎢⎥⎣⎦55()0.975,1.9633c cΦ==,所以c =。
设子样1225,,,ξξξL 取自正态总体2(,)N μσ,20σ已知,对假设检验0010:,:H H μμμμ=>,取临界域12n 0{(,,,):|}c x x x c ξ=>L ,(1)求此检验犯第一类错误概率为α时,犯第二类错误的概率β,并讨论它们之间的关系;(2)设0μ=,20σ=,α=,n=9,求μ=时不犯第二类错误的概率。
解:(1)在0H 成立的条件下,200(,)nN σξμ~,此时00000()P c P ξαξ=≥=≥10αμ-=,由此式解出010c αμ-=+在1H 成立的条件下,20(,)nN σξμ~,此时101010()(P c P αξβξμ-=<=<=Φ=Φ=Φ由此可知,当α增加时,1αμ-减小,从而β减小;反之当α减少时,则β增加。
(2)不犯第二类错误的概率为100.9511(0.650.51(3)0.21(0.605)(0.605)0.7274αβμμ--=-Φ--=-Φ-=-Φ-=Φ= 设一个单一观测的ξ子样取自分布密度函数为()f x 的母体,对()f x 考虑统计假设:0011101201:():()00x x x H f x H f x ≤≤≤≤⎧⎧==⎨⎨⎩⎩其他其他试求一个检验函数使犯第一,二类错误的概率满足2min αβ+=,并求其最小值。
假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。
具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。
常用的假设检验方法有u—检验法、t—检验法、X2检验法、F—检验法,秩和检验等。
目录简介假设检验亦称“显著性检验(Test of statistical significance)”,是假设检验用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
生物现象的个体差异是客观存在,以致抽样误差不可避免,所以我们不能仅凭个别样本的值来下结论。
当遇到两个或几个样本均数(或率)、样本均数(率)与已知总体均数(率)有大有小时,应当考虑到造成这种差别的原因有两种可能:一是这两个或几个样本均数(或率)来自同一总体,其差别仅仅由于抽样误差即偶然性所造成;二是这两个或几个样本均数(或率)来自不同的总体,即其差别不仅由抽样误差造成,而主要是由实验因素不同所引起的。
假设检验的目的就在于排除抽样误差的影响,区分差别在统计上是否成立,并了解事件发生的概率。
在质量管理工作中经常遇到两者进行比较的情况,如采购原材料的验证,我们抽样所得到的数据在目标值两边波动,有时波动很大,这时你如何进行判定这些原料是否达到了我们规定的要求呢?再例如,你先后做了两批实验,得到两组数据,你想知道在这两试实验中合格率有无显著变化,那怎么做呢?这时你可以使用假设检验这种统计方法,来比较你的数据,它可以告诉你两者是否相等,同时也可以告诉你,在你做出这样的结论时,你所承担的风险。
假设检验的思想是,先假设两者相等,即:µ=µ0,然后用统计的方法来计算验证你的假设是否正确。
有关假设检验中“假设”的进一步讨论
一般来讲是根据样本值的情况作出假设。
当你心中对所检验的东西的大小没有足够的把握时,就用等式假设。
如果检验的人对所检验的对象的大小有一定的偏向,那么,一般备选假设1H 就按偏向来假
设,而假设0H 就按1H 反向来假设。
比如,你心中对p 是不是10没把
握时,你就假设0H :p=10,1:10H p ≠;如果你心中偏向于p>10,那么你的备选假设为1H :p>10,而原假设为0:10H p ≤。
反之亦然。
说明:
1.、针对一个问题,假设不是唯一的,但是必须能说明问题。
2、同一个问题可以有不同的拒绝域,(比如选了不同的统计量就可能有不同的拒绝域。
)
3、为什么课件中第七章第二节例2,我说如果做假设0:1500H μ=,
1:1500H μ≠也可以呢?因为如果否定了假设0:1500H μ=,
那么就是接受了1:1500H μ≠,根据样本值15751500X =>,这时我只能认为1500μ>,而不是1500μ<。
所以,我说像这道题做假设0:1500H μ≤和0:1500H μ=我都算对,关键是拒绝域是否和假设对应。
4、还是以课件中第七章第二节例2为例,若原假设是0:1500H μ=,拒绝域一般是A B 。
若假设0:1500H μ≤,1:1500H μ>,那么拒绝域为B ,因为做假设的人认为样本值1500X -不可能小于0。