5.数理统计实验.
- 格式:doc
- 大小:484.00 KB
- 文档页数:21
数理统计5:指数分布的参数估计,Gamma分布,Gamma分布与其他分布的联系今天的主⾓是指数分布,由此导出\(\Gamma\)分布,同样,读者应尝试⼀边阅读,⼀边独⽴推导出本⽂的结论。
由于本系列为我独⾃完成的,缺少审阅,如果有任何错误,欢迎在评论区中指出,谢谢!⽬录Part 1:指数分布的参数估计指数分布是单参数分布族,总体\(X\sim E(\lambda)\)有时也记作\(\mathrm{Exp}(\lambda)\),此时的总体密度函数为\[f(x)=\lambda e^{-\lambda x}I_{x>0}. \]现寻找其充分统计量,样本联合密度函数为\[\begin{aligned} f(\boldsymbol{x})&=\lambda^n\exp\left\{-\lambda\sum_{j=1}^n x_j \right\}I_{x_1>0}\cdots I_{x_n>0}\\ &=\lambda^ne^{-n\lambda \barx}I_{x_{(1)}>0}, \end{aligned} \]由因⼦分解定理,取\[g(\bar x,\lambda)=\lambda^ne^{-n\lambda \bar x},\quad h(\boldsymbol{x})=I_{x_{(1)}>0}, \]可以得到\(\bar X\)是\(\lambda\)的充分统计量。
但是指数分布的参数并⾮均值,⽽是均值的倒数,所以对\(\bar X\)也有\[\mathbb{E}(\bar X)=\mathbb{E}(X)=\frac{1}{\lambda}. \]注意,千万不要想当然地认为期望和⼀般的函数之间是可交换的,即⼀般来说\(\mathbb{E}[f(X)]\ne f[\mathbb{E}(X)]\),所以你不能认为\(\bar X^{-1}\)就是\ (\lambda\)的⽆偏估计量。
数理统计习题五答案数理统计习题五答案数理统计是一门研究随机现象的规律性和统计方法的学科。
通过对数据的收集、整理、分析和解释,数理统计能够帮助我们了解数据背后的规律和趋势。
在学习数理统计的过程中,习题是不可或缺的一部分。
接下来,我将为大家提供数理统计习题五的答案。
第一题:设X1, X2, ..., Xn为来自总体X的一个样本,其中Xi的概率密度函数为f(x) = 2x, 0 < x < 1。
求样本均值的概率密度函数。
解答:样本均值的概率密度函数可以通过计算样本均值的分布来得到。
由于样本均值是随机变量X1, X2, ..., Xn的和的平均值,根据中心极限定理,当样本容量n足够大时,样本均值的分布近似服从正态分布。
总体X的概率密度函数为f(x) = 2x, 0 < x < 1。
首先计算总体X的期望和方差。
总体X的期望为E(X) = ∫xf(x)dx = ∫2x^2dx = 2/3。
总体X的方差为Var(X) =E(X^2) - [E(X)]^2 = ∫x^2f(x)dx - (2/3)^2 = ∫2x^3dx - 4/9 = 1/2 - 4/9 = 1/18。
根据中心极限定理,当样本容量n足够大时,样本均值的分布近似服从均值为总体均值,方差为总体方差除以样本容量的正态分布。
即样本均值的概率密度函数为f(x) = (1/√(2π/nσ^2)) * exp(-((x-μ)^2)/(2/nσ^2)),其中μ为总体均值,σ为总体标准差。
代入总体均值μ = 2/3,总体标准差σ = √(1/18),得到样本均值的概率密度函数为f(x) = (3√2π) * exp(-9(x-2/3)^2)。
第二题:设X1, X2, ..., Xn为来自总体X的一个样本,其中Xi的概率密度函数为f(x) = 3x^2, 0 < x < 1。
求样本均值的期望和方差。
解答:样本均值的期望和方差可以通过计算样本均值的分布来得到。
小学教育数理统计操作规程1. 目的本操作规程的目的是为了规范小学教育中的数理统计教学活动,确保教学的科学性和有效性。
2. 范围本操作规程适用于所有小学教师和学生,涉及到数理统计的教学活动。
3. 教学准备在进行数理统计教学活动之前,教师应做好以下准备工作:- 熟悉教学内容,了解教学目标和学生的研究需求。
- 准备教学材料,包括教材、练册、工具等。
- 设计教学计划,明确教学步骤和时间安排。
4. 教学步骤4.1 引入教师应通过生动有趣的方式引入数理统计的概念,激发学生的研究兴趣,并与实际生活相联系,让学生明白数理统计的重要性和应用场景。
4.2 知识讲解教师应清晰地讲解数理统计的基本概念、方法和原理,结合实例进行解释,使学生能够理解和掌握相关知识。
4.3 实践操作教师应组织学生进行实践操作,包括收集数据、整理数据、绘制统计图表等活动,让学生亲身体验数理统计的过程,提高他们的实际操作能力。
4.4 讨论和总结教师应引导学生进行讨论,分享实践中的经验和感悟,总结数理统计的应用方法和注意事项,帮助学生深化对数理统计的理解。
5. 教学评估教师应根据学生的实际表现,进行教学评估,包括考试、作业、小组讨论等形式,以便及时发现问题并进行针对性的辅导。
6. 教学改进教师应根据教学评估的结果,及时总结经验,改进教学方法和策略,提高教学效果,以更好地满足学生的研究需求。
7. 安全注意事项在进行数理统计教学活动时,教师和学生应注意以下安全事项:- 使用实验工具时要小心谨慎,避免造成伤害。
- 遵守实验室规定,保持教学环境的整洁和安全。
- 在进行统计实践活动时,保护好个人隐私和数据安全。
8. 附录- 数理统计教学参考书目- 数理统计实践活动案例- 数理统计教学评估表格以上为《小学教育数理统计操作规程》的主要内容,希望能够对小学数理统计教学工作提供一定的指导和帮助。
第五章习题5.1.假设X 和Y 为随机变量,且满足E [X ]=-2, E [Y ]=2, Var[X ]=1, Var[Y ]=9, X 与Y 的相关系数,X Y r =-0.50.5.试由切比雪夫不等式确定满足不等式.试由切比雪夫不等式确定满足不等式{6}P X Y +³c £的最小正数c 之值之值. .解:因为{][][]220[][][]2cov(,)[][]2(,)[][]E X Y E X E Y Var X Y Var X Var Y X Y Var X Var Y r X Y Var X Var Y +=+=-+=+=++=++192(0.5)197=++´-´´=.2[](()[]6)6Var X Y P X Y E X Y ++-+³£由切比雪夫不等式:,有277(6)=636P X Y +³£.得736c =.5.2.设12,X X 为随机变量且0,[]1(1,2)i i EX Var X i ===. . 证明:证明:对任意的0,l >有22121{2}P X X l l+³£.证明:不妨设12(,)X X 为二维连续型随机变量,其密度函数为12,X X f . 由于12222212,[]()(,)X X E X X x y fx y dxdy +¥+¥-¥-¥+=+òò,12122222222212,,22(2)(,)(,)2X X X X x y x y x y P X X f x y dxdy f x y dxdylll l+³+³++³=£òòòò1222,22221212221122(,)2111[][][]22211([]([]))([]([]))22X X x y f x y dxdy E X X E X E X Var X E X Var X E X lll ll l+¥+¥-¥-¥+£=+=+=+++òò111(10)(10)22lll=+++=.5.3.在一枚均匀正四面体的四个面上分别画上1,2,3,4个点个点. . . 现将该四面体重复投现将该四面体重复投掷,(1,2,)i X i =为第i 次投掷向下一面的点数,试求当n ¥®时,211ni i X n =å依概率收敛的极限.的极限.解: 已知已知 (1,2,3,)i X i =的分布列为的分布列为12341/41/41/41/4i X P4422211115[]() , 1,2,3,.42i i k k E X k P X k k i ===×==×==åå可见,222123,,,X X X 是独立同分布的随机变量序列,且有相同的数学期望152,满足辛钦大数定律,因此对任意0e >,有,有 21115lim 02n i n i P X n e ®+¥=æö-³=ç÷èøå,即211ni i X n =å依概率收敛的极限为152.5.4.设{n X }是独立的随机变量序列,且假设{ln }{ln }0.5, 1,2,n n P X n P X n n ===-==,问{n X }是否服从大数定律?是否服从大数定律?解: []ln 0.5(ln )0.50,i E X i i =´+-´=22222[][]([]) (ln )0.5(ln )0.50ln , 1,2,3,.i i i Var X E X E X i i i i =-=´+-´-==则1111[][]0, n n i i i i E X E X n n ====åå 22111111[][]ln , 1,2,3,.n n n i i i i i Var X Var X i n n n n ======ååå利用切比雪夫不等式:对任意0e >,由,由12111[]11([])ni n n i i i i i Var X n P X E X n n e e===-³£ååå, 得2211222111ln ln 1ln (0)nnni i ii i nn nnP X n n e eee===-³££=ååå,从而有从而有211ln 0lim (0)lim 0nin n i n P X n n e e ®+¥®+¥=£-³£=å,得 11lim (0)0n i n i P X n e ®+¥=-³=å.即随机变量序列{}n X 服从大数定律服从大数定律. .5.5.设{n X }是独立同分布的随机变量序列,且假设[]2, []6n n E X Var X ==,证明:22212345632313,Pn n n X X X X X X X X X a n n --++++++¾¾®®¥,并确定常数a 之值.之值.解:232313 1,2,3,k k k k Y X X X k --=+=令.由于{}k X 是独立同分布的随机变量序列,所以{}k Y 也是独立同分布的随机变量序列也是独立同分布的随机变量序列,,且223231332313[][][][] k k k k k k k E Y E X X X E X E X X ----=+=+232323132 ([]([]))[][] (62)2214, 1,2,.k k k k Var XE XE X E X k ---=++=++´==可见,序列{}k Y 满足辛钦大数定律的条件满足辛钦大数定律的条件. . . 根据辛钦大数定律,得根据辛钦大数定律,得根据辛钦大数定律,得1214, PnY Y Y n n+++¾¾®®+¥ 即2221234563231314, Pn n nX X X X X X X X X n n--++++++¾¾®®+¥ 所以,a =14.5.6.设随机变量X ~B(100,0.8)B(100,0.8),试用棣莫弗—拉普拉斯定理求,试用棣莫弗—拉普拉斯定理求{80100}P X £<的近似值.似值.解:由~(100,0.8)X B 知[]1000.880, []1000.80.216E X Var X =´==´´=. 根据棣莫弗根据棣莫弗--拉普拉斯定理作近似计算,有拉普拉斯定理作近似计算,有99[]80[](80100)(8099)[][]E X E X P X P X Var X Var X æöæö--£<=££»F -F ç÷ç÷ç÷ç÷èøèø()()99808080 4.75010.5=0.51616--æöæö=F -F =F -F =-ç÷ç÷èøèø.5.7.一仪器同时收到50个信号k X ,k =1,2,=1,2,………………,50. ,50. ,50. 设设150,,X X 相互独立,且都服从区间服从区间[0[0[0,,9]9]上的均匀分布,试求上的均匀分布,试求501(250)k k P X =>å的近似值.的近似值.解:由~(0,9) , (0,9) , 1,1,2,,50k X U k =,有,有[]92kE X =,[]()212790124kVar X =-=.根据林德伯格根据林德伯格--莱维定理作近似计算,有莱维定理作近似计算,有5050112501250k k k k P X P X ==æöæö>=-£ç÷ç÷èøèøåå250509/215027/4-´æö»-Fç÷´èø()1 1.3610.9130.087=-F =-=.5.8.一个复杂的系统由n 个相互独立起作用的部件所组成,每个部件损坏的概率为0.100.10,,为了使整个系统正常运行,至少需要80%80%或或80%80%以上的部件正常工作,问以上的部件正常工作,问n 至少为多大才能使整个系统正常工作的概率不小于95%95%..解: : 将将n 个部件编号:个部件编号:1,2,...,n, 1,2,...,n, 1,2,...,n, 记记1, 1,2,,.0,i i X i n ì==íî若第个部件正常工作个部件正常工作,,否则否则,,则 ~(1,0.9)i X B ,且12,,,n X X X 相互独立相互独立. .依题意,要求有依题意,要求有110.80.95nii P X n =æö³³ç÷èøå即要求满足即要求满足 10.80.95n i i P X n =æö³³ç÷èøå.根据棣莫弗根据棣莫弗--拉普拉斯定理作近似计算,有拉普拉斯定理作近似计算,有10.80.90.811330.90.1ni i n n n n P X n n =æöæö-´-æöæö³»-F =-F =F ÷ç÷ç÷ç÷ç´´èøèøèøèøå. 由(1.65)0.95F =,应有 1.653n ³,即()23 1.6524.5025n ³´=,取25n =.。
小学教育数理统计操作规程1. 目的本操作规程旨在指导小学教育数理统计工作的开展,确保教师们能够正确有效地进行数理统计教学。
2. 范围本操作规程适用于所有小学教师,包括数学和科学教师。
3. 程序3.1 准备工作在进行数理统计教学前,教师需要做好以下准备工作:- 熟悉教学大纲和教材内容;- 确定教学目标和重点;- 准备相关教学资源和教具。
3.2 教学方法在进行数理统计教学时,教师应采用以下教学方法:- 结合生活实际,引导学生发现统计问题;- 创设情境,激发学生学习兴趣;- 培养学生观察和分析问题的能力;- 引导学生进行实际统计调查;- 进行小组合作和讨论,促进学生间的互动。
3.3 教学步骤数理统计教学应包括以下步骤:1. 引入:引起学生对统计问题的兴趣,激发他们的思考;2. 讲解:向学生介绍统计的基本概念和方法;3. 演示:通过实例演示统计的过程和方法;4. 实践:组织学生进行实际统计调查和数据收集;5. 分析:引导学生对收集到的数据进行分析和总结;6. 总结:对本节课的内容进行总结和归纳;7. 练习:布置相关练习题,巩固学生的学习成果。
3.4 教学评估为了评估学生的学习情况和教学效果,教师应采用以下评估方法:- 经常性的课堂讨论和提问;- 统计作业和练习的批改和评分;- 学生小组项目的展示和评估;- 定期的阶段性考试。
4. 安全注意事项在进行数理统计教学时,教师应注意以下安全事项:- 确保实验材料和仪器设备的安全和完好;- 指导学生正确使用实验工具和设备;- 监督学生在实验过程中的安全行为;- 防止学生之间的不当行为和意外发生。
5. 相关法规和政策教师在进行数理统计教学时,应遵守相关的法规和政策,如:- 《中华人民共和国教育法》;- 《中小学教师职业道德规范》;- 《小学数学课程标准》等。
6. 更新和修订本操作规程应根据教学实践的需要进行定期更新和修订,以确保其与时俱进。
---以上为《小学教育数理统计操作规程》的内容。
第五章数理统计的基础知识在前四章的概率论部分中,我们讨论了概率论的基本概念、思想和方法。
知道随机变量的统计规律性是通过随机变量的概率分布来全面描述的。
在概率论的许多问题中,概率分布通常是已知的或假设为已知的,在这一前提下我们去研究它的性质、特点和规律性,即讨论我们关心的某些概率、数字特征的计算以及对某些问题的判断、推理等。
但在许多实际问题中,所涉及到的某个随机变量服从什么分布我们可能完全不知道,或有时我们能够根据某些事实推断出分布的类型,但却不知道其分布函数中的某些参数。
例如:1、某种电子元件的寿命服从什么分布是完全不知道的。
2、检测一批灯泡是否合格,则每个灯泡可能合格,也可能不合格,则服从(0—1)分布,但其中的参数p 未知。
对这类问题要深入研究,就必须知道与之相应的分布或分布中的参数.数理统计要解决的首要问题就是:确定一个随机变量的分布或分布中的参数.数理统计学是研究随机现象规律性的一门学科,它以概率论为理论基础,研究如何以有效的方式收集、整理和分析受到随机因素影响的数据,并对所考察的问题作出推理和预测,直至为采取某种决策提供依据和建议。
数理统计研究的内容非常广泛,可分为两大类:一是:怎样有效地收集、整理有限的数据资料.二是:怎样对所得的数据资料进行分析和研究,从而对所考察对象的某些性质作出尽可能精确可靠的判断—本书中参数估计和假设检验。
第一节数理统计的基本概念一、总体与总体的分布在数理统计中,我们将研究对象的全体称为总体或母体,而把组成总体的每个元素称为个体。
总体中所包含的个体的个数称为总体的容量. 容量为有限的总体称为有限总体;容量为无限的总体称为无限总体. 总体和个体之间的关系就是集合与元素之间的关系。
在实际问题中,研究对象往往是很具体的事物或现象,而我们所关心的不是每一个个体的种种具体的特征,而是其中某项或某几项数量指标,记为X .例如:研究一批灯泡的平均寿命时,该批灯泡的全体构成了研究的总体,其中每个灯泡就是个体.但在实际问题中,我们仅仅关心灯泡的使用寿命(记X 表示该批灯泡的寿命)。
习题1. 为了解2010年云南省某师范学院新生的每月消费情况,调查了该校50名新生。
试问:(1)研究的总体是什么?(2)研究的样本是什么?(3)样本容量是多少?解 (1)总体为该师范学院所有新生的每月消费。
(2)样本为50名该师范学院新生的每月消费。
(3)样本容量为50。
2. 某厂生产的灯泡使用寿命X 服从参数为λ的指数分布,为了研究其平均寿命,从中抽取一个样本容量为n 的样本12(,)n X X X ,试写出该样本的密度函数。
解 因为总体的密度函数为()0,0x 0.x e x f x λλ-⎧>=⎨≤⎩,,所以,样本12(,)n X X X 的密度函数为()112121,0,,()0ni i x nn n i i e x x x f x x x f x λλ=-=⎧∑⎪>==⎨⎪⎩∏ , , 其余.3. 设某厂大量生产某种产品,其次品率p 未知,每m 件产品包装为一盒,为了检查产品的质量,任意抽取n 盒,查其中的次品数,试在这个统计问题中说明什么是总体,样本以及它们的分布。
解 总体X 表示一盒产品中的产次品数,X 服从参数是(),m p 的二项分布。
这是由于产品的批量很大,次品率为p ,从大批产品中取m 件,可以认为每件产品的取出是相互独立的,从而次品数服从二项分布。
样本1(,,)n X X 表示所抽取的n 盒产品中的次品数。
由样本的独立性与代表性得1(,,)n X X 的联合分布列为11(,...,)n n P X x X x ===11()P X x =…()n n P X x == 111(1)(1)n n n x x m x xxm x m m C p p C p p ----=1[(1)]ii i nx x m x mi Cp p -=-∏.4. 从总体ξ中抽取了一个容量为5的样本,样本值为(5,3,1,2,0)--,试求ξ的经验分布函数。
解 经验分布函数为()0,3,1,31,52,10,53,02,54,25,51, 5.n x x x F x x x x <-⎧⎪-≤<-⎪⎪-≤<⎪⎪=⎨≤<⎪⎪⎪≤<⎪≥⎪⎩5. 研究某地区小学五年级男生身高的分布,抽取了100名男生进行测量。
工程数学Gxxxxxxxxxxxx xxxxxxE-mail: xxxxxxxxxxxxxx Tel: xxxxxxxxxxx5数理统计实验:5.1.实验目的与要求●学会对数据的参数进行评估和作相应的假设检验●学会对分布进行检验和数据的秩检验●建立相应的统计模型,并用R软件求解●对计算结果进行分析和讨论5.2.基本实验5.2.1.区间估计已知某种灯泡寿命服从正态分布,在某星期所生产的该灯泡中随机抽取10只,测得其寿命(单位:小时)为1067 919 1196 785 1126 936 918 1156 920 948(1)试问这批灯泡中大约95%的灯泡至少使用多少小时;(2)求这批灯泡能够使用1000小时以上的概率。
略。
解:(1)由点估计与参数估计未知参数和σ^2,可以求出均值与方差;输入程序:X<-c(1067,919,1196,785,1126,936,918,1156,920,948)t.test(X,al="g")运行结果:结果分析:有95%的灯泡至少可以使用920个小时。
(2)输入程序:x<-c(1067,919,1196,785,1126,936,918,1156,920,948) pnorm(1000,mean(x),sd(x))运行结果:结果分析:灯泡能够使用1000小时以上的概率为1-0.5087941=0.4912059,即49.12%5.2.2.假设检验I正常男子血小板计数均值为225 x 109/L,今测得20名男性油漆作业工人的血小板计数值(单位:109/ L)220 188 162 230 145 160 238 188 247 113126 245 164 231 256 183 190 158 224 175问油漆工人的血小板计数与正常成年男子有无差异,并说明油漆作业对人体血小板计数是否有影响。
解:对于自然状态下的男子血小板的数目可以假设服从于正态分布,由点估计与参数估计未知参数和σ^2,可以求出均值、均值区间与方差;设原假设为H0:225,对立假设H1:225输入程序:X<-c(220,188,162,230,145,160,238,188,247,113,126,245,164,231,256,183,190,158,224,175)t.test(X,mu=225)运行结果:结果分析:可以得出均值为= 192.15,方差σ^2=1694.728;均值区间为(172.3827,211.9173)由此可以得出对于油漆工人而言正常男子血小板数为225单位,油漆工人明显低于正常的数量,则可以得知结论油漆作业对人体血小板数量有严重影响。
5.2.3.假设检验II为研究国产四类新药阿卡波糖胶囊效果,某医院用40名II型糖尿病病人进行同期随机对照实验。
试验者将这些病人随机等分到试验组(阿卡波糖胶囊组)和对照组(拜唐苹胶囊组),分别测得试验开始前和8周后空腹血糖,算得空腹血糖下降值如表下:试验组-0.70 -5.60 2.00 2.80 0.70 3.50 4.00 5.80 7.10 -0.502.50 -1.60 1.703.00 0.404.50 4.60 2.50 6.00 -1.40对照组 3.70 6.50 5.00 5.20 0.80 0.20 0.60 3.40 6.60 -1.106.0 .80 2.00 1.60 2.00 2.20 1.20 3.10 1.70 -2.00(1)假设数据服从正态分布,试用t检验(讨论方差相同和方差不同两种情况)和成对t检验来判断:国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果是否相同?并分析三种检验方法各自的优越性。
(2)检验试验组和对照组的数据的方差是否相同?解:(1)方差相同,方差不同,成对检验3种情况输入程序:X<-c(-0.70, -5.60, 2.00, 2.80, 0.70, 3.50, 4.00, 5.80, 7.10, -0.50,2.50,-1.60, 1.70,3.00, 0.40,4.50, 4.60, 2.50, 6.00, -1.40)Y<-c(3.70, 6.50, 5.00, 5.20, 0.80, 0.20, 0.60, 3.40, 6.60, -1.10,6.00, 3.80, 2.00, 1.60, 2.00, 2.20, 1.20, 3.10, 1.70, -2.00)t.test(X, Y, var.equal=TRUE)t.test(X, Y)t.test(X, Y, paired=TRUE)!运行结果:结果分析:方差相同结果X<-c(-0.70, -5.60, 2.00, 2.80, 0.70, 3.50, 4.00, 5.80, 7.10, -0.50,2.50,-1.60, 1.70, 3.00, 0.40,4.50, 4.60, 2.50, 6.00, -1.40)Y<-c(3.70, 6.50, 5.00, 5.20, 0.80, 0.20, 0.60, 3.40, 6.60, -1.10, 6.00, 3.80, 2.00, 1.60, 2.00,2.20, 1.20,3.10, 1.70, -2.00)t.test(X, Y, var.equal=TRUE)方差不同结果t.test(X, Y)成对检验结果t.test(X, Y,paired=TRUE)结果分析:由此可得:效果相同,统计区别不明显,三种检验方式的优越性,方差相同的情况区间最小。
(2)X,Y组单独检验运行程序输入程序:t.test(X)运行结果:输入程序:t.test(Y)运行结果:结果分析:由此可得,X组P值为0.007077,Y组为0.00011125.2.4.假设检验III某医院研究乳腺癌家族史对于乳腺癌发病率的影响。
假设调查了10000名50-54岁的妇女,她们的母亲曾有乳腺癌。
发现她们在那个生存期的某个时刻有400例乳腺癌,而全国在该年龄段的妇女乳腺癌的患病率为2%,这组数据能否说明乳腺癌的患病率与家庭遗传有关。
解:根据题意,假设检验采用二项分布总体,调用binom.test函数。
输入程序:binom.test(400, 10000, 0.02)运行结果:结果分析:由此可得,p-value <2.2e-16<0.05,所以拒绝接受原假设,认为这些数据说明乳腺癌的患病率与家族史有关。
5.2.5.分布检验IMendel用豌豆的两对相对性状进行杂交实验,黄色圆滑种子与绿色皱缩种子的豌豆杂交后,第二代根据自由组合规律,理论分离比为黄圆:黄皱:绿圆:绿皱=9/16:3/16:3/16:1/16实际实验值为:黄圆315粒,黄皱101粒,绿圆108粒,绿皱32粒,共556粒,问此结果是否符合自由组合规律?解:由题黄圆:黄皱:绿圆:绿皱= :::此问题可以用Pearson拟合优度2 检验,令:09331H: P1=,P2=,P3=,P4=16161616输入程序:chisq.test(c(315,101,108,32),p=c(9,3,3,1)/16)运行结果:结果分析:程序运行结果表明,p-value = 0.9254>0.05,可以认为此结果是符合自由组合规律的。
5.2.6.分布检验II观察每分钟进入某商店的人数X,任取200分钟,所得数据表5.1所示。
试分析,能否认为每分钟顾客数X服从Poisson分布(α= 0.1)。
表5.1每分钟进人商店顾客人数的频数解:输入程序:1)X<-0:5;Y<-c(92,68,28,11,1,0);q<-ppois(X, mean(rep(X,Y)));n<-length(Y)p<-numeric(n);p[1]<-q[1];p[n]<-1-q[n-1];for (i in 2:(n-1)) p[i]<-q[i]-q[i-1];chisq.test(Y,p=p);2)Z<-c(92,68,28,12);n<-length(Z);p<-p[1:n-1];p[n]<-1-q[n-1];chisq.test(Z,p=p)运行结果:1)2)结果分析:因为2Pearson 检验要求在分组后,每组中的频数至少要大于等于5,而后两组中出现的频数是1,0,均小于5。
由此可以得知p-value = 0.8227>>0.1,因此,能认为每分钟顾客人数X服从Poisson分布。
5.2.7.列联表检验I向120名女性和120名男性做调查,了解他们关于给谁买节日礼物最难的看法,调查结果如表5.2所示,试分析:女性和男性在关于给谁买节日礼物最难的看法上有没有显著差异。
解:根据题意,输入数据,用chisq.test()函数检验:输入程序:x<-scan()28 34 23 7 13 15 42 13 9 11 7 20X<-matrix(x, nc=4, byrow=T)chisq.test(X)运行结果:结果分析:从计算结果得,p-value = 2.311e-08小于0.05,所以女性和男性在关于给谁买节日礼物最难的看法上有显著差异5.2.8.列联表检验II为研究人脑的左右半球恶性肿瘤的发病率是否有显著差异,对人脑恶性肿瘤和良性肿瘤的发育情况做了调查,调查结果如表5.3所示,试进行分析。
解:输入数据,用chisq.test()函数检验:输入程序:x <- matrix(c(9, 1, 3, 3), nc = 2)chisq.test(x,correct = FALSE)运行结果:用fisher.test()作独立精准检验,R程序:x<-c(9,1,3,3)dim(x)<-c(2,2)fisher.test(x)结果分析:P的平均值,p-value = 0.1181,平且估计区间包含有1,可得出结论,说明两个变量是独立的,左右半球恶性肿瘤的发病率没有显著差异。
5.2.9.Wilcoxon秩和检验I(1)为了了解新的数学教学方法的效果是否比原来方法的效果有所提高,从水平相当的10名学生中随机地各选5名接受新方法和原方法的教学试验。
充分长一段时间后,由专家通过各种方式(如考试提问等)对10名学生的数学能力予以综合评估(为公正起见,假定专家对各个学生属于哪一组并不知道),并按其数学能力由弱到强排序,结果如表5.4所示。
对α= 0.05,检验新方法是否比原方法显著地提高了教学效果。
表5.4学生数学能力排序结果(2)若新方法与原方法得到排序结果改为表5.6所示的情形,能否说明新方法比原方法显著提高了教学效果?表5.5学生数学能力排序结果解:(1)由题可以得出如下的wilcox.test()函数R程序输入程序:x<-c(3, 5, 7, 9, 10)y<-c(1, 2, 4, 6, 8)wilcox.test(x, y, alternative="greater")运行结果:结果分析:由p-value = 0.1111>=0.05所以无法确定新方法有提高新效果(2)由新的表格可以得到新的R程序输入程序:x<-c(4, 6, 7, 9, 10)y<-c(1, 2, 3, 5, 8)wilcox.test(x, y, alternative="greater")运行结果:结果分析:p-value = 0.04762<0.05则可以得出新方法有一定程度的提高效果5.2.10.Wilcoxon秩和检验II为比较一种新疗法对某种疾病的治疗效果,将40名患者随机地分为两组,每组20人,一组采用新疗法,另一组用原标准疗法.经过一段时间的治疗后,对每个患者的疗效作仔细的评估,并划分为差、较差、一般、较好和好五个等级。