(新)高中数学第3章统计案例3.2独立性检验的基本思想及其初步应用学业分层测评新人教A版选修2-3
- 格式:doc
- 大小:103.50 KB
- 文档页数:6
学习资料专题
3.2独立性检验的基本思想及其初步应用
预习导航
1.数据的表示方法
(1)变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
(2)用图表列出两个分类变量的频数表,称为列联表.
(3)与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.
思考1 班级与成绩2×2列联表:
表示数据m,n,p,
A.70,73,45,188 B.17,73,45,90
C.73,17,45,90 D.17,73,45,45
提示:B
2.独立性检验
(1)利用随机变量K2来判断“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
(2)一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}{y1,y2},其样本频数列联表如下:
公式K2=
n ad-bc
a +
b c+d a+
c b+d
,其中n=a+b+c+d为样本容量.
思考2 如何理解独立性检验的思想?
提示:独立性检验的基本思想类似于反证法.要判断“两个分类变量有关系”,首先假设结论不成立,即H0:“两个分类变量没有关系”成立,在该假设下构造的随机变量K2,应该很小.如果由观测数据计算得到的K2的观测值k很大,则断言H0不成立,即认为“两个分类变量有关系”;如果观测值k很小,则说明在样本数据中没有发现足够证据拒绝H0.。
3.2独立性检验的基本思想及其初步应用第三课时教学目标知识与技能理解独立性检验的基本思想,会根据K2的观测值的大小判断两个分类变量有关的可信度,培养学生的自主探究的学习能力,并能应用数学知识解决实际问题.过程与方法通过主动探究、自主合作、相互交流,从具体实例中归纳出进行独立性检验的基本步骤,使学生充分体会知识的发现过程,并渗透统计的基本思想和方法.情感、态度与价值观使学生体会数学的理性与严谨,了解数学来源于实际,应用于实际的唯物主义思想,培养学生对新知识的科学态度,勇于探索和敢于创新的精神.重点难点教学重点:利用独立性检验的基本思想解决实际问题以及处理步骤;教学难点:对独立性检验思想的理解.教学过程引入新课提出问题:在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶.(1)利用图形判断秃顶与患心脏病是否有关系;(2)能否在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系?学生活动:小组合作完成.活动结果:根据题目所给的数据画出列联表:相应的等高条形图如图所示:比较来说,秃顶的病人中患心脏病的比例大一些,可以在某种程度上认为“秃顶与患心脏病有关”.根据列联表中的数据,得到k =1 437×(214×597-175×451)2389×1 048×665×772≈16.373>6.635,因此,在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系.设计目的:以实际问题创建情境,引起学生的好奇,激发学习和探究知识的兴趣,从而也引起学生的无意注意,在不知不觉中进入教师设计的教学情境中,为本节课的学习做有利的准备.探究新知提出问题:上述解法中,用到了等高条形图和独立性检验两种方法来判断“秃顶与患心脏病是否有关系”,试比较两种方法的关系和各自的特点.学生活动:学生先自由发言,大胆描述.学情预测:独立性检验能精确判断可靠程度,而等高条形图的优点是直观,但只可以粗略判断两个分类变量是否有关系,一般在通过图表判断后还需要用独立性检验来确认,这主要是因为列联表中的数据来源于样本数据,它们反映出来的这种相关性的特征能够在多大程度上代表总体,则需要用独立性检验来确认.提出问题:试总结独立性检验的基本步骤. 学生活动:思考总结,然后回答.活动结果:①根据数据画出列联表;②计算随机变量K 2的观测值;③与已知数据对照下结论.设计目的:比较判断分类变量相关性方法的优缺点,并在解决问题的基础上将独立性检验的具体步骤模式化.理解新知提出问题:你所得的结论在什么范围内有效?学生活动:学生先自由发言,教师逐步引导学生.学情预测:开始学生的回答可能不全面、不准确,但在其他学生的不断补充、纠正下,会趋于完善.活动结果:“样本只能代表相应总体”,这里的数据来自于医院的住院病人,因此题目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出现错误,除非有其他的证据表明可以进行这种推广.设计意图:让学生充分体会用样本估计总体的思想. 提出问题:两个分类变量X 和Y 的2×2列联表如下若令W =⎪⎪⎪⎪⎪⎪a a +b -c c +d ,试结合前面的学习,分析W 的大小与“X 与Y 有关系”的联系. 学生活动:分组讨论,通过协作交流来解决问题,教师进行适当的引导.学情预测:W 越大,越有利于结论“X 与Y 有关系”,它越小,越有利于结论“X 与Y 没有关系”.提出问题:类似于通过K 2的构造判断规则,我们也可以用W 构造一个判断“X 与Y 有关系”的规则,即当W 的观测值w>w 0时,就判断“X 与Y 有关系”;否则,判断“X 与Y 没有关系”.那么,在“X 与Y 没有关系”的前提下P(W≥w 0)=0.01,且P(K 2≥k 0)=0.01,可以通过k 0来确定w 0吗?学生活动:分组讨论,通过协作交流来解决问题,教师进行适当的引导.学情预测:由计算公式可得K 2=W 2×n(a +b)(c +d)(a +c)(b +d),其中n =a +b +c +d.因此,K 2≥k 0等价于W≥k 0×(a +c)(b +d)n(a +b)(c +d),即可取w 0=k 0×(a +c)(b +d)n(a +b)(c +d).设计目的:通过一组精心设计的问题链来引导和激发学生的参与意识、创新意识,培养探究问题的能力,提升思维的层次.在解决问题的过程中,激发学生的研究兴趣,培养学生的科学理性精神,体会交流、合作和竞争等现代意识.运用新知1为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:由表中数据计算得到K2的观察值k≈4.513.在多大程度上可以认为高中生的性别与数学课程之间是否有关系?分析:根据K2的观察值k≈4.513,对照数据确定多大程度上可以认为高中生的性别与数学课程之间是否有关系.解:由上表可知k≈4.513>3.841,而P(K2≥3.841)≈0.05,故在犯错误的概率不超过0.05的前提下认为“高中生的性别与数学课程之间有关系”.点评:在熟练掌握了两个分类变量的独立性检验方法之后,可直接计算K2的观测值解决实际问题,而没有必要画相应的图形,但是图形的直观性也不可忽视.【变练演编】2某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表.提出问题:如何根据数据分析“高中生学习状况与生理健康”的关系?试阐述你的方案.活动设计:学生先独立探索,允许互相交流成果.然后全班交流.学情预测:等高条形图、独立性检验等.设计意图:设置本开放性问题,意在增加问题的多样性、有趣性、探索性,不仅会加深学生对数学的理解、掌握,而且会潜移默化地学会编题、解题.课堂小结1.知识收获:独立性检验的思想方法及一般步骤;2.方法收获:独立性检验的思想方法;3.思维收获:数学来源于生活.设计意图:让学生自己小结,这是一个多维整合的过程,是一个高层次的自我认识过程.补充练习【基础练习】1.在研究某种新药对猪白痢的防治效果问题时,得到以下数据:试问能否在犯错误的概率不超过0.01的前提下认为新措施对防治猪白痢有效?2.在一次恶劣气候的飞行航程中,调查男女乘客在机上晕机的情况如下表所示,据此资料,在犯错误的概率不超过0.1的前提下,你是否认为在恶劣气候飞行中男性比女性更容易晕机?答案:1.提示:K 2的观测值k≈7.317>6.635,故在犯错误的概率不超过0.01的前提下认为新措施对防治猪白痢有效.2.提示:K 2的观测值k≈2.149<2.706,而P(K 2>2.706)≈0.10,故在犯错误的概率不超过0.1的前提下,我们不能认为在恶劣气候飞行中男性比女性更容易晕机.【拓展练习】3.考察黄烟经过培养液处理与否跟发生青花病的关系,调查了457株黄烟,得到下表中的数据,请根据数据作统计分析.解:根据公式得K 2的观测值k =457×(25×142-80×210)235×222×105×352≈41.61,由于41.61>10.828,故在犯错误的概率不超过0.001的前提下,说明黄烟经过培养液处理与否跟发生青花病是有关系的.设计说明本设计主要采用“诱思探究教学法”,其核心是“诱导思维,探索研究”,其教学思想是“教师为主导,学生为主体,训练为主线,思维为主攻”的“四为主”原则.教师不是抛售现成的结论,而是充分暴露学生的思维,展示“发现”的过程,突出“师生互动”的教学,这种设计充分体现了教师的主导作用.学生在一系列的思考、探究中逐步完成了本节的学习任务,充分实现了学生的主体性地位,在整个教学过程中,始终着眼于培养学生的思维能力,这种设计符合现代教学观和学习观的精神,体现了素质教育的要求:教与学有机结合而对立统一.良好的教学设想,必须通过教学实践来体现,教师必须善于驾驭教法,指导学法,完成教学目标,从而使学生愉快地、顺利地、认真地、科学地接受知识.备课资料独立性检验在实际生活中有广泛的应用,解决该类问题的关键是准确的运算. 例1为了研究色盲与性别的关系,调查了1 000人,调查结果如下表所示:根据上述数据,试问在犯错概率不超过0.001的前提下,色盲与性别是否是相互独立的?解:由已知条件可得下表假设色盲与性别是相互独立的,即色盲与性别无关,依据公式得K2的观测值k=1 000×(442×6-38×514)2≈27.139.956×44×480×520由于27.139>10.828,∴在犯错概率不超过0.001的前提下,可认为色盲与性别有关,从而拒绝原假设,故在犯错概率不超过0.01的前提下,可以认为色盲与性别不是相互独立的.。
山西省忻州市2016-2017学年高中数学第三章统计案例3.2 独立性检验的基本思想及其初步应用测标题(无答案)新人教A版选修2-3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(山西省忻州市2016-2017学年高中数学第三章统计案例3.2 独立性检验的基本思想及其初步应用测标题(无答案)新人教A版选修2-3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为山西省忻州市2016-2017学年高中数学第三章统计案例3.2 独立性检验的基本思想及其初步应用测标题(无答案)新人教A版选修2-3的全部内容。
独立性检验的基本思想及其初步应用本试卷满分55分参考表P(k2≥k0)0。
500。
400.250.150。
100.050。
0250.010。
0050。
001K00。
4550。
708 1.3232.0722。
7063。
8415.0246.6357。
87910.828一.选择题(每小题5分,共25分)1。
在两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是 ( )A.模型1的相关指数R2为0。
98 B.模型2的相关指数R2为0.85C.模型3的相关指数R2为0。
61 D.模型4的相关指数R2为0.312.已知回归直线的斜率的估计值为1。
23,样本点的中心为(4,5),则回归直线方程为()A. 1.234y x=+B. 1.235y x=+C. 1.230.08y x=+D.0.08 1.23y x=+3.检验两个分类变量是否相关时,可以用( )粗略地判断两个分类变量是否有关系A.散点图 B.等高条形图 C.独立性检验 D.以上都可以4.对于P(K2≥k),当k>2。
3.2 独立性检验的基本思想及其初步应用知识点分类变量及2×2列联表1.分类变量变量的不同“值”表示个体所属的□01不同类别,像这样的变量称为分类变量. 2.列联表(1)定义:列出的两个分类变量的□02频数表,称为列联表. (2)2×2列联表一般地,假设有两个分类变量X 和Y ,它们的取值分别为□03{x 1,x 2}和□04{y 1,y 2},其样本频数列联表(也称为2×2列联表)为下表.知识点 等高条形图(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否□01相互影响,常用等高条形图展示列联表数据的□02频率特征. (2)观察等高条形图发现aa +b 和cc +d相差很大,就判断两个分类变量之间□03有关系.知识点独立性检验1.列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系.2.对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算随机变量K2的值,如果K2的值很大,说明假设不合理.K2越大,两个分类变量有关系的可能性越大.1.判一判(正确的打“√”,错误的打“×”)(1)分类变量中的变量与函数中的变量是同一概念.( )(2)列联表频率分析法、等高条形图可初步分析两分类变量是否有关系,而独立性检验中K2取值则可通过统计表从数据上说明两分类变量的相关性的大小.( )(3)独立性检验的方法就是反证法.( )答案(1)×(2)√(3)×2.做一做(1)为了调查高中生的性别与是否喜欢踢足球之间有无关系,一般需要收集以下数据________.(2)若观测值k≈7.8,得到的正确结论是在犯错误的概率不超过________的前提下认为“爱好该项运动与性别有关”.(3)独立性检验中,假设H0:变量x与变量y没有关系.则在H0成立的情况下,估计概率P(K2≥6.635)≈0.01表示的意义是变量x与变量y________(填“有关系”或“无关系”)的概率是99%.答案(1)男女生中喜欢和不喜欢踢足球的人数(2)1% (3)有关系解析(1)为了调查高中生的性别与是否喜欢踢足球之间有无关系,一般需要收集男女生中喜欢和不喜欢踢足球的人数,再得出2×2列联表,最后代入随机变量的观测值公式,得出结果.(2)因为7.8>6.635,所以这个结论有0.01=1%的机会说错,在犯错误的概率不超过1%的前提下认为“爱好该项运动与性别有关”.(3)因为概率P(K2≥6.635)≈0.01,所以两个变量有关系的可信度是1-0.01=99%,即两个变量有关系的概率是99%.探究1独立性检验的基本思想例1 在吸烟与患肺病这两个分类变量中,下列说法正确的是( )A.若K2的观测值k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99个人患有肺病B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病C .若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D .以上三种说法都不正确[解析] 独立性检验的结果是一种相关关系,不是确定性关系,反映的是有关或无关的概率的大小,故A 错误,B 错误,C 正确.答案选C.[答案] C 拓展提升本例考查独立性检验的基本思想,相关性检验的结果是一种相关关系,而不是确定性关系,是反映有关和无关的概率.本题考查学生对基本知识的理解.[跟踪训练1] 给出下列实际问题,其中不可以用独立性检验解决的是 ( ) A .喜欢参加体育锻炼与性别是否有关 B .喝酒者得胃病的概率 C .喜欢喝酒与性别是否有关 D .青少年犯罪与上网成瘾是否有关 答案 B解析 独立性检验主要是对两个分类变量是否有关进行检验,故不可用独立性检验解决的问题是B.故选B.[跟踪训练2] 通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )算得,K 2=110×(40×30-20×20)260×50×60×50≈7.8.附表:A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关” 答案 C解析 根据独立性检验的定义,由k 2≈7.8>6.635可知在犯错误的概率不超过0.01的前提下,认为“爱好该项运动与性别有关”,即有99%以上的把握认为“爱好该项运动与性别有关”.故选C.探究2 用等高条形图判断两个变量是否相关例2 为考察某种药物预防疾病的效果进行动物试验,得到如下列联表:药物效果试验列联表试用等高条形图分析服用药和患病之间是否有关系. [解] 根据列联表所给的数据可得出服用药患病的频率为1055≈0.18,未服用药患病的频率为2050=0.4,两者的差距是|0.18-0.4|=0.22,两者相差很大,作出等高条形图如图所示,因此服用药与患病之间有关系的程度很大.拓展提升应用等高条形图判断两变量是否相关的方法在等高条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例aa+b,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例cc+d.“两个比例的值相差越大,H1成立的可能性就越大”.[跟踪训练3]某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系.解作列联表如下:相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例高,可以认为考前紧张与性格类型有关.探究3由K2进行独立性检验例3 某校对学生课外活动进行调查,结果整理成下表:试用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?[解]其等高条形图如图所示.由图可以直观地看出喜欢体育还是喜欢文娱与性别在某种程度上有关系,但只能作粗略判断,具体判断方法如下:假设“喜欢体育还是喜欢文娱与性别没有关系”,∵a=21,b=23,c=6,d=29,n=79.∴K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=79×(21×29-23×6)2(21+23)×(6+29)×(21+6)×(23+29)≈8.106.且P(K2≥7.879)≈0.005,即我们得到的K2的观测值k≈8.106,超过7.879,这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关.”拓展提升独立性检验的具体做法(1)根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界α,然后查表确定临界值k0.(2)利用公式K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)计算随机变量K2的观测值k.(3)如果k≥k0,推断“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.[跟踪训练4]某地区甲校高二年级有1100人,乙校高二年级有900人,为了统计两个学校高二年级在学业水平考试中的数学学科成绩,采用分层抽样的方法在两校共抽取了200名学生的数学成绩,如下表:(已知本次测试合格线是50分,两校合格率均为100%) 甲校高二年级数学成绩:乙校高二年级数学成绩:(1)计算x,y的值,并分别估计以上两所学校数学成绩的平均分(精确到1分);(2)若数学成绩不低于80分为优秀,低于80分为非优秀,根据以上统计数据填写下面2×2列联表,并回答能否在犯错误的概率不超过0.05的前提下认为“两个学校的数学成绩有差异?”解(1)依题意知甲校应抽取110人,乙校应抽取90人,∴x =10,y =15,估计两个学校的平均分,甲校的平均分为 55×10+65×25+75×35+85×30+95×10110≈75.乙校的平均分为55×15+65×30+75×25+85×15+95×590≈71.(2)数学成绩不低于80分为优秀,低于80分为非优秀,得到列联表k =200(40×70-20×70)260×140×110×90≈4.174,又因为4.174>3.841,故能在犯错误的概率不超过0.05的前提下认为“两个学校的数学成绩有差异”.1.独立性检验是数理统计的一种方法,是数学中的一种基本理论,是数学体系中对数据关系进行探索的一种基本思想.判断两个分类变量是否相关可以通过等高条形图进行粗略判断,也可以通过独立性检验来考察两个分类变量是否有关系,利用公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(c +d )计算出随机变量K 2的观测值k ,通过查表确定临界值k 0.若k >k 0说明X与Y有关系,否则是没有关系.2.解决一般的独立性检验问题的步骤(1)通过列联表确定a,b,c,d,n的值,根据实际问题需要的可信程度确定临界值k0;(2)利用K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)求出K2的观测值k;(3)如果k≥k0,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”.其中第(2)步易算错K2的值,是本节课的易错点.1.在独立性检验中,假设H0:变量x与变量y没有关系,则在H0成立的情况下,P(K2≥6.635)≈0.01表示 ( )A.变量x与变量y有关系的概率是1%B.变量x与变量y有关系的概率是99%C.变量x与变量y没有关系的概率是0.1%D.变量x与变量y没有关系的概率是99.9%答案 B解析因为P(K2≥6.635)≈0.01,所以两个变量有关系的可信度是99%,即两个变量有关系的概率是99%.故选B.2.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:文化程度与月收入列联表(单位:人)由上表中数据计算得K2的观测值k=105×(10×30-20×45)255×50×30×75≈6.109,请估计有多大把握认为“文化程度与月收入有关系”()A.1% B.99%C.2.5% D.97.5%答案 D解析由于6.109>5.024,故在犯错误的概率不超过0.025的前提下,即有97.5%的把握认为“文化程度与月收入有关系”.3.如图是某地区男女中学生是否喜欢理科的等高条形图,从图中可以看出 ( )A.是否喜欢理科与性别无关B.女生中喜欢理科的百分比约为80%C.男生比女生喜欢理科的可能性大D.男生中不喜欢理科的百分比约为60%答案 C解析 由等高条形图,可知女生中喜欢理科的百分比约为1-0.8=0.2=20%,男生中喜欢理科的百分比约为1-0.4=0.6=60%,因此男生比女生喜欢理科的可能性大.故选C.4.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:则在犯错误的概率不超过________的前提下认为喜爱打篮球与性别有关(请用百分数表示).答案 0.5%解析 K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=50×(20×15-5×10)225×25×30×20≈8.333>7.879,所以在犯错误的概率不超过0.005的前提下认为喜爱打篮球与性别有关.5.吃零食是在中学生中普遍存在的现象,吃零食对中学生的身体发育有诸多不利影响,并影响他们的健康成长.下表是性别与喜欢吃零食的列联表:解 根据列联表所给的数据,可得出男生中喜欢吃零食的频率为545≈0.11,女生中喜欢吃零食的频率为1240=0.3,两者差距是|0.3-0.11|=0.19.两者相差较大,作出等高条形图如图所示,比较图中两个深色的条形可以发现,女生中喜欢吃零食的频率明显高于男生中喜欢吃零食的频率,因此可以认为性别与喜欢吃零食有关系.。
湖北省宜昌市高中数学第三章统计案例3.2 独立性检验的基本思想及其初步应用练习(无答案)新人教A版选修2-3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(湖北省宜昌市高中数学第三章统计案例3.2 独立性检验的基本思想及其初步应用练习(无答案)新人教A版选修2-3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为湖北省宜昌市高中数学第三章统计案例3.2 独立性检验的基本思想及其初步应用练习(无答案)新人教A版选修2-3的全部内容。
3。
2独立性检验的基本思想及其初步应用1.下列变量中不是分类变量的是( ) A .近视 B .成绩 C .性别 D .饮酒 2.下列说法中错误的是( )A .有时可以把分类变量的不同取值用数字表示,但这时的数字除了分类以外没有其它含义B .在统计学中,独立性检验就是检验两个分类变量是否有关系的一种方法C .在进行独立性检验时,可以先利用三维柱形图和二维条形图粗略地判断两个分类变量是否有关系D .通过三维柱形图和二维条形可以精确的给出所得结论的可靠程度3.某高校《统计》课程的教师随机给出了选该课程的一些情况,具体数据如下:为了判断选修统计专业是否与性别有关,根据表中数据,得2 4.844K ≈,因为2 3.841K >,所以可以判定选修统计专业与性别有关。
那么这种判断出错的可能性为( ) A .5% B .95% C .1% D .99%4.在三维柱形图中,主对角线的两个柱形高度的乘积bc 相关越大,X 与Y 有关系的可能性就 。
5.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同的剂量的电离辐射照射小白鼠.在照射14天内的结果如下:进行统计分析时的统计假设是非统计专业统计专业男 13 10 女720死存合7.研究人员选取170名青年男女大学生的样本,对他(她)们进行一种心理测验,发现有60名女生对该心理的最后一个题目的反应是:作肯定的18名,否定42名;男生110名在相同的项目上作出肯定的有22名,否定的有88名。
3.2 独立性检验的基本思想及其初步应用[学习目标]1.了解独立性检验的基本思想、方法及其简单应用;2.理解判断两个分类变量是否有关系的常用方法、独立性检验中K2的含义及其实施步骤.[知识链接]1.举例说明什么是分类变量?答变量的不同“值”表示个体所属的不同类别的变量称为分类变量,分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级等等.2.什么是列联表?怎样从列联表判断两个分类变量有无关系?答一般地,假设两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},列出两个变量的频数表,称为列联表(如下图)|ad-bc|越小,说明两个分类变量x,y之间的关系越弱;|ad-bc|越大,说明两个分类变量x,y之间的关系越强.[预习导引]1.分类变量和列联表(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表①定义:列出的两个分类变量的频数表称为列联表.②2×2列联表一般地,假设两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)为下表.2.等高条形图(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征. (2)观察等高条形图发现aa +b 和cc +d相差很大,就判断两个分类变量之间有关系.3.独立性检验(1)定义:利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验.(2)K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .(3)独立性检验的具体做法①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k 0.②利用公式计算随机变量K 2的观测值k .③如果k ≥k 0,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.要点一 有关“相关的检验”用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?解 判断方法如下:假设H 0“喜欢体育还是喜欢文娱与性别没有关系”,若H 0成立,则K 2应该很小. ∵a =21,b =23,c =6,d =29,n =79,∴K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=79×(21×29-23×6)244×35×27×52≈8.106.且P (K 2≥7.879)≈0.005即我们得到的K 2的观测值k ≈8.106超过7.879,这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关”.规律方法 (1)利用K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )求出K 2的观测值k 的值.再利用临界值的大小来判断假设是否成立.(2)解题时应注意准确代数与计算,不可错用公式,准确进行比较与判断.跟踪演练1 为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查得到如下数据:判断学生的数学成绩好坏与对学习数学的兴趣是否有关? 解 由公式得K 2的观测值k =189×(64×73-22×30)286×103×95×94≈38.459.∵38.459>10.828,∴有99.9%的把握说学生学习数学的兴趣与数学成绩是有关的. 要点二 有关“无关的检验”例2 为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.分析学生选报文、理科与对外语的兴趣是否有关? 解 列出2×2列联表代入公式得K 2的观测值k =361×(138×52-73×98)2236×125×211×150≈1.871×10-4.∵1.871×10-4<2.706,∴可以认为学生选报文、理科与对外语的兴趣无关.规律方法运用独立性检验的方法:(1)列出2×2列联表,根据公式计算K2的观测值k.(2)比较k与k0的大小作出结论.跟踪演练2 第16届亚运会于2010年11月12日至27日在中国广州进行,为了搞好接待工作,组委会招募了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和6人喜爱运动,其余人不喜爱运动.(2)根据列联表的独立性检验,能否在犯错误的概率不超过0.10的前提下认为性别与喜爱运动有关?解(1)(2)假设是否喜爱运动与性别无关,由已知数据可求得:K2=30×(10×8-6×6)2(10+6)(6+8)(10+6)(6+8)≈1.157 5<2.706,因此,在犯错误的概率不超过0.10的前提下不能判断喜爱运动与性别有关.要点三独立性检验的基本思想甲厂乙厂(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.附:K 2=n (-)(a +b )(c +d )(a +c )(b +d ),解 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500=64%.(2)K 2=1 000×(360×180-320×140)500×500×680×320≈7.353>6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”.规律方法 (1)解答此类题目的关键在于正确利用K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算k 的值,再用它与临界值k 0的大小作比较来判断假设检验是否成立,从而使问题得到解决.(2)此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握.(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.解 (1)假设H 0:传染病与饮用水无关.把表中数据代入公式得:K 2的观测值k =830×(52×218-466×94)2146×684×518×312≈54.21,∵54.21>10.828,所以拒绝H 0.因此我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关.此时,K 2的观测值k =86×(5×22-50×9)14×72×55×31≈5.785.由于5.785>5.024,所以我们有97.5%的把握认为该种疾病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有97.5%的把握肯定.1.观察下列各图,其中两个分类变量x ,y 之间关系最强的是( )答案 D解析 观察等高条形图发现x 1x 1+y 1=x 2x 2+y 2相差很大,就判断两个分类变量之量关系最强.则表中a ,b 处的值分别为( ) A .94,96 B .52,50 C .52,60 D .54,52 答案 C解析 ∵a +21=73,∴a =52,b =a +8=52+8=60.3.经过对K 2的统计量的研究,得到了若干个临界值,当K 2的观测值k >3.841时,我们( ) A .在犯错误的概率不超过0.05的前提下可认为X 与Y 有关 B .在犯错误的概率不超过0.05的前提下可认为X 与Y 无关 C .在犯错误的概率不超过0.01的前提下可认为X 与Y 有关 D .没有充分理由说明事件X 与Y 有关系 答案 A4.根据下表计算:K 2的观测值k ≈________(保留3位小数).答案 4.514解析 k =300×(37×143-85×35)2122×178×72×228≈4.514.1.列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系. 2.对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算随机变量K 2的值,如果K 2值很大,说明假设不合理.K 2越大,两个分类变量有关系的可能性越大.一、基础达标1.下面说法正确的是( )A.统计方法的特点是统计推断准确、有效B.独立性检验的基本思想类似于数学上的反证法C.任何两个分类变量有关系的可信度都可以通过查表得到D.不能从等高条形图中看出两个分类变量是否相关答案 B2.用独立性检验来考察两个分类变量x与y是否有关系,当统计量K2的观测值( ) A.越大,“x与y有关系”成立的可能性越小B.越大,“x与y有关系”成立的可能性越大C.越小,“x与y没有关系”成立的可能性越小D.与“x与y有关系”成立的可能性无关答案 B3.在一个2×2列联表中,由其数据计算得K2的观测值k=7.097,则这两个变量间有关系的可能性为( )A.99% B.99.5%C.99.9% D.无关系答案 A解析K2的观测值6.635<k<7.879,所以有99%的把握认为两个变量有关系.4.对两个分类变量A,B的下列说法中正确的个数为( )①A与B无关,即A与B互不影响;②A与B关系越密切,则K2的值就越大;③K2的大小是判定A与B是否相关的唯一依据A.0 B.1 C.2 D.3答案 B解析①正确,A与B无关即A与B相互独立;②不正确,K2的值的大小只是用来检验A与B是否相互独立;③不正确,例如借助三维柱形图、二维条形图等.故选B.5.如果K2的观测值为6.645,可以认为“x与y无关”的可信度是________.答案1%解析查表可知可信度为1%.由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,有________把握认为课外阅读量大与作文成绩优秀有关.答案99.5%解析根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.7.在某测试中,卷面满分为100分,60分为及格,为了调查午休对本次测试前两个月复习效果的影响,特对复习中进行午休和不进行午休的考生进行了测试成绩的统计,数据如下表所示:(2)根据列联表可以得出什么样的结论?对今后的复习有什么指导意义?解(1)根据题表中数据可以得到列联表如下:(2)计算可知,午休的考生及格率为P 1=80180=49,不午休的考生的及格率为P 2=65200=1340,则P 1>P 2,因此,可以粗略判断午休与考生考试及格有关系,并且午休的及格率高,所以在以后的复习中考生应尽量适当午休,以保持最佳的学习状态. 二、能力提升8.在等高条形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( ) A.a a +b 与d c +d B.c a +b 与a c +d C.aa +b 与cc +dD.aa +b 与cb +c答案 C解析 由等高条形图可知aa +b 与cc +d的值相差越大,|ad -bc |就越大,相关性就越强.9.考察棉花种子经过处理跟生病之间的关系得到下表数据:根据以上数据,可得出( )A .种子是否经过处理跟是否生病有关B .种子是否经过处理跟是否生病无关C .种子是否经过处理决定是否生病D .以上都是错误的 答案 B解析 由K 2=407×(32×213-61×101)293×314×133×274≈0.164<2.706,即没有把握认为种子是否经过处理跟是否生病有关.10.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据:设H 0:服用此药的效果与患者的性别无关,则K 2的观测值k ≈________(小数点后保留三位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________. 答案 4.882 5%解析 由公式计算得K 2的观测值k ≈4.882,∵k >3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.解 依题意,计算随机变量K 2的观测值: k =913×(478×24-399×12)2490×423×877×36≈6.233>5.024,所以在出错概率不超过0.025的前提下,可以判断“文科学生总成绩不好与数学成绩不好有关系”.请问喜欢吃零食与性别是否有关?解 K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),把相关数据代入公式,得K 2的观测值k =85×(5×28-40×12)217×68×45×40≈4.722>3.841.因此,在犯错误的概率不超过0.05的前提下,可以认为“喜欢吃零食与性别有关”. 三、探究与创新试说明在这三种心理障碍中哪一种与性别关系最大?解 对于题中三种心理障碍分别构造三个随机变量K 21,K 22,K 23.其观测值分别为k 1,k 2,k 3. 由表中数据列出焦虑是否与性别有关的2×2列联表可得k 1=110×(5×60-25×20)30×80×25×85≈0.863<2.706,同理,k 2=110×(10×70-20×10)230×80×20×90≈6.366>5.024,k 3=110×(15×30-15×50)230×80×65×45≈1.410<2.706.因此,在犯错误的概率不超过0.025的前提下,认为说谎与性别有关,没有充分的证据显示焦虑、懒惰与性别有关.。
2018-2019学年高中数学第三章统计案例3.2 独立性检验的基本思想及其初步应用习题新人教A版选修2-3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018-2019学年高中数学第三章统计案例3.2 独立性检验的基本思想及其初步应用习题新人教A版选修2-3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018-2019学年高中数学第三章统计案例3.2 独立性检验的基本思想及其初步应用习题新人教A版选修2-3的全部内容。
第三章 3.2 独立性检验的基本思想及其初步应用A级基础巩固一、选择题1.给出下列实际问题:①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区别;③吸烟者得肺病的概率;④吸烟是否与性别有关系;⑤网吧与青少年的犯罪是否有关系.其中用独立性检验可以解决的问题有( B )A.①②③B.②④⑤C.②③④⑤D.①②③④⑤[解析]独立性检验是判断两个分类变量是否有关系的方法,而①③都是概率问题,不能用独立性检验.2.在2×2列联表中,两个比值____________相差越大,两个分类变量之间的关系越强( A )A.错误!与错误!B.错误!与错误!C.错误!与错误!D.错误!与错误![解析] 错误!与错误!相差越大,说明ad与bc相差越大,两个分类变量之间的关系越强.3.判断两个分类变量是彼此相关还是相互独立的常用方法中,最为精确的是( D ) A.三维柱形图B.二维条形图C.等高条形图D.独立性检验[解析] 前三种方法只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度.独立性检验通过计算得出相关的可能性,较为准确.4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由K2=错误!算得,K2=错误!≈7.8.附表:参照附表,A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关"C.在犯错误的概率不超过0。
【课堂新坐标】2016-2017学年高中数学第3章统计案例 3.2 独立性检验的基本思想及其初步应用学业分层测评新人教A版选修2-3(建议用时:45分钟)[学业达标]一、选择题1.通过对K2的统计量的研究得到了若干个临界值,当K2≤2.706时,我们认为( ) A.在犯错误的概率不超过0.05的前提下认为X与Y有关系B.在犯错误的概率不超过0.01的前提下认为X与Y有关系C.没有充分理由认为X与Y有关系D.不能确定【解析】∵K2≤2.706,∴没有充分理由认为X与Y有关系.【答案】 C2.下列关于等高条形图的叙述正确的是( )A.从等高条形图中可以精确地判断两个分类变量是否有关系B.从等高条形图中可以看出两个变量频数的相对大小C.从等高条形图中可以粗略地看出两个分类变量是否有关系D.以上说法都不对【解析】在等高条形图中仅能粗略判断两个分类变量的关系,故A错.在等高条形图中仅能够找出频率,无法找出频数,故B错.【答案】 C3.分类变量X和Y的列联表如下:A.ad-bc越小,说明X与Y关系越弱B.ad-bc越大,说明X与Y关系越弱C.(ad-bc)2越大,说明X与Y关系越强D.(ad-bc)2越接近于0,说明X与Y关系越强【解析】对于同一样本,|ad-bc|越小,说明X与Y之间关系越弱;|ad-bc|越大,说明X 与Y 之间的关系越强.【答案】 C4.利用独立性检验对两个分类变量是否有关系进行研究时,若有99.5%的把握认为事件A 和B 有关系,则具体计算出的数据应该是( )A .k ≥6.635B .k <6.635C .k ≥7.879 D.k <7.879【解析】 有99.5%的把握认为事件A 和B 有关系,即犯错误的概率为0.5%,对应的k 0的值为7.879,由独立性检验的思想可知应为k ≥7.879.【答案】 C5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下表的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110由K 2=n ad -bc 2a +bc +d a +cb +d算得,k =110×40×30-20×20260×50×60×50≈7.8.附表:P (K 2≥k 0)0.050 0.010 0.001 k 03.8416.63510.828A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关”【解析】 由k ≈7.8及P (K 2≥6.635)=0.010可知,在犯错误的概率不超过1%的前提下认为“爱好该项运动与性别有关”,也就是有99%以上的把握认为“爱好该项运动与性别有关”.【答案】 C 二、填空题6.在对某小学的学生进行吃零食的调查中,得到如下表数据:吃零食 不吃零食 总计 男学生273461女学生 12 29 41 总计3963102297270063】 【解析】 由公式可计算得k =102×27×29-34×12239×63×61×41≈2.334.【答案】 2.3347.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射14天内的结果如表所示:死亡 存活 总计 第一种剂量 14 11 25 第二种剂量 6 19 25 总计203050【解析】 根据独立性检验的基本思想,可知类似于反证法,即要确认“两个分量有关系”这一结论成立的可信程度,首先假设该结论不成立.对于本题,进行统计分析时的统计假设应为“小白鼠的死亡与电离辐射的剂量无关”.【答案】 小白鼠的死亡与电离辐射的剂量无关 8.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K 2的观测值k >6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.(填序号)【解析】 K 2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.【答案】 ③ 三、解答题9.用两种检验方法对某食品做沙门氏菌检验,结果如下表.阳性 阴性 总计 荧光抗体法 160 5 165 常规培养法264874总计186 53 239附:P (K 2≥k 0)0.010 0.005 0.001 k 06.6357.87910.828(1)利用图形判断采用荧光抗体法与检验结果呈阳性是否有关系;(2)能否在犯错误的概率不超过0.001的前提下认为采用荧光抗体法与检验结果呈阳性有关系?【解】 (1)作出等高条形图如图所示,由图知采用荧光抗体法与检验结果呈阳性有关系.(2)通过计算可知K 2=n ad -bc 2a +bc +d a +cb +d≈113.184 6.而查表可知,因为P (K 2≥10.828)≈0.001,而113.184 6远大于10.828,所以在犯错误的概率不超过0.001的前提下认为采用荧光抗体法与检验结果呈阳性有关系.10.有人发现一个有趣的现象,中国人的邮箱里含有数字比较多,而外国人邮箱名称里含有数字比较少,为了研究国籍和邮箱名称里含有数字的关系,他收集了124个邮箱名称,其中中国人的64个,外国人的60个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.(1)根据以上数据建立2×2列联表;(2)他发现在这组数据中,外国人邮箱里含数字的也不少,他不能断定国籍和邮箱名称里含有数字是否有关,你能帮他判断一下吗?【解】 (1)2×2的列联表:中国人 外国人 总计 有数字 43 27 70 无数字 21 33 54 总计6460124(2)由表中数据得k =124×43×33-27×21270×54×64×60≈6.201.因为k >5.024,所以有理由认为假设“国籍和邮箱名称里与是否含有数字无关”是不合理的,即在犯错误的概率不超过0.025的前提下认为“国籍和邮箱名称里与是否含有数字有关”.[能力提升]1.对两个分类变量A,B,下列说法中正确的个数为( )①A与B无关,即A与B互不影响;②A与B关系越密切,则K2的值就越大;③K2的大小是判定A与B是否相关的唯一依据.A.1 B.2 C.3 D.0【解析】①正确,A与B无关即A与B相互独立;②不正确,K2的值的大小只是用来检验A与B是否相互独立;③不正确,也可借助等高条形图等.故选A.【答案】 A2.(2016·晋江市季延中学期中)某研究所为了检验某血清预防感冒的作用,把500名使用了该血清的志愿者与另外500名未使用该血清的志愿者一年中的感冒记录作比较,提出假设H:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列叙述中正确的是( )A.有95%的把握认为“这种血清能起到预防感冒的作用”B.若有人未使用该血清,那么他一年中有95%的可能性得感冒C.这种血清预防感冒的有效率为95%D.这种血清预防感冒的有效率为5%【解析】K2≈3.918>3.841,因此有95%的把握认为“这种血清能起到预防感冒的作用”,故选A.【答案】 A3.为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:设H一位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.【解析】由公式计算得K2的观测值k≈4.9.∵k>3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.【答案】 4.9 5%4.(2016·潍坊高二检测)为了研究玉米品种对产量的影响,某农科院对一块试验田种植的一批玉米共10 000株的生长情况进行研究,现采用分层抽样方法抽取50株作为样本,统计结果如下:高茎 矮茎 总计 圆粒 11 19 30 皱粒 13 7 20 总计242650(1)6株玉米,再从这6株玉米中随机选出2株,求这2株之中既有高茎玉米又有矮茎玉米的概率;(2)根据对玉米生长情况作出的统计,是否有95%的把握认为玉米的圆粒与玉米的高茎有关?【解】 (1)依题意,取出的6株圆粒玉米中含高茎2株,记为a ,b ;矮茎4株,记为A ,B ,C ,D ,从中随机选取2株的情况有如下15种:aA ,aB ,aC ,aD ,bA ,bB ,bC ,bD ,ab ,AB ,AC ,AD ,BC ,BD ,CD .其中满足题意的共有aA ,aB ,aC ,aD ,bA ,bB ,bC ,bD ,共8种,则所求概率为P =815.(2)根据已知列联表, 得k =50×11×7-13×19230×20×24×26≈3.860>3.841,即有95%的把握认为玉米的圆粒与玉米的高茎有关.。