高中数学 3.2 独立性检验(一)教案 北师大选修2-3
- 格式:doc
- 大小:274.50 KB
- 文档页数:4
独立性检验两种基本思想的解读与对比一、利用三维柱形图或二维条形图粗略地判断运用三维柱形图和二维条形图可以粗略地判断两个分类变量X与Y是否有关系,利用图形的直观性可以较好地向非专业人士解释所得到的统计分析结果.但需要注意的是:①运用两种图形法判断两个分类变量是否有关系时,作图一定要规范;②由于这两种方法无法精确地给出所得结论的可靠程度,因而只做粗略统计,而不做具体运算.例1.为考查某种药物预防疾病的效果,进行动物试验,得到如下的列联表:未患病患病总计服用药45 10 55没有服用药30 20 50总计75 30 105试用三维柱形图分析服用药和患病之间是否有关系?解:根据列联表所给的数据作出三维柱形图,如图1所示.比较说来,底面主对角线上两个柱体高度的乘积要大的多,可以在很大程度上认为“患病与是否服用药有关”.例2.在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,试用二维条形图判断色盲与性别是否有关系?解:根据题中已知数据作出如下的列联表:色盲未患色盲总计男38 442 480女 6 514 520总计44 956 1000根据列联表作出相应的二维条形图,如图2所示.从二维条形图来看,在男人中患色盲的比例38 480,要比在女人中患色盲的比例6520大,因而我们可以在很大程度上认为患色盲与性别是有关的.二、独立性检验独立性检验是用来考查两个分类变量是否具有相关关系,并且能较精确地给出这种判断的可靠程度的一种统计方法,利用这一方法,可以直接用2K的值解决实际问题.这里需特别说明的是:2K与k的关系并不是2k K=,2K是一个随机变量,它在a b c d,,,取不同的值时,2K可能不同;而k是2K的观测值,是取定一组数a、b、c、d后的一个确定的值.例3.运动员参加比赛前往往做热身运动,下表是一体育运动的研究机构对160位专业运动员追踪而得的数据,试问:由此数据,你认为运动员受伤与不做热身运动有关吗?解:由22()()()()()n ad bcKa c abcd b d-=++++2160(19207645)38.97495656496⨯⨯-⨯=≈⨯⨯⨯.因为38.974>7.879,所以有99.5%的把握说,运动员受伤与不做热身运动有关.针对训练1.研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的22名,否定受伤不受伤合计做热身19 76 95不做热身45 20 65合计64 96 160的38名;男生110名在相同的项目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?分别用图形和独立性检验的方法判断.2.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表;(2)判断性别与休闲方式是否有关系?参考答案1、解析:根据题目所给数据建立如下列联表:性别与态度的关系列联表肯定否定总计男生22 88 110女生22 38 60总计44 126 170相应的三维柱形图如图所示,比较来说,底面副对角线上两个柱体高度的乘积要大一些,因此可以在某种程度上认为“性别与态度有关”.根据列联表中的数据得到22170(22382288)5.622 5.0241106044126K⨯⨯-⨯=≈>⨯⨯⨯.所以有97.5%的把握认为“性别与态度有关”.2、解析:(1)依据题意“性别与休闲方式”2×2列联表为:看电视运动总计女43 27 70男21 33 54总计64 60 124(2)假设“休闲方式与性别无关”,计算22124(43332721)6.201 5.02470546460K⨯⨯-⨯=≈>⨯⨯⨯.所以有理由认为假设“休闲方式与性别无关”是不合理的,即有97.5%的把握认为“休闲方式与性别有关”.。
独立性检验(一)----教学设计(周至五中唐永鸽)一、内容与内容解析1内容(1)分类变量的定义;(2)两个分类变量的列联表;(3)等高条形图(了解);(4)独立性检验的基本思想(了解)及其实施步骤2 内容解析本节内容理论比较复杂,由于它贴近实际生活,在整个高中数学中,地位不可小视在近几年各省新课标高考试题中,本节内容屡屡出现,其重要性可见一斑该内容是学生在数学必修3中的统计知识的进一步应用,还涉及到与初中数学中讲到的“反证法”类似的思想“独立性检验”是在考察两个分类变量之间是否具有相关性的背景下提出的,因此教材上首先提到了分类变量,并给出了考察两个分类变量之间是否相关的一种直观的思路,即借助列联表,随后引出相对更精确的解决办法(独立性检验)。
独立性检验的思想,建立在统计思想、假设检验思想小概率事件在一次试验中几乎不可能发生等基础之上,通常按照如下步骤对数据进行处理:制列k并给出结论联表→计算统计量2K的观测值k→比较观测值k与临界值本节的重点内容是通过实例让学生体会独立性检验的基本思想,掌握独立性检验的一般步骤二、目标和目标解析1目标(1)理解分类变量的含义;(2)了解独立性检验(只要求2×2列联表)的基本思想及掌握解题步骤;(3)培养利用多种方法解决问题的学习精神情感、态度;(4)体会统计学的广泛性和科学的严谨性情感、态度2目标解析通过对典型案例((吸烟和患肺癌有关吗)的探究,让学生利用列联表、等高条形图初步判断两个分类变量的相关性,并进一步了解独立性检验(只要求2×2列联表)的基本思想及其实施步骤,从中体验用多种方法列联表、等高条形图和独立性检验解决同一问题;通过本问题的解决,还能让学生体会统计学的广泛性和科学的严谨性 三、教学问题诊断分析由于面对的学生数学基础薄弱,对数学概念的理解往往感到吃力。
结合实际情况,在本节新学内容时,有以下几点是初学者不易理解或掌握的:1为什么在直观判断“吸烟和患肺癌是否有关”后,还要进行统计分析(独立性检验)?教科书通过探究“吸烟是否与患肺癌有关系”引出了独立性检验的问题,并借助样本数据的列联表、等高条形图(补充)展示在吸烟人中患肺癌的比例比不吸烟人中患肺癌的比例要高,使学生直观感觉到吸烟和患肺癌可能有关系。
生活中的独立性检验独立性检验在实际生活中有广泛的应用,解决该类问题的关键是熟记公式,准确的运算。
独立性检验的基本步骤为: (1)找相关数据,作列联表;(2)求2K 2()()()()()n ad bc a b c d a c b d -=++++的值;(3)判断可能性.随机变量2K 的值越大,说明“X与Y 有关系”成立的可能性越大.例1某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取189名员工进行调查,所得数据如下表所示:对于人力资源部的研究项目,根据上述数据能得出什么结论?解:由题目中表的数据可知:a=64,b=40,c=32,d=63,a+b=94,c+d=95,a+c=86,b+d=103,n=189.代入公式得K 2=≈⨯⨯⨯⨯-⨯⨯=++++-103869594)32406354(189))()()(()(22d b d c b a c a bc ad n 10.759,因为10.759>7.879,所以有99.5%的把握说:员工“工作积极性”和“积极支持企业改革”是有关的,可以认为企业的全体员工对待企业改革态度和工作积极性是有关的。
点评:首先由已知条件确定a 、b 、c 、d 、n 的数值,再利用公式求出K 2的观测值,最后与6.635比较再下结论。
例2 考察黄烟经过培养液处理与否跟发生青花病的关系,调查了457株黄烟,得到下表中的数据,请根据数据作统计分析。
培养液处理 未处理 合计 青花病 25 210 235 无青花病 80 142 222 合计105352457解析:根据公式得()22457251428021041.61235222105352K ⨯⨯-⨯=≈⨯⨯⨯由于41.6110.828>,说明黄烟经过培养液处理与否跟发生青花病是有关系的。
点评:计算2K的值与临界值的大小进行比较即可。
例3.为了研究色盲与性别的关系,调查了1000人,调查结果如下表所示:根据上述数据,试问色盲与性别是否是相互独立的?解析:由已知条件可得下表依据公式得()22100044263851427.13995644480520K⨯⨯-⨯=≈⨯⨯⨯。
学习目标 1.理解2×2列联表,并会依据列联表判断两个变量是否独立.2.理解统计量χ2的意义和独立性检验的基本思想.知识点一2×2列联表思考某教育行政部门大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表:体育文娱合计男生210230440女生60290350合计270520790如何判定“喜欢体育还是文娱与性别是否有联系”?梳理设A、B为两个变量,每一变量都可以取两个值,得到表格.BB2总计A B1A1a bA2c d总计n=________其中,a表示变量A取________,且变量B取________时的数据,b表示变量A取________,且变量B取________时的数据;c表示变量A取________,且变量B取________时的数据;d表示变量A取________,且变量B取________时的数据.上表在统计中称为2×2列联表.知识点二统计量χ2=________________________.(其中n=a+b+c+d为样本容量)知识点三独立性检验当χ2≤2.706时,没有充分的证据判定变量A,B________;当χ2>2.706时,有__________的把握判定变量A,B有关联;当χ2>3.841时,有__________的把握判定变量A,B有关联;当χ2>6.635时,有__________的把握判定变量A,B有关联.类型一2×2列联表和统计量χ2例1某企业为了更好地了解设备改造与生产合格品的关系,随机抽取了180件产品进行分析,其中设备改造前生产的合格品有36件,不合格品有49件;设备改造后生产的合格品有65件,不合格品有30件,请根据数据,列出2×2列联表,并说明可以用本列表研究什么问题?反思与感悟2×2列联表将文字语言转换为图表语言,使问题更为清晰,可为进一步研究问题作充分的准备.跟踪训练1已知药物效果与动物试验列联表如下所示:则χ2≈________.(结果保留3位小数)类型二独立性检验的方法例2研究人员选取170名青年男、女大学生作为样本,对他们进行一种心理测验,发现有60名女生对该心理测验中的最后一个题目的反应是:肯定的有22名,否定的有38名;男生110名在相同的题目上肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?用独立性检验的方法判断.反思与感悟独立性检验可以通过2×2列联表计算χ2的值,然后和临界值对照作出判断.跟踪训练2为了研究人的性别与患色盲是否有关系,某研究所进行了随机调查,发现在调查的480名男性中有39名患有色盲,520名女性中有6名患有色盲,试问人的性别与患色盲有关系吗?1.当χ2>3.841时,认为事件A与事件B()A.有95%的把握有关B.有99%的把握有关C.没有理由说它们有关D.不确定2.为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校中学生中随机抽取了300名学生,得到如下列联表:你认为性别与是否喜欢数学课程之间有关系的把握有()A.0 B.95% C.99% D.100%3.某大学在研究性别与职称(分正教授、副教授)之间是否有关系时,你认为应该收集哪些数据?4.2014年世界杯期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为35,则有超过________的把握认为年龄与西班牙队的被喜欢程度有关.5.某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.(1)根据以上数据建立一个2×2列联表;(2)判断是否有99%的把握说明对新课程教学模式的赞同情况与教师年龄有关系.1.独立性检验的思想:先假设两个事件无关,计算统计量χ2的值.若χ2值较大,则拒绝假设,认为两个事件有关.2.独立性检验的步骤(1)画列联表.(2)计算χ2.(3)将得到的χ2值和临界值比较,下结论.答案精析问题导学知识点一思考可通过表格与图形进行直观分析,也可通过统计分析定量判断.梳理a+b c+d a+c b+d a+b+c+d A1B1A1B2A2B1A2B2知识点二n(ad-bc)2(a+b)(c+d)(a+c)(b+d)知识点三有关联90%95%99%题型探究例1解根据题意列出2×2列联表如下:通过研究此2×2列联表可以研究设备改造对产品合格率是否有影响. 跟踪训练1 6.109解析 χ2=105×(10×30-20×45)230×75×55×50≈6.109.例2 解 根据题目所给数据建立如下2×2列联表:根据2×2列联表中的数据,得χ2=170×(22×38-22×88)2110×60×44×126≈5.622>3.841,所以有95%的把握认为性别与态度有关系. 跟踪训练2 解 由题意列出2×2列联表:由公式得χ2=1 000×(39×514-441×6)2480×520×45×955≈28.225.因为28.225>6.635,所以有99%的把握认为人的性别与患色盲有关系.当堂训练 1.A 2.B3.女正教授人数、男正教授人数、女副教授人数、男副教授人数 4.95%5.解 (1)2×2列联表如下所示:(2)假设“对新课程教学模式的赞同情况与教师年龄无关”. 由公式,得χ2=50×(10×6-24×10)234×16×20×30≈4.963<6.635,所以没有99%的把握认为对新课程教学模式的赞同情况与教师年龄有关.。
研卷知古今;藏书教子孙。
一、基础知识运用(共24分,每小题3分)1、下列各组词语中,加点字的读音全部正确且没有错别字的一项是()A喟.(kuì)然长叹举一返三暴虎冯.(pínɡ)河祸起萧墙B屏.(pínɡ)气凝神发奋忘食箪食.(sì)瓢饮循循善诱C粢盛.(chéng)既洁礼崩乐坏斐.(fěi)然成章文质彬彬D色厉内荏.(rěn)耰而不辍曲肱.(hónɡ)而枕杀身成仁2、下列各项中不全有通假现象的一项是()A.乡也吾见夫子而问知且而从辟人之士也B.由也好勇过我良人出,则必餍酒肉而后反C. 莫春者,春服既成无欲速,无见小利D. 女闻六言六蔽矣乎蚤起,施从良人之所之3、选出下列划横线之词活用情况不同于其他三句的一项()A、风.乎舞雩B、七十者可以衣.帛食肉C、饭.疏食饮水D、约.我以礼4、下列加横线的字解释错误的一项是()A、思而不学则殆.(通“怠”,懈怠)B、恭而无礼则劳.(劳累、辛苦)C、小人之过必文.(掩饰)D、就.(接近,靠近)有道而正焉5、选出下列各项中不全是古今异现象的一项()A、①子路问成人②尝独立,鲤趋而过庭B、①子路从而后,遇丈人②颠沛必于是C、①至于他邦②古之学者为己,今之学者为人D、①子路从而后②必不得已而去,于斯二者何先6、下列各项中,“之”的意义,用法与例句相同的一项是()例句:子之武城A、天下之无道也久矣B、非其鬼而祭之C、今之成人者何必然D、先生将何之7、选出对下列加点字的意义与用法判断正确的一项()①未知,焉.得仁②二王我将有所遇焉.③为国以.礼④二三子以.我为隐乎A、①②不同,③④不同B、①②同,③④不同C、①②同,③④同D、①②不同,③④同8、下列各项中,句式与例句相同的一项是()例句:仁以为己任。
A、他人之贤者,丘陵也 B、子路宿于石门C、非夫人之为恸而谁为D、孟子遇于石丘二、文言诗文阅读鉴赏(共21分)阅读下面文字,完成9-11小题(共9分,每小题3分)万章曰:“尧以天下与舜,有诸?”孟子曰:“否。
《独立性检验的基本思想及其应用》教学设计焦作市第十二中学王存杰一、教材分析及学情分析本节课是北师大版数学选修2—3第三章第二节的第二课时内容学生已在《必修3》学习了概率统计的相关内容,又在《选修2-3》中进一步学习了事件的相互独立性、随机变量的分布及回归分析的基本思想在此基础之上,本节课通过典型案例介绍独立性检验的基本思想、方法及其应用,使学生认识统计方法在决策中的作用,是高中数学知识中体现统计思想的重要章节本章引言首先提出了现实中经常遇到的问题,比如肺癌是严重威胁人类生命的一种疾病,吸烟与患肺癌有关系吗?等等现实中类似的问题大量存在,如何得出准确的推断,这就需要科学的方法,独立性检验就是其中一种常用的统计方法本节课通过探究“吸烟是否与患肺癌有关系”引出了独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟人中患肺癌的比例比不吸烟人中患肺癌的比例要高,使学生直观感觉到吸烟和患肺癌可能有关系“吸烟与患肺癌有关”这一直觉来自于观测数据,即样本问题是这种来自于样本的印象能够在多大程度上代表总体?来自于样本的结论“吸烟与患肺癌有关”能够推广到总体吗?为了回答这个问题,就必须借助于统计理论来分析在统计学中,独立性检验就是检验两个分类变量是否有关系的一种统计方法学习独立性检验的目的是“通过典型案例介绍独立性检验的基本思想、方法及其应用,使学生认识统计方法在决策中的作用”这是因为,随着现代信息技术飞速发展,信息传播速度快,人们每天都会接触到影响我们生活的统计方面信息,所以具备一些统计知识已经成为现代人应具备的一种数学素养【教学重点】理解独立性检验的基本思想及实施步骤二、教学目标分析:独立性检验是考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度的一种重要的统计方法.利用独立性检验,能够帮助我们对日常生活中的实际问题做出合理的推断和预测.因此,在学习中通过对统计案例的分析,理解和掌握独立性检验的方法,体会独立性检验的基本思想在解决实际问题的应用,以提高我们处理生活和工作中的某些问题的能力.学生的数学学习内容应当是现实的、有趣的和富有挑战性的从心理学的角度看,青少年有一种好奇的心态、探究的心理因此,紧紧地抓住学生的这一特征,利用人人都关心的问题“吸烟是否与患肺癌有关系”,设计教学情境,使学生在观察、讨论等活动中,逐步提高数据分析处理能力基于以上原因我确定本节课的教学目标为:【知识与技能】1、了解独立性检验的基本思想、方法及初步应用;2、会根据给定的问题,列出两个变量的22⨯列联表;会从列联表、柱形图、条形图直观分析两个分类变量是否有关;3、会用2χ公式判断两个事件的相关性【过程与方法】运用数形结合的方法,借助对典型案例的探究,来了解独立性检验的基本思想,总结独立性检验的基本步骤,进一步发展统计思维能力,提高统计素养【情感、态度与价值观】在利用独立性检验分析和解决实际问题的过程中,体会统计推理方法在现实生活的作用,进一步认识数学的应用价值三、教学问题诊断在独立性检验中,本节课通过典型案例“吸烟是否与患肺癌有关系”的研究,介绍了独立性检验的基本思想、方法和应用独立性检验的步骤是固定的,仿照教科书的例题,学生不难完成习题,但独立性检验的思想对学生来说是比较难理解的,教学中如何结合例子介绍独立性检验的思想,才能使得学生很好的理解是一个教学难点那么,在教学过程中,采用了与反证法做类比,帮助学生理解独立性检验的思想两者都是先假设结论不成立,然后根据是否能够推出“矛盾”来断定结论是否成立但二者“矛盾”的含义不同,反证法中的“矛盾”是指一种不符合逻辑事情的发生;而独立性检验中的“矛盾”是指一种不符合逻辑的小概率事件的发生,即在结论不成立的假设下,推出有利于结论成立的小概率事件发生我们知道,小概率事件在一次试验中通常是不会发生的,因此认为结论在很大的程度上是成立的这样做了类比后,可以很好的帮助理解独立性检验的基本思想【教学难点】独立性检验的基本思想和统计量2 的含义四、教法学法分析本节课的教学体现“师为主导,生为主体”的教学理念以教师为主导,遵从学生认识规律进行启发;以学生为主体,合作探究式进行学习,激发学生的求知欲五、教学过程分析六、教学效果分析:本节课通过对典型案例的探究,学生理解了独立性检验的基本思想及其具体实施步骤让学生从中初步体会了数学与实际生活的联系,以及怎样运用所学知识去解决实际生活中的问题本节课通过对几个问题的设置,经过学生之间的讨论、互评,教师的引导帮助,使得本节课的难点得以突破学生通过总结也完善了自己的认知结构,从而对该部分的知识也有了更深的体会我在课堂上注重学生的主体参与,努力创设教师引导下的学生自主探究、合作交流的学习方式通过课堂练习,看到学生基本上能掌握用独立性检验思想解决实际问题,课前制定的教学目标基本实现通过反思,才能进步,我觉得课前预设与课堂生成相结合,才是符合新课程理念的对学生发展最为有利的教法。
知识改变命运,学习成就未来程度,首先假设该结的思想方法和反证法类似,不同之处受原假设的结论相找到矛盾.北师大版高中数学选修2-3:3.2独立性检验22.2 独立性检验 2.3 独立性检验的基本思想 2.4 独立性检验的应用【学习目标】1.了解独立性检验的基本思想方法.2.会利用2×2列联表解决实际问题.3.了解独立性检验的简单应用.一、条件概率是指在事件A发生的条件下,事件B发生的概率,P(B|A)=P(AB)P(A).特别地,如果P(B|A)=P(B),从而P(AB)=,则称A,B设A,B为两个变量,每一个变量都可以取,变量A:A1,A2=A1;=B通过观察得到下表所示数据:BA B1B2总计A1 a b a+bA2 c d c+d总计a+c b+d n=a+b+c+d并将形如此表的表格称为2×2列联表.是否独立的问题叫.=n(ad-bc)(a+b)(c+d)(a+c)(b+d).独立性判断的方法χ2的范围独立性判断χ2≤2.706没有关联χ2>2.70690%的把握判定A、B有关联χ2>3.84195%的把握判定A、B有关联χ2>6.63599%的把握判定A、B有关联统计的基本思维模式是归纳,它的特征之一是通过部分数据的性质来推测全部数据的性质,因此,统计推断是可能犯错误的,即从数据上体现的只列2×2列联表―→根据求随机变量值―→分析结论【解】事件独立性检验某大型企业人力资源部为了研究本企业员工工作积工作积极性对待企业改革的态度积极支持不太赞成工作积极5440工作一般3263总计86103是否又发作手术类别又发作过未发作过总计心脏搭桥手术39157196血管清障手术29167196总计68324392①若统计量χ>6.635,我们有99%的把握说吸烟与患肺病②若从统计中求出,有99%的把握说吸烟与患肺病有关,烟者中必有99个人患有肺病;取两个变量,且每一×2列联表yxy1y2总计x1 a 2173x2202545总计 b 462.在2×2列联表中,两个变量的取值a,b,c,d应是() 抽查了3000人,计算发现χ2=6.023,则根据这一数据查阅下表作业情况。
§2 独立性检验[对应学生用书P40]1.2×2列联表设A ,B 为两个变量,每个变量都可以取两个值,变量A :A 1,A 2=A -1;变量B :B 1,B 2=B -1,用下表表示抽样数据并将此表称为2.χ2的计算公式 χ2=n ad -bc 2a +bc +d a +cb +d.3.独立性判断的方法(1)当χ2≤2.706时,没有充分的证据判定变量A ,B 有关联,可以认为变量A ,B 是没有关联的;(2)当χ2>2.706时,有90%的把握判定变量A ,B 有关联; (3)当χ2>3.841时,有95%的把握判定变量A ,B 有关联; (4)当χ2>6.635时,有99%的把握判定变量A ,B 有关联.(1)独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的统计量,对假设的正确性进行判断.(2)使用χ2统计量作2×2列联表的独立性检验时,一般要求表中的4个数据都大于5,数据越大,越能说明结果的普遍性.[对应学生用书P41][例1] 在调查的6名患有色盲,试作出性别与色盲的列联表.[思路点拨] 在2×2列联表中,共有两类变量,每一类变量都有两个不同的取值,然后出相应的数据,列表即可.[精解详析] 根据题目所给的数据作出如下的列联表:[一点通]1.下面是一个2×2列联表:则表中a ,b 处的值分别为( )A.32,40 C .74,82D .64,72解析:a =53-21=32,b =a +8=40. 答案:A2.某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中在考前心情紧张的有213人.试作出2×2列联表.解:列联表如下:[例2] (8分)该地区调查了500位老年人,结果如下:(1)(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?[思路点拨] 解答本题先分析列联表数,后计算χ2,再与临界值比较,判断两个变量是否相互独立.[精解详析] (1)调查的500位老年人中有70位需要志愿者提供帮助,因此在该地区老年人中,需要帮助的老年人的比例的估计值为70500×100%=14%. 分)(2)χ2=-2200×300×70×430≈9.967.分)因为9.967>6.635,所以有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关.分)[一点通] 这类问题的解决方法为先确定a,b,c,d,n的值并求出χ2的值,再与临界值相比较,作出判断,解题时注意正确运用公式,代入数据准确计算.3.在一个2×2列联表中,通过数据计算χ2=8.325,则这两个变量间有关系的可能性为________.答案:99%4.某高校《统计初步》课程的教师随机调查了选该课的学生的一些情况,具体数据如下表:则χ2≈________,有 解析:χ2=-220×30×23×27≈4.844>3.841,故有95%的把握认为主修统计专业与性别有关.答案:4.844 95%5.(福建高考)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率.(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:χ2=a +bc +d a +cb +d解:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名. 所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),25周岁以下组工人有40×0.05=2(人).从中随机抽取2名工人,记至少抽到一名25周岁以下组工人的事件为A ,故P (A )=1-C 23C 25=710,故所求概率为710.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:所以得χ2=a +bc +d a +cb +d=260×40×30×70=2514≈1.79.因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.独立性检验的基本步骤: 1.列出2×2列联表. 2.求出χ2=n ad -bc 2a +ca +b b +dc +d.3.判断是否有关联,得出事件有关的可能性大小.[对应课时跟踪训练十七1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到下表:由χ2=n ad -bc 2a +bc +d a +cb +d算得,χ2=-260×50×60×50≈7.8.附表:参照附表,得到的正确结论是( )A.有99.9%以上的把握认为“爱好该项运动与性别有关”B.有99.9%以上的把握认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动和性别有关”D.有99%以上的把握认为“爱好该项运动和性别无关”解析:因为χ2=7.8>6.635,所以有99%以上的把握认为有关.答案:C2.下面是2×2列联表:则表中a,bA.94、96 B.52、50C.52、54 D.54、52解析:a=73-21=52,b=100-46=54,故选C.答案:C3.高二第二学期期中考试,对甲、乙两个班级学生的数学考试成绩按照优秀和不优秀统计人数后,得到2×2列联表,则随机变量χ2的值为( )班级与成绩统计表A.0.600 B.0.828C.2.712 D.6.004解析:随机变量χ2=-219×71×45×45≈0.600,故选A.答案:A4.(江西高考)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1表2表3A.成绩B.视力C.智商D.阅读量解析:因为χ21=-216×36×32×20=52×8216×36×32×20,χ22=-216×36×32×20=52×112216×36×32×20,χ23=-216×36×32×20=52×96216×36×32×20,χ24=-216×36×32×20=52×408216×36×32×20,则有χ24>χ22>χ23>χ21,所以阅读量与性别关联的可能性最大.答案:D5.在独立性检验中,统计量χ2有两个临界值:3.841和6.635.当χ2>3.841时,有95%的把握说明两个事件有关,当χ2>6.635时,有99%的把握说明两个事件有关,当χ2≤3.841时,认为两个事件无关.在一项打鼾与患心脏病关系的调查中,共调查了2 000人,经计算得χ2=20.87,根据这一数据分析,下列关于打鼾与患心脏病之间关系的说法,正确的是________.①有95%的把握认为两者有关;②约有95%的打鼾者患心脏病;③有99%的把握认为两者有关;④约有99%的打鼾者患心脏病.解析:χ2=20.87>6.635,有99%的把握说明两个事件有关,但只是估计,不能肯定什么.答案:③6.为探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射后14天内的结果如下表所示:在研究小白鼠的死亡与剂量是否有关时,根据以上数据求得χ2=________. 解析:χ2=-220×30×25×25≈5.333.答案:5.3337.为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查,得到如下数据:判断学生的数学成绩好坏与对学习数学的兴趣是否有关? 解:由公式求得χ2=-286×103×94×95≈38.459.∵38.459>6.635,∴有99%的把握认为数学成绩的好坏与对学习数学的兴趣有关.8.现对某市工薪阶层关于“楼市限购政策”的态度进行调查,随机抽查了50人,他们月收入(单位:百元)的频数分布及对“楼市限购政策”的赞成人数如下表:5 500元为分界点时,该市的工薪阶层对“楼市限购政策”的态度有差异;(2)“楼市限购政策”的概率.解:(1)由题意得2×2列联表:假设月收入以5 500元为分界点时,该市的工薪阶层对“楼市限购政策”的态度没有差异,根据列联表中的数据,得到:χ2=-210×40×32×18≈6.272<6.635,所以没有99%的把握认为当月收入以5 500元为分界点时,该市的工薪阶层对“楼市限购政策”的态度有差异.(2)已知在收入[55,65)中共有5人,2人赞成,3人不赞成,设至少有一个不赞成楼市限购政策为事件A ,则P (A )=1-C 22C 25=910.故所求概率为910.。
3.2 独立性检验
教学目标
(1)通过对典型案例的探究,了解独立性检验(只要求22⨯列联表)的基本思想、方法
及初步应用;
(2)经历由实际问题建立数学模型的过程,体会其基本方法.
教学重点、难点:独立性检验的基本方法是重点.基本思想的领会及方法应用是难点. 教学过程 一.问题情境
5月31日是世界无烟日。
有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。
这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题:
1. 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515
个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病.
问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”? 二.学生活动
为了研究这个问题,(1)引导学生将上述数据用下表来表示:
(2)估计吸烟者与不吸烟者患病的可能性差异:
在吸烟的人中,有
3716.82%220≈的人患病,在不吸烟的人中,有21
7.12%295
≈的人患病.
问题:由上述结论能否得出患病与吸烟有关?把握有多大? 三.建构数学 1.独立性检验:
(1)假设0H :患病与吸烟没有关系.
若将表中“观测值”用字母表示,则得下表:
(近似的判断方法:设n a b c d =+++,如果0H 成立,则在吸烟的人中患病的比例与 不吸烟的人中患病的比例应差不多,由此可得
a c
a b c d
≈
++,即()()0a c d c a b ad bc +≈+⇒-≈,因此,||ad bc -越小,患病与吸烟之间的关系越弱,
否则,关系越强.)
设n a b c d =+++,
在假设0H 成立的条件下,可以通过求 “吸烟且患病”、“吸烟但未患病”、“不吸烟但患病”、“不吸烟且未患病”的概率(观测频率),将各种人群的估计人数用,,,,a b c d n 表示出来.
例如:“吸烟且患病”的估计人数为()a b a c
n P AB n n n ++⨯≈⨯
⨯
; “吸烟但未患病” 的估计人数为()a b b d
n P AB n n n ++⨯≈⨯⨯
; “不吸烟但患病”的估计人数为()c d a c
n P AB n n n ++⨯≈⨯⨯
; “不吸烟且未患病”的估计人数为()c d b d
n P AB n n n
++⨯≈⨯⨯
. 如果实际观测值与假设求得的估计值相差不大,就可以认为所给数据(观测值)不能否
定假设0H .否则,应认为假设0H 不能接受,即可作出与假设0H 相反的结论. (2)卡方统计量:
为了消除样本对上式的影响,通常用卡方统计量(χ2
2
()-=∑
观测值预期值预期值
)来进行
估计.
卡方χ2
统计量公式:
χ2
22
a b a c a b b d a n b n n n n n a b a c a b b d n n n n n n ++++⎛⎫⎛⎫-⨯⨯-⨯⨯ ⎪ ⎪
⎝⎭⎝⎭=+++++⨯⨯⨯⨯
22
c d a c c d b d c n d n n n n n c d a c c d b d n n n n n n
++++⎛
⎫⎛⎫-⨯⨯-⨯⨯ ⎪ ⎪
⎝⎭⎝⎭++++++⨯⨯⨯⨯
()()()()()
2
n ad bc a b c d a c b d -=++++(其中n a b c d =+++) 由此若0H 成立,即患病与吸烟没有关系,则χ2
的值应该很小.把
37,183,21,274a b c d ====代入计算得χ211.8634=,统计学中有明确的结论,在0
H 成立的情况下,随机事件“2
6.635χ≥”
发生的概率约为0.01,即2( 6.635)0.01P χ≥≈,也就是说,在0H 成立的情况下,对统
计量χ2进行多次观测,观测值超过6.635的频率约为0.01.由此,我们有99%的把握认H不成立,即有99%的把握认为“患病与吸烟有关系”.
为
χ统计量研究吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检象以上这种用2
验.
说明:
(1)估计吸烟者与不吸烟者患病的可能性差异是用频率估计概率,利用χ2进行独立性
a b c d取值越大,效果越好.在
检验,可以对推断的正确性的概率作出估计,观测数据,,,
a b c d均不小于5,近似的效果才可接受.
实际应用中,当,,,
(2)这里所说的“呼吸道疾病与吸烟有关系”是一种统计关系,这种关系是指“抽烟的人患呼吸道疾病的可能性(风险)更大”,而不是说“抽烟的人一定患呼吸道疾病”.H下统计量χ2应该很小,如果由观测数据计算得到χ2的观测值很大,则
(3)在假设
在一定程度上说明假设不合理(即统计量χ2越大,“两个分类变量有关系”的可能性就越大).
2.独立性检验的一般步骤:
一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值:类A和类B(如吸烟与不吸烟),
H:两个分类变量Ⅰ和Ⅱ没有关系;
第一步,提出假设
第二步,根据2×2列联表和公式计算χ2统计量;
第三步,查对课本中临界值表,作出判断.
3.独立性检验与反证法:
反证法原理:在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立;
独立性检验(假设检验)原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立.
四.数学运用
1.例题:
例1.在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:该种血清能否起到预防感冒的作用?
分析:在使用该种血清的人中,有242
48.4%500
=的人患过感冒;在没有使用该种血清的人中,有
284
56.8%500
=的人患过感冒,使用过血清的人与没有使用过血清的人的患病率相差较大.从直观上来看,使用过血清的人与没有使用过血清的人的患感冒的可能性存在差异.
解:提出假设0H :感冒与是否使用该种血清没有关系.由列联表中的数据,求得
2
2
1000(258284242216)7.075474526500500
χ⨯⨯-⨯=≈⨯⨯⨯
∵当0H 成立时,2
6.635χ≥的概率约为0.01,∴我们有99%的把握认为:该种血清能起到预防感冒的作用.
例2.为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如表所示.根据所选择的193个病人的数据,能否作出药
分析:在口服的病人中,有
59%98≈的人有效;在注射的病人中,有67%95
≈的人有效.从直观上来看,口服与注射的病人的用药效果的有效率有一定的差异,能否认为用
药效果与用药方式一定有关呢?下面用独立性检验的方法加以说明. 解:提出假设0H :药的效果与给药方式没有关系.由列联表中的数据,求得
2
2
193(58314064) 1.3896 2.072122719895
χ⨯⨯-⨯=≈<⨯⨯⨯
当0H 成立时,2
1.3896χ≥的概率大于15%,这个概率比较大,所以根据目前的调查数据,不能否定假设0H ,即不能作出药的效果与给药方式有关的结论.
说明:如果观测值2
2.706χ≤,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“0H 成立”,即Ⅰ与Ⅱ没有关系. 2.练习:课本第91页 练习第1、2、3题. 五.回顾小结:
1.独立性检验的思想方法及一般步骤; 2.独立性检验与反证法的关系. 六.课外作业:
课本第93页 习题3.1 第1、2、3题.。