独立性检验的基本思想及其初步应用导学案
- 格式:doc
- 大小:55.51 KB
- 文档页数:4
独立性检验的基本思想及初步应用教案第一章:独立性检验简介1.1 学习目标:(1)理解独立性检验的定义及作用;(2)了解独立性检验在实际应用中的重要性;(3)掌握独立性检验的基本步骤。
1.2 教学内容:(1)独立性检验的定义;(2)独立性检验的实际应用案例;(3)独立性检验的基本步骤。
1.3 教学活动:(1)介绍独立性检验的概念;(2)通过实际案例让学生了解独立性检验的应用;(3)引导学生掌握独立性检验的基本步骤。
第二章:卡方检验2.1 学习目标:(1)理解卡方检验的原理;(2)掌握卡方检验的计算方法;(3)学会判断卡方检验的结果。
2.2 教学内容:(1)卡方检验的原理;(2)卡方检验的计算方法;(3)卡方检验的结果判断。
2.3 教学活动:(1)讲解卡方检验的原理;(2)通过示例让学生掌握卡方检验的计算方法;(3)引导学生学会判断卡方检验的结果。
第三章:列联表与独立性检验3.1 学习目标:(1)了解列联表的概念;(2)掌握列联表的绘制方法;(3)学会利用列联表进行独立性检验。
3.2 教学内容:(1)列联表的概念;(2)列联表的绘制方法;(3)利用列联表进行独立性检验。
3.3 教学活动:(1)介绍列联表的概念;(2)通过示例让学生掌握列联表的绘制方法;(3)引导学生学会利用列联表进行独立性检验。
第四章:独立性检验的应用4.1 学习目标:(1)学会运用独立性检验解决实际问题;(2)掌握独立性检验在调查分析中的作用;(3)了解独立性检验在实际应用中的局限性。
4.2 教学内容:(1)独立性检验在实际问题中的应用;(2)独立性检验在调查分析中的作用;(3)独立性检验的局限性。
4.3 教学活动:(1)讲解独立性检验在实际问题中的应用;(2)通过案例分析让学生了解独立性检验在调查分析中的作用;(3)引导学生认识独立性检验的局限性。
第五章:练习与拓展5.1 学习目标:(1)巩固所学独立性检验知识;(2)提高运用独立性检验解决实际问题的能力;(3)培养学生的创新意识和拓展能力。
3.2.1独立性检验的基本思想及其初步应用课前预习阅读教材P91-P95,了解相关概念,如:分类变量、列联表、独立性检验。
学习目标(1)通过对典型案例的探究,了解独立性检验(只要求22 列联表)的基本思想、方法及初步应用;(2)经历由实际问题建立数学模型的过程,体会其基本方法。
学习重点:独立性检验的基本方法学习难点:基本思想的领会学习过程一、情境引入5月31日是世界无烟日。
有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。
这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题:某医疗机构为了了解肺癌与吸烟是否有关,进行了一次抽样调查,共调查了9965个人,其中吸烟者2148人,不吸烟者7817人。
调查结果是:吸烟的2148人中有49人患肺癌,2099人未患肺癌;不吸烟的7817人中有42人患肺癌,7775人未患肺癌。
问题:根据这些数据能否断定“患肺癌与吸烟有关”?二、学生活动【自主学习】(1)将上述数据用下表(一)来表示:在不吸烟者中患肺癌的人约占多大比例? ; 在吸烟的人中患肺癌的人约占多大比例? 。
问题:由上述结论能否得出患肺癌与吸烟有关?把握有多大? 【合作探究】1、观察、分析样本数据的列联表和柱形图、条形图,你能得出什么结论?2、该结论能否推广到总体呢?3、假设0H :患肺癌与吸烟没有关系。
则两事件发生的概率有何关系?何结论?4、构造随机变量22()()()()()n ad bc Ka b c d a c b d -=++++(其中n a b c d =+++),结合3中结论,若0H 成立,则K 2应该很 (大、小)根据表(一)中的数据,利用4中公式,计算出K 2的观测值,该值说明什么?(统计学中有明确的结论,在0H 成立的情况下,P(K 2≥6.635)≈0.01。
)5、结合表(二)和三维柱形图、二维条形图如何判断两个分类变量是否有关系?利用独立性检验呢?二者谁更精确? 【当堂检测】在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?。
独立性检验的基本思想及其初步应用学习目标:1.通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的必要性;2.会根据22K.⨯列联表求统计量2学习重点:通过对实际问题的分析探究,学会独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。
学习难点:怎样理解独立性检验的基本思想。
新知1:1. 分类变量: .2. 22⨯列联表: .试试:你能列举出几个分类变量吗?探究任务:吸烟与患肺癌的关系(阅读课本第91页)回答:通过数据和图形,我们得到什么结论?有多大把握认为你的结论是正确的呢?新知2:统计量2K1.吸烟与患肺癌列联表问题:若没有关系推导得到bcad≈,为表示其差异性,将其转化成||bcad-,那么直观上|ad-的大小能说明什么?|bc2.为了使不同样本的数据有一个统一而又合理的评判标准,统计学家们经过研究后构造了一个随机变量2K=3.你能归纳独立性检验的一般步骤吗?4.请你对独立性检验基本的思想与反证法作比较课堂检测:1. (2010•宁夏)为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:(1(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提供更好的调查方法来估计该地区老年人中,需要志愿帮助的老年人的比例?说明理由.2.为了研究色盲与性别的关系,调查了1000人,调查结果如下表所示:根据上述数据试问色盲与性别是否有关?3.为了研究患慢性气管炎与吸烟量的关系,调查了228人,其中每天的吸烟支数在10支以上20支以下的调查者中,患者人数有98人,非患者人数有89人;每天的吸烟支数在20支以上的调查者中,患者人数有25人,非患者人数有16人。
试问患慢性气管炎是否与吸烟量有关?。
第一章 统计案例第二节 独立性检验的基本思想及初步应用(第1课时)一、学习目标1.了解两个分类变量的列联表,并用二维条形图表示,会计算K 2的观测值.2.了解独立性检验的思想,并会用独立性检验思想对两个变量之间是否有关联进行检验.3.通过实例说明独立性检验的方法和步骤,会根据22⨯列联表求统计量2K ,体会独立性检验的作用.【重点、难点】用独立性检验思想对两个变量之间是否有关联进行检验;根据22⨯列联表求统计量2K .二、学习过程复习引入:经常上网会影响学习吗?下表为教育部对1000名中学生进行调查的结果.经常上网影响学习吗?如何判断?经常上网 不经常上网总计 不及格 80 120 200及格 120 680 800总计 200 800 1000问题1:(1)通过上述数据经常上网的人成绩及格的比例为 ,不经常上网的人成绩及格的比例为 ,这个数据可以初步判断经常上网对学习成绩是有影响的,但这种说法的把握性有多大,还需要进行独立性检验才知道.(2)独立性检验的概念用统计量K 2的大小来研究两个变量是否有关系的方法,称为独立性检验.问题2:两个分类变量A 和B 的2×2列联表一般地,假设有两个分类变量A 和B ,它们的可能取值分别为{A 1,A 2}和{B 1,B 2}, 其样本频数列联表(称为2×2列联表)为:B AB 1 B 2 总计 A 1 a bA 2 c d总计问题3:统计量K 2的计算公式是怎样的?若有如下列联表所示的抽样数据:类1 类2 总计类 A a b a+b类 B c d c+d总计 a+cb+d a+b+c+d则K 2= (其中n=a+b+c+d ).问题4:根据K 2判断两变量是否有关联当K 2≤2.706时, 充分的证据判定变量A 、B 有关联,可以认为变量A 、B 是 关联的;当K 2>2.706时,有 的把握判定变量A 、B 有关联;当K 2>3.841时,有 的把握判定变量A 、B 有关联;当K 2>6.635时,有 的把握判定变量A 、B 有关联.答案:问题1:(1)60% 85% ;问题2:a+b c+d a+c b+d a+b+c+d问题3:错误!未找到引用源。
1.1 独立性检验【课标要求】1.了解独立性检验的意义、理解2×2列联表.2.会用χ2判断事件A与B之间的关系.3.掌握独立性检验的基本步骤.4.通过典型案例,掌握独立性检验的基本思想.【核心扫描】1.用χ2判断事件A与B之间的关系.(重点)2.独立性检验的基本思想及方法.(难点)自学导引1.2×2列联表与卡方统计量(1)一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值类A和类B,Ⅱ也有两类取值类1和类2,可以得下联表所示的抽样数据:将形如此表的表格称为2×2列联表.(2)卡方统计量χ2=,其中n=a+b+c+d为样本容量.2.独立性检验利用χ2统计量来研究两类对象是否有关系的方法称为独立性检验.3.独立性检验的基本步骤(1)提出假设H0:Ⅰ与Ⅱ没有关系;(2)根据2×2列联表与公式χ2=(n=a+b+c+d),计算χ2的值;(3)查对临界值(如表),作出判断.试一试:结合反证法与独立性检验原理的关系,说明独立性检验.提示独立性检验类似于数学中的反证法,要确认“两个变量有关系”这一结论成立的可信度,首先假设结论不成立,在假设下,我们构造的统计量χ2应该很小.如果由观测数据计算得到的χ2值很大,则在一定程度上说明假设不合理,再根据不合理的程度与临界值的关系作出判断.想一想:当χ2>6.635时,我们应当拒绝统计假设,还是接受统计假设.这种估计出错的可能性有多大?提示拒绝统计假设,由P(χ2>6.635)=0.01,即这种估计出错的可能性为1%.名师点睛1.独立性检验(1)利用随机变量χ2=,(其中n=a+b+c+d为样本容量),来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.(2)独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量χ2应该很小.如果由观测数据计算得到的χ2的观测值很大,则在一定程度上说明假设不合理.根据随机变量χ2的含义,可以通过概率P(χ2≥x0)的大小来评价该假设不合理的程度有多大,从而说明这“两个分类变量有关系”这一结论成立的可信程度有多大.如P(χ2≥6.635)≈0.01,由实际计算得χ2>6.635说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信程度为99%.2.利用χ2的值判定两个研究对象Ⅰ和Ⅱ之间的关系(1)若χ2>10.828,则有99.9%的把握认为“Ⅰ与Ⅱ有关系”;(2)若χ2>6.635,则有99%的把握认为“Ⅰ与Ⅱ有关系”;(3)若χ2>2.706,则有90%的把握认为“Ⅰ与Ⅱ有关系”;(4)若χ2≤2.706,则认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“H0成立”,即不能认为Ⅰ与Ⅱ没有关系.题型一利用χ2判定两个变量间的关系【例1】某电视台联合相关报社对“男女同龄退休”这一公众关注的问题进行了民意调查,数据如下表所示:根据表中数据,能否在犯错误的概率不超过0.001的前提下认为对这一问题的看法与性别有关系?(P(χ2≥10.828)≈0.001)[思路探索] 属于计算χ2,并用临界值表作出判断.解提出假设H0:对这一问题的看法与性别无关.由列联表中的数据,可以得到:χ2=≈125.161>10.828.又P(χ2>10.828)≈0.001.故在犯错误的概率不超过0.001的前提下认为对“男女同龄退休”这一问题的看法与性别有关.规律方法根据假设检验的思想,比较计算出的χ2与临界值的大小,选择接受假设还是拒绝假设.【训练1】为了研究色盲与性别的关系,调查了1 000人,调查结果如下表所示:根据上述数据试问色盲与性别是否是相互独立的?解提出假设H0:色盲与性别没有关系.由已知条件可得下表依据公式得χ2=≈27.139.当H0成立时,χ2≥10.828的概率约为0.001,因为χ2≈27.139>10.828,所以我们有99.9%的把握认为色盲与性别是有关的.题型二独立性检验的基本思想【例2】某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取392名成年人进行调查,所得数据如下表所示:对于教育机构的研究项目,根据上述数据能得出什么结论?[思路探索] 计算χ2的值,作出判断.解提出假设H0:具有大学专科以上学历和对待教育改革的态度无关.由公式得:χ2=≈1.78.因为1.78<2.706.所以我们没有理由说人具有大学专科以上学历(包括大学专科)和对待教育改革的态度有关.规律方法提出假设,计算χ2的值,结合临界值得出结论.【训练2】某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:对于人力资源部的研究项目,根据上述数据能得出什么结论?解提出假设H0:工作积极性与是否积极支持企业改革无关.χ2=≈10.759.当H0成立时,χ2>6.635的概率约为0.010,因为10.759>6.635,所以有99%的把握说:抽样员工对待企业改革的态度与工作积极性是有关的,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.题型三独立性检验综合应用【例3】(14分)某中学举办安全法规知识竞赛,从参赛的高一、高二学生中各抽出100人的成绩作为样本.对高一年级的100名学生的成绩进行统计,并按[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]分组,得到成绩分布的频率分布直方图(如图).(1)若规定60分以上(包括60分)为合格,计算高一年级这次知识竞赛的合格率;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此,估计高一年级这次知识竞赛的学生的平均成绩;(3)若高二年级这次知识竞赛的合格率为60%,由以上统计数据填写下面2×2列联表,并问是否有99%的把握认为“这次知识竞赛的成绩与年级有关系”?参考数据与公式:由列联表中数据计算χ2的公式χ2=临界值表审题指导本题综合考查了频率分布直方图的识图、应用、统计量的计算,2×2列联表及独立性检验知识.【解题流程】―→―→―→―→―→[规范解答] (1)高一合格率为0.02×10+0.03×10+0.02×10+0.01×10=0.8=80%.(2分)(2)高一样本的平均数为45×+55×+65×+75×+85×+95×=72,据此,可以估计高一年级这次知识竞赛的学生的平均成绩为72分.(7分)(3)(12分)χ2=≈9.5>6.635.所以有99%的把握认为“这次知识竞赛的成绩与年级有关系”.(14分)【题后反思】统计的基本思维模式是归纳,通过部分数据的性质来推测全部数据的性质,从数据上体现的只是统计关系,而不是因果关系.【训练3】某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:乙厂:(1)试分别估计两个分厂生产零件的优质品率;(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.附:χ2=,【解析】(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为=64%. (2)χ2=≈7.35>6.635,所以有99%的把握认为两个分厂生产的零件的质量有差异.误区警示不理解χ2的意义,得出的结论出现错误【示例】吃零食是中学生中普遍存在的现象,吃零食对中学生的身体发育有诸多不利的影响,下面给出了性别与吃零食的2×2列联表:试推断,男生与女生,谁更喜欢吃零食.[错解] 由公式χ2=≈4.722>3.841.所以说女生更喜欢吃零食,一个人吃零食与性别有关.我们由χ2的值判断A与B是否有关系,只是统计上的结论,具体到每个个体则不一定成立.[正解] 由公式χ2=≈4.722>3.841.所以有95%的把握认为吃零食与性别有关,但具体到每一个人则不能说吃零食与性别有关,也可能与其他因素有关.统计量χ2的值说明变量有关的可信度,与所给统计数据也有关系.所得结论也只是统计上的结论,不能具体到个体.。
第三章 统计案例3.2独立性检验的基本思想及其初步应用一、学习目标1、了解独立性检验的基本思想、方法及初步应用。
了解独立性检验的常用方法:等高条形图及2k 统计量法。
2、了解实际推断原理和假设检验的基本思想、方法及初步应用。
3、能运用自己所学知识对具体案例进行检验。
【重点、难点】重点:1、了解独立性检验的基本思想、方法及初步应用。
了解独立性检验的常用方法:等高条形图及2k 统计量法。
2、了解实际推断原理和假设检验的基本思想、方法及初步应用。
3、能运用自己所学知识对具体案例进行检验。
难点:1、实际推断原理和假设检验的基本思想、方法及初步应用。
2、解决独立性检验与其它知识(如概率)等的综合应用题。
二、学习过程 【导入新课】1.与列联表相关的概念(1)分类变量:变量的不同“___”表示个体所属的_________,像这样的变量称为分类变量. (2)列联表:①列出的_____分类变量的_______,称为列联表.②一般地,假设有两个分类变量X 和Y ,它们的取值分别为 {}{}2121,,y y x x 和其样本频数列联表(称为2×2列联表)为:2.等高条形图等高条形图与表格相比,图形更能直观地反映出两个分类变量间是否 _________,常用等高条形图展示列表数据的_________. 3.独立性检验的基本思想(1)定义:利用随机变量__来判断“两个分类变量_______”的方法称为独立性检验.(2)公式:=2k ____________________,其中=n ________.(3)独立性检验的具体做法:①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后k.查表确定_______k的_______k.②利用公式计算随机变量2③如果_____,就推断“X与Y有关系”,这种推断犯错误的概率不超过α;否则,就认为在_____________不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中_________________支持结论“X与Y有关系”.典型例题类型一利用等高条形图判断两个分类变量是否相关例1.下列关于等高条形图的叙述正确的是( )A.从等高条形图中可以精确地判断两个分类变量是否有关系B.从等高条形图中可以看出两个变量频数的相对大小C.从等高条形图可以粗略地看出两个分类变量是否有关系D.以上说法都不对例2、为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:病人与尿棕色素为阳性是否有关系?类型二独立性检验的基本思想例3、为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.能否在犯错误的概率不超过0.1的前提下,认为“学生选报文、理科与对外语的兴趣有关”?类型三独立性检验的综合应用例4、某高校共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时.请完成每周平均体育运动时间与性别的列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:变式拓展1、在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关?你所得到的结论在什么范围内有效?2、在一次重要会议上,为了搞好对外宣传工作,会务组选聘了16名男记者和14名女记者担任对外翻译工作,调查发现,男、女记者中分别有10人和6人会俄语.根据以上数据完成以下2×2列联表:会俄语不会俄语总计男女总计30并回答能否在犯错误的概率不超过0.10的前提下认为性别与会俄语有关?3、某中学将100名高一新生分成水平相同的甲、乙两个“平行班”,每班50人.陈老师采用A,B两种不同的教学方式分别在甲、乙两个班级进行教改实验.为了解教学效果,期末考试后,陈老师分别从两个班级中各随机抽取20名学生的成绩进行统计,作出茎叶图如图.记成绩不低于90分者为“成绩优秀”.(1)在乙班样本的20个个体中,从不低于86分的成绩中随机抽取2个,求抽出的两个均“成绩优秀”的概率;(2)由以上统计数据作出列联表,并判断能否在犯错误的概率不超过0.1的前提下认为:“成绩优秀”与教学方式有关.三、学习反思1.判断两个分类变量是否有关系的两种常用方法(1)利用数形结合思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法.(2)一般地,在等高条形图中,b a a + 与 dc c+ 相差越大,两个分类变量有关系的可能性就越大.2、独立性检验的步骤:第一步,确定分类变量,获取样本频数,得到列联表.第二步,根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值0k .第三步,利用公式()()()()d b c a d c b a bc ad n k ++++-=22)( 计算随机变量2k 的观测值k .第四步,作出判断.如果0k k >,就推断“X 与Y 有关系”这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 的关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.四、随堂检测1、某地区甲校高二年级有1 100人,乙校高二年级有900人,为了统计两个学校高二年级在学业水平考试中的数学学科成绩,采用分层抽样的方法在两校共抽取了200名学生的数学成绩,如下表:(已知本次测试合格线是50分,两校合格率均为100%) 甲校高二年级数学成绩:(1)计算x,y的值,并分别估计以上两所学校数学成绩的平均分(精确到1分).(2)若数学成绩不低于80分为优秀,低于80分为非优秀,根据以上统计数据写下面2×2列联表,并回答能否在犯错误的概率不超过0.05的前提下认为“两个学校的数学成绩有差异?”。
2017级人教版数学选修1-1 编号:5 编制时间: 2019.1.11 编制人:
第一章统计案例
1.2.1 独立性检验的基本思想及其初步应用
【学习目标】
通过探究“秃顶是否与患心脏病有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示患心脏病的秃顶比例比患其它病的秃顶比例高,让学生亲身体验独立性检验的实施步骤与必要性
【重点难点】
重点:独立性检验的实施步骤
难点; 独立性检验的实施步骤
【预习案】
1. 独立性检验的原理:
2. 独立性检验的步骤
【探究案】
例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?
例2为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高
1。
1.2独立性检验的基本思想及其初步应用学习目标:通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表展示,让学生亲身体验独立性检验的实施步骤与必要性. 学习重点:理解独立性检验的基本思想及实施步骤.学习难点:了解独立性检验的基本思想、了解随机变量2K 的含义. 学习过程: 一、课前准备:某医疗机构为了解吸烟与患肺癌是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人. 调查结果是:吸烟的220人中有37人患肺癌,183人未患肺癌;不吸烟的295人中有21人患肺癌,274人未患肺癌.问题1:吸烟与不吸烟,患肺癌的可能性的大小是否有差异? 为了研究这个问题,我们将上述数据用下表表示:问题2:差异大到什么程度才能作出“吸烟与患肺癌有关”的判断? 问题3:能否用数量刻画出“有关”的程度?二、新课导学: (一)独立性检验:1.独立性检验的含义:用2K 统计量研究吸烟与患肺癌是否有关、用药效果与用药方式是否有关、性别与数学成绩是否有关等这类问题的方法称为独立性检验. 2. 卡方统计量卡方统计量:22()()()()()n ad bc K a b c d a c b d -=++++其中n a b c d =+++为样本量.如果两个变量1x 与2x 无关系,则2K 的值应该很小.3. 用独立性检验来考察“1x 与2x 是否有关系”的步骤:(1)提出假设0H :1x 与2x 没有关系;(2)根据2×2列联表与公式计算2K 的值; (3)查对临界值表作出判断.4. 临界值表:例如:(1)210.828K >,则有99.9%的把握认为“1x 与2x ”有关系;(2)2 6.635K >,则有99%的把握认为“1x 与2x ”有关系; (3)2 2.706K >,则有90%的把握认为“1x 与2x ”有关系; (4)2 2.706K ≤,则认为没有充分的证据显示“1x 与2x ”有关系,但也不能作出结论“0H 成立”,即不能认为“1x 与2x ”没有关系.(二)典型例题【例1】在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人,六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.(1)根据以上数据建立一个2×2的列联表;(2)判断人的饮食习惯是否与年龄有关.【解析】动动手:在一次恶劣气候的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.请你根据所给数据判断是否在恶劣气候飞行中,男人比女人更容易晕机. 【解析】三、总结提升:独立性检验的方法、原理、步骤.四、反馈练习:1.独立性检验中的统计假设就是假设相关事件A 、B ( )A.互斥B.不互斥C.相互独立D.不独立 2.下列说法中正确的是 ( )①独立性检验的基本思想是带有概率性质的反证法;②独立性检验就是选取一个假设0H 条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝0H 的推断;③独立性检验一定能给出明确的结论.A. ①②B.①③C.②③D.①②③3.给出假设0H ,下列结论中不能对0H 成立与否作出明确判断的是 ( ) A.2K =2.535 B.2K =7.723 C.2K =10.321 D.2K =20.1254.某班主任对全班50名学生进行了作业量的调查,数据如下表:则学生的性别与作业量的大小有关系的把握大约为( ) A.99% B.95% C.)90% D.无充分根据5.考察棉花种子经过处理跟生病之间的关系得到如下表数据:根据以上数据,则 ( )A.种子经过处理跟是否生病有关B.种子经过处理跟是否生病无关C.种子是否经过处理决定是否生病D.以上都是错误的6.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中的数据,得到2250(1320107) 4.84423272030K ⨯⨯-⨯=≈⨯⨯⨯,因为2 3.841K ≥,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为____ .7.在性别与吃零食这两个分类变量的计算中,下列说法正确的是 .①若的观测值为2K =6.635,我们有99%的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;②从独立性检验可知有99%的把握认为吃零食与性别有关系时,我们说某人吃零食,那么此人是女性的可能性为99%;③若从统计量中求出有99%的把握认为吃零食与性别有关系,是指有1%的可能性使得出的判断出现错误.8.下列关于2K 的说法中,正确的是 .①2K 在任何相互独立问题中都可以用于检验是否相关;②2K 越大,两个事件的相关性越大;③2K 是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这一类问题.9 .在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表;(2)判断性别与休闲方式是否有关系.【解析】五、学后反思参考答案(二)典型例题【例1】【解析】(1)2×2的列联表如右:(2)提出统计假设,0H : 假设人的饮食习惯与年龄无关, 22124(43332721) 6.20170546460K ⨯-⨯=≈⨯⨯⨯,当统计假设0H 成立时,2 5.024K ≥的概率约为2.5%,即有97.5%的把握认为“人的饮食习惯与年龄有关”.动动手:【解析】根据题意,列出列联表如下:提出统计假设,0H :在恶劣气候飞行中男人与女人一样容易晕机则2289(2426318) 3.68955343257K ⨯-⨯==⨯⨯⨯,2 2.706K >,故我们有90%的把握认为在这次航程中男人比女人更容易晕机.四、反馈练习: 1. C 2. A 3. A 4. B 5. B. 6. 5%. 7.③ 8.③9 .【解析】(1)2×2的列联表(2)假设“休闲方式与性别无关” 计算2124(43332721) 6.20170546460k ⨯⨯-⨯=≈⨯⨯⨯,因为 5.024k ≥,所以有理由认为假设“休闲方式与性别无关”是不合理的, 即有97.5%的把握认为“休闲方式与性别有关”.。
独立性检验的基本思想及初步应用教学目标:1. 了解独立性检验的基本思想及其在实际问题中的应用。
2. 学会使用假设检验方法判断两个分类变量之间是否具有独立性。
3. 掌握利用独立性检验解决实际问题的基本步骤。
教学内容:第一章:独立性检验的基本思想1.1 独立性检验的定义1.2 独立性检验的基本原理1.3 独立性检验的应用场景第二章:列联表与卡方检验2.1 列联表的定义及制作2.2 卡方检验的原理及计算2.3 卡方检验的判断标准第三章:假设检验方法3.1 假设检验的定义及类型3.2 独立性检验的假设条件3.3 独立性检验的步骤及注意事项第四章:实际问题中的应用4.1 案例一:产品质量检验4.2 案例二:消费者偏好调查4.3 案例三:疾病与性别关系的分析第五章:总结与拓展5.1 独立性检验在实际问题中的应用范围5.2 独立性检验的局限性5.3 独立性检验与其他统计方法的比较教学方法:1. 讲授:讲解独立性检验的基本思想、原理及应用。
2. 案例分析:分析实际问题,引导学生运用独立性检验解决问题。
3. 小组讨论:分组讨论案例,培养学生的合作与交流能力。
4. 练习与反馈:布置课后习题,及时了解学生掌握情况,给予针对性的指导。
教学评估:1. 课后习题:检验学生对课堂内容的掌握程度。
2. 案例分析报告:评估学生在实际问题中运用独立性检验的能力。
3. 课堂表现:观察学生在课堂讨论、提问等方面的参与度。
教学资源:1. 教材:独立性检验相关章节。
2. 案例材料:产品质量检验、消费者偏好调查、疾病与性别关系等实际问题。
3. 计算器:用于计算卡方值及概率。
教学时数:1. 共计4课时,每课时45分钟。
2. 分配如下:第一章1课时,第二章1课时,第三章1课时,第四章1课时。
第六章:多组独立性检验6.1 多组独立性检验的定义6.2 多组独立性检验的方法6.3 多组独立性检验的应用案例第七章:非参数检验7.1 非参数检验的定义及意义7.2 非参数检验方法简介7.3 独立性检验与非参数检验的比较第八章:独立性检验的软件操作8.1 统计软件的选择与操作8.2 独立性检验的软件实现8.3 结果解读与分析第九章:独立性检验在实际问题中的应用案例分析9.1 案例一:市场调查与分析9.2 案例二:教育公平性研究9.3 案例三:医学研究中的应用第十章:总结与展望10.1 独立性检验在统计学中的地位与作用10.2 独立性检验的发展趋势10.3 独立性检验在未来的挑战与机遇教学方法:1. 讲授:讲解多组独立性检验、非参数检验及软件操作相关知识。
教师学科教案[ 20 – 20 学年度第__学期]任教学科:_____________任教年级:_____________任教老师:_____________xx市实验学校《3.2 独立性检验的基本思想及其初步应用(1)》导学案1教学目标(1)通过对典型案例的探究,了解独立性检验(只要求22⨯列联表)的基本思想、方法及初步应用;(2)经历由实际问题建立数学模型的过程,体会其基本方法.教学重点、难点:独立性检验的基本方法是重点.基本思想的领会及方法应用是难点.教学过程一.问题情境5月31日是世界无烟日。
有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。
这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题:1.某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病.问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”?二.学生活动为了研究这个问题,(1)引导学生将上述数据用下表来表示:(2)估计吸烟者与不吸烟者患病的可能性差异:在吸烟的人中,有3716.82%220≈的人患病,在不吸烟的人中,有217.12%295≈的人患病.问题:由上述结论能否得出患病与吸烟有关?把握有多大?三.建构数学1.独立性检验:(1)假设0H :患病与吸烟没有关系. 若将表中“观测值”用字母表示,则得下表:(近似的判断方法:设n a b c d =+++,如果0H 成立,则在吸烟的人中患病的比例与不吸烟的人中患病的比例应差不多,由此可得a ca b c d≈++,即()()0a c d c a b ad bc +≈+⇒-≈,因此,||ad bc -越小,患病与吸烟之间的关系越弱,否则,关系越强.) 设n a b c d =+++,在假设0H 成立的条件下,可以通过求 “吸烟且患病”、“吸烟但未患病”、“不吸烟但患病”、“不吸烟且未患病”的概率(观测频率),将各种人群的估计人数用,,,,a b c d n 表示出来.例如:“吸烟且患病”的估计人数为()a b a cn P AB n n n ++⨯≈⨯⨯; “吸烟但未患病” 的估计人数为()a b b dn P AB n n n ++⨯≈⨯⨯; “不吸烟但患病”的估计人数为()c d a cn P AB n n n ++⨯≈⨯⨯; “不吸烟且未患病”的估计人数为()c d b dn P AB n n n++⨯≈⨯⨯. 如果实际观测值与假设求得的估计值相差不大,就可以认为所给数据(观测值)不能否定假设0H .否则,应认为假设0H 不能接受,即可作出与假设0H 相反的结论. (2)卡方统计量:为了消除样本对上式的影响,通常用卡方统计量(χ22()-=∑观测值预期值预期值)来进行估计.卡方χ2统计量公式:χ222a b a c a b b d a n b n n n n n a b a c a b b d n n n n n n ++++⎛⎫⎛⎫-⨯⨯-⨯⨯ ⎪ ⎪⎝⎭⎝⎭=+++++⨯⨯⨯⨯22c d a c c d b d c n d n n n n n c d a c c d b d n n n n n n++++⎛⎫⎛⎫-⨯⨯-⨯⨯ ⎪ ⎪⎝⎭⎝⎭++++++⨯⨯⨯⨯()()()()()2n ad bc a b c d a c b d -=++++(其中n a b c d =+++) 由此若0H 成立,即患病与吸烟没有关系,则χ2的值应该很小.把37,183,21,274a b c d ====代入计算得χ211.8634=,统计学中有明确的结论,在0H 成立的情况下,随机事件“26.635χ≥”发生的概率约为0.01,即2( 6.635)0.01P χ≥≈,也就是说,在0H 成立的情况下,对统计量χ2进行多次观测,观测值超过6.635的频率约为0.01.由此,我们有99%的把握认为0H 不成立,即有99%的把握认为“患病与吸烟有关系”.象以上这种用2χ统计量研究吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检验. 说明:(1)估计吸烟者与不吸烟者患病的可能性差异是用频率估计概率,利用χ2进行独立性检验,可以对推断的正确性的概率作出估计,观测数据,,,a b c d 取值越大,效果越好.在实际应用中,当,,,a b c d 均不小于5,近似的效果才可接受.(2)这里所说的“呼吸道疾病与吸烟有关系”是一种统计关系,这种关系是指“抽烟的人患呼吸道疾病的可能性(风险)更大”,而不是说“抽烟的人一定患呼吸道疾病”.H下统计量χ2应该很小,如果由观测数据计算得到χ2的观测值很大,(3)在假设则在一定程度上说明假设不合理(即统计量χ2越大,“两个分类变量有关系”的可能性就越大).2.独立性检验的一般步骤:一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值:类A和类B(如吸烟与不吸烟),Ⅱ也有两类取值:类1和类2(如患呼吸道疾病与不患呼吸道疾病),得到如下表所示:推断“Ⅰ和Ⅱ有关系”的步骤为:H:两个分类变量Ⅰ和Ⅱ没有关系;第一步,提出假设第二步,根据2×2列联表和公式计算χ2统计量;第三步,查对课本中临界值表,作出判断.3.独立性检验与反证法:反证法原理:在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立;独立性检验(假设检验)原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立.四.数学运用1.例题:例1.在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:该种血清能否起到预防感冒的作用?分析:在使用该种血清的人中,有48.4%500=的人患过感冒;在没有使用该种血清的人中,有28456.8%500=的人患过感冒,使用过血清的人与没有使用过血清的人的患病率相差较大.从直观上来看,使用过血清的人与没有使用过血清的人的患感冒的可能性存在差异.解:提出假设0H :感冒与是否使用该种血清没有关系.由列联表中的数据,求得221000(258284242216)7.075474526500500χ⨯⨯-⨯=≈⨯⨯⨯∵当0H 成立时,26.635χ≥的概率约为0.01,∴我们有99%的把握认为:该种血清能起到预防感冒的作用.例2.为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如表所示.根据所选择的193个病人的数据,能否作出药的效果与给药方式有关的结论?分析:在口服的病人中,有59%98≈的人有效;在注射的病人中,有6467%95≈的人有效.从直观上来看,口服与注射的病人的用药效果的有效率有一定的差异,能否认为用药效果与用药方式一定有关呢?下面用独立性检验的方法加以说明. 解:提出假设0H :药的效果与给药方式没有关系.由列联表中的数据,求得22193(58314064) 1.3896 2.072122719895χ⨯⨯-⨯=≈<⨯⨯⨯当0H 成立时,21.3896χ≥的概率大于15%,这个概率比较大,所以根据目前的调查数据,不能否定假设0H ,即不能作出药的效果与给药方式有关的结论.χ≤,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,说明:如果观测值2 2.706H成立”,即Ⅰ与Ⅱ没有关系.但也不能作出结论“2.练习:课本第91页练习第1、2、3题.五.回顾小结:1.独立性检验的思想方法及一般步骤;2.独立性检验与反证法的关系.六.课外作业:课本第93页习题3.1 第1、2、3题.。
§1.2独立性检验的基本思想及其初步应用(导学案)
编写人:谢文审核人:付双全班级姓名
【学习目标】
通过典型案例的探究,了解独立性检验的基本思想,会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,并能利用独立性检验的基本思想来解决实际问题。
【学习过程】
问题的引入:为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)
那么吸烟是否对患肺癌有影响?
直观上来判断:
在不吸烟的样本中,有_______%患肺癌;在吸烟的样本中,则有______%
由此,吸烟群体和不吸烟群体患肺癌的可能性存在差异.
但,这种“差异”有多大呢?能够有一个评判的标准呢?我们可以通过以下的统计分析回答这个问题。
独立性检验:
1、把上表中数字用字母代替,得到如下用字母表示的列联表:
2、假设
H :吸烟与患肺癌没有关系
那么吸烟样本中不患肺癌的比例应该与不吸烟样本中不患肺癌的比例差不多,即:
______________________________________________________ 因此:
bc
ad -越小说明吸烟与患肺癌之间的关系______.反之,则_____
3、计算2
K
为了使不同样本变量的数据有统一的评测标准,构造一个随机变量
2K =
_________________________________________________________ 其中_______________=n 为样本容量. 从而,若
H 成立,即“吸烟与患肺癌没有关系”,则2
K 应该_______,
反之,2
K 应该___________。
上题2
K =56.632.这个值到底能告诉我们什么?能从中得到什么结论? 4、查表
上题中2K =56.632>10.828,所以
001.0)828.10(2
=>K P 该数据表明了在假设
H 成立的情况下,2
K 的值大于10.828的概率非常小,为
0.001,是一个小概率事件。
所以有理由断定假设
H 不成立,即认为“吸烟与患肺
癌有关系”,但这种判断会犯错误,犯错误的概率不会超过0.001
例题一、在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶。
利用图形判断秃顶与患心脏病是否有关系。
能否在犯错误的概率不超过0.010的前提下认为秃顶与患心脏病有关系?
解:根据题目所给数据得到如下列联表:
在秃顶样本中患心脏病的频率为_______________,在不秃顶样本中患心脏病的频率为_____________,相应的等高条形图如图所示:
从条形图中可以判断: 假设秃顶与患心脏病没有关系
计算=2
K
说明了: 当堂练习:
1.下面是一个22⨯列联表,则表中b a ,的值分别是 ( )
A. 94,96
B. 52,50
C. 52,54
D. 54,52
2、在独立性检验时计算的2
K 的观测值k =3.99,那么我们有 的把握认为这两个分类变量有关系 ( ) A .90% B .95% C .99% D .以上都不对
3、在一项打鼾与患心脏病的调查中,共调查1768人,经计算的2
K =27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是_____ 的.(填“有关”“无关”)
4、为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:
由表中数据计算得到2
K 的观察值 4.513k . 在多大程度上可以认为高中生的性别与是否数学课程之间有关系?为什么?。