(完整版)刘玉记-独立性检验的基本思想及其初步应用
- 格式:doc
- 大小:77.31 KB
- 文档页数:9
3.2 独立性检验的基本思想及其初步应用(1)教材分析本节内容是数学选修2-3 第三章统计案例的第二节,是在学习了回归分析的基本思想及其初步应用的知识后,对统计案例的再学习.可以看作是与前面学习过的相关关系的并列知识,是统计案例的另一类体现.在统计学中,独立性检验就是检验两个分类变量是否有关系的一种统计方法.在讨论两个分类变量关系时,要把重点放在独立性检验的统计学原理上,使学生初步掌握独立性检验的基本步骤,体会独立性检验的基本思想.独立性检验的步骤是相对固定的,仿照教科书的例题,学生不难完成书后的习题,但独立性检验的统计思想对学生来说是比较难理解的,所以在教学中结合例题介绍独立性检验的思想是十分重要的,要求特别注重学生思维的严密性品质的培养.课时分配本节内容用3课时完成,这是第1节,主要讲解独立性检验的基本思想及实施步骤.教学目标重点: 理解独立性检验的基本思想及实施步骤.K的含义.难点:了解独立性检验的基本思想;了解随机变量2知识点:独立性检验的解题步骤.能力点:正确理解独立性检验的基本思想.教育点:通过大量的实例,体会探究的乐趣,激发学生的学习热情.自主探究点:如何利用求出的数据正确解读分类变量的关系.考试点:独立性检验的解题步骤.易错易混点:反证法和独立性检验的区别.拓展点:完成思考的解答后,引导学生总结独立性检验的基本思想.教具准备多媒体课件、三角板课堂模式学案导学一、引入新课【师生活动】师:为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)表1 吸烟与患肺癌列联表生:讨论回答.师:要想解决这个问题,这就需要了解假设检验的基本原理.我们这节课就来学习一种假设检验——独立性检验的基本思想及其初步应用.【设计意图】通过实例,引出独立性检验的原理,假设检验.既激发了学生的学习热情,又让学生体会到学习数学的实用性.二、探究新知1、分类变量:对于性别变量,其取值为男和女两种. 这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.在现实生活中,分类变量是大量存在的,例如是否吸烟,宗教信仰,国籍,产品等级,是否喜欢数学,等等.2、列联表:像表1这样列出的两个分类变量的频数表,称为列联表. 师:从表格中的数据能反映出两个分类变量间是否相互影响? 生:不是很明显.师:图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征. 【设计意图】通过问题来引导学生明确:等高条形图可以直观反映出两个分类变量间是否相互影响,过渡自然,顺理成章.3、等高条形图图1【师生活动】师:图1就是一个等高条形图,其中两个浅色条的高分别表示吸烟和不吸烟样本中不患肺癌的频率;两个深色条的高分别表示吸烟和不吸烟样本中患肺癌的频率.我们能有什么结论?生:在吸烟样本中患肺癌的频率要高一些,因此直观上可以认为吸烟更容易引发肺癌.【设计意图】通过提问,要学生明确后续知识学习的必要性,对引出下一个问题起到很好的铺垫. 4、独立性检验我们先假设 0H :吸烟与患肺癌没有关系, 把表1中的数字用字母代替,得到表2表2不患肺癌患肺癌 总计不吸烟 ab a b + 吸烟 cd c d + 总计a c +b d + a bcd +++22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++为样本容量.若0H 成立,即“吸烟与患肺癌没有关系”,则2K 应该很小 .根据表1的数据,计算得2K 的观测值为29965(777549422099)56.63278172148987491k ⨯⨯-⨯=≈⨯⨯⨯.统计学家经过研究发现,在0H 成立的情况下,2( 6.635)0.010P K ≥≈ .即在0H 成立的情况下,2K 的观测值大于6.635的概率非常小,近似为0.010,是一个小概率事件.现在2K 的观测值56.632k ≈,远远大于6.635,所以有理由断定0H 不成立,即认为“吸烟与患肺癌有关系”. 但这种判断会犯错误,犯错误的概率不会超过0.010.上面这种利用随机变量2K 来判断“两个分类变量”的方法称为独立性检验.【设计意图】通过吸烟与患肺癌之间的关系的讨论过程体现了假设检验的思想,其目的是让学生通过实例初步体会一下假设检验的思想.可以从反证法的思想解释上面介绍的假设检验原理.5、独立性检验的具体步骤(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误的上界α,然后查表确定临界值0k . (2)利用公式(1),计算随机变量2K 的观测值k .(3)如果0k k ≥,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”,或者在样本数据中,没有足够证据支持结论“两个分类变量有关系”.【设计意图】在介绍完独立性检验的思想以后,对独立性检验的具体实施步骤进行总结、归纳.为学生的下一步应用起到奠基的作用,对解决下面的例题有很大的帮助.三、理解新知判断两个分类变量有关系的思路1、等高条形图可以直观地判断出两个分类变量是否有关系,但是这种判断不可靠, 并且不能提供所得结论犯错误的概率.因此需要用独立性检验的方法来提供有用数据.2、独立性检验的具体步骤(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误的上界α,然后查表确定临界值0k . (2)利用公式(1),计算随机变量2K 的观测值k .(3)如果0k k ≥,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”,或者在样本数据中,没有足够证据支持结论“两个分类变量有关系”.【设计意图】为准确地运用新知,作必要的铺垫.培养学生的归纳概括能力.四、运用新知例1、某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是患心脏病而住院的男性病人中,有175人秃顶.利用图形判断秃顶与患心脏病是否有关系.能否在犯错误的概率不超过0.010的前提下认为秃顶与患心脏病有关系?解 :根据题目所给数据得到如下列联表:表4 秃顶与患心脏病列联表患心脏病 患其他病 总计 不吸烟 214 175 389 吸烟 451 597 1048 总计6657721473图2相应的等高条形图如图2所示,可以看出秃顶样本中患心脏病的频率明显高于不秃顶样本中患心脏病的频率.因此可以认为秃顶与患心脏病有关系.根据列联表4中的数据,得到1437=16.373 6.635k ⨯⨯⨯≈>⨯⨯⨯2(214597-175451)3891048665772.因此,在犯错误的概率不超过0.010的前提下,认为秃顶与患心脏病有关系.【设计说明】教学中要先直观后计算,要注意引导学生运用已经学过的统计知识解决问题.解答中给出列联表,目的是复习列联表的制作.讲完例题解答后,需要向学生说明:在熟悉独立检验的基本原理后,可以通过直接计算2K 的观测值(不画等高条形图)来解决两个分类变量的独立性检验问题.但是,借助于图形可以更直观地向专业人士解释所得到的统计分析结果. 变式训练:在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个22⨯的列联表; (2)判断性别与休闲方式是否有关系. 答案:(2)因为,所以在犯错误的概率不超过0.025的前提下,认为休闲方式与性别有关系.五、课堂小结独立性检验的具体步骤(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误的上界α,然后查表确定临界值0k . (2)利用公式(1),计算随机变量2K 的观测值k .(3)如果0k k ≥,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”,或者在样本数据中,没有足够证据支持结论“两个分类变量有关系”.【设计意图】增强学生的归纳概括意识,培养学生整体看待问题的能力.通过课堂小结,加深学生对本节课所学内容的印象.六、布置作业1.阅读教材 P91—94;2.书面作业 教材P97 1 、2必做题:1. 研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验,发现对该心理测中的最后一个题目的反应得以下数据:问:性别与态度之间是否存在某种关系?2. 在研究某种新措施对“非典”的防治效果问题时,得以下数据:试问新措施对防治防治“非典”是否有效?答案:1. 22170(22421888) 2.158 3.8411106040130K ⨯⨯-⨯=≈<⨯⨯⨯,因此没有充分的证据显示“性别与态度有关” .2. 22300(1323611418)7.317 6.63524654150150K ⨯-⨯=≈>⨯⨯⨯,故在犯错误的概率不超过0.010的前提下,认为“新措施对防治非典有效” .选做题:某企业有两个分工厂生产某种零件,按规定内径尺寸(单位:mm )的值落在 [)29.94,30.06的零件为优质品. 从两个分厂生产的零件中各抽出500件,量其内径尺寸,的结果如下表:(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填写下面的22⨯列联表,并问是否有99﹪的把握认为“两个分厂生产的零件的质量【为了让学生能够根据独立性检验的思想,算出随机变量2K 的观测值来解决简单的数学问题;并注意巩固独立性检验的步骤.选做题是2009辽宁文科高考题,本题涉及到统计的多个知识点,可以说是一个综合题,在统计这一模块中的高考题不是太多,一方面让学生了解一下题型,另一方面引起学生对统计知识的重视.七、教后反思本教案通过实例引入,在教学中,向学生介绍多个知识点;分类变量、列联表、等高条形图、独立性检验、独立性检验的步骤.在例1的教学中,要注重强调独立性检验的的重要性,要求学生会解释这里“犯错误的概率”,提高了学生的解题能力.八、板书设计。
§3.2独立性检验的基本思想及其初步应用学习目标 1.了解独立性检验的基本思想、方法及其简单应用.2.理解判断两个分类变量是否有关系的常用方法、独立性检验中K2的含义及其实施步骤(重、难点).知识点1两个分类变量之间关联关系的定性分析1.分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.这里的“变量”和“值”都应作为“广义”的变量和值进行理解,它们取的不一定是具体的数值.2.列联表列出的两个分类变量的频数表,称为列联表.假设两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)为:y1y2总计x1 a b a+bx2 c d c+d总计a+c b+d a+b+c+d3.两个分类变量之间关联关系的定性分析的方法(1)频率分析法:通过对样本的每个分类变量的不同类别事件发生的频率大小进行比较来分析分类变量之间是否有关联关系.通常通过列联表列出两个分类变量的频数表来进行分析.(2)图形分析法:与表格相比,图形更能直观地反映出两个分类变量间是否互相影响,常用等高条形图展示列联表数据的频率特征.【预习评价】(1)下面是一个2×2列联表:y1y2总计x1 a 2173x282533总计 b 46则表中a,b处的值分别为()A.94,96B.52,50C.52,60D.54,52(2)根据如图所示的等高条形图可知吸烟与患肺病关系(填“有”或“没有”).知识点2独立性检验1.定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.2.K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.3.独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.(2)利用公式计算随机变量K2的观测值k.(3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.【预习评价】(1)在吸烟与患肺病这两个分类变量是否相关的判断中,下列说法中正确的是()①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在在犯错误的概率不超过0.01前提下,认为吸烟与患肺病有关系时,我们说若某人吸烟,则他有99%的可能患有肺病;③从统计量中得知在犯错误的概率不超过0.05的前提下认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.A.①B.①③C.③D.②(2)某班主任对全班50名学生进行了作业量的调查,数据如下表:认为作业量大认为作业量不大总计男生18927女生81523总计262450则推断“学生的性别与认为作业量大有关”这种推断犯错误的概率不超过()A.0.01B.0.005C.0.025D.0.001题型一利用等高条形图判断两个分类变量是否有关系【例1】为考察某种药物预防疾病的效果进行动物试验,得到如下列联表:患病未患病总计服用药104555未服用药203050总计3075105试用等高条形图分析服用药和患病之间是否有关系.规律方法(1)本题采用数形结合法通过条形图直观地看出差异,得出结论. (2)应用等高条形图判断两变量是否相关的方法在等高条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例aa+b,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例cc+d.“两个比例的值相差越大,H1成立的可能性就越大.”【训练1】网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用图形判断学生经常上网与学习成绩有关吗?方向1 有关“相关的检验”【例2-1】某校对学生课外活动进行调查,结果整理成下表:用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?方向2有关“无关的检验”【例2-2】为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.分析学生选报文、理科与对外语的兴趣是否有关?规律方法(1)独立性检验的关注点在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0,因此|ad -bc|越小,关系越弱;|ad-bc|越大,关系越强.(2)独立性检验的具体做法①根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界α,然后查表确定临界值k0.②利用公式K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)计算随机变量K2的观测值k.③如果k>k0,推断“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.【训练2】打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据:根据独立性检验,能否在犯错误的概率不超过0.001的前提下认为每一晚都打鼾与患心脏病有关系?题型三独立性检验的综合应用【例3】某高校共有学生15 000人,其中男生10 500人,女生4 500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间(单位:时)的样本数据.(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图),其中样本数据的分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否认为“该校学生的每周平均体育运动时间与性别有关”.附:P(K2≥k0)0.1000.0500.0100.005k0 2.706 3.841 6.6357.879K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).规律方法(1)解答此类题目的关键在于正确利用K2=n(ad-bc)2计算k的值,再用它与临界值k0的大小作比(a+b)(c+d)(a+c)(b+d)较来判断假设检验是否成立,从而使问题得到解决.(2)此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握.【训练3】某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分成绩优秀的人数如下表所示,能否在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学、总分成绩优秀有关系?物理优秀化学优秀总分优秀数学优秀228225267数学非优秀14315699注:该年级在此次考试中数学成绩优秀的有360人,非优秀的有880人.课堂达标1.观察下列各图,其中两个分类变量x,y之间关系最强的是()2.某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下2×2列联表:偏爱蔬菜 偏爱肉类 总计50岁以下 4 8 12 50岁以上 16 2 18 总计201030则可以说其亲属的饮食习惯与年龄有关的把握为( ) A.90%B.95%C.99%D.99.9%3.为了判断高中学生的文理科选修是否与性别有关系,随机调查了50名学生,得到如下2×2列联表:理科 文科 男 13 10 女720已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到K 2的观测值k =50×(13×20-10×7)223×27×20×30≈4.844.可认为选修文理科与性别有关系的可能性不低于 . 4.根据下表计算:不看电视 看电视 男 37 85 女35143K 2的观测值k ≈ (保留3位小数).5.在109个人身上试验某种药物预防感冒的作用,得到如下列联表:感冒 未感冒 总计 服用药1146 57 未服用药 213152总计3277109则有多大把握认为该药有效?课堂小结1.列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系.2.对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算随机变量K2的值,如果K2值很大,说明假设不合理.K2越大,两个分类变量有关系的可能性越大.基础过关1.对两个分类变量A,B的下列说法中正确的个数为()①A与B无关,即A与B互不影响;②A与B关系越密切,则K2的值就越大;③K2的大小是判定A与B是否相关的唯一依据A.0B.1C.2D.32.高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表:优秀及格总计甲班113445乙班83745总计197190则随机变量K2的观测值约为()A.0.600B.0.828C.2.712D.6.0043.考察棉花种子经过处理跟生病之间的关系得到下表数据:种子处理种子未处理总计根据以上数据,可得出()A.种子是否经过处理跟是否生病有关B.种子是否经过处理跟是否生病无关C.种子是否经过处理决定是否生病D.以上都是错误的4.2013年6月11日,中国的“神舟十号”发射成功,由此许多人认为中国进入了航天强国之列,也有许多人持反对意见,为此进行了调查.在参加调查的3 648名男性公民与3 432名女性公民中,持反对意见的男性有1 843人、女性有1 672人,在运用这些数据说明中国“神十”发射成功是否与中国进入航天强国有关系时,用下列最具说服力.①回归直线方程;②平均数与方差;③独立性检验.5.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是(填序号).①没有充足的理由认为课外阅读量大与作文成绩优秀有关;②有0.5%的把握认为课外阅读量大与作文成绩优秀有关;③有99.9%的把握认为课外阅读量大与作文成绩优秀有关;④有99.5%的把握认为课外阅读量大与作文成绩优秀有关.6.在研究某种药物对“H1N1”病毒的治疗效果时,进行动物试验,得到以下数据,对150只动物服用药物,其中132只动物存活,18只动物死亡,对照组150只动物进行常规治疗,其中114只动物存活,36只动物死亡.(1)根据以上数据建立一个2×2列联表;(2)试问该种药物对治疗“H1N1”病毒是否有效?7.在一次恶劣天气的飞行航程中调查男女乘客在飞机上晕机的情况如下表所示,根据此资料是否能在犯错误的概率不超过0.05的前提下认为在恶劣天气飞行中男人比女人更容易晕机?能力提升8.利用独立性检验来考察两个分类变量X和Y是否有关系时,通过查阅下表来确定“X与Y有关系”的可信程度.如果K2≥5.024,那么就有把握认为“X与Y有关系”的百分比为()A.25%B.75%C.2.5%D.97.5%9.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1表2表3表4A.成绩B.视力C.智商D.阅读量10.下表是关于男婴与女婴出生时间调查的列联表:那么,A=,B=,C=,D=,E=.11.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是(填序号).①若K2的观测值k=6.635,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;③由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.12.随着生活水平的提高,人们的休闲方式也发生了变化.某机构随机调查了n 个人,其中男性占调查人数的25.已知男性中有一半的人的休闲方式是运动,而女性中只有13的人的休闲方式是运动. (1)完成下列2×2列联表:(2)若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么本次被调查的人数至少有多少?(3)根据(2)的结论,本次被调查的人中,至少有多少人的休闲方式是运动? 13.(选做题)某学校为了解该校高三年级学生在市一练考试的数学成绩情况,随机从该校高三文科与理科各抽取50名学生的数学成绩,作出频率分布直方图如图,规定考试成绩在[120,150]内为优秀.(1)由以上频率分布直方图填写下列2×2列联表.若按是否优秀来判断,是否有99%的把握认为该校的文理科数学成绩有差异.文科理科总计优秀非优秀总计5050100(2)某高校派出2名教授对该校随机抽取的学生成绩中一练数学成绩在140分以上的学生进行自主招生面试,每位教授至少面试一人,每位学生只能被一位教授面试.若甲教授面试的学生人数为ξ,求ξ的分布列和均值.。
高一数学独立性检验的基本思想及其初步应用知识点独立性检验的基本思想独立性检验的基本思想及其初步应用是高中数学的一个难点,有些知识点需要同学们了解,下面是WTT给大家带来的高一数学独立性检验的基本思想及其初步应用知识点,希高一数学独立性检验的基本思想及其初步应用知识点(一)独立性检验的基本思想及其初步应分类变量与列联表:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量;列出的两个分类变量的频数表,称为列联表。
独立性检验:为了使不同样本容量的数据有统一的评判标准,构造一个随机变量,其中n=a+b+c+d为样本容量。
利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验。
利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度,具体做法是:(1)根据实际问题需要的可信程度确定临界值k0;(2)利用公式(1),由观测数据计算得到随机变量K2的观测值;(3)如果k>k0,就以(1-P(K2ge;k0))100的把握认为“与Y有关系”;否则就说样本观测数据没有提供“与Y有关系”的充分证据。
独立性检验的性质:独立性检验没有直观性,必须依靠K2的观测值k作判断。
独立性检验的一般步骤:(1)根据样本数据制成22列联表;(2)根据公式,计算K2的值;(3)查表比较K2与临界值的大小关系,作统计判断。
高一数学独立性检验的基本思想及其初步应用知识点(二)统计学的一种检验方式。
与适合性检验同属于2检验(即卡方检验,英文名:chi square test)它是根据次数资料判断两类因子彼此相关或相互独立的假设检验。
假设有两个分类变量和Y,它们的值域分另为{1, 2}和{y1, y2},其样本频数列联表为:y1y2总计1aba+b2cdc+d总计a+cb+da+b+c+d若要推断的论述为H1:“与Y有关系”,可以利用独立性检验来考察两个变量是否有关系,并且能较精确地给出这种判断的可靠程度。
《独立性检验的基本思想及其初步应用》教学设计陕西省西安市第八十三中学刘玉记【教材分析】《独立性检验的基本思想及应用》这节课是北师大版高中数学《选修2—3》第三章第2节,是概率与统计的重要内容。
在此之前,学生已经学习了随机事件发生的概率、相互独立事件等概念,本节课不仅是对前面所学知识的巩固和检测,更为学生进一步学习概率与统计奠定一定的理论基础,更有利于培养学生用数学的眼光去认识世界,用数学的思维去思考世界,用数学的方法去解决问题。
【教学目标】1.知识与技能:通过对典型案例的探究,了解独立性检验的基本思想,会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,并能解决实际问题。
2、过程与方法:通过设置问题,引导学生自主发现、合作探究、归纳展示、质疑对抗,使学生真正成为课堂的主体。
3、情感、态度与价值观:通过本节课学习,让学生体会统计方法在决策中的作用;合作探究的学习过程,使学生感受发现、探索的乐趣及成功展示的成就感,培养学生学习数学知识的积极态度。
通过对TI图形计算器的使用和操作,培养学生热爱数学、热爱新技术、热爱科学的情怀。
4、数学核心素养目标及落实途径:通过对实际问题的抽象与分析,引导学生建立数学模型,培养学生的数学建模能力;通过对数学模型的分析与解决,培养学生的数学运算能力和逻辑推理能力;充分利用TI图形计算器的数据收集功能、绘图功能、数据分析与处理功能,培养学生的数据分析能力,从而掌握独立性检验的方法和思想,并能用这些方法解决一些实际问题,凸显数学的应用价值。
【教学重点】了解独立性检验的基本思想及实施步骤。
【教学难点】独立性检验的基本思想;随机变量2K的含义;临界值表的含义【学情分析】一方面,学生学习了相关关系之后,明白两个变量之间可能会存在一种相关关系,但这种关系是强还是弱?作出这种判断有无出错的可能?出错率是多少?把握性又是多少?这些都有待于进一步解决,所以通过情景设置和问题导向可以激发学生的学习兴趣.另一方面,有了频率与概率、相互独立事件等知识做铺垫和准备,学生在学习本节课就具备了一定的知识基础.但理解独立性检验的思想包括卡方及其临界值的含义是本节课的难点,因此教师要通过温故知新、由浅入深、层层递进、循序善诱的方法给学生做足够的铺垫和启发才可以突破这一难点,还需要设置相应的练习加深理解、巩固新知识.【教学方式】多媒体辅助,以教师引导,学生合作探究式为主的教学方式。
【教学用具】数学TI—Nspire图形计算器、Wifi无线发射器、多媒体【教学过程】一、情境引入,提出问题有人说:“吸烟有害健康!”,而另一些人却认为吸烟不影响健康.理由是:有的吸烟老人却很长寿。
这两种观点哪个正确呢?引入一组调查数据:设置目的:通过两种对立的观点制造认识上的冲突和矛盾,使数学生活化、趣味化,从而激发学生的学习兴趣.二、层层设问,诱导思考问题一、如何通过表中的统计数据判断患肺癌跟吸烟是否有关联?学生活动:学生讨论、探究,并用图形计算器计算、作图,最终得出答案方法一:用图形计算器算出结果并回答(1)在不吸烟者中患肺癌的比重是多少?(2)在吸烟者中患肺癌的比重又是多少?你的结论是:方法二:用图形计算器作出等高条形图,并回答:你的结论是:设置目的:通过问题,引导学生小组合作讨论,培养理性思维能力;通过对图形计算器的操作,培养学生的动手能力;通过对数据的分析思考,培养学生的数据分析能力. 问题二:你认为根据上述方法作出的判断可靠吗?把握性有多大? 学生活动:学生讨论、辩论.可能会出现可靠和不可靠两种不同观点.教师点评:回答可靠和不可靠都有道理,那么可靠性有多大?我们需要一个量化的标准,这就是今天我们将要学习的一种重要方法:独立性检验设置目的:设置一个有辩论性的问题,激发学生辩论、质疑.一方面,为引出独立性检验的思想和方法做铺垫;另一方面,培养学生的质疑意识和科学精神.问题三:假设患肺癌跟吸烟没有关系,即 A1与B1相互独立,根据表中的数据(用字母代替)你能得到什么结论?学生活动:学生探究讨论并作出回答问题四:如果A1与B1相互独立,那么A1与B2 、 A2与B1、 A2与B2什么关系?式子化简后你还能得到什么结论? 学生活动:学生探究讨论并作出回答结论生成:假设A1与B1相互独立,那么A1与B2 、 A2与B1、 A2与B2也相互独立,用频率代替概率可以得到:n c a n b a n a +⨯+≈,n d c n c a n c +⨯+≈,nba n db n b +⨯+≈,ndc nd b n d +⨯+≈,bc ad -越小,说明吸烟与患肺癌之间关系越弱;bc ad -越大,说明吸烟与患肺癌之间关系越强。
设置目的:激发学生思考、探究,培养逻辑推理能力与数据分析能力,为统计量的生成奠定理论基础.三、介绍知识产生的背景、传播数学文化介绍卡方的提出者:皮尔逊(Karl Pearson )设置目的:让学生明白独立性检验的提出背景和提出者,旨在让学生了解数学文化。
四、知识生成、卡方检验问题五: 根据卡方的表达式,请你说说卡方的大小和两个变量之间关联程度的强弱有何关系?学生活动:学生探究讨论并作出回答结论生成:2K 越小,|ad-bc|也越小,说明吸烟与患肺癌之间关系越弱; 2K 越大,|ad-bc|也越大,说明吸烟与患肺癌之间关系越强.设置目的:与问题四相呼应,让学生体会2K 的生成过程,并为临界值的含义做铺垫. 解释临界值的含义,以001.0)831.10(2≈>χP 为例统计学研究发现:假设A 与B 相互独立,则出现831.102>χ的概率只有千分之一,这是一个小概率事件,几乎不可能发生.如果根据某次统计数据出现了831.102>χ—— 一个几乎不可能发生的小概率事件发生了,说明A 与B 相互独立这一假设成立的可能性非常小——只有0.1%,即就是说我们有1-0.1%=99.9%的把握判定A 与B 有关联.当然我们做出A 与B 有关联这样的判断也会出错,但出错的概率不超过0.1% .我们把这种检验方法称为假设检验法。
五、结合理论,实际应用问题六:在吸烟和患肺癌的例子中,请根据卡方的值,并结合临界值表,说说你得到了什么结论和启发?学生活动:学生用图形计算器计算、小组讨论生成结论结论生成:698.622=χ我们有99.9%的把握认为患肺癌与吸烟有关联。
因此,为了健康你、我、他,我们要拒绝吸烟、劝诫他人不要吸烟!设置目的:通过实例,结合具体计算,让学生体会独立性检验的基本思想,同时回答了问题二的疑问.学生练习:易怒的人更容易患心脏病吗?某机构随机调查了2796人,下表中给出了调查的结果,试问:容易生气的人是否更有可能患心脏病?))()()(()(22d b c a d c b a bc ad n K ++++-=2)+b a b b d n n n a b b d n n ++-⋅++⋅(2()+c c d a c n n n c d a cn n++-⋅++⋅2()]d c d b d n n n c d b dn n++-⋅++⋅课堂活动:并用图形计算器算出卡方的值,回答有多大把握认为性别与喜欢足球有关联。
A.男生、喜欢足球B.男生、不喜欢足球C.女生、喜欢足球D.女生、不喜欢足球设置目的:通过图形计算器现场收集数据,并利用本节课所学的知识解决问题,让学生参与在数据收集、数据处理、数据分析的整个过程当中,进一步培养学生的数据分析能力并体会独立性检验的思想。
同时让学生图形计算器的强大功能,从而培养热爱数学、热爱信息技术、热爱科学的情操。
六、知识小结、思想升华1、基本知识独立性检验的方法及步骤:(1)写出2×2列联表;(2)利用公式计算K2的观测值k;(3)查临界值表,比较k与k的大小得出结论。
2、独立性检验的原理与反正法原理反证法:假设检验:(1)假设(如A与B相互独立)(1)假设:原命题不成立(2)推出一个小概率事件发生(2)推出一个矛盾,(3)推断假设成立的可能性很(3)证明了这个假设不成立小其对立结论成立可能性很大(原命题成立)对立的两个结论可能性大小相反对立的两个命题的真假相反【教学目标检测】教学目标检测分为下面两部分:一、课堂提问及练习.练习1、某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:k =50(13×20-10×7)220×30×23×27≈4.844,因为k >3.841,所以确定主修统计专业与性别有关系,那么这种判断出错的可能性为________.练习2、通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联 表;由K 2=n ((a +b )(c +d )(a +c )(b +d )算得,K 2=110(40×30-20×20)260×50×60×50≈7.8.附表:A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 二、课后探究作业请同学们根据班上同学的实际情况,按下列四个项目(数学成绩好物理成绩也好,数学成绩好但物理成绩不好、数学成绩不好但物理成绩好、数学成绩不好物理成绩也不好)调查相应人数,并制成2乘2列联表,利用卡方独立检验法分析有多大把握认为数学成绩好与物理成绩好之间有关联。
设置目的:通过学生课堂回答问题的情况和练习结果,可以及时反馈学生在知识的产生、发展及应用过程中存在的问题,教师可以及时给予评价和纠正,使课堂教学取得更好的效果;通过学生课后作业反馈的信息,可以检测教师课堂教学目标的落实情况,教师可以及时对课堂教学进行反思,以便进一步改进教学方法、提高教学水平。
【板书设计】3.2.1独立性检验的思想及其初步应用一、分类变量与列联表二、独立性检验的思想1、思想2、步骤(1)写出2×2列联表;(2)利用公式计算K2的观测值k;(3)查临界值表,比较k与k的大小得出结论。
点评《独立性检验的基本思想及应用》这节课是概率与统计的重要内容。
正确理解独立性检验的基本思想、掌握其基本应用不仅是对前面所学知识的巩固和检测,更为学生进一步学习概率与统计奠定一定的理论基础。
刘玉记老师选择利用在“互联网+”信息技术条件下利用数学TI图形计算器进行数学实验教学,引导学生理解独立性检验的基本思想、巩固加强应用、实现教学目标,有新意,有创新,值得肯定。
本节课的教学主要有以下特点:1.从实际生活出发,创设问题情境。