独立性检验的基本思想及其初步应用 说课稿 教案 教学设计
- 格式:doc
- 大小:398.88 KB
- 文档页数:9
独立性检验的基本思想及其初步应用教材整理 独立性检验 1.卡方统计量 χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2,用χ2的大小可以决定是否拒绝原来的统计假设H 0.如果算出的χ2值较大,就拒绝H 0,也就是拒绝“事件A 与B 无关”,从而就认为它们是有关的了.2.两个临界值(1)当根据具体的数据算出的χ2>3.841时,有95%的把握说事件A 与B 有关; (2)当χ2>6.635时,有99%的把握说事件A 与B 有关,当χ2≤3.841时,认为事件A 与B 是无关的.1.判断(正确的打“√”,错误的打“×”)(1)分类变量中的变量与函数中的变量是同一概念.(×) (2)独立性检验的方法就是反证法.(×)(3)独立性检验中可通过统计表从数据上说明两分类变量的相关性的大小.(√) 2.考察棉花种子经过处理与生病之间的关系,得到下表中的数据:种子处理 种子未处理合计 得病 32 101 133 不得病 61 213 274 合计93314407A.种子是否经过处理与是否生病有关B.种子是否经过处理与是否生病无关C.种子是否经过处理决定是否生病D.有90%的把握认为种子经过处理与生病有关 【解析】χ2=407×(32×213-61×101)293×314×133×274≈0.164<0.455,即没有充足的理由认为种子是否经过处理跟生病有关. 【答案】 B3.若由一个2×2列联表中的数据计算得χ2=4.013,那么有__________的把握认为两个变量之间有关系.【解析】查阅χ2表知有95%的把握认为两个变量之间有关系.【答案】95%用2×2列联表分析两变量间的关系在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人的饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用n11n1+与n21n2+判断二者是否有关系.【自主解答】饮食习惯与年龄2×2列联表如下:年龄在六十岁以上年龄在六十岁以下合计饮食以蔬菜为主432164饮食以肉类为主273360合计7054124 将表中数据代入公式得n11 n1+=4364≈0.67,n21 n2+=2760=0.45.显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.1.作2×2列联表时,注意应该是4行4列,计算时要准确无误.2.作2×2列联表时,关键是对涉及的变量分清类别.[再练一题]1.上例中条件不变,尝试用|n11n22-n12n21|的大小判断饮食习惯与年龄是否有关.【解】将本例2×2列联表中的数据代入可得|n11n22-n12n21|=|43×33-21×27|=852.相差较大,可在某种程度上认为饮食习惯与年龄有关系.由χ2进行独立性检验某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下表所示,则我们能否在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学优秀有关系?物理优秀 化学优秀 总分优秀 数学优秀 228 225 267 数学非优秀14315699注:该年级此次考试中数学成绩优秀的有360人,非优秀的有880人.【精彩点拨】 首先分别列出数学成绩与物理、化学、总分的2×2列联表,再正确计算χ2的观测值,然后由χ2的值作出判断.【自主解答】 (1)根据已知数据列出数学与物理优秀的2×2列联表如下:物理优秀 物理非优秀合计 数学优秀 228 b 360 数学非优秀 143 d 880 合计371b +d1 240∴b =360-228=132,d =880-143=737,b +d =132+737=869. 代入公式可得χ2≈270.114.(2)按照上述方法列出数学与化学优秀的2×2列联表如下:化学优秀 化学非优秀合计 数学优秀 225 135 360 数学非优秀 156 724 880 合计3818591 240代入公式可得χ2≈240.611.综上,由于χ2的观测值都大于10.828,因此说明都能在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学优秀有关系.1.独立性检验的关注点在2×2列联表中,如果两个分类变量没有关系,则应满足n 11n 22-n 12n 21≈0,因此|n 11n 22-n 12n 21|越小,关系越弱;|n 11n 22-n 12n 21|越大,关系越强.2.独立性检验的具体做法(1)根据实际问题的需要确定允许推断“事件A 与B 有关系”犯错误的概率的上界α,然后查表确定临界值k 0.(2)利用公式χ2=n (n 11n 22-n 12n 221)n 1+n 2+n +1n +2计算随机变量χ2.(3)如果χ2≥k 0,推断“X 与Y 有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够的证据支持结论“X 与Y 有关系”.[再练一题]2.为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人的调查结果如下:患胃病 未患胃病 合计 生活不规律 60 260 320 生活有规律 20 200 220 合计80460540根据以上数据判断40岁以上的人患胃病与生活规律有关吗? 【解】 由公式得χ2=540(60×200-260×20)2320×220×80×460≈9.638.∵9.638>6.635,∴有99%的把握说40岁以上的人患胃病与生活是否有规律有关,即生活不规律的人易患胃病.独立性检验的综合应用探究1 利用χ2进行独立性检验,估计值的准确度与样本容量有关吗?【提示】 利用χ2进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n 越大,这个估计值越准确,如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性.探究2 在χ2运算后,得到χ2的值为29.78,在判断变量相关时,P (χ2≥6.635)≈0.01和P (χ2≥7.879)≈0.005,哪种说法是正确的?【提示】 两种说法均正确.P (χ2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两个变量相关;而P (χ2≥7.879)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两个变量相关.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:男 女 需要 40 30 不需要160270(1)(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中需要志愿者提供帮助的老年人的比例?说明理由.【精彩点拨】 题中给出了2×2列联表,从而可通过求χ2的值进行判定.对于(1)(3)可依据古典概率及抽样方法分析求解.【自主解答】 (1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为70500=14%.(2)χ2=500×(40×270-30×160)2200×300×70×430≈9.967.由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关. (3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法进行抽样,这比采用简单随机抽样方法更好.1.检验两个变量是否相互独立,主要依据是利用χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2公式计算χ2的值,再利用该值与3.841,6.635两个值进行比较作出判断.2.χ2计算公式较复杂,一是公式要清楚;二是代入数值时不能张冠李戴;三是计算时要细心.3.统计的基本思维模式是归纳,它的特征之一是通过部分数据的性质来推测全部数据的性质.因此,统计推断是可能犯错误的,即从数据上体现的只是统计关系,而不是因果关系.[再练一题]3.若两个分类变量x 和y 的列联表为:y x y 1 y 2 x 1 5 15 x 24010则x 与y 【解析】 χ2=(5+15+40+10)(5×10-40×15)2(5+15)(40+10)(5+40)(15+10)≈18.822. ∵18.822>6.635,∴x 与y 之间有关系的概率约为1-0.01=0.99. 【答案】 0.99。
独立性检验的基本思想及初步应用教案第一章:独立性检验简介1.1 学习目标:(1)理解独立性检验的定义及作用;(2)了解独立性检验在实际应用中的重要性;(3)掌握独立性检验的基本步骤。
1.2 教学内容:(1)独立性检验的定义;(2)独立性检验的实际应用案例;(3)独立性检验的基本步骤。
1.3 教学活动:(1)介绍独立性检验的概念;(2)通过实际案例让学生了解独立性检验的应用;(3)引导学生掌握独立性检验的基本步骤。
第二章:卡方检验2.1 学习目标:(1)理解卡方检验的原理;(2)掌握卡方检验的计算方法;(3)学会判断卡方检验的结果。
2.2 教学内容:(1)卡方检验的原理;(2)卡方检验的计算方法;(3)卡方检验的结果判断。
2.3 教学活动:(1)讲解卡方检验的原理;(2)通过示例让学生掌握卡方检验的计算方法;(3)引导学生学会判断卡方检验的结果。
第三章:列联表与独立性检验3.1 学习目标:(1)了解列联表的概念;(2)掌握列联表的绘制方法;(3)学会利用列联表进行独立性检验。
3.2 教学内容:(1)列联表的概念;(2)列联表的绘制方法;(3)利用列联表进行独立性检验。
3.3 教学活动:(1)介绍列联表的概念;(2)通过示例让学生掌握列联表的绘制方法;(3)引导学生学会利用列联表进行独立性检验。
第四章:独立性检验的应用4.1 学习目标:(1)学会运用独立性检验解决实际问题;(2)掌握独立性检验在调查分析中的作用;(3)了解独立性检验在实际应用中的局限性。
4.2 教学内容:(1)独立性检验在实际问题中的应用;(2)独立性检验在调查分析中的作用;(3)独立性检验的局限性。
4.3 教学活动:(1)讲解独立性检验在实际问题中的应用;(2)通过案例分析让学生了解独立性检验在调查分析中的作用;(3)引导学生认识独立性检验的局限性。
第五章:练习与拓展5.1 学习目标:(1)巩固所学独立性检验知识;(2)提高运用独立性检验解决实际问题的能力;(3)培养学生的创新意识和拓展能力。
《3.2独立性检验的基本思想及其初步应用》教学案学习目标1、通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,让学生亲身体验独立性检验的实施步骤与必要性.并了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用;2、能利用统计量2K来分析两个分类变量是否有关系;教学重点:理解独立性检验的基本思想;独立性检验的步骤.教学难点:1、理解独立性检验的基本思想;2、了解随机变量K2的含义;3、独立性检验的步骤.学习过程一、知识建构1、分类变量:对于性别变量,取值为:男、女;这种变量的不同取“值”表示______ _______,这类变量称为分类变量注意:分类变量的取值一定是离散的2、问题探究:为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)在不吸烟者中患肺癌的比重是,在吸烟者中患肺癌的比重是说明:吸烟者和不吸烟者患肺癌的可能性______,吸烟者患肺癌的可能性_______3、完成以下内容.第一步:列联表(用字母表示吸烟与患肺癌的列联表):第二步:0:“ ”.用A 表示不吸烟,B 表示不患肺癌,则AB 表示_________________________ 假设0H ()P AB⇔=__________________________ 所以0H 成立的条件下应该有:an≈ (n =a +b +c +d ) 因此ad -ad -与患肺癌之间关系越强,第三步:构造随机变量2K = (其中 n =a +b +c +d ) 计算随机变量2K 的观测值k .(简称卡方公式) 第四步:查表得出结论K k = ______________________________________因为k ≥_________,就推断“吸烟与患肺癌没有关系”,这种推断犯错误的概率不超过_________;即认为吸烟与患肺癌____________总结:以上这种利用随机变量K 2来判断“两个分类变量有关系”的方法称为______________________二、形成能力在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.能否在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系?为什么?三、课堂检测1、 分类变量Y X 和的列联表如下:则下列说法正确的是:A .bc ad -越小,说明Y X 和关系越弱B .bc ad -越大,说明Y X 和关系越强C .2()bc ad -越大,说明Y X 和关系越强 D .2()bc ad -越接近于0,说明Y X 和关系越强2、为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:K 数学课程之间有关系?为什么?。
“3.2独立性检验的基本思想及其应用”教学设计课例1 教材版本新课标教材 人教A 版《数学2-3》(选修) 第三章 统计案例 第二节 独立性检验的基本思想及其应用2 目标确立 (1)教材分析《独立性检验》为新课标教材中新增加的内容.虽然本节是新增内容,理论比较复杂,教学时间也不长(1-2课时),但由于它贴近实际生活,在整个高中数学中,地位不可小视.在近几年各省新课标高考试题中,本节内容屡屡出现,其重要性可见一斑.该内容是前面学生在《数学3》(必修)中的统计知识的进一步应用,并与本册课本前面提到的事件的独立性一节关系紧密,此外还涉及到与《数学2-2》(选修)中讲到的“反证法”类似的思想.本小节的知识内容如右图。
“独立性检验”是在考察两个分类变量之间是否具有相关性的背景下提出的,因此教材上首先提到了分类变量的概念,并给出了考察两个分类变量之间是否相关的一种简单的思路,即借助等高条形图的方法,随后引出相对更精确地解决办法——独立性检验。
独立性检验的思想,建立在统计思想、假设检验思想(小概率事件在一次试验中几乎不可能发生)等基础之上,通常按照如下步骤对数据进行处理:明确问题→确定犯错误概率的上界α及2K 的临界值0k →收集数据→整理数据→制列联表→计算统计量2K 的观测值k →比较观测值k 与临界值0k 并给出结论.学习独立性检验的目的是“通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生认识统计方法在决策中的作用”。
这是因为,随着现代信息技术飞速发展,信息传播速度快,人们每天都会接触到影响我们生活的统计方面信息,所以具备一些统计知识已经成为现代人应具备的一种数学素养。
(2)学情分析本节课是在学生学习了抽样方法、事件的相互独立性、正态分布及回归分析的基本思想及初步应用后进行的,是体现概率统计思想应用价值的新内容。
理解独立性检验的基本思想,并明确独立性检验的基本步骤是本课教学重点,通过“在做数学中学数学”,来突出理解这一统计思想。
独立性检验的基本思想及初步应用教学目标:1. 了解独立性检验的基本思想及其在实际问题中的应用。
2. 学会使用假设检验方法判断两个分类变量之间是否具有独立性。
3. 掌握利用独立性检验解决实际问题的基本步骤。
教学内容:第一章:独立性检验的基本思想1.1 独立性检验的定义1.2 独立性检验的基本原理1.3 独立性检验的应用场景第二章:列联表与卡方检验2.1 列联表的定义及制作2.2 卡方检验的原理及计算2.3 卡方检验的判断标准第三章:假设检验方法3.1 假设检验的定义及类型3.2 独立性检验的假设条件3.3 独立性检验的步骤及注意事项第四章:实际问题中的应用4.1 案例一:产品质量检验4.2 案例二:消费者偏好调查4.3 案例三:疾病与性别关系的分析第五章:总结与拓展5.1 独立性检验在实际问题中的应用范围5.2 独立性检验的局限性5.3 独立性检验与其他统计方法的比较教学方法:1. 讲授:讲解独立性检验的基本思想、原理及应用。
2. 案例分析:分析实际问题,引导学生运用独立性检验解决问题。
3. 小组讨论:分组讨论案例,培养学生的合作与交流能力。
4. 练习与反馈:布置课后习题,及时了解学生掌握情况,给予针对性的指导。
教学评估:1. 课后习题:检验学生对课堂内容的掌握程度。
2. 案例分析报告:评估学生在实际问题中运用独立性检验的能力。
3. 课堂表现:观察学生在课堂讨论、提问等方面的参与度。
教学资源:1. 教材:独立性检验相关章节。
2. 案例材料:产品质量检验、消费者偏好调查、疾病与性别关系等实际问题。
3. 计算器:用于计算卡方值及概率。
教学时数:1. 共计4课时,每课时45分钟。
2. 分配如下:第一章1课时,第二章1课时,第三章1课时,第四章1课时。
第六章:多组独立性检验6.1 多组独立性检验的定义6.2 多组独立性检验的方法6.3 多组独立性检验的应用案例第七章:非参数检验7.1 非参数检验的定义及意义7.2 非参数检验方法简介7.3 独立性检验与非参数检验的比较第八章:独立性检验的软件操作8.1 统计软件的选择与操作8.2 独立性检验的软件实现8.3 结果解读与分析第九章:独立性检验在实际问题中的应用案例分析9.1 案例一:市场调查与分析9.2 案例二:教育公平性研究9.3 案例三:医学研究中的应用第十章:总结与展望10.1 独立性检验在统计学中的地位与作用10.2 独立性检验的发展趋势10.3 独立性检验在未来的挑战与机遇教学方法:1. 讲授:讲解多组独立性检验、非参数检验及软件操作相关知识。
《独立性检验的基本思想及其初步应用》教学设计邹晓利两当一中《独立性检验的基本思想及其初步应用》教学设计两当一中邹晓利【教学目标】1.知识与技能:通过对典型案例的探究,了解独立性检验的基本思想,会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,并能解决实际问题。
2.过程与方法:通过设置问题,引导学生自主发现、合作探究、归纳展示、质疑对抗,使学生成为课堂主体。
3.情感、态度与价值观:通过本节课学习,让学生体会统计方法在决策中的作用;合作探究的学习过程,使学生感受发现、探索的乐趣及成功展示的成就感,培养学生学习数学知识的积极态度。
【教学重点】了解独立性检验的基本思想及实施步骤。
【教学难点】K的含义。
独立性检验的基本思想;随机变量2【学情分析】本节课是在学习了统计、回归分析的基本思想及初步应用后,利用独立性检验进一步分析两个分类变量之间是否有关系,为以后学习统计理论奠定基础。
【教学方式】多媒体辅助,合作探究式教学。
【教学过程】一、情境引入,提出问题5月31日是世界无烟日,有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、肺病等都与吸烟有关,吸烟已经成为继高血压之后的第二号全球杀手。
这些疾病与吸烟有关的结论是怎样得出的呢?[设计意图说明]好的课堂情景引入,能激发学生的求知欲,是新问题能够顺利解决的前提之一。
问题你认为吸烟与患肺癌有关系吗?怎样用数学知识说明呢?[设计意图说明]提出问题,引导学生自主探究,指明方向,步步深入。
二、阅读教材,探究新知1.分类变量对于性别变量,其取值为男和女两种:[设计意图说明]利用图像向学生展示变量的不同取值,更加形象的表示分类变量的概念。
这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量。
生活中有很多这样的分类变量如:是否吸烟宗教信仰国籍民族……2.列联表为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:表3—7 吸烟与患肺癌列联表单位:人不患肺癌患肺癌总计不吸烟7775 42 7817吸烟2099 49 2148总计9874 91 9965 这样列出的两个分类变量的频数表,称为列联表(一般我们只研究每个分类变量只取两2 列联表)。
独立性检验的基本思想及其应用【学情分析】:在实际的问题中,经常会面临需要推断的问题,比如研制一种新药,需要推断此药是否有效?有人怀疑吸烟的人更容易患肺癌,那么吸烟是否与患肺癌有关呢?等等。
在对类似的问题作出推断时,我们不能仅凭主观意愿作出结论,需要通过试验来收集数据,并依据独立性检验的原理作出合理的分析推断.在本节的学习中,通过案例分析,使学生学会用假设检验的思想方法解决对于两个分类变量是否有关系的判断问题,并理解统计思维与确定性思维的差异。
【教学目标】:(1)知识与技能:理解分类变量的含义;会根据收集的数据列出2×2列联表,并会阅读三维柱形图和二维条形图,并粗略判断两个分类变量是否有关系;理解假设检验思想,会利用独立性检验精确判断两个分类变量是否有关系;(2)过程与方法:利用学生身边熟悉的问题引入分类变量是否相关的问题;运用统计学解决问题的一般思路引导学生;让学生经历假设检验思想的形成及运用过程,领会分析、总结的方法;(3)情感态度与价值观:通过提供适当的情境资料,吸引学生的注意力,激发学生的学习兴趣;在合作讨论中学会交流与合作,启迪思维,提高创新能力;通过实际问题的解决和从不同角度对问题的解决,可提高学生应用数学能力。
【教学重点】:理解独立性检验的基本思想及实施步骤。
【教学难点】:.(1)了解独立性检验的基本思想;(2)了解随机变量2K太大认为两个分类变量是有关系的。
K的含义,2【课前准备】:课件【教学过程设计】:同步练习与测试:(基础题)1、根据下表计算:计算随机变量的观测值k= 。
【解析】把表格补充完整≈⨯⨯⨯⨯-⨯=17812222872)358514337(3002k 4.512、独立性检验常作的图形是 和 。
【答案】三维柱形图 ,二维条形图3、两个临界值为3.841与6.635。
当2 3.841k ≤时,认为事件A 与B 是 (填“有关的”或“无关的”);当2 6.635k >时,有99%的把握说事件A 与B 是 (填“有关的”或“无关的”)。
《独立性检验的基本思想及其初步应用》教学设计邹晓利两当一中《独立性检验的基本思想及其初步应用》教学设计两当一中邹晓利【教学目标】1.知识与技能:通过对典型案例的探究, 了解独立性检验的基本思想,会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,并能解决实际问题。
2.过程与方法:通过设置问题,引导学生自主发现、合作探究、归纳展示、质疑对抗,使学生成为课堂主体。
3.情感、态度与价值观:通过本节课学习,让学生体会统计方法在决策中的作用;合作探究的学习过程,使学生感受发现、探索的乐趣及成功展示的成就感,培养学生学习数学知识的积极态度。
【教学重点】了解独立性检验的基本思想及实施步骤。
【教学难点】独立性检验的基本思想;随机变量K 2的含义。
【学情分析】本节课是在学习了统计、回归分析的基本思想及初步应用后,利用独立性检验进一步分析两个分类变量之间是否有关系,为以后学习统计理论奠定基础。
【教学方式】多媒体辅助,合作探究式教学。
【教学过程】一、情境引入,提出问题5 月 31 日是世界无烟日,有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、肺病等都与吸烟有关,吸烟已经成为继高血压之后的第二号全球杀手。
这些疾病与吸烟有关的结论是怎样得出的呢?[ 设计意图说明]好的课堂情景引入,能激发学生的求知欲,是新问题能够顺利解决的前提之一。
问题你认为吸烟与患肺癌有关系吗?怎样用数学知识说明呢?[ 意明]提出,引学生自主探究,指明方向,步步深入。
二、教材,探究新知1.分量于性量,其取男和女两种:[ 意明]利用像向学生展示量的不同取,更加形象的表示分量的概念。
种量的不同“ ”表示个体所属的不同,像的量称分量。
生活中有很多的分量如:是否吸烟宗教信仰国籍民族⋯⋯2. 列表研究吸烟是否患肺癌有影响,某瘤研究所随机地了9965 人,得到如下果:表 3—7吸烟与患肺癌列表位:人不患肺癌患肺癌不吸烟7775427817吸烟20994921489874919965列出的两个分量的数表,称列表(一般我只研究每个分量只取两个,的列表称 2 2 列表)。
独立性检验的基本思想及其初步应用一、教学内容与教学对象分析通过典型案例,学习下列一些常用的统计方法,并能初步应用这些方法解决一些实际问题。
①通过对典型案例(如“患肺癌与吸烟有关吗”等)的探究。
了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。
②通过对典型案例(如“人的体重与身高的关系”等)的探究,了解回归的基本思想、方法及其初步应用。
二. 学习目标1、知识与技能通过本节知识的学习,了解独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确的判断。
明确对两个分类变量的独立性检验的基本思想具体步骤,会对具体问题作出独立性检验。
2、过程与方法在本节知识的学习中,应使学生从具体问题中认识进行独立性检验的作用及必要性,树立学好本节知识的信心,在此基础上学习三维柱形图和二维柱形图,并认识它们的基本作用和存在的不足,从而为学习下面作好铺垫,进而介绍K的平方的计算公式和K的平方的观测值R 的求法,以及它们的实际意义。
从中得出判断“X与Y有关系”的一般步骤及利用独立性检验来考察两个分类变量是否有关系,并能较准确地给出这种判断的可靠程度的具体做法和可信程度的大小。
最后介绍了独立性检验思想的综合运用。
3、情感、态度与价值观通过本节知识的学习,首先让学生了解对两个分类博变量进行独立性检验的必要性和作用,并引导学生注意比较与观测值之间的联系与区别,从而引导学生去探索新知识,培养学生全面的观点和辨证地分析问题,不为假想所迷惑,寻求问题的内在联系,培养学生学习数学、应用数学的良好的数学品质。
加强与现实生活相联系,从对实际问题的分析中学会利用图形分析、解决问题及用具体的数量来衡量两个变量之间的联系,学习用图形、数据来正确描述两个变量的关系。
明确数学在现实生活中的重要作用和实际价值。
教学中,应多给学生提供自主学习、独立探究、合作交流的机会。
养成严谨的学习态度及实事求是的分析问题、解决问题的科学世界观,并会用所学到的知识来解决实际问题。
三.教学重点、难点教学重点:理解独立性检验的基本思想;独立性检验的步骤。
教学难点;1、理解独立性检验的基本思想;2、了解随机变量K2的含义;3、独立性检验的步骤。
四、教学策略教学方法:诱思探究教学法学习方法:自主探究、观察发现、合作交流、归纳总结。
教学手段:多媒体辅助教学五、教学过程:对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.在现实生活中,分类变量是大量存在的,例如是否吸烟,宗教信仰,国籍,等等.在日常生活中,我们常常关心两个分类变量之间是否有关系.例如,吸烟与患肺癌是否有关系?性别对于是否喜欢数学课程有影响?等等.为调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)表3-7 吸烟与肺癌列联表那么吸烟是否对患肺癌有影响吗?像表3一7 这样列出的两个分类变量的频数表,称为列联表.由吸烟情况和患肺癌情况的列联表可以粗略估计出:在不吸烟者中,有0.54 %患有肺癌;在吸烟者中,有2.28%患有肺癌.因此,直观上可以得到结论:吸烟者和不吸烟者患肺癌的可能性存在差异.与表格相比,三维柱形图和二维条形图能更直观地反映出相关数据的总体状况.图3. 2 一1 是列联表的三维柱形图,从中能清晰地看出各个频数的相对大小.图3.2一2 是叠在一起的二维条形图,其中浅色条高表示不患肺癌的人数,深色条高表示患肺癌的人数.从图中可以看出,吸烟者中患肺癌的比例高于不吸烟者中患肺癌的比例.为了更清晰地表达这个特征,我们还可用如下的等高条形图表示两种情况下患肺癌的比例.如图3.2一3 所示,在等高条形图中,浅色的条高表示不患肺癌的百分比;深色的条高表示患肺癌的百分比.通过分析数据和图形,我们得到的直观印象是“吸烟和患肺癌有关”.那么我们是否能够以一定的把握认为“吸烟与患肺癌有关”呢?为了回答上述问题,我们先假设H0:吸烟与患肺癌没有关系.用A表示不吸烟, B表示不患肺癌,则“吸烟与患肺癌没有关系”独立”,即假设 H0等价于PAB)=P(A)+P(B) .把表3一7中的数字用字母代替,得到如下用字母表示的列联表:表3-8 吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟 a b a+b吸烟 c d c+d总计a+c b+d a+b+c+d在表3一8中,a 恰好为事件AB 发生的频数;a+b 和a+c 恰好分别为事件A 和B 发生的频数.由于频率近似于概率,所以在H 0成立的条件下应该有a ab a cn n n++≈⨯, 其中n a b c d =+++为样本容量, (a+b+c+d)≈(a+b)(a+c) ,即ad ≈bc.因此,|ad-bc|越小,说明吸烟与患肺癌之间关系越弱;|ad -bc|越大,说明吸烟与患肺癌之间关系越强.为了使不同样本容量的数据有统一的评判标准,基于上面的分析,我们构造一个随机变量()()()()()22n ad bc K a b c d a c b d -=++++ (1)其中n a b c d =+++为样本容量.若 H 0 成立,即“吸烟与患肺癌没有关系”,则 K “应该很小.根据表3一7中的数据,利用公式(1)计算得到 K “的观测值为()22996577754942209956.63278172148987491K ⨯-⨯=≈⨯⨯⨯,这个值到底能告诉我们什么呢?统计学家经过研究后发现,在 H 0成立的情况下,2( 6.635)0.01P K ≥≈. (2)(2)式说明,在H 0成立的情况下,2K 的观测值超过 6. 635 的概率非常小,近似为0 . 01,是一个小概率事件.现在2K 的观测值k ≈56.632 ,远远大于6. 635,所以有理由断定H 0不成立,即认为“吸烟与患肺癌有关系”.但这种判断会犯错误,犯错误的概率不会超过0.01,即我们有99%的把握认为“吸烟与患肺癌有关系” .在上述过程中,实际上是借助于随机变量2K 的观测值k 建立了一个判断H 0是否成立的规则:如果k ≥6. 635,就判断H 0不成立,即认为吸烟与患肺癌有关系;否则,就判断H 0成立,即认为吸烟与患肺癌没有关系.在该规则下,把结论“H 0 成立”错判成“H 0 不成立”的概率不会超过2( 6.635)0.01P K ≥≈,即有99%的把握认为从不成立.上面解决问题的想法类似于反证法.要确认是否能以给定的可信程度认为“两个分类变量有关系”,首先假设该结论不成立,即H 0:“两个分类变量没有关系”成立.在该假设下我们所构造的随机变量2K 应该很小.如果由观测数据计算得到的2K 的观测值k 很大,则在一定可信程度上说明H 0不成立,即在一定可信程度上认为“两个分类变量有关系”;如果k 的值很小,则说明由样本观测数据没有发现反对H 0 的充分证据.怎样判断2K 的观测值 k 是大还是小呢?这仅需确定一个正数0k ,当0k k ≥时就认为2K 的观测值k 大.此时相应于0k 的判断规则为:如果0k k ≥,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量之间没有关系”.我们称这样的0k 为一个判断规则的临界值.按照上述规则,把“两个分类变量之间没有关系”错误地判断为“两个分类变量之间有关系”的概率为20()P K k ≥.在实际应用中,我们把0k k ≥解释为有20(1())100%P K k -≥⨯的把握认为“两个分类变量之间有关系”;把0k k <解释为不能以20(1())100%P K k -≥⨯的把握认为“两个分类变量之间有关系”,或者样本观测数据没有提供“两个分类变量之间有关系”的充分证据.上面这种利用随机变量2K 来确定是否能以一定把握认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验.利用上面结论,你能从列表的三维柱形图中看出两个变量是否相关吗?一般地,假设有两个分类变量X 和Y ,它们的可能取值分别为{12,x x }和{12,y y }, 其样本频数列联表(称为2×2列联表)为:表3一 9 2×2列联表若要推断的论述为H l :X 与Y 有关系,可以按如下步骤判断结论H l 成立的可能性:1.通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.① 在三维柱形图中,主对角线上两个柱形高度的乘积ad 与副对角线上的两个柱形高度的乘积bc 相差越大,H 1成立的可能性就越大.② 在二维条形图中,可以估计满足条件X=1x 的个体中具有Y=1y 的个体所占的比例aa b+,也可以估计满足条件X=2x 的个体中具有Y=2y ,的个体所占的比例c c d +.“两个比例的值相差越大,H l 成立的可能性就越大.2.可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是:① 根据实际问题需要的可信程度确定临界值0k ;② 利用公式( 1 ) ,由观测数据计算得到随机变量2K 的观测值k ;③ 如果0k k >,就以20(1())100%P K k -≥⨯的把握认为“X 与Y 有关系”;否则就说样本观测数据没有提供“X 与Y 有关系”的充分证据.在实际应用中,要在获取样本数据之前通过下表确定临界值: 表3一10(四)、举例:例1.在某医院,因为患心脏病而住院的 665 名男性病人中,有 214 人秃顶,而另外 772 名不是因为患心脏病而住院的男性病人中有 175 人秃顶.(1)利用图形判断秃顶与患心脏病是否有关系.(2)能够以 99 %的把握认为秃顶与患心脏病有关系吗?为什么? 解:根据题目所给数据得到如下列联表:(1)相应的三维柱形图如图3.2一4所示.比较来说,底面副对角线上两个柱体高度的乘积要大一些,可以在某种程度上认为“秃顶与患心脏病有关”.(2)根据列联表3一11中的数据,得到21437(214597175451)3891048665772k ⨯⨯-⨯=⨯⨯⨯≈16.373>6 .因此有 99 %的把握认为“秃顶与患心脏病有关” .例2.为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:表3一12 性别与喜欢数学课程列联表喜欢数学课程 不喜欢数学课程 总计 男 37 85 122 女35143 178 总计 72 228300由表中数据计算得2K 的观测值 4.514k ≈.能够以95%的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?请详细阐明得出结论的依据.解:可以有约95%以上的把握认为“性别与喜欢数学课之间有关系”.作出这种判断的依据是独立性检验的基本思想,具体过程如下:分别用a , b , c , d 表示样本中喜欢数学课的男生人数、不喜欢数学课的男生人数、喜欢数学课的女生人数、不喜欢数学课的女生人数.如果性别与是否喜欢数学课有关系,则男生中喜欢数学课的比例aa b+与女生中喜欢数学课的人数比例c c d +应该相差很多,即||||()()a c ad bc abcd a b c d --=++++ 应很大.将上式等号右边的式子乘以常数因子,22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.因此2K 越大,“性别与喜欢数学课之间有关系”成立的可能性越大.另一方面,在假设“性别与喜欢数学课之间没有关系”的前提下,事件A ={2K ≥3. 841}的概率为P (2K ≥3. 841) ≈0.05,因此事件 A 是一个小概率事件.而由样本数据计算得2K 的观测值k=4.514,即小概率事件 A 发生.因此应该断定“性别与喜欢数学课之间有关系”成立,并且这种判断结果出错的可能性约为5 %.所以,约有95 %的把握认为“性别与喜欢数学课之间有关系”.补充例题1:打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得的数据,试问:每一晚都打鼾与患心脏病有关吗?患心脏病 未患心脏病合计 每一晚都打鼾 30 224 254 不打鼾 24 1355 1379 合计 5415791633解:略。