2018版高中数学北师大版选修2-3学案:第三章+2 独立性检验
- 格式:docx
- 大小:594.30 KB
- 文档页数:7
独立性检验两种基本思想的解读与对比一、利用三维柱形图或二维条形图粗略地判断运用三维柱形图和二维条形图可以粗略地判断两个分类变量X与Y是否有关系,利用图形的直观性可以较好地向非专业人士解释所得到的统计分析结果.但需要注意的是:①运用两种图形法判断两个分类变量是否有关系时,作图一定要规范;②由于这两种方法无法精确地给出所得结论的可靠程度,因而只做粗略统计,而不做具体运算.例1.为考查某种药物预防疾病的效果,进行动物试验,得到如下的列联表:未患病患病总计服用药45 10 55没有服用药30 20 50总计75 30 105试用三维柱形图分析服用药和患病之间是否有关系?解:根据列联表所给的数据作出三维柱形图,如图1所示.比较说来,底面主对角线上两个柱体高度的乘积要大的多,可以在很大程度上认为“患病与是否服用药有关”.例2.在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,试用二维条形图判断色盲与性别是否有关系?解:根据题中已知数据作出如下的列联表:色盲未患色盲总计男38 442 480女 6 514 520总计44 956 1000根据列联表作出相应的二维条形图,如图2所示.从二维条形图来看,在男人中患色盲的比例38 480,要比在女人中患色盲的比例6520大,因而我们可以在很大程度上认为患色盲与性别是有关的.二、独立性检验独立性检验是用来考查两个分类变量是否具有相关关系,并且能较精确地给出这种判断的可靠程度的一种统计方法,利用这一方法,可以直接用2K的值解决实际问题.这里需特别说明的是:2K与k的关系并不是2k K=,2K是一个随机变量,它在a b c d,,,取不同的值时,2K可能不同;而k是2K的观测值,是取定一组数a、b、c、d后的一个确定的值.例3.运动员参加比赛前往往做热身运动,下表是一体育运动的研究机构对160位专业运动员追踪而得的数据,试问:由此数据,你认为运动员受伤与不做热身运动有关吗?解:由22()()()()()n ad bcKa c abcd b d-=++++2160(19207645)38.97495656496⨯⨯-⨯=≈⨯⨯⨯.因为38.974>7.879,所以有99.5%的把握说,运动员受伤与不做热身运动有关.针对训练1.研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的22名,否定受伤不受伤合计做热身19 76 95不做热身45 20 65合计64 96 160的38名;男生110名在相同的项目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?分别用图形和独立性检验的方法判断.2.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表;(2)判断性别与休闲方式是否有关系?参考答案1、解析:根据题目所给数据建立如下列联表:性别与态度的关系列联表肯定否定总计男生22 88 110女生22 38 60总计44 126 170相应的三维柱形图如图所示,比较来说,底面副对角线上两个柱体高度的乘积要大一些,因此可以在某种程度上认为“性别与态度有关”.根据列联表中的数据得到22170(22382288)5.622 5.0241106044126K⨯⨯-⨯=≈>⨯⨯⨯.所以有97.5%的把握认为“性别与态度有关”.2、解析:(1)依据题意“性别与休闲方式”2×2列联表为:看电视运动总计女43 27 70男21 33 54总计64 60 124(2)假设“休闲方式与性别无关”,计算22124(43332721)6.201 5.02470546460K⨯⨯-⨯=≈>⨯⨯⨯.所以有理由认为假设“休闲方式与性别无关”是不合理的,即有97.5%的把握认为“休闲方式与性别有关”.。
生活中的独立性检验独立性检验在实际生活中有广泛的应用,解决该类问题的关键是熟记公式,准确的运算。
独立性检验的基本步骤为: (1)找相关数据,作列联表;(2)求2K 2()()()()()n ad bc a b c d a c b d -=++++的值;(3)判断可能性.随机变量2K 的值越大,说明“X与Y 有关系”成立的可能性越大.例1某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取189名员工进行调查,所得数据如下表所示:对于人力资源部的研究项目,根据上述数据能得出什么结论?解:由题目中表的数据可知:a=64,b=40,c=32,d=63,a+b=94,c+d=95,a+c=86,b+d=103,n=189.代入公式得K 2=≈⨯⨯⨯⨯-⨯⨯=++++-103869594)32406354(189))()()(()(22d b d c b a c a bc ad n 10.759,因为10.759>7.879,所以有99.5%的把握说:员工“工作积极性”和“积极支持企业改革”是有关的,可以认为企业的全体员工对待企业改革态度和工作积极性是有关的。
点评:首先由已知条件确定a 、b 、c 、d 、n 的数值,再利用公式求出K 2的观测值,最后与6.635比较再下结论。
例2 考察黄烟经过培养液处理与否跟发生青花病的关系,调查了457株黄烟,得到下表中的数据,请根据数据作统计分析。
培养液处理 未处理 合计 青花病 25 210 235 无青花病 80 142 222 合计105352457解析:根据公式得()22457251428021041.61235222105352K ⨯⨯-⨯=≈⨯⨯⨯由于41.6110.828>,说明黄烟经过培养液处理与否跟发生青花病是有关系的。
点评:计算2K的值与临界值的大小进行比较即可。
例3.为了研究色盲与性别的关系,调查了1000人,调查结果如下表所示:根据上述数据,试问色盲与性别是否是相互独立的?解析:由已知条件可得下表依据公式得()22100044263851427.13995644480520K⨯⨯-⨯=≈⨯⨯⨯。
§2独立性检验2.1独立性检验2.2独立性检验的基本思想2.3独立性检验的应用1.了解独立性检验的基本思想方法.(重点)2.了解独立性检验的初步应用.(难点)[基础·初探]教材整理1独立性检验阅读教材P87~P89,完成下列问题.设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=A1;变量B:B1,B2=B1,有下面2×2列联表:AB1B2总计BA1 a b a+bA2 c d c+d总计a+c b+d n=a+b+c+d 其中,a表示变量A取A1,且变量B取B1时的数据;b表示变量A取A1,且变量B取B2时的数据;c表示变量A取A2,且变量B取B1时的数据;d表示变量A取A2,且变量B取B2时的数据.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:文艺节目新闻节目总计20至40岁401858大于40岁152742总计5545100填“是”或“否”).【解析】因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即ba+b =1858,dc+d=2742,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄是有关的.【答案】是教材整理2独立性检验的基本思想阅读教材P90~P91“练习”以上部分,完成下列问题.在2×2列联表中,令χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).当数据量较大时,在统计中,用以下结果对变量的独立性进行判断.(1)当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;(2)当χ2>2.706时,有90%的把握判定变量A,B有关联;(3)当χ2>3.841时,有95%的把握判定变量A,B有关联;(4)当χ2>6.635时,有99%的把握判定变量A,B有关联.对分类变量X与Y的统计量χ2的值说法正确的是() 【导学号:62690055】A.χ2越大,“X与Y有关系”的把握性越小B.χ2越小,“X与Y有关系”的把握性越小C.χ2越接近于0,“X与Y无关系”的把握性越小D.χ2越接近于0,“X与Y无关系”的把握性越大【解析】χ2越大,X与Y越不独立,所以关联越大;相反,χ2越小,关联越小.【答案】 B[质疑·手记]预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流:疑问1:解惑:疑问2:解惑:疑问3:解惑:[小组合作型]2×2列联表在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用aa+b与cc+d判断二者是否有关系.【精彩点拨】对变量进行分类→求出分类变量的不同取值→作出2×2列联表→计算aa+b与cc+d的值作出判断【自主解答】2×2列联表如下:年龄在六十岁以上年龄在六十岁以下总计饮食以蔬菜为主432164 饮食以肉类为主273360 总计7054124将表中数据代入公式得aa+b =4364=0.671 875.c c+d =2760=0.45.显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.1.作2×2列联表时,关键是对涉及的变量分清类别.注意应该是4行4列,计算时要准确无误.2.利用2×2列联表分析两变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将aa+b 与cc+d⎝⎛⎭⎪⎫或ba+b与dc+d的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.[再练一题]1.在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.【解】作列联表如下:喜欢甜食情况性别喜欢甜食不喜欢甜食总计男117413530女492178670总计609591 1 200独立性检验记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:能否在犯错误的概率不超过1%的前提下认为该种血清能起到预防感冒的作用.未感冒感冒总计使用血清258242500未使用血清216284500合计474526 1 000 【精彩点拨】独立性检验可以通过2×2列联表计算χ2值对照作出判断.【自主解答】假设感冒与是否使用该种血清没有关系.由列联表中的数据,求得χ2=1 000×(258×284-242×216)2474×526×500×500≈7.075.χ2=7.075≥6.635,查表得P(χ2≥6.635)=0.01,故我们在犯错误的概率不超过1%的前提下,即有99%的把握认为该种血清能起到预防感冒的作用.1.熟练掌握χ2统计量的数值计算,根据计算得出χ2值,对比三个临界值2.706,3.841和6.635,作出统计推断.2.独立性检验的一般步骤: (1)根据样本数据列2×2列联表;(2)计算χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )的值;(3)将χ2的值与临界值进行比较,若χ2大于临界值,则认为X 与Y 有关,否则没有充分的理由说明这个假设不成立.[再练一题]2.“十一”黄金周前某地的一旅游景点票价上浮,黄金周过后,统计本地与外地来的游客人数,与去年同期相比,结果如下:本地 外地 总计 去年 1 407 2 842 4 249 今年 1 331 2 065 3 396 总计2 7384 9077 645地区有关系?【解】 按照独立性检验的基本步骤,假设票价上浮后游客人数与所处地区没有关系.因为χ2=7 645×(1 407×2 065-2 842×1 331)24 249×3 396×2 738×4 907≈30.35>6.635.所以在犯错误的概率不超过0.01的前提下认为票价上浮后游客人数与所处地区有关系.[探究共研型]独立性检验的综合应用探究12有关?【提示】由临界值表可知当χ2>3.841时,我们有95%的把握认为事件A 与B有关.探究2在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.我们是否可以判定100个心脏病患者中一定有打鼾的人?【提示】这是独立性检验,在犯错误的概率不超过0.01的前提下认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知100个心脏病患者中可能一个打鼾的人都没有.为了解某市创建文明城市过程中,学生对创建工作的满意情况,相关部门对某中学的100名学生进行调查,其中有50名男生对创建工作表示满意,有15名女生对创建工作表示不满意.已知在全部100名学生中随机抽取1人,其对创建工作表示满意的概率为45.是否有充足的证据说明,学生对创建工作的满意情况与性别有关?【精彩点拨】解决本题首先根据对工作满意的概率,确定对工作满意的男女生人数,再画出2×2列联表,最后根据2×2列联表计算χ2,并进行判断.【自主解答】由题意得2×2列联表如下:满意不满意总计男生50555女生301545总计8020100χ2=100×(50×15-30×5)280×20×55×45≈9.091>6.635,∴我们有99%的把握认为学生对创建工作的满意情况与性别有关.1.独立性检验的基本思想是要确认两个变量有关系这一结论成立的可信程度,首先假设结论“两个变量没有关系”成立,在该假设下我们构造的统计量χ2应该很小,如果用观测数据计算的统计量χ2很大,则在一定程度上说明假设不合理.由χ2与临界值的大小关系,作出判断.2.独立性检验仍然属于用样本估计总体,由于样本抽取具有随机性,因而作出的推断可能正确,也可能错误,有95%(或99%)的把握认为事件A 与B 有关,则推断结论为错误的可能性仅为5%(或1%).[再练一题]3.有两个变量x 与y ,其一组观测值如下2×2列联表所示:yxy 1 y 2 x 1 a 20-a x 215-a30+a其中a,15x 与y 之间有关系?【解】 由题意χ2=65[a (30+a )-(20-a )(15-a )]220×45×15×50=65(65a -300)220×45×15×50=13(13a -60)25 400.∵有95%的把握认为x 与y 之间有关系,∴χ2>3.841,∴13(13a -60)25 400>3.841,∴a >7.7或a <1.5.又a >5,15-a >5,∴7.7<a <10. 又a ∈N , ∴a =8或a =9.[构建·体系]1.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )A .平均数与方差B .回归分析C .独立性检验D .概率【解析】 判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.【答案】 C2.(2016·长沙高二检测)为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算χ2=8.01,则认为“喜欢乡村音乐与性别有关系”的把握性约为( )χ2 0.100 0.050 0.025 0.010 0.001 k 0 2.7063.8415.0246.63510.828C .99%D .99.9%【解析】因为χ2>6.635,所以有99%以上的把握认为“喜欢乡村音乐与性别有关系”.【答案】 C3.在2×2列联表中,两个比值aa+b与________相差越大,两个分类变量有关系的可能性越大.【解析】根据2×2列联表可知,比值aa+b与cc+d相差越大,则|ad-bc|就越大,那么两个分类变量有关系的可能性就越大.【答案】c c+d4.以下关于独立性检验的说法中,正确的是________.(填序号)①独立性检验依据小概率原理;②独立性检验得到的结论一定正确;③样本不同,独立性检验的结论可能有差异;④独立性检验不是判断两分类变量是否相关的唯一方法.【导学号:62690056】【解析】独立性检验得到的结论不一定正确,故②错,①③④正确.【答案】①③④5.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:的饮食习惯方面有差异”.【解】将2×2列联表中的数据代入公式计算,得χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100×(60×10-20×10)270×30×80×20=10021≈4.762.因为4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.我还有这些不足:(1)(2)我的课下提升方案:(1)(2)学业分层测评(建议用时:45分钟)[学业达标]一、选择题1.有两个分类变量X与Y的一组数据,由其列联表计算得χ2≈4.523,则认为“X与Y有关系”犯错误的概率为()A.95%B.90%C.5%D.10%【解析】χ2≈4.523>3.841.这表明认为“X与Y有关系”是错误的可能性约为0.05,即认为“X与Y有关系”犯错误的概率为5%.【答案】 C2.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女患色盲的频率分别为0.038,0.006B .男、女患色盲的概率分别为19240,3260C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关【解析】 男人中患色盲的比例为38480,要比女人中患色盲的比例6520大,其差值为⎪⎪⎪⎪⎪⎪38480-6520≈0.067 6,差值较大.【答案】 C3.为了探究中学生的学习成绩是否与学习时间长短有关,在调查的500名学习时间较长的中学生中有39名学习成绩比较好,500名学习时间较短的中学生中有6名学习成绩比较好,那么你认为中学生的学习成绩与学习时间长短有关的把握为( )A .0B .95%C .99%D .都不正确【解析】 计算出χ2与两个临界值比较,χ2=1 000×(39×494-6×461)245×955×500×500≈25.340 3>6.635.所以有99%的把握说中学生的学习成绩与学习时间长短有关,故选C. 【答案】 C4.某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,有________的把握认为糖尿病患者与遗传有关系.( )【导学号:62690057】A .99.9%B .99.5%C .99%D .97.5%【解析】 可以先作出如下列联表(单位:人):糖尿病患者与遗传列联表χ2=366×(16×240-17×93)2109×257×33×333≈6.067>5.024.故我们有97.5%的把握认为糖尿病患者与遗传有关系. 【答案】 D5.假设有两个分类变量X 与Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:( )A .a =5,b =4,c =3,d =2B .a =5,b =3,c =4,d =2C .a =2,b =3,c =4,d =5D .a =2,b =3,c =5,d =4 【解析】 比较⎪⎪⎪⎪⎪⎪aa +b -c c +d . 选项A 中,⎪⎪⎪⎪⎪⎪59-35=245;选项B 中,⎪⎪⎪⎪⎪⎪58-46=124;选项C 中,⎪⎪⎪⎪⎪⎪25-49=245;选项D 中,⎪⎪⎪⎪⎪⎪25-59=745.故选D.【答案】 D 二、填空题6.调查者通过随机询问72名男女中学生喜欢文科还是理科,得到如下列联表(单位:名)性别与喜欢文科还是理科列联表) 【解析】 通过计算χ2=72×(16×8-28×20)236×36×44×28≈8.42>7.879.故我们有99.5%的把握认为中学生的性别和喜欢文科还是理科有关系. 【答案】 有7.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:χ2=50×(13×20-10×7)223×27×20×30≈4.844,因为χ2≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________.【解析】 ∵χ2>3.841,所以有95%的把握认为主修统计专业与性别有关,出错的可能性为5%.【答案】 5%8.在吸烟与患肺病是否相关的判断中,有下面的说法:①若统计量χ2>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.(填序号)【解析】 统计量χ2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①错误;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.【答案】 ③ 三、解答题9.在一次天气恶劣的飞行航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.请你根据所给数据判定:在天气恶劣的飞行航程中,男乘客是否比女乘客更容易晕机?【解】 根据题意,列出2×2列联表如下:由公式可得χ2=89×(24×26-31×8)255×34×32×57≈3.689>2.706,故我们有90%的把握认为“在天气恶劣的飞行航程中,男乘客比女乘客更容易晕机”.10.(2016·郑州模拟)有甲乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下的列联表.已知在全部105人中随机抽取1人为优秀的概率为27.(1)请完成上面的列联表;(2)根据列联表的数据,若按95%的可靠性要求,能否认为“成绩与班级有关系”?(3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到6或10号的概率.参考公式:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )【解】(2)根据列联表中的数据,得到χ2=105×(10×30-20×45)255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”.(3)设“抽到6或10号”为事件A ,先后两次抛掷一枚均匀的骰子,出现的点数为(x,y).所有的基本事件有(1,1),(1,2),(1,3),…,(6,6),共36个.事件A包含的基本事件有:(1,5),(2,4),(3,3),(4,2),(5,1),(4,6),(5,5),(6,4),共8个,∴P(A)=836=29.[能力提升]1.硕士学位与博士学位的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表所示:A.性别与获取学位类别有关B.性别与获取学位类别无关C.性别决定获取学位的类别D.以上都是错误的【解析】由列联表可得χ2=340(162×8-143×27)2305×35×189×151≈7.34>6.635,所以有99%的把握认为性别与获取学位的类别有关.【答案】 A2.某班主任对全班50名学生进行了作业量的调查,数据如下表:过()A.0.01B.0.025C.0.10 D.0.05【解析】χ2=50×(18×15-8×9)226×24×27×23≈5.059>5.024,因为P(χ2>5.024)=0.025,所以这种推断犯错误的概率不超过0.025.【答案】 B3.某研究小组为了研究中学生的身体发育情况,在某中学随机抽出20名15至16周岁的男生将他们的身高和体重制成2×2列联表,根据列联表中的数据,可以在犯错误的概率不超过________的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.【解析】根据公式χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)得,χ2=20×(4×12-1×3)25×15×7×13≈5.934,因为χ2>5.024,因此在犯错误的概率不超过0.025的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.【答案】0.0254.(2016·延安二检)为了研究“教学方式”对教学质量的影响,某高中数学老师分别用两种不同的教学方式对入学数学平均分数和优秀率都相同的甲、乙两个高一新班进行教学(勤奋程度和自觉性都一样).以下茎叶图3-2-1为甲、乙两班(每班均为20人)学生的数学期末考试成绩.图3-2-1(1)现从甲班数学成绩不低于80分的同学中随机抽取两名同学,求成绩为87分的同学至少有一名被抽中的概率;(2)学校规定:成绩不低于75分的为优秀.请填写下面的2×2列联表,并判断有多大把握认为“成绩优秀与教学方式有关”.甲班乙班总计优秀不优秀总计P(χ2≥x0)0.150.100.050.0250.0100.0050.001x0 2.072 2.706 3.841 5.024 6.6357.87910.828(参考公式:χ2=(a+b)(c+d)(a+c)(b+d))【解】(1)记成绩为87分的同学为A,B,其他不低于80分的同学为C,D,E,“从甲班数学成绩不低于80分的同学中随机抽取两名同学”的一切可能结果组成的基本事件有(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),(C,D),(C,E),(D,E),共10个.“至少有一个87分的同学被抽到”所组成的基本事件有(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),共7个,所以P=7 10.(2)χ2=40×(6×6-14×14)220×20×20×20=6.4>5.024,因此,我们有97.5%的把握认为成绩优秀与教学方式有关.。
学习目标 1.了解2×2列联表的意义.2.了解统计量χ2的意义.3.通过对典型案例分析,了解独立性检验的基本思想和方法.知识点一2×2列联表思考山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表:如何判定“喜欢体育还是文娱与性别是否有联系”?梳理(1)2×2列联表的定义对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B;Ⅱ也有两类取值,即类1和类2.我们得到如下列联表所示的抽样数据:(2)χ2统计量的求法公式χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).知识点二独立性检验独立性检验的概念用χ2统计量研究两变量是否有关的方法称为独立性检验.知识点三独立性检验的步骤1.独立性检验的步骤要判断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:(1)提出假设H0:__________________;(2)根据2×2列联表及χ2公式,计算________的值;(3)查对临界值,作出判断.其中临界值如表所示:表示在H0成立的情况下,事件“_____________________________________”发生的概率.2.推断依据(1)若χ2>10.828,则有99.9%的把握认为“Ⅰ与Ⅱ有关系”.(2)若χ2>6.635,那么有99%的把握认为“Ⅰ与Ⅱ有关系”.(3)若χ2>2.706,那么有90%的把握认为“Ⅰ与Ⅱ有关系”.(4)若χ2≤2.706,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“H0成立”,即Ⅰ与Ⅱ没有关系.类型一2×2列联表例1在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.反思与感悟分清类别是列联表的作表关键步骤.表中排成两行两列的数据是调查得来的结果.跟踪训练1(1)下面是2×2列联表:则表中a,b的值分别为(2)某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中有213名在考前心情紧张.作出2×2列联表.类型二由χ2进行独立性检验例2对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示.试根据上述数据比较这两种手术对病人又发作过心脏病的影响有没有差别.反思与感悟独立性检验的关注点在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.跟踪训练2某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.(1)根据以上数据建立一个2×2列联表;(2)判断是否有99%的把握说明对新课程教学模式的赞同情况与教师年龄有关系.类型三独立性检验的综合应用例3电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,并根据调查结果绘制了观众日均收看该体育节目时间的频率分布直方图如图.将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,并据此资料推断“体育迷”与性别是否有关?(2)将上述调查所得的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的概率分布,均值E(X)和方差V(X).附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).反思与感悟独立性检验的步骤第一步,假设两个分类变量X与Y无关系;第二步,找相关数据,列出2×2列联表;第三步,由公式χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(其中n=a+b+c+d)计算出χ2的值;第四步,将χ2的值与临界值进行比较,进而作出统计推断.这些临界值,在高考题中常会附在题后,应适时采用.跟踪训练3某地区甲校高二年级有1 100人,乙校高二年级有900人,为了统计两个学校高二年级在学业水平考试中的数学学科成绩,采用分层抽样的方法在两校共抽取了200名学生的数学成绩,如下表:(已知本次测试合格线是50分,两校合格率均为100%)甲校高二年级数学成绩:乙校高二年级数学成绩:(1)计算x,y的值,并分别估计以上两所学校数学成绩的平均分;(精确到1分)(2)若数学成绩不低于80分为优秀,低于80分为非优秀,根据以上统计数据填写下面2×2列联表,并回答能否在犯错误的概率不超过0.05的前提下认为“两个学校的数学成绩有差异”?1.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(填有关,无关)2.为了考察长头发与女性头晕是否有关系,随机抽查301名女性,得到如下所示的列联表,试根据表格中已有数据填空.则空格中的数据分别为:①________;②________;③________;④________. 3.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是________.(填序号) ①若χ2>6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③若从χ2与临界值的比较中得出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.4.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据如表:根据表中数据得到χ2=775×(20×450-5×300)225×750×320×455≈15.968,因为χ2>6.635,则断定秃发与心脏病有关系,那么这种判断出错的可能性为________. 5.根据下表计算:χ2≈________.(保留3位小数)1.列联表列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有相关关系.2.对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算统计量χ2的值,如果χ2的值很大,说明假设不合理.χ2越大,两个分类变量有关系的可能性越大.答案精析问题导学 知识点一思考 可通过表格与图形进行直观分析,也可通过统计分析定量判断. 梳理 (1)a +b c +d a +c b +d 知识点三1.(1)Ⅰ与Ⅱ没有关系 (2)χ2 (3)χ2≥x 0 题型探究例1 解 作列联表如下:跟踪训练1 (1)52 解析 ∵a +21=73,∴a =52. 又∵a +2=b ,∴b =54. (2)解 作列联表如下:例2 解 假设病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术没有关系,由表中数据得a =39,b =157,c =29,d =167,a +b =196,c +d =196,a +c =68,b +d =324,n =392, 由公式得χ2=392×(39×167-157×29)2196×196×68×324≈1.779.因为χ2≈1.779<2.706,所以不能得出病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术有关系的结论,即这两种手术对病人又发作过心脏病的影响没有差别. 跟踪训练2 解 (1)2×2列联表如下所示:(2)假设“对新课程教学模式的赞同情况与教师年龄无关”. 由公式得χ2=50×(10×6-24×10)234×16×20×30≈4.963<6.635,所以没有99%的把握认为对新课程教学模式的赞同情况与教师年龄有关.例3 解 (1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:将2×2得χ2=100×(30×10-45×15)275×25×45×55=10033≈3.030.因为2.706<3.030<3.841,所以在犯错误的概率不超过0.10的前提下认为“体育迷”与性别有关.(2)由频率分布直方图知,抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为14.由题意知,X ~B (3,14),从而X 的概率分布为故E (X )=np =3×14=34,V (X )=np (1-p )=3×14×34=916.跟踪训练3 解 (1)依题意知,甲校应抽取110人,乙校应抽取90人, ∴x =10,y =15,估计两个学校的平均分,甲校的平均分为55×10+65×25+75×35+85×30+95×10110≈75.乙校的平均分为55×15+65×30+75×25+85×15+95×590≈71.(2)数学成绩不低于80分为优秀,低于80分为非优秀,得到2×2列联表如下:χ2=200×(40×70-20×70)260×140×110×90≈4.714, 又4.714>3.841,故能在犯错误的概率不超过0.05的前提下认为“两个学校的数学成绩有差异”.当堂训练1.有关 2.86 180 229 301 3.③4.0.01 5.4.514。
第三章 §2一、选择题1.独立性检验显示:有90%的把握认为性别与是否喜爱喝酒有关,那么下列说法中正确的是( )A .在100个男性中约有90个人爱喝酒B .若某人爱喝酒,那么此人为男性的可能性为90%C .判断出错的可能性为10%D .有90%的把握认为10个男性中有9个人爱喝酒 [答案] C2.提出统计假设H 0,计算出χ2的值,即拒绝H 0的是( ) A .χ2=6.635 B .χ2=2.63 C .χ2=0.725 D .χ2=1.832[答案] A[解析] 依据独立性检验的思想及其结论的应用,应选A.3.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )算得,K 2=110×(40×30-20×20)260×50×60×50≈7.8.附表:A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关” [答案] C[解析] 根据独立性检验的思想方法,正确选项为C. 二、填空题4.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是____________________________________.[答案] 男正教授人数,副教授人数;女正教授人数,副教授人数.5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表.能以________的把握认为婴儿的性别与出生时间有关系.[答案] 90%[解析] 由列联表可以看出a =24,b =31,c =8,d =26,a +b =55,c +d =34,a +c =32,b +d =57,n =a +b +c +d =89,代入公式χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )得χ2=89×(24×26-31×8)255×34×32×57≈3.689,由于χ2≈3.689>2.706,∴我们有90%的把握认为婴儿的性别与出生时间有关系. 三、解答题6.为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人的调查结果如下:[分析] 先计算χ2的数值,然后比较χ2与3.841及6.635的大小,进而得出是否有关的结论.[解析] 由公式得χ2=540(60×200-260×20)2320×220×80×460=540(12 000-5 200)22 590 720 000=2 496 960259 072≈9.638.∴9.638>6.635,∴有99%的把握说40岁以上的人患胃病与生活是否有规律有关,即生活不规律的人易患胃病.[点评]本题利用χ2公式计算出χ2的值,再利用临界性的大小关系来判断假设是否成立,解题时应注意准确代数与计算,不可错用公式,要准确进行比较与判断.一、选择题1.(2014·江西理,6)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()A.成绩B.视力C.智商D.阅读量[答案] D[解析]根据χ2计算公式可知,阅读量与性别相关数据较大,所以选D.2.在一次独立性检验中,其把握性超过99%,则随机变量χ2的一个可能的值为() A.6.635 B.5.024C.7.897 D.3.841[答案] C[解析]若有99%把握,则χ2>6.635,只有C满足条件.3.分类变量X和Y的列联表如下,则()A.ad-bcB.ad-bc越大,说明X与Y的关系越强C .(ad -bc )2越大,说明X 与Y 的关系越强D .(ad -bc )2越接近于0,说明X 与Y 的关系越强 [答案] C[解析] 由统计量χ2的计算公式计算χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )可知(ad -bc )2越大,则计算出的统计量的值也越大,而统计量越大,说明(ad -bc )2越大,故选C.4.根据下面的列联表判断患肝病与嗜酒有关系的把握有( )A.90% C .97.5% D .99.9%[答案] D[解析] 由K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )得其观测值k =9 965×(7 775×49-2 099×42)27 817×2 148×9 874×91≈56.632>10.828.故有99.9%的把握认为患肝病与嗜酒有关系,答案选D.5.为了研究性格和血型的关系,抽查80人实验,血型和性格情况如下:O 型或A 型者是内向型的有18人,外向型的有22人,B 型或AB 型是内向型的有12人,是外向型的有28人,则有多大的把握认为性格与血型有关系( )A.99.9% B .99%C .没有充分的证据显示有关D .1% [答案] C [解析]χ2=n (n 11n 22-12n 21)50×30×40×40=80×(22×12-28×18)50×30×40×40≈1.92<2.706,∴没有充分的证据显示有关.二、填空题6.在一次打鼾与患心脏病的调查中,共调查了1671人,经过计算得χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是____________的.填(“有关”或“无关”)[答案] 有关[解析] ∵27.63>6.635∴打鼾与患心脏病有关的可能性很大,我们可以有99%的把握这么认为.7.为了了解小学生是否喜欢吃零食与性别之间的关系,调查者随机调查了89名小学生的情况,得到的数据如下表(单位:人):[答案] 3.689[解析] χ2=89×(24×26-31×8)255×34×32×57≈3.689.三、解答题8.在某医院,因为患心脏病而住院的655名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中,有175人秃顶.根据以上数据判断男性病人的秃顶是否与患心脏病有关.[解析] 问题是判断男性病人的秃顶是否与患心脏病有关.计算得到下表(单位:人)由公式计算得χ2=1437×(214×597-175×451)389×1048×665×772≈16.373.因为16.373>6.635,所以有99%以上的把握认为男性病人的秃顶与患心脏病有关.9.为检验回答一个问题的对错是否和性别有关,有人作了一个调查,其中女生人数是男生人数的12,男生答对人数占男生人数的56,女生答错人数占女生人数的23.(1)若有99%的把握认为回答结果的对错和性别有关,则男生至少有多少人? (2)若没有充分的证据显示回答结果的对错和性别有关,则男生至多有多少人? [分析] 若有99%的把握认为回答结果的对错和性别有关,说明χ2>6.635;没有充分的证据显示回答结果的对错和性别有关,说明χ2≤2.706.设出男生人数,并且它分别表示各类别人数,代入χ2的计算公式,建立不等式求解即可.[解析] 设男生人数为x ,依题意可得2×2列联表如下:(1)若有99%, 由χ2=3x 2·(5x 6·x 3-x 6·x 6)2x ·x 2·x 2·x =3x 8>6.635,解得x >17.693.因为x 2,x 6,x3为整数,所以若有99%的把握认为回答结果的对错和性别有关,则男生至少有18人.(2)没有充分的证据显示回答结果的对错和性别有关,则χ2≤3.841. 由χ2=3x 2·(5x 6·x 3-x 6·x 6)2x ·x 2·x 2·x =3x8≤2.706,解得x ≤7.216.因为x 2,x 3,x6为整数,所以若没有充分的证据显示回答结果的对错和性别有关,则男生至多有6人.[点评] 本题是逆向型思维问题,即将根据已知数据判断相关性问题变式为了一道由已知相关性求表中的字母数据问题,同时也是一个独立性检验和不等式的综合问题,解答时要注意理解“至少”“至多”的含义,充分建立不等式(组)来解决.10.为了比较注射A ,B 两种药物后产生的皮肤疱疹的面积,选200只家兔做实验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A ,另一组注射药物B .(1)甲、乙是200只家兔中的2只,求甲、乙分在不同组的概率;(2)下表1和表2分别是注射药物A和B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表②完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.表3:附:χ2=n(ad-bc)(a+b)(c+d)(a+c)(b+d)[解析]2×2列联表等统计学知识.解题思路是(1)古典概型的概率公式的应用,需用到组合数公式.(2)绘制频率分布直方图,并从图中观察出中位数进行比较,(3)从频率分布表中读取数值填制2×2列联表并计算χ2与临界值比较,说明是否有关.解:(1)甲、乙两只家兔分在不同组的概率为p =2C 99198C 100200=100199.(2)①可以看出注射药物A 后的疱疹面积的中位数在65至70之间,而注射药物B 后的疱疹面积的中位数在70至75之间,所以注射药物A 后疱疹面积的中位数小于注射药物B 后疱疹面积的中位数.②表3:χ2=200×(70×65-35×30)100×100×105×95≈24.56,由于χ2>10.828,所以有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.[点评] 本题比较新颖,将统计学与古典概型、组合联系在一起,难度不大,但考查知识全面,而且还需要一定的识图表能力,是今年命题一热点方向.。
知识改变命运,学习成就未来程度,首先假设该结的思想方法和反证法类似,不同之处受原假设的结论相找到矛盾.北师大版高中数学选修2-3:3.2独立性检验22.2 独立性检验 2.3 独立性检验的基本思想 2.4 独立性检验的应用【学习目标】1.了解独立性检验的基本思想方法.2.会利用2×2列联表解决实际问题.3.了解独立性检验的简单应用.一、条件概率是指在事件A发生的条件下,事件B发生的概率,P(B|A)=P(AB)P(A).特别地,如果P(B|A)=P(B),从而P(AB)=,则称A,B设A,B为两个变量,每一个变量都可以取,变量A:A1,A2=A1;=B通过观察得到下表所示数据:BA B1B2总计A1 a b a+bA2 c d c+d总计a+c b+d n=a+b+c+d并将形如此表的表格称为2×2列联表.是否独立的问题叫.=n(ad-bc)(a+b)(c+d)(a+c)(b+d).独立性判断的方法χ2的范围独立性判断χ2≤2.706没有关联χ2>2.70690%的把握判定A、B有关联χ2>3.84195%的把握判定A、B有关联χ2>6.63599%的把握判定A、B有关联统计的基本思维模式是归纳,它的特征之一是通过部分数据的性质来推测全部数据的性质,因此,统计推断是可能犯错误的,即从数据上体现的只列2×2列联表―→根据求随机变量值―→分析结论【解】事件独立性检验某大型企业人力资源部为了研究本企业员工工作积工作积极性对待企业改革的态度积极支持不太赞成工作积极5440工作一般3263总计86103是否又发作手术类别又发作过未发作过总计心脏搭桥手术39157196血管清障手术29167196总计68324392①若统计量χ>6.635,我们有99%的把握说吸烟与患肺病②若从统计中求出,有99%的把握说吸烟与患肺病有关,烟者中必有99个人患有肺病;取两个变量,且每一×2列联表yxy1y2总计x1 a 2173x2202545总计 b 462.在2×2列联表中,两个变量的取值a,b,c,d应是() 抽查了3000人,计算发现χ2=6.023,则根据这一数据查阅下表作业情况。
2 独立性检验学习目标 1.理解2×2列联表,并会依据列联表判断两个变量是否独立.2.理解统计量χ2的意义和独立性检验的基本思想.知识点一2×2列联表思考某教育行政部门大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表:如何判定“喜欢体育还是文娱与性别是否有联系”?梳理设A、B为两个变量,每一变量都可以取两个值,得到表格.其中,a表示变量A取 ________,且变量B取 ________时的数据,b表示变量A取 ________,且变量B取 ________时的数据;c表示变量A取 ________,且变量B取 ________时的数据;d表示变量A取 ________,且变量B取 ________时的数据.上表在统计中称为2×2列联表.知识点二统计量χ2=________________________.(其中n=a+b+c+d为样本容量)知识点三独立性检验当χ2≤2.706时,没有充分的证据判定变量A,B________;当χ2>2.706时,有__________的把握判定变量A,B有关联;当χ2>3.841时,有__________的把握判定变量A,B有关联;当χ2>6.635时,有__________的把握判定变量A,B有关联.类型一2×2列联表和统计量χ2例1 某企业为了更好地了解设备改造与生产合格品的关系,随机抽取了180件产品进行分析,其中设备改造前生产的合格品有36件,不合格品有49件;设备改造后生产的合格品有65件,不合格品有30件,请根据数据,列出2×2列联表,并说明可以用本列表研究什么问题?反思与感悟2×2列联表将文字语言转换为图表语言,使问题更为清晰,可为进一步研究问题作充分的准备.跟踪训练1 已知药物效果与动物试验列联表如下所示:则χ2≈________.(结果保留3位小数)类型二独立性检验的方法例2 研究人员选取170名青年男、女大学生作为样本,对他们进行一种心理测验,发现有60名女生对该心理测验中的最后一个题目的反应是:肯定的有22名,否定的有38名;男生110名在相同的题目上肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?用独立性检验的方法判断.反思与感悟独立性检验可以通过2×2列联表计算χ2的值,然后和临界值对照作出判断.跟踪训练2 为了研究人的性别与患色盲是否有关系,某研究所进行了随机调查,发现在调查的480名男性中有39名患有色盲,520名女性中有6名患有色盲,试问人的性别与患色盲有关系吗?1.当χ2>3.841时,认为事件A与事件B( )A.有95%的把握有关B.有99%的把握有关C.没有理由说它们有关D.不确定2.为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校中学生中随机抽取了300名学生,得到如下列联表:你认为性别与是否喜欢数学课程之间有关系的把握有( )A.0 B.95% C.99% D.100%3.某大学在研究性别与职称(分正教授、副教授)之间是否有关系时,你认为应该收集哪些数据?4.2014年世界杯期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为35,则有超过________的把握认为年龄与西班牙队的被喜欢程度有关.5.某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.(1)根据以上数据建立一个2×2列联表;(2)判断是否有99%的把握说明对新课程教学模式的赞同情况与教师年龄有关系.1.独立性检验的思想:先假设两个事件无关,计算统计量χ2的值.若χ2值较大,则拒绝假设,认为两个事件有关.2.独立性检验的步骤(1)画列联表.(2)计算χ2.(3)将得到的χ2值和临界值比较,下结论.答案精析问题导学知识点一思考可通过表格与图形进行直观分析,也可通过统计分析定量判断.梳理a+b c+d a+c b+d a+b+c+d A1B1A1B2A2B1A2B2知识点二n ad -bc2a +b c+d a+c b+d知识点三有关联90% 95% 99%题型探究例1 解根据题意列出2×2列联表如下:通过研究此2×2列联表可以研究设备改造对产品合格率是否有影响.跟踪训练1 6.109解析χ2=-230×75×55×50≈6.109.例2 解根据题目所给数据建立如下2×2列联表:根据2×2列联表中的数据,得χ2=-2110×60×44×126≈5.622>3.841,所以有95%的把握认为性别与态度有关系.跟踪训练2 解由题意列出2×2列联表:由公式得χ2=-2480×520×45×955≈28.225.因为28.225>6.635,所以有99%的把握认为人的性别与患色盲有关系.当堂训练1.A 2.B3.女正教授人数、男正教授人数、女副教授人数、男副教授人数4.95%5.解(1)2×2列联表如下所示:(2)假设“对新课程教学模式的赞同情况与教师年龄无关”.由公式,得χ2=-234×16×20×30≈4.963<6.635,所以没有99%的把握认为对新课程教学模式的赞同情况与教师年龄有关.。
学习目标 1.理解2×2列联表,并会依据列联表判断两个变量是否独立.2.理解统计量χ2的意义和独立性检验的基本思想.
知识点一2×2列联表
思考某教育行政部门大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表:
如何判定“喜欢体育还是文娱与性别是否有联系”?
梳理设A、B为两个变量,每一变量都可以取两个值,得到表格.
其中,a表示变量A取________,且变量B取________时的数据,b表示变量A取________,
且变量B取________时的数据;c表示变量A取________,且变量B取________时的数据;d表示变量A取________,且变量B取________时的数据.上表在统计中称为2×2列联表.
知识点二统计量
χ2=________________________.
(其中n=a+b+c+d为样本容量)
知识点三独立性检验
当χ2≤2.706时,没有充分的证据判定变量A,B________;
当χ2>2.706时,有__________的把握判定变量A,B有关联;
当χ2>3.841时,有__________的把握判定变量A,B有关联;
当χ2>6.635时,有__________的把握判定变量A,B有关联.
类型一2×2列联表和统计量χ2
例1某企业为了更好地了解设备改造与生产合格品的关系,随机抽取了180件产品进行分析,其中设备改造前生产的合格品有36件,不合格品有49件;设备改造后生产的合格品有65件,不合格品有30件,请根据数据,列出2×2列联表,并说明可以用本列表研究什么问题?
反思与感悟2×2列联表将文字语言转换为图表语言,使问题更为清晰,可为进一步研究问题作充分的准备.
跟踪训练1已知药物效果与动物试验列联表如下所示:
则χ2≈________.(结果保留3位小数)
类型二独立性检验的方法
例2研究人员选取170名青年男、女大学生作为样本,对他们进行一种心理测验,发现有60名女生对该心理测验中的最后一个题目的反应是:肯定的有22名,否定的有38名;男生110名在相同的题目上肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?用独立性检验的方法判断.
反思与感悟独立性检验可以通过2×2列联表计算χ2的值,然后和临界值对照作出判断.跟踪训练2为了研究人的性别与患色盲是否有关系,某研究所进行了随机调查,发现在调查的480名男性中有39名患有色盲,520名女性中有6名患有色盲,试问人的性别与患色盲有关系吗?
1.当χ2>3.841时,认为事件A与事件B()
A.有95%的把握有关B.有99%的把握有关
C.没有理由说它们有关D.不确定
2.为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校中学生中随机抽取了300名学生,得到如下列联表:
你认为性别与是否喜欢数学课程之间有关系的把握有()
A.0 B.95% C.99% D.100%
3.某大学在研究性别与职称(分正教授、副教授)之间是否有关系时,你认为应该收集哪些数据?
4.2014年世界杯期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:
若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为3
5,则有超过
________的把握认为年龄与西班牙队的被喜欢程度有关.
5.某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.
(1)根据以上数据建立一个2×2列联表;
(2)判断是否有99%的把握说明对新课程教学模式的赞同情况与教师年龄有关系.
1.独立性检验的思想:先假设两个事件无关,计算统计量χ2的值.若χ2值较大,则拒绝假设,认为两个事件有关.
2.独立性检验的步骤
(1)画列联表.
(2)计算χ2.
(3)将得到的χ2值和临界值比较,下结论.
答案精析
问题导学 知识点一
思考 可通过表格与图形进行直观分析,也可通过统计分析定量判断.
梳理 a +b c +d a +c b +d a +b +c +d A 1 B 1 A 1 B 2 A 2 B 1 A 2 B 2 知识点二
n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )
知识点三
有关联 90% 95% 99% 题型探究
例1 解 根据题意列出2×2列联表如下:
通过研究此2×2列联表可以研究设备改造对产品合格率是否有影响. 跟踪训练1 6.109
解析 χ2=105×(10×30-20×45)
2
30×75×55×50
≈6.109.
例2 解 根据题目所给数据建立如下2×2列联表:
根据2×2列联表中的数据,得χ2
=170×(22×38-22×88)2
110×60×44×126
≈5.622>3.841,
所以有95%的把握认为性别与态度有关系. 跟踪训练2 解 由题意列出2×2列联表:
由公式得χ2
=1 000×(39×514-441×6)2
480×520×45×955
≈28.225.
因为28.225>6.635,
所以有99%的把握认为人的性别与患色盲有关系. 当堂训练 1.A 2.B
3.女正教授人数、男正教授人数、女副教授人数、男副教授人数 4.95%
5.解 (1)2×2列联表如下所示:
(2)假设“对新课程教学模式的赞同情况与教师年龄无关”.
由公式,得χ2=50×(10×6-24×10)
2
34×16×20×30
≈4.963<6.635,
所以没有99%的把握认为对新课程教学模式的赞同情况与教师年龄有关.。