独立性检验高考真题(2017年-2018年))
- 格式:doc
- 大小:264.50 KB
- 文档页数:3
1.2 独立性检验的基本思想及其初步应用例题:1.三维柱形图中柱的高度表示的是( )A .各分类变量的频数B .分类变量的百分比C .分类变量的样本数D .分类变量的具体值解析: 三维柱形图中柱的高度表示图中各个频数的相对大小.选A2. 统计推断,当______时,有95 %的把握说事件A 与B 有关;当______时,认为没有充分的证据显示事件A 与B 是有关的.解析:当841.3>k 时,就有95 %的把握说事件A 与B 有关,当076.2≤k 时认为没有充分的证据显示事件A 与B 是有关的.3.为了探究患慢性气管炎与吸烟有无关系,调查了却339名50岁以上的人,结果如下表所示,据此数据请问:50岁以上的人患慢性气管炎与吸烟习惯有关系吗?分析:有表中所给的数据来计算2K 的观测值k,再确定其中的具体关系.解:设患慢性气管炎与吸烟无关.a=43,b=162,c=13,d=121,a+b=205,c+d=134, a+c=56,b+d=283,n=339所以2K 的观测值为469.7))()()(()(2==+++-=d b c a d c b a bc ad n k .因此635.6>k ,故有99%的把握认为患慢性气管炎与吸烟有关.课后练习:1. 在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就( )A.越大B.越小C.无法判断D.以上都不对2.下列关于三维柱形图和二维条形图的叙述正确的是: ( ) A .从三维柱形图可以精确地看出两个分类变量是否有关系B .从二维条形图中可以看出两个变量频数的相对大小,从三维柱形图中无法看出相对频数的大小C .从三维柱形图和二维条形图可以粗略地看出两个分类变量是否有关系D .以上说法都不对3.对分类变量X 与Y 的随机变量2K 的观测值K ,说法正确的是() A . k 越大," X 与Y 有关系”可信程度越小; B . k 越小," X 与Y 有关系”可信程度越小; C . k 越接近于0," X 与Y 无关”程度越小 D . k 越大," X 与Y 无关”程度越大4. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A.若K 2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;C.若从统计量中求出有95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误;D.以上三种说法都不正确.5.若由一个2*2列联表中的数据计算得k 2=4.013,那么有 把握认为两个变量有关系6.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:250(1320107) 4.84423272030k ⨯⨯-⨯=≈⨯⨯⨯因为23.841K ≥,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 ____;7.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。
独立性检验(北京习题集)(教师版)一.选择题(共5小题)1.(2017春•东城区校级期末)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1表2表3表4A.成绩B.视力C.智商D.阅读量2.(2016春•海淀区校级期末)在检验吸烟与患肺炎是否有关的一次统计中,根据22⨯列联表中数据计算得2 6.234x≈,则下列说法正确的是()A .有99%的把握认为吸烟与患肺炎有关B .有99%的把握认为吸烟与患肺炎无关C .有95%的把握认为吸烟与患肺炎有关D .有95%的把握认为吸烟与患肺炎无关3.(2015秋•昌平区期末)某大学进行自主招生时,需要进行逻辑思维和阅读表达两项能力的测试.学校对参加测试的200名学生的逻辑思维成绩、阅读表达成绩以及这两项的总成绩进行了排名.其中甲、乙、丙三位同学的排名情况如图所示:下列叙述一定正确的是( )A .甲同学的阅读表达成绩排名比他的逻辑思维成绩排名更靠前B .乙同学的逻辑思维成绩排名比他的阅读表达成绩排名更靠前C .甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前D .乙同学的总成绩排名比丙同学的总成绩排名更靠前4.(2014•海淀区校级模拟)在对吸烟与患肺病这两个分类变量的独立性检验中,下列说法正确的是( ) (参考数据:2( 6.635)0.01)P k =①若2k 的观测值满足2 6.635k ,我们有99%的把握认为吸烟与患肺病有关系. ②若2k 的观测值满足2 6.635k ,那么在100个吸烟的人中约有99人患有肺病.③从独立性检验可知,如果有99%的把握认为吸烟与患肺病有关系时,那么我们就认为:每个吸烟的人有99%的可能性会患肺病.④从统计量中得知有99%的把握认为吸烟与患肺病有关系时,是指有1%的可能性使推断出现错误. A .①B .①④C .②③D .①②③④5.(2014•海淀区校级模拟)经过对2K 的统计量的研究,得到了若干个临界值,当2K 的观测值 3.841K >时,我们()2)k0.500.455A .在错误的概率不超过0.05的前提下可认为A 与B 有关 B .在错误的概率不超过0.05的前提下可认为A 与B 无关 C .在错误的概率不超过0.01的前提下可认为A 与B 有关D .没有充分理由说明事件A 与B 有关 二.填空题(共7小题)6.(2019春•东城区期末)吃零食是中学生中普遍存在的现象.长期吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表给出性别与吃零食的列联表根据下面2K 的计算结果,试回答,有 的把握认为“吃零食与性别有关”.参考数据与参考公式:222()85(140480)9826000 4.722()()()()176845402080800n ad bc K a b c d a c b d --===≈++++⨯⨯⨯0)k7.(2013•西湖区校级模拟)给出下列说法:①从匀速传递的产品生产线上每隔20分钟抽取一件产品进行某种检测,这样的抽样为系统抽样; ②若随机变量若(1,4)N ξ-,(0)P m ξ=,则1(01)2P m ξ<<=-; ③在回归直线?0.22y x =+中,当变量x 每增加1个单位时,?y 平均增加2个单位; ④在22⨯列联表中,213.079K =,则有99.9%的把握认为两个变量有关系. 附表:0)k0.050k3.841其中正确说法的序号为 (把所有正确说法的序号都写上)8.(2010春•海淀区校级期中)在调查学生数学成绩与物理成绩之间的关系时,得到如下数据(人数):物理成绩好物理成绩不好合计数学成绩好622385数学成绩不好282250合计9045135根据以上数据求得2X=;所以有(填百分数)以上的把握认为数学成绩与物理成绩有关.9.(2010春•怀柔区期末)为了了解某地母亲身高x与女儿身高Y的相关关系,随机测得10对母女的身高如下表所示:母亲身()x cm159160160163159154159158159157女儿身()Y cm158159160161161155162157162156计算x与Y的相关系数0.71r≈,通过查表得r的临界值0.050.632r=,从而有的把握认为x与Y之间具有线性相关关系,因而求回归直线方程是有意义的.通过计算得到回归直线方程为ˆ34.920.78y x==+,因此,当母亲的身高为161cm时,可以估计女儿的身高大致为.10.(2009春•北京校级期末)某校为提高教学质量进行教改实验,设有试验班和对照班.经过两个月的教学试验,进行了一次检测,试验班与对照班成绩统计如下的22⨯列联表所示(单位:人),则其中m=,n=.80及80分以下80分以上合计试验班321850对照班12m50合计4456n11.(2009春•北京校级期末)若由一个2*2列联表中的数据计算得2 4.013X=,那么有把握认为两个变量有关系.附:2X临界值表:12.(2009春•房山区期中)为了调查高中生的性别与是否喜欢足球之间有无关系,一般需要收集以下数据.三.解答题(共3小题)13.(2019•西城区校级模拟)已知某企业有职工5000人,其中男职工3500人,女职工1500人.该企业为了丰富职工的业余生活,决定新建职工活动中心,为此,该企业工会采用分层抽样的方法,随机抽取了300名职工每周的平均运动时间(单位:)h ,汇总得到频率分布表(如表所示),并据此来估计该企业职工每周的运动时间:(1)求抽取的女职工的人数;(2)①根据频率分布表,求出m 、n 、p 的值,完成如图所示的频率分布直方图,并估计该企业职工每周的平均运动时间不低于4h 的概率;②若在样本数据中,有60名女职工每周的平均运动时间不低于4h ,请完成以下22⨯列联表,并判断是否有95%以上的把握认为“该企业职工毎周的平均运动时间不低于4h 与性别有关”. 附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.0)k14.(2019•海淀区校级三模)手机厂商推出一款6寸大屏手机,现对500名该手机使用者(200名女性,300名男性)进行调查,对手机进行评分,评分的频数分布表如下: 女性用户 分值区间[50,60)[60,70)[70,80)[80,90)[90,100] 频数20 40 80 50 10男性用户 分值区间[50,60)[60,70)[70,80)[80,90)[90,100] 频数 45 75 90 60 30(Ⅰ)完成下列频率分布直方图,计算女性用户评分的平均值,并比较女性用户和男性用户评分的波动大小(不计算具体值,给出结论即可);(Ⅱ)把评分不低于70分的用户称为“评分良好用户”,能否有90%的把握认为“评分良好用户”与性别有关? 参考附表:20()P K k 0.100.050 0.010 0.0010k2.7063.841 6.635 10.828参考公式:2()2()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++15.(2019•西城区校级模拟)近年电子商务蓬勃发展,2017年某网购平台“双11”一天的销售业绩高达1682亿元人民币,平台对每次成功交易都有针对商品和快递是否满意的评价系统.从该评价系统中选出200次成功交易,并对其评价进行统计,网购者对商品的满意率为0.70,对快递的满意率为0.60,其中对商品和快递都满意的交易为80次.(1)根据已知条件完成下面的22⨯列联表,并回答能否有99%的把握认为“网购者对商品满意与对快递满意之间有关系”?(2)为进一步提高购物者的满意度,平台按分层抽样方法从中抽取10次交易进行问卷调查,详细了解满意与否的具体原因,并在这10次交易中再随机抽取2次进行电话回访,听取购物者意见.求电话回访的2次交易至少有一次对商品和快递都满意的概率.附:22()()()()()n ad bc K a b c d a c b d -=++++(其中n a b c d =+++为样本容量)2)kk独立性检验(北京习题集)(教师版)参考答案与试题解析一.选择题(共5小题)1.(2017春•东城区校级期末)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1表2表3表4A.成绩B.视力C.智商D.阅读量【分析】根据表中数据,利用公式,求出2K,即可得出结论.【解答】解:表2252(6221014)1:0.00916363220K⨯-⨯=≈⨯⨯⨯;表2252(4201216)2: 1.76916363220K⨯-⨯=≈⨯⨯⨯;表2252(824812)3: 1.316363220K⨯-⨯=≈⨯⨯⨯;表2252(143062)4:23.4816363220K⨯-⨯=≈⨯⨯⨯,∴阅读量与性别有关联的可能性最大,故选:D.【点评】本题考查独立性检验的应用,考查学生的计算能力,属于中档题.2.(2016春•海淀区校级期末)在检验吸烟与患肺炎是否有关的一次统计中,根据22⨯列联表中数据计算得2 6.234x≈,则下列说法正确的是()A.有99%的把握认为吸烟与患肺炎有关B.有99%的把握认为吸烟与患肺炎无关C.有95%的把握认为吸烟与患肺炎有关D.有95%的把握认为吸烟与患肺炎无关【分析】由2 6.234 3.841x≈>,对照表格,可知有95%的把握认为吸烟与患肺炎有关.【解答】解:由2 6.234 3.841x≈>,∴有95%的把握认为吸烟与患肺炎有关,故选:C.【点评】本题考查独立性检验的应用,考查学生的计算能力,属于基础题.3.(2015秋•昌平区期末)某大学进行自主招生时,需要进行逻辑思维和阅读表达两项能力的测试.学校对参加测试的200名学生的逻辑思维成绩、阅读表达成绩以及这两项的总成绩进行了排名.其中甲、乙、丙三位同学的排名情况如图所示:下列叙述一定正确的是( )A .甲同学的阅读表达成绩排名比他的逻辑思维成绩排名更靠前B .乙同学的逻辑思维成绩排名比他的阅读表达成绩排名更靠前C .甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前D .乙同学的总成绩排名比丙同学的总成绩排名更靠前【分析】根据图示,可得甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前. 【解答】解:根据图示,可得甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前, 故选:C .【点评】本题考查利用数学知识解决实际问题,考查数形结合的数学思想,考查学生分析解决问题的能力,比较基础.4.(2014•海淀区校级模拟)在对吸烟与患肺病这两个分类变量的独立性检验中,下列说法正确的是( ) (参考数据:2( 6.635)0.01)P k =①若2k 的观测值满足2 6.635k ,我们有99%的把握认为吸烟与患肺病有关系. ②若2k 的观测值满足2 6.635k ,那么在100个吸烟的人中约有99人患有肺病.③从独立性检验可知,如果有99%的把握认为吸烟与患肺病有关系时,那么我们就认为:每个吸烟的人有99%的可能性会患肺病.④从统计量中得知有99%的把握认为吸烟与患肺病有关系时,是指有1%的可能性使推断出现错误. A .①B .①④C .②③D .①②③④【分析】若2 6.635k >,我们有99%的把握认为吸烟与患肺病有关系,表示有1%的可能性使推断出现错误,不表示有99%的可能患有肺病,也不表示在100个吸烟的人中必有99人患有肺病,故可得结论.【解答】解:若2 6.635k >,我们有99%的把握认为吸烟与患肺病有关系,不表示有99%的可能患有肺病,故①正确.不表示在100个吸烟的人中必有99人患有肺病,故②不正确. 不表示有每个吸烟的人有99%的可能性会患肺病,故③不正确.从统计量中得知有99%的把握认为吸烟与患肺病有关系时,是指有1%的可能性使推断出现错误,④正确. 故选:B .【点评】本题的考点是独立性检验的应用,根据独立性检测考查两个变量是否有关系的方法进行判断,准确的理解判断方法及2k 的含义是解决本题的关键.5.(2014•海淀区校级模拟)经过对2K 的统计量的研究,得到了若干个临界值,当2K 的观测值 3.841K >时,我们()2)k0.500.455A .在错误的概率不超过0.05的前提下可认为A 与B 有关 B .在错误的概率不超过0.05的前提下可认为A 与B 无关 C .在错误的概率不超过0.01的前提下可认为A 与B 有关D .没有充分理由说明事件A 与B 有关【分析】根据所给的观测值,同临界值表中的临界值进行比较,根据2( 3.841)0.05P K >=,得到我们有10.0595%-=的把握认为A 与B 有关系. 【解答】解:依据下表:2)k2 3.841K >,2( 3.841)0.05P K >=∴我们在错误的概率不超过0.05的前提下可认为A 与B 有关,故选:A .【点评】本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的概率的意义,本题不用运算只要理解概率的意义即可. 二.填空题(共7小题)6.(2019春•东城区期末)吃零食是中学生中普遍存在的现象.长期吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表给出性别与吃零食的列联表根据下面2K 的计算结果,试回答,有 95% 的把握认为“吃零食与性别有关”. 参考数据与参考公式:222()85(140480)9826000 4.722)176845402080800n ad bc K b d --===≈+⨯⨯⨯0)k【分析】根据题意得出观测值的大小,对照临界值得出结论. 【解答】解:根据题意知2 4.722 3.841K ≈>, 所以有95%的把握认为“吃零食与性别有关”. 故答案为:95%.【点评】本题考查了列联表与独立性检验的应用问题,是基础题. 7.(2013•西湖区校级模拟)给出下列说法:①从匀速传递的产品生产线上每隔20分钟抽取一件产品进行某种检测,这样的抽样为系统抽样; ②若随机变量若(1,4)N ξ-,(0)P m ξ=,则1(01)2P m ξ<<=-; ③在回归直线?0.22y x =+中,当变量x 每增加1个单位时,?y 平均增加2个单位; ④在22⨯列联表中,213.079K =,则有99.9%的把握认为两个变量有关系. 附表:0)k0.050k3.841其中正确说法的序号为 ①②④ (把所有正确说法的序号都写上)【分析】对于①,从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样系统抽样;对于②,根据随机变量~(1,4)x N ,得到正态曲线的对称轴是1x =,得到(0)(2)P x P x =,根据所给的条件(0)P x m =,得到(2)P x m =,又根据概率之和是1,得到要求的结果;对;对于③在回归直线方程 ?0.22y x =+中,当解释变量x 每增加一个单位时,预报变量 ?y 平均增加0.1个单位;不对;对于④,通过所给的观测值,同临界值表中的数据进行比较,发现13.07910.828>,得到结论. 【解答】解:①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件 产品进行某项指标检测,这样的抽样是系统抽样,故①正确, ②:随机变量~(1,4)x N ,∴正态曲线的对称轴是1x =,(0)(2)P x P x ∴= (0)P x m =,(02)112P x m m m ∴<<=--=-,1(01)2P m ξ∴<<=-,故③正确, ③在回归直线方程 ?0.22y x =+中,当解释变量x 每增加一个单位时, 预报变量 ?y 平均增加0.2个单位,故④不正确, 对于④,一个2*2列联表中的数据计算得213.079K =,213.07910.828K =>,∴有999%的把握说这两个变量有关系,故答案为:①②④.【点评】本题考查独立性检验,考查系统抽样方法,考查线性回归方程,考查判断两个相关变量之间的关系等,是一个综合题目,这种题考查的知识点比较多,需要认真分析.8.(2010春•海淀区校级期中)在调查学生数学成绩与物理成绩之间的关系时,得到如下数据(人数):根据以上数据求得2X = 4.066 ;所以有 (填百分数)以上的把握认为数学成绩与物理成绩有关.【分析】根据表中所给的数据,利用所给的求观测值的公式,代入公式22()()()()()n ad bc K a b c d a c b d -=++++,计算出k 值,把观测值同临界值进行比较,得到有95%的把握数学成绩与物理成绩有关. 【解答】解:提出假设0H :学生数学成绩与物理成绩之间没有关系.根据列联表可以求得22135(62222823) 4.066 3.841904585110K ⨯⨯-⨯=≈>⨯⨯⨯当0H 成立时,2( 3.841)0.05P K >=.所以我们有10.0595%-=的把握认为:学生的数学成绩与物理成绩之间有关系, 故答案为:4.066;95%【点评】本题考查独立性检验的应用,考查数据处理能力、运算求解能力和应用意识,本题解题的关键是正确运算出观测值,理解临界值对应的概率的意义,本题是一个基础题.9.(2010春•怀柔区期末)为了了解某地母亲身高x 与女儿身高Y 的相关关系,随机测得10对母女的身高如下表所示:计算x 与Y 的相关系数0.71r ≈,通过查表得r 的临界值0.050.632r =,从而有 95% 的把握认为x 与Y 之间具有线性相关关系,因而求回归直线方程是有意义的.通过计算得到回归直线方程为ˆ34.920.78yx ==+,因此,当母亲的身高为161cm 时,可以估计女儿的身高大致为 .【分析】查对临界值表,可得结论,利用回归直线方程,代入计算可估计女儿的身高.【解答】解:查对临界值表,由临界值0.050.632r =,可得有95%的把握认为x 与Y 之间具有线性相关关系,回归直线方程为ˆ34.920.78yx =+,因此,当161x cm =时,ˆ34.920.7834.920.78161161y x cm =+=+⨯= 故答案为:95%,161cm .【点评】本题考查独立性检验的应用,考查学生的计算能力,属于基础题.10.(2009春•北京校级期末)某校为提高教学质量进行教改实验,设有试验班和对照班.经过两个月的教学试验,进行了一次检测,试验班与对照班成绩统计如下的22⨯列联表所示(单位:人),则其中m = 38 ,n = .80及80分以下80分以上合计 试验班 32 1850 对照班 12 m50合计4456n【分析】根据22⨯列联表的规律对应的横行与竖行的和应该等于合计,故可求 【解答】解:由题意,1856m +=,5050n +=,38m ∴=.100n =, 故答案为38,010.【点评】利用随机变量 来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.独立性检验的基本思想类似于反证法11.(2009春•北京校级期末)若由一个2*2列联表中的数据计算得2 4.013X =,那么有 95% 把握认为两个变量有关系. 附:2X 临界值表:【分析】通过所给的观测值,同临界值表中的数据进行比较,发现4.013 3.841>,得到结论有95%的把握说这两个变量有关系.【解答】解:一个2*2列联表中的数据计算得2 4.013X =, 4.013 3.841>,∴有95%的把握说这两个变量有关系,故答案为:95%【点评】本题考查独立性检验,考查判断两个变量之间有没有关系,一般题目需要自己做出观测值,再拿着观测值同临界值进行比较,得到结论,本题给出了观测值,只剩下一个比较过程.12.(2009春•房山区期中)为了调查高中生的性别与是否喜欢足球之间有无关系,一般需要收集以下数据 男女生中喜欢或不喜欢足球的人数 .【分析】根据调查目的:为了调查高中生的性别与是否喜欢足球之间有无关系,一般需要收集男女生中喜欢或不喜欢足球的人数,通过计算得到结果,【解答】解:为了调查高中生的性别与是否喜欢足球之间有无关系,一般需要收集男女生中喜欢或不喜欢足球的人数,再得出22 列联表,最后代入随机变量的观测值公式,得出结果. 故答案为:男女生中喜欢或不喜欢足球的人数.【点评】本题考查独立性检验的应用,考查独立性检验的基本思想和应用意识, 三.解答题(共3小题)13.(2019•西城区校级模拟)已知某企业有职工5000人,其中男职工3500人,女职工1500人.该企业为了丰富职工的业余生活,决定新建职工活动中心,为此,该企业工会采用分层抽样的方法,随机抽取了300名职工每周的平均运动时间(单位:)h ,汇总得到频率分布表(如表所示),并据此来估计该企业职工每周的运动时间:(1)求抽取的女职工的人数;(2)①根据频率分布表,求出m 、n 、p 的值,完成如图所示的频率分布直方图,并估计该企业职工每周的平均运动时间不低于4h 的概率;②若在样本数据中,有60名女职工每周的平均运动时间不低于4h,请完成以下22⨯列联表,并判断是否有95%以上的把握认为“该企业职工毎周的平均运动时间不低于4h与性别有关”.附:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.2()P K k0.250.150.100.050.025 0k 1.323 2.072 2.706 3.841 5.024【分析】(1)直接由分层抽样中每层所占比例相等求得抽取的女职工的人数;(2)①由图表数据及频率和为1求得n,然后依次求p与m的值,并完成频率分布直方图;②填写22⨯列联表,再由公式求得2K,则结论可求.【解答】解:(1)抽取的女职工的人数为1500 300905000⨯=;(2)①10.050.20.150.250.30.05n=-----=,15p=,300154575901560m=-----=;直方图如图:估计该企业职工每周的平均运动时间不低于4h的概率为:30.150.250.30.050.754P =+++==; ②22⨯列联表如图:22()300(456030165) 4.762 3.841()()()()7522521090n ad bc K a b c d a c b d -⨯-⨯==≈>++++⨯⨯⨯.∴有95%以上的把握认为“该企业职工毎周的平均运动时间不低于4h 与性别有关”.【点评】本题考查独立性检验,考查由频率分布直方图求概率的估计值,考查计算能力,是中档题.14.(2019•海淀区校级三模)手机厂商推出一款6寸大屏手机,现对500名该手机使用者(200名女性,300名男性)进行调查,对手机进行评分,评分的频数分布表如下:(Ⅰ)完成下列频率分布直方图,计算女性用户评分的平均值,并比较女性用户和男性用户评分的波动大小(不计算具体值,给出结论即可);(Ⅱ)把评分不低于70分的用户称为“评分良好用户”,能否有90%的把握认为“评分良好用户”与性别有关? 参考附表:20()P K k 0.100.050 0.010 0.0010k2.7063.841 6.635 10.828参考公式:2()2()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++【分析】(Ⅰ)利用所给数据,可得频率分布直方图,并比较女性用户和男性用户评分的波动大小; (Ⅱ)求出2K ,与临界值比较,即可得出结论.【解答】解:(Ⅰ)女性用户和男性用户的频率分布表分别如下左、右图:由图可得女性用户的波动小,男性用户的波动大. ⋯(4分) (Ⅱ)22⨯列联表如下图:女性用户 男性用户 合计 “认可”手机 140 180 320 “不认可”手机60 120 180 合计200300500500(14012018060)2 5.208 2.706200300320180K ⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为性别和对手机的“认可”有关.【点评】本题考查频率分布直方图的作法及应用,考查独立检验的应用,考查频率分布直方图等基础知识,考查运算求解能力,是基础题.15.(2019•西城区校级模拟)近年电子商务蓬勃发展,2017年某网购平台“双11”一天的销售业绩高达1682亿元人民币,平台对每次成功交易都有针对商品和快递是否满意的评价系统.从该评价系统中选出200次成功交易,并对其评价进行统计,网购者对商品的满意率为0.70,对快递的满意率为0.60,其中对商品和快递都满意的交易为80次.(1)根据已知条件完成下面的22⨯列联表,并回答能否有99%的把握认为“网购者对商品满意与对快递满意之间有关系”?(2)为进一步提高购物者的满意度,平台按分层抽样方法从中抽取10次交易进行问卷调查,详细了解满意与否的具体原因,并在这10次交易中再随机抽取2次进行电话回访,听取购物者意见.求电话回访的2次交易至少有一次对商品和快递都满意的概率.附:22()n ad bcK-=(其中n a b c d=+++为样本容量)2)kk【分析】(1)由题意填写列联表,计算观测值,对照临界值得出结论;(2)根据题意,用列举法求出基本事件数,计算所求的概率值.【解答】解:(1)由题意,填写22⨯列联表,如下:计算2200(80204060)1001.59140601208063K⨯⨯-⨯==≈⨯⨯⨯,由于1.59 6.635<,所以没有99%的把握认为“网购者对商品满意与对快递满意之间有关系”;(2)根据题意,抽取的10次交易中,对商品和快递都满意的交易有4次,记为A、B、C、D,其余6次不是都满意的交易记为1、2、3、4、5、6,那么抽取2次交易一共有45种可能:AB 、AC 、AD 、1A 、2A 、3A 、4A 、5A 、6A 、BC 、BD 、1B 、2B 、⋯⋯、56, 其中2次交易对商品和快递不是都满意的有15种: 12、13、14、15、16、⋯⋯、56;所以,在抽取的2次交易中,至少一次对商品和快递都满意的概率是 45152453P -==. 【点评】本题考查了列联表与独立性检验的应用问题,也考查了列举法求古典概型的概率问题.。
2017-2018学年高一数学(选修2-3)百所名校速递分项汇编专题05 独立性检验一、选择题1.可以粗略地判断两个分类变量是否有关的是( )A.残差图B.等高条形图C.2×2列联表D.以上均不对【答案】B【解析】等高条形图可以粗略地判断两个分类变量之间是否有关.故选B2.通过随机询问150名大学生是否参加某社团活动,得到如下的列联表:附表:参照附表,得到的正确的结论是( )A.在犯错的概率不超过0.1%的前提下,认为“是否参加该社团活动与性别无关”B.在犯错的概率不超过0.1%的前提下,认为“是否参加该社团活动与性别有关”C.有99%以上的把握认为“是否参加该社团活动与性别有关”D.有99%以上的把握认为“是否参加该社团活动与性别无关”【答案】C【解析】由表中数据求得K2的观测值k≈10.19,由10.19>6.635知,有99%以上的把握认为“是否参加该社团活动与性别有关”.故选C3.【辽宁省沈阳市郊联体2017-2018学年高二上学期期末】以下四个命题,其中正确的是( )A.由独立性检验可知,有99%的把握认为物理成绩与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀;B.两个随机变量相关系越强,则相关系数的绝对值越接近于0;C.在线性回归方程中,当变量每增加一单位时,变量平均增加0.2个单位;D.线性回归方程对应的直线至少经过其样本数据点中的一个点.【答案】C【解析】由独立性检验可知,有99%的把握认为物理成绩与数学成绩有关,某人数学成绩优秀,则他的物理不一定优秀,故A错误;两个随机变量相关系越强,则相关系数的绝对值越接近于1,故B错误;线性回归方程对应的直线可能不经过其样本数据点中的任何点,故D错误;在线性回归方程中,当变量每增加一个单位时,变量平均增加0.2个单位,故C正确.故选C.4.【湖南省浏阳一中、醴陵一中2018-2019学年高二12月联考】利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问名不同的大学生是否爱好某项运动,利用列联表,由计算可得.参照附表,得到的正确结论是()A.有以上的把握认为“爱好该项运动与性别无关”B.有以上的把握认为“爱好该项运动与性别有关”C.在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关”【答案】B【解析】由于计算得,根据独立性检验的知识可知有以上的把握认为“爱好该项运动与性别有关”.故选B.5.【河北省武邑中学2018-2019学年高二上学期期末】某校为了研究“学生的性别”和“对待某一活动的态度”是否有关,运用2×2列联表进行独立性检验,经计算,则认为“学生性别与支持活动有关系”的犯错误的概率不超过附:0.1000.0500.0250.0100.001k0 2.706 3.841 5.024 6.63510.828A.0.1% B.1% C.99% D.99.9%【答案】B【解析】由于,故认为“学生性别与支持活动有关系”的犯错误的概率不超过.故选B. 6.【四川省绵阳市2018-2019学年高二上学期期末】利用独立性检验的方法调查高中生性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用列联表,由计算可得,参照下表:0.010.050.0250.0100.0050.0012.7063.8415,024 6.6357.87910.828得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别无关”B.有99%以上的把握认为“爱好该项运动与性别有关”C.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别无关”【答案】B【解析】由,可得有99%以上的把握认为“爱好该项运动与性别有关”.故选B7.班主任对全班50名学生进行了作业量调查,统计数据如下表所示:认为作业多认为作业不多总计喜欢玩电脑游戏18927不喜欢玩电脑游戏81523总计262450根据表中数据得到K2的观测值≈5.059,因为P(K2≥5.024)≈0.025,所以判定是否喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为( )A.97.5%B.95%C.90%D.无充分根据【答案】A【解析】因为P(K2≥5.024)≈0.025,∴判定是否喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为1-0.025=97.5%.8.某社区为了了解本社区居民的受教育程度与年收入的关系,随机调查了100户居民,得到如下表所示的2×2列联表(单位:人):分类年收入5万元以下年收入5万元及以上总计高中文化以上104555高中文化及以下153045总计2575100[来源:学科网]若推断“受教育程度与年收入有关系”,则这种推断犯错误的概率不超过( ) A.2.5% B.2%C.1.5% D.1%【答案】D【解析】由表中的数据可得由于9.818>6.635,所以推断“受教育程度与年收入有关系”,犯错误的概率不超过1%.故选:D.9.某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表,根据表中数据则可判定秃发与患心脏病有关,那么这种判定出错的可能性为( )患心脏病情况秃发情况患心脏病无心脏病秃发20300不秃发5450A.0.1B.0.05C.0.01D.0.99【答案】C【解析】列出联表如下图所示:患心脏病情况秃发情况患心脏病无心脏病小计秃发20 300 320 不秃发 5 450455 小计25 750 775,故判断错误的概率不超过,故选.10.【湖北省十堰市2018-2019学年高二下学期第一次月考】针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的.若有的把握认为是否追星和性别有关,则男生至少有()参考数据及公式如下:A.12B.11C.10D.18【答案】A【解析】设男生人数为,依题意可得列联表如下:喜欢追星不喜欢追星总计男生女生总计若在犯错误的概率不超过的前提下认为是否喜欢追星和性别有关,则,由,解得,为整数,若在犯错误的概率不超过的前提下认为是否喜欢追星和性别有关,则男生至少有人,故选A.二、填空题11.给出下列实际问题:①一种药物对某种病的治愈率;②吸烟者得肺病的概率;③吸烟人群是否与性别有关系;④上网与青少年的犯罪率是否有关系.其中,用独立性检验可以解决的问题有________.(填序号)【答案】③④【解析】由于独立性检验是来解决两类分类变量的关系问题的,所以只能选择③④, ①②不是研究两类分类变量的关系的问题,所以不符合题意.故答案为:③④12.某医疗研究所为了检验某种血清对预防感冒的作用,把500名使用该血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:这种血清不能起到预防感冒的作用.利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.给出下列三种说法:①有95%的把握认为“这种血清能起到预防感冒的作用”;②如果某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为5%.则上述说法中,正确说法的序号是________.【答案】①【解析】根据已知能判断有95%的把握认为“这种血清能起到预防感冒的作用”,所以选项①是正确的;如果某人未使用该血清,不能说明他在一年中有95%的可能性得感冒,所以选项②是错误的;这种血清预防感冒的有效率为95%,不是5%.所以选项③是错误的.故答案为:①13.某高校“统计初步”课程的教师随机调查了该选修课的一些学生情况,具体数据如下表:非统计专业统计专业男1310女720为了检验主修专业是否与性别有关系,根据表中的数据,得到.因为,所以断定主修统计专业与性别有关系.这种判断出错的可能性为__________.【答案】5%(或0.05)【解析】根据临界值表0.050 0.010 0.0013.841 6.635 10.828,所以断定主修统计专业与性别有关系.这种判断出错的可能性为0.05.故答案为5%(或0.05)14.某中学为了调研学生的数学成绩和物理成绩是否有关系,随机抽取了189名学生进行调查,调查结果如下:在数学成绩较好的94名学生中,有54名学生的物理成绩较好,有40名学生的物理成绩较差;在成绩较差的95名学生中,有32名学生的物理成绩较好,有63名学生的物理成绩较差.根据以上的调查结果,利用独立性检验的方法可知,约有________的把握认为“学生的数学成绩和物理成绩有关系”.【答案】99.5%【解析】根据题目中所给的数据可得到2×2列联表,再由公式得k=≈10.76.因为10.76>7.879,所以约有99.5%的把握认为“学生的数学成绩和物理成绩有关系”.三、解答题15.【黑龙江省伊春市第二中学2018-2019学年高二上学期期末】某旅行社为调查市民喜欢“人文景观”景点是否与年龄有关,随机抽取了50名市民,得到数据如下表:喜欢不喜欢合计大于40岁2052520岁至40岁101525合计302050(1)判断是否有99.5%的把握认为喜欢“人文景观”景点与年龄有关?(保留小数点后3位)(2)用分层抽样的方法从喜欢“人文景观”景点的市民中随机抽取3人作进一步调查,将这3位市民作为一个样本,从中任选2人,求恰有1位“大于40岁”的市民和1位“20岁至40岁”的市民的概率.下面的临界值表供参考:0.150.100.050.0250.0100.0050.0012.072 2.7063.841 5.024 6.6357.87910.828(参考公式:,其中)【答案】(1)有把握(2)【解析】解:(1)由已知得7.879有99.5%的把握认为喜欢“人文景观”景点与年龄有关.(2)用分层抽样的方法从喜欢“人文景观”景点的市民中随机抽取3人中“大于40岁”的市民2人设为,,1位“20岁至40岁”的市民设为,抽取2人基本事件共有,,三个,恰有1位“大于40岁”的市民和1位“20岁至40岁”的市民包括基本事件2个,概率.16.2017年10月18日至24日,中国共产党第十九次全国人民代表大会在北京顺利召开.大会期间,北京某高中举办了一次“喜迎十九大”的读书读报知识竞赛,参赛选手为从高一年级和高二年级随机抽取的各100名学生.图1和图2分别是高一年级和高二年级参赛选手成绩的频率分布直方图.(1)分别计算参加这次知识竞赛的两个年级学生的平均成绩;(2)完成下面2×2列联表,并回答能否在犯错误的概率不超过0.010的前提下,认为高一、高二两个年级学生这次读书读报知识竞赛的成绩有差异.附:【答案】(1)高一平均分,高二平均分;(2)表格见解析,能.【解析】(1)高一年级参赛学生的平均成绩为(45×0.04+55×0.04+65×0.01+75×0.01)×10=54(分).高二年级参赛学生的平均成绩为(45×0.015+55×0.025+65×0.035+75×0.025)×10=62(分).(2)补全2×2列联表,如下:分类成绩低于60分人数成绩不低于60分人数总计高一年级80 20 100高二年级40 60[来源:学科网]100总计120 80 200根据表中数据得K2的观测值k=≈33.333>6.635,故在犯错误的概率不超过0.010的前提下,认为高一、高二两个年级学生这次读书读报知识竞赛的成绩有差异.17.【黑龙江省大庆第一中学2018-2019学年高二上学期期末】某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于 120 分为优秀,120 分以下为非优秀.统计成绩后,得到如下的列联表,且已知在甲、乙两个文科班全部 110 人中随机抽取 1 人为优秀的概率为.(1)请完成上面的列联表;(2)根据列联表的数据,是否有 99.9% 的把握认为“成绩与班级有关系”.参考公式与临界值表:.【答案】(1)见解析;(2)见解析【解析】(1)(2),没有 99.9% 的把握认为成绩与班级有关.18.【甘肃省天水一中2018-2019学年高二上学期期末】《中华人民共和国道路交通安全法》第47条的相关规定:机动车行经人行横道时,应当减速慢行;遇行人正在通过人行横道,应当停车让行,俗称“礼让斑马线”,《中华人民共和国道路交通安全法》第90条规定:对不礼让行人的驾驶员处以扣3分,罚款50元的处罚.下表是某市一主干路口监控设备所抓拍的5个月内驾驶员不“礼让斑马线”行为统计数据:月份12345违章驾驶员人数120105100[来源:学科网]9085(1)请利用所给数据求违章人数与月份之间的回归直线方程;(2)交警从这5个月内通过该路口的驾驶员中随机抽查了50人,调查驾驶员不“礼让斑马线”行为与驾龄的关系,得到如下列联表:能否据此判断有的把握认为“礼让斑马线”行为与驾龄有关?不礼让斑马线礼让斑马线合计驾龄不超过1年22830驾龄1年以上81220合计302050参考公式及数据:.[来源学&科&网](其中)【答案】(1);(2)有的把握认为“礼让斑马线”行为与驾龄关.【解析】(1)由表中数据知,,∴,∴,∴所求回归直线方程为。
第三章 统计案例3.2 独立性检验的基本思想及其初步应用一、选择题:在每小题给出的四个选项中,只有一项是符合题目要求的. 1.下列关于等高条形图的叙述正确的是A .从等高条形图中可以精确地判断两个分类变量是否有关系B .从等高条形图中可以看出两个变量频数的相对大小C .从等高条形图中可以粗略地看出两个分类变量是否有关系D .以上说法都不对 【答案】C2.下面是一个22⨯列联表:1y 2y总计 1x a21 73 2x825 33 总计b46则表中a ,b 处的值分别为 A .94,96 B .52,50 C .54,52D .52,60【答案】D【解析】∵2173a +=,∴52a =.又852860b a =+=+=.故选D .3.利用独立性检验来考虑两个分类变量X 错误!未找到引用源。
与Y 是否有关系时,通过查阅下表来确定“X 与Y 有关系”的可信度.如果 3.841k >,那么就有把握认为“X 错误!未找到引用源。
与Y 有关系”的百分比为20()P K k ≥ 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.0010k0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 A .95%B .5%C .2.5%D .97.5%【答案】A【解析】因为 3.841k >,所以有把握认为“X 错误!未找到引用源。
与Y 有关系”的百分比为95%.故选A .4.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:认为作业多认为作业不多总数 喜欢玩电脑游戏 18 9 27 不喜欢玩电脑游戏8 15 23 总数262450则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为20()P K k ≥ 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.0010k0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828A .99%B .97.5%C .95%D .无充分依据【答案】B二、填空题:请将答案填在题中横线上.5.为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以下的人,调查结果如下表:患慢性气管炎未患慢性气管炎合计 吸烟 43 162 205 不吸烟 13 121 134 合计56283339根据列表数据,求得2K 的观测值k ≈________________. 【答案】7.469【解析】22339(4312116213)7.46956283205134K ⨯⨯-⨯=≈⨯⨯⨯.6.两个分类变量X 、Y ,它们的取值分别为x 1、x 2和y 1、y 2,其列联表为:y 1 y 2 总计x 1 a b a +b x 2c d c +d 总计a+cb +da +b +c +d若两个分类变量X ,Y 独立,则下列结论:①ad bc ≈;②a c abcd ≈++;③c d b da b c d a b c d++≈++++++;④c a b d a b c d a b c d ++≈++++++;⑤2()()0()()()()a b c d ad bc a b b d a c c d +++-≈++++. 其中正确的序号是________________. 【答案】①②⑤三、解答题:解答应写出文字说明、证明过程或演算步骤.7.某生产线上,质量监督员甲在生产现场时,990件产品中有合格品982件,次品8件;不在生产现场时,510件产品中有合格品493件,次品17件.试利用列联表和等高条形图判断监督员甲在不在生产现场对产品质量好坏有无影响. 【答案】见解析.【解析】根据题目所给数据得如下2×2列联表:分类 合格品数 次品数 总计 甲在生产现场 982 8 990 甲不在生产现场493 17 510 总计1475251500因为98217849312750ad bc -=⨯-⨯=,||ad bc -比较大,说明甲在不在生产现场与产品质量好坏有关系.相应的等高条形图如图所示.图中两个阴影部分的高分别表示甲在生产现场和甲不在生产现场时样品中次品数的频率.从图中可以看出,甲不在生产现场时样本中次品数的频率明显高于甲在生产现场时样本中次品数的频率.因此可以认为质量监督员甲在不在生产现场与产品质量好坏有关系.8.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据:出生时间在晚上的男婴为24人,女婴为8人;出生时间在白天的男婴为31人,女婴为26人. (1)将22⨯列联表补充完整;出生时间 总计 晚上 白天 男婴 女婴 总计(2)能否在犯错误的概率不超过0.1的前提下认为婴儿性别与出生时间有关系?【答案】(1)见解析;(2)在犯错误的概率不超过0.1的前提下认为婴儿的性别与出生的时间有关系.(2)由所给数据计算2K 的观测值289(2426318) 3.689 2.70655343257k ⨯⨯-⨯=≈>⨯⨯⨯.根据临界值表知2( 2.706)0.10P K ≥≈,因此在犯错误的概率不超过0.1的前提下认为婴儿的性别与出生的时间有关系. 9.下表是某地区的一种传染病与饮用水的调查表:得病 不得病 合计 干净水 52 466 518 不干净水 94 218 312 合计146684830(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人;饮用不干净水得病9人,不得病22人.按此样本数据分析这种传染病是否与饮用水的卫生程度有关,并比较两种样本在反映总体时的差异.【答案】(1)见解析;(2)见解析.【解析】(1)根据题目中的列联表,及公式得221830(5221894466)54.21518312146684K⨯⨯-⨯=≈⨯⨯⨯.因为54.2110.828>,因此我们有99.9%的把握认为该地区这种传染病与饮用水的卫生程度有关.(2)依题意得22⨯列联表:得病不得病合计干净水55055不干净水92231合计147286由公式得22286(522509)5.78555311472K⨯⨯-⨯=≈⨯⨯⨯.由5.785 5.024>,所以我们有97.5%的把握认为该种传染病与饮用水的卫生程度有关.两个样本都能统计得到传染病与饮用水的卫生程度有关这一相同结论,但(1)问中我们有99.9%的把握肯定结论的正确性,(2)问中我们只有97.5%的把握肯定结论的正确性.10.某城市随机抽取一年(365天)内100天的空气质量指数API的监测数据,结果统计如下:API [0,50](50,100](100,150](150,200](200,250](250,300]300>空气质量优良轻微污染轻度污染中度污染中度重污染重度污染天数 4 13 18 30 9 11 15记某企业每天由空气污染造成的经济损失为S (单位:元),空气质量指数API为x.API在区间[0,100]对企业没有造成经济损失;在区间(100,300]对企业造成的经济损失成直线模型(当API为150时,造成的经济损失为500元,当API为200时,造成的经济损失为700元);当API大于300时造成的经济损失为2000元.(1)试写出()S x的表达式;(2)试估计在本年内随机抽取一天,该天经济损失S大于500元且不超过900元的概率;(3)若本次抽取的样本数据有30天是在供暖季,其中有8天为重度污染,完成下面22⨯列联表,并判断能否有95%的把握认为该市本年空气重度污染与供暖有关?非重度污染重度污染合计 供暖季 非供暖季 合计100附:22()()()()()n ad bc K a b c d a c b d -=++++P (K 2≥k 0) 0.250.15 0.10 0.05 0.025 0.010 0.0050.001k 01.3232.0722.7063.8415.0246.6357.879 10.828【答案】(1)0,[0,100]()4100,(100,300]2000,(300,)x S x x x x ∈⎧⎪=-∈⎨⎪∈+∞⎩;(2)39100;(3)有95%的把握认为该市本年空气重度污染与供暖有关.当300x >时,()2000S x =.综上,可得0,[0,100]()4100,(100,300]2000,(300,)x S x x x x ∈⎧⎪=-∈⎨⎪∈+∞⎩.(2)设“在本年内随机抽取一天,该天经济损失S 大于500元且不超过900元”为事件A , 由500900S <≤,即5004100900x <-≤,得150250x <≤, 对应的频数为39,所以39()100P A =. (3)根据题中数据得到如下列联表:非重度污染重度污染合计 供暖季 22 8 30 非供暖季63770合计85 15 1002K的观测值2100(638227)4.575 3.84185153070k⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为该市本年空气重度污染与供暖有关.。
精选历年高考题:独立性检验练习题1. 为了解某班学生喜爱打篮球是否与性别有关,对本班60人进行了问卷调查得到了如下的2×2列联表:(I)用分层抽样的方法在喜爱打篮球的学生中抽6人,其中男生抽多少人?(II)在上述抽取的人中选2人,求恰有一名女生的概率;(III)你是否有95%的把握认为喜爱打篮球与性别有关?说明你的理由。
下面的临界值表供参考:2. 2014年山东省第二十三届运动会将在济宁召开,为调查我市某校高中生是否愿意提供志愿者服务,用简单随机抽样方法从该校调查了50人,结果如下:(I)用分层抽样的方法在愿意提供志愿者服务的学生中抽取6人,其中男生抽取多少人?(II)在(I)中抽取的6人中任选2人,求恰有一名女生的概率;(III)你能否有99%的把握认为该校高中生是否愿意提供志愿者服务与性别有关?下面的临界值表供参考:独立性检验统计量()()()()(),22dbcadcbabcadnK++++-=其中.dcban+++=3. 为调查某市学生百米运动成绩,从该市学生中按照男女比例随机抽取50名学生进行百米测试,学生成绩全部都介于13秒到18秒之间,将测试结果按如下方式分成五组,第一组[),14,13第二组[)15,14, 第五组[]18,17,如图是按上述分组方法得到的频率分布直方图.(1)设n m ,表示从第一组和第五组的所有学生中任意抽取的两名学生的百米测试成绩,即[)[]18,1714,13,⋃∈n m ,求事件“2>-n m ”的概率;(2)根据有关规定,成绩小于16秒为达标.如果男女生使用相同的达标标准,则男女生达标情况如下表:男 女 总计 达标a=24 b=_____ _____ 不达标c=_____ d=12 _____ 总计 _____ _____ n=50完成上表,并根据上表数据,能否有99﹪的把握认为“体育达标与性别有关”? 参考公式:()()()()().,22d c b a n d b c a d c b a bc ad n K +++=++++-=其中 参考数据:。
独立性检验1、(09辽宁文)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm )的值落在[29.94,30.06)的零件为优质品。
从两个分厂生产的零件中各抽出500件,量其内径尺寸,的结果如下表:甲厂:乙厂:(1) 试分别估计两个分厂生产的零件的优质品率;(2) 由以上统计数据填下面22⨯列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量附:2112212211212()()0.050.01,3.841n n n n n p x k x n n n n k ++++-≥ = 6.6352、(2010辽宁理科)为了比较注射A, B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B。
(Ⅰ)甲、乙是200只家兔中的2只,求甲、乙分在不同组的概率;(Ⅱ)下表1和表2分别是注射药物A和B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表(ⅰ)完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;(ⅱ)完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.表3:3、(2012辽宁理科)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查。
下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图;将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”。
(Ⅰ)根据已知条件完成下面的列联表,并据此资料你是否认为“体育迷”与性别 有关?(Ⅱ)将上述调查所得到的频率视为概率。
现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X 。
若每次抽取的结果是相互独立的,求X 的分布列,期望和方差。
附:22⨯()E X ()D X 22112212211212(),n n n n n n n n n χ++++-=。
高考数学专题复习:独立性检验一、单选题1.某学校食堂对高三学生偏爱蔬菜还是肉类与性别的关系进行了一次调查,根据独立性检验原理,处理所得数据之后发现,有97.5%的把握但没有99%的把握认为偏爱蔬菜还是肉类与性别有关,则2K 的观测值可能为( ) k 2.706 A .2 3.206K =B .2 6.625K =C .27.869K =D .211.208K =2.某校为了解学生“玩手机游戏”和“学习成绩”是否有关,随机抽取了100名学生,运用2×2列联表进行独立性检验,经计算得到2 3.936K =,所以判定玩手机游戏与学习成绩有关系,那么这种判断出错的可能性为( )A .1%B .5%C .95%D .99%3.某校为了调查喜欢语文与性别的关系,随机调查了一些学生,数据如下表,由此判断喜欢语文与性别有关系,那么这种判断出错的可能性为( )()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .99.5%B .5%C .0.5%D .95%4.以下四个命题,其中正确的个数有( )①在独立性检验中,随机变量2K 的观测值越大,“认为两个分类变量有关”,这种判断犯错误的概率越小.②在线性回归方程ˆ0.80.35yx =-时,变量x 与y 具有负的线性相关关系; ③随机变量X 服从正态分布2(3,)N σ,若(4)0.64P X ≤=,则(23)0.07P X ≤≤=; ④两个随机变量相关性越强,则相关系数r 的值越接近于1. A .1个B .2个C .3个D .4个5.两个分类变量X 和Y ,它们的取值分别为{}12,x x 和{}12,y y ,其样本频数列联表如下表所示:则下列四组数据中,分类变量X 和Y 之间关系最强的是( ) A .4a =,2b =,3c =,6d = B .2a =,1b =,3c =,5d = C .4a =,5b =,6c =,8d =D .2a =,3b =,4c =,6d =6.为了丰富教职工业余文化生活,某校计划在假期组织70名老师外出旅游,并给出了两种方案(方案一和方案二),每位老师均选择且只选择一种方案,其中有50%的男老师选择方案一,有75%的女老师选择方案二,且选择方案一的老师中女老师占40%,则参照附表,得到的正确结论是( )附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.A .在犯错误的概率不超过2.5%的前提下,认为“选择方案与性别有关”B .在犯错误的概率不超过2.5%的前提下,认为“选择方案与性别无关”C .有95%以上的把握认为“选择方案与性别有关”D .有95%以上的把握认为“选择方案与性别无关”7.利用独立性检验的方法调查高中生性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用22⨯列联表,由计算可得27.236K =,参照下表:得到的正确结论是( )A .有99%以上的把握认为“爱好该项运动与性别无关”B .有99%以上的把握认为“爱好该项运动与性别有关”C .在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关"D .在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别无关”8.如果根据性别与是否爱好运动的列联表得到2 3.852 3.841x ≈>,所以判断性别与运动有关,那么这种判断犯错的可能性不超过( ) A .2.5%B .0.5%C .1%D .5%9.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用22⨯列联表进行独立性检验.经计算2 6.058K =,则所得到的统计学结论是:有( )的把握认为“学生性别与支持该活动有关系”A .0.025%B .97.5%C .99%D .99.9%10.根据分类变量x 与y 的观测数据,计算得到2 2.974χ=.依据0.05α=的独立性检验,结论为( )A .变量x 与y 不独立B.变量x与y不独立,这个结论犯错误的概率不超过0.05C.变量x与y独立D.变量x与y独立,这个结论犯错误的概率不超过0.05二、填空题11.为了调查高中学生参加课外兴趣活动选篮球和舞蹈是否与性别有关,现随机调查了30名学生,得到如下22⨯列联表:根据表中的数据,及观测值2K(其中22()()()()()n ad bcKa b c d a c b d-=++++),参考数据:则在犯错误的概率不超过__________前提下,认为选择舞蹈与性别有关.12.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:(单位:人)由上表中数据计算得2K的观测值22105(10302045)6.10955503075K⨯⨯-⨯=≈⨯⨯⨯,请估计在犯错误的概率不超过__________的前提下认为“文化程度与月收入有关系”.13.利用独立性检验的方法调查高中性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用22⨯列联表,由计算可得27.245K≈,参照下表2.706 至少有__________以上的把握认为“爱好该项运动与性别有关”.14.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到K 2的观测值k =250(1320107)23272030⨯⨯-⨯⨯⨯⨯≈4.844.则认为选修文科与性别有关系出错的可能性为__________.三、解答题15.为了解某市市民对政府出台楼市限购令的态度,在该市随机抽取了50名市民进行调查,他们月收入(单位:百元)的频率分布直方图如下:(1)求该市市民平均月收入的估计值(每组数据以区间中点值为代表).(2)将月收入不低于7500元称为“高收入”,否则称为“非高收入”,根据已知条件完成下面的22⨯列联表,并判断能否有99%的把握认为市民对楼市限购令的态度与收入有关.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.16.为了调查某大学学生在某天上网的时间,随机对100名男生和100名女生进行了不记名的问卷调查,得到了如下的统计结果: 表1:男生上网时间与频数分布表表2:女生上网时间与频数分布表(1)若该大学共有女生750人,试估计其中上网时间不少于60分钟的人数; (2)完成联表,并回答能否有90%的把握认为“大学生上网时间与性别有关”.附:()()()()22()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++为样本容量.0.45517.某大学为鼓励学生进行体育锻炼,购买了一批健身器材供学生使用,并从该校大一学生中随机抽取了100名学生调查使用健身器材的情况,得到数据如表所示:(1)设每周使用健身器材的次数不低于3次为“爱好健身”,根据上表数据,填写22⨯列联表,并判断能否在犯错误的概率不超过0.10的前提下认为“男生和女生在使用健身器材的爱好方面有差异”;(2)从上述每周使用健身器材3次的学生中,利用分层抽样的方法抽取5名学生,再从抽取的5名学生中随机抽取3人,求3人中至多有一名女生的概率.18.在对人们休闲方式的一次调查中,仅就看电视与运动这两种休闲方式比较喜欢哪一种进行了调查.调查结果:接受调查总人数110人,其中男、女各55人;受调查者中,女性有30人比较喜欢看电视,男性有35人比较喜欢运动.(1)请根据题目所提供的调查结果填写下列22⨯列联表:(2)能否在犯错误的概率不超过0.05的前提下认为“性别与休闲方式有关系”?注:22()()()()()n ad bcKa b c d a c b d-=++++,(其中n a b c d=+++为样本容量)参考答案1.B【分析】根据把握率确定2K的观测值区间范围即可选择.【详解】∵有97.5%的把握但没有99%的把握,∴2K的观测值区间范围为[5.024,6.635),结合选项可知,2K的观测值可能为6.625.故选:B2.B【分析】根据2K的值,对照附表即可得解.【详解】由题得2 3.936 3.841K=>,所以判定玩手机游戏与学习成绩有关系,这种判断出错的可能性为5%. 故选:B3.C【分析】计算出2K的值可得答案.【详解】因为()22501520510258.33320307.89225753K⨯⨯-⨯==≈>⨯⨯⨯,所有这种判断出错的可能性0.5%.故选:C.4.A【分析】利用随机变量2K的观测值越大,说明两个变量有关系的可能性越大判断①;根据回归方程一次项系数的正负判断②;根据正态分布的性质判断③; 利用线性相关的概念判断④. 【详解】①:在独立性检验中,因为随机变量2K 的观测值越大,说明两个变量有关系的可能性越大,即犯错误的概率越大,故①错误;②:回归方程ˆ0.80.35yx =-的一次项系数为-0.35<0,故变量x 与y 具有负的线性相关关系,故②正确;③:随机变量X 服从正态分布2(3)N σ,,则(34)(4)(3)0.640.50.14P X P X P X <≤=≤-<=-=, 由对称性可知,(23)0.14P X ≤≤=,故③错误;④:两个随机变量的线性相关关系越强,则相关系数r 的绝对值越接近于1,故④错误. 正确的选项有1个. 故选:A 5.A 【分析】逐项求出ad bc -的值并加以对比,最大值对应的分类变量之间关系最强. 【详解】我们可以用ad bc -的大小近似的判断两个分类变量之间关系的强弱,ad bc -的值越小,关系越弱,越大,关系越强.这四组数据中ad bc -的值分别为18、7、2、0, 所以A 组数据的ad bc -的值最大,相比较而言这组数据反应的X 和Y 的关系最强. 故选:A. 6.C 【分析】设该校男老师的人数为x ,女老师的人数为y ,根据条件,得到22⨯列联表,求出x ,y 的值,利用公式计算2K 的值,再与表中临界值比较可得结果. 【详解】设该校男老师的人数为x ,女老师的人数为y ,则可得如下表格:由题意0.40.50.25x y =+,可得43y x =,可得30x =,40y =,则()227015301510 4.667 3.84125453040K ⨯-⨯=≈>⨯⨯⨯, 但4.667 5.024<,所以无97.5%以上有95%以上的把握认为“选择方案与性别有关”. 故选:C. 7.B 【分析】由已知的27.236K =,对比临界值表可得答案 【详解】解:因为27.236 6.635K =>,所以有99%以上的把握认为“爱好该项运动与性别有关”. 故选:B. 8.D 【分析】根据临界值附表比较,即得结论. 【详解】根据以下临界值附表可知这种判断犯错的可能性不超过5%. 故选:D 9.B【分析】将2K 的值与表中数据比较大小可知5.024 6.058 6.635<<,由此确定出相应的把握有多少.【详解】因为2 6.058K =,对照表格:5.024 6.058 6.635<<,所以有10.0250.97597.5%-==的把握认为“学生性别与是否支持该活动有关系”. 故选:B.10.C【分析】由表中数据以及独立性检验的思想即可得出结果.【详解】0.05α=时,2 3.841 2.974χ=>,所以在犯错概率不超过0.1时变量x 与y 有关.故选:C11.0.025【分析】由列联表中的数据,根据公式计算出2K 的值,再对照临界表即可得答案.【详解】 解:由列联表中的数据可得,2230(13827)27 5.4 5.024*********K ⨯⨯-⨯===>⨯⨯⨯, 所以在犯错误的概率不超过0.025的前提下,认为选择舞蹈与性别有关.故答案为:0.025.12.0.025【分析】根据2K ,对比临界值即可得出结论.【详解】∵6.109 5.024>,故能在犯错误的概率不超过0.025的前提下认为“文化程度与月收入有关系”.故答案为:0.025.13.99%【分析】根据卡方的值与参考数据比较即可判断;【详解】解:因为27.245K ≈,6.6357.2457.879<<,所以10.0199%-=故至少有99%以上的把握认为“爱好该项运动与性别有关”,故答案为:99%14.5%【分析】根据观测值k ≈4.844以及独立性检验的基本思想即可得出结果.【详解】K 2的观测值k ≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.故答案为:5%15.(1)63;(2)表格见解析,有.【分析】(1)每组数据区间中点值乘以该组的频率求和可得答案;(2)根据每组频率乘以50可得每组的人数可完成列联表,计算2K 可得答案.【详解】(1)该市市民平均月收入的估计值为400.1500.2600.3700.2800.1900.163⨯+⨯+⨯+⨯+⨯+⨯=.(2)根据频率分布直方图知每组的人数分别为5,10,15,10,5,5.可得22⨯列联表如下:所以()22502882128.33340103020K ⨯⨯-⨯=≈⨯⨯⨯,因为8.333 6.635>,所以有99%的把握认为市民对楼市限购令的态度与收入有关.16.(1)225;(2)列联表答案见解析,没有90%的把握认为“大学生上网时间与性别有关”.【分析】(1)设上网时间不少于60分钟的人数为x ,依题意有30750100x =,计算即可; (2)填写列联表,计算2K ,对照临界值得出结论.【详解】(1)设上网时间不少于60分钟的人数为x ,依题意有30750100x =,解得225x =,所以估计其中上网时间不少于60分钟的人数是225.(2)塻22⨯列联表如下:由表中数据可得到22200(60304070) 2.20 2.70610010013070K ⨯-⨯=≈<⨯⨯⨯, 故没有90%的把握认为“大学生上网时间与性别有关”.17.(1)表格见解析,不能;(2)710. 【分析】(1)根据已知数据统计列联表中的各项的人数,填写列联表,进而计算2K 并与0.1的临界值进行比较,得到论断;(2)利用分层抽样的等比例原则求得抽取的5人中男女生的人数,利用符号表示每个学生,利用列举法计数,得到所求概率.【详解】解:(1)填写的列联表如下所示:()2210222422320.506 2.70644565446K ⨯⨯-⨯=≈<⨯⨯⨯.所以不能在犯错误的概率不超过0.1的前提下认为“男生和女生在使用健身器材的爱好方面有差异”.(2)从每周使用健身器材3次的学生中,利用分层抽样的方法抽取5名学生,则抽取男生3名,抽取女生2名.将抽取的3名男生分别记为a ,b ,c ,2名女生分别记为m ,n ,则从5人中随机抽取3人的不同情况有abc ,abm ,abn ,acm ,acn ,amn ,bcm ,bcn ,bmn ,cmn ,共10种, 其中至多有一名女生的情况有abc ,abm ,abn ,acm ,acn ,bcm ,bcn ,共7种. 所以从抽取的5名学生中随机抽取3人,至多有一名女生的概率为710. 18.(1)答案见解析;(2)不能.【分析】(1)由题意填写列联表即可;(2)代入数据计算2K 的观测值,比较观测值与3.841的大小,判断能否在犯错误的概率不超过0.05的前提下认为“性别与休闲方式有关系” .【详解】解.(1)根据题目所提供的调查结果,可得下列22⨯列联表:(2)根据列联表中的数据,可计算()2211030352025 3.66750605555K ⨯⨯-⨯=≈⨯⨯⨯,因为03.667 3.841k k ≈<=,所以不能在犯错误的概率不超过0.05的前提下认为“性别与休闲方式有关系”.。
高考衣食住用行衣:高考前这段时间,提醒同学们出门一定要看天气,否则淋雨感冒,就会影响考场发挥。
穿着自己习惯的衣服,可以让人在紧张时产生亲切感和安全感,并能有效防止不良情绪产生。
食:清淡的饮食最适合考试,切忌吃太油腻或者刺激性强的食物。
如果可能的话,每天吃一两个水果,补充维生素。
另外,进考场前一定要少喝水!住:考前休息很重要。
好好休息并不意味着很早就要上床睡觉,根据以往考生的经验,太早上床反而容易失眠。
考前按照你平时习惯的时间上床休息就可以了,但最迟不要超过十点半。
用:出门考试之前,一定要检查文具包。
看看答题的工具是否准备齐全,应该带的证件是否都在,不要到了考场才想起来有什么工具没带,或者什么工具用着不顺手。
行:看考场的时候同学们要多留心,要仔细了解自己住的地方到考场可以坐哪些路线的公交车?有几种方式可以到达?大概要花多长时间?去考场的路上有没有修路堵车的情况?考试当天,应该保证至少提前20分钟到达考场。
2017年普通高等学校招生全国统一考试(全国I卷)理科数学注意事项:1.答卷前,考生务必将自己的姓名、准考证号填写在答题卡上,2.回答选择题时,选出每小题答案后,用铅笔把答题卡上对应的答案标号涂黑,如需改动,用橡皮擦干净后,再选涂其他答案标号。
回答非选择题时,将答案写在答题卡上。
写在本试卷上无效。
3.考试结束后,将本试卷和答题卡一并交回。
一、选择题:本题共12小题,每小题5分,共60分。
在每小题给出的四个选项中,只有一项是符合题目要求的。
1. 已知集合{}{}131x A x x B x =<=<,,则() A .{}0=<I A B x x B .A B =R U C .{}1=>U A B x xD .A B =∅I【答案】A【解析】{}1A x x =<,{}{}310xB x x x =<=<∴{}0A B x x =<I ,{}1A B x x =<U , 选A2. 如图,正方形ABCD 内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分位于正方形的中心成中心对称,在正方形内随机取一点,则此点取自黑色部分的概率是()A .14B .π8C .12D .π4【答案】B【解析】设正方形边长为2,则圆半径为1则正方形的面积为224⨯=,圆的面积为2π1π⨯=,图中黑色部分的概率为π2则此点取自黑色部分的概率为ππ248=故选B3. 设有下面四个命题()1p :若复数z 满足1z∈R ,则z ∈R ;2p :若复数z 满足2z ∈R ,则z ∈R ;3p :若复数12z z ,满足12z z ∈R ,则12z z =; 4p :若复数z ∈R ,则z ∈R .A .13p p ,B .14p p ,C .23p p ,D .24p p ,【答案】B【解析】1:p 设z a bi =+,则2211a bi z a bi a b -==∈++R ,得到0b =,所以z ∈R .故1P 正确; 2:p 若z =-21,满足2z ∈R ,而z i =,不满足2z ∈R ,故2p 不正确;3:p 若1z 1=,2z 2=,则12z z 2=,满足12z z ∈R ,而它们实部不相等,不是共轭复数,故3p 不正确;4:p 实数没有虚部,所以它的共轭复数是它本身,也属于实数,故4p 正确;4. 记n S 为等差数列{}n a 的前n 项和,若4562448a a S +==,,则{}n a 的公差为() A .1 B .2C .4D .8【答案】C【解析】45113424a a a d a d +=+++=61656482S a d ⨯=+= 联立求得11272461548a d a d +=⎧⎪⎨+=⎪⎩①②3⨯-①②得()211524-=d624d =4d =∴ 选C5. 函数()f x 在()-∞+∞,单调递减,且为奇函数.若()11f =-,则满足()121f x --≤≤的x 的取值范围是() A .[]22-, B .[]11-, C .[]04, D .[]13,【答案】D【解析】因为()f x 为奇函数,所以()()111f f -=-=,于是()121f x --≤≤等价于()()()121f f x f --≤≤| 又()f x 在()-∞+∞,单调递减 121x ∴--≤≤3x ∴1≤≤ 故选D6. ()62111x x ⎛⎫++ ⎪⎝⎭展开式中2x 的系数为A .15B .20C .30D .35【答案】C.【解析】()()()66622111+1111x x x x x ⎛⎫+=⋅++⋅+ ⎪⎝⎭对()61x +的2x 项系数为2665C 152⨯== 对()6211x x⋅+的2x 项系数为46C =15, ∴2x 的系数为151530+= 故选C7. 某多面体的三视图如图所示,其中正视图和左视图都由正方形和等腰直角三角形组成,正方形的边长为2,俯视图为等腰直角三角形、该多面体的各个面中有若干是梯形,这些梯形的面积之和为A .10B .12C .14D .16【答案】B【解析】由三视图可画出立体图该立体图平面内只有两个相同的梯形的面 ()24226S =+⨯÷=梯6212S =⨯=全梯 故选B8. 右面程序框图是为了求出满足321000n n ->的最小偶数n ,那么在和可以分别填入A .1000A >和1n n =+B .1000A >和2n n =+C .1000A ≤和1n n =+D .1000A ≤和2n n =+ 【答案】D【答案】因为要求A 大于1000时输出,且框图中在“否”时输出∴“”中不能输入A 1000> 排除A 、B又要求n 为偶数,且n 初始值为0, “”中n 依次加2可保证其为偶 故选D9. 已知曲线1:cos C y x =,22π:sin 23C y x ⎛⎫=+ ⎪⎝⎭,则下面结论正确的是()A .把1C 上各点的横坐标伸长到原来的2倍,纵坐标不变,再把得到的曲线向右平移π6个单位长度,得到曲线2CB .把1C 上各点的横坐标伸长到原来的2倍,纵坐标不变,再把得到的曲线向左平移π12个单位长度,得到曲线2CC .把1C 上各点的横坐标缩短到原来的12倍,纵坐标不变,再把得到的曲线向右平移π6个单位长度,得到曲线2CD .把1C 上各点的横坐标缩短到原来的2倍,纵坐标不变,再把得到的曲线向左平移π12个单位长度,得到曲线2C 【答案】D【解析】1:cos C y x =,22π:sin 23⎛⎫=+ ⎪⎝⎭C y x首先曲线1C 、2C 统一为一三角函数名,可将1:cos C y x =用诱导公式处理.πππcos cos sin 222⎛⎫⎛⎫==+-=+ ⎪ ⎪⎝⎭⎝⎭y x x x .横坐标变换需将1=ω变成2=ω,即112πππsin sin 2sin 2224⎛⎫⎛⎫⎛⎫=+−−−−−−−−−→=+=+ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭C 上各坐短它原y x y x x 点横标缩来 2ππsin 2sin 233⎛⎫⎛⎫−−→=+=+ ⎪ ⎪⎝⎭⎝⎭y x x .注意ω的系数,在右平移需将2=ω提到括号外面,这时π4+x 平移至π3+x , 根据“左加右减”原则,“π4+x ”到“π3+x ”需加上π12,即再向左平移π12.10. 已知F 为抛物线C :24y x =的交点,过F 作两条互相垂直1l ,2l ,直线1l 与C 交于A 、B 两点,直线2l 与C 交于D ,E 两点,AB DE +的最小值为() A .16B .14C .12D .10【答案】A 【解析】设AB 倾斜角为θ.作1AK 垂直准线,2AK 垂直x 轴易知11cos 22⎧⎪⋅+=⎪⎪=⎨⎪⎛⎫⎪=--= ⎪⎪⎝⎭⎩AF GF AK AK AF P P GP Pθ(几何关系)(抛物线特性)cos AF P AF θ⋅+=∴同理1cos P AF θ=-,1cos PBF θ=+∴22221cos sin P PAB θθ==- 又DE 与AB 垂直,即DE 的倾斜角为π2θ+2222πcos sin 2P PDE θθ==⎛⎫+ ⎪⎝⎭而24y x =,即2P =.∴22112sin cos AB DE P θθ⎛⎫+=+ ⎪⎝⎭2222sin cos 4sin cos θθθθ+=224sin cos θθ=241sin 24=θ 21616sin 2θ=≥,当π4θ=取等号 即AB DE +最小值为16,故选A11. 设x ,y ,z 为正数,且235x y z ==,则()A .235x y z <<B .523z x y <<C .352y z x <<D .325y x z <<【答案】D【答案】取对数:ln 2ln3ln5x y ==.ln33ln 22x y => ∴23x y > ln2ln5x z = 则ln55ln 22x z =< ∴25x z <∴325y x z <<,故选D12. 几位大学生响应国家的创业号召,开发了一款应用软件,为激发大家学习数学的兴趣,他们推出了“解数学题获取软件激活码”的活动,这款软件的激活码为下面数学问题的答案:已知数列1,1,2,1,2,4,1,2,4,8,1,2,4,8,16,…,其中第一项是02,接下来的两项是02,12,在接下来的三项式62,12,22,依次类推,求满足如下条件的最小整数N :100N >且该数列的前N 项和为2的整数幂.那么该款软件的激活码是( ) A .440 B .330 C .220 D .110 【答案】A【解析】设首项为第1组,接下来两项为第2组,再接下来三项为第3组,以此类推.设第n 组的项数为n ,则n 组的项数和为()12n n +由题,100N >,令()11002n n +>→14n ≥且*n ∈N ,即N 出现在第13组之后第n 组的和为122112nn -=-- n 组总共的和为()2122212n nn n --=---若要使前N 项和为2的整数幂,则()12n n N +-项的和21k -应与2n --互为相反数即()*21214k n k n -=+∈N ,≥ ()2log 3k n =+→295n k ==,则()2912954402N ⨯+=+=故选A二、 填空题:本题共4小题,每小题5分,共20分。
高中数学独立性检验精选题目(附解析)(1)分类变量和列联表①分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.②列联表(ⅰ)定义:列出的两个分类变量的频数表,称为列联表.(ⅱ)2×2列联表.一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为(2)等高条形图①等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.②观察等高条形图发现aa+b和cc+d相差很大,就判断两个分类变量之间有关系.(3)独立性检验一、用2×2列联表分析两分类变量间的关系1.在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用aa+b与cc+d判断二者是否有关系.解:2×2列联表如下:a a+b =4364=0.671 875.cc+d=2760=0.45.显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.注:(1)作2×2列联表时,关键是对涉及的变量分清类别.计算时要准确无误.(2)利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将aa+b与cc+d⎝⎛⎭⎪⎫ba+b与dc+d的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.2.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:则当m取下面何值时,X)A.8B.9C.14D.19解析:选C由10×26≈18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.3.分类变量X和Y的列联表如下:则下列说法正确的是()A.ad-bc越小,说明X与Y关系越弱B.ad-bc越大,说明X与Y关系越强C.(ad-bc)2越大,说明X与Y关系越强D.(ad-bc)2越接近于0,说明X与Y关系越强解析:选C|ad-bc|越小,说明X与Y关系越弱,|ad-bc|越大,说明X与Y关系越强.4.假设有两个变量X与Y,它们的取值分别为x1,x2和y1,y2,其列联表为:为()A.a=50,b=40,c=30,d=20B.a=50,b=30,c=40,d=20C.a=20,b=30,c=40,d=50 D.a=20,b=30,c=50,d=40解析:选D当(ad-bc)2的值越大,随机变量K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)的值越大,可知X与Y有关系的可能性就越大.显然选项D中,(ad-bc)2的值最大.5.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:________(填“是”或“否”).解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即ba+b=1858,dc+d=2742,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.答案:是二、用等高条形图分析两分类变量间的关系1.某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系.解:作列联表如下:续表考前心情不紧94381475张总计426594 1 020相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例高,可以认为考前紧张与性格类型有关.注:利用等高条形图判断两个分类变量是否相关的步骤:2.在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?解:根据题目给出的数据作出如下的列联表:色盲不色盲总计男38442480女6514520总计449561000根据列联表作出相应的等高条形图:从等高条形图来看,在男人中患色盲的比例要比在女人中患色盲的比例大得多,因此,我们认为患色盲与性别是有关系的.3.观察下列各图,其中两个分类变量x,y之间关系最强的是()解析:选D在四幅图中,D图中两个深色条的高相差最明显,说明两个分类变量之间关系最强.4.在独立性检验中,可以粗略地判断两个分类变量是否有关系的是() A.散点图B.等高条形图C.假设检验的思想D.以上都不对解析:选B用等高条形图可以粗略地判断两个分类变量是否有关系,体现了数形结合思想,但是无法给出结论的可信程度,故选B.5.为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:父母吸烟父母不吸烟总计子女吸烟23783320子女不吸烟678522 1 200总计915605 1 520利用等高条形图判断父母吸烟对子女吸烟是否有影响?解:等高条形图如图所示:由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.三、独立性检验1.研究人员选取170名青年男女大学生为样本,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的有22名,否定的有38名;110名男生在相同的项目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?用独立性检验的方法判断.(链接教材P95-例1)附:解:根据2×2k=170×(22×38-22×88)2110×60×44×126≈5.622>5.024.所以在犯错误的概率不超过0.025的前提下,认为“性别与态度有关系”.注:根据题意列出2×2列联表,计算K2的观测值,如果K2的观测值很大,说明两个分类变量有关系的可能性很大;如果K2的观测值比较小,则认为没有充分的证据显示两个分类变量有关系.2.“开门大吉”是某电视台推出的游戏节目.选手面对1~8号8扇大门,依次按响门上的门铃,门铃会播放一段音乐(将一首经典流行歌曲以单音色旋律的方式演绎),选手需正确回答出这首歌的名字,方可获得该扇门对应的家庭梦想基金.在一次场外调查中,发现参赛选手多数分为两个年龄段:20~30;30~40(单位:岁),其猜对歌曲名称与否的人数如图所示.(1)写出2×2列联表;判断能否在犯错误的概率不超过0.10的前提下认为猜对歌曲名称与年龄有关系;说明你的理由;(下面的临界值表供参考)P(K2≥k0)0.100.050.0100.005k0 2.706 3.841 6.6357.879(2)6名选手,并抽取3名幸运选手,求3名幸运选手中至少有一人在20~30岁之间的概率.解:(1)根据所给的二维条形图得到列联表:正确错误总计20~30岁10304030~40岁107080总计20100120k=120×(10×70-10×30)220×100×40×80=3.∵3>2.706,∴在犯错误的概率不超过0.10的前提下认为猜对歌曲名称与年龄有关系.(2)按照分层抽样方法可知,20~30(岁)抽取:6×40120=2(人);30~40(岁)抽取:6×80120=4(人).在上述抽取的6名选手中,年龄在20~30(岁)有2人,年龄在30~40(岁)有4人.记至少有一人年龄在20~30岁为事件A,则P(A)=1-C34C36=1-420=45.故至少有一人年龄在20~30岁之间的概率为4 5.3.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差B.回归分析C.独立性检验D.概率解析:选C判断两个分类变量是否有关的最有效方法是进行独立性检验.4.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是() A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大解析:选B k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,即k越小,“X与Y有关系”的可信程度越小.5.某班主任对全班50名学生进行了作业量的调查,数据如下表,则学生的性别与认为作业量的大小有关的把握大约为()A.99%C.90% D.无充分证据解析:选B由2×2列联表得K2的观测值k=50×(18×15-8×9)2 27×23×26×24≈5.059>5.024,故有97.5%的把握认为学生性别与认为作业量大小有关,故选B.6.为了解决高二年级统计案例入门难的问题,某校在高一年级的数学教学中设有试验班,着重加强统计思想的渗透,下面是高二年级统计案例的测验成绩统计表(单位:分)的一部分,试分析试验效果.附:解:k=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100(32×38-18×12)250×50×44×56≈16.234.因为16.234>6.635,所以,在犯错误的概率不超过0.01的前提下认为高二年级统计案例的测试成绩与高一年级数学教学中增加统计思想的渗透有联系.巩固练习:1.下列关于K2的说法不正确的是()A.根据2×2列联表中的数据计算得出K2的观测值k≥6.635,而P(K2≥6.635)≈0,01,则有99%的把握认为两个分类变量有关系B.K2的观测值k越大,两个分类变量的相关性就越大C.K2是用来判断两个分类变量是否有关系的随机变量D.K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d为样本容量解析:选D D选项的公式中分子应该是n(ad-bc)2.故选D.2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1表2A.成绩B.视力C.智商D.阅读量解析:选D因为K21=52×(6×22-14×10)2 16×36×32×20=52×8216×36×32×20,K22=52×(4×20-16×12)216×36×32×20=52×112216×36×32×20,K23=52×(8×24-12×8)216×36×32×20=52×96216×36×32×20,K24=52×(14×30-6×2)216×36×32×20=52×408216×36×32×20,则有K24>K22>K23>K21,所以阅读量与性别有关联的可能性最大.2.在某次独立性检验中,得到如下列联表:最后发现,两个分类变量没有任何关系,则a的值可能是() A.200 B.720C.100 D.180解析:选B由于A和B没有任何关系,根据列联表可知2001 000和180180+a基本相等,检验可知,B满足条件,故选B.3.两个分类变量X,Y,它们的取值分别为{x1,x2}和{y1,y2},其列联表为:若两个分类变量X,Y没有关系,则下列结论正确的是________(填序号).①ad≈bc;②aa+b≈cc+d;③c+da+b+c+d≈b+da+b+c+d;④c+aa+b+c+d≈b+da+b+c+d;⑤(a+b+c+d)(ad-bc)2(a+b)(b+d)(a+c)(c+d)≈0.解析:因为分类变量X,Y独立,所以aa+b ≈cc+d,化简得ad≈bc,所以①②⑤正确,③④显然不正确.答案:①②⑤4.随着生活水平的提高,人们患肝病的越来越多,为了解中年人患肝病与经常饮酒是否有关,现对30名中年人进行了问卷调查得到如下列联表:已知在全部30人中随机抽取1人,抽到肝病患者的概率为4 15.(1)请将上面的列联表补充完整,并判断是否有99.5%的把握认为患肝病与常饮酒有关?说明你的理由;(2)现从常饮酒且患肝病的中年人(恰有2名女性)中,抽取2人参加电视节目,则正好抽到一男一女的概率是多少?解:(1)设患肝病中常饮酒的人有x人,x+230=415,x=6.常饮酒不常饮酒总计患肝病628 不患肝病41822 总计102030由已知数据可求得K2=30×(6×18-2×4)210×20×8×22≈8.523>7.879,因此有99.5%的把握认为患肝病与常饮酒有关.(2)设常饮酒且患肝病的男性为A,B,C,D,女性为E,F,则任取两人有AB,AC,AD,AE,AF,BC,BD,BE,BF,CD,CE,CF,DE,DF,EF,共15种.其中一男一女有AE,AF,BE,BF,CE,CF,DE,DF,共8种.故抽出一男一女的概率是P=8 15.5.某食品厂为了检查甲乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的质量(单位:克),质量值落在(495,510]的产品为合格品,否则为不合格品.表1是甲流水线样本频数分布表,图1是乙流水线样本频率分布直方图.表1甲流水线样本频数分布表产品质量/克频数(490,495] 6(495,500]8(500,505]14(505,510]8(510,515] 4(1)根据上表数据作出甲流水线样本频率分布直方图;(2)若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率分别是多少;(3)由以上统计数据作出2×2列联表,并回答在犯错误的概率不超过多少的前提下认为“产品的包装质量与两条要自动包装流水线的选择有关”.解:(1)甲流水线样本频率分布直方图如下:(2)由表1知甲样本合格品数为8+14+8=30,由图1知乙样本中合格品数为(0.06+0.09+0.03)×5×40=36,故甲样本合格品的频率为3040=0.75,乙样本合格品的频率为3640=0.9,据此可估计从甲流水线任取1件产品,该产品恰好是合格品的概率为0.75. 从乙流水线任取1件产品,该产品恰好是合格品的概率为0.9. (3)2×2列联表如下:甲流水线 乙流水线 总计 合格品 a =30 b =36 66 不合格品 c =10 d =4 14 总计4040n =80因为K 2k =n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=80×(120-360)266×14×40×40≈3.117>2.706, 所以在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关.。
《独立性检验》练习题一、选择题1.下面是一个2×2列联表y 1y 2总计x 1a 2173x 222527总计b46则表中a、b 处的值分别为()A.94、96B.52、50C.52、54D.54、522.关于独立性检验的说法中,错误的是()A.独立性检验依据小概率原理B.独立性检验原理得到的结论一定正确C.样本不同,独立性检验的结论可能有差异D.独立性检验不是判定两类事物是否相关的唯一方法3.利用独立性检验来考察两个分类变量X 和Y 是否有关系时,通过查阅下表来确定断言“X 与Y 有关系”的可信程度.如果k 2>5.024,那么就有把握认为“X 与Y 有关系”的百分比为()A.25%B.75%C.2.5%D.97.5%4.高二第二学期期中考试,按照甲、乙两个班级学生数学考试成绩优秀和不优秀统计后,得到如下列联表:班级与成绩列联表优秀不优秀总计甲班113445乙班83745总计197190则随机变量2K 的观测值约为()A.0.60B.0.828C.2.712D.6.0045.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若K 2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;)k (K 02 P 0.500.400.250.150.100.050.0250.0100.0050.001k 0.4550.708 1.323 2.072 2.706 3.841 5.0246.6357.87910.828B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推判出现错误;D.以上三种说法都不正确.6.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110计算得,()22110403020207.860506050K⨯⨯-⨯=≈⨯⨯⨯.2()P K k≥0.0500.0100.001 k3.8416.63510.828参照附表,得到的正确结论是A.再犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.再犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”7.对分类变量X与Y的随机变量2K的观测值K,说法正确的是()A.k越大,“X与Y有关系”可信程度越小;B.k越小,“X与Y有关系”可信程度越小;C.k越接近于0,“X与Y无关”程度越小D.k越大,"X与Y无关”程度越大8.冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表所示.根据以上数据,则()A.含杂质的高低与设备改造有关B.含杂质的高低与设备改造无关C.设备是否改造决定含杂质的高低D.以上答案都不对9、分类变量X和Y的列联表如下y 1y2总计x1x b x+bx 2c d c+d杂质高杂质低旧设备37121新设备22202总计x+c b+d x+b+c+d则下列说法正确的是()A.xd-bc 越小,说明X 和Y 关系越弱B.xd-bc 越大,说明X 和Y 关系越强C.(xd-bc)2越大,说明X 和Y 关系越强D.(xd-bc)2越接近于0,说明X 和Y 关系越强10、某医疗研究所为了检验新研发的流感疫苗对甲型的H1N1流感的预防作用,把1000名注射了疫苗的人与另外1000名未注射疫苗的人的半年的感冒记录作比较,提出假设0H :“这种疫苗不能起到预防甲型H1N1流感的作用”,并计算出)635.6(2≥K P 01.0≈,则下列说法正确的是()A、这种疫苗能起到预防甲型H1N1流感的有效率为1%;B、若某人未使用该疫苗,则他在半年中有99%的可能性得到甲型H1N1;C、有1%的把握认为“这种疫苗不能起到预防甲型H1N1流感的作用”D、有99%的把握认为“这种疫苗不能起到预防甲型H1N1流感的作用”二、填空题11、我们常利用随机变量2K 来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验,其思想类似于数学上的.12.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:性别专业非统计专业统计专业男1310女720为了判断主修统计专业是否与性别有关系,根据表中的数据,得到=k (保留三位小数)13、为了探究50岁以上的人患慢性气管炎与吸烟有无关系时,提出的假设是;14、通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110则2K 的观测值=k (保留一位小数)15、假设有两个分类变量X 和Y,它们的取值分别为}{21,x x 和}{21,y y ,其2×2联表为:1y 2y 总计1x a b a+b 2x c d c+d 总计a+cb+da+b+c+d定义||dc cb a a W +-+=,则W 越(大或小),就有利于结论“X 和Y 有关系”;W 越(大或小),就越有利于结论“X 和Y 没有关系”;三、解答题16.某企业为考察生产同一种产品的甲、乙两条生产线的产品合格率,同时各抽取100件产品,检验后得到如下列联表:生产线与产品合格数列联表合格不合格总计甲线973100乙线955100总计1928200请问甲、乙两线生产的产品合格率在多大程度上有关系?17.在对人们的休闲方式的一次调查中,共调查了120人,其中女性60人,男性60人。
专题19 独立性检验一、解答题1.(2022·全国·高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.(|) (|)P B A P B A 与(|)(|)P B AP B A的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.(ⅰ)证明:(|)(|)(|)(|)P A B P A BRP A B P A B=⋅;(ⅰ)利用该调查数据,给出(|),(|)P A B P A B的估计值,并利用(ⅰ)的结果给出R的估计值.附22()()()()()n ad bcKa b c d a c b d-=++++,A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,()2P K k0.1000.0500.010k 2.706 3.841 6.6353.(2021·全国·高考真题(文))甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++)国内某大学有男生6000人,女生4000人,该校想了解本校学生的运动状况,根据性别采取分层抽样的方法从全校学生中抽取100人,调查他们平均每天运动的时间(单位:小时),统计表明该校学生平均每天运动的时间范围是[]0,3,若规定平均每天运动的时间不少于2小时的学生为“运动达人”,低于2小时的学生为“非运动达人”.根据调查的数据按性别与“是否为‘运动达人’”进行统计,得到如下2×2列联表:前提下认为性别与“是否为‘运动达人’”有关;(2)将此样本的频率估计为总体的概率,随机调查该校的3名男生,设调查的3人中运动达人的人数为随机变量X ,求X 的分布列和数学期望()E X 及方差()D X . 附表及公式:2()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.5.(2022·青海·海东市第一中学模拟预测(文))某公司为了解用户对公司生产的产品的满意度做了一次随机调查,共随机选取了100位用户对其产品进行评分.用户对产品评分情况如表所示(已知满分100分,选取的100名用户的评分分值在区间[)70,100上).选取的100名用户中男性用户评分情况:(1)分别估计用户对产品评分分值在,,的概率;(2)若用户评分分值不低于80分,则定位用户对产品满意.填写下面的22⨯列联表,并分析有没有95%以上的把握认为用户对产品满意与否与性别有关?参考公式与数据:22()()()()()n ad-bcKa+b c+d a+c b+d=,n a b c d=+++.100周年,举办一系列活动,通过调查得知其中参加文艺活动与体育活动的居民人数如下表:0.5%的前提下认为参加活动的类型与性别有关?(2)在参加活动的男性居民中,用分层抽样方法抽取7人,再从这7人中随机抽取3人接受采访,记抽到参加文艺活动的人数为X,求X的分布列与期望.附:()()()()2()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.7.(2022·山西大附中三模(文))甲、乙两所学校高三年级分别有1000人,1100人,为了了解两所学校全体高三年级学生高中某学科基础知识测试情况,采用分层抽样方法从两个学校一共抽取了105名学生的该学科成绩,并作出了如下的频数分布统计表,规定考试成绩在[120,150]内为优秀. 甲校:(2)由以上统计数据填写下面2×2列联表,若按是否优秀来判断,是否有97.5%的把握认为两个学校的数学成绩有差异?规定;分数不低于125分为优秀.(1)求本次成绩的众数、中位数;(2)从该班中任意抽取一位学生,求该学生成绩优秀的概率;(3)完成下列22⨯列联表,并判断是否有90%的把握认为学生数学成绩是否优秀与性别有关?附:()()()()2n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.2022年2月4日在北京开幕,本次冬季奥运会共设7个大项,15个分项,109个小项.为调查学生对冬季奥运会项目的了解情况,某大学进行了一次抽样调查,若被调查的男女生人数均为10m (*m ∈N ),统计得到以下22⨯列联表,经过计算可得2 4.040K ≈.(2)为弄清学生不了解冬季奥运会项目的原因,采用分层抽样的方法从抽取的不了解冬季奥运会项目的学生中随机抽取9人,再从这9人中抽取2人进行面对面交流,求“至少抽到一名女生”的概率. 附:独立性检验临界值表(参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++)10.(2022·吉林·洮南市第一中学模拟预测(文))某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如表:(2)用分层抽样的方法从喜欢统计课程的学生中抽取6名学生做进一步调查,将这6名学生作为一个样本,从中任选2人,求恰有1个男生和1个女生的概率.附:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++,11.(2022·河南·平顶山市第一高级中学模拟预测(文))2021年10月1日是中华人民共和国第72个国庆日,很多人通过短视频APP或微信、微博表达了对祖国的祝福.某调查机构为了解通过短视频APP或微信、微博表达对祖国祝福的人们是否存在年龄差异,将年龄不低于45岁的人称为中老年,低于45岁的人称为青少年.通过不同途径调查了数千个通过短视频APP或微信、微博表达对祖国祝福的人,并从参与者中随机选出400人.经统计这400人中通过微信、微博表达对祖国祝福的有320人,其中中老年占25,这400人中通过短视频APP表达对祖国祝福的青少年有28人.(1)完成下列22⨯列联表,并判断是否有99.9%的把握认为通过短视频APP或微信、微博表达对祖国的祝福与年龄有关?5人,再从这5人中随机抽取2人,求这2人中恰好有一个是青少年的概率. 附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.12.(2022·河南开封·模拟预测(理))大豆是我国重要的农作物,种植历史悠久.某种子实验基地培育出某大豆新品种,为检验其最佳播种日期,在A ,B 两块试验田上进行实验(两地块的土质等情况一致).6月25日在A 试验田播种该品种大豆,7月10日在B 试验田播种该品种大豆.收获大豆时,从中各随机抽取20份(每份1千粒),并测量出每份的质量(单位:克),按照[)100,150,[)150,200,[]200,250进行分组,得到如下表格:(1)判断是否有97.5%的把握认为大豆籽粒饱满与播种日期有关?(2)从A ,B 两块实验田中各抽取一份大豆,求抽取的大豆中至少有一份籽粒饱满的概率;(3)用样本估计总体,从A 试验田随机抽取100份(每份千粒)大豆,记籽粒饱满的份数为X ,求X 的数学期望和方差.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.数均为()*10n n ∈N ,统计得到以下2×2列联表,经过计算可得2 4.040K ≈.(2)①为弄清学生不喜欢长跑的原因,采用分层抽样的方法从调查的不喜欢长跑的学生中随机抽取9人,再从这9人中抽取3人进行面对面交流,求“至少抽到一名女生”的概率;②将频率视为概率,用样本估计总体,从该校全体学生中随机抽取10人,记其中对长跑喜欢的人数为X,求X的数学期望.附表:附:()()()()()22n ad bcKa b c d a c b d-=++++.14.(2022·四川省泸县第二中学模拟预测(理))中国探月工程自2004年立项以来,聚焦“自主创新、重点跨越、支撑发展、引领未来”的目标,创造了许多项中国首次.2020年12月17日凌晨,嫦娥五号返回器携带“月壤”着陆地球,又首次实现了我国地外天体无人采样返回.为了了解某中学高三学生对此新闻事件的关注程度,从该校高三学生中随机抽取了50名学生进行调查,调查样本中有20名女生.如图是根据样本的调查结果绘制的等高条形图(阴影区域表示关注“嫦娥五号”的部分).“嫦娥五号”的关注程度与性别有关”? (2)若将频率视为概率,现从该中学高三的女生中随机抽取3人.记被抽取的3名女生中对“嫦娥五号”新闻关注的人数为随机变量X ,求X 的分布列及数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)如今大家对运动越来越重视,讨论也越来越多,时常听到有人说“有氧运动”和“无氧运动”,有氧运动主要的作用是健身,而无氧运动主要的作用是塑形,一般的健身计划都是有氧运动配合无氧运动以达到强身健体的目的.某健身机构对其60位会员的健身运动进行了一次调查,统计发现有氧运动为主的有42人,30岁以下无氧运动为主的有12人,占30岁以下调查人数的25. (1)根据以上数据完成如下22⨯列联表;附:参考公式:()()()()2n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.16.(2022·四川省宜宾市第四中学校模拟预测(文))为了助力北京2022年冬奥会、冬残奥会,某校组织全校学生参与了奥运会项目知识竞赛. 为了解学生的竞赛成绩(竞赛成绩都在区间[50,100]内)的情况,随机抽取n 名学生的成绩,并将这些成绩按照[50,60),[60,70),[70,80),[80,90),[90,100]分成5组,制成了如图所示的频率分布直方图.其中[50,60),[60,70),[70,80)三组的频率成等比数列,且成绩在[90,100]的有16人.(1)求n 的值;(2)在这n 名学生中,将成绩在[80,100]的学生定义为“冬奥达人”,成绩在[50,80)的学生定义为“非冬奥达人”.请将下面的列联表补充完整,并判断是否有99%的把握认为“是否是冬奥达人与性别有关”?并说明你的理由.参考公式:2()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.临界值表:据《漳州府志》记载,漳州地区在宋代就已经有布袋木偶戏了,清朝中叶后,布袋木偶戏开始进入兴盛时期,一直到抗日战争前,漳州的龙溪、漳浦、海澄、长泰等县,几乎乡乡都有布袋木偶戏,在传承的基础上,不断创新和发展壮大,走向更广阔的世界,为了了解民众对布袋木偶戏的了解程度,某单位随机抽取了漳州地区男女各100名市民,进行问卷调查根据调查结果绘制出得分条形图,如图所示形图,完成22⨯联表,并根据列联表,判断能否有90%的把握认为对布袋木偶戏的了解程度与性别有关?(2)恰逢三八妇女节,该单位对参与调查问卷的女市民制定如下抽奖方案;得分低于60分的可以获得1次抽奖机会,得分不低于60分的可以获得2次抽奖机会,每次抽奖结果相互独立,在一次抽奖中,获得一个木偶纪念品的概率为13,获得两个木偶纪念品的概率为16,不获得木偶纪念品的概率为12,在这100名女市民中任选一人.记X为她获得木偶纪念品的个数,求X的分布列和数学期望.参考公式:22()()()()()n ad bcKa b c d a c b d-=++++参考数据.居家隔离期间,人们对社会的依赖,对政府部门的期待也达到了前所未有的高度.某机构对封管区居民对政府部门的态度进行了一项网络调查,并随机抽取了100份问卷进行了成绩统计,得到下表,规定成绩在[]70,100为满意.状相同的4个白球,4个红球的口袋中,一次摸4个球,如果摸到2个红球获得20元话费,摸到3个红球获得50元话费,4个都是红球获得100元话费,某人参加了问卷调查,他获得的话费为X元,求X的分布列及数学期望.附:()()()()()22n ad bcKa b c d a c b d-=++++卫生与健康教育工作的意见》中指出:中小学生各项身体素质有所改善,大学生整体下降.某高校为提高学生身体素质,号召全校学生参加体育锻炼运,结合“微信运动”APP每日统计运动情况,对每日平均运动10000步或以上的学生授予“运动达人”称号,低于10000步称为“参与者”,统计了200名学生在某月的运动数据,结果如下:0.1的前提下认为获得“运动达人”称号与性别有关?(2)从全校运动“参与者”中按性别分层抽取8人,再从8人中选取3人参加特训,将男生人数记为X,求X 的分布列与期望EX.参考公式:()()()()()22n ad bcXa b c d a c b d-=++++,n a b c d=+++.“天宫课堂”第二课在中国空间站开讲,神舟十三号乘组航天员翟志刚、王亚平、叶光富相互配合进行授课,中央广播总台面向全球进行现场直播.此次授课活动采取天地对话方式进行,由航天员在轨演示太空“冰雪”实验、液桥演示实验、水油分离实验、太空抛物实验,介绍与展示空间科学实施,皆在传播普及空间科学知识,激发广大青年不断追寻“科学梦”实现“航天梦”的热情.某校组织在校中学生观看学习“天宫课堂”,并对其中500名学生进行了一次“飞天宇航梦”的调查,得到如下的两个等高条形图,其中被调查的男女学生比例为3:2.(1)求m ,n 的值(结果用分数表示);(2)完成以下表格,并根据表格数据判断能否有97.5%的把握认为学生性别和有飞天宇航梦有关?5人.若从这5人中随机抽取3人进一步调查,求抽到有飞天宇航梦的女生人数X 的分布列及数学期望.附表:()()()()()2,n ad bc K n a b c d a b c d a c b d -==+++++++.。
独立性检验高考频度:★★★☆☆ 难易程度:★★★★☆(2017新课标II 文)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg ), 其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50 kg”,估计A 的概率;学*科网(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50 kg箱产量≥50 kg旧养殖法 新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较. 附:P () 0.050 0.010 0.001 k3.841 6.635 10.82822()()()()()n ad bc K a b c d a c b d -=++++.【参考答案】(1)0.62;(2)列联表见解析,有99%的把握认为箱产量与养殖方法有关;(3)新养殖法优于旧养殖法.【试题解析】(1)旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.因此,事件A的概率估计值为0.62.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.【解题必备】(1)利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.独立性检验就是考查两个分类变量是否有关系,并能较为准确地给出这种判断的可信度,随机变量的观测值k值越大,说明“两个变量有关系”的可能性越大.(2)利用频率分布直方图求众数、中位数和平均数时,应注意三点:①最高的小长方形底边中点的横坐标即众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.1.在调查学生数学成绩与物理成绩之间的关系时,得到如下数据(人数)物理成绩好物理成绩不好合计数学成绩好18 7 25数学成绩不好 6 19 25合计24 26 50有多少把握认为数学成绩与物理成绩有关?A.90% B.99%C.97.5% D.99.9%2.某学校高中毕业班有男生900人,女生600人,学校为了对高三学生数学学习情况进行分析,从高三年级按照性别进行分层抽样,抽取200名学生成绩,统计数据如下表所示:分数段(分) [50,70)[70,90)[90,110)[110,130)[130,150]总计频数2040705020200若成绩在90分以上(含90分),则成绩为及格,学#科网(1)请估计该校毕业班的平均成绩和及格学生人数;(2)如果样本数据中,有60名女生数学成绩及格,请完成如下数学成绩与性别的列联表,并判断是否有90%的把握认为“该校学生的数学成绩与性别有关”.女生男生总计及格人数60不及格人数总计参考公式:22()()()()()n ad bcKa b c d a c b d-=++++2()P K k≥0.100.0500.010k 2.706 3.841 6.6351.【答案】D【解析】根据列联表可以求得2K的观测值250(181967)11.53810.82824262525k⨯⨯-⨯=≈>⨯⨯⨯,所以有99.9%以上的把握认为数学成绩与物理成绩有关,故选D.2.【答案】(1)平均成绩约为101分,及格学生人数约为1050人;(2)没有90%的把握认为“该校学生的数学成绩与性别有关”.【解析】(1)由统计数据可知,可以用每组成绩的中点值估算出平均成绩,估计该校毕业班的平均成绩即抽取的200人的平均成绩约为1(60208040100701205014020)101200⨯⨯+⨯+⨯+⨯+⨯=(分),成绩在90分以上(含90分)的人数为70+50+20=140人,因此可以估计该校毕业班1500人中及格学生人数约为140 15001050200⨯=人.【解题必备】解决一般的独立性检验问题时,首先由2×2列联表确定a,b,c,d,n的值,然后代入随机变量2K的计算公式求出观测值k,将k与临界值k进行对比,确定有多大的把握认为“两个分类变量有关系”.。
2017年普通高等学校招生全国统一考试理综(生物部分)试题全国卷2一、选择题1.已知某种细胞有4条染色体,且两对等位基因分别位于两对同源染色体上。
某同学用示意图表示这种细胞在正常减数分裂过程中可能产生的细胞。
其中表示错误的是【答案】D【考点定位】减数分裂不同时期细胞的特征图像【名师点睛】解题关键是明确减数分裂中染色体的行为变化及减数分裂各个时期的特点,尤其是对MI后期自由组合定律实质的理解、对等位基因概念的准确掌握。
2.在证明DNA是遗传物质的过程中,T2噬菌体侵染大肠杆菌的实验发挥了重要作用。
下列与该噬菌体相关的叙述,正确的是A.T2噬菌体也可以在肺炎双球菌中复制和增殖B.T2噬菌体病毒颗粒内可以合成mRNA和蛋白质C.培养基中的32P经宿主摄取后可出现在T2噬菌体的核酸中D.人类免疫缺陷病毒与T2噬菌体的核酸类型和增殖过程相同【答案】C【考点定位】病毒的分类、遗传物质、生活方式、增殖过程【名师点睛】解题关键是理解并掌握赫尔希和蔡斯获得32P标记的T2噬菌体的方法。
本题比较容易。
3.下列关于生物体中酶的叙述,正确的是A.在细胞中,核外没有参与DNA合成的酶B.由活细胞产生的酶在生物体外没有催化活性C.从胃蛋白酶的提取液中沉淀该酶可用盐析的方法D.唾液淀粉酶催化反应最适温度和保存温度是37℃【答案】C【解析】线粒体和叶绿体中也能进行DNA复制,所以也有参与DNA合成的酶,A错误;酶是活细胞产生的,既能在生物体内发挥作用,也能在细胞外发挥作用,只要给于适宜的温度和pH,活细胞产生的酶在生物体外酶仍然有催化活性,B错误;向某些蛋白质溶液中加入某些无机盐溶液后,可以降低蛋白质的溶解度,使蛋白质凝聚而从溶液中析出,这种作用叫作盐析,可在胃蛋白酶的提取液中加浓(NH4)2SO4使蛋白质凝聚沉淀,C正确;酶在低温环境中保存,D错误。
【考点定位】酶【名师点睛】解题关键是对盐析的理解,盐析一般是指溶液中加入无机盐类而使某种物质溶解度降低而析出的过程,原理是物质在不同浓度的盐溶液中溶解度不同。
回归分析与独立性检验高考试题汇编一、选择题1.(2017山东)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为ˆˆˆybx a =+.已知101225i i x ==∑,1011600i i y ==∑,ˆ4b =.该班某学生的脚长为24,据此估计其身高为 A .160 B .163 C .166 D .1702.(2015福建)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归本线方程ˆˆˆybx a =+ ,其中ˆˆˆ0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为A .11.4万元B .11.8万元C .12.0万元D .12.2万元3.(2014重庆)已知变量x 与y 正相关,且由观测数据算得样本的平均数3x =, 3.5y =,则由该观测数据算得的线性回归方程可能为A .0.4 2.3y x =+B .2 2.4y x =-C .29.5y x =-+D .0.3 4.4y x =-+ 4.(2014湖北)根据如下样本数据得到的回归方程为ˆybx a =+,则 A .0a >,0b < B .0a >,0b > C .0a <,0b < D .0a <,0b >5.(2012新课标)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线112y x =+上,则这组样本数据的样本相关系数为 ( )A .−1B .0C .12D .16.(2014江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是7.(2012湖南)设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y =0.85x -85.71,则下列结论中不正确...的是 A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1cm ,则其体重约增加0.85kgD .若该大学某女生身高为170cm ,则可断定其体重必为58.79kg 8.(2011山东)某产品的广告费用x 与销售额y 的统计数据如下表广告费用x (万元) 4 2 3 5 销售额y (万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元二、解答题9.(2018全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1217,,…,)建立模型①:ˆ30.413.5=-+y t ;根据2010年至2016年的数据(时间变量t 的值依次为127,,…,)建立模型②:ˆ9917.5=+yt . (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.10.(2016年全国III)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(Ⅰ)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (Ⅱ)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:参考数据:719.32ii y==∑,7140.17i i i t y ==∑,721()0.55ii y y =-=∑,7≈2.646.参考公式:相关系数12211()()()(yy)ni ii n ni ii i t t y y r t t ===--=--∑∑∑,回归方程y a bt =+中斜率和截距的最小二乘估计公式分别为:121()()()niii ni i t t y y b t t ==--=-∑∑,=.a y bt -11.(2015新课标1)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量i y (i =1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中i w =w =1881i i w =∑.(Ⅰ)根据散点图判断,y a bx =+与y c =+y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程;(Ⅲ)已知这种产品的年利率z 与x 、y 的关系为0.2z y x =-.根据(Ⅱ)的结果回答下列问题:(ⅰ)年宣传费x =49时,年销售量及年利润的预报值是多少? (ⅱ)年宣传费x 为何值时,年利率的预报值最大?附:对于一组数据11(,)u v ,22(,)u v ,⋅⋅⋅,(,)n n u v ,其回归线v u αβ=+的斜率和截距的最小二乘估计分别为121()()ˆ()niii nii u u v v u u β==--=-∑∑,ˆˆv uαβ=-. 12.(2014新课标2)某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表:(Ⅰ)求y 关于t 的线性回归方程;(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:()()()121nii i ni i tty y b t t ∧==--=-∑∑,ˆˆay bt =- 13.(2012辽宁)电视传媒公司为了解某地区电视观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.2 列联表,并据此资料你是否认为“体育迷”与性别有关?(I)根据已知条件完成下面2非体育迷体育迷合计男女合计(II)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性.若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.。
概率与统计 专题四:独立性检验一、知识储备 1.22⨯列联表设X ,Y 为两个变量,它们的取值分别为12{}x x ,和12{}y y ,,其样本频数列联表(22⨯列联表)如下:2.独立性检验利用随机变量2K (也可表示为2χ)2()()()()()n ad bc a b c d a c b d -=++++(其中n a b c d =+++为样本容量)来判断“两个变量有关系”的方法称为独立性检验. 3.独立性检验的一般步骤(1)根据样本数据列出22⨯列联表;(2)计算随机变量2K 的观测值k ,查下表确定临界值k 0:(3)如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过()20P K k ≥;否则,就认为在犯错误的概率不超过()20P K k ≥的前提下不能推断“X 与Y 有关系”.【注意】(1)通常认为 2.706k ≤时,样本数据就没有充分的证据显示“X 与Y 有关系”.(2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.(3)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.二、例题讲解1.(2022·榆林市第十中学高三月考(文))随着经济的发展,人们的生活水平显著提高,健康意识不断增强,健康管理理念深入人心,人们参加体育锻炼的次数与时间在逐渐增加.某校一个课外学习小组为研究居民参加体育锻炼的时长(时长不超过60分钟)是否与性别有关,对某小区居民进行调查,并随机抽取了100名居民的调查结果,其中男性有55人,根据调查结果绘制了居民日均锻炼时间的频率分布直方图如下:(1)求样本中居民日均锻炼时间的中位数;(2)将日均锻炼时间不低于40分钟的居民称为“健生达人”(健康生活达人),已知样本中“健生达人”中有10名女性,根据已知条件完成下面22⨯列联表,并据此资料判断是否有95%的把握认为“健生达人”与性别有关.附:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.2.(2022·江苏南京市·高三开学考试)科研小组为提高某种水果的果径,设计了一套实验方案,并在两片果园中进行对比实验.其中实验园采用实验方案,对照园未采用.实验周期结束后,分别在两片果园中各随机选取100个果实,按果径分成5组进行统计:[)21,26,[)26,31,[)31,36,[)36,41,[]41,46(单位:mm ).统计后分别制成如下的频率分布直方图,并规定果径达到36mm 及以上的为“大果”.(1)请根据题中信息完成下面的列联表,并判断是否有99.9%的把握认为“大果”与“采用实验方案”有关;(2)根据长期种植经验,可以认为对照园中的果径X 服从正态分布()2,N μσ,其中μ近似为样本平均数x ,5.5σ≈,请估计对照园中果径落在区间()39,50内的概率.(同一组中的数据以这组数据所在区间中点的值作代表)附:①()()()()()22n ad bc K a b c d a c b d -=++++;②若X 服从正态分布()2,N μσ,则()0.683P X μσμσ-<<+=,()220.954P X μσμσ-<<+=,()330.997P X μσμσ-<<+=.三、实战练习1.(2022·定远县育才学校高三开学考试(文))微信是腾讯公司推出的一种手机通信软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人.为了调查微信用户每天使用微信的时间,某经销化妆品的店家在一广场随机采访男性、女性用户各50名,将男性、女性平均每天使用微信的时间(单位:h )分成5组:(0,2],(2,4],(4,6],(6,8],(8,10]分别加以统计,得到如图所示的频率分布直方图.(1)根据频率分布直方图估计女性平均每天使用微信的时间;(2)若每天玩微信超过4h的用户称为“微信控”,否则称为“非微信控”,判断是否有90%的把握认为“微信控”与性别有关.附表:(参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++)2.(2022·河北唐山·高三开学考试)数字人民币是由央行发行的法定数字货币,它由指定运营机构参与运营并向公众兑换,与纸钞和硬币等价.截至2022年6月30日,数字人民币试点场景已超132万个,覆盖生活缴费、餐饮服务、交通出行、购物消费、政务服务等领域.为了进一步了解普通大众对数字人民币的感知以及接受情况,某机构进行了-次问卷调查,部分结果如下:(1)如果将高中及高中以下的学历称为“低学历”,大学专科及以上学历称为“高学历”,根据所给数据,完成下面的22⨯列联表;(2)若从低学历的被调查者中,按对数字人民币的了解程度用分层抽样的方法抽取8人,然后从这8人中抽取2人进行进一步调查,求被选中的2人中至少有1人对数字人民币不了解的概率;(3)根据列联表,判断是否有95%的把握认为“是否了解数字人民币”与“学历高低”有关?附:()()()()()22n ad bcKa b c d a c b d-=++++3.(2022·广东实验中学高三月考)在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段称为潜伏期.一研究团队统计了某地区1000名患者的相关信息,得到如下表格:(1)求这1000名患者的潜伏期的样本平均值x(同一组中的数据用该组区间的中点值作代表);(2)该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,以潜伏期是否超过6天为标准进行分层抽样,从上述1000名患者中抽取200人,得到如下列联表请将列联表补充完整,并根据列联表判断是否有95%的把捏认为潜伏期与息者年龄有关;(3)以这1000名患者的潜伏期超过6天的频率,代替该地区1名患者潜伏期超过6天发生的概率,每名患者的潜伏期是否超过6天相互独立.为了深入研究,该研究团队随机调查了20名患者,其中潜伏期超过6天的人数最有可能(即概率最大)...........是多少?附:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.4.(2022·黑龙江高三其他模拟(文))据有关部门统计,2021年本科生的平均签约薪酬为每月4300元.2021年某高校毕业生就业指导中心为了分析本校本科毕业生的专业课成绩优秀与否与本科毕业生就业后获得薪酬的关系,随机调查了从学校毕业的200名本科毕业学进行研究.研究结果表明:在专业课成绩优秀的120名本科毕业生中有90人每月工资超过人民币4300元,另30人每月工资低于人民币4300元;在专业课成绩不优秀的80名本科毕业生中有20人每月工资超过人民币4300元,另60人每月工资低于人民币4300元. (1)试根据上述数据完成22⨯列联表;(2)能否在犯错误的概率不超过0.001的前提下认为“该高校本科毕业生的专业课成绩优秀”与“每月工资超过当年本科生的平均签约薪酬”有关系?参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.5.(2022·山东济宁一中高三开学考试)为提高教育教学质量,越来越多的高中学校采用寄宿制的封闭管理模式.某校对高一新生是否适应寄宿生活十分关注,从高一新生中随机抽取了100人,其中男生占总人数的40%,且只有20%的男生表示自己不适应寄宿生活,女生中不适应寄宿生活的人数占总人数的32%,学校为了考察学生对寄宿生活适应是否与性别有关,构建了如下2×2列联表:(1)请将2×2列联表补充完整,并依据小概率值0.01α=的独立性检验,分析“适应寄宿生活与否”是否与性别有关;(2)从男生中以“是否适应寄宿生活”为标准采用分层抽样的方法随机抽取10人,再从这10人中随机抽取2人,若所选2名学生中的“不适应寄宿生活”人数为X,求随机变量X的分布列及数学期望.附:()()()()()22n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.6.(2022·全国高三月考)某企业计划招聘新员工,现对应聘者关于工作的首要考虑因素进行调查﹐所得统计结果如下表所示:(1)是否有95%的把握认为应聘者关于工作的首要考虑因素与性别有关;(2)若招聘考核共设置2个环节,应聘者需要参加全部环节的考核,每个环节设置两个项目,若应聘者每通过一个项目积10分,未通过积5-分.已知甲第1环节每个项目通过的概率均为34,第2环节每个项目通过的概率均为23,各环节、各项目间相互独立.求甲经过两个环节的考核后所得积分之和的分布列和数学期望()E ξ.参考公式:()()()()22()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:7.(2022·重庆垫江第五中学校高三月考)随着垫江五中教学质量的提升学生总人数达到了历史最高点即4700人左右,但学校发展的同时也对学校学生就餐带来前所未有的挑战.因此学校领导制定出学生分时就餐(第一轮11:40,第二轮12:30).经过一段时间的运行后,学校对就餐满意度进行调查,现从学校初、高中学生中随机抽取200人作为样本,得到下表(单位:人次)(1)(2)(1)通过上表完成下列22⨯列联表,并判断能否有97.5%的把握认为“是否满意”与初、高中学生有关?(2)现从调查的学生中按表(2)分层抽样的方法抽取8人,再从这8人中任选2人,记X为这2人中为满意的人数,求X的分布列和数学期望.参考公式及数据:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.8.(2022·全国高三月考(理))梨树绝大多数品种自花授粉,结实率很低,因此果农在栽培梨树的时候,必须在果园配置授粉树,并结合适当的辅助授粉方法,以便更顺利地完成梨树的授粉受精过程,以此达到果园丰产稳产、高品质的目的.某地区将梨树蜜蜂授粉和自然授粉的花朵坐果率进行比较,统计数据如下:(1)自然授粉和蜜蜂授粉的花朵坐果数的频率分别是多少?(2)根据数据完成下列22⨯列联表,并据此判断能否有99.9%的把握认为自然授粉与蜜蜂授粉的花朵坐果率有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++,n a b c d=+++9.(2022·陕西西安中学高三月考(文))2019年2月4日20:00,2019年央视春晚在中央电视台综合频道等频道并机直播.人们通过手机、互联网、电视等方式,都在观看央视春晚.某调查网站从观看央视春晚的观众中随机选出200人,经统计这200人中通过传统的传媒方式电视端口观看的人数与通过新型的传媒PC 端口观看的人数之比为4:1.将这200人按年龄分组:第1组[)15,25,第2组[)25,35,第3组[)35,45,第4组[)45,55,第5组[)55,65,其中统计通过传统的传媒方式电视端口观看的观众得到的频率分布直方图如图所示.(1)求a 的值及通过传统的传媒方式电视端口观看的观众的平均年龄;(2)把年龄在第1,2,3组的观众称青少年组,年龄在第4,5组的观众称为中老年组,若选出的200人中通过新型的传媒方式PC 端口观看的中老年人有12人,请完成下面2×2列联表,则能否在犯错误的概率不超过0.1的前提下认为观看央视春晚的方式与年龄有关? 附:22()()()()()n ad bc K a b c d a c b d -=++++(其中n a b c d =+++为样本容量).10.(2022·合肥市第六中学高三开学考试(文))医学统计表明,X 疾病在老年人中发病率较高.已知某地区老年人的男女比例为3:2,为了解X疾病在该地区老年人中发病情况,按分层抽样抽取100名老人作为样本,对这100位老人是否患有X疾病进行统计,得条形图如下所示.(1)完成下列2×2列联表,并判断有没有90%的把握认为患X疾病与性别有关?(2)在这100个样本中,将未患X疾病老年人按年龄段[60,65),[65,70),[70,75),[75,80),[80,85]分成5组,得频率分布直方图如图二所示.求未患病老年人的中位数(精确到小数点后一位).附:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.11.(2022·武功县普集高级中学高三开学考试(理))某校组织了全体学生参加“建党100周年”知识竞赛,从高一、高二年级各随机抽取50名学生的竞赛成绩(满分100分),统计如下表:(1)分别估计高一、高二年级竞赛成绩的平均值1x与2x(同一组中的数据以该组数据所在区间中点的值作代表);(2)学校规定竞赛成绩不低于80分的为优秀,根据所给数据,完成下面的22⨯列联表,并判断是否有90%的把握认为竞赛成绩优秀与年级有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.。
1.【新疆兵团第二师华山中学2017-2018学年高二下学期期末考试】下列说法错误的是 A. 对分类变量X 与Y ,随机变量K 2的观测值k 越大,则判断“X 与Y 有关系”的把握程度越小B. 在回归直线方程ˆy=0.2x+0.8中,当解释变量x 每增加1个单位时,预报变量ˆy 平均增加0.2个单位 C. 两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1 D. 回归直线过样本点的中心(x , y ) 【答案】A2.【福建省闽侯第六中学2017-2018学年高二上学期期末考试】以下四个命题,其中正确的是( ) A. 由独立性检验可知,有 99%的把握认为物理成绩与数学成绩有关,某人数学成绩优秀,则他有 99%的可能物理优秀;B. 两个随机变量相关系越强,则相关系数的绝对值越接近于 0;C. 在线性回归方程0.212ˆyx =+中,当变量x 每增加一十单位时,变量ˆy 平均增加 0.2 个单位; D. 线性回归方程对应的直线ˆˆˆybx a =+至少经过其样本数据点中的一个点. 【答案】C【解析】对于A.有99% 的把握认为物理成绩与数学成绩有关,是指“不出错的概率”, 不是“数学成绩优秀,物理成绩就有99%的可能优秀”,A 错误;对于B ,根据随机变量的相关系数知,两个随机变量相关性越强,则相关系数的绝对值越接近于1,B 错误;对于C.根据线性回归方程0.212ˆyx =+的系数ˆ0.2b = 知,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.2个单位,C 正确;对于D.线性回归方程对应的直线ˆˆˆybx a =+过样本中心点,不一定过样本数据中的点,故D 错误; 故选C .3.【江西省抚州市金溪一中等七校2016-2017学年高二下学期期末考试】以下四个命题,其中正确的个数有( ) ①由独立性检验可知,有99%的把握认为物理成绩与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程0.212ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.2个单位; ④对分类变量X 与Y ,它们的随机变量2K 的观测值k 来说, k 越小,“X 与Y 有关系”的把握程度越大. A. 1 B. 2 C. 3 D. 4 【答案】B4.【广东省东莞市2016-2017学年高二下学期期末教学质量检查】为直观判断两个分类变量X 和Y 之间是否有关系,若它们的取值分别为{}12,x x 和{}12,y y ,通过抽样得到频数表为:则下列哪两个比值相差越大,可判断两个分类变量之间的关系应该越强( ) A.a a c +与b b d + B. a a d +与c b c + C. a bd +与c a c + D. a c d +与ca b+ 【答案】A【解析】因为()()()()()()22a b c d ad bc K a c b d a b c d +++-=++++,所以当2K 的值越小说明两个分类变量之间的有关系的把握程度越小,反之,当2K 的值越小说明两个分类变量之间的有关系的把握程度越大,即两个分类变量之间的关系应该越强,()()a b ad bc a c b d a c b d --=++++与2K 的关系等价,则()()a b ad bc a c b d a c b d --=++++值相差越大,可判断两个分类变量之间的关系应该越强,应选答案A 。
独立性检验1.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是k=,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99 A.若2K的观测值为 6.635人患有肺病B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D.以上三种说法都不正确2.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是A.①回归分析,②取平均值B.①独立性检验,②回归分析C.①回归分析,②独立性检验D.①独立性检验,②取平均值⨯列联表:3.下面是一个22其中a b 、处应填的值分别为[来源:学。
科。
网Z 。
X 。
X 。
K] A .5254、 B .5452、 C .94146、D .14694、4.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了下表:参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.临界值表:根据表中的数据你认为喜爱打篮球与性别之间有关系的把握是 A .97.5% B .99% C .99.5%D .99.9%5.为了普及环保知识,增强环保意识,某大学从理工类专业的A 班和文史类专业的B 班各抽取20名同学参加环保知识测试.统计得到成绩与专业的列联表:附:参考公式及数据: (1)统计量:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.(2)独立性检验的临界值表:则下列说法正确的是A .有99%的把握认为环保知识测试成绩与专业有关B .有99%的把握认为环保知识测试成绩与专业无关C .有95%的把握认为环保知识测试成绩与专业有关D .有95%的把握认为环保知识测试成绩与专业无关 6.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为 A .5,35b d == B .15,25b d == C .20,20b d ==D .30,10b d ==参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.7.某学校为判断高三学生选修文科是否与性别有关,现随机抽取50名学生,得到如下22⨯列联表:,已知()2 3.8410.05P K ≥≈,()2 5.0240.025P K ≥≈.现作出结论“选修文科与性别相关”,估计这种判断出错的可能性约为A .97.5%B .95%C .2.5%D .5%8.利用独立性检验来判断两个分类变量X和Y是否有关系,通过查阅下表来确定“X和Y有关系”的可信度.为了调查使用电脑时间与视力下降是否有关系,现从某地网民中抽取100位居民进行调查.经过计算得2 3.855K≈,那么就有________%的把握认为使用电脑时间与视力下降有关系.学#科¥网9.某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校2019—2019学年高二年级每个学生一学期数学成绩平均分(采用百分制),剔除平均分在40分以下的学生后,共有男生300名,女生200名,现采用分层抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生成绩分为6组,得到如下所示频数分布表.(1)估计男、女生各自的平均分(同一组数据用该组区间中点值作代表),从计算结果看,数学成绩与性别是否有关;(2)规定80分以上者为优分(含80分),请你根据已知条件作出2×2列联表,并判断是否有90%以上的把握认为“数学成绩与性别有关”.参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.10.随着资本市场的强势进入,互联网共享单车“忽如一夜春风来”,遍布了一二线城市的大街小巷.为了解共享单车在A市的使用情况,某调查机构借助网络进行了问卷调查,并从参与调查的网友中抽取了200人进行抽样分析,得到表格:(单位:人)(1)根据以上数据,能否在犯错误的概率不超过0.15的前提下认为A市使用共享单车情况与年龄有关?(2)现从所抽取的30岁以上的网友中利用分层抽样的方法再抽取5人.(i)分别求这5人中经常使用、偶尔或不用共享单车的人数;(ii)从这5人中,再随机选出2人赠送一件礼品,求选出的2人中至少有1人经常使用共享单车的概率.参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.参考数据:11.为调查某社区居民的业余生活状况,研究这一社区居民在20:00~22:00时间段的休闲方式与性别的关系,随机调查了该社区80人,得到下面的数据表:(1)根据以上数据,能否有99%的把握认为“在20:00~22:00时间段居民的休闲方式与性别有关系”?(2)将此样本的频率估计为总体的概率,在该社区的所有男性中随机调查3人,设调查的3人在这一时间段以看书为休闲方式的人数为随机变量X,求X的数学期望和方差.附:22()()()()()n ad bcKa b c d a c b d-=++++12.某省高考改革实施方案指出:该省高考考生总成绩将由语文、数学、外语3门统一高考成绩和学生自主选择的学业水平等级性考试科目共同构成,该省教育厅为了解正在读高中的学生家长对高考改革方案所持的赞成态度,随机从中抽取了100名城乡家长作为样本进行调查,调查结果显示样本中有25人持不赞成意见,如图是根据样本的调查结果绘制的等高条形图.学&科%网(1)根据已知条件与等高条形图完成下面的列联表,并判断我们能否有95%的把握认为“赞成高考改革方案与城乡户口有关”?注:()()()()()22n ad bcKa b c d a c b d-=++++,其中.(2)用样本的频率估计概率,若随机在全省不赞成高考改革的家长中抽取3个,记这3个家长中是城镇户口的人数为X,试求X的分布列及数学期望()E X.13.(2019年高考新课标Ⅱ卷) 海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg).其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件:“旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg”,估计A的概率;学@科网(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:,14.电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列,期望E(X)和方差D(X).。
2017年全国卷2文科数学
19.(12分)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg), 其频率分布直方图如下:
(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量
(1)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行较。
附:
【解析】(1)旧养殖法的箱产量低于的频率为
因此,事件A的概率估计值为0.62.
(2)根据箱产量的频率分布直方图得列联表
K2=
由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.
(3)箱产量的频率分布直方图平均值(或中位数)在45kg到50kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.
2018全国卷3
18.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式,为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人第一组工人用第一种生产方式,第二组工人用第二种生产方式,根据工人完成生产任务的工作时同(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由:
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不
?
解:(1)第二种生产方式的效率更高.
理由如下:
(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至
多79分钟.因此第二种生产方式的效率更高.
(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.
(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.
(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.
以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.
(2)由茎叶图知.
列联表如下:
超过不超过
(3)由于,所以有99%的把握认为两种生产方式的效率有差异.。