2018届高三数学(理)一轮复习:第十一章 统计、 统计案例全国通用 第三节 变量间的相关关系、统计案例
- 格式:doc
- 大小:249.67 KB
- 文档页数:9
1.简单随机抽样(1)定义:一般地,从个体为N 的总体中逐个不放回地取出n 个个体作为样本(n ∈N ),如果每个个体都有相同的机会被取到,那么这样的抽样方法,称为简单随机抽样. (2)最常用的简单随机抽样方法有两种——抽签法和随机数表法. 2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本. ①采用随机的方法将总体中的N 个个体编号;②将编号按间隔k 分段,当N n 是整数时,取k =N n ;当Nn 不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N ′能被n 整除,这时取k =N ′n ,并将剩下的总体重新编号;③在第一段中用简单随机抽样确定起始的个体编号l ;④按照一定的规则抽取样本,通常将编号为l ,l +k ,l +2k ,…,l +(n -1)k 的个体抽出. 3.分层抽样(1)定义:一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几个部分,然后按各个部分在总体中所占的比实施抽样,这种抽样方法叫分层抽样,所分成的各个部分称为“层”. (2)分层抽样的应用范围:当总体由差异明显的几个部分组成时,往往选用分层抽样的方法. 【思考辨析】判断下列结论是否正确(请在括号中打“√”或“×”) (1)简单随机抽样是一种不放回抽样.( √ )(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( × ) (3)抽签法中,先抽的人抽中的可能性大.( × )(4)系统抽样在第1段抽样时采用简单随机抽样.( √ )(5)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( × )(6)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( × )1.(教材改编)某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为______________. 答案 25,56,19解析 因为125∶280∶95=25∶56∶19, 所以抽取人数分别为25,56,19.2.(2015·四川改编)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是__________. 答案 分层抽样法解析 根据年级不同产生差异及按人数比例抽取易知应为分层抽样法.3.(1)某学校为了了解2016年高考数学学科的考试成绩,在高考后对1 200名学生进行抽样调查,其中文科400名考生,理科600名考生,艺术和体育类考生共200名,从中抽取120名考生作为样本.(2)从10名家长中抽取3名参加座谈会.Ⅰ.简单随机抽样法 Ⅱ.系统抽样法 Ⅲ.分层抽样法 问题与方法配对正确的是____________. 答案 (1)Ⅲ,(2)Ⅰ解析 通过分析可知,对于(1),应采用分层抽样法,对于(2),应采用简单随机抽样法. 4.将参加英语口语测试的1 000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为________. 答案 695解析 由题意可知,第一组随机抽取的编号l =15,分段间隔数k =N n =1 00050=20,则抽取的第35个编号为15+(35-1)×20=695.5.某学校高一,高二,高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生. 答案 15解析设应从高二年级抽取x名学生,则x∶50=3∶10,解得x=15.题型一简单随机抽样例1(1)以下抽样方法是简单随机抽样的有________.①在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖;②某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格;③某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见;④用抽签方法从10件产品中选取3件进行质量检验.(2)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为________.答案(1)④解析(1)①、②不是简单随机抽样,因为抽取的个体间的间隔是固定的;③不是简单随机抽样,因为总体的个体有明显的层次;④是简单随机抽样.(2)由题意知前5个个体的编号为08,02,14,07,01.思维升华应用简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数表法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.(1)下列抽样试验中,适合用抽签法的有________.①从某厂生产的5 000件产品中抽取600件进行质量检验;②从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验;③从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验;④从某厂生产的5 000件产品中抽取10件进行质量检验.(2)下列抽取样本的方式不属于简单随机抽样的有________________.①从无限多个个体中抽取100个个体作为样本;②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;③从20件玩具中一次性抽取3件进行质量检验;④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.答案(1)②(2)①②③④解析(1)①、④中的总体个体数较多,不适宜抽签法,③中甲、乙两厂的产品质量有区别,也不适宜抽签法.②是简单随机抽样.(2)①不是简单随机抽样.②不是简单随机抽样.由于它是放回抽样.③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.④不是简单随机抽样.因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样.题型二系统抽样例2(1)(2015·湖南改编)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.(2)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为________.答案(1)4(2)12解析(1)由题意知,将1~35号分成7组,每组5名运动员,成绩落在区间[139,151]的运动员共有4组,故由系统抽样法知,共抽取4名.(2)由84042=20,即每20人抽取1人,所以抽取编号落在区间[481,720]的人数为720-48020=24020=12.引申探究1.本例(2)中条件不变,若第三组抽得的号码为44,则在第八组中抽得的号码是________.答案144解析 在第八组中抽得的号码为(8-3)×20+44=144.2.本例(2)中条件不变,若在编号为[481,720]中抽取8人,则样本容量为________. 答案 28解析 因为在编号[481,720]中共有720-480=240人,又在[481,720]中抽取8人, 所以抽样比应为240∶8=30∶1,又因为单位职工共有840人,所以应抽取的样本容量为84030=28.思维升华 (1)系统抽样适用的条件是总体容量较大,样本容量也较大.(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔.(3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定.(1)(2016·南京模拟)高三(1)班有学生52人,现将所有学生随机编号,用系统抽样方法,抽取一个容量为4的样本,已知5号、31号、44号学生在样本中,则样本中还有一个学生的编号是________.(2)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为________. 答案 (1)18 (2)10解析 (1)分段间隔为524=13,故还有一个学生的编号为5+13=18.(2)由系统抽样的特点知:抽取号码的间隔为96032=30,抽取的号码依次为9,39,69, (939)落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 题型三 分层抽样命题点1 求总体或样本容量例3 (1)(2016·苏北四市联考)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n 的样本,其中甲种产品有18件,则样本容量n =________.(2)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件. 答案 (1)90 (2)1 800解析 (1)依题意得33+5+7×n =18,解得n =90,即样本容量为90.(2)分层抽样中各层的抽样比相同.样本中甲设备生产的产品有50件,则乙设备生产的产品有30件.在4 800件产品中,甲、乙设备生产的产品总数比为5∶3,所以乙设备生产的产品的总数为1 800件. 命题点2 求某层入样的个体数例4 (2015·北京)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为________.(2)(2015·福建)某校高一年级有名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________. 答案 (1)180 (2)25解析 (1)由题意抽样比为3201 600=15,∴该样本中的老年教师人数为900×15=180.(2)由题意知,男生共有500名,根据分层抽样的特点,在容量为45的样本中男生应抽取的人数为45×500900=25.思维升华 分层抽样问题类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算.(3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.(1)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________.(2)某公司共有1 000名员工,下设若干部门,现采用分层抽样方法,从全体员工中抽取一个样本容量为80的样本,已告知广告部门被抽取了4个员工,则广告部门的员工人数为________.答案 (1)200,20 (2)50解析 (1)该地区中小学生总人数为 3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20. (2)1 00080=x 4,x =50.五审图表找规律典例 (14分)某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:(1)若要抽取40(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人? (3)若要抽20人调查对广州亚运会举办情况的了解,则应怎样抽样?抽取40人调查身体状况↓(观察图表中的人数分类统计情况) 样本人群应受年龄影响↓(表中老、中、青分类清楚,人数确定) 要以老、中、青分层,用分层抽样 ↓要开一个25人的座谈会 ↓(讨论单位发展与薪金调整)样本人群应受管理、技术开发、营销、生产方面的影响 ↓(表中管理、技术开发、营销、生产分类清楚,人数确定) 要以管理、技术开发、营销、生产人员分层,用分层抽样↓要抽20人调查对广州亚运会举办情况的了解↓(可认为亚运会是大众体育盛会,一个单位人员对情,况了解相当) 将单位人员看作一个整体 ↓(从表中数据看总人数为2 000) 人员较多,可采用系统抽样 规范解答解 (1)按老年、中年、青年分层,用分层抽样法抽取, [1分] 抽取比例为402 000=150.[3分] 故老年人、中年人、青年人各抽取4人、12人、24人.[5分] (2)按管理、技术开发、营销、生产分层,用分层抽样法抽取, [6分] 抽取比例为252 000=180,[8分]故管理、技术开发、营销、生产各部门抽取2人、4人、6人、13人. [10分] (3)用系统抽样,对全部2 000人随机编号,号码从0001~2000,每100号分为一组,从第一组中用简单随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1 900,共20人组成一个样本.[14分]1.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为________. 答案 8解析 设样本容量为N ,则N ×3070=6,∴N =14,∴高二年级所抽学生人数为14×4070=8.2.(2017·扬州月考)打桥牌时,将洗好的扑克牌(52张)随机确定一张为起始牌后,开始按次序搬牌,对任何一家来说,都是从52张总体抽取一个13张的样本.这种抽样方法是______________. 答案 系统抽样解析 符合系统抽样的特点,故是系统抽样.3.(2016·南京、盐城联考)某校高一年级有学生400人,高二年级有学生360人,现采用分层抽样的方法从全校学生中抽出55人,其中从高一年级学生中抽出20人,则从高三年级学生中抽取的人数为________. 答案 17解析 由题意可得从高二年级学生中抽出的人数为20400×360=18,故从高三年级学生中抽取的人数为55-20-18=17.4.用系统抽样法从160名学生中抽取容量为20的样本,将160名学生随机地从1~160进行编号,并按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若按等距的规则从第16组抽出的号码为126,则第1组中用抽签法确定的号码是________. 答案 6解析 第1组中用抽签法确定的号码是126-15×8=6.5.(2016·镇江模拟)将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是______________. 答案 16,28,40,52解析 编号组数为5,间隔为605=12,因为在第一组抽得04号:又4+12=16,16+12=28,28+12=40,40+12=52, 所以其余4个号码为16,28,40,52.6.将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为__________________. 答案 25,17,8解析 由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N *)组抽中的号码是3+12(k -1). 令3+12(k -1)≤300得k ≤1034,因此第Ⅰ营区被抽中的人数是25; 令300<3+12(k -1)≤495得1034<k ≤42,因此第Ⅱ营区被抽中的人数是42-25=17. 7.(2016·山西大同一中月考)用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性分别是__________. 答案110,110解析 在抽样过程中,个体a 每一次被抽中的概率是相等的,因为总体容量为10,故个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性均为110.8.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生. 答案 60解析 设应从一年级本科生中抽取x 名学生,则x 300=44+5+5+6,解得x =60.9.某高中在校学生有2 000人.为了响应“阳光体育运动”的号召,学校开展了跑步和登山的比赛活动.每人都参与而且只能参与其中一项比赛,各年级参与比赛的人数情况如下表:其中a ∶b ∶c =2∶3∶5,全校参与登山的人数占总人数的25.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则从高二年级参与跑步的学生中应抽取的人数为________. 答案 36解析 根据题意,可知样本中参与跑步的人数为200×35=120,所以从高二年级参与跑步的学生中应抽取的人数为120×32+3+5=36.10.一个总体中有90个个体,随机编号0,1,2,…,89,以从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m +k 的个位数字相同,若m =8,则在第8组中抽取的号码是________. 答案 76解析 由题意知m =8,k =8,则m +k =16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.11.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号,分为40组,分别为1~5,6~10,…,196~200,第5组抽取号码为22,第8组抽取号码为________.若采用分层抽样,40岁以下年龄段应抽取________人.答案 37 20解析 将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x 人,则40200=x100,解得x =20.12.某校共有学生2 000名,各年级男、女学生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为________.答案 16解析 依题意可知二年级的女生有380人,那么三年级的学生人数应该是2 000-373-377-380-370=500,即总体中各个年级的人数比为3∶3∶2,故用分层抽样法应在三年级抽取的学生人数为64×28=16.13.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n . 解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为36n ,分层抽样的比例是n 36,抽取的工程师人数为n 36×6=n6,技术员人数为n 36×12=n 3,技工人数为n 36×18=n2,所以n 应是6的倍数,36的约数,即n =6,12,18.当样本容量为(n +1)时,总体容量是35人,系统抽样的间隔为35n +1,因为35n +1必须是整数,所以n 只能取6.即样本容量n =6.*14.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:(1)5的样本,将该样本看成一个总体,从中任取2人,求至少有1人学历为研究生的概率;(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N 个人,其中35岁以下48人,50岁以上10人,再从这N 个人中随机抽取出1人,此人的年龄为50岁以上的概率为539,求x ,y 的值. 解 (1)用分层抽样的方法在35~50岁中抽取一个容量为5的样本,设抽取学历为本科的人数为m ,∴3050=m5,解得m =3. 抽取的样本中有研究生2人,本科生3人,分别记作S 1,S 2;B 1,B 2,B 3.从中任取2人的所有等可能基本事件共有10个:(S 1,B 1),(S 1,B 2),(S 1,B 3),(S 2,B 1),(S 2,B 2),(S 2,B 3),(S 1,S 2),(B 1,B 2),(B 1,B 3),(B 2,B 3),其中至少有1人的学历为研究生的基本事件有7个:(S 1,B 1),(S 1,B 2),(S 1,B 3),(S 2,B 1),(S 2,B 2),(S 2,B 3),(S 1,S 2), ∴从中任取2人,至少有1人学历为研究生的概率为710. (2)由题意,得10N =539,解得N =78,∴35~50岁中被抽取的人数为78-48-10=20, ∴4880+x =2050=1020+y, 解得x =40,y =5,即x ,y 的值分别为40,5.。
2018年高考数学总复习统计与统计案例(word版可编辑修改)编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018年高考数学总复习统计与统计案例(word版可编辑修改))的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018年高考数学总复习统计与统计案例(word版可编辑修改)的全部内容。
第三节统计与统计案例考纲解读1. 理解随机抽样的必要性和重要性。
2. 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.3. 了解分布的意义和作用,会列频率分布表,会画出频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.4. 理解样本数据标准差的意义和作用,会计算数据标准差.5. 能从样本的频率分布估计总体分布,会用样本的基本数字牲估计总体的基本数字特征,理解用样本估计总体的思想。
6. 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题。
7. 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.8. 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
9. 了解常见的统计方法,并能应用这些方法解决一些实际问题。
(1)独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.(2)回归分析了解回归分析的基本思想、方法及其简单应用.命题趋势探究1。
本节内容是高考必考内容,以选择题、填空题为主.2. 命题内容为:(1)三种抽样(以分层抽样为主);(2)频率分布表和频率分布直方图的制作、识图及运用。
(1)(2)有结合趋势,考题难度中下.3。
统计案例为新课标教材新增内容,考查考生解决实际问题的能力。
A 组 专项基础训练(时间:40分钟)1.(2017·豫东、豫北十所名校联考)根据如下样本数据:得到的回归直线方程为y =bx +a .若样本点的中心为(5,0.9),则当x 每增加1个单位时,y 就( )A .增加1.4个单位B .减少1.4个单位C .增加7.9个单位D .减少7.9个单位 【解析】 依题意得,a +b -25=0.9,故a +b =6.5①,又样本点的中心为(5,0.9),故0.9=5b +a ②,联立①②,解得b =-1.4,a =7.9,则y ^=-1.4x +7.9,可知当x 每增加1个单位时,y 就减少1.4个单位.【答案】 B2.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附表及公式K 2=(a +b )(c +d )(a +c )(b +d )A .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”【解析】 由2×2列联表得到a =45,b =10,c =30,d =15,则a +b =55,c +d =45,a +c =75,b +d =25,ad =675,bc =300,n =100,计算得K 2的观测值k =100×(675-300)255×45×75×25≈3.030.因为2.706<3.030<3.841,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.【答案】 A3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x A .y =x -1 B .y =x +1 C .y =88+12x D .y =176【解析】 由题意知D 项明显不符合实际,排除; 且x =174+176+176+176+1785=176,y =175+175+176+177+1775=176,又y 对x 的线性回归方程表示的直线恒过点(x ,y ), 所以将(176,176)代入A ,B ,C 中检验,只有C 成立. 【答案】 C4.已知某产品连续4个月的广告费用为x i (i =1,2,3,4)千元,销售额为y i (i =1,2,3,4)万元,经过对这些数据的处理,得到如下数据信息:①x 1+x 2+x 3+x 4=18,y 1+y 2+y 3+y 4=14;②广告费用x 和销售额y 之间具有较强的线性相关关系;③回归直线方程y ^=bx+a 中的b =0.8(用最小二乘法求得),那么,当广告费用为6千元时,可预测销售额约为( )A .3.5万元B .4.7万元C .4.9万元D .6.5万元【解析】 依题意得x =4.5,y =3.5,由回归直线必过样本中心点得a =3.5-0.8×4.5=-0.1.当x =6时,y ^=0.8×6-0.1=4.7.【答案】 B5.(2017·郑州预测)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中数据,求得线性回归方程为y =-4x +a .若在这些样本点中任取一点,则它在回归直线左下方的概率为( )A.16B.13C.12D.23【解析】 依题意得x =16×(4+5+6+7+8+9)=132,y =16×(90+84+83+80+75+68)=80,又回归直线必经过样本中心点(x ,y ),于是有a =80+4×132=106,不等式4x +y-106<0表示的是回归直线的左下方区域.注意到在6个样本数据中,共有2个样本数据位于回归直线的左下方区域,因此所求的概率等于13.【答案】 B6.(2017·济宁二模)已知下表所示数据的回归直线方程为y ^=4x +242,则实数a =________.【解析】 回归直线y ^=4x +242必过样本点的中心(x ,y ),而x =2+3+4+5+65=4,y=251+254+257+a +2665=1 028+a 5,∴1 028+a 5=4×4+242,解得a =262.【答案】 2627.某单位为了了解用电量y 千瓦·时与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.5 ℃时,用电量的千瓦·时数约为________.【解析】 因为回归直线经过样本中心点,故由已知数表可得x =10,y =30,即(10,30)在回归直线上,代入方程可得a =50,即回归直线方程为y =50-2x ,故可预测当气温为5 ℃时,用电量的度数约为50-2×5=40.【答案】 408.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如图所示2×2列联表:已知P (K 2≥3.841)≈K 2的观测值k =50×(13×20-10×7)223×27×20×30≈4.844,则有________的把握认为选修文科与性别有关.【解析】 由题意知,K 2=50×(13×20-10×7)223×27×20×30≈4.844,因为5.024>4.844>3.841,所以有95%的把握认为选修文科与性别有关.【答案】 95%9.(2017·宁夏银川一中期末)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)y =bx +a . (2)已知该厂技改前,100吨甲产品的生产能耗为90吨标准煤.试根据(1)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)10.(2017·邯郸摸底)为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查得到如下列联表.平均每天喝500 mL 以上为常喝,体重超过50 kg 为肥胖.已知在全部30人中随机抽取1人,抽到肥胖的学生的概率为415.(1)请将上面的列联表补充完整.(2)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由.(3)设常喝碳酸饮料且肥胖的学生中有2名女生,现从常喝碳酸饮料且肥胖的学生中抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考数据:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .【解析】 (1)设常喝碳酸饮料肥胖的学生有x 人,x +230=415,解得x =6.(2)有.由已知数据可求得K 2=10×20×8×22≈8.523>7.879.因此有99.5%的把握认为肥胖与常喝碳酸饮料有关.(3)设4名常喝碳酸饮料的肥胖男生为A ,B ,C ,D ,女生为E ,F ,则任取两人的取法有AB ,AC ,AD ,AE ,AF ,BC ,BD ,BE ,BF ,CD ,CE ,CF ,DE ,DF ,EF ,共15种.其中一男一女的取法有AE ,AF ,BE ,BF ,CE ,CF ,DE ,DF ,共8种.故抽到一男一女的概率是P =815.B 组 专项能力提升 (时间:30分钟)11.下列说法:①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;②设有一个线性回归方程y ^=3-5x ,变量x 增加1个单位时,y 平均增加5个单位; ③设具有相关关系的两个变量x ,y 的相关系数为r ,则|r |越接近于0,x 和y 之间的线性相关程度越强;④在一个2×2列联表中,由计算得K 2的值,则K 2的值越大,判断两个变量间有关联的把握就越大.以上,错误结论的个数为( ) A .0 B .1 C .2 D .3【解析】 方差反应一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差不变,故①正确;在线性回归方程y ^=3-5x 中,变量x 增加1个单位时,y 平均减小5个单位,故②不正确;根据线性回归分析中相关系数的定义:在线性回归分析中,相关系数为r ,|r |越接近于1,相关程度越强,故③不正确;对分类变量x 与y 的随机变量的观测值K 2来说,K 2越大,“x 与y 有关系”的可信程度越大,故④正确.综上所述,错误结论的个数为2,故选C.【答案】 C12.(2017·兰州、张掖联考)对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其线性回归方程是y ^=13x +a ^,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a ^的值是( )A.116 B.18C.14D.12【解析】 依题意可知样本点的中心为⎝ ⎛⎭⎪⎫34,38,则38=13×34+a ^,解得a ^=18. 【答案】 B13.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为7,则下列说法正确的是( )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按97.5%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按97.5%的可靠性要求,不能认为“成绩与班级有关系”【解析】 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,选项A 、B 错误.根据列联表中的数据,得到K 2=105×(10×30-20×45)255×50×30×75≈6.109>5.024,因此有97.5%的把握认为“成绩与班级有关系”. 【答案】 C14.某中学对“学生性别和是否喜欢看NBA 比赛”作了一次调查,其中男生人数是女生人数的2倍,男生喜欢看NBA 的人数占男生人数的56,女生喜欢看NBA 的人数占女生人数的13.(1)若被调查的男生人数为n ,根据题意建立一个2×2列联表;(2)若有95%的把握认为是否喜欢看NBA 和性别有关,求男生至少有多少人? 附:K 2=(a +b +c +d )(ad -bc )2(a +b )(c +d )(a +c )(b +d ),【解析】 (1)(2)K 2=3n 2⎝ ⎛⎭⎪⎫5n 6·n 3-n 6·n 6n ·n 2·n 2·n =38n .若有95%的把握认为是否喜欢看NBA 和性别有关, 则K 2>3.841,即38n >3.841,n >10.24.∵n 2,n6为整数,∴n 最小值为12. 即:男生至少12人.15.(2016·课标全国Ⅲ)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.。
第三节变量间的相关关系、统计案例
A组基础题组
1.已知变量x,y之间具有线性相关关系,其散点图如图所示,回归直线l的方程为=x+,则下列说法正确的是()
A.>0,<0
B.>0,>0
C.<0,<0
D.<0,>0
2.(2015福建,4,5分)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万
元家庭的年支出为()
A.11.4万元
B.11.8万元
C.12.0万元
D.12.2万元
3.在西非肆虐的“埃博拉病毒”的传播速度不断加快,这已经成为全球性的威胁.为考察某种埃博拉病毒疫苗的效果,现随机抽取100只小动物进行试验,得到如下列联表:
附表:
其中K2=.
参照附表,下列结论正确的是()
A.在错误率不超过5%的前提下,可认为“小动物是否被感染与有没有服用疫苗有关”
B.在错误率不超过5%的前提下,可认为“小动物是否被感染与有没有服用疫苗无关”
C.有97.5%的把握认为“小动物是否被感染与有没有服用疫苗有关”
D.有97.5%的把握认为“小动物是否被感染与有没有服用疫苗无关”
4.已知变量x与y之间的回归直线方程为=-3+2x,若x i=17,则y i的值等于()
A.3
B.4
C.0.4
D.40
5.2016年春节期间,某市物价部门对该市5家商场某商品一天的销售量及售价进行了调查,5家商场的售价x(单位:元)和销售量y(单位:件)之间的一组数据如下表所示:
通过散点图可知,销售量y与售价x之间有较好的线性相关关系,其线性回归方程是=-3.2x+,则的值为.
6.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录进行比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是.
①有95%的把握认为“这种血清能起到预防感冒的作用”;
②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;
③这种血清预防感冒的有效率为95%;
④这种血清预防感冒的有效率为5%.
7.(2016赣中南五校2月联考)心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个结论,从所在学校中按分层抽样的方法抽取50名同学(男30女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:人)
根据以上数据能否判断有97.5%的把握认为视觉和空间想象能力与性别有关?
附表及公式:
K2=.
8.某商场对每天进店人数和商品销售件数进行了统计对比,得到如下表格:
其中i=1,2,3,4,5,6,7.
(1)以每天进店人数为横轴,每天商品销售件数为纵轴,画出散点图;
(2)求回归直线方程;(结果保留到小数点后两位)
参考数据:x i y i=3245,=25,=15.43,=5075,7()2=4375,7=2700
(3)预测进店人数为80时商品销售的件数.(结果保留整数)
B组提升题组
9.(2016河南开封一模)下列说法错误的是()
A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B.在线性回归分析中,相关系数r的值越大,变量间的相关性越强
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好
10.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:
小李这5天的平均投篮命中率为;用线性回归分析的方法,可预测小李该月6号打6小时篮球的投篮命中率为.
11.(2016河南新乡许昌平顶山二调)某校高二年级共有学生1000名,其中走读生750名,住宿生250名,现采用分层抽样的方法从该年级抽取100名学生进行问卷调查,得到这100名学生每天
晚上有效学习时间(单位:分钟)的数据,按照以下区间分为八组:①0,30),②30,60),③60,90),④90,120),……得到频率分布直方图(部分),如图所示.
(1)如果把“学生晚上有效学习时间达到两小时”作为是否充分利用时间的标准,对抽取的100名学生,完成下列2×2列联表,并判断是否有95%的把握认为学生利用时间是否充分与走读、住宿有关;
附:
K2=.
(2)若在第①组、第②组、第③组中共抽出3人调查影响有效利用时间的原因,记抽到“有效学习时间少于60分钟”的学生人数为X,求X的分布列和数学期望.
答案全解全析
A组基础题组
1.D由题图可知,回归直线的斜率是正数,即>0;回归直线在y轴上的截距是负数,即<0,故选D.
2.B由统计数据表可得==10.0,==8.0,则
=8.0-0.76×10.0=0.4,所以回归直线方程为=0.76x+0.4,当x=15时,=0.76×15+0.4=11.8,故估计年收入为15万元家庭的年支出为11.8万元.故选B.
3.A由题意得,K2=≈
4.762,结合附表比较得3.841<K2<
5.024,所以在错误率不超过5%的前提下,可认为“小动物是否被感染与有没有服用疫苗有关”,故选A.
4.B依题意有==1.7,而直线=-3+2x一定经过样本点的中心(,),所以
=0.4×10=4.
=-3+2=-3+2×1.7=0.4,所以y
5.答案40
解析由题意可知,==10,==8,故样本点的中心为(10,8),将其代入
线性回归方程=-3.2x+,可解得=40.
6.答案①
解析∵3.918≥3.841,P(K2≥3.841)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.
7.解析由2×2列联表中数据得K2的观测值k==≈5.556>5.024,
所以有97.5%的把握认为视觉和空间想象能力与性别有关.
8.解析(1)散点图如图所示.
(2)因为x i y i=3245,=25,=15.43,=5075,
7()2=4375,7=2700.
所以=
=-=-4.07,
所以回归直线方程是=0.78x-4.07.
(3)进店人数为80时,商品销售的件数为y=0.78×80-4.07≈58件.
B组提升题组
9.B根据相关关系的概念知A正确;当r>0时,r越大,相关性越强,当r<0时,r越大,相关性越弱,故B不正确;对于一组数据拟合程度好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好;二是R2越大,拟合效果越好,所以R2为0.98的模型比R2为0.80的模型拟合的效果好,C,D正确,故选B.
10.答案0.5;0.53
解析这5天的平均投篮命中率=×(0.4+0.5+0.6+0.6+0.4)=0.5.利用相关公式计算易得=0.01,=0.47,∴线性回归方程为=0.01x+0.47,当x=6时,=0.01×6+0.47=0.53.
11.解析(1)
K2=≈5.556.
由于K2>3.841,所以有95%的把握认为学生利用时间是否充分与走读、住宿有关.
(2)设第i组的频率为P i(i=1,2,…,8),则由题图可知,P1=×30=,P2=×30=,P3=×30=,可得第①组1人,第②组4人,第③组10人.
因为X的所有可能取值为0,1,2,3,
P(X=0)==,
P(X=1)==,
P(X=2)==,
P(X=3)==.
所以X的分布列为
E(X)=0×+1×+2×+3×=1.。