北师大数学必修三练习:第一章 统计 § 课后梯度测评 含解析
- 格式:doc
- 大小:233.50 KB
- 文档页数:9
一、选择题1.某班统计一次数学测验的平均分与方差,计算完毕才发现有位同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( )A .1x x =,221s s = B .1x x =,221s s < C .1x x =,221s s >D .1x x <,221s s =2.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,83.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18554.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差5.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( )A .26B .27C .28D .296. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日7.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是( )A .2018年3月的销售任务是400台B .2018年月销售任务的平均值不超过600台C .2018年第一季度总销售量为830台D .2018年月销售量最大的是6月份 8.①45化为二进制数为(2)101101;②一个总体含有1000个个体(编号为0000,0001,…,0999),采用系统抽样从中抽取一个容量为50的样本,若第一个抽取的编号为0008,则第六个编号为0128; ③已知a ,b ,c 为ABC ∆三个内角A ,B ,C 的对边,其中3a =,4c =,6A π=,则这样的三角形有两个解.以上说法正确的个数是( ) A .0B .1C .2D .39.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是( )A.消耗1升汽油,乙车最多可行驶5千米B.以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多C.甲车以80千米/小时的速度行驶1小时,消耗10升汽油D.某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油10.已知x,y的取值如表:x 2678y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是A.B.C.D.11.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为A.12 B.14 C.16 D.1812.从存放号码分别为1,2, ,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是()A.0.53 B.0.5 C.0.47 D.0.37二、填空题13.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____14.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..15.已知数据(1,2,3,4,5)i x i =的平均值为a ,数列2{()}i x a -为等差数列,且3||0.1x a -=________.16.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.17.某公司的广告费支出x 与销售额y (单位:万元)之间有下列对应数据:由资料显示y 对x 呈线性相关关系。
一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .163.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为( )A .1167B .365C .36D 674. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是()A.这10天中有3天空气质量为一级PM日均值逐渐降低B.从6日到9日 2.5PM日均值的中位数是55C.这10天中 2.5PM日均值最高的是12月6日D.这10天中 2.55.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是()A.2018年3月的销售任务是400台B.2018年月销售任务的平均值不超过600台C.2018年第一季度总销售量为830台D.2018年月销售量最大的是6月份6.通过实验,得到一组数据如下:2,5,8,9,x,已知这组数据的平均数为6,则这组数据的方差为( )A.3.2 B.4 C.6 D.6.57.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为()A.0795 B.0780 C.0810 D.08158.某产品的广告费用x与销售额y的统计数据如下表:广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元9.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和9210.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .711.下列说法:①设有一个回归方程35y x =-,变量x 增加一个单位时,y 平均增加5个单位;②线性回归直线ˆybx a =+必过必过点(),x y ;③在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病;其中错误的个数是( ) A .0B .1C .2D .312.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53B .0.5C .0.47D .0.37二、填空题13.《数术记遗》相传是汉末徐岳(约公元2世纪)所著.该书主要记述了:积算(即筹算)、太乙算、两仪算、三才算、五行算、八卦算、九宫算、运筹算、了知算、成数算、把头算、龟算、珠算、计数共14种计算方法.某研究学习小组共6人,他们搜集整理该14种算法的相关资料所花费的时间(单位:min )分别为:93,93,88,81,94,91则这组时间数据的标准差为___________. 14.已知一组样本数据1210,x x x ,且22212102020x x x +++=,平均数9=x ,则该组数据的标准差为__________.15.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 16.已知样本数据为40,42,40,a ,43,44,且这个样本的平均数为43,则该样本的标准差为_________.17.下图是华师一附中数学讲故事大赛7位评委给某位学生的表演打出的分数的茎叶图.记分员在去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是____________.18.下表为生产A 产品过程中产量x (吨)与相应的生产耗能y (吨)的几组相对应数据:x34 5 6y 23.555.5根据上表提供的数据,得到y 关于x 的线性回归方程为0.7y x a =+,则a =__________. 19.目前北方空气污染越来越严重,某大学组织学生参加环保知识竞赛,从参加学生中抽取40名,将其成绩(均为整数)整理后画出的频率分布直方图如图,若从成绩是80分以上(包括80分)的学生中选两人,则他们在同一分数段的概率为_______.20.某班运动队由足球运动员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n 的样本,若分别采用系统抽样法和分层抽样法,则都不用剔除个体;当样本容量为n +1时,若采用系统抽样法,则需要剔除1个个体,那么样本容量n 为________.三、解答题21.为了了解高中新生的体能情况,某学校抽取部分高一学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12﹒(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.22.为了提高生产效益,某企业引进了一批新的生产设备,为了解设备生产产品的质量情况,分别从新、旧设备所生产的产品中,各随机抽取100件产品进行质量检测,所有产品15,45以内,规定质量指标值大于30的产品为优质品,质量指标值在质量指标值均在(](]15,30的产品为合格品,旧设备所生产的产品质量指标值如频率分布直方图所示,新设备所生产的产品质量指标值如频数分布表所示.质量指标值频数(]15,202(1)请分别估计新、旧设备所生产的产品的优质品率.(2)优质品率是衡量一台设备性能高低的重要指标,优质品率越高说明设备的性能越高,根据已知图表数据填写下面列联表(单位:件),并判断是否有95%的把握认为“产品质量高于新设备有关”.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. (3)已知每件产品的纯利润y (单位:元)与产品质量指标值t 的关系式为2,3045,1,1530,t y t <≤⎧=⎨<≤⎩若每台新设备每天可以生产1000件产品,买一台新设备需要80万元,请估计至少需要生产多少天方可以收回设备成本.23.某湿地公园占地约44万2m ,风景优美,吸引了大批市民前来游玩、健身.当地政府为了开展全民健身活动,组织了跑步队,并给每位队员发放统一服装,吸引了越来越多的市民加入跑步队.组织者统计了跑步队成立一个月内每一天队员的人数,用x 表示跑步队成立的天数,y 表示当天跑步队的人数,给出部分数据如下表所示: 第x (天) 1 4 9 1625 y (人)4080120140160经研究发现,可以用y c d x =+作为y 关于x 的回归方程类型. (1)根据表中的数据,建立y 关于x 的回归方程; (2)请预测第36天跑步队的人数. 参考数据:yx51i ii t y =∑51i ii x y =∑521ii x=∑521ii t=∑108111920 7680 979 55其中5115i i x x ==∑,5115i i y y ==∑,i i t x =,5115i i t t ==∑.参考公式:对于一组数据()()()1122,,,,,,n n u v u v u v ,其回归直线v a u β=+的斜率和截距的最小二乘法估计公式分别为:1221ni i i nii u v nuvunuβ==-=-∑∑,a v u β=-.24.为了解某小卖部冷饮销量与气温之间的关系,随机统计并制作了6天卖出的冷饮的数量与当天最高气温的对照表: 气温()x ℃ 27 29 30 32 33 35 数量y121520272836(1)画出散点图,并求出y 关于x 的线性回归方程;(2)根据天气预报,某天最高气温为36.6℃,请你根据这些数据预测这天小卖部卖出的冷饮数量.附:一组数据11(,)x y ,22(,)x y ,,(,)n n x y 的回归直线y a bx =+的斜率和截距的最小二乘估计为()()()121ˆniii ni i x x y y bx x ==--=-∑∑,ˆa y bx=- 25.某花圃为提高某品种花苗质量,开展技术创新活动,在A ,B 实验地分别用甲、乙方法培育该品种花苗.为观测其生长情况,分别在A ,B 试验地随机抽选各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图.记综合评分为80及以上的花苗为优质花苗.(1)求图中a 的值,并求综合评分的平均数;(2)若优质花苗数中甲乙两种培育法的比列为1:3,填写下面的列联表,并判断是否有99%的把握认为优质花苗与培育方法有关.优质花苗 非优质花苗 合计甲培育法 乙培育法 合计附:下面的临界值表仅供参考.()20P K k ≥ 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0k2.0722.706 3.841 5.0246.635 7.87910.828(参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)26.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.独立性检验临界值表:【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A .【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.A解析:A 【分析】先弄清楚程序框图中是统计成绩不低于90分的学生人数,然后从茎叶图中将不低于90分的个数数出来,即为输出的结果. 【详解】176A =,1i =,16i ≤成立,190A ≥不成立,112i =+=; 279A =,2i =,16i ≤成立,290A ≥不成立,112i =+=;792A =,7i =,16i ≤成立,790A ≥成立,011n =+=,718i =+=;依此类推,上述程序框图是统计成绩不低于90分的学生人数,从茎叶图中可知,不低于90分的学生数为10,故选A . 【点睛】本题考查茎叶图与程序框图的综合应用,理解程序框图的意义,是解本题的关键,考查理解能力,属于中等题.3.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差. 【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x+++++=得x =4,∴5个分数的方差为:S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B 【点睛】本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.4.C解析:C 【分析】认真观察题中所给的折线图,对照选项逐一分析,求得结果. 【详解】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确; 从图可知从6日到9日 2.5PM 日均值逐渐降低,所以B 正确; 从图可知,这10天中 2.5PM 日均值最高的是12月6日,所以D 正确; 由图可知,这10天中 2.5PM 日均值的中位数是4145432+=,所以C 不正确; 故选C. 【点睛】该题考查的是有关利用题中所给的折线图,描述对应变量所满足的特征,在解题的过程中,需要逐一对选项进行分析,正确理解题意是解题的关键.5.D解析:D 【分析】根据图形中给出的数据,对每个选项分别进行分析判断后可得错误的结论. 【详解】对于选项A ,由图可得3月份的销售任务是400台,所以A 正确. 对于选项B ,由图形得2018年月销售任务的平均值为1(3245810743413)10045012⨯+++++++++++⨯=,所以B 正确. 对于选项C ,由图形得第一季度的总销售量为13002001400 1.28302⨯+⨯+⨯=台,所以C 正确.对于选项D ,由图形得销售量最大的月份是5月份,为800台,所以D 不正确. 故选D . 【点睛】本题考查统计中的识图、用图和计算,解题的关键是从图中得到相关数据,然后再根据要求进行求解,属于基础题.6.C解析:C 【解析】分析:利用平均数的公式,求得6x =,得到数据2,5,8,9,6,再利用方差的计算公式,即求解数据的方差.详解:由题意,一组数据2,5,8,9,x 的平均数为6,即258924655x xx +++++===,解得6x =,所以数据2,5,8,9,6的方差为2222221[(26)(56)(86)(96)(66)]65s =-+-+-+-+-=,故选C.点睛:本题主要考查了数据的数字特的计算,其中熟记数据的平均数的公式和数据的方差的计算公式是解答的关键,着重考查了推理与运算能力,属于基础题.7.A解析:A 【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为10002050= 所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.8.B解析:B 【详解】试题分析:4235492639543.5,4244x y ++++++====, ∵数据的样本中心点在线性回归直线上,回归方程ˆˆˆybx a =+中的ˆb 为9.4, ∴42=9.4×3.5+a ,∴ˆa=9.1, ∴线性回归方程是y=9.4x+9.1,∴广告费用为6万元时销售额为9.4×6+9.1=65.5 考点:线性回归方程9.A解析:A 【解析】8个班参加合唱比赛的得分从小到大排列分别是87,89,90,91,92,93,94,96,中位数是91,92,的平均数91.5,平均数是87+89+90+91+92+93+94+968=91.510.B解析:B 【解析】分析:首先写出所有学生的乘积,然后结合系统抽样的方法整理计算即可求得最终结果. 详解:由题意可知,学生的成绩如下:111,111,112,113,113; 116,117,117,118,118; 120,120,121,122,122; 123,124,124,126127; 128,128,129,129,129; 131,131,131,132,132;132,133,134,134,135; 137,138,138,138,139;140,142,142,143,144.用系统抽样方法从中抽取9人,则每5人中抽取一人,即上述分组中每组抽取一人, 则所抽取的学生的成绩在区间[]120,135上的学生人数为5. 本题选择B 选项.点睛:本题主要考查系统抽样的概念及其应用,茎叶图的识别等知识,意在考查学生的转化能力和计算求解能力.11.C解析:C 【解析】分析:利用回归方程和独立性检验对每一个命题逐一判断.详解:对于①,一个回归方程35y x =-,变量x 增加一个单位时,y 应平均减少5个单位,所以该命题是错误的;对于②,线性回归直线ˆybx a =+必过必过点(),x y ,是正确的;对于③,在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,并不能说明他有99%的可能患肺病,所以该命题是错误的. 故答案为:C.点睛:本题主要考查回归方程和独立性检验,意在考查学生对这些知识的掌握水平和分析推理能力.12.A解析:A 【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=, 取卡片的次数为100次,则取到号码为奇数的频率是530.53100=. 本题选择A 选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.【分析】由搜集算法所费的时间的数据求得数据的平均数再结合方差的计算公式即可求解【详解】由题意搜集算法所费的时间的数据可得数据的平均数为所以方差为所以标准差故答案为:【点睛】本题主要考查了数据的平均数解析:【分析】由搜集算法所费的时间的数据,求得数据的平均数,再结合方差的计算公式,即可求解.由题意,搜集算法所费的时间的数据, 可得数据的平均数为939388819491906x +++++==,所以方差为2222222(9390)(9390)(8890)(8190)(9490)(9190)206s -+-+-+-+-+-==,所以标准差s ==故答案为: 【点睛】本题主要考查了数据的平均数和方差的计算,其中解答中熟记数据的平均数和方差的计算公式,准确计算是解答的关键,着重考查运算与求解能力.14.11【分析】根据题意利用方差公式计算可得数据的方差进而利用标准差公式可得答案【详解】根据题意一组样本数据且平均数则其方差则其标准差故答案为:11【点睛】本题主要考查平均数方差与标准差属于基础题样本方解析:11 【分析】根据题意,利用方差公式计算可得数据的方差,进而利用标准差公式可得答案. 【详解】根据题意,一组样本数据1210,,...,x x x ,且22212102020x x x ++⋯+=,平均数9x =, 则其方差()()()()22221210110S x x x x x x =-+-+⋯+-()2222121011012110x x x x =++⋯+-=,则其标准差11S ==, 故答案为:11. 【点睛】本题主要考查平均数、方差与标准差,属于基础题. 样本方差2222121[()()...()]n s x x x x x x n=-+-++-,标准差s =15.2【分析】根据题意列出关于的等量关系式结合求得的值利用方差公式求得结果【详解】一组数据的平均数是8且所以化简得又所以的值分别为或所以该组数据的方差为:故答案是:2【点睛】该题考查的是有关求一组数据的解析:2根据题意,列出关于,x y 的等量关系式,结合90xy =,求得,x y 的值,利用方差公式求得结果. 【详解】一组数据6,7,8,,x y 的平均数是8,且90xy =, 所以6788540x y ++++=⨯=, 化简得19x y +=,又90xy =, 所以,x y 的值分别为10,9或9,10, 所以该组数据的方差为:222222110[(68)(78)(88)(98)(108)]255s =-+-+-+-+-==,故答案是:2. 【点睛】该题考查的是有关求一组数据的方差的问题,涉及到的知识点有方差公式,属于简单题目.16.【分析】由平均数的公式求得再利用方差的计算公式求得即可求解【详解】由平均数的公式可得解得所以方差为所以样本的标准差为【点睛】本题主要考查了样本的平均数与方差标准差的计算着重考查了运算与求解能力属于基【分析】由平均数的公式,求得49a =,再利用方差的计算公式,求得2283s =,即可求解. 【详解】由平均数的公式,可得1(4042404344)436a +++++=,解得49a =, 所以方差为2222222128[(4043)(4243)(4043)(4943)(4343)(4443)]63s =-+-+-+-+-+-=,所以样本的标准差为s = 【点睛】本题主要考查了样本的平均数与方差、标准差的计算,着重考查了运算与求解能力,属于基础题.17.1【分析】因为题目中要去掉一个最高分所以对进行分类讨论然后结合平均数的计算公式求出结果【详解】若去掉一个最高分和一个最低分86分后平均分为不符合题意故最高分为94分去掉一个最高分94分去掉一个最低分解析:1因为题目中要去掉一个最高分,所以对x 进行分类讨论,然后结合平均数的计算公式求出结果 【详解】若4x >,去掉一个最高分()90x +和一个最低分86分后,平均分为()1899291949291.65++++=,不符合题意,故4x ≤,最高分为94分,去掉一个最高分94分,去掉一个最低分86分后,平均分()18992909192915x +++++=,解得1x =,故数字x 为1 【点睛】本题考查了由茎叶图求平均值,理解题目意思运用平均数计算公式即可求出结果,注意分类讨论18.【解析】分析:首先求得样本中心点然后利用回归方程的性质求得实数a 的值即可详解:由题意可得:线性回归方程过样本中心点则:解得:点睛:本题主要考查线性回归方程的性质及其应用等知识意在考查学生的转化能力和 解析:0.85【解析】分析:首先求得样本中心点,然后利用回归方程的性质求得实数a 的值即可. 详解:由题意可得:34569==42x +++,2 3.55 5.544y +++==, 线性回归方程过样本中心点9,42⎛⎫⎪⎝⎭,则:940.72a =⨯+,解得:0.85a =.点睛:本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.19.【解析】设第二组及第五组数据对应矩形的高为a 则10×(a+0015+0025+0035+a+0005)=1解得a=0010故各组的频率依次为:010015025035010005∵前三组的累积频率为 解析:715【解析】设第二组及第五组数据对应矩形的高为a , 则10×(a+0.015+0.025+0.035+a+0.005)=1, 解得a=0.010,故各组的频率依次为:0.10,0.15,0.25,0.35,0.10,0.05, ∵前三组的累积频率为:0.10+0.15+0.25=0.50, 故这次环保知识竞赛成绩的中位数为70;成绩在[80,90)段的人数有10×0.010×40=4人,成绩在[90,100]段的人数有10×0.005×40=2人,从成绩是80分以上(包括80分)的学生中任选两人共有15种不同的基本事件,其中他们在同一分数段的基本事件有:7,故他们在同一分数段的概率为7. 15故答案为:7 15.20.6【解析】n为18+12+6=36的正约数因为18:12:6=3:2:1所以n为6的倍数因此因为当样本容量为时若采用系统抽样法则需要剔除1个个体所以n+1为35的正约数因此解析:6【解析】n为18+12+6=36的正约数,因为18:12:6=3:2:1,所以n为6的倍数,因此6,12,18,24,30,36n=因为当样本容量为1n+时,若采用系统抽样法,则需要剔除1个个体,所以n+1为35的正约数,因此6n=三、解答题21.(1)0.08,150;(2)88%;(3)第四小组,理由见解析【解析】试题分析:(1)由频率分布直方图中各小矩形面积之和为1结合面积之比得到第二小组的频率,从而求得样本容量;(2)由频率分布直方图中各小矩形的面积和为1与面积之比可求出达标的频率即达标率;(3)求出前四组的频数即可得到中位数所在的区间.试题(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:又因为频率=所以(2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.考点:频率分布直方图22.(1)70%,55%;(2)列联表见解析,有95%的把握认为产品质量高与新设备有关;(3)471天方.【分析】(1)根据旧设备所生产的产品质量指标值的频率分布直方图中后3组的频率之和即为旧设备所生产的产品的优质品率,根据新设备所生产的产品质量指标值的频数分布表即可估计新设备所生产的产品的优质品率;(2)根据题目所给的数据填写22⨯列联表,计算K 的观测值2K ,对照题目中的表格,得出统计结论;(3)根据新设备所生产的产品的优质品率,分别计算1000件产品中优质品的件数和合格品的件数,得到每天的纯利润,从而计算出至少需要生产多少天方可以收回设备成本. 【详解】 解:(1)估计新设备所生产的产品的优质品率为:3025150.770%100++==,估计旧设备所生产的产品的优质品率为:()50.060.030.020.5555%⨯++==. (2)由列联表可得,()220030554570 4.8 3.84175125100100K ⨯⨯-⨯==>⨯⨯⨯, ∴有95%的把握认为产品质量高与新设备有关. (3)新设备所生产的产品的优质品率为0.7∴每台新设备每天所生产的1000件产品中,估计有10000.7700⨯=件优质品, 有1000700300-=件合格品.∴估计每台新设备一天所生产的产品的纯利润为700230011700⨯+⨯=(元). 8000001700471÷≈(天),∴估计至少需要生产471天方可以收回设备成本. 【点睛】本题考查了独立性检验的应用问题,考查了频率分布直方图,也考查了计算能力的应用问题,属于中档题.23.(1)18y =+;(2)198人. 【分析】(1)令t =,y c d t =+⋅,计算得3t =,511920i i i t y ==∑,52155i i t ==∑,30d =,把样本点的中心()3,108代入108303c =+⨯,得18c =,可得1830y t =+,所以1830y x =+;(2)将36x =代入1830y x =+中,可得结果. 【详解】(1)∵y c d x =+,令t x =,∴y c d t =+⋅,∵1234535t ++++==,108y =,511920i i i t y ==∑,52155i i t ==∑, ∴515222151920531083055535i ii i i t y t yd t t==--⨯⨯===-⨯-∑∑,把样本点的中心()3,108代入108303c =+⨯,得18c =, ∴1830y t =+,∴y 关于x 的回归方程式:1830y x =+; (2)将36x =代入1830y x =+中,得183036198y =+=, 故预测第36天跑步队的人数为198人. 【点睛】本题考查了转化化归思想,考查了利用最小二乘法求回归直线方程,考查了利用回归方程对总体进行预测,属于中档题. 24.(1)作图见解析,4310111414y x =-;(2)40. 【分析】(1)描点法得出散点图,根据所给数据及公式计算回归方程的系数,得回归方程; (2)36.6x =代入回归方程计算即得. 【详解】(1)散点图如图所示.根据销量与气温对照表知,272930323335316x +++++==,1215207836236y +++++==,则()()()()()()()()()()()12222222141128131425413421124niii nii x x y y b x x ==---⨯-+-⨯-+-⨯-+⨯+⨯+⨯==-+-+-+++-∑∑129434214==, 43101123311414a y bx =-=-⨯=-, 所以y 关于x 的线性回归方程为4310111414y x =-. (2)当36.6x =时,43101136.640.2401414y =⨯-=≈. 答:当最高气温为36.6℃时,可预测这天小卖部卖出的冷饮数量约为40. 【点睛】本题考查散点图,考查线性回归直线方程,考查学生的数据处理能力,运算求解能力,属于中档题.25.(1)0.04,81;(2)列联表见解析,有99%的把握认为优质花苗与培育方法有关 【分析】(1)利用频率和为1列方程求出a 的值,再利用直方图平均值公式计算平均值; (2)由(1)结合直方图求出有关数据,可填写列联表,计算观测值,对照临界值得出结论. 【详解】(1)因为(0.0050.0100.0250.020)101a ++++⨯=, 解得0.040a =,综合评分的平均数为,(0.005550.010650.025750.040850.02095)1081⨯+⨯+⨯+⨯+⨯⨯=(2)由(1)结合直方图可知,80分以上的频数为()1000.40.260⨯+=, 甲乙两种培育法的比列为1:3,所以,甲乙两种培育法的优质苗数分别为15、45 填写列联表如下,计算237,510.82860405050K =≈>⨯⨯⨯, 所以有99%的把握认为优质花苗与培育方法有关. 【点睛】本题考查了频率分布直方图的性质与应用问题,也考查了列联表与独立性检验问题的实际应用,是中档题.26.(1)分布列见解析,1;(2)0.10=P ,理由见解析. 【分析】(1)按照分层抽样计算“科学用眼”和“不科学用眼”的抽取人数,随机变量X的取值可能为0,1,2,然后计算概率得出分布列及其数学期望;(2)按照公式计算2K的值,然后由临界值表得出结果即可.【详解】(1)“科学用眼”抽156245⨯=人,“不科学用眼”抽306445⨯=人,则随机变量X0=,1,2,∴343641(0)205====CP XC,122436123(1)205C CP XC====,21243641(2)205C CP XC====,分布列为:0120121555EX=⨯+⨯+⨯=;(2)22100(45153010)3.03075255545⨯-⨯=≈⨯⨯⨯K,由表可知2.706 3.030 3.840<<,∴0.10=P.【点睛】本题考查随机变量的分布列和数学期望,考查独立性检验,考查逻辑思维能力和计算能力,考查学生分析解决问题的能力,属于常考题.。
一、选择题1.某商场为了了解毛衣的月销售量y (件)与月平均气温x (C ︒)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: 月平均气温x C ︒171382月销售量y (件)24334055由表中数据算出线性回归方程y bx a =+中的2b =-,气象部门预测下个月的平均气温为6C ︒,据此估计该商场下个月毛衣销售量约为( )A .58件B .40件C .38件D .46件2.2020年2月,受新冠肺炎的影响,医卫市场上出现了“一罩难求”的现象.在政府部门的牵头下,部分工厂转业生产口罩,下表为某小型工厂2-5月份生产的口罩数(单位:万) 月份x 2 3 4 5 口罩数y4.5432.5口罩数y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 的值为( ) A .6.1B .5.8C .5.95D .6.753.某班统计一次数学测验的平均分与方差,计算完毕才发现有位同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( )A .1x x =,221s s = B .1x x =,221s s < C .1x x =,221s s >D .1x x <,221s s =4.某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y +的值是( )A .12B .14C .16D .185.学校为了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于30分钟的观众称为“阅读霸”,则下列命题正确的是( ) A .抽样表明,该校有一半学生为阅读霸 B .该校只有50名学生不喜欢阅读 C .该校只有50名学生喜欢阅读 D .抽样表明,该校有50名学生为阅读霸6.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x (万元)8.28.610.011.311.9支出y (万元)6.27.58.0 8.59.8根据上表可得回归直线方程ˆˆˆybx a =+,其中ˆˆˆ0.76,b a y bx ==-,据此估计,该社区一户收入为15万元家庭年支出为( ) A .11.4万元B .11.8万元C .12.0万元D .12.2万元7.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元8.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和929.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10B .11C .12D .1310.已知某企业上半年前5个月产品广告投入与利润额统计如下: 月份1 2 3 4 5 广告投入(x 万元) 9.5 9.3 9.1 8.9 9.7 利润(y 万元)9289898793由此所得回归方程为7.5ˆyx a =+,若6月份广告投入10(万元)估计所获利润为( ) A .97万元B .96.5万元C .95.25万元D .97.25万元11.从8名女生4名男生中,选出3名学生组成课外小组,如果按性别比例分层抽样,则不同的抽取方法数为( )A .112种B .100种C .90种D .80种12.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53B .0.5C .0.47D .0.37二、填空题13.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.14.水痘是一种传染性很强的病毒性疾病,易在春天爆发.市疾控中心为了调查某校高年级学生注射水症疫苗的人数,在高一年级随机抽取5个班级,每个班抽取的人数互不相同,若把每个班级抽取的人数作为样本数据.已知样本平均数为7,样本方差为4,则样本数据中的最小值是______. 15.已知一组样本数据1210,x x x ,且22212102020x x x +++=,平均数9=x ,则该组数据的标准差为__________.16.一组数据由小到大依次为2,4,5,7,,,12,13,14,15a b ,且平均数为9,则49a b+的最小值为________.17.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:^y =0.245x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_______万元. 18.给出下列命题:①若函数()y f x =满足(1)(1)f x f x -=+,则函数()f x 的图象关于直线1x =对称; ②点(2,1)关于直线10x y -+=的对称点为(0,3);③通过回归方程y bx a =+可以估计和观测变量的取值和变化趋势;④正弦函数是奇函数,2()sin(1)f x x =+是正弦函数,所以2()sin(1)f x x =+是奇函数,上述推理错误的原因是大前提不正确. 其中真命题的序号是__________.19.某次测试共有100名考生参加,测试成绩的频率分布直方图如下图所示,则成绩在80分以上的人数为__________.20.某高中有高一学生320人,高二学生400人,高三学生360人.现采用分层抽样调查学生的视力情况.已知从高一学生中抽取了8人,则三个年级一共抽取了__________人。
第2课时系统抽样课时过关·能力提升1.从N个编号中抽取n个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为()AC答案:C2.有40件产品,编号为1~40,现在从中抽取4件检验,用系统抽样的方法确定所抽取的编号可能为()A.5,10,15,20B.2,12,22,32C.2,14,26,38D.5,8,31,36解析:由系统抽样的定义知抽样距为可以在第一组1~10号样本中取k号,1≤k≤10,则抽取到的样本编号为k,k+10,k+20,k+30.答案:B3.从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为()A.480B.481C.482D.483解析:由样本中编号最小的两个编号分别为007,032,得抽样距为32-7=25,则样本容量为每组中应抽取的号码数x=7+25(n-1)(1≤n≤20,n∈Z),当n=20时,x取得最大值为x=7+25×19=482.答案:C4.总体容量为524,采用系统抽样法抽样,若想不剔除个体,则抽样间隔可以为()A.3B.4C.5D.6解析:因为系统抽样的间隔需要能整除总体个数.故选B.答案:B5.某初级中学有学生270人,其中七年级108人,八年级、九年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按七年级、八年级、九年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270.那么关于上述样本的下列结论,正确的是()A.②③都不能为系统抽样B.②④都不能为分层抽样C.①④都可能为系统抽样D.①③都可能为分层抽样解析:由定义可知,①③可能为分层抽样也可能为系统抽样;②可能为分层抽样;④可能为简单随机抽样.故选D.答案:D6.将高三(1)班参加体检的36名学生,编号为:1,2,3,…,36,若采用系统抽样的方法抽取一个容量为4的样本,已知样本中含有编号为6号、24号、33号的学生,则样本中剩余一名学生的编号是.答案:157.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,……,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是.若用分层抽样方法,则40岁以下年龄段应抽取人.解析:由题意可知,系统抽样时共分成40组,抽样间隔为5,第5组的号码为22,则第8组的号码为22+5×3=37.在分层抽样时,由于40岁以下年龄段人数占总数的50%,故40岁以下年龄段应抽取40×50%=20(人).答案:37208.一个总体中有100个个体,随机编号为0,1,2,…,99.依编号顺序平均分成10个小组,组号依次为1,2,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是.解析:由题设知,若m=6,则在第7组中抽取的号码个位数字与13的个位数字相同,而第7组中的编号依次为60,61,62,63,…,69.故在第7组中抽取的号码是63.答案:639.某学校有学生3 000人,现在要抽取100人组成夏令营,应该怎样抽取样本?分析:因为总体中个体数较多,且无差异,所以按系统抽样的步骤来进行抽样.解:按系统抽样抽取样本,其步骤如下.第一步:把这些学生分成100个组,因为所以每个组30名学生,这时,抽样距就是30.第二步:将3 000名学生随机编号为1,2, (3000)第三步:在第1组用简单随机抽样确定起始个体的编号l(0<l≤30).第四步:按照一定的规则抽取样本,通常是将起始编号l加上分段间隔30得到第2个个体编号l+30,再加上30得到第3个个体编号l+60,这样继续下去,直到获取整个样本.比如l=15,则抽取的编号为15,45,75,105,…,2985.这些号码对应的学生组成样本.10.为了考察某校的教学水平,将抽取这个学校本学年高三年级部分学生的考试成绩,为了全面地反映实际情况,采取以下三种方式进行抽样(已知该校高三年级共有20个教学班,并且每个班的学生都已经按随机方式编好了学号,假定该校每个班的学生人数都相同).①从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察他们的考试成绩;②每个班都抽取1人,共计20人,考察这20个学生的考试成绩;③把学生按成绩分成优秀、良好、普通三个级别,从其中抽取100名学生进行考察(已知若按成绩分,该校高三学生中优秀生共有150人,良好生共有600人,普通生共有250人).根据上面的叙述,试回答下列问题:(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式所抽取的样本中,其样本容量分别是多少?(2)上面三种抽取方式中各自采用何种方法抽取样本?(3)试分别写出上面三种抽取方式各自抽取样本的步骤.解:(1)在这三种抽取方式中,其总体都是该校本学年高三全体学生的考试成绩,个体都是本学年高三年级每个学生的考试成绩.其中第一种抽取方式中样本为所抽取的本学年20名学生的考试成绩,样本容量为20;第二种抽取方式中样本为所抽取的本学年20名学生的考试成绩,样本容量为20;第三种抽取方式中样本为所抽取的本学年100名学生的考试成绩,样本容量为100.(2)在上面三种抽取方式中,第一种方式采用的是简单随机抽样;第二种方式采用的是系统抽样和简单随机抽样;第三种方式采用的是分层抽样和简单随机抽样.(3)第一种方式抽取样本的步骤如下:首先在这20个班中用抽签法任意抽取一个班,然后从这个班中按学号用随机数法或抽签法抽取20个学生,考察其考试成绩.第二种方式抽取样本的步骤如下:首先在第一个班中,用简单随机抽样法任意抽取一个学生,记其学号为a.然后在其余的19个班中,选取学号为a的学生,共计20人.第三种方式抽取样本的步骤如下:首先分层.因为若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应该把全体学生分成三层.然后确定各层抽取的人数.因为样本容量与总体的个体数之比为100∶1 000=1∶10,所以在每层抽取的个体数依次为即15,60,25.最后按层分别抽取.在优秀生中用简单随机抽样抽取15人,在良好生中用简单随机抽样抽取60人,在普通生中用简单随机抽样抽取25人.。
一、选择题1.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为 ( ) A .45,75,15B .45,45,45C .45,60,30D .30,90,152.某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成[)[)[)[)[)[)[)[]0,5,5,10,10,15,15,20,20,25,25,30,30,35,35,40时,所作的频率分布直方图如图所示,则原始茎叶图可能是( )A .B .C .D .3.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号1,2,⋯,960,分组后在第一组采用简单随机抽样的方法抽到的号码为29,则抽到的32人中,编号落入区间[]200,480的人数为 A .7 B .9C .10D .124.在一段时间内,某种商品的价格x (元)和销售量y (件)之间的一组数据如下表:价格x (元) 4 6 8 10 12 销售量y (件)358910若y 与x 呈线性相关关系,且解得回归直线ˆˆˆy bx a =+的斜率0.9b ∧=,则a ∧的值为( )A .0.2B .-0.7C .-0.2D .0.75.学校为了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于30分钟的观众称为“阅读霸”,则下列命题正确的是( ) A .抽样表明,该校有一半学生为阅读霸 B .该校只有50名学生不喜欢阅读 C .该校只有50名学生喜欢阅读 D .抽样表明,该校有50名学生为阅读霸 6.①45化为二进制数为(2)101101;②一个总体含有1000个个体(编号为0000,0001,…,0999),采用系统抽样从中抽取一个容量为50的样本,若第一个抽取的编号为0008,则第六个编号为0128; ③已知a ,b ,c 为ABC ∆三个内角A ,B ,C 的对边,其中3a =,4c =,6A π=,则这样的三角形有两个解.以上说法正确的个数是( ) A .0B .1C .2D .37.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3OP (O 为原点)的斜率的取值范围是3333(,)(,)22-∞-. A .①②③B .①③④C .①②④D .②③④8.某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( ) A .30B .25C .20D .159.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是A .甲地:总体均值为3,中位数为4B .乙地:总体均值为1,总体方差大于0C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为310.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10B .11C .12D .1311.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64B .96C .144D .16012.从8名女生4名男生中,选出3名学生组成课外小组,如果按性别比例分层抽样,则不同的抽取方法数为( ) A .112种B .100种C .90种D .80种二、填空题13.一组数据由小到大依次为2,4,5,7,,,12,13,14,15a b ,且平均数为9,则49a b+的最小值为________.14.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 15.一个车间为了规定工作原理,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下:由表中数据,求得线性回归方程0.66y x a =+,则估计加工70个零件时间为__________分钟(精确到0.1).16.已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为______.17.某天有10名工人生产同一零部件,生产的件数分别是:15、17、14、10、15、17、17、16、14、12,设其平均数为a ,中位数为b ,众数为c ,则a 、b 、c 从小到大的关系依次是________18.已知一组数据为2,3,4,5,6,则这组数据的方差为______.19.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88,若B 样本数据恰好是A 样本数据每个都加2后所得数据,则,A B 两样本的数字特征(众数、中位数、平均数、方差)对应相同的是__________.20.已知一组数据x ,8,7,9,7,若这组数据的平均数为8,则它们的方差为______.三、解答题21.2020年1月末,新冠疫情爆发,经过全国人民的努力,2月中旬,疫情得到了初步的控制,湖北省以外地区的每日新增确诊人数开始减少,某同学针对这个问题,选取他在统计学中学到的一元线性回归模型,作了数学探究:他于2月17日统计了2月7日至16日这十天湖北省以外地区的每日新增确诊人数,表格如下:计算出: 5.5,335x y ==,()()1013955iii x x y y =--=-∑,()210182.5ii x x =-=∑(1)请你帮这位同学计算出y 与x 的线性回归方程(精确到0.1),然后根据这个方程估计湖北省以外地区新增确诊人数为零时的大概日期;附:回归方程y bx a =+中斜率和截距的最小二乘法估计公式分别为:()()()1012101iii ii x x y y b x x ==--=-∑∑,a y bx =-(2)实际上2月17日至2月22日的新增确诊人数如下:出评价.22.某校高一年级举行“抗击新冠肺炎”在线知识问答比赛,现将60名参赛学生的成绩(满分100分)统计如下:(1)根据上面的统计表,作出这些数据的频率分布直方图;(2)求这60名参赛学生成绩的平均数(同一组中的数据用该组区间的中间值作代表)和中位数.23.“城管喊你摆地摊啦!”为了释放地摊经济活力,为市民提供灵活多样化的便民服务,某地区为市民在城区设置了流动摊贩临时摆放点.小张为参与地摊创业,调查了该地区甲、乙两个行业地摊摊主5年内的年收人,制作了如下统计数据表 年份x2015 2016 2017 2018 2019 甲行业年收人y (万元) 7.8 8.6 10.0 11.1 12.5 乙行业年收入z (万元)6.210.68.26.613.4(1)根据表格,对比甲、乙两个行业摊主这5年的年收入情况(已知甲、乙两个行业的年收入的5个数据的方差分别为2.852,7.232),判断小张在这两个地摊行业中选择哪个创业更合适;(2)根据甲行业摊主这5年年收入的数据,求其年收入y 关于年份x 的线性回归方程,并据此估计甲行业摊主在2020年的年收入.附:回归方程y bx a =+中的斜率和截距的最小二乘估计公式分别为21122211()()n ni i ii i nniii i x y nx y x x b xnxx x ====--==--∑∑∑∑,a y bx =-.24.某公司为了制定下一季度的投入计划,收集了今年前6个月投入量x (单位:万元)和产量y (单位:吨)的数据,用两种模型①y bx a =+,②y b x a =分别进行拟合,得到相应的回归方程111.2 2.0y x =+,228.29.8y x =,进行残差分析得到如图所示的残差值及一些统计量的值: 月份1234563.5x =(1)求上表中空格内的值;(2)残差值的绝对值之和越小说明模型拟合效果越好,根据残差比较模型①,②的拟合效果,应选择哪一个模型?并说明理由;(3)残差绝对值大于3的数据认为是异常数据,需要剔除,剔除异常数据后,重新求出(2)中所选模型的回归方程.(参考公式:i i ie y bx a =--,1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-)25.如表为某中学近5年被卓越大学联盟录取的学生人数.记2015年的年份序号为1,2016年的年份序号为2,…,2019年的年份序号为5.(1)求y 关于x 的线性回归方程,并估计2020年该中学被卓越大学联盟录取的学生人数.(2)若在2015年和2019年被卓越大学联盟录取的学生中分层抽样7人,再从这7人中任选2人,求这2人恰好来自同一年份的概率.参考数据:521ii x=∑=55,51i ii x y =∑=2920.参考公式:b =1221ni ii nii x y nx yxnx ==--∑∑,a y bx =-26.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:221nii xnx s n=-=∑(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】因为共有学生2700,抽取135,所以抽样比为1352700,故各年级分别应抽取135900452700⨯=,1351200602700⨯=,135600302700⨯=,故选C. 2.A解析:A 【解析】由频率分布直方图可知:第一组的频数为20×0.01×5=1个, [0,5)的频数为20×0.01×5=1个, [5,10)的频数为20×0.01×5=1个, [10,15)频数为20×0.04×5=4个, [15,20)频数为20×0.02×5=2个, [20,25)频数为20×0.04×5=4个, [25,30)频数为20×0.03×5=3个, [30,35)频数为20×0.03×5=3个, [35,40]频数为20×0.02×5=2个, 则对应的茎叶图为A , 本题选择A 选项.点睛:茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3.C解析:C 【分析】根据系统抽样的定义,可知抽到的号码数可组成一个以301=-n a n 为通项公式的等差数列,令*200301480,≤-≤∈n n N ,解不等式可得结果. 【详解】每组人数=9603230÷=人,即抽到号码数的间隔为30,因为第一组抽到的号码为29,根据系统抽样的定义,抽到的号码数可组成一个等差数列,且*2930(1)301,=+-=-∈n n n n N a ,令200301480≤-≤n ,得2014813030≤≤n ,可得n 的取值可以从7取到16,共10个,故选C . 【点睛】本题主要考查系统抽样的定义及应用,转化为等差数列是解决本题的关键.4.C解析:C 【解析】 【分析】由题意利用线性回归方程的性质计算可得a 的值. 【详解】由于468101285x ++++==,35891075y ++++==,由于线性回归方程过样本中心点(),x y ,故:70.98a =⨯+, 据此可得:0.2a =-. 故选C . 【点睛】本题主要考查线性回归方程的性质及其应用,属于中等题.5.A解析:A 【分析】根据频率分布直方图得到各个时间段的人数,进而得到结果. 【详解】根据频率分布直方图可列下表:故选A. 【点睛】这个题目考查了频率分布直方图的实际应用,以及样本体现整体的特征的应用,属于基础题.6.C解析:C 【解析】分析:①根据进位制的互化可得结果;②根据系统抽样的性质可得结论;③由正弦定理可得结论.详解:①45222...1÷=,22211...0÷=,112 5...1÷=,52 2...1÷=,22 1...0÷=,120...1÷=,故()()10245101101=,①正确;②因为1000个个题抽取50个样本,∴每个样本编号间隔为20,第六个编号为8205108+⨯=,即编号为0108,故②错误;③由正弦定理可得342,1sin 32sinC C ==,,c a C >∴∠可能是锐角,也可能是钝角,三角形有两个解,③正确,故选C.点睛:本题主要考查进位制、正弦定理的应用,分层抽样的应用,意在考查综合运用所学知识解决问题的能力,属于中档题.7.C解析:C【分析】利用线性回归方程系数的几何意义,圆锥曲线离心率的范围,椭圆的性质,逐一判断即可.【详解】①设某大学的女生体重y(kg)与身高x(cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的线性回归方程为y∧=0.85x﹣85.71,则若该大学某女生身高增加1cm,则其体重约增加0.85kg,正确;②关于x的方程x2﹣mx+1=0(m>2)的两根之和大于2,两根之积等于1,故两根中,一根大于1,一根大于0小于1,故可分别作为椭圆和双曲线的离心率.正确;③设定圆C的方程为(x﹣a)2+(x﹣b)2=r2,其上定点A(x0,y0),设B(a+r cosθ,b+r sinθ),P(x,y),由12OP =(OA OB+)得22x a rcosxy b rsinyθθ++⎧=⎪⎪⎨++⎪=⎪⎩,消掉参数θ,得:(2x﹣x0﹣a)2+(2y﹣y0﹣b)2=r2,即动点P的轨迹为圆,∴故③不正确;④由22143x y+=,得a2=4,b2=3,∴1c==.则F(﹣1,0),如图:过F作垂直于x轴的直线,交椭圆于A(x轴上方),则x A=﹣1,代入椭圆方程可得32Ay=.当P为椭圆上顶点时,P(0FPk=32OAk=-,∴当直线FPOP的斜率的取值范围是32⎛⎫-∞-⎪⎝⎭,.当P为椭圆下顶点时,P(0,∴当直线FPOP,32),综上,直线OP(O为原点)的斜率的取值范围是32⎛⎫-∞-⎪⎝⎭,∪,32).故选C【点睛】本题以命题真假的判断为载体,着重考查了相关系数、离心率、椭圆简单的几何性质等知识点,属于中档题.8.C解析:C【详解】抽取比例为1501 30000200=,1400020200∴⨯=,抽取数量为20,故选C.9.D解析:D【详解】试题分析:由于甲地总体均值为,中位数为,即中间两个数(第天)人数的平均数为,因此后面的人数可以大于,故甲地不符合.乙地中总体均值为,因此这天的感染人数总数为,又由于方差大于,故这天中不可能每天都是,可以有一天大于,故乙地不符合,丙地中中位数为,众数为,出现的最多,并且可以出现,故丙地不符合,故丁地符合.考点:众数、中位数、平均数、方差10.C解析:C【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n=30n﹣19,由401≤30n﹣21≤755,求得正整数n的个数,即可得出结论.【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列,又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,∴等差数列的通项公式为a n=11+(n﹣1)30=30n﹣19,由401≤30n﹣19≤755,n为正整数可得14≤n≤25,∴做问卷C的人数为25﹣14+1=12,故选C.【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.11.D解析:D【解析】【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81= 12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数.【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816, 因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D. 【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题12.A解析:A 【解析】分析:根据分层抽样的总体个数和样本容量,做出女生和男生各应抽取的人数,得到女生要抽取2人,男生要抽取1人,根据分步计数原理得到需要抽取的方法数. 详解:∵8名女生,4名男生中选出3名学生组成课外小组, ∴每个个体被抽到的概率是14, 根据分层抽样要求,应选出8×14=2名女生,4×14=1名男生, ∴有C 82•C 41=112. 故答案为:A .点睛:本题主要考查分层抽样和计数原理,意在考查学生对这些知识的掌握水平.二、填空题13.【分析】由已知可得利用基本不等式即可求出的最小值【详解】一组数据由小到大依次为且平均数为9故当且仅当时等号成立的最小值为故答案为:【点睛】本题考查基本不等式在最值中的应用关键要对1做代换属于中档题解析:2518【分析】由已知可得18,712a b a b +=≤≤≤,利用基本不等式,即可求出49a b+的最小值. 【详解】一组数据由小到大依次为2,4,5,7,,,12,13,14,15a b , 且平均数为9,故18,712,118a ba b a b ++=≤≤≤=, 49149()()18a b a b a b+=++ 149125(13)(13181818b a a b =++≥+=当且仅当3654,55a b ==时,等号成立, 49a b+的最小值为2518.故答案为:2518【点睛】本题考查基本不等式在最值中的应用,关键要对“1”做代换,属于中档题.14.2【分析】根据题意列出关于的等量关系式结合求得的值利用方差公式求得结果【详解】一组数据的平均数是8且所以化简得又所以的值分别为或所以该组数据的方差为:故答案是:2【点睛】该题考查的是有关求一组数据的解析:2 【分析】根据题意,列出关于,x y 的等量关系式,结合90xy =,求得,x y 的值,利用方差公式求得结果. 【详解】一组数据6,7,8,,x y 的平均数是8,且90xy =, 所以6788540x y ++++=⨯=, 化简得19x y +=,又90xy =, 所以,x y 的值分别为10,9或9,10, 所以该组数据的方差为:222222110[(68)(78)(88)(98)(108)]255s =-+-+-+-+-==,故答案是:2. 【点睛】该题考查的是有关求一组数据的方差的问题,涉及到的知识点有方差公式,属于简单题目.15.7【解析】【分析】结合题意先求出线性回归方程然后再计算出结果【详解】由题意可得则线性回归方程为当时【点睛】本题考查了求线性回归方程然后求出估计结果需要掌握解题方法较为基础解析:7 【解析】 【分析】结合题意先求出线性回归方程,然后再计算出结果 【详解】 由题意可得1520304050315x ++++==6570758090765y ++++==,760.6631a ∴=⨯+, 55.54a =,则线性回归方程为0.66 5.4ˆ55y x =+ 当70x =时,ˆ101.7y≈ 【点睛】本题考查了求线性回归方程,然后求出估计结果,需要掌握解题方法,较为基础16.【解析】【分析】先求出这个数据的平均数为此时这个数据的方差为由此求出结果【详解】某个数据的平均数为方差为现又加入一个新数据则这个数据的平均数为此时这个数据的方差为故答案为【点睛】本题主要考查了平均数解析:83【解析】 【分析】先求出这9个数据的平均数为5,此时这9个数据的方差为()22183559S ⎡⎤=⨯+-⎣⎦,由此求出结果 【详解】某8个数据的平均数为5,方差为3,现又加入一个新数据5, 则这9个数据的平均数为85559⨯+= ∴此时这9个数据的方差为()2218835593S ⎡⎤=⨯+-=⎣⎦故答案为83【点睛】本题主要考查了平均数和方差的计算公式,属于基础题。
第一章检测(时间:120分钟满分:150分)一、选择题:本大题共12小题,每小题5分,在每小题给出的四个选项中,只有一项是符合题目要求的.1.现从100件产品中随机抽出10件进行质量检测,下列说法正确的是()A.100件产品是总体B.10件产品是样本C.样本容量为100D.样本容量为10解析:这里考查统计的基本概念,总体是100件产品的质量;样本是抽取的10件产品的质量;总体容量为100,样本容量为10.答案:D2.下列说法中,不正确的是()A.系统抽样是先将差异明显的总体分成几个小组,再进行抽取B.分层抽样是将差异明显的几部分组成的总体分成几层,然后进行抽取C.简单随机抽样是从个体无差异且个体数较少的总体中逐个抽取个体D.系统抽样是从个体无差异且个数较多的总体中,将总体均分,再按事先确定的规则在各部分抽取解析:当总体中个体差异明显时,用分层抽样;当总体中个体无差异且个体数较多时,用系统抽样;当总体中个体无差异且个体数较少时,用简单随机抽样.所以A不正确.答案:A3.重庆市2016年各月的平均气温(单位:℃)数据的茎叶图如图所示,则这组数据的中位数是()A.19B.20C.21.5D.23答案:B4. 如图是容量为100的样本数据(质量)的频率分布直方图,已知样本质量均在[5,20]内,其分组为[5,10),[10,15),[15,20],则样本质量落在[15,20]内的频数为()A.10B.20C.30D.40解析:由题意得,组距为5,则样本质量在[5,10),[10,15)内的频率分别为0.3和0.5,所以样本质量在[15,20]内的频率为1-0.3-0.5=0.2.故频数为100×0.2=20.答案:B5.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,得到的频率分布直方图是()解析:由分组可知C,D一定不对;由题中茎叶图可知[0,5)有1人,[5,10)有1人,所以第一、二小组频率相同,频率分布直方图中矩形的高应相同,可排除B.故选A.答案:A6.已知两组数据x1,x2,…,x n与y1,y2,…,y n,它们的平均数分别是x和y,则新的一组数据2x1−5y1+ 3,2x2−5y2+3,…,2x n−5y n+3的平均数是()A.2x−5yB.2x−5y+3C.4x−25yD.4x−25y+3答案:B7.在抽查样本中,用频率分布直方图表示尺寸的过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个数在该组内的频率为m,表示该组的小矩形的高为h,则b-a等于()A.hmB.ℎmC.mℎD.与m,ℎ无关解析:b-a是组距,在频率分布直方图中,频率组距是表示该组的小矩形的高h,所以mb-a=ℎ,所以b-a=mℎ.答案:C8.某班有48名学生,在一次考试中统计出平均分为70分,方差为75分2,后来发现有2名同学的分数登错了,甲实得80分却记成了50分,乙实得70分却记成了100分,更正后平均分和方差分别为() A.70分,75分2 B.70分,50分2C.70分,1.04分2D.65分,25分2解析:注意到平均数没有变化,只是方差变动.s2=1[…+(50-70)2+(100-70)2+…]=75分2,实际上s2=1[…+(80-70)2+(70-70)2+…]=50分2,故选B.答案:B9.某校高三年级有男生500人,女生400人,为了了解该年级学生的健康状况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是()A.简单随机抽样B.抽签法C.随机数法D.分层抽样解析:样本容量n=25+20=45,男生和女生的抽样比都是1,即按抽样比为1的分层抽样方法抽取样本.答案:D10.某示范农场的鱼塘放养鱼苗8万条,根据这几年的经验知道,鱼苗的成活率为95%,一段时间后准备打捞出售,第一网捞出40条,称得平均每条鱼2.5 kg,第二网捞出25条,称得平均每条鱼2.2 kg,第三网捞出35条,称得平均每条鱼2.8 kg,估计这时鱼塘中鱼的总质量为()A.192 280 kgB.202 280 kgC.182 280 kgD.172 280 kg解析:样本平均数x=40×2.5+25×2.2+35×2.840+25+35=2.53(kg),可知样本中平均每条鱼重2.53kg,所以估计鱼塘中鱼的总质量约为80000×95%×2.53=192280(kg).答案:A11.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7例”.根据过去10天甲、乙、丙、丁四地新增疑似病例的数据,一定符合该标志的是()A.甲地:总体均值为3,中位数为4B.乙地:总体均值为1,总体方差大于0C.丙地:中位数为2,众数为3D.丁地:总体均值为2,总体方差为3解析:x=2,则s2=110[(x1−2)2+(x2−2)2+⋯+(x10-2)2],若有一天超过7人,不妨设x10=8,则s2≥1×(8−2)2=3.6>3,不合题意.故任何一天都不超过7人.答案:D12. 已知两个相关变量满足如下关系:x10 15 20 25 30y 1 003 1 005 1 010 1 011 1 014A.y=0.56x+997.4B.y=0.63x-231.2C.y=50.2x+501.4D.y=60.4x+400.7解析:因为b=x1y1+x2y2+…+x5y5-5xyx12+x22+…+x52-5x2=0.56,a=y−b x=997.4.所以线性回归方程为y=0.56x+997.4.答案:A二、填空题:本大题共4小题,每小题5分.13.某市有大型超市200家、中型超市400家、小型超市1 400家.为掌握各类超市的营业情况,现按分层抽样方法抽取一个容量为100的样本,则应抽取中型超市家.解析:本题为分层抽样,所以应抽取中型超市400×100400+200+1400=20(家).答案:2014.某考察团对全国10大城市职工人均工资水平x(单位:千元)与居民人均消费水平y(单位:千元)进行统计调查,y与x具有线性相关关系,线性回归方程为y=0.66x+1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为.解析:将y=7.675代入y=0.66x+1.562,得x=611.3.所以7.675611.366≈83%.答案:83%15.如图是一个容量为100的样本的频率分布直方图,试根据图中的数据回答下列问题:(1)样本数据落在区间[2,6)内的频率为;(2)样本数据落在区间[6,10)内的频数为.解析:由频率分布直方图可得数据落在区间[2,6)内的频率为相应的小矩形的面积,即0.02×4=0.08,数据落在区间[6,10)内的频率为0.08×4=0.32,故数据落在区间[6,10)内的频数为100×0.32=32.答案:(1)0.08(2)3216.甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如图所示,则甲班、乙班的最高成绩各是,从图中看班的平均成绩较高.解析:从题图可以看出乙班的成绩集中在70分以上,且在80分以上的有6人,而甲班80分以上的只有4人,甲班的最低成绩是46分,对平均分影响较大.答案:96,92乙三、解答题:解答应写出文字说明、证明过程或演算步骤.17.(本小题满分10分)小明家2016年四个季度的用电量如下表:季度用电量(单位:千瓦时)第一季度250第二季度150第三季度400第四季度200其中各种电器用电量如下表:电器类型用电量(单位:千瓦时)空调250冰箱400照明100彩电150其他100根据如图所示三幅统计图回答:(1)从哪幅统计图可看出各个季度用电量变化情况?(2)从哪幅统计图可看出冰箱用电量超过总用电量的14?(3)从哪幅统计图可以清楚地看出空调用电量?18.(本小题满分12分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下(单位:cm):甲:9,10,11,12,10,20乙:8,14,13,10,12,21.(1)绘出所抽取的甲、乙两种麦苗株高的茎叶图;(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况.解:(1)茎叶图如图所示:(2)x 甲=9+10+11+12+10+20=12,x 乙=8+14+13+10+12+216=13,s 甲2≈13.67,s 乙2≈16.67.因为x 甲<x 乙,所以乙种麦苗平均株高较高.又因为s 甲2<s 乙2,所以甲种麦苗长得较为整齐.19. (本小题满分12分)2017年春节前,公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让过往返乡的摩托车驾驶人有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的抽取5人,则四川籍的应抽取几人?解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.(2)从题图可知,被询问了省籍的驾驶人员中广西籍的有5+20+25+20+30=100(人); 四川籍的有15+10+5+5+5=40(人). 设四川籍的驾驶人员应抽取x 人,依题意得5100=x40,解得x=2,即四川籍的应抽取2人.20.(本小题满分12分)某车间20名工人年龄数据如下表:年龄/岁 工人数/人 19 1 28 3 29 3 30 5 31 4 32 3 40 1 合计20(1)求这20名工人年龄的众数与极差(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图; (3)求这20名工人年龄的方差.解:(1)由题中表可知,众数为30岁.极差为40-19=21(岁).(2)(3)这20名工人年龄的平均数为(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30(岁), 所以这20名工人年龄的方差为s 2=1[(19−30)2+3(28−30)2+3(29−30)2+5(30−30)2+4(31−30)2+3(32−30)2+(40−30)2]=12.6(岁2).21.(本小题满分12分)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差;(同一组中的数据用该组区间的中点值作代表)(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解:(1)(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.22.(本小题满分12分)某种瓶装溶液,因为装瓶机的不稳定性,所以很可能使每瓶的含量都不是标准的含量,我们随机抽出了20瓶,测得它们的含量(单位:百毫升)如下:12.111.912.212.212.012.112.912.112.312.511.712.412.311.811.312.111.411.611.212.2(1)根据数据列出频率分布表,画出频率分布直方图;(2)计算出这组数据的平均数和标准差;(结果精确到0.01)(3)结合(1)(2)的结果,根据实际意义写一个简短的报告.(对总体情况作出估计)解:(1)频率分布表如下:频率分布直方图如图所示.(2)平均数x =120×(12.1+11.9+12.2+…+12.2)≈12.02(百毫升).标准差s ≈ (12.1−12.02)2+(11.9−12.02)2+⋯+(12.2−12.02)220≈0.41(百毫升).(3)标准差相对于平均数来说比较小.从频率分布直方图中可以看出,每瓶的含量大致位于1150毫升到1250毫升之间.因此可判断装瓶机工作稳定.。
一、选择题1.为了了解某同学的数学学习情况,对他的6次数学测试成绩进行统计,作出的茎叶图如图所示,则下列关于该同学数学成绩的说法正确的是( )A.中位数为83 B.众数为85 C.平均数为85 D.方差为192.为了解一片经济树林的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出样本的频率分布直方图如图所示.那么在这100株树木中,底部周长小于110cm的株数n是()A.30 B.60C.70 D.803.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是()A.海水稻根系深度的中位数是45.5B.普通水稻根系深度的众数是32C.海水稻根系深度的平均数大于普通水稻根系深度的平均数D.普通水稻根系深度的方差小于海水稻根系深度的方差4.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为()A .600B .1225C .1530D .18555.有200人参加了一次会议,为了了解这200人参加会议的体会,将这200人随机号为001,002,003,…,200,用系统抽样的方法(等距离)抽出20人,若编号为006,036,041,176, 196的5个人中有1个没有抽到,则这个编号是( ) A .006B .041C .176D .1966.某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y +的值是( )A .12B .14C .16D .187.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为125-号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A .95B .96C .97D .988.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50B .70和67C .75和50D .75和679.已知变量,x y 之间的线性回归方程为0.47.6=-+y x ,且变量,x y 之间的一组相关数据如表所示,则下列说法错误的是( )A .变量,x y 之间呈现负相关关系B .m 的值等于5C .变量,x y 之间的相关系数0.4=-rD .由表格数据知,该回归直线必过点()9,410.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是 A .81.2,4.4 B .40.6,1.1 C .48.8,4.4D .78.8,1.111.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆy bx a =+中的ˆb为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元12.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .91二、填空题13.如图是某地区2018年12个月的空气质量指数以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述正确的是______.①2月相比去年同期变化幅度最小,3月的空气质量指数最高;②第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小;③第三季度空气质量指数相比去年同期变化幅度的方差最小; ④空气质量指数涨幅从高到低居于前三位的月份为6、8、4月.14.《数术记遗》相传是汉末徐岳(约公元2世纪)所著.该书主要记述了:积算(即筹算)、太乙算、两仪算、三才算、五行算、八卦算、九宫算、运筹算、了知算、成数算、把头算、龟算、珠算、计数共14种计算方法.某研究学习小组共6人,他们搜集整理该14种算法的相关资料所花费的时间(单位:min )分别为:93,93,88,81,94,91则这组时间数据的标准差为___________.15.对两个变量y 和x 进行回归分析,得到一组样本数据()11,x y ,()22,x y ,…,(),n n x y ,则下列说法中正确的序号是______.①由样本数据得到的回归直线方程y bx a =+必过样本点的中心 ②残差平方和越小的模型,拟合的效果越好③用相关指数2R 来刻画回归效果,2R 越小说明拟合效果越好④若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间线性相关性强 16.下表是某厂1~4月份用水量(单位:百吨)的一组数据: 月份x 1 2 3 4 用水量y4.5432.5由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 等于___17.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:^y =0.245x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_______万元.18.为了了解2100名学生早晨到校时间,计划采用系统抽样的方法从全体学生中抽取容量为100栋样本,则分段间隔为__________.19.对具有线性相关关系的变量x ,y ,有一组观察数据(,)(1,2,9)i i x y i =⋅⋅⋅,其回归直线方程是:2y x a =+,且919ii x==∑,9118i i y ==∑,则实数a 的值是__________.20.已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.三、解答题21.为了解某市家庭用电量的情况,该市统计局调查了100户居民去年一年的月均用电量,发现他们的用电量都在50kW·h至350kW·h之间,进行适当分组后,画出频率分布直方图如图所示.(I)求a的值;(Ⅱ)求被调查用户中,用电量大于250kW·h的户数;(III)为了既满足居民的基本用电需求,又提高能源的利用效率,市政府计划采用阶梯定价,希望使80%的居民缴费在第一档(费用最低),请给出第一档用电标准(单位:kW·h)的建议,并简要说明理由.22.某校高一年级举行“抗击新冠肺炎”在线知识问答比赛,现将60名参赛学生的成绩(满分100分)统计如下:分组频数频率[50,60)180.30[60,70)240.40[70,80)90.15[80,90)60.10[90,100]30.05(1)根据上面的统计表,作出这些数据的频率分布直方图;(2)求这60名参赛学生成绩的平均数(同一组中的数据用该组区间的中间值作代表)和中位数.23.为了提高生产效益,某企业引进了一批新的生产设备,为了解设备生产产品的质量情况,分别从新、旧设备所生产的产品中,各随机抽取100件产品进行质量检测,所有产品15,45以内,规定质量指标值大于30的产品为优质品,质量指标值在质量指标值均在(](]15,30的产品为合格品,旧设备所生产的产品质量指标值如频率分布直方图所示,新设备所生产的产品质量指标值如频数分布表所示.质量指标值频数(]15,202(]20,258(]25,3020(]30,3530(]35,4025(]40,4515合计100(1)请分别估计新、旧设备所生产的产品的优质品率.(2)优质品率是衡量一台设备性能高低的重要指标,优质品率越高说明设备的性能越高,根据已知图表数据填写下面列联表(单位:件),并判断是否有95%的把握认为“产品质量高于新设备有关”.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.(3)已知每件产品的纯利润y (单位:元)与产品质量指标值t 的关系式为2,3045,1,1530,t y t <≤⎧=⎨<≤⎩若每台新设备每天可以生产1000件产品,买一台新设备需要80万元,请估计至少需要生产多少天方可以收回设备成本.24.随着人民生活水平的日益提高,某小区拥有私家车的数量与日俱增,物业公司统计了近六年小区私家车的数量,数据如下:(1)若该小区私家车的数量y 与年份编号x 的关系可用线性回归模型来拟合,请求出y 关于x 的线性回归方程,并用相关指数2R 分析其拟合效果(2R 精确到0.01);(2)由于该小区没有配套停车位,车辆无序停放易造成交通拥堵,因此物业公司预在小区内划定一定数量的停车位,若要求在2022年小区停车位数量仍可满足需要,则至少需要规划多少个停车位.参考数据:61936ii y==∑,614081i i i x y ==∑,62191ii x ==∑,()62137586i i y y=-=∑.附:回归方程中斜率和截距的最小二乘估计公式分别为:1221ni ii nii x y nx yb xnx==-⋅=-∑∑,a y bx =-,相关指数()()221211nii i n ii yy R yy==-=--∑∑,残差e y y =-.25.探索浩瀚宇宙是全人类的共同梦想,我国广大科技工作者、航天工作者为推动世界航天事业发展付出了艰辛的努力,为人类和平利用太空、推动构建人类命运共同体贡献了中国智慧、中国方案、中国力量.(1)某公司试生产一种航空零件,在生产过程中,当每小时次品数超过90件时,产品的次品率会大幅度增加,为检测公司的试生产能力,同时尽可能控制不合格品总量,抽取几组一小时生产的产品数据进行次品情况检查分析,已知在x (单位:百件)件产品中,得到次品数量y (单位:件)的情况汇总如下表所示,且y (单位:件)与x (单位:百件)线性相关:根据公司规定,在一小时内不允许次品数超过90件,请通过计算分析,按照公司的现有生产技术设备情况,判断可否安排一小时试生产10000件的任务?(2)“战神”太空空间站工作人员需走出太空站外完成某项试验任务,每次只派一个人出去,且每个人只派出一次,工作时间不超过10分钟,如果有人10分钟内不能完成任务则撤回,再派下一个人.现在一共有n 个人可派,工作人员123,,,,n a a a a 各自在10分钟内能完成任务的概率分别依次为123,,,,n p p p p ,且1230.5n p p p p =====,*N n ∈,各人能否完成任务相互独立,派出工作人员顺序随机,记派出工作人员的人数为X ,X 的数学期望为()E X ,证明:()2E X <.(参考公式:用最小二乘法求线性回归方程ˆˆy bxa =+的系数公式 1122211()()=ˆ()n ni iiii i nnii i i x y nx y x x y y bxnx x x ====-⋅--=--∑∑∑∑;ˆa y bx=-.) (参考数据:515220143524403550404530i ii x y==⨯+⨯+⨯+⨯+⨯=∑,522222215203540505750ii x==++++=∑.)26.2018年中秋节到来之际,某超市为了解中秋节期间月饼的销售量,对其所在销售范围内的1000名消费者在中秋节期间的月饼购买量(单位:g)进行了问卷调查,得到如下频率分布直方图:()1求频率分布直方图中a 的值;()2以频率作为概率,试求消费者月饼购买量在600g 1400g ~的概率;()3已知该超市所在销售范围内有20万人,并且该超市每年的销售份额约占该市场总量的5%,请根据这1000名消费者的人均月饼购买量估计该超市应准备多少吨月饼恰好能满足市场需求(频率分布直方图中同一组的数据用该组区间的中点值作代表)?【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】试题分析:A 选项,中位数是84;B 选项,众数是出现最多的数,故是83;C 选项,平均数是85,正确;D 选项,方差是,错误.考点:•茎叶图的识别 相关量的定义2.C解析:C 【解析】解:由图可知:则底部周长小于110cm 段的频率为(0.01+0.02+0.04)×10=0.7, 则频数为100×0.7=70人. 故选C .3.D解析:D 【分析】选项A 求出海水稻根系深度的中位数是444745.52+=,判断选项A 正确;选项B 写出普通水稻根系深度的众数是32,判断选项B 正确;选项C 先求出海水稻根系深度的平均数,再求出普通水稻根系深度的平均数,判断选项C 正确;选项D 先求出普通水稻根系深度的方差,再求出海水稻根系深度的方差,判断选项D 错误. 【详解】解:选项A :海水稻根系深度的中位数是444745.52+=,故选项A 正确; 选项B :普通水稻根系深度的众数是32,故选项B 正确; 选项C :海水稻根系深度的平均数393938434447495050514510+++++++++=,普通水稻根系深度的平均数252732323436384041453510+++++++++=,故选项C 正确;选项D :普通水稻根系深度的方差2222222211[(3845)(3945)(3945)(4345)(4445)(4745)(4945)(5045)10S =-+-+-+-+-+-+-+-+, 海水稻根系深度的方差2222222221[(2535)(2735)(3235)(3235)(3435)(3635)(3835)(4035)(10S =-+-+-+-+-+-+-+-+,故选项D 错误 故选:D. 【点睛】本题考查根据茎叶图求中位数、众数、平均数、方差,是基础题. 4.C解析:C 【分析】根据系统抽样所得的编号为等差数列,再用等差数列的求和公式求解即可. 【详解】由系统抽样的定义可知,在区间[201,319]内抽取的编号数构成以205为首项,公差为20的等差数列,并且项数为6,所以6(61)62052015302⨯-⨯+⨯=. 故选:C 【点睛】本题考查系统抽样的知识,考查数据处理能力和应用意识.5.B解析:B【解析】 【分析】求得抽样的间隔为10,得出若在第1组中抽取的数字为6,则抽取的号码满足104n -,即可出判定,得到答案. 【详解】由题意,从200人中用系统抽样的方法抽取20人,所以抽样的间隔为2001020=, 若在第1组中抽取的数字为006,则抽取的号码满足6(1)10104n n +-⨯=-,其中n N +∈,其中当4n =时,抽取的号码为36;当18n =时,抽取的号码为176;当20n =时,抽取的号码为196,所以041这个编号不在抽取的号码中,故选B. 【点睛】本题主要考查了系统抽样的应用,其中解答中熟记系统抽样的抽取方法是解答的关键,着重考查了运算与求解能力,属于基础题.6.A解析:A 【分析】由题,中位数为12,求得4x y +=,再求得平均数,利用总体标准差最小和基本不等式求得x ,y 的值,即可求得答案. 【详解】由题,因为中位数为12,所以242x yx y +=∴+= 数据的平均数为:1(22342019192021)11.410x y ++++++++++= 要使该总体的标准最小,即方差最小,所以222222.8(1011.4)(1011.4)( 1.4)( 1.4)2()0.722x y x y x y +-+-++-=-+-≥= 当且紧当 1.4 1.4x y -=-,取等号,即2x y ==时,总体标准差最小 此时4212x y += 故选A 【点睛】本题考查了茎叶图,熟悉茎叶图,清楚中位数、标准差的求法是解题的关键,属于中档题型.7.C解析:C 【分析】结合系统抽样法的方法,得出其他四名选手的成绩,然后计算平均数,即可. 【详解】结合系统抽样法,可知间隔5个人抽取一次,甲为85,则其他人分别是88,94,99,107,故平均数为88+94+99+107=974,故选C.【点睛】考查了系统抽样法,关键该抽取方法每间隔相同人数中抽取一人,计算平均数,即可,难度中等.8.B解析:B 【解析】 【分析】根据平均数、方差的概念表示出更正前的平均数、方差和更正后的平均数、方差,比较其异同,然后整体代入即可求解. 【详解】设更正前甲,乙,…的成绩依次为a 1,a 2,…,a 50, 则a 1+a 2+…+a 50=50×70,即60+90+a 3+…+a 50=50×70, (a 1﹣70)2+(a 2﹣70)2+…+(a 50﹣70)2=50×75, 即102+202+(a 3﹣70)2+…+(a 50﹣70)2=50×75. 更正后平均分为x =150×(80+70+a 3+…+a 50)=70; 方差为s 2=150×[(80﹣70)2+(70﹣70)2+(a 3﹣70)2+…+(a 50﹣70)2] =150×[100+(a 3﹣70)2+…+(a 50﹣70)2] =150×[100+50×75﹣102﹣202]=67. 故选B . 【点睛】本题考查平均数与方差的概念与应用问题,是基础题.9.C解析:C 【解析】分析:根据线性回归方程的性质依次判断各选项即可.详解:对于A :根据b 的正负即可判断正负相关关系.线性回归方程为0.47.6y x =-+,b=﹣0.7<0,负相关.对于B :根据表中数据:x =9.可得y =4.即()16+3244m ++=,解得:m=5. 对于C :相关系数和斜率不是一回事,只有当样本点都落在直线上是才满足两者相等,这个题目显然不满足,故不正确.对于D :由线性回归方程一定过(x ,y ),即(9,4). 故选:C .点睛:本题考查了线性回归方程的求法及应用,属于基础题,对于回归方程,一定要注意隐含条件,样本中心满足回归方程,再者计算精准,正确理解题意,应用回归方程对总体进行估计.10.B解析:B 【分析】先设出原来的数据,然后设出现在的数据,找到两组数据的联系,即可. 【详解】设原来的数据为12,,....,n x x x ,每一个数据都乘以2,再减去80,得到新数据为 12280,280,...,280n x x x --- 已知()122...80 1.2n x x x nn+++-=,则81.240.62X == 方差为:224 4.4, 1.1σσ==,故选B . 【点睛】本道题目考查的是平均数和方差之间的关系,列出等式,探寻两组数据的联系,即可.11.B解析:B 【详解】 试题分析:4235492639543.5,4244x y ++++++====, ∵数据的样本中心点在线性回归直线上,回归方程ˆˆˆy bx a =+中的ˆb为9.4, ∴42=9.4×3.5+a ,∴ˆa=9.1, ∴线性回归方程是y=9.4x+9.1,∴广告费用为6万元时销售额为9.4×6+9.1=65.5 考点:线性回归方程12.A解析:A 【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可. 【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题.二、填空题13.①②③【分析】根据折线的变化率得到相比去年同期变化幅度、升降趋势逐一验证即可【详解】根据折现统计图可得2月相比去年同期变化幅度最小3月的空气质量指数最高故①正确;第一季度的空气质量指数的平均值最大第解析:①②③ 【分析】根据折线的变化率,得到相比去年同期变化幅度、升降趋势,逐一验证即可. 【详解】根据折现统计图可得,2月相比去年同期变化幅度最小,3月的空气质量指数最高,故①正确;第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小,故②正确;第三季度空气质量指数相比去年同期变化幅度的方差最小,故③正确; 空气质量指数涨幅从高到低居于前三位的月份为6、8、9月,故④错误, 故答案为:①②③. 【点睛】本题考查条形统计图和折线图的应用,重点考查数据分析,从表中准确获取信息是关键,属于中档题型.14.【分析】由搜集算法所费的时间的数据求得数据的平均数再结合方差的计算公式即可求解【详解】由题意搜集算法所费的时间的数据可得数据的平均数为所以方差为所以标准差故答案为:【点睛】本题主要考查了数据的平均数解析:【分析】由搜集算法所费的时间的数据,求得数据的平均数,再结合方差的计算公式,即可求解. 【详解】由题意,搜集算法所费的时间的数据, 可得数据的平均数为939388819491906x +++++==,所以方差为2222222(9390)(9390)(8890)(8190)(9490)(9190)206s -+-+-+-+-+-==,所以标准差s ==故答案为: 【点睛】本题主要考查了数据的平均数和方差的计算,其中解答中熟记数据的平均数和方差的计算公式,准确计算是解答的关键,着重考查运算与求解能力.15.①②④【分析】根据两个变量线性相关的概念及性质逐项判定即可求解【详解】由题意根据回归直线方程的特征可得线性回归直线方程一定过样本中心所以①正确;根据残差的概念可得残差平方和越小的模型拟合效果越好所以解析:①②④【分析】根据两个变量线性相关的概念及性质,逐项判定,即可求解.【详解】由题意,根据回归直线方程的特征,可得线性回归直线方程一定过样本中心,所以①正确;根据残差的概念,可得残差平方和越小的模型,拟合效果越好,所以②正确;根据相关指数的概念,可得2R越大说明拟合效果越好,所以③不正确;若变量y和x之间的相关系数为0.946r=-,则变量y和x之间负相关,且线性相关性强,所以④正确;故答案为:①②④.【点睛】本题主要考查了两个变量的线性相关性的概念与判定,其中解答中熟记线性相关的基本概念和结论是解答的关键,属于基础题.16.【分析】首先求出xy的平均数根据样本中心点满足线性回归方程把样本中心点代入得到关于a的一元一次方程解方程即可【详解】:(1+2+3+4)=25(45+4+3+25)=35将(2535)代入线性回归直解析:21 4【分析】首先求出x,y的平均数,根据样本中心点满足线性回归方程,把样本中心点代入,得到关于a的一元一次方程,解方程即可.【详解】:14x=(1+2+3+4)=2.5,14y=(4.5+4+3+2.5)=3.5,将(2.5,3.5)代入线性回归直线方程是ˆy=-0.7x+a,可得3.5=﹣1.75+a,故a=214.故答案为21 4【点睛】本题考查回归分析,考查样本中心点满足回归直线的方程,考查求一组数据的平均数,是基础题17.245【解析】当变为时=0245(x+1)+0321=0245x+0321+0245而0245x+0321+0245-(0245x+0321)=0245因此家庭年收入每增加1万元年饮食支出平均增加0解析:245 【解析】当x 变为1x +时,y ∧=0.245(x+1)+0.321=0.245x+0.321+0.245,而0.245x+0.321+0.245-(0.245x+0.321)=0.245.因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元,本题填写0.245.18.【解析】【分析】根据系统抽样的特征求出分段间隔即可【详解】根据系统抽样的特征得:从2100名学生中抽取100个学生分段间隔为故答案是21【点睛】该题所考查的是有关系统抽样的组距问题应用总体除以样本容 解析:21【解析】 【分析】根据系统抽样的特征,求出分段间隔即可. 【详解】根据系统抽样的特征,得:从2100名学生中抽取100个学生,分段间隔为210021100=, 故答案是21. 【点睛】该题所考查的是有关系统抽样的组距问题,应用总体除以样本容量等于组距,得到结果,属于简单题目.19.0【解析】分析:根据回归直线方程过样本中心点计算平均数代入方程求出的值详解:根据回归直线方程过样本中心点即答案为0点睛:本题考查了线性回归方程过样本中心点的应用问题是基础题解析:0 【解析】分析:根据回归直线方程过样本中心点x y (,), 计算平均数代入方程求出a 的值. 详解:根据回归直线方程ˆ2y x a =+过样本中心点x y (,),191191,99i i x x ==∑=⨯=191118299i i y y ==∑=⨯=,22210a y x ∴=-=-⨯=;即答案为0.点睛:本题考查了线性回归方程过样本中心点的应用问题,是基础题.20.【解析】分析:先由茎叶图得数据再根据平均数公式求平均数详解:由茎叶图可知5位裁判打出的分数分别为故平均数为点睛:的平均数为解析:【解析】分析:先由茎叶图得数据,再根据平均数公式求平均数.详解:由茎叶图可知,5位裁判打出的分数分别为8989909191,,,,,故平均数为89+89+90+91+91905=.点睛:12,,,n x x x 的平均数为12nx x x n+++.三、解答题21.(I )0.006;(Ⅱ)18;(III )245.5 kW·h. 【分析】(1)根据频率和为1计算出a 的值;(2)根据频率分布直方图计算出“用电量大于250kW·h”的频率,再将该频率乘以对应的总户数即可得到结果;(3)根据频率分布直方图计算出频率刚好为0.8时对应的月用电量,由此可得到第一档用电标准. 【详解】(1)因为()0.00240.00360.00440.00240.0012501a +++++⨯=,所以0.006a =; (2)根据频率分布直方图可知:“用电量大于250kW·h”的频率为()0.00240.0012500.18+⨯=,所以用电量大于250kW·h 的户数为:1000.1818⨯=, 故用电量大于250kW·h 有18户; (3)因为前三组的频率和为:()0.00240.00360.006500.60.8++⨯=<, 前四组的频率之和为()0.00240.00360.0060.0044500.820.8+++⨯=>, 所以频率为0.8时对应的数据在第四组, 所以第一档用电标准为:0.80.620050245.50.22-+⨯≈kW·h. 故第一档用电标准为245.5 kW·h. 【点睛】本题考查频率分布直方图的综合应用,主要考查利用频率分布直方图进行相关计算,对学生读取图表信息和计算能力有一定要求,难度一般. 22.(1)直方图见解析;(2)67分,65分. 【分析】(1)由统计表算出各频率,作出频率分布直方图;(2)取各组数据中间值乘以频率再相加可得总平均值,求出频率0.5对应的成绩(此成绩在[60,70)之间].【详解】(1)根据统计表,作出这些数据的频率分布直方图如图:(2)由表中数据可知,这60名参赛学生成绩的平均数550.3650.4750. 15850.1950.0567x =⨯+⨯+⨯+⨯+⨯=分.因为这60名参赛学生成绩在[50,60)的频率为0.30.5<,成绩在[50,70)的频率为0.70.5>,所以这60名.参赛学生成绩的中位数在[60,70)之间.设这60名参赛学生成绩的中位数为x ,则()0.04600.2x ⨯-=,解得65x =, 故这60名参赛学生成绩的中位数为65分. 【点睛】本题考查频率分布直方图,考查由频率分布直方图求均值和中位数.考查了学生的数据处理能力,运算求解能力,属于中档题.23.(1)70%,55%;(2)列联表见解析,有95%的把握认为产品质量高与新设备有关;(3)471天方. 【分析】(1)根据旧设备所生产的产品质量指标值的频率分布直方图中后3组的频率之和即为旧设备所生产的产品的优质品率,根据新设备所生产的产品质量指标值的频数分布表即可估计新设备所生产的产品的优质品率;(2)根据题目所给的数据填写22⨯列联表,计算K 的观测值2K ,对照题目中的表格,得出统计结论;(3)根据新设备所生产的产品的优质品率,分别计算1000件产品中优质品的件数和合格品的件数,得到每天的纯利润,从而计算出至少需要生产多少天方可以收回设备成本. 【详解】 解:(1)估计新设备所生产的产品的优质品率为:3025150.770%100++==,估计旧设备所生产的产品的优质品率为:()50.060.030.020.5555%⨯++==. (2)非优质品 优质品 合计 新设备产品3070100由列联表可得,()220030554570 4.8 3.84175125100100K ⨯⨯-⨯==>⨯⨯⨯, ∴有95%的把握认为产品质量高与新设备有关. (3)新设备所生产的产品的优质品率为0.7∴每台新设备每天所生产的1000件产品中,估计有10000.7700⨯=件优质品,有1000700300-=件合格品.∴估计每台新设备一天所生产的产品的纯利润为700230011700⨯+⨯=(元).8000001700471÷≈(天),∴估计至少需要生产471天方可以收回设备成本.【点睛】本题考查了独立性检验的应用问题,考查了频率分布直方图,也考查了计算能力的应用问题,属于中档题.24.(1)ˆ465yx =-;拟合效果较好;(2)至少需要规划409个停车位 【分析】(1)由已知数据求得ˆb与ˆa 的值,则线性回归方程可求,再求出残差平方和,代入相关指数公式求得2R ,根据与1的接近程度分析拟合效果;(2)在(1)中求得的线性回归方程中,取9x =求得y 值即可. 【详解】 解:(1)1(123456) 3.56x =+++++=,19361566y =⨯=.6162221640816 3.5156ˆ46916356i ii ii x yxy bxx ==--⨯⨯===-⨯-∑∑, ˆˆ15646 3.55ay bx =-=-⨯=-. y ∴关于x 的线性回归方程为ˆ465y x =-.1x =时,ˆ41y=,2x =时,ˆ87y =,3x =时,ˆ133y =, 4x =时,ˆ179y=,5x =时,ˆ225y =,6x =时,ˆ271y =. 621()556ii i yy =-=∑.6221621()556110.9737586()ii i ii yy R yy ==-=-=-≈-∑∑, 相关指数2R 近似为0.97,接近1,说明拟合效果较好; (2)在(1)中求得的线性回归方程中,取9x =,。
一、选择题1.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已知学习时长在[)9,11的学生人数为25,则n的值为()A.40 B.50 C.80 D.1002.在一个容量为5的样本中,数据均为整数,已测出其平均数为8,但墨水污损了后面两个数据,其中一个数据的十位数字1未污损,即5,7,8,,那么这组数据的方差2s 可能的最大值是()A.185B.18 C.36 D.63.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A.中位数B.平均数C.方差D.极差4.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是()A .2018年3月的销售任务是400台B .2018年月销售任务的平均值不超过600台C .2018年第一季度总销售量为830台D .2018年月销售量最大的是6月份5.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .636.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为125-号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A .95B .96C .97D .987.甲、乙两名同学在五次数学考试中的成绩统计如下面的茎叶图所示,若甲、乙两人的平均成绩分别是1x ,2x ,观察茎叶图,下列结论正确的是( )A .12x x <,乙比甲成绩稳定B .12x x >,乙比甲成绩稳定C.12x x<,甲比乙成绩稳定D.12x x>,甲比乙成绩稳定8.高二某班共有学生60名,座位号分别为01, 02, 03,···, 60.现根据座位号,用系统抽样的方法,抽取一个容量为4的样本.已知03号、18号、48号同学在样本中,则样本中还有一个同学的座位号是()A.31号B.32号C.33号D.34号9.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755的人数为()A.10 B.11C.12 D.1310.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是()A.90.5 B.91.5 C.90 D.9111.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表:时间周一周二周三周四周五车流量x(万辆)100102108114116浓度y(微克)7880848890根据上表数据,用最小二乘法求出y与x的线性回归方程是()参考公式:121()()()ni iiniix x y ybx x==--=-∑∑,a y b x=-⋅;参考数据:108x=,84y=;A.0.6274ˆ.2y x=+B.0.7264ˆ.2y x=+C.0.7164ˆ.1y x=+D.0.6264ˆ.2y x=+ 12.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是()A .4B .5C .6D .7二、填空题13.用系统抽样方法从400名学生中抽取容量为20的样本,将400名学生随机地编号为1~400,按编号顺序平均分为20个组.若第1组中用抽签的方法确定抽出的号码为11,则第17组抽取的号码为________.14.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____15.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 16.某校共有学生1600人,其中高一年级400人.为了解各年级学生的兴趣爱好情况,用分层抽样的方法从中抽取容量为80的样本,则应抽取高一学生____人. 17.已知数据(1,2,3,4,5)i x i =的平均值为a ,数列2{()}i x a -为等差数列,且3||0.1x a -________.18.为了解某地区某种农产品的年产量x (单位:吨)对价格y (单位:千元/吨)的影响,对近五年该农产品的年产量和价格统计如下表:x1 2 3 4 5 y7.06.5m3.82.2已知x 和y 具有线性相关关系,且回归方程为 1.238.69y x =-+,那么表中m 的值为__________.19.能够说明“若甲班人数为m ,平均分为a ;乙班人数为n n m ≠(),平均分为b ,则甲乙两班的数学平均分为2a b+”是假命题的一组正整数a ,b 的值依次为_____. 20.已知一组数据x ,8,7,9,7,若这组数据的平均数为8,则它们的方差为______.三、解答题21.“湖广熟,天下足”,鱼米之乡的湖北是全国重要的农产品生产地.而受疫情影响,像莲藕、小龙虾等湖北很多优质农副产品近期都面临销售难题.为了让淜北尽快恢复正常,央视主持人朱广权化身直播带货官,和网红们一起为湖北产品做公益直播.在为湖北某地区的小龙虾进行带货时,需大致了解该地区小龙虾的产量,通过调查发现湖北某地区近几年的小龙虾产量统计如下表: 年份 2014 2015 2016 2017 2018 2019 年份代码t123456年产量y (万吨)6.6 6.97.4 7.7 8 8.4(1)根据表中数据,建立关于t 的线性回归方程y bt a =+; (2)请你根据线性回归方程预测今年(2020年)该地区小龙虾的年产量.附:对于一组数据()11,t y ,()22,t y ,…,(),n n t y ,其回归直线y bt a =+的斜率和截距的最小二乘估计分别为:()()()121ˆniii ni i t t y y bt t ==--=-∑∑,a y bt =-.(参考数据:()()616.3iii t t y y =--=∑)22.某学校进行体验,现得到所有男生的身高数据,从中随机抽取50人进行统计(已知这50个身高介于155cm 到195cm 之间),现将抽取结果按如下方式分成八组:第一组[155,160),第二组[160,165),...,第八组[190,195],并按此分组绘制如图所示的频率分布直方图,其中第六组[180,185)和第七组[185,190)还没有绘制完成,已知第一组与第八组人数相同,第六组和第七组人数的比为5:2.(1)补全频率分布直方图;(2)根据频率分布直方图估计这50位男生身高的中位数;(3)用分层抽样的方法在身高为[170,180]内抽取一个容量为5的样本,从样本中任意抽取2位男生,求这两位男生身高都在[175,180]内的概率. 23.为了了解高中新生的体能情况,某学校抽取部分高一学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从 左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12﹒(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.24.某公司为了制定下一季度的投入计划,收集了今年前6个月投入量x (单位:万元)和产量y (单位:吨)的数据,用两种模型①y bx a =+,②y b x a =分别进行拟合,得到相应的回归方程111.2 2.0y x =+,228.29.8y x =,进行残差分析得到如图所示的残差值及一些统计量的值: 月份 1 2 3 4 5 6 3.5x =41y =611049i ii x y==∑62191ii x==∑投入量x (万元) 1 2 3 4 5 6 产量y (吨) 13 22 4345 55 68 模型①的残差值 -0.2 -2.4-1.8 -3 -1.2 模型②的残差值-5.4-8.04.0-1.61.69.0(1)求上表中空格内的值;(2)残差值的绝对值之和越小说明模型拟合效果越好,根据残差比较模型①,②的拟合效果,应选择哪一个模型?并说明理由;(3)残差绝对值大于3的数据认为是异常数据,需要剔除,剔除异常数据后,重新求出(2)中所选模型的回归方程.(参考公式:i i ie y bx a =--,1221ni iinii x y nx yb xnx==-=-∑∑,a y bx =-)25.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x (分钟)时刻的细菌个数为y 个,统计结果如下:x 1 2 3 4 5 y23445(Ⅰ)在给出的坐标系中画出x ,y 的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y 关于x 的回归直线方程ˆˆˆy bx a =+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni ii ni i x y nx yx n axby bx ====---∑∑) 26.某城市200户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,280,[)280,300分组的频率分布直方图如图:(1)求直方图中x 的值;(2)在月平均用电量为[)220,240,[)240,260,[)260,280的三组用户中,用分层抽样的方法抽取20户居民,则月平均用电量在[)220,240的用户中应抽取多少户? (3)求月平均用电量的中位数和平均数.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解. 【详解】由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =, 所以学习时长在[)9,11的频率2520.5x n==,解得50n =. 故选:B . 【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.2.C解析:C 【分析】设出最后两个数,然后根据已知条件列方程,求得方程2s 的表达式,根据表达式的结构求得2s 的最大值. 【详解】设这组数据的最后2个分别是10x +,y 则5781085x y +++++=⨯, 得10x y +=,故10y x =-. ∴()222211910(2)(2)21855s x x x ⎡⎤=+++++-=+⎣⎦, 显然当9x =时,2s 最大,最大为36. 故选:C 【点睛】本小题主要考查平均数和方差的计算,考查方程的思想,属于基础题.3.A【分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案. 【详解】设9位评委评分按从小到大排列为123489x x x x x x ≤≤≤≤≤.则①原始中位数为5x ,去掉最低分1x ,最高分9x ,后剩余2348x x x x ≤≤≤,中位数仍为5x ,∴A 正确. ②原始平均数1234891()9x x x x x x x =+++++,后来平均数234817x x x x x '=+++()平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确 ③()()()222219119S x x x x x x ⎡⎤=-+-++-⎣⎦()()()222223817s x x x x x x ⎡⎤'=-'+-'++-'⎢⎥⎣⎦由②易知,C 不正确.④原极差91=x -x ,后来极差82=x -x 可能相等可能变小,D 不正确. 【点睛】本题旨在考查学生对中位数、平均数、方差、极差本质的理解.4.D解析:D 【分析】根据图形中给出的数据,对每个选项分别进行分析判断后可得错误的结论. 【详解】对于选项A ,由图可得3月份的销售任务是400台,所以A 正确. 对于选项B ,由图形得2018年月销售任务的平均值为1(3245810743413)10045012⨯+++++++++++⨯=,所以B 正确. 对于选项C ,由图形得第一季度的总销售量为13002001400 1.28302⨯+⨯+⨯=台,所以C 正确.对于选项D ,由图形得销售量最大的月份是5月份,为800台,所以D 不正确. 故选D . 【点睛】本题考查统计中的识图、用图和计算,解题的关键是从图中得到相关数据,然后再根据要求进行求解,属于基础题.5.A解析:A【分析】由茎叶图确定所给的所有数据,然后确定中位数即可. 【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63, 最中间的数为:45,所以,中位数为45. 本题选择A 选项. 【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.6.C解析:C 【分析】结合系统抽样法的方法,得出其他四名选手的成绩,然后计算平均数,即可. 【详解】结合系统抽样法,可知间隔5个人抽取一次,甲为85,则其他人分别是88,94,99,107,故平均数为88+94+99+107=974,故选C.【点睛】考查了系统抽样法,关键该抽取方法每间隔相同人数中抽取一人,计算平均数,即可,难度中等.7.A解析:A 【解析】 【分析】根据茎叶图中的数据,即可计算出两人平均分,再根据茎叶图的分布情况可知乙成绩稳定. 【详解】 由茎叶图知, 甲的平均数是110210410511413391.65x ++++==,乙的平均数是2108115116122123116.85x ++++==,所以12x x <,从茎叶图上可以看出乙的数据比甲的数据集中,乙比甲成绩稳定 故选:A . 【点睛】本题考查茎叶图中两组数据的平均数和稳定程度,平均数要进行计算,稳定程度可通过计算方差或通过数据排布形状作出比较.8.C解析:C 【解析】根据系统抽样知,组距为604=15÷,即可根据第一组所求编号,求出各组所抽编号.【详解】学生60名,用系统抽样的方法,抽取一个容量为4的样本,所以组距为604=15÷,已知03号,18号被抽取,所以应该抽取181533+=号,故选C.【点睛】本题主要考查了抽样,系统抽样,属于中档题.9.C解析:C【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n=30n﹣19,由401≤30n﹣21≤755,求得正整数n的个数,即可得出结论.【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列,又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,∴等差数列的通项公式为a n=11+(n﹣1)30=30n﹣19,由401≤30n﹣19≤755,n为正整数可得14≤n≤25,∴做问卷C的人数为25﹣14+1=12,故选C.【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.10.A解析:A【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可.【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95,所以中位数为90+91=90.52,故选A.【点睛】本题主要考查了中位数,茎叶图,属于中档题.11.B解析:B【解析】【分析】利用最小二乘法做出线性回归直线的方程的系数,写出回归直线的方程,得到结果.由题意,b=22222210078102801088411488116905108841001021081141165108⨯+⨯+⨯+⨯+⨯-⨯⨯++++-⨯=0.72, a=84﹣0.72×108=6.24, ∴y =0.72x+6.24, 故选:B . 【点睛】本题主要考查线性回归方程,属于难题.求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,nnii i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,ab ;④写出回归直线方程为ˆˆˆy bx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.12.B解析:B 【解析】分析:首先写出所有学生的乘积,然后结合系统抽样的方法整理计算即可求得最终结果. 详解:由题意可知,学生的成绩如下:111,111,112,113,113; 116,117,117,118,118; 120,120,121,122,122; 123,124,124,126127;128,128,129,129,129; 131,131,131,132,132; 132,133,134,134,135; 137,138,138,138,139; 140,142,142,143,144.用系统抽样方法从中抽取9人,则每5人中抽取一人,即上述分组中每组抽取一人, 则所抽取的学生的成绩在区间[]120,135上的学生人数为5. 本题选择B 选项.点睛:本题主要考查系统抽样的概念及其应用,茎叶图的识别等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.331【分析】分段抽样由抽取时的分段间隔是20利用等差数列知识得解【详解】由抽取时的分段间隔是20即抽取20名同学其编号构成首项为11公差为20的等差数列第17组抽取的号码故答案为:331【点睛】本解析:331 【分析】分段抽样由抽取时的分段间隔是20,利用等差数列知识得解. 【详解】由抽取时的分段间隔是20.即抽取20名同学,其编号构成首项为11,公差为20的等差数列,第17组抽取的号码11(171)20331+-⨯= 故答案为:331 【点睛】本题考查系统抽样,属于基础题.14.或【分析】利用平均数与方差公式直接求解即可【详解】由题去掉最高与最低分后的测试成绩为8284848689则平均数方差故答案为:或【点睛】本题考查茎叶图考查平均数与方差的计算是基础题解析:5.6或285【分析】利用平均数与方差公式直接求解即可 【详解】由题去掉最高与最低分后的测试成绩为82,84,84,86,89,则平均数8284848689855x ++++==方差()()()()()2222221288582858485848586858955s ⎡⎤=-+-+-+-+-=⎣⎦ 故答案为:5.6或285【点睛】本题考查茎叶图,考查平均数与方差的计算,是基础题15.2【分析】根据题意列出关于的等量关系式结合求得的值利用方差公式求得结果【详解】一组数据的平均数是8且所以化简得又所以的值分别为或所以该组数据的方差为:故答案是:2【点睛】该题考查的是有关求一组数据的解析:2 【分析】根据题意,列出关于,x y 的等量关系式,结合90xy =,求得,x y 的值,利用方差公式求得结果. 【详解】一组数据6,7,8,,x y 的平均数是8,且90xy =, 所以6788540x y ++++=⨯=, 化简得19x y +=,又90xy =, 所以,x y 的值分别为10,9或9,10, 所以该组数据的方差为:222222110[(68)(78)(88)(98)(108)]255s =-+-+-+-+-==,故答案是:2. 【点睛】该题考查的是有关求一组数据的方差的问题,涉及到的知识点有方差公式,属于简单题目.16.20【解析】【分析】利用分层抽样方法直接求解【详解】由题意应抽取高一学生(人)故答案是20【点睛】该题考查的是有关分层抽样中某层所抽个体数的问题涉及到的知识点有分层抽样要求每个个体被抽到的概率是相等解析:20 【解析】 【分析】利用分层抽样方法直接求解. 【详解】由题意,应抽取高一学生40080201600⨯=(人), 故答案是20. 【点睛】该题考查的是有关分层抽样中某层所抽个体数的问题,涉及到的知识点有分层抽样要求每个个体被抽到的概率是相等的,列式求得结果,属于简单题目.17.1【分析】先根据数列为等差数列求出再根据方差公式可得【详解】因为数列为等差数列且所以所以该组数据的方差为故填01【点睛】考查方差的计算基础题解析:1 【分析】先根据数列2{()}i x a -为等差数列求出()521i i x a =-∑,再根据方差公式可得.【详解】因为数列2{()}i x a -为等差数列,且3x a -=()()52231550.1=ii x a x a =-=-=⨯∑ 0.5,所以该组数据的方差为()52110.15i i x a =-=∑.故填0.1. 【点睛】考查方差的计算,基础题.18.5【解析】将样本中心代入回归方程得到m=55故答案为:55解析:5 【解析】19.5,15,5my x +== 将样本中心代入回归方程得到m=5.5. 故答案为:5.5.19.是不相等的正整数即可【解析】∵甲班人数为平均分为乙班人数为平均分为∴甲乙两班的数学平均分为∵∴当时∴该命题是假命题时应满足是不相等的正整数故答案为:是不相等的正整数解析:,a b 是不相等的正整数即可 【解析】∵甲班人数为m ,平均分为a ,乙班人数为()n n m ≠,平均分为b ∴甲、乙两班的数学平均分为ma nbm n++ ∵m n ≠ ∴当a b =时,2ma nb a bm n ++=+ ∴该命题是假命题时,应满足,a b 是不相等的正整数 故答案为:,a b 是不相等的正整数20.【解析】因为平均数为所以方差为解析:45【解析】因为平均数为8,所以9,x = 方差为222214[10111]55++++=三、解答题21.(1)0.36 6.24y x =+;(2)8.76万吨. 【分析】(1)由题意求得知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,运用公式求得b ,代入可求得y 关于t 的线性回归方程.(2)由(1)得的线性回归方程,代入年份代码7t =计算,可预测2020年该地区小龙虾的年产量. 【详解】(1)由题知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,()()()616216.30.3617.5ˆiii i i t t y y bt t ==--===-∑∑, 又 6.24=-=a y bt .所以,y 关于t 的线性回归方程为0.36 6.24y x =+.(2)由(1)得,当年份为2020年时,年份代码7t =,此时0.367 6.248.76=⨯+=y .所以,可预测,2020年该地区小龙虾的年产量为8.76万吨. 【点睛】本题考查线性回归方程的求解,利用线性回归方程对总体进行估计,属于中档题. 22.(1)见解析;(2)174.5cm;(3)0.3.【详解】试题分析:(1)先分别算出第六组和第七组的人数,进而算出其频率与组距的比,补全直方图;(2)利用中位数两边频率相等,求出中位数的值;(3)先借助分层抽样的特征求出第四、第五组的人数,再运用列举法列举出所有可能数及满足题设的条件的数,运用古典概型的计算公式求解:解:(1)第六组与第七组频率的和为:∵第六组和第七组人数的比为5:2.∴第六组的频率为0.1,纵坐标为0.02;第七组频率为0.04,纵坐标为0.008.(2)设身高的中位数为,则∴估计这50位男生身高的中位数为174.5(3)由于第4,5组频率之比为2:3,按照分层抽样,故第4组中应抽取2人记为1,2,第5组应抽取3人记为3,4,5则所有可能的情况有:{1,2},{1,3},{1,4},{1,5},{2,3},{2,4},{2,5},{3,4},{3,5},{4,5}共10种满足两位男生身高都在[175,180]内的情况有{3,4},{3,5},{4,5}共3种,因此所求事件的概率为.23.(1)0.08,150;(2)88%;(3)第四小组,理由见解析【解析】试题分析:(1)由频率分布直方图中各小矩形面积之和为1结合面积之比得到第二小组的频率,从而求得样本容量;(2)由频率分布直方图中各小矩形的面积和为1与面积之比可求出达标的频率即达标率;(3)求出前四组的频数即可得到中位数所在的区间.试题(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为: 又因为频率=所以(2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内. 考点:频率分布直方图24.(1)7.4;(2)选模型①,理由见解析;(3)111y x =+. 【分析】(1)根据i i ie y bx a =--,结合表中所给数据,即可求得空格内的值;(2)分别计算出模型①和模型②的残差值绝对值之和,比较其大小,即可求得应选择哪一个模型;(3)根据所给数据计算出x ,y ,51i ii x y =∑,521ii x=∑,带入1221ni ii nii x y nx yb xnx==-=-∑∑,即可求得答案. 【详解】(1)根据i i ie y bx a =--∴空格处的值为()43311.2 2.07.4-⨯+=(2)应选择模型①模型①的残差值的绝对值之和为0.2 2.47.4 1.83 1.216+++++= 模型②的残差值的绝对值之和为5.48.0 4.0 1.6 1.69.029.6+++++=1629.6<∴模型①的拟合效果好,应该选模型①.(3)剔除异常数据,即剔除3月份的数据后, 得()1 3.563 3.65x =⨯-=,()14164340.65y =⨯-=, 511049343920i ii x y==-⨯=∑,522191382i i x ==-=∑.∴51522159205 3.640.6189.211825 3.6 3.617.25i iiiix y x ybx x==--⨯⨯====-⨯⨯-∑∑,40.611 3.61a y bx=-=-⨯=.所以y关于x的回归方程为111y x=+.【点睛】本题解题关键是掌握残差的定义和回归直线方程的求解步骤,考查了分析能力和计算能力,属于中档题.25.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5y x=+,当15x=时细菌个数为12个.【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果;(Ⅱ)利用公式代入数据计算即可.【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x=⨯++++=,()123445 3.65y=⨯++++=,1122334445561ni iix y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555niix==++++=∑122216153 3.67ˆ0.7555310ni iiniix y nx yxbx n==-⨯⨯====-⨯--∑∑,ˆˆ 3.60.73 1.5a y bx=-=-⨯=,所以ˆ0.7 1.5yx =+, 当0.7 1.512x +=时,解得15x =. 所以当15x =时细菌个数为12个. 【点睛】本题考查了散点图、线性回归方程及其应用,属于基础题. 26.(1)0.0075;(2)10户;(3)224a =,225.6x =. 【分析】(1)由频率和为1列出方程求解x ;(2)求出三组用户的月平均用电量的频率推出比例关系,用20乘以月平均用电量在[)220,240的用户所占比例即可得解;(3)根据中位数左边和右边的直方图面积相等列出等式估计中位数,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 【详解】(1)由直方图的性质可得()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=,解得0.0075x =,所以直方图中x 的值是0.0075.(2)因为月平均用电量为[)220,240,[)240,260,[)260,280的三组用户的频率分别为0.25、0.15、0.1,所以这三组用户的月平均用电量比例为5:3:2, 所以月平均用电量在[)220,240的用户中应抽取5201010⨯=(户). (3)因为()0.0020.00950.011200.450.5++⨯=<, 所以月平均用电量的中位数在[)220,240内,设中位数为a ,则()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=,解得224a =. 平均数1700.041900.192100.222300.252500.152700.12900.05x =⨯+⨯+⨯+⨯+⨯+⨯+⨯225.6=,所以月平均用电量的中位数为224,平均数为225.6. 【点睛】本题考查统计案例、分层抽样、根据频率分布直方图估计总体的数字特征,属于中档题.。
2.2分层抽样与系统抽样第1课时分层抽样课时过关·能力提升1.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本,从上述各层中依次抽取的人数分别是()A.12,24,15,9B.9,12,12,7C.8,15,12,5D.8,16,10,6解析:抽样比为因此,从各层依次抽取的人数分别为160答案:D2.某商场有四类食品,其中粮食类、植物油类、膨化食品类和果蔬类分别为40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类种数之和是()A.4B.5C.6D.7解析:分层抽样的抽样比为所以应抽取的植物油类为10种),果蔬类为20种).故抽取的植物油类与果蔬类种数之和为2+4=6.答案:C3.某服装加工厂某月生产A,B,C三种产品共4 000件,为了保证产品质量,进行抽样检验,根据分层抽样的结果,由于不小心,表格中A,C A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是()A.80件B.800件C.90件D.900件答案:B4.某校现有高一学生210人,高二学生270人,高三学生300人,用分层抽样的方法从这三个年级的学生中随机抽取n名学生进行问卷调查,如果已知从高一学生中抽取的人数为7,那么从高三学生中抽取的人数为()A.7B.8C.9D.10解析:由题意知高一学生210人,从高一学生中抽取的人数为7可以得出抽取比例为所以从高三学生中抽取的人数应为300答案:D5. 某工厂生产A,B,C三种不同型号的产品,其数量之比依次是3∶4∶7,现在用分层抽样的方法抽出样本容量为n的样本,样本中A型号产品有15件,则n等于()A.50B.60C.70D.80答案:C6.某高校甲、乙、丙、丁四个专业分别有150,150,400,300名学生,为了解学生的就业倾向,用分层抽样的方法从该校这四个专业共抽取40名学生进行调查,应在丙专业抽取的学生人数为.解析:由分层抽样定义可知,应抽取丙专业的人数为40答案:167.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取名学生.解析:由分层抽样的方法可得,从一年级本科生中抽取学生人数为300答案:608.某报社做了一次关于“什么是新时代的雷锋精神”的调查,从A,B,C,D四个单位回收的问卷数分别为a1,a2,a3,a4,且满足a1+a3=2a2,共回收1 000份.因报道需要,再从回收的问卷中按单位分层抽取容量为150的样本.若在B单位抽取30份,则在D单位抽取的问卷是份.解析:由题意有解得a2=200.又a1+a2+a3+a4=1 000,a1+a3=2a2,即3a2+a4=1 000,∴a4=400.设在D单位抽取的问卷数为n,解得n=60.答案:609.已知某校的初中生人数、高中生人数、教师人数之比为20∶15∶2,现用分层抽样的方法从所有师生中抽取一个容量为N的样本进行调查,若应从高中生中抽取60人,则N=.解析答案:14810.在某校500名学生中,O型血有200人,A型血有125人,B型血有125人,AB型血有50人,为了研究血型与色弱的关系,需从中抽取一个容量为20的样本.应怎样抽取样本?分析:由于研究血型与色弱的关系,故按血型分层,用分层抽样的方法抽取样本.利用抽样比确定抽取各种血型的人数.解:用分层抽样抽取样本.因为即抽样比为所以200故O型血抽8人,A型血抽5人,B型血抽5人,AB型血抽2人.抽样步骤如下.第一步:确定抽样比第二步:按比例分配各层所要抽取的个体数,O型血抽8人,A型血抽5人,B型血抽5人,AB型血抽 2人.第三步:用简单随机抽样分别在各种血型的人中抽取样本,直至取出容量为20的样本.。
一、选择题1.过三点(3,10),(7,20),(11,24)的线性回归直线方程是( ) A .y =1.75-5.75x B .y =-1.75+5.75x C .y =5.75+1.75x D .y =5.75-1.75x答案 C解析 根据求线性回归方程的方法,利用公式可得到答案.2.抽测10只某种白炽灯的使用寿命x ,结果如下(单位:h ):1067,919,1196,785,t,936,918,1156,920,918,若x -=997,则t 大约是( )A .1120B .1124C .1155D .1128答案 C3.在线性回归方程中,b 表示( ) A .当x 增加一个单位时,y 增加a 的数量 B .当y 增加一个单位时,x 增加b 的数量 C .当x 增加一个单位时,y 的平均变化量 D .当y 增加一个单位时,x 的平均变化量 答案 C解析 本题主要考查线性回归方程中a ,b 的含义.4.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到线性回归方程y =bx +a ,那么下列说法中错误的是( )A .直线y =bx +a 必经过点(x -,y -)B .直线y =bx +a 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点C .直线y =bx +a 的斜率为b =∑i =1nx i y i -n x -y -∑i =1nx 2i -n x -2D .直线y =bx +a 和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差的平方和∑i =1n[y i-(bx i +a )]2是该坐标平面上所有直线与这些点的偏差的平方和中最小的答案 B解析 理解线性回归方程的真正含义.因为y -=b x -+a ,其中x -=1n (x 1+x 2+…+x n ),y -=1n (y 1+y 2+…+y n ),显然回归直线经过点(x -,y -).故A 是正确的.回归直线最能近似刻画点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的变化趋势,但并不一定经过某些点.故B 是错误的.对于C 、D 只需了解相应概念便会得出正确结论.5.下列叙述中:①变量间关系有函数关系,还有相关关系; ②回归函数即用函数关系近似地描述相互关系; ③∑ni =1x i=x 1+x 2+…+x n ; ④线性回归方程y ^=bx +a 中,b =∑ni =1 (x i -x -)(y i -y -)∑ni =1(x i -x -)2,a =y --b x -; ⑤线性回归方程一定可以近似地表示所有相关关系. 其中正确的有( ) A .①②③ B .①②④⑤ C .①②③④ D .③④⑤答案 C解析 利用直接法逐个判断可知,①②③④正确,而⑤线性回归方程可以近似地表示具有线性相关关系,而不能表示其他相关关系.6.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成份含量x 之间的相关关系,现取了8对观察值,计算得:∑8i =1x i =52,∑8i =1y i =228,∑8i =1x 2i =478,∑8i =1x i y i =1849,则y 与x 的回归方程是( )A.y ^=11.47+2.62x B.y ^=-11.47+2.62x C.y ^=2.62+22.47x D.y ^=11.47-2.62x 答案 A解析 把题目所给的数据代入公式分别求系数a 和b 即可. 二、填空题7.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.答案 0.254解析 本小题主要考查了利用回归直线方程,对数据进行估计.以x +1代x ,得0.254(x +1)+0.321,与0.254x +0.321相减可得,年饮食支出平均增加0.254万元.8.某商店统计了最近6个月某商品的进价x 与售价y (单位:元)的对应数据如下:则x -=________,y =________,∑i =1x 2i =________,∑i =1x i y i=________,回归方程为________.答案 6.5 8 327 396 y ^=1.4x +0.571解析 根据公式代入即可求得,也可以利用计算器求得,x -=6.5,y -=8,∑6i =1x 2i =327,∑6i =1x i y i=396,回归方程为y ^=1.4x +0.571. 9.假设学生在初中的英语成绩和高一英语成绩是线性相关的.现有10名学生的初中英语成绩(x )和高一英语成绩(y )如下:答案 1.2182解析 求斜率即求回归方程中的b ,按照公式进行即可,即需要依次计算出x-=71,∑10i =1x 2i =50520,y -=72.3,∑10i =1x i y i=51467,所以b =51467-10×71×72.350520-10×712≈1.2182,所以斜率为1.2182.三、解答题10.在10年期间,一城市居民的年收入与某种商品的销售额有如下数据:(1)画出散点图;(2)如果散点图中的各点大致分布在一条直线的附近,求y与x之间的线性回归方程.解(1)散点图如图.(2)由图可知,y与x线性相关,列表计算如下:所以b =15202.9-10×37.97×39.114663.67-10×37.972≈1.447,a =39.1-1.447×37.97≈-15.843,因此,所求线性回归方程为y =1.447x -15.843.11.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表:时间 周一 周二 周三 周四 周五 车流量x (万辆) 100 102 108 114 116 浓度y (微克/立方米)7880848890(2)若周六同一时段车流量是200万辆,试根据(1)求出的线性回归方程,预测此时PM2.5的浓度为多少?解 (1)由条件可知,x -=15 i =15x i =5405=108,y -=15∑i =15y i =4205=84,∑i =15(x i -x -)(y i -y -)=(-8)×(-6)+(-6)×(-4)+0×0+6×4+8×6=144, ∑i =15(x i -x -)2=(-8)2+(-6)2+02+62+82=200, b =∑i =15(x i -x -)(y i -y -)∑i =15(x i -x -)2=144200=0.72,a =y --b x -=84-0.72×108=6.24, 故y 关于x 的线性回归方程为y ^=0.72x +6.24. (2)当x =200时,y ^=0.72×200+6.24=150.24.所以可以预测此时PM2.5的浓度约为150.24微克/立方米. 12.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归直线方程y =bx +a ; (2)利用(1)中所求出的直线方程预测该地2020年的粮食需求量.解 本题考查回归分析的基本思想及其初步应用、回归直线的意义和求法、数据处理的基本方法和能力,考查运用统计知识解决简单实际应用问题的能力.(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程.为此对数据预处理如下:对预处理后的数据,容易算得x -=0,y -=3.2,b =(-4)×(-21)+(-2)×(-11)+2×19+4×2942+22+22+42=26040=6.5, a =y --b x -=3.2.由上述计算结果,知所求回归直线方程为y ^-257=b (x -2014)+a =6.5(x -2014)+3.2,即y ^=6.5(x -2014)+260.2. ①(2)利用直线方程①,可预测2020年的粮食需求量为6.5×(2020-2014)+260.2=6.5×6+260.2=299.2(万吨)≈300(万吨).(未写近似值不扣分)13.日常生活中,某些东西所含的热量比较高,对我们的身体有一定的影响,下表给出了不同类型八种饼干的数据,第一列数据表示八种饼干各含热量的百分比,第二列数据表示顾客对八种饼干所给予分数(百分制).(1)(2)关于两个变量之间的关系,你能得出什么结论?(3)为什么人们更喜欢吃位于回归直线上方的饼干而不是下方的饼干? 解 (1)先把数据列成表:由上表分别计算x ,y 的平均数得x -=1878,y -=6098,代入公式⎩⎪⎨⎪⎧b =∑ni =1x i y i -n x -y -∑n i =1x 2i -n x - 2,a =y --b x -,得b =14426-8×1878×60984555-8×⎝ ⎛⎭⎪⎫18782=190.625183.875≈1.037, a =6098-1.036710×1878=76.125-24.2331≈51.9. 则回归直线方程y ^=1.037x +51.9.(2)回归直线方程y ^=1.037x +51.9中的回归系数b =1.037,它的意义是热量比每增加一个百分比,口味记录平均增加1.037分.(3)因为饼干所含有的热量百分比相同时,人们的满意率比较高;并且满意率相同时,位于回归直线上方的饼干所含热量百分比较低,人们比较喜欢吃热量百分比较低的食品.所以人们喜欢吃位于回归直线上方的饼干.。