北师大版(新课标)高中数学必修3第一章统计章末测试题汇总
- 格式:doc
- 大小:894.50 KB
- 文档页数:9
最新北师大版数学精品教学资料【成才之路】高中数学第一章统计综合能力测试北师大版必修3 本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.时间120分钟,满分150分.第Ⅰ卷(选择题共60分)一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.2015年的世界无烟日(5月31日)之前,小华学习小组为了了解本地区大约有多少成年人吸烟,随机调查了100个成年人,结果其中有15个成年人吸烟.对于这个关于数据收集与处理的问题,下列说法正确的是( )A.调查的方式是普查B.本地区约有15%的成年人吸烟C.样本是15个吸烟的成年人D.本地区只有85个成年人不吸烟[答案] B[解析]调查方式显然是抽样调查,∴A错误.样本是这100个成年人.∴C也错误,显然D不正确.故选B.2.某班的78名同学已编号1,2,3,…,78,为了解该班同学的作业情况,老师收取了学号能被5整除的15名同学的作业本,这里运用的抽样方法是( )A.简单随机抽样法 B.系统抽样法C.分层抽样法 D.抽签法[答案] B[解析]所抽出的编号都间隔5,故是系统抽样.3.下列问题,最适合用简单随机抽样的是( )A.某电影院有32排座位,每排有40个座位,座位号为1~40.有一次报告会坐满了听众,报告会结束后为听取意见,要留下32名听众进行座谈B.从10台冰箱中抽出3台进行质量检查C.某学校在编人员160人.其中行政人员16人,教师112人,后勤人员32人.教育部门为了解学校机构改革意见,要从中抽取一个容量为20的样本D.某乡农田有:山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩. 现抽取农田480亩估计全乡农田某种作物的平均亩产量[答案] B[解析]A项的总体容量较大,用简单随机抽样法比较麻烦;B项的总体容量较小,用简单随机抽样法比较方便;C 项由于学校各类人员对这一问题的看法可能差异较大,不宜采用简单随机抽样法;D 项的总体容量较大,且各类田地的产量差别很大,也不宜采用简单随机抽样法.4.一个容量为50的样本数据,分组后,组距与频数如下:[12.5,15.5),2;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),6;[30.5,33.5),4.根据分组情况估计小于30.5的数据占( )A .18% B.30% C .60% D.92%[答案] D[解析] (2+8+9+11+10+6)÷50=92%.5.如图所示的是2006年至2015年某省城镇居民百户家庭人口数的茎叶图,图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到2006年至2015年此省城镇居民百户家庭人口数的平均数为( )2 9 1 1 5 83 0 2 6 31247A.304.6B.303.6 C .302.6 D.301.6[答案] B[解析] 由茎叶图得到2006年至2015年城镇居民百户家庭人口数为:291,291,295,298,302,306,310,312,314,317,所以平均数为291+291+295+298+302+306+310+312+314+31710=3 03610=303.6.6.某地区共有10万户居民,该地区城市住户与农村住户之比为4∶6,根据分层抽样方法,调查了该地区1 000户居民冰箱拥有情况,调查结果如下表所示,那么可以估计该地区农村住户中无冰箱的总户数约为( )A.1.6万户 C .1.76万户 D.0.24万户[答案] A[解析] 由于城市住户与农村住户之比为4∶6,城市住户有4万户,农村住户有6万户,调查的1 000户居民中共400户城市住户,有600户农村住户,其中农村住户中无冰箱的有160户,所以可估计该地区农村住户中无冰箱的总户数约为10×1601 000=1.6(万户).7.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )1 2 520 2 3 33 1 24 4 8 94 5 5 5 7 7 8 8 950 0 1 1 4 7 96 17 8A.46,45,56B.46,45,53C.47,45,56 D.45,47,53[答案] A[解析]本题考查了茎叶图的应用及其样本的中位数、众数、极差等数字特征,由茎叶图可知,中位数为46,众数为45,极差为68-12=56.在求一组数据的中位数时,一定不要忘记先将这些数据排序再判断.8.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( )A.18 B.36C.54 D.72[答案] B[解析]频率分布直方图中所有小矩形的面积之和为1,每个小矩形的面积表示样本数据落在该区间内的频率,故样本数据落在区间[10,12)内的频率为1-2×(0.02+0.05+0.15+0.19)=0.18,故样本数据落在区间[10,12)内的频数为0.18×200=36.9.已知两个变量x,y之间具有线性相关关系,测得(x,y)的四组值分别为(1,2),(2,4),(3,5),(4,7),则y与x之间的回归直线方程为( )A.y=0.8x+3 B.y=-1.2x+7.5C.y=1.6x+0.5 D.y=1.3x+1.2[答案] C[解析] 利用排除法. ∵x =14(1+2+3+4)=2.5,y =14(2+4+5+7)=4.5,由于回归直线方程y =bx +a 必过定点(2.5,4.5),故排除A 、D.又由四组数值知y 随x 的增大而增大,知b >0,排除B.10.某路段检查站监控录像显示,在某时段内,有1 000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为如下图的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90 km/h 的约有()A .100辆 B.200辆 C .300辆 D.400辆[答案] C[解析] 由题图可知汽车中车速在[60,90)的频率为10×(0.01+0.02+0.04)=0.7, ∴在[90,110]的频率为(1-0.7)=0.3.∴车速不小于90 km/h 的汽车数量约为0.3×1 000=300辆.11.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9,已知这组数据的平均数为10,方差为2,则|x -y |的值为( )A .1 B.2 C .3 D.4[答案] D[解析] 依题意,可得 ⎩⎪⎨⎪⎧10=x +y +10+11+95,2=15x -2+y -2+-2+-2+-2],⇒⎩⎪⎨⎪⎧x +y =20,x -2+y -2=8,⇒⎩⎪⎨⎪⎧x =12y =8,或⎩⎪⎨⎪⎧x =8y =12,所以|x -y |=4.12.甲,乙,丙三名运动员在某次测试中各射击20次,三人测试成绩的频率分布条形图分别如图1,图2和图3,若s 甲,s 乙,s 丙分别表示他们测试成绩的标准差,则( )A .s 甲<s 乙<s 丙 B.s 甲<s 丙<s 乙 C .s 乙<s 甲<s 丙 D.s 丙<s 甲<s 乙[答案] D[解析] 由频率分布条形图可得甲,乙,丙三名运动员的平均成绩分别为 x -甲=0.25×(7+8+9+10)=8.5;x -乙=0.3×7+8×0.2+9×0.2+10×0.3=8.5; x -丙=0.2×7+8×0.3+9×0.3+10×0.2=8.5,s 2甲=0.25×(1.52+0.52+0.52+1.52)=1.25;s 2乙=0.3×1.52+0.52×0.2+0.52×0.2+1.52×0.3=1.45; s 2丙=0.2×1.52+0.52×0.3+0.52×0.3+1.52×0.2=1.05,∴s 丙<s 甲<s 乙.第Ⅱ卷(非选择题 共90分)二、填空题(本大题共4个小题,每小题5分,共20分,将正确答案填在题中横线上) 13.一个容量为40的样本,共分成6组,第1~4组的频数分别为10,5,7,6,第5组的频率是0.10,则第6组的频率是________.[答案] 0.20[解析] 第5组的频数为40×0.10=4,第6组的频数为40-(10+5+7+6+4)=8,则频率为840=0.20.14.(2015·广东文,12)已知样本数据x 1,x 2,…,x n 的均值x =5,则样本数据2x 1+1,2x 2+1,…,2x n +1的均值为________.[答案] 11[解析] 因为样本数据x 1,x 2,…,x n 的均值x =5,所以样本数据2x 1+1,2x 2+1,…,2x n +1的均值为2x +1=2×5+1=11.15.(2014·江苏,6)设抽测的树木的底部周长均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100cm.[答案] 24[解析] 本题考查频率分布直方图.由题意在抽测的60株树木中,底部周长小于100cm 的株数为(0.015+0.025)×10×60=24.频率分布直方图中的纵坐标为频率组距,此处经常误认为纵坐标是频率.16.下图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.(注:方差s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],其中x -为x 1,x 2,…,x n 的平均数)[答案] 6.8[解析] 本题考查茎叶图、方差的概念. 由茎叶图知x -=8+9+10+13+155=11,∴s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.三、解答题(本大题共6个小题,共70分,解答应写出文字说明、证明过程或演算步骤) 17.(本小题满分10分)在同等条件下,对30辆同一型号的汽车进行耗油1升所行走路程的试验,得到如下数据(单位:km):14.1 12.3 13.7 14.0 12.8 12.9 13.1 13.6 14.4 13.8 12.6 13.8 12.6 13.2 13.3 14.2 13.9 12.7 13.0 13.2 13.5 13.6 13.4 13.6 12.1 12.5 13.1 13.513.2 13.4以前两位数为茎画出上面数据的茎叶图(只有单侧有数据),并找出中位数.[解析]茎叶图如图所示.1213566789130112223445566 6 788914012 4中位数为13.35.18.(本小题满分12分)某高级中学共有学生3 000名,各年级男、女人数如下表:(1)问高二年级有多少名女生?(2)现对各年级用分层抽样的方法在全校抽取300名学生,问应在高三年级抽取多少名学生?[解析](1)由题设可知x3000=0.17,所以x=510.(2)高三年级人数为y+z=3000-(523+487+490+510)=990,现用分层抽样的方法在全校抽取300名学生,应在高三年级抽取的人数为:3003000×990=99名.答:(1)高二年级有510名女生;(2)在高三年级抽取99名学生.19.(本小题满分12分)为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:千克),并将所得数据分组,画出频率分布直方图(如图所示).(1)(2)估计数据落在[1.15,1.30)中的概率为多少;(3)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条,请根据这一情况来估计该水库中鱼的总条数.[解析] (1)根据频率分布直方图可知,频率=组距×频率组距故可得下表:(2)0.30+0.15+0.02=中的概率约为0.47. (3)120×1006=2000.所以水库中鱼的总条数约为2000条.20.(本小题满分12分)某农场为了从三种不同的西红柿品种中选出高产稳定的西红柿品种,分别在5块试验田上试种,每块试验田均为0.5公顷,产量情况如下表:[解析] 因为x 甲=15(21.5+20.4+22.0+21.2+19.9)=21.0(kg),x 乙=15(21.3+18.9+18.9+21.4+19.8)=20.06(kg), x 丙=15(17.8+23.3+21.4+19.9+20.9)=20.66(kg),所以s 甲=15-2+…+-21.02]≈0.756(kg);s 乙=15-2+…+-2]≈1.104(kg);s 丙=15-2+…+-2]≈1.807(kg).由于x 甲>x 丙>x 乙,s 甲<s 乙<s 丙,所以甲种西红柿既高产又稳定.21.(本小题满分12分)潮州统计局就某地居民的月收入调查了10 000人,并根据所得数据画出了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500)).(1)求居民月收入在[3 000,3 500)的频率; (2)根据频率分布直方图算出样本数据的中位数;(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层抽样的方法抽出100人作进一步分析,则月收入在[2 500,3 000)的这段应抽多少人?[解析] (1)月收入在[3 000,3 500)的频率为0.000 3×(3 500-3 000)=0.15. (2)∵0.000 2×(1 500-1 000)=0.1,0.000 4×(2 000-1 500)=0.2, 0.000 5×(2 500-2 000)=0.25, 0.1+0.2+0.25=0.55>0.5.∴样本数据的中位数为2 000+0.5-+0.000 5=2 000+400=2 400(元).(3)居民月收入在[2 500,3 000)的频率为0.000 5×(3 000-2 500)=0.25, 所以10 000人中月收入在[2 500,3 000)的人数为0.25×10 000=2 500(人), 再从10 000人中分层抽样方法抽出100人,则月收入在[2 500,3 000)的这段应抽取100×2 50010 000=25(人).22.(本小题满分12分)(2015·新课标Ⅰ理,19)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =,(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:(①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=,α^=v -β^u .[解析] (1)由散点图可以判断,y =c +d x 适合作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程,由于d ^=∑i =18 w i -wy i -y ∑i =18 w i -w 2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6.∴y 关于w 的线性回归方程为y ^=100.6+68w ,∴y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x )-x=-x +13.6x +20.12, ∴当x =13.62=6.8,即x =46.24时,z ^取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大.。
一、选择题1.某班统计一次数学测验的平均分与方差,计算完毕才发现有位同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( )A .1x x =,221s s = B .1x x =,221s s < C .1x x =,221s s >D .1x x <,221s s =2.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,83.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18554.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差5.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( )A .26B .27C .28D .296. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日7.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是( )A .2018年3月的销售任务是400台B .2018年月销售任务的平均值不超过600台C .2018年第一季度总销售量为830台D .2018年月销售量最大的是6月份 8.①45化为二进制数为(2)101101;②一个总体含有1000个个体(编号为0000,0001,…,0999),采用系统抽样从中抽取一个容量为50的样本,若第一个抽取的编号为0008,则第六个编号为0128; ③已知a ,b ,c 为ABC ∆三个内角A ,B ,C 的对边,其中3a =,4c =,6A π=,则这样的三角形有两个解.以上说法正确的个数是( ) A .0B .1C .2D .39.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是( )A.消耗1升汽油,乙车最多可行驶5千米B.以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多C.甲车以80千米/小时的速度行驶1小时,消耗10升汽油D.某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油10.已知x,y的取值如表:x 2678y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是A.B.C.D.11.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为A.12 B.14 C.16 D.1812.从存放号码分别为1,2, ,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是()A.0.53 B.0.5 C.0.47 D.0.37二、填空题13.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____14.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..15.已知数据(1,2,3,4,5)i x i =的平均值为a ,数列2{()}i x a -为等差数列,且3||0.1x a -=________.16.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.17.某公司的广告费支出x 与销售额y (单位:万元)之间有下列对应数据:由资料显示y 对x 呈线性相关关系。
一、选择题1.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm ),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是( )A .海水稻根系深度的中位数是45.5B .普通水稻根系深度的众数是32C .海水稻根系深度的平均数大于普通水稻根系深度的平均数D .普通水稻根系深度的方差小于海水稻根系深度的方差2.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.53.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .164.有一个容量为200的样本,样本数据分组为[50,70),[70,90),[90,110),[110,130),[130,150),其频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在区间[90,110)内的频数为( )A .48B .60C .64D .725.通过实验,得到一组数据如下:2,5,8,9,x ,已知这组数据的平均数为6,则这组数据的方差为( ) A .3.2B .4C .6D .6.56.①45化为二进制数为(2)101101;②一个总体含有1000个个体(编号为0000,0001,…,0999),采用系统抽样从中抽取一个容量为50的样本,若第一个抽取的编号为0008,则第六个编号为0128; ③已知a ,b ,c 为ABC ∆三个内角A ,B ,C 的对边,其中3a =,4c =,6A π=,则这样的三角形有两个解.以上说法正确的个数是( ) A .0B .1C .2D .37.总体由编号为01,02,,29,30的30个个体组成,利用下面的随机数表选取4个个体.选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为( ).7806 6572 0802 6314 2947 1821 98003204 9234 4935 3623 4869 6938 7481A .02B .14C .18D .298.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10B .11C .12D .139.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( )A.60 B.50 C.40 D.3010.设有一个直线回归方程为2 1.5y x=-,则变量x增加一个单位时()A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位11.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为A.12 B.14 C.16 D.1812.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是()A.0.53 B.0.5 C.0.47 D.0.37二、填空题13.福利彩票“双色球”中红色球由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表(下表是随机数表的第一行和第二行)选取6个红色球,选取方法是从随机数表中第1行的第6列和第7列数字开始,由左到右依次选取两个数字,则选出来的第3个红色球的编号为______.49 54 43 54 82 17 37 93 23 28 87 35 20 56 43 84 26 34 91 6457 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7614.某住宅小区有居民2万户,从中随机抽取200户,调查是否安装宽带,调查结果如下表所示:宽带租户业主已安装6042未安装3662则该小区已安装宽带的居民估计有______户.15.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..16.为调查某校学生每天用于课外阅读的时间,现从该校3000名学生中随机抽取100名学生进行问卷调查,所得数据均在区间[50,100]上,其频率分布直方图如图所示,则估计该校学生中每天用于阅读的时间在[70,80)(单位:分钟)内的学生人数为____.17.一个车间为了规定工作原理,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下: 零件数x (个) 15 20 30 40 50 加工时间y (分钟)6570758090由表中数据,求得线性回归方程0.66y x a =+,则估计加工70个零件时间为__________分钟(精确到0.1).18.下表为生产A 产品过程中产量x (吨)与相应的生产耗能y (吨)的几组相对应数据:x34 5 6y 23.55 5.5根据上表提供的数据,得到y 关于x 的线性回归方程为0.7y x a =+,则a =__________. 19.某班60名学生参加普法知识竞赛,成绩都在区间[40100],上,其频率分布直方图如图所示,则成绩不低于60分的人数为___.20.总体由编号为01,02,⋅⋅⋅,29,30的30个个体组成.利用下面的随机数表选取样本,选取方法是从随机数表第2行的第6列数字开始由左到右依次选取两个数字,则选出来的第3个个体的编号为__________.三、解答题21.我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额x (单位:亿元)对年盈利额y (单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额i x 和年盈利额i y 的数据.通过对比分析,建立了两个函数模型:①2y x αβ=+,②x ty e λ+=,其中α,β,λ,t 均为常数,e 为自然对数的底数.令2i i u x >,()ln 1,2,,10ii v y i ==⋅⋅⋅,经计算得如下数据:xy()1021i i x x =-∑()1021i i y y =-∑ uv2621565 26805.36()1021ii uu =-∑()()101iii u u y y =--∑()1021ii v v =-∑()()101iii x x v v =--∑11250 130 2.6 12(2)(ⅰ)根据(1)的选择及表中数据,建立y 关于x 的回归方程;(系数精确到0.01) (ⅱ)若希望2021年盈利额y 为250亿元,请预测2021年的研发资金投入额x 为多少亿元?(结果精确到0.01)附:①相关系数12211()()()()niii nn iii i x x y y r x x y y ===--=--∑∑∑,回归直线ˆˆˆya bx =+中:121()()ˆ()niii nii x x yy bx x ==--=-∑∑,ˆˆay bx =- ②参考数据:ln 20.693≈,ln5 1.609≈.22.某地政府拟在该地一水库上建造一座水电站,用泄流水量发电.下图是根据该水库历年的日泄流量的水文资料画成的日泄流量X (单位:万立方米)的频率分布直方图(不完整),已知[)0,120X ∈,历年中日泄流量在区间[30,60) 的年平均天数为156,一年按364天计.(Ⅰ)请把频率分布直方图补充完整;(Ⅱ)该水电站希望安装的发电机尽可能运行,但每30万立方米的日泄流量才够运行一台发电机,如6090X ≤<时才够运行两台发电机,若运行一台发电机,每天可获利润为4000元,若不运行,则该台发电机每天亏损500元,以各段的频率作为相应段的概率,以水电站日利润的期望值为决策依据,问:为使水电站日利润的期望值最大,该水电站应安装多少台发电机?23.某养殖基地为满足市场需要,逐年加大对养殖基地的资金投入,技术分析员对4年来的年资金投入量x (单位:万元)与相应的年市场销售额y (单位:万元)作了初步的调研统计,得到数据如表:x (万元)2 3 4 5 y (万元) 26394954(1)求根据年资金投入量预报年市场销售额的的回归方程; (2)预报年资金投入量为7.5万元时年市场销售额;(3)若年市场销售额不低于100万,那么年资金投入量至少要多少?(保留两位小数)其中,()()()121nii i nii xx y yb xx==--=-∑∑,a bx y =-+.24.某学校因为今年寒假延期开学,根据教育部的停课不停学指示,该学校组织学生线上教学,高一年级在线上教学一个月后,为了了解线上教学的效果,在线上组织了学生数学学科考试,随机抽取50名学生的成绩并制成频率分布直方图如图.(1)求m 的值并估计这50名学生的平均成绩;(2)估计高一年级所有学生数学成绩在[90,100)分与[)70,100分的学生所占的百分比. 25.随着各国经贸关系的进一步加深,许多国外的热带水果进入国内市场,牛油果作为一种热带水果,越来越多的中国消费者对这种水果有了一种全新的认识,它富含多种维生素、丰富的脂肪和蛋白质,钠、钾、镁、钙等含量也高,除作生果食用外也可作菜肴和罐头.牛油果原产于墨西哥和中美洲,后在加利福尼亚州被普遍种植.因此加利福尼亚州成为世界上最大的牛油果生产地,在全世界热带和亚热带地区均有种植,但以美国南部、危地马拉、墨西哥及古巴栽培最多,并形成了墨西哥系、危地马拉系、西印度系三大种群,我国的广东、海南、福建、广西、台湾、云南及四川等地都有少量栽培.市场上的牛油果大部分都是进口的.为了调查市场上牛油果的等级代码数值x 与销售单价y 之间的关系,经统计得到如下数据: 等级代码数值x 38 48 58 68 78 88 销售单价y (元/kg )16.818.820.822.82425.8(1)已知销售单价y 与等级代码数值x 之间存在线性相关关系,利用前5组数据求出y 关于x 的线性回归方程;(2)若由(1)中线性回归方程得到的估计值与最后一组数据的实际值之间的误差不超过1,则认为所求回归方程是有效可靠的,请判断所求回归直线方程是否有效可靠? (3)若一果园估计可以收获等级代码数值为85的牛油果980kg ,求该果园估计收入为多少元.参考公式:对一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线y bx a =+的斜率和截距的最小二乘估计分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,b y bx =-.参考数据:516169.6i ii x y==∑,52117820i i x ==∑.26.某企业广告费支出与销售额(单位:百万元)数据如表所示:(1)求销售额y 关于广告费x 的线性回归方程;(2)预测当销售额为76百万元时,广告费支出为多少百万元. 回归方程y bx a =+中斜率和截距的最小二乘估计公式分别为:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】选项A 求出海水稻根系深度的中位数是444745.52+=,判断选项A 正确;选项B 写出普通水稻根系深度的众数是32,判断选项B 正确;选项C 先求出海水稻根系深度的平均数,再求出普通水稻根系深度的平均数,判断选项C 正确;选项D 先求出普通水稻根系深度的方差,再求出海水稻根系深度的方差,判断选项D 错误. 【详解】解:选项A :海水稻根系深度的中位数是444745.52+=,故选项A 正确; 选项B :普通水稻根系深度的众数是32,故选项B 正确;选项C :海水稻根系深度的平均数393938434447495050514510+++++++++=,普通水稻根系深度的平均数252732323436384041453510+++++++++=,故选项C 正确;选项D :普通水稻根系深度的方差2222222211[(3845)(3945)(3945)(4345)(4445)(4745)(4945)(5045)10S =-+-+-+-+-+-+-+-+, 海水稻根系深度的方差2222222221[(2535)(2735)(3235)(3235)(3435)(3635)(3835)(4035)(10S =-+-+-+-+-+-+-+-+,故选项D 错误 故选:D. 【点睛】本题考查根据茎叶图求中位数、众数、平均数、方差,是基础题. 2.A解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.3.A解析:A 【分析】先弄清楚程序框图中是统计成绩不低于90分的学生人数,然后从茎叶图中将不低于90分的个数数出来,即为输出的结果. 【详解】176A =,1i =,16i ≤成立,190A ≥不成立,112i =+=; 279A =,2i =,16i ≤成立,290A ≥不成立,112i =+=;792A =,7i =,16i ≤成立,790A ≥成立,011n =+=,718i =+=;依此类推,上述程序框图是统计成绩不低于90分的学生人数,从茎叶图中可知,不低于90分的学生数为10,故选A . 【点睛】本题考查茎叶图与程序框图的综合应用,理解程序框图的意义,是解本题的关键,考查理解能力,属于中等题.4.B解析:B【分析】由(0.00500.00750.01000.0125)201a ++++⨯=,求出a ,计算出数据落在区间[90,110)内的频率,即可求解.【详解】由(0.00500.00750.01000.0125)201a ++++⨯=, 解得0.015a =,所以数据落在区间[90,110)内的频率为0.015200.3⨯=, 所以数据落在区间[90,110)内的频数2000.360⨯=, 故选B. 【点睛】本题主要考查了频率分布直方图,频率、频数,属于中档题.5.C解析:C 【解析】分析:利用平均数的公式,求得6x =,得到数据2,5,8,9,6,再利用方差的计算公式,即求解数据的方差.详解:由题意,一组数据2,5,8,9,x 的平均数为6,即258924655x xx +++++===,解得6x =,所以数据2,5,8,9,6的方差为2222221[(26)(56)(86)(96)(66)]65s =-+-+-+-+-=,故选C.点睛:本题主要考查了数据的数字特的计算,其中熟记数据的平均数的公式和数据的方差的计算公式是解答的关键,着重考查了推理与运算能力,属于基础题.6.C解析:C 【解析】分析:①根据进位制的互化可得结果;②根据系统抽样的性质可得结论;③由正弦定理可得结论.详解:①45222...1÷=,22211...0÷=,112 5...1÷=,52 2...1÷=,22 1...0÷=,120...1÷=,故()()10245101101=,①正确;②因为1000个个题抽取50个样本,∴每个样本编号间隔为20,第六个编号为8205108+⨯=,即编号为0108,故②错误;③由正弦定理可得342,1sin 32sinC C ==,,c a C >∴∠可能是锐角,也可能是钝角,三角形有两个解,③正确,故选C.点睛:本题主要考查进位制、正弦定理的应用,分层抽样的应用,意在考查综合运用所学知识解决问题的能力,属于中档题.7.D解析:D【解析】分析:根据随机数表法则取数:取两个数,不小于30的舍去,前面已取的舍去.详解:从表第1行5列,6列数字开始由左到右依次选取两个数字中小于30的编号为:08,02,14,29.∴第四个个体为29.选D.点睛:本题考查随机数表,考查对概念基本运用能力.8.C解析:C【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n=30n﹣19,由401≤30n﹣21≤755,求得正整数n的个数,即可得出结论.【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列,又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,∴等差数列的通项公式为a n=11+(n﹣1)30=30n﹣19,由401≤30n﹣19≤755,n为正整数可得14≤n≤25,∴做问卷C的人数为25﹣14+1=12,故选C.【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.9.C解析:C【分析】设该样本中高三年级的学生人数为x,则1800601200x=,解之即可【详解】设该样本中高三年级的学生人数为x,则1800601200x=,解得40x=,故选C.【点睛】本题考查了分层抽样方法的应用问题,属基础题.10.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.11.C解析:C 【解析】 【分析】根据分层抽样的定义求出在各层中的抽样比,即样本容量比上总体容量,按此比例求出在高三年级中抽取的人数. 【详解】根据题意得,用分层抽样在各层中的抽样比为421105020=, 则在高三年级抽取的人数是14001625⨯=人, 故选C. 【点睛】该题所考查的是有关分层抽样的问题,在解题的过程中,需要明确无论采用哪种抽样方法,都必须保证每个个体被抽到的概率是相等的,所以注意成比例的问题.12.A解析:A 【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=, 取卡片的次数为100次,则取到号码为奇数的频率是530.53100=. 本题选择A 选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.05【分析】根据给定的随机数表的读取规则从第一行第67列开始两个数字一组从左向右读取重复的或超出编号范围的跳过即可【详解】根据随机数表排除超过33及重复的编号第一个编号为21第二个编号为32第三个编解析:05【分析】根据给定的随机数表的读取规则,从第一行第6、7列开始,两个数字一组,从左向右读取,重复的或超出编号范围的跳过,即可.【详解】根据随机数表,排除超过33及重复的编号,第一个编号为21,第二个编号为32,第三个编号05,故选出来的第3个红色球的编号为05.【点睛】本题主要考查了简单随机抽样中的随机数表法,属于容易题.14.【分析】计算出抽样中已安装宽带的用户比例乘以总人数求得小区已安装宽带的居民数【详解】抽样中已安装宽带的用户比例为故小区已安装宽带的居民有户【点睛】本小题主要考查用样本估计总体考查频率的计算属于基础题解析:10200【分析】计算出抽样中已安装宽带的用户比例,乘以总人数,求得小区已安装宽带的居民数.【详解】抽样中已安装宽带的用户比例为604251200100+=,故小区已安装宽带的居民有512000010200100⨯=户.【点睛】本小题主要考查用样本估计总体,考查频率的计算,属于基础题.15.5000【分析】由题意其他年级抽取200人其他年级共有学生2000人根据题意列出等式即可求出该校学生总人数【详解】由题意其他年级抽取200人其他年级共有学生2000人则该校学生总人数为人故答案是:5解析:5000【分析】由题意,其他年级抽取200人,其他年级共有学生2000人,根据题意列出等式,即可求出该校学生总人数.【详解】由题意,其他年级抽取200人,其他年级共有学生2000人,则该校学生总人数为20005005000200⨯=人,故答案是:5000.【点睛】该题考查的是有关分层抽样的问题,涉及到的知识点有分层抽样要求每个个体被抽到的概率是相等的,属于简单题目.16.【分析】利用频率分布直方图中频率和为1求a 值根据7080)的频率求出在此区间的人数即可【详解】由1﹣005﹣035﹣02﹣01=03故a =003故阅读的时间在7080)(单位:分钟)内的学生人数为: 解析:900【分析】利用频率分布直方图中频率和为1求a 值,根据[70,80)的频率求出在此区间的人数即可. 【详解】由1﹣0.05﹣0.35﹣0.2﹣0.1=0.3, 故a =0.03,故阅读的时间在[70,80)(单位:分钟)内的学生人数为:0.3×3000=900, 故答案为900. 【点睛】本题考查频率分布直方图中的有关性质的应用,考查直方图中频率和频数的求法.17.7【解析】【分析】结合题意先求出线性回归方程然后再计算出结果【详解】由题意可得则线性回归方程为当时【点睛】本题考查了求线性回归方程然后求出估计结果需要掌握解题方法较为基础解析:7 【解析】 【分析】结合题意先求出线性回归方程,然后再计算出结果 【详解】 由题意可得1520304050315x ++++==6570758090765y ++++==,760.6631a ∴=⨯+, 55.54a =,则线性回归方程为0.66 5.4ˆ55y x =+ 当70x =时,ˆ101.7y≈ 【点睛】本题考查了求线性回归方程,然后求出估计结果,需要掌握解题方法,较为基础18.【解析】分析:首先求得样本中心点然后利用回归方程的性质求得实数a 的值即可详解:由题意可得:线性回归方程过样本中心点则:解得:点睛:本题主要考查线性回归方程的性质及其应用等知识意在考查学生的转化能力和解析:0.85【解析】分析:首先求得样本中心点,然后利用回归方程的性质求得实数a 的值即可. 详解:由题意可得:34569==42x +++,2 3.55 5.544y +++==, 线性回归方程过样本中心点9,42⎛⎫⎪⎝⎭,则:940.72a =⨯+,解得:0.85a =.点睛:本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.19.30【解析】由题意可得:则成绩不低于分的人数为人解析:30 【解析】 由题意可得:()400.0150.0300.0250.0051030⨯+++⨯=则成绩不低于60分的人数为30人20.【解析】依次选取两个数字为237593211504……所以选出来的第个个体的编号为15 解析:15【解析】依次选取两个数字为23,75,93,21,15,04,…… 所以选出来的第3个个体的编号为15.三、解答题21.(1)模型x t y e λ+=的拟合程度更好;(2)(ⅰ)0.180.56ˆx ye +=;(ⅱ)27.56. 【分析】(1)通过换元,模型①写成y u βα=+,模型②两边取对数,写成x t νλ=+,根据参考数列,求两个方程的相关系数,再比较大小;(2)(ⅰ)由(1)可知选择x ty e λ+=,化为x t νλ=+,后根据公式求ˆλ和ˆt ,再换回,x y 求回归方程;(ⅱ)根据回归方程,令250y =,求x 的值. 【详解】(1)设{}i u 和{}i y 的相关系数为1r ,{}i x 和{}i v 的相关系数为2r ,由题意,()()101130.8715iiu u y y r --===≈∑,()()102120.9213iix x v v r --===≈∑,则12r r <,因此从相关系数的角度,模型x t y e λ+=的拟合程度更好. (2)(ⅰ)先建立v 关于x 的线性回归方程, 由x ty eλ+=,得ln y t x λ=+,即v t x λ=+,()()()101102112ˆ65iii i i x x v v x x λ==--==-∑∑, 12ˆˆ 5.36260.5665tv x λ=-=-⨯=, 所以v 关于x 的线性回归方程为ˆ0.180.56v x =+, 所以ˆln 0.180.56yx =+,则0.180.56ˆx y e +=.(ⅱ)2021年盈利额250y =(亿元), 所以0.180.56250x e +=,则0.180.56ln 250x +=, 因为ln 2503ln5ln 23 1.6090.693 5.52=+≈⨯+=, 所以 5.520.5627.560.18x -≈≈.所以2021年的研发资金投入量约为27.56亿元. 【点睛】思路点睛:本题考查非线性回归方程,一般可根据换元,两边取对数的方法,变形为线性回归直线方程,再根据参考公式求系数.22.(Ⅰ)见解析;(Ⅱ)要使水电站日利润的期望值最大,该水电站应安装3台发电机. 【详解】试题分析:(Ⅰ)可利用频率分布直方图的性质,补全图像;(Ⅱ)分别计算安装1台,2台,3台的日利润的期望值,然后进行比较. (Ⅰ)在区间[30,60)的频率为15633647= 31==73070⨯频率组距, 设在区间[0,30)上,a 频率组距=, 则11130170105210a ⎛⎫+++⨯= ⎪⎝⎭,解得1210a=,补充频率分布直方图如图;(Ⅱ)记水电站日利润为Y元.由(Ⅰ)知:不能运行发电机的概率为17,恰好运行一台发电机的概率为37,恰好运行二台发电机的概率为27,恰好运行三台发电机的概率为17,①若安装1台发电机,则Y的值为-500,4000,其分布列为Y-5004000P 1767E(Y)=5004000777-⨯+⨯=;②若安装2台发电机,则Y的值为-1000,3500,8000,其分布列为Y-100035008000P 173737E(Y)=1000350080007777-⨯+⨯+⨯=;③若安装3台发电机,则Y的值为-1500,3000,7500,12000,其分布列为Y-15003000750012000P 17372717E(Y)=1500300075001200077777 -⨯+⨯+⨯+⨯=;∵345003350023500777>>∴要使水电站日利润的期望值最大,该水电站应安装3台发电机.23.(1)9.49.1y x=+;(2)79.6万元;(3)9.67万元.【分析】(1)根据表中数据分别求得ˆ,,x y b,写出回归直线方程. (2)将x =7.5代入(1)的回归直线方程求解. (3)解不等式9.49.1100x +≥即可. 【详解】(1)由表中数据得,23453.54x +++==,26394954424y +++==, ∴()()()41421ˆ9.4iii ii x x y y bx x ==--==-∑∑,429.4 3.59.1a y b x =-⋅=-⨯=,∴回归方程为9.49.1y x =+.(2)年资金投入量为7.5万元时,9.47.59.179.6y =⨯+=(万元); (3)由题意得:9.49.1100x +≥, 解得90.99.4x ≥. ∵90.99.679.4≈, ∴若年市场销售额超过100万,那么年资金投入量至少要9.67万元. 【点睛】本题主要考查回归方程的求法及应用,还考查了运算求解的能力,属于中档题. 24.(1)0.016m =;76.2;(2)16%;70%. 【分析】(1)由频率分布直方图的性质,求得m ,再利用频率分布直方图的平均数计算公式求得50名学生的平均成绩.(2)由频率分布直方图计算[90,100)这一组的频率即可;[70,100)计算三组的频率和即可. 【详解】(1)由频率分布直方图性质可得,(0.0040.0060.0200.0240.030)101m +++++⨯=,得0.016m =,设平均成绩为x ,0.04450.06550.2650.3750.24850.169576.2x =⨯+⨯+⨯+⨯+⨯+⨯=∴.(2)由频率分布直方图可估计在[90,100)分的学生所占总体百分比为0.016100.16⨯=即为16%,[70,100)分的学生所占的百分比(0.0300.0240.016)100.7++⨯=,即为70%.【点睛】本题主要考查频率分布直方图的性质.25.(1)0.1849.968y x =+;(2)所求回归直线方程是有效可靠的;(3)该果园预计收入25095.84元. 【分析】(1)求出x 的平均值x ,y 的平均值y ,再根据公式求出b 和a ,即可得出回归方程; (2)将88x =代入(1)中的回归方程,求出y ,然后用25.8y 和1比较即可判断;(3)将85x =代入回归方程估计出单价,即可计算出收入. 【详解】(1)由题意,得3848586878585x ++++==,16.818.820.822.82420.645y ++++==,则515222156169.655820.641840.1841782055810005i ii ii x y x yb xx ==-⋅-⨯⨯====-⨯-∑∑,20.640.184589.968a y bx =-=-⨯=,故所求回归方程为0.1849.968y x =+;(2)当88x =时,0.184889.96826.16y =⨯+=,所以26.1625.80.361-=<,所以所求回归直线方程是有效可靠的; (3)当85x =,0.184859.96825.608y =⨯+=, 所以25.60898025095.84⨯=(元), 所以该果园预计收入25095.84元. 【点睛】本题考查回归方程的求法以及利用回归方程估计值,属于基础题. 26.(1)17.5 6.5y x =+;(2)9百万元. 【分析】(1)由已知求得ˆb与ˆa 的值,可得销售额y 关于广告费x 的线性回归方程; (2)在(1)中求得的线性回归方程中,取76y =求得x 值即可. 【详解】 (1)6482555x ++++==,5040703060505y ++++==.61621()()10(1)(10)320(3)(20)010130ˆ 6.51199020()iii ii x x yy bx x ==--⨯+-⨯-+⨯+-⨯-+⨯====++++-∑∑,50 6.5517.5ˆˆay bx =-=-⨯=. ∴销售额y 关于广告费x 的线性回归方程为ˆ17.5 6.5yx =+;(2)当ˆ76y=时,代入回归方程ˆ17.5 6.5y x =+,求得9x =. 故预测当销售额为76百万元时,广告费支出为9百万元. 【点睛】本题考查线性回归方程的求法,考查回归方程的应用,考查了计算能力,是中档题.。
第2课时系统抽样课时过关·能力提升1.从N个编号中抽取n个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为()AC答案:C2.有40件产品,编号为1~40,现在从中抽取4件检验,用系统抽样的方法确定所抽取的编号可能为()A.5,10,15,20B.2,12,22,32C.2,14,26,38D.5,8,31,36解析:由系统抽样的定义知抽样距为可以在第一组1~10号样本中取k号,1≤k≤10,则抽取到的样本编号为k,k+10,k+20,k+30.答案:B3.从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为()A.480B.481C.482D.483解析:由样本中编号最小的两个编号分别为007,032,得抽样距为32-7=25,则样本容量为每组中应抽取的号码数x=7+25(n-1)(1≤n≤20,n∈Z),当n=20时,x取得最大值为x=7+25×19=482.答案:C4.总体容量为524,采用系统抽样法抽样,若想不剔除个体,则抽样间隔可以为()A.3B.4C.5D.6解析:因为系统抽样的间隔需要能整除总体个数.故选B.答案:B5.某初级中学有学生270人,其中七年级108人,八年级、九年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按七年级、八年级、九年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270.那么关于上述样本的下列结论,正确的是()A.②③都不能为系统抽样B.②④都不能为分层抽样C.①④都可能为系统抽样D.①③都可能为分层抽样解析:由定义可知,①③可能为分层抽样也可能为系统抽样;②可能为分层抽样;④可能为简单随机抽样.故选D.答案:D6.将高三(1)班参加体检的36名学生,编号为:1,2,3,…,36,若采用系统抽样的方法抽取一个容量为4的样本,已知样本中含有编号为6号、24号、33号的学生,则样本中剩余一名学生的编号是.答案:157.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,……,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是.若用分层抽样方法,则40岁以下年龄段应抽取人.解析:由题意可知,系统抽样时共分成40组,抽样间隔为5,第5组的号码为22,则第8组的号码为22+5×3=37.在分层抽样时,由于40岁以下年龄段人数占总数的50%,故40岁以下年龄段应抽取40×50%=20(人).答案:37208.一个总体中有100个个体,随机编号为0,1,2,…,99.依编号顺序平均分成10个小组,组号依次为1,2,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是.解析:由题设知,若m=6,则在第7组中抽取的号码个位数字与13的个位数字相同,而第7组中的编号依次为60,61,62,63,…,69.故在第7组中抽取的号码是63.答案:639.某学校有学生3 000人,现在要抽取100人组成夏令营,应该怎样抽取样本?分析:因为总体中个体数较多,且无差异,所以按系统抽样的步骤来进行抽样.解:按系统抽样抽取样本,其步骤如下.第一步:把这些学生分成100个组,因为所以每个组30名学生,这时,抽样距就是30.第二步:将3 000名学生随机编号为1,2, (3000)第三步:在第1组用简单随机抽样确定起始个体的编号l(0<l≤30).第四步:按照一定的规则抽取样本,通常是将起始编号l加上分段间隔30得到第2个个体编号l+30,再加上30得到第3个个体编号l+60,这样继续下去,直到获取整个样本.比如l=15,则抽取的编号为15,45,75,105,…,2985.这些号码对应的学生组成样本.10.为了考察某校的教学水平,将抽取这个学校本学年高三年级部分学生的考试成绩,为了全面地反映实际情况,采取以下三种方式进行抽样(已知该校高三年级共有20个教学班,并且每个班的学生都已经按随机方式编好了学号,假定该校每个班的学生人数都相同).①从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察他们的考试成绩;②每个班都抽取1人,共计20人,考察这20个学生的考试成绩;③把学生按成绩分成优秀、良好、普通三个级别,从其中抽取100名学生进行考察(已知若按成绩分,该校高三学生中优秀生共有150人,良好生共有600人,普通生共有250人).根据上面的叙述,试回答下列问题:(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式所抽取的样本中,其样本容量分别是多少?(2)上面三种抽取方式中各自采用何种方法抽取样本?(3)试分别写出上面三种抽取方式各自抽取样本的步骤.解:(1)在这三种抽取方式中,其总体都是该校本学年高三全体学生的考试成绩,个体都是本学年高三年级每个学生的考试成绩.其中第一种抽取方式中样本为所抽取的本学年20名学生的考试成绩,样本容量为20;第二种抽取方式中样本为所抽取的本学年20名学生的考试成绩,样本容量为20;第三种抽取方式中样本为所抽取的本学年100名学生的考试成绩,样本容量为100.(2)在上面三种抽取方式中,第一种方式采用的是简单随机抽样;第二种方式采用的是系统抽样和简单随机抽样;第三种方式采用的是分层抽样和简单随机抽样.(3)第一种方式抽取样本的步骤如下:首先在这20个班中用抽签法任意抽取一个班,然后从这个班中按学号用随机数法或抽签法抽取20个学生,考察其考试成绩.第二种方式抽取样本的步骤如下:首先在第一个班中,用简单随机抽样法任意抽取一个学生,记其学号为a.然后在其余的19个班中,选取学号为a的学生,共计20人.第三种方式抽取样本的步骤如下:首先分层.因为若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应该把全体学生分成三层.然后确定各层抽取的人数.因为样本容量与总体的个体数之比为100∶1 000=1∶10,所以在每层抽取的个体数依次为即15,60,25.最后按层分别抽取.在优秀生中用简单随机抽样抽取15人,在良好生中用简单随机抽样抽取60人,在普通生中用简单随机抽样抽取25人.。
2.2分层抽样与系统抽样第1课时分层抽样课时过关·能力提升1.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本,从上述各层中依次抽取的人数分别是()A.12,24,15,9B.9,12,12,7C.8,15,12,5D.8,16,10,6解析:抽样比为因此,从各层依次抽取的人数分别为160答案:D2.某商场有四类食品,其中粮食类、植物油类、膨化食品类和果蔬类分别为40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类种数之和是()A.4B.5C.6D.7解析:分层抽样的抽样比为所以应抽取的植物油类为10种),果蔬类为20种).故抽取的植物油类与果蔬类种数之和为2+4=6.答案:C3.某服装加工厂某月生产A,B,C三种产品共4 000件,为了保证产品质量,进行抽样检验,根据分层抽样的结果,由于不小心,表格中A,C A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是()A.80件B.800件C.90件D.900件答案:B4.某校现有高一学生210人,高二学生270人,高三学生300人,用分层抽样的方法从这三个年级的学生中随机抽取n名学生进行问卷调查,如果已知从高一学生中抽取的人数为7,那么从高三学生中抽取的人数为()A.7B.8C.9D.10解析:由题意知高一学生210人,从高一学生中抽取的人数为7可以得出抽取比例为所以从高三学生中抽取的人数应为300答案:D5. 某工厂生产A,B,C三种不同型号的产品,其数量之比依次是3∶4∶7,现在用分层抽样的方法抽出样本容量为n的样本,样本中A型号产品有15件,则n等于()A.50B.60C.70D.80答案:C6.某高校甲、乙、丙、丁四个专业分别有150,150,400,300名学生,为了解学生的就业倾向,用分层抽样的方法从该校这四个专业共抽取40名学生进行调查,应在丙专业抽取的学生人数为.解析:由分层抽样定义可知,应抽取丙专业的人数为40答案:167.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取名学生.解析:由分层抽样的方法可得,从一年级本科生中抽取学生人数为300答案:608.某报社做了一次关于“什么是新时代的雷锋精神”的调查,从A,B,C,D四个单位回收的问卷数分别为a1,a2,a3,a4,且满足a1+a3=2a2,共回收1 000份.因报道需要,再从回收的问卷中按单位分层抽取容量为150的样本.若在B单位抽取30份,则在D单位抽取的问卷是份.解析:由题意有解得a2=200.又a1+a2+a3+a4=1 000,a1+a3=2a2,即3a2+a4=1 000,∴a4=400.设在D单位抽取的问卷数为n,解得n=60.答案:609.已知某校的初中生人数、高中生人数、教师人数之比为20∶15∶2,现用分层抽样的方法从所有师生中抽取一个容量为N的样本进行调查,若应从高中生中抽取60人,则N=.解析答案:14810.在某校500名学生中,O型血有200人,A型血有125人,B型血有125人,AB型血有50人,为了研究血型与色弱的关系,需从中抽取一个容量为20的样本.应怎样抽取样本?分析:由于研究血型与色弱的关系,故按血型分层,用分层抽样的方法抽取样本.利用抽样比确定抽取各种血型的人数.解:用分层抽样抽取样本.因为即抽样比为所以200故O型血抽8人,A型血抽5人,B型血抽5人,AB型血抽2人.抽样步骤如下.第一步:确定抽样比第二步:按比例分配各层所要抽取的个体数,O型血抽8人,A型血抽5人,B型血抽5人,AB型血抽 2人.第三步:用简单随机抽样分别在各种血型的人中抽取样本,直至取出容量为20的样本.。
必修三 统计测试题一、选择题(每题只有一个正确答案,每小题5分,共12小题,60分)1.在2008年奥运会开幕之际,某网站想要调查北京市家庭的收入情况,在该问题中,总体是( B )A.北京市B.北京市的所有家庭的收入C.北京市的所有人口D.北京市的工薪阶层 1.解析 :所要研究对象的全体称为统计总体,简称总体,要调查某城市的所有家庭的收入,研究对象就是所有家庭的收入. 答案:B.2.某企业有职工150人,其中高级职称15人,中级职称45人,一般职员90人,现抽取30人进行分层抽样,则各职称人数分别为( B )A .5,10,15B .3,9,18C .3,10,17D .5,9,163. 从N 个编号中抽取n 个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为( C )A .nN B .n C .⎥⎦⎤⎢⎣⎡n N D.1+⎥⎦⎤⎢⎣⎡n N 4. 有50件产品编号从1到50,现在从中抽取5件检验,用系统抽样确定所抽取的编号为( D )A .5,10,15,20,25B .5,15,20,35,40C .5,11,17,23,29D .10,20,30,40,505.用样本频率分布估计总体频率分布的过程中,下列说法正确的是( C )A .总体容量越大,估计越精确B .总体容量越小,估计越精确C .样本容量越大,估计越精确D .样本容量越小,估计越精确6.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则改样本的中位数、众数、极差分别是 ( A )( )A .46,45,56B .46,45,53C .47,45,56D .45,47,537.据报道,2012年7月2日,正阳县一女子在考驾照的路上不小心撞倒行人.对此,某网站对责任的界定进行了一个调查,结果如下:根据此调查结论,则“认为驾校和学员共同负责”者的频率为( )A.18B.14C.12D.137.解析:参与的人数为8000人, “认为驾校和学员共同负责”的频率为4000180002=.答案:C.8 .小波一星期的总开支分布图如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为(C)( )A .30%B .10%C .3%D .不能确定9 .在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是(D )A .众数B .平均数C .中位数D .标准差A.9%B.18%C.27%D.82% 10.解析:优秀的学生共9人,该班总人数为50人,故优秀率为918%50=. 答案:B.11.容量为20的样本数据,分组后的频数如下表则样本数据落在区间[10,40)的频率为( B )A .0.35B .0.45C .0.55D .0.6512.某地区某种病的发病人数呈上升趋势,统计近四年这种病的新发病人数的线性回归分析如下表所示:如果不加控制,仍按这个趋势发展下去,请预测从2000年初到2003年底的四年时间里,该地区这种病的新发病总人数约为( B )A.1167B.11676C.20987D.209812.解析:由上表可得: yˆ=94.7x -186623,当x 分别取2000,2001,2002,2003时,得估计值分别为:2777, 2871.7, 2966.4, 3061.1,则总人数约为2777+2871.7+2966.4+3061.1≈ 11676 答案:B. 二、填空题(每题5分,共4小题,满分20分)13 .一支田径运动队有男运动员56人,女运动员42人.现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有_6_____人.14.由正整数组成的一组数据1x 、2x 、3x 、4x ,其平均数和中位数都是2,且标准差等于1,则这组数据为_1;1;3;3;________.(从小到大排列)15.采用简单随机抽样从含10个个体的总体中抽取一个容量为4的样本,个体 a 前两次未被抽到,第三次被抽到的概率为_101____________________解析 : 不论先后,被抽取的概率都是11016.则样本在区间[20,50)[60,70)⋃ 上的频率为__________________16.解析:首先可以求出20245423x =-----=,在区间[20,50)[60,70)⋃的样本个数为3+4+5+2=14,故频率为140.720=. 答案:0.7.三、解答题(共6小题,满分70分) 17.(本题满分10分)某学校对甲、乙两班的学习成绩进行抽样分析,各抽5 门功课,得到其平均分数分别如下: 甲:60,80,70,90,70 乙:80,60,70,80,75问:甲、乙两个班哪班平均成绩好?哪班的各门功课发展较平衡?17.解:甲班的各门平均成绩为:11(6080709070)745x =++++=乙班的各门平均成绩为:21(8060708075)735x =++++=甲班成绩的方差为:22222211(1464164)1045s =++++= 乙班成绩的方差为: 22222221(713372)565s =++++=由12x x >,2212S S >可知甲的平均成绩较好,乙的各门功课发展较平衡 18.(本题满分12分)有1个容量为100的样本,数据的分组及各组的频率如下:[12.5,15.5)频数 6; [15.5,18.5)频数16; [18.5,21.5) 频数18; [21.5,24.5)频数 22; [24.5,27.5)频数20; [27.5,30.5) 频数10; [30.5,33.5)频数 8.(1).列出样本的频率分布表(含累积频率); (2).画出频率分布直方图. 18.解:(1).样本的频率分布表如下:(2)频率分布直方图如图10—519.(本题满分12分)某学校选拔学生会主席,在5名参选者中选出1名,规定获胜者的条件如下: (1)在竞选中得票最多;(2)得票总数不低于总票数的一半.如果在计票中周小玉的数据不小心丢失,试根据统计数据回答下列问题:(1)请问:如果周小玉获胜,那么周小玉的得票数x 至少是多少?(2)如果赵琦获胜,求周小玉得票数x 的取值范围.19.解:(1).根据条件,如果周小玉获胜,则周小玉的得票数不低于总票数的一半,且票数最高:则必有:130010030602xx≥++++且300x>,解之得:490x ≥.即周小玉的得票数至少为490票;(2).根据条件,如果赵琦获胜,则赵琦的得票数不低于总票数的一半,且得票数最多,则必有:300130010030602300x x ⎧≥⎪++++⎨⎪>⎩,解之得110x ≤ 即周小玉的得票数取值范围是:0110x ≤≤,x N ∈. 20.(本题满分12分)如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:(1)79.589.5 这一组的频数、频率分别是多少?(2)估计这次环保知识竞赛分数的众数、中位数和平均数; (3)估计这次环保知识竞赛的及格率(60分及以上为及格)解析:(1)频率为:0.025100.25⨯=,频数:600.2515⨯=(2)众数在样本数据的频率分布直方图中就是最高矩形的中点横坐标5.7425.795.69=+;估计众数是75或74;对于中位数,由于样本中的个体有一半小于或等于中位数,因此在排列分布直方图中中位数左边和右边的直方图面积应该相等,由此估计样本中的中位数的大小。
一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆy bx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是( )A .成绩B .视力C .智商D .阅读量3.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,84.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为( )A .1167B .365C .36D .675.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .6.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是 A .81.2,4.4 B .40.6,1.1 C .48.8,4.4D .78.8,1.17.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x (cm )174176176176178儿子身高y (cm )175175176177177则y 对x 的线性回归方程为 A .y = x-1B .y = x+1C .y =88+12x D .y = 1768.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用x (万元) 2 3 4 5 销售额y (万元)25374454根据上表可得回归方程ˆˆˆy bx a =+中的ˆb为9.4,据此模型预报广告费用为6万元时销售额为( ) A .61.5万元 B .62.5万元C .63.5万元D .65.0万元9.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .9110.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表: 时间周一 周二 周三周四 周五 车流量x (万辆) 100 102 108 114 116 浓度y (微克)7880848890根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 11.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位12.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53B .0.5C .0.47D .0.37二、填空题13.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位: cm ),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有_______株树木的底部周长大于110cm .14.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.15.数列{}n a 是公差不为零的等差数列,其前n 项和为n S ,若记数据1a ,2a ,3a ,⋅⋅⋅,2019a 的标准差为1σ,数据11S ,22S ,33S ,⋅⋅⋅,20192019S 的标准差为2σ,则12σσ=________ 16.一个车间为了规定工作原理,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下: 零件数x (个) 15 20 30 40 50 加工时间y (分钟)6570758090由表中数据,求得线性回归方程0.66y x a =+,则估计加工70个零件时间为__________分钟(精确到0.1). 17.已知x ,y 的取值如下表: x 2 3 4 5 y2.23.85.56.5从散点图分析,y 与x 线性相关,且回归方程为y =1.46x +a ,则实数a 的值为________.18.数据1x ,2x ,…,n x 的平均数是3,方差是1,则数据15x -,25x -,…,5n x -的平均数和方差之和是__________.19.某超市统计了一个月内每天光顾的顾客人数,得到如图所示的频率分布直方图,根据该图估计该组数据的中位数为__________.20.已知某市A 社区35岁至45岁的居民有450人,46岁至55岁的居民有750人,56岁至65岁的居民有900人.为了解该社区35岁至65岁居民的身体健康状况,社区负责人采用分层抽样技术抽取若干人进行体检调查,若从46岁至55岁的居民中随机抽取了50人,试问这次抽样调查抽取的人数是________人.三、解答题21.某同学在生物研究性学习中,对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另三天的数据,求出y 关于x 的线性回归方程y bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠? 附:回归直线的斜率和截距的最小二乘估计公式分别为:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.22.假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:若由资料可知y 对x 呈线性相关关系,试求: (1)回归直线方程;(2)估计使用年限为10年时,维修费用约是多少?(参考:1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-)23.经销商小王对其所经营的某一型号二手汽车的使用年数(010)x x <≤与销售价格y (单位:万元/辆)进行整理,得到如下的对应数据:售价 1613 9.5 7 4.5(1)试求y 关于x 的回归直线方程;(2)已知每辆该型号汽车的收购价格为20.05 1.7517.2=-+w x x 万元,根据(1)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大.附:回归方程ˆybx a =+中,1221ˆˆˆˆ,ni ii nii x ynx y b ay bx xnx -=-==--∑∑ 24.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x (分钟)时刻的细菌个数为y 个,统计结果如下:x 1 2 3 4 5 y23445(Ⅰ)在给出的坐标系中画出x ,y 的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y 关于x 的回归直线方程ˆˆˆy bx a =+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni ii ni i x y nx yx n axby bx ====---∑∑) 25.某市举办了一次“诗词大赛”,分预赛和复赛两个环节,已知共有20000名学生参加了预赛,现从参加预赛的全体学生中随机地抽取100人的预赛成绩作为样本,得到如下的统计数据. 得分(百分[0,20)[20,40)[40,60)[60,80)[80,100]地抽取2人,求恰有1人预赛成绩优良的概率;(2)由样本数据分析可知,该市全体参加预赛学生的预赛成绩Z 服从正态分布()2,N μσ,其中μ可近似为样本中的100名学生预赛成绩的平均值(同一组数据用该组数据的中间值代替),且2361σ=.利用该正态分布,估计全市参加预赛的全体学生中预赛成绩不低于72分的人数;(3)预赛成绩不低于91分的学生将参加复赛,复赛规则如下: ①参加复赛的学生的初始分都设置为100分;②参加复赛的学生可在答题前自己决定答题数量n ,每一题都需要“花”掉一定分数来获取答题资格(即用分数来买答题资格),规定答第k 题时“花”掉的分数为()0.21,2,k k n =; ③每答对一题得2分,答错得0分;④答完n 题后参加复赛学生的最终分数即为复赛成绩.已知学生甲答对每道题的概率均为0.75,且每题答对与否都相互独立,则当他的答题数量n 为多少时,他的复赛成绩的期望值最大?参考数据:若()2~,Z N μσ,则() 6.827P Z μσμσ-<<+≈,()220.9545P Z μσμσ-<<+≈,()330.9973P Z μσμσ-<<+≈26.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.独立性检验临界值表:【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A . 【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.D解析:D 【解析】试题分析:由表中数据可得 表1:()25262210140.00916362032K ⨯⨯-⨯=≈⨯⨯⨯;表2: ()2524201216 1.76916362032K ⨯⨯-⨯=≈⨯⨯⨯;表3: ()252824128 1.316362032K ⨯⨯-⨯=≈⨯⨯⨯;表4: ()25214302623.4816362032K ⨯⨯-⨯=≈⨯⨯⨯.其中23.48最大,所以阅读量与性别有关联的可能性最大.故D 正确. 考点:独立性检验.3.D解析:D 【分析】根据平均数的性质,方差的性质直接运算可得结果. 【详解】令23(1,2,,5)i i y x i =-=1234555x x x x x x ++++==,1234523232323232310375x x x x x y x -+-+-+-+-∴==-=-=,(也可()(23)2()32537E y E x E x =-=-=⨯-=)()()()2y 232428D D x D x =-==⨯=故选:D 【点睛】本题主要考查方差及平均值的性质的简单应用,属于中档题.4.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差. 【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x+++++=得x =4,∴5个分数的方差为: S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B 【点睛】本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.5.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】 因为,所以,代入回归直线方程可求得,所以,故选D. 【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.6.B解析:B 【分析】先设出原来的数据,然后设出现在的数据,找到两组数据的联系,即可. 【详解】设原来的数据为12,,....,n x x x ,每一个数据都乘以2,再减去80,得到新数据为 12280,280,...,280n x x x --- 已知()122...80 1.2n x x x nn+++-=,则81.240.62X == 方差为:224 4.4, 1.1σσ==,故选B . 【点睛】本道题目考查的是平均数和方差之间的关系,列出等式,探寻两组数据的联系,即可.7.C解析:C 【详解】试题分析:由已知可得176,176x y ==∴中心点为()176,176, 代入回归方程验证可知,只有方程y =88+12x 成立,故选C 8.C解析:C 【分析】先求出所给数据的平均数,得到样本中心点,根据回归直线经过样本中心点,求出ˆa,得到线性回归方程,把6x =代入即可求出答案. 【详解】 由题意知4235 3.54x +++==,44253754404y +++==, 则40ˆˆ9.4 3.57.1a y bx=-=-⨯=, 所以回归方程为9.4.1ˆ7yx =+, 则广告费用为6万元时销售额为9.467.163.5⨯+=, 故答案为C. 【点睛】本题考查了线性回归方程的求法与应用,属于基础题.9.A解析:A 【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可. 【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题.10.B解析:B 【解析】 【分析】利用最小二乘法做出线性回归直线的方程的系数,写出回归直线的方程,得到结果. 【详解】 由题意,b=22222210078102801088411488116905108841001021081141165108⨯+⨯+⨯+⨯+⨯-⨯⨯++++-⨯=0.72,a=84﹣0.72×108=6.24, ∴y =0.72x+6.24, 故选:B . 【点睛】本题主要考查线性回归方程,属于难题.求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,nnii i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,ab ;④写出回归直线方程为ˆˆˆy bx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位,即减少1.5个单位,故选C.【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目. 12.A解析:A【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=,取卡片的次数为100次,则取到号码为奇数的频率是530.53 100=.本题选择A选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.18【分析】根据频率小矩形的面积小矩形的高组距底部求出周长大于110的频率再根据频数样本容量频率求出对应的频数【详解】由频率分布直方图知:底部周长大于110的频率为所以底部周长大于110的频数为(株解析:18【分析】根据频率=小矩形的面积=小矩形的高⨯组距底部,求出周长大于110cm的频率,再根据频数=样本容量⨯频率求出对应的频数.【详解】由频率分布直方图知:底部周长大于110cm的频率为(0.0200.010)100.3+⨯=,所以底部周长大于110cm的频数为600.318⨯=(株),故答案是:18.【点睛】该题考查的是有关频率分布直方图的应用,在解题的过程中,注意小矩形的面积表示的是对应范围内的频率,属于简单题目.14.【分析】先根据平均数计算出的值再根据方差的计算公式计算出这组数的方差【详解】依题意所以方差为故答案为【点睛】本小题主要考查平均数和方差的有关计算考查运算求解能力属于基础题解析:26 5【分析】先根据平均数计算出m的值,再根据方差的计算公式计算出这组数的方差.【详解】依题意12674,45m m ++++==.所以方差为()()()()()22222114244464745⎡⎤-+-+-+-+-⎣⎦[]126944955=+++=. 故答案为265. 【点睛】本小题主要考查平均数和方差的有关计算,考查运算求解能力,属于基础题.15.2【分析】根据等差数列性质分析两组数据之间关系再根据数据变化规律确定对应标准差变化规律即得结果【详解】因为数列是公差不为零的等差数列其前项和为所以因此即故答案为:2【点睛】本题考查等差数列和项性质以解析:2 【分析】根据等差数列性质分析两组数据之间关系,再根据数据变化规律确定对应标准差变化规律,即得结果. 【详解】因为数列{}n a 是公差不为零的等差数列,其前n 项和为n S ,所以111=+222n n n a a a a n S +=, 因此2112σσ=,即122σσ=故答案为:2 【点睛】本题考查等差数列和项性质以及数据变化对标准差的影响规律,考查综合分析求解能力,属中档题.16.7【解析】【分析】结合题意先求出线性回归方程然后再计算出结果【详解】由题意可得则线性回归方程为当时【点睛】本题考查了求线性回归方程然后求出估计结果需要掌握解题方法较为基础解析:7 【解析】 【分析】结合题意先求出线性回归方程,然后再计算出结果 【详解】 由题意可得1520304050315x ++++==6570758090765y ++++==,760.6631a ∴=⨯+,55.54a =,则线性回归方程为0.66 5.4ˆ55y x =+ 当70x =时,ˆ101.7y≈ 【点睛】本题考查了求线性回归方程,然后求出估计结果,需要掌握解题方法,较为基础17.—061【分析】根据所给条件求出把样本中心点代入回归直线方程可以得到关于的方程解出即可得到答案【详解】根据题意可得则这组数据的样本中心点是代入到回归直线方程故答案为【点睛】本题考查了线性回归方程解题解析:—0.61 【分析】根据所给条件求出x ,y ,把样本中心点()x y ,代入回归直线方程 1.4ˆ6ˆyx a +=,可以得到关于ˆa的方程,解出即可得到答案 【详解】 根据题意可得23453.54x +++== 2.2 3.8 5.5 6.54.54y +++==则这组数据的样本中心点是()3.54.5,代入到回归直线方程 1.4ˆ6ˆyx a += 4.5 1.46 3.ˆ5a∴⨯+= ˆ0.61a=- 故答案为0.61- 【点睛】本题考查了线性回归方程,解题的关键是线性回归方程一定过样本中心点,这是求解线性回归方程的步骤之一,是线性回归方程考查的常见题型,体现了回归直线方程与样本中心点的关联.18.3【解析】分析:由题意结合平均数方差的性质整理计算即可求得最终结果详解:由题意结合平均数和方差的性质可知:数据…的平均数为:方差为:则平均数和方差之和是点睛:本题主要考查均值的性质方差的性质等知识意解析:3 【解析】分析:由题意结合平均数、方差的性质整理计算即可求得最终结果. 详解:由题意结合平均数和方差的性质可知:数据15x -,25x -,…,5n x -的平均数为:532-=,方差为:()2111-⨯=, 则平均数和方差之和是213+=.点睛:本题主要考查均值的性质、方差的性质等知识,意在考查学生的转化能力和计算求解能力.19.75【解析】分析:由频率分布直方图算出各频率然后计算中位数详解:由图可知的频率为的频率为的频率为的频率为的频率为前两组频率前三组频率中位数在第三组设中位数为则解得故该组数据的中位数为点睛:本题考查了解析:75. 【解析】分析:由频率分布直方图算出各频率,然后计算中位数 详解:由图可知,10~20的频率为0.1420~30的频率为0.2430~40的频率为0.32 40~50的频率为0.2 50~60的频率为0.1前两组频率0.140.240.380.5=+=< 前三组频率0.140.240.320.70.5=++=>∴中位数在第三组设中位数为x ,则()300.380.320.510x -+⨯=解得33.75x =故该组数据的中位数为33.75点睛:本题考查了在频率分布直方图中求中位数,此类题目需要先确定中位数所在的组,然后根据公式计算求得结果,较为基础.20.【解析】根据题意可得抽样比为则这次抽样调查抽取的人数是即答案为140 解析:140【解析】根据题意可得抽样比为501,75015= 则这次抽样调查抽取的人数是()114507509002100140,1515++=⨯= 即答案为140.三、解答题21.(1)532y x =-;(2)线性回归方程是可靠的. 【分析】(1)根据最小二乘法公式,分别将数据代入计算,即可得答案;(2)选取的是4月1日与4月30日的两组数据,即10x =和8x =代入判断即可; 【详解】解:(1)由数据得12x =,27y =,3972xy =,23432x =; 又31977i i i x y ==∑,321434i i x ==∑;97797254344322b -==-,5271232a =-⨯=-;所以y 关于x 的线性回归方程为:532y x =-. (2)当10x =时,5103222y =⨯-=,22232-<; 当8x =时,583222y =⨯-=,17162-<, 所得到的线性回归方程是可靠的. 【点睛】本题考查最小二乘法求回归直线方程及利用回归方程进行判断拟合效果,考查数据处理能力,求解时注意回归直线必过样本点中心的应用.22.(1) 1.2308ˆ.0yx =+;(2)12.38万元.. 【分析】(1)由已知表格中的数据,易计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.(2)把使用年限10代入回归直线方程,即可估算出维修费用的值. 【详解】 (1)4x =,5y=,52190i i x==∑,51112.3i i i x y ==∑,12215 1.235ni ii nii x yxyb xx ==-==-∑∑,0.08a y bx =-=, 所以回归直线方程为 1.2308ˆ.0yx =+; (2) 1.23100.0812.3ˆ8y=⨯+=, 即估计用10年时维修费约为12.38万元. 【点评】本题考查回归直线的方程求解,关键是要求出回归直线方程的系数,由已知的变量x ,y 的值,我们计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.属于中等题.23.(1) 1.4518.7y x =-+;(2)3 【分析】(1)由表中数据计算x 、y ,求出ˆb、ˆa ,即可写出回归直线方程; (2)写出利润函数z y w =-,利用二次函数的图象与性质求出3x =时z 取得最大值. 【详解】解:(1)由表中数据得,1(246810)65x =⨯++++=,1(16139.57 4.5)105y =⨯++++=, 由最小二乘法求得:22222221641369.58710 4.5561058ˆ 1.452468105640b⨯+⨯+⨯+⨯+⨯-⨯⨯-===-++++-⨯, ˆ10( 1.45)618.7a=--⨯=, 所以y 关于x 的回归直线方程为 1.4518.7y x =-+; (2)根据题意,利润函数为:22(1.4518.7)(0.05 1.7517.2)0.050.3 1.5z y w x x x x x =-=-+--+=-++,所以,当0.332(0.05)x =-=⨯-时,二次函数z 取得最大值为1.95;即预测3x =时,小王销售一辆该型号汽车所获得的利润z 最大. 【点睛】本题考查了回归直线方程的求法,以及二次函数的图象与性质的应用,考查计算能力.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑122216153 3.67ˆ0.7555310ni ii ni i x y nx yxbx n ==-⨯⨯====-⨯--∑∑,ˆˆ 3.60.73 1.5a y bx =-=-⨯=, 所以ˆ0.7 1.5yx =+, 当0.7 1.512x +=时,解得15x =. 所以当15x =时细菌个数为12个. 【点睛】本题考查了散点图、线性回归方程及其应用,属于基础题. 25.(1)2552;(2)3173;(3)当他的答题数量7n =时,他的复赛成绩的期望值最大. 【分析】(1)由表可知,样本中成绩不低于60分的学生共有40人,其中成绩优良的人数为15人,再结合排列组合与古典概型即可得解;(2)先求出样本中的100名学生预赛成绩的平均值,即为μ,从而推出~(53Z N ,219),再根据正态分布的性质即可得解;(3)以随机变量ξ表示甲答对的题数,则~B ξ(,0.75)n ,记甲答完n 题所得的分数为随机变量X ,则2X ξ=,为了获取答n 道题的资格,甲需要“花”掉的分数为20.1()n n +,设甲答完n 题后的复赛成绩的期望值为()f n ,则2()1000.1()()f n n n E X =-++,最后利用配方法即可得解. 【详解】解:(1)由题意得样本中成绩不低于60分的学生共有40分,其中成绩优良的人数为15人,记“从样本中预赛成绩不低于60分的学生中随机地抽取2人,恰有1人预赛成绩优良”为事件A ,则()1125152402552C C P A C == 答:“从样本中预赛成绩不低于60分的学生中随机地抽取2人,恰有1人预赛成绩优良”的概率为2552(2)由题意知样本中的100名学生预赛成绩的平均值为:100.1300.2500.3700.25900.1533x =⨯+⨯+⨯+⨯+⨯=,则53μ=,由2361σ=得19σ=, 所以()()()()17210.158652P Z P Z P Z μσμσμσ≥=≥+=--<≤+≈, 所以,估计全市参加参赛的全体学生中,成绩不低于72分的人数为20000×0.15865=3173,即全市参赛学生中预赛成绩不低于72分的人数为3173.(3)以随机变量ξ表示甲答对的题数,则()~,0.75B n ξ,且()0.75E n ξ=, 记甲答完n 题所加的分数为随机变量X ,则2X ξ=,∴()()2 1.5E X E n ξ==, 依题意为了获取答n 道题的资格,甲需要“花”掉的分数为:()()20.2123...0.1n n n ⨯++++=+,设甲答完n 题后的复赛成绩的期望值为()f n ,则()()()221000.1 1.50.17104.9f n n n n n =-++=--+,由于*n N ∈,所以当7n =时,()f n 取最大值104.9. 即当他的答题数量7n =时,他的复赛成绩的期望值最大. 【点睛】本题考查古典概型、正态分布的性质、二项分布的性质及数学期望的实际应用,考查学生对数据的分析与处理能力,属于中档题.26.(1)分布列见解析,1;(2)0.10=P ,理由见解析. 【分析】(1)按照分层抽样计算“科学用眼”和“不科学用眼”的抽取人数,随机变量X 的取值可能为0,1,2,然后计算概率得出分布列及其数学期望; (2)按照公式计算2K 的值,然后由临界值表得出结果即可. 【详解】(1)“科学用眼”抽156245⨯=人,“不科学用眼”抽306445⨯=人,则随机变量X0=,1,2,∴343641 (0)205====CP XC,122436123(1)205C CP XC====,21243641(2)205C CP XC====,分布列为:0120121555EX=⨯+⨯+⨯=;(2)22100(45153010)3.03075255545⨯-⨯=≈⨯⨯⨯K,由表可知2.706 3.030 3.840<<,∴0.10=P.【点睛】本题考查随机变量的分布列和数学期望,考查独立性检验,考查逻辑思维能力和计算能力,考查学生分析解决问题的能力,属于常考题.。
章末综合测评(一) 统 计(满分:150分 时间:120分钟)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.为了调查全国人口的寿命,抽查了十一个省(市)的2 500名城镇居民,这个问题中“2 500名城镇居民的寿命的全体”是( )A .总体B .个体C .样本D .样本容量C [每个人的寿命是个体,抽出的2 500名城镇居民的寿命的全体是从总体中抽取的一个样本.]2.为了了解1 200名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔k 为( )A .40B .30C .20D .12B [系统抽样也叫间隔抽样,抽多少就分成多少组,总数组数=间隔数,即k =1 20040=30.] 3.一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为( )A .10组B .9组C .8组D .7组B [根据频率分布表的步骤,极差组距=140-5110=8.9,所以分成9组.] 4.某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )A .11B .12C .13D .14B [依据系统抽样的特点分42组,每组20人,区间[481,720]包含25组到36组,每组抽一个,则抽到的人数为12.]5.某市重点中学奥数培训班共有14人,分为两个小组,在一次阶段考试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则m +n 的值是( )A .10B .11C .12D .13C [∵甲组学生成绩的平均数是88,∴由茎叶图可知78+86+84+88+95+90+m +92=88×7,∴m =3,∵乙组学生成绩的中位数是89,∴n =9,∴m +n =12.故选C.]6.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队平均每场进球数为1.8,全年比赛进球数的标准差为0.3.下列说法中,正确的个数为( )①甲队的进球技术比乙队好;②乙队发挥比甲队稳定;③乙队几乎每场都进球;④甲队的表现时好时坏.A .1B .2C .3D .4D [因为甲队的平均进球数比乙队多,所以甲队技术较好,①正确;乙队的标准差比甲队小,标准差越小越稳定,所以乙队发挥稳定,②也正确;乙队平均每场进球数为1.8,所以乙队几乎每场都进球,③正确;由于s 甲=3,s 乙=0.3,所以甲队与乙队相比,不稳定,所以甲队的表现时好时坏,④正确,故选D.]7.某学校为调查学生的学习情况,对学生的课堂笔记进行了抽样调查,已知某班级一共有56名学生,根据学号(001~056),用系统抽样的方法抽取一个容量为4的样本,已知007号、021号、049号在样本中,那么样本中还有一个学生的学号为( )A .014B .028C .035D .042C [由系统抽样的原理知,抽样的间隔为564=14,故第一组的学号为001~014,所以007为第一组内抽取的学号,所以第二组抽取的学号为021;第三组抽取的学号为035;第四组抽取的学号为049.故选C.]8.从800件产品中抽取60件进行质检,利用随机数表法抽取样本时,先将800件产品按001,002,…,800进行编号.如果从随机数表第8行第8列的数6开始往右读数(随机数表第7行至第9行的数如下),则抽取的第4件产品的编号是( )8105010805 4557182405 35303428148879907439 23403097328326977602 020******* 68555748187305385247 18623885796357332135 0532547048 90558575182846828709 8340125624A .602B .020C .516D .569D [找到第8行第8列的数6,并开始向右读,每次读取三位,凡不在001~800中的数跳过去不读,前面已经读过的也跳过去不读,从而最先抽取的4件产品的编号依次是602,020,516,569.故抽取的第4件产品的编号是569.]9.对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其回归直线方程是:y =16x +a ,且x 1+x 2+x 3+…+x 8=3,y 1+y 2+y 3+…+y 8=6,则a =( ) A.116B.18C.14D.1116D [因为x 1+x 2+x 3+…+x 8=3,y 1+y 2+y 3+…+y 8=6,所以x =38,y =34, 所以样本中心点的坐标为⎝⎛⎭⎫38,34,代入回归直线方程得34=16×38+a ,所以a =1116.] 10.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A .8B .15C .16D .32C [已知样本数据x 1,x 2,…,x 10的标准差为s =8,则s 2=64,数据2x 1-1,2x 2-1,…,2x 10-1的方差为22s 2=22×64,所以其标准差为22×64=2×8=16,故选C.]11.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:。
高中数学必修3第一章(统计)检测题班级姓名得分一、选择题:(本题共10小题,每小题3分,共30分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.某单位有老年人28人,中年人54人,青年人81人.为了调查他们的身体状况,需从他们中抽取一个容量为36的样本,最适合抽取样本的方法是( ).A.简单随机抽样B.系统抽样C.分层抽样D.先从老年人中剔除一人,然后分层抽样2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则有( ).A.a>b>c B.b>c>a C.c>a>b D.c>b>a3.下列说法错误的是( ).A.在统计里,把所需考察对象的全体叫作总体B.一组数据的平均数一定大于这组数据中的每个数据C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.一组数据的方差越大,说明这组数据的波动越大4.下列说法中,正确的是( ).A.数据5,4,4,3,5,2的众数是4B.一组数据的标准差是这组数据的方差的平方C.数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半D.频率分布直方图中各小长方形的面积等于相应各组的频数5.从甲、乙两班分别任意抽出10名学生进行英语口语测验,其测验成绩的方差分别为S12= 13.2,S22=26.26,则( ).A.甲班10名学生的成绩比乙班10名学生的成绩整齐B.乙班10名学生的成绩比甲班10名学生的成绩整齐C.甲、乙两班10名学生的成绩一样整齐D.不能比较甲、乙两班10名学生成绩的整齐程度6.下列说法正确的是( ).A.根据样本估计总体,其误差与所选择的样本容量无关B.方差和标准差具有相同的单位C.从总体中可以抽取不同的几个样本D.如果容量相同的两个样本的方差满足S12<S22,那么推得总体也满足S12<S22是错的7.右图是根据《湖南统计年整2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为()29 1 1 5 8 (A)304.6(B)303.63 0 2 63 1 0 24 7 (C)302.6 (D)301.68.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为(1);在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为(2)。
一、选择题1.如图1为某省2019年1~4月快递业务量统计图,图2是该省2019年1~4月快递业务收入统计图,下列对统计图理解错误的是( )A .2019年1~4月的业务量,3月最高,2月最低,差值接近2000万件B .2019年1~4月的业务量同比增长率超过50%,在3月最高C .从两图来看2019年1~4月中的同一个月快递业务量与收入的同比增长率并不完全一致D .从1~4月来看,该省在2019年快递业务收入同比增长率逐月增长2.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元3.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm ),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是( )A .海水稻根系深度的中位数是45.5B .普通水稻根系深度的众数是32C .海水稻根系深度的平均数大于普通水稻根系深度的平均数D .普通水稻根系深度的方差小于海水稻根系深度的方差4.已知变量x ,y 的关系可以用模型kx y ce =拟合,设ln z y =,其变换后得到一组数据下:x16171819 z50344131由上表可得线性回归方程4=-+,则()z x aA.4-B.4e-C.109 D.109e5.为了了解我校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1:2:3,第2小组的频数为12,则抽取的学生总人数是()A.24 B.48 C.56 D.646.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号1,2,⋯,960,分组后在第一组采用简单随机抽样的方法抽到的号码为29,则抽到的32人中,编号200,480的人数为落入区间[]A.7 B.9 C.10 D.127.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是()A.2018年3月的销售任务是400台B.2018年月销售任务的平均值不超过600台C.2018年第一季度总销售量为830台D.2018年月销售量最大的是6月份8.如果在一次试验中,测得(x,y)的四组数值分别是A(1,3),B(2,3.8),C(3,5.2),D(4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.99.某宠物商店对30只宠物狗的体重(单位:千克)作了测量,并根据所得数据画出了频率分布直方图如下图所示,则这30只宠物狗体重(单位:千克)的平均值大约为( )A .15.5B .15.6C .15.7D .1610.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .1811.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .712.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经统计,得到一个卖出的热饮杯数与当天气温的对比表: 温度℃ -5 0 4 7 12 15 19 23 27 31 36 热饮杯数15615013212813011610489937654根据上表数据确定的线性回归方程应该是( )A .ˆ 2.352147.767yx =-+ B .ˆ 2.352127.765yx =-+ C .ˆ 2.35275.501yx =+D .ˆ 2.35263.674yx =+ 二、填空题13.如图是甲、乙两人在10天中每天加工零件个数的茎叶图,若这10天甲加工零件个数的中位数为a ,乙加工零件个数的平均数为b ,则a b +=______.14.已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为______.15.对具有线性相关关系的变量,x y ,有一组观测数据(,)i i x y (1,2,3,,10i =),其回归直线方程是3ˆ2ˆybx =+,且121012103()30x x x y y y +++=+++=,则b =______.16.数据1x ,2x ,…,n x 的平均数是3,方差是1,则数据15x -,25x -,…,5n x -的平均数和方差之和是__________. 17.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,若变量x 增加一个单位时,则y 平均增加5个单位; ③线性回归方程^^^y b x a =+所在直线必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个22⨯列联表中,由计算得213.079K =,则其两个变量之间有关系的可能性是0090.其中错误的是________.18.变量X 与Y 相对应的5组数据和变量U 与V 相对应的5组数据统计如表: X 10 11.3 11.8 12.5 13 U 10 11.3 11.8 12.5 13 Y12345V54321用b 1表示变量Y 与X 之间的回归系数,b 2表示变量V 与U 之间的回归系数,则b 1与b 2的大小关系是___.19.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.20.已知一组数据x ,8,7,9,7,若这组数据的平均数为8,则它们的方差为______.三、解答题21.某北方村庄4个草莓基地,采用水培阳光栽培方式种植的草莓个大味美,一上市便成为消费者争相购买的对象.光照是影响草莓生长的关键因素,过去50年的资料显示,该村庄一年当中12个月份的月光照量X (小时)的频率分布直方图如下图所示(注:月光照量指的是当月阳光照射总时长).(1)求月光照量X (小时)的平均数和中位数;(2)现准备按照月光照量来分层抽样,抽取一年中的4个月份来比较草莓的生长状况,问:应在月光照量[160,240)X ∈,[240,320)X ∈,[320,400]X ∈的区间内各抽取多少个月份?(3)假设每年中最热的5,6,7,8,9,10月的月光照量X 是大于等于240小时,且6,7,8月的月光照量X 是大于等于320小时,那么,从该村庄2018年的5,6,7,8,9,10这6个月份之中随机抽取2个月份的月光照量进行调查,求抽取到的2个月份的月光照量X (小时)都不低于320的概率.22.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元),有如下的统计资料:x (年)1 2 3 4 5y (万元) 5 6 7 8 10由资料可知y 对x 呈线性相关关系. (1)求y 关于x 的线性回归方程;(2)请估计该设备使用年限为15年时的维修费用.参考公式:线性回归方程y bx a =+的最小二乘法计算公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-,参考数据:5115263748510120i ii x y==⨯+⨯+⨯+⨯+⨯=∑23.某微商对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.(Ⅰ)求频率分布直方图中a的值;(Ⅱ)若微商在一天的销售量不低于25件,则上级商企会给微商赠送100元的礼金,估计该微商在一年内获得的礼金数.24. 2.5PM是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与 2.5PM的浓度是否相关,现采集到某城市周一至周五某时间段车流量与2.5PM浓度的数据如下表:时间周一周二周三周四周五车流量x(万辆)50515457582.5PM的浓度y(微克/立方米)3940424445(1)根据上表数据,求出这五组数据组成的散点图的样本中心坐标;(2)用最小二乘法求出y关于x的线性回归方程y bx a=+;(3)若周六同一时间段车流量是100万辆,试根据(2)求出的线性回归方程预测,此时2.5PM的浓度是多少?(参考公式:()()()121ni iiniix x y ybx x==--=-∑∑,a y bx=-)25.某花圃为提高某品种花苗质量,开展技术创新活动,在A,B实验地分别用甲、乙方法培育该品种花苗.为观测其生长情况,分别在A,B试验地随机抽选各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图.记综合评分为80及以上的花苗为优质花苗.(1)求图中a的值,并求综合评分的平均数;(2)若优质花苗数中甲乙两种培育法的比列为1:3,填写下面的列联表,并判断是否有99%的把握认为优质花苗与培育方法有关.附:下面的临界值表仅供参考.(参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)26.某企业广告费支出与销售额(单位:百万元)数据如表所示: (1)求销售额y 关于广告费x 的线性回归方程;(2)预测当销售额为76百万元时,广告费支出为多少百万元. 回归方程y bx a =+中斜率和截距的最小二乘估计公式分别为:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】由题意结合所给的统计图确定选项中的说法是否正确即可.【详解】对于选项A: 2018年1~4月的业务量,3月最高,2月最低,差值为439724111986-=,接近2000万件,所以A是正确的;对于选项B: 2018年1~4月的业务量同比增长率分别为55%,53%,62%,58%,均超过50%,在3月最高,所以B是正确的;对于选项C:2月份业务量同比增长率为53%,而收入的同比增长率为30%,所以C是正确的;对于选项D,1,2,3,4月收入的同比增长率分别为55%,30%,60%,42%,并不是逐月增长,D错误.本题选择D选项.【点睛】本题主要考查统计图及其应用,新知识的应用等知识,意在考查学生的转化能力和计算求解能力.2.C解析:C【解析】试题分析:根据线性回归方程=50+80x的意义,对选项中的命题进行分析、判断即可.解:根据线性回归方程为=50+80x,得;劳动生产率为1000元时,工资约为50+80×1=130元,A正确;∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B正确;劳动生产率提高1000元时,工资约提高=80元,C错误;当月工资为210元时,210=50+80x,解得x=2,此时劳动生产率约为2000元,D正确.故选C.考点:线性回归方程.3.D解析:D【分析】选项A求出海水稻根系深度的中位数是444745.52+=,判断选项A正确;选项B写出普通水稻根系深度的众数是32,判断选项B正确;选项C先求出海水稻根系深度的平均数,再求出普通水稻根系深度的平均数,判断选项C正确;选项D先求出普通水稻根系深度的方差,再求出海水稻根系深度的方差,判断选项D错误.【详解】解:选项A:海水稻根系深度的中位数是444745.52+=,故选项A正确;选项B:普通水稻根系深度的众数是32,故选项B正确;选项C :海水稻根系深度的平均数393938434447495050514510+++++++++=,普通水稻根系深度的平均数252732323436384041453510+++++++++=,故选项C 正确;选项D :普通水稻根系深度的方差2222222211[(3845)(3945)(3945)(4345)(4445)(4745)(4945)(5045)10S =-+-+-+-+-+-+-+-+, 海水稻根系深度的方差2222222221[(2535)(2735)(3235)(3235)(3435)(3635)(3835)(4035)(10S =-+-+-+-+-+-+-+-+,故选项D 错误 故选:D. 【点睛】本题考查根据茎叶图求中位数、众数、平均数、方差,是基础题. 4.D解析:D 【分析】由已知求得x 与z 的值,代入线性回归方程求得a ,再由kxy ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+,结合z lny =,得z lnc kx =+,则109lnc =,由此求得c 值.【详解】 解:1617181917.54x +++==,50344131394z +++==. 代入4z x a =-+,得39417.5a =-⨯+,则109a =.∴4109z x =-+,由kxy ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+,令z lny =,则z lnc kx =+,109lnc ∴=,则109c e =. 故选:D . 【点睛】本题考查回归方程的求法,考查数学转化思想方法,考查计算能力,属于中档题.5.B解析:B 【分析】根据频率分布直方图可知从左到右的前3个小组的频率之和,再根据频率之比可求出第二组频率,结合频数即可求解. 【详解】 由直方图可知,从左到右的前3个小组的频率之和为1(0.01250.0375)510.250.75-+⨯=-=, 又前3个小组的频率之比为1:2:3, 所以第二组的频率为20.750.256⨯=, 所以学生总数120.2548n =÷=,故选B. 【点睛】本题主要考查了频率分布直方图,频率,频数,总体,属于中档题.6.C解析:C 【分析】根据系统抽样的定义,可知抽到的号码数可组成一个以301=-n a n 为通项公式的等差数列,令*200301480,≤-≤∈n n N ,解不等式可得结果. 【详解】每组人数=9603230÷=人,即抽到号码数的间隔为30,因为第一组抽到的号码为29,根据系统抽样的定义,抽到的号码数可组成一个等差数列,且*2930(1)301,=+-=-∈n n n n N a ,令200301480≤-≤n ,得2014813030≤≤n ,可得n 的取值可以从7取到16,共10个,故选C . 【点睛】本题主要考查系统抽样的定义及应用,转化为等差数列是解决本题的关键.7.D解析:D 【分析】根据图形中给出的数据,对每个选项分别进行分析判断后可得错误的结论. 【详解】对于选项A ,由图可得3月份的销售任务是400台,所以A 正确. 对于选项B ,由图形得2018年月销售任务的平均值为1(3245810743413)10045012⨯+++++++++++⨯=,所以B 正确. 对于选项C ,由图形得第一季度的总销售量为13002001400 1.28302⨯+⨯+⨯=台,所以C 正确.对于选项D ,由图形得销售量最大的月份是5月份,为800台,所以D 不正确. 故选D . 【点睛】本题考查统计中的识图、用图和计算,解题的关键是从图中得到相关数据,然后再根据要求进行求解,属于基础题.8.B解析:B 【解析】分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程. 详解:123+4=2.54x ++=, 3 3.8 5.264.5,4y +++==∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立, 故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.9.B解析:B 【分析】由频率分布直方图分别计算出各组得频率、频数,然后再计算出体重的平均值 【详解】由频率分布直方图可以计算出各组频率分别为:0.10.20.250.250.15,,,,,0.05 频数为:367.57.54.51.5,,,,, 则平均值为:113136157.5177.519 4.521 1.515.630⨯+⨯+⨯+⨯+⨯+⨯=故选B 【点睛】本题主要考查了由频率分布直方图计算平均数,需要注意计算不要出错10.C解析:C 【解析】 【分析】根据分层抽样的定义求出在各层中的抽样比,即样本容量比上总体容量,按此比例求出在高三年级中抽取的人数. 【详解】根据题意得,用分层抽样在各层中的抽样比为421105020=, 则在高三年级抽取的人数是14001625⨯=人, 故选C. 【点睛】该题所考查的是有关分层抽样的问题,在解题的过程中,需要明确无论采用哪种抽样方法,都必须保证每个个体被抽到的概率是相等的,所以注意成比例的问题.11.B解析:B【解析】分析:首先写出所有学生的乘积,然后结合系统抽样的方法整理计算即可求得最终结果.详解:由题意可知,学生的成绩如下:111,111,112,113,113;116,117,117,118,118;120,120,121,122,122;123,124,124,126127;128,128,129,129,129;131,131,131,132,132;132,133,134,134,135;137,138,138,138,139;140,142,142,143,144.用系统抽样方法从中抽取9人,则每5人中抽取一人,即上述分组中每组抽取一人,则所抽取的学生的成绩在区间[]120,135上的学生人数为5.本题选择B选项.点睛:本题主要考查系统抽样的概念及其应用,茎叶图的识别等知识,意在考查学生的转化能力和计算求解能力.12.A解析:A【解析】分析:先观察表中数据的规律,确定回归系数b的符号,再计算x和y,代入选项确定正确答案.详解:由表中数据规律发现:热饮杯数y随当天气温x升高而减少,则0b<,排除C、D.计算1169=(504712151923273136)1111x-++++++++++=11228=(15615013212813011610489937654)111.64 1111y++++++++++=≈将x代入选项A,得1692.352147.767111.6311ˆy=-⨯+=将x代入选项B,得1692.352127.76591.6311ˆy=-⨯+=所以选项A正确.故选A.点睛:本题考查线性回归方程的求法与应用,一次项系数b符号的判断和回归直线过样本中心点(,)x y是解题关键.二、填空题13.5【解析】【分析】由茎叶图直接可以求出甲的中位数和乙的平均数求和即可【详解】由茎叶图知甲加工零件个数的中位数为乙加工零件个数的平均数为则【点睛】本题主要考查利用茎叶图求中位数和平均数解析:5 【解析】 【分析】由茎叶图直接可以求出甲的中位数和乙的平均数,求和即可. 【详解】由茎叶图知,甲加工零件个数的中位数为()1212221.52a =⨯+=, 乙加工零件个数的平均数为()11917112124222430323010b =⨯+++++++++23=,则21.52344.5a b +=+=. 【点睛】本题主要考查利用茎叶图求中位数和平均数.14.【解析】【分析】先求出这个数据的平均数为此时这个数据的方差为由此求出结果【详解】某个数据的平均数为方差为现又加入一个新数据则这个数据的平均数为此时这个数据的方差为故答案为【点睛】本题主要考查了平均数解析:83【解析】 【分析】先求出这9个数据的平均数为5,此时这9个数据的方差为()22183559S ⎡⎤=⨯+-⎣⎦,由此求出结果 【详解】某8个数据的平均数为5,方差为3,现又加入一个新数据5, 则这9个数据的平均数为85559⨯+= ∴此时这9个数据的方差为()2218835593S ⎡⎤=⨯+-=⎣⎦故答案为83【点睛】本题主要考查了平均数和方差的计算公式,属于基础题。
第一章统计章末测试题一.选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的.)1.(原创)①某商场某月得1000张发票,其中副食品类有500张,百货类有300张,电器与文具类各100张,现想通过抽检其中100张来快速估计每月的销售金额;②从20名优秀学生中选出3名参加2010广州奥运会知识竞赛.方法:Ⅰ.简单随机抽样法;Ⅱ.系统抽样法;Ⅲ.分层抽样法.其中问题与方法能配对的是( )A.①Ⅰ,②ⅡB. ①Ⅲ,②ⅠC.①Ⅱ,②ⅢD.①Ⅲ,②Ⅱ2.(原创)国家体委将挑选1名运动员参加2010年广州奥运会单人皮划艇项目比赛. 需对甲、乙2名运动员的10次测试成绩进行统计分析,要求能反映所有的原始数据且没有信息的损失,应选择的统计图是()A.扇形统计图B.折线统计图C.条形统计图D.茎叶图3.下列说法正确的有()①一个小学生的身高与他的父母的身高不相关;②散点图的作用是粗略判断变量是否具有相关关系;③线性回归方程最能代表线性相关的两个变量之间的关系;④当所研究的数据对应散点图是非线性时不能用最小二乘估计.A.0 B.1 C.2 D.3 4.(改编)甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图1-1所示,则甲、乙命中9环以上(含9环)的次数分别为( ) A.2次,3次B.1次,3次C.3次,1次D.3次,2次5.李宁运动鞋厂为了了解中学生穿鞋的鞋号的情况,对某中学高一(2)班的20名男生所穿鞋号的统计如下表:设其平均数为A.B.C.c a b>>D.bac=>6.一个箱子中有若干个大小相同的球,为了估算球的个数,采用下列方法:从箱子内取20出个球,做上记号后(不会影响球的大小)再放回箱内,然后搅拌均匀,接着再从箱子内取出30个球,结果其中5个球上有记号,那么原来箱子内的球的个数大约为()A. 120 B. 180 C. 300 D.600 7.有甲、乙两种水稻,测得每种水稻各12株的分蘖数后,计算出样本方差分别为2S甲=8,2S乙=3.4,由此可以估计( ).A.甲种水甲种水稻比乙种水稻分蘖整齐B.乙种水稻比甲种水稻分蘖整齐C.甲、乙两种水稻分蘖整齐程度相同D.甲、乙两种水稻分蘖整齐程度不能比较8.下列说法中正确的是()A.数据5,4,4,3,5,2的众数是4B.一组数据的标准差是这组数据的方差的平方C.数据2,3,4,5的标准差是数据4,6,8,10的图1-110.已知,x y 的取值如下表所示,从散点图分析,y 与x 线性相关,且0.95y x a =+,则和方差分别为( )A .84,4.84B .84,1.6C .85,1.6D .85,4二.填空题(本大题共4小题,每小题4分,共16分,把答案填在题中横线上)13.某大学对1000名学生的自主招生水平测试成绩进行统计,得到样本频率分布直方图如图1-4所示,现规定不低于70分为合格,则合格人数是 .14.2010年“两会”期间,某大学组织全体师生,以调查表的形式对温总理的政府工作报告进行讨论.为及时分析讨论结果,该大学从所回收的调查表中,采用分层抽样的方法抽取了300份进行分析.若回收的调查表中,来自于退休教职工、在职教职工、学生的份数之比为3:7:40,则所抽取的调查表中来自于退休教职工的有 份 15.某单位为了了解用电量y 度与气温ox C 之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表: 由表中数据得线性回归方程y bx a =+中,2b =-,若利用最小二乘估计进行预测,则当气温为o 4C -时,用电量的度数约为 . 16.(改编)某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数登错了,甲实得80分,却记了50分,乙得70分却记了100分,图1-2图1-4记更正后的平均分为m,方差为n,则m= , n= .三、解答题(分值分别为12+12+12+12+12+ 14=74分,要求写出解答或证明过程)17.(本小题满分12分)从某工厂生产的1004个节能灯中抽取10个进行性能检测,请选择合理的抽样方法,并写出抽样过程.18.(本小题满分12分)某班甲乙两同学的高考备考成绩如下:甲:512,554,528,549,536,556,534,541,522,538;乙:515,558,521,543,532,559,536,548,527,531.(1)用茎叶图表示两学生的成绩;(2)分别求两学生成绩的中位数和平均分. 19.(本小题满分12分)为了了解某年段1000名学生的百米成绩情况,随机抽取了若干学生的百米成绩,成绩全部介于13秒与18秒之间,将成绩按如下方式分成五组:第一组[13,14);第二组[14,15);……;第五组[17,18].按上述分组方法得到的频率分布直方图如图1-5所示,已知图中从左到右的前3个组的频率之比为3∶8∶19,且第二组的频数为8.(1)请估计该年段1000名学生中百米成绩在[16,17)内的人数;(2)求第二组的频率;(3)求调查中随机抽取了多少个学生的百米成绩.图1-520.(本小题满分12分)某电器商场为了了解电暖器的月销售量y (个)与月平均气温)(0C x 之间的关系随机统计了某5个月的月销售量与月平均气温,其数据如下表:(1)在所给的坐标系中画出上表数据的散点图:(2)根据表中的数据求出y 关于x 的线性回归方程a bx y +=.(3)若气象部门预测下个月的平均气温为06C ,据此估计,该商场下个月电暖器的销售量约为多少个?21.(本小题满分12分)(原创)为了让学生更多的了解“数学史”知识,某中学举办了一次“追寻先哲的足迹,倾听数学的声音”的数学史知识竞赛活动,共有800名学生参加了这次竞赛,为了解本次竞赛的成绩情况,从中抽取了100学生的成绩(得分均为整数,满分为100分)进行统计.请你根据频(1)填充频率分布表中的空格(在解答中直接写出对应空格序号的答案);(2)在图1-6中画出频率分布直方图. (3)为鼓励更多的学生了解“数学史”知识,成绩不低于70分的学生能获奖,那么可以估计在参加的800名学生中大概有多少同学获奖?月7日舟曲泥石流发生以后,某地组织一个救援队进行救援,若该救援队到达灾区后分成4个小组,其人数分别为10,10,x,8,已知这组数据的中位数和平均数相等,求这组数据中的x及平均数与方差.第一章统计章末测试卷参考答案及解析 一、选择题1.B 解析:因为①有明显的差异,选用分层抽样法;②总体数目较少适宜简单随机抽样法.选B. 2.D 解析:由茎叶图的特点可知D 正确. 3.D 解析:①错误,②③④正确,故选D. 4.B 解析:由图1-1知甲只有第一次命中9环,乙最后三次都命中9环以上(含9环).5.C 解析:由平均数、中位数和众数的概念可求得平均数为a =24.55,中位数为b =24.5,众数为c =25;故选C.6.A 解析: 设原来箱子内球个数为n ,则:20512030n n =⇒= . 7.B 解析:因为22S S >乙甲,所以乙种水稻比甲种水稻分蘖整齐.选B.8.C 解析:因为A 中数据的众数是4和5,所以错;B 中一组数据的标准差是这组数据的方差的算术平方根,而不是平方;D 频率分布直方图中的各小正方形的面积等于相应各组的频率,而不是频数;选C ,因为如数据4,6,8,10的标准差为S ,由题知,数据2,3,4,512S =. 9.B 解析:由于乘车人数为25人,百分比为50%,可计算出总人数为50人,而步行人数占30%,所以50×30%=15(人)) 10.D 解析:013424x +++==,2.2 4.3 4.8 6.7 4.54y +++==,0.95 4.50.952 2.6a y x =-=-⨯=11.B 解析:因为40个分数的总和为40M ,所以4041M MN M +==,即M :N =112. C 解析:七位评委打出的分数从低到高为:76,84,84,84,86,87,95.去掉最低分76,最高分95,计算平均数为85,然后计算方差为1.6.故选C.二、填空题13. 600 解析:由直方图可以看出合格率为(0.035+0.015+0.01)×10=0.6,所以及格人数为10000.6600⨯=.14.18 解析: 所抽取的调查表中来自于退休教职工的有3300183740?++.15.68度 解析:根据表中数据估算60a =,所以预测当气温为o4C -时用电量的度数约为68度.16.70,50解析:因甲少记了30分,乙多记了30分,故平均分不变,设更正后的方差为2S ,则由题意可得:22212222481[(70)(70)48(8070)(7070)(70)]S x x x =-+-++-+-++-LL 而更正前有:221222248175[(70)(70)48(5070)(10070)(70)]x x x =-+-++-+-++-LL 化简整理得.502=S三、解答题17.解:由于总体中个体数目比较大,而且个体之间没有明显的差异,故可采用系统抽样法,同时总体容量不能被个体容量整除,需先剔除4个灯泡,使得总体容量能被样本容量整除,然后再利用系统抽样的方法运行,过程如下:(1)将每个灯泡编号,分别为0001至1004; (2)利用随机数法找到4个号码,将这4个灯泡剔除:(3)将剩余的1000个灯泡重新编号0001至1000; (4)取间隔100010010k ==,将总体均分为10组,每组含100个灯泡;(5)从第一组即0001~0100号中随机抽取一个号a ;(6)将编号为a ,100+a ,200+a ,…900+a 的10个灯泡选出,组成样本.18.解:(1)两学生成绩绩的茎叶图如图1-7所示:图1-7(2)由表中数据可得x=2017128312,5++++=2716334220,5y++++==2.5b=,(12,20)满足abxy+=;∴20=-2.5×12+a,∴50a=;∴y关于x的线性回归方程为 2.550y x=-+.(3)由(2)可知,当月平均气温为6C︒时,该商场电暖器的销售量约为2.565035-⨯+=个.21.解:(1)①为16,②为0.018,③为22,④为0.22;(2)频率分布直方图如下图1-8所示:(3)(0.20+0.10+0.08)×800=304,即在参加的800名学生中,大概有304名学生获奖.22.解:该数据的平均数为284x+,中位数是其中两个数的平均数,因为x不知是多少,所以要分几图1-8种情况讨论.(1)当8x ≤时,原数据可排为x ,8,10,10,其中位数为81092+=,由284x+=9,解得8x =,此时平均数为9,方差为:21(1111)14S =+++=;(2)当810x <≤时,原数据可排为8, x ,10,10,其中位数为102x +,由284x +=102x +,解得8x =,但8不在810x <≤范围内,故舍去;(3)当10x >时,原数据可排为8,10,10,x 其中位数为1010102+=,由284x+=10,解得12x =,此时平均数为10,方差为:21(0044)24S =+++=;综上所述,当8x =时,平均数为9,方差为:21S =;当12x =时,平均数为10,方差为: 22S =;备选题1.(原创)下列叙述中:①变量间关系有函数关系,还有相关关系;②线性回归直线方程最能代表观测值x ,y 之间的关系;③任何一组观测值都能得到具有代表意义的回归直线方程;④线性回归方程y bx a =+,其中1122222212n n nx y x y x y nx y b x x x nx+++-=+++- ,a y bx =-.其中正确的有( )A. ①②③B. ①②④C. ①②③④D. ③④1.B 解:根据线性回归方程的特点知①②④正确,③错误.2.把容量为100的某个样本数据分成10组,并填写频率分布表,若前7组频率之和为0.79,则剩下3组的频率之和为 . 2.0.21解析:由频率分布表知,各组频率的和应等于1,所以剩下3组的频率之和为1-0.79=0.21.。