精品新版高中数学北师大版必修3习题:第一章统计1-8
- 格式:docx
- 大小:45.28 KB
- 文档页数:5
学业分层测评(建议用时:45分钟)[学业达标]一、选择题1.下列说法正确的是( )A .在两组数据中,平均值较大的一组方差较大B .平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C .方差的求法是求出各个数据与平均值的差的平方后再求和D .在记录两个人射击环数的两组数据中,方差大的表示射击水平高 【解析】 平均值的大小与方差的大小无任何联系,故A 错,由方差的公式s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]知C 错.对于D ,方差大的表示其射击环数比较分散,而非射击水平高,故D 错.【答案】 B2.一个样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x 为 ( )A .21B .22C .20D .23【解析】 由中位数的概念知x +232=22,所以x =21. 【答案】 A3.(2016·长沙四校联考)为了了解某同学的数学学习情况,对他的6次数学测试成绩(满分100分)进行统计,作出的茎叶图如图1-4-3所示,则下列关于该同学数学成绩的说法正确的是( )图1-4-3A .中位数为83B .众数为85C .平均数为85D .方差为19【解析】易知该同学的6次数学测试成绩的中位数为84,众数为83,平均数为85.【答案】 C4.为了了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高为1.60 m;从南方抽取了200个男孩,平均身高为1.50 m.由此可推断我国13岁男孩的平均身高为()A.1.54 m B.1.55 mC.1.56 m D.1.57 m【解析】x=300×1.60+200×1.50300+200=1.56(m).【答案】 C5.为了普及环保知识,增强环境意识,某大学随机抽取30名学生参加环保知识测试,得分(10分制)如图1-4-4所示,假设得分值的中位数为m e,众数为m0,平均值为x,则()图1-4-4A.m e=m0=xB.m e=m0<xC.m e<m0<xD.m0<m e<x【解析】由图知30名学生的得分情况依次为2个人得3分,3个人得4分、10个人得5分、6个人得6分、3个人得7分,2个人得8分、2个人得9分、2个人得10分,中位数为第15、16个数的平均数,即m e=5+62=5.5,5出现次数最多,故m0=5.x=130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97.于是m 0<m e <x . 【答案】 D 二、填空题6.某年级举行校园歌曲演唱比赛,七位评委为学生甲打出的演唱分数的茎叶图如右图1-4-5所示,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为________.图1-4-5【解析】 由茎叶图可知,学生甲的演唱分数分别为79,83,84,86,84,88,93,去掉一个最高分和一个最低分后,得分如下:83,84,84,86,88,则平均数为85,方差为s 2=15×[(-2)2+(-1)2+(-1)2+12+32]=3.2.【答案】 85,3.27.一组数据的方差为s 2,将这一组数据中的每个数都乘2,所得到的一组新数据的方差为________.【解析】 每个数都乘以2,则x =2x , S =1n [(2x 1-2x )2+…+(2x n -2x )2] =4n [(x 1-x )2+…+(x n -x )2]=4s 2. 【答案】 4s 28.由正整数组成的一组数据x 1,x 2,x 3,x 4其平均数和中位数都是2,且标准差等于1,则这组数据为________(从小到大排列).【解析】 不妨设x 1≤x 2≤x 3≤x 4且x 1,x 2,x 3,x 4为正整数. 由条件知⎩⎪⎨⎪⎧x 1+x 2+x 3+x 44=2,x 2+x 32=2,即⎩⎨⎧x 1+x 2+x 3+x 4=8,x 2+x 3=4,又x1、x2、x3、x4为正整数,∴x1=x2=x3=x4=2或x1=1,x2=x3=2,x4=3或x1=x2=1,x3=x4=3. ∵s=1 4[](x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2=1,∴x1=x2=1,x3=x4=3.由此可得4个数分别为1,1,3,3.【答案】1,1,3,3三、解答题9.为了了解市民的环保意识,某校高一(1)班50名学生在6月5日(世界环境日)这一天调查了各自家庭丢弃旧塑料袋的情况,有关数据如下表:(1)求这50(2)求这50户居民每天丢弃旧塑料袋的标准差.【解】(1)平均数x=150×(2×6+3×16+4×15+5×13)=18550=3.7.众数是3,中位数是4.(2)这50户居民每天丢弃旧塑料袋的方差为s2=150×[6×(2-3.7)2+16×(3-3.7)2+15×(4-3.7)2+13×(5-3.7)2]=150×48.5=0.97.所以标准差s≈0.985.10.(2014·广东高考)某车间20名工人年龄数据如下表:(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图; (3)求这20名工人年龄的方差.【解】 (1)这20名工人年龄的众数为:30;这20名工人年龄的极差为:40-19=21.(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下:(3)这20名工人年龄的平均数为:(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;所以这20名工人年龄的方差为:120(30-19)2+320(30-28)2+320(30-29)2+520(30-30)2+420(30-31)2+320(30-32)2+120(30-40)2=12.6.[能力提升]1.(2015·山东高考)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图1-4-5所示的茎叶图.考虑以下结论:图1-4-5①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的平均气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的平均气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的序号为()A.①③B.①④C.②③D.②④【解析】甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B.【答案】 B2.对“小康县”的经济评价标准:①年人均收入不小于7 000元;②年人均食品支出不大于收入的35%.某县有40万人口,年人均收入如下表所示,年人均食品支出如图1-4-6所示.则该县()图1-4-6A.是小康县B.达到标准①,未达到标准②,不是小康县C.达到标准②,未达到标准①,不是小康县D.两个标准都未达到,不是小康县【解析】 由图表可知年人均收入为(2 000×3+4 000×5+6 000×5+8 000×6+10 000×7+12 000×5+16 000×3)÷40=7 050(元)>7 000元,达到了标准①;年人均食品支出为(1 400×3+2 000×5+2 400×13+3 000×10+3 600×9)÷40=2 695(元),则年人均食品支出占收入的2 6957 050×100%≈38.2%>35%,未达到标准②.所以不是小康县.【答案】 B3.已知样本9,10,11,x ,y 的平均数为10,方差为4,则xy =________. 【解析】 由题意得⎩⎪⎨⎪⎧9+10+11+x +y5=10,15[(9-10)2+(10-10)2+(11-10)2+(x -10)2+(y -10)2]=4.化简得x +y =20, ① (x -10)2+(y -10)2=18, ② 由①得x 2+y 2+2xy =400, ③ 代入②化简得xy =91. 【答案】 914.某校甲班、乙班各有49名学生,两班在一次数学测验中的成绩(满分100分)统计如下表:(1)甲班的小刚回家对妈妈说:“昨天的数学测验,全班平均79分,得70分的人最多,我得了85分,在班里算是上游了!”(2)请你根据表中数据,对这两个班的测验情况进行简要分析,并提出教学建议.【解】 (1)由中位数可知,85分排在第25名之后,从名次上讲,85分不算是上游.但也不能单以名次来判断学习成绩的好坏,小刚得了85分,说明他对本阶段的学习内容掌握较好.(2)甲班学生成绩的中位数为87分,说明高于或等于87分的学生占一半以上,而平均分为79分,标准差很大,说明低分也多,两极分化严重,建议对学习有困难的同学多给一些帮助;乙班学生成绩的中位数和平均分均为79分,标准差小,说明学生成绩之间差别较小,成绩很差的学生少,但成绩优异的学生也很少,建议采取措施提高优秀率.。
一、选择题1.某班统计一次数学测验的平均分与方差,计算完毕才发现有位同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( )A .1x x =,221s s = B .1x x =,221s s < C .1x x =,221s s >D .1x x <,221s s =2.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,83.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18554.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差5.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( )A .26B .27C .28D .296. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日7.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是( )A .2018年3月的销售任务是400台B .2018年月销售任务的平均值不超过600台C .2018年第一季度总销售量为830台D .2018年月销售量最大的是6月份 8.①45化为二进制数为(2)101101;②一个总体含有1000个个体(编号为0000,0001,…,0999),采用系统抽样从中抽取一个容量为50的样本,若第一个抽取的编号为0008,则第六个编号为0128; ③已知a ,b ,c 为ABC ∆三个内角A ,B ,C 的对边,其中3a =,4c =,6A π=,则这样的三角形有两个解.以上说法正确的个数是( ) A .0B .1C .2D .39.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是( )A.消耗1升汽油,乙车最多可行驶5千米B.以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多C.甲车以80千米/小时的速度行驶1小时,消耗10升汽油D.某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油10.已知x,y的取值如表:x 2678y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是A.B.C.D.11.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为A.12 B.14 C.16 D.1812.从存放号码分别为1,2, ,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是()A.0.53 B.0.5 C.0.47 D.0.37二、填空题13.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____14.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..15.已知数据(1,2,3,4,5)i x i =的平均值为a ,数列2{()}i x a -为等差数列,且3||0.1x a -=________.16.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.17.某公司的广告费支出x 与销售额y (单位:万元)之间有下列对应数据:由资料显示y 对x 呈线性相关关系。
第一章 算法初步 1.1算法与程序框图练习(P5) 1、算法步骤:第一步,给定一个正实数r .第二步,计算以r 为半径的圆的面积2S r π=.第三步,得到圆的面积S .2、算法步骤:第一步,给定一个大于1的正整数n .第二步,令1i =.第三步,用i 除n ,等到余数r .第四步,判断“0r =”是否成立. 若是,则i 是n 的因数;否则,i 不是n 的因数. 第五步,使i 的值增加1,仍用i 表示.第六步,判断“i n >”是否成立. 若是,则结束算法;否则,返回第三步.练习(P19)算法步骤:第一步,给定精确度d ,令1i =.第二步,取出2的到小数点后第i 位的不足近似值,赋给a ;取出2的到小数点后第i 位的过剩近似值,赋给b . 第三步,计算55b am =-. 第四步,若m d <,则得到25的近似值为5a;否则,将i 的值增加1,仍用i 表示.返回第二步. 第五步,输出5a.程序框图:习题1.1 A 组(P20)1、下面是关于城市居民生活用水收费的问题.为了加强居民的节水意识,某市制订了以下生活用水收费标准:每户每月用水未超过7 m 3时,每立方米收费1.0元,并加收0.2元的城市污水处理费;超过7m 3的部分,每立方收费1.5元,并加收0.4元的城市污水处理费.设某户每月用水量为x m 3,应交纳水费y 元,那么y 与x 之间的函数关系为 1.2,071.9 4.9,7x x y x x ≤≤⎧=⎨->⎩我们设计一个算法来求上述分段函数的值.算法步骤:第一步:输入用户每月用水量x .第二步:判断输入的x 是否不超过7. 若是,则计算 1.2y x =;若不是,则计算 1.9 4.9y x =-.第三步:输出用户应交纳的水费y .程序框图:2、算法步骤:第一步,令i =1,S=0.第二步:若i ≤100成立,则执行第三步;否则输出S. 第三步:计算S=S+i 2.第四步:i = i +1,返回第二步.程序框图:3、算法步骤:第一步,输入人数x ,设收取的卫生费为m 元.第二步:判断x 与3的大小. 若x >3,则费用为5(3) 1.2m x =+-⨯;若x ≤3,则费用为5m =.第三步:输出m .程序框图:B 组 1、算法步骤:第一步,输入111222,,,,,a b c a b c ..第二步:计算21121221b c b c x a b a b -=-.第三步:计算12211221a c a c y ab a b -=-.第四步:输出,x y .程序框图:INPUT “a ,b=”;a ,bsum=a+b diff=a -b pro=a*b quo=a/bPRINT sum ,diff ,pro ,quoEND2、算法步骤:第一步,令n =1第二步:输入一个成绩r ,判断r 与6.8的大小. 若r ≥6.8,则执行下一步;若r<6.8,则输出r ,并执行下一步.第三步:使n 的值增加1,仍用n 表示.第四步:判断n 与成绩个数9的大小. 若n ≤9,则返回第二步;若n >9,则结束算法.程序框图:说明:本题在循环结构的循环体中包含了一个条件结构.1.2基本算法语句 练习(P24) 1、程序:2、程序:3、程序:练习(P29) 1、程序:INPUT “a ,b ,c=”;a ,b ,cIF a+b>c AND a+c>b AND b+c>a THEN PRINT “Yes.” ELSEPRINT “No.” END IF ENDINPUT “a ,b ,c=”;a ,b ,cp=(a+b+c)/2 s=SQR(p*(p -a) *(p -b) *(p -c)) PRINT “s=”;s END INPUT “F=”;F C=(F -32)*5/9 PRINT “C=”;C END4、程序: INPUT “a ,b ,c=”;a ,b ,csum=10.4*a+15.6*b+25.2*c PRINT “sum =”;sum END2、本程序的运行过程为:输入整数x . 若x 是满足9<x <100的两位整数,则先取出x 的十位,记作a ,再取出x 的个位,记作b ,把a ,b 调换位置,分别作两位数的个位数与十位数,然后输出新的两位数. 如输入25,则输出52. 34练习(P32) 1 2习题1.2 A 组(P33)1、1(0)0(0)1(0)x x y x x x -+<⎧⎪==⎨⎪+>⎩23、程序:习题1.2 B 组(P33) 1、程序:23 41.3算法案例 练习(P45) 1、(1)45; (2)98; (3)24; (4)17. 2、2881.75.3、2200811111011000=() ,820083730=() 习题1.3 A 组(P48) 1、(1)57; (2)55. 2、21324.4、习题1.3 B 组(P48)1、算法步骤:第一步,令45n =,1i =,0a =,0b =,0c =.第二步,输入()a i .第三步,判断是否0()60a i ≤<. 若是,则1a a =+,并执行第六步. 第四步,判断是否60()80a i ≤<. 若是,则1b b =+,并执行第六步. 第五步,判断是否80()100a i ≤≤. 若是,则1c c =+,并执行第六步. 第六步,1i i =+. 判断是否45i ≤. 若是,则返回第二步.第七步,输出成绩分别在区间[0,60),[60,80),[80,100]的人数,,a b c .2、如“出入相补”——计算面积的方法,“垛积术”——高阶等差数列的求和方法,等等.1、(1)程序框图:程序:1、(2)程序框图:程序:2、见习题1.2 B组第1题解答.INPUT “x=”;x IF x<0 THENy=0ELSEIF x<1 THENy=1ELSEy=xEND IFEND IFPRINT “y=”;y ENDINPUT “x=”;x IF x<0 THENy=(x+2)^2 ELSEIF x=0 THENy=4ELSEy=(x-2)^2 END IFEND IFPRINT “y=”;y END34、程序框图:程序:INPUT “t=0”;t IF t<0 THENPRINT “Please input again.” ELSEIF t>0 AND t<=180 THEN y=0.2 ELSEIF (t -180) MOD 60=0 THEN y=0.2+0.1*(t-180)/60 ELSEy=0.2+0.1*((t-180)\60+1) END IF END IFPRINT “y=”;y END IF ENDINPUT “n=”;n i=1 S=0WHILE i<=n S=S+1/i i=i+1 WENDPRINT “S=”;S END5、 (1)向下的运动共经过约199.805 m (2)第10次着地后反弹约0.098 m (3)全程共经过约299.609 m 第二章 复习参考题B 组(P35)1、 2、3、算法步骤:第一步,输入一个正整数x 和它的位数n . 第二步,判断n 是不是偶数,如果n 是偶数,令2n m =;如果n 是奇数,令12n m -=. 第三步,令1i =第四步,判断x 的第i 位与第(1)n i +-位上的数字是否相等. 若是,则使i 的值增加1,仍用i 表示;否则,x 不是回文数,结束算法.i=100 sum=0 k=1 WHILE k<=10 sum=sum+i i=i /2 k=k+1 WEND PRINT “(1)”;sum PRINT “(2)”;i PRINT “(3)”;2*sum -100 ENDINPUT “n=”;n IF n MOD 7=0 THEN PRINT “Sunday ” END IF IF n MOD 7=1 THEN PRINT “Monday ” END IF IF n MOD 7=2 THEN PRINT “Tuesday ” END IF IF n MOD 7=3 THEN PRINT “Wednesday ” END IF IF n MOD 7=4 THEN PRINT “Thursday ” END IF IF n MOD 7=5 THEN PRINT “Friday ” END IF IF n MOD 7=6 THEN PRINT “Saturday ” END IF END第二章统计2.1随机抽样练习(P57)1、.况之间有误差. 如抽取的部分个体不能很好地代表总体,那么我们分析出的结果就会有偏差.2、(1)抽签法:对高一年级全体学生450人进行编号,将学生的名字和对应的编号分别写在卡片上,并把450张卡片放入一个容器中,搅拌均匀后,每次不放回地从中抽取一张卡片,连续抽取50次,就得到参加这项活动的50名学生的编号.(2)随机数表法:第一步,先将450名学生编号,可以编为000,001, (449)第二步,在随机数表中任选一个数. 例如选出第7行第5列的数1(为了便于说明,下面摘取了附表的第6~10行).16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 5457 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28第三步,从选定的数1开始向右读,得到一个三位数175,由于175<450,说明号码175在总体内,将它取出;继续向右读,得到331,由于331<450,说明号码331在总体内,将它取出;继续向右读,得到572,由于572>450,将它去掉. 按照这种方法继续向右读,依次下去,直到样本的50个号码全部取出,这样我们就得到了参加这项活动的50名学生.3、用抽签法抽取样本的例子:为检查某班同学的学习情况,可用抽签法取出容量为5的样本. 用随机数表法抽取样本的例子:部分学生的心理调查等.抽签法能够保证总体中任何个体都以相同的机会被选到样本之中,因此保证了样本的代表性.4、与抽签法相比,随机数表法抽取样本的主要优点是节省人力、物力、财力和时间,缺点是所产生的样本不是真正的简单样本.练习(P59)1、系统抽样的优点是:(1)简便易行;(2)当对总体结构有一定了解时,充分利用已有信息对总体中的个体进行排队后再抽样,可提高抽样调查;(3)当总体中的个体存在一种自然编号(如生产线上产品的质量控制)时,便于施行系统抽样法.系统抽样的缺点是:在不了解样本总体的情况下,所抽出的样本可能有一定的偏差.2、(1)对这118名教师进行编号;(2)计算间隔1187.37516k==,由于k不是一个整数,我们从总体中随机剔除6个样本,再来进行系统抽样. 例如我们随机剔除了3,46,59,57,112,93这6名教师,然后再对剩余的112位教师进行编号,计算间隔7k=;(3)在1~7之间随机选取一个数字,例如选5,将5加上间隔7得到第2个个体编号12,再加7得到第3个个体编号19,依次进行下去,直到获取整个样本.3、由于身份证(18位)的倒数第二位表示性别,后三位是632的观众全部都是男性,所以这样获得的调查结果不能代表女性观众的意见,因此缺乏代表性.练习(P62)1、略2、这种说法有道理,因为一个好的抽样方法应该能够保证随着样本容量的增加,抽样调查结果会接近于普查的结果. 因此只要根据误差的要求取相应容量的样本进行调查,就可以节省人力、物力和财力.3、可以用分层抽样的方法进行抽样. 将麦田按照气候、土质、田间管理水平的不同而分成不同的层,然后按照各层麦田的面积比例及样本容量确定各层抽取的面积,再在各层中抽取个体(这里的个体是单位面积的一块地).习题2.1 A组(P63)1、产生随机样本的困难:(1)很难确定总体中所有个体的数目,例如调查对象是生产线上生产的产品.(2)成本高,要产生真正的简单随机样本,需要利用类似于抽签法中的抽签试验来产生非负整值随机数.(3)耗时多,产生非负整数值随机数和从总体中挑选出随机数所对的个体都需要时间.2、调查的总体是所有可能看电视的人群.学生A的设计方案考虑的人数是:上网而且登录某网址的人群,那些不能上网的人群,或者不登录某网址的人群就被排除在外了. 因此A方案抽取的样本的代表性差.学生B的设计方案考虑的人群是小区内的居民,有一定的片面性. 因此B方案抽取的样本的代表性差.学生C的设计方案考虑的人群是那些有电话的人群,也有一定的片面性. 因此C方案抽取的样本的代表性.所以,这三种调查方案都有一定的片面性,不能得到比较准确的收视率.3、(1)因为各个年级学习任务和学生年龄等因素的不同,影响各年级学生对学生活动的看法,所以按年级分层进行抽样调查,可以得到更有代表性的样本.(2)在抽样的过程中可能遇到的问题如敏感性问题:有些学生担心提出意见对自己不利;又如不响应问题:由于种种原因,有些学生不能发表意见;等等.(3)前面列举的两个问题都可能导致样本的统计推断结果的误差.(4)为解决敏感性问题,可以采用阅读与思考栏目“如何得到敏感性问题的诚实反应”中的方法设计调查问卷;为解决不响应问题,可以事先向全体学生宣传调查的意义,并安排专人负责发放和催收调查问卷,最大程度地回收有效调查问卷.4、将每一天看作一个个体,则总体由365天组成. 假设要抽取50个样本,将一年中的各天按先后次序编号为0~364天用简单随机抽样设计方案:制作365个号签,依次标上0~364. 将号签放到容器内充分搅拌均匀,从容器中任意不放回取出50个号签. 以签上的号码所对应的那些天构成样本,检测样本中所有个体的空气质量.用系统抽样设计抽样方案:先通过简单随机抽样方法从365天中随机抽出15天,再把剩下的350天重新按先后次序编号为0~349. 制作7个分别标有0~7的号签,放在容器中充分搅拌均匀. 从容器中任意取出一个号签,设取出的号签的编号为a,则编号为7(050)+≤<所对应的那些天构成样本,检测样本中所有个体的空气质量.a k k显然,系统抽样方案抽出的样本中个体在一年中排列的次序更规律,因此更好实施,更受方案的实施者欢迎.5、田径队运动员的总人数是564298+=(人),要得到28人的样本,占总体的比例为27.于是,应该在男运动员中随机抽取256167⨯=(人),在女运动员中随机抽取281612-=(人).这样我们就可以得到一个容量为28的样本.6、以10为分段间隔,首先在1~10的编号中,随机地选取一个编号,如6,那么这个获奖者奖品的编号是:6,16,26,36,46.7、说明:可以按年级分层抽样的方法设计方案. 习题2.1 B 组(P64)1、说明:可以按年级分层抽样的方法设计方案,调查问卷由学生所关心的问题组成. 例如:(1)你最喜欢哪一门课程? (2)你每月的零花钱平均是多少? (3)你最喜欢看《新闻联播》吗? (4)你每天早上几点起床? (5)你每天晚上几点睡觉?要根据统计的结果和具体的情况解释结论,主要从引起结论的可能原因及结论本身含义来解释.2、说明:这是一个开放性的题目,没有一个标准的答案. 2.2用样本估计总体 练习(P71) 1、说明:由于样本的极差为364.41362.51 1.90-=,取组距为0.19,将样本分为10组. 可以按照书上的方法制作频率分布表、频率分布直观图和频率折线图. 2、说明:此题目属于应用题,没有标准的答案.3、茎叶图为:由该图可以看出30名工人的日加工零件个数稳定在120件左右. 练习(P74)这里应该采用平均数来表示每一个国家项目的平均金额,因为它能反应所有项目的信息. 但平均数会受到极端数据2000万元的影响,所以大多数项目投资金额都和平均数相差比较大.练习(P79)1、甲乙两种水稻6年平均产量的平均数都是900,但甲的标准差约等于23.8,乙的标准差约等于41.6,所以甲的产量比较稳定.2、(1)平均重量496.86x ≈,标准差 6.55s ≈.(2)重量位于(,)x s x s -+之间有14袋白糖,所占的百分比约为66.67%.3、(1)略. (2)平均分19.25x ≈,中位数为15.2,标准差12.50s ≈.这些数据表明这些国家男性患该病的平均死亡率约为19.25,有一半国家的死亡率不超过15.2,15.2x >说明存在大的异常数据,值得关注. 这些异常数据使标准差增大. 习题2.2 A 组(P81) 1、(1)茎叶图为:(2)汞含量分布偏向于大于1.00 ppm 的方向,即多数鱼的汞含量分布在大于1.00 ppm 的区域.(3)不一定. 因为我们不知道各批鱼的汞含量分布是否都和这批鱼相同. 即使各批鱼的汞含量分布相同,上面的数据只能为这个分布作出估计,不能保证平均汞含量大于1.00 ppm. (4)样本平均数 1.08x ≈,样本标准差0.45s ≈.(5)有28条鱼的汞含量在平均数与2倍标准差的和(差)的范围内.2比较短,所以在这批棉花中混进了一些次品.3、说明:应该查阅一下这所大学的其他招生信息,例如平均数信息、最低录取分数线信息等. 尽管该校友的分数位于中位数之下,而中位数本身并不能提供更多录取分数分布的信息.在已知最低录取分数线的情况下,很容易做出判断;在已知平均数小于中位数很多,则说明最低录取分数线较低,可以推荐该校友报考这所大学,否则还要获取其他的信息(如标准差的信息)来做出判断. 4、说明:(1)对,从平均数的角度考虑; (2)对,从标准差的角度考虑;(3)对,从标准差的角度考虑; (4)对,从平均数和标准差的角度考虑; 5、(1)不能. 因为平均收入和最高收入相差太多,说明高收入的职工只占极少数. 现在已知知道至少有一个人的收入为50100x =万元,那么其他员工的收入之和为4913.55010075ii x==⨯-=∑(万元)每人平均只有1.53. 如果再有几个收入特别高者,那么初进公司的员工的收入将会很低. (2)不能,要看中位数是多少.(3)能,可以确定有75%的员工工资在1万元以上,其中25%的员工工资在3万元以上.(4)收入的中位数大约是2万. 因为有年收入100万这个极端值的影响,使得年平均收入比中位数高许多.6、甲机床的平均数=1.5x 甲,标准差=1.2845s 甲;乙机床的平均数 1.2z y =,标准差0.8718z s =. 比较发现乙机床的平均数小而且标准差也比较小,说明乙机床生产出的次品比甲机床少,而且更为稳定,所以乙机床的性能较好. 7、(1)总体平均数为199.75,总体标准差为95.26. (2)可以使用抓阄法进行抽样. 样本平均数和标准差的计算结果和抽取到的样本有关. (3) (4)略 习题2.2 B 组(P82)1、(1)由于测试1T 的标准差小,所以测试1T 结果更稳定,所以该测试做得更好一些. (2)由于2T 测出的值偏高,有利于增强队员的信心,所以应该选择测试2T .2、说明:此题需要在本节开始的时候就布置,先让学生分头收集数据,汇总所收集的数据才能完成题目.2.3变量间的相关关系 练习(P85)1、从已经掌握的知识来看,吸烟会损害身体的健康. 但除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果. 我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题. 但吸烟引起健康问题的可能性大,因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.2、从现在我们掌握的知识来看,没有发现根据说明“天鹅能够带来孩子”,完全可能存在既能吸引天鹅和又使婴儿出生率高的第3个因素(例如独特的环境因素),即天鹅与婴儿出生率之间没有直接的关系,因此“天鹅能够带来孩子”的结论不可靠.而要证实此结论是否可靠,可以通过试验来进行. 相同的环境下将居民随机地分为两组,一组居民和天鹅一起生活(比如家中都饲养天鹅),而另一组居民的附近不让天鹅活动,对比两组居民的出生率是否相同. 练习(P92)1、当0x =时,147.767y =,这个值与实际卖出的热饮杯数150不符,原因是:线性回归方程中的截距和斜率都是通过样本估计的,存在随机误差,这种误差可以导致预测结果的偏差;即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x ,预报值y 能够等于实际值y . 事实上:y bx a e =++. (这里e 是随机变量,是引起预报值y 与真实值y 之间的误差的原因之一,其大小取决于e 的方差.)(1)散点图如下: 2、数据的散点图为:从这个散点图中可以看出,鸟的种类数与海拔高度应该为正相关(事实上相关系数为0.793). 但是从散点图的分布特点来看,它们之间的线性相关性不强. 习题2.3 A 组(P94)1、教师的水平与学生的学习成绩呈正相关关系. 又如,“水涨船高”“登高望远”等.2、(3)基本成正相关关系,即食品所含热量越高,口味越好.(4)因为当回归直线上方的食品与下方的食品所含热量相同时,其口味更好. 3、(1)散点图如下:(2)回归方程为:0.66954.933y x =+.(3)加工零件的个数与所花费的时间呈正线性相关关系.(2)回归直线如下图所示:4、(1)散点图为:(2)回归方程为:0.546876.425y x =+.(3)由回归方程知,城镇居民的消费水平和工资收入之间呈正线性相关关系,即工资收入水平越高,城镇居民的消费水平越高. 习题2.3 B 组(P95) 1、(1)散点图如下:(2)回归方程为: 1.44715.843y x =-.(3)如果这座城市居民的年收入达到40亿元,估计这种商品的销售额为42.037y ≈(万元). 2、说明:本题是一个讨论题,按照教科书中的方法逐步展开即可.第二章 复习参考题A 组(P100)1、A .2、(1)该组的数据个数,该组的频数除以全体数据总数; (2)nmN. 3、(1)这个结果只能说明A 城市中光顾这家服务连锁店的人比其他人较少倾向于选择咖啡色,因为光顾连锁店的人使一种方便样本,不能代表A 城市其他人群的想法. (2)这两种调查的差异是由样本的代表性所引起的. 因为A 城市的调查结果来自于该市光顾这家服装连锁店的人群,这个样本不能很好地代表全国民众的观点.4、说明:这是一个敏感性问题,可以模仿阅读与思考栏目“如何得到敏感性问题的诚实反应”来设计提问方法.5、表略. 可以估计出句子中所含单词的分布,以及与该分布有关的数字特征,如平均数、标准差等.6、(1)可以用样本标准差来度量每一组成员的相似性,样本标准差越小,相似程度越高. (2)A 组的样本标准差为 3.730A S ≈,B 组的样本标准差为11.789B S ≈. 由于专业裁判给分更符合专业规则,相似程度应该高,因此A 组更像是由专业人士组成的.7、(1)中位数为182.5,平均数为217.1875.(2)这两种数字特征不同的主要原因是,430比其他的数据大得多,应该查找430是否由某种错误而产生的. 如果这个大数据的采集正确,用平均数更合适,因为它利用了所有数据的信息;如果这个大数据的采集不正确,用中位数更合适,因为它不受极端值的影响,稳定性好. 8、(1)略.(2)系数0.42是回归直线的斜率,意味着:对于农村考生,每年的入学率平均增长0.42%.(3)城市的大学入学率年增长最快. 说明:(4)可以模仿(1)(2)(3)的方法分析数据.第二章 复习参考题B 组(P101)1、频率分布如下表:从表中看出当把指标定为17.46千元 时,月65%的推销员 经过努力才能完成销 售指标.2、(1)数据的散点图如下:(2)用y 表示身高,x 表示年龄,则数据的回归方程为 6.31771.984y x =+. (3)在该例中,斜率6.317表示孩子在一年中增加的高度.(4)每年身高的增长数略. 3~16岁的身高年均增长约为6.323 cm. (5)斜率与每年平均增长的身高之间之间近似相等.第三章 概率3.1随机事件的概率 练习(P113) 1、(1)试验可能出现的结果有3个,两个均为正面、一个正面一个反面、两个均为反面. (2)通过与其他同学的结果汇总,可以发现出现一个正面一个反面的次数最多,大约在50次左右,两个均为正面的次数和两个均为反面的次数在25次左右. 由此可以估计出现一个正面一个反面的概率为0.50,出现两个均为正面的概率和两个均为反面的概率均为0.25. 2、略 3、(1)例如:北京四月飞雪;某人花两元钱买福利彩票,中了特等奖;同时抛10枚硬币,10枚都正面朝上.(2)例如:在王府井大街问路时,碰到会说中文的人;去烤鸭店吃饭的顾客点烤鸭;在1~1000的自然数任选一个数,选到的数大于1. 练习(P118)1、说明:例如,计算机键盘上各键盘的安排,公交线路及其各站点的安排,抽奖活动中各奖项的安排等,其中都用到了概率. 学生可能举出各种各样的例子,关键是引导他们正确分析例子中蕴涵的概率思想.2、通过掷硬币或抽签的方法,决定谁先发球,这两种方法都是公平的. 而猜拳的方法不太公平,因为出拳有时间差,个人反应也不一样.3、这种说法是错误的. 因为掷骰子一次得到2是一个随机事件,在一次试验中它可能发生也可能不发生. 掷6次骰子就是做6次试验,每次试验的结果都是随机的,可能出现2也可能不出现2,所以6次试验中有可能一次2都不出现,也可能出现1次,2次,…,6次. 练习(P121)1、0.72、0.6153、0.44、D5、B 习题3.1 A 组(P123) 1、D . 2、(1)0; (2)0.2; (3)1.3、(1)430.067645≈; (2)900.140645≈; (3)7010.891645-≈. 4、略 5、0.13 6、说明:本题是想通过试验的方法,得到这种摸球游戏对先摸者和后摸者是公平的结论. 最好把全班同学的结果汇总,根据两个事件出现的频率比较近,猜测在第一种情况下摸到红球的概率为110,在第二种下也为110. 第4次摸到红球的频率与第1次摸到红球的频率应该相差不远,因为不论哪种情况,第4次和第1次摸到红球的概率都是1 10.习题3.1 B组(P124)1、D.2、略. 说明:本题是为了学生根据实际数据作出一些推断. 一般我们假定每个人的生日在12个月中哪一个月是等可能的,这个假定是否成立,引导学生通过收集的数据作出初步的推断.3.2古典概率练习(P130)1、110. 2、17. 3、16.练习(P133)1、38,38.2、(1)113;(2)1213;(3)14;(4)313;(5)0;(6)213;(7)12;(8)1.说明:模拟的方法有两种.(1)把1~52个自然数分别与每张牌对应,再用计算机做模拟试验.(2)让计算机分两次产生两个随机数,第一次产生1~4的随机数,代表4个花色;第二次产生1~13的随机数,代表牌号.3、(1)不可能事件,概率为0;(2)随机事件,概率为49;(3)必然事件,概率为1;(4)让计算机产生1~9的随机数,1~4代表白球,5~9代表黑球.4、(1)16;(2)略;(3)应该相差不大,但会有差异. 存在差异的主要原因是随机事件在每次试验中是否发生是随机的,但在200次试验中,该事件发生的次数又是有规律的,所以一般情况下所得的频率与概率相差不大.习题3.2 A组(P133)1、游戏1:取红球与取白球的概率都为12,因此规则是公平的.游戏2:取两球同色的概率为13,异色的概率为23,因此规则是不公平的.游戏3:取两球同色的概率为12,异色的概率为12,因此规则是公平的.2、第一位可以是1~9这9个数字中的一个,第二位可以是0~9这10个数字中的一个,所以(1)190;(2)18919090-=;(3)9919010-=3、(1)0.52;(2)0.18.4、(1)12;(2)16;(3)56;(4)16.5、(1)25;(2)825.6、(1)920;(2)920;(3)12.习题3.2 B组(P134)1、(1)13;(2)14.2、(1)35;(2)310;(3)910.说明:(3)先计算该事件的对立事件发生的概率会比较简单.3、具体步骤如下:①建立概率模型. 首先要模拟每个人的出生月份,可用1,2,…,11,12表示月份,用产生取整数值的随机数的办法,随机产生1~12之间的随机数. 由于模拟的对象是一个有10个人的集体,故把连续产生的10个随机数作为一组模拟结果,可模拟产生100组这样的结果.②进行模拟试验. 可用计算器或计算机进行模拟试验.如使用Excel软件,可参看教科书125页的步骤,下图是模拟的结果:其中,A,B,C,D,E,F,G,H,I,J的每一行表示对一个10人集体的模拟结果. 这样的试验一共做了100次,所以共有100行,表示随机抽取了100个集体.③统计试验的结果. K,L,M,N列表示统计结果. 例如,第一行前十列中至少有两个数相同,表示这个集体中至少有两个人的生日在同一月. 本题的难点是统计每一行前十列中至少有两个数相同的个数. 由于需要判断的条件态度,所以用K,L,M三列分三次完成统计.其中K列的公式为“=IF(OR(A1=B1,A1=C1,A1=D1,A1=E1,A1=F1,A1=G1,A1=H1,A1=I1,A1=J1,B1=C1,B1=D1,B1=E1,B1=F1,B1=G1,B1=H1,B1=I1,B1=J1,C1=D1,C1=E1,C1=F1,C1=G1,C1=H1,C1=I1,C1=J1,D1=E1,D1=F1,D1=G1,D1=H1,D1=I1,D1=J1),1,0)”,L列的公式为“=IF(OR(E1=F1,E1=G1,E1=H1,E1=I1,E1=J1,F1=G1,F1=H1,F1=I1,F1=J1,G1=H1,G1=I1,G1=J1,H1=I1,H1=J1,I1=J1),1,0)”,M列的公式为“=IF(OR(K1=1,L1=1),1,0)”,M列的值为1表示该行所代表的10人集体中至少有两个人的生日在同一个月. N1表示100个10人集体中至少有两个人的生日在同一个月的个数,其公式为“=SUM(M$1:M$100)”. N1除以100所得的结果0.98,就是用模拟方法计算10人集体中至少有两个人的生日在同一个月的概率的估计值. 可以看出,这个估计值很接近1.3.3几何概率。
第2课时系统抽样课时过关·能力提升1.从N个编号中抽取n个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为()AC答案:C2.有40件产品,编号为1~40,现在从中抽取4件检验,用系统抽样的方法确定所抽取的编号可能为()A.5,10,15,20B.2,12,22,32C.2,14,26,38D.5,8,31,36解析:由系统抽样的定义知抽样距为可以在第一组1~10号样本中取k号,1≤k≤10,则抽取到的样本编号为k,k+10,k+20,k+30.答案:B3.从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为()A.480B.481C.482D.483解析:由样本中编号最小的两个编号分别为007,032,得抽样距为32-7=25,则样本容量为每组中应抽取的号码数x=7+25(n-1)(1≤n≤20,n∈Z),当n=20时,x取得最大值为x=7+25×19=482.答案:C4.总体容量为524,采用系统抽样法抽样,若想不剔除个体,则抽样间隔可以为()A.3B.4C.5D.6解析:因为系统抽样的间隔需要能整除总体个数.故选B.答案:B5.某初级中学有学生270人,其中七年级108人,八年级、九年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按七年级、八年级、九年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270.那么关于上述样本的下列结论,正确的是()A.②③都不能为系统抽样B.②④都不能为分层抽样C.①④都可能为系统抽样D.①③都可能为分层抽样解析:由定义可知,①③可能为分层抽样也可能为系统抽样;②可能为分层抽样;④可能为简单随机抽样.故选D.答案:D6.将高三(1)班参加体检的36名学生,编号为:1,2,3,…,36,若采用系统抽样的方法抽取一个容量为4的样本,已知样本中含有编号为6号、24号、33号的学生,则样本中剩余一名学生的编号是.答案:157.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,……,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是.若用分层抽样方法,则40岁以下年龄段应抽取人.解析:由题意可知,系统抽样时共分成40组,抽样间隔为5,第5组的号码为22,则第8组的号码为22+5×3=37.在分层抽样时,由于40岁以下年龄段人数占总数的50%,故40岁以下年龄段应抽取40×50%=20(人).答案:37208.一个总体中有100个个体,随机编号为0,1,2,…,99.依编号顺序平均分成10个小组,组号依次为1,2,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是.解析:由题设知,若m=6,则在第7组中抽取的号码个位数字与13的个位数字相同,而第7组中的编号依次为60,61,62,63,…,69.故在第7组中抽取的号码是63.答案:639.某学校有学生3 000人,现在要抽取100人组成夏令营,应该怎样抽取样本?分析:因为总体中个体数较多,且无差异,所以按系统抽样的步骤来进行抽样.解:按系统抽样抽取样本,其步骤如下.第一步:把这些学生分成100个组,因为所以每个组30名学生,这时,抽样距就是30.第二步:将3 000名学生随机编号为1,2, (3000)第三步:在第1组用简单随机抽样确定起始个体的编号l(0<l≤30).第四步:按照一定的规则抽取样本,通常是将起始编号l加上分段间隔30得到第2个个体编号l+30,再加上30得到第3个个体编号l+60,这样继续下去,直到获取整个样本.比如l=15,则抽取的编号为15,45,75,105,…,2985.这些号码对应的学生组成样本.10.为了考察某校的教学水平,将抽取这个学校本学年高三年级部分学生的考试成绩,为了全面地反映实际情况,采取以下三种方式进行抽样(已知该校高三年级共有20个教学班,并且每个班的学生都已经按随机方式编好了学号,假定该校每个班的学生人数都相同).①从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察他们的考试成绩;②每个班都抽取1人,共计20人,考察这20个学生的考试成绩;③把学生按成绩分成优秀、良好、普通三个级别,从其中抽取100名学生进行考察(已知若按成绩分,该校高三学生中优秀生共有150人,良好生共有600人,普通生共有250人).根据上面的叙述,试回答下列问题:(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式所抽取的样本中,其样本容量分别是多少?(2)上面三种抽取方式中各自采用何种方法抽取样本?(3)试分别写出上面三种抽取方式各自抽取样本的步骤.解:(1)在这三种抽取方式中,其总体都是该校本学年高三全体学生的考试成绩,个体都是本学年高三年级每个学生的考试成绩.其中第一种抽取方式中样本为所抽取的本学年20名学生的考试成绩,样本容量为20;第二种抽取方式中样本为所抽取的本学年20名学生的考试成绩,样本容量为20;第三种抽取方式中样本为所抽取的本学年100名学生的考试成绩,样本容量为100.(2)在上面三种抽取方式中,第一种方式采用的是简单随机抽样;第二种方式采用的是系统抽样和简单随机抽样;第三种方式采用的是分层抽样和简单随机抽样.(3)第一种方式抽取样本的步骤如下:首先在这20个班中用抽签法任意抽取一个班,然后从这个班中按学号用随机数法或抽签法抽取20个学生,考察其考试成绩.第二种方式抽取样本的步骤如下:首先在第一个班中,用简单随机抽样法任意抽取一个学生,记其学号为a.然后在其余的19个班中,选取学号为a的学生,共计20人.第三种方式抽取样本的步骤如下:首先分层.因为若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应该把全体学生分成三层.然后确定各层抽取的人数.因为样本容量与总体的个体数之比为100∶1 000=1∶10,所以在每层抽取的个体数依次为即15,60,25.最后按层分别抽取.在优秀生中用简单随机抽样抽取15人,在良好生中用简单随机抽样抽取60人,在普通生中用简单随机抽样抽取25人.。
2.2分层抽样与系统抽样第1课时分层抽样课时过关·能力提升1.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本,从上述各层中依次抽取的人数分别是()A.12,24,15,9B.9,12,12,7C.8,15,12,5D.8,16,10,6解析:抽样比,从各层依次抽取的人数分别为160答案:D2.某商场有四类食品,其中粮食类、植物油类、膨化食品类和果蔬类分别为40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类种数之和是()A.4B.5C.6D.7解析:分层抽样的抽样比10),果蔬类为20).故抽取的植物油类与果蔬类种数之和为2+4=6.答案:C3.某服装加工厂某月生产A,B,C三种产品共4 000件,为了保证产品质量,进行抽样检验,根据分层抽样的结果,企业统计员制作了如下的统计表:由于不小心,表格中A,C A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是()A.80件B.800件C.90件D.900件答案:B4.某校现有高一学生210人,高二学生270人,高三学生300人,用分层抽样的方法从这三个年级的学生中随机抽取n名学生进行问卷调查,如果已知从高一学生中抽取的人数为7,那么从高三学生中抽取的人数为()A.7B.8C.9D.10解析:由题意知高一学生210人,从高一学生中抽取的人数为7可以得出抽取比例300答案:D5. 某工厂生产A,B,C三种不同型号的产品,其数量之比依次是3∶4∶7,现在用分层抽样的方法抽出样本容量为n的样本,样本中A型号产品有15件,则n等于()A.50B.60C.70D.80答案:C6.某高校甲、乙、丙、丁四个专业分别有150,150,400,300名学生,为了解学生的就业倾向,用分层抽样的方法从该校这四个专业共抽取40名学生进行调查,应在丙专业抽取的学生人数为.解析:由分层抽样定义可知,应抽取丙专业的人数为40答案:167.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取名学生.解析:由分层抽样的方法可得,从一年级本科生中抽取学生人数为300答案:608.某报社做了一次关于“什么是新时代的雷锋精神”的调查,从A,B,C,D四个单位回收的问卷数分别为a1,a2,a3,a4,且满足a1+a3=2a2,共回收1 000份.因报道需要,再从回收的问卷中按单位分层抽取容量为150的样本.若在B单位抽取30份,则在D单位抽取的问卷是份.解析:由题意a2=200.又a1+a2+a3+a4=1 000,a1+a3=2a2,即3a2+a4=1 000,∴a4=400.设在D单位抽取的问卷数为n,n=60.答案:609.已知某校的初中生人数、高中生人数、教师人数之比为20∶15∶2,现用分层抽样的方法从所有师生中抽取一个容量为N的样本进行调查,若应从高中生中抽取60人,则N=.答案:14810.在某校500名学生中,O型血有200人,A型血有125人,B型血有125人,AB型血有50人,为了研究血型与色弱的关系,需从中抽取一个容量为20的样本.应怎样抽取样本?分析:由于研究血型与色弱的关系,故按血型分层,用分层抽样的方法抽取样本.利用抽样比确定抽取各种血型的人数.解:用分层抽样抽取样本.因所以200故O型血抽8人,A型血抽5人,B型血抽5人,AB型血抽2人.抽样步骤如下.第一步:确定抽样第二步:按比例分配各层所要抽取的个体数,O型血抽8人,A型血抽5人,B型血抽5人,AB型血抽 2人.第三步:用简单随机抽样分别在各种血型的人中抽取样本,直至取出容量为20的样本.。
§8最小二乘估计课时过关·能力提升1.某地区调查了2~9岁的儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为y=8.25x+60.13,下列叙述正确的是()A.该地区一个10岁儿童的身高为142.63 cmB.该地区2~9岁的儿童每年身高约增加8.25 cmC.该地区9岁儿童的平均身高是134.38 cmD.利用这个模型可以准确地预算该地区每个2~9岁儿童的身高解析:由y=8.25x+60.13知斜率的估计值为8.25,说明每增加一个单位年龄,约增加8.25个单位身高,故选B.答案:B2.对具有线性相关关系的变量x,y有一组预测数据(x i,y i)(i=1,2,…,8),其回归直线方程是y=13x+a,且x1+x2+⋯+x8=2(y1+y2+⋯+y8)=6,则实数a的值是()A.116B.18C.14D.12解析:由题意易知x=3,y=3,代入线性回归方程得a=1.答案:B3.y对xA.y=x-1B.y=x+1C.y=88+12x D.y=176解析:方法一:由线性回归方程过样本中心点(176,176),排除A,B项,结合选项可得C为正确答案.方法二:将表中的五组数值分别代入选项验证,可知y=88+12x最适合.答案:C4.下表是某厂1月到4用水量y与月份x,则a的值为()A.5.25B.5C.2.5D.3.5解析:x=2.5,y=3.5,代入回归方程,得3.5=-0.7×2.5+a,故a=5.25.答案:A5.对某台机器购置后的运行年限x(x=1,2,3,…)与当年利润y的统计分析知x,y具备线性相关关系,线性回归方程为y=10.47-1.3x,估计该台机器最为划算的使用年限为()A.7年B.8年C.9年D.越长越划算解析:当年利润小于或等于零时应该报废该机器,当y=0时,10.47-1.3x=0,解得x≈8.05.故估计该台机器最为划算的使用年限为8年.答案:B6.正常情况下,年龄在18岁到38岁的人,体重y(kg)对身高x(cm)的回归方程为y=0.72x-58.2,王能同学(20岁)身高178 cm,他的体重应该在kg左右.解析:用回归方程对身高为178 cm的人的体重进行预测,当x=178时,y=0.72×178-58.2=69.96.答案:69.967.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm.因为儿子的身高与父亲的身高有关,该老师用以上数据求出线性回归方程来预测他孙子的身高为cm.解析:设线性回归方程为y−b x=176−173=3.故线性回归直线方程为y=3+x,将x=182代入可预测他孙子的身高为185 cm.答案:1858.期中考试后,某班班主任对50名学生的成绩进行分析,得到数学成绩y与总成绩x之间具有线性相关关系,其线性回归方程为y=6+0.4x,由此可以估计:若两名同学的总成绩相差50分,则他们的数学成绩相差分.答案:209. 已知某工厂在某年每月产品的总成本y(单位:万元)与该月产量x(单位:万件)之间的回归方程为y=1.215x+0.974,计算当x=2时,总成本y的估计值为.解析:当x=2时,总成本y的估计值y=1.215×2+0.974=3.404.答案:3.40410.一个车间为了规定工时定额,需要确定加工零件所花费时间,为此进行了10次试验,测得的数据如下:如果(1)y关于x的线性回归方程;(2)x关于y的线性回归方程.b=55950-10×55×91.738500-10×552≈0.668,a=y−bx≈91.7-0.668×55=54.96,即所求线性回归方程为y=0.668x+54.96.(2)设所求线性回归方程为x=c+dy,d=55950-10×55×91.7 87777-10×91.72≈1.495.则c=x−dy≈55-1.495×91.7≈-82.09, 即所求线性回归方程为x=1.495y-82.09.。
一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆy bx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是( )A .成绩B .视力C .智商D .阅读量3.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,84.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为( )A .1167B .365C .36D .675.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .6.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是 A .81.2,4.4 B .40.6,1.1 C .48.8,4.4D .78.8,1.17.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x (cm )174176176176178儿子身高y (cm )175175176177177则y 对x 的线性回归方程为 A .y = x-1B .y = x+1C .y =88+12x D .y = 1768.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用x (万元) 2 3 4 5 销售额y (万元)25374454根据上表可得回归方程ˆˆˆy bx a =+中的ˆb为9.4,据此模型预报广告费用为6万元时销售额为( ) A .61.5万元 B .62.5万元C .63.5万元D .65.0万元9.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .9110.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表: 时间周一 周二 周三周四 周五 车流量x (万辆) 100 102 108 114 116 浓度y (微克)7880848890根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 11.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位12.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53B .0.5C .0.47D .0.37二、填空题13.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位: cm ),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有_______株树木的底部周长大于110cm .14.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.15.数列{}n a 是公差不为零的等差数列,其前n 项和为n S ,若记数据1a ,2a ,3a ,⋅⋅⋅,2019a 的标准差为1σ,数据11S ,22S ,33S ,⋅⋅⋅,20192019S 的标准差为2σ,则12σσ=________ 16.一个车间为了规定工作原理,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下: 零件数x (个) 15 20 30 40 50 加工时间y (分钟)6570758090由表中数据,求得线性回归方程0.66y x a =+,则估计加工70个零件时间为__________分钟(精确到0.1). 17.已知x ,y 的取值如下表: x 2 3 4 5 y2.23.85.56.5从散点图分析,y 与x 线性相关,且回归方程为y =1.46x +a ,则实数a 的值为________.18.数据1x ,2x ,…,n x 的平均数是3,方差是1,则数据15x -,25x -,…,5n x -的平均数和方差之和是__________.19.某超市统计了一个月内每天光顾的顾客人数,得到如图所示的频率分布直方图,根据该图估计该组数据的中位数为__________.20.已知某市A 社区35岁至45岁的居民有450人,46岁至55岁的居民有750人,56岁至65岁的居民有900人.为了解该社区35岁至65岁居民的身体健康状况,社区负责人采用分层抽样技术抽取若干人进行体检调查,若从46岁至55岁的居民中随机抽取了50人,试问这次抽样调查抽取的人数是________人.三、解答题21.某同学在生物研究性学习中,对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另三天的数据,求出y 关于x 的线性回归方程y bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠? 附:回归直线的斜率和截距的最小二乘估计公式分别为:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.22.假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:若由资料可知y 对x 呈线性相关关系,试求: (1)回归直线方程;(2)估计使用年限为10年时,维修费用约是多少?(参考:1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-)23.经销商小王对其所经营的某一型号二手汽车的使用年数(010)x x <≤与销售价格y (单位:万元/辆)进行整理,得到如下的对应数据:售价 1613 9.5 7 4.5(1)试求y 关于x 的回归直线方程;(2)已知每辆该型号汽车的收购价格为20.05 1.7517.2=-+w x x 万元,根据(1)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大.附:回归方程ˆybx a =+中,1221ˆˆˆˆ,ni ii nii x ynx y b ay bx xnx -=-==--∑∑ 24.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x (分钟)时刻的细菌个数为y 个,统计结果如下:x 1 2 3 4 5 y23445(Ⅰ)在给出的坐标系中画出x ,y 的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y 关于x 的回归直线方程ˆˆˆy bx a =+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni ii ni i x y nx yx n axby bx ====---∑∑) 25.某市举办了一次“诗词大赛”,分预赛和复赛两个环节,已知共有20000名学生参加了预赛,现从参加预赛的全体学生中随机地抽取100人的预赛成绩作为样本,得到如下的统计数据. 得分(百分[0,20)[20,40)[40,60)[60,80)[80,100]地抽取2人,求恰有1人预赛成绩优良的概率;(2)由样本数据分析可知,该市全体参加预赛学生的预赛成绩Z 服从正态分布()2,N μσ,其中μ可近似为样本中的100名学生预赛成绩的平均值(同一组数据用该组数据的中间值代替),且2361σ=.利用该正态分布,估计全市参加预赛的全体学生中预赛成绩不低于72分的人数;(3)预赛成绩不低于91分的学生将参加复赛,复赛规则如下: ①参加复赛的学生的初始分都设置为100分;②参加复赛的学生可在答题前自己决定答题数量n ,每一题都需要“花”掉一定分数来获取答题资格(即用分数来买答题资格),规定答第k 题时“花”掉的分数为()0.21,2,k k n =; ③每答对一题得2分,答错得0分;④答完n 题后参加复赛学生的最终分数即为复赛成绩.已知学生甲答对每道题的概率均为0.75,且每题答对与否都相互独立,则当他的答题数量n 为多少时,他的复赛成绩的期望值最大?参考数据:若()2~,Z N μσ,则() 6.827P Z μσμσ-<<+≈,()220.9545P Z μσμσ-<<+≈,()330.9973P Z μσμσ-<<+≈26.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.独立性检验临界值表:【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A . 【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.D解析:D 【解析】试题分析:由表中数据可得 表1:()25262210140.00916362032K ⨯⨯-⨯=≈⨯⨯⨯;表2: ()2524201216 1.76916362032K ⨯⨯-⨯=≈⨯⨯⨯;表3: ()252824128 1.316362032K ⨯⨯-⨯=≈⨯⨯⨯;表4: ()25214302623.4816362032K ⨯⨯-⨯=≈⨯⨯⨯.其中23.48最大,所以阅读量与性别有关联的可能性最大.故D 正确. 考点:独立性检验.3.D解析:D 【分析】根据平均数的性质,方差的性质直接运算可得结果. 【详解】令23(1,2,,5)i i y x i =-=1234555x x x x x x ++++==,1234523232323232310375x x x x x y x -+-+-+-+-∴==-=-=,(也可()(23)2()32537E y E x E x =-=-=⨯-=)()()()2y 232428D D x D x =-==⨯=故选:D 【点睛】本题主要考查方差及平均值的性质的简单应用,属于中档题.4.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差. 【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x+++++=得x =4,∴5个分数的方差为: S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B 【点睛】本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.5.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】 因为,所以,代入回归直线方程可求得,所以,故选D. 【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.6.B解析:B 【分析】先设出原来的数据,然后设出现在的数据,找到两组数据的联系,即可. 【详解】设原来的数据为12,,....,n x x x ,每一个数据都乘以2,再减去80,得到新数据为 12280,280,...,280n x x x --- 已知()122...80 1.2n x x x nn+++-=,则81.240.62X == 方差为:224 4.4, 1.1σσ==,故选B . 【点睛】本道题目考查的是平均数和方差之间的关系,列出等式,探寻两组数据的联系,即可.7.C解析:C 【详解】试题分析:由已知可得176,176x y ==∴中心点为()176,176, 代入回归方程验证可知,只有方程y =88+12x 成立,故选C 8.C解析:C 【分析】先求出所给数据的平均数,得到样本中心点,根据回归直线经过样本中心点,求出ˆa,得到线性回归方程,把6x =代入即可求出答案. 【详解】 由题意知4235 3.54x +++==,44253754404y +++==, 则40ˆˆ9.4 3.57.1a y bx=-=-⨯=, 所以回归方程为9.4.1ˆ7yx =+, 则广告费用为6万元时销售额为9.467.163.5⨯+=, 故答案为C. 【点睛】本题考查了线性回归方程的求法与应用,属于基础题.9.A解析:A 【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可. 【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题.10.B解析:B 【解析】 【分析】利用最小二乘法做出线性回归直线的方程的系数,写出回归直线的方程,得到结果. 【详解】 由题意,b=22222210078102801088411488116905108841001021081141165108⨯+⨯+⨯+⨯+⨯-⨯⨯++++-⨯=0.72,a=84﹣0.72×108=6.24, ∴y =0.72x+6.24, 故选:B . 【点睛】本题主要考查线性回归方程,属于难题.求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,nnii i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,ab ;④写出回归直线方程为ˆˆˆy bx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位,即减少1.5个单位,故选C.【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目. 12.A解析:A【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=,取卡片的次数为100次,则取到号码为奇数的频率是530.53 100=.本题选择A选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.18【分析】根据频率小矩形的面积小矩形的高组距底部求出周长大于110的频率再根据频数样本容量频率求出对应的频数【详解】由频率分布直方图知:底部周长大于110的频率为所以底部周长大于110的频数为(株解析:18【分析】根据频率=小矩形的面积=小矩形的高⨯组距底部,求出周长大于110cm的频率,再根据频数=样本容量⨯频率求出对应的频数.【详解】由频率分布直方图知:底部周长大于110cm的频率为(0.0200.010)100.3+⨯=,所以底部周长大于110cm的频数为600.318⨯=(株),故答案是:18.【点睛】该题考查的是有关频率分布直方图的应用,在解题的过程中,注意小矩形的面积表示的是对应范围内的频率,属于简单题目.14.【分析】先根据平均数计算出的值再根据方差的计算公式计算出这组数的方差【详解】依题意所以方差为故答案为【点睛】本小题主要考查平均数和方差的有关计算考查运算求解能力属于基础题解析:26 5【分析】先根据平均数计算出m的值,再根据方差的计算公式计算出这组数的方差.【详解】依题意12674,45m m ++++==.所以方差为()()()()()22222114244464745⎡⎤-+-+-+-+-⎣⎦[]126944955=+++=. 故答案为265. 【点睛】本小题主要考查平均数和方差的有关计算,考查运算求解能力,属于基础题.15.2【分析】根据等差数列性质分析两组数据之间关系再根据数据变化规律确定对应标准差变化规律即得结果【详解】因为数列是公差不为零的等差数列其前项和为所以因此即故答案为:2【点睛】本题考查等差数列和项性质以解析:2 【分析】根据等差数列性质分析两组数据之间关系,再根据数据变化规律确定对应标准差变化规律,即得结果. 【详解】因为数列{}n a 是公差不为零的等差数列,其前n 项和为n S ,所以111=+222n n n a a a a n S +=, 因此2112σσ=,即122σσ=故答案为:2 【点睛】本题考查等差数列和项性质以及数据变化对标准差的影响规律,考查综合分析求解能力,属中档题.16.7【解析】【分析】结合题意先求出线性回归方程然后再计算出结果【详解】由题意可得则线性回归方程为当时【点睛】本题考查了求线性回归方程然后求出估计结果需要掌握解题方法较为基础解析:7 【解析】 【分析】结合题意先求出线性回归方程,然后再计算出结果 【详解】 由题意可得1520304050315x ++++==6570758090765y ++++==,760.6631a ∴=⨯+,55.54a =,则线性回归方程为0.66 5.4ˆ55y x =+ 当70x =时,ˆ101.7y≈ 【点睛】本题考查了求线性回归方程,然后求出估计结果,需要掌握解题方法,较为基础17.—061【分析】根据所给条件求出把样本中心点代入回归直线方程可以得到关于的方程解出即可得到答案【详解】根据题意可得则这组数据的样本中心点是代入到回归直线方程故答案为【点睛】本题考查了线性回归方程解题解析:—0.61 【分析】根据所给条件求出x ,y ,把样本中心点()x y ,代入回归直线方程 1.4ˆ6ˆyx a +=,可以得到关于ˆa的方程,解出即可得到答案 【详解】 根据题意可得23453.54x +++== 2.2 3.8 5.5 6.54.54y +++==则这组数据的样本中心点是()3.54.5,代入到回归直线方程 1.4ˆ6ˆyx a += 4.5 1.46 3.ˆ5a∴⨯+= ˆ0.61a=- 故答案为0.61- 【点睛】本题考查了线性回归方程,解题的关键是线性回归方程一定过样本中心点,这是求解线性回归方程的步骤之一,是线性回归方程考查的常见题型,体现了回归直线方程与样本中心点的关联.18.3【解析】分析:由题意结合平均数方差的性质整理计算即可求得最终结果详解:由题意结合平均数和方差的性质可知:数据…的平均数为:方差为:则平均数和方差之和是点睛:本题主要考查均值的性质方差的性质等知识意解析:3 【解析】分析:由题意结合平均数、方差的性质整理计算即可求得最终结果. 详解:由题意结合平均数和方差的性质可知:数据15x -,25x -,…,5n x -的平均数为:532-=,方差为:()2111-⨯=, 则平均数和方差之和是213+=.点睛:本题主要考查均值的性质、方差的性质等知识,意在考查学生的转化能力和计算求解能力.19.75【解析】分析:由频率分布直方图算出各频率然后计算中位数详解:由图可知的频率为的频率为的频率为的频率为的频率为前两组频率前三组频率中位数在第三组设中位数为则解得故该组数据的中位数为点睛:本题考查了解析:75. 【解析】分析:由频率分布直方图算出各频率,然后计算中位数 详解:由图可知,10~20的频率为0.1420~30的频率为0.2430~40的频率为0.32 40~50的频率为0.2 50~60的频率为0.1前两组频率0.140.240.380.5=+=< 前三组频率0.140.240.320.70.5=++=>∴中位数在第三组设中位数为x ,则()300.380.320.510x -+⨯=解得33.75x =故该组数据的中位数为33.75点睛:本题考查了在频率分布直方图中求中位数,此类题目需要先确定中位数所在的组,然后根据公式计算求得结果,较为基础.20.【解析】根据题意可得抽样比为则这次抽样调查抽取的人数是即答案为140 解析:140【解析】根据题意可得抽样比为501,75015= 则这次抽样调查抽取的人数是()114507509002100140,1515++=⨯= 即答案为140.三、解答题21.(1)532y x =-;(2)线性回归方程是可靠的. 【分析】(1)根据最小二乘法公式,分别将数据代入计算,即可得答案;(2)选取的是4月1日与4月30日的两组数据,即10x =和8x =代入判断即可; 【详解】解:(1)由数据得12x =,27y =,3972xy =,23432x =; 又31977i i i x y ==∑,321434i i x ==∑;97797254344322b -==-,5271232a =-⨯=-;所以y 关于x 的线性回归方程为:532y x =-. (2)当10x =时,5103222y =⨯-=,22232-<; 当8x =时,583222y =⨯-=,17162-<, 所得到的线性回归方程是可靠的. 【点睛】本题考查最小二乘法求回归直线方程及利用回归方程进行判断拟合效果,考查数据处理能力,求解时注意回归直线必过样本点中心的应用.22.(1) 1.2308ˆ.0yx =+;(2)12.38万元.. 【分析】(1)由已知表格中的数据,易计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.(2)把使用年限10代入回归直线方程,即可估算出维修费用的值. 【详解】 (1)4x =,5y=,52190i i x==∑,51112.3i i i x y ==∑,12215 1.235ni ii nii x yxyb xx ==-==-∑∑,0.08a y bx =-=, 所以回归直线方程为 1.2308ˆ.0yx =+; (2) 1.23100.0812.3ˆ8y=⨯+=, 即估计用10年时维修费约为12.38万元. 【点评】本题考查回归直线的方程求解,关键是要求出回归直线方程的系数,由已知的变量x ,y 的值,我们计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.属于中等题.23.(1) 1.4518.7y x =-+;(2)3 【分析】(1)由表中数据计算x 、y ,求出ˆb、ˆa ,即可写出回归直线方程; (2)写出利润函数z y w =-,利用二次函数的图象与性质求出3x =时z 取得最大值. 【详解】解:(1)由表中数据得,1(246810)65x =⨯++++=,1(16139.57 4.5)105y =⨯++++=, 由最小二乘法求得:22222221641369.58710 4.5561058ˆ 1.452468105640b⨯+⨯+⨯+⨯+⨯-⨯⨯-===-++++-⨯, ˆ10( 1.45)618.7a=--⨯=, 所以y 关于x 的回归直线方程为 1.4518.7y x =-+; (2)根据题意,利润函数为:22(1.4518.7)(0.05 1.7517.2)0.050.3 1.5z y w x x x x x =-=-+--+=-++,所以,当0.332(0.05)x =-=⨯-时,二次函数z 取得最大值为1.95;即预测3x =时,小王销售一辆该型号汽车所获得的利润z 最大. 【点睛】本题考查了回归直线方程的求法,以及二次函数的图象与性质的应用,考查计算能力.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑122216153 3.67ˆ0.7555310ni ii ni i x y nx yxbx n ==-⨯⨯====-⨯--∑∑,ˆˆ 3.60.73 1.5a y bx =-=-⨯=, 所以ˆ0.7 1.5yx =+, 当0.7 1.512x +=时,解得15x =. 所以当15x =时细菌个数为12个. 【点睛】本题考查了散点图、线性回归方程及其应用,属于基础题. 25.(1)2552;(2)3173;(3)当他的答题数量7n =时,他的复赛成绩的期望值最大. 【分析】(1)由表可知,样本中成绩不低于60分的学生共有40人,其中成绩优良的人数为15人,再结合排列组合与古典概型即可得解;(2)先求出样本中的100名学生预赛成绩的平均值,即为μ,从而推出~(53Z N ,219),再根据正态分布的性质即可得解;(3)以随机变量ξ表示甲答对的题数,则~B ξ(,0.75)n ,记甲答完n 题所得的分数为随机变量X ,则2X ξ=,为了获取答n 道题的资格,甲需要“花”掉的分数为20.1()n n +,设甲答完n 题后的复赛成绩的期望值为()f n ,则2()1000.1()()f n n n E X =-++,最后利用配方法即可得解. 【详解】解:(1)由题意得样本中成绩不低于60分的学生共有40分,其中成绩优良的人数为15人,记“从样本中预赛成绩不低于60分的学生中随机地抽取2人,恰有1人预赛成绩优良”为事件A ,则()1125152402552C C P A C == 答:“从样本中预赛成绩不低于60分的学生中随机地抽取2人,恰有1人预赛成绩优良”的概率为2552(2)由题意知样本中的100名学生预赛成绩的平均值为:100.1300.2500.3700.25900.1533x =⨯+⨯+⨯+⨯+⨯=,则53μ=,由2361σ=得19σ=, 所以()()()()17210.158652P Z P Z P Z μσμσμσ≥=≥+=--<≤+≈, 所以,估计全市参加参赛的全体学生中,成绩不低于72分的人数为20000×0.15865=3173,即全市参赛学生中预赛成绩不低于72分的人数为3173.(3)以随机变量ξ表示甲答对的题数,则()~,0.75B n ξ,且()0.75E n ξ=, 记甲答完n 题所加的分数为随机变量X ,则2X ξ=,∴()()2 1.5E X E n ξ==, 依题意为了获取答n 道题的资格,甲需要“花”掉的分数为:()()20.2123...0.1n n n ⨯++++=+,设甲答完n 题后的复赛成绩的期望值为()f n ,则()()()221000.1 1.50.17104.9f n n n n n =-++=--+,由于*n N ∈,所以当7n =时,()f n 取最大值104.9. 即当他的答题数量7n =时,他的复赛成绩的期望值最大. 【点睛】本题考查古典概型、正态分布的性质、二项分布的性质及数学期望的实际应用,考查学生对数据的分析与处理能力,属于中档题.26.(1)分布列见解析,1;(2)0.10=P ,理由见解析. 【分析】(1)按照分层抽样计算“科学用眼”和“不科学用眼”的抽取人数,随机变量X 的取值可能为0,1,2,然后计算概率得出分布列及其数学期望; (2)按照公式计算2K 的值,然后由临界值表得出结果即可. 【详解】(1)“科学用眼”抽156245⨯=人,“不科学用眼”抽306445⨯=人,则随机变量X0=,1,2,∴343641 (0)205====CP XC,122436123(1)205C CP XC====,21243641(2)205C CP XC====,分布列为:0120121555EX=⨯+⨯+⨯=;(2)22100(45153010)3.03075255545⨯-⨯=≈⨯⨯⨯K,由表可知2.706 3.030 3.840<<,∴0.10=P.【点睛】本题考查随机变量的分布列和数学期望,考查独立性检验,考查逻辑思维能力和计算能力,考查学生分析解决问题的能力,属于常考题.。
高中数学必修3第一章(统计)检测题班级姓名得分一、选择题:(本题共10小题,每小题3分,共30分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.某单位有老年人28人,中年人54人,青年人81人.为了调查他们的身体状况,需从他们中抽取一个容量为36的样本,最适合抽取样本的方法是( ).A.简单随机抽样B.系统抽样C.分层抽样D.先从老年人中剔除一人,然后分层抽样2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则有( ).A.a>b>c B.b>c>a C.c>a>b D.c>b>a3.下列说法错误的是( ).A.在统计里,把所需考察对象的全体叫作总体B.一组数据的平均数一定大于这组数据中的每个数据C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.一组数据的方差越大,说明这组数据的波动越大4.下列说法中,正确的是( ).A.数据5,4,4,3,5,2的众数是4B.一组数据的标准差是这组数据的方差的平方C.数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半D.频率分布直方图中各小长方形的面积等于相应各组的频数5.从甲、乙两班分别任意抽出10名学生进行英语口语测验,其测验成绩的方差分别为S12= 13.2,S22=26.26,则( ).A.甲班10名学生的成绩比乙班10名学生的成绩整齐B.乙班10名学生的成绩比甲班10名学生的成绩整齐C.甲、乙两班10名学生的成绩一样整齐D.不能比较甲、乙两班10名学生成绩的整齐程度6.下列说法正确的是( ).A.根据样本估计总体,其误差与所选择的样本容量无关B.方差和标准差具有相同的单位C.从总体中可以抽取不同的几个样本D.如果容量相同的两个样本的方差满足S12<S22,那么推得总体也满足S12<S22是错的7.右图是根据《湖南统计年整2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为()29 1 1 5 8 (A)304.6(B)303.63 0 2 63 1 0 24 7 (C)302.6 (D)301.68.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为(1);在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为(2)。
第一章检测(时间:120分钟满分:150分)一、选择题:本大题共12小题,每小题5分,在每小题给出的四个选项中,只有一项是符合题目要求的.1.现从100件产品中随机抽出10件进行质量检测,下列说法正确的是()A.100件产品是总体B.10件产品是样本C.样本容量为100D.样本容量为10解析:这里考查统计的基本概念,总体是100件产品的质量;样本是抽取的10件产品的质量;总体容量为100,样本容量为10.答案:D2.下列说法中,不正确的是()A.系统抽样是先将差异明显的总体分成几个小组,再进行抽取B.分层抽样是将差异明显的几部分组成的总体分成几层,然后进行抽取C.简单随机抽样是从个体无差异且个体数较少的总体中逐个抽取个体D.系统抽样是从个体无差异且个数较多的总体中,将总体均分,再按事先确定的规则在各部分抽取解析:当总体中个体差异明显时,用分层抽样;当总体中个体无差异且个体数较多时,用系统抽样;当总体中个体无差异且个体数较少时,用简单随机抽样.所以A不正确.答案:A3.重庆市2016年各月的平均气温(单位:℃)数据的茎叶图如图所示,则这组数据的中位数是()A.19B.20C.21.5D.23答案:B4. 如图是容量为100的样本数据(质量)的频率分布直方图,已知样本质量均在[5,20]内,其分组为[5,10),[10,15),[15,20],则样本质量落在[15,20]内的频数为()A.10B.20C.30D.40解析:由题意得,组距为5,则样本质量在[5,10),[10,15)内的频率分别为0.3和0.5,所以样本质量在[15,20]内的频率为1-0.3-0.5=0.2.故频数为100×0.2=20.答案:B5.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,得到的频率分布直方图是()解析:由分组可知C,D一定不对;由题中茎叶图可知[0,5)有1人,[5,10)有1人,所以第一、二小组频率相同,频率分布直方图中矩形的高应相同,可排除B.故选A.答案:A6.已知两组数据x1,x2,…,x n与y1,y2,…,y n,它们的平均数分别A.C.答案:B7.在抽查样本中,用频率分布直方图表示尺寸的过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个数在该组内的频率为m,表示该组的小矩形的高为h,则b-a等于()A.hm BC解析:b-a是组距,在频率分布直方图h,所b-a答案:C8.某班有48名学生,在一次考试中统计出平均分为70分,方差为75分2,后来发现有2名同学的分数登错了,甲实得80分却记成了50分,乙实得70分却记成了100分,更正后平均分和方差分别为()A.70分,75分2B.70分,50分2C.70分,1.04分2D.65分,25分2解析:注意到平均数没有变化,只是方差变动.s2+(50-70)2+(100-70)2+…]=75分2,实际上s2+(80-70)2+(70-70)2+…]=50分2,故选B.答案:B9.某校高三年级有男生500人,女生400人,为了了解该年级学生的健康状况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是()A.简单随机抽样B.抽签法C.随机数法D.分层抽样解析:样本容量n=25+20=45,男生和女生的抽样比都.答案:D10.某示范农场的鱼塘放养鱼苗8万条,根据这几年的经验知道,鱼苗的成活率为95%,一段时间后准备打捞出售,第一网捞出40条,称得平均每条鱼2.5 kg,第二网捞出25条,称得平均每条鱼2.2 kg,第三网捞出35条,称得平均每条鱼2.8 kg,估计这时鱼塘中鱼的总质量为()A.192 280 kgB.202 280 kgC.182 280 kgD.172 280 kg解析:样本平均2.53 kg,所以估计鱼塘中鱼的总质量约为80 000×95%×2.53=192 280(kg).答案:A11.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7例”.根据过去10天甲、乙、丙、丁四地新增疑似病例的数据,一定符合该标志的是()A.甲地:总体均值为3,中位数为4B.乙地:总体均值为1,总体方差大于0C.丙地:中位数为2,众数为3D.丁地:总体均值为2,总体方差为3解析s2+(x10-2)2],若有一天超过7人,不妨设x10=8,则s2≥.故任何一天都不超过7人.答案:D12. 已知两个相关变量满足如下关系:A.y=0.56x+997.4B.y=0.63x-231.2C.y=50.2x+501.4D.y=60.4x+400.7解析:因为b y=0.56x+997.4.答案:A二、填空题:本大题共4小题,每小题5分.13.某市有大型超市200家、中型超市400家、小型超市1 400家.为掌握各类超市的营业情况,现按分层抽样方法抽取一个容量为100的样本,则应抽取中型超市家.解析:本题为分层抽样,所以应抽取中型超市400).答案:2014.某考察团对全国10大城市职工人均工资水平x(单位:千元)与居民人均消费水平y(单位:千元)进行统计调查,y与x具有线性相关关系,线性回归方程为y=0.66x+1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为.解析:将y=7.675代入y=0.66x+1.562,得x≈83%.答案:83%15.如图是一个容量为100的样本的频率分布直方图,试根据图中的数据回答下列问题:(1)样本数据落在区间[2,6)内的频率为;(2)样本数据落在区间[6,10)内的频数为.解析:由频率分布直方图可得数据落在区间[2,6)内的频率为相应的小矩形的面积,即0.02×4=0.08,数据落在区间[6,10)内的频率为0.08×4=0.32,故数据落在区间[6,10)内的频数为100×0.32=32.答案:(1)0.08(2)3216.甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如图所示,则甲班、乙班的最高成绩各是,从图中看班的平均成绩较高.解析:从题图可以看出乙班的成绩集中在70分以上,且在80分以上的有6人,而甲班80分以上的只有4人,甲班的最低成绩是46分,对平均分影响较大.答案:96,92乙三、解答题:解答应写出文字说明、证明过程或演算步骤.17.(本小题满分10分)小明家2016年四个季度的用电量如下表:其中各种电器用电量如下表:根据如图所示三幅统计图回答:(1)从哪幅统计图可看出各个季度用电量变化情况?(2)从哪幅统计图可看出冰箱用电量超过总用电量(3)从哪幅统计图可以清楚地看出空调用电量?解:三幅统计图分别为折线统计图、扇形统计图和条形统计图,各自的优点如下:18.(本小题满分12分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下(单位:cm):甲:9,10,11,12,10,20乙:8,14,13,10,12,21.(1)绘出所抽取的甲、乙两种麦苗株高的茎叶图;(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况.解:(1)茎叶图如图所示:(2≈13.67≈16.67.因.又因.19. (本小题满分12分)2017年春节前,公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让过往返乡的摩托车驾驶人有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的抽取5人,则四川籍的应抽取几人?解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.(2)从题图可知,被询问了省籍的驾驶人员中广西籍的有5+20+25+20+30=100(人);四川籍的有15+10+5+5+5=40(人).设四川籍的驾驶人员应抽取x人,依题意x=2,即四川籍的应抽取2人.20.(本小题满分12分)某车间20名工人年龄数据如下表:(1)求这20名工人年龄的众数与极差(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.解:(1)由题中表可知,众数为30岁.极差为40-19=21(岁).(2)(3)这20名工人年龄的平均数为(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30(岁),所以这20名工人年龄的方差为s2=12.6(岁2).21.(本小题满分12分)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差;(同一组中的数据用该组区间的中点值作代表)(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解:(1)(2)质量指标值的样本平均数为质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.22.(本小题满分12分)某种瓶装溶液,因为装瓶机的不稳定性,所以很可能使每瓶的含量都不是标准的含量,我们随机抽出了20瓶,测得它们的含量(单位:百毫升)如下:12.111.912.212.212.012.112.912.112.312.511.712.412.311.811.312.111.411.611.212.2(1)根据数据列出频率分布表,画出频率分布直方图;(2)计算出这组数据的平均数和标准差;(结果精确到0.01)(3)结合(1)(2)的结果,根据实际意义写一个简短的报告.(对总体情况作出估计)解:(1)频率分布表如下:频率分布直方图如图所示.(2)平均.1+11.9+12.2+…+12.2)≈12.02(百毫升).标准差s≈≈0.41(百毫升).(3)标准差相对于平均数来说比较小.从频率分布直方图中可以看出,每瓶的含量大致位于1 150毫升到1 250毫升之间.因此可判断装瓶机工作稳定.。
§3统计图表第1课时条形统计图、扇形统计图、折线统计图课时过关·能力提升1.下列四个图中,用来表示不同品种的奶牛的平均产奶量最为合适的是()解析:用统计图表示不同品种的奶牛的平均产奶量,即从图中可以比较各种数量的多少,因此“最为合适”的统计图是条形统计图.注意B选项中的图不能称为统计图.答案:D2.已知某地农村2000年到2015年间人均居住面积的统计图如图所示,则增长最多的5年为()A.2000~2005年B.2005~2010年C.2010~2015年D.无法从图中看出解析:2000~2005年的增长量为3.1 m2,2005~2010年的增长量为3.2 m2,2010~2015年的增长量为3.8 m2.答案:C3.张佳同学对高一(1)班和高一(2)班两个班级今年的获奖情况进行了统计,制成两个统计图(如图所示),你认为哪个图比较恰当()A.①恰当B.②恰当C.①②都恰当D.①②都不恰当解析:图②较恰当.由图②我们可以很清楚地看出运动类的获奖次数(1)班比(2)班多一些,而学习类的获奖次数(1)班比(2)班少一些.答案:B4.如图是某商场一天营业额的扇形统计图,根据统计图可以得到的信息有()①该商场家用电器销售额为全商场营业额的40%;②服装鞋帽和百货日杂共售出29 000元;③副食的销售额为该商场营业额的10%;④家用电器部所得利润最高.A.①②④B.①③④C.②③④D.①②③答案:D5.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93B.123C.137D.167解析:由性别比例图知,该校女教师的人数为110×70%+150×(1-60%)=77+60=137.答案:C6.据报道,2016年某咨询公司对1 500个家庭进行了关于奶粉市场的调查,如图是关于每月购买奶粉袋数的有关数据,每月购买1袋奶粉的比率同每月购买2袋奶粉的比率合计为()A.79.9%B.70.9%C.38.8%D.32.1%解析:根据折线图知,每月购买1袋奶粉和每月购买2袋奶粉的比率分别为38.8%和32.1%,故所求为38.8%+32.1%=70.9%.答案:B7.要清楚地表明一病人的体温变化情况,选用统计图比较合适;学校要统计各年级人数及总人数,选用统计图比较合适;在一片果园中,有不同种类的果树,为了反映某种果树的种植面积占整个果园面积的百分比,选用统计图比较合适.答案:折线条形扇形8.某校高一(1)班有50名学生,综合素质评价“运动与健康”方面的等级统计如图所示,则该班“运动与健康”评价等级为A的人数是.解析:由扇形统计图知评价等级为A的人数占总人数的38%,则评价等级为A的人数是50×38%=19.答案:199.如图是2016年10万人受教育程度的条形统计图,若从这10万人中分层抽取1 000人进行某项目调查,则从高中应抽取人.解析:根据条形统计图,这10万人中高中生有14 000人.设应抽取的人数为n,n=140.答案:14010. 某足球赛门票正式发行时,售票窗口在3月1日至8日的售票情况如图所示,由图可知,售票最多的日期是;售票最少的日期是;前4天共售票张.解析:由题图可知,售票最多的日期是3月2日;最少的日期是3月3日与3月7日;前4天共售票8+14+7+12=41(张).答案:3月2日3月3日与3月7日4111.小明和小刚从某报纸上看到某年我国汽车市场一些轿车的销售量如下表所示:他们将表中的数据相加,得知四种汽车品牌在该年的总销售量为363 870辆,于是画出如图所示的该年我国汽车市场占有率的扇形统计图,你同意这个结果吗?为什么?解:不同意.因为该年我国汽车市场销售品牌不止这四种,总销售量的结果是不对的,所以用扇形统计图描述四种车型的市场占有率不合理,可以用条形统计图描述表中数据.12.英才学校其中的四个年级学生分布如图①所示的扇形统计图,通过对这四个年级学生暑假期间所读课外书情况的调查,制成各年级读书情况的条形统计图(如图②).已知英才学校被调查的四个年级共有学生1 500人,求:图①图②(1)高一年级学生暑假期间共读课外书的本数;(2)暑假期间读课外书总量最少的是几年级学生;(3)该校暑假期间四个年级人均读课外书的本数.解:(1)因为高一年级学生人数占四个年级总人数的百分比为1-24%-28%-22%=26%,四个年级共有1 500人,所以高一年级有1 500×26%=390(人).又因为每人读6.2本,故高一年级学生暑假期间共读课外书390×6.2=2 418(本).(2)七年级参加调查的人数为1 500×28%=420,阅读课外书总量为420×5.6=2 352(本);八年级参加调查的人数为1 500×24%=360,阅读课外书总量为360×6.6=2 376(本);高二年级参加调查的人数为1 500×22%=330,阅读课外书总量为330×7.3=2 409(本),故暑假期间阅读课外书总量最少的是七年级学生.(3)该校暑假期间四个年级人均读课外书).。
第2课时茎叶图课时过关·能力提升1.在如图所示的茎叶图中,乙中没有的数据是()A.17B.26C.38D.44答案:B2. 如图是在某地举办的挑战主持人大赛上,七位评委给某选手打出的分数的茎叶图,最低分和最高分分别为()A.79分,93分B.84分,87分C.48分,78分D.39分,97分答案:A3.如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,在这几场比赛中,甲、乙两人的最高分分别为()A.51分,83分B.41分,47分C.51分,47分D.41分,83分答案:B4.如图是两户居民家庭全年各项支出的统计图.根据统计图,下列对两户教育支出占全年总支出的百分比作出的判断中,正确的是()A.甲户比乙户大B.乙户比甲户大C.甲、乙两户一样大D.无法确定哪一户大解析:条形统计图反映具体数值,则由图可知,甲户教育支出占全年总支出的百分比为1 200÷(1200+2 000+1 200+1 600)=20%;从图可知,乙户教育支出占全年总支出的百分比为25%.所以乙户比甲户大.答案:B5.某班一次单元测试后,已知解答题部分的抽样成绩的茎叶图如图所示,则图中□内数字所表示的学生的原始成绩是.解析:根据“茎”是十位数,“叶”是个位数易得.答案:456.某校开展“爱我家乡”摄影比赛,9位评委为参赛作品给出的分数如图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清.若记分员计算无误,则数字x应该是.解析:当x≥4≠91,∴x<4.∴x=1.答案:17. 在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是.解析:依题意,应将35名运动员的成绩由好到差排序后分为7组,每组5人.然后从每组中抽取1人,其中成绩在区间[139,151]上的运动员恰好是第3,4,5,6组,因此,成绩在该区间上的运动员人数是4.答案:48.青年歌手大奖赛共有10位选手参赛,并请了7位评委,如图所示的茎叶图是7位评委给参加最后决赛的两位选手甲、乙评定的成绩,去掉一个最高分和一个最低分后,甲、乙选手剩余数据的平均成绩分别为.解析:甲的成绩是75,78,84,85,86,88,92,去掉一个最高分92和一个最低分75后,甲剩余数据的平均成绩为84.2;乙的成绩是78,84,84,84,86,87,94,去掉一个最高分94和一个最低分78后,乙剩余数据的平均成绩为85.答案:84.2,859.在某电脑杂志的一篇文章中,每个句子中所含字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子中所含字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,能得到什么结论?解:(1)茎叶图如图所示.(2)从茎叶图中可以看出电脑杂志上每个句子的字数集中在10~30之间;报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少,说明电脑杂志作为科普读物需要通俗易懂、简明扼要.(答案不唯一,合理即可)10.心理教育专家对某班50名学生进行智力测验,得分如下(单位:分):48,65,52,86,71,48,64,41,86,79,71,68,82,84,68,64,62,68,81,57,90,52,74,73,56,78,47,66,55,64,56,88,69, 40,73,97,68,56,67,59,70,52,79,44,45,69,62,58,32,58.(1)这次测验成绩中的最大值和最小值分别是多少?(2)画出这50人成绩的茎叶图,通过分析,你能得出什么结论?解:(1)这次测验成绩中的最小值为32分,最大值为97分.(2)这50人成绩的茎叶图如图所示,从茎叶图中可以直观地看出,学生智力成绩的平均得分及中位数、众数都在50~70分之间,且分布较对称,集中程度较高,符合学生正常的智力水平.(答案不唯一,合理即可)。
§6统计活动:结婚年龄的变化§7相关性课时过关·能力提升1.要了解全市高一学生身高在某一范围的学生所占比例的大小,需知道相应样本的()A.平均数B.方差C.众数D.频率分布答案:D2.对于给定的两个变量的统计数据,下列说法正确的是()A.可以分析出两个变量之间的关系B.可以用一条直线近似地表示两者之间的关系C.可以作出散点图D.可以用确定的表达式表示两者之间的关系解析:因为两个变量可能是无关的,所以A错误;因为两者可能不是线性相关的,此时不一定能用直线近似,所以B错误;当两个变量无关联时,不能用确定的表达式来表示,所以D错误.故选C.答案:C3.下列说法正确的是()A.无论是什么样的散点图,我们总可以用一条光滑的曲线把这些点连接起来,从而说明它们总是相关的B.线性相关关系实际上就是一次函数关系C.连接最多点的曲线是最好的拟合曲线D.以上都不对解析:若所有点在散点图中没有显示任何关系,则称变量间是不相关的,A不正确;线性相关关系与函数关系既有区别又有联系,B不正确;连接最多点的曲线不一定最能反映数据的变化趋势,故不一定是最好的拟合曲线,C不正确.故选D.答案:D4.从下列图形中可以得出两个变量具有相关关系的是()解析:A项,显然任给一个x都有唯一确定的y和它对应,是一种函数关系;B项,也是一种函数关系;C 项,从散点图可以看出所有点看上去都在某条直线附近波动,具有相关关系,而且是一种线性相关关系;D项,所有的点在散点图中没有显示任何关系,因此变量间是不相关的.答案:C5.如图,有5组数据,若去掉其中一组数据后,剩下的4组数据线性相关关系最大,则这组数据对应的点是()A.EB.DC.BD.A解析:哪个点离某一条直线最远,就应考虑除去这一个点.答案:B6.下列两个变量之间的关系不是函数关系的是.(只填序号)①角度和它的余弦值;②正方形的边长和周长;③已知二次函数y=ax2+bx+c,其中a,c是已知常数,且a≠0,取b为自变量,因变量是这个函数的判别式Δ=b2-4ac;④人的视力和身高.解析:由函数关系与相关关系的概念即知.答案:④7.下面各组变量之间具有相关关系的是.(只填序号)①高原含氧量与海拔高度;②速度一定时,汽车行驶的路程和所用的时间;③学生的成绩和学生的学号;④父母的身高和子女的身高.答案:①④8.下列说法中正确的有.(只填序号)①y=3x+2中的x,y是具有函数关系的两个变量;②商品的销售量与商品的价格之间是一种确定的关系;③学生的学习态度与学习成绩之间是一种确定的关系.解析:②③中两变量之间是相关关系.答案:①9.某个男孩的年龄与身高的统计数据如下:画出散点图,解:散点图如图所示.由散点图可清楚地看到,在一定的范围内,这个男孩的年龄与身高具有明显的线性相关关系.10.以下是在某地搜集到的不同楼盘房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:画出散点图,并判断房屋的销售价格和房屋面积之间是否具有线性相关关系.解:数据对应的散点图如图所示.通过以上数据对应的散点图可以判断,房屋的销售价格和房屋面积之间具有线性相关关系.11.在7块并排的、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg):(1)画出散点图;(2)判断它们是否具有线性相关关系.分析:(1)以施化肥量为横坐标,其对应的观测值为纵坐标,在平面直角坐标系中描点,得散点图;(2)由散点图分析是否具有线性相关关系,如果散点图中的点分布在一条直线附近,说明两个变量具有线性相关关系,否则不具有线性相关关系.解:(1)散点图如图所示.(2)观察散点图,知散点图中的点分布在一条直线附近,则水稻产量与施化肥量之间具有线性相关关系.12.某地区的环境适合天鹅栖息繁衍,有人经统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的婴儿出生率就高;如果村庄附近栖息的天鹅少,那么婴儿出生率就低.于是,他就得出一个结论:天鹅能够带来孩子.你认为两者之间具有相关关系吗?解:从现在我们掌握的知识来看,没有任何证据说明“天鹅能够带来孩子”,完全可能存在既能吸引天鹅又使婴儿出生率高的第三因素(例如独特的环境因素),即天鹅与婴儿出生率之间没有直接的关系.故两者之间不具有相关关系.。
一、选择题1.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,82.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .163.某产品的广告费用与销售额的统计数据如下表:( ) 广告费用(万元) 销售客(万元)根据上表中的数据可以求得线性回归方程中的为,据此模型预报广告费用为万元时销售额为( ) A .万元B .万元C .万元D .万元4.从两个班级各随机抽取5名学生测量身高(单位:cm ),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生的平均身高x 甲,x 乙及方差2s 甲,2s 乙的关系为( )A .x 甲>x 乙,2s 甲>2s 乙B .x 甲>x 乙,2s 甲<2s 乙C .x 甲<x 乙,2s 甲<2s 乙D .x 甲<x 乙,2s 甲>2s 乙5.有200人参加了一次会议,为了了解这200人参加会议的体会,将这200人随机号为001,002,003,…,200,用系统抽样的方法(等距离)抽出20人,若编号为006,036,041,176, 196的5个人中有1个没有抽到,则这个编号是( ) A .006B .041C .176D .1966.在一段时间内,某种商品的价格x (元)和销售量y (件)之间的一组数据如下表: 价格x (元) 4 6 8 10 12 销售量y (件)358910若y 与x 呈线性相关关系,且解得回归直线ˆˆˆybx a =+的斜率0.9b ∧=,则a ∧的值为( ) A .0.2B .-0.7C .-0.2D .0.77. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日8.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50 B .70和67C .75和50D .75和679.通过实验,得到一组数据如下:2,5,8,9,x ,已知这组数据的平均数为6,则这组数据的方差为( ) A .3.2B .4C .6D .6.510.总体由编号为01,02,,29,30的30个个体组成,利用下面的随机数表选取4个个体.选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为( ).7806 6572 0802 6314 2947 1821 98003204 9234 4935 3623 4869 6938 7481A .02B .14C .18D .2911.如图是两组各7名同学体重(单位:kg )数据的茎叶图,设1、2两组数据的平均数依次为1x 和2x ,标准差依次为12s s 、,那么( )(注:标准差222121[()()...()]n s x x x x x x n=-+-++-A .1212,x x s s >>B .1212,x x s s ><C .1212,x x s s <<D .1212,x x s s12.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .91二、填空题13.对两个变量y 和x 进行回归分析,得到一组样本数据()11,x y ,()22,x y ,…,(),n n x y ,则下列说法中正确的序号是______.①由样本数据得到的回归直线方程y bx a =+必过样本点的中心 ②残差平方和越小的模型,拟合的效果越好③用相关指数2R 来刻画回归效果,2R 越小说明拟合效果越好④若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间线性相关性强 14.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 15.上海市普通高中学业水平等级考成绩共分为五等十一级,各等级换算成分数如表所示: 等级A + AB + BB -C + CC -D + DE 分数 7067646158555249464340上海某高中2018届高三()1班选考物理学业水平等级考的学生中,有5人取得A +成绩,其他人的成绩至少是B级及以上,平均分是64分,这个班级选考物理学业水平等级考的.人数至少为______人16.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.17.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:^y=0.245x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_______万元.18.某高中有高一学生320人,高二学生400人,高三学生360人.现采用分层抽样调查学生的视力情况.已知从高一学生中抽取了8人,则三个年级一共抽取了__________人。
第一章检测(时间:120分钟满分:150分)一、选择题:本大题共12小题,每小题5分,在每小题给出的四个选项中,只有一项是符合题目要求的.1.现从100件产品中随机抽出10件进行质量检测,下列说法正确的是()A.100件产品是总体B.10件产品是样本C.样本容量为100D.样本容量为10解析:这里考查统计的基本概念,总体是100件产品的质量;样本是抽取的10件产品的质量;总体容量为100,样本容量为10.答案:D2.下列说法中,不正确的是()A.系统抽样是先将差异明显的总体分成几个小组,再进行抽取B.分层抽样是将差异明显的几部分组成的总体分成几层,然后进行抽取C.简单随机抽样是从个体无差异且个体数较少的总体中逐个抽取个体D.系统抽样是从个体无差异且个数较多的总体中,将总体均分,再按事先确定的规则在各部分抽取解析:当总体中个体差异明显时,用分层抽样;当总体中个体无差异且个体数较多时,用系统抽样;当总体中个体无差异且个体数较少时,用简单随机抽样.所以A不正确.答案:A3.重庆市2016年各月的平均气温(单位:℃)数据的茎叶图如图所示,则这组数据的中位数是()A.19B.20C.21.5D.23答案:B4. 如图是容量为100的样本数据(质量)的频率分布直方图,已知样本质量均在[5,20]内,其分组为[5,10),[10,15),[15,20],则样本质量落在[15,20]内的频数为()A.10B.20C.30D.40解析:由题意得,组距为5,则样本质量在[5,10),[10,15)内的频率分别为0.3和0.5,所以样本质量在[15,20]内的频率为1-0.3-0.5=0.2.故频数为100×0.2=20.答案:B5.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,得到的频率分布直方图是()解析:由分组可知C,D一定不对;由题中茎叶图可知[0,5)有1人,[5,10)有1人,所以第一、二小组频率相同,频率分布直方图中矩形的高应相同,可排除B.故选A.答案:A6.已知两组数据x1,x2,…,x n与y1,y2,…,y n,它们的平均数分别是x和y,则新的一组数据2x1−5y1+3,2x2−5y2+3,…,2x n−5y n+3的平均数是()A.2x−5yB.2x−5y+3C.4x−25yD.4x−25y+3答案:B7.在抽查样本中,用频率分布直方图表示尺寸的过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个数在该组内的频率为m,表示该组的小矩形的高为h,则b-a等于()A.hmB.ℎmC.mℎD.与m,ℎ无关解析:b-a是组距,在频率分布直方图中,频率组距是表示该组的小矩形的高h,所以mb-a=ℎ,所以b-a=mℎ.答案:C8.某班有48名学生,在一次考试中统计出平均分为70分,方差为75分2,后来发现有2名同学的分数登错了,甲实得80分却记成了50分,乙实得70分却记成了100分,更正后平均分和方差分别为()A.70分,75分2B.70分,50分2C.70分,1.04分2D.65分,25分2解析:注意到平均数没有变化,只是方差变动.s2=148[…+(50-70)2+(100-70)2+…]=75分2,实际上s2=148[…+(80-70)2+(70-70)2+…]=50分2,故选B.答案:B9.某校高三年级有男生500人,女生400人,为了了解该年级学生的健康状况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是()A.简单随机抽样B.抽签法C.随机数法D.分层抽样解析:样本容量n=25+20=45,男生和女生的抽样比都是120,即按抽样比为120的分层抽样方法抽取样本.答案:D10.某示范农场的鱼塘放养鱼苗8万条,根据这几年的经验知道,鱼苗的成活率为95%,一段时间后准备打捞出售,第一网捞出40条,称得平均每条鱼2.5 kg,第二网捞出25条,称得平均每条鱼2.2 kg,第三网捞出35条,称得平均每条鱼2.8 kg,估计这时鱼塘中鱼的总质量为()A.192 280 kgB.202 280 kgC.182 280 kgD.172 280 kg解析:样本平均数x=40×2.5+25×2.2+35×2.840+25+35=2.53(kg),可知样本中平均每条鱼重2.53 kg,所以估计鱼塘中鱼的总质量约为80 000×95%×2.53=192 280(kg).答案:A11.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7例”.根据过去10天甲、乙、丙、丁四地新增疑似病例的数据,一定符合该标志的是()A.甲地:总体均值为3,中位数为4B.乙地:总体均值为1,总体方差大于0C.丙地:中位数为2,众数为3D.丁地:总体均值为2,总体方差为3解析:x=2,则s2=110[(x1−2)2+(x2−2)2+⋯+(x10-2)2],若有一天超过7人,不妨设x10=8,则s2≥110×(8−2)2=3.6>3,不合题意.故任何一天都不超过7人.答案:D12. 已知两个相关变量满足如下关系:A.y=0.56x+997.4B.y=0.63x-231.2C.y=50.2x+501.4D.y=60.4x+400.7解析:因为b=x1y1+x2y2+…+x5y5-5x yx12+x22+…+x52-5x2=0.56,a=y−b x=997.4.所以线性回归方程为y=0.56x+997.4.答案:A二、填空题:本大题共4小题,每小题5分.13.某市有大型超市200家、中型超市400家、小型超市1 400家.为掌握各类超市的营业情况,现按分层抽样方法抽取一个容量为100的样本,则应抽取中型超市家.解析:本题为分层抽样,所以应抽取中型超市400×100400+200+1400=20(家).答案:2014.某考察团对全国10大城市职工人均工资水平x(单位:千元)与居民人均消费水平y(单位:千元)进行统计调查,y与x具有线性相关关系,线性回归方程为y=0.66x+1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为.解析:将y=7.675代入y=0.66x+1.562,得x=611.366.所以7.675611.366≈83%.答案:83%15.如图是一个容量为100的样本的频率分布直方图,试根据图中的数据回答下列问题:(1)样本数据落在区间[2,6)内的频率为;(2)样本数据落在区间[6,10)内的频数为.解析:由频率分布直方图可得数据落在区间[2,6)内的频率为相应的小矩形的面积,即0.02×4=0.08,数据落在区间[6,10)内的频率为0.08×4=0.32,故数据落在区间[6,10)内的频数为100×0.32=32.答案:(1)0.08(2)3216.甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如图所示,则甲班、乙班的最高成绩各是,从图中看班的平均成绩较高.解析:从题图可以看出乙班的成绩集中在70分以上,且在80分以上的有6人,而甲班80分以上的只有4人,甲班的最低成绩是46分,对平均分影响较大.答案:96,92乙三、解答题:解答应写出文字说明、证明过程或演算步骤.17.(本小题满分10分)小明家2016年四个季度的用电量如下表:第三季度400第四季度200其中各种电器用电量如下表:根据如图所示三幅统计图回答:(1)从哪幅统计图可看出各个季度用电量变化情况??(2)从哪幅统计图可看出冰箱用电量超过总用电量的14(3)从哪幅统计图可以清楚地看出空调用电量?解:三幅统计图分别为折线统计图、扇形统计图和条形统计图,各自的优点如下:18.(本小题满分12分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下(单位:cm): 甲:9,10,11,12,10,20 乙:8,14,13,10,12,21.(1)绘出所抽取的甲、乙两种麦苗株高的茎叶图;(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况. 解:(1)茎叶图如图所示:(2)x 甲=9+10+11+12+10+206=12,x 乙=8+14+13+10+12+216=13,s 甲2≈13.67,s 乙2≈16.67.因为x 甲<x 乙,所以乙种麦苗平均株高较高.又因为s 甲2<s 乙2,所以甲种麦苗长得较为整齐.19. (本小题满分12分)2017年春节前,公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让过往返乡的摩托车驾驶人有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的抽取5人,则四川籍的应抽取几人?解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.(2)从题图可知,被询问了省籍的驾驶人员中广西籍的有5+20+25+20+30=100(人); 四川籍的有15+10+5+5+5=40(人).设四川籍的驾驶人员应抽取x人,依题意得5100=x40,解得x=2,即四川籍的应抽取2人.20.(本小题满分12分)某车间20名工人年龄数据如下表:(1)求这20名工人年龄的众数与极差(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.解:(1)由题中表可知,众数为30岁.极差为40-19=21(岁).(2)(3)这20名工人年龄的平均数为(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30(岁),所以这20名工人年龄的方差为s2=120[(19−30)2+3(28−30)2+3(29−30)2+5(30−30)2+4(31−30)2+3(32−30)2+(40−30)2]=12.6(岁2).21.(本小题满分12分)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差;(同一组中的数据用该组区间的中点值作代表)(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解:(1)(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.22.(本小题满分12分)某种瓶装溶液,因为装瓶机的不稳定性,所以很可能使每瓶的含量都不是标准的含量,我们随机抽出了20瓶,测得它们的含量(单位:百毫升)如下:12.1 11.9 12.2 12.2 12.0 12.1 12.9 12.1 12.3 12.5 11.7 12.4 12.3 11.8 11.3 12.1 11.4 11.6 11.2 12.2(1)根据数据列出频率分布表,画出频率分布直方图; (2)计算出这组数据的平均数和标准差;(结果精确到0.01)(3)结合(1)(2)的结果,根据实际意义写一个简短的报告.(对总体情况作出估计) 解:(1)频率分布表如下:频率分布直方图如图所示.(2)平均数x =120×(12.1+11.9+12.2+…+12.2) ≈12.02(百毫升).标准差s ≈√(12.1−12.02)2+(11.9−12.02)2+⋯+(12.2−12.02)220≈0.41(百毫升).(3)标准差相对于平均数来说比较小.从频率分布直方图中可以看出,每瓶的含量大致位于1 150毫升到1 250毫升之间.因此可判断装瓶机工作稳定.。
§8最小二乘估计
课时过关·能力提升
1.某地区调查了2~9岁的儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为
y=8.25x+60.13,下列叙述正确的是()
A.该地区一个10岁儿童的身高为142.63 cm
B.该地区2~9岁的儿童每年身高约增加8.25 cm
C.该地区9岁儿童的平均身高是134.38 cm
D.利用这个模型可以准确地预算该地区每个2~9岁儿童的身高
解析:由y=8.25x+60.13知斜率的估计值为8.25,说明每增加一个单位年龄,约增加8.25个单位身高,故选B.
答案:B
2.对具有线性相关关系的变量x,y有一组预测数据(x i,y i)(i=1,2,…,8),其回归直线方程是y=1
3
x+a,
且x1+x2+⋯+x8=2(y1+y2+⋯+y8)=6,则实数a的值是()
A.1
16B.1
8
C.1
4
D.1
2
解析:由题意易知x=3
4,y=3
8
,代入线性回归方程得a=1
8
.
答案:B
3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
y对x
A.y=x-1
B.y=x+1
C.y=88+1
2
x D.y=176
解析:方法一:由线性回归方程过样本中心点(176,176),排除A,B项,结合选项可得C为正确答案.
方法二:将表中的五组数值分别代入选项验证,可知y=88+1
2
x最适合.
答案:C
4.下表是某厂1月到4月用水量(单位:百吨)的一组数据:
用水量y与月份x,则a的值为()
A.5.25
B.5
C.2.5
D.3.5
解析:x=2.5,y=3.5,代入回归方程,得3.5=-0.7×2.5+a,故a=5.25.
答案:A
5.对某台机器购置后的运行年限x(x=1,2,3,…)与当年利润y的统计分析知x,y具备线性相关关系,线性回归方程为y=10.47-1.3x,估计该台机器最为划算的使用年限为()
A.7年
B.8年
C.9年
D.越长越划算
解析:当年利润小于或等于零时应该报废该机器,当y=0时,10.47-1.3x=0,解得x≈8.05.故估计该台机器最为划算的使用年限为8年.
答案:B
6.正常情况下,年龄在18岁到38岁的人,体重y(kg)对身高x(cm)的回归方程为y=0.72x-58.2,王能同学(20岁)身高178 cm,他的体重应该在kg左右.
解析:用回归方程对身高为178 cm的人的体重进行预测,当x=178时,y=0.72×178-58.2=69.96.
答案:69.96
7.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm.因为儿子的身高与父亲的身高有关,该老师用以上数据求出线性回归方程来预测他孙子的身高为
cm.
解析:儿子和父亲的身高可列表如下:
设线性回归方程为y−b x=176−173=3.
故线性回归直线方程为y=3+x,将x=182代入可预测他孙子的身高为185 cm.
答案:185
8.期中考试后,某班班主任对50名学生的成绩进行分析,得到数学成绩y与总成绩x之间具有线性相关关系,其线性回归方程为y=6+0.4x,由此可以估计:若两名同学的总成绩相差50分,则他们的数学成绩相差分.
答案:20
9. 已知某工厂在某年每月产品的总成本y(单位:万元)与该月产量x(单位:万件)之间的回归方程为
y=1.215x+0.974,计算当x=2时,总成本y的估计值为.
解析:当x=2时,总成本y的估计值y=1.215×2+0.974=3.404.
答案:3.404
10.一个车间为了规定工时定额,需要确定加工零件所花费时间,为此进行了10次试验,测得的数据如下:
如果
(1)y关于x的线性回归方程;
(2)x关于y的线性回归方程.
解:列表、计算.
≈0.668,
b=55950-10×55×91.7
38500-10×552
a=y−bx≈91.7-0.668×55=54.96,
即所求线性回归方程为y=0.668x+54.96.
(2)设所求线性回归方程为x=c+dy,
≈1.495.
d=55950-10×55×91.7
87777-10×91.72
则c=x−dy≈55-1.495×91.7≈-82.09,
即所求线性回归方程为x=1.495y-82.09.。