高一数学统计试题
- 格式:docx
- 大小:206.73 KB
- 文档页数:8
(名师选题)(精选试题附答案)高中数学第九章统计经典大题例题单选题1、某中学高一年级有400人,高二年级有320人,高三年级有280人,若每人被抽到的可能性都为0.2,用随机数表法在该中学抽取容量为n的样本,则n等于()A.80B.160C.200D.280答案:C分析:每个个体被抽的可能性等于样本容量除以总体数,由此列出关于n的方程并求解出结果.=0.2,解得n=200,由题意可知:n400+320+280故选:C.2、某校为了解学生的课外锻炼身体的情况,随机抽取了部分学生,对他们一周的课外锻炼时间进行了统计,统计数据如下表所示:则该校学生一周进行课外锻炼的时间的第40百分位数是()A.8.5B.8C.7D.9答案:A分析:根据百分位数的求法计算即可.抽取的学生人数为6+10+9+8+7=40.由40%×40=16,故第40百分位数为所有数据从小到大排序的第16项与第17项数据的平均数,=8.5.即8+92故选: A.3、下列调查方式较为合适的是()A.为了了解灯管的使用寿命,采用普查的方式B.为了了解我市中学生的视力状况,采用抽样调查的方式C.调查一万张面值为100元的人民币中有无假币,采用抽样调查的方式D.调查当今中学生喜欢什么体育活动,采用普查的方式答案:B分析:根据实际情况选择合适的调查方式即可判断.对A,为了了解灯管的使用寿命,应采用抽样调查的方式,故A错误;对B,为了了解我市中学生的视力状况,采用抽样调查的方式,故B正确;对C,调查一万张面值为100元的人民币中有无假币,采用抽样普查的方式,故C错误;对D,调查当今中学生喜欢什么体育活动,采用抽样普查的方式,故D错误.故选:B.4、2021年3月,树人中学组织三个年级的学生进行“庆祝中国共产党成立100周年”党史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图),则下列命题错.误.的是()A.成绩前200名的200人中,高一人数比高二人数多30人B.成绩第1-100名的100人中,高一人数不超过一半C.成绩第1-50名的50人中,高三最多有32人D.成绩第51-100名的50人中,高二人数比高一的多答案:D分析:根据饼状图和条形图提供的数据判断.由饼状图,成绩前200名的200人中,高一人数比高二人数多200×(45%−30%)=30,A正确;=45<50,B 由条形图知高一学生在前200名中,前100和后100人数相等,因此高一人数为200×45%×12正确;成绩第1-50名的50人中,高一人数为200×45%×0.2=18,因此高三最多有32人,C正确;第51-100名的50人中,高二人数不确定,无法比较,D错误.故选:D.5、某射击运动员6次的训练成绩分别为:88,91,89,88,86,85,则这6次成绩的第70百分位数为()A.89B.89.5C.90D.90.5答案:A分析:先将数据按从小到大的顺序排列,计算6×70%=4.2不是整数,则所求的是从小到大排列的第5位数6次考试数学成绩从小到大为:85,86,88,88,89,91,6×70%=4.2,∴这名学生6次训练成绩的第70百分位数为89 .故选:A6、某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率直方图如图所示,估计棉花纤维的长度的样本数据的80百分位数是()A.29 mmB.29.5 mmC.30 mmD.30.5 mm答案:A分析:先求得棉花纤维的长度在30 mm以下的比例为85%,在25 mm以下的比例为85%-25%=60%,从而可得80百分位数一定位于[25,30)内,进而可求出答案棉花纤维的长度在30 mm以下的比例为(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,在25 mm以下的比例为85%-25%=60%,因此,80百分位数一定位于[25,30)内,=29,由25+5×0.80−0.600.85−0.60可以估计棉花纤维的长度的样本数据的80百分位数是29 mm.故选:A7、根据气象学上的标准,连续5天的日平均气温低于10℃即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下:①平均数x̅<4;②平均数x̅<4且极差小于或等于3;③平均数x̅<4且标准差s≤4;④众数等于5且极差小于或等于4.则4组样本中一定符合入冬指标的共有()A .1组B .2组C .3组D .4组答案:B分析:举反例否定①;反证法证明②符合要求;举反例否定③;直接法证明④符合要求.①举反例:0,0,0,4,11,其平均数x̅=3<4.但不符合入冬指标;②假设有数据大于或等于10,由极差小于或等于3可知,则此组数据中的最小值为10−3=7,此时数据的平均数必然大于7,与x̅<4矛盾,故假设错误.则此组数据全部小于10. 符合入冬指标;③举反例:1,1,1,1,11,平均数x̅=3<4,且标准差s =4.但不符合入冬指标;④在众数等于5且极差小于等于4时,则最大数不超过9.符合入冬指标.故选:B .8、关于圆周率π,数学发展史上出现过许多很有创意的求法,如著名的浦丰实验和查理斯实验.受其启发,我们也可以通过设计下面的实验来估计π的值:先请全校m 名同学每人随机写下一个都小于1的正实数对(x,y );再统计两数能与1构成钝角三角形三边的数对(x,y )的个数a ;最后再根据统计数a 估计π的值,那么可以估计π的值约为( )A .4a mB .a+2mC .a+2m mD .4a+2m m答案:D解析:由试验结果知m 对0~1之间的均匀随机数x,y ,满足{0<x <10<y <1,面积为1,再计算构成钝角三角形三边的数对(x,y),满足条件的面积,由几何概型概率计算公式,得出所取的点在圆内的概率是圆的面积比正方形的面积,即可估计π的值.解:根据题意知,m 名同学取m 对都小于1的正实数对(x,y ),即{0<x <10<y <1, 对应区域为边长为1的正方形,其面积为1,若两个正实数x,y 能与1构成钝角三角形三边,则有{x 2+y 2<1x +y >10<x <10<y <1,其面积S =π4−12;则有a m =π4−12,解得π=4a+2m m故选:D .小提示:本题考查线性规划可行域问题及随机模拟法求圆周率的几何概型应用问题. 线性规划可行域是一个封闭的图形,可以直接解出可行域的面积;求解与面积有关的几何概型时,关键是弄清某事件对应的面积,必要时可根据题意构造两个变量,把变量看成点的坐标,找到试验全部结果构成的平面图形,以便求解.9、某校高一共有10个班,编号为01,02,…,10,现用抽签法从中抽取3个班进行调查,设高一(5)班被抽到的可能性为a ,高一(6)班被抽到的可能性为b ,则( )A .a =310,b =29B .a =110,b =19 C .a =310,b =310D .a =110,b =110答案:C分析:根据简单随机抽样的定义,分析即可得答案.由简单随机抽样的定义,知每个个体被抽到的可能性相等,故高一(5)班和高一(6)班被抽到的可能性均为310. 故选:C10、为调查参加考试的高二级1200名学生的成绩情况,从中抽查了100名学生的成绩,就这个问题来说,下列说法正确的是( )A .1200名学生是总体B .每个学生是个体C .样本容量是100D .抽取的100名学生是样本答案:C分析:根据总体、个体、样本容量、样本的定义,结合题意,即可判断和选择.根据题意,总体是1200名学生的成绩;个体是每个学生的成绩;样本容量是100,样本是抽取的100名学生的成绩;故正确的是C.故选:C.填空题11、某市A、B、C三个区共有高中学生20000人,其中A区高中学生7000人,现采用分层抽样的方法从这三个区所有高中学生中抽取一个容量为600人的样本进行学习兴趣调查,则A区应抽取__________________.答案:210分析:根据总体数和要抽取的样本数,得到每个个体被抽到的概率,利用这个概率乘以A区的人数,得到A区要抽取的人数.解:由题意知A区在样本中的比例为700020000∴A区应抽取的人数是700020000×600=210.所以答案是:210.12、某单位有员工900人,其中女员工有360人,为做某项调查,拟采用分层抽样的方法抽取容量为150的样本,则应抽取的男员工人数是_______________________.答案:90分析:按照分层抽样的定义,按照比例抽取即可由题意,设应抽取的男员工人数是x则900−360900=x150解得:x=90所以答案是:9013、已知一组数据:20,30,40,50,50,60,70,80,记这组数据的第60百分位数为a,众数为b,则a和b的大小关系是______________.(用“<”“>”或“=”连接)答案:a=b##b=a分析:由百分位数求法得50为第60百分位数,并确定数据的众数,即可比较它们的大小关系.因为8×60%=4.8,所以这组数据的第5个数:50为第60百分位数.观察易知这组数据的众数为50,所以a和b的大小关系是a=b.所以答案是:a=b14、某校从高一新生中随机抽取了一个容量为20的身高样本,数据从小到大排序如下(单位:cm):152 ,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170 ,171,x,174,175,若样本数据的第90百分位数是173,则x的值为________.答案:172分析:根据百分位数的意义求解.百分位数的意义就在于,我们可以了解的某一个样本在整个样本集合中所处的位置,=173,x=172本题第90百分位数是173,所以x+1742故答案为:172小提示:本题考查样本数据的第多少百分位数的概念.15、气象意义上从春季进入夏季的标志为连续5天的日平均温度均不低于22℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据:(记录数据都是正整数)①甲地5个数据的中位数为24,众数为22;②乙地5个数据的中位数为27,总体均值为24;③丙地5个数据中有一个数据是32,总体均值为26,总体方差为10.8.则肯定进入夏季的地区有_____.答案:①③分析:根据数据的特点进行估计甲、乙、丙三地连续5天的日平均气温的记录数据,分析数据的可能性进行解答即可得出答案.①甲地:5个数据的中位数为24,众数为22,根据数据得出:甲地连续5天的日平均温度的记录数据可能为:22、22、24、25、26,其连续5天的日平均气温均不低于22;②乙地:5个数据的中位数为27,总体均值为24,当5个数据为19、20、27、27、27,可知其连续5天的日平均温度有低于22,故不确定;③丙地:5个数据中有一个数据是32,总体均值为26,若有低于22,假设取21,此时方差就超出了10.8,可知其连续5天的日平均温度均不低于22,如22、25、25、26、32,这组数据的平均值为26,方差为10.8,但是进一步扩大方差就会超过10.8,故③对.则肯定进入夏季的地区有甲、丙两地,故答案为①③.小提示:本题考查中位数、众数、平均数、方差的数据特征,简单的合情推理,解答此题应结合题意,根据平均数的计算方法进行解答、取特殊值即可.解答题16、为了了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如图所示.(1)求图中a的值;(2)估计这种植物果实重量的平均数x̅(同一组中的数据用该组区间的中点值作代表);(3)已知这种植物果实重量不低于37.5克的即为优质果实,现对该种植物果实的某批10000个果实进行检测.据此估算这批果实中的优质果实的个数.答案:(1)a=0.050(2)40(3)7000分析:(1)由各组频率之和为1(面积之和为1)可求得;(2)频率分布直方图用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和估计平均数;(3)用样本频率估计总体概率进行求解.(1)由题意,有(0.020+0.040+0.075+a+0.015)×5=1,解得a=0.050;(2)这种植物果实重量的平均数约为:30×0.020×5+35×0.040×5+40×0.075×5+45×0.050×5+50×0.015×5=40,∴这种植物果实重量的平均数x̅的估计值约为40.(3)样本中,这种植物果实重量不低于37.5克,即优质果实的频率为0 .075×5+0.050×5+0.015×5=0.7,由此估计某批10000个果实中,重量不低于37.5克,即优质果实的概率为0.7,∴这批果实中的优质果实的个数约为10000×0.7=7000个.17、第24届北京冬季奥林匹克运动会于2022年2月4日至2月20日在北京和张家口联合举办.这是中国历史上第一次举办冬季奥运会,它掀起了中国人民参与冬季运动的大热潮.某市举办了中学生滑雪比赛,从中抽取40名学生的测试分数绘制成茎叶图和频率分布直方图如下,后来茎叶图受到了污损,可见部分信息如图.(1)求频率分布直方图中a的值,并根据直方图估计该市全体中学生的测试分数的平均数(同一组中的数据以这组数据所在区间中点的值作代表,结果保留一位小数);(2)现要对测试成绩在前26%的中学生颁发“滑雪达人”证书,并制定出能够获得证书的测试分数线,请你用样本来估计总体,给出这个分数线的估计值.答案:(1)a=0.02,平均数为74.5(2)82分析:(1)计算出测试分数位于[90,100]个数,可求得测试分数位于[80,90)的个数,由此可求得a的值,将每个矩形底边的中点值乘以对应矩形的面积,将所得结果全加可得样本的平均数;(2)设能够获得证书的测试分数线为x,分析可得80<x<90,根据已知条件可得出关于x的等式,求解即可. (1)解:由频率分布直方图可知,测试分数位于[90,100]的频率为10×0.01=0.1,则测试分数位于[90,100]个数为40×0.1=4,所以,测试分数位于[80,90)的个数为40−(4+10+14+4)=8,÷10=0.02.所以a=840估计平均数为55×0.1+65×0.25+75×0.35+85×0.2+95×0.1=74.5.(2)解:因为测试分数位于[90,100]的频率为0.1,测试分数位于[80,90)的频率为0.2,能够获得“滑雪达人”证书的中学生测试分数要在前26%,故设能够获得证书的测试分数线为x,则80<x<90,由(90−x)×0.02=0.26−0.1,可得x=82,所以分数线的估计值为82.18、某中学要从高一年级甲乙两个班级中选择一个班参加电视台组织的“环保知识竞赛”,该校对甲乙两班的参赛选手(每班7人)进行了一次环保知识测试,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生的平均分是85,乙班学生成绩的中位数是85.(1)求x,y的值;(2)根据茎叶图,求甲乙两班同学方差的大小,并从统计学角度分析,该校应选择甲班还是乙班参赛.答案:(1)x=9,y=5;(2)乙班成绩比较稳定,故应选乙班参加.分析:(1)利用茎叶图,根据甲班7名学生成绩的平均分是85,乙班7名学生成绩的中位数是85.先求出x,y,(2)求出乙班平均分,再求出甲班7名学生成绩方差和乙班名学生成绩的方差,由此能求出结果.解:(1)甲班的平均分为:17(75+78+80+80+x+85+92+96)=85;解得x=9,∵乙班7名学生成绩的中位数是85,∴y=5,(2)乙班平均分为:17(75+80+80+85+90+90+95)=85;甲班7名学生成绩方差S12=17(102+72+52+42+02+72+112)=3607,乙班名学生成绩的方差S22=17(102+52+52+02+52+52+102)=3007,∵两个班平均分相同,S22<S12,∴乙班成绩比较稳定,故应选乙班参加.小提示:本题考查茎叶图的应用,解题时要认真审题,属于基础题.19、2019年下半年以来,各地区陆续出台了“垃圾分类”的相关管理条例,实行“垃圾分类”能最大限度地减少垃圾处置量,实现垃圾资源利用,改善垃圾资源环境,某部门在某小区年龄处于[20,45]岁的人中随机地抽取x人,进行了“垃圾分类”相关知识掌握和实施情况的调查,并把达到“垃圾分类”标准的人称为“环保族”,得到如图示各年龄段人数的频率分布直方图和表中的统计数据.(1)求x、y、z的值;(2)根据频率分布直方图,估计这x人年龄的平均值(同一组数据用该区间的中点值代替,结果按四舍五入保留整数);(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,并在这9人中选取2人作为记录员,求选取的2名记录员中至少有一人年龄在[30,35]中的概率.答案:(1){x=200y=0.625z=6;(2)30.75;(3)1318.分析:(1)由频率分布直方图和频数分布表能求出x、y、z;(2)根据频率分布直方图,能估计这x人年龄的平均值;(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,[25,30)中选5人,分别记为A、B、C、D、E,[30,35]中选4人,分别记为a、b、c、d,在这9人中选取2人作为记录员,利用列举法列举出所有的基本事件,然后利用古典概型的概率公式可求得所求事件的概率.(1)由题意得:{x=450.750.06×5=200y=25200×0.04×5=0.625z=200×0.03×5×0.2=6;(2)根据频率分布直方图,估计这x人年龄的平均值为:x=22.5×0.3+27.5×0.2+32 .5×0.2+37.5×0.15+42.5×0.15=30.75;(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,从[25,30)中选:9×2525+20=5人,分别记为A、B、C、D、E,从[30,35]中选:9×2025+20=4人,分别记为a、b、c、d,在这9人中选取2人作为记录员,所有的基本事件有:(A,B)、(A,C)、(A,D)、(A,E)、(A,a)、(A,b)、(A,c)、(A,d)、(B,C)、(B,D)、(B,E)、(B,a)、(B,b)、(B,c)、(B,d)、(C,D)、(C,E)、(C,a)、(C,b)、(C,c)、(C,d)、(D,E)、(D,a)、(D,b)、(D,c)、(D,d)、(E,a)、(E,b)、(E,c)、(E,d)、(a,b)、(a,c)、(a,d)、(b,c)、(b,d)、(c,d),共36种,选取的2名记录员中至少有一人年龄在[30,35]包含的基本事件有:(A,a)、(A,b)、(A,c)、(A,d)、(B,a)、(B,b)、(B,c)、(B,d)、(C,a)、(C,b)、(C,c)、(C,d)、(D,a)、(D,b)、(D,c)、(D,d)、(E,a)、(E,b)、(E,c)、(E,d)、(a,b)、(a,c)、(a,d)、(b,c)、(b,d)、(c,d),共26种,因此,选取的2名记录员中至少有一人年龄在[30,35]中的概率P=2636=1318.小提示:本题考查频率、平均数、概率的求法,考查频数分布表、频率分布直方图、分层抽样、古典概型的性质等基础知识,考查数据分析能力、运算求解能力,是基础题.。
高一数学统计试题1.为了调查甲、乙两种品牌商品的市场认可度,在某购物网点随机选取了14天,统计在某确定时间段的销量,得如下所示的统计图,根据统计图求:(1)甲、乙两种品牌商品销量的中位数分别是多少?(2)甲品牌商品销量在[20,50]间的频率是多少?(3)甲、乙两个品牌商品哪个更受欢迎?并说明理由.【答案】(1) 甲、乙两种品牌商品销量的中位数分别是;(2)甲品牌商品销量在间的频率;(3)甲品牌商品更受欢迎.【解析】(1)利用茎叶图能求出甲、乙两种品牌商品销量的中位数;(2)甲品牌商品销量在间的数据有共5个,由此能求出甲品牌商品销量在间的频率.(3)求出甲品牌商品的日平均销售量和乙品牌商品的日平均销售量,由此能求出结果.试题解析:(1)甲的数据由小到大为:乙的数据由小到大为:所以甲、乙两种品牌商品销量的中位数分别是.(2) 甲品牌商品销量在间的数据有共5个,所以甲品牌商品销量在间的频率.(3) 解一:甲品牌商品的日平均销售量为:,乙品牌商品的日平均销售量为:,由知甲品牌商品更受欢迎.【考点】中位数、频率的求法;平均数的应用.2.青年歌手电视大赛共有10名选手参加,并请了7名评委,如图所示的茎叶图是7名评委给参加最后决赛的两位选手甲、乙评定的成绩,流程图用来编写程序统计每位选手的成绩(各评委所给有效分数的平均值),试根据所给条件回答下列问题:(1) 根据茎叶图,选手乙的成绩中,众数是多少?选手甲的成绩中,中位数是多少?(2) 在流程图(如图所示)中,用k表示评委人数,用a表示选手的成绩(各评委所给有效分数的平均值).横线①、②处应填什么?(3) 根据流程图,甲、乙的成绩分别是多少?【答案】(1) 84,85;(2) ①,②;(3) 84.2,85.【解析】(1)由众数与中位数概念易得,但要注意茎叶图所含的数据是什么,对于中位数的求法要先把这组数据从大到小或从小到大排列,当数据个数为奇数时,中位数为最中间一个数,当数据个数为偶数个时,中位数为最中间两个数的平均值,(2)由于满足条件要跳出循环结构,k的值是用来控制数据个数,所以①中要填,去掉一个最大数据与一个最小数据再求平均值,所以②中填,(3)由流程图可知a的值即去掉一个最大数据与一个最小数据再求平均值,因此易得甲与乙的成绩.试题解析:(1) 选手乙的成绩为79,84,84,84,86,87,93,众数为84,选手甲的成绩为75,78,84,85,86,88,92,中位数为85;(2) ①;②;(3) ,.【考点】1,众数,中位数的概念;2,茎叶图及程序框图的理解,数据处理能力.3.如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:请观察图形,求解下列问题:(1)79.5~89.5这一组的频率、频数分别是多少?(2)估计这次环保知识竞赛的及格率(60分及以上为及格)和平均分.【答案】(1)0.25,15; (2)0.75, 70.5【解析】(1)利用频率分布直方图中,纵坐标与组距的乘积是相应的频率,频数=频率×组距,可得结论;(2)纵坐标与组距的乘积是相应的频率,再求和,即可得到结论.试题解析:(1)由频率的意义可知,成绩在79.5~89.5这一组的频率为:0.025×10=0.25,频数:60×0.25=15;(2)利用纵坐标与组距的乘积是相应的频率可得及格率为0.015×10+0.025×10+0.03×10+0.005×10=0.75平均分为: 70.5【考点】用样本的频率分布估计总体分布;频率分布直方图.4.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为()A.B.C.D.2【答案】D【解析】由题意知,解得a=-1,∴样本方差为S2=,故选D.【考点】方差与标准差.5.某单位N名员工参加“社区低碳你我他”活动,他们的年龄在25岁至50岁之间。
高中数学-统计-测试练习题1. 2018年央视大型文化节目《经典咏流传》的热播,在全民中掀起了诵读诗词的热潮,节目组为热心观众给以奖励,要从2018名观众中抽取50名幸运观众,先用简单随机抽样从2018人中剔除18人,剩下的2000人再按系统抽样的方法抽取50人,则在2018人中,每个人被抽到的可能性()A.均不相等B.不全相等C.都相等,且为251009D.都相等,且为1402. 下列属于相关现象的是()A.利息与利率B.居民收入与储蓄存款C.电视机产量与苹果产量D.某种商品的销售额与销售价格3. 将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个得分的平均分为91,现场做的7个得分的茎叶图(如图)后来有一个数据模糊,无法辨认,在图中用x表示,则x的值为()A.0B.4C.5D.74. 在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本,有以下三种抽样方法:①采用随机抽样法,将零件编号为00,01,…,99,抽签取出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组随机抽取1个;③采用分层抽样法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.则下述判断中正确的是()A.不论采用何种抽样方法,这100个零件中每个被抽到的可能性均为15B.①、②两种抽样方法,这100个零件中每个被抽到的可能性均为15;③并非如此C.①、③两种抽样方法,这100个零件中每个被抽到的可能性均为15;②并非如此D.采用不同的抽样方法,这100个零件中每个被抽到的可能性是各不相同的5. 某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:∘C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i,y i)(i=1,2,⋯,20)得到下面的散点图:由此散点图,在10∘C至40∘C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+bxB.y=a+bx2C.y=a+be xD.y=a+b ln x6. 某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其平均数和方差分别为x和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的平均数和方差分别为()A.x¯,s2+1002B.x¯+100,s2+1002C.x¯,s2D.x¯+100,s27. 某校有高中生1470人,现采用系统抽样法抽取49人做问卷调查,将高一、高二、高三学生(高一、高二、高三分别有学生495人、493人、482人)按1,2,3, (1470)号,若第一组用简单随机抽样的方法抽取的号码为23,则所抽样本中高二学生的人数为( )A.15B.16C.17D.188. 某学校有教职员工150人,其中高级职称15人,中级职称45人,一般职员90人,现在用分层抽样抽取30人,则样本中各职称人数分别为()A.5,10,15B.3,9,18C.3,10,17D.5,9,169. 在下列各图中,每个图的两个变量具有相关关系的图是()A.(1)(2)B.(1)(3)C.(2)(4)D.(2)(3)10. 一组数据中的每一个数据都乘以2,再减去80,得到一组新数据,若求得的新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是()A.40.6,1.1B.48.8,4.2C.81.2,44.4D.78.8,75.611. 我国于2015年10月宣布实施普遍二孩政策,为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为140的调查样本,其中城镇户籍与农村户籍各70人;男性60人,女性80人,绘制的不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图如图所示,其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述正确的是( )A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别有关C.调查样本中倾向选择生育二胎的人群中,男性人数与女性人数相同D.倾向选择不生育二胎的人群中,农村户籍人数多于城镇户籍人数12. 给出下列命题,其中正确的命题有()A.若a∈R,则(a+1)i是纯虚数B.随机变量X∼N(3,22),若X=2η+3,则D(η)=1C.公共汽车上有10位乘客,沿途5个车站,乘客下车的可能方式有105种D.回归方程为ŷ=0.85x−85.71中,变量y与x具有正的线性相关关系E.P(A)=0.5,P(B)=0.3,P(AB)=0.2,则P(A|B)=0.413. “微信运动”是腾讯开发的一个记录跑步或行走情况(步数里程)的公众号用户通过该公众号可查看自己某时间段的运动情况.某人根据2018年1月至2018年11月期间每月跑步的里程(单位:十公里)的数据绘制了下面的折线图.根据该折线图,下列结论正确的是( )A.月跑步里程逐月增加B.月跑步里程最大值出现在10月C.月跑步里程的中位数为5月份对应的里程数D.1月至5月的月跑步里程相对于6月至11月,波动性更小,变化比较平稳14. 下列抽样方法是简单随机抽样的是()A.从50个零件中随机抽取5个做质量检验B.从50个零件中有放回地抽取5个做质量检验C.从整数集中随机抽取10个分析奇偶性D.运动员从8个跑道中随机选取一个跑道15. 对于表中x,y之间的一组数据:甲、乙两位同学给出的拟合直线方程分别为①y=13x+1和②y=12x+12.若通过分析得出②的拟合效果好,则下列分析理由正确的是()参考公式:R2=1−∑ni=1(y i−y i)2∑n i=1(y i−y¯)2.A.①的残差和大于②的残差和,所以②拟合效果更好B.①的残差平方和大于②的残差平方和,所以②拟合效果更好C.①的R2小于②的R2,所以②拟合效果更好D.残差图中直线②的残差点分布的水平带状区域比①的残差点分布的水平带状区域更窄,所以直线②拟合效果更好16. 某工厂生产甲、乙、丙三种不同型号的产品,产量分别为360、240、120,为检验产品的质量,现需从以上所有产品中抽取一个容量为60的样本进行检验,则下列说法正确的是()A.如果采用系统抽样的方法抽取,不需要先剔除个体B.如果采用分层抽样的方法抽取,需要先剔除个体C.如果采用系统抽样的方法抽取,抽取过程不需要运用简单随机抽样的方法D.如果采用分层抽样的方法抽取时,所有产品被抽中的概率相等17. 某公司生产三种型号的轿车,产量分别为1500辆,6000辆和2000辆.为检验该公司的产品质量,公司质监部门要抽取76辆进行检验,则下列说法正确的是( )A.应采用抽签法抽取B.应采用分层随机抽样抽取C.三种型号的轿车依次应抽取12辆,48辆,16辆D.这三种型号的轿车,每一辆被抽到的概率都是相等的18. 频率分布直方图中各小长方体的面积和为________.19. 从某500件产品中随机抽取50件进行质检,利用随机数表法抽取样本时,先将这500件产品按001,002,003,…,500进行编号.如果从随机数表第第7行第4列的数2开始,从左往右读数,则依次抽取的第4个个体的编号是________.(下面摘录了随机数表第6行至第8行各数)16 22 77 94 3949 54 43 54 8217 37 93 23 7887 35 20 96 4384 26 34 91 6484 42 17 53 3157 24 55 06 8877 04 74 47 6721 72 06 50 2583 42 16 33 7663 01 63 78 5916 95 55 67 1998 10 50 71 7512 86 73 58 0744 39 52 38 79.20. 2008年5月12日,四川汶川地区发生里氏8.0级特大地震.在随后的几天中,地震专家对汶川地区发生的余震进行了监测,记录的部分数据如下表:注:地震强度是指地震时释放的能量地震强度(x)和震级(y)的模拟函数关系可以选用y=a lg x+b(其中a,b为常数).利用散点图可知a的值等于________.(取lg2=0.3)21. 如图为两种商品2019年前三季度销售量的折线统计图,结合统计图,下列说法中正确的有________.①1∼6月,商品B的月销售量都超过商品A.②7月份商品A与商品B的销售量相等.③对于商品B,7∼8月的月销售量增长率与8∼9月的月销售量增长率相同.④2019年前三季度商品A的销量逐月增长.22. 将参加夏令营的100名学生编号为001,002,…,100.先采用系统抽样方法抽取一个容量为20的样本,若随机抽得的号码为003,那么从048号到081号被抽中的人数是________.23. 某工厂的某种型号的机器的使用年限x和所支出的维修费用y(万元)有下表的统计资料:根据该表可得回归方程ŷ=1.23x+â,据此模型估计,该型号机器使用年限为9年的维修费用大约为________万元.24. 世卫组织规定,PM2.5日均值在35微克/立方米以下空气质量为一级;在35微克/立方米∼75微克/立方米之间空气质量为二级;在75微克/立方米以上空气质量为超标.清远市环保局从市区2013年全年每天的PM2.5监测数据中随机抽取15天的数据作为样本,监测值如茎叶图所示(十位为茎,个位为叶),从这15天的数据中任取3天的数据,则恰有一天空气质量达到一级的概率为________(用分数作答).25. 随着智能手机的发展,微信越来越成为人们交流的一种方式,某机构对使用微信交流的态度进行调查,随机调查了50人,他们年龄的频数分布及对使用微信交流赞成人数如下表:分界点对使用微信交流的态度有差异;(Ⅱ)若对年龄在[55, 65)的被调查人中随机抽取两人进行追踪调查,求至少有1人赞成使用微信交流的概率.,其中n=a+b+c+d参考公式:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)参考数据:26. 设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i, y i)(i=1, 2,…,n),用最小二乘法建立的回归方程为y=0.85x−85.71,给定下列结论:①y与x具有正的线性相关关系;②回归直线过样本点的中心(x¯, y¯);③若该大学某女生身高增加1cm,则其体重约增加0.85kg;④若该大学某女生身高为170cm,则可断定其体重必为58.79kg.其中正确的结论是________.27. 为了解M离子在小鼠体内的残留程度,进行如下试验:给100只小鼠服M离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同,经过一段时间后检测出残留在小鼠体内离子的百分比.根据试验数据得到如图频率分布直方图,则图中a=________;估计M离子残留百分比的平均数为________.(同组中的每个数据用该组区间的中点值代替)28. 成年人收缩压的正常范围是(90,140)(单位:mmHg),未在此范围的献血志愿者不适合献血.某血站对志愿者的收缩压进行统计,随机抽取男志愿者100名、女志愿者100名,根据统计数据分别得到如下直方图:(1)根据直方图计算这200名志愿者中不适合献血的总人数;(2)估计男志愿者收缩压的中位数;(3)估计女志愿者收缩压的平均值(同一组中的数据用该组区间的中点值为代表).29. 甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:(1)用茎叶图表示这两组数据;(2)现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标准差中选两个)考虑,你认为选派哪位学生参加合适?请说明理由.30. 某商场为了调查旅游鞋的销售情况,随机抽取了40位顾客的购鞋尺寸,将所得数据整理后,画出频率分布直方图如下,其中直方图从左到右前3个小矩形的面积之比为1:2:3,试估计(1)购鞋尺寸在39.5∼43.5内的顾客所占的百分比是多少?(2)样本数据的中位数是多少?(精确到0.01)31. 为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这一次竞赛,为了解本次竞赛成绩情况,从中抽取了部分学生的成绩进行统计,请你根据尚未完成并有局部污损的频率分布表和频率分布直方图,解答下列问题:(1)填充频率分布表的空格(将答案直接填在表格内);7分(2)补全频率分布直方图;11分(3)若成绩在60.5∼80.5分的学生为三等奖,问全校获得三等奖的学生约为多少人?32. 目前,我国老年人口比例不断上升,造成日趋严峻的人口老龄化问题.2019年10月12日,北京市老龄办、市老龄协会联合北京师范大学中国公益研究院发布《北京市老龄事业发展报告(2018)》,相关数据有如下图表.规定年龄在15岁至59岁为“劳动年龄”,具备劳动力,60岁及以上年龄为“老年人”,据统计,2018年底北京市每2.4名劳动力抚养1名老年人.(1)请根据上述图表计算北京市2018年户籍总人口数和北京市2018年的劳动力数;(保留两位小数)(2)从2014年起,北京市老龄人口与年份呈线性关系,比照2018年户籍老年人人口年龄构成,预计到2020年年底,北京市90以上老人达到多少人?(精确到1人)(附:对于一组数据(u 1,v 1),(u 2,v 2),⋯⋯,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘法估计分别为:β̂=∑u i n i=1v i −nu ¯⋅v¯∑u i 2n i=1−nu¯2,α̂=v ¯−β̂u ¯,2×27.62+1×11.02+1×8.98+2×24.78=124.8)参考答案与试题解析高中数学-统计-测试练习题一、选择题(本题共计 10 小题,每题 3 分,共计30分)1.【答案】C【考点】简单随机抽样【解析】此题暂无解析【解答】解:因为在系统抽样中,若所给的总体个数不能被样本容量整除,则要先剔除几个个体,再分组.在剔除过程中,每个个体被剔除的概率相等,所以每个个体被抽到包括两个过程,一是不被剔除,二是选中,这两个过程是相互独立的,所以每人入选的概率P=502018=251009.故选C.2.【答案】B【考点】变量间的相关关系【解析】根据所学函数关系和相关关系的概念逐一核对四个选项即可得到正确答案.【解答】如果当一个变量的取值一定时,另一个变量的取值带有一定的随机性,我们称这样的两个变量具有相关关系,也就是说两个变量之间即不存在函数关系,又不是完全没有关系,选项A中的两个变量具有函数关系;选项B中居民收入与储蓄存款具有相关关系,一般来说,居民收入越高对应的储蓄存款越多;选项C中的电视机产量与苹果产量吴任何关系;选项D中某种商品的销售额与销售价格具有函数关系.互选B.3.【答案】A【考点】茎叶图【解析】根据茎叶图提供的数据,去掉1个最高分和1个最低分后,利用公式求平均数可得x的值.【解答】解:选手的7个得分中去掉1个最高分96,去掉1个最低分86,剩余5个得分为88,93,90,94,(90+x);它们的平均分为88+93+90+94+(90+x)5=91,∴ x =0; 故选:A . 4. 【答案】 A【考点】 简单随机抽样 分层抽样方法 系统抽样方法【解析】样本代表性的好坏直接影响统计结论的准确性,所以抽样过程中,考虑的最主要原则是保证样本能够很好地代表总体.而随机抽样的出发点是使每个个体都有相同的机会被抽中,这是基于对样本数据代表性的考虑. 【解答】解:根据抽样的定义知道,三种抽样方法的特点就是保证了每个个体从总体中抽到的可能性都相同, 保证了总体中每个个体被抽到的概率相等的公平性. 故选A . 5.【答案】 D【考点】 散点图 【解析】将散点图近似判断为所学函数图象,根据近似函数图象选择合适的回归方程即可. 【解答】解:由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适宜作为发芽率y 和温度x 的回归方程类型的是 y =a +b ln x . 故选D . 6. 【答案】 D【考点】极差、方差与标准差 众数、中位数、平均数【解析】根据变量之间均值和方差的关系和定义,直接代入即可得到结论. 【解答】解:由题意知y i =x i +100,则y ¯=110(x 1+x 2+...+x 10+100×10)=110(x1+x2+⋯+x10)+100=x¯+100,方差:s2=110[(x1+100−x¯−100)2+(x2+100−x¯−100)2+⋯+(x10+100−x¯−100)2]=110[(x1−x¯)2+(x2−x¯)2+⋯+(x10−x¯)2]=s2.故选D.7.【答案】C【考点】系统抽样方法【解析】由题意,求得高二学生的编号为496−988,再得出分组的组距为147049=30,根据第一组用简单随机抽样的方法抽取的号码为23,得出抽取的号码满足30n−7,列出不等式,即可求解.【解答】解:由题意得高二学生的编号为496−988,分组的组距为147049=30,因为由第一组用简单随机抽样的方法抽取的号码为23,所以抽取的号码满足23+(n−1)×30=30n−7,n∈N+,令496≤30n−7≤988,解得50330≤n≤99530,n∈N+,所以n可取17个数.故选C.8.【答案】B【考点】分层抽样方法【解析】求出样本容量与总容量的比,然后用各层的人数乘以得到的比值即可得到各层应抽的人数.【解答】解:由30150=15,所以,高级职称人数为15×15=3(人);中级职称人数为45×15=9(人);一般职员人数为90×15=18(人).所以高级职称人数、中级职称人数及一般职员人数依次为3,9,18.故选B.9.【答案】D【考点】利用散点图识别两变量之间关系【解析】仔细观察图象,寻找散点图间的相互关系,主要观察这些散点是否围绕一条曲线附近排列着,由此能够得到正确答案.【解答】解:散点图(1)中,所有的散点都在曲线上,所以(1)具有函数关系;散点图(2)中,所有的散点都分布在一条直线的附近,所以(2)具有相关关系;散点图(3)中,所有的散点都分布在一条曲线的附近,所以(3)具有相关关系,散点图(4)中,所有的散点杂乱无章,没有分布在一条曲线的附近,所以(4)没有相关关系.故选D.10.【答案】A【考点】极差、方差与标准差【解析】设出原来的一组数据,使数据中的每一个数据都都乘以2,再都减去80,得到一组新数据求得新数据的平均数是1.2,方差是4.4,根据这些条件列出算式,合并同类项,做出原来数据的平均数,再利用方差的关系式求出方差结果.【解答】设原来的一组数据是x1,x2...x n,∵每一个数据乘以2,再都减去80得到新数据且求得新数据的平均数是1.2,方差是4.4,2x1−80+2x2−80+⋯2x n−80=1.2n∴2x1+2x2+⋯2x n=1.2+80=81.2nx1+x2+⋯x n=40.6n又∵数据都减去同一个数,没有改变数据的离散程度,∴2x1,2x2...2x n的方差为:4.4,×4.4=1.1.从而原来数据x1,x2...x n的方差为:122二、多选题(本题共计 7 小题,每题 3 分,共计21分)11.【答案】A,B,C【考点】收集数据的方法【解析】由比例图,可得是否倾向选择生育二胎与户籍、性别有关,倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员中的男性人数与女性人数,即可得出结论.【解答】解:由不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图,知:城镇户籍倾向选择生育二胎的比例为40%,农村户籍倾向选择生育二胎的比例为80%,∴是否倾向选择生育二胎与户籍有关,故A正确;男性倾向选择生育二胎的比例为80%,女性倾向选择生育二胎的比例为60%,∴是否倾向选择生育二胎与性别有关,故B正确;男性倾向选择生育二胎的比例为80%,人数为60×80%=48人,女性倾向选择生育二胎的比例为60%,人数为80×60%=48人,∴倾向选择生育二胎的人群中,男性人数与女性人数相同,故C正确;倾向选择不生育二胎的人群中,农村户籍人数为70×(1−80%)=14人,城镇户籍人数为70×(1−40%)=42人,∴倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,故D错误.故选ABC.12.【答案】B,D【考点】条件概率与独立事件离散型随机变量的期望与方差分步乘法计数原理复数的基本概念两个变量的线性相关【解析】A选项根据纯虚数的概念利用特殊值a=−1即可判断错误. B选项根据离散型分布列期望与方差的性质可以进行判断. C选项考查简单计数问题. D选项考查两个变量的线性相关性. E 选项考查条件概率的计算方式.【解答】解:A,当a=−1,(a+1)i=(−1+1)i=0,故A错误;B,随机变量X∼N(3,22),则E(X)=3,D(X)=4,若X=2η+3,则D(X)=22×D(η)=4,解得D(η)=1,故B正确;C,由分步乘法计数原理可知,每位乘客下车方法有5种,所以乘客下车的可能方式有510中,故C错误;D,由回归方程的形式可知,0.85>0,变量y与x具有正的线性相关关系,变量x增加1个单位时,y平均增加0.85个单位,故D正确;E,由条件概率公式可得P(A|B)=P(AB)P(B)=23,故E错误.故选BD.13.【答案】B,C,D【考点】用样本的数字特征估计总体的数字特征【解析】此题暂无解析 【解答】解:由2018年1月至2018年11月期间每月跑步的里程的数据,绘制的折线图,知: 在A 中,月跑步里程2月、7月、8月和11月减少,故A 错误; 在B 中,月跑步里程高峰期大致在9、10月,故B 正确;在C 中,月跑步里程的中位数为5月份对应的里程数,故C 正确;在D 中,1月至5月的月跑步里程相对于6月至11月,波动性更小,变化比较平稳,故D 正确. 故选BCD . 14. 【答案】 A,D【考点】 简单随机抽样 【解析】根据简单随机抽样的定义和使用条件,逐项判定,即可求解. 【解答】解:对于A 中,从50个零件中随机抽取5个做质量检验,符合简单随机抽样的定义和条件,所以是简单的随机抽样;对于B 中,从50个零件中有放回地抽取5个做质量检验是又放回抽样,不符合简单随机抽样的使用条件,不是简单的随机抽样;对于C 中,从整数集中随机抽取10个分析奇偶性,其中整数集为无限集,不符合简单随机抽样的条件,不是简单的随机抽样;对于D 中,运动员从8个跑道中随机选取一个跑道,符合简单随机抽样的定义和条件,所以是简单随机抽样. 故选AD . 15.【答案】 B,C,D 【考点】求解线性回归方程 【解析】根据所给的两条直线的方程和五个坐标点,求出用y =13x +1作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和,用y =12x +12作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和,比较分析A ,B ,D 的正误,再求得①的R 2与②的R 2分析C 的正误. 【解答】解:用y =13x +1作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为: S 1=(1−43)2+(2−2)2+(3−3)2+(4−103)2+(5−113)2=73.用y =12x +12作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为: S 2=(1−1)2+(2−2)2+(3−72)2+(4−4)2+(5−92)2=12.∵S2<S1,∴ ①的残差和大于②的残差和,①的残差平方和大于②的残差平方和,则②的拟合效果更好,故A错误,B正确;残差图中直线②的残差点分布的水平带状区域比①的残差点分布的水平带状区域更窄,所以直线②拟合效果更好,故D正确;①的R2=1−7310=2330,②的R2=1−1210=1920,①的R2小于②的R2,②拟合效果更好,故C正确.故选BCD.16.【答案】A,D【考点】分层抽样方法系统抽样方法【解析】此题暂无解析【解答】解:(360+240+120)÷60=12,无论是运用系统抽样还是分层抽样,都不需要先剔除个体,A正确,B错误.系统抽样确定起始号时需要用到简单随机抽样,C错误.分层抽样时,所有个体被抽到的机会均等,D正确.故选AD.17.【答案】B,C,D【考点】分层抽样方法【解析】根据简单随机抽样的特点知应选分层抽样,按照抽样比即可得三种型号的轿车分别应抽取的数量.【解答】解:A.因为个体数目多,用抽取法制签难,搅拌不均匀,抽出的样本不具有好的代表性,故A错误;B,因为是三种型号的轿车,个体差异明显,所以选择分层抽样,故B正确;C,抽样比为761500+6000+2000=1125,三种型号的轿车依次应抽取1500×1125=12辆,6000×1125=48辆,2000×1125=16辆,故C正确;D,分层抽样中,每一个个体被抽到的可能性相同,故D正确.故选BCD.三、填空题(本题共计 10 小题,每题 3 分,共计30分)18.【答案】1【考点】频率分布直方图【解析】=根据频率分布直方图中纵横坐标的意义,易得长方形的面积为长乘宽,即组距×频率组距频率,而所有频率和为1可知频率分布直方图中各小长方体的面积和为1.【解答】解:在频率直方图中纵坐标表示频率,横坐标表示组距,组距,小长方形的长表示组距,则小长方形的高表示频率组距=频率;则长方形的面积为长乘宽,即组距×频率组距根据所有频率和为1可知频率分布直方图中各小长方体的面积和为1;故答案为:119.【答案】206【考点】简单随机抽样【解析】找到第7行第4列的数开始向右读,依次寻找号码小于500的即可得到结论.【解答】解:找到第7行第4列的数开始向右读,第一个符合条件的是217,第二个数553,不成立,第三个数157,第四个数245,这样依次读出结果,合适的数是217,157,245,217,206,其中217前面已经重复舍掉,故第四个数是206.故答案为:20620.【答案】23【考点】散点图【解析】由散点图可知函数的图象经过(1.6, 5)(3.2, 5.2),把点的坐标代入函数的解析式得到关于a,b的方程组,两个方程相减得到a的值.【解答】解:由散点图可知函数的图象经过(1.6, 5)(3.2, 5.2)把点的坐标代入函数的解析式得到5=a lg1.6+b①5.2=a lg3.2+b②用②-①得0.2=a lg2∴ a =0.2lg 2=23故答案为:23 21. 【答案】 ①②④【考点】频率分布折线图、密度曲线 【解析】 此题暂无解析 【解答】解:由图可知,①1∼6月,商品B 的月销售量曲线在商品A 之上,故①正确; ②7月份商品A 与商品B 的销售量都为13/万份,故②正确;③对于商品B ,7∼8月的月销售量增长率为负,8∼9月的月销售量增长率为0,故③错误;④2019年前三季度商品A 的销量折线呈上升趋势,故④正确. 故答案为:①②④. 22.【答案】 7【考点】 系统抽样方法 【解析】根据系统抽样的定义,即可得到结论. 【解答】解:∵ 样本容量为20,首个号码为003, ∴ 样本组距为100÷20=5∴ 对应的号码数为3+5(x −1)=5x −2, 由48≤5x −2≤81, 得10≤x ≤16.6,即x =10,11,12,13,14,15,16,共7个, 故答案为:7. 23.【答案】 11.15 【考点】求解线性回归方程 【解析】由表格可得平均值x ¯,y ¯,由回归直线过点(x ¯, y ¯)可得其方程,把x =9代入计算可得. 【解答】解:由表格可得x ¯=15(2+3+4+5+6)=4, y ¯=15(2.2+3.8+5.5+6.5+7.0)=5。
高中数学:统计与统计案例练习一、选择题1.某校为了解学生平均每周的上网时间(单位:h),从高一年级1 000名学生中随机抽取100 名进行了调查,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1 : 3 : 5,据此估计该校高一年级学生中平均每周上网时间少于4 h的学生人数为()领率组距A. 200 C. 400 0.0350.015B. 240D. 48010平均每周上网时间(h)解析:选C 设频率分布直方图中从左到右前3个小矩形的面积分别为A3K5P.由频率分布直方图可知,最后2个小矩形的面积之和为(0.015+0.035)X2 = 0.1.由于频率分布直方图中各个小矩形的面积之和为1,所以P+3P+5P=0.9,即尸=0.1.所以平均每周上网时间少于4h的学生所占比例为尸+3P=0.4,由此估计学生人数为0.4X1 000 =400.2. AQI(Air Quality Index,空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,一级优(0〜50),二级良(51〜100),三级轻度污染(101〜150),四级中度污染(151〜200),五级重度污染(201〜300),六级严重污染(大于300).如图是昆明市2021年4月份随机抽取的10天的AQI茎叶图,利用该样本估计昆明市2021年4月份空气质量优的天数为 ()A. 3B. 4C. 12D. 2142解析:选c 从茎叶图知,10天中有4天空气质量为优,所以空气质量为优的频率为 1 V.Z 22所以估计昆明市2021年4月份空气质量为优的天数为30X5=12,应选C.3.〔成都模拟〕某城市收集并整理了该市2021年1月份至10月份各月最低气温与最高气 温〔单位:C 〕的数据,绘制了下面的折线图.该城市各月的最低气温与最高气温具有较好的线性关系,那么根据折线图,以下结论错误 的是〔〕A.最低气温与最高气温为正相关B. 10月的最高气温不低于5月的最高气温C.月温差〔最高气温减最低气温〕的最大值出现在1月D.最低气温低于0C 的月份有4个解析:选D 在A 中,最低气温与最高气温为正相关,故A 正确;在B 中,10月的最高气温 不低于5月的最高气温,故B 正确;在C 中,月温差〔最高气温减最低气温〕的最大值出现在1月, 故C 正确:在D 中,最低气温低于0℃的月份有3个,故D 错误.应选D.4 .〔承德模拟〕为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取 了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体 中倾向选择生育二胎与倾向选择不生育二胎的人数比例图〔如下图〕,其中阴影局部表示倾向 选择生育二胎的对应比例,那么以下表达中错误的选项是〔〕A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别无关♦最高气温 ♦最低气温C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数解析:选C 由题图,可得是否倾向选择生育二胎与户籍有关、与性别无关;倾向选择不 生育二胎的人员中,农村户籍人数少于城镇户籍人数;倾向选择生育二胎的人员中,男性人数为 60X60% =36,女性人数为40X60%=24,不相同.应选C.5 .(石家庄模拟)某学校48两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过 茎叶图比拟两个班兴趣小组成绩的平均值及标准差.3 4 28 8 4 6 8 65152①A 班兴趣小组的平均成绩高于B 班兴趣小组的平均成绩; ②B 班兴趣小组的平均成绩高于A 班兴趣小组的平均成绩; ③A 班兴趣小组成绩的标准差大于B 班兴趣小组成绩的标准差;@B 班兴趣小组成绩的标准差大于A 班兴趣小组成绩的标准差. 其中正确结论的编号为()A.①④C. ®®其方差为白义[(53—78尸+(62—78/ +…+ (95—78)2]=121.6, 那么其标准差为'121.6%11.03;45+48+5H -------- F91B 班兴趣小组的平均成成为'」=66,其方差为表义[(45—66)2+(48 - 66)2 + ... + (91-66)2] =169.2, 那么其标准差为1169.2%13.01.应选A.6 .某商场对某一商品搞活动,该商品每一个的进价为3元,销售价为8元,每天售出的 第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如下图,设M 个)为每天商 品的销量,M 元)为该商场每天箱售这种商品的利润.从日利润不少于96元的几天里任选2天, 那么选出的这2天日利润都是97元的概率为()4 5 5 1 6 2 7 38班8 3 6 4 5 3 4 02B.②③D.①③解析:选A A 班兴趣小组的平均成绩为 53+62+64+…+92+95--------------- ---------------- =785x, x=18, 19, y =<l95+(x-19)(4-3), x=20, 21, J5x, x=18, 19, 即 L176+x, x=20, 21.当日销量不少于20个时,日利泗不少于96元, 当日销量为20个时,日利润为96元, 当日销量为21个时,日利润为97元,日利泗为96元的有3天,记为日利泗为97元的有2天,记为人丛从中任选2天有 (.4),(〃石),(.力),(.1),3/),(48),3«),(c4),(.,8),(48),共 10 种情况.其中选出的这2天日利泗都是97元的有(A,8)1种情况. 故所求概率为关.应选B. 二、填空题7 .某小卖部销售某品牌饮料的零售价与销量间的关系统计如下:单价x/元 3.0 3.2 3.4 3.6 3.8 4.0 销量w 瓶504443403528x,y 的关系符合回归方程£=£+2其中分=-20.假设该品牌饮料的进价为2元,为使利润 最大,零售价应定为 元.解析:依题意得:x =3.5, y =40,A所以.=40—(- 20)X3.5=110,所以回归直线方程为f=-20x+110,利润 L = (A —2)(-20A + 110)= -201+ 150x-220,B 选• •1 - 9 1 - 5 A.C 解BioD.g由题意知频数(天)0 18 19 20 2 俏量〔个〕所以x=* = 3.75元时,利润最大.答案:3.758.某高校调查了200名学生每周的自习时间(单位:小时),制成了如下图的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是.解析:设所求的人数为〃,由频率分布直方图,自习时间不少于22.5小时的频率为(0.04+0.08 +0.16) X 2.5=0.7, n=0.7 X 200=140.答案:1409.为比拟甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:C) 制成如下图的茎叶图,甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,那么甲地该月11时的平均气温的标准差为.甲9 8 2 62 m 03 I解析:甲地该月11时的气温数据(单位:℃)为28,29,30,30+〃?,32;乙地该月11时的气温数据(单位:℃)为26,28,29,31,31,那么乙地该月11时的平均气温为(26+28+29+31+31计5 = 29(℃),所以甲地该月11时的平均气温为30 ℃,故(28+29+30+30+m + 32)+5 = 30,解得〃?=1,那么甲地该月11时的平均气温的标准差为嗝义[(28 - 30产+(29 - 30)2+(30 - 30/+(31 - 30/+(32 - 30户]=\(2.答案:^2三、解做题10.某篮球运发动的投篮命中率为50%,他想提升自己的投篮水平,制定了一个夏季练习计划,为了了解练习效果,执行练习前他统计了10场比赛的得分,计算出得分的中位数为15,平均得分为15,得分的方差为463执行练习后也统计了10场比赛的得分,茎叶图如下图:0 8 91 2 4 4 5 6 82 1 3(1)请计算该篮球运发动执行练习后统计的10场比赛得分的中位数、平均得分与方差;⑵如果仅从执行练习前后统计的各10场比赛得分数据分析,你认为练习方案对该运发动的投篮水平的提升是否有帮助?为什么?解:(1)练习后得分的中位数为上芋=14.5;平均得分为8+9+12+14+14+15+16+18 + 21+23= 15:10方差为击义[(8—15)2 + (9 — 15>+(12 —15>+(14 — 15)2+(14 — 15> + (15 —15>+(16 — 15产+(18-15)2+(21-15)2+(23 —15)2]=20.6.(2)尽管中位数练习后比练习前稍小,但平均得分一样,练习前方差20.6小于练习前方差46.3, 说明练习后得分稳定性提升了(阐述观点合理即可),这是投篮水平提升的表现.故此练习方案对该篮球运发动的投篮水平的提升有帮助.11.(西安八校联考)在2021年俄罗斯世界杯期间,莫斯科的局部餐厅销售了来自中国的小龙虾,这些小龙虾均标有等级代码.为得到小龙虾等级代码数值x与销售单价y(单位:元)之间的关系,经统计得到如下数据:⑴销售单价),与等级代码数值x之间存在线性相关关系,求),关于x的线性回归方程(系数精确到0.1);(2)假设莫斯科某餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价为多少元?参考公式:对于一组数据(xi1 ),3,光),…其回归直线f=源+2的斜率和截距的最小2Xyi一〃x y八 '। A — A——二乘估计分别为Z? = ----------------- a= y —b x .n _Xxr-n x 26 6参考数据:2>»=8 440, 2e = 25 564.—38+48 + 58 + 68 + 78 + 88解:(1)由题意,得x -■= 63,- 16.8+18.8+20.8 + 22.8 + 24+25.8 _y = 6 =21.5,yA_8 440 - 6X63X21.5〜h = ~~6Z—=25 564—6X63X63「026 A 2A — A 一a= y -bx =21.5-0.2X63 = 8.9.故所求线性回归方程为f=0.2x+8.9.⑵由(1)知,当%=98 时,>=0.2X98+8.9=28.5.・•・估计该等级的中国小龙虾销售单价为28.5元.12.(长沙模拟)某职称晋级评定机构对参加某次专业技术测试的100人的成绩进行了统计, 绘制的频率分布直方图如下图.规定80分以上者晋级成功,否那么晋级失败(总分值为100分).(1)求图中.的值;(2)估计该次测试的平均分不(同一组中的数据用该组的区间中点值代表);(3)根据条件完成下面2X2列联表,并判断能否有85%的把握认为“晋级成功〞与性别有关.P(K?2k)0.40 0.25 0.15 0.1()0.050.025k0.708 1.323 2.072 2.706 3.841 5.024解:(1)由频率分布直方图中各小长方形面积总和为1,得(2.+ 0.020+0.03.+0.040)义10=1,解得〃=0...5.⑵由频率分布直方图知洛小组的中点值依次是55,65,75,85,95, 对应的频率分别为0.05.30,0.40,0.20.05,那么估计该次测试的平均分为 x = 55X0.05 + 65X0.30 + 75X0.40 + 85X0.20 + 95X0.05 = 74(分). ⑶由频率分布直方图知,晋级成功的频率为0.20+0.05=0.25, 故晋级成功的人数为100X0.25 = 25,填写2X2列联表如下:晋级成功 晋级失败合计男 16 34 50 女 9 41 50 合计2575100100X(16X41 ——25X75X50X50^2,613>2.072,所以有85%的把握认为“晋级成功〞与性别有关.1 .为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单 位:小时)如下:248 256 232 243 188 268 278 266 289 312 274296 288 302 295 228 287 217 329 283K 2=n(acl-bc)2(1)完成下面的频率分布表,并作出频率分布直方图;(2)估计8万台电风扇中有多少台无故障连续使用时限不低于280小时;(3)用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.解:(1)频率分布表及频率分布直方图如下所示:0.0100 ——⑵由题意可得8乂(0.30+0.10+0.05) = 3.6,所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.(3)由频率分布直方图可知x =190X0.05 + 210X0.05 + 230X0.10 + 250X0.15 + 270X0.20 + 290X0.30 + 310X0.10 + 330X0.05 = 269(小时),所以样本的平均无故障连续使用时限为269小时.2 .海水养殖场进行某水产品的新、旧网箱养殖方法的产量比照,收获时各随机抽取了 100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50kg 〞,估计A 的概率;⑵填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量V50 kg箱产量250 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比拟. 附:P (心2)0.050 0.010 0.001 k3.841 6.635 10.8280.01500.0125频率 仇距0.0075 0.0050 0.0025.厂工丁丁丁丁厂!无故障连续使用时用/小时新养殖法、n(ad-bc)1 _ .K-= . , , ,,其中〃=a+/?+c+d.(a+Z?)(c 十d)(a十c)(Z?+d)解:⑴旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)X5=0.62.因此,事件A的概率估计值为0.62.⑵根据箱产量的频率分布直方图得到联表:K2=---------- -------------------- 15 705100X100 X 96X104由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图说明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.3.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得x =+£即=9.97,5=、*ZG L x )21 /=1 \ / 1O/=1/ 1 16 _ / 16 16 _=、/讳16 X 2比0.212, / L G-8.5)2^ 18.439,Z (x,- x )(L8.5)=—2.78,其中为为抽取的第i个零件的尺寸,i= 1,2, (16)(1)求⑶,i)(i= 12…,16)的相关系数二并答复是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(假设加V0.25,那么可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(刀-35,7 +3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(7 -35,7 +3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(H,v)(i = 12…4的相关系数£(X,-7)(57-7)r=I ______/ / ・、/(),008公丫0・09・、/ £ d )2、/ £ 8 - 5 )216 _Z (XL x )(/—8.5)尸1解:(1)由样本数据得8,i)(i= 1,2,…,16)的相关系数为r= --------- /--- 1/16 _ / 16、/ Z (即- X C-8.5)2 -2.78剔除第13个数据,剩下数据的样本方差为aX 〔1 591.134 —9.22?—15X 10.022〕=0.008,A Q 这条生产线当天生产的零件尺寸的标准差的估计值为廊而比0.09.4.〔昆明模拟〕〞工资条里显红利,个税新政入民心〞.随着2021年新年钟声的敲响,我国 自1980年以来,力度最大的一次个人所得税〔简称个税〕改革迎来了全面实施的阶段.某IT 从业 者为了解自己在个税新政下能享受多少税收红利,绘制了他在26〜35岁〔2021〜2021年〕之间各 年的月平均收入〕,〔单位:千元〕的散点图:20・・・・ 16- ・ , 12- ., 8 ■ •4°123456789 io"年龄代码工注:年龄代码1~10分别对应年的26〜35岁⑴由散点图知,可用回归模型y=h\n x+a 拟合〕,与x 的关系,试根据有关数据建立〕,关于x 的回归方程;〔2〕如果该IT 从业者在个税新政下的专项附加扣除为3 000元/月,试利用〔1〕的结果,将月平 均收入视为月收入,根据新旧个税政策,估计他36岁时每个月少缴纳的个人所得税.1010 10 _10_ _ 10附注:参考数据:= 55,2〕〉= 155.5,N 〔即一x 〕2 =82.5,2 — x〕〔F — y 〕 = 94.9,26= i=li=li=lJ =1io _ io _ _15.1,2 缶- 1〕2=4.84,£〔力一 t 〕〔yi- y 〕 =242其中"=ln 为;取 In 11 =24,In 36=361=1 /=1参考公式:回归方程.=筋+味中斜率和截距的最小二乘估计分别为公= n ______ _X 〔出一〃〕〔.- V 〕 曰 A - A — -------------------------- \a= v —b u .Z 〔3一 〃 〕2月平均收入y千元解:(1)令 f=lnx,那么 y=bf+a10__Z & -,)()L y)24.2, b ~ ~__Z _痴_5ze —)2r=l10Zu-_2__155.5-_2_=而=-^-=15.55, t =苗A — A —a= y —b t = 15.55 —5X 1.51=8,所以〕,关于/的回归方程为〕,=5/+8.1015.1 lo"=L51由于/=lnx,所以y关于x的回归方程为y=51nx+8.⑵由⑴得,该IT从业者36岁时月平均收入为y=51n 11+8 = 5X2.4+8 = 20〔千元〕.旧个税政策下每个月应缴纳的个人所得税为1 500X3%+3 000X10%+4 500X20%+〔20 000-3 500-9 000〕X25% = 3 120〔元〕.新个税政策下每个月应缴纳的个人所得税为3 000X3%+〔20 000-5 OOO-3OOO-3 000〕X 10%=990〔元〕.故根据新旧个税政策,该IT从业者36岁时每个月少缴纳的个人所得税为3 120-990=2 130(70).I— 0 180.212X716X18.439 ',由于lrlV0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于7 =9.97,产0.212,由样本数据可以看出抽取的第13个零件的尺寸在(T—3s,7 + 3s)以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为右义(16义9.97—9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.162X?=16X0.212I2+16X9.972^1 591.134,。
高一下概率统计练习题一.选择题1.某单位有老年人28人,中年人54人,青年人81人.为了调查他们的身体状况,需从他们中抽取一个容量为36的样本,最适合抽取样本的方法是( )A .简单随机抽样B .系统抽样C .分层抽样D .先从老年人中剔除一人,然后分层抽样2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,4,12.设其平均数为a ,中位数为b ,众数为c ,则有( )A .a>b>cB .b>c>aC .c>a>bD .c>b>a3.下列说法中正确的是 ( )A .数据5,4,4,3,5,2的众数是4B .一组数据的标准差是这组数据的方差的平方C .数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半D .频率分布直方图中各小长方形的面积等于相应各组的频数4.下列说法正确的是( )A .根据样本估计总体,其误差与所选择的样本容量无关B .方差和标准差具有相同的单位C .从总体中可以抽取不同的几个样本D .如果容量相同的两个样本的方差满足S 21<S 22,那么推得总体也满足S 21<S 225.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输人为15,那么由此求出的平均数与实际平均数的差是( )A .3.5B .-3C .3D .-0.56如图所示是一批产品中抽样得到数据的频率直方图,由图可看出概率最大时数据所在范围是( )A .(8.1,8.3)B .(8.2,8.4)C .(8.4,8.5)D .(8.5,8.7)7.将编号为1、2、3、4的四个小球任意地放入A 、B 、C 、D 四个小盒中,每个盒中放球的个数不受限制,恰好有一个盒子是空的的概率为( ) ()169A ()41B ()43C ()167D 8从区间()0,1内任取两个数,则这两个数的和小于56的概率是 A 、35 B 、45 C 、1625 D 、2572 9 把一条长10厘米的线段随机地分成三段,这三段能够构成三角形的概率是( )A. ;31B. ;41C. ;103D. .53 10 ABCD 为长方形,AB =2,BC =1,O 为AB 的中点,在长方形ABCD 内随机取一点,取到的点到O 的距离大于1的概率为( )A.4π B.14π- C.8π D.18π- 11 在样本的频率分布直方图中,一共有n 个小矩形,若中间某一个小矩形的面积等于其余n -1个小矩形面积和的14,且样本容量为160,则中间这一组的频数是 A.32 B.20 C.40 D.2512一块各面均涂有油漆的正方体被锯成1000个大小相同的小正方体,若将这些小正方体均匀地搅混在一起,则任意取出一个正方体其两面涂有油漆的概率是A .121 B .101 C .253 D .12512二、填空题:13.连续两次掷一颗质地均匀的骰子(一种各面上分别标有1,2,3,4,5,6个点的正方体玩具),记出现向上的点数分别为,m n ,设向量(),m n =a ,()3,3=-b ,则a 与b 的夹角为锐角的概率是 14某单位200名职工的年龄分布情况如图2,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1-5号,6-10号…,196-200号).若第5组抽出的号码为22,则第8组抽出的号码应是 。
高一数学统计试题答案及解析1.从测量所得数据中取出个,个,个,个组成一个样本,则这个样本的平均数是()A.B.C.D.【答案】C【解析】利用平均数计算公式平均数=,故选C。
【考点】本题考查了平均数的概念及计算.点评:运用求平均数公式:。
2.一位教师出了一份含有3个问题的测验卷,每个问题1分.班级中30%的学生得了3分,50%的学生得了2分,10%的学生得了1分,另外还有10%的学生得0分,则全班的平均分是_________.【答案】2分【解析】=3×30%+2×50%+1×10%+0=2.【考点】本题考查了平均数的概念及计算、频率分布表的意义、加权平均数的求法.点评:运用求平均数公式:。
3.某校在一次学生身体素质调查中,在甲、乙两班中随机抽10名男生测验100m短跑,测得成绩如下(单位:):【答案】甲班男生短跑水平高些【解析】,.,甲班男生短跑水平高些.【考点】本题考查了平均数的概念及计算.点评:运用求平均数公式:,分别计算比较,平均数高者为优秀,数基本题型。
4.如果五个数的平均数是7,那么这五个数的平均数是()A.5B.6C.7D.8【答案】D【解析】利用平均数计算,或利用结论:样本x1,x2, (x)n的平均数为7,∴样本x1+1,x2+1,…,xn+1的平均数=7+1=8,故选D.【考点】本题主要考查平均数的意义及其计算。
点评:基本题型,注意掌握平均数计算公式。
在此基础上推出一般结论更好。
5.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组对应数据:判断它们是否有相关关系.【答案】解:两者之间具有相关关系.【解析】本题只给出了样本数据,对于给定的两个变量是否具有相关关要用散点图来分析,散点图中的点若很集中,则具有相关关系并且集中趋势越强则相关性越强,若很分散,则不具相关关系。
散点图为:可看出样本点都集中在一条直线附近,所以两者之间具有相关关系。
高一数学必修第二册第九章《统计》单元练习题卷8(共22题)一、选择题(共10题)1. 某位教师 2018 年的家庭总收入为 80000 元,各种用途占比统计如下面的折线图.2019 年家庭总收入的各种用途占比统计如下面的条形图,已知 2019 年的就医费用比 2018 年的就医费用增加了 4750 元,则该教师 2019 年的旅行费用为 ( )A . 21250 元B . 28000 元C . 29750 元D . 85000 元2. 总体由编号为 01,02,⋯,19,20 的 20 个个体组成,利用下面的随机数表选取 5 个个体,选取方法是从随机数表第 1 行的第 11 列和第 12 列数字开始由左到右依次选取两个数字,则选出来的第 5 个个体的编号为 ( )4698637162332616804560111410959774246762428114572042533237322707A . 11B . 14C . 16D . 203. 设 x 1,x 2,⋯,x n 为样本数据,令 f (x )=∑(x i −x )2n i=1,则 f (x ) 的最小值点为 ( )A .样本众数B .样本中位数C .样本标准差D .样本平均数4. 我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米 1534 石,验得米内夹谷,抽样取米一把,数得 254 粒内夹谷 28 粒,则这批米内夹谷约为 ( ) A . 134 石B . 169 石C . 338 石D . 1365 石5. 如图所示的茎叶图记录了甲、 乙两组各 5 名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则 x 和 y 的值分别为 ( )A .3,5B .5,5C .3,7D .5,76. 为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是 ( )A .该地农户家庭年收入低于 4.5 万元的农户比率估计为 6%B .该地农户家庭年收入不低于 10.5 万元的农户比率估计为 10%C .估计该地农户家庭年收入的平均值不超过 6.5 万元D .估计该地有一半以上的农户,其家庭年收入介于 4.5 万元至 8.5 万元之间7. 为比较甲、乙两地某月 14 时的气温情况,随机选取该月中的 5 天,这 5 天中 14 时的气温数据(单位:∘C )如下:甲:2628293131乙:2829303132以下结论:①甲地该月 14 时的平均气温低于乙地该月 14 时的平均气温; ②甲地该月 14 时的平均气温高于乙地该月 14 时的平均气温; ③甲地该月 14 时的气温的标准差小于乙地该月 14 时的气温的标准差; ④甲地该月 14 时的气温的标准差大于乙地该月 14 时的气温的标准差. 其中根据数据能得到的统计结论的编号为 ( ) A .①③B .①④C .②③D .②④8. 某项测试成绩满分为 10 分,现随机抽取 30 名学生参加测试,得分情况如图所示,假设得分值的中位数为 m e ,平均数为 x ,众数为 m 0,则 ( )A . m e =m 0=xB . m e =m 0<xC . m e <m 0<xD . m 0<m e <x9. 对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数,众数,极差分别是 ( )125202333124489455577889500114796178A . 46,45,56B . 46,45,53C . 47,45,56D . 45,47,5310. 气象意义上从春季进入夏季的标志为“联系 5 天的日平均温度均不低于 22∘C ”.现有甲、乙、丙三地连续 5 天的日平均温度的记录数据(记录数据都是正整数). ① 甲地:5 个数据的中位数为 24,众数为 22; ② 乙地:5 个数据的中位数为 27,平均数为 24;③ 丙地:5 个数据中有一个数据是 32,平均数为 26,方差为 10.8. 则肯定进入夏季的地区有 ( ) A . 0 个 B . 1 个 C . 2 个 D . 3 个二、填空题(共6题)11. 从甲、乙、丙三个厂家生产的同一种产品中各抽取 8 件产品,对其使用寿命(单位:年)跟踪调查结果如下:甲:3,4,5,6,8,8,8,10; 乙:4,6,6,6,8,9,12,13; 丙:3,3,4,7,9,10,11,12.三个厂家在广告中都称该产品的使用寿命是 8 年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数:甲 ,乙 ,丙 .12. 某工厂生产A ,B ,C 三种不同型号的产品,产品数量之比依次为 2:3:5,现用分层抽样方法抽出一个容量为 n 的样本,样本中A 种型号产品有 16 件,那么此样本的容量 n = .13. 某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 5 次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程 y ^=0.67x+54.9.零件数x/个1020304050加工时间y/min62■758189现发现表中有一个数据模糊看不清,请你推断出该数据的值为.14.下图是根据部分城市某年6月份的平均气温(单位:∘C)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5).已知样本中平均气温低于22.5∘C的城市个数为11,则样本中平均气温不低于25.5∘C的城市个数为.15.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=(结果保留3位小数).若要从身高在[120,130),[130,140),[140,150]内的三组学生中,用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为.16.样本容量为10的一组样本数据依次为:3,9,0,4,1,6,6,8,2,7,该组数据的第50百分位数是,第75百分位数是.三、解答题(共6题)17.要做频率分布表,需要对原始数据做哪些工作?18.某学校对男、女学生进行有关“习惯与礼貌”的评分,记录如下:男:54,70,57,46,90,58,63,46,85,73,55,66,38,44,56,75,35,58,94,58女:77,55,69,58,76,70,77,89,51,52,63,63,69,83,83,65,100,74分别求男生、女生得分的四分位数.19.某班40个学生平均分成两组,两组学生某次考试成绩情况如表所示:组别平均数标准差第一组904第二组806求该班学生这次考试成绩的平均数和标准差.20.一个频数分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,试计算样本在[40,50),[50,60)内的数据个数之和.21.某武警大队共有第一、第二、第三三支中队,人数分别为30,30,40人.为了检测该大队的射击水平,从整个大队用分层随机抽样共抽取了30人进行射击考核,统计得三个中队参加射击比赛的平均环数分别为8.8环,8.5环,8.1环,试估计该武警大队队员的平均射击水平.22.为提倡节能减排,同时减轻居民负担,广州市积极推进“一户一表”工程.非一户一表用户电费采用“合表电价”收费标准:0.65元/度.“一户一表”用户电费采用阶梯电价收取,其11月到次年4月起执行非夏季标准如下:第一档第二档第三档每户每月用电量(单位:度)[0,200](200,400](400,+∞)电价(单位:元/度)0.610.660.91例如:某用户11月用电410度,采用合表电价收费标准,应交电费410×0.65=266.5元,若采用阶梯电价收费标准,应交电费元200×0.61+(400−200)×0.66+(410−400)×0.91=263.1元.为调查阶梯电价是否能取到“减轻居民负担”的效果,随机调查了该市100户的11月用电量,工作人员已经将90户的月用电量填在下面的频率分布表中,最后10户的月用电量(单位:度)为:88,268,370,140,440,420,520,320,230,380.(1) 完成频率分布表,并绘制频率分布直方图;(2) 根据已有信息,试估计全市住户11月的平均用电量(同一组数据用该区间的中点值作代表);(3) 设某用户11月用电量为x度(x∈N),按照合表电价收费标准应交y1元,按照阶梯电价收费标准应交y2元,请用x表示y1和y2,并求当y2≤y1时,x的最大值,同时根据频率分布直方图估计“阶梯电价”能否给不低于75%的用户带来实惠?答案一、选择题(共10题)1. 【答案】C【解析】由题意可知,2018年的就医花费为80000×10%=8000(元),×35=则2019年的就医花费为8000+4750=12750(元),2019年的旅行费用为1275015 29750(元).【知识点】频率分布直方图2. 【答案】D【解析】由随机数法的抽样过程及题意知,选出的5个个体的编号为:16,11,14,10,20,故第5个个体的编号是20.【知识点】简单随机抽样3. 【答案】D【知识点】样本数据的数字特征4. 【答案】B≈169石,故选:B.【解析】由题意,这批米内夹谷约为1534×28254【知识点】简单随机抽样5. 【答案】A【解析】由已知中甲组数据的中位数为65,故乙组数据的中位数也为65,即y=5,则乙组数据的平均数为:66,故x=3.【知识点】茎叶图、样本数据的数字特征6. 【答案】C【解析】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元农户的比率估计值为0.02+0.04=0.06=6%,故A正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.04+0.02×3=0.10=10%,故B 正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.10+0.14+0.20×2=0.64=64%>50%,故D正确;该地农户家庭年收入的平均值的估计值为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),超过6.5万元,故C错误.综上,给出结论中不正确的是C . 故选:C .【知识点】样本数据的数字特征7. 【答案】B【解析】因为 x 甲=26+28+29+31+315=29,x 乙=28+29+30+31+325=30,所以 x 甲<x 乙.又 s 甲2=9+1+0+4+45=185,s 乙2=4+1+0+1+45=2,所以 s 甲>s 乙,故由样本估计总体可知结论①④正确. 【知识点】样本数据的数字特征8. 【答案】D【解析】由图知 m 0=5.由中位数的定义知应该是第 15 个数与第 16 个数的平均值,由图知将数据从小到大排,第 15 个数是 5,第 16 个数是 6, 所以 m e =5+62=5.5,x =3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230≈5.97>5.5,所以 m 0<m e <x .【知识点】样本数据的数字特征、频率分布直方图9. 【答案】A【解析】由概念知中位数是中间两数的平均数,即 45+472=46,众数是 45,极差为 68−12=56.所以选A .【知识点】茎叶图、样本数据的数字特征10. 【答案】C【解析】甲地肯定进入,因为众数为 22,所以 22 至少出现两次,若有一天低于 22∘C ,则中位数不可能为 24;丙地肯定进入,令 x 为其中某天的日平均温度,则 10.8×5−(32−26)2=18>(x −26)2,若 x ≤21,上式显然不成立;乙地不一定进入,如 13,23,27,28,29.【知识点】样本数据的数字特征二、填空题(共6题)11. 【答案】众数;平均数;中位数【解析】甲、乙、丙三个厂家从不同角度描述了一组数据的特征.甲:该组数据8出现的次数最多;乙:该组数据的平均数x=4+6×3+8+9+12+138=8;丙:该组数据的中位数是7+92=8.【知识点】样本数据的数字特征12. 【答案】80【知识点】分层抽样13. 【答案】68【解析】由表知x=30,设模糊不清的数据为m,则y=15×(62+y+75+81+89)=307+m5,因为y=0.67x+54.9,即307+m5=0.67×30+54.9,解得m=68.【知识点】样本数据的数字特征14. 【答案】9【解析】设样本容量为n,则(0.1+0.12)n=11,解得n=50,故气温不低于25.5∘C的城市个数为50×0.18=9.【知识点】频率分布直方图15. 【答案】0.030;3【解析】因为0.005×10+0.035×10+a×10+0.020×10+0.010×10=1,所以a=0.030.设身高在[120,130),[130,140),[140,150]内的三组学生分别有x,y,z人.则x100=0.030×10,解得x=30.同理,y=20,z=10.故从身高在[140,150]内的学生中选取的人数为1030+20+10×18=3.【知识点】分层抽样、频率分布直方图16. 【答案】5;7【解析】样本容量为10的一组样本数据依次为:3,9,0,4,1,6,6,8,2,7,从小到大排列为:0,1,2,3,4,6,6,7,8,9,因为10×50%=5,所以该组数据的第50百分位数是4+62=5.因为10×75%=7.5,第75百分位数是7.【知识点】样本数据的数字特征三、解答题(共6题)17. 【答案】分组,频数累计,计算频数和频率.【知识点】频率分布直方图18. 【答案】对男生得分由小到大排序为35,38,44,46,46,54,55,56,57,58,58,58,63,66,70,73,75,85,90,94,共20个数据,所以20×25%=5,20×50%=10,20×75%=15,则25%分位数为46+542=50,50%分位数为58+582=58,75%分位数为70+732=71.5.对女生得分由小到大排序为51,52,55,58,63,63,65,69,69,70,74,76,77,77,83,83,89,100,共18个数据.所以18×25%=4.5,18×50%=9,18×75%=13.5,则25%分位数为63,50%分位数为69+702=69.5,75%分位数为77.【知识点】样本数据的数字特征19. 【答案】根据题意,全班平均成绩为x=90×2040+80×2040=85,第一组的平均数为x1=90,方差为s12=16.第二组的平均数为x2=80,方差为s22=36.则该班学生的方差为s2=2040[s12+(x1−x)2]+2040[s22+(x2−x)2]=12[16+(90−85)2]+12[36+(80−85)2]=51.所以s=√51.综上可得,该班学生这次考试成绩的平均数和标准差分别为85和√51.11 【知识点】样本数据的数字特征20. 【答案】根据题意,设分布在 [40,50),[50,60) 内的数据个数分别为 x ,y .因为样本中数据在 [20,60) 内的频率为 0.6,样本容量为 50,所以4+5+x+y 50=0.6,解得 x +y =21.即样本在 [40,50),[50,60) 内的数据个数之和为 21.【知识点】频率与频数21. 【答案】该武警大队共有 30+30+40=100(人),按比例分配所以第一中队参加考核人数为30100×30=9(人),第二中队参加考核人数为 30100×30=9(人), 第三中队参加考核人数为 40100×30=12(人).所参加考核的 30 人的平均射击环数为 930×8.8+930×8.5+1230×8.1=8.43(环).所以估计该武警大队的平均射击水平为 8.43 环.【知识点】分层抽样22. 【答案】(1) 频率分布表如下:频率分布直方图如下:(2) 该 100 户用户 11 月的平均用电量 x =50×0.04+150×0.12+250×0.24+350×0.3+450×0.26+550×0.04=324 度,所以估计全市住户 11 月的平均用电量为 324 度.(3) y 1=0.65x ,y 2={0.61x,0≤x ≤2000.66(x −200)+122=0.66x −10,200<x ≤4000.91(x −400)+254=0.91x −110,x >400. 由 y 2≤y 1 得 {0.61x ≤0.65x,0≤x ≤200或 {200<x ≤400,0.66x −10≤0.65x 或 {0.91x −110≤0.65x,x >400, 解得 x ≤1100.26≈423.1,因 x ∈N ,故 x 的最大值为 423,根据频率分布直方图,x ≤423 时的频率为 0.04+0.12+0.24+0.3+23×0.26=0.7598>0.75,故估计“阶梯电价”能给不低于 75% 的用户带来实惠.【知识点】频率分布直方图、样本数据的数字特征、函数模型的综合应用。
高一数学必修第二册第九章《统计》单元练习题卷9(共22题)一、选择题(共10题)1.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( )A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳2.A,B两名同学在5次数学考试中的成绩统计如图的茎叶图所示,若A,B两人的平均成绩分别是x A,x B,观察茎叶图,下列结论正确的是( )A.x A<x B,A比B成绩稳定B.x A>x B,A比B成绩稳定C.x A<x B,B比A成绩稳定D.x A>x B,B比A成绩稳定3.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分,1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A.中位数B.平均数C.方差D.极差4.如图所示的茎叶图记录了甲、乙两名同学在10次英语听力比赛中的成绩(单位:分),已知甲得分的中位数为76分,乙得分的平均数是75分,则下列结论正确的是( )A.x甲=76B.甲数据中x=3,乙数据中y=6 C.甲数据中x=6,乙数据中y=3D.乙同学成绩较为稳定5.如图所示的是一容量为100的样本的频率分布直方图,则由图形中的数据,可知其中位数为( )A.12.5B.13C.13.5D.146.右面茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损.则甲的平均成绩超过乙的平均成绩的概率为( )A.25B.710C.45D.9107.为了了解某校高三学生每天的作业量,通过简单随机抽样从该校高三学生中抽取了60名学生,通过调查发现这60名学生每天完成作业平均用时2小时,则可以推测该校高三学生每天完成作业所需时间的平均数( )A.一定为2小时B.高于2小时C.低于2小时D.约为2小时8.某班有48名学生,在一次考试中统计出平均分为70,方差为75,后来发现有2名学生的成绩有误,学生甲实得80分却记为50分,学生乙实得70分却记为100分,更正后平均分和方差分别是( )A.70,25B.70,50C.70,5√2D.65,259.已知100个数据的75%分位数是9.3,则下列说法正确的是( )A.这100个数据中一定有75个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第75个数据C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数10.16位参加百米半决赛同学的成绩各不相同,按成绩取前8位进入决赛.如果小刘知道了自己的成绩后,要判断他能否进入决赛,则其他15位同学成绩的下列数据中,能使他得出结论的是( )A.平均数B.极差C.中位数D.众数二、填空题(共6题)11.某住宅小区有居民2万户,从中随机抽取200户,调查是否安装宽带,调查结果如下表所示:宽带动迁户原住户已安装6035未安装4560则该小区已安装宽带的户数估计有户.12.某单位工会组织75名会员观看《光荣与梦想》、《觉醒年代》、《跨过鸭绿江》三部建党百年优秀电视,对这三部剧的观看情况统计如表,则会员中看过《跨过鸭绿江》的共有人,三部电视剧中,看过至少一部的有人.观看情况观看人数只看过《光荣与梦想》12只看过《觉醒年代》11只看过《跨过鸭绿江》8只看过《光荣与梦想》和《觉醒年代》7只看过《光荣与梦想》和《跨过鸭绿江》4只看过《觉醒年代》和《跨过鸭绿江》5同时看过《光荣与梦想》、《觉醒年代》和《跨过鸭绿江》2113.某高中在校学生有2000人,为了响应“阳光体育运动”的号召,学校开展了跑步和登山的比赛活动,每人都参与而且只能参与其中一项比赛,各年级参与比赛的人数情况如下表:高一年级高二年级高三年级跑步a b c登山x y z其中a∶b∶c=2∶3∶5,全校参与登山的人数占总人数的2.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则从高二年级5参与跑步的学生中应抽取的人数为.14.某单位200名职工的年龄分布情况如图所示,现要从中随机抽取50名职工的年龄作为样本,若采用分层随机抽样的方法,则40∼50岁年龄段应抽取人.15.某学校为调查学生的身高情况,从高二年级的220名男生和180名女生中,根据性别采用按比例分配的分层抽样方法,随机抽取容量为40的样本.样本中男,女生的平均身高分别是178.6cm,164.8cm,该校高二年级学生的平均身高估计为cm.(精确到0.01cm)16.判断下列结论是否正确(请在括号中打“√”或“×”).(1)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( )(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( )(3)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( )三、解答题(共6题)17.某超市计划按月订购一种酸奶,每天进货量相同,已知每售出一箱酸奶的利润为50元,当天未售出的酸奶降价处理,以每箱亏损10元的价格全部处理完.若供不应求,可从其它商店调拨,每销售1箱可获利30元.假设该超市每天的进货量为14箱,超市的日利润为y元.为确定以后的订购计划,统计了最近50天销售该酸奶的市场日需求量,其频率分布表如图所示.(1) 求a,b,m,n,P的值;(2) 求y关于日需求量x(10≤x≤20)的函数表达式;(3) 以50天记录的酸奶需求量的频率作为酸奶需求量发生的概率,估计日利润在区间[580,760)内的概率.18.为了解学生的周末学习时间(单位:小时),高一年级某班班主任对本班40名学生某周末的学习时间进行了调査,将所得数据整理绘制出如图所示的频率分布直方图,根据直方图所提供的信息:(1) 求该班学生周末的学习时间不少于20小时的人数.(2) 估计这40名同学周末学习时间的25%分位数.(3) 如果用该班学生周末的学习时间作为样本去推断该校高一年级全体学生周末的学习时间,这样推断是否合理?说明理由.19.某科研课题组通过一款手机APP软件,调查了某市1000名跑步爱好者平均每周的跑步量(简称“周跑量”),得到如下的频数分布表:周跑量(km/周)[10,15)[15,20)[20,25)[25,30)[30,35)[35,40)[40,45)[45,50)[50,55)人数100120130180220150603010(1) 补全该市1000名跑步爱好者周跑量的频率分布直方图;注:请先用铅笔画,确定后再用黑色水笔描黑.(2) 根据以上图表数据计算得样本的平均数为28.5km,试求样本的中位数(保留一位小数),并用平均数、中位数等数字特征估计该市跑步爱好者周跑量的分布特点.(3) 根据跑步爱好者的周跑量,将跑步爱好者分成以下三类,不同类别的跑者购买的装备的价格不一样,如表:周跑量小于20公里20公里到40公里不小于40公里类别休闲跑者核心跑者精英跑者装备价格(单位:元)250040004500根据以上数据,估计该市每位跑步爱好者购买装备,平均需要花费多少元?20.为保障食品安全,某地食品监管部门对辖区内甲、乙两家食品企业进行检查,分别从这两家企业生产的某种同类产品中随机抽取了100件作为样本,并以样本的一项关键质盘指标值为检测依据.已知该质量指标值对应的产品等级如下:质量指标值[15,20)[20,25)[25,30)[30,35)[35,40)[40,45]等级次品二等品一等品二等品三等品次品根据质量指标值的分组,统计得到了甲企业的样本频率分布直方图和乙企业的样本频数分布表(图表如图,其中a>0).质量指标值频数[15,20)2[20,25)18[25,30)48[30,35)14[35,40)16[40,45]2合计100(1) 现从甲企业生产的产品中任取一件,试估计该件产品为次品的概率.(2) 根据图表数据,请自定标准,对甲、乙两企业食品质量的优劣情况进行比较.21.一个频数分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,试计算样本在[40,50),[50,60)内的数据个数之和.22.某生产企业对其所生产的甲、乙两种产品进行质量检测,分别抽取6件产品检测其质量的误差,测得数据如下(单位:mg):甲:13,15,13,8,14,21;乙:15,13,9,8,16,23.(1) 画出样本数据的茎叶图;(2) 分别计算甲、乙两组数据的方差,并分析甲、乙两种产品的质量(精确到0.1).答案一、选择题(共10题)1. 【答案】A【解析】对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;对于选项C,D,由图可知显然正确.【知识点】频率分布直方图2. 【答案】C【解析】由茎叶图知,可知道甲的成绩为96,91,92,103,128,平均成绩为102;乙的成绩为99,108,107,114,112,平均成绩为106;从茎叶图上可以看出B的数据比A的数据集中,B比A成绩稳定,故选:C.【知识点】样本数据的数字特征、茎叶图3. 【答案】A【解析】根据题意,从9个原始评分中去掉1个最高分,1个最低分,得到7个有效评分,7个有效评分与9个原始评分相比,最中间的一个数不变,即中位数不变.【知识点】样本数据的数字特征4. 【答案】C【解析】因为甲得分的中位数为76分,所以x=6,=75,故A,B错误;所以x甲因为乙得分的平均数是75分,=75,解得y=3,故C正确;由茎叶图中甲、乙成绩的所以56+68+68+70+72+(70+y)+80+86+88+8910分布可知D错误.【知识点】样本数据的数字特征、茎叶图5. 【答案】B【解析】中位数是把频率分布直方图分成两个面积相等部分的平行于纵轴的直线的横坐标,第一个矩形的面积是0.2,第二个矩形的面积是0.5,第三个矩形的面积是0.3,故将第二个矩形分成3:2即可,所以中位数是13.【知识点】频率分布直方图6. 【答案】C【解析】由已知中的茎叶图可得甲的5次综合测评中的成绩分别为88,89,90,91,92,则甲的平均成绩甲=88+89+90+91+925=90设污损数字为X,则乙的5次综合测评中的成绩分别为83,83,87,99,90+X则乙的平均成绩乙=83+83+87+99+90+X5=88.4+X5当X=8或9时,甲≤乙即甲的平均成绩不超过乙的平均成绩的概率为210=15则甲的平均成绩超过乙的平均成绩的概率P=1−15=45.【知识点】样本数据的数字特征、茎叶图7. 【答案】D【知识点】简单随机抽样8. 【答案】B【解析】学生甲少记30分,学生乙多记30分,则总分不变,由此可知平均分不发生变化.设其余46名学生的成绩分别为x1,x2,⋯,x46,则原方差s2=148[(x1−70)2+(x2−70)2+⋯+(x46−70)2+(50−70)2+(100−70)2]=75,更正后方差sʹ2=148[(x1−70)2+(x2−70)2+⋯+(x46−70)2+(80−70)2+(70−70)2]=s2−148×[(50−70)2+(100−70)2]+148×[(80−70)2+(70−70)2]=50.【知识点】样本数据的数字特征9. 【答案】C【解析】因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为75%分位数,是9.3.【知识点】样本数据的数字特征10. 【答案】C【解析】判断是不是能进入决赛,只要判断是不是前8名,所以只要知道其他15位同学的成绩中是不是有8个高于他,也就是把其他15位同学的成绩排列后看第8个的成绩即可,小刘的成绩高于这个成绩就能进入决赛,低于这个成绩就不能进入决赛,这个第8名的成绩就是这15位同学成绩的中位数.【知识点】样本数据的数字特征二、填空题(共6题)11. 【答案】9500【知识点】用样本估计总体12. 【答案】38;68【解析】根据题意,将数据利用韦恩图表示,如图所示:由图可知看过《跨过鸭绿江》的共有21+4+5+8=38人;三部电视剧中,看过至少一部的有12+7+21+4+8+5+11=68人.【知识点】频率分布直方图13. 【答案】36【解析】根据题意,可知样本中参与跑步的人数为200×35=120.所以从高二年级参与跑步的学生中应抽取的人数为120×32+3+5=36.【知识点】分层抽样14. 【答案】15【解析】50×30%=15(人).【知识点】分层抽样15. 【答案】172.39【解析】高二年级男女比例为220180=119,所以平均身高为: 178.6×1120+164.8×920=98.23+74.16=172.39.故该校高二学生平均身高为172.39cm.【知识点】样本数据的数字特征16. 【答案】 × ; × ; √【知识点】样本数据的数字特征、简单随机抽样、频率分布直方图三、解答题(共6题)17. 【答案】(1) a =50×0.16=8,b =1250=0.24,m =50×0.3=15,n =50−8−12−15−5=10,P =1050=0.2;(2) 超市的日利润 y 关于日需求量 x 的函数表达式为y ={50×14+30×(x −14),14≤x ≤20,50x −10×(14−x ),10≤x <14,即 y ={30x +280,14≤x ≤2060x −140,10≤x <14.(3) 由(2)知:当 10≤x <14 时,y =60x −140,令 580≤y <760,解得 12≤x <14.当 14≤x ≤20 时,y =30x +280,令 580≤y <760,解得 14≤x <16;所以 y ∈[580,760) 时,x ∈[12,16),故所求概率为 0.24+0.30=0.54.【知识点】函数模型的综合应用、频率分布直方图、建立函数表达式模型18. 【答案】(1) 由图可知,该班学生周末的学习时间不少于 20 小时的频率为 (0.03+0.015)×5=0.225, 则 40 名学生中周末的学习时间不少于 20 小时的人数为 40×0.225=9.(2) 学习时间在 5 小时以下的频率为 0.02×5=0.1<0.25,学习时间在 10 小时以下的频率为 0.1+0.04×5=0.3>0.25,所以 25% 分位数在 (5,10),5+5×0.25−0.10.2=8.75,则这 40 名同学周末学习时间的 25% 分位数为 8.75.(3) 不合理,样本的选取只选在高一某班,不具有代表性.【知识点】频率分布直方图、样本数据的数字特征19. 【答案】(1) 补全该市 1000 名跑步爱好者周跑量的频率分布直方图,如下:(2) 中位数的估计值:由 5×0.02+5×0.024+5×0.026=0.35<0.5,0.35+5×0.036=0.53>0.5,所以中位数位于区间 [25,30) 中,设中位数为 x ,则 0.35+(x −25)×0.036=0.5,解得 x ≈29.2,因为 28.5<29.2,所以估计该市跑步爱好者多数人的周跑量多于样本的平均数.(3) 依题意可知,休闲跑者共有 (5×0.02+5×0.024)×1000=220 人,核心跑者 (5×0.026+5×0.036+5×0.044+5×0.030)×1000=680 人,精英跑者 1000−220−680=100 人,所以该市每位跑步爱好者购买装备,平均需要 220×2500+680×4000+100×45001000=3720 元.【知识点】样本数据的数字特征、频率分布直方图20. 【答案】(1) 由题意知 (a +0.020+0.022+0.028+0.042+0.080)×5=1,解得 a =0.008,所以甲企业的样本中次品的频率为 (a +0.020)×5=0.14,故从甲企业生产的产品中任取一件,该件产品是次品的概率约为 0.14.(2) 答案不唯一,只要言之有理便可(下面给出几种参考答案).①以产品的合格率(非次品的占有率)为标准,对甲、乙两家企业的食品质量进行比较.由图表可知:甲企业产品的合格率约为 0.86,乙企业产品的合格率约为 0.96,即乙企业产品的合格率高于甲企业产品的合格率,所以可以认为乙企业的食品生产质量更高.②以产品次品率为标准,对甲、乙两家企业的食品质量进行比较(略).③以产品中一等品的概率为标准,对甲、乙两家企业的食品质量进行比较.根据图表可知,甲企业产品中一等品的概率约为 0.4;乙企业产品中一等品的概率约为 0.48,即乙企业产品中一等品的概率高于甲企业产品中一等品的概率,所以乙企业的食品生产质量更高.【知识点】频率分布直方图21. 【答案】根据题意,设分布在 [40,50),[50,60) 内的数据个数分别为 x ,y .因为样本中数据在 [20,60) 内的频率为 0.6,样本容量为 50,所以4+5+x+y 50=0.6,解得 x +y =21.即样本在 [40,50),[50,60) 内的数据个数之和为 21.【知识点】频率与频数22. 【答案】(1) 如图所示.(2) 甲的平均数是8+13+13+14+15+216=14, 乙的平均数是 8+9+13+15+16+236=14; 甲的方差是 s 甲2=16×[(−6)2+(−1)2+(−1)2+02+12+72]≈14.7,乙的方差是 s 乙2=16×[(−6)2+(−5)2+(−1)2+12+22+92]≈24.7. 所以甲产品质量好,较稳定.【知识点】样本数据的数字特征。
高一数学数据分析与统计练习题一、选择题1. 下列哪个不是统计学的主要内容?A. 数据收集B. 数据分析C. 数据处理D. 数据存储2. 样本的大小对统计结果的可靠性有影响吗?A. 有影响B. 没有影响3. 下列哪个不是描述统计的方法?A. 均值B. 方差C. 相关系数D. 假设检验4. 当数据集中值波动很大时,使用哪个指标更准确?A. 中位数5. 下列哪种图表适合用于展示不同学科的成绩比较?A. 饼图B. 折线图C. 条形图D. 散点图二、解答题1. 某班级50名学生参加了一次数学测试,他们的成绩如下(成绩满分为100分):85, 78, 90, 92, 73, 88, 81, 65, 95, 77, 79, 82, 87, 94, 76, 71, 83, 89, 84, 91, 80, 85, 87, 70, 75, 88, 93, 85, 89, 98, 62, 77, 73, 69, 90, 81, 78, 93, 72, 89, 87, 95, 92, 76, 84, 79, 88, 83, 85, 80请计算该班级的平均成绩、中位数和众数。
2. 某超市对顾客年龄的统计如下:10, 12, 14, 9, 12, 15, 17, 22, 11, 12, 8, 10, 15, 13, 12, 18, 10, 12, 11, 15请计算该超市顾客年龄的众数。
3. 根据某店铺过去一周的销售数据,有以下销售额(单位:万元):12.5, 15.2, 11.8, 13.6, 14.9, 12.3, 15.1请计算该店铺过去一周销售额的平均值和标准差。
某公司聘请了5名大专毕业生,他们的月薪分别为3000元、4000元、3500元、3800元、3200元。
根据数据,回答以下问题:1. 计算他们的平均薪资和中位数。
2. 根据数据,你是否能确定这5名员工的薪资分布是正态分布?请解释你的答案。
3. 如果公司决定给每名员工发放500元的奖金,重新计算平均薪资和中位数,并比较新旧数据之间的变化。
高一数学统计试题答案及解析1.若变量y与x之间的相关系数r=-0.9362,查表得到相关系数临界值r=0.8013,则变量y0.05与x之间A.不具有线性相关关系B.具有线性相关关系C.它们的线性关系还要进一步确定D.不确定【答案】B【解析】因为相关系数的绝对值越大,越具有强大相关性,相关系数r=-0.9362,相关系数的绝对值约接近1,相关关系较强,故选B2.在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得数据如下(单位:kg)1)画出散点图;2)检验相关系数r的显著性水平;3)求月总成本y与月产量x之间的回归直线方程【答案】1)见解析;2)水稻产量与施化肥量之间存在线性相关关系;3)【解析】画出散点图如下:2)检验相关系数r的显著性水平:r==≈0.9733,在“相关系数检验的临界值表”查出与显著性水平0.05及自由度7-2相应的相关数临界值r。
05=0.754<0.9733,这说明水稻产量与施化肥量之间存在线性相关关系.3)设回归直线方程,利用计算a,b,得b=a=399.3-4.75×30≈257,则回归直线方程3.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间由如下一组数据:1)画出散点图;2)检验相关系数r的显著性水平;3)求月总成本y与月产量x之间的回归直线方程【答案】1)见解析;2)见解析;3)【解析】解:1)画出散点图:2)r=3)回归直线方程为:4.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下组对应数据:(1)画出散点图;(2)求月总成本y与月总产量x之间的回归直线方程.【答案】(1)略;(2)【解析】.回归直线方程为.5.从某地成年男子中随机抽取n人,测得平均身高=172cm,标准差sx=7.6cm,平均体重=72kg,标准差sy=15.2kg,相关系数r==0.5.求由身高估计平均体重的回归方程=a+bx,以及由体重估计平均身高的回归方程=c+dy.【答案】=x-100;=154+0.25y【解析】解:因为sx =, sy=一,故=0.5×7.6×15.2=57.76b=="1," a=-b=72-172×1=-100,回归方程为=x-100.由于x, y位置的对称性,d==0.25。
高一数学必修第二册第九章《统计》单元练习题卷4(共22题)一、选择题(共10题)1.某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )A.抽签法B.随机数法C.系统抽样法D.分层抽样法2.根据如图给出的2000年至2016年我国实际利用外资情况,以下结论正确的是实际利用外资规模实际利用外资同比增速( )A.2000年以来我国实际利用外资规模与年份负相关B.2010年以来我国实际利用外资规模逐年增加C.2008年我国实际利用外资同比增速最大D.2010年我国实际利用外资同比增速最大3.某学校组织部分学生参加体能测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是18人,则参加体能测试的学生人数是( )A.45B.48C.50D.604.下列调查方式中,可用普查的是( )A.调查某品牌电视机的市场占有率B.调查某电视连续剧在全国的收视率C.调查某校七年级一班的男女同学的比例D.调查某型号炮弹的射程5.某县共有小学生4400名,初中生3600名,高中生2000名,为了解该县学生的视力情况,计划按学段采用分层抽样法,抽取一个容量为100的样本,则应在这三个学段抽取学生的人数分别为( )A.34,55,11B.56,34,10C.55,30,10D.44,36,206.从某中学抽取100名学生进行周课余锻炼时长(单位:min)的调查,发现他们的锻炼时长都在50∼350min之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示,则直方图中x的值为( )A.0.0040B.0.0044C.0.0048D.0.00527.为全面地了解学生对任课教师教学的满意程度,特在某班开展教学调查.采用简单随机抽样的办法,从该班抽取20名学生,根据他们对语文、数学教师教学的满意度评分(百分制),绘制茎叶图如图.设该班学生对语文、数学教师教学的满意度评分的中位数分别为a,b,则( )A.a<b B.a>b C.a=b D.无法确定8.已知一组数据1,2,3,4,5,那么这组数据的方差为( )A.√2B.2C.√3D.39.某学校为了了解高一年级、高二年级、高三年级这三个年级的学生对学校有关课外活动内容与时间安排的意见,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )A.抽签法B.随机数法C.分层抽样法D.不能确定10.甲、乙、丙三名学生在一项集训中的40次测试分数都在[50,100]内,将他们的测试分数分别绘制成频率分布直方图,如图所示,记甲、乙、丙的分数标准差分别为s1,s2,s3,则它们的大小关系为( )A.s1>s2>s3B.s1>s3>s2C.s3>s1>s2D.s3>s2>s1二、填空题(共6题)11.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是.12.已知样本x1,x2,⋯,x2019的平均数和方差分别是1和4,若y i=ax i+b(i=1,2,⋯,2019)的平均数和方差也是1和4,则a b=.13.从一堆苹果中任取了20个,并得到它们的质量(单位:克)数据分布表如下:分组[90,100)[100,110)[110,120)[120,130)[130,140)[140,150)则这堆苹果中质量频数1231031不小于120克的苹果数约占苹果总数的%.14. 一个单位共有职工 200 人,其中不超过 45 岁的有 120 人,超过 45 岁的有 80 人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为 25 的样本,应抽取超过 45 岁的职工 人.15. 常用的百分位数(1)四分位数: , , .(2)其它常用的百分位数:第 1 百分位数, ,第 95 百分位数, .16. 思考辨析,判断正误.在分层随机抽样时,每层可以不等可能抽样.( )三、解答题(共6题)17. 为了选拔参加自行车比赛的选手,对自行车运动员甲、乙两人在相同条件下进行了 6 次测试,测得他们的最大速度(单位:m/s )的数据如下:甲273830373531乙332938342836(1) 根据这两组数据你能获得哪些信息;(2) 估计甲、乙两运动员的最大速度的平均数和方差,并判断谁参加比赛更合适.18. 试构造由 10 个正数组成的一组数据,使该组数据的平均数比中位数大 10.19. 某校从高二年级学生中随机抽取 60 名学生,将期中考试的政治成绩(均为整数)分成六段:[40,50),[50,60),[60,70),⋯,[90,100] 后得到如下频率分布直方图.(1) 根据频率分布直方图,分别求 a ,众数,中位数; (2) 估计该校高二年级学生期中考试政治成绩的平均数;(3) 用分层抽样的方法在各分数段的学生中抽取一个容量为 20 的样本,则在 [70,90) 分数段抽取的人数是多少?20. 某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):甲群 13,13,14,15,15,15,15,16,17,17;乙群54,3,4,4,5,5,6,6,6,57.(1) 甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?(2) 乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?21.为了创建“和谐平安”校园,某校决定在开学前将学校的电灯电路使用情况进行检查,以便排除安全隐患,该校应该怎样进行调查?22.共享单车入驻某市一周年以来,因其“绿色出行,低碳环保”的理念而备受人们的喜爱,值此周年之际,某机构为了了解共享单车使用者的年龄段、使用频率、满意度等三个方面的信息,在全市范围内发放5000份调查问卷,回收到有效问卷3125份,现从中随机抽取80份,分别对使用者的年龄段、26∼35岁使用者的使用频率、26∼35岁使用者的满意度进行汇总,得到如下三个表格:表(一)使用者年龄段25岁以下26岁∼35岁36岁∼45岁45岁以上人数20401010表(二)使用频率0∼6次/月7∼14次/月15∼22次/月23∼31次/月人数510205表(三)满意度非常满意(9∼10)满意(8∼9)一般(7∼8)不满意(6∼7)人数1510105(1) 依据上述表格完成下列三个统计图:(2) 某城区现有常住人口30万,请用样本估计总体的思想,试估计年龄在26岁∼35岁之间,每月使用共享单车在7∼14次的人数.答案一、选择题(共10题)1. 【答案】D【解析】总体(1000名学生)中的个体(男、女学生)有明显差异,应采用分层抽样法.【知识点】分层抽样2. 【答案】C【解析】从图表中可以看出,2000年以来我国实际利用外资规模基本上是逐年上升的,因此实际利用外资规模与年份正相关,选项A错误;我国实际利用外资规模2012年比2011年少,所以选项B错误;从图表中的折线可以看出,2008年实际利用外资同比增速最大,所以选项C正确;2008年实际利用外资同比增速最大,所以选项D错误;故选:C.【知识点】频率分布直方图3. 【答案】D【解析】低于60分的人数是18人,由频率分布直方图得低于60分的频率为:(0.005+0.010)×20=5.3.所以参加体能测试的学生人数n=180.5=60.故选:D.【知识点】频率分布直方图4. 【答案】C【解析】选项A,调查市场占有率,要求时效性,而普查时间较长,不适合普查;选项B,调查对象较多,在人力、物力、财力上很难实现,且结果要保证时效性,不适合普查;选项C,调查对象较少,且容易实现,适合普查;选项D,调查过程具有破坏性,不适合普查.【知识点】简单随机抽样5. 【答案】D【解析】由题意得,应在这三个学段抽取学生的人数分别为440010000×100=44,360010000×100=36,200010000×100=20.【知识点】分层抽样6. 【答案】B【解析】依题意及频率分布直方图知,0.0024×50+0.0036×50+0.0060×50+x×50+0.0024×50+0.0012×50=1,解得 x =0.0044. 【知识点】频率分布直方图7. 【答案】A【解析】由茎叶图得 a =75+762=75.5,b =75+772=76,所以 a <b .【知识点】样本数据的数字特征8. 【答案】B【解析】由题可得 x =1+2+3+4+55=3;所以这组数据的方差 s 2=15[(1−3)2+(2−3)2+(3−3)2+(4−3)2+(5−3)2]=2. 【知识点】样本数据的数字特征9. 【答案】C【解析】由于研究对象是三个年级学生的意见,故应按分层抽样法来抽取,故选C . 【知识点】分层抽样10. 【答案】B【解析】比较三个频率分布直方图知,甲为“双峰”直方图,两端数据最多,最分散,方差最大; 乙为“单峰”直方图,数据最集中,方差最小;丙为“单峰”直方图,但数据分布相对均匀,方差介于甲、乙之间. 综上可知 s 1>s 3>s 2.【知识点】样本数据的数字特征、频率分布直方图二、填空题(共6题) 11. 【答案】6【知识点】分层抽样12. 【答案】 1【解析】因为 x 1,x 2,⋯,x 2019 的平均数为 1,所以 y i =ax i +b (i =1,2,⋯,2019) 的平均数为 a ×1+b =1. 因为 x 1,x 2,⋯,x 2019 的方差为 4,所以 y i =ax i +b (i =1,2,⋯,2019) 的方差为 4a 2=4, 所以 {a 2=1,a +b =1,解得 {a =1,b =0 或 {a =−1,b =2.所以 a b =1.【知识点】样本数据的数字特征13. 【答案】70【解析】由表中可知这堆苹果中,质量不小于 120 克的苹果数为 20−1−2−3=14,故约占苹果总数的 1420=0.70,即 70%. 【知识点】频率分布直方图14. 【答案】 10【解析】因为超过 45 岁的职工为 80 人,占比例为 80200=25, 所以抽取的 25 人中超过 45 岁的职工为 25×25=10 人.【知识点】分层抽样15. 【答案】第 25 百分位数;第 50 百分位数;第 75 百分位数;第 5 百分位数;第 99 百分位数【知识点】样本数据的数字特征16. 【答案】 ×【知识点】分层抽样三、解答题(共6题) 17. 【答案】(1) 可以看出,甲、乙两人的最大速度都是均匀分布的,只是甲的最大速度的中位数是 33,乙的最大速度的中位数是 33.5,因此从中位数看乙的情况比甲好. (2) x 甲=16(27+38+30+37+35+31)=33,x 乙=16(33+29+38+34+28+36)=33, 所以他们的最大速度的平均数相同,再看方差 s 甲2=16[(−6)2+⋯+(−2)2]=473,s 乙2=16(02+⋯+32)=383,则 s 甲2>s 乙2,故乙的最大速度比甲稳定,所以派乙参加比赛更合适. 【知识点】样本数据的数字特征18. 【答案】不妨设平均数为 0,则中位数为 −10,为方便可取从小到大排列的 10 个数据的第 5个数和第 6 个数都是 −10.于是可构造 10 个数据如下(它们的和为 0):−14,−13,−12,−11,−10,−10,11,12,13,34.现将上面的每个数都加15,就得满足条件的10个正数:1,2,3,4,5,5,26,27,28,49.(结果不唯一)【知识点】样本数据的数字特征19. 【答案】(1) 由题意可得,(0.01+0.015×2+a+0.025+0.005)×10=1,解得a=0.03.根据频率分布直方图可知[70,80)分数段的频率最高,因此众数为75.又由频率分布直方图可知[40,70)分数段的频率为0.1+0.15+0.15=0.4,因为[70,80)分数段的频率为0.3,所以,中位数为70+13×10=2203.(2) 估计该校高二年级学生政治成绩的平均数为(45×0.01+55×0.015+65×0.015+ 75×0.03+85×0.025+95×0.005)×10=71.(3) 因为总体共60名学生,样本容量为20,因此抽样比为2060=13,又在[70,90)分数段共有60×(0.3+0.25)=33(人),因此,在[70,90)分数段抽取的人数是33×13=11.【知识点】样本数据的数字特征、频率分布直方图、分层抽样20. 【答案】(1) 甲群市民年龄的平均数为13+13+14+15+15+15+15+16+17+1710=15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.(2) 乙群市民年龄的平均数为54+3+4+4+5+5+6+6+6+5710=15(岁),中位数为5.5岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.【知识点】样本数据的数字特征21. 【答案】由于一个学校的电灯电路数目不算大,且对创建“和谐平安”校园来说,必须排除任一潜在或已存在的安全隐患,故必须用普查的方式.【知识点】数据的收集22. 【答案】(1)(2) 由表(一)可知:年龄在26岁∼35岁之间的有40人,占总抽取人数的一半,用样本估计总体的思想可知,某城区30万人口中年龄在26岁∼35岁之间的约有30×12=15(万人);又年龄在26岁∼35岁之间每月使用共享单车在7∼14次之间的有10人,占总抽取人数的14,用样本估计总体的思想可知,城区年龄在26岁∼35岁之间每月使用共享单车在7∼14次之间的约有15×14=154(万人),所以年龄在26岁∼35岁之间,每月使用共享单车在7∼14次之间的人数约为154万人.【知识点】简单随机抽样、频率分布直方图。
《统计》测试题(满分150分,时间120分钟)一、选择题(每小题5分,共50分)1.某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是() A.抽签法B.随机数法C.系统抽样法D.分层抽样法2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有()A.a>b>c B.b>c>a C.c>a>b D.c>b>a3.2014年某大学自主招生面试环节中,七位评委为一考生打出分数的茎叶图如图2-1,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为()图2-1A.84,4.84 B.84,1.6C.85,1.6 D.85,44.甲、乙、丙、丁四人参加射击项目选拔赛,四人平均成绩和方差如下:甲乙丙丁平均环数x8.6 8.9 8.9 8.2方差s2 3.5 3.5 2.1 5.6A.甲B.乙C.丙D.丁5.某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n人中,抽取35人进行问卷调查,已知高二被抽取的人数为13人,则n =()A.660B.720 C.780D.8006.下表是某小卖部一周卖出热茶的杯数与当天气温的对比表:气温/℃1813104-1若热茶杯数y()A.y=x+6 B.y=x+42 C.y=-2x+60 D.y=-3x+787.x是x1,x2,…,x100的平均数,a是x1,x2,…,x40的平均数,b是x41,x42,…,x100的平均数,则下列各式正确的是()A.x=40a+60b100 B.x=60a+40b100 C.x=a+b D.x=a+b28.在抽查某产品的尺寸过程中,将其尺寸数据分成若干组,[a,b]是其中一组,抽查出的个体数在该组上的频率是m,该组上的直方图的高为h,则|a-b|=()A.h·m B.hm C.mh D.与m,h无关9.甲、乙、丙三名运动员在某次测试中各射击20次,三人测试成绩的频率分布条形图分别如图2-2,图2-3和图2-4,若s甲,s乙,s丙分别表示他们测试成绩的标准差,则() A.s甲<s乙<s丙B.s甲<s丙<s乙C.s乙<s甲<s丙D.s丙<s甲<s乙图2-2 图2-3图2-410.图2-5是某县参加2014年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A1,A2,…,A m(如A2表示身高(单位:cm)在[150,155)内的学生人数).图2-6是统计图中身高在一定范围内学生人数的一个算法流程图.现要统计身高在160~180 cm(含160 cm,不含180 cm)的学生人数,那么在流程图中的判断框内应填写的条件是()图2-5图2-6A.i<9? B.i<8? C. i<7? D.i<6?二、填空题(每小题5分,共20分)11.下列四种说法中,①数据4,6,6,7,9,3的众数与中位数相等;②一组数据的标准差是这组数据的方差的平方;③数据3,5,7,9的标准差是数据6,10,14,18的标准差的一半;④频率分布直方图中各小长方形的面积等于相应各组的频数.其中正确的有__________(填序号).12.将参加数学竞赛的1000名学生编号如下:0001,0002, 003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法把编号分成50个部分,如果第一部分编号为0001,0002,0003,…,0020,第一部分随机抽取一个号码为0015,那么抽取的第40个号码为________.13.超速行驶已成为马路上最大杀手之一,已知某中段属于限速路段,规定通过该路段的汽车时速不超过80 km/h,否则视为违规.某天,有1000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图如图2-7,则违规的汽车大约为________辆.图2-714.已知回归直线斜率估计值为1.23,样本点中心为(4,5),则回归方程是____________.三、解答题(共80分)15.(12分)某校500名学生中,O型血有200人,A型血有125人,B型血有125人,AB型血有50人,为了研究血型与色弱的关系,用分层抽样的方法抽取一个容量为20的样本,则各种血型的人分别抽多少?写出抽样过程.16.(12分)对甲、乙两名自行车赛手在相同条件下进行了8次测试,测得他们的最大速度(单位:m/s)的数据如下表:(1)(2)分别求出甲、乙两名自行车赛手最大速度(单位:m/s)的数据的平均数、中位数、标准差,并判断选谁参加比赛更合适(可用计算器).17.(14分)有一个容量为100的样本,数据的分组及各组的频数如下:[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5],8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)数据落在[18.5,27.5)范围内的可能性为百分之几?18.(14分)为了调查甲、乙两个交通站的车流量,随机选取了14天,统计每天上午8:00~12:00间各自的车流量(单位:百辆),得如图2-8所示的统计图,根据统计图:(1)甲、乙两个交通站的车流量的极差分别是多少?(2)甲交通站的车流量在[10,40]间的频率是多少?(3)甲、乙两个交通站哪个更繁忙?并说明理由.图2-819.(14分)为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如图2-9),已知图中从左到右的前三个小组的频率分别是0.1,0.3,0.4.第一小组的频数是5.(1)求第四小组的频率和参加这次测试的学生人数;(2)在这次测试中,学生跳绳次数的中位数落在第几小组内?(3)参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩的优秀率是多少?图2-920.(14分)某连锁经营公司所属5个零售店某月的销售额和利润额资料如下表:(1)(2)若销售额和利润额具有相关关系,用最小二乘法计算利润额y对销售额x的回归直线方程;(3)据(2)的结果估计当销售额为1亿元时的利润额.第二章自主检测 1.D 2.D3.C 解析:平均分为80+15(4×3+6+7)=85,s 2=15[3×(84-85)2+(86-85)2+(85-87)2]=1.6.4.C 5.B 6.C 7.A 8.C 9.D 10.B 11.①③12.0795 解析:抽取的第40个号码为0015+39×20=0795. 13.28014.y ^=1.23x +0.0815.解:用分层抽样方法抽样.∵20500=250,∴200×250=8,125×250=5,50×250=2. 故O 型血抽8人,A 型血抽5人,B 型血抽5人,AB 型血抽2人. 16.解:(1)茎叶图如图D31,中间数为数据的十位数.图D31从这个茎叶图上可以看出,甲、乙的得分情况都是分布均匀的,只是乙更好一些;乙的中位数是35,甲的中位数是33.因此乙发挥比较稳定,总体得分情况比甲好.(2)利用科学计算器,得x 甲=34,x 乙=35.75;s 甲≈7.55,s 乙≈5.70;甲的中位数是33,乙的中位数是35. 综合比较,选乙参加比赛更合适.17.解:(1)样本的频率分布表如下:分组 频数 频率 [12.5,15.5) 6 0.06 [15.5,18.5) 16 0.16 [18.5,21.5) 18 0.18 [21.5,24.5) 22 0.22 [24.5,27.5) 20 0.20 [27.5,30.5) 10 0.10 [30.5,33.5] 8 0.08 合计1001.00(2)图D32(3)0.18+0.22+0.20=0.60=60%.18.解:(1)甲交通站的车流量的极差为73-8=65; 乙交通站的车流量的极差为71-5=66. (2)甲交通站的车流量在[10,40]间的频率为414=27.(3)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方.从数据的分布情况来看,甲交通站更繁忙.19.解:(1)第四小组的频率=1-(0.1+0.3+0.4)=0.2, 因为第一小组的频数为5,其频率为0.1, 所以参加这次测试的学生人数为5÷0.1=50(人).(2)0.3×50=15,0.4×50=20,0.2×50=10,则第一、第二、第三、第四小组的频数分别为5,15,20,10.所以学生跳绳次数的中位数落在第三小组内. (3)跳绳成绩的优秀率为(0.4+0.2)×100%=60%. 20.解:(1)销售额和利润额的散点图如图D33.图D33(2)销售额和利润额具有相关关系,列表如下:x i 3 5 6 7 9 y i 2 3 3 4 5 x i y i615182845x =6,y =3.4,51i i i x y =∑=112,521i i x =∑=200所以b ^=112-5×6×3.4200-5×62=0.5,11 / 11 a ^=y -b ^x =3.4-6×0.5=0.4.从而得回归直线方程y ^=0.5x +0.4.(3)当x =10时,y ^=0.5×10+0.4=5.4(百万元).故当销售额为1亿元时,利润额估计为540万元.。
高一数学第15周测试题(统计Ⅰ、Ⅱ节)1、从高一D 级1000名学生中抽取60名学生进行体重的统计分析,在这个问题中,60名学生的体重是( )A 、总体B 、个体C 、从总体中抽取的一个样本D 、样本容量 2、从162人中抽取一个样本容量为16的样本,采用系统抽样的方法则必须从这162人中剔除( )人A 、1B 、2C 、3D 、43、一批热水器共有98台,其中甲厂生产的有56台,乙厂生产的有42台,用分层抽样从中抽出一个容量为14的样本,那么甲、乙两厂各抽得的热水器的台数是( )A 、甲厂9台,乙厂5台B 、甲厂7台,乙厂7台C 、甲厂10台,乙厂4台D 、甲厂8台,乙厂6台4、频率分布直方图中,各小长方形高的比不.等于( ) A 、组距比 B 、频率比 C 、面积比 D 、频数比5、一个容量为10的样本数据,分组后,组距与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),1则样本在[20,30)上的频率为( )A 、0.2B 、0.4C 、0.1D 、0.36、计算40个数据的平均数时,错将其中的一个数据115输入为15,那么由此求出的平均数与实际平均数的差是( )A 、-2.5B 、2.5C 、3.25D 、-3.257、阅读如图1的程序框图,如果两次输入的值分别为1和3,则输出y 的值分别为( )A 、1和6B 、2和9C 、2x 和x 2D 、3和68、某商场一天中售出MK 牌运动鞋12双,其中各种尺码的鞋的销售量如下表所9、在频率分布直方图中共有11个小矩形,其中中间小矩形的面积是其余小矩形面积之和的4倍,若样本容量为220,则该组的频数是( )A 、176B 、44C 、20D 、以上答案都不对10、一组数据X 1,X 2,…,Xn 的平均数是3,方差是5,则数据3X 1+2,3X 2+2,…,3Xn +2 的平均数和方差分别是( )A 、3 ,5B 、5 ,15C 、11 ,45D 、5 ,4511、从参加数学竞赛的100名学生中抽取一个容量为10的样本,按系统抽样的方法分成10组,第一组随机抽取一个号码为05,则抽取的第8个号码为12、观察某县新生婴儿的体重,其频率分布直方图如图2所示,则新生婴儿体重在[2.6,2.8)的频率为图113、某班学生父母年龄的茎叶图如图3所示,则该班学生的母亲的平均年龄是________;父亲的平均年龄是_________14、如图4所示的程序运行后输出的结果是班级 学号 姓名 分数二、填空题(5×4=20)11、 12、 13、(1) (2) 14、三、计算题(30)15、某赛季甲、乙两名NBA 球员在5场比赛中的盖帽数如下: 甲 2,3,4,5,6 乙 3,4,5,3,5根据上述数据,试判断谁更优秀.父 母 2 3 8 4 7 2 3 1 2 83 1 7 1 2 345 图3图22.8 2.4 2.6 33.2 3.4图4高一数学第15周测试题(统计Ⅰ、Ⅱ节)参考答案二、填空题11、75 12、 0.3 13、(1) 41 (2) 44 14、 2 三、 15、分故乙比甲更优秀,但乙比甲更稳定,两人的平均盖帽数相同由此可以说明,甲、乙> = 分 ])-+()-+()-+()-+()-[(=分 ])-+()-+()-+()-+()-[(=分 =++++=分=++++=乙甲乙甲乙甲乙甲30 . s s 24 8.0454********1s 172464544434251s 10 4553543 5 4565432 22222222222222x x x x ∴==。
高一数学必修第二册第九章《统计》单元练习题卷11(共22题)一、选择题(共10题)1.天津市某中学组织高二年级学生参加普法知识考试(满分100分),考试成绩的频率分布直方图如图,数据(成绩)的分组依次为[20,40),[40,60),[60,80),[80,100],若成绩低于60分的人数是180,则考试成绩在区间[60,80)内的人数是( )A.180B.240C.280D.3202.关于频率分布直方图中小长方形的高的说法,正确的是( )A.表示该组上的个体在样本中出现的频率B.表示取某数的频率C.表示该组上的个体数与组距的比值D.表示该组上的个体在样本中出现的频率与组距的比值3.下列问题中,最适合用简单随机抽样方法抽样的是( )A.某学术厅有32排座位,每排有40个座位,座位号是1∼40,有一次报告会学术厅里坐满了观众,报告会结束以后听取观众的意见,要留下32名观众进行座谈B.从10台冰箱中抽取3台进行质量检验C.某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人.教育部门为了解大家对学校机构改革的意见,要从中抽取容量为20的样本D.某乡农田有山地8000亩,丘陵12000亩,平地24000亩,洼地4000亩,现抽取农田480亩估计全乡农田平均产量4.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分,1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A.中位数B.平均数C.方差D.极差5.从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),⋯,[5.45,5.47],[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A.10B.18C.20D.366.10名工人生产某一零件,生产的件数分别是10,12,14,14,15,15,16,17,17,17.设其平均数为a,中位数为b,众数为c,则( )A.a>b>c B.b>c>a C.c>a>b D.c>b>a7.某班由编号为01,02,03,⋯,50的50名学生组成,现在要选取8名学生参加合唱团,选取方法是从如下随机数表的第1行第11列开始由左到右依次选取两个数字,则该样本中选出的第8名学生的编号为( )495443548217379323783035209623842634916450258392120676572355068877044767217633502583921206764954A.20B.23C.26D.348.在一次体育测试中,某班的6名同学的成绩(单位:分)分别为66,83,87,83,77,96.关于这组数据,下列说法错误的是( )A.众数是83B.中位数是83C.极差是30D.平均数是839.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是A.12,24,15,9B.9,12,12,7C.8,15,12,5D.8,16,10,610.某学校随机抽取了部分学生,对他们每周使用手机的时间进行统计,得到如下的频率分布直方图.若从每周使用时间在[15,20),[20,25),[25,30)三组内的学生中用分层抽样的方法选取8人进行访谈,则应从使用时间在[20,25)内的学生中选取的人数为( )A.1B.2C.3D.4二、填空题(共6题)11.某次体检,8位同学的身高(单位:米)分别为 1.68,1.71,1.73,1.63,1.81,1.74,1.66,1.78,则这组数据的中位数是(米).12.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如图所示),已知从左到右各长方形高的比为2:3:5:6:3:1,则该班学生数学成绩在(80,100)之间的学生人数是.13.校本课程的学分,统计如表.甲811141522乙67102324用s12,s22分别表示甲、乙两班抽取的5名学生学分的方差,计算两个班学分的方差,得s22=,并由此可判断成绩更稳定的班级是班.14.众数、中位数、平均数(1)众数、中位数、平均数的概念.①众数:在一组数据中,出现最多的数据(即频率分布最大值所对应的样本数据)叫这组数据的众数.若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数.②中位数:将一组数据按大小依次排列,把处在位置的一个数据(或中间两个数据的平均数)叫这组数据的中位数.③平均数:指样本数据的算术平均数.即:x=.(2)众数、中位数、平均数与频率分布直方图的关系.众数众数是最高矩形的 所对应的数据,表示样本数据的中心值中位数①在频率分布直方图中,中位数左边和右边的直方图 相等,由此可以估计中位数的值,但是有偏差②表示样本数据所占频率的等分线平均数①平均数等于每个小长方形的面积乘以小长方形底边中点的横坐标之和②平均数是频率分布直方图的重心,是频率分布直方图的平衡点15.某学校高一、高二、高三年级的学生人数之比为3:3:4,现用分层随机抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取名学生.16.一汽车厂生产甲,乙,丙三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):轿车甲轿车乙轿车丙舒适型100120z标准型300480600按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有甲类轿车10辆,则z的值为,抽取的50辆车中,乙类舒适型的数量为.三、解答题(共6题)17.一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.18.作为北京副中心,通州区的建设不仅成为京津冀协同发展战略的关键节点,也肩负着医治北京市“大城市病”的历史重任,因此,通州区的发展备受啊目,2017年12月25日发布的《北京市通州区统计年鉴(2017)》显示:2016年通州区全区完成全社会固定资产投资939.9亿元,比上年增长17.4%,下面给出的是通州区2011∼2016年全社会固定资产投资及增长率,如图一.根据通州区统计局2018年1月25日发布:2017年通州区全区完成全社会固定资产投资1054.5亿元,比上年增长12.2%.(1) 在图二中画出2017年通州区全区完成全社会固定资产投资(柱状图),标出增长率并补全折线图;(2) 从2011∼2017这7年中随机选取续的2年份,求后一年份增长率高于前一年份增长率的概率;(3) 设2011∼2017这7年全社会固定资产投资总额的中位数为x0,平均数为x,比较x0与x的大小(写出结论即可).19.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.(1) 求这次测试数学成绩的众数; (2) 求这次测试数学成绩的中位数.20. 某公交公司为了估计某线路公交公司发车的时间间隔,对乘客在这条线路上的某个公交车站等车的时间进行了调查,以下是在该站乘客候车时间的部分记录:等待时间(分钟)频数频率[0,3) 0.2[3,6) 0.4[6,9)5x [9,12)2y [12,15) 0.05合计z 1 (1) 求 x ,y ,z ;(2) 画出频率分布直方图及频率分布折线图; (3) 计算乘客平均等待时间的估计值.21. 某校从高一全体男生中用简单随机抽样抽取了 20 人测量出体重情况如下:(单位 kg )6556708266725486706258726460767280685866试估计该校高一男生的平均体重,以及体重在 60∼75 kg 之间的人数所占比例.22. 平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有何缺点?答案一、选择题(共10题)1. 【答案】B【知识点】频率分布直方图2. 【答案】D,面积表示频率.【解析】频率分布直方图中小长方形的高是频率组距【知识点】频率分布直方图3. 【答案】B【知识点】简单随机抽样4. 【答案】A【解析】根据题意,从9个原始评分中去掉1个最高分,1个最低分,得到7个有效评分,7个有效评分与9个原始评分相比,最中间的一个数不变,即中位数不变.【知识点】样本数据的数字特征5. 【答案】B【解析】根据直方图,直径落在区间[5.43,5.47)之间的零件频率为:(6.25+5.00)×0.02=0.225,则区间[5.43,5.47)内零件的个数为:80×0.225=18.【知识点】频率分布直方图6. 【答案】D=14.7,【解析】依题意,得a=10+12+14+14+15+15+16+17+17+1710中位数b=15,众数c=17,故c>b>a.【知识点】样本数据的数字特征7. 【答案】D【解析】从样本中选出来的8名学生的编号分别为17,37,23,30,35,20,26,34.故该样本中选出的第8名学生的编号为34.【知识点】简单随机抽样8. 【答案】D【知识点】样本数据的数字特征9. 【答案】D【解析】高级职称应抽取:160×40800=8(人),中级职称应抽取:320×40800=16(人),初级职称应抽取:200×40800=10(人),其余人员:120×40800=6(人).【知识点】分层抽样10. 【答案】C【解析】由频率分布直方图可知:5×(0.01+0.02+a+0.04+0.04+0.06)=1,解得:a=0.03,即在[15,20),[20,25),[25,30)三组内的学生数之比为:4:3:1,则从每周使用时间在[15,20),[20,25),[25,30)三组内的学生中用分层抽样的方法选取8人进行访谈,则应从使用时间在[20,25)内的学生中选取的人数为38×8=3.【知识点】分层抽样、频率分布直方图二、填空题(共6题)11. 【答案】1.72【知识点】样本数据的数字特征12. 【答案】33【解析】数学成绩在(80,100)之间的学生人数是(520+620)×60=33.【知识点】频率分布直方图13. 【答案】62;甲【知识点】样本数据的数字特征14. 【答案】次数;最中间;1n(x1+x2+⋯+x n);中点;面积【知识点】样本数据的数字特征15. 【答案】15【解析】高二年级学生人数占总数的310,样本容量为50,则应从高二年级抽取的学生人数为50×310=15.【知识点】分层抽样16. 【答案】400;3【解析】由题意知抽样比为10100+300=140,则50100+300+120+480+z+600=140,解得z=400.可得甲,乙,丙三类车数量的比例为2:3:5,则乙类车抽到的数量为310×50=15,乙类车中,舒适型与标准型的数量比为1:4,所以舒适型的数量为15×15=3.【知识点】分层抽样三、解答题(共6题)17. 【答案】因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而应采用分层抽样的方法.具体过程如下:(1)将3万人分成5层,一个乡镇为一层.(2)按照各乡镇的人口比例随机抽取各乡镇的样本:300×315=60( 人),300×215=40(人),300×515=100( 人),300×215=40( 人),300×315=60( 人).各乡镇分别用分层抽样抽取的人数分别为60,40,100,40,60.(3)将抽取的这300人组到一起,即得到一个样本.【知识点】分层抽样18. 【答案】(1) 由题意在图二中画出2017年通州区全区完成全社会固定资产投资(柱状图),标出增长率并补全折线图,如图.(2) 从2011∼2017这7年里,随机选取连续的2个年份,共6组,分别为:(2011,2012),(2012,2013),(2013,2014),(2014,2015),(2015,2016),(2016,2017),设事件A表示“随机选取续的2年份,后一年份增长率高于前一年份增长率”,则事件A包含的基本事件有2个,分别为:(2011,2012),(2015,2016),所以随机选取续的2年份,后一年份增长率高于前一年份增长率的概率P(A)=26=13.(3) x0<x.【知识点】频率与频数、样本数据的数字特征、频率分布直方图19. 【答案】(1) 由题干图知众数为70+802=75.(2) 由题干图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x−70),所以x≈73.3,即中位数为73.3.【知识点】频率分布直方图、样本数据的数字特征20. 【答案】(1) 由上面表格得0.2+0.4+x+y+0.05=1即x+y=0.35,又52=xy,所以x=0.25,y=0.1.又5z=x=0.25,所以z=20(2) 根据上一问做出的数据画出频率分步直方图.(3) 由频率分步直方图可以知道x=1.5×0.2+4.5×0.4+7.5×0.25+10.5×0.1+13.5×0.05=5.7,即乘客平均等待时间的估计值是5.7.【知识点】频率分布直方图、样本数据的数字特征、频率与频数21. 【答案】这20名男生的平均体重为65+56+70+⋯+68+58+6620=67.85(kg).20名男生中体重在60∼75kg之间的人数为12,故这20名男生体重在60∼75kg之间的人数所占比例为1220=0.6.所以佔计该校高一男生的平均体重约为67.85kg,体重在60∼75kg之间的人数所占比例约为0.6.【知识点】样本数据的数字特征22. 【答案】平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但是平均数受数据中极端值的影响较大.【知识点】样本数据的数字特征。
高一数学统计与概率试题答案及解析1.甲,乙两人在相同条件下练习射击,每人打发子弹,命中环数如下【答案】甲稳定【解析】略2.从装有个红球和个黒球的口袋内任取个球,那么互斥而不对立的两个事件是()A.至少有一个黒球与都是黒球B.至少有一个黒球与都是黒球C.至少有一个黒球与至少有个红球D.恰有个黒球与恰有个黒球【答案】D【解析】A中至少有一个黒球包括都是黑球,不是互斥的;B中至少有一个黒球包括都是黑球,不是互斥的;C中两个事件都可能是1黑球1红球;D中是互斥事件但不对立【考点】互斥事件与对立事件3.在一块并排10垄的土地上,选择2垄分别种植A、B两种植物,每种植物种植1垄,为有利于植物生长,则A、B两种植物的间隔不小于6垄的概率为()A. B. C. D.【答案】B【解析】任意种植的方法数,间隔不小于6垄的方法数为12,所以概率【考点】古典概型概率4.(本题满分14分)一个包装箱内有6件产品,其中4件正品,2件次品。
现随机抽出两件产品,(1)求恰好有一件次品的概率。
(2)求都是正品的概率。
(3)求抽到次品的概率【答案】(1);(2);(3)【解析】本题中三个小题考察的都是古典概型概率,求解时需找到所有基本事件总数和满足题意要求的基本事件的个数,求其比值即可,在求解时当情况比较多可首先考虑其对立事件试题解析:将六件产品编号,ABCD(正品),ef(次品),从6件产品中选2件,其包含的基本事件为:(AB)(AC)(AD)(Ae)(Af)(BC)(BD)(Be)(Bf)(CD)(Ce)(Cf)(De)(Df)(ef).共有15种, 2分(1)设恰好有一件次品为事件A,事件A中基本事件数为:8则P(A)= 6分(2)设都是正品为事件B,事件B中基本事件数为:6则P(B)= 10分(3)设抽到次品为事件C,事件C与事件B是对立事件,则P(C)=1-P(B)=1- 14分【考点】古典概型概率5.欧阳修《卖油翁)中写到:“(翁)乃取一葫芦置于地,以钱覆其口,徐以杓酌漓沥之,自钱孔入,而钱不湿”,可见“行行出状元”,卖油翁的技艺让人叹为观止,若铜钱是直径为4 cm的圆,中间有边长为l cm的正方形孔.若随机向铜钱上滴一滴油(设油滴整体落在铜钱上).则油滴(设油滴是直径为0.2 cm的球)正好落入孔中(油滴整体落入孔中)的概率是.【答案】【解析】油滴(设油滴是直径为0.2 cm的球),所以油滴的球心必须落在边长为的正方形边界或其内部(如图中红色的正方形),而随机向铜钱上滴一滴油且油滴整体落在铜钱上即油滴的球心必须落在以铜钱的中心为球心以为半径的圆上或内部(如图中红色的小圆)。
高一数学必修第二册第九章《统计》单元练习题卷3(共22题)一、选择题(共10题)1. 某地区有网购行为的居民约 10 万人.为了解他们网上购物消费金额占日常消费总额的比例情况,现从中随机抽取 168 人进行调查,其数据如表所示.由此估计,该地区网购消费金额占日常消费总额的比例在 20% 及以下的人数大约是 ( )网购消费金额占日常消费总额的比例人数10%及以下4010%∼20%(含20%)5420%∼30%(含30%)3230%∼40%(含40%)740%∼50%(含50%)850%∼60%(含60%)1460%以上13合计168A .1.68 万B .3.21 万C .4.41 万D .5.59 万2. 将一组以 1 开头的连续的正整数写在黑板上,擦去其中一个数,余下的数的算术平均数为 493,则擦去的那个数是 ( ) A . 5B . 6C . 7D . 83. 随着人民生活水平的提高,对城市空气质量的关注度也逐步增大,下图是某城市 1 月至 8 月的空气质量检测情况,图中一、二、三、四级是空气质量等级,一级空气质量最好,一级和二级都是质量合格天气,下面四种说法正确的是 ( )① 1 月至 8 月空气合格天数超过 20 天的月份有 5 个; ②第二季度与第一季度相比,空气合格天数的比重下降了; ③ 8 月是空气质量最好的一个月; ④ 6 月的空气质量最差.A .①②③B .①②④C .①③④D .②③④4.高铁、扫码支付、共享单车、网购被称为中国的“新四大发明”,为评估共享单车的使用情况,选了n座城市作试验基地,这n座城市共享单车的使用量(单位:人次/天)分别为x1,x2,⋯,x n,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是( ( )A.x1,x2,⋯,x n的平均数B.x1,x2,⋯,x n的标准差C.x1,x2,⋯,x n的最大值D.x1,x2,⋯,x n的中位数5.下列说法不正确的是( )A.普查是要对所有的对象进行调查B.样本不一定是从总体中抽取的,没抽取的个体也是样本C.当调查的对象很少时,普查是很好的调查方式,但当调查的对象很多时,要耗费大量的人力、物力和财力D.普查不是在任何情况下都能实现的6.使用简单随机抽样从1000件产品中抽出50件进行某项检查,合适的抽样方法是( )A.抽签法B.随机数法C.随机抽样法D.以上都不对7.某学校为了了解高一年级、高二年级、高三年级这三个年级的学生对学校有关课外活动内容与时间安排的意见,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )A.抽签法B.随机数法C.分层抽样法D.系统抽样法8.某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )类别人数/人老年教师900中年教师1800青年教师1600合计4300 A.90B.100C.180D.3009.已知数据x1,x2,x3,⋯,x n是某市普通职工n(n≥3,n∈N+)个人的年收入,设这n个数据的中位数为x,平均数为y,方差为z,如果再加上世界首富的年收入x n+1,那么关于这(n+1)个数据的说法正确的是( )A.平均数大大增大,中位数一定变大,方差可能不变B.平均数大大增大,中位数可能不变,方差变大C.平均数大大增大,中位数可能不变,方差也不变D.平均数可能不变,中位数可能不变,方差可能不变10.某公司在甲、乙、丙、丁四个地区分别有150,120,180,150个销售点.公司为了调查产品销售情况,需从这600个销售点中抽取一个容量为100的样本.按照分层抽样的方法抽取样本,则丙地区抽取的销售点比乙地区抽取的销售点多( )A.5个B.8个C.10个D.12个二、填空题(共6题)11.思考辨析判断正误50%分位数就是中位数.( )12.某校高二年级化生史组合只有2个班,且每班50人,在一次数学测试中,从两个班抽取了20名学生的数学成绩进行分析,统计得在该次测试中,两班中各拍取的20名学生的平均成绩分别为110分和106分,则该组合学生的平均成绩约为分.13.2020年初,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常返校开学,不得不在家“停课不停学”.为了解高三学生每天居家学习时长,从某校的调查问卷中,随机抽取n个学生的调查问卷进行分析,得到学生学习时长的频率分布直方图(如图所示).已知学习时长在[9,11)的学生人数为25,则n的值为.14.已知一组数据4,2a,3−a,5,6的平均数为4,则a的值是.15.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名授课教师中抽取20名教师,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图:0791335672124588据此可估计该校上学期200名教师中,使用多媒体进行教学次数在301474112[15,25)内的人数为.16.中位数:把一组数据按的顺序排列,处在位置的数(或中间两个数的)叫做这组数据的中位数.三、解答题(共6题)17.在下列问题中,各采取怎样的抽样方法抽取样本较为合适?(1) 从20台手提电脑中抽取4台进行质量检查;(2) 某大剧院共有80排座位,每排共有120个座位,座位号为1∼120,有一次音乐会坐满了观众,音乐会结束后为听取观众意见需留下80名观众进行座谈;(3) 某学校共有七个年级1600名学生,其中,六年级学生160名,七年级学生160名,八年级学生240名,九年级学生240名,高中一年级学生200名,高中二年级学生280名,高中三年级学生320名,从中抽取一个容量为160的样本.18.某公司为了了解一年内的用水情况,抽取了10天的用水量如表所示:用水量/t22384041445095天数1112212(1) 在这10天中,该公司用水量的平均数是多少?每天用水量的中位数是多少?(2) 你认为应该用平均数和中位数中的哪一个来描述该公司每天的用水量?19.某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810310.010.29.99.810.010.110.29.7旧设备和新设备生产产品新设备10.110.410.110.010.110.310.610.510.410.5的该项指标的样本平均数分别记为x和y,样本方差分别记为s12和s22.(1) 求x,y,s12,s22;(2) 判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y−x≥2√s12+s22,则10认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).20.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号分组频数1[0,2)62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14)68[14,16)29[16,18)2合计100(1) 从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2) 求频率分布直方图中的a,b的值;(3) 假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)21.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表.学历35岁以下35∼50岁50岁以上本科803020研究生x20y(1) 用分层抽样的方法在35∼50岁年龄段的专业技术人员中抽取一个容量为5的样本,求在35∼50岁年龄段学历为研究生和本科各多少人?(2) 在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取出1人,此人的年龄为50岁以上的概率为539,求x,y的值.22.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工只能参加其中一组,在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%;登山组的职工占参加活动总人数的14,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取容量为200的样本.试求:(1) 游泳组中,青年人、中年人、老年人分别占的比例;(2) 游泳组中,青年人、中年人、老年人分别应抽取的人数.答案一、选择题(共10题)1. 【答案】D【知识点】频率分布直方图2. 【答案】B【解析】设共有n个数,去掉的数为x.由已知,n个连续的自然数的和为S n=n(n+1)2,若x=n,剩下的数的平均数是S n−nn−1=n2;若x=1,剩下的数的平均数是S n−1n−1=n2+1.由n2≤493≤n2+1,解得3023≤n≤3223,因为n为正整数,所以n=31或32.当n=32时,31×493=32(32+1)2−x,解得x=2123(不符合题意);当n=31时,30×493=31(31+1)2−x,解得x=6.所以去掉的数是6.【知识点】样本数据的数字特征3. 【答案】A【解析】在A中,1月至8月空气合格天数超过20谈的月份有:1月,2月,6月,7月,8月,共5个,故A正确;在B中,第一季度合格天数的比重为22+26+1931+29+31≈0.8462;第二季度合格天气的比重为19+13+2530+31+30≈0.6263,所以第二季度与第一季度相比,空气达标天数的比重下降了,所以B是正确的;在C中,8月空气质量合格天气达到30天,是空气质量最好的一个月,所以是正确的;在D中,5月空气质量合格天气只有13天,5月份的空气质量最差,所以是错误的,综上,故选A.【知识点】频率分布直方图4. 【答案】B【解析】表示一组数据x1,x2,⋯,x n的稳定程度是方差或标准差.【知识点】样本数据的数字特征5. 【答案】B【解析】样本必须是从总体中抽取的,没抽取的个体不是样本.【知识点】简单随机抽样6. 【答案】B【解析】由于总体相对较大,样本量较小,故采用随机数法较为合适.【知识点】系统抽样7. 【答案】C【解析】某学校为了了解高一年级、高二年级、高三年级这三个年级的学生对学校有关课外活动内容与时间安排的意见,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是分层抽样.【知识点】分层抽样8. 【答案】C【解析】设该样本中的老年教师人数为x,由题意及分层抽样的特点得x900=3201600,故x=180.【知识点】分层抽样9. 【答案】B【解析】插入大的极端值,平均数增加,中位数可能不变,方差也因为数据更加分散而变大.【知识点】样本数据的数字特征10. 【答案】C【解析】由题意:乙地区抽取120600×100=20(个),丙地区抽取180600×100=30(个),30−20=10(个),丙地区抽取的销售点比乙地区抽取的销售点多10个.【知识点】分层抽样二、填空题(共6题)11. 【答案】√【知识点】样本数据的数字特征12. 【答案】108【知识点】样本数据的数字特征13. 【答案】50【解析】由频率分布直方图的性质可得:2×(0.05+0.15+x+0.05)=1,解得:x=0.25,,解得:n=50.所以学习时长在[9,11)的频率为:2x=0.5=25n故答案为:50.【知识点】频率分布直方图14. 【答案】2【解析】因为数据4,2a,3−a,5,6的平均数为4,所以4+2a+3−a+5+6=20,即a=2.【知识点】样本数据的数字特征15. 【答案】60【知识点】简单随机抽样、茎叶图16. 【答案】从小到大(或从大到小);中间;平均数【知识点】样本数据的数字特征三、解答题(共6题)17. 【答案】(1) 随机简单抽样.(2) 系统抽样法.(3) 分层抽样法.【知识点】系统抽样、简单随机抽样、分层抽样18. 【答案】×(22+38+40+2×41+2×44+50+(1) 在这10天中,该公司用水量的平均数是x=1102×95)=51(t).=42.5(t).每天用水量的中位数是41+442(2) 平均数受数据中的极端值(2个95)影响较大,使平均数在估计总体时可靠性降低,10天的用水量有8天都在平均值以下,故用中位数描述每天的用水量更合适.【知识点】样本数据的数字特征19. 【答案】=10.(1) x=9.8+10.3+10+10.2+9.9+9.8+10+10.1+10.2+9.710=10.3,y=10.1+10.4+10.1+10+10.1+10.3+10.6+10.5+19.4+10.510=0.036,s12=0.22+0.32+0+0.22+0.12+0.22+0+0.12+0.22+0.3210s22=0.22+0.12+0.22+0.32+0.22+0+0.32+0.22+0.12+0.2210=0.04.(2) 依题意,y−x=0.3=2×0.15=2√0.152=2√0.0225,2√0.036+0.0410=2√0.0076,y−x≥2√s12+s2210,所以新设备生产产品的该项指标的均值较旧设备有显著提高.【知识点】样本数据的数字特征20. 【答案】(1) 根据频数分布表,100名学生中课外阅读时间不少于12小时的学生共有6+2+2=10名,所以样本中的学生课外阅读时间少于12小时的频率是1−10100=0.9.从该校随机选取一名学生,估计这名学生该周课外阅读时间少于12小时的概率为0.9.(2) 课外阅读时间落在组[4,6)的有17人,频率为0.17,所以a=频率组距=0.172=0.085,课外阅读时间落在组[8,10)的有25人,频率为0.25,所以b=频率组距=0.252=0.125.(3) 估计样本中的100名学生课外阅读时间的平均数在第4组.【知识点】频率分布直方图21. 【答案】(1) 用分层抽样的方法在35∼50岁中抽取一个容量为5的样本,设抽取学历为本科的人数为m,所以3050=m5,解得m=3,所以抽取了学历为研究生的2人,学历为本科的3人.(2) 依题意得10N =539,解得N=78,所以35∼50岁中被抽取的人数为78−48−10=20,所以4880+x =2050=1020+y,解得x=40,y=5,所以x=40,y=5.【知识点】分层抽样22. 【答案】(1) 设登山组人数为x,游泳组中青年人、中年人、老年人所占比例分别为a,b,c,则有x⋅40%+3xb4x=47.5%,x⋅10%+3xc4x=10%,解得b=50%,c=10%,故a=100%−50%−10%=40%,即游泳组中,青年人、中年人、老年人各占比例为40%,50%,10%.×40%=60(人);(2) 游泳组中,抽取的青年人人数为200×34×50%=75(人);抽取的中年人人数为200×34×10%=15(人);抽取的老年人人数为200×34即游泳组中,青年人、中年人、老年人分别应抽取的人数为60人,75人,15人.【知识点】分层抽样11。
高一数学统计案例试题答案及解析1.用辗转相除法求得459和357的最大公约数是_________ .[【答案】51.【解析】由用辗转相除法知:由于459÷357,余数是102;357÷102,余数是51;102÷51,整除;所以459和357的最大公约数是51; 故应填入:51.【考点】辗转相除法.2.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身高儿子身高则,对的线性回归方程为( )A. B. C. D.【答案】C.【解析】∵,,∴,,∴线性回归方程为.【考点】线性回归方程.3.某公司的广告费支出与销售额(单位:万元)之间有下列对应数据:由资料显示对呈线性相关关系。
x24568根据上表提供的数据得到回归方程中的,预测销售额为115万元时约需万元广告费.【答案】15【解析】由题知=(2+4+5+6+8)=5,=(30+40+60+50+70)=50,因为回归直线过样本中心点(,),所以50=6.5×5+,解得=17.5,所以回归直线方程为,令=115,解得=15.考点:回归直线方程4.用秦九韶算法求多项式f(x)=7x3+3x2-5x+11在x=23时的值,在运算过程中下列数值不会出现的是()A.164B.3 767C.86 652D.85 169【答案】D【解析】,故D正确。
【考点】秦九韶算法5.三个数的最大公约数是_________________。
【答案】24【解析】因为三个数都是偶数,则都除与8约简得,9、15、21,容易得出 9、15、21这三个数的最大公约数是3,所以72、120、168的最大公约数是【考点】更相减损术6.某公司的广告费支出x与销售额y(单位:万元)之间有下列对应数据:由资料显示对呈线性相关关系。
根据上表提供的数据得到回归方程中的,预测销售额为115万元时约需万元广告费。
参考公式:回归方程为其中,【答案】15万元【解析】略7.(2014•潍坊三模)为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到如下的2×2列联表.喜爱打篮球不喜爱打篮球合计则至少有()的把握认为喜爱打篮球与性别有关.A.95%B.99%C.99.5%D.99.9%【答案】C【解析】根据所给的列联表得到求观测值所用的数据,把数据代入观测值公式中,做出观测值,同所给的临界值表进行比较,得到所求的值所处的位置,得到百分数.解:根据所给的列联表,得到k2==8.333>7.879,∴至少有99.5%的把握说明喜爱打篮球与性别有关.故选:C.点评:根据所给的列联表得到求观测值所用的数据,把数据代入观测值公式中,做出观测值,同所给的临界值表进行比较,得到所求的值所处的位置,得到百分数.8.(2014•呼和浩特二模)从1,2,3,4,5中不放回地依次取2个数,事件A=“第一次取到的是奇数”,B=“第二次取到的是奇数”,则P(B|A)=()A. B. C. D.【答案】D【解析】先计算P(AB)、P(A),再利用P(B|A)=,即可求得结论.解:由题意,P(AB)==,P(A)==∴P(B|A)===故选D.点评:本题考查条件概率,考查学生的计算能力,属于基础题.9.(2014•淄博三模)先后掷骰子(骰子的六个面分别标有1、2、3、4、5、6个点)两次落在水平桌面后,记正面朝上的点数分别为x、y,设事件A为“x+y为偶数”,事件B为“x、y中有偶数,且x≠y”,则概率P(B|A)=()A. B. C. D.【答案】B【解析】根据题意,利用随机事件的概率公式,分别求出事件A的概率与事件A、B同时发生的概率,再用条件概率公式加以计算,可得P(B|A)的值.解:根据题意,若事件A为“x+y为偶数”发生,则x、y两个数均为奇数或均为偶数.共有2×3×3=18个基本事件,∴事件A的概率为P==.1而A、B同时发生,基本事件有“2+4”、“2+6”、“4+2”、“4+6”、“6+2”、“6+4”,一共有6个基本事件,因此事件A、B同时发生的概率为P==2因此,在事件A发生的情况下,B发生的概率为P(B|A)==故选:B.点评:本题给出掷骰子的事件,求条件概率.着重考查了随机事件的概率公式、条件概率的计算等知识,属于中档题.10.(2012•泰安一模)下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程,变量x增加一个单位时,y平均增加5个单位;③线性回归方程必过;④在一个2×2列联表中,由计算得K2=13.079,则有99%的把握确认这两个变量间有关系;其中错误的个数是()A.0B.1C.2D.3【答案】C【解析】①方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程,变量x增加一个单位时,y平均减少5个单位;③线性回归方程必过必过样本中心点;④由计算得K2=13.079,则其两个变量间有关系的可能性是99.9%,解:①方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变,故①正确;②设有一个回归方程,变量x增加一个单位时,y平均减少5个单位,故②不正确;③线性回归方程必过必过样本中心点,故③正确;④由计算得K2=13.079,对照临界值,可得其两个变量间有关系的可能性是99.9%,故④错误,综上知,错误的个数是2个故选C.点评:本题考查线性回归方程,考查独立性检验,考查方差的变化特点,是一个考查的知识点比较多的题目,注意分析,本题不需要计算,只要理解概念就可以得出结论.11.(2012•道里区三模)同时抛掷三颗骰子一次,设A=“三个点数都不相同”,B=“至少有一个6点”则P(B|A)为()A. B. C. D.【答案】A【解析】本题要求条件概率,根据P(B|A)=,需要先求出AB同时发生的概率,除以B 发生的概率,根据等可能事件的概率公式做出要用的概率.代入算式得到结果.解:∵P(B|A)=,同时抛掷三颗骰子一次,每颗骰子出现的点数有6种情况,三颗骰子出现的点数组合有63种情况.三个点数都不相同且至少有一个6点,则三颗骰子中只有一个6点,共×5×4=60种,∴P(AB)==,∵A=“三个点数都不相同”,共有6×5×4=120种,∴P(A)=,∴P(B|A)===.故选A.点评:本题考查条件概率,在这个条件概率的计算过程中,可以用两种不同的表示形式来求解,一是用概率之比得到条件概率,一是用试验发生包含的事件数之比来得到结果.12.(2014•包头一模)从1,2,3,4,5中任取2个不同的数,事件A=“取到的2个数之和为偶数”,事件B=“取到的2个数均为偶数”,则P(B|A)等于.【答案】【解析】利用互斥事件的概率及古典概型概率计算公式求出事件A的概率,同样利用古典概型概率计算公式求出事件AB的概率,然后直接利用条件概率公式求解.解:P(A)=,P(AB)=.由条件概率公式得P(B|A)=.故答案为.点评:本题考查了条件概率与互斥事件的概率,考查了古典概型及其概率计算公式,解答的关键在于对条件概率的理解与公式的运用,属中档题.13.(2011•湖南)如图,EFGH 是以O为圆心,半径为1的圆的内接正方形.将一颗豆子随机地扔到该圆内,用A表示事件“豆子落在正方形EFGH内”,B表示事件“豆子落在扇形OHE(阴影部分)内”,则(1)P(A)= ;(2)P(B|A)= .【答案】.【解析】此题是个几何概型.用面积法求出事件A“豆子落在正方形EFGH内”的概率p(A),同理求出P(AB),根据条件概率公式P(B|A)=即可求得结果.解:用A表示事件“豆子落在正方形EFGH内”,∴p(A)==,B表示事件“豆子落在扇形OHE(阴影部分)内”,p(AB)==,∴P(B|A)=.故答案为:.点评:此题是个基础题.考查条件概率的计算公式,同时考查学生对基础知识的记忆、理解和熟练程度.14.(2010•海门市模拟)根据科学家的测算,未来若干年人类活到76岁的概率是0.8,活到90岁的概率是0.4,则现年76岁的某人活到90岁的概率是.【答案】0.5【解析】根据人类活到76岁的概率是0.8,活到90岁的概率是0.4,现年76岁的某人活到90岁的概率是一个条件概率,利用条件概率的概率公式,代入数据,求得结果.解:∵人类活到76岁的概率是0.8,活到90岁的概率是0.4,∴现年76岁的某人活到90岁的概率是一个条件概率,设现年76岁的某人活到90岁为事件A,人类活到76岁为事件B,人类活到90岁为事件C,∴P(A)===0.5,故答案为:0.5点评:本题考查条件概率,是一个基础题,这种题目出现的机会比较少,在教材上所占的篇幅也比较少,同学们要根据这个题目熟悉条件概率.15.一个口袋中装有大小相同1个红球和3个黑球,现在有3个人,每人依次去摸出一个球,然后放回,若某两人摸出的球均为红色,则称这两人是“好朋友“,记A=“有两人好朋友”,B=“三人都是好朋友”,则P(B|A )= .【答案】【解析】求出P(A)==,P(AB)=,利用P(B|A )=可得结论.解:A=“有两人好朋友”,B=“三人都是好朋友”,则P(A)==,P(AB)=,∴P(B|A )==.故答案为:.点评:本题考查条件概率,考查学生的计算能力,比较基础.16.已知随机事件M、N,P(M)=,P(N)=,P()=,则P()= .【答案】【解析】利用已知得到事件M、N同时发生的概率为,即可求得P()的值.解:已知随机事件M、N,P(M)=,P()=,则P(MN)=,故P()==,故答案为:点评:本题考查概率的计算,考查学生的计算能力,属于基础题.17.(本小题满分12分)A、B、C、D、E五位学生的数学成绩x与物理成绩y(单位:分)如下表:8075706560(1)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(参考数值:,)(2)若学生F的数学成绩为90分,试根据(1)求出的线性回归方程,预测其物理成绩(结果保留整数).【答案】(1)(2) 约73分【解析】根据所给数据计算样本均值,,再利用参考公式计算得回归方程,然后利用方程进行估算.试题解析:(1)因为,(1分),(2分),(3分)(4分)所以,(6分).(7分)故所求线性回归方程为.(8分)(2)由(1),当x=90时,,(11分)答:预测学生F的物理成绩为73分.(12分)【考点】1.回归直线方程2.回归分析.18.在对两个变量、进行线性回归分析时,有下列步骤:①对所求出的回归直线方程作出解释;②收集数据、),,,;③求线性回归方程;④求未知参数;⑤根据所搜集的数据绘制散点图。
高一数学统计试题1.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为()A.B.C.D.2【答案】D【解析】由题意知,解得a=-1,∴样本方差为S2=,故选D.【考点】方差与标准差.2.已知x与y之间的几组数据如下表:则y与x的线性回归方程=x+必过点()A.(1,2) B.(2,6) C. D.(3,7)【答案】C【解析】回归直线必过样本中心点,由表格可求得.【考点】回归分析.3.用秦九韶算法计算多项式在时的值时,的值为【答案】-57【解析】由秦九韶算法知,当时,.【考点】算法案例.4.为预防X病毒爆发,某生物技术公司研制出一种X病毒疫苗,为测试该疫苗的有效性(若疫苗有效的概率小于90%,则认为测试没有通过),公司选定2000个样本分成三组,测试结果如下表:组组组67390已知在全体样本中随机抽取1个,抽到组疫苗有效的概率是0.33.(1)现用分层抽样的方法在全体样本中抽取360个测试结果,应在组抽取样本多少个?(2)已知,,求通过测试的概率.【答案】(1)90(2)【解析】(I)根据分层抽样的定义,按每层中的比例即可计算出组抽取样本的个数;(II)由(I),再结合题设条件,列举出所有可能的组合的个数及没有通过测试的组合的个数,再由概率公式及概率的性质求出通过测试的概率.(I)∵,∴,∵,∴应在组抽取样个数是(个).(II)∵,,,∴(,)的可能性是 (465,35),(466,34),(467,33),(468,32),(469,31),(470,30),若测试没有通过,则,,(,)的可能性是(465,35),(466,34),通过测试的概率是.【考点】1、分层抽样;2.、古典概型;3、估测能力.5.某校从高一年级学生中随机抽取40名学生作为样本,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六组:,,后得到如图的频率分布直方图.(Ⅰ)求图中实数的值;(Ⅱ)若该校高一年级共有学生500人,试估计该校高一年级在考试中成绩不低于60分的人数;(Ⅲ)若从样本中数学成绩在与两个分数段内的学生中随机选取两名学生,试用列举法求这两名学生的数学成绩之差的绝对值不大于10的概率.【答案】(1)0.03(2)425(3)【解析】解:(Ⅰ)由可得 2分(Ⅱ)数学成绩不低于60分的概率为:4分数学成绩不低于60分的人数为人 5分(Ⅲ)数学成绩在的学生人数:人 6分数学成绩在的学生人数:人 7分设数学成绩在的学生为,数学成绩在的学生为 8分两名学生的结果为:,共种 10分其中两名学生的数学成绩之差的绝对值不大于10的情况有,,,,,,共7种, 12分因此,抽取的两名学生的数学成绩之差的绝对值不大于10的概率为 13分【考点】直方图以及古典概型点评:主要是考查了直方图以及古典概型概率的计算,属于基础题。
6.某交警部门对城区上下班交通情况作抽样调查,上下班时间各抽取12辆机动车的行驶速度(单位:km/h)作为样本进行研究,做出样本的茎叶图,则上班、下班时间行驶速度的中位数分别是()A.2827.5B.2828.5C.2927.5D.2928.5【答案】C【解析】据已知中的茎叶图,我们易得到左右两边两组数据的值,然后根据中位数的定义,即可得到答案.解:由已知中茎叶图,我们易得左右两边的数据分别为:左:18,20,21,26,27,28,30,32,33,35,36,40;右:16,17,19,22,25,27,28,30,30,32,36,37;左右两边的中位数分别为:,故可知选C.【考点】中位数、茎叶图点评:本题考查的知识点是中位数、茎叶图,其中根据茎叶图分析出两组数据是解答本题的关键.7.某商品销售量y(件)与销售价格x()负相关,则其回归方程可能是()A. B. C. D【答案】A【解析】由于某商品销售量y(件)与销售价格x()负相关,所以画成的散点图是从左上方到右下方分布,则回归直线的斜率小于0,又因为C项中销售价格,所以销售量,这显然不成立。
故选A。
【考点】回归分析点评:若数据成负相关,则画成的散点图是从左上方到右下方分布;若数据成正相关,则画成的散点图是从左下方到右上方分布。
8.在我县举行的“建县2700年”唱红歌比赛活动中,共有40支参赛队。
有关部门对本次活动的获奖情况进行了统计,并根据收集的数据绘制了图6、图7两幅不完整的统计图,请你根据图中提供的信息解答下面的问题:1、获一、二、三等奖各有多少参赛队?2、在答题卷上将统计图图6补充完整。
3、计算统计图图7中“没获将”部分所对应的圆心角的度数4、求本次活动的获奖概率。
图6【答案】(1)6;10;16(2)见解析(3)(4)【解析】(1)先求得获一、二等奖的人数,再求得没等奖所占的百分比,从而得出三等奖的人数;(2)根据(1)的数据将图1补全即可;(3)用人数除以总人数乘以360°即可;(4)用获一、二、三等奖的人数之和除以总人数即可.解:(1)一等奖:40×15%=6(支)二等奖:(支)三等奖:40-10-6-8=16(2)(3)(4)9.(本题满分12分)对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:甲:6080709070乙:8060708075问:甲、乙谁的平均成绩好?谁的各门功课较平衡?【答案】甲的平均成绩较好,乙的各门功课较平衡.【解析】第一问中,利用给出的数据,结合平均值的公式可知甲,乙,s甲,s乙然后根据平均值来看谁的平均数大就是成绩好,而方差越小说明越平稳。
解:甲=×(60+80+70+90+70)=74,乙=×(80+60+70+80+75)=73,s甲=≈10.2,s乙=≈7.5.因为甲>乙,s甲>s乙.所以甲的平均成绩较好,乙的各门功课较平衡.10.,,,的平均数为,方差为,则数据,,,的平均数和方差分别是()A.和B.和C.和D.和【答案】C【解析】故选C11.调查机构对本市小学生课业负担情况进行了调查,设平均每人每天做作业的时间为分钟.有1000名小学生参加了此项调查,调查所得数据用程序框图处理,若输出的结果是680,则平均每天做作业的时间在0~60分钟内的学生的频率是] ()A. 680B. 320C. 0.68D. 0.32【答案】C【解析】略12.(12分)一个路口的红绿灯,红灯的时间为秒,黄灯的时间为秒,绿灯的时间为秒,当你到达路口时看见下列三种情况的概率各是多少?(1) 红灯 (2) 黄灯 (3) 不是红灯【答案】解:总的时间长度为秒,设红灯为事件,黄灯为事件,(1)出现红灯的概率·········4分(2)出现黄灯的概率········8分(3)不是红灯的概率·········12分【解析】略13.甲乙两位同学在高三的5次月考中数学成绩统计如茎叶图所示,若甲乙两人的平均成绩分别是,则下列正确的是()A.;甲比乙成绩稳定B.;甲比乙成绩稳定C.;乙比甲成绩稳定D.;乙比甲成绩稳定【答案】C【解析】略14.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出80人作进一步调查,则在[1 500,2 000)(元)月收入段应抽出人.【答案】16【解析】略15.统计某校1000名学生的数学水平测试成绩,得到样本频率分布直方图如图所示,若满分为100分,规定不低于60分为及格,则及格率是()A.20%B.25%C.6%D.80%【答案】D【解析】略16.如图是总体的一个样本频率分布直方图,且在[15,18)内频数为8.则样本容量=_________【答案】【解析】略17.有如下四个游戏盘,撒一粒黄豆,若落在阴影部分,怎可以中奖,小明希望中奖,则他应该选择的游戏是【答案】A【解析】四个游戏盘中奖的概率分别是,最大的是,故选A[18.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取个容量为50的样本,且在第一段中随机抽得的号码是003.这600名学生分别住在三个营区,从001到300在第一营区,从301到495在第二营区,从496到600在第三营区.则三个营区被抽到的人数分别为A.25,17,8B.25,16,9C.26,16,8D.24,17,9【答案】A【解析】析:由于是系统抽样,故先随机抽取第一数,再确定间隔,可知样本组成以3为首项,12为公差的等差数列,由此可得结论.解答:解:由题意,在随机抽样中,首次抽到003号,以后每隔12个号抽到一个人,则分别是003、015、027、039构成以3为首项,12为公差的等差数列,故可分别求出在001到300中有25人,在301至495号中共有17人,则496到600中有8人.故选A.19.如图是甲、乙两名篮球运动员某赛季一些场次得分的茎叶图,中间的数字表示得分的十位数,据图可知()A.甲运动员的最低得分为0分B.甲运动员得分的众数为44分C.乙运动员得分的中位数是29分D.乙运动员得分的平均值在区间(11、19)内【答案】B【解析】略20.阅读程序,输出的结果是____________________【答案】5,9,2【解析】略。