最新数学一轮复习精品试题第48讲随机抽样、用样本估计总体、变量间的相互关汇总
- 格式:doc
- 大小:93.50 KB
- 文档页数:8
第四十八讲随机抽样、用样本估计总体、变量间的相互关系、统计案例班级________姓名________考号________日期________得分________一、选择题:(本大题共6小题,每小题6分,共36分,将正确答案的代号填在题后的括号内.)1.一个单位有职工160人,其中业务人员96人,管理人员40人,后勤服务人员24人,为了了解职工的收入情况,要从中抽取一个容量为20的样本,如何去抽取?解法一:将160人从1至160编号,然后将用白纸做成有1~160号的160个号签放入箱内搅匀,最后从中取20个签,与签号相同的20个人被选出.解法二:将160人从1至160编号,按编号顺序分成20组,每组8人,令1~8号为第一组,9~16号为第二组,…,153~160号为第20组.从第一组中用抽签方式抽到一个为k号(1≤k≤8),其余组是(k+8n)号(n=1,2,3,…,19),如此抽到20人.解法三:按=的比例,从业务员中抽取12人,从管理人员中抽取5人,从后勤人员中抽取3人,都用简单随机抽样法从各类人员中抽取所需人数,他们合在一起恰好抽到20人.以上的抽样方法,依次是简单随机抽样、分层抽样、系统抽样的顺序是()A.解法一、解法二、解法三B.解法二、解法一、解法三C.解法一、解法三、解法二D.解法三、解法一、解法二解析:解法二为简单随机抽样,解法二为系统抽样,解法三为分层抽样,故选C.答案:C2.一个样本a,3,5,7的平均数是b,且a、b是方程x2-5x+4=0的两根,则这个样本的方差是()A.3B.4C.5 D.6解析:x2-5x+4=0的两根是1,4.当a=1时,a,3,5,7的平均数是4,当a=4时,a,3,5,7的平均数不是1.∴a=1,b=4.则方差s2=14×[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5,故选C.答案:C3.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力从4.6到5.0之间的学生数为b,则a,b的值分别为()A.0.27,78 B.0.27,83C.2.7,78 D.2.7,83解析:由图知共有9组,故后6组的频率是以2.7×0.1=0.27为首项,d为公差的等差数列,又各组频率之和为0.01+0.03+0.09+0.27×6+15d=1,故d=-0.05.所以各组的频率依次为0.01,0.03,0.09,0.27,0.22,0.17,0.12,0.07,0.02,故a=0.27,b=(0.27+0.22+0.17+0.12)×100=78,故选A.答案:A4.下列有关线性回归的说法,不正确的是()A.相关关系的两个变量不是因果关系B.散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间的关系D.任一组数据都有回归方程解析:根据两个变量属相关关系的概念,可知A正确;散点图能直观地描述呈相关关系的两个变量的离散程度,且回归直线最能代表它们之间的相关关系,所以B、C正确;只有线性相关的数据才有回归直线,所以D不正确.答案:D5.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定断信“X和Y有关系”的可信度.如果k>5.024,那么就有把握认为“X和Y有关系”的百分比为()C.2.5% D.97.5%解析:∵k>5.024时,“X和Y无关系”的可信度0.025,所以“X和Y有关系”百分比97.5%.答案:D6.下面是一个2×2列联表则表中a ,bA .94,96B .52,50C .52,54D .54,52解析:∵a +21=73,∴a =52. 又∵a +2=b 知b =54,故选C. 答案:C二、填空题:(本大题共4小题,每小题6分,共24分,把正确答案填在题后的横线上.) 7.某企业三月中旬生产A 、B 、C 三种产品共3000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:由于不小心,表格中A 产品的样本容量比C 产品的样本容量多10.根据以上信息,可得C 产品的数量是________件.解析:设样品的容量为x ,则x 3000×1300=130,所以x =300.所以A 产品和C 产品在样本中共有300-130=170(件).设C 产品的样本容量为y ,则y +(y +10)=170,所以y =80.所以C 产品的数量为3000300×80=800(件).答案:8008.已知总体的各个体的值由小到大依次为2,3,3,7,a ,b,12,13.7,18.3,20,且总体的中位数为10.5,若要使该总体的方差最小,则a ,b 的取值是________和________.解析:由题意a +b =21,故平均数x -=10. 欲使方差最小,只需使(a -10)2+(b -10)2最小,又∵(a -10)2+(b -10)2=a 2+b 2-20(a +b )+200=a 2+b 2-220=(a +b )2-2ab -220=221-2ab ≥221-2⎝ ⎛⎭⎪⎫a +b 22,当且仅当a =10.5,b =10.5时最小,故a =10.5,b =10.5时,s 2最小.答案:10.5 10.59.某地教育部门为了调查学生在数学答卷中的有关信息,从上次考试的10000名考生的数学试卷中用分层抽样的方法抽取500人,并根据这500人的数学成绩画出样本的频率分布直方图(如图),则10000人的数学成绩在[140,150]段的约是________人.解析:设500人的数学成绩在[140,150]段的人数为x,10000人的数学成绩在[140,150]段的人数为n .由样本频率分布直方图知数学成绩在[140,150]段的频率最小矩形的面积,即为0.008×10=0.08=x 500,∴x =40.又样本的个数占总个数的120,即每组的抽样比为120,∴120=40n,∴n =800. ∴10000人的数学成绩在[140,150]段的约是800人. 答案:80010.某肉食鸡养殖小区某种病的发病鸡只数呈上升趋势,统计近4个月这种病的新发病鸡只数的线性回归分析如下表所示:如果不加控制,仍按这个趋势发展下去,请预测从9月初到12月底的4个月时间里,该养殖小区这种病的新发病鸡总只数约为________.解析:由上表可得:y ^=94.7x +1924.7,当x 分别取9,10,11,12时,得估计值分别为:2777,2871.7,2966.4,3061.1,则总只数约为2777+2871.7+2966.4+3061.1≈11676.答案:11676三、解答题:(本大题共3小题,11、12题13分,13题14分,写出证明过程或推演步骤.)11.一个地区共有5个乡镇30000人,其中人口比例为,要从这30000人中抽取300个人进行某种传染病分析,因考虑该传染病与不同地理位置及水土有关,问应采取什么样的抽样方法?写出抽样过程.解:应采用分层抽样的方法. 具体抽样过程如下:(1)计算抽样比:30030000=1100;(2)计算各乡镇人口数分别为:315×30000=6000,215×30000=4000,515×30000=10000,115×30000=2000,415×30000=8000; (3)计算各乡镇抽取的人口数分别为:6000×1100=60,4000×1100=40,10000×1100=100,2000×1100=20,8000×1100=80;(4)用系统抽样的方法依次从五个乡镇中抽出60人,40人,100人,20人,80人; (5)将抽取的个体合在一起,就构成所要抽取的一个样本. 12.据报道,某公司的33名职工的月工资(以元为单位)如下:(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是什么?(精确到元)(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.解:(1)平均数是x -=1500+4000+3500+2000×2+1500+1000×5+500×3+0×2033≈1500+591=2091(元).中位数是1500元,众数是1500元. (2)平均数是x -′=1500+28500+18500+2000×2+1500+1000×5+500×3+0×2033≈1500+1788=3288(元).中位数是1500元,众数是1500元.(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差数大,所以平均数不能反映这个公司员工的工资水平.13.要分析学生初中升学的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽选10名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩,如下表所示:(1)画出散点图; (2)求回归直线方程;(3)若某学生王明亮的入学数学成绩为80分,试预测他在高一年级期末考试中的数学成绩为多少?解:(1)作出散点图如图所示,从散点图可以看出,这两个变量具有线性相关关系.(2)可求得x -=110(63+67+…+76)=70,y -=110(65+78+…+75)=75.b =54284-10×70×7551474-10×702≈0.721,∴a =75-0.721×70≈24.53. 所求的线性回归方程为 y -=0.721x +24.53.(3)若王明亮入学数学成绩为80分,代入上面的线性回归方程 y -=0.721x +24.53可得y -≈82分.。
高考数学一轮总复习素养提升:几种常见的统计图形一、扇形图(饼状图)——用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.(多选题)(2024·南京师大附中阶段测试)某中学为了解学生数学史知识的积累情况,随机抽取150名同学参加数学史知识测试,测试题共5道,每答对一题得20分,答错得0分,得分不少于60分记为及格,不少于80分记为优秀,测试成绩百分比分布图如图所示,则( AC )A.该次数学史知识测试及格率超过90%B.该次数学史知识测试得满分的同学有15名C.该次测试成绩的中位数大于测试成绩的平均数D.若该校共有1 500名学生,则数学史知识测试成绩能得优秀的同学大约有720名[解析]由图知,及格率为1-8%=92%>90%,故A正确;该测试满分同学的百分比为1-8%-32%-48%=12%,即有12%×150=18名,故B错误;由图知,中位数为80分,平均数为40×8%+60×32%+80×48%+100×12%=72.8分,故C正确;由题意,1 500名学生成绩能得优秀的同学有1 500×(48%+12%)=900,故D错误.故选AC.二、条形图(柱状图)——建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图.(2023·安徽蚌埠质检)已知某地区中小学生人数如图甲所示,为了解该地区中小学生的近视情况,卫生部门根据当地中小学生人数,用分层抽样的方法抽取了10%的学生进行调查,调查数据如图乙所示,则估计该地区中小学生的平均近视率为( D )A .50%B .32%C .30%D .27%[解析] 根据题意,抽取的样本容量为(3 500+4 500+2 000)×10%=1 000,其中小学生、初中生、高中生抽取人数分别为:350,450,200,根据图乙知抽取的小学生、初中生、高中生中,近视的人数分别为:35,135,100,所以该地区学生的平均近视率为35+135+1001 000×100%=27%,故选D.三、折线图——建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图.折线图主要用于描述数据随时间的变化趋势.(多选题)(2024·湖湘名校联合体联考)某学校校医对生病的甲、乙两名同学一周的体温进行了统计,其结果如图所示,则下列说法正确的有( AC )A .甲同学的体温的平均值为36.4 ℃B .甲同学的体温的方差为0.2C .乙同学的体温的众数、中位数都为36.4 ℃D .乙同学的体温的极差为0.3 ℃[解析] 甲同学体温的平均值为17×(36.4+36.2+36.5+36.2+36.6+36.4+36.5)=36.4 ℃,故A 正确;由方差计算公式可知17×(02+0.22+0.12+0.22+0.22+02+0.12)=0.02,故B 错误;乙同学体温按从小到大排列为:36.3 ℃,36.3 ℃,36.4 ℃,36.4 ℃,36.4 ℃,36.5 ℃,36.5 ℃,故乙同学体温的众数、中位数都为36.4 ℃,故C 正确;由上述排列可知,乙同学体温的极差为0.2 ℃,故D 错误.故选AC.四、雷达图(网络图、蜘蛛图)——一种能够直观地展示多维度的类目数据对比情况的统计图.1.(2024·广东实验中学阶段测试)2025年某省将实行“3+1+2”模式的新高考,其中“3”表示语文、数学和英语这三门必考科目,“1”表示必须从物理和历史中选考一门科目,“2”表示要从化学、生物、政治和地理中选考两门科目.为帮助甲、乙两名高一学生应对新高考,合理选择选考科目,将其高一年级的成绩综合指标值(指标值满分为5分,分值越高成绩越优)整理得到如下的雷达图,则下列选择最合理的是( D )A.选考科目甲应选物理、化学、历史B.选考科目甲应选化学、历史、地理C.选考科目乙应选物理、政治、历史D.选考科目乙应选政治、历史、地理[解析]根据雷达图,甲同学按照科目综合指标值从高到低顺序为:物理、历史(化学)、地理、生物、政治,乙同学按照科目综合指标值从高到低顺序为:历史、物理(政治)、地理、生物、化学,根据新高考选科模式规则,选考科目甲应选物理、化学、地理;选考科目乙应选历史、政治、地理.故选D.2.(多选题)(2024·湖南名校联合体联考)如图所示是世界人口变化情况的三幅统计图:则下列结论正确的是( ABC )A.从折线图能看出世界人口的总量随着年份的增加而增加B.2050年亚洲人口将比其他各洲人口的总和还要多C.2050年南美洲及大洋洲人口之和将与欧洲人口基本持平D.1957年到2050年各洲中北美洲人口增长速度最慢[解析]从折线图能看出世界人口的总量随着年份的增加而增加,故A正确;从扇形图中能够明显地看出2050年亚洲人口将比其他各洲人口的总和还要多,故B正确;从条形图中能够明显地看出2050年南美洲及大洋洲人口之和将与欧洲人口基本持平,故C正确;由题中三幅统计图并不能得出从1957年到2050年中哪个洲人口增长速度最慢,故D错误.故选ABC.。
2025年高考数学一轮复习-抽样方法、统计图表、用样本估计总体-专项训练基础巩固练1.(2023连云港期中)下列一组数据的第30百分位数是()2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6.A.3.0B.3.2C.3.3D.4.42.从某中学抽取10名同学,得到他们的数学成绩(单位:分)如下:88,85,82,92,90,92,96,92,96,98.这10名同学数学成绩的众数、中位数分别为()A.92,92B.92,96C.96,92D.92,903.(2023宿迁月考)统计某样本数据得到的频率分布直方图如图所示,已知该样本容量为300,则样本数据落在[6,14)内的频数为()A.68B.170C.204D.2404.如图,这是某市2023年国庆节假期的楼房认购量与成交量的折线图,小明同学根据折线图对这7天的认购量(单位:套)与成交量(单位:套)作出如下判断,则下列判断正确的为()A.日成交量的中位数是16B.日成交量超过日平均成交量的有2天C.10月7日认购量的增幅大于10月7日成交量的增幅D.日认购量的方差大于日成交量的方差5.(多选题)在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本.方法1:采用简单随机抽样的方法,将零件分别编号为00,01,02,…,99,用抽签法抽取20个.方法2:采用分层随机抽样的方法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.对于上述问题,下列说法正确的是()A.无论采用哪种抽样方法,这100个零件中每一个零件被抽到的可能性都是15B.采用不同的方法,这100个零件中每一个零件被抽到的可能性各不相同C.在上述两种抽样方法中,方法2抽到的样本比方法1抽到的样本更能反映总体的特征D.在上述两种抽样方法中,方法1抽到的样本比方法2抽到的样本更能反映总体的特征6.(多选题)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()甲乙A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的平均数等于乙的成绩的平均数C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数D.甲的成绩的极差等于乙的成绩的极差7.在一次竞选中,规定一个人获胜的条件如下:(1)在竞选中得票最多;(2)得票数不低于总票数的一半.在计票时,周鹏得票的数据丢失.候选人赵明钱红孙华李丽周鹏得票数3001003060x如果周鹏获胜,那么周鹏的得票数x的最小值为.8.(2023盐城调研)已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为.9.某大学艺术专业400名学生参加某次测评,根据男、女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成[20,30),[30,40),…,[80,90]七组,并整理得到如图所示的频率分布直方图:(1)从样本中随机抽取一人,求其分数小于70的频率.(2)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男、女生人数相等.试估计总体中男生和女生人数的比.综合提升练10.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,并得到频率分布直方图如图:则这20名工人一天生产该产品的数量的中位数为()A.65B.64C.62.5D.6011.一组数据的平均数为a,方差为b,将这组数据的每个数都乘m(m>0)后得到一组新数据,则下列说法正确的是()A.这组新数据的平均数为aB.这组新数据的平均数为a+mC.这组新数据的方差为mbD.这组新数据的方差为m2b12.(多选题)(2023徐州质检)在第一次全市高三年级统考后,数学老师为了解本班学生的本次数学考试情况,将全班50名学生的数学成绩绘制成了频率分布直方图.已知该班级学生的数学成绩(单位:分)全部介于65到145之间(满分150分),将数学成绩按如下方式分成八组:第一组[65,75),第二组[75,85),…,第八组[135,145].按上述分组方法得到的频率分布直方图的一部分如图所示,则下列结论正确的是()A.第七组的频率为0.008B.该班级数学成绩的中位数的估计值为101C.该班级数学成绩的平均分的估计值大于95D.该班级数学成绩的方差的估计值大于2613.已知甲、乙两组数据如下表所示,其中a,b∈N*,若甲、乙两组数据的平均数相等,要使甲组数据的方差小于乙组数据的方差,则(a,b)为.(只需填一组)甲12ab10乙12471114.某校从高一年级中随机抽取部分学生,将他们的期末数学测试成绩分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]6组加以统计,得到如图所示的频率分布直方图.据此统计,期末数学测试成绩不少于第60百分位数的分数至少为.15.6月17日是联合国确定的“世界防治荒漠化和干旱日”,为增强全社会对防治荒漠化的认识与关注,聚焦联合国2030年可持续发展目标——实现全球土地退化零增长.自2004年以来,我国荒漠化和沙化状况呈现整体遏制、持续缩减、功能增强、成效明显的良好态势.治理沙漠离不开优质的树苗,现从苗圃中随机地抽测了200株树苗的高度(单位:cm),得到如图所示的频率分布直方图.(1)求频率分布直方图中a的值及众数、中位数.(2)已知树高为185cm及以上的是可以移栽的合格树苗.①求合格树苗的平均高度(结果精确到个位);②从样本中按分层抽样的方法抽取20株树苗进一步研究,不合格树苗、合格树苗分别应抽取多少株?创新应用练16.某小区毗邻一条公路,为了解交通噪声,有关部门连续25天监测噪声值(单位:分贝),得到频率分布直方图(图1),发现噪声污染严重,采取了在公路旁加装隔声板等治理措施,而后,再连续25天监测噪声值,得到频率分布直方图(图2).图1图2同一组中的数据用该组区间的中点值作代表,请解答下列问题:(1)根据上面两个频率分布直方图,估计治理后比治理前的平均噪声值降低了分贝.(2)国家“城市区域环境噪声”规定:重度污染:>65分贝;中度污染:60~65分贝;轻度污染:55~60分贝;较好:50~55分贝;好:≤50分贝.把上述两个样本数据的频率视为概率,根据图1估算出该小区噪声治理前一年内(365天)噪声中度污染及以上的天数为277,根据图2估计一年内(365天)噪声中度污染及以上的天数比治理前减少了天.(精确到1天)参考答案1.C2.A3.C4.D5.AC6.BCD7.4908 839.解(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从样本中随机抽取一人,其分数小于70的频率为0.4.(2)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60 12=30,所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比为60∶40=3∶2.所以根据分层抽样原理,估计总体中男生和女生人数的比为3∶2.10.C11.D12.BCD13.(4,8)或(5,7)或(6,6)或(7,5)或(8,4)(填其中一个即可)14.7415.解(1)∵(0.0015+0.0110+0.0225+0.0300+a+0.0080+0.0020)×10=1,∴a=0.0250.众数为185+1952=190.设中位数为x,∵(0.0015+0.0110+0.0225)×10=0.35<0.5,(0.0015+0.0110+0.0225+0.030)×10=0.65>0.5,∴185<x<195,(0.0015+0.0110+0.0225)×10+0.030(x-185)=0.5,∴x=190.(2)∵树苗高度为185cm及以上的频率是(0.0300+0.0250+0.0080+0.0020)×10=0.65, =[190×(0.030×10)+200×(0.0250×10)+210×(0.0080×10)+220×(0.002 0×10)]÷0.65≈197(cm).(3)应抽取不合格的树苗20×0.35=7(株),合格的树苗20×0.65=13(株),故不合格树苗、合格树苗分别应抽取7株和13株.16.(1)2.56(2)138。
2012年数学一轮复习精品试题第48讲随机抽样、用样本估计总体、变量间的相互关第四十八讲 随机抽样、用样本估计 总体、变量间的相互关系、统计案例班级________ 姓名________ 考号________ 日期________ 得分________ 一、选择题:(本大题共6小题,每小题6分,共36分,将正确答案的代号填在题后的括号内.)1.一个单位有职工160人,其中业务人员96人,管理人员40人,后勤服务人员24人,为了了解职工的收入情况,要从中抽取一个容量为20的样本,如何去抽取?解法一:将160人从1至160编号,然后将用白纸做成有1~160号的160个号签放入箱内搅匀,最后从中取20个签,与签号相同的20个人被选出.解法二:将160人从1至160编号,按编号顺序分成20组,每组8人,令1~8号为第一组,9~16号为第二组,…,153~160号为第20组.从第一组中用抽签方式抽到一个为k 号(1≤k ≤8),其余组是(k +8n )号(n =1,2,3,…,19),如此抽到20人.解法三:按20160=18的比例,从业务员中抽取12人,从管理人员中抽取5人,从后勤人员中抽取3人,都用简单随机抽样法从各类人员中抽取所需人数,他们合在一起恰好抽到20人.以上的抽样方法,依次是简单随机抽样、分层抽样、系统抽样的顺序是( ) A .解法一、解法二、解法三 B .解法二、解法一、解法三 C .解法一、解法三、解法二 D .解法三、解法一、解法二解析:解法二为简单随机抽样,解法二为系统抽样,解法三为分层抽样,故选C. 答案:C2.一个样本a,3,5,7的平均数是b ,且a 、b 是方程x 2-5x +4=0的两根,则这个样本的方差是( )A .3B .4C .5D .6解析:x 2-5x +4=0的两根是1,4.当a =1时,a,3,5,7的平均数是4,当a =4时,a,3,5,7的平均数不是1. ∴a =1,b =4.则方差s 2=14×[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5,故选C.答案:C3.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力从4.6到5.0之间的学生数为b,则a,b的值分别为()A.0.27,78 B.0.27,83C.2.7,78 D.2.7,83解析:由图知共有9组,故后6组的频率是以2.7×0.1=0.27为首项,d为公差的等差数列,又各组频率之和为0.01+0.03+0.09+0.27×6+15d=1,故d=-0.05.所以各组的频率依次为0.01,0.03,0.09,0.27,0.22,0.17,0.12,0.07,0.02,故a=0.27,b=(0.27+0.22+0.17+0.12)×100=78,故选A.答案:A4.下列有关线性回归的说法,不正确的是()A.相关关系的两个变量不是因果关系B.散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间的关系D.任一组数据都有回归方程解析:根据两个变量属相关关系的概念,可知A正确;散点图能直观地描述呈相关关系的两个变量的离散程度,且回归直线最能代表它们之间的相关关系,所以B、C正确;只有线性相关的数据才有回归直线,所以D不正确.答案:D5.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定断信“X和Y有关系”的可信度.如果k>5.024,那么就有把握认为“X和Y有关系”的百分比为()C.2.5% D.97.5%解析:∵k>5.024时,“X和Y无关系”的可信度0.025,所以“X和Y有关系”百分比97.5%.答案:D6.下面是一个2×2列联表则表中a,bA.94,96 B.52,50C.52,54 D.54,52解析:∵a+21=73,∴a=52.又∵a+2=b知b=54,故选C.答案:C二、填空题:(本大题共4小题,每小题6分,共24分,把正确答案填在题后的横线上.)7.某企业三月中旬生产A、B、C三种产品共3000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:由于不小心,表格中A产品的样本容量比C产品的样本容量多10.根据以上信息,可得C产品的数量是________件.解析:设样品的容量为x,则x3000×1300=130,所以x=300.所以A产品和C产品在样本中共有300-130=170(件).设C产品的样本容量为y,则y+(y+10)=170,所以y=80.所以C产品的数量为3000300×80=800(件).答案:8008.已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5,若要使该总体的方差最小,则a,b的取值是________和________.解析:由题意a+b=21,故平均数x-=10.欲使方差最小,只需使(a-10)2+(b-10)2最小,又∵(a-10)2+(b-10)2=a2+b2-20(a+b)+200=a2+b2-220=(a+b)2-2ab-220=221-2ab ≥221-2⎝ ⎛⎭⎪⎫a +b 22,当且仅当a =10.5,b =10.5时最小,故a =10.5,b =10.5时,s 2最小.答案:10.5 10.59.某地教育部门为了调查学生在数学答卷中的有关信息,从上次考试的10000名考生的数学试卷中用分层抽样的方法抽取500人,并根据这500人的数学成绩画出样本的频率分布直方图(如图),则10000人的数学成绩在[140,150]段的约是________人.解析:设500人的数学成绩在[140,150]段的人数为x,10000人的数学成绩在[140,150]段的人数为n .由样本频率分布直方图知数学成绩在[140,150]段的频率最小矩形的面积,即为0.008×10=0.08=x 500,∴x =40.又样本的个数占总个数的120,即每组的抽样比为120,∴120=40n,∴n =800. ∴10000人的数学成绩在[140,150]段的约是800人. 答案:80010.某肉食鸡养殖小区某种病的发病鸡只数呈上升趋势,统计近4个月这种病的新发病鸡只数的线性回归分析如下表所示:如果不加控制,仍按这个趋势发展下去,请预测从9月初到12月底的4个月时间里,该养殖小区这种病的新发病鸡总只数约为________.解析:由上表可得:y ^=94.7x +1924.7,当x 分别取9,10,11,12时,得估计值分别为:2777,2871.7,2966.4,3061.1,则总只数约为2777+2871.7+2966.4+3061.1≈11676.答案:11676三、解答题:(本大题共3小题,11、12题13分,13题14分,写出证明过程或推演步骤.)11.一个地区共有5个乡镇30000人,其中人口比例为32514,要从这30000人中抽取300个人进行某种传染病分析,因考虑该传染病与不同地理位置及水土有关,问应采取什么样的抽样方法?写出抽样过程.解:应采用分层抽样的方法. 具体抽样过程如下:(1)计算抽样比:30030000=1100;(2)计算各乡镇人口数分别为:315×30000=6000,215×30000=4000,515×30000=10000,115×30000=2000,415×30000=8000;(3)计算各乡镇抽取的人口数分别为:6000×1100=60,4000×1100=40,10000×1100=100,2000×1100=20,8000×1100=80;(4)用系统抽样的方法依次从五个乡镇中抽出60人,40人,100人,20人,80人; (5)将抽取的个体合在一起,就构成所要抽取的一个样本. 12.据报道,某公司的33名职工的月工资(以元为单位)如下: 职务 董事长 副董事长董事 总经理 经理 管理员 职员 人数 1 1 2 1 5 3 20 工资5500500035003000250020001500(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是什么?(精确到元)(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.解:(1)平均数是x -=1500+4000+3500+2000×2+1500+1000×5+500×3+0×2033≈1500+591=2091(元).中位数是1500元,众数是1500元. (2)平均数是x -′=1500+28500+18500+2000×2+1500+1000×5+500×3+0×2033≈1500+1788=3288(元).中位数是1500元,众数是1500元.(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差数大,所以平均数不能反映这个公司员工的工资水平.13.要分析学生初中升学的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽选10名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩,如下表所示:x 63 67 45 88 81 71 52 99 58 76 y65785282828973985675(1)画出散点图; (2)求回归直线方程;(3)若某学生王明亮的入学数学成绩为80分,试预测他在高一年级期末考试中的数学成绩为多少?解:(1)作出散点图如图所示,从散点图可以看出,这两个变量具有线性相关关系.(2)可求得x -=110(63+67+…+76)=70,y -=110(65+78+…+75)=75.b =54284-10×70×7551474-10×702≈0.721, ∴a =75-0.721×70≈24.53. 所求的线性回归方程为 y -=0.721x +24.53.(3)若王明亮入学数学成绩为80分,代入上面的线性回归方程 y -=0.721x +24.53可得y -≈82分.。