统计案例高考题
- 格式:doc
- 大小:25.50 KB
- 文档页数:1
第五节 统计、统计案例高考试题考点一 抽样的方法1.(2013年新课标全国卷Ⅰ,理3)为了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( ) (A)简单随机抽样(B)按性别分层抽样(C)按学段分层抽样 (D)系统抽样解析:由于小学、初中、高中三个学段学生的视力情况差异较大,而男女视力情况差异不大,因此可以按学段分层抽样.故选C. 答案:C2.(2013年安徽卷,理5)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( ) (A)这种抽样方法是一种分层抽样 (B)这种抽样方法是一种系统抽样(C)这五名男生成绩的方差大于这五名女生成绩的方差 (D)该班男生成绩的平均数小于该班女生成绩的平均数解析:本题采用简单随机抽样方法抽取样本,故选项A 、B 错误.因为5名男生成绩和5名女生成绩的平均数,与该班男生成绩的平均数与女生成绩的平均数不一定存在准确的对应关系,所以选项D 的说法不一定成立.对于C 项,男生成绩的平均数1x =90,女生成绩的平均数2x =91,故5名男生成绩的方差21s =15[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8,5名女生成绩的方差22s =15[(88-91)2+(93-91)2+(93-91)2+(88-91)2+(93-91)2]=6,故选C. 答案:C3.(2013年江西卷,理4)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )(A)08 (B)07 (C)02(D)01解析:从左到右第1行的第5列和第6列数字是65,依次选取符合条件的数字分别是08,02,14,07,01,故选出来的第5个个体的编号为01. 答案:D考点二 统计图表1.(2013年福建卷,理4)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )(A)588 (B)480(C)450 (D)120解析:由题频率分布直方图得,该模块测试成绩不少于60分的学生人数为600×(0.030+0.025+0.015+0.010)×10=480.故选B.答案:B2.(2012年陕西卷,理6)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x甲,x乙,中位数分别为m甲,m乙,则( )(A) x甲<x乙,m甲>m乙 (B) x甲<x乙,m甲<m乙(C) x甲>x乙,m甲>m乙 (D) x甲>x乙,m甲<m乙解析:把数据从茎叶图中整理出来,甲的数据为:5,6,8,10,10,14,18,18,22,25,27,30,30,38,41,43;乙的数据为:10,12,18,20,22,23,23,27,31,32,34,34,38,42,43,48,所以x甲=116(5+6+8+10+10+14+18+18+22+25+27+30+30+38+41+43)=34516,x乙=116(10+12+18+20+22+23+23+27+31+32+34+34+38+42+43+48)=45716,显然x甲<x乙.又∵m甲=18222+=20,m乙=27312+=29,所以m甲<m乙.答案:B3.(2013年新课标全国卷Ⅱ,理19)经销商经销某种农产品,在一个销售季度内,每售出1 t该产品获利润500元,未售出的产品,每1 t亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130 t该农产品.以X(单位:t,100≤X≤150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润.(1)将T表示为X的函数;(2)根据直方图估计利润T不少于57000元的概率;(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,并以需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若需求量X∈[100,110),则取X=105,且X=105的概率等于需求量落入[100,110)的频率),求T的数学期望.解:(1)当X∈[100,130)时,T=500X-300(130-X)=800X-39000,当X∈[130,150]时,T=500×130=65000,所以T=80039000,100130, 65000,130150.X XX-⎧⎨⎩≤<≤≤(2)由(1)知利润T不少于57000元当且仅当120≤X≤150.由直方图知需求量X∈[120,150]的频率为0.7,所以下一个销售季度内的利润T不少于57000元的概率的估计值为0.7.(3)依题意可得T的分布列为T45000530006100065000P0.10.20.30.4所以ET=45000×0.1+53000×0.2+61000×0.3+65000×0.4=59400.考点三样本的数字特征1.(2013年重庆卷,理4)如图所示茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )(A)2,5 (B)5,5(C)5,8 (D)8,8解析:由甲组数据的中位数为15,得x=5.由乙组数据的平均数为16.8,得9+30+5+y+8+24=16.8×5,即76+y=84,解得y=8.故选C.答案:C2.(2012年安徽卷,理5)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )(A)甲的成绩的平均数小于乙的成绩的平均数(B)甲的成绩的中位数等于乙的成绩的中位数(C)甲的成绩的方差小于乙的成绩的方差(D)甲的成绩的极差小于乙的成绩的极差解析:甲射击比赛中靶4,5,6,7,8环各1次,则甲成绩的中位数为6环,平均数为6环,极差为4环,方差为2平方环;乙射击比赛中靶5环3次,6环1次,9环1次,则乙成绩的中位数为5环,平均数为6环,极差为4环,方差为2.4平方环.所以甲成绩的方差比乙成绩的方差小.故选C.答案:C3.(2012年江西卷,理9)样本(x1,x2,…,x n)的平均数为x,样本(y1,y2,…,y m)的平均数为y(x≠y).若样本(x1,x2,…,x n,y1,y2,…,y m)的平均数z=αx+(1-α)y,其中0<α<12,则n,m的大小关系为( )(A)n<m (B)n>m(C)n=m (D)不能确定解析:依题意得x1+x2+…+x n=n x,y1+y2+…+y m=m y,x1+x2+…+x n+y1+y2+…+y m=(m+n)z=(m+n)αx+(m+n)(1-α) y,所以n x+m y=(m+n)αx+(m+n)(1-α)y,所以()()(),1, n m n am m n a ⎧=+⎪⎨=+-⎪⎩于是有n-m=(m+n)[α-(1-α)]=(m+n)(2α-1).因为0<α<1 2 ,所以2α-1<0.又m+n>0,所以n-m<0.即n<m.故选A.答案:A4.(2011年江苏卷,6)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2= .解析:由于这5个数的平均数x=15×(10+6+8+5+6)=7,因此该组数据的方差s2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=3.2.答案:3.2考点四变量的相关性1.(2012年湖南卷,理4)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为ˆy=0.85x-85.71,则下列结论中不正确的是( )(A)y与x具有正的线性相关关系(B)回归直线过样本点的中心(x,y)(C)若该大学某女生身高增加1 cm,则其体重约增加0.85 kg(D)若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg解析:根据线性回归方程相关知识可知选项A、B、C是正确的.而由回归方程得到的是预报变量的可能取值的平均值,不是预报变量的精确值,故选D.答案:D2.(2011年陕西卷,理9)设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图所示),以下结论中正确的是( )(A)x和y的相关系数为直线l的斜率(B)x和y的相关系数在0到1之间(C)当n为偶数时,分布在l两侧的样本点的个数一定相同(D)直线l过点(x,y)解析:相关系数是表示两个变量是否具有线性相关关系的量,可正可负也可为0,它的绝对值越接近1两变量相关性越强.因此A、B错,线性回归直线两侧样本点个数不一定相同,故C错.回归直线恒过样本中心(x,y).选项D正确.答案:D3.(2011年江西卷,理6)变量X和Y对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )(A)r2<r1<0 (B)0<r2<r1(C)r2<0<r1(D)r2=r1解析:对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r1>0;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r2<0.所以有r2<0<r1.故选C.答案:C4.(2011年山东卷,理7)某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元4235销售额y/万元49263954根据上表可得回归方程ˆy=b x+ˆa中的b为9.4,据此模型预报广告费用为6万元时销售额为( )(A)63.6万元(B)65.5万元(C)67.7万元(D)72.0万元解析:线性回归直线过定点(x,y),y=492639544+++=42, x=3.5,代入ˆa=y-ˆb x得ˆa=42-9.4×3.5=9.1,所以ˆy=6×9.4+9.1=65.5(万元).答案:B5.(2011年辽宁卷,理14)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:ˆy=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加万元. 解析:由回归直线方程可知,x每增加1,ˆy增加0.254,从而家庭年收入每增加1万元,年饮食支出平均增加0.254万元.答案:0.2546.(2011年广东卷,理13)某数学老师的身高为176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为cm.解析:儿子和父亲的身高可列表如下:(单位:cm)父亲身高x173170176儿子身高y170176182设回归直线方程为ˆy=ˆa+ˆb x,由表中数据可求得x=173, y=176,∴ˆb=()()()31321i iiiix x y yx x==---∑∑=()223633⨯+-=1,ˆa=y-ˆb x=3,故回归直线方程为ˆy=x+3.当x=182时, ˆy=182+3=185.故预测他孙子的身高为185 cm.答案:185考点五独立性检验(2012年辽宁卷,理19)电视传媒公司为了解某地区某类体育节目的收视情况,随机抽取了100名观众进行调查.如图所示的是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,据此资料,你是否认为“体育迷”与性别有关?非体育迷体育迷总计男女1055总计(2)将上述调查得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中“体育迷”的人数为X.若每次抽取的结果是相互独立的,求X的分布列、期望E(X)和方差D(X).附:χ2=()211221221n n n n nn n n n-++.P(χ2≥k)0.050.01 k 3.841 6.635解:(1)由频率分布直方图可知在抽取的100人中,“体育迷”有25人,从而2×2列联表补充如下:非体育迷体育迷总计男301545女451055总计7525100将2×2列联表中的数据代入公式计算,得χ2=()2 1003010451575254555⨯-⨯⨯⨯⨯=10033≈3.030.因为3.030<3.841,所以没有足够的把握认为“体育迷”与性别有关.(2)由频率分布直方图知抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为14.由题意知X ~B(3, 14),从而X 的分布列为: X 0123P27642764964164所以E(X)=np=3×14=34,D(X)=np(1-p)=3×14×34=916. 模拟试题考点一 抽样方法1.(2013北京市丰台区期末)某高中共有学生900人,其中高一年级240人,高二年级260人,为做某项调查,拟采用分层抽样法抽取容量为45的样本,则在高三年级抽取的人数是 .解析:高三的人数为400, 所以在高三抽取的人数为45900×400=20. 答案:202.(2013青岛一中调研)某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号1~50号,并分组,第一组1~5号,第二组6~10号,……,第十组46~50号,若在第三组中抽得号码为12的学生,则在第八组中抽得号码为 的学生.解析:因为12=5×2+2,即第三组抽出的是第二个同学, 所以每一组都相应抽出第二个同学. 所以第8组中抽出的号码为5×7+2=37号. 答案:37考点二 统计图表1.(2013云南师大附中检测)甲、乙两名运动员在某项测试中的6次成绩的茎叶图如图所示,,分别表示甲乙两名运动员这项测试成绩的平均数,s 1,s 2分别表示甲乙两名运动员这项测试成绩的标准差,则有( )(A)1x >2x ,s 1<s 2 (B)1x =2x ,s 1=s 2 (C)1x =2x ,s 1<s 2(D)1x =2x ,s 1>s 2解析:由样本中数据可知1x =15, 2x =15, 由茎叶图得s 1<s 2, 所以选C. 答案:C2.(2013贵州省六校联考)某同学学业水平考试的9科成绩如茎叶图所示,则根据茎叶图可知该同学的平均分为 .解析:19(68+72+73+78×2+81+89×2+92)=7209=80.答案:803.(2013北京市西城区期末)为了解学生的身体状况,某校随机抽取了一批学生测量体重.经统计,这批学生的体重数据(单位:千克)全部介于45至70之间.将数据分成以下5组:第1组[45,50),第2组[50,55),第3组[55,60),第4组[60,65),第5组[65,70],得到如图所示的频率分布直方图.现采用分层抽样的方法,从第3,4,5组中随机抽取6名学生做初检.(1)求每组抽取的学生人数;(2)若从6名学生中再次随机抽取2名学生进行复检,求这2名学生不在同一组的概率.解:(1)由频率分布直方图知,第3,4,5组的学生人数之比为3∶2∶1.所以,每组抽取的人数分别为:第3组:36×6=3;第4组:26×6=2;第5组:16×6=1.所以从第3,4,5组应依次抽取3名学生,2名学生,1名学生.(2)记“从6名学生中抽取2名学生不在同一组”为事件A,则P(A)=11111131213226C C C C C CC+⋅+⋅=1115.考点三样本的数字特征1.(2012西安五校模拟)已知一组正数x1,x2,x3,x4的方差s2=14(22221234x x x x+++-16),则数据x1+2,x2+2,x3+2,x4+2的平均数为( ) (A)2 (B)3 (C)4 (D)6解析:设x1,x2,x3,x4的平均值为x,则s2=14[(x1-x)2+(x2-x)2+(x3-x)2+(x4-x)2]=14(22221234x x x x+++-42x),∴42x=16,∴x =2,∴x 1+2,x 2+2,x 3+2,x 4+2的平均数为4. 答案:C2.(2013昆明一中检测)某学校想要调查全校同学是否知道迄今为止获得过诺贝尔物理奖的6位华人的姓名,为此出了一份考卷.该卷共有6个单选题,每题答对得20分,答错、不答得零分,满分120分.阅卷完毕后,校方公布每题答对率如下:则此次调查全体同学的平均分数是 分.解析:假设全校人数有x 人,则每道试题答对人数及总分分别为所以六个题的总分为66x,所以平均分为66xx=66. 答案:66考点四 线性回归方程1.(2013青岛一中调研)某学生四次模拟考试中,其英语作文的减分情况如下表:显然所减分数y 与模拟考试次数x 之间有较好的线性相关关系,则其线性回归方程为( )(A)y=0.7x+5.25 (B)y=-0.6x+5.25 (C)y=-0.7x+6.25(D)y=-0.7x+5.25解析:由题意可知,所减分数y 与模拟考试次数x之间为负相关,所以排除A. 考试次数的平均数为x =14(1+2+3+4)=2.5, 所减分数的平均数为y =14(4.5+4+3+2.5)=3.5, 即直线应该过点(2.5,3.5),代入验证可知直线y=-0.7x+5.25成立,故选D. 答案:D2.(2012湘潭三模)某种产品的广告支出x 与销售额y(单位:百万元)之间有如下的对应关系:(1)假定x 与y 之间具有线性相关关系,求回归方程;(2)若实际销售额不少于60百万元,则广告支出应该不少于多少?参考公式: ˆb=1221ni ii nii x ynx y xnx==--∑∑,ˆa=y -ˆb x . 解:(1)∵x =15×(2+4+5+6+8)=5, y =15×(30+40+60+50+70)=50,521ii x=∑=22+42+52+62+82=145,51i ii x y=∑=2×30+4×40+5×60+6×50+8×70=1380,∴ˆb=51522155i ii ii x yx y xx==--∑∑=21380555014555-⨯⨯-⨯=6.5,ˆa=y -ˆb x =50-6.5×5=17.5. ∴回归方程为ˆy=6.5x+17.5. (2)由回归方程得ˆy ≥60,即6.5x+17.5≥60, 解得x ≥8513≈6.54. 故广告支出应该不少于6.54百万元.考点五 独立检验1.(2012枣庄模拟)下面是2×2列联表:则表中a,b 的值分别为( )(A)94,72 (B)52,50 (C)52,74 (D)74,52 解析:∵a+21=73,∴a=52, 又a+22=b,∴b=74. 答案:C2.(2012汕头期末)下列命题中假命题是( )(A)对分类变量X 与Y 的随机变量K 2的观测值k 来说,k 越小,“X 与Y 有关系”的可信程度越大(B)用相关指数R 2来刻画回归的效果时,R 2的值越大,说明模型拟合的效果越好(C)两个随机变量的相关性越强,相关系数的绝对值越接近1 (D)等高条形图可以展示2×2列联表数据的频率特征解析:K 2的观测值k 越大,“X 与Y 有关系”的可信程度越大.答案:A综合检测1.(2011汕头期末)下表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据:如果根据上表提供的数据求出y 关于x 的线性回归方程为y =0.7x+0.35,那么表中t 的值为( )(A)3 (B)3.15 (C)3.5(D)4.5解析:由y=0.7x+0.35得2.54 4.54t+++=0.7×34564++++0.35,即114t+=3.5,解得t=3.答案:A2.(2011佛山联考)一个总体分为A,B两层,用分层抽样方法从总体中抽取一个容量为30的样本,已知B层中每个个体被抽到的概率都是112,则总体中的个体数为.解析:因为分层抽样为等可能抽样,故每个个体被抽到的可能性都是相等的.设总体中的个体数为n,则30n=112,∴n=360.答案:3603.(2012广州期末)在一次调研中,随机调查了某社区若干居民的年龄,将调查数据绘制成如图所示的扇形和条形统计图,则a-b= .(60以上含60)解析:设共调查了x名居民的年龄,由x·46%=230,得x=500,于是得a=100500×100%=20%,b=1-(20%+46%+22%)=12%.故a-b=8%.答案:8%。
一、选择题1.某校高二(1)班甲、乙两同学进行投篮比赛,他们进球的概率分别是34和45,现甲、乙各投篮一次,恰有一人进球的概率是( ) A .120B .320C .15D .7202.某校学生会为研究该校学生的性别与语文、数学、英语成绩这3个变量之间的关系,随机抽查了100名学生,得到某次期末考试的成绩数据如表1至表3,根据表中数据可知该校学生语文、数学、英语这三门学科中( )表1表2表3 语文 性别不及格 及格 总计 数学 性别不及格 及格 总计 英语 性别不及格 及格 总男 14 36 50 男 10 40 50 男 25 25 女 16 34 50 女 20 30 50 女 5 45 总计3070100总计3070100总计30701A .语文成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小B .数学成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小C .英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小D .英语成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小 3.某人射击一次命中目标的概率为12,且每次射击相互独立,则此人射击 7次,有4次命中且恰有3次连续命中的概率为( ) A .3761()2CB .2741()2AC .2741()2CD .1741()2C4.在一次抗洪抢险中,准备用射击的方法引爆漂流的汽油桶.现有5发子弹,第一次命中只能使汽油流出,第二次命中才能引爆,每次射击相互独立,且命中概率都是34.则打光子弹的概率是( ) A .9256B .13256C .45512D .910245.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的女生人数是男生人数的,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数,若有的把握认为是否喜欢抖音和性别有关,则男生至少有( )参考公式:0.10 0.05 0.025 0.010 0.005 0.001 2.7063.8415.0246.6357.87910.828A .12人B .18人C .24人D .30人6.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有( ) 参考数据及公式如下:20()P K k ≥ 0.050 0.0100.0010k3.841 6.635 10.8282()=()()()()n ad bc K a b c d a c b d -++++A .12B .11C .10D .187.为了解某班学生喜爱打篮球是否与性别有关,对该班60名学生进行问卷调查,得到如下图所示的22⨯列联表,则至少有( )的把握认为喜爱打篮球与性别有关.喜爱打篮球 不喜爱打篮球 合计男生 25530 女生 151530合计40 20 60附参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.20()P K k ≥ 0.100.050.025 0.010 0.005 0.001 0k 2.706 3.8415.0246.6357.78910.828A .99.9%B .99.5%C .99%D .97.5%8.甲、乙两名同学参加2018年高考,根据高三年级一年来的各种大、中、小型数学模拟考试总结出来的数据显示,甲、乙两人能考140分以上的概率分别为12和45,甲、乙两人是否考140分以上相互独立,则预估这两个人在2018年高考中恰有一人数学考140 分以上的概率为( ) A .12B .23C .34D .139.2018年元旦期间,某高速公路收费站的三个高速收费口每天通过的小汽车数X (单位:辆)均服从正态分布()2600,Nσ,若()5007000.6P X <<=,假设三个收费口均能正常工作,则这个收费口每天至少有一个超过700辆的概率为( ) A .1125B .12125 C .61125 D .6412510.下列说法中正确的是( )A .设随机变量~(10,0.01)X N ,则1(10)2P X >= B .线性回归直线不一定过样本中心点(,)x yC .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1D .先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这样的抽样方法是分层抽样11.为了解学生对街舞的喜欢是否与性别有关,在全校学生中进行抽样调查,根据数据,求得2K 的观测值0 4.804k ≈,则至少有( )的把握认为对街舞的喜欢与性别有关.参考数据:A .90%B .95%C .97.5%D .99%12.甲、乙两队进行篮球决赛,采取五场三胜制(当一队赢得三场胜利时,该队获胜,比赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队不超过4场即获胜的概率是( ) A .0.18B .0.21C .0.39D .0.42二、填空题13.有7个评委各自独立对A 、B 两位选手投票表决,两位选手旗鼓相当,每位评委公平投票且不得弃权.若7位评委依次揭晓票选结果,则A 选手在每位评委投票揭晓后票数始终保持领先的概率是______.14.有9粒种子分种在3个坑内,每坑放3粒,每粒种子发芽概率为0.5,若一个坑内至少有1粒种子发芽,则这个坑不需要补种;若一个坑内的种子都没有发芽,则这个坑需要补种,假定每个坑至多补种一次,需要补种的坑数为2的概率等于_______.15.已知如下四个命题:①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于0,表示回归效果越好;②在回归直线方程ˆ0.812yx =-中,当解释变量x 每增加一个单位时,预报变量ˆy平均增加0.8个单位;③两个变量相关性越强,则相关系数的绝对值就越接近于1;④对分类变量X 与Y ,对它们的随机变量2K 的观测值k 来说,k 越小,则“X 与Y 有关系”的把握程度越大.其中正确命题的序号是__________. 16.三个元件正常工作的概率分别为,,,将两个元件并联后再和串联接入电路,如图所示,则电路不发生故障的概率为_________.17.从包括甲乙两人的6名学生中选出3人作为代表,记事件A :甲被选为代表,事件B :乙没有被选为代表,则()P B A │等于_________.18.甲袋中装有2个白球,2个黑球,乙袋中装有2个白球,4个黑球,从甲、乙两袋中各取一球均为白球的概率为______________19.把一枚硬币任意抛掷三次,事件A =“至少出现一次反面”,事件B =“恰好出现一次正面”,则(/)P B A =__________.20.投到某出版社的稿件,先由两位初审专家进行评审,若能通过两位初审专家的评审,则直接予以录用,若两位初审专家都未予通过,则不予录用,若恰能通过一位初审专家的评审,则再由第三位专家进行复审,若能通过复审专家的评审,则予以录用,否则不予录用.设稿件能通过各初审专家评审的概率均为12,复审的稿件能通过评审的概率为14,各专家独立评审,则投到该出版社的1篇稿件被录用的概率为__________.三、解答题21.为落实中央“坚持五育并举,全面发展素质教育,强化体育锻炼”的指示精神,小明和小亮两名同学每天利用课余时间进行羽毛球比赛.规定每一局比赛中获胜方记2分,失败方记0分,没有平局,谁先获得10分就获胜,比赛结束.假设每局比赛小明获胜的概率都是23. (1)求比赛结束时恰好打了7局的概率;(2)若现在是小明6:2的比分领先,记X 表示结束比赛还需打的局数,求X 的分布列及期望.22.某航空公司规定:国内航班(不构成国际运输的国内航段)托运行李每件重量上限为50kg ,每件尺寸限制为40cm 60cm 100cm ⨯⨯,其中头等舱乘客免费行李额为40kg ,经济舱乘客免费行李额为20kg .某调研小组随机抽取了100位国内航班旅客进行调查,得到如表所示的数据:(1)请完成22⨯列联表,并判断是否在犯错概率不超过0.05的前提下,认为托运超额行李与乘客乘坐座位的等级有关?(2)调研小组为感谢参与调查的旅客,决定从托运行李超出免费行李额且不超出的旅客中(其中女性旅客4人)随机抽取4人,对其中的女性旅客赠送“100元超额行李补贴券”,记赠送的补贴券总金额为X 元,求X 的分布列与数学期望.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:23.某工厂A ,B 两条相互独立的生产线生产同款产品,在产量一样的情况下,通过日常监控得知,A ,B 生产线生产的产品为合格品的概率分别为p 和21(0.51)p p -.(1)从A ,B 生产线上各抽检一件产品,若使得产品至少有一件合格的概率不低于99.5%,求p 的最小值0p ;(2)假设不合格的产品均可进行返工修复为合格品,以(1)中确定的0p 作为p 的值. ①已知A ,B 生产线的不合格品返工后每件产品可分别挽回损失5元和3元,若从两条生产线上各随机抽检1000件产品,以挽回损失的平均数为判断依据,估计哪条生产线的挽回损失较多?②若最终的合格品(包括返工修复后的合格品)按照一、二、三等级分类后,每件可分别获利10元、8元、6元,现从A ,B 生产线的最终合格品中各随机抽取100件进行分级检测,结果统计如图所示,用样本的频率分布估计总体分布,记该工厂生产一件产品的利润为X ,求X 的分布列并估计该厂产量2000件时利润的期望值.24.某种疾病可分为Ⅰ、Ⅱ两种类型.为了解该疾病类型与性别的关系,在某地区随机抽取了患该疾病的病人进行调查,其中女性是男性的2倍,男性患Ⅰ型病的人数占男性病人的56,女性患Ⅰ型病的人数占女性病人的13. (1)若在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,求男性患者至少有多少人?(2)某药品研发公司欲安排甲乙两个研发团队来研发此疾病的治疗药物.两个团队各至多安排2个接种周期进行试验.甲团队研发的药物每次接种后产生抗体的概率为p ,每人每次接种花费()0m m >元,每个周期至多接种3次,第一个周期连续2次出现抗体则终止本接种周期进入第二个接种周期,否则需依次接种至第一周期结束,再进入第二周期;第二接种周期连续2次出现抗体则终止试验,否则需依次接种至至试验结束;乙团队研发的药物每次接种后产生抗体的概率为q ,每人每次花费()0n n >元,每个周期接种3次,每个周期必须完成3次接种,若一个周期内至少出现2次抗体,则该周期结束后终止试验,否则进入第二个接种周期.假设两个研发团队每次接种后产生抗体与否均相互独立.①若甲团队的试验平均花费大于乙团队的试验平均花费,求p 、q 、m 、n 满足的关系式;②若m n =,2p q =,从两个团队试验的平均花费考虑,该公司应选择哪个团队进行药品研发?附:()()()()()22n ad bc K a b c d a c b d -=++++,()20P K k ≥ 0.100.05 0.01 0.005 0.001 0k 2.7063.8416.6357.87910.82825.某大型运动会的组委会为了搞好接待工作,招募了30名男志愿者和20名女志愿者.调查发现,这些志愿者中有部分志愿者喜爱运动,另一部分志愿者不喜欢运动,并得到了如下等高条形图和22⨯列联表:喜爱运动 不喜爱运动 总计 男生 ab30 女生 cd20 总计50(1)求出列联表中a 、b 、c 、d 的值;(2)是否有99%的把握认为喜爱运动与性别有关?附:参考公式和数据:22()()()()()n ad bc K a b c d a c b d -=++++,(其中n a b c d =+++)20()P K k ≥ 0.5000.100 0.050 0.010 0.001 0k 0.4552.7063.8416.63510.82826.某花圃为提高某品种花苗质量,开展技术创新活动,分别用甲、乙两种方法培育该品种花苗.为比较两种培育方法的效果,选取了40棵花苗,随机分成两组,每组20棵.第一组花苗用甲方法培育,第二组用乙方法培育.培育完成后,对每棵花苗进行综合评分,绘制了如图所示的茎叶图:(1)分别求两种方法培育的花苗综合评分的中位数.你认为哪一种方法培育的花苗综合评分更高?并说明理由.(2)综合评分超过80的花苗称为优质花苗,填写下面的列联表,并判断是否有99.5%的把握认为优质花苗与培育方法有关?优质花苗 非优质花苗 合计甲培育法 乙培育法 合计附:()()()()()22n ad bc K a b c d a c b d -=++++. ()20P K k ≥ 0.0100.050 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.828【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】利用相互独立事件的概率乘法公式求得 甲投进而乙没有投进的概率,以及乙投进而甲没有投进的概率,相加即得所求. 【详解】甲投进而乙没有投进的概率为343(1)4520⨯-=,乙投进而甲没有投进的概率为341(1)455-⨯=,故甲、乙各投篮一次,恰有一人投进球的概率是 31720520+=,故选:D 【点睛】本题主要考查了相互独立事件的概率乘法公式的应用,体现了分类讨论的数学思想,属于中档题.2.C解析:C 【分析】根据题目所给的数据填写2×2列联表即可;计算K 的观测值K 2,对照题目中的表格,得出统计结论. 【详解】因为()()2210014341636100103020403070505030705050⨯⨯-⨯⨯⨯-⨯<⨯⨯⨯⨯⨯⨯()2100254552530705050⨯⨯-⨯<⨯⨯⨯,所以英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小. 故选C 【点睛】本题考查了独立性检验的应用问题,也考查了计算能力的应用问题,是基础题目. 3.B解析:B 【分析】由于射击一次命中目标的概率为12,所以关键先求出射击7次有4次命中且恰有3次连续命中的所有可能数,即根据独立事件概率公式得结果. 【详解】因为射击7次有4次命中且恰有3次连续命中有24A 种情况,所以所求概率为7241A 2⎛⎫⋅ ⎪⎝⎭.选B. 【点睛】本题考查排列组合以及独立事件概率公式,考查基本分析求解能力,属中档题.4.B解析:B 【分析】打光所有子弹,分中0次、中一次、中2次. 【详解】5次中0次:5 1 4⎛⎫ ⎪⎝⎭5次中一次:4 153144 C⎛⎫⨯⨯ ⎪⎝⎭5次中两次:前4次中一次,最后一次必中314331 444C⎛⎫⨯⨯⨯ ⎪⎝⎭则打光子弹的概率是514⎛⎫⎪⎝⎭+4153144C⎛⎫⨯⨯ ⎪⎝⎭+314331444C⎛⎫⨯⨯⨯ ⎪⎝⎭=13256,选B【点睛】本题需理解打光所有子弹的含义:可能引爆,也可能未引爆.5.B解析:B【解析】【分析】设男生人数为,女生人数为,完善列联表,计算解不等式得到答案.【详解】设男生人数为,女生人数为喜欢抖音不喜欢抖音总计男生女生总计男女人数为整数故答案选B【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.6.A解析:A【分析】设男生人数为x ,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,列不等式即可得出结论. 【详解】设男生人数为x ,依题意可得列联表如下:则2 3.841K >,由222235236183 3.841822x x x K x x x x x ⎛⎫- ⎪⎝⎭==>⋅⋅⋅,解得10.24x >, ,26x x为整数, ∴若在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关,则男生至少有12人,故选A. 【点睛】本题主要考查独立性检验知识,考查学生的计算能力,考查学生分析解决问题的能力,属于中档题. 独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.7.C解析:C 【解析】分析:根据列联表中数据,利用公式求得27.333k ≈,对照临界值即可的结果. 详解:根据所给的列联表, 得到()226025151557.333 6.63540203030k ⨯-⨯=≈>⨯⨯⨯,∴至少有0099的把握认为喜爱打篮球与性别有关,故选C.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.8.A解析:A 【解析】分析:根据互斥事件概率加法公式以及独立事件概率乘积公式求概率.详解:因为这两个人在2018年高考中恰有一人数学考140 分以上的概率为甲考140 分以上乙未考到140 分以上事件概率与乙考140 分以上甲未考到140 分以上事件概率的和,而 甲考140 分以上乙未考到140 分以上事件概率为14(1)25⨯-,乙考140 分以上甲未考到140 分以上事件概率为14(1)25-⨯,因此,所求概率为14(1)25⨯-1451(1)25102+-⨯==, 选A.点睛:本题考查互斥事件概率加法公式以及独立事件概率乘积公式,考查基本求解能力.9.C解析:C 【解析】分析:根据正态曲线的对称性求解即可.详解:根据正态曲线的对称性,每个收费口超过700辆的概率()()()111700150070010.60.2225P X P X ⎡⎤≥=-<<=⨯-==⎣⎦, ∴这三个收费口每天至少有一个超过700辆的概率 3161115125P ⎛⎫=--=⎪⎝⎭,故选C. 点睛:本题主要考查正态分布的性质与实际应用,属于中档题.有关正态分布的应用题考查知识点较为清晰,只要掌握以下两点,问题就能迎刃而解:(1)仔细阅读,将实际问题与正态分布“挂起钩来”;(2)熟练掌握正态分布的性质,特别是状态曲线的对称性以及各个区间概率之间的关系.10.A解析:A 【解析】在A 中,设随机变量X 服从正态分布N (10,0.01),则由正态分布性质得1(10)2P X >=,故A 正确; 在B 中,线性回归直线一定过样本中心点(),x y ,故B 错误;在C 中,若两个随机变量的线性相关性越强,则相关系数r 的绝对值越接近于1,故C 错误;在D 中,先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为m+50,m+100,m+150…的学生,这样的抽样方法是系统抽样法,故D 错误. 故选:A11.B解析:B 【解析】因为4.804>3.841,所以有95%的把握认为对街舞的喜欢与性别有关.12.C解析:C 【分析】利用相互独立事件概率乘法公式和互斥事件概率加法公式直接求解. 【详解】解:甲、乙两队进行排球决赛,采取五场三胜制(当一队赢得三场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立, 则甲队以3:1获胜的概率是:()()()10.60.610.50.50.610.60.50.510.60.60.50.50.21P =⨯⨯-⨯+⨯-⨯⨯+-⨯⨯⨯=.甲队以3:0获胜的概率是: 20.60.60.50.18P =⨯⨯=则甲队不超过4场即获胜的概率120.210.180.39P P P =+=+= 故选:C 【点睛】本题考查概率的求法,考查相互独立事件概率乘法公式和互斥事件概率加法公式等基础知识,考查运算求解能力,属于中档题.二、填空题13.【分析】将比分分为四种情况讨论计算概率【详解】由条件可知前两名投票的都投给选手并且投给每位选手的概率是若投票给两位选手的比分为则概率为若比分为则投给选手的方法有种所以概率为若比分为则投给选手的两票不 解析:532【分析】将比分分为7:0,6:1,5:2,4:3四种情况讨论计算概率. 【详解】由条件可知前两名投票的都投给选手A ,并且投给每位选手的概率是12P =. 若投票给A 、B 两位选手的比分为7:0,则概率为712⎛⎫ ⎪⎝⎭, 若比分为6:1,则投给选手B 的方法有155C =种,所以概率为7152⎛⎫⋅ ⎪⎝⎭若比分为5:2,则投给选手B 的两票不能在第三和第四的位置,有2519C -=种,所以概率为7192⎛⎫⋅ ⎪⎝⎭, 若比分为4:3,则投给A 的票不能是最后一位,且不能占5,6位,有2415C -=种,所以概率为7152⎛⎫⋅ ⎪⎝⎭, 所以概率()7151595232P ⎛⎫=+++⋅=⎪⎝⎭. 故答案为:532【点睛】本题考查独立事件同时发生的概率,重点考查分类的思想,属于中档题型.14.【分析】先计算出粒种子都没有发芽的概率即得出每个坑需要补种的概率然后利用独立重复试验的概率得出所求事件的概率【详解】由独立事件的概率乘法公式可知粒种子没有粒发芽的概率为所以一个坑需要补种的概率为由独 解析:21512【分析】先计算出3粒种子都没有发芽的概率,即得出每个坑需要补种的概率,然后利用独立重复试验的概率得出所求事件的概率. 【详解】由独立事件的概率乘法公式可知,3粒种子没有1粒发芽的概率为31128⎛⎫= ⎪⎝⎭, 所以,一个坑需要补种的概率为18, 由独立重复试验的概率公式可得,需要补种的坑数为2的概率为223172188512C ⎛⎫⋅⋅= ⎪⎝⎭, 故答案为21512. 【点睛】本题考查独立事件概率乘法公式的应用,同时也考查了独立重复试验恰有()k k N *∈次发生的概率,要弄清楚事件的基本类型,并结合相应的概率公式进行计算,考查分析问题和理解问题的能力,属于中等题.15.②③【分析】①根据相关指数的性质进行判断;②根据回归方程的性质进行判断;③根据相关系数的性质进行判断;④根据随机变量的观测值k 的关系进行判断【详解】①在线性回归模型中相关指数表示解释变量对于预报变量解析:②③ 【分析】①根据相关指数2R 的性质进行判断;②根据回归方程的性质进行判断;③根据相关系数的性质进行判断;④根据随机变量2K 的观测值k 的关系进行判断. 【详解】①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于1,表示回归效果越好,所以①错误;②在回归直线方程ˆy=0.8x−12中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.8个单位,正确;③两个变量相关性越强,则相关系数的绝对值就越接近于1,正确;④对分类变量X 与Y ,对它们的随机变量K2的观测值k 来说,k 越小,则“X 与Y 有关系”的把握程度越小,所以④错误; 故正确命题的序号是②③. 【点睛】该题考查的是有关统计的问题,涉及到的知识点有线性回归分析,两个变量之间相关关系强弱的判断,独立性检验,属于简单题目.16.【解析】分析:组成的并联电路可从反面计算即先计算发生故障的概率然后用对立事件概率得出不发生故障概率详解:由题意故答案为点睛:零件不发生故障的概率分别为则它们组成的电路中如果是串联电路则不发生故障的概 解析:【解析】分析:23,T T 组成的并联电路可从反面计算,即先计算发生故障的概率,然后用对立事件概率得出不发生故障概率. 详解:由题意11115(1)24432P =⨯-⨯=. 故答案为1532. 点睛:零件12,,,k a a a 不发生故障的概率分别为12,,,k p p p ,则它们组成的电路中,如果是串联电路,则不发生故障的概率易于计算,即为12k p p p ,如果组成的是并联电路,则发生故障的概率易于计算,即为12(1)(1)(1)k p p p ---.17.【解析】因为所以应填答案解析:35【解析】因为()()2254336613,210C C P A P AB C C ====,所以3(|)5P B A =。
2015年高三复习高中数学统计案例习题(有详细答案)一.选择题(共15小题)1.(2014•四川模拟)为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样2.(2014•湖北模拟)某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福广东的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次被抽取的总户数为()A.20 B.24 C.30 D.363.(2014•湖南一模)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,324.(2014•锦州一模)为了研究一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出的样本频率分布直方图如图,那么在这片树木中底部周长大于100cm的株树大约中()A.3000 B.6000 C.7000 D.80005.(2014•许昌二模)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{a n}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为()A.100 B.120 C.150 D.2006.(2014•云南模拟)已知一组数据如图所示,则这组数据的中位数是()A.27.5 B.28.5 C.27 D.287.(2014•青浦区三模)已知图1、图2分别表示A、B两城市某月1日至6日当天最低气温的数据折线图(其中横轴n表示日期,纵轴x表示气温),记A、B两城市这6天的最低气温平均数分别为和,标准差分别为s A和s B,则它们的大小关系是()A.>,sA>s B B.>,sA<s BC.<,sA<s BD.<,sA>s B8.(2014•天门模拟)如图是根据变量x,y的观测数据(x i,y i)(i=1,2,…10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是()A.①②B.①④C.②③D.③④9.(2014•邯郸二模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程,利用下表中数据推断a的值为()零件数x(个)10 20 30 40 50加工时间y(min)62 a 75 81 89A.68.2 B.68 C.69 D.6710.(2013•福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.12011.(2013•陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09 B.0.20 C.0.25 D.0.4512.(2013•辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45 B.50 C.55 D.6013.(2012•成都一模)某小区有125户高收入家庭、280户中等收入家庭、95户低收人家庭.现采用分层抽样的方法从中抽取100户,对这些家庭社会购买力的某项指标进行调查,则中等收入家庭中应抽选出的户数为()A.70 户B.17 户C.56 户D.25 户14.(2012•泸州一模)某校高三680名学生(其中男生360名、女生320名)在学术报告厅听了应考心理讲座,为了解有关情况,学校用分层抽样的方法抽取了一个样本,已知该样本中的女生人数为16名,那么该样本中的男生人数为()A.15 B.16 C.17 D.1815.(2012•绵阳二模)要从60人中抽取6人进行身体健康检查,现釆用分层抽样方法进行抽取,若这60人中老年人和中年人分别是40人,20人,则老年人中被抽取到参加健康检查的人数是()A.2人B.3人C.4人D.5人二.解答题(共15小题)16.为了了解学生的身体发育情况,某校对年满16周岁的60名男生的身高进行测量,其结果如下:身高(m)1.57 1.59 1.60 1.62 1.63 1.64 1.65 1.66 1.68人数 2 1 4 2 3 4 2 7 6身高(m)1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77人数8 7 4 3 2 1 2 1 1(1)根据上表,估计这所学校,年满16周岁的男生中,身高不低于1.65m且不高于1.71m的约占多少?不低于1.63m 的约占多少?(2)将测量数据分布6组,画出样本频率分布直方图;(3)根据图形说出该校年满16周岁的男生在哪一范围内的人数所占的比例最大?如果年满16周岁的男生有360人,那么在这个范围的人数估计约有多少人?17.改革开放以来,我国高等教育事业有了突飞猛进的发展,有人记录了某村2001到2005年五年间每年考入大学的人数,为了方便计算,2001年编号为1,2002年编号为2,…,2005年编号为5,数据如下:年份(x) 1 2 3 4 5人数(y) 3 5 8 11 13求y关于x的回归方程=x+所表示的直线必经的点.18.甲、乙两位同学参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取4次,绘制成茎叶图如图:甲乙9 7 78 1 2 8 535(Ⅰ)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(Ⅱ)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.19.下表是某单位在2013年1﹣5月份用水量(单位:百吨)的一组数据:月份x 1 2 3 4 5用水量y 4.5 4 3 2.5 1.8(Ⅰ)若由线性回归方程得到的预测数据与实际检验数据的误差不超过0.05,视为“预测可靠”,通过公式得,那么由该单位前4个月的数据中所得到的线性回归方程预测5月份的用水量是否可靠?说明理由;(Ⅱ)从这5个月中任取2个月的用水量,求所取2个月的用水量之和小于7(单位:百吨)的概率.参考公式:回归直线方程是:,.20.某校高三数学竞赛初赛考试后,对考生的成绩进行统计(考生成绩均不低于90分,满分为150分),将成绩按如下方式分成六组,第一组[90,100)、第二组[100,110)…,第六组[140,150],如图为其频率分布直方图的一部分,若第四、五、六组的人数依次成等差数列,且第六组有4人.(Ⅰ)求第四和第五组频率,并补全频率分布直方图;(Ⅱ)若不低于120分的同学进入决赛,不低于140分的同学为种子选手,完成下面2×2列联表(即填写空格处的数据),并判断是否有99%的把握认为“进入决赛的同学成为种子选手与专家培训有关”.[120,140)[140,150]合计参加培训8 8未参加培训合计 4附:K2=P(K2≥k0)0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001K0 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.82821.为了了解某中学高二女生的身高情况,该校对高二女生的身高进行了一次随机抽样测量,所得数据整理后列出了频率分布表如下:(单位:cm)(1)表中m、n、M、N所表示的数分别是多少?(2)绘制频率分布直方图;(3)估计该校女生身高小于162.5cm的百分比.22.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].(1)求x值;(2)(理科)从成绩不低于80分的学生中随机的选取2人,该2人中成绩在90以上(含90分)的人数记为ξ,求ξ的概率分布列及数学期望Eξ.(文)从从成绩不低于80分的学生中随机的选取3人,该3人中至少有2人成绩在90以上(含90分)的概率.23.某网站针对2014年中国好声音歌手A,B,C三人进行网上投票,结果如下观众年龄支持A 支持B 支持C20岁以下200 400 80020岁以上(含20岁)100 100 400(1)在所有参与该活动的人中,用分层抽样的方法抽取n人,其中有6人支持A,求n的值.(2)在支持C的人中,用分层抽样的方法抽取6人作为一个总体,从这6人中任意选取2人,求恰有1人在20岁以下的概率.24.某校100名学生期中考试数学成绩的频率分布直方图如图,其中成绩分组区间如下:组号第一组第二组第三组第四组第五组分组[50,60)[60,70)[70,80)[80,90)[90,100](Ⅰ)求图中a的值;(Ⅱ)根据频率分布直方图,估计这100名学生期中考试数学成绩的平均分;(Ⅲ)现用分层抽样的方法从第3、4、5组中随机抽取6名学生,将该样本看成一个总体,从中随机抽取2名,求其中恰有1人的分数不低于90分的概率?25.从某实验中,得到一组样本容量为60的数据,分组情况如下:(Ⅰ)求出表中m,a的值;分组5~15 15~25 25~35 35~45频数 6 2l m频率 a 0.05(Ⅱ)估计这组数据的平均数.26.某校高三文科分为四个班.高三数学调研测试后,随机地在各班抽取部分学生进行测试成绩统计,各班被抽取的学生人数恰好成等差数列,人数最少的班被抽取了22人.抽取出来的所有学生的测试成绩统计结果的频率分布条形图如图所示,其中120~130(包括120分但不包括130分)的频率为0.05,此分数段的人数为5人.(1)问各班被抽取的学生人数各为多少人?(2)求平均成绩;(3)在抽取的所有学生中,任取一名学生,求分数不小于90分的概率.27.在参加世界杯足球赛的32支球队中,随机抽取20名队员,调查其年龄为25,21,23,25,27,29,25,28,30,29,26,24,25,27,26,22,24,25,26,28.(1)填写下面的频率分布表(2)并画出频率分布直方图.(3)据此估计全体队员在哪个年龄段的人数最多?占总数的百分之几?分组频数频率20.5~22.522.5~24.524.5~26.526.5~28.528.5~30.5合计28.如图是调查某地某公司1000名员工的月收入后制作的直方图.(1)求该公司员工的月平均收入及员工月收入的中位数;(2)在收入为1000至1500元和收入为3500至4000元的员工中用分层抽样的方法抽取一个容量15的样本,员工甲、乙的月收入分别为1200元、3800元,求甲乙同时被抽到的概率.29.某市为了解全市居民日常用水量的分布情况,现采用抽样调查的方式,获得了n位居民某年的月均用水量(单位:t),样本统计结果如图表:(Ⅰ)分别求出x,n,y的值;(Ⅱ)若从样本中月均用水量在[5,6]内的5位居民a,b,c,d,e中任选2人作进一步的调查研究,求居民a被选中的概率.分组频数频率[0,1)25 y[1,2)0.19[2,3)50 x[3,4)0.23[4,5)0.18[5,6] 530.为了分析某次考试数学成绩情况,用简单随机抽样从某班中抽取25名学生的成绩(百分制)作为样本,得到频率分布表如下:分数[50,60)[60,70)[70,80)[80,90)[90,100]频数2 3 9 a 1频率0.08 0.12 0.36 b 0.04(Ⅰ)求样本频率分布表中a,b的值,并根据上述频率分布表,在下表中作出样本频率分布直方图;(Ⅱ)计算这25名学生的平均数及方差(同一组中的数据用该组区间的中点值作代表);(Ⅲ)从成绩在[50,70)的学生中任选2人,求至少有1人的成绩在[60,70)中的概率.参考答案与试题解析一.选择题(共15小题)1.(2014•四川模拟)为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样考点:分层抽样方法.专题:阅读型.分析:若总体由差异明显的几部分组成时,经常采用分层抽样的方法进行抽样解答:解:我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,而事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.了解某地区中小学生的视力情况,按学段分层抽样,这种方式具有代表性,比较合理.故选C.点评:本小题考查抽样方法,主要考查抽样方法,属基本题.2.(2014•湖北模拟)某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福广东的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次被抽取的总户数为()A.20 B.24 C.30 D.36考点:分层抽样方法.专题:计算题.分析:根据社区里的高收入家庭户和高收入家庭户要抽取的户数,得到每个个体被抽到的概率,用求到的概率乘以低收入家庭户的户数,得到结果.解答:解:∵区现有480个住户,高收入家庭120户,抽取了6户∴每个个体被抽到的概率是∴该社区本次被抽取的总户数为=24,故选B.点评:本题考查分层抽样方法,这种题目类型是高考题目中一定会出现的题目,运算量不大,是一个必得分题目.3.(2014•湖南一模)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,32考点:系统抽样方法.专题:计算题.分析:由系统抽样的特点知,将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,这时间隔一般为总体的个数除以样本容量.从所给的四个选项中可以看出间隔相等且组距为10的一组数据是由系统抽样得到的.解答:解:从50枚某型导弹中随机抽取5枚,采用系统抽样间隔应为=10,只有B答案中导弹的编号间隔为10,故选B.点评:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本.4.(2014•锦州一模)为了研究一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出的样本频率分布直方图如图,那么在这片树木中底部周长大于100cm的株树大约中()A.3000 B.6000 C.7000 D.8000考点:频率分布直方图.专题:概率与统计.分析:在频率分布表中,频数的和等于样本容量,频率的和等于1,每一小组的频率等于这一组的频数除以样本容量.频率分布直方图中,小矩形的面积等于这一组的频率.底部周长小于100cm的矩形的面积求和乘以样本容量即可.解答:解:由图可知:底部周长小于100cm段的频率为(0.01+0.02)×10=0.3,则底部周长大于100cm的段的频率为1﹣0.3=0.7那么在这片树木中底部周长大于100cm的株树大约10000×0.7=7000人.故选C.点评:本小题主要考查样本的频率分布直方图的知识和分析问题以及解决问题的能力.统计初步在近两年高考中每年都以小题的形式出现,基本上是低起点题.5.(2014•许昌二模)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{a n}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为()A.100 B.120 C.150 D.200考点:频率分布直方图.专题:概率与统计.分析:根据直方图中的各个矩形的面积代表了频率,各个矩形面积之和为1,求出小长方形面积最大的一组的频率,再根据频数=频率×样本容量,求出频数即可.解答:解:∵直方图中的各个矩形的面积代表了频率,这5个小方形的面积由小到大构成等差数列{a n},a2=2a1,∴d=a1,a3=3a1,a4=4a1,a5=5a1根据各个矩形面积之和为1,则a1+a2+a3+a4+a5=15a1=1∴a1=,小长方形面积最大的一组的频率为a5=5×=根据频率=可求出频数=300×=100故选:A.点评:本题考查了频率、频数的应用问题,各小组频数之和等于样本容量,各小组频率之和等于1.6.(2014•云南模拟)已知一组数据如图所示,则这组数据的中位数是()A.27.5 B.28.5 C.27 D.28考点:众数、中位数、平均数.专题:概率与统计.分析:利用中位数的定义即可得出.解答:解:这组数据为16,17,19,22,25,27,28,30,30,32,36,40的中位数是=27.5.故选:A.点评:本题考查了中位数的定义及其计算方法,属于基础题.7.(2014•青浦区三模)已知图1、图2分别表示A、B两城市某月1日至6日当天最低气温的数据折线图(其中横轴n表示日期,纵轴x表示气温),记A、B两城市这6天的最低气温平均数分别为和,标准差分别为s A和s B,则它们的大小关系是()A.>,sA>s B B.>,sA<s BC.<,sA<s BD.<,sA>s B考点:众数、中位数、平均数.专题:概率与统计.分析:本题可以由折线图上的数据做出两个城市的平均气温和方差,也可以根据两个折线图的高低和变化的趋势即波动的大小,得到结果.解答:解:由折线图可知A市的平均气温是,B市的平均气温是=11.7,由折线图也可以看出B市的气温较高,可以看出B市的气温的变化不大,方差较小;故选D.点评:本题考查了折线图以及平均数和方差的求法;求两组数据的平均值和方差是研究数据常做的两件事,平均值反映数据的平均水平,而方差反映数据的波动大小,从两个方面可以准确的把握数据的情况.8.(2014•天门模拟)如图是根据变量x,y的观测数据(x i,y i)(i=1,2,…10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是()A.①②B.①④C.②③D.③④考点:散点图.专题:计算题.分析:通过观察散点图可以知道,y随x的增大而减小,各点整体呈下降趋势,x与y负相关,u随v的增大而增大,各点整体呈上升趋势,u与v正相关.解答:解:由题图③可知,y随x的增大而减小,各点整体呈下降趋势,x与y负相关,由题图④可知,u随v的增大而增大,各点整体呈上升趋势,u与v正相关.故选D.点评:本题考查散点图,是通过读图来解决问题,考查读图能力,粗略的反应两个变量之间的关系,是不是线性相关,是正相关还是负相关.9.(2014•邯郸二模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程,利用下表中数据推断a的值为()零件数x(个)10 20 30 40 50加工时间y(min)62 a 75 81 89A.68.2 B.68 C.69 D.67考点:线性回归方程.专题:计算题;概率与统计.分析:由题意,将20代入可得68.2,故可能值为68.解答:解:由题意,y=0.68×20+54.6=68.2,又由表可知加工时间y(min)都是以整数记,故a可能为68,故选B.点评:本题考查了线性回归方程的应用及数学问题与实际问题的转化,属于基础题.10.(2013•福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.120考点:频率分布直方图.专题:图表型.分析:根据频率分布直方图,成绩不低于60分的频率,然后根据频数=频率×总数可求出所求.解答:解:根据频率分布直方图,成绩不低于60(分)的频率为1﹣10×(0.005+0.015)=0.8.由于该校高一年级共有学生600人,利用样本估计总体的思想,可估计该校高一年级模块测试成绩不低于60(分)的人数为600×0.8=480人.故选B.点评:本小题主要考查频率、频数、统计和概率等知识,考查数形结合、化归与转化的数学思想方法,以及运算求解能力.11.(2013•陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09 B.0.20 C.0.25 D.0.45考点:频率分布直方图.分析:在频率分布表中,频数的和等于样本容量,频率的和等于1,小矩形的面积等于这一组的频率,则所以面积和为1,建立等量关系即可求得长度在[25,30)内的频率即得.解答:解:设长度在[25,30)内的频率为a,根据频率分布直方图得:a+5×0.02+5×0.06+5×0.03=1⇒a=0.45.则根据频率分布直方图估计从该批产品中随机抽取一件,则其为二等品的概率为0.45.故选D.点评:本小题主要考查样本的频率分布直方图的知识和分析问题以及解决问题的能力.统计初步在近两年高考中每年都以小题的形式出现,基本上是低起点题.12.(2013•辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45 B.50 C.55 D.60考点:频率分布直方图.专题:概率与统计.分析:由已知中的频率分布直方图,我们可以求出成绩低于60分的频率,结合已知中的低于60分的人数是15人,结合频数=频率×总体容量,即可得到总体容量.解答:解:∵成绩低于60分有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20则成绩低于60分的频率P=(0.005+0.010)×20=0.3,又∵低于60分的人数是15人,则该班的学生人数是=50.故选B.点评:本题考查的知识点是频率分布直方图,结合已知中的频率分布直方图,结合频率=矩形的高×组距,求出满足条件的事件发生的频率是解答本题的关键.13.(2012•成都一模)某小区有125户高收入家庭、280户中等收入家庭、95户低收人家庭.现采用分层抽样的方法从中抽取100户,对这些家庭社会购买力的某项指标进行调查,则中等收入家庭中应抽选出的户数为()A.70 户B.17 户C.56 户D.25 户考点:分层抽样方法.专题:概率与统计.分析:由分层抽样的计算方法:中等收入家庭的户数占总户数的比例再乘以要抽取的户数,即可得出答案.解答:解:由已知可得中等收入家庭中应抽选出的户数==56.故选C.点评:本题考查了分层抽样,掌握分层抽样的计算方法是解决问题的关键.14.(2012•泸州一模)某校高三680名学生(其中男生360名、女生320名)在学术报告厅听了应考心理讲座,为了解有关情况,学校用分层抽样的方法抽取了一个样本,已知该样本中的女生人数为16名,那么该样本中的男生人数为()A.15 B.16 C.17 D.18考点:分层抽样方法.专题:计算题.分析:设该样本中的男生人数为x,则由分层抽样的定义和方法可得=,由此解得x 的值.解答:解:设该样本中的男生人数为x,则由分层抽样的定义和方法可得=,解得x=18,故选D.点评:本题主要考查分层抽样的定义和方法,利用了总体中各层的个体数之比等于样本中对应各层的样本数之比,属于基础题.15.(2012•绵阳二模)要从60人中抽取6人进行身体健康检查,现釆用分层抽样方法进行抽取,若这60人中老年人和中年人分别是40人,20人,则老年人中被抽取到参加健康检查的人数是()A.2人B.3人C.4人D.5人考点:分层抽样方法.专题:计算题.分析:先求出每个个体被抽到的概率,用该层的个体数乘以每个个体被抽到的概率,就等于该层应抽取的个体数.解答:解:每个个体被抽到的概率等于=,老年人中被抽取到参加健康检查的人数是40×=4,故选C.点评:本题主要考查分层抽样的定义和方法,用每层的个体数乘以每个个体被抽到的概率等于该层应抽取的个体数,属于基础题.二.解答题(共15小题)16.为了了解学生的身体发育情况,某校对年满16周岁的60名男生的身高进行测量,其结果如下:身高(m)1.57 1.59 1.60 1.62 1.63 1.64 1.65 1.66 1.68人数 2 1 4 2 3 4 2 7 6身高(m)1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77人数8 7 4 3 2 1 2 1 1(1)根据上表,估计这所学校,年满16周岁的男生中,身高不低于1.65m且不高于1.71m的约占多少?不低于1.63m 的约占多少?(2)将测量数据分布6组,画出样本频率分布直方图;(3)根据图形说出该校年满16周岁的男生在哪一范围内的人数所占的比例最大?如果年满16周岁的男生有360人,那么在这个范围的人数估计约有多少人?考点:频率分布直方图;频率分布表.专题:概率与统计.分析:(1)根据上表求出身高不低于1.65m且不高于1.71m的频率与不低于1.63m的频率;(2)将测量数据分组,求频数与频率,列出频率分布表,画出频率分布直方图;(3)根据图形得出正确的结论以及估计结果.解答:解:(1)根据上表得,身高不低于1.65m且不高于1.71m的频率是=≈0.567,∴约占总体的56.7%;不低于1.63m的频率是1﹣=1﹣0.15=0.85,约占总体的85%;(2)将测量数据分布6组,∴=0.033,∴组距是0.04,计算频数与频率,列出频率分布表,如下;分组频数频率156.5﹣160.5 7 0.11160.5﹣164.5 9 0.15164.5﹣168.5 15 0.25168.5﹣172.5 22 0.37172.5﹣176.5 6 0.10176.5﹣180.5 1 0.02合计60 1.00画出样本频率分布直方图,如图所示;(3)根据图形知,该校年满16周岁的男生在168.5﹣172.5内的人数所占的比例最大,如果年满16周岁的男生有360人,那么在这个范围的人数估计约为360×0.37=133人.点评:本题考查了频率分布直方图的应用问题,也考查了列表和画图的能力,解题时应根据图中数据进行有关的计算,是基础题.17.改革开放以来,我国高等教育事业有了突飞猛进的发展,有人记录了某村2001到2005年五年间每年考入大学的人数,为了方便计算,2001年编号为1,2002年编号为2,…,2005年编号为5,数据如下:年份(x) 1 2 3 4 5人数(y) 3 5 8 11 13求y关于x的回归方程=x+所表示的直线必经的点.考点:回归分析的初步应用.专题:计算题;概率与统计.分析:求平均值,回归直线必过样本点的中心.解答:解:==3,==8,故回归方程=x+所表示的直线必经过点(3,8).点评:本题考查了回归分析,回归直线必过样本点的中心,同时考查了平均数的求法,属于基础题.18.甲、乙两位同学参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取4次,绘制成茎叶图如图:甲乙9 7 78 1 2 8 535(Ⅰ)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(Ⅱ)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.考点:茎叶图;众数、中位数、平均数;极差、方差与标准差.专题:概率与统计.分析:(I)由茎叶图知甲乙两同学的成绩分别为:甲:82 81 79 88 乙:85 77 83 85.利用“列举法”及其古典概型的概率计算公式即可得出.(II)分别计算出甲乙的平均成绩及其方差即可得出.。
高考数学深化复习+命题热点提分专题18统计与统计案例理1.某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人.现采取分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为( )A.15,5,25 B.15,15,15C.10,5,30 D.15,10,20解析:先确定抽样比为=,则依次抽取的人数分别为×300=15,×200=10和×400=20.故选D.答案:D2.某同学进入高三后,4次月考的数学成绩的茎叶图如图.则该同学数学成绩的方差是 ( )A.125 B.5 5C.45 D.3 5解析:由茎叶图知平均值为=125,∴s2=[(125-114)2+(125-126)2+(125-128)2+(125-132)2]=45.答案:C3.为了判定两个分类变量X和Y是否有关系,应用K2独立性检验法算得K2的观测值为5,又已知P(K2≥3.841)=0.05,P(K2≥6.635)=0.01,则下列说法正确的是( )A.有95%的把握认为“X和Y有关系”B.有95%的把握认为“X和Y没有关系”C.有99%的把握认为“X和Y有关系”D.有99%的把握认为“X和Y没有关系”解析:依题意,K2=5,且P(K2≥3.841)=0.05,因此有95%的把握认为“X和Y有关系”,选A.答案:A4.为了研究某大型超市开业天数与销售额的情况,随机抽取了5天,其开业天数与每天的销售额的情况如下表所示:0.67x+54.9,由于表中有一个数据模糊看不清,请你推断出该数据的值为( )A.67 B.68C.68.3 D.71解析:设表中模糊看不清的数据为m.因为x==30,又样本中心(,)在回归直线=0.67x+54.9上,所以==0.67×30+54.9,得m=68,故选B.答案:B5.采用系统抽样方法从1 000人中抽取50人做问卷调查,为此将他们随机编号为1,2,…,1 000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.抽到的50人中,编号落入区间[1,400]的人做问卷A,编号落入区间[401,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C的人数为( )A.12 B.13。
考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例一、选择题1.(2012·某某高考文科·T2)容量为20的样本数据,分组后的频数如下表:则样本数据落在区间[10,40)的频率为( )(A)0.35 (B)0.45 (C)0.55 (D)0.65【解题指南】解答本题先要读懂频数分布表,再结合频率的求法求解.【解析】选B.数据落在区间[10,40)内的频数为9,样本容量为20,所求频率P=920=0.45.2.(2012·某某高考文科·T5)与(2012·某某高考理科·T4)相同设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为y,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg【解题指南】根据线性相关,回归直线,样本点的中心等相关概念判断.【解析】选D.bx可知正确,是估计变量;正确不正确3.(2012·某某高考文科·T3)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()(A)46,45,56 (B) 46,45,53 (C) 47,45,56 (D) 45,47,53【解题指南】根据中位数、众数、极差的概念进行计算,注意观察茎叶图中的数据.【解析】选A. 茎叶图中共有30个数据,所以中位数是第15个和第16个数字的平均数,即1(4547)462+=,排除C ,D ;再计算极差,最小数据是12,最大数据是68,所以681256-=,故选A.4.(2012·某某高考理科·T6)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x 甲、x 乙,中位数分别为m 甲、m 乙,则( )(A) x x <甲乙,m 甲>m 乙 (B) x x <甲乙,m 甲<m乙 (C) x x >甲乙,m 甲>m乙 (D)x x >甲乙,m 甲<m乙【解题指南】平均数的大小可以根据茎叶图中数据的分布的集中位置进行判断,中位数则需要确定第8个数与第9个数的平均值,然后再比较大小;或直接根据平均数和中位数的计算公式进行计算.【解析】选B.解法一:观察茎叶图可知x x <甲乙,甲组数据中的中位数是1(1822)202+=,乙组数据中的中位数是1(2731)292+=,∴m 甲<m 乙.解法二:1(4143303016x =+++甲382225271010++++++345141818568)16++++++=,1(42434816x =++乙31323434382022+++++++45723232327101218)16+++++++=,所以x x <甲乙,又=20=29m m 乙甲,,∴m m <乙甲,故选B.5.(2012·某某高考理科·T5)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )()A 甲的成绩的平均数小于乙的成绩的平均数()B 甲的成绩的中位数等于乙的成绩的中位数 ()C 甲的成绩的方差小于乙的成绩的方差 ()D 甲的成绩的极差小于乙的成绩的极差【解题指南】根据平均数、方差、中位数的定义计算即可.【解析】选C .11(45678)6,(5369)655x x =++++==⨯++=乙甲,甲的成绩的方差为221(2212)25⨯+⨯=,乙的成绩的方差为221(1331) 2.45⨯+⨯=.6. (2012·新课标全国高考文科·T3)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i=1,2,…,n)都在直线y=12x+1上,则这组样本数据的样本相关系数为( )(A )-1 (B )0 (C )12(D )1【解题指南】理清相关系数与相关性强弱的关系是解决本题关键.【解析】选D. 样本相关系数越接近1,相关性越强,现在所有的样本点都在直线112y x =+上,样本的相关系数应为1.7.(2012·某某高考文科·T6)小波一星期的总开支分布图如图(1)所示,一星期的食品开支如图(2)所示,则小波一星期的鸡蛋开支占总开支的百分比为( )A.30%B.10%C.3%D.不能确定【解题指南】读图,理清鸡蛋开支、食品开支与总开支之间的百分比关系.【解析】选C.由图2知,小波一星期的食品开支为300元,其中鸡蛋开支为30元,占食品开支的10%,而食品开支占总开支的30%,所以小波一星期的鸡蛋开支占总开支的百分比为3%.8. (2012·某某高考理科·T9)样本()12,,n x x x …,的平均数为x ,样本()12,,n y y y …的平均数为y ()x y ≠.若样本()1212,,,,,n m x x x y y y ……的平均数()1z x y αα=+-,其中102α<<,则,n m 的大小关系为( )A.n m <B.n m >C.n m =D.不能确定【解题指南】用,x y 表示出z ,结合已知条件,建立m n α、、所满足的关系式,由α的X 围获得,n m 所满足的不等关系,进而判断出n 与m 的大小关系. 【解析】选A.由已知得12+n x x x nx ++=…,12+m y y y my ++=…,()()1212+n m x x x y y y z m n++++++=+……nx m ym n +=+=()1x y αα+-整理得()()10x y m n αα-+-=⎡⎤⎣⎦,,x y ≠∴()10m n αα+-=即1n m αα=-,又10,,0121ααα⎛⎫∈∴<< ⎪-⎝⎭,1,n n m m ∴<∴<.9.(2012·某某高考文科·T4)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )(A)众数 (B)平均数 (C)中位数 (D)标准差 【解题指南】本题考查样本的数字特征来估计总体.【解析】选D. B 样本数据恰好是A 样本数据都加2后所得数据众数、中位数、平均数比原来的都多2,而标准差不变.10.(2012·某某高考理科·T4)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的为9.抽到的32人中,编号落入区间[]1,450的人做问卷A ,编号落入区间[]451,750的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )(A )7 (B )9 (C )10 (D )15【解题指南】本题考查系统抽样方法和数列项数的计算方式,由系统抽样抽出的数的编号是等差数列. 【解析】选C. 采用系统抽样方法从960人中抽取32人,将整体分成32组,每组30人,即30=l ,第k 组的为930)1(+-k ,令750930)1(451≤+-≤k ,而z k ∈,解得2516≤≤k ,则满足2516≤≤k 的整数k 有10个,故答案应选C. 二、填空题11.(2012·某某高考理科·T9)某地区有小学150所,中学75所,大学25所,现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取__________所学校,中学中抽取__________所学校.【解题指南】根据抽取样本的比例计算.【解析】∵分层抽样也叫按比例抽样,由题知学校总数为250所,所以应从小学中抽取150330=30=18150+75+255⨯⨯(人),同理可得从中学中抽取75330=30=9150+75+2510⨯⨯(人).【答案】18 9.12. (2012·某某高考文科·T14)右图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的X 围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为____.【解题指南】本题考查频率分布直方图,关键是抓住纵轴表示的是频率/组距.【解析】最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9. 【答案】9.13.(2012·某某高考文科·T11)一支田径运动队有男运动员56人,女运动员42人.现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有______人. 【解题指南】本题考查分层抽样,解答本题的关键是求出入样率.【解析】选X. 由842656⨯=,可知结果.【答案】6.14.(2012·某某高考文科·T11)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为____________.【解题指南】考查随机抽样的方法,利用抽样比乘以组内人数即可求出.【解析】此样本中男生人数为280560160560+420⨯=.【答案】160.15.(2012·某某高考文科·T13)由正整数组成的一组数据1234,,,,x x x x 其平均数和中位数都是2,且标准差等于1,则这组数据为.(从小到大排列)【解题指南】本题是考查统计的有关知识,要知道平均数及中位数(按从小到大或从大到小的顺序排列,若奇数个数据取中间的数,若偶数个数据取中间两个数的平均数)的求法,以及标准差公式。
第四节 统计案例预习设计 基础备考知识梳理 1.回归分析在具有线性相关关系的数据),(,),,(),,(2211n n y x y x y x 中,回归方程的截距和斜率的最小二乘估计分别为=---=∑∑==ax xy y x xbini i ini ˆ,)())((ˆ211其中=x =y, 称为样本点的中心,线性回归方程为2.残差分析(1)残差:对于样本点),,(,),,(),,(2211n n y x y x y x 它们的随机误差为,,,2,1,.n i a bx y e i i i =--=其估计值为-=-=i i i y i y y e ˆˆi xie n i a b ˆ.,,2,1,ˆˆ =-称为相应于点)(i i y x 的残差. (2)残差平方和(3)相关指数,)()ˆ(1212112y y i yyR in i in---=∑∑==22121((11y n y x n x i ni i yx n yx r ni ii ni -∑-∑∑=-===2R 越大,意味着残差平方和 ,即模型的拟合效果 2R 越小,残差平方和 ,即模型的拟合效果 在线性回归模型中,2R 表示解释变量对于预报变量变化的贡献率,2R 越近接于1,表示回归的效果3.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)列联表:列出的两个分类变量的 称为列联表.假设有两个分类变量X 和y ,它们的可能取值分别为},{21x x 和},,{21y y 其样本频数列联表(称为2×2列联表)为2×2列联表构造一个随机变量⋅++++-=))()()(()(22d b c a d c b a bc ad n K 其中=n 为样本容量. (3)独立性检验:利用随机变量 来判断“两个分类变量 ”的方法称为独立性检验.典题热身1.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是 ( ) A .残差 B .残差的平方和 C .随机误差 D .相关指数2R 答案:B2.对于事件A 和事件B ,通过计算得到2K 的观测值≈k ,514.4下列说法正确的是A .在犯错误的概率不超过0.01的前提下认为事件A 和事件B 有关 B .在犯错的概率不超过0.05的前提下认为事件A 和事件B 有关C .在犯错的概率不超过0. Ol 的前提下认为事件A 和事件B 无关D .在犯错误的概率不超过0.05的前提下认为事件A 和事件B 无关 答案:B3.两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下,其中拟合效果最好的模型是 ( )A .模型1的相关指数2R 为O.98 B .模型2的相关指数2R 为0.80 C .模型3的相关指数2R 为0.50 D .模型4的相关指数2R 为0.25 答案:A( ))0,0.(A )8.1,2.(B )5.2,3.(c )2.3,4.(D答案:C5.(2011.莱芜模拟)在一项打鼾与患心脏病的调查中,共调 查了l 671人,经过计算2K 的观测值,63.27=k 根据这一数据分析,我们有理由认为打鼾与患心脏病是答案:有关课堂设计 方法备考题型一 线性回归分析【例1】假设关于某种设备的使用年限x(年)与所支出的维修费用y (万元)有如下统计资料:已知,3.112,8.140,9051251251===∑∑∑===i i i i i it y x y x.878.0,32,4.12,9.87905.0==-≈≈r n 时(1)求⋅y x ,(2)对x ,y 进行线性相关性检验;(3)如果x 与y 具有线性相关关系,求出线性回归方程; (4)估计使用年限为10年时,维修费用约是多少?题型二 非线性回归分析【例2】下表是某年美国旧轿车价格的调查资料,今以x 表示轿车的使用年数,y 表示相应的年均价格,题型三 独立性检验【例3】 (2011.山东模拟)在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关.你所得到的结论在什么范围内有效?技法巧点(1)线性回归分析以散点图为基础,具有很强的直观性,有散点图作比较时,拟合效果的好坏可由直观性直接判断,没有散点图时,只需套用公式求2,R r 再作判断即可. (2)独立性检验没有直观性,必须依靠2K 的观测值k 作判断.失误防范1.r 的大小只说明是否相关并不能说明拟合效果的好坏,2R 才是判断拟合效果好坏的依据.2.独立性检验的随机变.量706.22=K 是判断是否有关系的临界值,706.22<K 应判断为没有充分证据显示X 与y 有关系,而不能作为小于90%的量化值来判断随堂反馈1.(2009.临沂模拟)在对两个变量x ,y 进行线性回归分析时有下列步骤:①对所求出的回归方程作出解释;②收集数据=i y x i i },,{;,,2,1n ③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图,如果根据可靠性要求能够作出变量x ,y 线性相关的结论,则在下列操作顺序中正确的是 ( )A .①②⑤③④ B.③②④⑤① C .②④③①⑤ D.②⑤④③① 答案:D2.已知回归方程,12ˆ+=x y而试验得到一组数据(x ,y)是(2,4.9),(3,7.1),(4,9.1),则残差平方和是 ( )01.0.A 02.0.B 03.0.C 04.0.D 答案:C3.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到下表:已知.025.0)024.5(,05.0)841.3(22≈≥≈≥K P K p根据表中数据,得到.844.430202723)7102013(5022≈⨯⨯⨯⨯-⨯⨯=K 则认为选修文科与性别有关系出错的可能性为答案:5%高效作业 技能备考一、选择题1.(2011.江西高考)变量X 与y 相对应的一组数据为,10(),2,3.11(),1),3,8.11();5,13(),4,5.12(变量U 与y 相对应的一组数据为),2,5.12(),3,8.11(),4,3.11(),5,10(1).1,13(r 表示变量y 与X 之间的线性相关系数,2r 表示变量V 与U 之间的线性相关系数,则 ( )0.12<<r r A 120.r r B << 120r r C <<⋅ 12.r r D =答案:C2.(2011.深圳模拟)甲、乙、丙、丁四位同学各自对A 、B 两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:则哪位同学的试验结果体现A 、B 两变量有更强的线性相关性 ( )A .甲B .乙C .丙D .丁 答案:D3.(2011.巢湖月考)下列说法:①将一组数据中的每个数都加上或减去同一个常数后,方差不变;②设有一个回归方程,53ˆx y-=变量x 增加一个单位时,y 平均增加5个单位; ③线性回归方程.ˆˆˆa x b y+=必过点);,( ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得,079.132=K 则其两个变量间有关系的可能性是90%. 其中错误的个数是( )1.A2.B3.C4.D 答案:C4.(2011.菏泽月考)下面是2×2列联表:则表中a ,b 的值分别为( ) 答案:C5.(2011.东营模拟)若变量y 与x 之间的相关系数=r ,9362.0-查表得到相关系数临界值,8013.005.0=r 则变量y 与x 之间A .不具有线性相关关系B .具有线性相关关系C .它们的线性关系还要进一步确定D .不确定 答案:B6.(2011.湖州调研)冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表所示.根据以上数据,则A .含杂质的高低与设备改造有关B .含杂质的高低与设备改造无关C .设备是否改造决定含杂质的高低D .以上答案都不对 答案:A7.(2011.湖南高考)通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表:由))()()(()(22d b c a d c b a bc ad n K ++++-=算得,8.750605060)30203040(11022≈⨯⨯⨯⨯-⨯⨯=K 附表:参照附表,得到的正确结论是 ( )A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误韵概率不超过O.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过O.l%的前提下,认为“爱好该项运动与性别无关” 答案:A二、填空题8.(2011.惠州模拟)对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:试根据上述数据计算=2K (保留两位小数)比较这两种手术对病人又发作心脏病的影响有没有差别,答案:1.78不能作出这两种手术对病人又发作心脏病的影响有差别的结论9.(2011.马鞍山模拟煤高校“统计初步”课程的教师随机调查了选该课程的一些学生的情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中的数据,得到,841.3,844.430202723)7102013(50222≥≈⨯⨯⨯⨯-⨯⨯=K K 因为所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 答案:5%三、解答题10.(2010.菜芜模拟)对某校学生进行心理障碍测试得到如下表:试说明在这三种心理障碍中哪一种与性别关系最大.11.(2011.潍坊模拟)某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关?并说明理由.12.某研究机构为了研究人的脚的大小(码)与身高(cm)之间的关系,随机抽测了20人,得到如下数据:(1)若“身高大于175 cm”的为“高个”,“身高小于等于175 cm”的为“非高个”;“脚长大于42码”的为“大脚”,“脚长小于等于42码”的为“非大脚”,请根据上表数据完成如下的2×2列联表;(2)根据题(1)中表格的数据,若按99%的可靠性要求,能否认为脚的大小与身高之间有关系?。
高考数学二轮复习专题突破—统计与统计案例1.某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01) 附:√74≈8.602.2.(2021·江西赣州二模改编)遵守交通规则,人人有责.“礼让行人”是我国《道路交通安全法》的明文规定,也是全国文明城市测评中的重要内容.《道路交通安全法》第47条明确规定:“机动车行经人行横道时,应当减速行驶;遇行人正在通过人行横道,应当停车让行.机动车行经没有交通信号的道路时,遇行人横过道路,应当避让.否则扣3分罚200元”.下表是2021年1至4月份我市某主干路口监控设备抓拍到的驾驶员不“礼让行人”行为统计数据:(1)请利用所给数据求不“礼让行人”驾驶员人数y 与月份x 之间的经验回归方程y ^=b ^x+a ^,并预测该路口2021年10月不“礼让行人”驾驶员的大约人数(四舍五入);(2)交警从这4个月内通过该路口的驾驶员中随机抽查50人,调查驾驶员不“礼让行人”行为与驾龄的关系,得到下表:依据小概率值α=0.10的独立性检验,分析“礼让行人”行为是否与驾龄有关.参考公式:b ^=∑i=1nx i y i -nx y ∑i=1nx i 2-nx2=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2.χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.3.(2021·河北石家庄二模改编)某地区在2020年底全面建成小康社会,随着实施乡村振兴战略规划,该地区农村居民的收入逐渐增加,可支配消费支出也逐年增加.该地区统计了2016~2020年农村居民人均消费支出情况,对有关数据处理后,制作如图1的折线图[其中变量y (单位:万元)表示该地区农村居民人均年消费支出,年份用变量t 表示,其取值依次为1,2,3,…].(1)由图1可知,变量y与t具有很强的线性相关关系,求y关于t的经验回归方程,并预测2021年该地区农村居民人均消费支出;2016~2020年该地区农村居民人均消费支出图1(2)在国际上,常用恩格尔系数(其含义是指食品类支出总额占个人消费支出总额的比重)来衡量一个国家和地区人民生活水平的状况.根据联合国粮农组织的标准:恩格尔系数在40%~50%为小康,30%~40%为富裕.已知2020年该地区农村居民平均消费支出构成如图2所示,预测2021年该地区农村居民食品类支出比2020年增长3%,从恩格尔系数判断2021年底该地区农村居民生活水平能否达到富裕生活标准.2020年该地区农村居民人均消费支出构成图2参考公式:经验回归方程y ^=b ^x+a ^中斜率和截距的最小二乘估计分别为:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2=∑i=1nx i y i -nx y∑i=1nx i 2-nx 2,a ^=y −b ^x .4.(2021·山东潍坊一模)在对人体的脂肪含量和年龄之间的关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据(x i ,y i )(i=1,2,…,20,25<x i <65),其中x i 表示年龄,y i 表示脂肪含量,并计算得到∑i=120x i 2=48 280,∑i=120y i 2=15 480,∑i=120x i y i =27 220,x =48,y =27,√22≈4.7.(1)请用样本相关系数说明该组数据中y 与x 之间的关系可用线性回归模型进行拟合,并求y 关于x的经验回归方程y ^=a ^+b ^x (a ^,b ^的计算结果保留两位小数);(2)科学健身能降低人体脂肪含量,下表是甲、乙两款健身器材的使用年限(整年)统计表:某健身机构准备购进其中一款健身器材,以使用年限的频率估计概率,请根据以上数据估计,该机构选择购买哪一款健身器材,才能使用更长久?参考公式:样本相关系数r=∑i=1n(x i -x)(y i -y)√∑i=1n (x i -x)2√∑i=1n(y i -y)2=∑i=1nx i y i -nx y√∑i=1nx i 2-nx 2√∑i=1ny i 2-ny 2;对于一组具有线性相关关系的数据(x i ,y i )(i=1,2,…,n ),其经验回归直线y ^=b ^x+a ^的斜率和截距的最小二乘估计分别为:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2,a ^=y −b ^x .答案及解析1.解 (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y =1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30, s 2=1100[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6, s=√0.029 6=0.02×√74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17. 2.解 (1)由表中数据易知:x =1+2+3+44=52,y =125+105+100+904=105,则b ^=∑i=14x i y i -4x y∑i=14x i 2-4x2=995−1 05030−25=-11,a ^=y −b ^ x =105-(-11)×52=132.5,故所求经验回归方程为y ^=-11x+132.5.令x=10,则y ^=-11×10+132.5=22.5≈23(人),预测该路口10月份不“礼让行人”的驾驶员大约人数为23. (2)零假设为H 0:“礼让行人”行为与驾龄无关.由表中数据可得χ2=50×(10×12−20×8)218×32×30×20≈0.23<2.706=x 0.10,依据小概率值α=0.10的独立性检验,没有充分证据推断H 0不成立,可以认为H 0成立,即认为“礼让行人”行为与驾龄无关.3.解 (1)由已知数据可求t =1+2+3+4+55=3, y =1.01+1.10+1.21+1.33+1.405=1.21,∑i=15t i 2=12+22+32+42+52=55,∑i=15t i y i =1×1.01+2×1.10+3×1.21+4×1.33+5×1.40=19.16,b ^=19.16−5×3×1.2155−5×32=1.0110=0.101,a ^=1.21-0.101×3=0.907,所求经验回归方程为y ^=0.101t+0.907. 当t=6时,y ^=0.101×6+0.907=1.513(万元),故2021年该地区农村居民人均消费支出约为1.513万元.(2)已知2021年该地区农村居民平均消费支出1.513万元,由图2可知,2020年该地区农村居民食品类支出为4 451元,则预测2021年该地区食品类支出为4 451×(1+3%)=4 584.53元,恩格尔系数=4 584.5315 130×100%≈30.3%∈(30%,40%),所以,2021年底该地区农村居民生活水平能达到富裕生活标准.4.解 (1)x 2=2 304,y2=729,∑i=120x i y i -20x y =1 300,∑i=120x i 2-20x 2=2 200,∑i=1ny i 2-20y 2=900,r=∑i=120x i y i -20x y√∑i=120x i 2-20x 2√∑i=1ny i 2-20y2≈0.92,因为y 与x 的样本相关系数接近1,所以y 与x 之间具有较强的线性相关关系,可用线性回归模型进行拟合.由题可得,b ^=∑i=120(x i -x)(y i -y)∑i=120(x i -x)2=∑i=120x i y i -20x y∑i=120x i 2-20x2=1322≈0.591,a ^=y −b ^ x =27-0.591×48≈-1.37,所以y ^=0.59x-1.37.(2)以频率估计概率,设甲款健身器材使用年限为X (单位:年).E (X )=5×0.1+6×0.4+7×0.3+8×0.2=6.6. 设乙款健身器材使用年限为Y (单位:年).E (Y )=5×0.3+6×0.4+7×0.2+8×0.1=6.1.因为E (X )>E (Y ),所以该健身机构购买甲款健身器材更划算.。
高考数学2024概率与统计历年题目全集概率与统计是高中数学中一门重要的学科,也是高考数学考试的一部分。
在概率与统计中,我们需要通过概率的计算和统计的方法来分析和解决实际问题。
为了帮助同学们复习和准备高考数学考试,本文整理了高考数学2024概率与统计历年题目全集,希望能对同学们有所帮助。
1. 单项选择题1) 已知概率为P(A) = 0.2,P(B) = 0.4,事件A、B相互独立,求P(A并B)的值。
2) 一次抛掷一硬币,设正面向上的概率为p,反面向上的概率为q。
连续抛掷3次硬币,求正面朝上的次数不超过2次的概率。
3) 某音乐社有男生40人,女生60人。
从中随机抽取一人,求抽到女生的概率。
2. 典型案例题1) 某超市中购买了100个某品牌产品,其中有5个是次品。
现从中不放回地连续抽取3个产品,求至少有一个次品的概率。
2) 某餐厅的饭菜有4个主食和6个副食。
现从中选择2个饭菜,求至少有一个主食的概率。
3. 解答题1) 设事件A与事件B相互独立,且P(A) = 0.3,P(B) = 0.5。
求下列事件的概率:a) P(A并B)b) P(A或B)c) P(A的对立事件)2) 设P(A) = 0.4,P(B) = 0.3,P(A并B) = 0.1,求下列事件的概率:a) P(A的对立事件)b) P(B的对立事件)c) P(A或B)3) 有一批产品,其中20%是次品。
现从中不放回地连续抽取3个产品,求以下事件的概率:a) 已抽出的3个产品都是次品;b) 至少有一个次品。
(提示:利用组合数学中的排列、组合知识进行计算)本文仅列举了一部分高考数学2024概率与统计历年题目,希望能给同学们提供一些复习和备考的参考。
在备考过程中,同学们还需结合教材和课堂上的知识,多进行习题训练和模拟考试,提高解题能力和应试技巧。
祝同学们取得优异的高考成绩!。
专题检测(十二) 统计、统计案例一、选择题1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( )A.73B.78C.77D.762.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A.中位数B.平均数C.方差D.极差3.(2019·广东六校第一次联考)某单位为了落实“绿水青山就是金山银山”理念,制定节能减排的目标,先调查了用电量y (单位:kW ·h)与气温x (单位:℃)之间的关系,随机选取了4天的用电量与当天气温,并制作了如下对照表:x (单位:℃) 17 14 10 -1 y (单位:kW ·h)243438a由表中数据得线性回归方程:y ^=-2x +60,则a 的值为( ) A.48 B.62 C.64D.684.如图是民航部门统计的2019年春运期间十二个城市售出的往返机票的平均价格以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述不正确的是( )A.深圳的变化幅度最小,北京的平均价格最高B.深圳和厦门的春运期间往返机票价格同去年相比有所下降C.平均价格从高到低居于前三位的城市为北京、深圳、广州D.平均价格的涨幅从高到低居于前三位的城市为天津、西安、厦门5.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{a n},若a3=8,且a1,a3,a7成等比数列,则此样本的平均数和中位数分别是()A.13,12B.13,13C.12,13D.13,146.(2019·成都市第二次诊断性检测)为比较甲、乙两名篮球运动员的近期竞技状态,选取这两名球员最近五场比赛的得分,制成如图所示的茎叶图.有下列结论:①甲最近五场比赛得分的中位数高于乙最近五场比赛得分的中位数;②甲最近五场比赛得分的平均数低于乙最近五场比赛得分的平均数;③从最近五场比赛的得分看,乙比甲更稳定;④从最近五场比赛的得分看,甲比乙更稳定.其中所有正确结论的编号为()A.①③B.①④C.②③D.②④二、填空题7.(2019·全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.8.(2019·安徽五校联盟第二次质检)数据a1,a2,a3,…,a n的方差为σ2,则数据2a1,2a2,2a3,…,2a n的方差为________.9.某新闻媒体为了了解观众对央视《开门大吉》节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:总计60 50 110试根据样本估计总体的思想,估计在犯错误的概率不超过________的前提下(约有________的把握)认为“喜爱该节目与否和性别有关”.参考附表:P (K 2≥k 0)0.050 0.010 0.001 k 03.8416.63510.828⎝ ⎛⎭⎪⎫参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d 三、解答题10.(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C 为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P (C )的估计值为0.70.(1)求乙离子残留百分比直方图中a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).11.某市教育学院从参加市级高中数学竞赛的考生中随机抽取60名学生,将其竞赛成绩(均为整数)分成六段:[40,50),[50,60),[60,70),…,[90,100],得到如图所示的频率分布直方图.(1)根据频率分布直方图,估计参加高中数学竞赛的考生的成绩的平均数、众数、中位数(小数点后保留一位有效数字);(2)用分层抽样的方法在各分数段的考生中抽取一个容量为20的样本,则各分数段抽取的人数分别是多少?12.(2019·沈阳市质量监测(一))某篮球运动员的投篮命中率为50%,他想提高自己的投篮水平,制定了一个夏季训练计划,为了了解训练效果,执行训练前,他统计了10场比赛的得分,计算出得分的中位数为15,平均得分为15,得分的方差为46.3.执行训练后也统计了10场比赛的得分,茎叶图如图所示:(1)请计算该篮球运动员执行训练后统计的10场比赛得分的中位数、平均得分与方差.(2)如果仅从执行训练前后统计的各10场比赛得分数据分析,你认为训练计划对该运动员的投篮水平的提高是否有帮助?为什么?参考答案1.解析:选B 样本的分段间隔为8016=5,所以13号在第三组,则最大的编号为13+(16-3)×5=78.故选B.2.解析:选A 中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.3.解析:选C 由题意,得x =17+14+10-14=10,y =24+34+38+a 4=96+a4.样本点的中心(x ,y )在回归直线y ^=-2x +60上,代入线性回归方程可得96+a 4=-20+60,解得a=64,故选C.4.解析:选D 由图可知深圳对应的小黑点最接近0%,故变化幅度最小,北京对应的条形图最高,则北京的平均价格最高,故A 正确;由图可知深圳和厦门对应的小黑点在0%以下,故深圳和厦门的价格同去年相比有所下降,故B 正确;由图可知条形图由高到低居于前三位的城市为北京、深圳和广州,故C 正确;由图可知平均价格的涨幅由高到低分别为天津、西安和南京,故D 错误,选D.5.解析:选B 设等差数列{a n }的公差为d (d ≠0),a 3=8,a 1a 7=a 23=64,(8-2d )(8+4d )=64,即2d -d 2=0,又d ≠0,故d =2,故样本数据为:4,6,8,10,12,14,16,18,20,22,平均数为(4+22)×510=13,中位数为12+142=13.6.解析:选C 对于①,甲得分的中位数为29,乙得分的中位数为30,错误; 对于②,甲得分的平均数为15×(25+28+29+31+32)=29,乙得分的平均数为15×(28+29+30+31+32)=30,正确;对于③,甲得分的方差为15×[(25-29)2+(28-29)2+(29-29)2+(31-29)2+(32-29)2]=15×(16+1+0+4+9)=6, 乙得分的方差为15×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=15×(4+1+0+1+4)=2,所以乙比甲更稳定,③正确,④错误.所以正确结论的编号为②③.7.解析:x =10×0.97+20×0.98+10×0.9910+20+10=0.98.则经停该站高铁列车所有车次的平均正点率的估计值为0.98. 答案:0.988.解析:设a 1,a 2,a 3,…,a n 的平均数为a ,则2a 1,2a 2,2a 3,…,2a n 的平均数为2a ,σ2=(a 1-a )2+(a 2-a )2+(a 3-a )2+…+(a n -a )2n.则2a 1,2a 2,2a 3,…,2a n 的方差为(2a 1-2a )2+(2a 2-2a )2+(2a 3-2a )2+…+(2a n -2a )2n =4×(a 1-a )2+(a 2-a )2+(a 3-a )2+…+(a n -a )2n =4σ2.答案:4σ29.解析:分析列联表中数据,可得K 2的观测值k =110×(40×30-20×20)260×50×60×50≈7.822>6.635,所以在犯错误的概率不超过0.01的前提下(有99%的把握)认为“喜爱该节目与否和性别有关”.答案:0.01 99%10.解析:(1)由已知得0.70=a +0.20+0.15,故a =0.35. b =1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05, 乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00. 11.解析:(1)由频率分布直方图可知,(0.010+0.015+0.015+a +0.025+0.005)×10=1,所以a =0.03. 所以参加高中数学竞赛的考生的成绩的平均数为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71, 成绩的众数为75.设参加高中数学竞赛的考生的成绩的中位数为x , 则0.1+0.15+0.15+(x -70)×0.03=0.5,解得x ≈73.3, 所以中位数为73.3.(2)因为各层人数分别为6,9,9,18,15,3,各层抽取比例为2060=13,所以各分数段抽取人数依次为2,3,3,6,5,1. 12.解析:(1)训练后得分的中位数为14+152=14.5;平均得分为8+9+12+14+14+15+16+18+21+2310=15;方差为110[(8-15)2+(9-15)2+(12-15)2+(14-15)2+(14-15)2+(15-15)2+(16-15)2+(18-15)2+(21-15)2+(23-15)2]=20.6.(2)尽管中位数训练后比训练前稍小,但平均得分一样,训练后方差20.6小于训练前方差46.3,说明训练后得分稳定性提高了(阐述观点合理即可),这是投篮水平提高的表现.故此训练计划对该篮球运动员的投篮水平的提高有帮助.。
1.春节前夕,质检部门检查一箱装有2 500件包装食品的质量,抽查总量的2%,在这个问题中,下列说法正确的是( )A .总体是指这箱2 500件包装食品B .个体是一件包装食品C .样本是按2%抽取的50件包装食品D .样本容量是50 答案 D解析 总体、个体、样本的考查对象是同一事,不同的是考查的范围不同,在本题中,总体、个体是指食品的质量,而样本容量是样本中个体的包含个数.故答案为D.2.在可行域内任取一点,其规则如流程图所示,则能输出数对(x ,y )的概率是( )A.π8B.π4C.π6D.π2 答案 B解析 依题意可行域为正方形AOCD ,输出数对(x ,y )形成的图形为图中阴影部分,故所求概率为:P =14π⎝⎛⎭⎫22222·22=π4.3.已知随机变量ξ服从正态分布N (2,σ2),且P (ξ<4)=0.8,则P (0<ξ<2)等于( ) A .0.6 B .0.4 C .0.3 D .0.2 答案 C解析 ∵P (ξ<4)=0.8, ∴P (ξ>4)=0.2,由题意知图象的对称轴为直线x =2, P (ξ<0)=P (ξ>4)=0.2,∴P (0<ξ<4)=1-P (ξ<0)-P (ξ>4)=0.6. ∴P (0<ξ<2)=12P (0<ξ<4)=0.3.4.节日前夕,小李在家门前的树上挂了两串彩灯,这两串彩灯的第一次闪亮相互独立,且都在通电后的4秒内任一时刻等可能发生,然后每串彩灯以4秒为间隔闪亮,那么这两串彩灯同时通电后,它们第一次闪亮的时刻相差不超过2秒的概率是( ) A.14 B.12 C.34 D.78 答案 C 解析设在通电后的4秒钟内,甲串彩灯、乙串彩灯第一次亮的时刻为x 、y ,x 、y 相互独立,由题意可知⎩⎪⎨⎪⎧0≤x ≤4,0≤y ≤4,|x -y |≤2,如图所示.所以两串彩灯第一次亮的时间相差不超过2秒的概率为P (|x -y |≤2)=S 正方形-2S △ABC S 正方形=4×4-2×12×2×24×4=1216=34.5.为了从甲、乙两名运动员中选拔一人参加某次运动会跳水项目,对甲、乙两名运动员进行培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取6次,得到茎叶图如图所示.从平均成绩及发挥稳定性的角度考虑,你认为选派________(填甲或乙)运动员合适.答案 甲解析 根据茎叶图,可得x 甲=16×(78+79+81+84+93+95)=85,x 乙=16×(75+80+83+85+92+95)=85.s 2甲=16×[(78-85)2+(79-85)2+(81-85)2+(84-85)2+(93-85)2+(95-85)2]=1333, s 2乙=16×[(75-85)2+(80-85)2+(83-85)2+(85-85)2+(92-85)2+(95-85)2]=1393. 因为x 甲=x 乙,s 2甲<s 2乙,所以甲运动员的成绩比较稳定,选派甲运动员参赛比较合适.题型一 古典概型与几何概型例1 (1)(2015·陕西)设复数z =(x -1)+y i(x ,y ∈R ),若|z |≤1,则y ≥x 的概率为( ) A.34+12π B.14-12π C.12-1π D.12+1π答案 B解析 由|z |≤1可得(x -1)2+y 2≤1,表示以(1,0)为圆心,半径为1的圆及其内部,满足y ≥x 的部分为如图阴影所示,由几何概型概率公式可得所求概率为:P =14π×12-12×12π×12=π4-12π=14-12π.(2)有9张卡片分别写着数字1,2,3,4,5,6,7,8,9,甲、乙二人依次从中抽取一张卡片(不放回),试求: ①甲抽到写有奇数数字卡片,且乙抽到写有偶数数字卡片的概率; ②甲、乙二人至少抽到一张写有奇数数字卡片的概率.解 ①甲、乙二人依次从9张卡片中抽取一张的可能结果有C 19·C 18,甲抽到写有奇数数字卡片,且乙抽到写有偶数数字卡片的结果有C 15·C 14种,设“甲抽到写有奇数数字卡片,且乙抽到写有偶数数字卡片”的概率为P 1,则P 1=C 15·C 14C 19·C 18=2072=518.②方法一 甲、乙二人至少抽到一张写有奇数数字卡片的事件包含下面的三个事件:“甲抽到写有奇数数字的卡片,乙抽到写有偶数数字的卡片”有C 15·C 14种; “甲抽到写有偶数数字卡片,且乙抽到写有奇数数字卡片”有C 14·C 15种; “甲、乙二人均抽到写有奇数数字卡片”有C 15·C 14种. 设甲、乙二人至少抽到一张写有奇数数字卡片的概率为P 2,则P 2=C 15·C 14+C 14·C 15+C 15·C 14C 19C 18=6072=56. 方法二 甲、乙二人至少抽到一张奇数数字卡片的对立事件为两人均抽到写有偶数数字卡片,设为P 2,则P 2=1-P 2=1-C 14C 13C 19C 18=56.思维升华 几何概型与古典概型的本质区别在于试验结果的无限性,几何概型经常涉及的几何度量有长度、面积、体积等,解决几何概型的关键是找准几何测度;古典概型是命题的重点,对于较复杂的基本事件空间,列举时要按照一定的规律进行,做到不重不漏.(1)为了丰富学生的课余生活,促进校园文化建设,我校高二年级通过预赛选出了6个班(含甲、乙)进行经典美文诵读比赛决赛.决赛通过随机抽签方式决定出场顺序.求: ①甲、乙两班恰好在前两位出场的概率;②决赛中甲、乙两班之间的班级数记为X ,求X 的分布列和均值. 解 ①设“甲、乙两班恰好在前两位出场”为事件A ,则P (A )=A 22×A 44A 66=115.所以甲、乙两班恰好在前两位出场的概率为115.②随机变量X 的可能取值为0,1,2,3,4.P (X =0)=A 22×A 55A 66=13,P (X =1)=4×A 22×A 44A 66=415,P (X =2)=A 24×A 22×A 33A 66=15, P (X =3)=A 34×A 22×A 22A 66=215,P (X =4)=A 44×A 22A 66=115. 随机变量X 的分布列为X 0 1 2 3 4 P1341515215115因此,E (X )=0×13+1×415+2×15+3×215+4×115=43.(2)已知关于x 的二次函数f (x )=ax 2-4bx +1.设点(a ,b )是区域⎩⎪⎨⎪⎧x +y -8≤0,x >0,y >0内的一点,求函数y =f (x )在区间[1,+∞)上是增函数的概率.解 ∵函数f (x )=ax 2-4bx +1的图象的对称轴为直线x =2ba ,要使f (x )=ax 2-4bx +1在区间[1,+∞)上为增函数, 当且仅当a >0且2ba≤1,即2b ≤a .依条件可知事件的全部结果所构成的区域为 ⎩⎨⎧⎭⎬⎫(a ,b )⎪⎪⎪⎩⎪⎨⎪⎧ a +b -8≤0,a >0,b >0,构成所求事件的区域为三角形部分. 所求概率区间应满足2b ≤a .由⎩⎪⎨⎪⎧a +b -8=0,b =a 2,得交点坐标为(163,83),故所求事件的概率为P =12×8×8312×8×8=13.题型二 求离散型随机变量的均值与方差例2 (2015·四川)某市A ,B 两所中学的学生组队参加辩论赛,A 中学推荐了3名男生、2名女生,B 中学推荐了3名男生、4名女生,两校所推荐的学生一起参加集训.由于集训后队员水平相当,从参加集训的男生中随机抽取3人、女生中随机抽取3人组成代表队. (1)求A 中学至少有1名学生入选代表队的概率;(2)某场比赛前,从代表队的6名队员中随机抽取4人参赛,设X 表示参赛的男生人数,求X 的分布列和均值.解 (1)由题意,参加集训的男、女生各有6名,参赛学生全从B 中学抽取(等价于A 中学没有学生入选代表队)的概率为C 33C 34C 36C 36=1100,因此,A 中学至少有1名学生入选代表队的概率为 1-1100=99100. (2)根据题意,X 的可能取值为1,2,3,P (X =1)=C 13C 33C 46=15,P (X =2)=C 23C 23C 46=35,P (X =3)=C 33C 13C 46=15,所以X 的分布列为X 1 2 3 P153515因此,X 的均值为E (X )=1×P (X =1)+2×P (X =2)+3×P (X =3) =1×15+2×35+3×15=2.思维升华 离散型随机变量的均值和方差的求解,一般分两步:一是定型,即先判断随机变量的分布是特殊类型,还是一般类型,如二点分布、二项分布、超几何分布等属于特殊类型;二是定性,对于特殊类型的均值和方差可以直接代入相应公式求解,而对于一般类型的随机变量,应先求其分布列然后代入相应公式计算,注意离散型随机变量的取值与概率间的对应.受轿车在保修期内维修费等因素的影响,企业生产每辆轿车的利润与该轿车首次出现故障的时间有关.某轿车制造厂生产甲、乙两种品牌轿车,保修期均为2年.现从该厂已售出的两种品牌轿车中各随机抽取50辆,统计数据如下:品牌甲 乙 首次出现故障时间x (年)0<x ≤1 1<x ≤2 x >2 0<x ≤2 x >2 轿车数量(辆) 2 3 45 5 45 每辆利润(万元)1231.82.9将频率视为概率,解答下列问题:(1)从该厂生产的甲品牌轿车中随机抽取一辆,求其首次出现故障发生在保修期内的概率;(2)若该厂生产的轿车均能售出,记生产一辆甲品牌轿车的利润为X 1,生产一辆乙品牌轿车的利润为X 2,分别求X 1,X 2的分布列;(3)该厂预计今后这两种品牌轿车销量相当,由于资金限制,只能生产其中一种品牌的轿车.若从经济效益的角度考虑,你认为应生产哪种品牌的轿车?说明理由.解 (1)设“甲品牌轿车首次出现故障发生在保修期内”为事件A ,则P (A )=2+350=110.(2)依题意得,X 1的分布列为X 1 1 2 3 P125350910X 2的分布列为X 2 1.8 2.9 P110910(3)由(2)得E (X 1)=1×125+2×350+3×910=14350=2.86(万元), E (X 2)=1.8×110+2.9×910=2.79(万元).因为E (X 1)>E (X 2),所以应生产甲品牌轿车. 题型三 概率与统计的综合应用例3 经销商经销某种农产品,在一个销售季度内,每售出1 t 该产品获利润500元,未售出的产品,每1 t 亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130 t 该农产品.以X (单位: t,100≤X ≤150)表示下一个销售季度内的市场需求量,T (单位:元)表示下一个销售季度内经销该农产品的利润.(1)将T 表示为X 的函数;(2)根据直方图估计利润T 不少于57 000元的概率;(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若需求量X ∈[100,110),则取X =105,且X =105的概率等于需求量落入[100,110)的频率),求T 的均值. 解 (1)当X ∈[100,130)时,T =500X -300(130-X )=800X -39 000. 当X ∈[130,150]时,T =500×130=65 000.所以T =⎩⎪⎨⎪⎧800X -39 000,100≤X <130,65 000,130≤X ≤150.(2)由(1)知利润T 不少于57 000元当且仅当120≤X ≤150.由直方图知需求量X ∈[120,150]的频率为0.7,所以下一个销售季度内的利润T 不少于57 000元的概率的估计值为0.7.(3)依题意可得T 的分布列为T 45 000 53 000 61 000 65 000 P0.10.20.30.4所以E (T )=45 000×0.1+思维升华 概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X 表示.甲组 乙组 9 9 0 X 8 9 111(1)如果X =8,求乙组同学植树棵数的平均数和方差;(2)如果X =9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵树Y 的分布列和均值. (注:方差s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)解 (1)当X =8时,由茎叶图可知,乙组同学的植树棵数是8,8,9,10,所以平均数x =8+8+9+104=354; 方差s 2=14[(8-354)2+(8-354)2+(9-354)2+(10-354)2]=1116. (2)当X =9时,由茎叶图可知,甲组同学的植树棵数是9,9,11,11;乙组同学的植树棵数是9,8,9,10.分别从甲、乙两组中随机选取一名同学,共有4×4=16(种)可能的结果,这两名同学植树总棵数Y 的可能取值为17,18,19,20,21.事件“Y =17”等价于“甲组选出的同学植树9棵,乙组选出的同学植树8棵”,所以该事件有2种可能的结果,因此P (Y =17)=216=18.同理可得P (Y =18)=14,P (Y =19)=14,P (Y =20)=14,P (Y =21)=18.所以随机变量Y 的分布列为Y 17 18 19 20 21 P1814141418E (Y )=17×18+18×14+19×14+20×14+21×18=19.题型四 概率与统计案例的综合应用例4 电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,并据此资料是否可以认为“体育迷”与性别有关?(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X .若每次抽取的结果是相互独立的,求X 的分布列、均值E (X )和方差D (X ). 附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),解 (1)由所给的频率分布直方图知,“体育迷”人数为100×(10×0.020+10×0.005)=25, “非体育迷”人数为75,从而2×2列联表如下:将2×2列联表的数据代入公式计算: χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=100×(30×10-45×15)245×55×75×25=10033≈3.030. 因为2.706<3.030<3.841,所以有90%的把握认为“体育迷”与性别有关.(2)由频率分布直方图知,抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为14.由题意,X ~B ⎝⎛⎭⎫3,14,从而X 的分布列为E (X )=np =3×14=34,D (X )=np (1-p )=3×14×34=916.思维升华 统计以考查抽样方法、样本的频率分布、样本特征数的计算为主,概率以考查概率计算为主,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来,只有这样才能有效地解决问题.为了解大学生观看湖南卫视综艺节目“快乐大本营”是否与性别有关,一所大学心理学教师从该校学生中随机抽取了50人进行问卷调查,得到了如下的列联表:喜欢看“快乐大本营”不喜欢看“快乐大本营”合计 女生 5 男生 10 合计50若该教师采用分层抽样的方法从50份问卷调查中继续抽查了10份进行重点分析,知道其中喜欢看“快乐大本营”的有6人.(1)请将上面的列联表补充完整;(2)是否有99.5%的把握认为喜欢看“快乐大本营”节目与性别有关?说明你的理由;(3)已知喜欢看“快乐大本营”的10位男生中,A 1,A 2,A 3,A 4,A 5还喜欢看新闻,B 1,B 2,B 3还喜欢看动画片,C 1,C 2还喜欢看韩剧,现再从喜欢看新闻、动画片和韩剧的男生中各选出1名进行其他方面的调查,求B 1和C 1不全被选中的概率. 下面的临界值表供参考:P (χ2≥k 0)0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828(参考公式:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d )解 (1)由分层抽样知识知,喜欢看“快乐大本营”的同学有50×610=30人,故不喜欢看“快乐大本营”的同学有50-30=20人,于是可将列联表补充如下:喜欢看“快乐大本营”不喜欢看“快乐大本营”合计 女生 20 5 25 男生 10 15 25 合计302050(2)∵χ2=50×(20×15-10×5)230×20×25×25≈8.333>7.879,∴有99.5%的把握认为喜欢看“快乐大本营”节目与性别有关.(3)从喜欢看“快乐大本营”的10位男生中选出喜欢看韩剧、喜欢看新闻、喜欢看动画片的各1名,其一切可能的结果组成的基本事件共有N =5×3×2=30个,用M 表示“B 1,C 1不全被选中”这一事件,则其对立事件M 表示“B 1,C 1全被选中”这一事件,由于M 由(A 1,B 1,C 1),(A 2,B 1,C 1),(A 3,B 1,C 1),(A 4,B 1,C 1),(A 5,B 1,C 1)5个基本事件组成,所以P (M )=530=16.由对立事件的概率公式得 P (M )=1-P (M )=1-16=56.(时间:80分钟)1.某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.1 7 92 0 1 5 3(1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?(3)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率. 解 (1)样本平均值为17+19+20+21+25+306=1326=22.(2)由(1)知样本中优秀工人占的比例为26=13,故推断该车间12名工人中有12×13=4名优秀工人.(3)设事件A :“从该车间12名工人中,任取2人,恰有1名优秀工人”,则P (A )=C 14C 18C 212=1633.2.在10件产品中,有3件一等品,4件二等品,3件三等品.从这10件产品中任取3件,求: (1)取出的3件产品中一等品件数X 的分布列和均值; (2)取出的3件产品中一等品件数多于二等品件数的概率.解 (1)由于从10件产品中任取3件的结果数为C 310,从10件产品中任取3件,其中恰有k 件一等品的结果数为C k 3C 3-k7(k =0,1,2,3),那么从10件产品中任取3件,其中恰有k 件一等品的概率为P (X =k )=C k 3C 3-k7C 310,k =0,1,2,3.所以随机变量X 的分布列是X 的均值E (X )=0×724+1×2140+2×740+3×1120=910.(2)设“取出的3件产品中一等品件数多于二等品件数”为事件A ,“恰好取出1件一等品和2件三等品”为事件A 1,“恰好取出2件一等品”为事件A 2,“恰好取出3件一等品”为事件A 3,由于事件A 1,A 2,A 3彼此互斥,且A =A 1∪A 2∪A 3,而P (A 1)=C 13C 23C 310=340.P (A 2)=P (X =2)=740.P (A 3)=P (X =3)=1120,所以取出的3件产品中一等品件数多于二等品件数的概率为P (A )=P (A 1)+P (A 2)+P (A 3)=340+740+1120=31120.3.一个均匀的正四面体的四个面上分别涂有1,2,3,4四个数字,现随机投掷两次,正四面体面朝下的数字分别为b ,c .(1)z =(b -3)2+(c -3)2,求z =4的概率;(2)若方程x 2-bx -c =0至少有一根x ∈{1,2,3,4},就称该方程为“漂亮方程”,求方程为“漂亮方程”的概率.解 (1)因为是投掷两次,因此基本事件(b ,c ):(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1),(4,2),(4,3),(4,4)共16个. 当z =4时,(b ,c )的所有取值为(1,3),(3,1), 所以P (z =4)=216=18.(2)①若方程一根为x =1,则1-b -c =0, 即b +c =1,不成立.②若方程一根为x =2,则4-2b -c =0,即2b +c =4,所以⎩⎪⎨⎪⎧ b =1,c =2.③若方程一根为x =3,则9-3b -c =0,即3b +c =9,所以⎩⎪⎨⎪⎧b =2,c =3.④若方程一根为x =4,则16-4b -c =0,即4b +c =16,所以⎩⎪⎨⎪⎧b =3,c =4.由①②③④知(b ,c )的所有可能取值为(1,2),(2,3),(3,4),所以方程为“漂亮方程”的概率为P =316.4.某食品厂为了检查一条自动包装流水线的生产情况,随机抽取该流水线上40件产品作为样本称出它们的重量(单位:克),重量的分组区间为(490,495],(495,500],…,(510,515],由此得到样本的频率分布直方图,如图所示.(1)根据频率分布直方图,求重量超过505克的产品数量;(2)在上述抽取的40件产品中任取2件,设Y 为重量超过505克的产品数量,求Y 的分布列; (3)从该流水线上任取2件产品,设X 为重量超过505克的产品数量,求X 的分布列.解 (1)根据频率分布直方图可知,重量超过505克的产品数量为[(0.01+0.05)×5]×40=12(件). (2)依题意,Y 的可能取值为0,1,2. P (Y =0)=C 228C 240=63130,P (Y =1)=C 128C 112C 240=2865,P (Y =2)=C 212C 240=11130,∴Y 的分布列为Y 0 1 2 P63130286511130(3)利用样本估计总体,该流水线上产品重量超过505克的概率为0.3, 令X 为任取的2件产品中重量超过505克的产品数量, 则X ~B (2,0.3), ∴X 的分布列为X 0 1 2 P0.490.420.095.如图所示,一圆形靶分成A ,B ,C 三部分,其面积之比为1∶1∶2.某同学向该靶投掷3枚飞镖,每次1枚.假设他每次投掷必定会中靶,且投中靶内各点是随机的.(1)求该同学在一次投掷中投中A 区域的概率;(2)设X 表示该同学在3次投掷中投中A 区域的次数,求X 的分布列;(3)若该同学投中A ,B ,C 三个区域分别可得3分,2分,1分,求他投掷3次恰好得4分的概率. 解 (1)设该同学在一次投掷中投中A 区域的概率为P (A ),依题意得P (A )=14.(2)依题意知,X ~B (3,14),从而X 的分布列为(3)设B i 表示事件“第i 次击中目标时,击中B 区域”,C i 表示事件“第i 次击中目标时,击中C 区域”,i =1,2,3.依题意知P =P (B 1C 2C 3)+P (C 1B 2C 3)+P (C 1C 2B 3)=3×14×12×12=316.6.一次考试共有12道选择题,每道选择题都有4个选项,其中有且只有一个是正确的.评分标准规定:“每题只选一个选项,答对得5分,不答或答错得零分”.某考生已确定有8道题的答案是正确的,其余题中:有两道题都可判断两个选项是错误的,有一道题可以判断一个选项是错误的,还有一道题因不理解题意只好乱猜.请求出该考生: (1)得60分的概率;(2)所得分数X 的分布列和均值.解 (1)设“可判断两个选项是错误的”两道题之一选对为事件A ,“有一道题可以判断一个选项是错误的”选对为事件B ,“有一道题不理解题意”选对为事件C , ∴P (A )=12,P (B )=13,P (C )=14,∴得60分的概率为P =12×12×13×14=148.(2)X 可能的取值为40,45,50,55,60. P (X =40)=12×12×23×34=18;P (X =45)=C 12×12×12×23×34+12×12×13×34+12×12×23×14=1748; P (X =50)=12×12×23×34+C 12×12×12×13×34+C 12×12×12×23×14+12×12×13×14=1748; P (X =55)=C 12×12×12×13×14+12×12×23×14+12×12×13×34=748; P (X =60)=12×12×13×14=148.X 的分布列为E (X )=40×18+45×1748+50×1748+55×748+60×148=57512.。
19. 某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表:
年份 2007 2008 2009 2010 2011 2012 2013 年份代号t 1 2 3 4 5 6 7 人均纯收入y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(Ⅰ)求y 关于t 的线性回归方程;
(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘法估计公式分别为:
()()
()
1
2
1
n
i
i
i n
i i t t y y b t t ∧
==--=
-∑∑,ˆˆa
y bt =- 19.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
性别
是否需要志愿者
男 女
需要 40 30 不需要
160
270
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.
附:
P (K 2≥k )
0.050 0.010 0.001 k
3.841
6.635
10.828
K 2
=n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )。