2021高三数学北师大版(文)一轮教师用书:第11章 第4节 概率与统计、统计案例的综合问题
- 格式:pdf
- 大小:656.65 KB
- 文档页数:17
一、知识梳理1.统计图表(1)频率分布直方图的画法步骤1求极差(即一组数据中最大值与最小值的差);2决定组距与组数;3将数据分组;4列频率分布表;5画频率分布直方图.(2)频率分布折线图1频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(3)茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列;第三步:将各个数据的叶依次写在其茎的两侧.2.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把错误!称为a1,a2,…,a n这n个数的平均数.(4)标准差与方差:设一组数据x1,x2,x3,…,x n的平均数为错误!,则这组数据的标准差和方差分别是s=错误!s2=错误![(x1—错误!)2+(x2—错误!)2+…+(x n—错误!)2]常用结论1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示错误!,频率=组距×错误!.(2)在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.2.平均数、方差的公式推广(1)若数据x1,x2,…,x n的平均数为错误!,那么mx1+a,mx2+a,mx3+a,…,mx n+a 的平均数是m错误!+a.(2)数据x1,x2,…,x n的方差为s2.1数据x1+a,x2+a,…,x n+a的方差也为s2;2数据ax1,ax2,…,ax n的方差为a2s2.二、教材衍化1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为()A.4B.8C.12D.16解析:选B.设频数为n,则错误!=0.25,所以n=32×错误!=8.2.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5B.91.5和92C.91和91.5D.92和92解析:选A.因为这组数据由小到大排列为87,89,90,91,92,93,94,96,所以中位数是错误!=91.5,平均数错误!=错误!=91.5.3.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民数有________人.解析:由频率分布直方图可知,月均用水量为[2,2.5)范围内的居民所占频率为0.5×0.5=0.25,所以月均用水量为[2,2.5)范围内的居民数为100×0.25=25.答案:254.甲、乙两台机床同时生产一种零件,10天中,两台机床每天出的次品数分别是:甲0 10 220 3124乙23110 2110 1则机床性能较好的为________.解析:因为错误!甲=1.5,错误!乙=1.2,s错误!=1.65,s错误!=0.76,所以s错误!<s 错误!,所以乙机床性能较好.答案:乙一、思考辨析判断正误(正确的打“√”,错误的打“×”)(1)一组数据的方差越大,说明这组数据的波动越大.()(2)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.()(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.()(4)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.()(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.()答案:(1)√(2)√(3)×(4)√(5)√二、易错纠偏错误!错误!(1)平均数与方差的性质理解出错;(2)中位数、众数、平均数的求法不清导致出错.1.若数据x1,x2,x3,…,x n的平均数错误!=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3x n+1的平均数和方差分别为()A.5,2B.16,2C.16,18 D.16,9解析:选C.因为x1,x2,x3,…,x n的平均数为5,所以错误!=5,所以错误!+1=3×5+1=16,因为x1,x2,x3,…,x n的方差为2,所以3x1+1,3x2+1,3x3+1,…,3x n+1的方差是32×2=18.故选C.2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m,众数为n,平均数为错误!,则m,n,错误!的大小关系为________.(用“<”连接)解析:由题图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m=5.5;又5出现次数最多,故n=5;错误!=错误!(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97.故n<m<错误!.答案:n<m<错误!茎叶图(自主练透)1.如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5B.5,5C.3,7 D.5,7解析:选A.根据两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等,所以错误!=错误!,解得x=3.故选A.2.(2020·陕西渭南模拟)已知甲,乙两名篮球运动员进行罚球训练,每人练习10组,每组罚球40个,每组投中个数的茎叶图如图所示,则下列结论错误的是()A.甲投中个数的极差是29B.乙投中个数的众数是21C.甲的投中率比乙高D.甲投中个数的中位数是25解析:选D.由茎叶图可知甲投中个数的极差为37—8=29,故A正确;易知乙投中个数的众数是21,故B正确;甲的投中率为错误!=0.535,乙的投中率为错误!=0.4225,所以甲的投中率比乙高,C正确;甲投中个数的中位数为错误!=23,D不正确,故选D.3.某学生在一门功课的22次考试中,所得分数的茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为()A.117 B.118C.118.5D.119.5解析:选B.22次考试中,所得分数最高的为98,最低的为56,所以极差为98—56=42,将分数从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为42+76=118.错误!茎叶图中的三个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.(2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.频率分布直方图(多维探究)角度一求样本的频率、频数(2020·湖南五市十校联考)在某次赛车中,50名参赛选手的成绩(单位:min)全部介于13到18之间(包括13和18),将比赛成绩分为五组:第一组[13,14),第二组[14,15),…,第五组[17,18].其频率分布直方图如图所示,若成绩在[13,15)内的选手可获奖,则这50名选手中获奖的人数为()A.39 B.35C.15D.11【解析】由频率分布直方图知成绩在[15,18]内的频率为(0.38+0.32+0.08)×1=0.78.所以成绩在[13,15)内的频率为1—0.78=0.22.则成绩在[13,15)内的选手有50×0.22=11(人),即这50名选手中获奖的人数为11,故选D.【答案】D角度二求样本的数字特征(2019·高考全国卷Ⅲ改编)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【解】(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1—0.05—0.15—0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.角度三与概率结合的问题(2020·安徽芜湖一模)某社区为了解该社区退休老人每天的平均户外活动时间,从该社区退休老人中随机抽取了100位老人进行调查,获得了每人每天的平均户外活动时间(单位:时),活动时间按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成样本的频率分布直方图如图所示.(1)求图中a的值;(2)估计该社区退休老人每人每天的平均户外活动时间的中位数;(3)在[1,1.5),[1.5,2)这两组中采用分层抽样的方法抽取7人,再从这7人中随机抽取2人,求抽取的2人恰好在同一个组的概率.【解】(1)由频率分布直方图,可知平均户外活动时间在[0,0.5)内的频率为0.08×0.5=0.04.同理,平均户外活动时间在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)内的频率分别为0.08,0.20,0.25,0.07,0.04,0.02,由1—(0.04+0.08+0.20+0.25+0.07+0.04+0.02)=0.5a+0.5a,解得a=0.30.(2)设中位数为m时.因为前5组的频率之和为0.04+0.08+0.15+0.20+0.25=0.72>0.5,而前4组的频率之和为0.04+0.08+0.15+0.20=0.47<0.5,所以2≤m<2.5.所以0.50×(m—2)=0.5—0.47,解得m=2.06.故可估计该社区退休老人每人每天的平均户外活动时间的中位数为2.06时.(3)由题意得平均户外活动时间在[1,1.5),[1.5,2)内的人数分别为15,20.按分层抽样的方法在[1,1.5),[1.5,2)内分别抽取3人,4人,从7人中随机抽取2人,共有C错误!=21种方法,抽取的两人恰好都在同一个组有C错误!+C错误!=9种方法,故抽取的2人恰好在同一个组的概率P=错误!=错误!.错误!频率、频数、样本容量的计算方法错误!=频率,错误!=样本容量,样本容量×频率=频数.[提醒] 制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确.1.在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是()A.15B.18C.20 D.25解析:选A.根据频率分布直方图,得第二小组的频率是0.04×10=0.4,因为频数是40,所以样本容量是错误!=100,又成绩在80~100分的频率是(0.01+0.005)×10=0.15,所以成绩在80~100分的学生人数是100×0.15=15.故选A.2.(2020·安徽淮南二模)某乡镇为了打赢脱贫攻坚战,决定盘活贫困村的各项经济发展要素,实施了产业、创业、就业“三业并举”工程.在实施过程中,引导某贫困村农户因地制宜开展种植某经济作物.该类经济作物的质量以其质量指标值来衡量,质量指标值越大表明质量越好,记其质量指标值为k,其质量指标的等级划分如表:质量指标值k产品等级k≥90优秀80≤k<90良好75≤k<80合格k<75不合格品种的各10 000件产品,测量了每件产品的质量指标值,得到下面产品质量指标值频率分布直方图(图甲和图乙).(1)若将频率视为概率,从乙品种产品中有放回地随机抽取3件,记“抽出乙品种产品中至少有1件优等品(质量指标值k≥80为优等品)”为事件A,求事件A发生的概率P(A);(结果保留小数点后3位)(2)若甲、乙两个品种的销售利润率y与质量指标值k满足下表:质量指标值k k≥9080≤k<9075≤k<80k<75销售利润率y3t5t2t2—t其中错误!<t<解:(1)设“从乙品种产品中抽取1件为优等品”的概率为P,则根据频率分布直方图可得P=(0.03+0.08+0.04+0.02)×5=0.85,则P(A)=1—C错误!(1—P)3=1—0.153≈0.997.(2)由频率分布直方图可得,甲品种产品的利润率的分布列为y3t5t2t2P0.20.70.1Ey甲=0.2×3t+0.7×5t2+22;乙品种产品的利润率的分布列为y3t5t2t2—tP0.30.550.10.05Ey乙=0.3×3t+0.55×5t2+0.1×t2+0.05×(—t)=2.85t2+0.85t.Ey甲—E(y)乙=3.6t2+0.6t—(2.85t2+0.85t)=0.75t2—0.25t=0.25t(3t—1),由于错误!<t<错误!,所以Ey甲—Ey乙<0,即Ey甲<Ey乙.故种植乙品种的平均利润率较大.样本数字特征的求解与应用(师生共研)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892(2)甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图:1分别求出两人得分的平均数与方差;2根据图和上面算得的结果,对两人的训练成绩作出评价.【解】(1)错误!甲=错误!(87+91+90+89+93)=90,错误!乙=错误!(89+90+91+88+92)=90,s错误!=错误![(87—90)2+(91—90)2+(90—90)2+(89—90)2+(93—90)2]=4,s错误!=错误![(89—90)2+(90—90)2+(91—90)2+(88—90)2+(92—90)2]=2.故填2.(2)1由题图可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.错误!甲=错误!=13;错误!乙=错误!=13,s错误!=错误![(10—13)2+(13—13)2+()2+(14—13)2+(16—13)2]=4;s错误!=错误![(13—13)2+(14—13)2+()2+()2+(14—13)2]=0.8.2由s错误!>s错误!,可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.错误!(1)众数、中位数、平均数及方差的意义1平均数与方差都是重要的数字特征,是对总体的一种简明地描述;2平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)在计算平均数、方差时可利用平均数、方差的有关结论.1.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差解析:选C.错误!甲=错误!(4+5+6+7+8)=6,错误!乙=错误!(5×3+6+9)=6,甲的成绩的方差为错误!(22×2+12×2)=2,乙的成绩的方差为错误!(12×3+32×1)=2.4.甲的成绩的中位数为6,乙的成绩的中位数为5,甲的成绩的极差为4,乙的成绩的极差为4,故选C.2.(2020·贵阳市监测考试)在某校科普知识竞赛前的模拟测试中,得到甲、乙两名学生的6次模拟测试成绩(百分制)的茎叶图(如图).若从甲、乙两名学生中选择一人参加该知识竞赛,你会选哪位?请运用统计学的知识说明理由.解:学生甲的平均成绩错误!甲=错误!=82,学生乙的平均成绩错误!乙=错误!=82,又s错误!=错误!×[(68—82)2+(76—82)2+(79—82)2+(86—82)2+(88—82)2+(95—82)2]=77,s错误!=错误!×[(71—82)2+(75—82)2+(82—82)2+(84—82)2+(86—82)2+(94—82)2]=错误!,则错误!甲=错误!乙,s错误!>s错误!,说明甲、乙的平均水平一样,但乙的方差小,即乙发挥更稳定,故可选择学生乙参加知识竞赛.[基础题组练]1.(2019·高考全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分,7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差解析:选A.记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e 为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.2.(2020·陕西商洛质检)在一次53.5千米的自行车个人赛中,25名参赛选手成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为1~25号,再用系统抽样的方法从中选取5人,已知选手甲的成绩性为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A.95B.96C.97 D.98解析:选C.由系统抽样法及已知条件可知被选中的其他4人的成绩分别是88,94,99,107,故平均数为错误!=97,故选C.3.(2020·广东珠海摸底)某班级在一次数学竞赛中设置了一等奖、二等奖、三等奖以及参与奖,各个奖品的单价分别为一等奖20元,二等奖10元,三等奖5元,参与奖2元,获奖人数的分配情况如图所示,则以下说法不正确的是()A.获得参与奖的人数最多B.各个奖项中三等奖的总费用最高C.购买奖品的平均费用为9.25元D.购买奖品的费用的中位数为2元解析:选C.设全班人数为a.由扇形统计图可知.一等奖占5%,二等奖占10%,三等奖占30%,参与奖占55%,获得参与奖的人数最多,故A正确;一等奖的总费用为5%a×20=a.二等奖的总费用为10%a×10=a,三等奖的总费用为30%a×5=错误!a,参与奖的总费用为55%a×2=错误!a,所以各个奖项中三等奖的总费用最高,故B正确;购买奖品的平均费用为5%×20+10%×10+30%×5+55%×2=4.6(元),故C错误;参与奖占55%,所以购买奖品的费用的中位数为2元,故D 正确.故选C.4.(2020·安徽六安毛坦厂中学月考)某位教师的家庭总收入为80 000元,各种用途占比统计如下面的折线图.收入的各种用途占比统计如下面的条形图,已知的就医费用比增加了4750元,则该教师的家庭总收入为()A.100 000元B.95000元C.90 000元D.85000元解析:选D.由已知得,2017年的就医费用为80 000×10%=8 000(元).故的就医费用为8 000+4750=12750(元),所以该教师的家庭总收入为错误!=85000(元).故选D.5.甲、乙两名同学6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为错误!甲,错误!乙,标准差分别为σ甲,σ乙,则()A.错误!甲<错误!乙,σ甲<σ乙B.错误!甲<错误!乙,σ甲>σ乙C.错误!甲>错误!乙,σ甲<σ乙D.错误!甲>错误!乙,σ甲>σ乙解析:选C.由题图可知,甲同学除第二次考试成绩略低于乙同学外,其他考试成绩都远高于乙同学,可知错误!甲>错误!乙,题图中数据显示甲同学的成绩比乙同学稳定,故σ甲<σ乙.6.某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则n—m的值是________.解析:由甲组学生成绩的平均数是88,可得错误!=88,解得m=3.由乙组学生成绩的中位数是89,可得n=9,所以n—m=6.答案:67.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________、________.解析:由题图甲可知学生总人数是10 000,样本容量为10 000×2%=200,抽取的高中生人数是2000×2%=40,由题图乙可知高中生的近视率为50%,所以抽取的高中生的近视人数为40×50%=20.答案:200 208.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是________.解析:设被抽查的美术生的人数为n,因为后2个小组的频率之和为(0.037 5+0.0125)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n=错误!=60.答案:609.我国是世界上严重缺水的国家,城市缺水问题较为突出.某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准x(吨),月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解全市居民用水量的分布情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求频率分布直方图中a的值;(2)已知该市有80万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.解:(1)由频率分布直方图,可得(0.08+0.16+a+0.40+0.52+a+0.12+0.08+0.04)×0.5=1,解得a=0.30.(2)由频率分布直方图知,100位居民每人月均用水量不低于3吨的频率为(0.12+0.08+0.04)×0.5=0.12.由以上样本频率分布,可以估计全市80万居民中月均用水量不低于3吨的人数为800 000×0.12=96 000.(3)因为前6组的频率之和为(0.08+0.16+0.30+0.40+0.52+0.30)×0.5=0.88>0.85,前5组的频率之和为(0.08+0.16+0.30+0.40+0.52)×0.5=0.73<0.85,所以2.5≤x<3.由0.3×(x—2.5)=0.85—0.73,解得x=2.9.因此,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.10.有A,B,C,D,E五位工人参加技能竞赛培训.现分别从A,B二人在培训期间参加的若干次预赛成绩中随机抽取8次.用茎叶图表示这两组数据:(1)A,B二人预赛成绩的中位数分别是多少?(2)现要从A,B中选派一人参加技能竞赛,从平均状况和方差的角度考虑,你认为派哪位工人参加合适?请说明理由;(3)若从参加培训的5位工人中选2人参加技能竞赛,求A,B二人中至少有一人参加技能竞赛的概率.解:(1)A的中位数是错误!=84,B的中位数是错误!=83.(2)派B参加比较合适.理由如下:错误!B=错误!(78+79+81+82+84+88+93+95)=85,错误!A=错误!(75+80+80+83+85+90+92+95)=85,s错误!=错误![(78—85)2+(79—85)2+(81—85)2+(82—85)2+(84—85)2+(88—85)2+(93—85)2+(95—85)2]=35.5,s错误!=错误![(75—85)2+(80—85)2+(80—85)2+(83—85)2+(85—85)2+(90—85)2+(92—85)2+(95—85)2]=41,因为错误!A=错误!B,但s错误!<s错误!,说明B稳定,派B参加比较合适.(3)5位工人中选2人有10种:(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),(C,D),(C,E),(D,E);A,B都不参加的有3种:(C,D),(C,E),(D,E),A,B二人中至少有一人参加技能竞赛的概率P=1—错误!=错误!.[综合题组练]1.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据环保部门某日早6点至晚9点在A县、B县两个地区附近的PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,A县、B县两个地区浓度的方差较小的是()A.A县B.B县C.A县、B县两个地区相等D.无法确定解析:选A.根据茎叶图中的数据可知,A县的数据都集中在0.05和0.08之间,数据分布比较稳定,而B县的数据分布比较分散,不如A县数据集中,所以A县的方差较小.2.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x—y|的值为()A.1B.2C.3D.4解析:选D.由题意知这组数据的平均数为10,方差为2,可得:x+y=20,(x—10)2+(y—10)2=8,设x=10+t,y=10—t,由(x—10)2+(y—10)2=8,得t2=4,所以|x—y|=2|t|=4.3.设样本数据x1,x2,…,x2017的方差是4,若y i=2x i—1(i=1,2,…,2017),则y,y2,…,y2017的方差为________.1解析:设样本数据的平均数为错误!,则y i=2x i—1的平均数为2错误!—1,则y1,y2,…,y20的方差为错误![(2x1—1—2错误!+1)2+(2x2—1—2错误!+1)2+…+(2x2017—117—2错误!+1)2]=4×错误![(x1—错误!)2+(x2—错误!)2+…+(x2017—错误!)2]=4×4=16.答案:164.我市某高中从高三年级甲、乙两个班中各选出7名学生参加全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a,b满足a,G,b成等差数列且x,G,y成等比数列,则错误!+错误!的最小值为________.解析:由甲班学生成绩的中位数是81,可知81为甲班7名学生的成绩按从小到大的顺序排列的第4个数,故x=1.由乙班学生成绩的平均数为86,可得(—10)+(—6)+(—4)+(y—6)+5+7+10=0,解得y=4.由x,G,y成等比数列,可得G2=xy=4,由正实数a,b满足a,G,b 成等差数列,可得G=2,a+b=2G=4,所以错误!+错误!=(错误!+错误!)×(错误!+错误!)=错误!(1+错误!+错误!+4)≥错误!×(5+4)=错误!(当且仅当b=2a时取等号).故错误!+错误!的最小值为错误!.答案:错误!5.(2020·东北三省三校二模)一个经销鲜花产品的微店,为保障售出的百合花品质,每天从某省鲜花基地空运固定数量的百合花,如有剩余则免费分赠给第二天购花顾客,如果不足,则从本地鲜花供应商处进货.今年四月前10天,微店百合花的售价为每支2元,某省空运来的百合花每支进价1.6元,本地供应商处的百合花每支进价1.8元,微店这10天的订单中百合花的日需求量(单位:支)依次为:251,255,231,243,263,241,265,255,244,252.(1)求今年四月前10天订单中百合花日需求量的平均数和众数,并完成频率分布直方图;(2)预计四月的后20天,订单中百合花日需求量的频率分布与四月前10天相同,百合花进货价格与售价均不变,请根据(1)中频率分布直方图判断(同一组中的需求量数据用该组区间的中点值作代表,位于各区间的频率代替位于该区间的概率),微店每天从某省固定空运250支,还是255支百合花,四月后20天百合花销售总利润会更大?解:(1)四月前10天订单中百合需求量众数为255,平均数错误!=错误!×(231+241+243+244+251+252+255+255+263+265)=250.频率分布直方图如图:(2)设订单中百合花的日需求量为a(支),由(1)中频率分布直方图知,a可能取值为235,245,255,265,相应频率分别为0.1,0.3,0.4,0.2.所以20天中a=235,245,255,265相应的天数为2天,6天,8天,4天.1若空运250支,a=235,当日利润为235×2—250×1.6=70(元),a=245,当日利润为245×2—250×1.6=90(元),a=255,当日利润为255×2—250×1.6—5×1.8=101(元),a=265,当日利润为265×2—250×1.6—15×1.8=103(元),20天总利润为70×2+90×6+101×8+103×4=1900(元).2若空运255支,a=235,当日利润为235×2—255×1.6=62(元),a=245,当日利润为245×2—255×1.6=82(元),a=255,当日利润为255×2—255×1.6=102(元),a=265,当日利润为265×2—255×1.6—10×1.8=104(元),20天总利润为62×2+82×6+102×8+104×4=1848(元).因为1900>1848,所以每天空运250支百合花,四月后20天总利润更大.6.某高三毕业班甲、乙两名同学在连续的8次数学周练中,统计解答题失分的茎叶图如图:(1)比较这两名同学8次周练解答题失分的平均数和方差的大小,并判断哪位同学做解答题相对稳定些;(2)以上述数据统计甲、乙两名同学失分超过15分的频率作为概率,假设甲、乙两名同学在同一次周练中失分多少互不影响,预测在接下来的2次周练中,甲、乙两名同学失分均超过15分的次数X的分布列和均值.解:(1)错误!甲=错误!(7+9+11+13+13+16+23+28)=15,错误!乙=错误!(7+8+10+15+17+19+21+23)=15,s错误!=错误![(—8)2+(—6)2+(—4)2+(—2)2+(—2)2+12+82+132]=44.75,s错误!=错误![(—8)2+(—7)2+(—5)2+02+22+42+62+82]=32.25.甲、乙两名同学解答题失分的平均数相等;甲同学解答题失分的方差比乙同学解答题失分的方差大.所以乙同学做解答题相对稳定些.(2)根据统计结果,在一次周练中,甲和乙失分超过15分的概率分别为P1=错误!,P2=错误!,两人失分均超过15分的概率为P1P2=错误!,X的所有可能取值为0,1,2.依题意,X~B错误!,P(X=k)=C错误!错误!错误!错误!错误!,k=0,1,2,则X的分布列为X012P错误!错误!错误!X的均值EX=2×错误!。
§11.2互斥事件有一个发生的概率【知识概要】1.互斥事件:若事件A 与B 不可能同时发生,则事件A 与B 为互斥事件。
AB φ=2.对立事件:其中必有一个发生的互斥事件叫对立事件。
事件A 的对立事件记作A ,A A φ=,A A U =(U 为全集);3.互斥事件与对立事件的区别与联系,两个事件对立是这两个事件互斥的充分不必要条件; 4.互斥事件的加法公式:()()()P A B P A P B +=+;()()1P A P A +=;()1()P A P A =-; 【基础训练】1.从装有2个红球和2个白球的的口袋内任了两个球,那么下列事件中互斥的个数是(C ) ①至少有1个红球,都是白球;②至少有一个白球,至少有一个红球; ③恰有1个白球,恰有两个白球;④至少有一个白球;都是红球; A .0 B .1 C .2 D .3 2.甲、乙两人下棋,甲不输的概率是0.8,两人下成和棋的概率是0.5,则甲胜的概率为(A ) A .0.3 B .0.8 C .0.5 D .0.43.某班委会由4名男生与3名女生组成,现从中选出2人担任正、副班长,其中至少有1名女生当选的概率是574.若10把钥匙中只有2把能打开某锁,则从中任取2把能将锁打开的概率为1745【典型例题】例1.袋中有大小相同的5个白球和3个黑球,从中任意摸出4个,求下列事件发生的概率(1)摸出2个或3个白球;(2)至少摸出一个黑球;解(1)22315353448837C C C C P C C =+=(2)45481114C P C =-= 例2.袋中有9个编号分别为1,2,…,9的小球,从中随机地取出2个,求至少有一个球的编号为奇数的概率。
解:记“从9个球中任取2个,其中恰有一个编号是奇数”为事件A ,“恰有两个球的编号是奇数”为事件B ,则1154295()9C C P A C ==,25295()18C P B C ==则555()()()9186P A B P A P B +=+=+=例3.有4位同学,每人买一X 彩票,求至少有两位同学彩票的末位数字相同的概率。
第四讲二项分布及其应用、正态分布1.[2020浙江温州九校第一次联考]抽奖箱中有15个除颜色外完全一样的球(2个红色,3个黄色,其余为白色),抽到红球为一等奖,抽到黄球为二等奖,抽到白球不中奖.有90人依次进行有放回的抽奖,则这90人中中奖人数的期望值和方差分别是()A.6,0.4B.18,14.4C.30,10D.30,202.[2015 新课标全国Ⅰ]投篮测试中,每人投3次,至少投中2次才能通过测试.已知某同学每次投篮投中的概率为0.6,且各次投篮是否投中相互独立,则该同学通过测试的概率为()A.0.648B.0.432C.0.36D.0.3123.[2018全国卷Ⅲ]某群体中的每位成员使用移动支付的概率都为p,各成员的支付方式相互独立.设X为该群体的10位成员中使用移动支付的人数,D(X)=2.4,P(X=4)<P(X=6),则p=()A.0.7B.0.6C.0.4D.0.34.[2019吉林长春三模]若8件产品中包含6件一等品,从这8件产品中任取2件,则在已知取出的2件产品中有1件不是一等品的条件下,另1件是一等品的概率为()A.37B.45C.67D.12135.[新情境题]北京冬奥会将于2022年2月4日至2月20日在北京和张家口联合举行.甲、乙两人都想去现场观看比赛,若他们到车站买动车票,甲买票用微信支付的概率为0.4,乙买票用微信支付的概率为0.3,两人是否用微信支付互不影响,则两人中恰有一人用微信支付的概率为()A.0.46B.0.58C.0.7D.0.886.[多选题]江先生朝九晚五上班,上班通常乘坐公交加步行或乘坐地铁加步行.江先生从家到公交站或地铁站都要步行5分钟.公交车多且路程近一些,但乘坐公交路上经常拥堵,所需时间Z(单位:分)服从正态分布N(33,42),下车后从公交站步行到单位要12分钟;乘坐地铁畅通,但路线长且乘客多,所需时间Z(单位:分)服从正态分布N(44,22),下地铁后从地铁站步行到单位要5分钟.从统计的角度看,下列说法合理的是()参考数据:若Z~N(μ,σ2),则P(μ-σ<Z≤μ+σ)≈0.682 7,P(μ-2σ<Z≤μ+2σ)≈0.954 5,P(μ-3σ<Z≤μ+3σ)≈0.997 3.A.若8:00出门,则乘坐公交上班不会迟到B.若8:02出门,则乘坐地铁上班不迟到的可能性更大C.若8:06出门,则乘坐公交上班不迟到的可能性更大D.若8:12出门,则乘坐地铁上班几乎不可能不迟到7.[2020江西五校联考]非洲成员代表团团长及相关的人员参加了中非合作论坛北京峰会,会后某记者在场地外随机进行采访,假设第一次采访到的人恰好是参会的代表团团长的概率为0.7,连续两次采访到的人都是代表团团长的概率为0.6,则在第一次采访到的人是代表团团长的条件下,第二次采访到的也是代表团团长的概率为.8.[2017全国卷Ⅱ]一批产品的二等品率为0.02,从这批产品中每次随机取一件,有放回地抽取100次,X表示抽到的二等品件数,则D(X)=.9.[2020百校联考]若随机变量ξ服从正态分布N(9,16),则P( - 3<ξ≤13)=.参考数据:若ξ~N(μ,σ2),则P(μ - σ<ξ≤μ+σ)≈0.682 7,P(μ - 2σ<ξ≤μ+2σ)≈0.954 5,P(μ - 3σ<ξ≤μ+3σ)≈0.997 3.考法1 条件概率的计算1 [2020西安模拟]从1,2,3,4,5,6,7中取出两个不同的数,记事件A为“两个数之和为偶数”,事件B为“两个数均为偶数”,则P(B|A)=A.13B.17C.37D.12先用列举法求出事件A,事件B所包含的基本事件的个数,求得P(A),P(AB),再根据条件概率公式,即可得到结果.解法一从这七个数中取出两个不同的数,不同的结果共有C 72种.事件A为“两个数之和为偶数”,其包含的基本事件有{1,3},{1,5},{1,7},{3,5},{3,7},{5,7},{2,4},{2,6},{4,6},共9个,所以P(A)=9C72=37.(求出事件A发生的概率)由题意知,事件AB为“两个数均为偶数”,所以P(AB)=P(B).事件B为“两个数均为偶数”,其包含的基本事件有{2,4},{2,6},{4,6},共3个,所以P(AB)=P(B)=3C72=17.(求出事件A和事件B同时发生的概率)所以P(B|A)=P(AB)P(A)=13.解法二因为事件A为“两个数之和为偶数”,所以选取的两个数应都为偶数或都为奇数,事件A包含的基本事件有{1,3},{1,5},{1,7},{3,5},{3,7},{5,7},{2,4},{2,6},{4,6},共9个.事件B|A表示在事件A发生的前提下事件B发生,即“在两数之和为偶数的前提下,选取的两个数都为偶数”,事件B|A包含的基本事件有{2,4},{2,6},{4,6},共3个.(写出对应事件包含的基本事件)故P(B|A)=39=13.A1.已知100件产品中有95件合格品,5件不合格品,现从中不放回地取两次,每次任取一件,则在第一次取到不合格品后,第二次取到不合格品的概率为.考法2 相互独立事件的概率的求法2[2019全国卷Ⅰ]甲、乙两队进行篮球决赛,采取七场四胜制(当一队赢得四场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队以4∶1获胜的概率是.解法一因为甲队以4∶1获胜,所以第五场甲胜,而前四场甲需要胜三场输一场,则甲队的胜负情况可分为“胜胜胜负胜”“胜胜负胜胜”“胜负胜胜胜”“负胜胜胜胜”这4种.设事件A为“甲队以4∶1获胜”,A i表示第i场甲队获胜.又前五场的主客场安排为“主主客客主”,所以P(A1)=P(A2)=P(A5)=0.6,P(A3)=P(A4)=0.5,则P(A)=P(A1A2A3。
11.4统计探考情悟真题【考情探究】考点内容解读5年考情预测热度考题示例考向关联考点1.随机抽样①理解随机抽样的必要性和重要性②会用简单随机抽样方法从总体中抽取样本;了解分层抽样方法2015北京文,4分层抽样★☆☆2.统计图表会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,体会它们各自的特点2016北京文,17统计图表的理解与应用样本估计总体★★☆3.用样本估计总体①理解样本数据标准差的意义和作用,会计算数据标准差②能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释③会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想④会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题2018北京文,17方差古典概型的概率★★☆2017北京文,17用样本特征估计总体特征统计图表分析解读 1.掌握简单随机抽样、分层抽样等常用抽样方法,体会两种抽样方法的区别与联系及具体的操作步骤.2.会用样本的频率分布估计总体的分布,会用样本的数字特征估计总体的数字特征.3.样本数字特征及频率分布直方图为高考热点.有关统计内容及方法主要以选择题、填空题的形式呈现;抽样方法和各种统计图表与概率的有关内容相结合也会出现在解答题中.破考点练考向【考点集训】考点一随机抽样1.(2018课标Ⅲ文,14改编)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样和分层抽样,则比较合适的抽样方法是.答案分层抽样2.某校高三共有720人,其中男生480人,女生240人,现采用分层抽样的方法从中抽取90名学生进行问卷调查,则抽取男生的人数为.答案60考点二统计图表3.(2015陕西,2,5分)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93B.123C.137D.167答案C4.(2018江苏,3,5分)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为.8999011答案905.(2015湖北文,14,5分)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为.答案(1)3(2)6000考点三用样本估计总体6.(2018课标Ⅰ文,19,12分)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水.(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解析(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x1=1×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.50该家庭使用了节水龙头后50天日用水量的平均数为x2=1×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.50估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).7.(2019天津文,15,13分)2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取25人调查专项附加扣除的享受情况.(1)应从老、中、青员工中分别抽取多少人?(2)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为A,B,C,D,E,F.享受情况如下表,其中“○”表示享受,“×”表示不享受.现从这6人中随机抽取2人接受采访.(i)试用所给字母列举出所有可能的抽取结果;(ii)设M为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件M发生的概率.员工A B C D E F项目子女教育○○×○×○继续教育××○×○○大病医疗×××○××住房贷款利息○○××○○住房租金××○×××赡养老人○○×××○解析本题主要考查随机抽样、用列举法计算随机事件所含的基本事件数、古典概型及其概率计算公式等基本知识.考查运用概率知识解决简单实际问题的能力,体现了数学运算素养.(1)由已知,老、中、青员工人数之比为6∶9∶10,由于采用分层抽样的方法从中抽取25位员工,因此应从老、中、青员工中分别抽取6人,9人,10人.(2)(i)从已知的6人中随机抽取2人的所有可能结果为{A,B},{A,C},{A,D},{A,E},{A,F}, {B,C},{B,D},{B,E},{B,F},{C,D},{C,E},{C,F},{D,E},{D,F},{E,F},共15种.(ii)由表格知,符合题意的所有可能结果为{A,B},{A,D},{A,E},{A,F},{B,D},{B,E},{B,F},{C,E},{C,F},{D,F},{E,F},共11种.所以,事件M发生的概率P(M)=1115.思路分析(1)首先得出抽样比,从而按比例抽取各层的人数;(2)(i)利用列举法列出满足题意的基本事件;(ii)利用古典概型公式求概率.失分警示在列举基本事件时应找好标准,做到不重不漏.8.(2019北京昌平二模文,17)某学校为了解学生的体质健康状况,对高一、高二两个年级的学生进行体质健康测试.现从两个年级学生中各随机抽取20人,将他们的测试数据用茎叶图表示如下:《国家学生体质健康标准》的等级标准如下表.规定:测试数据≥60,体质健康为合格.等级优秀良好及格不及格测试数据[90,100][80,89][60,79][0,59](1)从该校高二年级学生中随机抽取一名学生,试估计这名学生体质健康合格的概率;(2)从两个年级等级为优秀的样本中各随机选取一名学生,求选取的两名学生的测试数据平均数大于95的概率;(3)设该校高一学生测试数据的平均数和方差分别为x1,s12,高二学生测试数据的平均数和方差分别为x2,s22,试比较x1与x2、s12与s22的大小.(只需写出结论)解析(1)高二年级学生样本中合格的学生数为3+4+4+4=15,样本中学生体质健康合格的频率为1520=3 4 ,所以从该校高二年级学生中随机抽取一名学生,估计这名学生体质健康合格的概率为34. (2)设等级为优秀的样本中高一年级测试数据是93,94,96的学生分别为a1,a2,a3,高二年级测试数据是90,95,98的学生分别为b1,b2,b3.选取的两名学生构成的基本事件空间为{(a1,b1),(a1,b2),(a1,b3),(a2,b1),(a2,b2),(a2,b3),(a3,b1),(a3,b2),(a3,b3)},总数为9,选取的测试数据平均数大于95的两名学生构成的基本事件空间为{(a1,b3),(a2,b3),(a3,b2),(a3,b3)},总数为4,所以从两个年级等级为优秀的样本中各随机选取一名学生,选取的两名学生的测试数据平均数大于95的概率为4.(3)x1>x2,s12<s22.9炼技法提能力【方法集训】方法1频率分布直方图的应用1.(2018北京昌平二模,17)为评估大气污染防治效果,调查区域空气质量状况,某调研机构从A,B两地区分别随机抽取了20天的观测数据,得到A,B两地区的空气质量指数(AQI),绘制如下频率分布直方图:A地区B地区根据空气质量指数,将空气质量状况分为以下三个等级:空气质量指数AQI(0,100)[100,200)[200,300)空气质量状况优良轻中度污染重度污染(1)试根据样本数据估计A地区当年(365天)的空气质量状况为“优良”的天数;(2)若分别在A、B两地区上述20天中,空气质量指数均不小于150的日子里随机各抽取一天,求抽到的日子里空气质量等级均为“重度污染”的概率.解析(1)从A地区抽取的20天中随机抽取一天,这一天空气质量状况为“优良”的频率为(0.008+0.007)×50=0.75,估计A地区当年(365天)的空气质量状况为“优良”的概率为0.75,则估计A地区当年(365天)的空气质量状况为“优良”的天数为365×0.75≈274.(2)A地区20天中空气质量指数在[150,200)内有20×0.003×50=3(天),设为a1,a2,a3,空气质量指数在[200,250)内有20×0.001×50=1(天),设为a4,B地区20天中空气质量指数在[150,200)内有20×0.002×50=2(天),设为b1,b2,空气质量指数在[200,250)内有20×0.003×50=3(天),设为b3,b4,b5.设“A,B两地区的空气质量等级均为‘重度污染’”为事件C,则基本事件空间Ω={a1b1,a1b2,a1b3,a1b4,a1b5,a2b1,a2b2,a2b3,a2b4,a2b5,a3b1,a3b2,a3b3,a3b4,a3b5,a 4b 1,a 4b 2,a 4b 3,a 4b 4,a 4b 5},共20个基本事件,C={a 4b 3,a 4b 4,a 4b 5},事件C 包含3个基本事件, 所以A,B 两地区在抽到的日子里空气质量等级均为“重度污染”的概率P(C)=320. 2.(2019北京东城期末,16)某中学有学生500人,学校为了解学生的课外阅读时间,从中随机抽取了50名学生,获得了他们某一个月课外阅读时间的数据(单位:小时),将数据分为5组:[10,12),[12,14),[14,16),[16,18),[18,20],整理得到如图所示的频率分布直方图.(1)求频率分布直方图中的x 的值;(2)试估计该校所有学生中,课外阅读时间不小于16小时的学生人数;(3)已知课外阅读时间在[10,12)的样本学生中有3名女生,现从课外阅读时间在[10,12)的样本学生中随机抽取3人,记X 为抽到女生的人数,求X 的分布列与数学期望E(X).解析 (1)由0.05×2+0.08×2+0.10×2+0.12×2+2x=1,可得x=0.15.(3分)(2)0.10×2+0.05×2=0.30,即课外阅读时间不小于16小时的学生样本的频率为0.30.500×0.30=150,所以可估计该校所有学生中,课外阅读时间不小于16小时的学生人数为150.(6分)(3)课外阅读时间在[10,12)的学生样本的频率为0.08×2=0.16,50×0.16=8,即课外阅读时间在[10,12)的学生样本人数为8,8名学生包含3名女生,5名男生,随机变量X 的所有可能取值为0,1,2,3,P(X=0)=C 30C 53C 83=528;P(X=1)=C 31C 52C 83=1528;P(X=2)=C 32C 51C 83=1556;P(X=3)=C 33C 50C 83=156. 所以X 的分布列为 X0 1 2 3 P528 1528 1556 156 故X 的期望E(X)=0×528+1×1528+2×1556+3×156=98.(13分) 方法2 样本的数字特征及其应用3.(2019课标全国Ⅲ,3,5分)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )A.0.5B.0.6C.0.7D.0.8答案C4.(2018北京丰台一模,18)某地区工会利用“健步行APP”开展健步走积分奖励活动.会员每天走5千步可获积分30分(不足5千步不积分),每多走2千步再积20分(不足2千步不积分).为了解会员的健步走情况,工会某天从系统中随机抽取了1000名会员,统计了当天他们的步数,并将样本数据分为[3,5),[5,7),[7,9),[9,11),[11,13),[13,15),[15,17),[17,19),[19,21]九组,整理得到频率分布直方图:(1)求当天这1000名会员中步数少于11千步的人数;(2)从当天步数在[11,13),[13,15),[15,17)的会员中按分层抽样的方式抽取6人,再从这6人中随机抽取2人,求这2人积分之和不少于200分的概率;(3)写出该组数据的中位数(只写出结果).解析(1)这1000名会员中健步走的步数在[3,5)内的人数为0.02×2×1000=40;健步走的步数在[5,7)内的人数为0.03×2×1000=60;健步走的步数在[7,9)内的人数为0.05×2×1000=100;健步走的步数在[9,11)内的人数为0.05×2×1000=100.40+60+100+100=300.所以这1000名会员中健步走的步数少于11千步的人数为300.(2)易知按分层抽样的方法,在[11,13)内应抽取3人,记为a1,a2,a3,每人的积分都是90分;在[13,15)内应抽取2人,记为b1,b2,每人的积分都是110分;在[15,17)内应抽取1人,记为c,积分是130分.从这6人中随机抽取2人,有a1a2,a1a3,a1b1,a1b2,a1c,a2a3,a2b1,a2b2,a2c,a3b1,a3b2,a3c,b1b2,b1c,b2c,共15种取法,所以从这6人中随机抽取2人,这2人的积分之和不少于200分的有a1b1,a1b2,a1c,a2b1,a2b2,a2c,a3b1,a3b2,a3c,b1b2,b1c,b2c,共12种取法.设从这6人中随机抽取2人,这2人的积分之和不少于200分为事件A,则P(A)=1215=4 5 ,即从这6人中随机抽取2人,这2人的积分之和不少于200分的概率为45.(3)中位数为373.思路分析(1)根据频率分布直方图中的数据得到健步走的步数在[3,5)内的人数为40,在[5,7)内的人数为60,在[7,9)内的人数为100,在[9,11)内的人数为100,共有300人;(2)根据分层抽样的概念得到在[11,13)内应抽取3人,每人的积分都是90分,在[13,15)内应抽取2人,每人的积分都是110分,在[15,17)内应抽取1人,积分是130分,再根据古典概型概率公式得到概率;(3)由中位数的概念以及直方图可求出结果.5.(2019北京怀柔一模,17)某大型企业为鼓励员工利用网络进行营销,准备为员工办理手机流量套餐.为了解员工手机流量的使用情况,通过抽样调查,得到了100位员工月平均使用流量L(单位:M)的数据,其频率分布直方图如图所示.(1)从该企业的员工中随机抽取3人,求这3人中至多有1人月平均使用流量不超过900M的概率;(2)据了解,某网络运营商推出两款流量套餐,详情如下:套餐名称月套餐费(单位:元)月套餐流量(单位:M)A20700B301000流量套餐的规则:每月1日收取套餐费.如果手机实际使用流量超出套餐流量,则需要购买流量叠加包,每一个叠加包(包含200M的流量)需要10元,可以多次购买,如果当月流量有剩余,将会被清零.该企业准备订购其中一款流量套餐,每月为员工支付套餐费,以及购买流量叠加包所需费用.若以所需费用的数学期望为决策依据,该企业订购哪一款套餐更经济?解析(1)由题意得100位员工月平均使用流量不超过900M的概率为1-(0.0002+0.0008)×100=0.9.设事件A为“3人中至多有1人月平均使用流量不超过900M”,则P(A)=C31×0.91×0.12+C30×0.90×0.13=0.028.(6分)(2)若该企业选择A套餐,设一个员工所需费用为X,则X可能为20,30,40,X的分布列为X203040P0.30.60.1E(X)=20×0.3+30×0.6+40×0.1=28.若该企业选择B套餐,设一个员工所需费用为Y,则Y可能为30,40,Y的分布列为Y3040P0.980.02E(Y)=30×0.98+40×0.02=30.2.E(X)<E(Y),所以该企业订购A套餐更经济.(13分)【五年高考】A组自主命题·北京卷题组1.(2015北京文,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()类别人数老年教师900中年教师1800青年教师1600合计4300A.90B.100C.180D.300答案C2.(2016北京文,17,13分)某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到频率分布直方图如图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.解析(1)由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,可得w至少定为3.(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:组号12345678分组[2,4](4,6](6,8](8,10](10,12](12,17](17,22](22,27]频率0.10.150.20.250.150.050.050.05该市居民该月的人均水费估计为4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).思路分析第(1)问,需要计算该市居民月用水量在各区间内的频率,根据样本的频率分布直方图即可获解.第(2)问,由月用水量的频率分布直方图和w=3可得居民该月用水费用的数据分组与频率分布表,由此可估计该市居民该月的人均水费.难点突破第(2)问本质上是考查加权平均数的概念,这个权重就是频率,所以结合第(1)问和加权平均数的概念,就可以算出人均水费.评析本题考查了频率分布直方图及用样本估计总体,属于中档题.B组统一命题、省(区、市)卷题组考点一随机抽样(2017江苏,3,5分)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.答案18考点二统计图表1.(2015重庆,4,5分)重庆市2013年各月的平均气温(℃)数据的茎叶图如下:0891258200338312则这组数据的中位数是()A.19B.20C.21.5D.23答案B2.(2017课标Ⅲ,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案A3.(2018课标Ⅰ,3,5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案A4.(2019课标全国Ⅲ理,17,12分)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解析本题主要考查频率分布直方图的含义,以及用频率分布直方图估计样本的数字特征,通过实际问题的应用考查学生的运算求解能力,考查了数学运算的核心素养,体现了应用意识.(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.方法总结由频率分布直方图估计样本的数字特征:(x i表示第i个小矩形底边中点的横坐标,S i表示第i个小矩形的面积)①平均数x=x1S1+x2S2+…+x i S i+…+x n S n;②方差s2=(x1-x)2S1+(x2-x)2S2+…+(x n-x)2S n;③中位数:从左到右(或从右到左)小矩形面积之和等于0.5时对应点的横坐标;④众数:最高小矩形底边中点的横坐标.5.(2016四川,16,12分)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.解析(1)由频率分布直方图,可知月均用水量在[0,0.5)内的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]内的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)由(1),知100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12,由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36000.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.思路分析(1)通过各组频率之和为1,求出a的值.(2)利用样本的频率来估计总体的数字特征.评析本题考查了样本数据的数字特征,以及利用样本的数字特征估计总体的数字特征,同时考查了学生的运算能力.考点三用样本估计总体1.(2019课标全国Ⅱ理,5,5分)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差答案A2.(2019课标全国Ⅱ,13,5分)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为.答案0.983.(2019江苏,5,5分)已知一组数据6,7,8,8,9,10,则该组数据的方差是.答案53C组教师专用题组1.(2014重庆文,3,5分)某中学有高中生3500人,初中生1500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100B.150C.200D.250答案A2.(2014广东,6,5分)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()图1图2A.200,20B.100,20C.200,10D.100,10答案A3.(2015课标Ⅱ,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案D4.(2014湖北,11,5分)甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为件.答案18005.(2014江苏,6,5分)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm.答案246.(2014广东文,17,13分)某车间20名工人年龄数据如下表:年龄(岁)工人数(人)191283293305314323401合计20(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.解析(1)由题表中的数据易知,这20名工人年龄的众数是30,极差为40-19=21.(2)这20名工人年龄的茎叶图如下:1 2 3 49888999000001111222 0(3)这20名工人年龄的平均数x=120×(19×1+28×3+29×3+30×5+31×4+32×3+40×1)=30,故方差s2=120×[1×(19-30)2+3×(28-30)2+3×(29-30)2+5×(30-30)2+4×(31-30)2+3×(32-30)2+1×(40-30)2]=120×(121+12+3+0+4+12+100)=12.6.7.(2014重庆,17,13分)20名学生某次数学考试成绩(单位:分)的频率分布直方图如下:(1)求频率分布直方图中a的值;(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;(3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率.解析(1)由(2a+3a+6a+7a+2a)×10=1,解得a=1200=0.005.(2)成绩落在[50,60)中的学生人数为2×0.005×10×20=2.成绩落在[60,70)中的学生人数为3×0.005×10×20=3.(3)记成绩落在[50,60)中的2人为A1,A2,成绩落在[60,70)中的3人为B1,B2,B3,则从成绩在[50,70)的学生中任选2人的基本事件共有10个:(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3),其中2人的成绩都在[60,70)中的基本事件有3个:(B1,B2),(B1,B3),(B2,B3),故所求概率为P=310.8.(2014广东,17,13分)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据上述数据得到样本的频率分布表如下:分组频数频率[25,30]30.12(30,35]50.20(35,40]80.32(40,45]n1f1(45,50]n2f2(1)确定样本频率分布表中n1,n2,f1和f2的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率.解析(1)n1=7,n2=2,f1=0.28,f2=0.08.(2)样本频率分布直方图如图所示.(3)根据样本频率分布直方图,得每人的日加工零件数落在区间(30,35]的概率为0.2,设所取的4人中,日加工零件数落在区间(30,35]的人数为ξ,则ξ~B(4,0.2),P(ξ≥1)=1-P(ξ=0)=1-(1-0.2)4=1-0.4096=0.5904,所以4人中,至少有1人的日加工零件数落在区间(30,35]的概率为0.5904.9.(2014福建,20,12分)根据世行2013年新标准,人均GDP低于1035美元为低收入国家;人均GDP为1035~4085美元为中等偏下收入国家;人均GDP为4085~12616美元为中等偏上收入国家;人均GDP不低于12616美元为高收入国家.某城市有5个行政区,各区人口占该城市人口比例及人均GDP如下表:行政区区人口占城市人口比例区人均GDP(单位:美元)A25%8000B30%4000C15%6000D10%3000E20%10000(1)判断该城市人均GDP是否达到中等偏上收入国家标准;(2)现从该城市5个行政区中随机抽取2个,求抽到的2个行政区人均GDP都达到中等偏上收入国家标准的概率.解析(1)设该城市人口总数为a,则该城市人均GDP为8 000×0.25a+4 000×0.30a+6 000×0.15a+3 000×0.10a+10 000×0.20aa。
[命题解读] 从近五年全国卷高考试题来看,在高考的解答题中,对概率与随机变量及其分布相结合的综合问题的考查既是热点又是重点,是高考必考的内容,并且常常与统计相结合,常常设计成包含概率计算、概率分布表、随机变量的数学期望与方差、统计图表的识别等知识为主的综合题.以考生比较熟悉的实际应用问题为载体,考查学生应用基础知识和基本方法分析问题和解决问题的能力.[典例示范] (本题满分12分)(2019·全国卷Ⅰ)为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得-1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得-1分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X.(1)求X的分布列①;(2)若甲药、乙药在试验开始时都赋予4分,p i(i=0,1,…,8)表示“甲药的累计得分为i时,最终认为甲药比乙药更有效”的概率,则p0=0,p8=1,p i=ap i-1+bp i+cp i+1(i=1,2,…,7),其中a=P(X=-1),b=P(X=0),c=P(X=1).假设α=0.5,β=0.8.(i)证明:{p i+1-p i}(i=0,1,2,…,7)为等比数列②;(ii)求p4,并根据p4的值解释这种试验方案的合理性.[信息提取] (1)看到①,想到概率模型及概率的求法;(2)看到②,想到递推关系的变形;看到求特定项,想到求通项公式.[规范解答] (1)X 的所有可能取值为-1,0,1.P (X =-1)=(1-α)β,P (X =0)=αβ+(1-α)(1-β),P (X =1)=α(1-β),3分所以X 的分布列为X -101P(1-α)βαβ+(1-α)(1-β)α(1-β)4分(2)①由(1)得a =0.4,b =0.5,c =0.1.因此p i =0.4p i -1+0.5p i +0.1p i +1,故0.1=0.4,(pi +1-pi )(pi -pi -1)即p i +1-p i =4.6分(pi -pi -1)又因为p 1-p 0=p 1≠0,所以(i =0,1,2,…,7)为公比为4,首项为p 1的等比数列.7分{pi +1-pi }②由①可得p 8=p 8-p 7+p 7-p 6+…+p 1-p 0+p 0=++…+=p 1.(p 8-p 7)(p 7-p 6)(p 1-p 0)48-13由于p 8=1,故p 1=,9分348-1所以p 4=+++=p 1=.(p 4-p 3)(p 3-p 2)(p 2-p 1)(p 1-p 0)44-13125710分p 4表示最终认为甲药更有效的概率,由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为p 4=≈0.003 9,此1257时得出错误结论的概率非常小,说明这种试验方案合理.12分[易错防范] 易错点防范措施忽视X的实际含义导致取值错误,进而导致概率计算错误细心审题,把握题干中的重要字眼,关键处加标记,同时理解X取每个值的含义对(2)的条件“p i=ap i-1+bp i+cp i+1”不理解,求不出a,b,c 结合(1)中的分布列及题设条件,推理求解便可不会证明:{p i+1-p i}(i=0,1,2,…,7)为等比数列.采用累加递推法求解.[通性通法] 随机变量分布列类问题的求解步骤:(1)定元:根据已知条件确定离散型随机变量的取值.(2)定性:明确每个随机变量取值所对应的事件.(3)定型:确定事件的概率模型和计算公式.(4)计算:计算随机变量取每一个值的概率.(5)列表:列出分布列.(6)求解:根据公式求期望.[规范特训] 某超市计划按月订购一种冰激凌,每天进货量相同,进货成本为每桶5元,售价为每桶7元,未售出的冰激凌以每桶3元的价格当天全部处理完毕,根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关,如果最高气温不低于25 ℃,需求量为600桶,如果最高气温(单位:℃)位于区间[20,25),需求量为400桶,如果最高气温低于20 ℃,需求量为200桶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温(℃)[10,15)[15,20)[20,25)[25,30)[30,35)[35,40]天数216362574以最高气温位于各区间的频率代替最高气温位于该区间的概率.(1)求六月份这种冰激凌一天的需求量X(单位:桶)的分布列;(2)设六月份一天销售这种冰激凌的利润为Y(单位:元),当六月份这种冰激凌一天的进货量n (单位:桶)为多少时,Y 的均值取得最大值?[解] (1)由已知得,X 的所有可能取值为200,400,600,记六月份最高气温低于20 ℃为事件A 1,最高气温(单位:℃)位于区间[20,25)为事件A 2,最高气温不低于25 ℃为事件A 3,根据题意,结合频数分布表,用频率估计概率,可知P (X =200)=P (A 1)==,P (X =400)=P (A 2)==,P (X =600)=P (A 3)189015369025==,369025故六月份这种冰激凌一天的需求量X (单位:桶)的分布列为X 200400600P152525(2)由题意得,当n ≤200时,EY =2n ≤400;当200<n ≤400时,EY =×[200×2+(n -200)×(-2)]15+×n ×2=n +160∈(400,640];4565当400<n ≤600时,EY =×[200×2+(n -200)×(-2)]+×[400×2+(n -400)×(-2)]1525+×n ×2=-n +800∈[560,640);2525当n >600时,EY =×[200×2+(n -200)×(-2)]+×[400×2+(n -400)×(-2)]1525+×[600×2+(n -600)×(-2)]=1 760-2n <560,25所以当n =400时,Y 的均值取得最大值640.。
第四节 概率与统计、统计案例的综合问题(对应学生用书第197页)⊙考点1 概率与统计的综合问题 破解概率与统计图表综合问题的“三步曲” 经过多年的努力,炎陵黄桃在国内乃至国际上逐渐打开了销路,成为炎陵部分农民脱贫致富的好产品.为了更好地销售,现从某村的黄桃树上随机摘下了100个黄桃进行测重,其质量分别在区间[200,500]内(单位:克),统计质量的数据作出其频率分布直方图如图所示:(1)按分层抽样的方法从质量落在[350,400),[400,450)的黄桃中随机抽取5个,再从这5个黄桃中随机抽2个,求这2个黄桃质量至少有一个不小于400克的概率;(2)以各组数据的中间数值代表这组数据的平均水平,以频率代表概率,已知该村的黄桃树上大约还有100 000个黄桃待出售,某电商提出两种收购方案:A.所有黄桃均以20元/千克收购;B.低于350克的黄桃以5元/个收购,高于或等于350克的以9元/个收购.请你通过计算为该村选择收益最好的方案.(参考数据:225×0.05+275×0.16+325×0.24+375×0.3+425×0.2+475×0.05=354.5)[解](1)由题得黄桃质量在[350,400)和[400,450)的比例为3∶2,∴应分别在质量为[350,400)和[400,450)的黄桃中各抽取3个和2个.记抽取质量在[350,400)的黄桃为A 1,A 2,A 3,质量在[400,450)的黄桃为B 1,B 2,则从这5个黄桃中随机抽取2个的情况共有以下10种:A 1A 2,A 1A 3,A 2A 3,A 1B 1,A 2B 1,A 3B 1,A 1B 2,A 2B 2,A 3B 2,B 1B 2.其中质量至少有一个不小于400克的有7种情况,故所求概率为.710(2)方案B 好,理由如下:由频率分布直方图可知,黄桃质量在[200,250)的频率为50×0.001=0.05,同理,黄桃质量在[250,300),[300,350),[350,400),[400,450),[450,500]的频率依次为0.16,0.24,0.3,0.2,0.05.若按方案B 收购:∵黄桃质量低于350克的个数为(0.05+0.16+0.24)×100 000=45 000个,黄桃质量不低于350克的个数为55 000个.∴收益为45 000×5+55 000×9=720 000元.若按方案A 收购:根据题意各段黄桃个数依次为5 000,16 000,24 000,30 000,20 000,5 000,于是总收益为(225×5 000+275×16 000+325×24 000+375×30 000+425×20 000+475×5 000)×20÷1 000=709 000(元).∴方案B 的收益比方案A 的收益高,应该选择方案B. 解答本例第(2)问时,方案A 需要算出黄桃的总质量,方案B 需要求出黄桃质量低于350克和不低于350克的个数.[教师备选例题] (2017·北京高考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.[解](1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4,所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5,所以总体中分数在区间[40,50)内的人数估计为400×=20.5100(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×=30,12所以样本中的男生人数为30×2=60,女生人数为100-60=40,所以样本中男生和女生人数的比例为60∶40=3∶2,所以根据分层抽样原理,估计总体中男生和女生人数的比例为3∶2. (2019·泰安模拟)2018年的政府工作报告强调,要树立绿水青山就是金山银山理念,以前所未有的决心和力度加强生态环境保护.某地科技园积极检查督导园区内企业的环保落实情况,并计划采取激励措施引导企业主动落实环保措施,下图给出的是甲、乙两企业2012年至2017年在环保方面投入金额(单位:万元)的柱状图.(1)分别求出甲、乙两企业这六年在环保方面投入金额的平均数;(结果保留整数)(2)园区管委会为尽快落实环保措施,计划对企业进行一定的奖励,提出了如下方案:若企业一年的环保投入金额不超过200万元,则该年不奖励;若企业一年的环保投入金额超过200万元,不超过300万元,则该年奖励20万元;若企业一年的环保投入金额超过300万元,则该年奖励50万元.①分别求出甲、乙两企业这六年获得的奖励之和;②现从甲企业这六年中任取两年对其环保情况作进一步调查,求这两年获得的奖励之和不低于70万元的概率.[解](1)由柱状图可知,甲企业这六年在环保方面的投入金额分别为150,290,350,400,300,400,其平均数为×(150+290+350+400+300+400)=315(万元);16乙企业这六年在环保方面的投入金额分别为100,200,300,230,500,300,其平均数为×(100+200+300+230+500+300)=≈272(万元),168153(2)①根据题意可知,企业每年所获得的环保奖励t (x )(单位:万元)是关于该年环保投入x (单位:万元)的分段函数,即t (x )=Error!所以甲企业这六年获得的奖励之和为:0+20+50+50+20+50=190(万元);乙企业这六年获得的奖励之和为:0+0+20+20+50+20=110(万元).②由①知甲企业这六年获得的奖励数如下表:年份2012年2013年2014年2015年2016年2017年奖励(单位:2050502050万元)奖励共分三个等级,其中奖励0万元的只有2012年,记为A ;奖励20万元的有2013年,2016年,记为B 1,B 2;奖励50万元的有2014年,2015年和2017年,记为C 1,C 2,C 3,故从这六年中任意选取两年,所有的情况为:(A ,B 1),(A ,B 2),(A ,C 1),(A ,C 2),(A ,C 3),(B 1,B 2),(B 1,C 1),(B 1,C 2),(B 1,C 3),(B 2,C 1),(B 2,C 2),(B 2,C 3),(C 1,C 2),(C 1,C 3),(C 2,C 3),共15种.其中奖励之和不低于70万元的取法为:(B 1,C 1),(B 1,C 2),(B 1,C 3),(B 2,C 1),(B 2,C 2),(B 2,C 3),(C 1,C 2),(C 1,C 3),(C 2,C 3),共9种.故所求事件的概率为P ==.91535⊙考点2 概率与线性回归分析的综合问题 在求两变量相关系数和两变量的回归方程时,由于r 和的计算公式b^ 比较复杂,求它们的值时计算量比较大,因此为了计算准确,可将它们分成几个部分分别计算,这样等同于分散难点,各个攻破,提高了计算的准确度. (2019·黄山模拟)由于往届高三年级数学学科的学习方式大都是“刷题-讲题-再刷题”的模式效果不理想,某市一中的数学课堂教改采用了“记题型-刷题-检测效果”的模式,并记录了某学生的记题型时间t (单位:h)与检测效果y 的数据如表所示:记题型时间t /h 1234567检测效果y2.93.3 3.64.4 4.85.2 5.9(1)据统计表明,y 与t 之间具有线性相关关系,请用相关系数r 加以说明(若|r |≥0.75,则认为y 与t 有很强的线性相关关系,否则认为没有很强的线性相关关系);(2)建立y 关于t 的回归方程,并预测该学生记题型8 h 的检测效果;(3)在该学生检测效果不低于3.6的数据中任取2个,求检测效果均高于4.4的概率.[解](1)由题得==4,t 1+2+3+4+5+6+77(t i -)2=9+4+1+0+1+4+9=28,∑7 i =1t (y i -)2=7.08, (t i -)(y i -)=14,∑7 i =1y ∑7 i =1t y ∴r ==≈0.99>0.75.1428×7.08∴y 与t 有很强的线性相关关系.(2)由(1)可得===0.5,b^1428∴=- =4.3-0.5×4=2.3.a ^ y b^ x ∴y 关于x 的线性回归方程=0.5t +2.3,y^ 当t =8时,=0.5×8+2.3=6.3.y^ ∴预测该学生记题型8 h 的检测效果约为6.3.(3)由题意,该学生检测效果不低于3.6的数据有5个,任取2个数据有:(3.6,4.4),(3.6,4.8),(3.6,5.2),(3.6,5.9),(4.4,4.8),(4.4,5.2),(4.4,5.9),(4.8,5.2),(4.8,5.9),(5.2,5.9)共10种情况,其中检测效果均高于4.4的有:(4.8,5.2),(4.8,5.9),(5.2,5.9)共3种结果.故所求概率P =.310 在计算r 或时,要充分利用题目中给出的数据,结合所给公式,分b^析哪些数据已知,哪些未知. 某同学在生物研究性学习中,对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下资料:日期4月1日4月7日4月15日4月21日4月30日温差x /℃101113128发芽数y /颗2325302616(1)从这5天中任选2天,求这2天发芽的种子数均不小于25的概率;(2)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另外三天的数据,求出y 关于x 的线性回归方程=x +;y ^ b ^ a^ (3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?附:回归直线的斜率和截距的最小二乘估计公式分别为[解](1)由题意,设这两天发芽的种子数分别为m ,n ,m ,n 的所有取值有(23,25),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26),(30,16),(26,16),共有10个,设“m ,n 均不小于25”为事件A ,则事件A 包含的基本事件有(25,30),(25,26),(30,26),共3个,所以P (A )=,310故从这5天中任选2天,发芽的种子数均不小于25的概率为.310(2)由数据得=12,=27,x y ∴3 =972,32=432.x y x 又x i y i =977,x =434,∑3 i =1∑3 i =12i ∴==,b^ 977-972434-43252=27-×12=-3,a^52∴y 关于x 的线性回归方程为=x -3.y^ 52(3)当x =10时,=×10-3=22,|22-23|<2,y^ 52当x =8时,=×8-3=17,|17-16|<2.y^ 52故所得到的线性回归方程是可靠的.⊙考点3 概率与独立性检验的综合问题 解决概率与统计案例综合问题的四步骤 (2019·大同模拟)“微信运动”是一个类似计步数据库的公众账号,现从“微信运动”的60个好友(男、女各30人)中,记录了他们某一天的走路步数,并将数据整理如表:0~2 000步2 001~5 000步 5 001~8 000步8 001~10 000步>10 000步男(人数)246108女(人数)171093P (χ2≥k )0.100.050.0100.0050.001k2.7063.8416.6357.87910.828附:χ2=.n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(1)若某人一天的走路步数超过8 000步被系统评定为“积极型”,否则评定为“懈怠型”.根据题意完成下面的2×2列联表,并据此判断能否有90%的把握认为“评定类型”与“性别”有关?积极型懈怠型总计男(人数)女(人数)总计(2)现从被系统评定为“积极型”好友中,按男女性别分层抽样,共抽出5人,再从这5人中,任意抽出3人发一等奖,求发到一等奖的3人中恰有一名女性的概率.[解](1)根据题意填写列联表如下:积极型懈怠型总计男(人数)181230女(人数)121830总计303060计算χ2==2.4<2.706,60×(18×18-12×12)230×30×30×30所以没有90%的把握认为“评定类型”与“性别”有关.(2)按男女性别分层抽样,抽出5人中3男2女,分别设为a ,b ,c ,D ,E ,从这5人中任意抽出3人,所有结果为abc ,abD ,abE ,acD ,acE ,aDE ,bcD ,bcE ,bDE ,cDE 共10种,其中恰有1名女性的基本事件有abD ,abE ,acD ,acE ,bcD ,bcE 共6种,故所求的概率为P ==.61035 解答本例第(1)问的关键是正确列出2×2列联表.[教师备选例题]某研究型学习小组调查研究“中学生使用智能手机对学习的影响”,部分统计数据如下表:使用智能手机人数不使用智能手机人数总计学习成绩优秀人数4812学习成绩不优秀人数16218总计201030参考数据:P (χ2≥k )0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828参考公式:χ2=,其中n =a +b +c +d .n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(1)试根据以上数据运用独立性检验思想,指出有多大把握认为中学生使用智能手机对学习有影响?(2)研究小组将该样本中使用智能手机且成绩优秀的4位同学记为A 组,不使用智能手机且成绩优秀的8位同学记为B 组,计划从A 组推选的2人和B 组推选的3人中,随机挑选2人在学校升旗仪式上作“国旗下讲话”分享学习经验.求挑选的2人恰好分别来自A ,B 两组的概率.[解](1)由题易求得K 2=10,因为7.879<χ2<10.828,所以有99.5%的把握认为中学生使用智能手机对学习有影响.(2)记A 组推选的2名同学为a 1,a 2,B 组推选的3名同学为b 1,b 2,b 3,则从中随机选出2名同学包含如下10个基本事件:(a 1,a 2),(a 1,b 1),(a 1,b 2),(a 1,b 3),(a 2,b 1),(a 2,b 2),(a 2,b 3),(b 1,b 2), (b 1, b 3), (b 2, b 3).记挑选的2人恰好分别来自A ,B 两组为事件Z ,则事件Z 包含如下6个基本事件:(a 1,b 1),(a 1,b 2),(a 1,b 3),(a 2,b 1),(a 2,b 2),(a 2,b 3).故P (Z )==,61035即挑选的2人恰好分别来自A ,B 两组的概率是.35 (2019·洛阳模拟)某学校为调查高三年级学生的身高情况,按随机抽样的方法抽取100名学生,得到男生身高情况的频率分布直方图(图1)和女生身高情况的频率分布直方图(图2).已知图1中身高在170~175 cm 的男生人数有16人.图1 图2(1)试问在抽取的学生中,男、女生各有多少人?(2)根据频率分布直方图,完成下列的2×2列联表,并判断能有多大(百分之几)的把握认为“身高与性别有关”?≥170 cm<170 cm总计男生身高女生身高总计(3)在上述100名学生中,从身高在175~185cm 之间的男生和身高在170~175 cm 之间的女生中间按男、女性别分层抽样的方法,抽出6人,从这6人中选派2人当旗手,求2人中恰好有一名女生的概率.参考公式:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )参考数据:P (χ2≥k )0.0250.0100.0050.001k5.0246.6357.87910.828[解](1)直方图中,因为身高在170~175 cm 的男生的频率为0.4,设男生数为n 1,则0.4=,得n 1=40.16n 1由男生的人数为40,得女生的人数为100-40=60.(2)男生身高≥170 cm 的人数=(0.08+0.04+0.02+0.01)×5×40=30,女生身高≥170 cm 的人数=0.02×5×60=6,所以可得到下列列联表:≥170 cm<170 cm 总计男生身高301040女生身高65460总计3664100χ2=≈44.010>10.828,100×(30×54-10×6)236×64×40×60所以能有99.9%的把握认为身高与性别有关.(3)在175~185 cm 之间的男生有12人,在170~175 cm 之间的女生人数有6人.按分层抽样的方法抽出6人,则男生占4人,女生占2人.设男生为A 1,A 2,A 3,A 4,女生为B 1,B 2.从6人中任选2名有:(A 1,A 2),(A 1,A 3),(A 1,A 4),(A 1,B 1),(A 1,B 2),(A 2,A 3),(A 2,A 4),(A 2,B 1),(A 2,B 2),(A 3,A 4),(A 3,B 1),(A 3,B 2),(A 4,B 1),(A 4,B 2),(B 1,B 2)共15种可能.2人中恰好有一名女生:(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(A 4,B 1),(A 4,B 2)共8种可能,故所求概率为P =.815课外素养提升⑩ 数据分析——统计图表中的信息提取及数据处理(对应学生用书第200页)概率统计综合问题是高考应用型问题,解决问题需要经历收集数据、整理数据、分析数据、处理数据、得出有用的结论几个复杂过程.如果这几个过程书写步骤缺失则会造成丢分;如果数据处理不当则会陷入庞大的数据运算中,因此解决这类问题首先需要根据题目条件提取有用数据,然后根据统计思想对数据进行相关处理、运算,并按照一定的书写步骤准确无误书写出来,做到步骤不缺失、表述准确无误,下面就如何从概率统计综合问题中迅速提取数据,并作出正确处理及模型构建提供典例展示.统计图中数据的提取、处理及运算【例1】 (2016·全国卷Ⅰ)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.(1)若n=19,求y与x的函数解析式;(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?[解](1)当x≤19时,y=3 800;当x>19时,y=3 800+500(x-19)=500x-5 700,所以y与x的函数解析式为y=Error!(x∈N).(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为(3 800×70+41100300×20+4 800×10)=4 000.若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为(4 000×90+4 500×10)=4 050.1100比较两个平均数可知,购买1台机器的同时应购买19个易损零件.[评析](1)根据题意写出分段函数的解析式.(2)根据柱状图结合频率的概念,求n 的最小值.(3)分别计算两种情况下的平均数,并比较大小,作出决策.【素养提升练习】1.2019年的“国庆节”期间,高速公路车辆较多.某调查公司在一服务区从七座以下小型汽车中按进服务区的先后每间隔50辆就抽取一辆的抽样方法抽取40名驾驶员进行询问调查,将他们在某段高速公路的车速(km/h)分成六段:[60,65),[65,70),[70,75),[75,80),[80,85),[85,90)后得到如图的频率分布直方图.(1)求这40辆小型车辆车速的众数和中位数的估计值;(2)若从车速在[60,70)的车辆中任抽取2辆,求车速在[65,70)的车辆恰有一辆的概率.[解](1)众数的估计值为最高的矩形的中点,即众数的估计值等于77.5.设中位数的估计值为x ,则0.01×5+0.02×5+0.04×5+0.06×(x -75)=0.5,解得x =77.5,即中位数的估计值为77.5(2)从图中可知,车速在[60,65)的车辆数为:m 1=0.01×5×40=2,车速在[65,70)的车辆数为:m 2=0.02×5×40=4.将车速在[60,65)的车辆设为a ,b ,车速在[65,70)的车辆设为c ,d ,e ,f ,则所有的基本事件有:(a ,b ),(a ,c ),(a ,d ),(a ,e ),(a ,f ),(b ,c ),(b ,d ),(b ,e ),(b ,f ),(c ,d ),(c ,e ),(c ,f ),(d ,e ),(d ,f ),(e ,f ),共15种,其中车速在[65,70)的车辆恰有一辆的事件有:(a ,c ),(a ,d ),(a ,e ),(a ,f ),(b ,c ),(b ,d ),(b ,e ),(b ,f ),共8种.所以,车速在[65,70)的车辆恰有一辆的概率为P =.815统计数表中的信息提取与数据处理【例2】 (2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得=x i =9.97,s ==≈0.212,≈18.439, x 116∑16 i =1∑16i =1(x i -)(i -8.5)=-2.78,其中x i 为抽取的第i 个零件的尺寸,i =1,2, (16)x (1)求(x i ,i )(i =1,2,…,16)的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r |<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(-3s ,+3s )之外的零件,就认x x 为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在(-3s ,+3s )之外的数据称为离群值,试剔除离群值,估计这条生产x x 线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(x i ,y i )(i =1,2,…,n )的相关系数r =,≈0.09.0.008[解](1)由样本数据得(x i ,i )(i =1,2,…,16)的相关系数r =≈≈-0.18.-2.780.212×16×18.439由于|r |<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)(i)由于=9.97,s ≈0.212,因此由样本数据可以看出抽取的第13个零件x 的尺寸在(-3s ,+3s )以外,因此需对当天的生产过程进行检查.x x (ⅱ)剔除离群值,即第13个数据,剩下数据的平均数为(16×9.97-9.22)=10.02,115这条生产线当天生产的零件尺寸的均值的估计值为10.02.x ≈16×0.2122+16×9.972≈1 591.134,∑16 i =12i 剔除第13个数据,剩下数据的样本方差为(1 591.134-9.222-15×10.022)≈0.008,115这条生产线当天生产的零件尺寸的标准差的估计值为≈0.09.0.008[评析](1)利用相关系数r 的公式求出r 进行判断.(2)认真分析题目给出的信息,对照已知数据,找出异常值,剔除异常值,求出零件尺寸的均值与标准值.【素养提升练习】2.某项科研活动共进行了5次试验,其数据如下表:特征量第1次第2次第3次第4次第5次x 555559551563552y601605597599598(1)从5次特征量y 的试验数据中随机地抽取两个数据,求至少有一个大于600的概率;(2)求特征量y 关于x 的线性回归方程=x +;并预测当特征量x 为570时,y ^ b ^ a^ 特征量y 的值.[解](1)记“从5次特征量y 的试验数据中随机地抽取两个数据,至少有一个大于600”为事件A .从5次特征量y 的试验数据中随机地抽取两个数据有{601,605},{601,597},{601,599},{601,598},{605,597},{605,599},{605,598},{597,599},{597,598},{599,598},共10种情况.其中至少有一个数据大于600的有{601,605},{601,597},{601,599},{601,598},{605,597},{605,599},{605,598},共7种情况.∴P (A )=.710(2)∵==556,x 555+559+551+563+5525==600.y 601+605+597+599+5985∴=b ^ -1×1+3×5+(-5)×(-3)+7×(-1)+(-4)×(-2)(-1)2+32+(-5)2+72+(-4)2==0.3.30100=- =600-0.3×556=433.2,a ^ y b^ x ∴线性回归方程为=0.3x +433.2.y^ 当x =570时,=0.3×570+433.2=604.2.y^ ∴当x =570时,特征量y 的估计值为604.2。