2019年高二文科数学暑期系统复习1:统计案例(解析附后)
- 格式:docx
- 大小:250.08 KB
- 文档页数:15
9.3 统计案例【例1】(2019·山东高考模拟(文))甲、乙两人参加一个射击的中奖游戏比赛,在相同条件下各打靶50次,统计每次打靶所得环数,得下列频数分布表.比赛中规定所得环数为1,2,3,4时获奖一元,所得环数为5,6,7时获奖二元,所得环数为8,9时获奖三元,所得环数为10时获奖四元,没命中则无奖.(1)根据上表,在答题卡给定的坐标系内画出甲射击50次获奖金额(单位:元)的条形图;(2)估计甲射击1次所获奖至少为三元的概率;(3)要从甲、乙两人中选拔一人参加射击比赛,请你根据甲、乙两人所获奖金额的平均数和方差作出选择.【答案】(1)见解析;(2) 1225; (3)派甲参赛比较好.【解析】(1)依题意知甲50次获奖金额(单位:元)的频数分布为其获奖金额的条形图如下图所示(2)甲射击一次所获奖金至少为三元,即打靶所得环数至少为8,因为甲所得环数至少 为8的有166224++=(次)所以估计甲射击一次所获奖金至少为三元的概率为24125025=. (3)甲50次获奖金的平均数为15(1122532242)502⨯⨯+⨯+⨯+⨯=, 乙50次获奖金的平均数为15(1322132442)502⨯+⨯+⨯+⨯=, 甲50次获奖金额的方差为2222155551122532242502222⎡⎤⎛⎫⎛⎫⎛⎫⎛⎫⨯-⨯+-⨯+-⨯+-⨯⎢⎥ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎢⎥⎣⎦137********=⨯=. 乙50次获奖金额的方差为2222155551322132442502222⎡⎤⎛⎫⎛⎫⎛⎫⎛⎫-⨯+-⨯+-⨯+-⨯⎢⎥ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎢⎥⎣⎦145950220=⨯=. 甲、乙的平均数相等.甲的方差小,故派甲参赛比较好. 【点睛】本题主要考查条形图的应用,古典概型概率公式的应用以及平均数与方差的实际意义,属于中档题. 样本数据的算术平均数12n 1(++...+)x x xx n =,样本方差2222121[()()...()]n s x x x x x x n=-+-++-,标准差s =【举一反三】1.(2020·四川高三期末(文))某次高三年级模拟考试中,数学试卷有一道满分10分的选做题,学生可以从A ,B 两道题目中任选一题作答.某校有900名高三学生参加了本次考试,为了了解该校学生解答该选做题的得分情况,作为下一步教学的参考依据,计划从900名考生的选做题成绩中随机抽取一个容量为10的样本,为此将900名考生选做题的成绩按照随机顺序依次编号为001~900.(1)若采用系统抽样法抽样,从编号为001~090的成绩中用简单随机抽样确定的成绩编号为025,求样本中所有成绩编号之和;(2)若采用分层抽样,按照学生选择A 题目或B 题目,将成绩分为两层.已知该校高三学生有540人选做A 题目,有360人选做B 题目,选取的样本中,A 题目的成绩平均数为5,方差为2,B 题目的成绩平均数为5.5,方差为0.25.(i )用样本估计该校这900名考生选做题得分的平均数与方差;(ii )本选做题阅卷分值都为整数,且选取的样本中,A 题目成绩的中位数和B 题目成绩的中位数都是5.5.从样本中随机选取两个大于样本平均值的数据做进一步调查,求取到的两个成绩来自不同题目的概率. 【答案】(1)4300;(2) (i )平均数为5.2,方差为1.36.(ii )35【解析】(1)由题易知,若按照系统抽样的方法,抽出的编号可以组成以25为首项,以90为公差的等差数列,故样本编号之和即为该数列的前10项之和, 所以1010910259043002S ⨯=⨯+⨯=. (2)(i )由题易知,若按照分层抽样的方法,抽出的样本中A 题目的成绩有6个,按分值降序分别记为1x ,2x ,…,6x ;B 题目的成绩有4个,按分值降序分别记为1y ,2y ,3y ,4y .记样本的平均数为x ,样本的方差为2s .由题意可知,()()126123410x x x y y y y x ++⋅⋅⋅+++++=56 5.545.210⨯+⨯==()()()()22225.250.2520.250.2i i i i x x x x -=--=--⨯-+⎡⎤⎣⎦,1,2,,6i =⋅⋅⋅ ()()()()22225.2 5.50.3 5.520.3 5.50.3i i i i y y y y -=-+=-+⨯-+⎡⎤⎣⎦,1,2,,4i =⋅⋅⋅()()()()()22222126142 5.2 5.2 5.2 5.2 5.210x x x y y s -+-+⋅⋅⋅+-+-+⋅⋅⋅+-=222600.260.25400.3413.6 1.361010⨯-+⨯+⨯++⨯===所以,估计该校900名考生选做题得分的平均数为5.2,方差为1.36.(ii )本选做题阅卷分值都为整数,且选取的样本中,A 题目成绩的中位数和B 题目成绩的中位数都是5.5,易知样本中A 题目的成绩大于样本平均值的成绩有3个,分别为1x ,2x ,3x ,B 题目的成绩大于样本平均值的成绩有2个,分别为1y ,2y .从样本中随机选取两个大于样本平均值的数据共有种10方法,为:()12,x x ,()13,x x ,()23,x x ,()12,y y ,()11,x y ,()21,x y ,()31,x y ,()12,x y ,()22,x y ,()32,x y ,其中取到的两个成绩来自不同题目的取法共有6种,为:()11,x y ,()21,x y ,()31,x y ,()12,x y ,()22,x y ,()32,x y ,记“从样本中随机选取两个大于样本平均值的数据,取到的两个成绩来自不同题目”为事件A , 所以()63105P A ==. 2.(2019·河北高二期中)(2014·长春模拟)对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(m/s)的数据如下表:(1)画出茎叶图.(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、方差,并判断选谁参加比赛更合适? 【答案】【解析】(1)画茎叶图如图所示,中间数为数据的十位数.(2)由茎叶图把甲、乙两名选手的6次成绩按从小到大的顺序依次排列为甲:27,30,31,35,37,38; 乙:28,29,33,34,36,38.所以x ̅甲=16×(27+30+31+35+37+38)=33,x ̅乙=16×(28+29+33+34+36+38)=33.s 甲2=16×[(-6)2+(-3)2+(-2)2+22+42+52]=473,s 乙2=16×[(-5)2+(-4)2+0+12+32+52]=383.因为x ̅甲=x ̅乙,s 甲2>s 乙2.所以乙的成绩更稳定,故乙参加比赛更合适.1.(2019·安徽省舒城中学高二月考(文))有关部门要了解甲型H1N1流感预防知识在学校的普及情况,命制了一份有10道题的问卷到各学校做问卷调查.某中学A 、B 两个班各被随机抽取5名学生接受问卷调查,A 班5名学生得分为:5、8、9、9、9,B 班5名学生得分为:6、7、8、9、10.(1)请你判断A 、B 两个班中哪个班的问卷得分要稳定一些,并说明你的理由;(2)求如果把B 班5名学生的得分看成一个总体,并用简单随机抽样方法从中抽取样本容量为2的样本,求样本平均数与总体平均数之差的绝对值不小于1的概率. 【答案】(1)B 班的问卷得分要稳定,见解析;(2)2()5P M = 【解析】(1)B 班的问卷得分要稳定一些,理由如下:589996789108,855A B x x ++++++++====222222(58)(88)(98)(98)(98) 2.45AS -+-+-+-+-∴==222222(68)(78)(88)(98)(108)25BS -+-+-+-+-==,22,A B A B x x S S =>,B ∴班的问卷得分要稳定;(2)记“样本平均数与总体平均数之差的绝对值不小于1”为事件M所有的基本事件分别为:(6,7)、(6,8)、(6,9)、(6,10)、(7,8)、(7,9)、(7,10)、(8,9)、(8,10)、(9,10),(6,7),(6,8),(6,9),(6,10),(7,8),(7,9),(7,10),(8,9),(8,10),(9,10)共10个.事件M 包含的基本事件分别为:(6,7),(6,8),(8,10),(9,10),共4个 由于事件M 符合古典概型,则42()105P M == 2.(2019·兰州市第二十七中学高一期末)某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分): 甲班:82 84 85 89 79 80 91 89 79 74 乙班:90 76 86 81 84 87 86 82 85 83 (1)求两个样本的平均数; (2)求两个样本的方差和标准差; (3)试分析比较两个班的学习情况.【答案】(1)=83.2x 甲,=84x 乙;(2)22=26.36=13.2S S 甲乙,,=5.13S 甲,=3.63S 乙;(3)乙班的总体学习情况比甲班好 【解析】(1)x 甲=110×(82+84+85+89+79+80+91+89+79+74)=83. 2, x 乙=110×(90+76+86+81+84+87+86+82+85+83)=84. (2)2S 甲=110×[(82-83. 2)2+(84-83. 2)2+(85-83. 2)2+(89-83. 2)2+(79-83. 2)2+(80-83. 2)2+(91-83. 2)2+(89-83. 2)2+(79-83. 2)2+(74-83. 2)2]=26. 36,2S 甲=110[(90-84)2+(76-84)2+(86-84)2+(81-84)2+(84-84)2+(87-84)2+(86-84)2+(82-84)2+(85-84)2+(83-84)2]=13. 2,则s 甲 5. 13,s 乙≈3. 63.(3)由于x x <乙甲,则甲班比乙班平均水平低.由于S S >甲乙,则甲班没有乙班稳定. 所以乙班的总体学习情况比甲班好3.(2019·平遥县第二中学高一月考)某技校开展技能大赛,甲、乙两班各选取5名学生加工某种零件,在4个小时内每名学生加工的合格零件数的统计数据的茎叶图如图所示,已知甲班学生在4个小时内加工的合格零件数的平均数为21,乙班学生在4个小时内加工的合格零件数的平均数不低于甲班的平均数.(1)求,m n 的值;(2)分别求出甲、乙两班学生在4个小时内加工的合格零件数的方差2S 甲和2S 乙,并由此比较两班学生的加工水平的稳定性.【答案】(1)8,9m n ==;(2)22=16.8=16.4S S 甲乙,,乙班学生加工水平比甲班稳定.【解析】(1)甲班学生在4个小时内加工的合格零件数的平均数为21, 即()11618212220215x m =+++++=甲,解得m =8. 乙班学生在4个小时内加工的合格零件数的平均数不低于甲班的平均数,即()11014232425215x n =+++++≥乙,又0n 9≤≤,解得n =9. (2)甲班的方差为()()()()()22222211621182121212221282116.85S ⎡⎤=-+-+-+-+-=⎣⎦甲,由(1)可得21x =乙, ∴乙班的方差为()()()()()22222211421192123212421252116.45S ⎡⎤=-+-+-+-+-=⎣⎦乙. ∵方差22S S 甲乙>,∴两班加工的合格零件数的平均数相同,乙班更稳定些.4.(2019·安徽高二期中(文))大城市往往人口密集,城市绿化在健康人民群众肺方面发挥着非常重要的作用,历史留给我们城市里的大山拥有品种繁多的绿色植物更是无价之宝.改革开放以来,有的地方领导片面追求政绩,对森林资源野蛮开发受到严肃查处事件时有发生.2019年的春节后,广西某市林业管理部门在“绿水青山就是金山银山”理论的不断指引下,积极从外地引进甲、乙两种树苗,并对甲、乙两种树苗各抽测了10株树苗的高度(单位:厘米),数据如下面的茎叶图:(1)据茎叶图求甲、乙两种树苗的平均高度;(2)据茎叶图,运用统计学知识分析比较甲、乙两种树苗高度整齐情况.【答案】(1)27(厘米),30(厘米);(2)甲种树苗长的比较整齐,乙种树苗长的参差不齐【解析】(1)甲种树苗的平均高度为192120292325373132332710+++++++++=(厘米).乙种树苗的平均高度为101410272630474644463010+++++++++=(厘米). (2)甲种树苗的方差为:()164364941641001625363810+++++++++=,乙种树苗的方差为:()1400256400169160289256196256223.810+++++++++=,故甲种树苗长的比较整齐,乙种树苗长的参差不齐.5.(2019·福建厦门外国语学校高二期中)某中学的高二(1)班男同学有45名,女同学有15名,老师按照分层抽样的方法组建了一个4人的课外兴趣小组. (1)求课外兴趣小组中男、女同学的人数;(2)经过一个月的学习、讨论,这个兴趣小组决定选出两名同学做某项实验,方法是先从小组里选出1名同学做实验,该同学做完后,再从小组内剩下的同学中选一名同学做实验,求选出的两名同学中恰有一名女同学的概率;(3)试验结束后,第一次做试验的同学得到的试验数据为68,70,71,72,74,第二次做试验的同学得到的试验数据为69,70,70,72,74 ,请问哪位同学的实验更稳定?并说明理由. 【答案】(1) 男、女同学的人数分别为3人,1人;(2) 12;(3) 第二位同学的实验更稳定,理由见解析 【解析】(1)设有x 名男同学,则45604x=,∴3x =,∴男、女同学的人数分别为3人,1人 (2)把3名男同学和1名女同学记为123,,,a a a b ,则选取两名同学的基本事件有12(,)a a ,13(,)a a ,1(,)a b ,21(,)a a ,23(,)a a ,2(,)a b ,31(,)a a ,32(,)a a ,3(,)a b ,1(,)b a ,2(,)b a ,3(,)b a 共12种,其中恰有一名女同学的有6种,∴选出的两名同学中恰有一名女同学的概率为61122P == (3)16870717274715x ++++==,26970707274715x ++++== 2222221(6871)(7071)(7171)(7271)(7471)45s -+-+-+-+-==,2222222(6971)(7071)(7071)(7271)(7471) 3.25s -+-+-+-+-==因2212s s >,所以第二位同学的实验更稳定.6.(2019·陕西高一期末)为选派一名学生参加全市实践活动技能竟赛,A 、B 两位同学在学校的学习基地现场进行加工直径为20mm 的零件测试,他俩各加工的10个零件直径的相关数据如图所示(单位:mm )A 、B 两位同学各加工的10个零件直径的平均数与方差列于下表;根据测试得到的有关数据,试解答下列问题:(Ⅰ)计算s 2B ,考虑平均数与方差,说明谁的成绩好些;(Ⅱ)考虑图中折线走势情况,你认为派谁去参赛较合适?请说明你的理由. 【答案】(Ⅰ)0.008,B 的成绩好些(Ⅱ)派A 去参赛较合适 【解析】(Ⅰ)由题意,根据表中的数据,利用方差的计算公式,可得S 2B 22221[5(2020)3(19.920)1(120)1(20.220)]0.00810=⨯-+⨯-+⨯-+⨯-= ∴S 2A >S 2B ,∴在平均数相同的情况下,B 的波动较小, ∴B 的成绩好些.(Ⅱ)从图中折线趋势可知:尽管A 的成绩前面起伏大,但后来逐渐稳定,误差小,预测A 的潜力大, ∴派A 去参赛较合适.7.(2019·沙雅县第二中学高二期末)某车间20名工人年龄数据如表所示: (1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图; (3)求这20名工人年龄的方差.【答案】(1)众数为30,极差为21;(2)见解析;(3)方差,12.6 【解析】(1)这20名工人年龄的众数为30,极差为401921-=; (2)茎叶图如下:(3)年龄的平均数为19283293305314323403020+⨯+⨯+⨯+⨯+⨯+=,故这20名工人年龄的方差为()()()222222211132315041321020⎡⎤-+⨯-+⨯-+⨯+⨯+⨯+⎣⎦ ()1112112341210025212.62020=+++++=⨯=. 8.(2020·北京高一期末)根据以往的成绩记录,甲、乙两名队员射击中靶环数(环数为整数)的频率分布情况如图所示.假设每名队员每次射击相互独立.(Ⅰ)求图中a的值;(Ⅱ)队员甲进行2次射击.用频率估计概率,求甲恰有1次中靶环数大于7的概率;(Ⅲ)在队员甲、乙中,哪一名队员的射击成绩更稳定?(结论无需证明)【答案】(Ⅰ)0.06;(Ⅱ)38;(Ⅲ)甲【解析】(I)由题意1(0.190.450.290.01)0.06a=-+++=;(II)记事件A为甲中射击一次中靶环数大于7,则()0.450.290.010.75P A=++=,甲射击2次,恰有1次中靶数大于7的概率为:()()()()()() P P AA P AA P A P A P A P A =+=+3 0.750.250.250.758 =⨯+⨯=;(III)甲稳定.9.(2019·永济市涑北中学校高一月考)甲、乙两名技工在相同的条件下生产某种零件,连续6天中,他们日加工的合格零件数的统计数据的茎叶图,如图所示(1)写出甲、乙的中位数和众数;(2)计算甲、乙的平均数与方差,并依此说明甲、乙两名技工哪名更为优秀.【答案】(1)见解析(2)甲更为优秀.【解析】解:(1)甲的中位数为2020202+=,众数为20;乙的中位数为192019.52+=,众数为23.(2)181920202122206x+++++==甲,()()()()()()2222222182019202020202021202220563S -+-+-+-+-+-==甲, 171819202323206x +++++==乙,()()()()()()22222221720182019202020232023201663S -+-+-+-+-+-==乙,由于x x =甲乙,且22S S <甲乙,所以甲更为优秀.10.(2019·四川高三期中(文))根据幼儿身心发展的特征,幼儿园通常着重在健康、科学、社会、语言、艺术五大领域对幼儿展开全方位的教育和培养.经调查发现,一个幼儿除了在幼儿园进行五大领域的系统学习之外,还会报一些课外兴趣班.而家长朋友们对于是否额外报这些课外兴趣班的态度也是不一样的.某调查机构对某幼儿园的100名幼儿家长就孩子是否报课外兴趣班的赞同程度进行调查统计,得到家长对幼儿报课外兴趣班赞同度y 的频数分布表:(1)分别计算对幼儿报兴趣班的赞同度不低于60%的家长比例和对幼儿报兴趣班的赞同度低于20%的家长比例;(2)求家长对幼儿报兴趣班的赞同度的平均数与方差的估计值.(同一组中的数据用该组区间的中点值代替)【答案】(1)0.72,0.02; (2)0.70,0.0496.【解析】(1)根据家长对幼儿报课外兴趣班赞同度y 的频数分布表, 对幼儿报兴趣班的赞同度不低于60%的家长比例为28440.72100+==; 对幼儿报兴趣班的赞同度低于20%的家长比例为20.02100=. (2)由题意,家长对幼儿报兴趣班的赞同度的平均数为()10.1020.30120.50140.70280.9044100y =⨯+⨯+⨯+⨯+⨯0.70=, 其方差为()()()22222210.6020.40120.20140280.2044100s ⎡⎤=-⨯+-⨯+-⨯+⨯+⨯⎣⎦0.0496=,所以家长对幼儿报兴趣班的赞同度的平均数与方差的估计值分别为0.70和0.0496.11.(2020·江西高二月考(理))某学校需要从甲、乙两名学生中选一人参加数学竞赛,抽取了近期两人5次数学考试的成绩,统计结果如下表:(1)若从甲、乙两人中选出一人参加数学竞赛,你认为选谁合适?请说明理由. (2)若数学竞赛分初赛和复赛,在初赛中有两种答题方案:方案一:每人从5道备选题中任意抽出1道,若答对,则可参加复赛,否则被淘汰.方案二:每人从5道备选题中任意抽出3道,若至少答对其中2道,则可参加复赛,否则被润汰. 已知学生甲、乙都只会5道备选题中的3道,那么你推荐的选手选择哪种答题方条进人复赛的可能性更大?并说明理由.【答案】(1)见解析;(2)选方案二【解析】(1)解法一:甲的平均成绩为180********835x ++++==;乙的平均成绩为29076759282835x ++++==, 甲的成绩方差()25211150.85i i s x x==-=∑;乙的成绩方差为()25221148.85i i s x x==-=∑;由于12x x =,2212s s >,乙的成绩较稳定,派乙参赛比较合适,故选乙合适. 解法二、派甲参赛比较合适,理由如下:从统计的角度看,甲获得85以上(含85分)的概率135P =,乙获得85分以上(含85分)的概率225P = 因为12P P >故派甲参赛比较合适,(2)5道备选题中学生乙会的3道分别记为a ,b ,c ,不会的2道分别记为E ,F .方案一:学生乙从5道备选题中任意抽出1道的结果有:a ,b ,c ,E ,F 共5种,抽中会的备选题的结果有a ,b ,c ,共3种. 所以学生乙可参加复赛的概率135P =. 方案二:学生甲从5道备选题中任意抽出3道的结果有(),,a b c ,(),,a b E ,(),,a b F ,(),,a c E ,(),,a c F ,(),,a E F ,(),,b c E ,(),,b c F ,(),,b E F ,(),,c E F ,共10种,抽中至少2道会的备选题的结果有:(),,a b c ,(),,a b E ,(),,a b F ,(),,a c E ,(),,a c F ,(),,b c E ,(),,b c F 共7种,所以学生乙可参加复赛的概率2710P =因为12P P <,所以学生乙选方案二进入复赛的可能性更大.12.(2020·陕西高二期末(文))某赛季,甲、乙两名篮球运动员都参加了7场比赛,他们所有比赛得分的情况如下:甲:15,17,14,23,22,24,32; 乙:12,13,11,23,27,31,30 .(1)求甲、乙两名运动员得分的中位数.(2)分别求甲、乙两名运动员得分的平均数、方差,你认为哪位运动员的成绩更稳定? 【答案】(1) 甲中位数是22,乙中位数是23;(2)21x =甲,21x =乙,22367S =甲,24667S =乙,甲运动员的成绩更稳定.【解析】(1)将甲运动员得分的数据由大到小排列:32,24,23,22,17,15,14. 将乙运动员得分的数据由大到小排列:31,30,27,23,13,12,11.∴甲运动员得分的中位数是22,乙运动员得分的中位数是23.(2)1(15171423222432)217x ==甲++++++, 1(12131123273130)217x ==乙++++++, 22221236[(2115)(2117)(2132)]77S =⋯=甲-+-++-,22221466[(2112)(2113)(2130)]77S =⋯=乙-+-+-,∴22S S <甲乙,∴甲运动员的成绩更稳定.13.(2019·广东执信中学高二期中(理))某超市从2014年甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取100个,整理得到数据分组及频率分布表和频率分布直方图:(1)写出频率分布直方图中a 的值,并做出甲种酸奶日销售量的频率分布直方图;(2)记甲种酸奶与乙种酸奶日销售量(单位:箱)的方差分别为2212,s s 。
[学生用书P273(单独成册)]一、选择题1.设事件A ,B ,已知P (A )=15,P (B )=13,P (A ∪B )=815,则A ,B 之间的关系一定为( )A .两个任意事件B .互斥事件C .非互斥事件D .对立事件解析:选B .因为P (A )+P (B )=15+13=815=P (A ∪B ),所以A ,B 之间的关系一定为互斥事件.故选B .2.某产品分甲、乙、丙三级,其中乙、丙两级均属次品,在正常生产情况下,出现乙级品和丙级品的概率分别是5%和3%,则抽检一件是正品(甲级)的概率为( )A .0.95B .0.97C .0.92D .0.08解析:选C .记抽检的产品是甲级品为事件A ,是乙级品为事件B ,是丙级品为事件C ,这三个事件彼此互斥,因而所求概率为P (A )=1-P (B )-P (C )=1-5%-3%=92%=0.92.3.从3个红球、2个白球中随机取出2个球,则取出的2个球不全是红球的概率是( ) A .110B .310C .710D .35解析:选C .“取出的2个球全是红球”记为事件A ,则P (A )=310.因为“取出的2个球不全是红球”为事件A 的对立事件,所以其概率为P (A )=1-P (A )=1-310=710.4.“微信抢红包”自2015年以来异常火爆,在某个微信群某次进行的抢红包活动中,若所发红包的总金额为9元,被随机分配为1.49元,1.31元,2.19 元,3.40元,0.61元,共5份,供甲、乙等5人抢,每人只能抢一次, 则甲、乙二人抢到的金额之和不低于4元的概率是( )A .12B .25C .34D .56解析:选B .设事件A 为“甲、乙二人抢到的金额之和不低于4元”,甲、乙两人抢到红包的所有结果为{1.49,1.31},{1.49,2.19},{1.49,3.40},{1.49,0.61},{1.31,2.19},{1.31,3.40},{1.31,0.61},{2.19,3.40},{2.19,0.61},{3.40,0.61},共10种情况.其中事件A 的结果一共有4种情况,根据古典概型概率计算公式,得P (A )=410=25,即甲、乙二人抢到的金额之和不低于4元的概率是25.故选B .5.在正六边形的6个顶点中随机选择4个顶点,则构成的四边形是梯形的概率为( ) A .15B .25C .16D .18解析:选B .如图,在正六边形ABCDEF 的6个顶点中随机选择4个顶点,共有15种选法,其中构成的四边形是梯形的有ABEF ,BCDE ,ABCF ,CDEF ,ABCD ,ADEF ,共6种情况,故构成的四边形是梯形的概率P =615=25.6.已知集合M ={1,2,3,4},N ={(a ,b )|a ∈M ,b ∈M },A 是集合N 中任意一点,O 为坐标原点,则直线OA 与y =x 2+1有交点的概率是( )A .12B .13C .14D .18解析:选C .易知过点(0,0)与y =x 2+1相切的直线为y =2x (斜率小于0的无需考虑),集合N 中共有16个元素,其中使OA 斜率不小于2的有(1,2),(1,3),(1,4),(2,4),共4个,由古典概型知概率为416=14.二、填空题7.某城市2017年的空气质量状况如下表所示:轻微污染,则该城市2017年空气质量达到良或优的概率为________.解析:由题意可知2017年空气质量达到良或优的概率为P =110+16+13=35.答案:358.口袋内装有一些除颜色不同之外其他均相同的红球、白球和黑球,从中摸出1个球,摸出红球的概率是0.42,摸出白球的概率是0.28,若红球有21个,则黑球有________个.解析:摸到黑球的概率为1-0.42-0.28=0.3.设黑球有n 个,则0.4221=0.3n ,故n =15.答案:159.从2名男生和2名女生中,任意选择两人在星期六、星期日参加某公益活动,每天一人,则星期六安排一名男生,星期日安排一名女生的概率为________.解析:将2名男生记为A 1,A 2,2名女生记为B 1,B 2,任意选择两人在星期六、星期日参加某公益活动有A 1A 2,A 1B 1,A 1B 2,A 2B 1,A 2B 2,B 1B 2,B 1A 1,B 2A 1,B 1A 2,B 2A 2,B 2B 1,A 2A 1共12种情况,而星期六安排一名男生,星期日安排一名女生共有A 1B 1,A 1B 2,A 2B 1,A 2B 2这4种情况,则其发生的概率为412=13.答案:1310.现有7名数理化成绩优秀者,分别用A 1,A 2,A 3,B 1,B 2,C 1,C 2表示,其中A 1,A 2,A 3的数学成绩优秀,B 1,B 2的物理成绩优秀,C 1,C 2的化学成绩优秀.从中选出数学、物理、化学成绩优秀者各1名,组成一个小组代表学校参加竞赛,则A 1和B 1不全被选中的概率为________.解析:从这7人中选出数学、物理、化学成绩优秀者各1名,所有可能的结果组成的12个基本事件为:(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 2,B 1,C 1),(A 2,B 1,C 2),(A 2,B 2,C 1),(A 2,B 2,C 2),(A 3,B 1,C 1),(A 3,B 1,C 2),(A 3,B 2,C 1),(A 3,B 2,C 2).设“A 1和B 1不全被选中”为事件N ,则其对立事件N -表示“A 1和B 1全被选中”,由于N -={(A 1,B 1,C 1),(A 1,B 1,C 2)},所以P (N -)=212=16,由对立事件的概率计算公式得P (N )=1-P (N -)=1-16=56.答案:56三、解答题11.如图,从A 地到火车站共有两条路径L 1和L 2,现随机抽取100位从A 地到达火车站的人进行调查,调查结果如下:所用时间(分钟) 10~20 20~30 30~40 40~50 50~60 选择L 1的人数 6 12 18 12 12 选择L 2的人数416164(1)试估计(2)分别求通过路径L 1和L 2所用时间落在上表中各时间段内的频率;(3)现甲、乙两人分别有40分钟和50分钟时间用于赶往火车站,为了尽最大可能在允许的时间内赶到火车站,试通过计算说明,他们应如何选择各自的路径.解:(1)由已知共调查了100人,其中40分钟内不能赶到火车站的有12+12+16+4=44(人), 所以用频率估计相应的概率为44÷100=0.44. (2)选择L 1的有60人,选择L 2的有40人,故由调查结果得频率为(3)设A 1,A 2121,B 2L 1和L 2时,在50分钟内赶到火车站.由(2)知P (A 1)=0.1+0.2+0.3=0.6,P (A 2)=0.1+0.4=0.5,因为P (A 1)>P (A 2),所以甲应选择L 1 . 同理,P (B 1)=0.1+0.2+0.3+0.2=0.8, P (B 2)=0.1+0.4+0.4=0.9, 因为P (B 1)<P (B 2),所以乙应选择L 2.12.根据我国颁布的《环境空气质量指数(AQI)技术规定》:空气质量指数划分为0~50、51~100、101~150、151~200、201~300和大于300六级,对应空气质量指数的六个级别,指数越大,级别越高,说明污染越严重,对人体健康的影响也越明显.专家建议:当空气质量指数小于等于150时,可以进行户外运动;空气质量指数为151及以上时,不适合进行旅游等户外活动,下表是济南市2017年10月上旬的空气质量指数情况:(1)(2)一外地游客在10月上旬来济南旅游,想连续游玩两天,求适合连续旅游两天的概率. 解:(1)该试验的基本事件空间Ω={1,2,3,4,5,6,7,8,9,10},基本事件总数n =10. 设事件A 为“市民不适合进行户外活动”,则A ={3,4,9,10},包含基本事件数m =4.所以P (A )=410=25, 即10月上旬市民不适合进行户外活动的概率为25.(2)该试验的基本事件空间Ω={(1,2),(2,3),(3,4),(4,5),(5,6),(6,7),(7,8),(8,9),(9,10)},基本事件总数n =9,设事件B 为“适合连续旅游两天的日期”,则B ={(1,2),(5,6),(6,7),(7,8)},包含基本事件数m =4, 所以P (B )=49,所以适合连续旅游两天的概率为49.1.某超市随机选取1 000位顾客,记录了他们购买甲、乙、丙、丁四种商品的情况,整理成如下统计表,其中“√”表示购买,“”表示未购买.(1)(2)估计顾客在甲、乙、丙、丁中同时购买3种商品的概率;(3)如果顾客购买了甲,则该顾客同时购买乙、丙、丁中哪种商品的可能性最大?解:(1)从统计表可以看出,在这1 000位顾客中有200位顾客同时购买了乙和丙,所以顾客同时购买乙和丙的概率可以估计为2001 000=0.2.(2)从统计表可以看出,在这1 000位顾客中,有100位顾客同时购买了甲、丙、丁,另有200位顾客同时购买了甲、乙、丙,其他顾客最多购买了2种商品,所以顾客在甲、乙、丙、丁中同时购买3种商品的概率可以估计为100+2001 000=0.3.(3)与(1)同理,可得:顾客同时购买甲和乙的概率可以估计为2001 000=0.2,顾客同时购买甲和丙的概率可以估计为100+200+3001 000=0.6,顾客同时购买甲和丁的概率可以估计为1001 000=0.1,所以,如果顾客购买了甲,则该顾客同时购买丙的可能性最大.2.以青蒿素类药物为主的联合疗法已经成为世界卫生组织推荐的抗疟疾标准疗法,目前,国内青蒿人工种植发展迅速,调查表明,人工种植的青蒿的长势与海拔高度、土壤酸碱度、空气湿度的指标有极强的相关性,现将这三项的指标分别记为x ,y ,z ,并对它们进行量化:0表示不合格,1表示临界合格,2表示合格,再用综合指标ω=x +y +z 评定人工种植的青蒿的长势等级:若ω≥4,则长势为一级;若2≤ω≤3,则长势为二级;若0≤ω≤1,则长势为三级.为了了解目前人工种植的青蒿的长势情况,研究人员随机抽取了10个青蒿人工种植地,得到如下结果:(2)从长势等级为一级的青蒿人工种植地中随机抽取2个,求这2个人工种植地的综合指标ω均为4的概率.解:(1)计算10个青蒿人工种植地的综合指标,可得下表:编号A1A2A3A4A5A6A7A8A9A10综合指标1446245353由上表可知,长势等级为三级的种植地只有A1一个,其频率为110,用样本的频率估计总体的频率,可估计这些种植地中长势等级为三级的个数约为180×110=18.(2)由(1)可知,长势等级是一级的青蒿人工种植地有A2,A3,A4,A6,A7,A9,共6个,从中随机抽取2个,所有的可能结果为(A2,A3),(A2,A4),(A2,A6),(A2,A7),(A2,A9),(A3,A4),(A3,A6),(A3,A7),(A3,A9),(A4,A6),(A4,A7),(A4,A9),(A6,A7),(A6,A9),(A7,A9),共计15个,综合指标ω=4的有A2,A3,A6,共3个,则符合题意的可能结果为(A2,A3),(A2,A6),(A3,A6),共3个,故所求概率P=315=1 5.。
§10.2统计及统计案例考纲解读考点内容解读要求高考示例常考题型预测热度1.抽样方法1.理解随机抽样的必要性和重要性2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法Ⅲ2017江苏,3;2015北京,4;2015湖南,2选择题、填空题、解答题★★★2.统计图表了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,体会它们各自的特点2017课标全国Ⅲ,3;2017北京,17;2016北京,173.样本的数字特征1.理解样本数据标准差的意义和作用,会计算数据标准差2.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释3.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想4.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题2017课标全国Ⅰ,2;2017山东,8;2016课标全国Ⅰ,19;2016四川,16;2016江苏,4;2015重庆,4;2015山东,6;2014课标Ⅰ,184.变量间的相关性1.会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程Ⅱ2017课标全国Ⅰ,19;2016课标全国Ⅲ,18;2015湖北,4;2015课标Ⅰ,19★★☆5.独立性检验了解独立性检验的基本思想、方法及其简单应用,能通过计算判断两个变量的相关程度2017课标全国Ⅱ,19;2014安徽,17;2013福建,19分析解读从近几年的高考试题来看,本部分在高考中的考查点如下:1.主要考查分层抽样的定义,频率分布直方图,平均数、方差的计算,识图能力及借助概率知识分析、解决问题的能力;2.在频率分布直方图中,注意小矩形的高=频率/组距,小矩形的面积为频率,所有小矩形的面积之和为1;3.分析两个变量间的相关关系,通过独立性检验判断两个变量是否相关.本节内容在高考中分值为17分左右,属中档题.(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为100-100×0.9-5=5.所以总体中分数在区间[40,50)内的人数估计为400×5100=20.(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.五年高考考点一 抽样方法1.(2015北京,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )类别 人数 老年教师 900 中年教师 1 800 青年教师 1 600 合计4 300A.90B.100C.180D.300 答案 C2.(2015湖南,2,5分)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( ) A.3B.4C.5D.6答案 B3.(2015四川,3,5分)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是()A.抽签法B.系统抽样法C.分层抽样法D.随机数法答案 C4.(2014湖南,3,5分)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3答案 D5.(2014四川,2,5分)在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是()A.总体B.个体C.样本的容量D.从总体中抽取的一个样本答案 A6.(2017江苏,3,5分)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.答案187.(2014山东,16,12分)海关对同时从A,B,C三个不同地区进口的某种商品进行抽样检测,从各地区进口此种商品的数量(单位:件)如下表所示.工作人员用分层抽样的方法从这些商品中共抽取6件样品进行检测.(1)求这6件样品中来自A,B,C各地区商品的数量;(2)若在这6件样品中随机抽取2件送往甲机构进行进一步检测,求这2件商品来自相同地区的概率.地区A B C数量50150100解析(1)因为样本容量与总体中的个体数的比是650+150+100=1 50,所以样本中包含三个地区的个体数量分别是:50×150=1,150×150=3,100×150=2,所以A,B,C三个地区的商品被选取的件数分别为1,3,2.(2)设6件来自A,B,C三个地区的样品分别为:A;B1,B2,B3;C1,C2,则抽取的这2件商品构成的所有基本事件为:{A,B1},{A,B2},{A,B3},{A,C1},{A,C2},{B1,B2},{B1,B3},{B1,C1},{B1,C2},{B2,B3},{B2,C1},{B2,C2},{B3,C1},{B3,C2},{C1,C2},共15个. 每个样品被抽到的机会均等,因此这些基本事件的出现是等可能的.记事件D:“抽取的这2件商品来自相同地区”,则事件D包含的基本事件有{B1,B2},{B1,B3},{B2,B3},{C1,C2},共4个.所以P(D)=415,即这2件商品来自相同地区的概率为415.教师用书专用(8—15)8.(2014重庆,3,5分)某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100B.150C.200D.250答案 A9.(2014广东,6,5分)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50B.40C.25D.20答案 C10.(2013江西,5,5分)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08B.07C.02D.01答案 D11.(2013湖南,3,5分)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件、80件、60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=()A.9B.10C.12D.13答案 D12.(2015福建,13,4分)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为.答案2513.(2014湖北,11,5分)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为件.答案 1 80014.(2014天津,9,5分)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取名学生. 答案6015.(2013陕西,19,12分)有7位歌手(1至7号)参加一场歌唱比赛,由500名大众评委现场投票决定歌手名次.根据年龄将大众评委分为五组,各组的人数如下:组别A B C D E人数5010015015050(1)为了调查评委对7位歌手的支持情况,现用分层抽样方法从各组中抽取若干评委,其中从B组抽取了6人,请将其余各组抽取的人数填入下表;组别A B C D E人数5010015015050抽取人数6(2)在(1)中,若A,B两组被抽到的评委中各有2人支持1号歌手,现从这两组被抽到的评委中分别任选1人,求这2人都支持1号歌手的概率.解析(1)由题设知,分层抽样的抽取比例为6%,所以各组抽取的人数如下表:组别A B C D E人数5010015015050抽取人数36993(2)记从A组抽到的3个评委为a1,a2,a3,其中a1,a2支持1号歌手;从B组抽到的6个评委为b1,b2,b3,b4,b5,b6,其中b1,b2支持1号歌手.从{a1,a2,a3}和{b1,b2,b3,b4,b5,b6}中各抽取1人的所有结果为:由以上树状图知所有结果共18种,其中2人都支持1号歌手的有a1b1,a1b2,a2b1,a2b2,共4种,故所求概率P=418=29 .考点二统计图表1.(2017课标全国Ⅲ,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案 A2.(2016山东,3,5分)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140答案 D3.(2015课标Ⅱ,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案 D4.(2015陕西,2,5分)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93B.123C.137D.167答案 C5.(2014山东,8,5分)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.18答案 C6.(2015课标Ⅱ,18,12分)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数2814106(1)作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大,说明理由.解析(1)通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.7.(2015安徽,17,12分)某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为:[40,50),[50,60),…,[80,90),[90,100].(1)求频率分布直方图中a的值;(2)估计该企业的职工对该部门评分不低于80的概率;(3)从评分在[40,60)的受访职工中,随机抽取2人,求此2人的评分都在[40,50)的概率.解析(1)因为(0.004+a+0.018+0.022×2+0.028)×10=1,所以a=0.006.(2)由所给频率分布直方图知,50名受访职工评分不低于80的频率为(0.022+0.018)×10=0.4,所以该企业职工对该部门评分不低于80的概率的估计值为0.4.(3)受访职工中评分在[50,60)的有50×0.006×10=3(人),记为A1,A2,A3;受访职工中评分在[40,50)的有50×0.004×10=2(人),记为B1,B2.从这5名受访职工中随机抽取2人,所有可能的结果共有10种,它们是{A1,A2},{A1,A3},{A1,B1},{A1,B2},{A2,A3},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2},又因为所抽取2人的评分都在[40,50)的结果有1种,即{B1,B2},故所求的概率为P=1.10教师用书专用(8—13)8.(2013山东,10,5分)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:则7个剩余分数的方差为()A.1169B.367C.36D.6√77答案 B9.(2013辽宁,5,5分)某班的全体学生参加英语测试,成绩的频率分布直方图如图.数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是()A.45B.50C.55D.60答案 B10.(2013重庆,6,5分)如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为()1892122793003A.0.2B.0.4C.0.5D.0.6答案 B11.(2013四川,7,5分)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()答案 A12.(2014福建,20,12分)根据世行2013年新标准,人均GDP低于1 035美元为低收入国家;人均GDP为1 035~ 4 085美元为中等偏下收入国家;人均GDP为4 085~ 12 616美元为中等偏上收入国家;人均GDP不低于12 616美元为高收入国家.某城市有5个行政区,各区人口占该城市人口比例及人均GDP如下表:行政区区人口占城市人口比例区人均GDP(单位:美元)A25%8 000B30% 4 000C15% 6 000D10% 3 000E20%10 000(1)判断该城市人均GDP是否达到中等偏上收入国家标准;(2)现从该城市5个行政区中随机抽取2个,求抽到的2个行政区人均GDP都达到中等偏上收入国家标准的概率.解析(1)设该城市人口总数为a,则该城市人均GDP为1a(8 000×0.25a+4000×0.30a+6000×0.15a+3000×0.10a+10000×0.20a)=6 400.因为6 400∈[4 085,12 616), 所以该城市人均GDP达到了中等偏上收入国家标准.(2)“从5个行政区中随机抽取2个”的所有的基本事件是{A,B},{A,C},{A,D},{A,E},{B,C},{B,D},{B,E},{C,D},{C,E},{D,E},共10个.设事件“抽到的2个行政区人均GDP都达到中等偏上收入国家标准”为M,则事件M包含的基本事件是{A,C},{A,E},{C,E},共3个,所以所求概率为P(M)=3.1013.(2014重庆,17,13分)20名学生某次数学考试成绩(单位:分)的频率分布直方图如下:(1)求频率分布直方图中a的值;(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;(3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率.解析(1)据题中直方图知组距=10,由(2a+3a+6a+7a+2a)×10=1,解得a=1=0.005.200(2)成绩落在[50,60)中的学生人数为2×0.005×10×20=2.成绩落在[60,70)中的学生人数为3×0.005×10×20=3.(3)记成绩落在[50,60)中的2人为A1,A2,成绩落在[60,70)中的3人为B1,B2,B3,则从成绩在[50,70)的学生中任选2人的基本事件共有10个:(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3),其中2人的成绩都在[60,70)中的基本事件有3个:.(B1,B2),(B1,B3),(B2,B3),故所求概率为P=310考点三样本的数字特征1.(2017课标全国Ⅰ,2,5分)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数答案 B2.(2017山东,8,5分)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y的值分别为()A.3,5B.5,5C.3,7D.5,7答案 A3.(2016江苏,4,5分)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是.答案0.14.(2016课标全国Ⅰ,19,12分)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:记x 表示1台机器在三年使用期内需更换的易损零件数,y 表示1台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数.(1)若n=19,求y 与x 的函数解析式;(2)若要求“需更换的易损零件数不大于n ”的频率不小于0.5,求n 的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件? 解析 (1)当x ≤19时,y=3 800;当x>19时,y=3 800+500(x-19)=500x-5 700, 所以y 与x 的函数解析式为y={3 800, x ≤19,500x -5 700,x >19(x ∈N ).(4分) (2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n 的最小值为19.(5分)(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800元,20台的费用为4 300元,10台的费用为4 800元,因此这100台机器在购买易损零件上所需费用的平均数为1100(3 800×70+4 300×20+ 4 800×10)=4 000(元).(7分)若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000元,10台的费用为 4 500元,因此这100台机器在购买易损零件上所需费用的平均数为1100(4 000×90+4 500×10)=4 050(元).(10分)比较两个平均数可知,购买1台机器的同时应购买19个易损零件.(12分)5.(2016四川,16,12分)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图. (1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由; (3)估计居民月均用水量的中位数.解析 (1)由频率分布直方图可知:月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02. 由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)由(1)知,100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12,由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000. (3)设中位数为x 吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5, 而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5, 所以2≤x<2.5.由0.50×(x -2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.6.(2014课标Ⅰ,18,12分)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125)频数62638228(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解析(1)(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.教师用书专用(7—17)7.(2015重庆,4,5分)重庆市2013年各月的平均气温(℃)数据的茎叶图如下:0 8 91 2 5 82 0 03 3 83 1 2则这组数据的中位数是()A.19B.20C.21.5D.23答案 B8.(2014陕西,9,5分)某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为x和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为()A.x,s2+1002B.x+100,s2+1002C.x,s2D.x+100,s2答案 D9.(2015广东,12,5分)已知样本数据x1,x2,…,x n的均值x=5,则样本数据2x1+1,2x2+1,…,2x n+1的均值为.答案1110.(2013湖北,12,5分)某学员在一次射击测试中射靶10次,命中环数如下: 7,8,7,9,5,4,9,10,7,4则(1)平均命中环数为 ; (2)命中环数的标准差为 . 答案 (1)7 (2)211.(2013辽宁,16,5分)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为 . 答案 1012.(2015广东,17,12分)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?解析 (1)由已知得,20×(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)=1,解得x=0.007 5.(2)由题图可知,面积最大的矩形对应的月平均用电量区间为[220,240),所以月平均用电量的众数的估计值为230; 因为20×(0.002+0.009 5+0.011)=0.45<0.5,20×(0.002+0.009 5+0.011+0.012 5)=0.7>0.5,所以中位数在区间[220,240)内. 设中位数为m,则20×(0.002+0.009 5+0.011)+0.012 5×(m -220)=0.5,解得m=224.所以月平均用电量的中位数为224.(3)由题图知,月平均用电量为[220,240)的用户数为(240-220)×0.012 5×100=25,同理可得,月平均用电量为[240,260),[260,280),[280,300]的用户数分别为15,10,5.故用分层抽样的方式抽取11户居民,月平均用电量在[220,240)的用户中应抽取11×2525+15+10+5=5(户).13.(2014课标Ⅱ,19,12分)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:甲部门乙部门4 9797665332110988777665555544433321006655200 6322203 4 5 6 7 8 9 10590448122456677789011234688 00113449123345 011456000(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率; (3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解析 (1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大. 14.(2014广东,17,13分)某车间20名工人年龄数据如下表:年龄(岁) 工人数(人)19 1 28 3 29 3 30 5 31 4 32 3 40 1 合计20(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图; (3)求这20名工人年龄的方差.解析 (1)由题表中的数据易知,这20名工人年龄的众数是30,极差为40-19=21. (2)这20名工人年龄的茎叶图如下:1 2 3 4 98 8 8 9 9 9 0 0 0 0 0 1 1 1 1 2 2 2 0(3)这20名工人年龄的平均数x =120(19×1+28×3+29×3+30×5+31×4+32×3+40×1)=30,故方差s 2=120[1×(19-30)2+3×(28-30)2+3×(29-30)2+5×(30-30)2+4×(31-30)2+3×(32-30)2+1×(40-30)2]=120×(121+12+3+0+4+12+100)=12.6.15.(2014湖南,17,12分)某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下: (a,b),(a,b ),(a,b),(a ,b),(a ,b ),(a,b),(a,b),(a,b ),(a ,b),(a,b ),(a ,b ),(a,b),(a,b ),(a ,b),(a,b), 其中a,a 分别表示甲组研发成功和失败;b,b 分别表示乙组研发成功和失败.(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平; (2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率. 解析 (1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1, 其平均数为x 甲=1015=23;方差s 甲2=115×[(1−23)2×10+(0−23)2×5]=29.乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数为x 乙=915=35; 方差s 乙2=115×[(1−35)2×9+(0−35)2×6]=625. 因为x 甲>x 乙,s 甲2<s 乙2,所以甲组的研发水平优于乙组.(2)记E={恰有一组研发成功}.在所抽得的15个结果中,恰有一组研发成功的结果是(a,b ),(a ,b),(a,b ),(a ,b),(a,b ),(a,b ),(a ,b),共7个,故事件E 发生的频率为715.将频率视为概率,即得所求概率为P(E)=715.16.(2013北京,16,13分)如图是某市3月1日至14日的空气质量指数趋势图.空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染.某人随机选择3月1日至3月13日中的某一天到达该市,并停留2天.(1)求此人到达当日空气质量优良的概率;(2)求此人在该市停留期间只有1天空气重度污染的概率;(3)由图判断从哪天开始连续三天的空气质量指数方差最大.(结论不要求证明)解析 (1)在3月1日至3月13日这13天中,1日、2日、3日、7日、12日、13日共6天的空气质量优良,所以此人到达当日空气质量优良的概率是613.(2)根据题意,事件“此人在该市停留期间只有1天空气重度污染”等价于“此人到达该市的日期是4日,或5日,或7日,或8日”. 所以此人在该市停留期间只有1天空气重度污染的概率为413. (3)从3月5日开始连续三天的空气质量指数方差最大.17.(2013安徽,17,12分)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下:(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x 1、x 2,估计x 1-x 2的值.解析 (1)设甲校高三年级学生总人数为n.由题意知,30n=0.05,即n=600.样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级此次联考数学成绩及格率为1-530=56.(2)设甲、乙两校样本平均数分别为x '1、x '2,根据样本茎叶图可知,30(x '1-x '2)=30x '1-30x '2 =(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92 =2+49-53-77+2+92 =15.因此x '1-x '2=0.5.故x 1-x 2的估计值为0.5分.考点四 变量间的相关性1.(2015湖北,4,5分)已知变量x 和y 满足关系y=-0.1x+1,变量y 与z 正相关.下列结论中正确的是( ) A.x 与y 正相关,x 与z 负相关 B.x 与y 正相关,x 与z 正相关 C.x 与y 负相关,x 与z 负相关 D.x 与y 负相关,x 与z 正相关 答案 C2.(2014湖北,6,5分)根据如下样本数据得到的回归方程为y ^=bx+a,则( )x 3 4 5 6 7 8 y4.0 2.5 -0.5 0.5 -2.0 -3.0A.a>0,b<0B.a>0,b>0C.a<0,b<0D.a<0,b>0答案 A3.(2017课标全国Ⅰ,19,12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:。
2019年高一数学暑期系统复习2:统计初步(解析附后)经典例题例2 [2019·株洲质检]某企业对其生产的一批产品进行检测,得出每件产品中某种物质含量(单位:克)的频率分布直方图如图所示.则该物质含量的众数和平均数分别为()A.和 B.和 C.和 D.和【答案】C【解析】根据频率分布直方图得出众数落在第三组,内,所以众数为8090852+=;含量在,之间的频率为0.1,含量在,之间的频率为0.2,含量在,之间的频率为0.4,根据概率和为1,可得含量在,之间的频率为0.3,所以频率分布直方图的平均数为.....故选C.经典集训一、单选题1.[2019·石嘴山三中]某中学的高一、高二、高三共有学生1350人,其中高一500人,高三比高二少50人,为了解该校学生健康状况,现采用分层抽样方法进行调查,在抽取的样本中有高一学生120人,则该样本中的高二学生人数为()A.80 B.96 C.108 D.1102.[2019·石嘴山三中]样本中共有5个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本的标准差为()A.65C.2 D.3.[2019·芜湖模拟]某年级有学生560人,现用系统抽样的方法抽取一个容量为80的样本,把学生编号为1~560号,已知编号为20的学生被抽中,则样本中编号最小的是()A.004 B.005 C.006 D.0074.[2019·乐山调研]某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图、后从事互联网行业者岗位分布条形图,则下列结论中不一定正确的是()A.互联网行业从业人员中后占一半以上B.互联网行业中从事技术岗位的人数超过总人数的C.互联网行业中从事运营岗位的人数后比前多D.互联网行业中从事运营岗位的人数后比后多5.[2019·景德镇一中]某班由33个学生编号为01,02,,33的33个个体组成,现在要选取6名学生参加合唱团,选取方法是从随机数表的第1行的第11列开始由左到右依次选取两个数字,样本则选出来的第6名同学的编号为()A.26 B.30 C.25 D.066.[2019·梅州质检]中国诗词大会的播出引发了全民读书热,某学校语文老师在班里开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如右图,若规定得分不低于85分的学生得到“诗词达人”的称号,低于85分且不低于70分的学生得到“诗词能手”的称号,其他学生得到“诗词爱好者”的称号.根据该次比赛的成绩按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词能手”称号的人数为()A.6 B.5 C.4 D.27.[2019·开封期中]已知、取值如表:画散点图分析可知:与线性相关,且求得回归方程为,则的值(精确到0.1)为()A.1.8.[2019·吉安模拟]某市举行“中学生诗词大赛”,分初赛和复赛两个阶段进行,规定:初赛成绩大于90分的具有复赛资格,某校有1000名学生参加了初赛,所有学生的成绩均在区间(30,150]内,其频率分布直方图如图所示,则获得复赛资格的人数为()A.650 B.660 C.680 D.7009.[2019·凌源联考]海水养殖场收获时随机抽取了100个养殖网箱,测量各网箱水产品产量(单位:),其频率分布直方图如图,则估计此样本中位数为()A.50.00 B.51.80 C.52.35 D.52.5010.[2019·全国大联考]《九章算术·衰分》中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱.欲以钱数多少衰出之,问各几何?”翻译为:“今有甲持钱560,乙持钱350,丙持钱180,甲、乙、丙三个人一起出关,关税共计100钱,要按个人带钱多少的比率交税,问三人各应付多少税?”则下列说法中错误..的是()A.乙付的税钱应占总税钱的35 109B.乙、丙两人付的税钱不超过甲C.丙应出的税钱约为32D.甲、乙、丙三人出税钱的比例为56:35:1811.[2019·焦作模拟]条形图给出的是2017年全年及2018年全年全国居民人均可支配收入的平均数与中位数,饼图给出的是2018年全年全国居民人均消费及其构成,现有如下说法:①2018年全年全国居民人均可支配收入的平均数的增长率低于2017年;②2018年全年全国居民人均可支配收入的中位数约是平均数的;③2018年全年全国居民衣(衣着)食(食品烟酒)住(居住)行(交通通信)的支出超过人均消费的,则上述说法中,正确的个数是()A.3 B.2 C.1 D.012.[2019·湘潭模拟]高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为,,,,,它们的平均数为,方差为;其中扫码支付使用的人数分别为,,,,,它们的平均数为,方差为,则,分别为()A., B., C., D.,二、填空题13.[2019·安徽联考]国家气象局统计某市2016年各月的平均气温(单位:℃)数据的茎叶图所示,则这组数据的中位数是________.14.[2019·安阳一中]通常,满分为分的试卷,分为及格线,若某次满分为分的测试卷,人参加测试,将这人的卷面分数按照,,,,,,分组后绘制的频率分布直方图如图所示.由于及格人数较少,某位老师准备将每位学生的卷面分采用“开方乘以取整”的方式进行换算以提高及格率(实数的取整等于不超过的最大整数),如:某位学生卷面分,则换算成分作为他的最终考试成绩,则按照这种方式,这次测试的及格率将变为_____.15.[2019·舒兰一中]某工厂为了对新研发的一种产品进行合理定价,将该产品事先拟订的价格进行试销,得到如下数据.16.[2019·徐汇期末]上海市普通高中学业水平等级考成绩共分为五等十一级,各等级换算成分数如表所示:上海某高中2018届高三()班选考物理学业水平等级考的学生中,有5人取得成绩,其他人的成绩至少是B级及以上,平均分是64分,这个班级选考物理学业水平等级考的人数至少为______人三、解答题17.[2019·厦门外国语]某市2011年至2017年新开楼盘的平均销售价格(单位:千元/平方米)的统计数据如下表:附:参考公式:1221ˆi ii nii x ynxy bxnx ==-=-∑∑, ,其中 , 为样本平均值.参考数据:71137.2i i i x y ==∑,721140i i x ==∑.(1)求 关于 的线性回归方程;(2)利用(1)中的回归方程,分析2011年至2017年该市新开楼盘平均销售价格的变化情况,并预测该市2019年新开楼盘的平均销售价格.18.[2019·大兴联考]随着智能手机的发展,各种“APP”(英文单词Application的缩写,一般指手机软件)应运而生.某机构欲对A市居民手机内安装的APP的个数和用途进行调研,在使用智能手机的居民中随机抽取100人,获得了他们手机内安装APP的个数,整理得到如图所示频率分布直方图.(1)求a的值;(2)从被抽取安装APP的个数不低于50的居民中,随机抽取2人进一步调研,求这2人安装APP的个数都低于60的概率;(3)假设同组中的数据用该组区间的右端点值代替,以本次被抽取的居民情况为参考,试估计A市使用智能手机的居民手机内安装APP的平均个数在第几组(只需写出结论).一、单选题1.【答案】C【解析】设高二总人数为人,抽取的样本中有高二学生人,则高三总人数为人,由题可得()500501350120500x xyx+⎧+-==⎪⎨⎪⎩,解得.故选C.2.【答案】D【解析】由题可得012315a++++=,解得,所以样本的标准差为δ==.故选D.3.【答案】C【解析】样本间隔为560807÷=,则20726-⨯=,则样本中编号最小的是006,故选C.4.【答案】D【解析】对于选项A,互联网行业从业人员中后占56%,占一半以上,所以该选项正确;对于选项B,互联网行业中90后从事技术岗位的人数占总人数的. . ,超过总人数的 ,所以该选项正确;对于选项C,互联网行业中从事运营岗位的人数后占总人数的.,比前多,所以该选项正确;对于选项D,互联网行业中从事运营岗位的人数后占总人数的.,80后占总人数的41%,所以互联网行业中从事运营岗位的人数后不一定比后多.所以该选项不一定正确.故选D.5.【答案】C【解析】从随机数表第1行的第11列数字开始由左到右依次选取两个数字,则选出来的前6名同学的编号分别为17,23,30,20,26,25,∴选出来的第6名同学的编号为25.故选C.6.【答案】C【解析】由茎叶图可得,低于85分且不低于70分的学生共有16人,所以获得“诗词能手”的称号的概率为162 405=,所以分层抽样抽选10名学生,获得“诗词能手”称号的人数为21045⨯=,故选C.7.【答案】C【解析】由题意可得014563.25x++++==,1.33 5.67.414.3455m m my+++++==,又回归方程为,所以,即14.343.215m+=+,所以..,故选C.8.【答案】A【解析】由题意,根据频率分布直方图,可得获得复赛资格的人数为..=650人,故选A.9.【答案】C【解析】由图可知,七个组的频率依次为0.02,0.10,0.22,0.34,0.23,0.05,0.04,因此中位数位于第4组,设为,则.....,解得..故选C.10.【答案】C【解析】乙付的税钱应占总税钱的35035 560350180109=++,可知A正确;乙、丙两人付的税钱占总税钱的5311092<,不超过甲,可知B 正确; 丙应出的税钱为18180010017109109⨯=≈,可知C 错误; 甲、乙、丙三人出税钱的比例为 ,可知D 正确. 本题正确选项C . 11.【答案】A【解析】2018年全年全国居民人均可支配收入的平均数的增长率为 . ,而2017年全年全国居民人均可支配收入的平均数的增长率为 ,故①正确; 因为243360.86228228≈,所以2018年全年全国居民人均可支配收入的中位数约是平均数的 ,故②正确;因为 . . . . . ,2018年全年全国居民衣(衣着)食(食品烟酒)住(居住)行(交通通信)的支出超过人均消费的 ,故③正确. 故正确的个数有3个,故答案为A . 12.【答案】C【解析】由平均数的计算公式,可得数据 , , , 的平均数为()1231001100x x x x x =++++,数据 , , , 的平均数为:()()()()1210012100113232323210032100100x x x x x x x ⎡⎤⎤⎡++++++=++++⨯=+⎢⎥⎥⎢⎦⎣⎣⎦,数据 , , , 的方差为()()()2222121001100s x x x x x x ⎡⎤=-+-++-⎣⎦,数据 , , , 的方差为:()()()(()(){}222121001323232323232100x x x x x x ⎡⎡⎡⎤+-+++-++++-+⎤⎦⎣⎦⎣⎣()()()22221210019999100x x x x x x s ⎡⎤=-+-++-=⎣⎦,故选C .二、填空题 13.【答案】20.5【解析】将茎叶图各数据从小到大排列,可得中位数为202120.52+=. 14.【答案】0.82.【解析】先考虑不进行换算前 分以上(含 分)的学生的频率,该频率为 . . ,换算后,原来 分以上(含 分)的学生都算及格,故这次测试的及格率将变为0.82. 15.【答案】58 【解析】()11345678962x =+++++=,()1908483807568806y =+++++=, ∴()138041062a =--⨯=,∴回归方程为1ˆ406yx =-+, 当12x =时,4121068ˆ5y=-⨯+=,故答案为58. 16.【答案】15【解析】设取得A 成绩的x 人,取得 成绩的y 人,取得B 成绩的z 人, 则 ,即 , 又x ,y , ,即当且仅当 , , 时, 取得最小值15, 取得A 成绩的0人,取得 成绩的0人,取得B 成绩的10人, 这个班级选考物理学业水平等级考的人数至少为15人, 故答案为15.三、解答题17.【答案】(1) . . ;(2)见解析. 【解析】(1)由题意知:123456747x ++++++==,3 3.4 3.7 4.5 4.9 5.364.47y ++++++==,所以12221137.274 4.40.5174ˆ40ni ii nii x ynxybxnx ==--⨯⨯===-⨯-∑∑, . . . , 所以线性回归方程为: . . .(2)由(1)得到. ,所以2011年至2017年该市新开楼盘平均销售价格的变化是逐年增加的,平均每年每平方增加0.5千元.将 代入线性回归方程 . . 得到: . . . , 故预测该市2019年新开楼盘的平均销售价格为6.9千元/平方米.18.【答案】(1)0.025a =;(2)()35P A =;(3)第4组(或者写成[30,40)).【解析】(1)由()0.0110.0160.0180.0040.001101a a ++++++⨯=,得0.025a =. (2)设事件A 为“这2人手机内安装“APP”的数量都低于 0”,被抽取的智能手机内安装“APP”的数量在[50,60)的有0.004× 0× 00 4人,分别记为a 1,a 2,a 3,a 4,被抽取的智能手机内安装“APP”的数量在[60,70]的有0.00 × 0× 00 人,记为b 1, 从被抽取的智能手机内安装“APP”的数量不低于50的居民中随机抽取2人进一步调研, 共包含10个基本事件,分别为12a a , ,a 1a 4,a 1b 1,a 2a 3,a 2a 4,a 2b 1,a 3a 4,a 3b 1,a 4b 1, 事件A 包含6个基本事件,分别为 , ,a 1a 4,a 2a 3,a 2a 4,a 3a 4,则这2人安装APP的个数都低于60的概率()63P A==.105(3)由题意,可得估计A市使用智能手机的居民手机内安装APP的平均个数为:........,所以可得A市使用智能手机的居民手机内安装APP的平均个数位于第4组.。
统计案例辅导教案与直线2x -y +4=0平行的抛物线y =x 2的切线方程是( ) A .2x -y +3=0 B .2x -y -3=0 C .2x -y +1=0D .2x -y -1=0设a ∈R ,若函数y =e x +ax 有大于零的极值点,则( ) A .a <-1 B .a >-1 C .a >-1eD .a <-1e1.导数极值的求解一、回归分析1.线性回归分析(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(2)线性回归分析:方法是画散点图,求回归直线方程,并用回归直线方程进行预报.其回归方程的截距和斜率的最小二乘估计公式分别为:回归模型中,R 2表示解释变量对于预报变量变化的贡献率.R 2越接近于1,表示回归的效果越好.如果对某组数据可能采取几种不同的回归方程进行回归分析,也可以通过比较几个R 2,选择R 2大的模型作为这组数据的模型.说明:r 只能用于线性模型,R 2则可用于任一种模型. 对线性回归模型来说,22=R r .二、独立性检验1.基本概念(1)对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)假设有两个分类变量X 和Y ,它们的值域分别为{}11x ,y 和{}12y ,y 其样本频数列联表称为2×2列联表:y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计a +cb +da +b +c +d(3)构造随机变量()()()()()()22+++-=++++a b c d ad bc K ,a b c d a c b d利用K 2的大小可以确定在多大程度上可以认为“两个分类变量有关系”,这种方法称为如:如果k >7.879,就有99.5%的把握认为“X 与Y 有关系”.考点一 两个变量间的相关关系【例1】 四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论: ①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^ =-3.476x +5.648; ③y 与x 正相关且y ^ =5.437x +8.493; ④y 与x 正相关且y ^ =-4.326x -4.578.其中一定不正确的结论的序号是( ).A .①②B .②③C .③④D .①④规律方法 在回归直线方程y ^=b ^x +a ^中,b ^代表x 每增加一个单位,y 平均增加的单位数,一般来说,当回归系数b^>0时,说明两个变量呈正相关关系;当回归系数b ^<0时,说明两个变量呈负相关关系.考点二 独立性检验【例2】 通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110去解,计算更繁琐(如年份、需求量不做如上处理),所以平时训练时遇到数据较大的要考虑有没有更简便的方法解决.1.下列两个变量之间的关系是相关关系的是( ). A .速度一定时,位移与时间B .单位面积的产量为常数时,土地面积与总产量C .身高与体重D .电压一定时,电流与电阻2.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是( ). A .直线l 过点(x ,y )B .x 和y 的相关系数为直线l 的斜率C .x 和y 的相关系数在0到1之间D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同3.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( ). A .-1 B .0 C.12 D .14.对具有线性相关关系的变量x ,y ,测得一组数据如下x 2 4 5 6 8 y2040607080根据上表,利用最小二乘法得它们的回归直线方程为y ^=10.5x +a ^,据此模型来预测当x =20时,y 的估计值为( ). A .210 B .210.5 C .211.5 D .212.5A .0.35B .0.45C .0.55D .0.6510.用茎叶图记录甲、乙两人在5次体能综合测评中的成绩(成绩为两位整数),若乙有一次不少于90分的成绩未记录,则甲的平均成绩超过乙的平均成绩的概率为( ).A.25B.710C.45D.1211.已知施化肥量x 与水稻产量y 的试验数据如下表,则变量x 与变量y 是________相关(填“正”或“负”).施化肥量x 15 20 25 30 35 40 45 水稻产量y33034536540544545045512某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.67x +54.9.零件数x (个)1020304050加工时间y (min) 6275 81 89现发现表中有一个数据看不清,请你推断出该数据的值为________. 13.某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为________.14.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:理科 文科 男 13 10 女720已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到K 2=50×(13×20-10×7)223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为________.15.已知某8个数的平均数为5,方差为2,现又加入一个新数据5,此时这9个数的平均数为x,方差为s2,则().A.x=5,s2<2B.x=5,s2>2C.x>5,s2<2D.x>5,s2>2(1)求线性回归方程的基本步骤:(2)需特别注意的是,只有在散点图大致呈直线时,求出的线性回归方程才有实际意义,否则求出的回归方程毫无意义.1.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用过血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.对此,四名同学作出了以下判断:p:有95%的把握认为“这种血清能起到预防感冒的作用”;q:若某人未使用该血清,那么他在一年中有95%的可能性得感冒;r:这种血清预防感冒的有效率为95%;s:这种血清预防感冒的有效率为5%.则下列结论中,正确结论的序号是________.①p∧非q;②非p∧q;③(非p∧非q)∧(r∨s);④(p∨非r)∧(非q∨s).2、统计某校1 000名学生的数学会考成绩,得到样本频率分布直方图如图所示,规定不低于60分为及格,则及格人数是________名.。
高二下数学统计知识点总结在高二下学期的数学学习中,统计学是一个重要的知识点。
通过统计学的学习,我们可以对数据进行收集、整理、分析和解读,从而得出有效的结论。
本文将对高二下学期的数学统计知识点进行总结,并提供相应的例题进行说明。
1. 统计调查的设计与方法统计调查是数据收集的基础,设计合理的调查方法对于得到准确可靠的数据非常重要。
常见的统计调查方法包括问卷调查、抽样调查和实地观察等。
在设计统计调查时,我们需考虑样本容量、样本选择方式以及调查项目的具体内容等。
例题:某班级有50名学生,老师想要了解学生的学习情况。
她决定采用随机抽样的方法,从班级中选取10名学生进行调查。
请问这个调查样本的样本容量是多少?解答:样本容量表示调查中的样本数量,根据题目可知,调查样本的数量为10,因此样本容量为10。
2. 数据的整理与描述在统计学中,我们需要对收集到的数据进行整理与描述,以便更好地理解和分析数据。
数据的整理可以包括数据的分类统计、频数统计、频率统计等。
数据的描述主要包括数据的中心趋势(均值、中位数、众数)和数据的离散程度(极差、方差、标准差)等。
例题:某班级的学生考试成绩如下:85、90、78、92、84。
请问这组数据的平均分是多少?解答:平均分表示数据的中心趋势,可以通过求数据总和除以数据个数得到。
根据题目可知,这组数据的平均分为(85+90+78+92+84)/5 = 85.8。
3. 随机变量与概率分布随机变量是数学统计中的重要概念,它表示实验结果的可变性。
概率分布是随机变量取值的概率分布情况,常见的概率分布包括离散型概率分布(如二项分布、泊松分布)和连续型概率分布(如正态分布、指数分布)等。
例题:一枚公正的硬币进行二次投掷,每次投掷结果为正面或反面。
设X表示正面出现的次数。
请问X的概率分布是什么?解答:由于硬币的投掷结果只有两种可能性(正面或反面),可以利用二项分布来描述X的概率分布。
其中,X的取值范围为0到2,对应的概率分别为1/4、1/2和1/4。
2019年高二文科数学暑期系统复习1:统计案例(附解析)经典例题理1.[2019·哈六中]有如下四个命题:①甲乙两组数据分别为甲:28,31,39,42,45,55,57,58,66;乙:29,34,35,48,42,46,55,53,55,67.则甲乙的中位数分别为45和44.②相关系数.,表明两个变量的相关性较弱.③若由一个22列联表中的数据计算得的观测值.,那么有95%的把握认为两个变量有关.④用最小二乘法求出一组数据,,,,的回归直线方程后要进行残差分析,相应于数据,,,,的残差是指.以上命题“错误”的序号是_______.【答案】②【解析】①由甲的数据可知它的中位数为45,乙的中位数为4246442+=,故①正确;②相关系数.时,两个变量有很强的相关性,故②错误;③由于的观测值.,满足..,故有95%的把握认为两个变量有关,所以③正确;④用最小二乘法求出一组数据,,,,的回归直线方程后要进行残差分析,相应于数据,,,,的残差是指,故④正确.故答案为②.经典集训一、单选题1.[2019·重庆一中]下面是列联表则表中,A.33,66 B.25,50 C.32,67 D.43,562.[2019·赣州期中]已知回归直线方程中斜率的估计值为.,样本点的中心,,则回归直线方程为()A... B...C.. D..3.[2019·黄山质检]为了判断高中生选修理科是否与性别有关.现随机抽取50名学生,得到如下列联表:根据表中数据,得到的观测值()225013201074.84423272030K⨯⨯-⨯=≈⨯⨯⨯,若已知..,..,则认为选修理科与性别有关系出错的可能性约为()A. B. C. D.4.[2019·宁德质检]在一组数据为,,,,,,(,,,,不全相等)的散点图中,若这组样本数据的相关系数为 ,则所有的样本点,,,,满足的方程可以是()A.112y x=-+ B. C. D.5.[2019·衡阳一中]某学校为了制定治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的 份调查问卷,得到了如下的列联表:A.. B.. C. . D. .6.[2019·徐州月考]在一组样本数据,,,,,,(,,,,不全相等)的散点图中,若所有样本点,(=,,,,)都在直线=上,则这组样本数据的样本相关系数为()A.1- B.0 C.2 D.17.[2019·福州期中]为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,根据调查数据得到的观测值.,则认为选修文科与性别有关系出错的可能性为()(..,..,..)A.0.025 B.0.01 C.0.05 D.不确定8.[2019·四川联考]下列说法中错误的是()A.从某社区65户高收入家庭,28户中等收入家庭,105户低收入家庭中选出100户调查社会购买力的某一项指标,应采用的最佳抽样为分层抽样.B.线性回归直线一定过样本中心点,C.若两个随机变量的线性相关性越强,则相关系数的值越接近于D.若一组数据、、、的众数是,则这组数据的中位数是9.[2019·四川联考]下列说法中错误的是()A.先把高二年级的名学生编号为到,再从编号为到的名学生中随机抽取名学生,其编号为,然后抽取编号为,,,,的学生,这样的抽样方法是系统抽样法.B.正态分布,在区间,和,上取值的概率相等C.若两个随机变量的线性相关性越强,则相关系数的值越接近于D.若一组数据、、、的平均数是,则这组数据的众数和中位数都是10.[2019·山东联考]相关变量,的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程,相关系数为;方案二:剔除点,,根据剩下数据得到线性回归直线方程:,相关系数为.则()A. B. C. D.11.[2019·贵州适应]2018年12月1日,贵阳市地铁一号线全线开通,在一定程度上缓解了出行的拥堵状况.为了了解市民对地铁一号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构,并制作出如下等高条形图:根据图中(岁以上含岁)的信息,下列结论中不一定正确的是()A.样本中男性比女性更关注地铁一号线全线开通B.样本中多数女性是岁以上C.岁以下的男性人数比岁以上的女性人数多D.样本中岁以上的人对地铁一号线的开通关注度更高12.[2019·十堰月考]针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有的把握认为是否追星和性别有关,则男生至少有()参考数据及公式如下:()()()()()2n ad bc K a b c d a c b d -=++++A .12B .11C .10D .18 二、填空题13.[2019·孝感期中]某企业对4个不同的部门的个别员工的年旅游经费调查发现,员工的年旅游经费 (单位:万元)与其年薪(单位:万元)有较好的线性相关关系,通过下表中的数据计算得到 关于 的线性回归方程为 . . .那么,相应于点 , . 的残差为__________.14.[2019·深圳期中]为了判断高中三年级学生是否选择文科与性别的关系,现随机抽取50名学生, 得到如下 列联表:已知 . . , . . 。
根据表中数据,得到的观测值()2501320107 4.84423272030k ⨯⨯-⨯=≈⨯⨯⨯,则有_____以上把握认为选择文科与性别有关系.15.[2019·宜昌联考]在一组样本数据为 , , , ,, ,, , , , 不全相等 的散点图中,若所有样本点 , , , ,都在直线132y x =--上,则这组样本数据的相关系数 _______.16.[2019·钦州期末]某公司调查了商品 的广告投入费用 (万元)与销售利润 (万元)的统计数据,如下表:由表中的数据得线性回归方程为 ,则当 时,销售利润 的估值为__________.其中:()1221ˆniii nii x ynxybxn x ==-=-∑∑,a b y x =-.三、解答题17.[2019·长沙一中]为推动更多人阅读,联合国教科文组织确定每年的4月23日为“世界读书日”设立目的是希望居住在世界各地的人,无论你是年老还是年轻,无论你是贫穷还是富裕,都能享受阅读的乐趣,都能尊重和感谢为人类文明做出过巨大贡献的思想大师们,都能保护知识产权.为了解不同年龄段居民的主要阅读方式,某校兴趣小组在全市随机调查了200名居民,经统计这200人中通过电子阅读与纸质阅读的人数之比为3:1,将这200人按年龄分组,其中统计通过电子阅读的居民得到的频率分布直方图如图所示,(1)求a 的值及通过电子阅读的居民的平均年龄;(2)把年龄在第1,2,3组的居民称为青少年组,年龄在第4,5组的居民称为中老年组,若选出的200人中通过纸质阅读的中老年有30人,请完成下面2×2列联表,并判断是否有97.5%的把握认为 阅读方式与年龄有关?参考公式:2()()()()K a b a d b c c d =++++.18.[2019·康杰中学]某品牌新款夏装即将上市,为了对新款夏装进行合理定价,在该地区的三家连锁店各进行了两天试销售,得到如下数据:(1程 ;(2)在大量投入市场后,销量与单价仍然服从(1)中的关系,且该夏装成本价为40元/件,为使该新夏装在销售上获得最大利润,该款夏装的单价应定为多少元?(保留整数)附:()()()121ˆnii i nii xx y y bxx ==--=-∑∑,.一、单选题 1.【答案】A【解析】461333a =-=,33333366b a =+=+=.故选A .2.【答案】A【解析】设线性回归方程 中,由题意得 . , ∴ . .又回归直线过样本点的中心 , ,∴ . , ∴ . ,∴回归直线方程为 . . . 故选A . 3.【答案】B【解析】由观测值 . ,对照临界值得4.844 3.841>,由于()2 3.8410.05P X ≥≈,∴认为选修理科与性别有关系出错的可能性为5%. 故选B . 4.【答案】A【解析】∵这组样本数据的相关系数为 , ∴这一组数据 , , , ,, , 线性相关,且是负相关,∴可排除D ,B ,C ,故选A . 5.【答案】C【解析】由题中数据可得:()()()()()()2225020155108.33325253020n ad bc K a b c d a c b d -⨯⨯-⨯==≈++++⨯⨯⨯,又由临界值表可得 . . , 而 . . ,所以“是否同意限定区域停车与家长性别有关”的把握约为 . . 故选C .6.【答案】D【解析】在一组样本数据的散点图中,所有样本点(),i i x y (i =1,2,,n )都在一条直线21y x =+上,那么这组样本数据完全正相关,且相关系数为1.故选D .7.【答案】C【解析】由5.024 4.844 3.841>>,而()2 3.8410.05P K ≥≈,()2 5.0240.025P K ≥≈, 故选修文理科与性别有关系出错的可能性约为5%,故答案为5%.8.【答案】C【解析】对于A ,由于各个家庭收入差距明显适于用分层抽样,A 正确;对于B ,线性回归直线 一定过样本中心点 , ,B 正确;对于C ,两个随机变量的线性相关性越强,则相关系数 的值越接近于 ,C 错误; 对于D ,一组数据 、 、 、 的众数是 , ;所以该组数据的中位数为 ,D 正确.故选C 项.9.【答案】C【解析】对于A ,根据抽样方法特征是数据多,抽样间隔相等,是系统抽样,A 正确; 对于B ,正态分布 , 的曲线关于 对称,区间 , 和 , 与对称轴距离相等,所以在两个区间上的概率相等,B 正确;对于C ,两个随机变量的线性相关性越强,则相关系数 的值越接近于 ,C 错误; 对于D ,一组数据 、 、 、 的平均数是 , ;所以该组数据的众数和中位数均为 ,D 正确.10.【答案】D【解析】由散点图得负相关,所以,,因为剔除点,后,剩下点数据更具有线性相关性,更接近,所以.故选D.11.【答案】C【解析】由左图知,样本中的男性数量多于女性数量,A正确;由右图知女性中岁以上的占多数,B正确;由右图知,岁以下的男性人数比岁以上的女性人数少,C错误;由右图知样本中岁以上的人对地铁一号线的开通关注度更高,D正确.故选C.12.【答案】A【解析】设男生人数为,依题意可得列联表如下:则.,由2222352361833.841822x x xK xx xx x⎛⎫-⎪⎝⎭==>⋅⋅⋅,解得.,2x ,6x 为整数, 若在犯错误的概率不超过 的前提下认为是否喜欢追星和性别有关,则男生至少有 人,故选A .二、填空题13.【答案】0.0284【解析】当 时, . ,∴残差为y- . . . .故答案为 . .14.【答案】95%【解析】 . . 且 . . ,有 以上的把握认为选择文科与性别有关系,本题正确结果 .15.【答案】 【解析】因为102-<,所以这两个变量成负相关,故这组样本数据的相关系数为负值, 又所有样本点 , , , , ,都在直线132y x =--上,则 ,所以 .16.【答案】12.2 【解析】由题中数据可得:235644x +++==,5791184y +++==, 所以()4142214253759611448 1.4492536414ˆ6i i i i i x y xyb xx ==-⨯+⨯+⨯+⨯-⨯⨯===+++-⨯-∑∑, 所以8 1.44 2.4x a b y =-=-⨯=,故回归直线方程为 1.4 2.4x y =+,所以当时, 1.47 2.412.2y=⨯+=.三、解答题17.【答案】(1)0.035a=,41.5;(2)有97.5%的把握认为阅读方式与年龄有关.【解析】(1)由频率分布直方图可得()100.010.0150.030.011a⨯++++=,解得0.035a=,所以通过电子阅读的居民的平均年龄为:20100.0130100.01540100.03550100.0360100.10514.⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯=⨯.(2)由题意200人中通过电子阅读与纸质阅读的人数之比为3:1,∴纸质阅读的人数为1200504⨯=,其中中老年有30人,∴纸质阅读的青少年有20人,电子阅读的总人数为150,青少年人数为()1500.10.150.3590⨯++=,则中老年有60人,得22⨯列联表,计算2200903060202006.061 5.024501501109033K⨯-⨯==≈>⨯⨯⨯,所以有97.5%的把握认为阅读方式与年龄有关.18.【答案】(1) 2.25270.25y x=-+;(2)80.【解析】(1),,三家连锁店平均售价和销量分别为:,,,,,,∴,,∴()()()()()()()()()2228385837985858079878574792.258385858ˆ58785b-⨯-⨯-⨯-⨯-⨯-==--+-+-,∴.,...(2)设该款夏装的单价应定为元,利润为元,则.....当时,取得最大值,故该款夏装的单价应定为80元.。