2019-2020年高中数学第一章统计1.6统计活动:结婚年龄的变化自主练习北师大版必修
- 格式:doc
- 大小:279.00 KB
- 文档页数:3
1.5 用样本估计总体 1.6 统计活动 结婚年龄的变化[航向标·学习目标]1.通过实例体会频率分布的意义和作用,在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图,体会它们各自的特点.2.会用样本的频率分布估计总体的分布,用样本的基本数字特征,估计总体的数字特征. 3.体会统计的作用和基本思想,形成对数据处理过程进行初步评价的意识,激发学生的兴趣.[读教材·自主学习]1.频率分布直方图:图中每个小矩形的宽度为□01Δx i (分组的宽度),高为□02f i Δx i,小矩形的面积恰为相应的□03频率f i ,通常我们称这样的图形为频率分布直方图. 2.频率折线图:在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的□04中点开始,用线段依次连接各个矩形的顶端□05中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.3.样本平均数:假设通过随机抽样得到的样本为x 1,x 2,…,x n ,我们把□06x -=x 1+x 2+…+x nn称为样本平均数,用样本平均数来估计总体的平均数.4.样本标准差:假设通过随机抽样得到的样本为x 1,x 2,…,x n . 我们把□07s =s 2=(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2n称为样本标准差.用样本标准差来估计总体的标准差.[看名师·疑难剖析]1.频率分布表和频率分布直方图的特征(1)频率分布表中的数字和频率分布直方图的形状都与分组数(组距)有关;频率分布直方图的外观还和坐标系单位长度有关.分组数的变化可引起频率分布表和频率分布直方图的结构变化;坐标系的单位长度的变化只能引起频率分布直方图的形状沿坐标轴方向的拉伸变化.(2)随机性:频率分布表和频率分布直方图由样本决定,因此会随着样本的改变而改变. (3)规律性:根据频率趋近于概率的原理若固定分组数,随着样本容量的增加,频率分布表中的各个频率会稳定于总体中任一个体分布在相应分组的概率,从而频率分布直方图中的各个矩形的高度也会稳定在特定的值(即相应的概率除以组间距)上.(4)在频率分布直方图中,每个小矩形的面积等于相应数据组的频率,小矩形的高等于数据组的频率除以组距.2.频率分布表、频率分布直方图的优点(1)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.但是从直方图本身得不出原始的数据内容.(2)频率折线图的优点是它反映了数据的变化趋势.如果样本容量不断增加,分组的组距不断缩小,那么折线图就趋向于总体分布趋势的图形.考点一频率分布表、频率分布直方图及折线图例1 美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2001年的小布什,共43任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,4 2,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.[分析] 由本题可获得以下主要信息:①本题给出了样本数据;②本题要列表画图.解答本题可先列出频率分布表,再按步骤作出频率分布直方图及折线图.[解] (1)以4为组距,列表如下:年龄分组频数频率频率组距[41.5,45.5)20.04650.0116 [45.5,49.5)60.13950.0349 [49.5,53.5)80.18600.0465 [53.5,57.5)160.37210.0930 [57.5,61.5)50.11630.0291 [61.5,65.5)40.09300.0233 [65.5,69.5]20.04650.0116(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.类题通法在列频率分布表时,先求极差(即最大值-最小值)再分组,注意分组不能太多也不能太少,要牢固掌握列频率分布表及画频率分布直方图、频率分布折线图的步骤与方法.[变式训练1]为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组数如下:[10.75,10.85),3;[10.85,10.95),9;[10.95,11.05),13;[11.05,11.15),16;[11.15,11.25),26;[11.25,11.35),20;[11.35,11.45),7;[11.45,11.55),4;[11.55,11.65],2.(1)列出频率分布表;(2)画出频率分布直方图以及频率分布折线图;(3)根据上述图表,估计数据落在[10.95,11.35)范围内的可能性是多大?解(1)画出频率分布表.分组频数频率[10.75,10.85)30.03[10.85,10.95)90.09[10.95,11.05)130.13[11.05,11.15)160.16[11.15,11.25)260.26[11.25,11.35)200.20[11.35,11.45)70.07[11.45,11.55) 4 0.04 [11.55,11.65]2 0.02 合计1001.00(2)画频率分布直方图与频率分布折线图,如下图所示.(3)由上述图表可知数据落在[10.95,11.35)范围内的频率为0.13+0.16+0.26+0.20=0.75=75%,即数据落在[10.95,11.35)范围内的可能性是75%. 考点二 样本平均数与标准差的计算例2 一个水库养了某种鱼10万条,从中捕捞了20条,称得它们的质量如下(单位:千克):1.15,1.04,1.11,1.07,1.10,1.32,1.25,1.19,1.15,1.21,1.18,1.14,1.09,1.25,1.21,1.29,1.16,1.24,1.12,1.16.计算样本平均数,并根据结果估计水库里的所有鱼的总质量.[分析] 利用样本均值公式x -=1n(x 1+x 2+…+x n ),由鱼的平均质量与水库中鱼的总数量便可求得总质量.[解] x -=120[1.15+1.04+1.11+1.07+1.10+1.32+1.25+1.19+1.15+1.21+1.18+1.14+1.09+1.25+1.21+1.29+1.16+1.24+1.12+1.16]=120×23.43=1.1715(千克).水库中鱼的总质量约为1.1715×100000=117150(千克).答:样本平均数为1.1715千克,估计水库里的所有鱼的总质量为117150千克. 类题通法样本均值又称样本平均数,也称为样本的算术平均数,公式为x -=1n(x 1+x 2+…+x n ),本例是计算样本平均数的简单应用,很明显是用部分反映整体的一个例子.[变式训练2] 一名射击运动员射击8次所中环数如下: 9.9,10.3,9.8,10.1,10.4,10,9.8,9.7.(1)8次射击平均环数x -是多少?标准差是多少?(2)环数落在x --s 与x -+s 之间的有几次?所占百分比是多少? 分析 只有正确地利用平均数公式求出x -,才能正确地求出标准差. 解 (1)x -=10+18(-0.1+0.3-0.2+0.1+0.4+0-0.2-0.3)=10(环),s 2=18[(9.9-10)2+(10.3-10)2+…+(9.7-10)2]=18[0.01+0.09+…+0.09]=18×0.44=0.055(环2),所以s =0.055≈0.235(环).(2)x --s =9.765,x -+s =10.235.所以环数落在x --s 与x -+s 之间的有5次,所占百分比为62.5%. 考点三 用样本数字特征估计总体数字特征例3 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下.(1)试估计这种日光灯的平均使用寿命和标准差; (2)若定期更换,可选择多长时间统一更换合适?[分析] 总体的平均数与标准差往往很难求,甚至是不可求的,通常的做法就是用样本的平均数与标准差去估计总体的平均数与标准差.只要样本的代表性好,这种做法是合理的.[解] (1)各组中值分别为165,195,225,255,285,315,345,375,由此,算得平均数约为1100(165×1+195×11+225×18+255×20+285×25+315×16+345×7+375×2)=267.9≈268(天).将各组中值对于此平均数求方差, 得1100×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]≈2128.6(天2),故标准差约为2128.6≈46(天).估计这种日光灯的平均使用寿命约为268天,标准差约为46天. (2)由(1)可知,可在222天到314天内的某一天统一更换较合适. 类题通法(1)在刻画样本数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.(2)平均数和标准差是工业生产中监测产品质量的重要指标,当样本的平均数或标准差超过了规定界限的时候,说明这批产品的质量可能距生产要求有较大的偏离.应该进行检查,找出原因,从而及时解决问题.[变式训练3] 某农户在承包的荒山上共种植了44棵樱桃树,2018年采摘时,先随意采摘5棵树上的樱桃,称得每棵树上的樱桃重量为(单位:千克)35,35,34,39,37.(1)根据以上数据估计该农户2018年樱桃的产量;(2)已知该农户的44棵樱桃树在2016年共收获樱桃1100千克,若近几年的产量的年增长率相同.依照(1)中所估计的2018年的产量,预计2019年该农户可收获樱桃多少千克.分析 (1)首先应计算样本平均数,然后用样本平均数去估计总体平均数,从而计算出总产量.(2)由2016年的产量,设每年的增长率为x ,则可列出2018的产量,从而求出增长率,最后由增长率可估计出2019年的产量.解 (1)从44棵樱桃树中抽取5棵,每棵的平均产量为: x -=x 1+x 2+x 3+x 4+x 55=35+35+34+39+375=35+15(0+0-1+4+2)=36(千克).所以估计2018年的总产量为:36×44=1584(千克).(2)设2016年到2018年中,樱桃产量的年增长率为x ,根据题意,得1100(1+x )2=1584,即(1+x )2=1.44,解这个方程得x 1=0.2,x 2=-2.2(舍去).根据每年的增长率相同,则预计2019年的产量为:1584(1+x )=1584×1.2=1900.8(千克).答:(1)估计该农户2018年樱桃的产量是1584千克.(2)预计2019年该农户可收获樱桃1900.8千克.[例] (12分)在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日.评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率高? (一)精妙思路点拨(二)分层规范细解(1)依题意知第三组的频率为 42+3+4+6+4+1①=15.2分又∵第三组的频数为12,∴本次活动的参评作品数为12 1 5=60②.4分(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×62+3+4+6+4+1①=18(件).8分(3)第四组的获奖率是1018=59.第六组上交的作品数量为60×12+3+4+6+4+1①=3(件),11分∴第六组的获奖率为23=69,显然第六组的获奖率高.12分(三)来自一线的报告通过阅卷后分析,对解答本题的失分警示和解题启示总结如下:(注:此处的①②见分层规范细解过程)(四)类题练笔掌握某乡镇供电所为了调查农村居民用电量情况,随机抽取了500户居民去年的月均用电量(单位:kW/h),将所得数据整理后,画出频率分布直方图如下,其中直方图从左到右前3个小矩形的面积之比为1∶2∶3,试估计:(1)该乡镇月均用电量在39.5~43.5内的居民所占百分比约是多少? (2)该乡镇居民月均用电量的中位数约是多少?(精确到0.01)解 (1)设直方图从左到右前3个小矩形的面积分别为P,2P,3P .由直方图可知,最后两个小矩形的面积之和为(0.0875+0.0375)×2=0.25.因为直方图中各小矩形的面积之和为1,所以P +2P +3P =1-0.25,即P =0.125, 所以3P +0.0875×2=0.55.由此估计,该乡镇居民月均用电量在39.5~43.5内的居民所占百分比约是55%. (2)显然直方图的面积平分线位于正中间一个矩形内,且该矩形在面积平分线左侧部分的面积为0.5-P -2P =0.5-0.375=0.125.设样本数据的中位数为39.5+x ,正中间一个矩形的面积为3P =0.375, 所以x ∶2=0.125∶0.375, 即x =23≈0.67.从而39.5+x ≈40.17,由此估计,该乡镇居民月均用电量的中位数约是40.17(kW/h). (五)解题设问(1)频率分布直方图中,小矩形的面积的含义是什么?________.(2)根据中位数的含义,过样本数据中位线对应的点,作横轴的垂线,此垂线应在什么位置?________.答案 (1)对应组的频率 (2)直方图面积的平分线处1.在频率分布直方图中,各个长方形的面积表示( ) A .落在相应各组的数据的频数 B .相应各组数据的频率 C .该样本所分成的组数 D .该样本的样本容量 答案 B解析 在频率分布直方图中,横轴是组距,纵轴是频率组距,故每个小长方形的面积是相应各组数据的频率.故选B.2.用样本中的频率分布来估计总体情况时,下列说法中正确的是( ) A .样本容量的大小与估计准确与否无关 B .估计准确与否只与总体容量的大小有关 C .样本容量越大,估计结果越准确 D .估计结果准确与否仅与样本分组数有关 答案 C解析 一般来说,样本容量越大,估计准确度越高,而与分组数无关. 3.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5),2;[15.5,19.5),4;[19.5,23.5),9;[23.5,27.5),18;[27.5,31.5),11;[31.5,35.5),12;[35.5,39.5),7;[39.5,43.5),3.根据样本的频率分布估计,大于或等于31.5的数据约占( )A.211 B.13 C.12 D.23答案 B解析 由题意知,样本容量为66,而落在[31.5,43.5)内样本数为12+7+3=22,故所求概率为2266=13.4.容量为100的样本的频率分布直方图如下图,试根据图形中的数据填空.(1)样本数据落在范围[6,10)内的频率为________;(2)样本数据落在范围[10,14)内的频数为________.答案(1)0.32 (2)36解析频率=频率组距×组距,频数=频率×样本容量.故样本数据落在[6,10)内的频率为0.08×4=0.32,数据落在[10,14)内的频数为0.09×4×100=36.5.有一个容量为50的样本,数据的分组及各组的频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5],4.(1)列出样本频率分布表;(2)画出频率分布直方图;(3)根据频率分布直方图估计,数据落在[15.5,24.5)内的可能性约是多少?解(1)频率分布表如下表:分组频数频率[12.5,15.5)30.06[15.5,18.5)80.16[18.5,21.5)90.18[21.5,24.5)110.22[24.5,27.5)100.20[27.5,30.5)50.10[30.5,33.5]40.08合计50 1.00(2)频率分布直方图如下图所示.(3)数据落在[15.5,24.5)内的频率为8+9+1150=2850=0.56,所以数据落在[15.5,24.5)内的可能性约是56%.。
§5用样本估计总体§6统计活动:结婚年龄的变化1.频率分布直方图(1)概念:频率分布是指样本数据在各个小范围内所占比例的大小.一般用频率分布①反映样本的频率分布.作频率分布直方图的一般步骤:(i)计算一组数据中最大值与最小值的差,即求②;;(ii)决定组距与组数,组数=极差组距(iii)将数据分组;(iv)列频率分布表;(v)画频率分布直方图.(2)频率分布直方图的特征:(i)从频率分布直方图可以清楚地看出数据分布的总体趋势;(ii)从频率分布直方图得不出原始的数据内容.2.频率折线图、总体密度曲线(1)频率折线图的定义:连接频率分布直方图中各个小长方形上端的③,就得到频率折线图.(2)总体密度曲线的定义:在样本频率分布直方图中,随着样本容量的增加,所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为④.它能够精确地反映总体在各个范围内取值的百分比,它能给我们提供更加精确的信息.3.用样本数字特征估计总体数字特征⑤体现样本数据的最大集中点,但是无法客观地反映总体特征.⑥是样本数据所占频率的等分线,不受极端值的影响.⑦可以反映更多的关于样本数据的信息,但平均数受数据中极端值的影响较大.上面三个数据反映数据的集中趋势,而方差、标准差则反映数据的离散程度.一般地,从样本数据得到的平均数和标准差,并不是总体数据真正的平均数和标准差,而只是对总体数据的一个估计,但这种估计是合理的,特别是样本容量很大时,它们确实反映了总体数据的信息.基础巩固训练1.如图是某城市通过抽样得到的居民某年的月均用水量(单位:吨)的频率分布直方图.直方图中x的值为( )A.0.11B.0.12C.0.13D.0.142.从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的人数为8,其频率为0.4,则样本容量是( )A.20B.40C.70D.803.将容量为50的样本数据,按从小到大的顺序分为6组,如下表所示:组号 1 2 3 4 5 6频数 6 8 10 10 9 7第3组的频率和前3组的累积频率是( )A.0.2和0.5B.0.2和0.48C.0.06和0.24D.0.14和0.484.下列说法正确的是 ( )A.样本的数据个数等于频数之和B.扇形统计图可以告诉我们各部分的数量分别是多少C.如果一组数据可以用扇形统计图表示,那么它一定可以用频数分布直方图表示D.将频数分布直方图中各个小长方形上面一边的一个端点顺次连接起来,就可以得到频数折线图5.统计某校 1 000名学生的数学测试成绩,得到样本频率分布直方图如图所示(每组包含左端点,不包含右端点),若满分为100分,规定不低于60分为及格,则及格率是( )A.20%B.25%C.60%D.80%6.把容量是100的样本分成8组,从第1组到第4组的频数分别是15,17,11,13,第5组到第7组的频率之和是0.32,那么第8组的频率是.能力提升训练7.已知样本:12,7,11,12,11,12,10,10,9,8,13,12,10,9,6,11,8,9,8,10,那么频率为0.25的数据的范围是( )A.[5.5,7.5)B.[7.5,9.5)C.[9.5,11.5)D.[11.5,13.5)8.在抽查产品尺寸的过程中,将其尺寸分成若干组.[a,b)是其中的一组,抽查出的个体在该组上的频率为m,该组在直方图中的高为h,则|a-b|=( )A.hmB.mhC.hD.h+mm9.为了了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名授课教师中抽取20名教师,有6人使用,由此估计200名教师中使用多媒体的人数为.10.为了了解中学生的身高情况,对育才中学同龄的50名男学生的身高进行了测量,结果如下:(单位:cm)175 168 180 176 167 181 162 173 171 177171 171 174 173 174 175 177 166 163 160166 166 163 169 174 165 175 165 170 158174 172 166 172 167 172 175 161 173 167170 172 165 157 172 173 166 177 169 181列出样本的频率分布表,画出频率分布直方图.11.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(各小组包含左端点,不含右端点)(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110)为达标,试估计该学校高一学生的达标率是多少;(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.12.为了调查学生的学习用书的质量情况,下面是从某校高二学生中抽取的20名学生的学习用书的质量(单位:kg).8.4 10.1 6.3 7.1 6.2 6.5 7.6 8.0 8.5 6.410.3 8.8 5.2 4.6 7.8 3.9 4.8 7.2 8.0 6.8(1)作出频率分布直方图;(2)利用频率分布直方图中的组中值对总体平均数及方差进行估计,并与实际结果比较.知识清单①直方图 ②极差 ③中点 ④总体密度曲线 ⑤众数 ⑥中位数 ⑦平均数基础过关基础巩固训练1.B 依题意及频率分布直方图,知0.02+0.1+x+0.37+0.39=1,解得x=0.12. 2.A 样本容量为8÷0.4=20.3.B 第3组的频率=10÷50=0.2,前3组的累积频率为2450=0.48.4.A 扇形统计图反映的是各部分所占的百分比,频数分布直方图反映的是各部分的数量.连接频数分布直方图中各个小长形上面一边的中点,得到频数折线图.5.D 由样本频率分布直方图得成绩不低于60分的频率为(0.025+0.035+0.010+0.010)×10= 0.8=80%.6.答案 0.12解析 前4组的频率分别为15100=0.15,17100=0.17,11100=0.11,13100=0.13,第5组到第7组的频率之和是0.32,故第8组的频率为1-(0.15+0.17+0.11+0.13+0.32)=0.12. 能力提升训练7.D 由题可知,样本容量为20,20×0.25=5,而四个选项中,只有D 选项的区间中有5个数据.8.B |a-b|为组距,在频率分布直方图中,纵轴为频率组距,则|a-b|=mℎ.9.答案 60解析 200×620=60(人).10.解析 在这个样本中,最大值为181,最小值为157,它们的差是24,可以取组距为4,分成7组,根据题意列出样本的频率分布表如下:分组 频数 频率 156.5~160.5 3 0.06 160.5~164.5 4 0.08 164.5~168.5120.24168.5~172.5 12 0.24 172.5~176.5 13 0.26 176.5~180.5 4 0.08 180.5~184.52 0.04 合计501.00频率分布直方图如下:11.解析 (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3=0.08. 又因为第二小组频率=第二小组频数样本容量,所以样本容量=第二小组频数第二小组频率=120.08=150.(2)由题图可以估计该学校高一学生的达标率为17+15+9+32+4+17+15+9+3×100%=88%. (3)由题意可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,69<1502<114,所以跳绳次数的中位数落在第四小组内.12.解析 (1)频率分布表如下:质量 频数 频率 [3.9,4.9) 3 0.15 [4.9,5.9) 1 0.05 [5.9,6.9) 5 0.25 [6.9,7.9) 4 0.2 [7.9,8.9)50.25[8.9,9.9) 0 0[9.9,10.9) 2 0.1总计20 1频率分布直方图如图所示.(2)总体平均数估计为4.4×0.15+5.4×0.05+6.4×0.25+7.4×0.2+8.4×0.25+9.4×0+10.4×0.1=7.1 5(kg),方差估计为(4.4-7.15)2×0.15+(5.4-7.15)2×0.05+(6.4-7.15)2×0.25+(7.4-7.15)2×0.2+(8.4-7.15)2×0.25+(9.4-7.15)2×0+(10.4-7.15)2×0.1=2.887 5(kg2),总体平均数x=7.125,方差s2≈2.795 9.两种计算结果比较,存在差距,但不是很大,因而在处理数据问题时,可用频率分布直方图中的组中值进行近似估计.。
6 统计活动:结婚年龄的变化[学习目标] 1.掌握收集数据的方式.2.体会收集数据的过程.3.本节意义在于通过实践活动,验证前面学习知识的科学性与合理性.知识点一进行统计活动所依据的基本思想用样本估计总体.故要设计一个统计活动,首先要确定调查对象,并从中抽取一个合理的样本,也就是收集数据,然后分析整理数据,并得出科学合理的推断,进而估计总体的情况.知识点二搞好统计活动的方法步骤要搞好统计活动,需明确以下几个方法步骤:1.确定调查对象.2.收集数据.3.整理数据.4.分析数据.5.作出推断.题型一统计活动中数据的收集例1 中央电视台主办的“开学第一课”已成为全国中小学生最喜爱的节目,2013年央视又推出了“开学第一课”,再次引起了共鸣.问题:设计步骤,估计你所在的县市的中学生中,喜欢这个节目的学生所占比例的大小.解可以按照如下的步骤来进行这个统计活动:(1)确定调查的对象:该县市的全体中学生;明确调查的目的:是否喜欢“开学第一课”这个节目.(2)利用随机抽样抽取样本,收集数据.由于中学生太多,只能进行抽样调查.由于学校之间存在差别,采用分层抽样在各个中学抽取样本.为了统计的方便,设计如下的调查表,记录下来.(3)整理数据,用表格来表示数据.把所收集到的数据汇总成一个表格,如表:(4)分析数据.由于是调查喜欢“开学第一课”的学生占多大的百分比,所以选用扇形统计图来表示.(5)作出推断.根据扇形统计图作出推断.反思与感悟 统计活动中作出推断结论的准确性,决定于抽取的样本是否具有代表性,以及样本容量的大小,一般来说,用科学的抽样方法抽取样本,并且样本容量足够大,这样的统计活动得到的结论准确性高,可信度大,可以作为决策依据. 跟踪训练1 请设计一个测量全班同学身高的试验. 解 试验的操作步骤设计如下:(1)准备身高测量仪(为了多次测量求平均值,可以准备多架身高测量仪,比如用3架测量仪); (2)安排负责仪器的人,一般每架仪器两人,一人测量一人记录;(3)组织学生排队依次测量.用每架测量仪各测量一次,将所得数据填入下表; (4)整理数据,用求平均值的方法算出每位同学的身高.题型二 例2 某公司销售部有销售人员15人,销售部为了制定某种商品的月销售定额,统计了这15人某月的销售量如下:(1)求这(2)假设销售部负责人把每位营销人员的月销售额定为320件,你认为是否合理,为什么?如果不合理,请你制定一个较合理的销售定额.解 (1)平均数x =115(1 800×1+510×1+250×3+210×5+150×3+120×2)=320,中位数为210,众数为210.(2)不合理.因为15人中有13人的销售额达不到320件,也就是说320件虽是这一组数据的平均数,但它却不能反映营销人员的一般水平,销售额定为210件要合理些,这是由于210件既是中位数,又是众数,是绝大部分人都能达到的定额.反思与感悟 实际问题要先选用有代表性的数据,然后通过整理数据,选用多种方式分析数据,做出正确、合理的决策.跟踪训练2 为了寻求发展,某公司新开发了10个项目,其中一个项目投资为200万,另外9个项目均在2万与20万之间.经分析,中位数是30万,平均数是35万,众数是4万,你会选择哪种数字特征表示这批项目的投资?为什么?解 选择平均数较合适.平均数描述了数据的平均水平,定量地反映了数据的集中趋势所处的水平,从而使总投资资金更有代表性、更有说服力. 题型三 统计活动中的数据分析例3 某风景区对5个旅游景点的门票价格进行了调整,据统计,调价前后各景点的游客人数基本不变,有关数据如表所示:(1)问风景区是怎样计算的?(2)另一方面,游客认为调整收费后风景区的日平均总收入相对于调价前,实际上增加了约9.4%,问游客是怎样计算的?(3)你认为风景区和游客哪一个的说法较能反映整体实际? 解 (1)调整前的平均价格为10+10+15+20+255=16(元).调整后的平均价格为5+5+15+25+305=16(元).因为调整前后的平均价格不变,日平均人数不变,所以日平均总收入不变. (2)游客是这样计算的,原日平均总收入:10×1 000+10×1 000+15×2 000+20×3 000+25×2 000=160 000(元).现在日平均总收入:5×1 000+5×1 000+15×2 000+25×3 000+30×2 000=175 000(元). 日平均总收入增加了175 000-160 000160 000≈9.4%.(3)游客的说法较能反映整体实际.反思与感悟 1.统计活动中的数据分析,可以分析数据中的平均值、方差、标准差、中位数、众数等数字特征数,从而全面把握总体情况.2.统计活动中的数据分析,可以采取图表来分析,如条形图、扇形图、折线图、直方图以及茎叶图等,这样得到的结果更直观,更能体现出各部分数据所占的份量.跟踪训练3 从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:甲品种:271 273 280 285 285 287 292 294 295 301 303 303 307 308 310 314 319 323 325 325 328 331 334 337 352乙品种:284 292 295 304 306 307 312 313 315 315 316 318 318 320 322 322 324 327329 331 333 336 337 343 356由以上数据设计了如下茎叶图:根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论:(1)________________________________________________________________________(2)________________________________________________________________________答案(1)乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度(或乙品种棉花的纤维长度普遍大于甲品种棉花的纤维长度)(2)甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散(或乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中.或甲品种棉花的纤维长度的分散程度比乙品种棉花的纤维长度的分散程度更大)1.为了调查某市高中学生中喜欢数学的同学所占的比例,收集数据后,整理数据的方式是( )A.画频率分布直方图B.茎叶图C.计算平均数和标准差D.扇形统计图答案 D2.某中学人数相等的甲、乙两班学生参加同一次数学测试,两班平均分和方差分别为x 甲=82,x 乙=82,s 2甲=245,s 2乙=190,那么成绩较为整齐的是( ) A .甲班 B .乙班 C .两班一样齐 D .无法确定答案 B解析 x 甲=x 乙,说明甲、乙两班学生的平均成绩一样,但s 2甲>s 2乙,所以乙班的成绩比甲班稳定、整齐.3.期中考试以后,班长算出了全班40个人数学成绩的平均分为M .如果把M 当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均数为N ,那么M ∶N 为( ) A.4041 B .1 C.4140 D .2答案 B解析 N =40M +M41=M ,∴M ∶N =1.4.在甲、乙两个总体中各抽取一个样本,甲的样本平均数为15,乙的样本平均数为17,甲的样本方差为3,乙的样本方差为2,则________的总体波动小. 答案 乙解析 样本方差越大,对应的总体波动越大,样本方差越小,对应的总体波动越小. 5.下列收集数据方式中:①某市教育部门为了了解全市初中学生的视力情况,选择城区的一所初中和农村的一所初中,对这两所学校的全体学生进行检查;②某厂的一台车床每天加工3 000个零件.为了掌握零件的质量,每天选取其中的100个进行相关项目的质量测试;③某校为了调查本校高中学生的数学应用能力,对全校的高中学生进行书面和实践两方面测试;④某工厂为了掌握全厂工人的身体健康状况,请一家医院对全厂工人进行体检; ⑤为了测定一种铜丝的最大控断力,在一批铜丝中取50根进行测试. 其中________是抽样调查,________是普查(填序号). 答案 ①②⑤ ③④在评价中应主要考虑以下几个方面:(1)求解过程和结果要合理、清楚、简洁、正确;(2)独到的思考和发现;(3)提出有价值的求解设计和有见解的新问题;(4)发挥组员的特长,合作学习.更重要的一条是,评价的意识将有助于客观地认识统计的过程、统计分析的方法,有助于理性思维的培养.。
课时作业7 统计活动:结婚年龄的变化相关性|基础巩固|(25分钟,60分)一、选择题(每小题5分,共25分)1.下列变量是线性相关的是( )A.人的体重与视力B.圆心角的大小与所对的圆弧长C.收入水平与购买能力D.人的年龄与体重解析:B为确定性关系;A,D不具有线性关系,故选C.答案:C2.下列各图中所示两个变量具有相关关系的是( )A.①②B.①③C.②④D.②③解析:具有相关关系的两个变量的数据所对应的图形是散点图,②③能反映两个变量的变化规律,它们之间是相关关系.答案:D3.下列语句所表示的事件中的因素不具有相关关系的是( )A.瑞雪兆丰年B.读书破万卷,下笔如有神C.吸烟有害健康D.喜鹊叫喜,乌鸦叫丧解析:“瑞雪兆丰年”和“读书破万卷,下笔如有神”是根据多年经验总结归纳出来的,吸烟有害健康具有科学根据,所以它们都是相关关系,所以A、B、C三项具有相关关系;结合生活经验知喜鹊和乌鸦发出叫声是它们自身的生理反应,与人无任何关系,故D项不具有相关关系.答案:D4.下列说法正确的是( )A.相关关系是函数关系B.函数关系是相关关系C.线性相关关系是一次函数关系D.相关关系有两种,分别是线性相关关系和非线性相关关系解析:函数关系和相关关系互不包含,所以A、B、C三项不正确;根据定义,相关关系有两种,分别是线性相关关系和非线性相关关系.答案:D5.在某种新型材料的研究中,实验人员获得了下边几组实验数据:x 2.01 3.00 3.98 5.10 6.12 y1.504.047.5012.0017.99现准备用下列四个函数中的一个近似地表示这些数据的规律,其中最接近的一个是( )A .y =2x -2B .y =2xC .y =log 2xD .y =12(x 2-1)解析:代入检验. 答案:D二、填空题(每小题5分,共15分)6.以下是收集到的某物品的销售价格y 和物品的大小x 的数据:物品大小/m 2 11.5 110 80 135 105 销售价格/万元4.821.618.429.222则根据数据可以判断x ,y ________相关关系.(填“有”或“无”)解析:物品大小的值由小变大时,销售价格也由小变大,因此,两个变量有相关关系. 答案:有7.在下列各变量之间的关系中:①汽车的重量和百公里耗油量;②正n 边形的边数与内角度数之和;③收入水平与购买能力;④家庭的经济条件与学生的学习成绩.以上具有相关关系的是________(只填序号).解析:由相关关系的概念知①③满足. 答案:①③8.有5个学生的数学和物理成绩如下表:学生学科ABCDE数学 80 75 70 65 60 物理7066686462把数学成绩作为横坐标,把相应的物理成绩作为纵坐标,在直角坐标系中描点(x i ,y i )(i=1,2,…,5),作出散点图如图所示,从散点图中可发现学生的数学成绩与物理成绩之间的关系是________________________________________________________________________.解析:从题图中可以看出各点基本上在一条直线附近,所以数学成绩与物理成绩具有相关关系,且当数学成绩增大时,物理成绩也增大.答案:是相关关系,且数学成绩增大时,物理成绩也增大 三、解答题(每小题10分,共20分)9.李老师为了了解学生的计算能力,对某同学进行了10次测验,收集数据如下: 题数x /道 5 10 15 20 25 30 35 40 45 50 做题时间y /分钟9192637485261738189画出散点图,并判断它们是否有线性相关关系.解析:散点图如图,由散点图可以看出,两者之间具有线性相关关系.10.目前,中国的青少年视力水平下降已引起全社会的关注.为了调查了解某中学高三年级1 500名学生的视力情况,从中抽测了一部分学生的视力,整理数据后,分析数据如下:频率分布表分组 频数 频率 3.95~4.252 0.046 0.12 4.55~4.85 23 4.85~5.15 5.15~5.45 10.02 合计1.00(1)在这个问题中,总体是_________________________;(2)填写频率分布表中未完成的部分;(3)若视力在4.85以上均属正常,不需矫正,试估计该校高三年级学生视力正常的人数约为多少?解:(1)该中学高三年级1500名学生视力 (2)很明显第二组的分组X 围是4.25~4.55;第一组的频数是2,频率是0.04,则样本容量是20.04=50.则第三组的频率是2350=046,第四组的频率是1-0.04-0.12-0.46-0.02=0.36, 第四组的频数是50×0.36=18,频数合计是样本容量50.完整的表格如下:分组频数频率3.95~4.2520.044.25~4.5560.124.55~4.85230.464.85~5.15180.365.15~5.4510.02合计50 1.00(3)视力正常即视力在4.85~5.15、5.15~5.45这两组,其频率是0.36+0.02=0.38,则1500×0.38=570,即估计该校高三年级学生视力正常的人数约为570.|能力提升|(20分钟,40分)11.某市5月1日至5月12日每天感冒患者治愈的有关数据,以及根据这些数据绘制出的散点图.日期 5.1 5.2 5.3 5.4 5.5 5.6人数100109115118121134日期 5.7 5.8 5.9 5.10 5.11 5.12人数141152168175186203下列说法:①根据此散点图,可以判断日期与人数具有线性相关关系;②根据此散点图,可以判断日期与人数具有非线性相关关系;③根据此散点图,可以判断日期与人数具有一次函数关系.其中正确的个数为( )A.0 B.1C.2 D.3解析:由图知所有的点大致集中在一条直线附近,因此,日期与人数具有线性关系,只有①正确.答案:B12.有5组数据对应的点如图所示,去掉点________后,剩下的4组数据的线性相关性就更好了.解析:除D点外,其余的A、B、C、E四点大致分布在某一直线附近,故去掉D点,可使剩下的4组数据的线性相关性更好.答案:D(3,10)13.某种木材体积与树木的树龄之间有如下的对应关系:树龄2345678体积30344060556270(1)请作出这些数据的散点图;(2)你能从散点图中发现木材体积与树木的树龄变化趋势吗?解析:(1)以x轴表示树林的树龄,y轴表示树木的体积,可得相应的散点图如图所示:(2)由散点图中发现木材体积随着树龄的增加而呈增加的趋势.14.对某种鸡胚胎的生长进行研究,测得5~20日龄鸡的胚胎的重量:日龄/天56789101112 胚胎0.2500.4980.846 1.288 1.656 2.662 3.100 4.579重/g日龄/天1314151617181920胚胎6.5187.4869.94814.52215.61019.91423.73626.472重/g(1)请作出这些数据的散点图;(2)关于这两个变量的关系,你能得出什么结论?解析:(1)由题知,散点图如图所示.(2)由散点图可发现,胚胎重与日龄之间具有相关关系,日子越长,生长速度越快.。
2019-2020学年高中数学 基础知识篇 1.7统计活动 结婚年龄的变化训练(含解析)北师大版必修3建议用时 实际用时满分实际得分45分钟100分1.观察下面的散点图,下列说法错误的是( )A.变量y 与x 具有相关关系B.变量y 与x 具有非线形相关关系C.变量y 与x 具有二次函数关系D.变量y 与x 相关关系较明显 2.下列选项正确的是( )A.最小二乘法求出的直线能很好地反映两个变量间的相关关系B.在求线性回归方程时,应先判断两个变量之间是否具有线性相关关系,否则,所求的直线无意义C.利用最小二乘法求线性回归方程时,其中112222212n n nx y x y x y nx yb x x x +++-=+++ D.不具有线性相关关系的两个变量之间不能用最小二乘法求出线性回归方程3. 工人月工资(元)依劳动生产率(千元)变化的回归方程为y=50+80x ,下列判断正确的是( ) A.劳动生产率为1000元时,工资为130元B.劳动生产率提高1000元时,则工资平均提高80元C.劳动生产率提高1000元时,则工资平均提高 130元D.当月工资为210元时,劳动生产率为2000元 4. 设有一个回归方程为y=2-1.5x ,则变量x 增加一个单位时( )A.y 平均增加1.5个单位B.y 平均增加2个单位C.y 平均减少1.5个单位D.y 平均减少2个单位5. 为了考察两个变量x 和y 之间的线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用最小二乘法,求得回归方程所对应的直线分别为12l l 和,已知两个人在试验中发现对变量x 的观测数据的平均数为s ,对变量y 的观测数据的平均数为t ,那么下列说法正确的是( ) A. 12l l 与有公共点(s ,t )B. 12l l 与有交点,但公共点不一定是(s ,t )C. 12l l 和必定平行D. 12l l 和必定重合二、解答题(每小题5分,共15分)6.在利用计算机求线性回归直线方程时,我们通常是利用计算机______软件中的_______功能求出回归方程的系数.7.对于线性回归方程25.275.4+=x y ,当28=x 时,y 的估计值是_______.8. 一机器可以按各种不同的速度运转,其生产的物件有一些会有缺点,每小时生产有缺点物件的多少,随机器运转的速度而变化,下列为其试验结果:则机器速度的影响每小时生产有缺点物件数和回归线性方程为_______. 三、解答题(共60分)9.(15分)5个学生的数学和物理成绩如下表:学 科学 生A B C D E 数学 80 75 70 65 60 物理7066686462画出散点图,并判断它们是否有相关关系.10. (15分)在7块并排、形状大小相同的实验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg):施化肥量x15 20 25 30 35 40 45水稻产量y 33345365 40544545455(1)画出散点图;(2)试判断施化肥量x与水稻产量y是否线性相关?11.( 15分)为了分析某个高二学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x,物理成绩y进行分析.下面是该生7次考试的成绩.数学88 83 1179210810112物理94 91 10896104101106(1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明. (2)已知该生的物理成绩y与数学成绩x是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议.12.(15分)假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:使用年限x(年)2 3 4 5 6 维修费用y(万元)2.23.8 5.5 6.5 7.0 若由资料知,y对x呈线性相关关系,试求:(1)线性回归方程y=bx+a的回归系数a、b;(2)估计使用年限为10年时,维修费用是多少?6 统计活动:结婚年龄的变化7 相关性8 最小二乘估计(必修3北师版)答题纸得分:一、选择题题号 1 2 3 4 5答案二、填空题6. 7. 8.三、解答题9.10.11.12.6 统计活动:结婚年龄的变化7 相关性8 最小二乘估计(必修3北师版)答案一、选择题1.C 解析:本题考查由散点图判断两个变量的相关关系,考查识图能力.2.B3.B 解析:由回归系数b 的意义知,当b >0时,自变量和因变量按同向变化(正相关),当b <0时,自变量和因变量按反向变化(负相关).回归直线斜率b=80,所以x 每增加1,y 平均增加80,可知B 正确.4.C 解析:∵直线回归方程为 ,① ∴y =2-1.5(x+1).② ∴②-①=-1.5,即y 平均减少1.5个单位.5.A 解析:∵在两人的试验中发现变量x 的观测数据的平均数恰好都为s ,变量y 的观测数据的平均数恰好都为t ,∴这两组数据的平均数是相等的,都是(s ,t ).∵线性回归直线一定过样本中心点,∴两条直线都过(s ,t )点,即两条线性回归直线有公共点(s ,t ). 二、填空题6.电子表格,计算7.135.25 解析:∵回归方程y=4.75x+2.25,∴当x=28时,y 的估计值是4.75×28+2.25=135.25. 8.y=0.7286x-0.8571 解析:直接代入回归直线方程的公式,回归直线方程:=a+bx,其中回归系数是1221ni ii nii x ynx yb xnx==-=-∑∑.三、解答题9. 解:把数学成绩作为横坐标,把相应的物理成绩作为纵坐标,在直角坐标系中描点()(i=1,2,…,5).从图中可以直观地看出数学成绩和物理成绩具有相关关系,且当数学成绩减小时,物理成绩也在由大变小,即它们正相关.10.解:(1)以施化肥量x 为横轴,水稻产量为y 轴建立平面直角坐标系,描出各点,画出散点图,如图所示.(2)从图中可以看出,图中各点大致分布在一条直线的附近,故可认为施化肥量与水稻产量线性相关.11. 解:(1) -12-17+17-8+8+0+12-6-9+8-4+4+1+6x =100+=100,y =100+=100,77∴数学成绩的方差是,物理成绩的方差是 (36+81+64+16+16+1+36)=.从而物理的方差小于数学的方差,所以物理成绩更稳定.(2)由于x与y之间具有线性相关关系,所以b==0.5,a=100-0.5×100=50.所以线性回归方程为y=0.5x+50.当y=115时,x=130,即该生物理成绩是115分时,数学成绩是130分.故物理和数学的关系非常密切,要学好物理需要有好的数学做基础12.解:(1)由题意知x=4,y=5,b==1.23,a=5-4×1.23=0.08.(2)由(1)知线性回归方程是=1.23x+0.08,当自变量x=10时,预报维修费用y=1.23×10+0.08=12.38.。
§6 统计活动:结婚年龄的变化课后篇巩固提升1.为了调查某市高中学生中喜欢数学的同学所占的比例,收集数据后,整理数据的方式是( ) A.画频率分布直方图B.画茎叶图D.画扇形统计图.2.某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适( )A.系统抽样B.抽签法C.分层抽样D.随机数法,应选用分层抽样.3.为调查某产品的销售情况,销售部门从下属的92家连锁店中用系统抽样的方法抽取了30家调查,则剔除的个体数为( )A .2B .3C .4D .592=3×30+2可知,应剔除2个个体.4.设矩形的长为a ,宽为b ,其比满足b ∶a=≈0.618,这种矩形给人以美感,称为黄金矩形.黄金5-12矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.598 0.625 0.628 0.595 0.639乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是( )A.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值更接近C.两个批次总体平均数与标准值接近程度相同5.为了了解商场某日旅游鞋的销售情况,抽取了部分顾客购鞋的尺寸,将所得的数据整理后,画出频率分布直方图如图.已知图中从左至右前3个小组的频率之比为1∶2∶3,第4小组与第5小组的频率分别为0.175和0.075,第2小组的频数为10,则抽取的顾客人数是( )A.80B.40D.1006.甲、乙两人在相同的条件下,射击10次,命中环数如下:甲:8 6 9 5 10 7 4 8 9 5乙:7 6 5 8 6 9 6 8 7 7根据以上数据估计两人的技术稳定性,稳定性较好的是 .。
高中数学第一章统计 1.6 统计活动:结婚年龄的变化自我小测北师大版必修31.下列数据适合用试验的方法得到的是( ).A.2000年的全国人口总数B.某学校抽烟的学生在总人数中所占的比例C.某班男生的平均身高D.顾客对某种产品的满意程度2.将甲、乙两名同学5次物理测验的成绩用茎叶图表示如图,若甲、乙两人成绩的中位数分别为x甲,x乙,则下列说法正确的是( ).A.x甲<x乙;乙比甲成绩稳定B.x甲>x乙;甲比乙成绩稳定C.x甲>x乙;乙比甲成绩稳定D.x甲<x乙;甲比乙成绩稳定3.某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适( ).A.系统抽样 B.简单随机抽样C.分层抽样 D.随机数表法4.在某次考试中,10名同学得分如下:84,77,84,83,68,78,70,85,79,95.则这一组数据的众数和中位数分别为( ).A.84,68 B.84,78 C.84,81 D.78,815.某学校共有教师490人,其中不到40岁的有140人,40岁及40岁以上的有350人.为了解普通话在该校教师中的推广普及情况,用分层抽样的方法,从全体教师中抽取一个容量为70人的样本进行普通话水平测试,其中在40岁及40岁以上的教师中应抽取的人数是________.6.某住宅小区有居民2万户,从中抽取200户,调查是否安装电脑,调查结果见下表,则该小区已安装电脑的户数估计为________.7年级1 500名学生的视力情况,从中抽测了一部分学生的视力,整理数据后,绘制频率分布表(不完整)如下:频率分布表(1)(2)填写频率分布表中未完成的部分;(3)若视力为4.9,5.0,5.1均属正常,不需矫正,试估计该校高三年级学生视力正常的人数.8.高二(1)班同学以自己班级50名同学的家庭在同一个月内的用电量为样本,估计全市居民的用电量,他们调查的数据如下(单位:千瓦·时):84 85 95 75 68 50.5 105 5580 90 74.5 65 80.5 82 108 8580 105 108 90 95 75 60 6570.5 85 88.5 82 102 95 84 78.588 55 75 105 74 76 90 7852.5 76 84 94 92 98 68.5 96.566 98.5(1)列出样本的频率分布表;(2)画出样本的频率分布直方图;(3)估计用电量在[70,90)千瓦·时内的居民的比例.参考答案1.解析:A 项,2000年的全国人口总数适合用查资料的方法得到;B 项,某学校抽烟的学生在总人数中所占的比例适合用问卷调查的方法得到;D 项,顾客对某种产品的满意程度也适合用问卷调查的方法得到.答案:C2.解析:x 甲=79,x 乙=82,∴x 甲<x 乙.由茎叶图可知乙的成绩稳定.故选A. 答案:A3.解析:总体由差异明显的三部分组成,应选用分层抽样. 答案:C4.解析:显然,在样本容量为10的这组数据中,众数是84.将这10个数据按由小到大的顺序排列:68,70,77,78,79,83,84,84,85,95,所以中位数是79+832=81.答案:C 5.答案:50 6.解析:65+30200×20 000=9 500. 答案:9 5007.解:(1)该中学高三年级1 500名学生的视力 (2)很明显第二组的范围是4.25~4.55; 第一组的频数是2,频率是0.04,则样本容量是20.04=50.则第三组的频率是2350=0.46, 第四组的频率是1-0.04-0.12-0.46-0.02=0.36, 第四组的频数是50×0.36=18, 频数合计是样本容量50.完整的表格如下.(3)视力为4.9,5.0,5.10.36,则1 500×0.36=540,即估计该校高三年级学生视力正常的人数为540人.8.分析:列频率分布表、画频率分布直方图的步骤:(1)计算极差:样本的最大值与最小值的差;(2)决定组数或组距;组数根据样本容量的大小而定,组数较小或较大都会影响频率分布表和频率分布直方图的结构.一般情况下,当样本的容量在100以内时,分为5~12组为好,样本容量越大,所分组数应越多,组数=极差组距(比值为整数时,则取该整数;比值不为整数时,取大于该数的最小整数);(3)决定分点:决定分点的方法是,使分点数据比样本数据多一位小数,或采用左闭右开的区间进行分组;(4)统计频数、计算频率、填表;(5)画频率分布直方图.解:(1)样本数据的极差为108-50.5=57.5,组距定为10,第一小组起点取为50,则组数为6.频率分布表如下表所示:50名同学家庭月用电量(单位:千瓦·时)(2)(3)由表或图可知月用电量在[70,90)千瓦·时内的频率为0.2+0.26=0.46,即全市用电量在[70,90)千瓦·时内的居民约占46%.。
§6统计活动:结婚年龄的变化§7相关性1.统计活动中,抽样调查在抽取调查对象时( )A.按一定的方法抽取 B.随意抽取C.全部抽取 D.根据个人的爱好抽取2.下列两个变量之间的关系是相关关系的是( )A.正方体的棱长和体积B.角的弧度数和它的正弦值C.单产为常数时,土地面积和总产量D.日照时间与水稻的亩产量3.2009年春季,我国部分地区“手足口”病在婴幼儿中流行,党和政府采取果断措施,防治结合,很快使病情得到控制.下表是某同学记载的5月1日至5月12日每天某市“手下列说法:①根据此散点图,可以判断日期与人数具有线性相关关系;②根据此散点图,可以判断日期与人数具有一次函数关系.其中正确的个数为( )A.0个 B.1个 C.2个 D.以上都不对4.进行统计活动(初婚年龄的变化)的主要步骤是:(1)确定______;(2)______数据;(3)______数据;(4)______数据;(5)______.答案:1.A 抽样调查在抽取调查对象时必须要能保证所抽取的样本具有代表性,使每个个体被抽入样的可能性是相等的,因此抽样时一定要注意事先设计好抽样的程序,按既定的程序进行抽样.2.D A、B、C三项都具有确定的函数关系,∴选D项.3.B4.调查对象收集整理分析作出推断1.对于给定的两个变量的统计数据,下列说法正确的是( )A.都可以分析出两个变量的关系B.都可以用一条直线近似地表示两者的关系C.都可以作出散点图D.都可以用确定的表达式表示两者的关系2.为了了解某交通路口车辆的违章情况,通过“电子眼”监视系统调出违章车辆记录,这里采用的收集数据的方法是( )A.做试验 B.查阅资料C.设计调查问卷 D.以上都不是3.利用实验数据进行拟合时,下列说法不正确的是( )A.数据越多,拟合效果越好B.数据的数目不同时,拟合的直线方程相同C.样本容量越大,所估计的直线方程越能更好地反映变量间的关系D.拟合前必须先观察数据的规律性4.下列命题中的两个变量具有相关关系的命题序号是________.①学生的身高与学生的数学成绩②学生的数学成绩与外语成绩③人的身高与体重④正方体的体积与正方体的边长⑤人体内脂肪含量与人的年龄⑥教师的水平与学生的水平5答案:1.C 由两变量数据可以作出散点图,但不一定能分析出它们的关系,更不一定符合线性关系.2.B 这些数据是由“电子眼”监控得到的数据,要得到这些数据就要调用“电子眼”的数据,实际上就是查阅“电子眼”所收集的数据,属于查阅资料的一种方式.3.B 如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程就是曲线的拟合,若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,我们可以用一条直线来近似,根据这个概念可知选B项.4.③⑤⑥两变量具有相关关系,即是不确定的关系,但是有些变量之间并没有这种关系,比如学生的身高和成绩根本就没有什么关系,还有数学成绩和外语成绩也没有必然的联系,而正方体的体积和边长是一种确定的关系,不是相关关系;③⑤⑥中所提供的变量之间都具有一种不确定的关系,也就是相关关系.5.解:以x轴表示年龄,y轴表示脂肪含量,得到相应的散点图如下:由散点图可见,两者之间具有相关关系.1.下列说法正确的个数为( )(1)两个变量之间若没有确定的函数关系,则这两个变量不相关.(2)正相关是两个变量相关关系中的一种.(3)“庄稼一枝花,全靠粪当家”说明农作物产量与施肥量之间具有相关关系.(4)根据散点图可判断两个变量之间有无相关关系.A.1个B.2个C.3个D.4个答案:C (1)不正确,无函数关系,可能具有相关关系,(2)(3)(4)正确.2.下列两个变量之间的关系,是相关关系的是( )A.角度和它的正弦值B.圆半径与圆的面积C.正n边形的边数和内角度数之和D.人的年龄和身高答案:D A、B、C三项都是函数关系,甚至可以写出它们的函数解析式,如f(x)=sinx,g(r)=πr2,h(n)=nπ-2π.显然,对于年龄相同的人有不同的身高,D项中两变量具有相关关系.3.在下列统计活动中,其数据收集适合用实验的方法得到的是( )A.2000年的全国人口总数B.某学校抽烟的学生在总人数中所占的比例C.某班男生的平均身高D.顾客对某种产品的满意程度答案:C A项2000年的全国人口总数适合用查资料的方法得到;B项某学校抽烟的学生在总人数中所占的比例适合用问卷调查的方法得到;D项顾客对某种产品的满意程度也适合用问卷调查的方法得到.4.(易错题)下列变量之间的关系不是相关关系的是( )A.已知二次函数y=ax2+bx+c,其中a、c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4acB.光照时间和果树亩产量C.降雪量和交通事故发生率D.每亩施用肥料量和粮食亩产量答案:A B、C、D三项都是一种不确定的关系,是相关关系,而函数关系是一种确定的关系,A中判别式Δ和变量b是一种确定的表达式,所以是一种函数关系.点评:函数关系是一种确定性关系,如一次、二次函数.所以当一个变量的值确定了后,另一个变量的值就唯一确定了时,两个变量间就是函数关系,抓住这一点,就可以区分函数关系和相关关系,弄不清两种关系的含义是此类问题的错解原因.5.给出下列x,y则根据数据可以判断x系”).答案:确定关系由表中数据的特征可以得到x、y之间是一种函数关系:y=2x+1,所以,x和y是一种确定的关系,也即函数关系,它和相关关系有明显的区别.6.(2009广东佛山模拟,13)下列说法不正确的是.①相关关系是一种不确定的关系;②当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫相关关系;③可以用散点图表示的两个变量之间的关系一定是相关关系;④相关关系分为正相关和负相关.答案:③散点图可以表示相关关系,但并不是所有的散点图都表示相关关系.7.在某种产品表面进行腐蚀刻线试验,得到腐蚀深度Y与腐蚀时间x之间相应的一组答案:解:散点图如下图所示:从散点图中发现它们近似成线性相关关系.8.5个学生的数学成绩和物理成绩见下表:画出散点图,并判断它们是否有相关关系.解:以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如图所示:由散点图可见,两者之间具有相关关系.9.(易错题)从某校抽查测量10名14岁的男生的身高x(单位:cm)和体重y(单位:kg),x 157 153 151 158 155 156 159 160 158 163y 45.5 44 42 46 44.5 45 46.5 47 45 49(2)你能从散点图中发现身高与体重近似成什么关系吗?(3)如果近似呈线性关系,试画出一条直线来近似地表示这种关系.解:(1)(2)由图可见,身高与体重近似成一次函数(线性)关系,随身高的增长,体重也增长.(3)见(1)图.点评:将样本中n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中,以表示两个变量之间关系的一组数据的图形叫散点图,它形象地反映各对数据的密切程度,利用它可以判断变量之间有无相关关系,作图时要注意单位长度的恰当选取,原点不一定取在(0,0)点.拟合两变量关系的一般步骤为:(1)作出散点图,判断散点是否在一条直线附近;(2)观察图的特征,如果各点大致分布在一条直线的附近,就称这两个变量间具有线性相关关系,然后画出拟合直线(可据不同的标准来画).散点图可以帮助分析变量间是否具有相关关系,但不是唯一的判断途径.。
高中数学第一章统计 1.6 统计活动:结婚年龄的变化自主练习北师大版必修3我夯基我达标1.某校高一年级有43名足球运动员,要从中抽出5人抽查学习负担情况.试用两种简单随机抽样方法分别取样思路分析:可以用抽签法和随机数表法两种方法取样解:抽签法:以姓名制签,在容器中搅拌均匀,每次从中抽取一个,连续抽取5次,从而得到一容量为5的入选样本随机数表法:以00,01,02,…,42逐个编号,拿出随机数表前先确定起始位置,确定读数方向(可以向上、向下、向右或向左),读数在总体编号内的取出,而读数不在内的和已取出的不算,依次下去,直至得到容量为5的样本.2.当今,青少年视力水平的下降已引起全社会的关注,为了了解某中学毕业年级300名学生的视力情况,从中抽测了一部分学生的视力,进行数据整理如下:频率分布表分组频数频率3.95~4.25 2 0.046 0.124.55~4.85 234.85~5.155.15~5.45 1 0.02合计 1.00(1)在这个问题中,总体是(2)填写频率分布表中未完成的部分(3)若视力为4.9,5.0,5.1均属正常不需矫正,试估计该校毕业年级学生视力正常的人数约为多少思路解析:表中所缺数据不影响求解的结果,关键在于从整体上观测所缺的是哪几个数据,把握情况作出解答答案:(1)某中学毕业年级300名学生视力的全体(2)每列从上到下分别填上4.25~4.55 18(3)300×0.36=108(名).3.某私营业主开办了一家服装加工厂,聘请其弟弟为厂长,并招聘了2名服装设计师、1名工程师和2名技术员,还招聘了50名工人.在招聘广告上,该私营业主承诺“所有员工月平均工资超过1 000元”.被招聘来的某工人问遍了其他49名工人,发现月工资最高的也没超过800元,于是找该业主论理,要求业主兑现招聘广告中的承诺.该业主拿出工厂每月工资的发放清单,这名工人经过计算发现所有员工月平均工资的确超过1 000元,你知道这是怎么一回事吗?试举例说明.你认为本题中工人的月工资用统计学中的何种量来反映更合理思路解析:这是一个实际生活中常见的招工中的问题,工人对这种现象不太了解,出现了上述的“被骗”,其实工厂并没有弄虚作假,只不过没有将真实情况介绍给工人,从而使工人误解此事答案:个别数据影响了平均值.用中位数.我综合我发展4.下列调查中哪些是用普查的方式,哪些是用抽样调查的方式来收集数据的(1)某市教育部门为了了解全市初中学生的视力情况,选择城区的一所初中和农村的一所初中,对这两所学校的全体学生进行检查(2)某厂的一台车床每天加工3 000个零件.为了掌握零件的质量,每天选取其中的100个进行相关项目的质量测试(3)某校为了调查本校高中学生的数学应用能力,对全校的高中学生进行书面和实践两方面测试(4)某工厂为了掌握全厂工人的身体健康状况,请一家医院对全厂工人进行体检(5)为了测定一种铜丝的最大控断力,在一批铜丝中取50根进行测试思路解析:普查和抽查要根据问题的实际情况作出选择,一般来说所要作的调查具有一定的破坏性或难度相当大,可以用抽查的方法.对于必须要全部检验的问题一定要用普查的方法答案:(1)(2)(5)是抽样调查,(3)(4)是普查.5.2003年11月,中国女排以11连胜的战绩夺回了阔别17年的世界冠军,重振了“敢于拼搏,敢于创新,团结起来,在不利的条件下赢得最大的胜利”的中国女排精神.其中11月12日的中美之战是关键的一战,中国女排在1∶2比分落后的不利情况下,顽强拼搏,最后反败为胜,以3∶2击败夺冠道路上的主要竞争对手.项目中国美国发球得分 3 7一攻得分37 35防守反击得分29 25拦网得分13 13因对方失误得分27 22总得分109 102(1)所给表是中美两国比赛的技术数据统计,学生甲用两幅直方图(如图1-6-4)比较中美两国比赛的得分情况,学生乙用一幅直方图(如图1-6-5)比较中美两国比赛的得分情况,哪一个效果好图1-6-4学生甲制作图1-6-5学生乙制作(2)从统计表中你能获取哪些信息思路分析:两位学生均根据统计数据作出了分析,但两人做的方式不同,要想了解各自国家的情况甲的方案好,但问题是想研究两个国家的得分比较情况,乙同学的方案是最佳的解:(1)学生甲的方案由于纵轴单位刻度不同,不容易对两国排球赛的得分情况进行比较;而学生乙将两张图合并成一张图,可以一目了然地看出两国排球赛的得分情况的差异,因此,乙的效果更好(2)分析表中的数据我们可以大概地了解到,中国队战胜美国队的主要因素是失误较少,防守反击比较成功,而中国队发球的威力不大,这是需要提高的.6.下面是关于吸烟情况的20个国家的统计数字,其中第一行是国名,第二行是男性吸烟成员的百分数,第三行是女性吸烟成员的百分数.韩国拉脱维亚俄罗斯多米尼加汤加土耳其中国泰国68.2 67.0 67.0 66.3 65.0 63.0 61.0 60.0 59.3 59.0瑞典巴哈马28.1 27.4 27.0 26.6 24.4 24.1 24.0 24.0 20.0 19.3 23.5 4.4 19.0 1.5 6.7 5.5 6.0 22.0根据以上数据,试研究这些国家吸烟状况的类似程度思路分析:这个过程叫做聚类分析,它的基本思想是:在一批样本数据中,定义能度量样本数据或类别间相近程度的统计量,在此基础上计算出各样本数据或类别之间的相近程度度量值;再按相近程度的大小,把样本逐一归类,关系密切的聚集到一个小的分类单位,关系疏远的聚集到一个大的分类单位,直到所有的样本数据都聚集完毕;最后把不同的类别一一划分出来,形成一个关系密疏图,并用以直观地显示分类对象的差异和联系解:要根据数据研究这些国家吸烟状况的类似程度,我们可以仅讨论男性的吸烟情况,首先确定一个划分类似的标准,不妨取1%,即当两个国家男性吸烟人数百分比之差小于1%时,将这两个国家称为类似的.可分成下面九组(1)韩国;(2)拉脱维亚、俄罗斯和多米尼加;(3)汤加;(4)土耳其;(5)中国、泰国、斐济和日本;(6)美国;(7)巴基斯坦、芬兰和土库曼;(8)尼日利亚、巴拉圭、巴林和新西兰;(9)瑞典和巴哈马.对于女性吸烟的情况也可做类似的分析.。
学习资料课时素养评价八统计活动:结婚年龄的变化(20分钟·35分)1.下列统计活动中,不适宜用问卷调查的方式收集数据的是()A。
某停车场中每天停放的蓝色汽车的数量B.七年级同学家中电视机的数量C.每天早晨同学们起床的时间D。
各种手机在使用时所产生的辐射【解析】选D.对于A.停车场中停放的蓝色汽车的数量可以进行统计具体数目,故本选项不符合要求;对于B。
七年级同学家中电视机的数量可以进行统计,故本选项不符合要求;对于C。
同学们每天起床的时间可以进行统计,故本选项不符合要求;对于D。
各种手机在使用时所产生的辐射只能进行估计,故本选项符合要求.2。
为了了解商场某日旅游鞋的销售情况,抽取了部分顾客购鞋的尺寸,将所得的数据整理后,画出频率分布直方图如图.已知图中从左至右前3个小组的频率之比为1∶2∶3,第4小组与第5小组的频率分别为0。
175和0.075,第2小组的频数为10,则抽取的顾客人数是( )A.80B.40C.60 D。
100【解题指南】由第4组与第5组的频率和得到前3组的频率和,又根据前3组的频率之比即可得到第2组的频率,结合第2组的频数可得抽取的顾客人数。
【解析】选B。
已知第4小组与第5小组的频率分别为0。
175和0。
075,所以前3组的频率和为0。
75.又因为从左至右前3个小组的频率之比为1∶2∶3,所以从左至右第2个小组的频率为0.25.又频数为10,所以抽取的顾客人数是=40人.3.用随机数法从100名学生(男生25人)中抽取20人进行评价,某男同学被抽到的概率是()A。
B。
C。
D。
【解析】选C. 从个体数为N=100的总体中抽取一个容量为n=20的样本,每个个体被抽到的概率都是=.4.为了了解某地区高三学生的身体发育情况,抽查了该地区200名年龄为17~18岁的男生体重(kg),得到频率分布直方图如图:根据频率分布直方图可得这200名学生中体重在[64.5,76。
5](kg)的学生人数是( )A。
§6统计活动:结婚年龄的变化知识梳理1.统计活动可以帮助我们更好地理解统计的全过程.2.设计一个统计活动可以遵循以下步骤来进行:(1)确定调查对象;(2)收集数据;(3)整理数据;(4)分析数据;(5)作出推断.知识导学进行统计活动必须依据统计的基本思想,即用样本估计总体,所以要设计一个统计活动,首先应确定要调查的对象,并从中抽取一个合理的样本,也就是收集数据.然后是分析整理数据,并得出科学合理的推断,进而估计总体的情况.抽取样本可按你要调查的对象的多少来确定合适的方法,比如分层抽样、系统抽样等,不论用哪种抽样方法,必须保证样本能很好地代表总体.整理分析样本数据时,可借助于前面已学的图表直观地表达出来.设计统计活动方案,可与同学们合作交流,不断改进,以求高效.疑难突破1.统计结婚年龄的变化问题的步骤和方法剖析:要搞好这项统计活动,需明确以下几个方法步骤:(1)调查目的:在全国范围内人们的初次结婚年龄是否随时代变化而增大.(2)调查对象:近五年全国各地初次结婚年龄.(3)调查方法:抽样、问卷调查.(4)数据汇总:把数据输入计算机汇总.(5)数据处理:利用计算机求初次结婚平均年龄.(6)自行得出结论,并与同学交流.2.统计结婚年龄的变化活动中如何收集、处理数据剖析:(1)收集数据,也就是通过抽样调查的方式获得你要的数据.每位同学收集自己父母辈和祖父母辈的初次结婚年龄,按照以下方式记录下来.(2)整理数据,即把每个人获得的数据汇总.可先将本小组成员收集到的数据汇总,再把班上所有同学的数据按照小组进行汇总.(3)分析数据,就是将上面的数据用折线图、频率直方图等形式分别表示出来.大家可进行相互交流、讨论,确定出比较合适的统计图.利用所画的图表,分别估计父辈、母辈、祖父辈、祖母辈的初次结婚年龄的平均数与标准差,并进行比较,以利于数据的分析.(4)作出推断,即根据上面的数据,同学们进行交流讨论,充分听取每一个同学的见解,以便更好地得出科学的结论.判断此结论与你从事这个活动之前的猜想是否一致.典题精讲例1895年,在伦敦有106块男性头盖骨被挖掘出土.经考证头盖骨的主人死于1665年~1666年之间的大瘟疫.人类学家分别测量了这些头盖骨的宽度,数据如下所示(单位:mm):146 141 139 140 145 141 142 131 142140 144 140 138 139 147 139 141 137141 132 140 140 141 143 134 146 134142 133 149 140 140 143 143 149 136141 143 143 141 138 136 138 144 136145 143 137 142 146 140 148 140 140139 139 144 138 146 153 158 135 132148 142 145 145 121 129 143 148 138148 152 143 140 141 145 148 139 136141 140 139 149 146 141 142 144 137153 148 144 138 150 148 138 145 145142 143 143 148 141 145 141请根据以上数据,分析随着头盖骨宽度的变化,男性头盖骨有何特征?思路分析:本题中的数据是较多的,一方面要能根据数据作出统计,作出数据的统计分析图,由各种不同类型的统计图表去一一得出分析结论.解:其数据可以用以下图表表示:(1)数据归类(按频数和频率)宽度/mm 频数 频率 宽度/mm 频数 频率 121 1 0.009 142 7 0.066 129 1 0.009 143 10 0.094 131 1 0.009 144 5 0.047 132 2 0.019 145 8 0.075 133 1 0.009 146 5 0.047 134 2 0.019 147 1 0.009 135 1 0.009 148 8 0.075 136 4 0.038 149 3 0.028 137 3 0.028 150 1 0.009 138 7 0.066 152 2 0.019 139 7 0.066 153 1 0.009 140 12 0.113 158 1 0.009 141 12 0.113(2)数据整理(分组)宽度分组(Δx i ) 频数(n i ) 频率(f i ) ii x f 120~125 mm 1 0.009 0.001 8125~130 mm 1 0.009 0.001 8130~135 mm 6 0.057 0.011 4135~140 mm 22 0.208 0.041 6140~145 mm 46 0.434 0.086 8145~150 mm 25 0.236 0.047 2150~155 mm 4 0.038 0.007 6155~160 mm 1 0.009 0.001 8(注:当数据在120个以内时,通常按照数据的多少分成5~12组.在实际操作中,一般要求各组的组距相等.)(3)频率分布直方图(如图1-6-1所示).图1-6-1(4)频数分布直方图(如图1-6-2所示).图1-6-2(5)频率折线图(如图1-6-3所示).图1-6-3答案:男性头盖骨的宽度大部分在135 mm~150 mm之间.绿色通道:当抽样或普查得到大量的数据时,要想科学分析所得各统计数据的特征,需要按步骤依次将数据归类(按频数和频率)、数据整理(分组)、作频数分布直方图、频率分布直方图、频率折线图,从图形中去观察统计所需的数据及信息.问题探究问题 1 由于样本选取的代表性,分析数据方法的多样性,统计结果的随机性等多方面的因素,从数据分析的结果中有可能得不到所预知的推断,应如何处理更科学?导思:熟练掌握统计的方法,领会统计的思想.探究:(1)首先应进行反思:样本的选取是否具有代表性,表达和分析数据的方法是否合理等.(2)即便从数据分析的结果中得到了正确的推断,仍可以继续思考:哪些环节可以作进一步的改进,怎样才能使得结果更精确可信等.在这个具体的问题情境中,通过统计活动的过程以及之后的反思,可以真正体会统计思维与确定性思维的差异.(3)逐渐形成对数据处理过程进行初步评价的意识.自我评价意识的形成有助于改进学习方法,提高学习能力.在统计内容的学习中,形成对数据处理过程初步评价的意识,将有助于对统计思维与确定性思维的理解.(4)数据处理的过程存在着统计思想与统计方法的差异,这样可能导致统计分析结果的差别,初步评价的意识,将有助于改善统计分析过程中可能出现的各种问题.问题2 如何才能对调查统计的结果给出科学的评价?导思:建议以小组为单位,选出代表,在班级中报告研究成果,交流研究体会.在评价中,采用自评、互评、教师评价相结合的形式,应善于发现别人工作中的特色.探究:在评价中应主要考虑以下几个方面:(1)求解过程和结果:合理、清楚、简洁、正确;(2)独到的思考和发现;(3)提出有价值的求解设计和有见地的新问题;(4)发挥组员的特长,合作学习.更重要的一条是,评价的意识将有助于客观地认识统计的过程、统计分析的方法,有助于理性思维的培养.。
【课堂新坐标】(教师用书)2013-2014学年高中数学 1.6 统计活动结婚年龄的变化课时训练 北师大版必修3一、选择题1.若样本1+x 1,1+x 2,1+x 3,…,1+x n 的平均数是10,方差为2,则对于样本2+x 1,2+x 2,…,2+x n ,下列结论正确的是( )A .平均数为10,方差为2B .平均数为11,方差为3C .平均数为11,方差为2D .平均数为12,方差为4【解析】 由已知1n(1+x 1+1+x 2+…+1+x n )=10,则1n (2+x 1+2+x 2+…+2+x n )=1n (1+x 1+1+x 2+…+1+x n +n )=1n(1+x 1+1+x 2+…+1+x n )+1=10+1=11, 即2+x 1,2+x 2,…,2+x n 的平均数是11.又∵1n[(1+x 1-10)2+(1+x 2-10)2+…+(1+x n -10)2]=2.∴1n[(2+x 1-11)2+(2+x 2-11)2+…+(2+x n -11)2]=2,即2+x 1,2+x 2,…,2+x n的方差为2.故选C.【答案】 C2.甲、乙、丙三位同学分别在10次相同的数学测验中,其数学成绩的方差分别是s 甲=3.2,s 乙=0.37,s 丙=2.5,则数学成绩最稳定的是( )A .甲B .乙C .丙D .不确定【解析】 ∵s 乙<s 甲,s 乙<s 丙,∴乙同学的数学成绩最稳定. 【答案】 B3.(2012·湖北高考)容量为20的样本数据,分组后的频数如下表:分组[10,20)[20,30)[30,40)[40,50)[50,60)[60,70) 频数23454 2A.0.35 B.0.45C.0.55 D.0.65【解析】由表知[10,40)的频数为2+3+4=9,所以样本数据落在区间[10,40)的频率为920=0.45.【答案】 B4.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图1-6-3所示.根据此图,估计该校2 000名高中男生中体重大于70.5千克的人数为( )图1-6-3A.300 B.360C.420 D.450【解析】由图得100名高中男生体重大于70.5千克的频率是(0.04+0.034+0.016)×2=0.18.故该校2 000名男生中体重大于70.5千克的频率是0.18,人数为2 000×0.18=360.【答案】 B5.对“小康县”的经济评价标准:①年人均收入不小于7 000元;②年人均食品支出不大于收入的35%.某县有40万人口,年人均收入如下表所示,年人均食品支出如图1-6-4所示.则该县( )年人均收入(元)0 2 000 4 000 6 0008 00010 00012 00016 000人数(万人)6355675 3图1-6-4A .是小康县B .达到标准①,未达到标准②,不是小康县C .达到标准②,未达到标准①,不是小康县D .两个标准都未达到,不是小康县.【解析】 由图表可知年人均收入为(2 000×3+4 000×5+6 000×5+8 000×6+10 000×7+12 000×5+16 000×3)÷40=7 050(元)>7 000元,达到了标准①;年人均食品支出为(1 400×3+2 000×5+2 400×13+3 000×10+3 600×9)÷40=2 695(元),则年人均食品支出占收入的2 6957 050×100%≈38.2%>35%,未达到标准②.所以不是小康县. 【答案】 B 二、填空题6.(2012·山东高考)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.图1-6-5【解析】 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.【答案】 97.某学校高一(5)班,在一次数学测验中,全班数学成绩的平均分为91分,其中某生得分为140分,是该班的最高分.若不包括该生的成绩,其他同学在这次测验中的平均分为90分,则该班学生的总人数为______.【解析】 设该班共有学生n 人,每人的数学成绩分别为x 1,x 2,…,x n , 其中x n =140, 由题意知x 1+x 2+…+x n -1+140n=91,x 1+x 2+…+x n -1n -1=90,∴90(n -1)+140=91n , 解得n =50. 【答案】 508.某医院急救中心关于病人等待急诊的记录如下表: 等待时间 (分钟) [0,5) [5,10) [10,15) [15,20) [20,25] 频数48521用上述分组资料计算出病人平均等待时间的估计值x =________,病人等待时间标准差的估计值s =___________________________________________.【解析】 病人平均等待时间的估计值x =120(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5(分钟),s 2=120[(2.5-9.5)2×4+(7.5-9.5)2×8+(12.5-9.5)2×5+(17.5-9.5)2×2+(22.5-9.5)2×1]=28.5,∴s =28.5≈5.34(分钟).【答案】 9.5分钟 5.34分钟 三、解答题9.(2013·安徽高考)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图.图1-6-6(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x 1,x 2,估计x 1-x 2的值.【解】 (1)设甲校高三年级学生总人数为n . 由题意知30n=0.05,解得n =600.样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级这次联考数学成绩的及格率为1-530=56.(2)设甲、乙两校样本平均数分别为x ′1,x ′2.根据样本茎叶图可知30(x ′1-x ′2)=30x ′1-30x ′2=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92=2+49-53-77+2+92=15.因此x ′1-x ′2=0.5. 故x 1-x 2的估计值为0.5分.10.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图1-6-7所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、0.15、0.10、0.05.图1-6-7求:(1)成绩的众数、中位数; (2)平均成绩.【解】 (1)众数是最高矩形的中间值的横坐标, ∴众数为65.中位数是数据的中间值.由直方图知中位数应在60~70段内.设其底边为x ,高为0.04,∴x ·0.04=0.2,∴x=5.故中位数应为60+5=65.(2)平均数为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67.11.为了估计一次性木质筷子的用量,2011年从某县共600家高、中、低档饭店中抽取10家进行调查,得到这些饭店每天消耗的一次性筷子的数据如下(单位:盒):0.6,3.7,2.2,1.5,2.8,1.7,1.2,2.1,3.2,1.0.(1)通过对样本数据的计算,估计该县2011年共消耗了多少盒一次性筷子?(每年按350个营业日计算)(2)2012年又对该县一次性木质筷子的用量以同样的方式做了抽样调查,调查结果是10家饭店平均每家每天使用一次性筷子2.42盒,求该县2012比2011年一次性木质筷子用量增加的百分率;(3)假如让你统计你所在省一年使用一次性木质筷子所消耗的木材量,如何利用统计知识去做?简要地说明你的做法.【解】(1)10家饭店每天共消耗20盒,则估计600家饭店每天共消耗20×60=1 200(盒),从而可估计2011年(350天)共可消耗一次性筷子1 200×350=420 000(盒).(2)依题意知,2012年比2011年一次性木筷用量增加值为(2.42-2)×600×350=88 200(盒).∴从2011年到2012年增加的百分率为88 200420 000=21%.(3)先采用简单随机抽样的方法抽取若干县(市)(作样本),再从这些县(市)中采用分层抽样的方法抽取若干家饭店,统计一次性木质筷子用量的平均数,从而估计总体平均数,再进一步计算所消耗的木材总量.。
1.5 用样本估计总体 1.6 统计活动 结婚年龄的变化一、选择题1.一个容量为100的样本,其数据的分组与各组的频数如下: 组别 (0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70] 频数 1213241516137则样本数据落在(10,40]上的频率为( ) A .0.13 B .0.39 C .0.52 D .0.64 答案 C解析 由列表可知样本数据落在(10,40]上的频数为52,故其频率为0.52,故选C. 2.下列说法正确的是 ( )A .在两组数据中,平均数较大的一组方差较大B .平均数反映数据的集中趋势,方差则反映数据波动的大小C .方差的求法是求出各个数据与平均数的差的平方后再求和D .在记录两个人射击环数的两组数据中,方差大的表示射击水平高 答案 B解析 平均数表示样本的集中趋势,A 错.方差公式s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n-x -)2],C 错.方差大说明射击成绩不稳定,D 错.故选B.3.当收集到的数据量很大时,比较合适的统计图是( ) A .茎叶图B .频率分布直方图C .频率分布折线统计图D .频率分布表答案 B解析 当收集到的数据量很大时一般用频率分布直方图表示.4.下图是2010年中央电视台举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A.84,4.84 B .84,1.6 C .85,1.6 D .85.4 答案 C解析 x -=80+15(4+4+6+4+7)=85,s 2=15(12+12+12+12+22)=1.6,故选C.5.已知样本:10,8,6,10,8,13,11,10,12,7,8,9,10,11,12,9,10,11,9,12,那么频率为0.2的范围是( )A .5.5~7.5B .7.5~9.5C .9.5~11.5D .11.5~13.5答案 D解析 根据四个选项判断即可.6.某校在“创新素质实践行”活动中组织学生进行社会调查,并对学生的调查报告进行了评比,下面是将某年级60篇学生调查报告进行整理,分成5组画出的频率分布直方图,如图.已知从左至右4个小组的频率分别为0.05,0.15,0.35,0.30,那么在这次评比中被评为优秀的调查报告有(分数大于或等于80分为优秀且分数为整数)( )A .18篇B .24篇C .25篇D .27篇 答案 D解析 分数大于或等于80分的频率为0.30+0.15=0.45而共有60篇,故优秀的篇数为60×0.45=27(篇).二、填空题7.某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3000名学生在该次数学考试中成绩小于60分的学生数是________.答案 600解析 本题主要考查频率分布直方图的应用,考生的识图与用图能力,同时也考查了考生的数据处理能力和分析解决问题的能力.由题意知,在该次数学考试中成绩小于60分的频率为(0.002+0.006+0.012)×10=0.2,故这3000名学生在该次数学考试中成绩小于60分的学生数是3000×0.2=600.8.下图所示的是一个容量为1000的样本频率分布直方图,请根据图形中的数据填空.(1)样本数据落在范围[5,9)的频率为________; (2)样本数据落在范围[9,13)的频数为________. 答案 (1)0.32 (2)360解析 组距为4,(1)0.08×4=0.32; (2)1000×(0.09×4)=360.9.已知样本数据x 1,x 2,…,x n 的方差为4,则数据2x 1+3,2x 2+3,…,2x n +3的标准差是________.答案 4解析 设原数据x 1,x 2,…,x n 的平均数为x -′,方差为s ′2=4,则新的数据的平均数是x -=1n [(2x 1+3)+(2x 2+3)+…+(2x n +3)]=1n (2x 1+2x 2+…+2x n )+3=2·1n(x 1+x 2+…+x n )+3=2x -′+3.∴方差是:s 2=1n{[(2x 1+3)-(2x -′+3)]2+[(2x 2+3)-(2x -′+3)]2+…+[(2x n +3)-(2x -′+3)]2}=1n×4[(x 1-x -′)2+(x 2-x -′)2+…+(x n -x -′)2]=4·s ′2=4×4=16,∴s =4. 三、解答题10.为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:千克),并将所得数据分组,画出频率分布直方图(如下图所示).(1)在下面的表格中填写相应的频率;分组 频率 [1.00,1.05) [1.05,1.10) [1.10,1.15) [1.15,1.20) [1.20,1.25) [1.25,1.30)(2)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条,请根据这一情况来估计该水库中鱼的总条数.解 (1)根据频率分布直方图可知,频率=组距×(频率/组距),故可得下表.(2)120×1006=2000,所以估计该水库中鱼的总条数为2000.11.甲、乙两台机床同时加工直径为100 mm 的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm):甲:99 100 98 100 100 103 乙:99 100 102 99 100 100(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求. 解 (1)x -甲=99+100×3+98+1036=100,x -乙=99×2+100×3+1026=100,s 2甲=16[(99-100)2+(100-100)2×3+(98-100)2+(103-100)2]=73,s 2乙=16[(99-100)2×2+(100-100)2×3+(102-100)2]=1.(2)∵x -甲=x -乙,s 2甲>s 2乙,∴说明甲机床加工的这种零件的直径波动比较大,因此乙机床加工的这种零件更符合要求.12.某校从参加科普知识竞赛的学生中抽出60名学生,将其成绩(均为整数)分成六段[40,50),[50,60),…,[90,100)后画出如图所示的部分频率分布直方图.观察图形的信息,回答下列问题:(1)求第四段的频率,并补全这个频率分布直方图;(2)求这次考试的及格率(60分以上为及格);(3)估计这次的平均分.解(1)由于各组的频率和等于1,故第四段的频率为f4=1-(0.025+0.015×2+0.01+0.005)×10=0.3,则其直方图如图所示.(2)60分以上的分数在第三~六段的频率之和为(0.015+0.03+0.025+0.005)×10=0.75,即抽样学生的及格率为75%.(3)利用组中值估算抽样学生的平均分为45×f1+55×f2+65×f3+75×f4+85×f5+95×f6=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.13.某河流上的一座水力发电站,每年六月份的发电量Y(单位:万千瓦时)与该河上游在六月份的降雨量X(单位:毫米)有关.据统计,当X=70时,Y=460;X每增加10,Y增加5.已知近20年X的值为:140,110,160,70,200,160,140,160,220,200,110,160,160,200,140,110,160,220,140,160.(1)完成如下的频率分布表:近20年六月份降雨量频率分布表(2)假定今年六月份的降雨量与近20年六月份降雨量的分布规律相同,并将频率视为概率,求今年六月份该水力发电站的发电量低于490(万千瓦时)或超过530(万千瓦时)的概率.解本题考查概率统计的基础知识,考查运算能力、分析问题解决问题的能力.第一问中的统计表是降雨量的统计表,只要根据给出的数据进行统计计算即可;第二问中根据给出的X,Y的函数关系,求出Y<490或者Y>530对应的X的范围,结合第一问的概率分布情况求解,或者求解其对立事件的概率.(1)在所给数据中,降雨量为110毫米的有3个,为160毫米的有7个,为200毫米的有3个.故近20年六月份降雨量频率分布表为(2)P(“发电量低于490万千瓦时或超过530万千瓦时”)=P(Y<490或Y>530)=P(X<130或X>210)=P(X=70)+P(X=110)+P(X=220)=120+320+220=310.故今年六月份该水力发电站的发电量低于490(万千瓦时)或超过530(万千瓦时)的概率为310.。
2019-2020年高中数学第一章统计1.6统计活动:结婚年龄的变化自主练
习北师大版必修
我夯基我达标
1.某校高一年级有43名足球运动员,要从中抽出5人抽查学习负担情况.试用两种简单随机抽样方法分别取样
思路分析:可以用抽签法和随机数表法两种方法取样
解:抽签法:以姓名制签,在容器中搅拌均匀,每次从中抽取一个,连续抽取5次,从而得到一容量为5的入选样本
随机数表法:以00,01,02,…,42逐个编号,拿出随机数表前先确定起始位置,确定读数方向(可以向上、向下、向右或向左),读数在总体编号内的取出,而读数不在内的和已取出的不算,依次下去,直至得到容量为5的样本.
2.当今,青少年视力水平的下降已引起全社会的关注,为了了解某中学毕业年级300名学生的视力情况,从中抽测了一部分学生的视力,进行数据整理如下:
频率分布表
分组频数频率
3.95~
4.25 2 0.04
6 0.12
4.55~4.85 23
4.85~
5.15
5.15~5.45 1 0.02
合计 1.00
(1)在这个问题中,总体是
(2)填写频率分布表中未完成的部分
(3)若视力为4.9,5.0,5.1均属正常不需矫正,试估计该校毕业年级学生视力正常的人数约
为多少
思路解析:表中所缺数据不影响求解的结果,关键在于从整体上观测所缺的是哪几个数据,把握情况作出解答
答案:(1)某中学毕业年级300名学生视力的全体
(2)每列从上到下分别填上4.25~4.55 18
(3)300×0.36=108(名).
3.某私营业主开办了一家服装加工厂,聘请其弟弟为厂长,并招聘了2名服装设计师、1名工程师和2名技术员,还招聘了50名工人.在招聘广告上,该私营业主承诺“所有员工月平均工资超过1 000元”.被招聘来的某工人问遍了其他49名工人,发现月工资最高的也没超过800元,于是找该业主论理,要求业主兑现招聘广告中的承诺.该业主拿出工厂每月工资的发放清单,这名工人经过计算发现所有员工月平均工资的确超过1 000元,你知道这是怎么一回事吗?试举例说明.你认为本题中工人的月工资用统计学中的何种量来反映更合理
思路解析:这是一个实际生活中常见的招工中的问题,工人对这种现象不太了解,出现了上述的“被骗”,其实工厂并没有弄虚作假,只不过没有将真实情况介绍给工人,从而使工人误解此事
答案:个别数据影响了平均值.用中位数.
我综合我发展
4.下列调查中哪些是用普查的方式,哪些是用抽样调查的方式来收集数据的
(1)某市教育部门为了了解全市初中学生的视力情况,选择城区的一所初中和农村的一所初中,对这两所学校的全体学生进行检查
(2)某厂的一台车床每天加工3 000个零件.为了掌握零件的质量,每天选取其中的100个进行相关项目的质量测试
(3)某校为了调查本校高中学生的数学应用能力,对全校的高中学生进行书面和实践两方面
测试
(4)某工厂为了掌握全厂工人的身体健康状况,请一家医院对全厂工人进行体检
(5)为了测定一种铜丝的最大控断力,在一批铜丝中取50根进行测试
思路解析:普查和抽查要根据问题的实际情况作出选择,一般来说所要作的调查具有一定的破坏性或难度相当大,可以用抽查的方法.对于必须要全部检验的问题一定要用普查的方法
答案:(1)(2)(5)是抽样调查,(3)(4)是普查.
5.xx年11月,中国女排以11连胜的战绩夺回了阔别17年的世界冠军,重振了“敢于拼搏,敢于创新,团结起来,在不利的条件下赢得最大的胜利”的中国女排精神.其中11月12日的中美之战是关键的一战,中国女排在1∶2比分落后的不利情况下,顽强拼搏,最后反败为胜,以3∶2击败夺冠道路上的主要竞争对手.
项目中国美国
发球得分 3 7
一攻得分37 35
防守反击得分29 25
拦网得分13 13
因对方失误得分27 22
总得分109 102
(1)所给表是中美两国比赛的技术数据统计,学生甲用两幅直方图(如图1-6-4)比较中美两国比赛的得分情况,学生乙用一幅直方图(如图1-6-5)比较中美两国比赛的得分情况,哪一个效果好
图1-6-4
学生甲制作
图1-6-5
学生乙制作
(2)从统计表中你能获取哪些信息
思路分析:两位学生均根据统计数据作出了分析,但两人做的方式不同,要想了解各自国家的情况甲的方案好,但问题是想研究两个国家的得分比较情况,乙同学的方案是最佳的
解:(1)学生甲的方案由于纵轴单位刻度不同,不容易对两国排球赛的得分情况进行比较;而学生乙将两张图合并成一张图,可以一目了然地看出两国排球赛的得分情况的差异,因此,乙
的效果更好
(2)分析表中的数据我们可以大概地了解到,中国队战胜美国队的主要因素是失误较少,防守反击比较成功,而中国队发球的威力不大,这是需要提高的.
6.下面是关于吸烟情况的20个国家的统计数字,其中第一行是国名,第二行是男性吸烟成员的百分数,第三行是女性吸烟成员的百分数.
韩国拉脱维亚俄罗斯多米尼加汤加土耳其中国泰国68.2 67.0 67.0 66.3 65.0 63.0 61.0 60.0 59.3 59.0
瑞典巴哈马28.1 27.4 27.0 26.6 24.4 24.1 24.0 24.0 20.0 19.3 23.5 4.4 19.0 1.5 6.7 5.5 6.0 22.0
根据以上数据,试研究这些国家吸烟状况的类似程度
思路分析:这个过程叫做聚类分析,它的基本思想是:在一批样本数据中,定义能度量样本数据或类别间相近程度的统计量,在此基础上计算出各样本数据或类别之间的相近程度度量值;再按相近程度的大小,把样本逐一归类,关系密切的聚集到一个小的分类单位,关系疏远的聚集到一个大的分类单位,直到所有的样本数据都聚集完毕;最后把不同的类别一一划分出来,形成一个关系密疏图,并用以直观地显示分类对象的差异和联系
解:要根据数据研究这些国家吸烟状况的类似程度,我们可以仅讨论男性的吸烟情况,首先确定一个划分类似的标准,不妨取1%,即当两个国家男性吸烟人数百分比之差小于1%时,将这两个国家称为类似的.可分成下面九组
(1)韩国;(2)拉脱维亚、俄罗斯和多米尼加;(3)汤加;(4)土耳其;(5)中国、泰国、斐济和日本;(6)美国;(7)巴基斯坦、芬兰和土库曼;(8)尼日利亚、巴拉圭、巴林和新西兰;(9)瑞典和巴哈马.对于女性吸烟的情况也可做类似的分析.。