2014年高中数学 第一章 统计 统计复习与小结教案 北师大版必修3
- 格式:doc
- 大小:115.00 KB
- 文档页数:6
第1章 统计1.抽样方法(1)用随机数表法抽样时,对个体所编号码位数要相等,当问题所给位数不等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.(2)用系统抽样法时,如果总体容量N 能被样本容量n 整除,抽样间隔为k =Nn;如果总体容量N 不能被样本容量n 整除,先用简单随机抽样剔除多余个体,抽样间隔为k =⎣⎢⎡⎦⎥⎤N n .(3)应用三种抽样方法时需要搞清楚它们的使用原则. ①当总体容量较小,样本容量也较小时,可采用抽签法. ②当总体容量较大,样本容量较小时,可用随机数表法. ③当总体容量较大,样本容量也较大时,可用系统抽样法. ④当总体由差异明显的几部分组成时,常用分层抽样. 2.用样本估计总体(1)用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理,作频率分布表与频率分布直方图时要注意其方法步骤.(2)茎叶图刻画数据有两个优点:一是所有信息都可以从图中得到,二是便于记录和表示.但数据较多时不方便.(3)平均数反映了样本数据的平均水平,而标准差反映了样本数据相对平均数的波动程度.3.变量间的相关关系除了函数关系这种确定性的关系外,还大量存在因变量的取值带有一定随机性的两个变量之间的关系——相关关系,对于一元线性相关关系,通过建立线性回归方程就可以根据其部分观测值,获得对这两个变量之间的整体关系的了解,主要是作出散点图、写出线性回归方程.[典例1] 某工厂有1 003名工人,从中抽取10人参加体检,试采用简单随机抽样和系统抽样进行具体实施.[解] (1)简单随机抽样:①将每一个人编一个号由0001至1003.②制作大小相同的号签,并写上号码.③放入一个大容器内,均匀搅拌.④依次抽取10个号签.具有这十个编号的人组成一个样本.(2)系统抽样:①将每个人编一个号由0001至1003.②利用随机数表抽取3个号,将这3个人剔除.③重新编号0001至1000.④分段1 00010=100,所以0001至0100为第一段.⑤在第一段内由简单随机抽样方法抽得一个号l.⑥按编号将l,100+l,…,900+l,共10个号选出,这10个号所对应的人组成样本.[借题发挥] 1.当总体容量N 能被样本容量n 整除时,分段间隔k =Nn,利用系统抽样的方法抽样.2.当总体容量不能被样本容量整除时,可先从总体中随机剔除n 个个体.3.要注意三种抽样方法的使用条件. [对点训练]1.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为( )A .26,16,8B .25,17,8C .25,16,9D .24,17,9 解析:选B 由题意知间隔为60050=12,故抽到的号码为12k +3(k =0,1,…,49),列出不等式可解得:第Ⅰ营区抽25人,第Ⅱ营区抽17人,第Ⅲ营区抽8人.[典例2] 有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20],17. (1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图; (3)求样本数据不足0的频率. [解] (1)频率分布表如下:(2) (3)样本数据不足0的频率为:0.035+0.055+0.075+0.2=0.365.[借题发挥] 1.频率分布直方图的绘制方法与步骤(1)先制作频率分布表,然后作直角坐标系,横轴表示总体,纵轴表示频率组距.(2)把横轴分成若干段,每一段对应一个组.以每个组距为底,以各频率除以组距的商为高,分别画成矩形.这样得到的直方图就是频率分布直方图.2.频率分布折线图反映的是数据的变化趋势,可用来对数据进行估计和预测.[对点训练]2.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.解析:∵0.005×10+0.035×10+a×10+0.020×10+0.010×10=1,∴a=0.030.设身高在[120,130),[130,140),[140,150]三组的学生各有x,y,z人,则x100=0.030×10,解得x=30.同理,y=20,z=10.故从[140,150]中抽取的学生人数为1030+20+10×18=3.答案:0.030 33.某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标).所得数据均在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有________根棉花纤维的长度小于20 mm.解析:(0.04×5+0.01×5+0.01×5)×100=30.答案:30[借题发挥] 在实际问题中,仅靠平均数不能完全反映问题,还要研究数据偏离平均数的离散程度(即方差或标准差).标准差越大,说明数据的离散性越大;标准差越小,说明数据的离散性越小或数据越集中、稳定.[对点训练]4.甲、乙两位学生参加数学竞赛培训,在培训期间他们参加5项预赛,成绩记录如下:甲:78 76 74 90 82乙:90 70 75 85 80(1)用茎叶图表示这两组数据;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?说明理由.解:(1)用茎叶图表示如下:(2)x-甲=80,x-乙=80,而s2甲=15×[(78-80)2+(76-80)2+(74-80)2+(90-80)2+(82-80)2]=32,s2乙=15×[(90-80)2+(70-80)2+(75-80)2+(85-80)2+(80-80)2]=50.∵x-甲=x-乙,s2甲<s2乙,∴从统计学的角度考虑,选甲参加更合适.[典例4] 某个体服装店经营某种服装在某周内获纯利y(元)与该周每天销售这种服装件数x之间有如下一组数据:x 3456789y 66697381899091已知:=280,=45 309,=3 487.(1)求x,y;(2)求纯利y与每天销售件数x之间的线性回归方程;(3)估计每天销售10件这种服装时纯利润为多少元?[解] (1)由已知得x=17(3+4+5+6+7+8+9)=6,y=17(66+69+73+81+89+90+91)≈79.86.(2)设线性回归方程为y=bx+a,则b==3 487-7×6×79.86280-7×62≈4.75,a=y-b x=79.86-4.75×6≈51.36.∴所求线性回归方程为y=4.75x+51.36.(3)当x=10时,y=98.86,估计每天销售这种服装10件可获纯利98.86元.[借题发挥] 要对y与x进行线性相关检验,只要画出散点图,看各数据是否集中在某一条直线附近即可,采用数形结合思想,若线性相关,则根据公式求出回归方程.[对点训练]5.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据如下表所示:吗?(2)求回归方程;(3)预测当钢水含碳量为160时,应冶炼多少分钟.解:(1)用x表示含碳量,y表示冶炼时间,可作散点图如下图所示.从上图中可以看出,各点散布在一条直线附近,即它们线性相关.(2)列出下表,并用科学计算器进行计算:设所求回归方程为y =bx +a . b =∑10i =1x i y i -10x - y -∑10i =1x 2i -10x -2≈1.267,a =y --b x -≈-30.47.即所求的回归方程为y =1.267x -30.47. (3)当x =160时,y =1.267×160-30.47≈172(min),即大约冶炼172 min.(时间:90分钟 满分:120分)一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.为了了解1 200名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔k 为( )A .40B .30C .20D .12解析:选B 系统抽样也叫间隔抽样,抽多少个就分成多少组,总数÷组数=间隔数,即k =1 20040=30.2.某学校为了调查高一年级的200名学生完成课后作业所需时间,采取了两种抽样调查的方式:第一种由学生会的同学随机抽取20名同学进行抽查;第二种由教务处对该年级的学生进行编号,从001到200,抽取学号最后一位为2的同学进行调查.则这两种抽样的方法依次是( )A .分层抽样,简单随机抽样B .简单随机抽样,分层抽样C .分层抽样,系统抽样D .简单随机抽样,系统抽样解析:选D 由抽样方法的概念知选D.3.一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为( )A .10组B .9组C .8组D .7组解析:选B 根据列频率分布表的步骤,极差组距=140-5110=8.9,所以分9组.4.(陕西高考)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )A .11B .12C .13D .14解析:选B 依据系统抽样为等距抽样的特点,分42组,每组20人,区间[481,720]包含25组到36组,每组抽1人,则抽到的人数为12.5.某大学数学系共有本科生5 000人,其中一、二、三、四年级的人数比为4∶3∶2∶1,要用分层抽样的方法从所有本科生中抽取一个容量为200的样本,则应抽取三年级的学生人数为( )A .80B .40C .60D .20解析::选B 应抽取三年级的学生人数为200×210=40.6.已知200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[60,70)的汽车辆数为( )A.8 B.80 C.65 D.70解析:选B 时速在[60,70)的汽车频率为0.04×10=0.4,时速在[60,70)的汽车大约有200×0.4=80(辆).7.已知回归直线斜率的估计值为1.23,样本点的中心为(4,5),则回归方程为( )A.y=1.23x+4B.y=1.23x+5C.y=1.23x+0.08D.y=0.08x+1.23解析:选C 回归直线的斜率就是b,则回归方程为y=1.23x +a,将(4,5)代入方程得a=0.08.8.某班的数学考试成绩的平均分为70分,方差为s2.后来发现成绩记录有误,同学甲得80分却误记为50分,同学乙得70分却误记为100分,更正后计算得方差为s21,则s2与s21的大小关系是( )A.s2>s21 B.s2=s21 C.s2<s21 D.无法判断解析:选 A 根据方差的计算公式,s2的算式中含有(50-70)2+(100-70)2,s21的算式中含有(80-70)2+(70-70)2,而两算式的其他部分完全相同,故易知s2>s21.9.甲、乙两名同学在5次体育测试中的成绩统计如图的茎叶图所示,若甲、乙两人的平均成绩分别是X 甲,X 乙,则下列结论正确的是( )A .X 甲<X 乙;乙比甲成绩稳定B .X 甲>X 乙;甲比乙成绩稳定C .X 甲>X 乙;乙比甲成绩稳定D .X 甲<X 乙;甲比乙成绩稳定解析:选A ∵甲同学的成绩为78,77,72,86,92,乙同学的成绩为78,82,88,91,95,∴X 甲=78+77+72+86+925=81, X 乙=78+82+88+91+955=86.8, ∴X 甲<X 乙.从茎叶图中数据的分布情况看,乙同学的成绩更集中于平均数附近,这说明乙比甲成绩稳定.10.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A .甲地:总体平均值为3,中位数为4B .乙地:总体平均值为1,总体方差大于0C .丙地:中位数为2,众数为3D .丁地:总体平均值为2,总体方差为3解析:选D 根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,选项A 中,中位数为4,可能存在大于7的数;同理,在选项C 中也有可能;选项B 中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;选项D 中,根据方差公式,如果有大于7的数存在,那么方差不会为3.二、填空题(本大题共4小题,每小题5分,共20分.把答案填写在题中的横线上)11.某社区对居民进行2017天津全运会知晓情况的分层抽样调查.已知该社区的青年人、中年人和老年人分别有800人、1 600人、1 400人.若在老年人中的抽样人数是70,则在中年人中的抽样人数应该是________.解析:抽取的比例为k =701 400=120,故在中年人中应该抽取的人数为1 600×120=80. 答案:8012.对具有线性相关关系的变量x 和Y ,测得一组数据如下:程为________.解析:设回归方程为y =6.5x +a .由已知,x-=15×(2+4+5+6+8)=5.y-=15×(30+40+60+50+70)=50.∴a=y--6.5x-=50-6.5×5=17.5.∴y=6.5x+17.5.答案:y=6.5x+17.513.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x的值为________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.解析:(1)根据频率和为1,得(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,解得x=0.004 4;(2)(0.003 6+0.006 0+0.004 4)×50×100=70.答案:(1)0.004 4 (2)7014.甲、乙两位同学某学科连续五次考试成绩用茎叶图表示,如图所示,则平均数较高的是______,成绩较为稳定的是________.解析:甲的平均分为x-=68+69+70+71+725=70,乙的平均分为y-=63+68+69+69+715=68;甲的方差为:s21=68-702+69-702+70-702+71-702+72-7025=2,同理乙的方差为s22=7.2,故甲的平均分高于乙,甲的成绩比乙稳定.答案:甲甲三、解答题(本大题共4小题,共50分.解答应写出必要的文字说明、证明过程或演算步骤)15.(12分)某车间有189名职工,现要按1∶21的比例选质量检查员,采用系统抽样的方式进行,写出抽样过程.解:以随机方式对189名职工编号(比如可直接采用工资表上号码编号),设其分别为1,2,3 (189)由已知样本容量是总体个数的121,故样本容量为189×121=9(个),将1,2,3,…,189编9段,每段21个号.如1~21为第一段,22~42为第二段,…,169~189为第九段,在第一段1~21个号码中随机抽样产生一个号码,如设为l,则l,l+21,l+42,…,l+168就是所产生的9个样本号码,对应的就是质量检查员.16.(12分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下:(单位:cm)甲:9,10,11,12,10,20乙:8,14,13,10,12,21.(1)绘出所抽取的甲、乙两种麦苗株高的茎叶图;(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况.解:(1)茎叶图如图所示:(2)x-甲=9+10+11+12+10+206=12,x-乙=8+14+13+10+12+216=13,s2甲≈13.67,s2乙≈16.67.因为x-甲<x-乙,所以乙种麦苗平均株高较高,又因为s2甲<s2乙,所以甲种麦苗长的较为整齐.17.(12分)为了了解中学生的身体发育情况,对某一中学同年龄的50名男生的身高进行了测量,结果如下:[157,161)3人; [161,165)4人; [165,169)12人;[169,173)13人;[173,177)12人;[177,181]6人.(1)列出频率分布表;(2)画出频率分布直方图;(3)估计总体在[165,177)间的比例.解:(1)列出频率分布表:(2)画出频率分布直方图如图:(3)因0.24+0.26+0.24=0.74,所以总体在[165,177)间的比例为74%.18.(14分)某学校高一(3)班甲、乙两名同学的最近5次数学测验成绩(单位:分)统计如下:(1)(2)分别用平均数和中位数分析甲、乙两位同学中,哪位同学成绩较好;(3)又知同班同学丙的最近5次数学测验成绩(单位:分)如下:坏,并说明理由.解:(1)平均分:x -甲=15×(65+98+94+98+95)=90, x -乙=15×(62+98+99+100+71)=86. 甲的中位数是95,乙的中位数是98.(2)从平均分看,甲的平均分高,甲的成绩较好;从中位数看,乙的中位数大,乙的成绩较好.(3)x -丙=15×(80+90+86+99+95)=90,丙的中位数为90.s2丙=15×[(80-90)2+(90-90)2+(86-90)2+(99-90)2+(95-90)2]=44.4;s2甲=15×[(65-90)2+(98-90)2+(94-90)2+(98-90)2+(95-90)2]=158.8.由于两人的平均分相同,所以从平均分看,甲、丙成绩同样好;从中位数看,甲的中位数高,甲的成绩好;从方差看,丙的方差小,丙的成绩较稳定,所以丙的成绩好.。
第一章统计现代社会是信息化的社会,人们面临着更多的机会和选择,常常需要对大量纷繁复杂的信息作出恰当的选择与判断.为了更好地适应社会,人们必须具有一定的收集和分析数据,并作出合理决策的能力.统计是研究如何合理收集、整理、分析数据的学科,它可以为人们制定决策提供依据.因此,统计的基础知识已经成为一个未来公民的必备常识.在这一章中,学生将在义务教育阶段所学统计的基础上,通过实际问题情境,学习随机抽样、样本估计总体、线性回归的基本方法,体会用样本估计总体及其特征的思想;通过解决实际问题,较为系统地经历数据收集与处理的全过程,体会统计思维与确定性思维的差异.在义务教育阶段,学生已经通过丰富的实例,初步感受了抽样的必要性.在此基础上,教科书首先以具体的实例展开,主要从两个方面进一步讨论了抽样的必要性:一是总体的量很大,二是对总体的抽样具有破坏性;接着从一些统计误导的例子谈起,让学生体会什么样的样本才具有代表性;最后介绍了三种比较典型和常用的抽样方法,即简单随机抽样、分层抽样、系统抽样,通过具体的问题让学生体会不同抽样方法各自的优越性与局限性,并针对不同的问题选择适当的抽样方法.在随后的内容中,教科书首先复习了象形统计图、条形统计图、折线统计图、扇形统计图等,学习了一种新的统计图——茎叶图,通过具体的问题让学生不断体会它们各自的特点和用途,并有针对性地选择合适的统计图表;接着介绍了数据的数字特征,在平均数、中位数、众数、极差、方差等基础上,学习了一种新的数字特征——标准差,使学生能结合具体情境理解不同的数字特征意义,并能根据问题的需要,选择适当的数字特征来表达数据的信息;最后介绍了用样本估计总体的方法——用样本的频率分布(频率分布表、频率分布直方图、频率折线图)估计总体分布,用样本的基本数字特征估计总体的基本数字特征,并初步体会样本频率分布和数字特征的随机性.关于变量的相关性,对学生来说是一个新的内容.为此,教科书首先通过大量的例子,介绍了现实生活中存在的不满足函数关系的一些量,如人的身高与体重,人的身高与右手一拃长.通过变量之间的散点图,让学生探索用不同的方法确定线性回归直线;在此基础上,介绍了最小二乘法的方法,让学生体会最小二乘法的思想,并会根据给出的公式求线性回归方程;最后,再通过具体的例子让学生理解最小二乘法的思想,以及用样本数据拟合结果的随机性.当然,统计的学习最好通过案例来进行.因此,教科书还设计了两个大的统计活动:结婚年龄的变化、通俗歌曲的流行趋势,并在活动的要求上设计了一定的层次.通过这几个统计活动,使学生经历较为系统的数据处理全过程,在此过程中学习一些数据处理的方法,并运用所学的知识和方法去解决实际问题.教科书在设计和呈现时,选取了很多具有丰富背景的内容和问题情境来引入学习主题,展示统计思想和方法的广泛应用.例如,在统计图表一节中,教科书呈现了50人的智商、班级同学的身高、某某市居民的支出构成、自动售货机的销售额等丰富的素材,使学生能积极参与数学学习活动,开展数学探究.又如,教科书还提供了多个阅读材料,以此展现数学与现实的联系,激发学生学习统计的兴趣.值得注意的几个问题:1.注意与义务教育阶段统计与概率知识的衔接在统计与概率内容的教学中,一定要注意知识的衔接.教科书在设计时,已经考虑到这方面的因素.在统计内容设计时,尽可能关注在义务教育阶段没有学过统计与概率内容的学生,比如,在学习统计图表时,教科书安排了一些义务教育阶段内容的复习与提高.教学时,教师一定要注意这方面的问题.如果有个别知识内容学生学起来有困难,教师可以根据教科书内容展开讨论与教学.2.注意培养学生的学习兴趣在高中阶段的一开始,尤其要注意培养学生的学习兴趣.可能有些学生在义务教育阶段没有使用过课程标准试验教科书,统计与概率内容的学习对他们来说是一个全新的内容.一个新的学习内容一开始时,一定要注意培养学生的学习兴趣.3.注重使学生经历“收集数据—整理数据—分析数据—作出推断〞的统计活动全过程统计的学习,本质上是统计活动的学习,而不是概念和公式的学习.因此,教师在教学中要注重学生的实践,并亲自设计一些统计活动.另外,还要特别加强小组活动的组织与教学,并在活动的过程中引导学生逐步体会统计的作用和基本思想,体会统计思维与确定性思维的差异,注意到统计结果的随机性,统计推断是有可能犯错误的,等等.4.结合具体的、可操作的实例或情境进行教学,突出处理对象和数据的现实背景教师在教学中所采用的数据和问题情境应尽可能来源于实际,充分挖掘学生生活中与数据有关的素材,使他们体会所学内容与现实世界的密切联系.教学中可以选择反映现实社会和科学技术中学生感兴趣的素材,也可以从学生的生活实际中选取.实际上,很多渠道都为我们提供了非常多的有意义的问题,教师要充分挖掘,比如,可以从报刊杂志、广播电视、互联网等方面寻找素材.当然,教师还可以鼓励学生对他们认为感兴趣、有价值的问题开展调查,或让他们自己去收集生活中的数据,供课堂活动和讨论使用.另外,教师还可以根据本地区学校和学生的特点,灵活地使用教科书.5.注意统计思想的教学统计是为了从数据中提取信息,教学时应通过丰富的实例,引导学生根据实际问题的需求,选择不同的方法合理地选取样本,并从样本数据中提取需要的数字特征.不应把统计处理成数字运算和画图表.对统计中的概念(如“总体〞“样本〞等)应结合具体问题进行描述性说明,不应追求严格的形式化定义,应该主要关注学生统计观念的形成和统计意识的培养.6.统计教学必须通过案例来进行教学中应通过对一些典型案例的处理,使学生经历较为系统的数据处理全过程,在此过程中学习一些数据处理的方法,并运用所学知识、方法去解决实际问题.如,在学习线性相关的内容时,教师可以鼓励学生探索用多种方法确定线性回归直线.在此基础上,教师可以引导学生体会最小二乘法的思想,根据给出的公式求线性回归方程.对感兴趣的学生,教师可以鼓励他们尝试推导线性回归方程.7.注意现代信息技术的使用统计的要点是“做〞而不是记忆与运算,应鼓励学生尽可能运用计算器来处理复杂的数据,有条件的地区或学校,可以尝试用计算机等现代化手段,进行数据的处理和教学,以给学生留下充足的时间来经历统计活动的过程,更好地体会统计思想.整体设计教学分析首先,教科书从我国第五次人口普查展开讨论,并通过对人口普查的了解,说明普查的工作量大,要耗费大量的时间和资金.从某种意义来说,人口普查虽然规模大,还是可以实现的,但有时候,即使有时间、精力和财力也难以完成普查.因此,教科书通过几个现实生活中的例子来说明这一点,进而让学生体会到抽样的必要性.更进一步,教科书通过学生的思考与交流,总结出抽样调查的优点,让学生了解样本和总体的概念.如果有条件,教学时教师可以利用多媒体动态地展示我国第五次人口普查的有关信息,教师也可以借助当时电视、广播等媒体的有关报道,让学生更加直观、形象地了解我国人口普查的历史.三维目标1.了解普查和抽样的意义,提高学生解决实际问题的能力.2.掌握抽样调查的有关概念,能正确地选择调查方式,培养学生分析问题的能力.重点难点教学重点:选择适当的调查方式.教学难点:抽查的意义.课时安排1课时教学过程导入新课思路1.茶饮料是以茶叶水提取液或其浓缩液、速溶茶粉为原料,经加工、调配(或不调配)等工序制成的饮料.茶饮料和茶一样富含多种对人体有益的物质,深受广大消费者的欢迎.近年来,茶饮料工业发展迅速,是继碳酸饮料、瓶装水、果汁饮料之后迅速发展起来的又一饮料新品种.由于我国茶饮料市场潜力很大,大大小小的饮料生产企业都加入到茶饮料的生产行列,市场上该类产品的质量参差不齐.2012年夏天,国家质检总局对茶饮料产品质量进行了国家监督抽查.共抽查了、某某、某某、某某、某某、某某、某某、某某、某某、某某、某某、某某、某某、某某、某某等15个省市37家企业的52种产品,合格45种,产品抽样合格率约为86.5%.国家质检总局采取什么方式进行了调查?从这37家企业生产的52种产品中,抽查其中具有代表性的一部分,用抽查部分产品的质量来估计该类产品的质量.教师点出课题:从普查到抽样.思路 2.古往今来,人们把月饼当作吉祥、团圆的象征.每逢中秋佳节,阖家团聚,吃月饼赏明月是中华民族的传统文化.月饼发展到今日,品种更加繁多,风味因地各异.其中京式、苏式、广式、潮式等月饼广为我国南北各地的人们所喜爱.为维护广大消费者的合法权益,让消费者吃上放心的月饼,从1999年至今,质检总局已连续14年组织对月饼产品质量进行了产品质量国家监督专项抽查.跟踪抽查结果说明:目前我国月饼产品总体质量状况较好,产品质量稳步提高,特别是占据月饼主流市场的均为大中型企业和名牌企业,其产品质量很好.你知道为什么用抽查的方式吗?教师点出课题:从普查到抽样.推进新课新知探究提出问题下面呈现的是2000年我国第五次人口普查关于人口分布情况的一部分统计数据和一些新闻.·人口普查显示我国男女婴出生比未超过国际标准(2001年4月28日《青年报》) ·计划生育30年全国少生3亿(新华网2001年4月23日电(记者沈路涛))·人口普查数据显示:我国东西部人口密度之比为9∶1(2001年4月18日《青年报》) ·人口普查登记质量抽查说明漏登率为1.81%(中新网2001年3月28日消息)·我国男女性别比为106.74∶100(新华网2001年3月28日电)·第五次全国普查结果:我国总人口达到12.95亿(新华网2001年3月28日电)·某某一人口普查员劳累过度以身殉职(2000年11月23日《长江日报》)参考上面的阅读材料,针对上述统计数据和新闻回答下面的问题:1.什么叫普查?2.为什么要进行人口普查?3.在第五次人口普查中,为什么会出现漏登?4.在第五次人口普查的过程中,某某一人口普查员劳累过度以身殉职,说明了普查有什么弊端?5.什么样的调查适用普查?讨论结果:1.如果对所有的对象进行调查,那么这种调查称为普查.2.人口普查是一项重大的国情国力调查.世界上许多国家都把掌握本国准确和系统的人口数字、人口素质、人口结构等情况作为科学治国和宏观决策的基础.人口普查对国家宏观决策、发展社会经济、贯彻计划生育国策、合理安排劳动就业、发展教育事业、不断提高人民生活水平和保护生态环境等都将具有重大的现实意义和深远的历史意义.3.2000年的第五次人口普查,对于外出流动人口的界定理论上可行,但实际上划分困难,普查初期坚持原那么,后期又推翻原那么的现象出现,造成了人口漏登的现象.4.人口普查是一项非常艰巨的工作,要耗费大量的人力、物力与财力,工作时间长且非常繁重.5.当调查的对象很少或需要掌握所有对象的详细信息时,要选用普查.提出问题1.某灯管厂生产了一批灯管,现在要了解这批灯管的寿命(使用时间),能使用普查吗?2.什么样的调查不适用普查?那么这时采用什么调查方式?3.抽样调查与普查相比具有什么样的优点?讨论结果:1.由于调查灯管的使用寿命具有破坏性,即调查后的灯管不能再使用了,因此不能使用普查.2.调查具有破坏性或调查的对象太多时不适用普查,这时使用抽样调查.通常情况下,从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标作出推断,这种调查方式称为抽样调查.其中,调查对象的全体称为总体,被抽取的一部分称为样本.3.最突出的有两点:一是迅速、及时;二是节约人力、物力和财力.应用示例思路1例 1 医生是如何检验人的血液中血脂的含量是否偏高的?你觉得这样做的合理性是什么?解:大家都知道,医生在检验时是不可能将一个人的血液都抽出来进行普查的,因此,医生在检验人的血液中血脂含量是否偏高时,通常是抽取少量的血样进行检验,然后由此作出推断,认为这个人的血液状况基本如此.点评:当调查的对象很少或需要掌握所有对象的详细信息时,要选用普查;调查具有破坏性或调查的对象太多时不适用普查,这时使用抽样调查.变式训练为了准确调查我国某一时期的人口总量、人口分布、民族人口、城乡人口、受教育的程度、迁移流动、就业状况、人口住房等多方面情况,需要什么样的统计方法呢?解:要获得系统、全面、准确的信息,在对总体没有破坏性的前提下,如果想获得第一手的统计数据及资料,普查无疑是一个非常好的方法.此题要求全面准确调查我国的人口状况,因此应当用普查的方法进行调查.例2为了缓解城市的交通拥堵情况,某城市准备出台限制私家车的政策,为此要进行民意调查.某调查小组调查了一些拥有私家车的市民,你认为这样的调查结果会怎样?解:一个城市的交通状况的好坏将直接影响着生活在这个城市中的每个人,关系到每个人的利益.为了调查这个问题,在抽样时应当关注到各种人群,既要抽到拥有私家车的市民,也要抽到没有私家车的市民.调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.因此,在调查时,要对生活在该城市的所有市民进行随机的抽样调查,不要只关注到拥有私家车的市民.点评:抽取样本是否具有代表性是抽样调查的关键.变式训练中央电视台希望在春节联欢晚会播出后一周内获得当年春节联欢晚会的收视率.下面是三名同学为电视台设计的调查方案.同学A:我把这X《春节联欢晚会收视率调查表》放在互联网上,只要上网登录该网址的人就可以看到这X表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快统计出收视率了.同学B:我给我们居民小区的每一个住户发一份是否在除夕那天晚上看过中央电视台春节联欢晚会的调查表,只要一两天就可以统计出收视率了.同学C:我在本上随机地选出一定数量的,然后逐个给他们打,问一下他们是否收看了中央电视台春节联欢晚会,我不出家门就可以统计出中央电视台春节联欢晚会的收视率了.请问:上述三名同学设计的调查方案能够获得比较准确的收视率吗?为什么?解:调查的总体是所有可能看电视的人群.学生A的设计方案考虑的人群是:上网而且登录某网址的人群,那些不能上网的人群,或者不登录某网址的人群就被排除在外了.因此A同学的方案抽取的样本的代表性差.学生B的设计方案考虑的人群是小区内的居民,有一定的片面性.因此B同学的方案抽取的样本的代表性差.学生C的设计方案考虑的人群是那些有的人群,也有一定的片面性.因此C同学的方案抽取的样本的代表性差.综上,这三种调查方案都有一定的片面性,不能得到比较准确的收视率.点评:此题说明方便样本的代表性差.思路2例1为了了解全校2 000名学生的体重情况,从中抽取280名学生进行测量,以下说法正确的选项是( ).A.总体是2 000 B.个体是每一个学生C.样本是280名学生 D.样本容量是280解析:因为总体是2 000名学生的体重,所以A不正确;因为个体是每一个学生的体重,所以B不正确;因为样本是280名学生的体重,所以C不正确;很明显样本容量是280.答案:D陷阱提示:此题易错认为选项A,B,C均正确,其原因是没有审清题意,此题的调查对象是学生的体重..情况.变式训练1.假设要调查某城市家庭的收入情况,在该问题中,总体是( ).A.该城市B.该城市的所有家庭的收入C.该城市的所有人口D.该城市的工薪阶层解析:要调查某城市家庭的收入情况,在该问题中,总体是该城市的所有家庭的收入.答案:B2.为检验一批袋装牛奶的细菌含量是否超标,从中抽取了10袋进行检验.写出总体、个体、样本容量.解:总体是这批袋装牛奶的细菌含量,个体是一袋袋装牛奶的细菌含量,样本容量是10.2 以下调查工作适合采用普查方式的是( ).A.环保部门对淮河水域的水污染情况的调查B.电视台对正在播出的某电视节目收视率的调查C.质检部门对各厂家生产的电池使用寿命的调查D.企业在给职工做工作服前进行的尺寸大小的调查解析:A,B中的调查,在理论上来说采用普查是可行的,但是普查时会费时费力;C中,质检部门对各厂家生产的电池使用寿命的调查不能采用普查,如果生产的电池都用在了普查上,那么什么时候能生产出一块能够使用的电池呢?很明显,企业在给职工做工作服前进行的尺寸大小的调查必须作普查,否那么工人穿着工作服不一定合体.答案:D点评:对带有破坏性的调查必须采用抽查;对没有破坏性的调查:当调查的结果是每个个体的具体信息时,采用普查;否那么,如果总体中的个体数目较多,宜采用抽查;如果总体中的个体数目较少,宜采用普查.变式训练1.(1)某工厂要检查一个批次(10万个)螺钉的质量,请你给检验员提供一些检验方法上的建议,并说明你的理由.(2)某灯管厂要对一个批次灯管的寿命(使用时间)进行检验,你认为应当怎样进行检验?说明你的理由.解:(1)由于这批螺钉数目很大,建议进行抽样调查.(2)由于检查灯管的使用寿命带有破坏性,建议进行抽样调查.2.为什么说一个好的抽样调查胜过一次蹩脚的普查?解:普查费时费力,并且检查有时具有破坏性.抽样调查省时省力方便易行,其可能带来的破坏性很小,因此说一个好的抽样调查胜过一次蹩脚的普查.例 3 在统计调查中,问卷的设计是一门很大的学问,特别是对一些敏感性问题,例如学生在考试中有无作弊现象、社会上的偷税漏税等,更要精心设计问卷,设法消除被调查者的顾虑,使他们能够如实回答以下问题,否那么,被调查者往往会拒绝回答,或不提供真实情况.下面我们用一个例子来说明对敏感性问题的调查方法.某地区公共卫生部门想调查本地区中学生的吸烟情况,对随机抽出的200名学生进行了调查.请你帮助该地区卫生部门设计一个调查方案.假设你在调查中使用了如下两个问题.问题1:你的父亲阳历生日日期是不是奇数?问题2:你是否经常吸烟?先设计一个随机化装置,这是一个装有大小、形状和质量完全一样的50个白球和50个红球的袋子.然后让每个被调查者随机从袋中摸取1个球(摸出的球再放回袋中),摸到白球的学生如实回答第一个问题,摸到红球的学生如实回答第二个问题,回答“是〞的人往一个盒子中放一个小石子,回答“否〞的人什么都不要做.由于问题的答案只有“是〞和“否〞,而且回答的是哪个问题也是别人不知道的,因此被调查者可以毫无顾虑地给出符合实际情况的答案.请问:如果在200人中,共有58人回答“是〞,你能估计出此地区中学生吸烟人数的百分比吗?解:由题意可知,每个学生从口袋中摸出1个白球或红球的概率都是0.5,即我们期望大约有100人回答了第一个问题,另100人回答了第二个问题.在摸出白球的情况下,回答父亲阳历生日日期是奇数的概率是186365≈0.51.因而在回答第一个问题的100人中,大约有51人回答了“是〞.于是我们能推出,在回答第二个问题的100人中,大约有7人回答了“是〞,即估计此地区大约有7%的中学生吸烟.点评:在问卷的设计中,不但要考虑“难以启齿〞问题本身对调查结果的影响,而且还要考虑其他因素.例如,调查中问题的措辞会对被调查者产生影响,举例来说,“你在多大程度上喜欢吸烟〞与“你在多大程度上不喜欢吸烟〞两种问法中,前者会比后者给出更为肯定的答案.再如,问题在问卷中的位置也会对调查者产生影响.一般地,比较容易的、不涉及个人的问题应当排在比较靠前的位置,较难的、涉及个人的问题放在后面,等等. 变式训练1.假设要调查你所在的城市有多少人有酗酒或吸毒的历史,请你思考一下如何进行抽样,在抽样的过程中应当注意什么问题,并与同学交流自己的想法.解:由于城市居民太多,所以采取抽样调查.如果直接面对面调查可能出现“难以启齿〞,因此建议采取问卷形式的调查.在设计调查问题时,要注意措辞对调查者产生的影响,以及所设计问题在问卷中的位置对调查者产生的影响.一般地,比较容易的问题应当排在比。
第一章统计章末复习课课时目标 1.巩固本章主干知识点.2.提高知识的综合应用能力.1.某质检人员从编号为1~100这100件产品中,依次抽出号码为3,13,23,…,93的产品进行检验,则这样的抽样方法是( )A.简单随机抽样 B.系统抽样C.分层抽样 D.以上都不对2.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为( )A.7 B.15 C.25 D.353.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A.91.5和91.5 B.91.5和92C.91和91.5 D.92和924.在测试某个样本时,数据中有5个a1,4个a2,6个a3,10个a4,则这个样本的平均数为( )A.5a1+4a2+6a3+10a425B.a1+a2+a3+a425C.a1+4a2+6a3+10a45D.5a1+4a2+6a3+10a445.如果数据x1,x2,…,x n的平均数为x,方差为s2,则2x1+3,2x2+3,…,2x n+3的平均数和方差分别为( )A.x和s B.2x+3和4s2C.2x+3和s2 D.2x+3和4s2+12s+96.某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据均在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有______根棉花纤维的长度小于20 mm.一、选择题1.为了调查参加运动会的500名运动员的身高情况,从中抽查了50名运动员的身高,就这个问题来说,下列说法正确的是( )A.50名运动员是总体B.每个运动员是个体C.抽取的50名运动员是样本D.样本容量是502.某高级中学高一年级有十六个班,812人,高二年级有十二个班,605人,高三年级有十个班,497人,学校为加强民主化管理,现欲成立由76人组成的学生代表会,你认为下列代表产生的办法中,最符合统计抽样原则的是( )A.指定各班团支部书记、班长为代表B.全校选举出76人C.高三选举出20人,高二选举出24人,高一选举出32人D.高三20人,高二24人,高一32人均在各年级随机抽取3.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40和0.125,则n的值是( )A.640 B.320C.240 D.1604.观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿的体重在[2 700,3 000]的频率为( )A.0.001 B.0.01C.0.003 D.0.35.在某项体育比赛中,七位裁判为一选手打出的分数如下:90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )A.92,2 B.92,2.8C.93,2 D.93,2.86.下列图形中具有相关关系的两个变量是( )题号12345 6答案7.一个总体中有100个个体,随机编号0,1,2,…,99,依从小到大的编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同,若m=8,则在第8组中抽取的号码是________.8.一个样本容量是100的频率分布如图(1)样本落在[60,70)内的频率为________;(2)样本落在[70,80)内的频数为________;(3)样本落在[90,100)内的频率是0.16,该小矩形的高是________.9)的对应数据如下表:x 3528912y 46391214假设得到的关于x________.三、解答题10甲6080709070乙8060708075分别计算两个样本的平均数x和方差s2,并根据计算结果估计甲、乙谁的平均成绩较好?谁的各门功课发展较平衡?11.下表数据是退水温度x(℃)对黄酮延长性y(%)效应的试验结果,y是以延长度计算x(℃)300400500600700800y(%)405055606770(1)(2)指出x,y是否线性相关;(3)若线性相关,求y关于x的线性回归方程;(4)估计退水温度是1 000℃时,黄酮延长性的情况.12.在育民中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.(1)求第二小组的频率,并补全这个频率分布直方图;(2)求这两个班参赛的学生人数是多少?(3)这两个班参赛学生的成绩的中位数应落在第几小组内?(不必说明理由)能力提升成绩1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90(单位m)人数2323411 1(2)分析这些数据的含义.14.今年西南一地区遭遇严重干旱,某乡计划向上级申请支援,为上报需水量,乡长事先抽样调查了100户村民的月均用水量,得到这100户村民月均用水量的频率分布表如下表:(用水量分组频数频率[0.5,2.5)12[2.5,4.5)[4.5,6.5)40[6.5,8.5)0.18[8.5,10.5] 6合计100 1(1)(2)估计样本的中位数是多少?(3)已知上级将按每户月均用水量向该乡调水,若该乡共有1 200户,请估计上级支援该乡的月调水量是多少吨?答案 双基演练 1.B2.B [设样本容量为n ,则350750=7n,∴n =15.] 3.A 4.A [x =125(5a 1+4a 2+6a 3+10a 4)=5a 1+4a 2+6a 3+10a 425.] 5.B [因x 1+x 2+…+x n =n x ,所以2x 1+3+2x 2+3+…+2x n +3n =2(x 1+x 2+…+x n )+3n n =2n x n +3=2x +3.又(x 1-x )2+(x 2-x )2+…+(x n -x )2=ns 2,所以[2x 1+3-(2x +3)]2+[2x 2+3-(2x +3)]2+…+[2x n +3-(2x +3)]2=4[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=4ns 2.所以方差为4s 2.]6.30解析 纤维长度小于20 mm 的频率约为p =5×0.01+5×0.01+5×0.04=0.3, ∴100×0.30=30. 作业设计1.D [在这个问题中所要考察的对象是身高,另一方面,样本容量是指样本中的个体数目.]2.D [以年级为层,按各年级所占的比例进行抽样,为了使抽取的学生具有代表性,应在各年级进行随机抽样.]3.B [由40n=0.125,得n =320.]4.D [频率=频率组距×组距,由图易知:频率组距=0.001,组距=3 000-2 700=300,∴频率=0.001×300=0.3.]5.B [去掉95和89后,剩下5个数据的平均值x =90+90+93+94+935=92,方差s 2=15[(90-92)2+(90-92)2+(93-92)2+(94-92)2+(93-92)2]=2.8.]6.D [A 和B 符合函数关系,即对x 的每一个值,y 都有唯一确定的值与之对应;从C 、D 散点图来看,D 的散点都在某一条直线附近波动,因此两变量具有相关关系.]7.76解析 由题意知:m =8,k =8,则m +k =16,也就是第8组的个位数字为6,十位数字为8-1=7,故抽取的号码为76.8.(1)0.2 (2)30 (3)0.016解析 (1)由频率组距×组距=频率,得频率为0.2;(2)频率为0.3,又由频数=频率×样本容量,得频数为30; (3)由频率组距=高,得小矩形的高是0.016.9.(6.5,8)解析 x =16(3+5+2+8+9+12)=6.5,y =16(4+6+3+9+12+14)=8.由a =y -b x 得y =b x +a ,所以y =b x +a 恒过(x ,y ),即过定点(6.5,8). 10.解 x 甲=15×(60+80+70+90+70)=74,x 乙=15×(80+60+70+80+75)=73,s 2甲=15×(142+62+42+162+42)=104,s 2乙=15×(72+132+32+72+22)=56,∵x 甲>x 乙,s 2甲>s 2乙;∴甲的平均成绩较好,乙的各门功课发展较平衡. 11.解 (1)散点图如下.(2)由散点图可以看出样本点分布在一条直线的附近,可见y 与x 线性相关. (3)i 1 2 3 4 5 6 xi30400 500 600 700 800 y i40 50 55 60 67 70 x i y i12 00020 00027 50036 00046900560002i x90000160 000 250 000 360 000 490 000 640 000x =550,y =57∑6i =1x2i =1 990 000,∑6i =1x i y i =198 400 于是可得b =∑6i =1x i y i -6x y∑6i =1x 2i -6x 2=198 400-6×550×571 990 000-6×5502≈0.058 86,a =y -b x =57-0.058 86×550=24.627.因此所求的线性回归方程为 y =0.058 86x +24.627.(4)将x =1 000代入线性回归方程得 y =0.058 86×1 000+24.627=83.487, 即退水温度是1 000℃时, 黄酮延长性大约是83.487%.12.解 (1)各小组的频率之和为 1.00,第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05.∴第二小组的频率为:1.00-(0.30+0.15+0.10+0.05)=0.40.∴落在59.5~69.5的第二小组的小长方形的高=频率组距=0.4010=0.04.则补全的直方图如图所示.(2)设九年级两个班参赛的学生人数为x 人. ∵第二小组的频数为40人,频率为0.40, ∴40x=0.40,解得x =100(人). 所以九年级两个班参赛的学生人数为100人.(3)∵0.3×100=30,0.4×100=40,0.15×100=15,0.10×100=10,0.05×100=5, 即第一、第二、第三、第四、第五小组的频数分别为30,40,15,10,5,所以九年级两个班参赛学生的成绩的中位数应落在第二小组内.13.解 (1)在17个数据中,1.75出现了4次,次数最多,即众数是1.75;把成绩从小到大排列,中间一个数即第9个数据是1.70中的一个,即中位数是1.70;平均数x =117(1.50×2+1.60×3+…+1.90×1)≈1.69(m ).因此,17名运动员成绩的众数、中位数、平均数依次为1.75 m ,1.70 m,1.69 m . (2)众数是1.75说明了跳1.75 m 的人数最多;中位数是1.70 m 说明了1.70 m 以下和1.70 m 以上的成绩个数相等;平均数是1.69 m 说明了所有参赛运动员平均成绩是1.69 m .14.解 (1)频率分布表与相应的频率分布直方图和频率分布折线图如下:用水量分组 频数 频率 [0.5,2.5) 12.12[2.5,4.5) 240.24[4.5,6.5) 400.40[6.5,8.5) 180.18[8.5,10.5]6 0.06合计1001(2)前两个矩形面积和为0.12+0.24,第三个矩形一半的面积为0.5-(0.12+0.24),则所求的中位数为:4.5+0.5-(0.12+0.24)0.2=4.5+0.7=5.2.(3)该乡每户平均月均用水量估计为(1.5×12+3.5×24+5.5×40+7.5×18+9.5×6)/100=5.14. 上级支援该乡的月调水量应为5.14×1 200=6 168. 答 上级支援该乡的月调水量是6 168吨.。
§1.5估计总体的分布(一)一、教学目标:1、知识与技能:(1)通过实例体会分布的意义和作用。
(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图。
(3)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。
2、过程与方法:通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。
3、情感态度与价值观:通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。
二、重点与难点:重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图。
难点:能通过样本的频率分布估计总体的分布。
三、教学方法:探究归纳,思考交流四、教学设想(一)、创设情境在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50;乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布(板出课题)。
(二)、探究新知〖探究〗:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a 的部分按议价收费。
如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等。
1.1 从普查到抽样本节教材分析一、三维目标1、知识与技能(1)了解普查的意义,并能判断对一个总体是抽查还是普查;(2)理解随机抽样的必要性和重要性,并能分清抽查与普查.2、过程与方法学生通过“回顾-反思-巩固-小结”的过程中掌握普查与抽查的关系,理解它们的区别.3、情感、态度与价值观在探究活动中,通过学生的举例,激发学生学习数学的兴趣和积极性,培养他们的辨析能力以及培养他们的分析问题和解决问题的能力.二、教学重点:(1)普查的概念、抽查的运用;(2)判断对一个总体是抽查还是普查.三、教学难点:(1)分清抽查与普查;(2)对总体抽查;(3)分析普查与抽查之关系.四、教学建议首先,教科书从我国第五次人口普查展开讨论,并通过对人口普查的了解,说明普查的工作量大,要耗费大量的时间和资金.从某种意义来说,人口普查虽然规模大,还是可以实现的,但有时候,即使有时间、精力和财力也难以完成普查.因此,教科书通过几个现实生活中的例子来说明这一点,进而让学生体会到抽样的必要性.更进一步,教科书通过学生的思考与交流,总结出抽样调查的优点,让学生了解样本和总体的概念.新课导入设计如果有条件,教学时教师可以利用多媒体动态地展示我国第五次人口普查的有关信息,教师也可以借助当时电视、广播等媒体的有关报道,让学生更加直观、形象地了解我国人口普查的历史.(本书在备用课程资源中有这方面的内容,教师备课时可以参考) 导入一2011年2月9日,各卫视春晚全国网的收视率出炉,除安徽卫视和湖北卫视有所提升之外,其余地方卫视收视率均滑坡;另外值得注意的是2011年央视春晚CCTV-1的收视率有望突破30%,创近年来春晚收视的新高.这是央视-索福瑞媒介研究公司公布的调查结果,这一结果是怎么出炉的呢?是靠什么方法得到的呢?是不是把全国的所有电视用户都一一调查的呢?我们学习了本节就对这一问题有所了解了.导入二在初中我们就学习了统计的一些简单知识,下面我们从第五次人口普查再来更深入的了解普查与抽样.教学过程:一、复习准备:作用与讨论你是如何理解普查与抽样的关系的?我的思路:在统计中,有时由于检验对象的量很大,在很多的情况下,很难做到对所有考察的对象作全面的观测,有时根本无法施行.例如测试灯泡的寿命、医生检验人的血液中血脂的含量、判断山东省的成年人平均身高是否为全国之最等,这些试验有的是破坏性的,有的由于测试的总体包含的成员数量很大,如果逐一测试,要消耗大量的时间、人力、物力,得不偿失.一个行之有效的方法是从总体中选取部分个体,记录下来,并从这组数据来推断总体的情况.抽样调查与普查相比有很多优点,最突出的有如下几点:(1)迅速、及时要调查一个国家就业状况,如果采用普查,需要很长的时间去收集与处理数据,等统计数据出来之后,这个国家的就业状况又发生了一定的变化;而抽样调查就能很迅速与及时地得到统计数据,对一个国家的宏观调控起到一定的指导作用.(2)节约人力、物力和财力抽样调查面对的调查对象少,会节省更多的财力与物力.由于调查的对象少,因此可以对每个被调查个体的信息了解得更为详细,从而使获取的数据更加科学、可靠.(3)准确性一方面统计方案的设定是有统计学作为依据的,统计的过程是按照预先设计的方案来进行的;另一方面,由于人少,便于进行调查前的培训工作,提高调查的质量.例题思考当普查的对象很多时,普查的工作量很大,并且,在很多情况下,普查工作难以实现,通常情况下,从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标作出推测,这就是抽样调查.那么,如何抽取样本,直接关系到对总体估计的准确程度,所以抽样时要特别注意,保证每一个个体都可能被抽到,每一个个体被抽到的机会是均等的.例如,你要调查全国中学生学业负担的情况,可以先在自己班级进行调查,假设有58%的学生认为目前的课业负担过重,是不是可以说全国可能有58%的学生认为学业负担过重?这明显是以偏概全.但是你可以扩大抽样范围,比如从重点中学抽取一些样本,从普通中学抽取一些样本,从薄弱中学抽取一些样本,这样得到的结果比前面的结果将更加接近真相.要得到真实的结果,必须尽可能扩大抽样的范围与样本的代表性.要使我们的调查更接近客观实际,那就要多抽样本,比如多调查班级、学校,抽样越多,越接近实际.【例题】某校高中学生有900人,校医务室想对全校高中学生的身高情况作一次调查,为了不影响正常教学活动,准备抽取50名学生作为调查对象,校医务室若从高一年级中选出50名学生的身高来估计全校高中学生的身高,你认为这样的调查结果会怎样?该问题中的总体和样本是什么?分析:由于学生的身高会随着年龄的增长而增高,校医务室想了解全校高中学生的身高情况,在抽样时应当关注高中各年级学生的身高,既要抽到高一的学生,也要抽到高二和高三的学生.如果只抽取高一的学生,结果一定是片面的,不能代表全校高中学生的身高情况.因此,在调查时,要对高一、高二和高三的所有学生进行随机地抽样调查,不要只关注到高一学生的身高.这个问题涉及调查对象的总体是某校全体高中学生,其中每一个学生是个体.点评:抽样调查时,一定要保证随机性原则,尽可能地避免人为因素的干扰,且保证每个个体以一定的概率被抽到.[典型例题探究]【例1】你班的班主任想全面了解你班学生的学习和思想状况,请你帮助班主任设计一个调查方案.解:因为一个班的人数不是太多,为了帮助班主任全面了解班里学生的学习和思想状况,可以采取普查的方法进行调查.你可以先设计一个问卷,包括同学们对学习的各种看法,同学们的爱好、心理和思想状况等,然后发放给每一个学生,并全部收回,然后进行统计.这样就可以全面了解每个学生的学习和思想状况了.【例2】在食品质量检验中,为了检验某批次袋装牛奶(10万包)的细菌超标情况,请你说出检验方法,并说明其合理性.解:大家知道,要检验某批次袋装牛奶的细菌超标情况几乎不可能将每一包牛奶进行检验,也就是不可能进行普查,因此,我们只要抽取少量的进行检验就可以了,然后推断这批袋装牛奶的细菌是否超标,并对超标情况进行统计,认为这批牛奶的细菌超标情况基本如此.【例3】某玻璃厂要检验一批次(10万块)玻璃的质量(包括硬度、承受压力),应如何检验,并说明其合理性.解:我们知道,要检验玻璃的质量,不可能将每块玻璃都进行试验,因此我们检验这批玻璃时,可以抽取少量进行试验,由此来推断玻璃的质量.由上面例子我们看出,凡是大批量的,或有破坏性的检验通常用抽样调查的方法,而在总体容量不是很大的情况下,要获得更系统的信息,通常用普查的方法.【例4】如果现在有一项调查,调查你们学校学生的家庭平均月收入情况,那么你会怎样做?将你的想法写成调查方案,并与同学交流你的调查方案与想法,看看是否有需要改进的地方.解:由于学校人数较多,用普查的方法工作量太大,所以可以用抽样调查的方法.有的同学可能想先确定每个班要抽查的人数,然后用随机抽样的方法,抽取部分同学进行问卷调查,最后汇总各班情况进行统计,这是一个比较合理的方法.有的同学可能想先找到全校学生的学籍号,然后隔一定人数选出一位同学,这样找出了你要调查的样本,然后进行问卷调查,最后进行统计,得出结果,这也是一个不错的方法.有的同学可能想到,每位同学的家庭收入不同,先选10个家庭收入较高的调查,再选10个家庭收入中等的调查,最后选10个家庭收入较低的调查,这样选30个同学进行调查合理吗?可以与同学交流彼此的调查方案,看谁的方案更合理. 规律发现在总体容量不是很大的情况下,普查是全面获取信息最可靠的方法,它有两个特点:(1)所得资料更加全面系统;(2)能够得到某个时期的信息总量.这是大批量且有破坏性的检验问题,只能进行抽样调查,因为这同一批次牛奶细菌超标情况没有大的差异,所以这样检验是科学合理的. 抽样调查与普查相比有很多优点,最突出的有两点:(1)迅速、及时;(2)节约人力、物力、财力.对一个问题的调查,要具体问题具体分析,根据普查与抽查的特点,选用科学合理的方法.设计合理的调查方案是调查的基础,是统计活动中非常重要的环节.在一个班抽取的被调查人,一定要随机抽取,可以用抓阄的方法.这种方法是比较科学的,以后我们还会学习这一抽样方法.这种方法不是很合理,因为三种情况的家庭并不均等,应需要改进.。
2.2 分层抽样与系统抽样整体设计教学分析教学通过实例介绍了分层抽样与系统抽样及其步骤.分层抽样是高考的热点,其抽样过程中,在每一层常用简单随机抽样和系统抽样,因此建议改变教材的顺序,先学习系统抽样,再学习分层抽样.值得注意的是在教学过程中,教师适当介绍当nN 不是整数时,应如何实施系统抽样. 三维目标1.理解系统抽样,会用系统抽样从总体中抽取样本,了解系统抽样在实际生活中的应用,提高学生学习数学的兴趣.2.理解分层抽样,掌握其实施步骤,培养学生发现问题和解决问题的能力.3.掌握分层抽样与简单随机抽样和系统抽样的区别与联系,提高学生的总结和归纳能力,让学生领会到客观世界的普遍联系性.重点难点教学重点:实施系统抽样的步骤,分层抽样及其步骤.教学难点:当nN 不是整数,如何实施系统抽样,确定各层的入样个体数目,以及根据实际情况选择正确的抽样方法.课时安排2课时教学过程第1课时 系统抽样导入新课思路1.上一节我们学习了简单随机抽样,那么简单随机抽样的特点是什么?简单随机抽样是最简单和最基本的抽样方法,当总体中的个体较少时,常采用简单随机抽样.但是如果总体中的个体较多时,怎样抽取样本呢?教师点出课题:系统抽样.思路2.某中学有5 000名学生,打算抽取200名学生,调查他们对奥运会的看法,采用简单随机抽样时,无论是抽签法还是随机数法,实施过程很复杂,需要大量的人力和物力,那么有没有更为方便可行的抽样方法呢?这就是今天我们要学习的内容:系统抽样.推进新课新知探究提出问题(1)某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查,除了用简单随机抽样获取样本外,你能否设计其他抽取样本的方法?(2)请归纳系统抽样的定义和步骤.(3)系统抽样有什么特点?讨论结果:(1)可以将这500名学生随机编号1—500,分成50组,每组10人,第1组是1—10,第二组11—20,依次分下去,然后用简单随机抽样在第1组抽取1人,比如号码是2,然后每隔10个号抽取一个,得到2,12,22, (492)这样就得到一个容量为50的样本.这种抽样方法称为系统抽样.(2)一般地,要从容量为N 的总体中抽取容量为n 的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫作系统抽样.其步骤是:1°采用随机抽样的方法将总体中的N 个个体编号;2°将整体按编号进行分段,确定分段间隔k(k ∈N,l≤k);3°在第1段用简单随机抽样确定起始个体的编号l(l ∈N,l≤k);4°按照一定的规则抽取样本,通常是将起始编号l 加上间隔k 得到第2个个体编号(l+k),再加上k 得到第3个个体编号(l+2k),这样继续下去,直到获取整个样本.说明:从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想.(3)系统抽样的特点是:1°当总体容量N 较大时,采用系统抽样.2°将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k =[nN ]. 3°预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号.应用示例思路1例1 某工厂平均每天生产某种机器零件大约10 000件,要求产品检验员每天抽取50件零件,检查其质量状况.假设一天的生产时间中生产机器零件的件数是均匀的,请你设计一个调查方案.解:我们可以采用系统抽样,按照下面的步骤设计方案.第一步 按生产时间将一天分为50个时间段,也就是说,每个时间段大约生产5010000 =200件产品.这时,抽样距就是200.第二步 将一天中生产出的机器零件按生产时间进行顺序编号.比如,第一个生产出的零件就是0号,第二个生产出的零件就是1号等.第三步 从第一个时间段中按照简单随机抽样的方法,抽取一件产品,比如是k 号零件.第四步 顺序地抽取编号分别为下面数字的零件:k+200,k+400,k+600,…,k+9 800.这样总共就抽取了50个样本.点评:系统抽样与简单随机抽样一样,每个个体被抽到的概率都相等,从而说明系统抽样是等概率抽样,它是公平的.系统抽样是建立在简单随机抽样的基础之上的,将总体均分后对每一部分进行抽样时,采用的是简单随机抽样.变式训练1.下列抽样不是系统抽样的是( )A.从标有1—15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样B.工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验C.搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止D.电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈 分析:C 中,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的概率入样,所以不是系统抽样.答案:C2.某校高中三年级的295名学生已经编号为1,2,…,295,为了了解学生的学习情况,要按1∶5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.分析:按1∶5分段,每段5人,共分59段,每段抽取一人,关键是确定第1段的编号. 解:抽样过程是:(1)按照1∶5的比例,应该抽取的样本容量为295÷5=59,我们把259名同学分成59组,每组5人,第一组是编号为1—5的5名学生,第2组是编号为6—10的5名学生,依次下去,59组是编号为291—295的5名学生;(2)采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为l(l≤5);(3)按照一定的规则抽取样本,抽取的学生编号为l+5k(k=0,1,2,…,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,…,288,293.3.为了了解参加某种知识竞赛的1 000名学生的成绩,应采用什么抽样方法较恰当?简述抽样过程.解:适宜选用系统抽样,抽样过程如下:(1)随机地将这1 000名学生编号为1,2,3,…,1 000.(2)将总体按编号顺序均分成50部分,每部分包括20个个体.(3)在第一部分的个体编号1,2,3,…,20中,利用简单随机抽样抽取一个号码,比如18.(4)以18为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:18,38,58,…,978,998.例2 某装订厂平均每小时大约装订图书362册,要求检验员每小时抽取40册图书,检查其质量状况.请你设计一个调查方案.解:我们可以采用系统抽样,按照下面的步骤设计方案.第一步 把这些图书分成40个小组,由于40362的商是9,余数是2,所以每个组有9册书,还剩2册书.这时,抽样距就是9.第二步 先用简单随机抽样的方法从这些书中抽取2册书,不进行检验.第三步 将剩下的书进行编号,编号分别为0,1, (359)第四步 从第一组(编号分别为0,1,…,8)的书中按照简单随机抽样的方法,抽取1册书,比如说,其编号为k.第五步 顺序地抽取编号分别为下面数字的书:k+9,k+18,k+27,…,k+39×9.这样总共抽取了40个样本.点评:如果遇到nN 不是整数的情况,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除.变式训练1.某校高中三年级有1 242名学生,为了了解他们的身体状况,准备按1∶40的比例抽取一个样本,那么( )A.剔除指定的4名学生B.剔除指定的2名学生C.随机剔除4名学生D.随机剔除2名学生分析:为了保证每名学生被抽到的可能性相等,必须是随机剔除学生,由于401242的余数是2,所以要剔除2名学生.故选D.答案:D2.从2 008个编号中抽取20个号码,采用系统抽样的方法,则抽样的分段间隔为( )A.99B.99.5C.100D.100.5答案:C3.为了了解参加某种知识竞赛的1 003名学生的成绩,请用系统抽样抽取一个容量为50的样本.分析:由于501003不是整数,所以先从总体中随机剔除3个个体. 解:(1)随机地将这1 003个个体编号为1,2,3, (1003)(2)利用简单随机抽样,先从总体中剔除3个个体(可利用随机数表),剩下的个体数1 000能被样本容量50整除,然后再重新编号为1,2,3, (1000)(3)确定分段间隔.501000=20,则将这1 000名学生分成50组,每组20人,第1组是1,2,3,...,20;第2组是21,22,23,...,40;依次下去,第50组是981,982, (1000)(4)在第1组用简单随机抽样确定第一个个体编号l(l≤20).(5)按照一定的规则抽取样本.抽取的学生编号为l+20k (k=0,1,2,...,19),得到50个个体作为样本,如当k=2时的样本编号为2,22,42, (982)思路2例1 从已编号为1—50的50枚最新研制的某种型号导弹中随机抽取5枚来进行发射试验,若采用系统抽样方法,则所选取5枚导弹的编号可能是( )A.5,10,15,20,25B.3,13,23,33,43C.1,2,3,4,5D.2,4,6,16,32分析:用系统抽样的方法抽取到的导弹编号应该为k,k+d,k+2d,k+3d,k+4d,其中d=550=10,k 是1到10中用简单随机抽样方法得到的数,因此只有选项B 满足要求.答案:B点评:利用系统抽样抽取的样本的个体编号按从小到大的顺序排起来,从第2个号码开始,每一个号码与前一个号码的差都等于同一个常数,这个常数就是分段间隔.变式训练某小礼堂有25排座位,每排20个座位,一次心理学讲座,礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的所有25名学生进行测试,这里运用的是_____________抽样方法.答案:系统知能训练1.从学号为0—50的高一某班50名学生中随机选取5名同学参加数学竞赛,采用系统抽样的方法,则所选5名学生的学号不可能是( )A.1,2,3,4,5B.5,15,25,35,45C.2,12,22,32,42D.9,19,29,39,49答案:A2.采用系统抽样从个体数为83的总体中抽取一个样本容量为10的样本,那么每个个体入样的可能性为( ) A.8310 B.831 C.101 D.801 答案:A3.某单位的在岗工人为624人,为了调查工作上班时从家到单位的路上平均所用的时间,决定抽取10%的工人调查这一情况,如何采用系统抽样的方法完成这一抽样?答案:先随机剔除4人,再按系统抽样抽取样本.4.某学校有学生3 000人,现在要抽取100人组成夏令营,怎样抽取样本?分析:由于总体人数较多,且无差异,所以按系统抽样的步骤来进行抽样.解:按系统抽样抽取样本,其步骤是:①将3 000名学生随机编号1,2, (3000)②确定分段间隔k=1003000=30,将整体按编号进行分100组,第1组1—30,第2组31—60,依次分下去,第100组2971—3000;③在第1段用简单随机抽样确定起始个体的编号l(l ∈N ,0≤l≤30);④按照一定的规则抽取样本,通常是将起始编号l 加上间隔30得到第2个个体编号l+30,再加上30,得到第3个个体编号l+60,这样继续下去,直到获取整个样本.比如l =15,则抽取的编号为:15,45,75, (2985)这些号码对应的学生组成样本.拓展提升将参加数学竞赛的1 000名学生编号如下000,001,002,…,999,打算从中抽取一个容量为50的样本,按系统抽样方法分成50个部分,第一组编号为000,002,…,019,如果在第一组随机抽取的一个号码为015,则抽取的第40个号码为______________.分析:利用系统抽样抽取样本,在第一组抽取号码为l =015,分段间隔为k=501000 =20,则在第i 组中抽取的号码为015+20(i -1).则抽取的第40个号码为015+(40-1)×20=795. 答案:795课堂小结通过本节的学习,应明确什么是系统抽样,系统抽样的适用范围,如何用系统抽样获取样本.作业调查某班学生的身高情况,利用系统抽样的方法,样本容量为40.这个班共分5个组,每个组都是8名学生,他们的座次是按照身高高矮进行编排的.李立是这样做的,抽样距是8,按照每个小组的座次进行顺序编号.你觉得这样抽取的样本具有代表性吗?分析:假设这个班的学生是这样编号(这个编号也代表他们的身高)的:第一组 a 1<a 2<a 3<a 4<a 5<a 6<a 7<a 8;第二组 b 1<b 2<b 3<b 4<b 5<b 6<b 7<b 8;第三组 c 1<c 2<c 3<c 4<c 5<c 6<c 7<c 8;第四组 d 1<d 2<d 3<d 4<d 5<d 6<d 7<d 8;第五组 e 1<e 2<e 3<e 4<e 5<e 6<e 7<e 8.如果按照李立的抽样方法,比如在第一组抽到了8号,也就是a 8,那么所抽取的样本分别为a 8,b 8,c 8,d 8,e 8.显然,这样的样本不具有代表性,它们代表的身高偏高.。
第一章统计§1从普查到抽样(教师用书独具)●三维目标1.知识与技能(1)了解并掌握:普查、抽样调查、总体、样本、个体这些基本概念.(2)在调查中,会选择合理的调查方式.2.过程与方法(1)初步经历数据的收集、处理过程,发展学生初步的统计意识和数据处理能力.(2)通过数据收集的学习,培养学生应用、分析、判断能力.3.情感、态度与价值观(1)通过小组合作调查研究,培养学生的合作意识和处理问题的能力.(2)通过解决身边的实际问题,让学生认识数学与人类生活的密切联系及对人类历史发展的作用.●重点难点(1)掌握普查与抽样调查的区别与联系.(2)掌握总体、样本及个体间关系.(3)获取数据时,选择哪种调查方式较好,何时用普查,何时用抽样调查,并能说明理由 .(4)应用意识的培养,设计方案教学时要注意初高中知识的链接,抓住知识的切入点,从学生原有的认知水平入手,逐步引入、渗透、将重、难点逐一化解.(教师用书独具)●教学建议高中统计的学习,是在初中统计的基础上的深化与延伸.在教学中,引导学生复习初中统计学习的内容,在此基础上对高中统计学习的主要内容和重点给出学生做分析,以此从整体上把握本章的内容.充分分析和利用教材的实例,指导学生认识到抽样调查的必要性.围绕问题,让学生讨论如何进行抽样才能使得样本具有代表性.●教学流程设置情境,提出如人口普查,收视调查等问题,引发学生的兴趣和问题意识⇒引导学生明确普查与抽样的必要性,掌握普查与抽样调查的区别与联系⇒通过例1及变式训练,使学生理解总体、样本等概念,突出了重点⇒通过例2及变式训练,使学生掌握调查方式的选取,选择普查还是抽样调查的关键是什么,从而强化了重点⇒通过例3及变式训练,使学生学会调查方案的设计,获得运用数学方法探索问题和解决问题的途径,突破难点⇒课堂小结,总结升华,让学生对知识有一个系统的认识,突出重点,抓住关键⇒完成当堂双基达标检测落实各个知识点,突出重点,强化难点课标解读1.了解普查的意义和抽样调查的概念,理解抽样调查的必要性和重要性(重点).2.体会普查和抽样调查的各自的优点和区别,会对一些实际问题进行合理的抽样调查.(难点).普查【问题导思】1.我国常进行的普查有哪些?(举例)【提示】人口普查、农业普查、工业普查等.2.普查还被称作什么调查?【提示】整体调查或全面调查.普查是为了了解总体的一般情况,对所有的对象都无一例外地进行调查,也称整体调查或全面调查.当普查的对象很少时,普查无疑是一项非常好的调查方式.当普查的对象很多时,普查的工作量就很大,要耗费大量的人力、物力与财力,并且组织工作繁重、时间长.更值得注意的是,在很多情况下,普查工作难以实现.抽样调查继“三聚氰胺”、“瘦肉精”、“染色馒头”等国内食品安全事件的不断曝光,食品安全问题越业越受到人们的关注,也得到各级政府部门的重视.食品质量检测人员对某品牌牛奶的抽检合格率是99.9%,你知道这一数据是怎么得到的吗?【提示】检测人员是不可能逐个检查的,是抽取少量的牛奶来检查得到的.通常情况下,从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标作出推断,这就是抽样调查,其中,调查对象的全体称为总体,被抽取的一部分称为样本.普查与抽样调查的比较调查方法特点普查抽样调查优点①所取得的资料更加全面、系统;②调查特定时段的总体的信息①迅速、及时;②节约人力、物力、财力,对个体信息的了解更详细缺点耗费大量的人力、物力、财力获取的信息不够全面、系统适用范围总体容量不大,要获取详实、系统、全面的信息①大批量检验;②破坏性检验;③不必要普查等总体、样本等概念辨析题2013年某部门从某校高三1 256名学生中抽取300名学生进行身高的统计分析.下列说法正确的是( )A.1 256名学生是总体B.每个被抽取的学生是个体C.抽取的300名学生的身高是一个样本D.抽取的300名学生的身高是样本的容量【思路探究】对照总体、个体、样本及样本的容量的概念加以判断.【自主解答】研究的对象是学生的身高情况,故总体为1 256名学生的身高,样本容量为300,个体为每个被抽取的学生的身高,综上,C正确.【答案】 C解决此类问题的关键是分清有关概念:总体是研究对象的全体,总体中的所有个体数目为总体容量,组成总体的每个对象称为个体,从总体中抽取若干个个体称为样本,样本中个体的个数称为样本容量,要弄清概念的实质.现从80件产品中随机抽出20件进行质量检验.下列说法正确的是( ) A.80件产品是总体B.20件产品是样本C.样本容量是80 D.样本容量是20【解析】总体是80件产品的质量,样本是抽取的20件产品的质量,总体容量是80,样本容量为20.【答案】 D调查方式的选取标检验,应当选用何种调查方式?为什么?【思路探究】从调查所需时间和费用,以及是否具有破坏性考虑选择何种调查方式.【自主解答】应该用抽样调查的方法对该批小包装饼干进行卫生达标检验.采用普查的方法来检验食品是否卫生达标是不合适的,因为这里检查的目的是决定是否让这批小包装饼干出售,而普查的结果却使得这批小包装饼干完全不能出售,与检查的目的相违背.一般地,如果检验具有破坏性,则需要通过抽样调查来推断总体的特征.1.对总体进行调查,选择普查还是抽样调查关键是看调查的目的和两种调查方式的各自特点.2.一般地,总体数较多或调查中对产品具有破坏性时,多采用抽样调查.3.很多情况下,普查难以实现,在通常情况下,总是通过抽样调查来代替普查.假如你是某印刷厂的一名质检人员,负责对《新坐标》的印刷质量进行检查.你应该采用“普查”还是“抽样调查”,试说明理由.【解】如果对每一份《新坐标》都进行检查在理论上是可行的,但是实际上是不可行的.《新坐标》单科的发行量都在100万册以上,若普查要浪费大量的人力和物力,得不偿失,故应采取抽样调查的方式检查图书的印刷质量.调查方案的设计下面是三位同学为电视台设计的调查方案:同学A:我把这张《春节联欢晚会收视率调查表》放至互联网的某网站上,只要上网登录该网站的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中,这样我就可以很快地统计出收视率了.同学B:给我们居民小区的每一个住户发一个是否在除夕晚上看过中央电视台春节联欢晚会的调查表,只要一两天就可以统计出收视率.同学C:我在电话号码本上随机地选取一定数量的电话号码,然后逐个给他们打电话,问一下他们是否收看了中央电视台春节联欢晚会,我不出家门就可以统计出中央电视台春节联欢晚会的收视率.请问:上述三位同学设计的调查方案是否能获得比较准确的收视率?为什么?【思路探究】判断A,B,C三位同学的设计调查方案是否能获得较准确的收视率,关键是看他们的样本是否具有代表性,即看每个个体被抽到的机会是否相同.【自主解答】调查的总体是所有可能看电视的人群.同学A的设计方案考虑的人群是上网且登录某网站的人群,那些不能上网或不登录该网站的人就排除在外,故用此方法抽取的样本代表性差.同学B的设计方案考虑的人群是小区居民,有一定的片面性,故抽取的样本代表性差.同学C的设计方案考虑的人群是那些有电话的人群,有一定的片面性,因此抽取的样本代表性差.总之,这三种调查方案都有一定的片面性,不能得到比较准确的收视率,他们获得的样本代表性差.1.在统计活动中,需要对统计方案进行仔细的设计,以避免一些外界因素的干扰或人为因素的影响.2.根据调查问题的特点设计抽样调查的不同方案,应遵循的原则是:抽取的部分个体具有广泛的代表性,能很好的代表总体,否则调查结果与实际情况不相符.2013年春季,某知名的全国性服装连锁店进行了一项关于当年秋季服装流行色的民意调查,调查者通过向顾客发放饮料,并让顾客通过挑选饮料瓶的颜色来对自己喜欢的服装颜色“投票”,根据这次调查结果,在某大城市A,服装颜色的众数(大多数人的选择)为红色,而当年全国服装协会发布的是咖啡色,这个结果是否意味着A城市的人比其他城市的人较少倾向于选择咖啡色?你认为这两种调查的差异是由什么引起的?【解】这个结果意味着A城市中,光顾这家服装连锁店的人比其他城市的人较少倾向于选择咖啡色.由于光顾服装连锁店的人是一种比较容易得到的样本,不一定能代表A城市其他人群的想法,而A城市的调查结果来自于该市光顾这家服装连锁店的人群,这个样本不能很好地代表全国民众的观点,从而带来了调查结果的差异.概念模糊致误(2013·合肥检测)从某年级的1 000名学生中抽取125名学生进行体重的统计分析.下列说法正确的是( )A.1 000名学生是总体B.每个被抽查的学生是个体C.抽查的125名学生的体重是一个样本D.抽取的125名学生的体重是样本容量【错解】 B【错因分析】不清楚抽样调查的是学生的体重而不是学生.【防范措施】 1.正确理解总体、样本、样本容量、个体的定义.2.仔细审题,分析好各个选项.【正解】 C选择普查还是抽样调查的依据是调查的目的以及两种调查方式优缺点的比较,一般来说对于必须全部检验的问题一定要用普查的方法;若调查具有一定的破坏性或难度相当大,可以用抽样调查的方法.1.某校有40个班,每班50人,每班选派3人参加“学代会”,在这个问题中样本容量是( )A.40 B.50C.120 D.150【解析】每班3人,共40个班.故样本中的个体数为3×40=120.即样本容量为120.【答案】 C2.下列调查时,必须采用“抽样调查”的是( )A.调查某城市今年7月份的温度变化情况B.调查某一品牌5万包袋装鲜奶是否符合卫生标准C.调查我国所有城市中哪些是第一批沿海开放城市D.了解全班50名学生100米短跑的成绩【解析】检查袋装鲜奶的质量,具有破坏性,不宜用普查方式.【答案】 B3.为了解所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是( )A.总体 B.总体容量C.总体的一个样本 D.样本容量【解析】200个零件的长度为总体的一个样本.【答案】 C4.有人说“如果抽样方法设计得好,对样本进行视力调查与对24 300名学生进行视力普查的结果会差不多,而且对于教育部门掌握学生视力状况来说,因为节省了人力、物力和财力,抽样调查更可取”,你认为这种说法有道理吗?为什么?【解】这种说法有道理,因为一个好的抽样方法应该能够保证随着样本容量的增加,抽样调查的结果接近于普查的结果,因此只要根据误差的要求取相应容量的样本进行调查,就可以节省人力、物力和财力.一、选择题1.为了了解某地参加计算机水平测试的5 000名学生的成绩,从中抽取了200名学生的成绩进行统计分析,在这个问题中5 000名学生成绩的全体是( )A.总体B.个体C.从总体中抽取的一个样本D.样本的容量【解析】依据抽样调查的要求可知选A.【答案】 A2.抽样调查在抽取调查对象时( )A.按一定的方法抽取B.随便抽取C.全部抽取D.根据个人的爱好抽取【解析】根据抽样调查的要求,可知选A.【答案】 A3.下列调查方式合适的是( )A.要了解一批电视机的使用寿命,采用普查方式B.要了解收看中央电视台的“法制报道”栏目的情况,采用普查方式C.要保证“神舟十号”载人飞船发射成功,对重要零件采取抽查方式D.要了解外国人对“上海世博会”的关注度,可采取抽样调查方式【解析】检测电视机的寿命,具有破坏性,不宜用普查方式,故A不正确;由于收视观众较多,分布广,所以B不正确;对于“神舟十号”重要零件,数量不大,且至关重要,所以适合普查,因此C不正确;故选D.【答案】 D4.(2013·南昌检测)下列调查中属于抽样调查的是( )①每隔5年进行一次人口普查;②某商品的质量优劣;③某报社对某个事件进行舆论调查;④高考考生的身体检查.A.②③B.①④C.③④ D.①②【解析】①④为普查,②③为抽样调查.【答案】 A5.下面问题可以用普查的方式进行调查的是( )A.检验一批钢材的抗拉强度B.检验海水中微生物的含量C.检验10件产品的质量D.检验一批汽车的使用寿命【解析】A不能用普查的方式调查,因为这种试验具有破坏性;B用普查的方式无法完成;C可以用普查的方式进行调查;D该试验具有破坏性,且需要耗费大量的时间,在实际生产中无法应用.【答案】 C二、填空题6.为了准确调查我国某一时期的人口总量、人口分布、民族人口、城乡人口、受教育的程度、迁徒流动、就业状况等多方面的情况,需要用________的方法进行调查.【解析】要获得系统、全面、准确的信息,在对总体没有破坏的前提下,普查无疑是一个非常好的方法,要求全面、准确调查人口的状况,应当用普查的方法进行调查.【答案】普查7.检验员为了检查牛奶中是否含有黄曲霉素MI,应采用________的方法检验.【解析】这是大批量的破坏性检验,不可能进行普查,应当采取抽样调查的方法检验.【答案】抽样调查8.为了了解某班学生的会考合格率,要从该班70人中选30人进行考察分析.在这个问题中,70人的会考成绩的全体是________,样本是________,样本容量是________.【解析】由总体、样本、样本容量的定义知:70人的会考成绩的全体是总体,样本是30人的会考成绩.样本容量是30.【答案】总体30人的会考成绩30三、解答题9.某市有7万名学生参加学业水平测试,要想了解这7万名学生的数学成绩,从中抽取了1 000名学生的数学成绩.(1)在此项调查中总体是什么?(2)在此项调查中个体是什么?(3)在此项调查中样本是什么?(4)在此项调查中样本容量是什么?【解】(1)总体是7万名学生的数学成绩.(2)个体是7万名学生中每一名学生的数学成绩.(3)样本是从7万名学生的数学成绩中抽取1 000名学生的数学成绩.(4)样本容量是1 000.10.某县有在校高中生6 400人,初中生30 200人,小学生30 300人.该县电教站为了了解本县对计算机的推广及学生掌握的熟练程度,该部门应如何抽取样本?【解】因为影响学生计算机知识的掌握及使用情况的因素是多方面的,不同的乡镇,不同的学校,办学条件也不同,因此在进行抽样时,宜将学生按城、乡及高中、初中、小学分别抽样.另外,三类学生人数相差较大.因此,为了提高样本的代表性,还应考虑他们在样本中所占的比例大小.11.你的班主任想全面了解你班学生的学习和思想状况.请你帮助班主任设计一个调查方案.【解】因为一个班的人数不是太多,为了帮助班主任全面了解班里学生的学习和思想状况,可以采取普查的方法进行调查.可以先设计一个问卷,包括同学们对学习的各种看法,同学们的爱好、心理和思想状况等,然后发放给每一个学生,并全部收回,然后进行统计,这样就可以全面了解每个学生的学习和思想状况了.(教师用书独具)指出下列调查分别适于进行普查,还是适于进行抽样调查.(1)调查除夕之夜我国有多少人观看中央电视台的春节联欢晚会;(2)调查某工厂生产的一万件胶卷中有无不合格产品;(3)调查一万张面值为100元的人民币中有无假币;(4)调查当今中学生中,喜欢听年轻教师讲课的多,还是喜欢听老教师讲课的多.【解】(1)我国人口众多,地域辽阔,要用普查的方式调查有多少人在除夕之夜看了“春节联欢晚会”,需投入大量的人力、财力,实属得不偿失.(2)把未曾使用的胶卷逐个仔细检查,实际是把全部产品报废,显然是愚蠢的设想.(3)一万张人民币,数量虽大,但不应允许有一张假币给人民群众造成经济损失,也不应允许任何制造假币者逃脱法网,况且,用目前的技术手段检查一万张人民币中是否有假币混入,并非难事,也不需太多时间.(4)当今中学生的数量实在太庞大了,又很分散.这四项调查工作,只有第(3)项应以普查的方式进行,其余三项均以抽样调查的方式进行为妥.“三聚氰胺奶粉事件”举国震惊,质检也变得尤为重要,由于总体中的个体数是很大的,检验人员只能从一大批罐装奶粉中进行抽样调查.你能从这个例子出发说明一下抽样调查的必要性吗?【解】如果普查,会很费时费力,等检查完了,奶粉可能变质了,况且检查奶粉具有破坏性,每罐奶粉检查时必须拆开,这样检查就会得不偿失,没有什么意义了.而此时抽样调查就比较理想了.§2抽样方法2.1 简单随机抽样(教师用书独具)●三维目标1.知识与技能理解统计学需要解决的问题、抽样的必要性,简单随机抽样的概论,掌握简单随机抽样的两种方法.2.过程与方法通过对生活中的实例分析、解决,体验简单随机抽样的科学性及其方法的可靠性,培养分析问题,解决问题的能力.3.情感、态度与价值观通过身边事例研究,体会抽样调查在生活中的应用,培养抽样思考问题意识,养成良好的个性品质.●重点难点重点:掌握简单随机抽样常见的两种方法(抽签法、随机数法)难点:理解简单随机抽样的科学性,以及由此推断结论的可靠性学生已有的认知基础是,初中学习过统计的基础知识,并对总体、样本、个体等知识有了初步的了解,对为什么要进行抽样已有了感性认识,但对如何实施抽样缺乏系统的了解.对简单随机抽样的概念的认识上,学生对抽签法有感性认识,但对抽样过程的科学、合理、使每个个体被抽到的可能性相等的理解存在差异,因而对概念的本质理解也可能有所差异.在利用抽签法进行简单随机抽样时,学生对此方法比较熟悉,但对程序化或流程图式的解决问题模式接触不多,因而可能出现解题过程的不完善.在利用随机数法进行简单随机抽样时,学生在对物件进行标号时由于位数的不一致而可能产生抽样过程的错误,同时在选号的规则上可能带来一些误差.(教师用书独具)●教学建议考虑到学生的知识水平和理解能力以及课堂教学的信息量,教师可从信息技术和数学知识的有效整合入手,从实际生活中提炼数学素材,从激励学生探究知识入手,通过直观演示,优化教学,使学生在熟悉的知识背景下探求新知.通过视频片断,实例图片,Excel表格的综合应用,丰富学生的体验,给学生多一点空间和时间,把任务角色还给学生,使学生亲历数学发现、创造的过程,获得对数学价值的认识,通过分层激励,让不同层次的学生获得最大进步.●教学流程设置情境,提出问题一锅水饺的味道如何品尝?⇒引导学生结合现实生活中的实际问题,思考讨论得出随机抽样的概念⇒引导学生明确抽样的必要性,掌握抽样的特点及方法突出“等可能性”特征⇒通过例1及变式训练使学生进一步明确随机抽样的特征,明确什么是简单随机抽样⇒通过例2及变式训练使学生掌握抽签法的应用,体会抽签法的“公平性”,突破难点,突出重点⇒通过例3及变式训练使学生掌握随机数法的应用,体会该种方法的科学性与优越性⇒课堂小结,总结升华,让学生对知识有一个系统的认识,突出重点,抓住关键⇒完成当堂双基达标,落实各个知识点,突出重点,强化难点课标解读1.理解简单随机抽样的概念及其两种方法(重点).2.会用简单随机抽样方法解决实际问题(难点).3.抽签法和随机数法的异同(易混点).简单随机抽样的概念【问题导思】1.某月某种商品的销售量、电视剧的收视率等这些数据是如何得到的?【提示】一般是从总体中收集部分个体数据得出结论.2.要判断一锅汤的味道需要把整锅汤都喝完吗?应如何判断?【提示】不需要,只要将锅里的汤“搅拌均匀”品尝一小勺就知道汤的味道.在抽取样本的过程中,要保证每个个体被抽取到的概率相同.这样的抽样方法叫作简单随机抽样.这是抽样中一个最基本的方法.简单随机抽样的方法简单随机抽样{抽签法随机数法简单随机抽样的概念(1)从无限多个个体中抽取50个个体作为样本.(2)箱子里共有100个零件,今从中选取10个零件进行检验,在抽样操作时,从中任意地拿出一个零件进行质量检验后再把它放回箱子里.(3)从50个个体中一次性抽取5个个体作为样本.【思路探究】要判断所给的抽样方式是否是简单随机抽样,关键是看它们是否符合简单随机抽样的特点.【自主解答】(1)不是简单随机抽样.因为被抽取样本的总体的个体数是无限的而不是有限的.(2)不是简单随机抽样.因为它是放回抽样,简单随机抽样,可分为不放回抽样和放回抽样,而本章定义中规定的是不放回抽样,所以它不是简单随机抽样.(3)不是简单随机抽样.因为它是一次性抽取,而不是“逐个”抽取.简单随机抽样具备以下四个特点:①总体的个体数较少,②逐个抽取,③不放回抽样,④等可能抽样.判断抽样方法是否是简单随机抽样,只需看是否符合上述四个特点,若有一条不符合就不是简单随机抽样.下列问题中,最适合用简单随机抽样方法的是( )A.某电影院有32排座位,每排40个,座位号是1~40,有一次报告会坐满了听众,报告会结束后为听取意见,要留下32名听众进行座谈B.从10台冰箱中抽取3台进行质量检查C.某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人.教育部门为了了解学校机构改革意见,要从中抽取一个容量为20的样本D.某乡镇有山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩,要抽取田地480亩估计全乡田地平均产量【解析】根据简单随机抽样的特点进行判断:A的总体容量较大,用简单随机抽样的方法比较麻烦;B的总体容量较小,用简单随机抽样的方法比较简单、方便;C中由于学校各类人员对这一问题的看法的差异可能很大,不宜采用简单随机抽样;D总体容量较大,且各类田地的产量差别很大,也不易采用简单随机抽样.【答案】 B。
第一章统计本章知识体系专题一三种抽样方法的比较【例1】(1)某社区有500户家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户,为了了解社会购买力的某项指标,要从中抽取一个容量为100的样本;(2)从10名同学中抽取3人参加座谈会.Ⅰ.简单随机抽样Ⅱ.系统抽样方法Ⅲ.分层抽样方法问题与方法配对正确的是( )A.(1)Ⅲ,(2)ⅠB.(1)Ⅰ,(2)ⅡC.(1)Ⅱ,(2)ⅢD.(1)Ⅲ,(2)Ⅱ【解答】(1)中由于这500户家庭之间的收入有明显的差异,故采用分层抽样;(2)中个体无差异,且总体中个体数目较少,则采用简单随机抽样.【答案】 A【规律方法】选择抽样方法的标准是:先判断总体中个体有无差异,当总体中个体有差异时,无论总体中个体数目的多少,都应选择分层抽样;当总体中的个体无差异时,再判断总体中的个体数目的多少,如果个体数目较少,则用简单随机抽样,如果个体数目较多,则用系统抽样.(1)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( C )A .50B .40C .25D .20(2)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为1_800件.解析:(1)根据系统抽样的特点可知分段间隔为1 00040=25,故选C.(2)设乙设备生产的产品总数为x 件,则甲设备生产的产品总数为(4 800-x )件.由分层抽样特点,结合题意可得5080=4 800-x4 800,解得x =1 800.专题二 统计图表【例2】 2018世界锦标赛中国女子排球队队员的年龄如下: 号 2 3 4 6 7 8 9 10 12 15 16 18 年龄/岁252424242523292924262422【解答】 用条形统计图表示如下图所示.用扇形统计图表示如下图所示.【规律方法】从不同的角度出发,可作出不同的统计图.小明家2018年的四个季度的用电量如下:季度名称用电量(单位:千瓦·时)第一季度 250 第二季度 150 第三季度 400 第四季度200其中各种电器用电量如下表:各种电器 用电量(单位:千瓦·时)空调 250 冰箱 400 照明 100 彩电 150 其他100根据以下三幅统计图回答:(1)从哪幅统计图可看出各个季度用电量变化情况? (2)从哪幅统计图可看出冰箱用电量超过总用电量的14?(3)从哪幅统计图可以清楚地看出空调用电量? 解:(1)折线统计图; (2)扇形统计图; (3)条形统计图.专题三 用样本的频率分布估计总体分布【例3】如下表所示给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料.(单位:cm)(2)画出频率分布直方图;(3)估计身高低于134 cm的人数占总人数的百分比.【思路探究】(1)根据频数计算出频率.分“分组”、“频数”、“频率”三列,列出频率分布表.(2)根据频率分布表画出频率分布直方图.(3)根据频率分布表计算出身高低于134 cm的频率.【解答】(1)样本的频率分布表:(2)(3)因为样本中身高低于134 cm 的人数的频率为5+8+10120=23120≈0.19,所以估计身高低于134 cm 的人数约占总人数的19%.【规律方法】 通常利用样本的频率分布和频率分布直方图对总体情况作出估计,有时也利用频率分布折线图和茎叶图对总体情况作出估计.频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在频率分布表中看不清楚的数据模式,这样根据样本的频率分布,我们就可以大致估计出总体的分布.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有24株树木的底部周长小于100 cm.解析:底部周长在[80,90)的频率为0.015×10=0.15,底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm 的株数为(0.15+0.25)×60=24.专题四 用样本的数字特征估计总体的数字特征【例4】 某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min 抽取一包产品,称其重量,分别记录抽查数据如下:甲:102,101,99,98,103,98,99 乙:110,115,90,85,75,115,110 (1)这种抽样方法是哪一种? (2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间产品较稳定. 【思路探究】 (1)由简单随机抽样的特点判断; (2)“茎”上写十位或百位,“叶”上写个位; (3)计算方差的大小比较稳定性.【解答】 (1)根据三种抽样的特点可知为系统抽样. (2)茎叶图为:(3)x 甲=17(102+101+99+103+98+99+98)=100,x 乙=17(110+115+90+85+75+115+110)=100,所以x 甲=x 乙=100.s 2甲=17[(102-100)2+(101-100)2+(99-100)2+(103-100)2+(98-100)2+(99-100)2+(98-100)2]≈3.428 6,s 2乙=17[(110-100)2+(115-100)2+(90-100)2+(85-100)2+(75-100)2+(115-100)2+(110-100)2]≈228.571 4.由于x 甲=x 乙,s 2甲<s 2乙,所以甲车间产品较稳定.【规律方法】总体的平均数与标准差往往通过样本的平均数、标准差来估计.一般地,样本容量越大,对总体的估计越精确.平均数描述集中趋势,方差、标准差描述波动大小,也可以说方差、标准差反映各个数据与其平均数的离散程度.一组数据的方差或标准差越大,说明这组数据波动越大.方差的单位是原数据单位的平方,标准差的单位与原单位相同.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指[75,85)[85,95)[95,105)[105,115)[115,125) 标值分组频数62638228(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解:(1)(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.专题五线性回归分析【例5】每立方米混凝土的水泥用量x(kg)与28天后混凝土的抗压强度y(kg/cm2)之间的关系有如下数据:x 150 160 170 180 190 200 y56.9 58.3 61.6 64.6 68.1 71.3x 210 220 230 240 250 260 y74.177.480.282.686.489.7(1)画出散点图;(2)若y 与x 之间具有线性相关关系,求回归直线方程;(3)如果两种水泥用量下的抗压强度相差12.5,则水泥用量相差多少?【思路探究】 先画出散点图,确定y 与x 之间是否线性相关,再根据求回归直线方程的步骤求出回归直线方程,最后根据回归方程确定水泥用量的差别.【解答】 (1)由已知数据可画出散点图如下图所示:(2)x =205,y =72.6,∑i =112x 2i =518 600,∑i =112x i y i =182 943,则b =∑i =112x i y i -12x y∑i =112x 2i -12x 2≈0.304,a =y -b x =72.6-0.304×205=10.28,故所求的线性回归方程为y =0.304x +10.28.(3)设两种水泥用量为x 1,x 2,则对应抗压强度为y 1=0.304x 1+10.28,y 2=0.304x 2+10.28.由题意y 1-y 2=0.304(x 1-x 2)=12.5, 所以x 1-x 2≈41.12.故当两种水泥用量下的抗压强度相差12.5 kg/cm 2时,水泥用量相差41.12 kg. 【规律方法】 两个变量之间的关系可能是确定的函数关系,也可能是不确定的相关关系.分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘法求出回归方程.从散点图上,我们可以分析出两个变量是否存在相关关系.如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这条直线叫作回归直线,直线的方程叫作回归方程.求回归方程的步骤:(1)先把数据制成表,从表中计算出∑i =1nx i ,∑i =1ny i ,∑i =1nx 2i ,∑i =1nx i y i ,x ,y ;(2)计算回归系数a ,b ; (3)写出回归方程y =bx +a .有人收集了春节期间平均气温x 与某取暖商品销售额y 的有关数据如下表:平均气温(℃) -2 -3 -5 -6 销售额(万元)20232730根据以上数据,用线性回归的方法,求得销售额y 与平均气温x 之间的线性回归方程y =bx +a 的系数b =-2.4.则预测平均气温为-8℃时该商品的销售额为( A )A .34.6万元B .35.6万元C .36.6万元D .37.6万元解析:x =-2+-3+-5+-64=-4,y =20+23+27+304=25,所以25=(-2.4)×(-4)+a .所以a =15.4,所以回归直线方程为y =-2.4x +15.4.当x =-8时,y =34.6,即预测平均气温为-8℃时,该商品的销售额为34.6万元.故选A.专题六 数形结合思想【例6】 为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8:00~10:00间各自的点击量,得如图所示的茎叶图,根据茎叶图求:(1)甲、乙两个网站点击量的极差分别是多少?(2)甲网站点击量在[10,40]间的频率是多少?(3)观察茎叶图,估计甲、乙两个网站哪个更受欢迎,并说明理由.【思路探究】茎叶图的比较可以观察茎叶图中反映的信息,通过极差可以粗略判断分散集中程度.【解答】(1)根据茎叶图,得甲网站的点击量的最大值是73,最小值是8,乙网站的点击量的最大值是71,最小值是5.则甲网站的极差为73-8=65,乙网站的极差为71-5=66.(2)观察茎叶图,得甲网站点击量在[10,40]间的有20,24,25,38,共4个,所以甲网站点击量在[10,40]间的频率为414=27.(3)观察茎叶图,得甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.【规律方法】数形结合思想在本章中的重要应用是通过频率分布的态势对总体进行估计及根据散点图确定两个变量是否具有相关关系,并做出判断.统计图表(频率分布直方图、茎叶图)与数字特征(平均数、中位数、方差)是高考的重点和热点内容,几乎每年必考,通常以茎叶图和频率分布直方图为载体,考查平均数、中位数、方差等的计算.高考对变量间的相关性的考查呈逐年上升的趋势,主要考查借助散点图直观地分析两个变量间的相关关系,知道回归直线经过样本中心,会求回归方程,并能利用方程对有关变量作出估计.从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x 甲、y 乙,中位数分别为m 甲、m 乙,则下列关系中正确的是②(填序号).①x 甲<x 乙,m 甲>m 乙 ②x 甲<x 乙,m 甲<m 乙③x 甲>x 乙,m 甲>m 乙 ④x 甲>x 乙,m 甲<m 乙解析:由茎叶图m 甲=22+182=20,m 乙=27+312=29. ∴m 甲<m 乙.x 甲=116(41+43+30+30+38+22+25+27+10+10+14+18+18+5+6+8)=34516, x 乙=116(42+43+48+31+32+34+34+38+20+22+23+23+27+10+12+18)=45716. ∴x 甲<x乙.。
1.3统计图表本节教材分析一、三维目标1、知识与技能(1)掌握常用四种统计图表(条形统计图、扇形统计图、折线统计图、茎叶图)的功能及其特点;(2)能针对实际问题和收集到的数据的特点,选择科学的统计图表;(3)能从统计图表中获取有价值的信息.2、过程与方法通过“复习—巩固—加深—引入新知”的过程中掌握条形统计图、折线统计图、扇形统计图、茎叶图,能科学选择合适的图表示数据,并能从图中得到数据.3、情感态度与价值观在探究活动中,通过学生的举例,激发学生学习数学的兴趣和积极性,培养他们的辨析能力以及培养他们的分析问题和解决问题的能力.二、教学重点:用统计图表表示数据.三、教学难点:统计图表的制作.四、教学建议在义务教育阶段,学生已经通过实例,学习了象统计图、条形图、折线统计图、扇形统计图等,并能解决简单的实际问题.在这个基础上,高中阶段还将进一步学习茎叶图,并在学习中不断地体会它们各自的特点,在具体的问题中根据情况有针对性的选择一些合适的图表.新课导入设计导入一一图胜千字,看懂图是21世纪所有人必须具备的能力.如图所示,大家能从这图中的得到什么样的信息?这就是我们这一节要解决的问题.导入二初中我们学习了条形统计图、折线统计图、扇形统计图这一节我们继续更深入地学习这些知识.看看这些知识除了我们初中学习过的,还有没有更深的知识.是不是还有其它的方法表示数据.【教学过程】:✧名人指引华罗庚教授:数无形,少直观;形无数,难入微。
图形和数据若能恰当、准确的结合起来,必然是最具有说服力的。
扇形图、频数分布直方图都是常见的统计图,在网上、书籍、杂志、报纸上我们还会看到许多其他形式的统计图或统计表,它们使数据变得一目了然,让读者很快就能了解作者想要表达的信息.那么,哪种统计图表可以较为准确而迅速地反映出要表达的信息呢?✧世界人口下面是权威机构公布的一组反映世界人口的数据:1957年世界人口30亿,17年后(即1974年)增加了10亿,即达40亿;又过13年达到50亿;到1999年全世界总人口达到60亿。
§3 统计图表整体设计教学分析在义务教育阶段,学生已经通过实例,学习了象形统计图、条形统计图、折线统计图、扇形统计图、茎叶图,并能解决简单的实际问题.(由于义务教育阶段《大纲》中对统计部分的要求与《标准》的要求相差较大,若是承接现行《大纲》的话,建议先补充《标准》中第三学段相应部分的内容)在这个基础上,高中阶段还将进一步学习茎叶图,并在学习中不断地体会它们各自的特点,在具体的问题中根据情况有针对性地选择一些合适的图表.通过问题1和问题2,一方面让学生通过具体的实例,初步体会总体及其分布的含义,同时为后面理解总体分布的意义、用样本的频率分布估计总体的分布作一个铺垫;另一方面复习义务教育阶段已经学过的一些统计图,并进一步发展学生从统计图表中获取信息的能力.三维目标1.通过实例初步体会分布的意义和作用,在表示样本数据的过程中,掌握条形统计图、折线统计图、扇形统计图,体会它们各自的特点,提高学生的画图能力;2.能根据实际需要选择适当的统计图表来分析数据,进一步发展学生从统计图表中获取信息的能力.重点难点教学重点:条形统计图、折线统计图、扇形统计图、茎叶图及其应用.教学难点:根据实际需要选择适当的统计图表.课时安排1课时教学过程导入新课思路1.下面是权威机构公布的一组反映世界人口的数据:1957年世界人口30亿,17年后(即1974年)增加了10亿,即达40亿;又过13年达到50亿;到1999年全世界总人口达到60亿.以此速度,人口学专家预测到2025年,世界人口将达到80亿;而到2050年人口将超过90亿,其中亚洲人口最高,将达到52.68亿,北美洲3.92亿、欧洲8.28亿、拉丁美洲及加勒比地区8.09亿,非洲17.68亿.那么怎样看出世界人口的总体变化情况呢?教师点出课题:统计图表.思路2.前面我们学习了科学的抽样方法,那么抽出样本后,怎样用图表来分析所得数据呢?教师点出课题:统计图表.推进新课新知探究提出问题1.什么叫条形统计图?有什么特点?2.什么叫折线统计图?有什么特点?3.什么叫扇形统计图?有什么特点?4.什么叫茎叶图?有什么特点?讨论结果:1.用一定的单位长度表示一定的数量,并根据数据的多少画出长短不同的直条,然后把这些直条按照一定的顺序排列起来,这样的统计图叫作条形统计图.条形统计图可以表示同类指标在不同地区、不同时间、不同条件的对比关糺.也可以表示总体的结构及其在时间上的变化.从条形统计图上很容易看出各种数量的多少.2.用一定单位长度表示一定的数量,根据数量多少描出各点,然后把各点用线段顺次连接起来,形成折线,用折线的升降来表示数量之间的关系及变化趋势的图形叫作折线统计图.折线统计图可以表示一种数量的增减变化情况,也可以表示几种数量的相互依存和发展变化的趋势或情况.3.用圆和扇形分别表示关于总体和各个组成部分数据的统计图叫作扇形统计图(或称饼形图),特点是能直观地、生动地反映各部分在总体中所占的比例.4.当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫作茎叶图.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.(3)当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.应用示例思路1例1 我们对50人的智商情况进行了调查,如果按照区间[80,85),[85,90),…,[115,120)进行分组,得到的分布情况如图1所示.图1(1)有多少人的智商在90—105之间?(2)有多少人的智商低于100?(3)有多少人的智商不低于100?你还能从图中获得其他的信息吗?解:(1)38人的智商在90—105之间;(2)29人的智商低于100;(3)21人的智商不低于100.点评:由于已经学习过一些统计图表的知识,学生在回答上面几个问题时可能比较容易,教师还可以鼓励学生从这个统计图中获取更多的信息,并通过该问题初步体会分布的含义.变式训练1.丁文静是集邮爱好者,她每年都要对自己收藏的邮票进行整理.到2006年年底,她收藏的邮票达到了100张;当2007年年底到了的时候,她发现自己收藏的邮票已经有200张了.她用图2来表示自己的收藏成果,这样的描述合适吗?丁文静的邮票收藏情况图2解:从高度看,上图中第二个正方体确实是第一个正方体的2倍;但从体积上看,却是23(即8)倍.这样就会使读者产生错误的印象,以为2007年丁文静收藏的邮票比2006年多得多,所以这样的描述不合适.2.有许多人认为鹌鹑蛋比鸡蛋更有营养,是不是这样呢?检测发现,每100克鹌鹑蛋和鸡蛋的可食部分中各种维生素B的含量分别为:维生素B1约0.18毫克和0.15毫克;维生素B2约0.79毫克和0.31毫克;维生素B6约0.02毫克和0.12毫克.学生甲用以下两幅条形图比较两种蛋的各种维生素B含量,如图3.图3学生乙用一幅条形图比较两种蛋的各种维生素B含量,如图4.图4问:这两位同学谁画得较好?解:甲同学制作的两幅条形图采用的单位长度不一致,很难比较两种蛋的各种维生素B的含量,乙同学的直方图采用了同一单位长度,把三种维生素含量放在一起比较,准确直观容易区分,所以乙同学的条形图较好.例 2 下面是关于某个总体包含的所有学生的身高分布的几种表述,其中哪一种表述反映的总体信息较多?(1)身高在160 cm以下的学生数占50%,不低于160 cm的学生数占50%(如图5(a)).(2)身高在150 cm以下、150—160 cm之间、不低于160 cm的学生数分别占10%、40%、50%(如图5(b)).(3)身高在150 cm 以下、150—160 cm 之间、160—170 cm 之间、不低于170 cm 的学生数分别占10%、40%、40%、10%(如图5(c)).(a) (b)(c)图5解:从该总体包含的所有学生的身高分布的几种表述(包括文字和统计图)来看,不难发现:从(1)—(3),反映的总体信息依次增多.就这个问题而言,说“身高在160 cm 以下的学生数占50%,不低于160 cm 的学生数占50%”,是身高分布一种很粗略的表述;说“身高在150 cm 以下、150—160 cm 之间、不低于160 cm 的学生数分别占10%、40%、50%”,则相对精确一些;而说“身高在150 cm 以下、150—160 cm 之间、160—170 cm 之间、不低于170 cm 的学生数分别占10%、40%、40%、10%”,表述就更精确了.点评:对于同样的数据,可以用不同的方式来表示.变式训练1.某中学在一次健康知识竞赚活动中,抽取了一部分同学测试的成绩为样本,绘制的成绩统计图如图6,请结合统计图回答下列问题:(1)本次测试中,抽样的学生有多少人?(2)分数在90.5—100.5这一组的频率是多少?(3)这次测试成绩的众数落在哪个小组内?(4)若这次测试成绩80分以上(含80分)为优秀,则优秀率约为多少?图6解:(1)2+3+4+41=50(人);(2)频率=504 总数频数=0.08;(3)众数落在80.5—90.5这一小组内;(4)这次测试成绩的优秀率约为90%.2.2003年11月,中国女排以11连胜的战绩夺回了阔别17年的世界冠军,重振了“敢于拼搏,敢于创新,团结起来,在不利的条件下赢得最大的胜利”的中国女排精神.其中11月12日的中美之战是关键的一战,中国女排在1∶2局数落后的不利情况下,顽强拼搏,最后反败为胜,以3∶2击败夺冠道路上的主要竞争对手.项目中国美国发球得分 3 7一攻得分37 35防守反击得分29 25拦网得分13 13 因对方失误得分27 22总得分109 102 上表是中美两国比赛的技术数据统计,如图7,学生甲用两幅条形图比较中美两国比赛的得分情况,学生乙用一幅条形图比较中美两国比赛的得分情况,哪一个效果好?从统计表中你能获取哪些信息?学生甲制作学生乙制作图7解:学生甲的方案由于纵轴单位刻度不同,不容易对两国排球赛的得分情况进行比较;而学生乙将两张图合并成一张图,可以一目了然地看出两国排球赛的得分情况的差异,因此,乙的效果更好.分析表中的数据我们可以大概地了解到,中国队战胜美国队的主要因素是失误较少,防守反击比较成功,而中国队发球的威力不大,这是需要提高的.例3 有关部门从甲、乙两个城市所有的自动售货机中分别随机抽取了16台,记录下上午8:00—11:00间各自的销售情况(单位:元):甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41;乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.你能用不同的方式分别表示上面的数据吗?解:从上面的数据不易直接看出各自的分布情况,为此,我们可以先将以上的数据按照不同的方式进行表示.上述的数据可以用如图8所示的图形来表示,横线下面的数字表示销售额的十位数,上面的数字分别表示各自销售额的个位数.图8也可以用条形统计图(图9)将上图进行简化:图9点评:根据实际需要选择适当的统计图表来分析数据.变式训练某地农村某户农民年收入如下(单位:元):土地收入打工收入养殖收入其他收入4 320 3 600 2 350 850请用不同的统计图来表示上面数据.分析:题意的要求是将此四个数据用统计图展示出来,在所有的统计图中,可利用条形统计图、折线统计图、扇形统计图来表示.解:用条形统计图表示,如图10所示.图10用折线统计图表示,如图11所示.图11用扇形统计图表示,如图12所示.图12思路2例1 下面是跃进厂各车间男、女工人数统计表:根据表中数据,制成条形统计图.解:步骤是:①根据图纸的大小,画出两条相互垂直的射线.(注意水平射线下面和垂直射线左面必须留有一定空白,注明直条数量和统计的内容)②在横轴上确定直条的位置.③在纵轴上根据数量的多少确定单位长度.④根据数据的多少画出长短不同的直条.画直条的步骤:1°先在纵轴上找到80(一车间的男工有80人),用铅笔过此点作横轴的平行线.2°用三角板的直角边对齐一车间的直条位置画两条与横轴垂直的平行线,画到与水平线相交为止,涂上阴影或涂色均可.(注意:直条的宽窄要一致,长短要准确,条与条之间间隔要均等)3°在直条上方标明数量的多少.4°依次画出其他直条.⑤在图的上方写标题.统计图如图13所示.跃进机床厂各车间男、女数统计图图13点评:条形统计图比统计表更形象、直观、具体,使人看了统计图以后,对事物在数量方面的变化与发展,以及事物总体与部分之间的关系等情况,留下了深刻的印象.变式训练观察如图14所示的条形统计图,你知道了什么?某小学2003年—2006年购买图书统计图2007年1月制图14答案:该小学2006年购买图书最多,比购买图书最少的2003年多300本.例2 某地2007年每月的月平均气温如下表:月份一二三四五六七八九十十一十二平均气温(℃) 2 5 10 16.5 22 28 32 32.5 26 19 11.5 5 根据上表中的数据,制成折线统计图.解:制作步骤:(1)根据图纸的大小,画出两条互相垂直的射线.(2)适当分配各点的位置,确定各点的间隔.(3)在与水平射线垂直的射线上,根据数据大小的具体情况,确定单位长度表示多少.(4)按照数据的大小描出各点,再用线段顺次连接起来.折线统计图如图15所示.图15点评:折线统计图不但可以表示数量的多少,还可以反映数量增减的变化趋势.变式训练1.如图16所示的条形统计图,你知道了什么?2001—2004年国产与进口54厘米彩电平均零售价统计图图16答案:从折线统计图中可以看出国产与进口彩电降价的情况.在这场持续的价格大战中,消费者无疑是最大的受惠者.2.如图17是一张某居民区水箱水位统计图,请你根据图中的变化情况编一段这个居民区的故事.图17答案:根据统计图的曲线变化情况,可以编出各种故事,如:8点钟居民们都开始洗菜、洗车等,是个用水高峰期,因此统计图上水位开始下降.9点到10点用水的人越来越少,水箱开始放水进来,因此10点钟水又满了.11点时水箱的水位变成0,可能是水箱破了,水都漏光了.说明:没有标准的答案,只要有道理,就可以算好故事.例3 某学校有50名学生,对出行使用的交通工具,统计数据如下:①步行:20人;②骑自行车:15人;③坐公交:10人;④其他:5人.根据以上数据,制成扇形统计图.解:画图步骤:(1)画一个圆.(2)按各组成部分所占的比例算出各个扇形的圆心角度数.交通工具人数比例圆心角度数步行20人40% 144°骑自行车15人30% 108°坐公交10人20% 72°其他5人10% 36°(3)根据算出的各圆心角的度数画出各个扇形,并注明相应的百分比,各比例的名称可以注在图上,也可用图例表明.扇形统计图如图18所示.图18注意:不用彩色,也可用白色、涂黑、斜线、网状等表示,学会动手画出扇形统计图.点评:扇形统计图是用整个圆面积表示总数(100%),用圆内的扇形面积表示各部分所占总数的百分数.总之,用统计图来表示数量关系更生动形象、具体,使人一目了然.变式训练1.如图19所示的条形统计图,你知道了什么?大王村青年养禽场养的鸡、鸭、鹅数量统计图图19答案:大王村养禽养的鸡最多,其次是鸭,再就是鹅.2.下面两幅统计图(如图20、图21),反映了某市甲、乙两所中学学生参加课外活动的情况.请你通过图中信息回答下面的问题.甲、乙两校参加课外活动的学生2003年甲、乙两校学生参加人数统计图(1997—2003年) 课外活动情况统计图图20 图21(1)通过对图20的分析,写出一条你认为正确的结论;(2)通过对图21的分析,写出一条你认为正确的结论;(3)2003年甲、乙两所中学参加科技活动的学生人数共有多少?解:(1)1997年至2003年甲校学生参加课外活动的人数比乙校增长得快;(2)甲校学生参加文体活动的人数比参加科技活动的人数多;(3)2 000×12%+1 100×10%=350.例4 某赛季甲、乙两名篮球运动员每场得分情况如下:甲12 15 24 25 31 31 36 36 37 39 44 49 50 乙8 13 14 16 23 26 28 33 38 39 51 9 17(1)用茎叶图表示上面的数据.(2)根据你所画的茎叶图,分析甲、乙两名运动员的得分情况.解:(1)如图22所示的茎叶图中,中间的数字表示两位运动员得分的十位数,两边的数字分别表示两个人各场比赛得分的个位数.图22(2)从茎叶图上可以看出:甲运动员的得分比较集中在茎为3的一行,且大致关于这一行对称,中位数是36;乙运动员的得分主要分散在四行,中位数是23.所以甲运动员的发挥比较稳定,总体得分情况比乙运动员好.点评:如果茎叶图中的数据大致集中在一行,说明这些数据比较稳定;如果收集到的是两组不连续的数据,并且是一位或两位数的整数,并且需要对比,那么可以先考虑使用茎叶图来统计.变式训练1.已知某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图(如图23所示),则甲、乙两人得分的中位数之和是( )图23A.62B.63C.64D.65分析:利用茎叶图可得甲得分的中位数是22628=27,乙得分的中位数是36,所以甲、乙两人得分的中位数之和是63.答案:B2.某篮球学校的甲、乙两名运动员练习罚球,每人练习10组,每组罚球10个.命中个数的茎叶图如图24.则罚球命中率较高的是____________.图24分析:观察茎叶图可知,甲运动员的呼中个数与乙相比位于茎叶图的下方,也就是说甲罚球命中率较高.答案:甲3.下图是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图25可知( )图25A.甲运动员的成绩好于乙运动员B.乙运动员的成绩好于甲运动员C.甲、乙两名运动员的成绩没有明显的差异D.甲运动员的最低得分为0分答案:A知能训练1.下面哪种统计图没有数据信息的损失,所有的原始数据都可以从该图中得到( )A.条形统计图B.茎叶图C.扇形统计图D.折线统计图分析:所有的统计图中,仅有茎叶图完好无损地保存着所有的数据信息.答案:B2.当收集到的数据量很大或有多组数据时,需要比较各种数量的多少,用哪种统计图较合适( )A.茎叶图B.条形统计图C.折线统计图D.扇形统计图分析:由于需要比较各种数量的多少,并且收集到的数据量很大或有多组数据,符合条形统计图的特点.答案:B3.2007年某市居民的支出构成情况如下表所示:食品衣着家庭设备用品及服务医疗保健交通和通讯教育文化娱乐服务居住杂项商品和服务40.4% 4.2% 8.9% 5.0% 8.9% 17.7% 11.5% 3.4% 用下列哪种统计图表示上面的数据较合适( )A.都一样B.茎叶图C.扇形统计图D.折线统计图分析:扇形统计图和条形统计图均可以将统计中的所有数据所占整体百分比直观显示出来,但最佳的统计图表应当是扇形统计图,其显示得更为直观一些.答案:C4.下表给出了2006年A、B两地的降水量.(单位:mm)1月2月3月4月5月6月7月8月9月10月11月12月A 9.2 4.9 5.4 18.6 38.0 106.3 54.4 128.9 62.9 73.6 26.2 10.6B 41.4 53.3 178.8 273.5 384.9 432.4 67.5 228.5 201.4 147.3 28.0 19.1为了直观表示2006年A、B两地的降水量的差异和变化趋势,适当的统计图是__________.答案:条形统计图和折线统计图拓展提升在第28届奥运会上,中国运动员奋力拼搏共夺得32块金牌,其分布如下:射击球类水上项目力量型项目田径体操4 8 8 9 2 1画出扇形统计图,从扇形统计图中看出中国在什么项目上有优势呢?解:扇形统计图如图26:第28届奥运会中国金牌分布统计图图26从扇形统计图中看出中国在力量型项目、水上项目和球类项目上有优势.课堂小结本节课复习巩固了用条形统计图、折线统计图、扇形统计图、茎叶图来分析数据.作业习题1—3 1、2.设计感想本节依据学生的认知特点,首先复习了条形统计图、折线统计图、扇形统计图、茎叶图的定义,再举例说明了其适用范围.实际教学时,可以针对学生的实际,选择使用本节的例题和练习题.。
复习课(一) 统计难度偏小,属中、低档题.[考点精要]1.三种抽样方法(1)简单随机抽样:是抽样中一个最基本的方法——逐一不放回地抽取.一次抽取所有样本和抽取样本检查后放回样本都不是简单随机抽样.(2)系统抽样:按照简单随机抽样抽取第一个样本,然后按相同的间隔(即抽样距)抽取其他样本.(3)分层抽样:将总体分成若干层,在各层中按照所占比例随机抽取一定的样本.2.三种抽样方法的适用原则(1)看总体是否由差异明显的几个层组成.若是,则选用分层抽样;否则,考虑用简单随机抽样或系统抽样.(2)看总体容量和样本容量的大小.当总体容量较小时,采用抽签法;当总体容量较大、样本容量较小时,采用随机数表法;当总体容量较大、样本容量也较大时,采用系统抽样.[典例] (1)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )A.90C.180 D.300(2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.1314 15⎪⎪⎪0 0 3 4 5 6 6 8 8 8 91 1 12 2 23 34 45 5 56 67 80 1 2 2 3 3 3若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( )A.3 B.4C.5 D.6[解析] (1)设样本中的老年教师人数为x ,则3201 600=x900,解得x =180,选C.(2)第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在[139,151]上恰有4组,故有4人,选B.[答案] (1)C (2)B [类题通法](1)分层抽样中容量的计算分层抽样的特点是“按比例抽样”,即 每层中抽取的个体数该层的个体数=样本容量总体容量.(2)系统抽样中个体编号的确定系统抽样的特点是“等距抽样”,即第一段抽取的是编号为i 的个体,则第k 段抽取的是第k 段中的第i 个.(3)当总体容量或其中某层中的个体数使得不能恰好按比例或等距抽取时,应该采取简单随机抽样的方法剔除若干个体后再进行.[题组训练]1.某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )A .抽签法B .系统抽样法C .分层抽样法D .随机数法解析:选C 根据年级不同产生差异及按人数比例抽取易知应为分层抽样法. 2.有20位同学,编号从1至20,现在从中抽取4人做问卷调查,用系统抽样的方法确定所抽的编号可能为( )A .3,8,13,18B .2,6,10,14C .2,4,6,8D .5,8,11,14解析:选A 总体个体数是20,样本容量为4,因此分段间隔k =204=5,只有选项A中的数据的分段间隔为5.3.某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________.解析:设男生抽取x 人,则有45900=x900-400,解得x =25.答案:254.某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按1100的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为________.解析:若设高三学生数为x ,则高一学生数为x 2,高二学生数为x 2+300,所以有x +x 2+x2+300=3 500,解得x =1 600.故高一学生数为800,因此应抽取高一学生数为800100=8. 答案:8低档题.有时与概率等知识相结合以解答题的形式出现.[考点精要]1.频率分布直方图2.茎叶图[典例] (1)对一批产品的长度(单位:毫米)进行抽样检测,如图为检测结果的频率分布直方图.根据标准, 产品长度在区间[20,25)上为一等品,在区间[15,20)和[25,30)上为二等品,在区间[10,15)和[30,35]上为三等品.用频率估计概率,现从该批产品中随机抽取1件,则其为二等品的概率是( )A.0.09 B.0.20C.0.25 D.0.45(2)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )(3)某电子商务公司对10 000名网络购物者2015年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.①直方图中的a=________;②在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.[解析] (1)由频率分布直方图的性质可知,样本数据在区间[25,30)上的频率为1-5×(0.02+0.04+0.06+0.03)=0.25,则二等品的频率为0.25+0.04×5=0.45,故任取1件为二等品的概率为0.45.(2)由茎叶图知,各组频数统计如下表:上表对应的频率分布直方图为A.(3)①由0.1×1.5+0.1×2.5+0.1a +0.1×2.0+0.1×0.8+0.1×0.2=1,解得a =3. ②区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000. [答案] (1)D (2)A (3)①3 ②6 000 [类题通法](1)茎叶图与频率分布表的关系如下: 频率分布表中的分组茎叶图的茎;频率分布表中指定区间组的频率茎上叶的数目.(2)频率分布直方图中计算用到的知识:①图中小矩形的面积=组距×频率组距=频率.②所有小矩形的面积之和为1.[题组训练]1.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )A .0.2B .0.4C .0.5D .0.6解析:选 B 由茎叶图可知数据落在区间[22,30)内的频数为4,所以数据落在区间[22,30)内的频率为410=0.4,故选B.2.某地教育部门为了调查学生在数学考试中的有关信息,从上次参加考试的10 000名考生中用分层抽样的方法抽取500人,并根据这500人的数学成绩画出样本的频率分布直方图(如图所示),则这10 000人的数学成绩在[140,150](单位:分)段的约是________人.解析:设500人的数学成绩在[140,150]段的人数为x ,10 000人的数学成绩在[140,150]段的人数为n.由样本频率分布直方图知数学成绩在[140,150]段的频率是相应小矩形的面积,即0.008×10=0.08=x500,∴x=40.又样本的个数占总体个数的120,即每组的抽样比为120,∴120=40n,∴n=800,因此10 000人的数学成绩在[140,150]段的约是800人.答案:800知识结合出现在解答题中.[考点精要]1.有关数据的数字特征2.众数、中位数、平均数的异同(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会相应引起平均数的变动.(3)众数考查各数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,众数往往更能反映问题.(4)中位数仅与数据的大小排列顺序有关,某些数据的变动可能对中位数没有影响,,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.[典例] (1)重庆市2015年各月的平均气温(℃)数据的茎叶图如图,则这组数据的中位数是( )A.19 B.20C.21.5 D.23(2)某工厂36名工人的年龄数据如下表.①用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据.②计算①中样本的均值x和方差s2.③36名工人中年龄在x-s与x+s之间有多少人?所占的百分比是多少(精确到0.01%)?[解析](1)由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,28,31,32,所以中位数为20+202=20.答案:B(2)解:①36人分成9组,每组4人,其中第一组的工人年龄为44,所以它在组中的编号为2,所以所有样本数据的编号为4n-2(n=1,2,…,9),其年龄数据为:44,40,36,43,36,37,44,43,37.②由均值公式知:x=44+40+…+379=40,由方差公式知:s 2=19[(44-40)2+(40-40)2+…+(37-40)2]=1009.③因为s 2=1009,s =103,所以36名工人中年龄在x -s 和x +s 之间的人数等于年龄在区间[37,43]上的人数, 即40,40,41,…,39,共23人.所以36名工人中年龄在x -s 和x +s 之间的人数所占的百分比为2336×100%≈63.89%.[类题通法]通常我们用样本的平均数和方差(标准差)来近似代替总体的平均数和方差(标准差),呈现样本数据的集中趋势及波动大小,从而实现对总体的估计.(1)一般情况下,需要将平均数和标准差结合,得到更多样本数据的信息,从而对总体作出较好的估计.因为平均数容易掩盖一些极端情况,使我们对总体作出片面的判断,而标准差较好地避免了极端情况.(2)若两组数据的平均数差别很大,也可以仅比较平均数,估计总体的平均水平,从而作出判断.[题组训练]1.为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:选B 法一:∵x 甲=26+28+29+31+315=29,x 乙=28+29+30+31+325=30,∴x 甲<x 乙,又s 2甲=9+1+0+4+45=185,s 2乙=4+1+0+1+45=2,∴s 甲>s 乙.故可判断结论①④正确.法二:甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B.2.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( )A.8 B.15C.16 D.32解析:选C 已知样本数据x1,x2,…,x10的标准差为s=8,则s2=64,数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为22×64=2×8=16,故选C.3.(新课标全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.图①B地区用户满意度评分的频数分布表满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).图②(2)根据用户满意度评分,将用户的满意度分为三个等级:解:(1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B 地区用户满意度评分的平均值高于A 地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A 地区用户满意度评分比较分散.(2)A 地区用户的满意度等级为不满意的概率大.记C A 表示事件:“A 地区用户的满意度等级为不满意”;C B 表示事件:“B 地区用户的满意度等级为不满意”.由直方图得P (C A )的估计值为(0.01+0.02+0.03)×10=0.6,P (C B )的估计值为(0.005+0.02)×10=0.25.所以A 地区用户的满意度等级为不满意的概率大.[考点精要]1.最小二乘法求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫作最小二乘法. 2.线性回归方程方程y =bx +a 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的线性回归方程,其中a ,b 是待定参数.⎩⎪⎨⎪⎧b =∑i =1nx i-x y i-y∑i =1nx i-x 2=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a =y -b x .[典例] (1)(福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =bx +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元(2)(重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:①求②用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. [解析] (1)由题意知,x =8.2+8.6+10.0+11.3+11.95=10,y =6.2+7.5+8.0+8.5+9.85=8,∴a =8-0.76×10=0.4,∴当x =15时,y =0.76×15+0.4=11.8(万元). 答案:B(2)解:①列表计算如下:这里n =5,t -=1n ∑i =1nt i =155=3,y =1n ∑i =1n y i =365=7.2.又∑i =1nt 2i -n t -2=55-5×32=10,∑i =1nt i y i -n t -y =120-5×3×7.2=12,从而b =1210=1.2,a =y -b t -=7.2-1.2×3=3.6,故所求回归方程为y =1.2t +3.6.②将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y =1.2×6+3.6=10.8(千亿元).[类题通法]线性回归分析就是研究两组变量间线性相关关系的一种方法,通过对统计数据的分析,可以预测可能的结果,这就是线性回归方程的基本应用,因此利用最小二乘法求线性回归方程是关键,必须熟练掌握线性回归方程中两个重要估计量的计算.[题组训练]1.(新课标全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关解析:选D 对于A 选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A 正确.对于B 选项,由图知,由2006年到2007年矩形高度明显下降,因此B 正确.对于C 选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C 正确.由图知2006年以来我国二氧化硫年排放量与年份负相关,故选D.2.以下是某地搜集到的新房屋的销售价格y 和房屋面积x 的数据:(1)(2)求线性回归方程,并在散点图中加上回归直线; (3)根据(2)的结果估计当房屋面积为150 m 2时的销售价格. 解:(1)数据对应的散点图如下图所示:(2)x =15∑i =15x i =109,∑i =15(x i -x )2=1 570,y =15∑i =15y i =23.2,∑i =15(x i -x )(y i -y )=308.设所求回归直线方程为y =bx +a ,则b =∑i =15x i -xy i -y∑i =15x i -x2=3081 570≈0.196 2, a =y -b x ≈23.2-109×0.1 962=1.814 2.故回归直线方程为y =0.196 2x +1.814 2,回归直线在(1)中的散点图中. (3)据(2)知当x =150 m 2时,销售价格估计为:y =0.196 2×150+1.814 2=31.244 2≈31.2(万元).1.某日用品按行业质量标准分成五个等级,等级系数X 依次为1,2,3,4,5.现从一批该日用品中随机抽取20件,对其等级系数进行统计分析,得到频率分布表如下:若所抽取的20件日用品,等级系数为4的恰有3件,等级系数为5的恰有2件,则a ,b ,c 的值分别为( )A .无法确定B .0.2,0.75,0.05C .0.1,0.15,0.1D .0.2,0.15,0.1解析:选C 由频率分布表得a +0.2+0.45+b +c =1,即a +b +c =0.35.因为抽取的20件日用品中,等级系数为4的恰有3件,等级系数为5的恰有2件,所以b =320=0.15,c =220=0.1,从而a =0.35-b -c =0.1.所以a =0.1,b =0.15,c =0.1.2.已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数相同,则图中的m+n=( )A.3 B.5C.8 D.11解析:选D 根据茎叶图,得乙的中位数是33,∴甲的中位数也是33,即m=3;甲的平均数x甲=13×(27+39+33)=33,乙的平均数是x乙=14×(20+n+32+34+38)=33,∴n=8,∴m+n=11.故选D.3.对于下列表格所示的五个散点,已知求得的线性回归直线方程为y=0.8x-155.则实数m的值为( )A.8 B.8.2C.8.4 D.8.5解析:选A 因为回归直线过样本点的中心(x,y),又x=15×(196+197+200+203+204)=200,y=15×(1+3+6+7+m)=17+m5,所以把(x,y)代入y=0.8x-155可得,17+m5=0.8×200-155,解得m=8.4.某中学高中部有300名学生.为了研究学生的周平均学习时间,从中抽取了60名学生,先统计了他们某学期的周平均学习时间(单位:小时),再将学生的周平均学习时间分成5组:[40,50),[50,60),[60,70),[70,80),[80,90],并加以统计,得到如图所示的频率分布直方图.则高中部学生的周平均学习时间为(同一组中的数据用该组区间的中点值作代表)( )A.63.5小时B.62.5小时C.63小时D.60小时解析:选A 在高中部抽取的60名学生中,周平均学习时间分别落在[40,50),[50,60),[60,70),[70,80),[80,90]的人数依次为6,15,24,12,3.所以高中部学生的周平均学习时间为(6×45+15×55+24×65+12×75+3×85)÷60=63.5(小时).故选A.5.某学校随机抽查了本校20名同学平均每天在课外从事体育锻炼的时间(单位:分钟),根据所得数据的茎叶图,以5为组距将数据分为8组,分别是[0,5),[5,10),…,[35,40],作出频率分布直方图如图所示,则原始的茎叶图可能是( )解析:选B 根据频率分布直方图,样本数据位于区间[15,20)内的有20×0.02×5=2个,位于区间[20,25)内的有20×0.04×5=4个,据此检验只可能是选项B.6.气象意义上从春季进入夏季的标志为“连续5天的日平均温度均不低于22 ℃”.现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数).①甲地:5个数据的中位数为24,众数为22;②乙地:5个数据的中位数为27,总体平均数为24;③丙地:5个数据中有一个数据是32,总体平均数为26,总体方差为10.8.则肯定进入夏季的地区有( )A.0个B.1个C.2个D.3个解析:选C 甲地肯定进入,因为众数为22,所以22至少出现两次,若有一天低于22 ℃,则中位数不可能为24;丙地肯定进入,令x为其中某天的日平均温度,则10.8×5-(32-26)2=18≥(x-26)2,若x≤21,上式显然不成立;乙地不一定进入,如13,23,27,28,29.故选C.7.为了解某市甲、乙、丙三所学校高三数学模拟考试成绩,采取分层抽样方法,从甲校的1 260份试卷、乙校的720份试卷、丙校的900份试卷中进行抽样调研.若从丙校的900份试卷中抽取了45份试卷,则这次调研共抽查的试卷份数为________.解析:抽取比例为120,故抽取的试卷份数为(1 260+720+900)×120=144.答案:1448.一组数据中的每一个数据都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是________,________.解析:由题意得原来数据的平均数是80+1.2=81.2,方差不变,仍是4.4.答案:81.2 4.49.利用随机数表法对一个容量为500,编号为000,001,002,…,499的产品进行抽样检验,抽取一个容量为10的样本,选取方法是从随机数表第12行第5列、第6列、第7列数字开始由左到右依次选取三个数字(下面摘取了随机数表中的第11行至第12行),根据下表,读出的第3个数是________.18 18 07 92 45 44 17 16 58 09 79 83 86 19 62 06 76 50 03 10 55 23 64 05 0526 62 38 97 75 84 16 07 44 99 83 11 46 32 24 20 14 85 88 45 10 93 72 88 71解析:最先读到的数据的编号是389,向右读下一个数是775,775大于499,故舍去,再下一个数是841,舍去,再下一个数是607,舍去,再下一个数是449,再下一个数是983,舍去,再下一个数是114.故读出的第3个数是114.答案:11410.为了了解小学生的体能情况,抽取某校一个年级的部分学生进行一分钟跳绳次数的测试,将数据整理后,画出频率分布直方图(如图所示).已知图中从左到右前三个小组的频率分别为0.1,0.3,0.4,且第一小组的频数为5.(1)求第四小组的频率;(2)求参加这次测试的学生的人数;(3)若一分钟跳绳次数在75次以上(含75次)为达标,试估计该年级学生跳绳测试的达标率.解:(1)第四小组的频率为1-0.1-0.3-0.4=0.2.(2)设参加这次测试的学生有x 人,则0.1x =5,∴x =50,故参加这次测试的学生有50人.(3)由题意,样本的达标率约为0.3+0.4+0.2=0.9,∴该年级学生跳绳测试的达标率约为90%.11.甲、乙两位同学进行投篮比赛,每人玩5局,每局在指定线外投篮,若第一次不进,再投第二次,依此类推,但最多只能投6次.当投进时,该局结束,并记下投篮的次数.当6次投不进,该局也结束,记为“×”.第一次投进得6分,第二次投进得5分,第三次投进得4分,依此类推,第6次投不进,得0分.两人的投篮情况如下:解:依题意,甲、乙的得分情况如下表:x 甲=15×(2+0+3+2+6)=2.6, s 甲=15-2+-2+0.42+-2+3.42]≈1.96,x 乙=15×(0+5+3+5+0)=2.6, s 乙=15-2+2.42+0.42+2.42+-2]≈2.24,因为甲得分的平均数为2.6,乙得分的平均数为2.6, 甲得分的标准差约为1.96,乙得分的标准差约为2.24, 所以甲得分的平均数与乙得分的平均数相等. 甲得分的标准差小于乙得分的标准差. 故甲投篮的水平高.12.某零售店近5个月的销售额和利润额资料如下表:(1)(2)用最小二乘法计算利润额y 关于销售额x 的回归直线方程.(3)当销售额为4千万元时,利用(2)的结论估计该零售店的利润额(百万元). 解:(1)散点图如图所示,两个变量有线性相关关系.(2)设回归直线方程是y =bx +a , 由题中的数据可知x =6,y =3.4.所以b =∑i =1nx i -xy i -y∑i =1nx i -x2=--+--+-+1×0.6+3×1.69+1+0+1+9=1020=0.5.a =y -b x =3.4-0.5×6=0.4.所以利润额y 关于销售额x 的回归直线方程为y =0.5x +0.4.(3)由(2)知,当x =4时,y =0.5×4+0.4=2.4,所以当销售额为4千万元时,可以估计该商场的利润额为2.4百万元.。
第一章统计复习与小结
一、教学目标:
1通过小结与复习,梳理本章知识内容,强化知识间的内在联系,提高综合运用知识解决问题的能力.
2.通过例题的讲解、讨论和进一步的训练,提高学生灵活运用本章知识解决问题的能力二、教学重、难点:
统计知识的梳理和知识之间的内在联系;
用知识解决实际问题.
三、教学方法:探析归纳,讲练结合
四、教学过程
(一)知识点归纳与例题分类探析
1、抽样方法:
(1)简单随机抽样(2)系统抽样(3)分层抽样
2、样本分布估计总体分:
(1)扇形图;(2)条形图;(3)折线图;(4)茎叶图;(5)频率分布表;(6)直方图; (7)散点图。
3、样本特征数估计总体特征数:
(1)平均数(2)方差 (3)众数 (4)中位数
4、线性回归方程。
5、总体、个体、样本、样本容量
总体:在统计中,所有考察对象的全体。
个体:总体中的每一个考察对象。
样本:从总体中抽取的一部分个体叫做这个总体的一个样本。
样本容量:样本中个体的数目。
6、统计的基本思想是:用样本的某个量去估计总体的某个量。
7、总体中每个个体被抽取的机会相等。
(1)简单随机抽样(抽签法、随机数法)(2)系统抽样(3)分层抽样
(1)、抽签法步骤①先将总体中的所有个体(共有N个)编号(号码可从0到N-1)。
②把号码写在形状、大小相同的号签上,号签可用小球、卡片、纸条等制作。
③将这些号签放在同一个容器中,搅拌均匀。
④抽签时,每次从中抽出一个号签,连续抽取n次。
⑤抽出样本。
(2)、随机数表法步骤①将总体中的个体编号(编号时位数要一样);②选定开始的数字;
③按照一定的规则读取号码;④取出样本
(3).系统抽样步骤:① 编号,随机剔除多余个体,重新编号;② 分段 (段数等于样本容量)样本距 k=N/n;③ 抽取第一个个体编号为i (i<=k)④依预定的规则抽取余下的个体编号为i+k, i+2k, …。
(4).分层抽样步骤:① 将总体按一定标准分层;② 计算各层的个体数与总体的个体数的比;抽样比k=n/N;③ 按比例确定各层应抽取的样本数目;④ 在每一层进行抽样(可用简单随机抽样或系统抽样)。
例1、某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程。
[分析]按1:5分段,每段5人,共分59段,每段抽取一人,关键是确定第1段的编号。
解:按照1:5的比例,应该抽取的样本容量为295÷5=59,我们把259名同学分成59组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,59组是编号为291~295的5名学生。
采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1≤k≤5),那么抽取的学生编号为k+5L(L=0,1,2,……,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,……,288,293。
例2、一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。
解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:(1)将3万人分为5层,其中一个乡镇为一层。
(2)按照样本容量的比例随机抽取各乡镇应抽取的样本。
300×(3/15)=60(人),300×(2/15)=40(人),300×(5/15)=100(人) ,300×(2/15)=40(人),300×(3/15)=60(人),因此各乡镇抽取人数分别为60人、40人、100人、40人、60 人。
(3)将300人组到一起,即得到一个样本。
分析样本,估计总体
几个公式
分析样本的分布情况可用样本的频率分布表、样本的频率分布直方图、样本的茎叶图。
频率分布:是指一个样本数据在各个小范围内所占比例的大小。
一般用频率分布直方图反映样本的频率分布。
频率分布直方图的特征:(
1)从频率分布直方图可以清楚的看出数据分布的总体趋势。
(2)从频率分布直方图得不出原始的数据内容,每个小矩形的面积等于此项的概率,所有面积和为1.
做样本频率分布直方图的步骤:
(1)决定组距与组数; (组数=极差/组距);(2)将数据分组;(3)列频率分布表(分组,频数,频率);(4)画频率分布直方图。
做频率分布直方图的方法:把横轴分成若干段,每一线段对应一个组的组距,然后以此线段为底作一矩形,它的高等于该组的频率/组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率,这些矩形就构成了频率分布直方图。
例3、下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)
样本数据:
12n
x x x
,,,
12n
x x x
x
n
+++
=
平均数:
标准差:s==
(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134cm的人数占总
人数的百分比。
分析:根据样本频率分布表、频率分布直方图的一般步骤解题。
)(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.
茎叶图:1.茎叶图的概念:用中间的数字表示十位数,两边的数字表示个位数,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。
2.茎叶图的特征:
(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加。
(2)茎叶图只便于表示量比较少的数据,而且茎叶图只方便记录两组的数据。
注意:相同的得分要重复记录,不能遗漏。
变量间的相互关系:1、相关关系
(1)概念:两个变量之间是不确定的随机关系,但两个变量之间又有关系,称为相关关系。
(2)相关关系与函数关系的异同点。
相同点:两者均是指两个变量间的关系。
不同点:函
数关系是一种确定关系,是一种因果系;相关关系是一种非确定的关系,也不一定是因果关系(但可能是伴随关系)。
(3)相关关系的分析方向。
在收集大量数据的基础上,利用统计分析,发现规律,对它们的关系作出判断。
2、回归直线方程
(1)回归直线:观察散点图的特征,如果各点大致分布在一条直线的附近,就称两个变量之间具有线性相关的关系,这条直线叫做回归直线。
(2)最小二乘法求线性回归方程的步骤:1.列表、计算 2.代入公式求a,b。
3.写出直线方程。
(3)利用回归直线对总体进行估计
(二)、练习:
1、某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户,为了调查社会购买力的某项指标,要从中抽取1个容量为100户的样本,记做①;某学校高一年级有12名女排运动员,要从中选出3个调查学习负担情况,记做②.那么完成上述2项调查应采用的抽样方法是( ) 答案B
(A)①用简单随机抽样法,②用系统抽样法(B)①用分层抽样法,②用简单随机抽样法
(C)①用系统抽样法,②用分层抽样法(D)①用分层抽样法,②用系统抽样法
2、某公司生产三种型号的轿车,产量分别为1200辆,6000辆和2000辆.为检验该公司的产品质量,现用分层抽样的方法抽取46辆舒畅行检验,这三种型号的轿车依次应抽取___辆.答案:6、 30 、 10
3.从甲、乙两班分别任意抽出10名学生进行英语口语测验,其测验成绩的方差分别为S12 =
13.2,S22
=26.26,则( ).A.甲班10名学生的成绩比乙班10名学生的成绩整齐
B.乙班10名学生的成绩比甲班10名学生的成绩整齐C.甲、乙两班10名学生的成绩一样整齐
D.不能比较甲、乙两班10名学生成绩的整齐程度
4.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则有( ).答案:D
A.a>b>c B.b>c>a C.c>a>b D.c>b>a
5. 如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:
(1)79.5---89.5这一组的频数、频率分别是多少?
(2)估计这次环保知识竞赛的及格率(60分及以上为及格)
解:(1)频率为:0.025×10=0.25,频数为:60×0.25=15
(2)0.015×10+0.025×10+0.03×10+0.005×10=0.75
(三)、小结:
统计.这一部分内容,可以看成是初中“统计初步”和高中必修课“概率”这两章内容的深入和扩展,它属于统计的基础知识,从总的方面来看,研究了两个基本问题:一是如何从总体中抽取样本;二是如何对抽取的样本进行计算与分析,并据此对总体的相应情况作出判断.要领会思想方法的实质,这样才能达到事半功倍的效果
(四)、课后作业:略
五、教学反思:。