概率与统计----用样本的频率分布2
- 格式:doc
- 大小:738.00 KB
- 文档页数:6
数学上“频率”与“概率”的关系?我是中考数学当百荟,从事初中数学教学三⼗多年。
说到“频率”与“概率”的关系,⾸先要了解初中数学中基本的统计思想:⽤样本估计总体,⽤频率估计概率;其次,要知道数学试验的统计量:频率=频数/总次数。
频率是通过试验得到的统计量,⽽概率是通过建⽴数学模型,计算得到的理论值。
在⼀定的情况下,可以⽤频率去估计(代替)事件发⽣的概率。
⼀。
⽤样本估计总体统计中,通常通过调查的⽅式获取相关的统计量。
调查通常有两种⽅式:普查和抽样调查。
⽐如:第六次全国⼈⼝普查(2010年11⽉1⽇),就是在国家统⼀规定的时间内,按照统⼀的⽅法、统⼀的项⽬、统⼀的调查表和统⼀的标准时点,对全国⼈⼝普遍地、逐户逐⼈地进⾏的⼀次性调查登记。
这次⼈⼝普查登记的全国总⼈⼝为1,339,724,852⼈这个数据采⽤的就是普查⽅式得到的。
⽽国家统计局每季度发布的居民⼈均可⽀配收⼊、居民消费价格指数、调查失业率等统计指标,是采⽤抽样调查⽅式获取的。
当统计的总体容量很⼤,调查耗时费⼒,调查成本巨⼤或者试验具有破坏性时,不宜采⽤普查⽅式,就要⽤抽样的⽅式来进⾏统计,然后⽤样本的统计量,去估计总体统计量。
这种统计思想就叫做⽤样本估计总体。
⽐如:某照明企业⽣产⼀批LED灯泡,为统计这批LED灯泡的使⽤寿命,采⽤哪种调查⽅式⽐较适合呢?因为要了解LED的使⽤寿命,按试验要求,就必须将LED灯泡变成“长明灯”,⼀直点亮直⾄⾃然熄灭(寿终正寝)。
这样试验是具有破坏性的,显然不能⽤普查⽅式,只能采⽤抽样的⽅式来进⾏。
从这批LED灯泡中,随机抽取50只灯泡作为⼀个样本,通过试验得到这个样本的平均使⽤寿命为3000⼩时,然后我们就说该企业的这批LED灯泡(总体)的使⽤寿命为3000⼩时。
⼆。
⽤频率估计概率俗话说,天有不测风云,⼈有旦⼣祸福。
这句话从数学的⾓度来理解就是,在⾃然界和⼈类社会中,严格确定的事件是⼗分有限的,⽽随机事件却是⼗分普遍的,概率就是对随机事件的⼀种数学的定量描述。
2.2.1 用样本的频率分布估计总体分布A级基础巩固一、选择题1.没有信息的损失,所有的原始数据都可以从图中得到的统计图是( )A.总体密度曲线B.茎叶图C.频率分布折线图D.频率分布直方图答案:B2.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )B.C.D.解析:数据总个数n=10,又落在区间[22,30)内的数据个数为4,故所求的频率为410=0.4.答案:B3.某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚.下图是某路段的一个检测点对300辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可得出将被处罚的汽车数为( )A.30辆B.40辆C.60辆D.80辆解析:车速大于或等于70 km/h的汽车数为×10×300=60(辆).答案:C4.一个社会调查机构就某地区居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图),为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(单位:元)月收入段应抽出的人数为( )A.5 B.25 C.50 D.2 500解析:组距=500,在[2 500,3 000)的频率=0.000 5×500=,样本数为100,则在[2 500,3 000)内应抽100×=25(人).答案:B5.为了了解某校高三学生的视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,仅知道后5组的频数和为62.设视力在到之间的学生数为a,最大频率为,则a的值为( )A.27 B.48 C.54 D.64解析:由已知,视力在到之间的学生数为100×=32,又视力在到之间的频率为1-+0.5)×-62100=,所以视力在到之间的学生数为100×=22,所以视力在到之间的学生数a =32+22=54.答案:C二、填空题6.某市共有5 000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:分组/分频数频率[80,90)①②[90,100)[100,110)[110,120)36[120,130)[130,140)12③[140,150]合计④根据上面的频率分布表,可以①处的数值为________,②处的数值为________. 解析:由位于[110,120)的频数为36,频率=36n=,得样本容量n =120,所以[130,140)的频率=12120=,②处的数值=1------=; ①处的数值为×120=3. 答案:37.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[140,150]内的学生中抽取的人数应为________.解析:所有小矩形的面积和等于10×++0.020+a +0.035)=1,解得a =;100名同学中,身高在[120,130)内的学生数是10××100=30,身高在[130,140)内的学生数是10××100=20,身高在[140,150]内的学生数是10××100=10,则三组内的总学生数是30+20+10=60,抽样比是1860=310,所以身高在[140,150]内的学生中选取的人数应为10×310=3.答案: 38.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名授课教师中抽取20名教师,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如下:据此可估计该校上学期200名教师中,使用多媒体进行教学次数在[15,25)内的人数为________.答案:60三、解答题9.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8:00-10:00间各自的点击量,得到如图所示的茎叶图.(1)甲网站点击量在[10,40]间的频率是多少? (2)甲、乙两个网站哪个更受欢迎?请说明理由.解:(1)甲网站点击量在[10,40]内的有17,20,38,32,共有4天,则频率为414=27. (2)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少? 解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由题意估计该学校高一学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.B 级 能力提升1.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图所示是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .18解析:志愿者的总人数为20(+)×1=50,所以第三组的人数为50×=18,有疗效的人数为18-6=12.答案:C2.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在区间[139,151]上的运动员恰有4组,则运动员人数为4.答案:43.从高一学生中抽取50名参加调研考试,成绩的分组及各组的频数如下(单位:分): [40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在[70,80)分的学生所占总体的百分比.解:(1)频率分布表如下:成绩分组频数频率[40,50)2[50,60)3[60,70)10[70,80)15[80,90)12[90,100]8合计50(2)由题意知组距为10,取小矩形的高根据表格画出如下的频率分布直方图:(3)由频率分布直方图,可估计成绩在[70,80)分的学生所占总体的百分比是×10==30%.。
2.2.1-2频率分布折线图、总体密度曲线及茎叶图一、内容与解析《用样本的频率分布估计总体分布》是普通高中新课程标准人教A版必修三第二章2.2.1的内容,属于概率统计知识的一部分。
概率统计是高中新课标的重要内容,也是高考重点考查的内容之一,统计思想方法是数学中的一个重要思想方法。
本节课,是在初中学习了统计初步知识和前面研究了随机抽样、数据收集方法的基础上。
通过对样本分析估计总体的过程,突出了统计的实用性,体现了统计的思想及其在实际问题中的应用价值,真正体现出数学知识与现实生活的联系。
本节,主要研究对收集样本如何进行处理,突出对数据描述、处理的方法。
特别是,频率分布直方图画法。
后面,接着研究总体密度曲线、用样本的数字特征估计总体的数字特征以及正态曲线等。
可以说,本节课内容承上启下,地位非常重要。
二、教学目标及解析1.能够根据频率分布直方图画出频率分布折线图,并最终得到总体密度曲线。
2.能够根据样本数据,画出茎叶图,并通过茎叶图估计总体的分布情况.3.正确理解频率折线图、总体密度曲线和茎叶图的特点及随机性。
三、问题诊断分析在本节课的教学中,学生可能遇到的问题是能通过样本的频率分布估计总体的分布,体会统计的思想、方法.四、教学过程问题1.复习:作频率分布直方图的步骤有哪些?频率分布直方图有什么特点?第一步,求极差.第二步,决定组距与组数.第三步,确定分点,将数据分组.第四步,统计频数,计算频率,制成表格.第五步,画平面直角坐标系,在横轴上均匀标出各组分点,在纵轴上标出单位长度,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.特点:(1)随机性:频率分布表和频率分布直方图由样本决定,因此它们会随着样本的改变而改变.(2)规律性:若固定分组数,随着样本容量的增加,频率分布表中的各个频率会稳定在总体相应分组的概率之上,从而频率分布直方图中的各个矩形高度也会稳定在特定的值上.设计意图:师生活动(小问题):问题 2. 频率分布直方图能够很容易地表示大量的数据,非常直观地表明分布形状.但它不能保留原来的数据信息,在精确要求较高的情况下不适用.那么当题目要求精度较高时,我们该怎么做呢?一般地,类似于频数分布折线图,只要我们把频率分布直方图中各个小矩形上端的中点连接起来,就得到了频率分布折线图.那么当组数增大到大时,相应的频率分布折线图就变成一条光滑的曲线.这条曲线在统计中就叫做总体密度曲线,它反映了总体在各个范围内的取值,能提供更多更详细的信息.1.你认为频率分布折线图能大致反映样本数据的频率分布吗?2.当总体中的个体数很多时(如抽样调查全国城市居民月均用水量),随着样本容量的增加,作图时所分的组数增多,组距减少,你能想象出相应的频率分布折线图会发生什么变化吗?3.当总体中的个体数比较少或样本数据不密集时,是否存在总体密度曲线?为什么?不存在,因为组距不能任意缩小.4.对于一个总体,如果存在总体密度曲线,这条曲线是否惟一?能否通过样本数据准确地画出总体密度曲线?(1)有的总体没有密度曲线;(2)尽管有些总体密度曲线是客观存在的,但在实际应用中我们并不知道它的具体表达形式,需要用样本来估计.由于样本是随机的,它的频率分布折线图并不是惟一的,而是随着样本的容量和分组情况的变化而变化的,因此不能由样本的频率分布折线图准确估计密度曲线.问题3.频率分布表、频率分布直方图和折线图的主要作用是表示样本数据的分布情况,此外,我们还可以用茎叶图来表示样本数据的分布情况.【问题】某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.助教在比赛中将这些数据记录为如下形式:1.在统计中,上图叫做茎叶图,它也是表示样本数据分布情况的一种方法,其中“茎”指的是哪些数,“叶”指的是哪些数?练习:对于样本数据:3.1,2.5,2.0,0.8,1.5,1.0,4.3,2.7,3.1,3.5,用茎叶图如何表示?2.一般地,画出一组样本数据的茎叶图的步骤如何?第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)侧;第三步,将各个数据的叶按大小次序写在茎右(左)侧.3.用茎叶图表示数据的分布情况是一种好方法,你认为茎叶图有哪些优点?(1)保留了原始数据,没有损失样本信息;(2)数据可以随时记录、添加或修改.4.比较茎叶图和频率分布表,茎叶图中“茎”和“叶”的数目分别与频率分布表中哪些数目相当?5.对任意一组样本数据,是否都适合用茎叶图表示?为什么?不适合样本容量很大或茎、叶不分明的样本数据.五、课堂小结1.用样本的频率分布估计总体分布,当总体中的个体数取值很少时,可用茎叶图估计总体分布;当总体中的个体数取值较多时,可将样本数据适当分组,用频率分布表或频率分布直方图估计总体分布.2.总体密度曲线可看成是函数的图象,对一些特殊的密度曲线,其函数解析式是可求的.3.茎叶图中数据的茎和叶的划分,可根据样本数据的特点灵活决定.六、目标检测课本61页练习1。
新课导入前面研究学习了三种抽样收集数据,数据收集后,必须从中寻找包含的信息,以使我们能追求样本的估计总体,但是由于数据多而杂,所以需要通过一定的方法去分析.可以通过表、图、计算方法来分析.1. 通过实例体会分布的意义和作用;2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;3. 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.知识与技能教学目标过程与方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.情感态度与价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系.重点会列频率分布表,画频率分布直方图、频率折线图和茎叶图.能通过样本的频率分布估计总体的分布. 难点教学重难点我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?实际问题为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.假设我们通过抽样,得到100为居民月用水量,如下:100位居民的月均用水量(单位:t)3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.64.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2观察?上面的数字能告诉我们什么呢很容易发现的是一个居民月均用水量的最小值是0.2t,最大值是4.3t.其他值在0.2—4.3t之间.除此之外,很难从随意记录下来的数据中直接看出规律.为此,我们需要对统计数据进行整理和分析.知识要点频率分布直方图频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.方法画频率分布直方图的一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差;(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.(1)求极差 因为用水最小值为0.2t ,最大值为4.3t 所以:4.3-0.2=4.1 说明样本数据的变化范围是4.1t.将上述抽样的100户居民月用水量,画出频率分布直方图.解:(2)决定组距与组数数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5—12组.为了方便起见,组距的选择应力求“取整”.在本问题中,如果取组距为0.5(t),那么组数=极差/组距=4.1/0.5=8.2因此可将数据分成9组,这个组数是较合适的,于是去组距为0.5.组数为9.(3)将数据分组以组距为0.5将数据分组时,可以分成以下9组:[0,0.5),[0.5,1),…,[4,4.5).(4)列频率分布表按照组距为0.5将数据分组,分成以下9组:[0,0.5),[0.5,1),…,[4,4.5). 图如下:100位居民月均用水量的频率分布表分组频数频率[0,0.5)40.04[0.5,1)80.08[1,1.5)150.15[1.5,2)220.22 [2,2.5)250.25 [2.5,3)140.14 [3,3.5)60.06 [3.5,4)40.04 [4,4.5)20.02合计1001频数等于样本数,频率恒为1(5)画频率分布直方图 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/to 0.100.200.300.400.50频率/组距特征频率分布直方图的特征:从频率分布直方图可以清楚的看出数据分布的总体趋势.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.知识要点频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.总体密度曲线的定义在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.茎叶图数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.特征茎叶图的特征:1. 用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.2. 茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.课堂小结1.频率分布直方图的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.2.频率分布折线图的概念连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.高考链接1(2009四川)设矩形的长为a ,宽为b ,其比满足 51b :a 0.6182-=≈这种矩形给人以美感,称为黄金矩形,黄金矩形常应用用于工艺品设计中,下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样品来估计两个批次的总体平均数,与标准值0.618比较,正确结论是()AA.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值跟接近C.两个批次总体平均数与标准值接近程度相同D.两个批次总体平均数与标准值接近程度不能确定解析:本题考查平均数的求法,用样本估计总体,经计算甲、乙批次的总体平均数0.6170.613甲乙,x x ==知甲批次的总体平均数与标准值0.618更接近.2(2009湖北)下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[6,10]内的频数为_______,数据落在[2,10)内的概率约为_____. 64 0.4解析:本题考查频率分布直方图,样本数据落在[6,10)内的频数为0.08×(10-6)×200=64.样本数据落在[2,10)内的概率约为(0.02+0.08)×4=0.4.区间界限[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)人数5810223320区间界限[146,150)[150,154)[154,158)人数11651.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位c m)(1)列出样本频率分布表﹔ (2)一画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.随堂练习分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158)50.04合计1201解:(1)样本频率分布表如下:前面的过程省略!122 126 130 134 138 142 146 150 158 154 身高(cm )o 0.010.020.030.040.050.060.07频率/组距(2)其频率分布直方图如下:0.04+0.07+0.08=0.19,所以我们估计身高小于134cm 的人数占总人数的19%.(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为:2.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.90 100 110 120 130 140 150 次数o 0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.036解:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1. (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:40.0824171593=+++++121500.08===第二小组频数样本容量第二小组频率又因为频率=频数/ 样本容量所以 (2)由图可估计该学校高一学生的达标率约为 171593100%88%24171593+++⨯=+++++(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.。
§2.2用样本估计总体2.2.1用样本的频率分布估计总体的分布自主学习学习目标1.通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体的分布,初步体会样本频率分布的随机性.自学导引1.极差的概念极差是一组数据的________________的差,它反映了一组数据____________,极差又叫________.2.频数、频率的概念将一批数据按要求分为若干组,对落在各个小组内数据的________进行累计,这个累计数叫做各个小组的______,各个小组的______除以________,即得该小组的______.3.频率分布直方图在频率分布直方图中,纵轴表示________________,各小长方形的面积等于________________,所有长方形面积之和等于________.4.频率分布折线图连接频率分布直方图中各个小长方形的____________,就得到频率分布折线图.5.总体密度曲线如果样本容量越大,所分组数越多,频率分布直方图中表示的频率分布就越接近总体在各个小组内所取值的________________的大小;当样本容量不断增大,分组的组距不断缩小时,频率分布直方图实际上越来越接近于____________,它可以用一条____________来描绘,这条光滑曲线就叫做________________.6.茎叶图用茎叶图表示数据的两个优点在于:一是从茎叶图上没有____________的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛时____________,方便记录与表示.对点讲练知识点一画频率分布直方图、频率分布折线图例1某中学同年级40名男生的体重数据如下(单位:千克):61605959595858575757575656565656565655555555545454545353525252525251515150504948列出样本的频率分布表,画出频率分布直方图,画出频率分布折线图.变式迁移1有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20),17.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)求样本数据不足0的频率.知识点二用样本的频率分布估计总体分布寿命(2)画出频率分布直方图及折线图;(3)估计电子元件寿命在400 h以上的概率.变式迁移2为了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的频率;(2)问参加这次测试的学生人数是多少?(3)问在这次测试中,学生跳绳次数的中位数落在第几小组内?例3某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲的得分12,15,24,25,31,31,36,36,37,39,44,49,50;乙的得分8,13,14,16,23,26,28,33,38,39,51.(1)画出甲、乙两名运动员得分数据的茎叶图;(2)根据茎叶图分析甲、乙两运动员的水平.变式迁移3在某电脑杂志的一篇文章中,每个句子所含的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17;在某报纸的一篇文章中,每个句子所含的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,得到什么结论?几种表示频率分布的方法的优点与不足(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.(3)频率分布折线图的优点是它反映了数据的变化趋势.如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体密度曲线.(4)用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.课时作业一、选择题1.关于频率分布直方图中的有关数据,下列说法正确的是()A.小矩形的高表示取某数的频率B.小矩形的高表示该组上的个体在样本中出现的频率C.小矩形的高表示该组上的个体数与组距的比值D.小矩形的高表示该组上个体在样本中出现的频率与组距的比值2.关于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是()A.频率分布直方图与总体密度曲线无关B.频率分布直方图就是总体密度曲线C.样本容量很大的频率分布直方图就是总体密度曲线D.如果样本容量无限增大,分组的组距无限减小,那么相应的频率分布折线图会越来越接近一条光滑曲线,则这条光滑曲线为总体密度曲线3.已知10个数据如下:63,65,67,69,66,64,66,64,65,68.如果对这些数据绘制频率分布表,那么其中在64.5~66.5这组的频率是()A.0.4 B.0.5 C.5 D.4A.0.5 B.0.24 C.0.6 D.0.7二、填空题5.在求频率分布时,把数据分为5组,若已知其中的前四组频率分别为0.1,0.3,0.3,0.1,则第五组的频率是______,这五组的频数之比为________.6.在样本的频率分布直方图中,共有5个小长方形,已知中间一个小长方形面积是其余4个小长方形面积之和的13,且中间一组的频数为10,则这个样本容量是________.三、解答题7.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为6月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图),已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比?(2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?8.有关部门从甲,乙两个城市所有的自动售货机中分别随机抽取了16台,记录下一上午各自的销售情况如下:(单位:元)甲18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41乙22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23(1)请画出这两组数据的茎叶图.(2)将这两组数据进行比较分析,你能得到什么结论?§2.2用样本估计总体2.2.1用样本的频率分布估计总体的分布自学导引1.最大值与最小值变化的幅度全距2.个数频数频数样本容量频率3.频率与组距的比值相应各组的频率 14.上边的中点5.个数与总数比值总体的分布光滑曲线y=f(x)总体密度曲线6.原始信息随时记录对点讲练例1解(1)计算:61-48=13;(2)决定组距与组数,取组距为2,∵132=612,∴共分7组;(3)决定分点,使分点比数据多一位小数.并把第1小组的分点减小0.5,即分成如下7组:47.5~49.5,49.5~51.5,51.5~53.5,53.5~55.5,55.5~57.5,57.5~59.5,59.5~61.5.(4)51.5~53.5 7 0.175 53.5~55.5 8 0.20 55.5~57.5 11 0.275 57.5~59.5 5 0.125 59.5~61.5 2 0.05 合计4040 1.00(5)(6)取各小长方形上边的中点并用线段连接就构成了频率分布折线图. 变式迁移1 解 (1)分组 频数 频率[-20,-15)7 0.035 [-15,-10)11 0.055 [-10,-5)15 0.075 [-5,0)40 0.200 [0,5) 49 0.245 [5,10) 41 0.205 [10,15) 20 0.100 [15,20) 17 0.085合计200 (2)(3)样本数据不足0的频率为7+11+15+40200=0.365.例2 解 (1)寿命(h ) 频数 频率100~20020 0.10 200~30030 0.15 300~40080 0.40 400~50040 0.20 500~60030 0.15 合计200 1.00 (2)(3)由频率分布表可知,寿命在400 h 以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h 以上的频率为0.35.变式迁移2 解 (1)第四小组的频率为1-(0.1+0.3+0.4)=0.2. (2)n =第一小组的频数÷第一小组的频率=5÷0.1=50.(3)由0.1×50=5,0.3×50=15,0.4×50=20,0.2×50=10,得第一、第二、第三、第四小组的频数分别为5,15,20,10.所以学生跳绳次数的中位数落在第三小组内. 例3 解 (1)作出茎叶图如下图:(2)由上面的茎叶图可以看出,甲运动员的得分情况是大致对称的,中位数是36分;乙运动员的得分情况除一个特殊得分外,也大致对称,中位数是26分.因此甲运动员的发挥比较稳定,总体得分情况比乙运动员好.变式迁移3 解 (1)茎叶图如图所示:(2)电脑杂志上每个句子的字数集中在10~30之间,报纸上每个句子的字数集中在20~40之间,说明电脑杂志上每个句子的平均字数要比报纸上每个句子的平均字数要少.课时作业 1.D 2.D3.A [∵在这组中的数只有4个,∴频率=410=0.4.]4.D5.0.2 1∶3∶3∶1∶2 6.40解析 可知中间长方形的面积是所有长方形面积的14,即频率为14,∴样本容量为1014=40.7.解 (1)依题意知第三组的频率为42+3+4+6+4+1=15,又∵第三组的频数为12,∴本次活动的参评作品数为1215=60(件).(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×62+3+4+6+4+1=18(件)(3)第四组的获奖率是1018=59,第六组上交的作品数量为60×12+3+4+6+4+1=3(件)∴第六组的获奖率为23=69,显然第六组的获奖率较高. 8.解 (1)茎叶图如图所示.(2)由图可以看出乙城市的销售额分布较对称,集中程度较高,故乙城市一上午的销售情况比较稳定且销售额较高.。
对新教材第三册(选修)第一章《概率与统计》的认识及教学建议一、增加本章内容的背景与作用在全日制普通高级中学《教学大纲》中,增加概率与统计的初步知识是高中数学教学内容改革的重要组成部分。
《高中数学课程标准》的框架设想中指出,中学的概率与统计的教学,是中国数学教学的弱点,现在正在大力弥补。
由于概率、总体、样本等的概念很复杂,对高中学生来说难以严格地说清楚,所以新教材中采用描述方法来说明。
由于概率统计知识与日常生活、自然知识、社会生产实践的联系紧密,而日常生活中许多事件的发生往往是随机发生的,这与中学数学中长期占统治地位的确定性数学研究的对象有很大的不同,但它在数学众多分支中别具一格,与众不同。
教材中按排概率与统计的教学内容主要是培养学生的随机观念,弄清随机变量的取值规律是用概率和分布刻划的,会用随机观点处理随机现象,知道统计结果是概率地呈现的,可以有误差。
这样可使学生感觉到确定性和随机性数学思维方法的本质区别。
高中概率与统计内容教学的线索应该是:提出问题、收集资料、整理资料、解释资料、研究资料特征,做出统计判断,要使学生经历这样的全过程。
数据处理需要学生参与。
数据处理和概率的教学,主要依靠编制事例,提出课题,进行实际问题的处理。
在本章的第二部分“统计”中,教材选择了数理统计中最基本的问题来介绍这门学科的思想和方法。
第一个问题,就是采集样本。
有样本才能作统计推断。
抽样方法就是介绍怎样科学、合理公正地采集样本,教材介绍了简单随机抽样是最基本的抽样方法。
第二个问题,就是从样本中分布估计总体的分布。
教材首先介绍了总体分布的意义,并且实际例子介绍了用样本的频率分布估计总体分布。
第三个问题,就是假设检验。
教材利用线性回归的内容,介绍了相关系数的假设检验,通过具体的操作方法,介绍了假设检验的基本思想。
首先作出一个统计假设,在此假设下某些随机事件是否发生,从此来判断事先所作的统计假设:拒绝这个假设,还是接受这个假设。
关于χ2分布的样本题怎么计算χ2分布是概率论与数理统计中常用的一种概率分布,主要用于对样本数据的假设检验。
本文将介绍如何计算和使用χ2分布解决一个具体的样本题。
假设有一个实验,研究一个鸟种的性别比例。
调查了100只鸟的性别,并得到以下数据:雌性:35只雄性:65只现在要判断这只鸟群的性别分布是否符合已知的性别比例。
假设已知鸟群性别比例是1:1,即雌性和雄性各占一半。
我们可以使用χ2分布来检验这个假设。
首先,我们需要建立假设和备择假设:假设H0:鸟群的性别比例符合1:1备择假设H1:鸟群的性别比例不符合1:1然后,我们进行计算。
首先要计算卡方值(χ2值),计算公式为:χ2 = Σ((Oi - Ei)² / Ei)其中,Oi表示观察值,即实际测得的数量;Ei表示期望值,即按照假设得出的数量。
在这个例子中,假设雌性和雄性各占一半,则期望值分别为50只。
通过计算我们可以得到卡方值:χ2 = ((35-50)²/50) + ((65-50)²/50) = 6.5接下来,我们需要根据自由度和显著性水平确定拒绝域。
在这个例子中,自由度为1(观察数据的分类数目减1),我们选择显著性水平为0.05。
查阅χ2分布表,可以得到临界值χ2_0.05(1) ≈ 3.841。
因为计算得到的卡方值 6.5大于临界值 3.841,我们可以拒绝原假设,即鸟群的性别比例不符合1:1。
最后,我们可以计算p值来表示拒绝原假设的程度。
p值表示了在原假设成立的情况下,观察值出现的概率。
在这个例子中,p值约等于0.01。
因为p值小于0.05,我们可以得出结论:鸟群的性别比例不符合1:1,并且这种差异是显著的。
在参考内容方面,可以提供χ2分布表供读者参考。
由于不能提供链接,可以在文中直接列出一部分χ2分布表,帮助读者查找他们需要的临界值。
可以使用以下形式进行列举:卡方值自由度=1 自由度=2 自由度=3 ...0.001 0.000 0.020 0.115 ...0.010 0.004 0.051 0.216 ...0.025 0.102 0.103 0.352 ......0.975 3.841 5.991 7.815 ......通过参考内容和示例计算,读者可以更好地理解和应用χ2分布进行样本问题的分析。
2015航班概率与统计----统计
1.为了解某小区“全民健身”活动的开展情况,某志愿者对居
住在该小区的50名成年人一周的体育锻炼时间进行了统计,
并绘制成如图所示的条形统计图.这组数据的众数和中位数分
别是
A.6,4 B.6,6 C.4,4 D.4,6
2.为筹备班级联欢会,班干部对全班同学最爱吃的水果进行了统计,最终决定买哪种水果时,班干部最关心的统计量是
A.平均数B.中位数C.众数D.方差
3.某次比赛中,15名选手的成绩如图所示,则这15名选手成
绩的众数和中位数分别是
A.98,95 B.98,98
C.95,98 D.95,95
5.某射击教练对甲、乙两个射击选手的5次成绩(单位:环)进行了统计,如下表所示:
设甲、乙两人射击成绩的平均数分别为x甲、x乙,射击成绩的方差分别为2s
甲、2
s
乙
,则下
列判断中正确的是
A.x
甲<x
乙
,2
s
甲
>2
s
乙
B.x
甲
=x
乙
,2
s
甲
<2
s
乙
C.x
甲=x
乙
,22
=
s s
甲乙
D.x
甲
=x
乙
,2
s
甲
>2
s
乙
5.甲和乙入选学校的定点投篮大赛,他们每天训练后投10个球测试,记录命中的个数,五天后将记录的数据绘制成折线统计图,如右图所示.则下列对甲、乙数据描述正确的是
A.甲的方差比乙的方差小
B.甲的方差比乙的方差大
C.甲的平均数比乙的平均数小
D.甲的平均数比乙的平均数大
6.下表记录了甲、乙、丙、丁四名跳远运动员选拔赛成绩的平均数x 与方差2
s :
根据表中数据,要从中选择一名成绩好又发挥稳定的运动员参加比赛,应该选择 A .甲 B .乙 C .丙 D .丁
7.某企业为了解员工给灾区“爱心捐款”的情况,随机抽取部分员工的捐款金额整理绘制成如图所示的直方图,根据图中信息,下列结论正确的是( )
A .样本中位数是200元
B .样本容量是20
C .该企业员工捐款金额的极差是450元
D .该企业员工最大捐款金额是500元
8.某校为了更好的开展“学校特色体育教育”,从全校八年级的各班分别随机抽取了5名男生和5名女生,组成了一个容量为60的样本,进行各项体育项目的测试,了解他们的身体素质情况.下表是整理样本数据,得到的关于每个个体的测试成绩的部分统计表、图:
(说明:40---55分为不合格,55---70分为合格,70---85分为良好,85---100分为优秀) 请根据以上信息,解答下列问题: (1)表中的a= ,b= ;
(2)请根据频数分布表,画出相应的频数分布直方图;
(3)如果该校八年级共有150名学生,根据以上数据,估计该校八年级学生身体素质良好及以上的人数为 .
正正正
某校60名学生体育测试成绩 频数分布表
9.在北京,乘坐地铁是市民出行时经常采用的一种交通方式.据调查,新票价改革政策的实施给北京市轨道交通客流带来很大变化.根据2015年1月公布的调价后市民当时乘坐地铁的相关调查数据,制作了以下统计表以及统计图.
根据以上信息解答下列问题:
(1)补全扇形图;
(2)题目所给出的线路中,调价后客流量下降百分比最高的线路是,调价后里程x(千米)在范围内的客流量下降最明显.对于表中客流量不降反增而且增长率最高的线路,如果继续按此变化率增长,预计2016年1月这条线路的日均客流量将达到万人次;(精确到0.1)
(3)小王同学上学时,需要乘坐地铁15.9公里到达学校,每天上下学共乘坐两次.问调价后小王每周(按5天计算)乘坐地铁的费用比调价前多支出元.(不考虑使用市政一卡通刷卡优惠,调价前每次乘坐地铁票价为2元)
10.为防治大气污染,依据北京市压减燃煤相关工作方案,2014年全市燃煤数量比2012年压减450万吨,到2015年、2017年要比2012年分别压减燃煤800万吨、1300万吨.以下是根据相关数据绘制的统计图的一部分:
(1)据报道,2012年全市燃煤由四部分组成,其中电厂用煤920万吨,则2012年全市燃煤数量为万吨;
(2)请根据以上信息补全2012-2017年全市燃煤数量的折线统计图,并标明相应数据;
(3)某地区积极倡导“清洁空气,绿色出行”,大力提升自行车出行比例,小颖收集了该地区近几年公共自行车的有关信息(如下表),发现利用公共自行车出行人数与公共自行车投放数量之间近似成正比例关系.
2012-2015年公共自行车投放数量与利用公共自行车出行人数统计表
年份公共自行车投放数量(万辆)利用公共自行车出行人数(万人)
2012 1.4 约9.9
2013 2.5 约17.6
2014 4 约27.6
2015 5 约
根据小颖的发现,请估计,该地区2015年利用公共自行车出行人数(直接写出结果,精确到0.1)
11.第九届中国国际园林博览会(园博会)已于2013年5月18日在北京开幕,
以下是根据近几
届园博会的相关数据绘制的统计图的一部分:
(1)第九届园博会的植物花园区由五个花园组成,其中月季园面积为0.04平方千米,牡丹园面积为平方千米;
(2)第九届园博会园区陆地面积是植物花园区总面积的18倍,水面面积是第七、八两届园博会的水面面积之和,请根据上述信息补全条形统计图,并标明相应数据;
(3)小娜收集了几届园博会的相关信息(如下表),发现园博会园区周边设置的停车位数量与日接待游客量和单日最多接待游客量中的某个量近似成正比例关系,根据小娜的发现,请估计将于2015年举办的第十届园博会大约需要设置的停车位数量(直接写出结果,精确到百位)。
12.吴老师为了解本班学生的数学学习情况,对
某次数学考试成绩(成绩取整数,满分为100分)
作了统计,绘制成如下频数分布表和频数分布直
方图.
请你根据图表提供的信息,解答下列问题:
(1)求频率分布表中a、b、c的值;并补全
频数分布直方图;
(2)如果用扇形统计图表示这次数学考试成绩
时,那么成绩在69.5~79.5范围内的扇形圆心角的度数为多少度?
13.北京市近年来大力发展绿地建设,2010年人均公共绿地面积比2005年增加了4平方米,以
下是根据北京市常住人口调查数据和绿地面积的有关数据制作的统计图表的一部分.
北京市常住人口统计表
(1)补全条形统计图,并在图中标明相应数据;
(2)按照2013年的预测,预计2020年北京市常住人口将达到多少万人?
(3)按照2013年的北京市常住人口预测,要完成2020年的北京市人均公共绿地面积规划,从2005年到2020年,北京市的公共绿地总面积需增加多少万平方米?。