2019-2020年数学必修3同步课件讲义应用案巩固提升:第2章2.2.1频率分布直方图与折线图(苏教版)
- 格式:doc
- 大小:813.52 KB
- 文档页数:29
姓名,年级:时间:§2.3变量间的相关关系学习目标 1.了解变量间的相关关系,会画散点图。
2。
根据散点图,能判断两个变量是否具有相关关系.3。
了解线性回归思想,会求回归直线的方程.知识点一变量间的相关关系相关关系的定义变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,那么这两个变量之间的关系叫做相关关系,两个变量之间的关系分为函数关系和相关关系.知识点二散点图及正、负相关的概念1.散点图将样本中n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图.点(错误!,错误!)叫样本点中心.2.正相关与负相关(1)正相关:散点图中的点散布在从左下角到右上角的区域.(2)负相关:散点图中的点散布在从左上角到右下角的区域.知识点三回归直线回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.回归直线过样本点中心.(2)线性回归方程:回归直线对应的方程叫做回归直线的方程,简称回归方程.(3)最小二乘法:求线性回归方程错误!=错误!x+错误!时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.错误!其中,错误!是线性回归方程的斜率,错误!是线性回归方程在y轴上的截距.1.人的身高与年龄之间的关系是相关关系.(×)2.农作物的产量与施肥量之间的关系是相关关系.(√)3.回归直线过样本点中心(x,错误!).( √)4.根据回归直线方程得到的结论一定是可靠的.( ×)题型一变量间相关关系的判断例1 (1)下列关系中,属于相关关系的是________.(填序号)①正方形的边长与面积之间的关系;②农作物的产量与施肥量之间的关系;③出租车费与行驶的里程;④降雪量与交通事故的发生率之间的关系.答案②④解析在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;③为确定的函数关系;在④中,降雪量与交通事故的发生率之间具有相关关系.(2)某个男孩的年龄与身高的统计数据如下表所示。
2.2总体分布的估计
2.2.1频率分布表
2.2.2频率分布直方图与折线图
1.了解频数、频率的概念,了解全距、组距的概念.
2.能正确地编制频率分布表,会用样本频率分布去估计总体分布.
3.理解运用频率分布直方图和折线图分析样本的分布,从而估计总体分布的思想方法.
4.掌握用频率分布表作频率分布直方图和频率折线图的方法.
1.频率分布表
(1)定义:频数是某一研究对象在某范围内出现的次数,频率指某一研究对象出现的频数与总次数的比值,它能更好地反映出某一对象出现的频繁程度.当总体很大或不便获得总体的频率时,可以用样本的频率分布估计总体的频率分布.根据所抽取样本的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值情况),就叫做样本的频率分布.
(2)当总体容量很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.
(3)全距与组距:整个取值区间的长度称为全距;分成的区间的长度称为组距. 2.频率分布直方图
(1)定义:我们利用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图,简称频率直方图.
(2)作频率分布直方图的步骤
①求全距,即一组数据中最大值和最小值的差.
②决定组距与组数,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚的呈现出来.
③将数据分组.
④计算各小组的频率,作频率分布表,各小组的频率=小组频数
样本容量
.
⑤画频率分布直方图:作直角坐标系,横轴表示样本数据,纵轴表示频率
组距;把横轴分成
若干段,每一线段对应一个组的组距,然后以此为底作一矩形,它的高等于该组的频率
组距
.
3.频率分布折线图
如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到频率分布
折线图,简称频率折线图.
4.总体分布的密度曲线
如果将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线.
1.判断下列关于频率分布直方图的说法是否正确(正确的打“√”,错误的打“×”) (1)直方图的高表示取某数的频率.( )
(2)直方图的高表示该组上的个体在样本中出现的频数与组距的比值.( ) (3)直方图的高表示该组上的个体在样本中出现的频率.( )
(4)直方图的高表示该组上的个体在样本中出现频率与组距的比值.( )
解析:频率分布直方图的高表示该组上的个体在样本中出现的频率与组距的比值. 答案:(1)× (2)× (3)× (4)√
2.将容量为100的样本数据按由小到大排列分成8个小组,如表所示,但第3组被墨汁污染,则第三组的频率为( )
C .0.03
D .0.10
解析:选A.第三组的频数为100-(10+13+14+15+13+12+9)=14.故第三组的频率为14
100
=0.14. 3.一个容量为n 的样本分成若干组,已知某组的频数和频率分别为20和0.25,则n =________.
解析:由频率=频数样本容量
,利用此式可知二求一,即20
n =0.25,所以n =80.
答案:80
4.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12]内的频数为________.
解析:由直方图得样本数据在[10,12]内的频率为0.18,则样本数据在区间[10,12]内的频数为36.
答案:36
5.为了让学生更多地了解“数学史”知识,某班级举办一次“追寻先哲的足迹,倾听数学的声音”的数学史知识竞赛活动.现将初赛答卷成绩(得分均为整数,满分为100分)进行统计,制成如下频率分布表:
解析:设①②③④处的数值分别为A 、B 、C 、D , 则A
50=0.16,所以A =8; B =22
50
=0.44;
C =50-(8+22+14)=6;
D =1-(0.16+0.44+0.28)=0.12. 答案:①8 ②0.44 ③6 ④0.12
频率分布表的应用
(1)为了解某校高一年级男生的身高情况,从中选取一个容量为60的样本(60名男生的身高单位:cm),分组情况如下:。