第三章 集中趋势的度量
- 格式:ppt
- 大小:390.00 KB
- 文档页数:42
第三章数据的集中趋势和离散程度教案教案:第三章数据的集中趋势和离散程度一、教学目标:1.理解数据的集中趋势和离散程度的基本概念和含义;2.掌握计算和应用数据的集中趋势和离散程度的方法;3.能够利用数据的集中趋势和离散程度进行数据分析和决策。
二、教学内容:1.集中趋势的度量:众数、中位数、均值;2.离散程度的度量:极差、方差、标准差。
三、教学过程:1.导入(5分钟)教师简要介绍数据的集中趋势和离散程度的概念和定义,激发学生的学习兴趣。
2.集中趋势的度量(20分钟)(1)众数:a.理解众数的概念:数据中出现次数最多的值;b.计算众数的方法:统计数据各项的频数,找出频数最大的数据项。
(2)中位数:a.理解中位数的概念:将数据从小到大排序,中间的数;b.计算中位数的方法:①如果数据个数为奇数,中位数可直接取排序后的中间值;②如果数据个数为偶数,中位数可取排序后的中间两个数的平均值。
(3)均值:a.理解均值的概念:数据的算术平均值;b.计算均值的方法:将数据项相加,再除以数据的个数。
3.离散程度的度量(30分钟)(1)极差:a.理解极差的概念:数据的最大值与最小值之差;b.计算极差的方法:将数据按升序排列,最大值减去最小值。
(2)方差:a.理解方差的概念:数据偏离均值的平均平方差;b.计算方差的方法:将每个数据与均值之差的平方相加,再除以数据个数。
(3)标准差:a.理解标准差的概念:方差的正平方根;b.计算标准差的方法:取方差的正平方根。
4.应用案例分析(25分钟)教师提供实际数据,并引导学生运用所学知识计算数据的集中趋势和离散程度,分析数据的特点和规律。
例如,一个班级的学生成绩:70、75、80、85、90,学生的身高:160cm、165cm、170cm、175cm、180cm。
5.总结(5分钟)教师对本节课所学内容进行总结,并强调数据的集中趋势和离散程度对数据分析和决策的重要性。
同时,鼓励学生在实践中灵活应用所学知识。
第三章 数据分布特征的描述(一)教学目的通过本章的学习,使同学们正确理解各种指标的概念及计算方法,学会运用相应的统计指标对数据的分布特征进行分析说明。
(二)基本要求使学生熟练掌握数据分布特征的描述方法。
(三)教学要点1、集中趋势的测度指标及其计算方法;2、离散趋势的测度指标及其计算方法;3、总体分布的偏度与峰度的测度。
(四)教学时数9——10课时(五)学习内容本章共分三节:第一节 数据分布集中趋势的测定一、定类数据集中趋势的测度——众数(Mode)(一) 概念要点众数是指一组数据中出现次数最多的变量值,用表示。
从变量分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数。
当然,如果数据的分布没有明显的集中趋势或最高峰点,众数也可以不存在;如果有多个高峰点,也就有多个众数。
1.集中趋势的测度值之一2.出现次数最多的变量值3.不受极端值的影响4.可能没有众数或有几个众数5.主要用于定类数据,也可用于定序数据和数值型数据众数的不唯一性:无众数原始数据: 10 5 9 12 6 8一个众数原始数据: 6 5 9 8 5 5多于一个众数原始数据: 25 28 28 36 42 42(二)众数的计算根据未分组数据或单变量值分组数据计算众数时,我们只需找出出现次数最多的变量值即为众数。
对于组距分组数据,众数的数值与其相邻两组的频数分布有一定的关系,这种关系可作如下的理解:设众数组的频数为,众数前一组的频数为,众数后一组的频数为。
当众数相邻两组的频数相等时,即=,众数组的组中值即为众数;当众数组的前一组的频数多于众数组后一组的频数时,即>,则众数会向其前一组靠,众数小于其组中值;当众数组后一组的频数多于众数组前一组的频数时,即<,则众数会向其后一组靠,众数大于其组中值。
基于这种思路,借助于几何图形而导出的分组数据众数的计算公式如下:下限公式:(3.1)上限公式:(3.2)式中:表示众数所在组的下限;表示众数所在组的上限;表示众数所在组的组距。
【课程讲义】第三章集中量数【教学目标】明确一批数据的特征包括两个方面的内容:集中趋势、离散性;明确集中量数是描述数据集中趋势的量数,可以作为一批数据的代表值;明确算术平均数是所有集中量数中运用最广泛、最优的量数;明确各种集中量数的含义、计算方法、使用条件、性质及优缺点。
【学习方法】了解、理解、计算与应用。
【重点难点】算术平均数的概念及适用条件;算术平均数的计算方法;中位数的概念及适用条件;中位数的计算方法。
【讲义内容】前一章所讲的统计分组、统计表、统计图等,只是对研究工作中所获得的数据进行初步整理,其目的是对数据的性质、分布特征、差异情况及数据的一般规律有一直观和形象的认识。
因此说这一步还不是应用统计方法的步骤。
为了进一步发现和表示一组数据的规律性,需要计算出一些能够反映这组数据的统计特征的数字——称为统计量或特征数。
对于一组数据来讲,最常用的统计量有两类。
一类是表现数据集中性质或集中程度的,另一类是表现数据分散性质或分散程度的。
数据的集中情况指一组数据的中心位置。
集中趋势的度量,即确定一组数据的代表值。
描述数据集中情况的统计量有多种,包括算术平均数、中数、几何平均数等。
由于这些统计量的作用在于度量数据的集中趋势,因此它们都称为集中量数。
本章主要介绍几种常用的集中量数。
集中量数只描述数据的集中趋势和典型情况,它还不能说明一组数据的全貌。
数据除典型情况之外,还有变异性的特点。
对于数据变异性即离中趋势进行度量的一组统计量,称作差异量数,这些差异量数有方差、标准差、全距、平均差、四分差及各种百分差等等,下一章中将对常用的差异量数进行介绍。
第一节 算术平均数一、算术平均数的概念和适用条件(一)概念算术平均数一般简称为平均数或均数(Mean )。
只有在与其他几种集中量数如几何平均数、加权平均数相区别的时候,才把它叫做算术平均数。
如果平均数是由X 变量计算的,就记为X (读作X 杠),若由Y 变量求得,则记为Y 。
第三章 集中趋势和离中趋势在一个右偏的分布中,在一个左偏的分布中,xX Md Mo§2 离中趋势的计量与集中趋势相反,离中趋势反映的是一组资料中各观测值之间的差异或离散程度。
一、全距(Range )全距又称极差,指一组资料中最大的数值与最小的数值之差。
R = 最大值-最小值简单明了,但没有考虑中间值以及数据的分布情况。
二、平均差(Average Deviation )1、一组数据值与其均值之差的绝对值的平均数称为平均差。
以A.D.表示,其计算公式为:对于未分组资料:nXX D A ni i ∑=-=1..对于分组资料:∑∑=-=iii ii f f XX D A 1..例4.12 某企业100名工人的每周工资资料如下:100名工人每周工资资料 按工资分组 人数 组中值 离差 离差的 绝对值 离差绝对值×次数 100—200 10 150 -170 170 1700 200─300 30 250 -70 70 2100 300─400 40 350 30 30 1200 400─500 20 450 130 130 2600 合计100-——7600则: x =x f fi iii i∑∑=3200100=320(元) A.D. =x x ffi iii i-∑∑=7600100=76(元) 平均差充分考虑了每一个数值离中的情况,完整地反映了全部数值的分散程度,在反映离中趋势方面比较灵敏,计算方法也比较简单。
它的缺陷在于,由于它的敏感性,使得它易受极端值影响,特别是绝对值运算给数学处理带来很多不便。
2、在ECXCEL 中计算平均差 未分组资料:函数A VEDEV分组资料:运用函数:SUMPRODUCT, ABS (求绝对值)三、方差(Variance )与标准差(Standard Deviation ) 方差与标准差是测度离中趋势的最重要、最常用的量。
1、总体方差是一组资料中各数值与其算术平均数离差平方和的平均数。
第三章 数据分布特征的度量第一节 一.集中趋势 (一)概念:指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是要寻找数据一般水平的代表值或中心值。
(二)特点:1.集中趋势测度值是一个代表性值,表示被研究总体的一般水平(数据的共性)2.平均数把被研究总体的数量标志值在各个单位之间的数量差异抽象化了 (三)作用:1.利用集中趋势测度值对比不同总体的一般水平2.利用集中趋势测度值比较.反映同一单位某一标志不同时期一般水平的发展变化,说明事物的发展过程和变化趋势3.利用集中趋势测度值分析现象之间的相互关系,并推算其它有关的指标。
(四)度量Ⅰ.数值均值(μ) 1.算术均值 (1)特点:①集中趋势的最常用测度值 ②一组数据的均衡点所在 ③体现了数据的必然性特征 ④易受极端值的影响 (2)数学性质:①数值观测值与算术均值的离差之和等于0 ∑=-0)(μx 或 ∑=-0)(f x μ ②数值观测值与算术均值的离差平方和最小∑=-min )(2μx 或∑=-min )(2f x μ③均值易受极端值的影响2.调和均值(H ) (1)特点:①调和均值是各个变量值倒数的算术均值的倒数 ②易受极端值的影响3.几何均值(G)(1)特点:①适用于对比率数据的平均②主要用于计算平均速度Ⅱ.位置均值1.众数(M o)(1)概念:一组数据中出现次数最多的变量值,Mo表示(2)特点①众数的值与相邻两组频数的分布有关②用于数值型分组数据,适合于数据量较多时使用③不受极端值的影响④一组数据可能没有众数或有几个众数(不唯一性)2.中位数(M e)(1)概念:依据数据从小到大排序后,处于中间位置上的变量值,用Me表示(2)特点:①不受极端值影响②数据分布偏斜程度较大时应用绝对值之和为最小(中位数与各数据的距离之和最短)③各变量值与中位数的离差3.分位数(Q)(1)概念:是将全部数据排序后等分为若干个分位点,各分位点上的数值称为分位数(五)算术均值与众数和中位数的关系第二节数据离中程度的度量一.离散程度(一)概念:测量一组数据差异程度,反应频数分布数列中各个数据的变动范围或差异程度。