第一节 数据集中趋势的测度
- 格式:ppt
- 大小:510.50 KB
- 文档页数:4
2012年经济师测试中级经济基础预习讲义集中趋势的测度第二十二章数据特征的测度第一节集中趋势的测度集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。
集中趋势的测度,主要包括:位置平均数----众数、中位数等数值平均数----算术平均数和几何平均数等(一)、众数1、涵义:众数是一组数据中出现频数最多的那个数值,用M0表示。
2、用众数反映集中趋势,非常直观,不仅适用于品质数据,也适用于数值型数据。
众数是一个位置代表值,不受极端值的影响,抗干扰性强。
(二)中位数1、涵义:把一组数据按从小到大的顺序进行排列,位置居中的数值叫做中位数,用Me表示。
中位数将数据分为两部分,其中一半的数据小于中位数,另一半数据大于中位数。
2、中位数计算:根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,n为数据的个数,其公式为: n为奇数:中位数位置是,该位置所对应的数值就是中位数数值。
n为偶数:中位数位置是介于和( +1)之间,中位数数值就是所对数值和( +1)所对应数值的算术平均数。
具体计算见教材例题:3、中位数主要用于顺序数据,也适用于数值型数据,但不适用于分类数据,中位数也是一(三)算术平均数1、涵义:算术平均数是全部数据的算术平均,又称均值,用表示。
是集中趋势中最主要的测度值。
主要适用于数值型数据,但不适用于品质数据。
2、计算公式(1)简单算术平均数简单算术平均数主要用于处理未分组的原始数据。
简单算术平均数的计算公式为:(2)加权算术平均数加权算术平均数主要用于处理经分组整理的数据。
加权算术平均数的计算公式为:Xi——各组的组中值fi——各组的频数3、计算和运用算术平均数注意事项:(1)算术平均数同时受到两个因素的影响:各组数值的大小、各组分布频数的多少。
频数在算术平均数中起着权衡轻重的作用。
(2)算术平均数易受极端值的影响。
极端值的出现,会使平均数的真实性受到干扰。
第五章数据分布特征的描述第一节集中趋势指标概述一、集中趋势指标及其特点集中趋势(Central tendency),是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是要寻找数据一般水平的代表值或是心值。
在现象的同质总体中,各个单位的标志值是不尽相同的。
如果我们的目的是要对总体的数量水平有一个概括地、一般地认识,显然不能用某一单位的标志值表示。
统计平均数就是用来反映总体的一般水平和集中趋势的指标。
通俗的理解就是,在不变更总体总量的情况下,对总体内的全部标志值进行“截长补短”,使得总体各单位拥有同一水平的数量表现,这个同一水平的数量表现就是平均数,即集中趋势指标。
统计平均数有两个重要的特点:第一,平均数是一个代表值,表示被研究总体的一般水平。
例如,某企业职工的工资水平有高有低,有的职工月工资1680元,有的职工月工资1900元,有的职工月工资1870元,有的职工月工资2200元,等等。
若根据该企业各个职工月工资额综合计算出职工月平均工资为1860元,那么,1860元就是一个代表值。
它反映了该企业职工月工资的—般水平。
第二,平均数把被研究总体各单位的标志值的数量差异抽象化了。
例如,某企业职工的月平均工资为1860元,但是各个职工的工资水平有高有低,高于1860元的工资和低于1860元的工资互相抵消了,从而得出平均工资1860元。
由此可见,平均工资(1860元)已把各职工月工资水平的差别抽象化了。
二、集中趋势指标的作用集中趋势指标——统计平均数,在统计研究中被广泛应用,平均数的作用可以归纳为以下几点:1.利用平均数对比不同总体的一般水平。
平均数可以用来对同类现象在各单位、各部门、各地区之间进行比较,以说明生产水平的高低或经济效果的好坏。
例如,要比较不同的生产企业生产水平的好坏,仅对比企业的产品总产量是不足以说明问题的,因为产品总产量受到企业规模大小的影响。
要比较,需要计算各企业生产人员的平均产品产量,即劳动生产率,并分析不同的生产条件,才能做出正确的判断。
中级经济师-经济基础知识-基础练习题-第二十四章描述统计-一、集中趋势的测度[单选题]1.某小学六年级8个班的学生人数由少到多依次为34人、34人、34人、34人、36人、36人、37人、37人(江南博哥),其中位数为()。
A.34B.35C.36D.37正确答案:B参考解析:此题考查集中趋势测度值,已排序,居中的是34人36人,则中位数是(34+36)÷2=35人。
[单选题]5.下面一组数据为9个家庭在2017年的人均月收入数据(单位:元):750、780、850、960、1080、1250、1500、1650、2000,则中位数为()元,均值为()元。
A.750,1250B.1080,1202.2C.1500,1080D.2000,1500正确答案:B参考解析:本题考查集中趋势的测度。
先把上述数据按顺序排列,由于有9个数据,是奇数,中位数的位置为(9+1)/2=5,中位数是1080元。
均值=(750+780+850+960+1080+1250+1500+1650+2000)/9=1202.2(元)。
[单选题]6.某直辖市下辖8个县,每个县的面积如下(单位:平方公里):1455、2019、912、1016、1352、1400、1792、2000,则该直辖市下辖县面积的中位数是()。
A.1400B.1455C.1427.5D.1428正确答案:C参考解析:本题考查中位数的具体应用。
把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫作中位数。
Me=(1400+1455)÷2=1427.5[单选题]7.下面是抽样调查的10个学生的考试分数等级,分别为:不及格,中,中,良,良,良,良,优,优,优。
这10个学生分数的众数为()。
A.优B.中C.良D.不及格正确答案:C参考解析:此题考查集中趋势测度值中的众数。
众数是指一组数据中出现次数(频数)最多的变量值,题目中良的出现次数最多,所以应为良。
第二十三章描述统计【本章内容讲解】对统计数据特征的测度,主要从三个方面进行:一是分布的集中趋势,反映数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的偏态和峰度,反映数据分布的形状。
第一节、集中趋势的测度【本节知识点】1.均值的计算及适用范围2.中位数的计算及适用范围3.众数的含义及适用范围【本节内容精讲】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。
集中趋势均值也就是平均数,就是数据组中所有数值的总和除以该组数值的个数。
【提示1】它是集中趋势中最主要的测度值,是一组数据的重心所在,解释了一组数据的平均水平。
【提示2】均值主要适用于数值型数据,但不适用于分类数据和顺序数据。
【提示3】均值易受极端值的影响,极端值会使得均值向极大值或极小值方向倾斜,使得均值对数据组的代表性减弱。
【例题1:2014年单选题】在某城市2014年4月空气质量检测结果中,随机抽取6天的质量指数进行分析。
样本数据分别是:30、40、50、60、80和100,这组数据的平均数是()。
A. 50B. 55C. 60D. 70【答案】C【解析】均值即位平均数,本题均值=(30+40+50+60+80+100)/6=60【知识点二】中位数1.含义:把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫做中位数。
中位数将数据分为两部分,其中一半的数据小于中位数,另一半数据大于中位数。
2.计算: 根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,n 为数据的个数,其公式为: (1)n 为奇数:中位数位置是21 n ,该位置所对应的数值就是中位数数值。
(2)n 为偶数:中位数位置是介于2n 和(2n +1)之间,中位数就是这两个位置对应的数据的均值。
3.适用:中位数主要用于顺序数据,也适用于数值型数据,但不适用于分类数据,中位数不受极端值的影响,抗干扰性强。
第四部分统计——第二十四章描述统计考情分析:年份单选题多选题合计2016年2题2分2题4分6分2015年4题4分2题4分8分本章重点:1.集中趋势的测度指标:均值、中位数和众数。
2.离散程度的测度指标:方差、标准差和离散系数。
3.分布形态的测度:偏态系数、标准分数。
4.变量相关关系的分类、散点图、相关系数。
知识点一:集中趋势的测度1.均值。
均值也叫做平均数,就是数据组中所有数值的总和除以该组数值的个数。
设一组数据为X1,X2,…,X n,平均数`X的计算公式为:【注意1】:均值主要适用于数值型数据,但不适用于分类和顺序数据。
【注意2】:均值容易受到极端值的影响,极端值会使得均值向极大值或极小值方向倾斜,使得均值对数据组的代表性减弱。
2.中位数。
把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫做中位数,用M e表示:【注意1】:中位数是一个位置代表值,主要用于顺序数据和数值型数据,但不适用于分类数据。
【注意2】:中位数的优点是不受极端值的影响,抗干扰性强。
3.众数:指一组数据中出现次数(频数)最多的变量值。
适用于描述分类数据和顺序数据,不适用于定量数据。
【注意】:有些情况下可能出现双众数、多众数或者没有众数,难以描述数据的集中趋势。
总结:均值VS中位数VS众数:指标适用特点均值定量变量利用全部信息,受极端值影响如有明显极端值,则代表性差中位数顺序变量和定量变量没有充分利用全部信息,不受极端值影响适用于分布不对称的数据众数分类变量和顺序变量没有充分利用全部信息,不受极端值影响适用于分布明显呈偏态的数据【例题·单选题】在对数据集中趋势的测度中,适用于偏斜分布的数值型数据的是()。
A.中位数B.均值C.标准差D.方差『正确答案』A『答案解析』本题考查中位数。
中位数主要适用于顺序数据,也适用于数值型数据,但不适用于分类数据,中位数不受极端值的影响,抗干扰性强,尤其适用于收入这类偏斜分布的数值型数据。
统计学基础知识之数据集中趋势的描述统计学基础知识之数据集中趋势的描述在社会和经济领域中有许多实际发生的数据,因为各种偶然因素的影响,这些数据看起来往往杂乱无章。
但是,如果对这些无序的数据进行整理和归纳,就可以发现有一种必然的因素在起作用,这种因素就是社会和经济领域中内在的变化趋势。
通过这种趋势的研究可以了解事物的本质特征,可以掌握事物发展变化的规律。
这种趋势在统计学中就被称为集中趋势。
下面是yjbys店铺为大家带来的关于数据集中趋势的描述的知识,欢迎阅读。
数据集中趋势的描述算术平均数(arithmetic mean),又称均值,分为简单算术平均数、加权算术平均数。
它主要适用于数值型数据,不适用于品质数据。
就是将一组数据的和除以数据的个数。
计算公式:1. 简单算术平均,适用:主要用于未分组的原始数据。
设一组数据为X1,X2,...,Xn,则简单的算术平均数的计算公式为:2. 加权算术平均,适用:主要用于处理经分组整理的数据。
设原始数据为被分成K组,各组的组中的值为X1,X2,...,Xk,各组的频数分别为f1,f2,...,fk,则加权算术平均数为:应用问题:均值是实际中应用最广泛的集中趋势测度值,样本均值受样本数据影响最小,具有一定的稳定性,因此,在抽样推断中均值是用于推断总体的一个最重要指标,但还需要注意以下几个问题:(1)当数据中有极大值或极小值存在时,均值会受到很大影响,其结果会掩盖数据的真实特征,使均值失去代表性。
(2)使用分组数据计算总平均数时,由于各组频率对平均数的影响,在对总平均数进行对比时,要注意结合组平均数补充说明。
几何平均数(geometric mean),是指n个观察值连乘积的n次方根。
几何平均数主要用于各种比率的平均,尤其在计算动态比率的平均时特别适合。
计算公式:设一组数据为X1,X2,…,Xn,且均大于0,则几何平均数Xg 为:应用举例:某厂流水作业的装配线有4道工序,各工序的产品合格率分别是85%,97%,94%,92%,求4道工序平均产品合格率。
第三章+数据分布特征的描述(教案)第三章数据分布特征的描述(一)教学目的通过本章的自学,并使同学们正确理解各种指标的概念及计算方法,学会运用适当的统计数据指标对数据的原产特征展开分析表明。
(二)基本要求并使学生熟练掌握数据分布特征的叙述方法。
(三)教学要点1、集中趋势的测度指标及其计算方法;2、离散趋势的测度指标及其计算方法;3、总体分布的偏度与峰度的测度。
(四)教学时数9――10课时(五)学习内容本章共分三节:第一节数据分布分散趋势的测量一、定类数据集中趋势的测度――众数(mode)(一)概念要点众数就是指一组数据中发生次数最少的变量值,用mo表示。
从变量分布的角度看,众数就是具备显著分散趋势点的数值,一组数据分布的最高峰点所对应的数值即为为众数。
当然,如果数据的原产没显著的分散趋势或最高峰点,众数也可以不存有;如果存有多个高峰点,也就存有多个众数。
1.集中趋势的测度值之一2.出现次数最多的变量值3.不受极端值的影响4.可能将没众数或存有几个众数5.主要用于定类数据,也可用于定序数据和数值型数据众数的不唯一性:并无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:252828364242(二)众数的排序根据未分组数据或单变量值分组数据计算众数时,我们只需找出出现次数最多的变量值即为众数。
对于组距分组数据,众数的数值与其相邻两组的频数分布有一定的关系,这种关系可作如下的理解:设众数组的频数为fm,众数前一组的频数为f?1,众数后一组的频数为f?1。
当众数相连两组的频数成正比时,即f?1=f?1,众数组的组中值即为众数;当众数组的前一组的频数多于众数组后一组的频数时,即f?1>f?1,则众数可以向其前一组依靠,众数大于其组中值;当众数组后一组的频数多于众数组前一组的频数时,即f?1<f?1,则众数可以向其后一组依靠,1众数大于其组中值。
基于这种思路,借助几何图形而求出的分组数据众数的计算公式如下:下限公式:mo?l?下限公式:fm?f?1??d?l?1?d(fm?f?1)?(fm?f?1)?1??2(3.1)fm?f?1??d?u?2?d(fm?f?1)?(fm?f?1)?1??2(3.2)mo?u?式中:l表示众数所在组的下限;u表示众数所在组的上限;d表示众数所在组的组距。
第五章数据分布特征的描述第一节集中趋势指标概述一、集中趋势指标及其特点集中趋势(Central tendency),是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是要寻找数据一般水平的代表值或是心值。
在现象的同质总体中,各个单位的标志值是不尽相同的。
如果我们的目的是要对总体的数量水平有一个概括地、一般地认识,显然不能用某一单位的标志值表示。
统计平均数就是用来反映总体的一般水平和集中趋势的指标。
通俗的理解就是,在不变更总体总量的情况下,对总体内的全部标志值进行“截长补短”,使得总体各单位拥有同一水平的数量表现,这个同一水平的数量表现就是平均数,即集中趋势指标。
统计平均数有两个重要的特点:第一,平均数是一个代表值,表示被研究总体的一般水平。
例如,某企业职工的工资水平有高有低,有的职工月工资1680元,有的职工月工资1900元,有的职工月工资1870元,有的职工月工资2200元,等等。
若根据该企业各个职工月工资额综合计算出职工月平均工资为1860元,那么,1860元就是一个代表值。
它反映了该企业职工月工资的—般水平。
第二,平均数把被研究总体各单位的标志值的数量差异抽象化了。
例如,某企业职工的月平均工资为1860元,但是各个职工的工资水平有高有低,高于1860元的工资和低于1860元的工资互相抵消了,从而得出平均工资1860元。
由此可见,平均工资(1860元)已把各职工月工资水平的差别抽象化了。
二、集中趋势指标的作用集中趋势指标——统计平均数,在统计研究中被广泛应用,平均数的作用可以归纳为以下几点:1.利用平均数对比不同总体的一般水平。
平均数可以用来对同类现象在各单位、各部门、各地区之间进行比较,以说明生产水平的高低或经济效果的好坏。
例如,要比较不同的生产企业生产水平的好坏,仅对比企业的产品总产量是不足以说明问题的,因为产品总产量受到企业规模大小的影响。
要比较,需要计算各企业生产人员的平均产品产量,即劳动生产率,并分析不同的生产条件,才能做出正确的判断。
统计学导论曾五⼀第三章数据分布特征的描述第三章数据分布特征的描述第⼀节统计变量集中趋势的测定⼀测定集中趋势的指标及其作⽤集中趋势(Central tendency)较⼤和较⼩的观测值出现的频率⽐较低,⼤多数观测值密集分布在中⼼附近,使得全部数据呈现出向中⼼聚集或靠拢的态势。
测度集中趋势的指标有两⼤类:数值平均数——是根据全部数据计算得到的代表值,主要有算术平均数、调和平均数及⼏何平均数;位置代表值——根据数据所处位置直接观察或根据与特定位置有关的部分数据来确定的代表值,主要有众数和中位数。
1.反映变量分布的集中趋势和⼀般⽔平。
如⽤平均⼯资了解职⼯⼯资分布的中⼼,反映职⼯⼯资的⼀般⽔平。
2.可⽤来⽐较同⼀现象在不同空间或不同阶段的发展⽔平。
不受总体规模⼤⼩的影响;在⼀定程度上使偶然因素的影响相互抵消。
3.可⽤来分析现象之间的依存关系。
如研究劳动者的⽂化程度与收⼊的关系。
4.平均指标也是统计推断中的⼀个重要统计量,是进⾏统计推断的基础。
⼆数值平均数(⼀)算术平均数(均值)⼀组数据的总和除以这组数据的项数所得的结果;最常⽤的数值平均数。
1.简单算术平均数把每项数据直接加总后除以它们的项数。
通常⽤于对未分组的数据计算算术平均数。
计算公式:2.加权算术平均数加权算术平均数的计算公式:加权—为了体现各变量值轻重不同的影响作⽤,对各个变量值赋予不尽相同的权数(fi )。
权数(fi ,也称权重)权数——指在计算总体平均数或综合⽔平的过程中对各个数据起着权衡轻重作⽤的变量。
可以是绝对数形式,也可以是⽐重形式(如频率)来表⽰。
事实上⽐重权数更能够直接表明权数的权衡轻重作⽤的实质。
当权数完全相等(f1 =f2 =…= fn)时,加权算术平均数就成了简单算术平均数。
3.由组距数列计算算术平均数各组变量值⽤组中值来代表。
假定条件是各组内数据呈均匀分布或对称分布。
计算结果是近似值。
4.对相对数求算术平均数由于各个相对数的对⽐基础不同,采⽤简单算术平均通常不合理,需要加权。
众数:⼀组数据中出现次数最多的变量值;它是⼀个位置代表值,特点是不受数据中极端值的影响。
众数不仅适⽤于品质数据,也适⽤于数值型数据。
中位数:是⼀组数据按⼀定顺序排序后,处于中间位置上的数值。
当数值个数为奇数时,取中间位置的数;当数值个数为偶数时,取中间位置两个数的均值。
它将全部数据等分成两部分,也是⼀个位置代表值,其特点是不受极端值的影响,在研究收⼊分配时很有⽤。
中位数主要⽤于顺序数据,也适⽤于数值型数据,但不适⽤于分类数据。
算术平均数:也称均值,是全部数据的算术平均。
它是集中趋势的最主要测度值。
简单均值:等于所有数值相加之和 / 数值个数;加权均值:(各组组中值*各组频数) / 频数之和。
均值是⼀组数据的重⼼所在,是数据误差相互抵消后的必然结果,反映出事物必然性的数量特征。
其缺点是容易受极端值的影响
⼏何平均数:将⼀组中n个数据连乘后再开n次⽅。
是适⽤于特殊数据的⼀种平均数,主要⽤于计算⽐率或速度的平均。
实践中,主要⽤于计算社会经济现象的平均发展速度。