数据特征的测度
- 格式:ppt
- 大小:941.50 KB
- 文档页数:33
某中学初二(一)班数据分布特征的测度使用excel 方法数据特征的测度众数 中位数 四分位数平均数亠、集中趋势1、众数(mode )— 一组数据中出现次数最多的变 量值.分类数据众数偏态 峰态异众比率 极差 方差 离散系数制作:用frequency 函数求出语文成绩的频数一求 出各个分数段的比例一各个分数段的百分比.原始数据:原始数据一众数・xls2、中位数(median )-排序后处于中间位置上的值解:这里的变量为“成绩 分数段”,这是个分类变 量,不同的分数段就是变 量值。
所调查的初二一班 60人 中,60-69这个分数段的人 数最多,为23人,占全班 人数的38.33%,因此众数 为“ 60-69这一分数段”。
即:M=60-69这一分数段制作:对语文成绩进行降序排列一根据计算公式求得中位数/插入median函数求得中位数要求得这60名学生语文成绩的中位数有2种方法:方法一:1、首先对学生的语文成绩进行降序排列。
2、由于学生人数为偶数,所以位置计算公式二错误!位置=错误!—错误!= 30。
5语文成绩中位数=错误!= 68方法二:插入median函数一求得语文成绩中位数。
原始数据-中位数:原始数据一中位数。
XlS3、四分位数(quartile)—排序后处于25%和75%位置上的值.要求得这60名学生语文成绩的中位数有2种方法: 方法一:1、首先对学生的语文成绩进行升序排列。
2、由于学生人数为偶数,所以位置计算公式为:Q 位置二错误!=错误!= 15.25Q位置二错误!=错误!= 45。
75Q= 61+0.75 X( 62-61 ) =61。
75Q= 78+0。
25 X( 78—78) =78方法二:使用函数QUARTILE求出语文成绩的四分位数xls 原始数据一四分位数:原始数据-四分位数。
4、平均数(mean)加权平均数一初二(一)班语文总评成绩总评成绩=错误!原始数据一平均数:原始数据一平均数。
数据特征的测度1.集中趋势的测度众数:⼀组数据中出现次数最多的变量值;它是⼀个位置代表值,特点是不受数据中极端值的影响中位数:是⼀组数据按⼀定顺序排序后,处于中间位置上的数值。
当数值个数为奇数时,取中间位置的数;当数值个数为偶数时,取中间位置两个数的均值。
它将全部数据等分成两部分,也是⼀个位置代表值,其特点是不受极端值的影响,在研究收⼊分配时很有⽤单选(2004年试题):2003年,某市下辖六个县的棉花种植⾯积按规模由⼩到⼤依次为800公顷、900公顷、1100公顷、1400公顷、1500公顷、3000公顷,这六个县棉花种植⾯积的中位数是()公顷。
A,1450B,1250C,1100D,1400答案:B解析:变量值⼀共有6个,偶数个,中位数为最中间两个数的平均数,即第三和第四个数的平均数,为1/2*(1100+1400)= 1250。
算术平均数:也称均值,是全部数据的算术平均。
它是集中趋势的最主要测度值。
简单均值:等于所有数值相加之和 / 数值个数;加权均值:(各组组中值*各组频数) / 频数之和。
均值是⼀组数据的重⼼所在,是数据误差相互抵消后的必然结果,反映出事物必然性的数量特征。
其缺点是容易受极端值的影响⼏何平均数:将⼀组中n个数据连乘后再开n次⽅。
是适⽤于特殊数据的⼀种平均数,主要⽤于计算⽐率或速度的平均。
实践中,主要⽤于计算社会经济现象的平均发展速度2.离散程度的测度标准差:各变量与其均值离差平⽅和的平均数的平⽅根,它是数测量数据离散程度的最主要⽅法,也是实际中应⽤最⼴泛的离散程度测度值。
在对社会经济现象进⾏分析是主要使⽤标准差。
例:⼀组5个数据, 1、2、3、4、5,求其标准差。
解:先求均值等于(1+2+3+4+5)/ 5 =3;再求离差,分别为:(1-3)=-2,(2-3)=-1,(3-3)=0,(4-3)=1,(5-3)=2。
离差平⽅,分别为:4,1,0,1,4。
离差平⽅和等于4+1+0+1+4=10离差平⽅和的平均数:10/5=2,所以⽅差为2把2开平⽅,即得标准差。
第二十二章数据特征的测度(答案分离版)一、单项选择题1.一组数据中出现频数最多的那个数值称为()。
A.中位数B.极值C.众数D.平均数2.2003年,某市下辖六个县的棉花种植面积按规模由小到大依次为800公顷、900公顷、1100公顷、1400公顷、1500公顷、3000公顷,这六个县棉花种植面积的中位数是()公顷。
A.1450B.1250C.1100D.14003.某连锁超市6个分店的职工人数由小到大排序后为57人、58人、58人、60人、63人、70人,其算术平均数、众数分别为()。
A.59、58B.61、58C.61、59D.61、704.共有100个学生进行分组,150~160cm有10个,组中值为155;160~170cm有70个,组中值为165;170~180cm有20个,组中值为175,加权算术平均数为()。
A.155B.175C.165D.1665.n个观察值连乘积的n次方根称为()。
A.众数B.极值C.算术平均数D.几何平均数6.计算几何平均数要求各观察值之间存在()的关系。
A.等差B.等比C.连加D.连乘积7.数据的离散程度越大,集中趋势的测度值对该组数据的代表性()。
A.越差B.越好C.不变D.反复变化8.最简单的变异指标是()。
A.极差B.标准差C.组距D.离散系数9.离散系数比标准差更适用于比较两组数据的离散程度,这是因为离散系数()。
A.不受极端值的影响B.不受数据差异程度的影响C.不受变量值水平或计量单位的影响D.计量更简单二、多项选择题1.集中趋势的测度,主要包括()。
A.位置平均数B.极差C.方差D.数值平均数E.标准差2.数值平均数包括()。
A.算术平均数B.几何平均数C.方差D.中位数E.众数3.下列反映数据集中趋势的测度指标是()。
A.众数B.算术平均数C.标准差D.极差E.离散系数4.加权算术平均数会受到()的影响。
A.各组数值的大小B.各组分布频数的多少C.极端值D.计量单位E.组数5.几何平均数的主要用途是()。
中级经济师《经济基础知识》第二十四章课后练习【单选题】下列指标中,应采用算术平均方法计算平均数的是()。
A. 企业年销售收入B. 男女性别比C. 国内生产总值环比发展速度D. 人口增长率【答案】A【解析】考核集中趋势的测度。
本题用排除法选择,几何平均数的主要用途:(1)对比率、指数等进行平均(2)计算平均发展速度。
【单选题】集中趋势的测试,主要包括()。
A. 方差和标准差B. 众数和离散系数C. 标准分数D. 中位数和众数【答案】D【解析】集中趋势的测试,主要包括:均值、中位数、众数和均值、中位数和众数的比较及适用范围。
【单选题】()的测度值是对数据一般水平的一个概括性变量,它对一组数据的代表程度,取决于该组数据的()。
A. 集中趋势;离散程度B. 离散程度;集中程度C. 极差;组距D. 方差;算术平均数【答案】A【解析】集中趋势的测度值是对数据一般水平的一个概括性变量,它对一组数据的代表程度,取决于该数据的离散程度。
【单选题】一家连锁酒店8个分店某月的营业额(单位:万元)为:60、60、70、80、80、70、70、65,那么这8个分店月营业额的中位数为()。
A. 60B. 65C. 70D. 80【答案】C【解析】中位数首先要将数据进行排列,从小到大排列的结构时60,60,65,70,70,70,80,80,则中位数第4个数和第5个数的均值,即(70+70)/2=70【单选题】2010年某省8个地市的财政支出(单位:万元)分别为:59000,50002,65602,66450,78000,78000,78000,132100这组数据的中位数是()万元。
A. 78000B. 72225C. 66450D. 75894【答案】B【解析】对数据进行排序后是:50002,59000,65602,66450,78000,78000,78000,132100所以中位数的位置是第4个和第5个数据的平均数。
第四章数据分布特征的测度一、选择题1.一组数据中出现频数最多的变量值称为()。
A.众数B.中位数C.四分位数D.均值2.下列关于众数的叙述,不正确的是()。
A.一组数据可能存在多个众数B.众数主要适用于分类数据C.一组数据的众数是唯一的D.众数不受极端值的影响3.一组数据排序后处于中间位置上的变量值称为()。
A.众数B.中位数C.四分位数D.均值4.一组数据排序后处于25%和75%位置上的值称为()。
A.众数 B.中位数C.四分位数D.均值5.非众数组的频数占总额数的比率称为()。
A.异众比率B.离散系数C.平均差D.标准差6.如果一个数据的标准分数是-2,表明该数据()。
A.比平均数高出2个标准差B.比平均数低2个标准差C.等于2倍的平均数D.等于2倍的标准差7.比较两组数据的离散程度最适合的统计量是()。
A.极差B.平均差C.标准差D.离散系数8.偏度系数测度了数据分布的非对称性程度。
如果一组数据的分布是对称的,则偏度系数()。
A.等于0 B.等于1 C.大于0 D.大于1 9.某专家小组成员的年龄分别为29,45,35,43,45,58,他们的年龄中位数为()。
A.45 B.40 C.44 D.3910.某居民小区准备建一个娱乐活动场所,为此,随机抽取了80户居民进行调查,其中表示赞成的有59户,表示中立的有12户,表示反对的有9户。
该组数据的中位数是()。
A.赞成B.59 C.中立D.1211.对于右偏分布,均值、中位数和众数之间的关系是()。
A .均值>中位数>众数B .中位数>均值>众数C .众数>中位数>均值D .众数>均值>中位数12.某班学生的大学英语平均成绩是70分,标准差是10分。
如果已知该班学生的考试分数为对称分布,可以判断成绩在60分~80分之间的学生大约占( )。
A .95%B .89%C .68%D .99%13.当一组数据中有一项为零时,不能计算( )。
数据特征的测度本章知识点【知识点一】众数、中位数★★★【知识点二】算术平均数、几何平均数★★【知识点三】离散程度的测度**【知识点一】众数、中位数(一)集中趋势的测度【例如】一家连锁超市的10个分店某月的销售额(单位:万元)分别为:61 65 73 78 80 80 80 80 96 97。
这10个分店月销售额的众数为M0 = 80 (万元)【总结】众数既适用于品质数据,也适用于数值型数据。
【例如】某地级市下辖9个县,每个县的面积如下(单位:平方公里),计算该市下辖县面积的中位数:1455 2019 912 1016 1352 1031 2128 1075 2000首先,将上面的数据排序:912 1016 1031 1075 1352 1455 2000 2019 2128中位数位置=(9 + 1)+2 = 5,中位数为1352,即Me = 1352 (平方公里)【总结】中位数主要适用于顺序数据,也适用于数值型数据。
【例题•单选题】(2018年)2016年,某市下辖6个县的棉花种植面积按规模由小到大依次为800亩、900亩、1100亩、1400亩、1500亩、3000亩。
这组数据的中位数为()亩。
A.1100B.1250C.1400D.1450『正确答案』B『答案解析』本题考查中位数的应用。
中位数=(1100+1400)+2 = 1250。
【知识点二】算术平均数、几何平均数(一)算数平均数的特点、适用范围(二)两种算数平均数的比较【例如】某售货小组有5名营业员,元旦一天的销售额分别为520元、600元、480 元、750元和500元,求该日每名营业员的平均销售额。
于_旦+筋+…L=-------------- = ------ 520+600+480 + 750 + 500 、JC = ---------- ---------- =570(>L)【例如】某市商业企业协会根据100个会员样本,整理出一年销售额分布资料:销售额分布资料计算年平均销售额。
第二十一章数据特征的测度一、单项选择题1、以下属于位置平均数的是()。
A、众数B、极差C、几何平均数D、算术平均数2、下列统计量中,适于描述分类数据集中趋势的是()。
A、均值B、中位数C、众数D、标准差3、某产品的生产需经过8道不同的加工工序,根据各道工序的合格率计算该产品的平均合格率,应使用()。
A、算术平均数B、中位数C、众数D、几何平均数最新版经济师权威押题购买唯一联系QQ:1368967816 后续课程获取务必加Q群:469327763 不然无法保证资料的完整性!4、2018年某地区外商投资工业企业利润情况如下:该地区外商投资工业企业平均利润总额为()万元。
A、2500B、3000C、3500D、40005、下列统计指标中,应采用算术平均数进行平均的是()。
A、产品工序合格率B、发展速度C、股票收益率D、石油产量6、数据的离散程度越小,集中趋势的测度值对该组数据的代表性()。
A、越差B、越好C、始终不变D、在一定区间内反复变化7、离散系数比标准差更适用于比较两组数据的离散程度,这是因为离散系数()。
A、不受极端值的影响B、不受数据差异程度的影响C、不受变量值水平或计量单位的影响D、计算更简单8、下列关于极差的表述错误的是()。
A、极差是最简单的变异指标B、极差反映的是变量分布的变异范围或离散幅度C、极差计算简单,含义直观,运用方便D、极差不受极端值的影响9、某售货小组有5名营业员,元旦一天的平均销售额为500元,日销售额的标准差为100元,则日销售额的离散系数为()。
A、20%B、40%C、50%D、80%10、某中学高中一年级8个班的学生人数由小到大排序后为:40人、42人、42人、42人、44人、44人、45人、46人,其众数、中位数分别为()人。
A、42、43B、43、43.5C、43、42D、46、4311、在某城市2014年4月空气质量检测结果中,随机抽取6天的质量指数进行分析。
第四章数据分布特征的测度学习目的和要求:通过本章的学习,掌握数据分布特征的各种描述方法;掌握不同测度方法的特点、应用条件及应用场合;能利用所学的方法对统计数据作各种统计描述。
难点释疑:(一)算术平均数通常用来反映总体分布的集中趋势,调和平均数往往只作为算术平均数的变形来使用,即在已知标志总量而未知总体单位总量的情况下计算调和平均数;而几何平均数较适用于计算平均比率和平均速度。
(二)调和平均数虽然是根据标志值的倒数计算的,但其结果不等于算术平均数的倒数。
在计算和应用平均指标时,除了考虑数理方面的要求外,更重要的是要考虑其现实的经济意义。
(三)平均数的性质是简捷计算法的基础,也是计算标志变异指标的基础。
掌握中位数和众数与算术平均数的关系的目的是能够根据其中的两个平均数大体计算出第三个平均数,并判断总体的分布状态。
(四)全距、四分位差、平均差、标准差在反映标志变异程度方面各有优缺点。
全距是描述数据离散程度的最简单测度值,它计算简单,易于理解,但不能全面反映总体各单位标志值的差异程度。
标准差与平均差的意义基本相同,但在数学性质上比平均差要优越,所以,在反映标志变动度大小时,一般都采用标准差。
标准差是实际中应用最广泛的离散程度测度值。
(五)标准差系数的应用。
为了对比和分析不同平均水平总体的标志差异程度,就需要使用标准差系数。
它是标志变异的相对指标。
它既消除了变量数列变量值差异程度的影响,也消除了变量数列水平高低的影响。
练习题:(一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内)1.平均指标反映了()。
①总体变量值分布的集中趋势②总体分布的离散特征③总体单位的集中趋势④总体变动趋势2.加权算术平均数的大小( )。
①受各组标志值的影响最大 ②受各组次数的影响最大③受各组权数系数的影响最大 ④受各组标志值和各组次数的共同影响3.在变量数列中,如果变量值较小的一组权数较大,则计算出来的算术平均数( )。
数据特征的测度数据特征的测度数据特征的测度统计数据经过整理和显示后,我们对数据分布的类型和特点就有了一个大致的了解,但这种了解只是表面上的,还缺少代表性的数量特征值准确地描述出统计数据的分布。
为进一步掌握数据分布的特征和规律,进行更深入的分析,还需要找到反映数据分布特征的各个代表值。
对统计数据分布的特征,我们可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的偏态和峰度,反映数据分布的形状。
这三个方面分别反映了数据分布特征的不同侧面,这里我们主要讨论集中趋势和离散程度的测度方法。
(一)集中趋势的测度集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。
集中趋势的测度值主要有众数、中位数、均值、几何平均数等几种。
众数是一组数据中出现次数最多的变量值,用M 0表示。
例如,下面是抽样调查的10个家庭住房面积(单位:平方米)的数据:55 75 75 90 90 90 90 105 120 150这10个家庭住房面积的众数为90。
即M 0=90(平方米)众数是一个位置代表值,它的特点是不受数据中极端值的影响。
2. 中位数中位数是一组数据按一定顺序排序后,处于中间位置上的数值,用M e 表示。
显然,中位数将全部数据等分成两部分,每部分包含50%的数据,一部分数据比中位数大,另一部分则比中位数小。
根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,其公式为:式中的n 为数据的个数,最后确定中位数的具体数值。
设一组数据为x 1,x 2,…,x n ,按从小到大排序后为x (1) ,x (2) ,…,x (n ) ,则中位数可表示为:当n 为奇数时⎧x n +1M e =⎧1⎧⎧⎧ x n +x n ⎧当n 为偶数时+1⎧2 ⎧22⎧⎧⎧例如,在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据如下(单位:750 780 850 960 1080 1250 1500 1650 2000中位数位置=(9+1)÷2=5,中位数为1080,即M e =1080(元)。
第四章数据分布特征的测度【教学要求】了解绝对数和相对数的概念及作用,掌握绝对数的种类、相对数的种类及应用;掌握集中趋势的测度方法,掌握算术平均数、调和平均数、几何平均数、众数、中位数的计算方法及应用;掌握离散程度的测度方法,理解全距、四分位差、异众比率、平均差的概念及计算方法,掌握标准差、离散系数的计算方法及应用;了解偏态与峰度的测度方法。
【知识点】绝对数、相对数、术平均数、调和平均数、几何平均数、众数、中位数、全距、四分位差、异众比率、平均差、标准差、离散系数【本章重点】相对数的种类及应用;算术平均数、调和平均数、几何平均数、众数、中位数的计算方法及应用;理解全距、四分位差、异众比率、平均差的概念及计算方法,掌握标准差、离散系数的计算方法及应用。
【本章难点】算术平均数、调和平均数、几何平均数、众数、中位数的计算方法及应用;理解全距、四分位差、异众比率、平均差的概念及计算方法,掌握标准差、离散系数的计算方法及应用。
【教学内容】第一节绝对数和相对数统计指标就其具体内容来讲非常多,可谓成千上万,但从其基本形式看,则不外乎总量指标、相对指标和平均指标三种类型,统称统计综合指标。
一、绝对数(一)绝对数的概念和种类1、绝对数的作用主要表现在:(1)绝对数可以反映一个国家、地区、部门或单位的基本情况(2)绝对数是制定政策、编制计划以及进行科学管理的重要依据(3)绝对数是计算相对数和平均数的基础相对数和平均数是由两个有联系的总量指标对比计算出来的统计综合指标,无论是相对指标还是平均指标,都是总量指标的派生指标,没有总量指标就不会有相对指标和平均指标。
例如,职工劳动生产率、职工平均工资、宏观经济增长速度、国民经济发展的重要比例关系、农作物单位面积产量等都是在总量指标的基础上计算出来的。
(二)绝对数的种类1、按反映总体内容不同分为总体单位总量和总体标志总量。
例、某业企业职工人数1,000人,工资总额1980,000元。