数据特征的测度
- 格式:ppt
- 大小:105.50 KB
- 文档页数:32
某中学初二(一)班数据分布特征的测度使用excel 方法数据特征的测度众数 中位数 四分位数平均数亠、集中趋势1、众数(mode )— 一组数据中出现次数最多的变 量值.分类数据众数偏态 峰态异众比率 极差 方差 离散系数制作:用frequency 函数求出语文成绩的频数一求 出各个分数段的比例一各个分数段的百分比.原始数据:原始数据一众数・xls2、中位数(median )-排序后处于中间位置上的值解:这里的变量为“成绩 分数段”,这是个分类变 量,不同的分数段就是变 量值。
所调查的初二一班 60人 中,60-69这个分数段的人 数最多,为23人,占全班 人数的38.33%,因此众数 为“ 60-69这一分数段”。
即:M=60-69这一分数段制作:对语文成绩进行降序排列一根据计算公式求得中位数/插入median函数求得中位数要求得这60名学生语文成绩的中位数有2种方法:方法一:1、首先对学生的语文成绩进行降序排列。
2、由于学生人数为偶数,所以位置计算公式二错误!位置=错误!—错误!= 30。
5语文成绩中位数=错误!= 68方法二:插入median函数一求得语文成绩中位数。
原始数据-中位数:原始数据一中位数。
XlS3、四分位数(quartile)—排序后处于25%和75%位置上的值.要求得这60名学生语文成绩的中位数有2种方法: 方法一:1、首先对学生的语文成绩进行升序排列。
2、由于学生人数为偶数,所以位置计算公式为:Q 位置二错误!=错误!= 15.25Q位置二错误!=错误!= 45。
75Q= 61+0.75 X( 62-61 ) =61。
75Q= 78+0。
25 X( 78—78) =78方法二:使用函数QUARTILE求出语文成绩的四分位数xls 原始数据一四分位数:原始数据-四分位数。
4、平均数(mean)加权平均数一初二(一)班语文总评成绩总评成绩=错误!原始数据一平均数:原始数据一平均数。
数据特征的测度本章知识点【知识点一】众数、中位数★★★【知识点二】算术平均数、几何平均数★★【知识点三】离散程度的测度**【知识点一】众数、中位数(一)集中趋势的测度【例如】一家连锁超市的10个分店某月的销售额(单位:万元)分别为:61 65 73 78 80 80 80 80 96 97。
这10个分店月销售额的众数为M0 = 80 (万元)【总结】众数既适用于品质数据,也适用于数值型数据。
【例如】某地级市下辖9个县,每个县的面积如下(单位:平方公里),计算该市下辖县面积的中位数:1455 2019 912 1016 1352 1031 2128 1075 2000首先,将上面的数据排序:912 1016 1031 1075 1352 1455 2000 2019 2128中位数位置=(9 + 1)+2 = 5,中位数为1352,即Me = 1352 (平方公里)【总结】中位数主要适用于顺序数据,也适用于数值型数据。
【例题•单选题】(2018年)2016年,某市下辖6个县的棉花种植面积按规模由小到大依次为800亩、900亩、1100亩、1400亩、1500亩、3000亩。
这组数据的中位数为()亩。
A.1100B.1250C.1400D.1450『正确答案』B『答案解析』本题考查中位数的应用。
中位数=(1100+1400)+2 = 1250。
【知识点二】算术平均数、几何平均数(一)算数平均数的特点、适用范围(二)两种算数平均数的比较【例如】某售货小组有5名营业员,元旦一天的销售额分别为520元、600元、480 元、750元和500元,求该日每名营业员的平均销售额。
于_旦+筋+…L=-------------- = ------ 520+600+480 + 750 + 500 、JC = ---------- ---------- =570(>L)【例如】某市商业企业协会根据100个会员样本,整理出一年销售额分布资料:销售额分布资料计算年平均销售额。
初级经济师考试《经济基础》:数据特征经济师考试-初级经济基础数据特征的测度
对统计数据特征的测度,主要从三个方面进行:
(1)分布的集中趋势;
(2)分布的离散程度;
(3)分布的偏态和峰度。
集中趋势的测度
集中趋势的测度,主要包括位置平均数和数值平均数。
位置平均数是指按数据的大小顺序或出现频数的多少确定的集中趋势的代表值,主要有众数、中位数等;
数值平均数是指根据全部数据计算出来的平均数,主要有算术平均数、几何平均数等。
众数
一组数据中出现频数最多的那个数值,用M0表示。
用众数反映集中趋势,不仅适用于品质数据,也适用于数值型数据。
众数是一个位置代表值,不受极端值的影响,抗干扰性强。
例题:
1.下面是抽样调查的l0个家庭住房面积(单位:平方米):
55757590909090105120150
这10个家庭住房面积的众数为()。
A90
B75
C55
D150
[715220101]
「正确案」A
2.(2004年)2003年,某市下辖六个县的棉花种植面积按规模由小到大依次为800公顷、900公顷、1100公顷、1400公顷、1500公顷、3000公顷,这六个县棉花种植面积的中位数是()公顷。
A1450
B1250
C1100
D1400
[715220102]
「正确案」B.中位数=(1100+1400)/2=1250.。
第二章数据分布特征的测度对数据分布特征主要从三个方面进行测度和描述:一是分布的集中趋势,反映数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏斜程度和峰度。
本章主要介绍如何使用函数以及“数据分析”工具对数据分布特征进行测度和描述。
第一节函数的介绍本节主要介绍在统计分析中需要用到的一些函数,其中包括我们本章(描述统计)中以及在概率分布、参数估计与假设检验、方差分析、相关与回归等分析中涉及到的函数,读者在后面章节的学习中可以参阅本节的内容。
一、统计计算中经常用到的函数(函数列表)★Excel为用户提供了数学、三角函数、统计函数、数据库函数、财务函数、工程函数、逻辑函数、文本函数、时间和日期函数、信息函数、查找和引用函数等10类300多种,可以满足多方面的需要。
其中,统计函数最多达78种;此外还有14种数据库函数,以及在统计中经常使用的数学函数20种,合计112种。
下面将这些函数名称及功能列表显示。
★本小节摘自: 安维默主编,《统计电算化》第34~37页,中国统计出版社,2000表2-1 可用于统计分析的函数(续2)1、函数的语法工作表函数包括两个部分:函数名和紧跟的一个或多个参数。
函数名,例如SUM和A VERAGE,表明函数要执行的操作;参数则指定函数所使用的值或单元格。
例如,在公式“=SUM(C3:C5)”中,SUM为函数名,C3:C5为参数。
此函数计算单元格C3、C4和C5中值的总和。
函数的参数可以为数值类型。
例如,公式“=SUM(327,209,176)”中的SUM 函数将数字327、209和176求和。
不过通常的做法是,先在工作表的单元格中输入使用的数字,然后将这些单元格作为函数的参数使用。
请注意函数参数两端的括号:开括号表示参数的开始,必须紧跟在函数名后。
如果在函数名和括号之间输入了空格或其他字符,那么Excel会显示错误信息“Microsoft Excel 在公式中发现了错误。
数据特征的测度数据特征的测度数据特征的测度统计数据经过整理和显示后,我们对数据分布的类型和特点就有了一个大致的了解,但这种了解只是表面上的,还缺少代表性的数量特征值准确地描述出统计数据的分布。
为进一步掌握数据分布的特征和规律,进行更深入的分析,还需要找到反映数据分布特征的各个代表值。
对统计数据分布的特征,我们可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的偏态和峰度,反映数据分布的形状。
这三个方面分别反映了数据分布特征的不同侧面,这里我们主要讨论集中趋势和离散程度的测度方法。
(一)集中趋势的测度集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。
集中趋势的测度值主要有众数、中位数、均值、几何平均数等几种。
众数是一组数据中出现次数最多的变量值,用M 0表示。
例如,下面是抽样调查的10个家庭住房面积(单位:平方米)的数据:55 75 75 90 90 90 90 105 120 150这10个家庭住房面积的众数为90。
即M 0=90(平方米)众数是一个位置代表值,它的特点是不受数据中极端值的影响。
2. 中位数中位数是一组数据按一定顺序排序后,处于中间位置上的数值,用M e 表示。
显然,中位数将全部数据等分成两部分,每部分包含50%的数据,一部分数据比中位数大,另一部分则比中位数小。
根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,其公式为:式中的n 为数据的个数,最后确定中位数的具体数值。
设一组数据为x 1,x 2,…,x n ,按从小到大排序后为x (1) ,x (2) ,…,x (n ) ,则中位数可表示为:当n 为奇数时⎧x n +1M e =⎧1⎧⎧⎧ x n +x n ⎧当n 为偶数时+1⎧2 ⎧22⎧⎧⎧例如,在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据如下(单位:750 780 850 960 1080 1250 1500 1650 2000中位数位置=(9+1)÷2=5,中位数为1080,即M e =1080(元)。
一组数据的分布特征可以从哪几
个方面进行测度
1、集中趋势的测度(众数、中位数、分位数、均值、几何平均数、切尾均值)。
集中趋势又称“数据的中心位置”、“集中量数”等。
它是一组数据的代表值。
集中趋势的概念就是平均数的概念,它能够对总体的某一特征具有代表性,表明所研究的舆论现象在一定时间、空间条件下的共同性质和一般水平。
2、离散程度测度(极差、内距、方差和标准差、离散系数)。
离散程度是指通过随机地观测变量各个取值之间的差异程度,用来衡量风险大小的指标。
3、偏态与峰度测度(偏态及其测度、峰度及其测度)。
偏态是指非对称分布的偏斜状态。
峰度又称峰态系数。
表征概率密度分布曲线在平均值处峰值高低的特征数。
直观看来,峰度反映了峰部的尖度。
样本的峰度是和正态分布相比较而言统计量,如果峰度大于三,峰的形状比较尖,比正态分布峰要陡峭。
反之亦然。