统计学课件 第三张章 数据的整理与显示
- 格式:pdf
- 大小:844.64 KB
- 文档页数:86
1. 2.掌握3.掌握 4.
用Excel
5.
§3.1数据的预处理
3.1.1 数据审核
3.1.2 数据筛选
3.1.3 数据排序
1.
错误2.
符合条件
3.
升序和降序
4.
按需要汇总
(raw data)
完整性准确性
检查数据是否有错误,计算是否正确等
数值型数据,计算检查)
(second hand data)
1.适用性
2.时效性
3.确认
(data filter)
1. 2.
不符合明显错误
剔除符合筛选出来,而不
用Excel 进行数据筛选
8名学生的考试成绩数据(data filter)
(data rank)
1.一定顺序
2.
有助于
3.
排序本身就是分析的目的
4.借助于计算机
(方法)
1.分类数据 字母型习惯上
用升序
汉字型首位拼音字母笔画多少
2.数值型–递增递增
–递减x (2)>…>x (n)
数据透视表
(pivot table )
1.
复杂提取有用 2.重要信息汇总和作图
3. 4.首行
列标题
拖至
区域,将需要汇总的“变
【向导—3步骤之3】对
,即可输出数据透视表
§3.2 分类和顺序数据的整理与显示
3.2.1 分类数据的整理与显示
3.2.2 顺序数据的整理与显示
(基本问题)
1.弄清数据类型
2.分类数据和顺序数据分类整理
3.数值型数据分组整理
4.适合于低层次数据的整理和显示方法也适合
于高层次的数据;但适合于高层次数据的整
(基本过程) B
A
E
D
C
比率
百分比
比例
频数
分类
(可计算的统计量)
1.个数
2.一类别全部数
据
3.
4.不同类别
制作频数分布表
(bar Chart )
1.宽度相同高度或长短
2.单式复式
3.分类数据频数分布
4.
条形图可以横置或纵置
汇源果汁
露露
品牌
(side - 1.不
同时间或不同空间2.差异或变化趋势
688
563
328247
戴尔
电脑品牌
1.
频数多少排序2.分类数据不同品牌饮料的帕累托图
百事可乐
露露
汇源果汁
品牌
(pie Chart)
1.圆形及圆内扇形的角度
2.各组成部分所
占的比例结构性问题
3.绘制圆形图时,总体中各部分所占的百分
比用圆内的各个扇形角度表示,这些扇形的中心角度,是按各部分数据百分比占
不同品牌饮料的构成
旭日升冰茶
22%
分类数据显示图例
(可计算的指标)
频数逐级累加
频率(百分比)的逐级累加
☺
☺☺☺☺☺
—
—
—
100.092562510276168753044.075.090.0100.0132225270300
乙城市
回答类别
100.093.060.034.012.7300279180102387.040.066.087.3100.0211201982623007.033.026.021.312.72199786438非常不满意不满意一般满意
非常满意百分比(%)户数(户)百分比(%)户数(户)向下累积向上累积
百分比(%)户数(户)乙城市家庭对住房状况评价的频数分布
(24
300
132
225
2700
100
200300400
非常不满意
不满意一般满意
非常
满意
累积户数(户)(a)向上累积
非常不满意
不满意一般满意非常满意
(b)向下累积甲城市家庭对住房状况评价的累积频数分布
甲城市家庭对住房状况评价的累积频数分布
(annular chart)
1. 2.
同时绘制多个总体
3. 4.环形图主要用于展示分类和顺序数据
满意非常满意
§3.3 数值型数据的整理与显示
3.3.1 数据分组
3.3.2 数值型数据的图示
等距分组等距分组异距分组
异距分组
(要点)
一个变量值离散变量值较少的情况
☺☺☺☺
(要点)
1.一个区间
2.连续变量
3.
变量值较多4.
“不重不漏”5.等距不等距☺~ ☺☺~ ☺☺~ ☺☺~ ☺☺~ ☺
(步骤)
1.确定组数
2.确定组距
上限与下限之差,可根据全部数据的最大
统计频数并整理成频数分布表
(几个概念)
(例题分析)【例】某电脑
公司2005年前
四个月各天的
销售量数据(
单位:台)。
试对数据进行
分组。
(步骤)
1.
用Excel 制作频数分布表
(上下组限重叠)
(上下组限间断)
(使用开口组)
(在表现频数分布上的差异)
1.等距
不受
绝对频数
2.不等距
受
各组绝对频数的多少不能反映频数分布的实际
频数密度组距)反映
Excel
分组数据—。