统计学-数据的图表展示分析

  • 格式:ppt
  • 大小:2.36 MB
  • 文档页数:136

下载文档原格式

  / 136
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图2-10
第五步:在上面的【数据透视表和数据透视向 导——布局】对话框中,依次将“性别”和“买衣物 首选因素”拖至左边的“行”区域,将“家庭所在地” 拖至上边的“列”区域,将“平均月生活费”和“月 平均衣物支出”拖至“数据”区域。如图3-11所示。
图3-11根据需要建立【数据透视表和数据透视图向导——布局】
900
吸香烟(女性) 800
抽雪茄 2021/3/25
300
原因
寿命减少天数Leabharlann Baidu
危险工作,事故 交通事故 饮酒 滥用药物 一般工作,事故 自然放射性 喝咖啡 医疗X——射线
300 200 130
90 74
8 8 6
柱形图
寿命减少天数
1000
900
800
700
600
500
400
300
200
100
0
1 3 5 7 9 11 13
– 主要用于对定类数据和定序数据的审核
2. 计算检查
– 检查调查表中的各项数据在计算结果和计算方法上有 无错误
– 主要用于对定距和定比数据的审核
2021/3/25
数据的审核 (第二手数据Second Hand Data )
1. 适用性审核
– 弄清楚数据的来源、数据的口径以及有关的 背景材料
– 确定这些数据是否符合自己分析研究的需要
2.Calculate the frequency of every category.
计算各类别的频数。
☺ 3.Make a frequency distribution table. ☺ ☺ 编制频数分布表。
☺ ☺ 4. Graphical presentation. 用图形表现出来。
分类 频数
2021/3/25
3.2.1 分类数据的整理与显示
1、基本过程
(1). 列出各类别
(2). 计算各类别的 频数
☺☺☺ ☺☺
(3). 制作频数分布表
(4). 用图形显示数据
2021/3/25
Categorical Data Organization
生成频数分布图
Procedure程序:
1. List all the categories.列出所有分类。
2021/3/25
数据的审核、筛选与排序
1. 数据的审核Data Check
▪ 发现数据中的错误
2. 数据的筛选Data Filter
▪ 找出符合条件的数据
3. 数据排序Data Rank
▪ 发现数据的基本特征 ▪ 升序和降序
2021/3/25
3.1.1 数据的审核 (原始数据Check—Raw Data )
3.1.4 数据透视表
利用数据透视表可以利用Excel提供的数据透 视表工具,对数据重要信息按使用者习惯分析要 求进行汇总和作图,形成一个符合需要的交叉表 (列联表)。
在利用数据透视表时,数据源表中的首行必 须有列标题。
第一步:建立Excel数据清单,如表3-2
2021/3/25
表3-2
2021/3/25
(2)比例(proportion)
(3)百分比(percentage)
(4)比率(ratio)
2、分类数据的图示
(1)条形图(bar chart)用宽度相同的条形高度 或长度表示数据多少的图形。
纵置或横置,纵置时称为柱形图(column chart)
2021/3/25
15
13
11
9
7
5
3
1
-1
果汁
图 3-8
第三步:确定数据源区。本利的数据源区为 $A$1:$F$31,如果在启动想到之前单击了数据 源单元格,Excel会自动选定数据源区域。单击 下一步,探出的对话框如图3-9所示。
图2-9
第四步:在上面的对话框中,选择数据透视表的 输出位置,为方便起见可选择【现有工作表 】,并 利用鼠标确定数据透视表的输出位置,本例为原工 作表的G1单元格,然后选择【布局】,弹出的对话 框如图3-10所示。
2021/3/25
表3-4 不同类型的饮料和顾客性别的频数分布表
也称为列联表或交叉表
2021/3/25
SPSS生成频数分布表
第一步:选择【Analyze】 【Descriptive Statistics-Frequencies】 进入主题对话框
第二步:将“饮料类型”或“顾客性别” 选入【Variable】;选中【Display Frequencies tables】。
2021/3/25
数据的整理与显示
(基本问题)
1. 要弄清所面对的数据类型,因为不同类型的 数据,所采取的处理方式和方法是不同的
2. 对定类数据和定序数据主要是做分类整理 3. 对定距数据和定比数据则主要是做分组整理 4. 适合于低层次数据的整理和显示方法也适合
于高层次的数据;但适合于高层次数据的整 理和显示方法并不适合于低层次的数据
数据的排序
1. 定类数据的排序
▪ 字母型数据,排序有升序降序之分,但习惯上用升序 ▪ 汉字型数据,可按汉字的首位拼音字母排列,也可按
笔画排序,其中也有笔画多少的升序降序之分
2. 定距和定比数据的排序
– 递 序后增可排表序示:为设:一X组(1数)<据X(为2)<X…1,<XX2(,N) …,XN,递增排 – 递减排序可表示为:X(1)>X(2)>…>X(N)
第六步:单击【确定】,自动返回【数据透视表和数据透 视图向导—3步骤之3】对话框。然后单击【完成】,即可输出 数据透视表。结果如图3-12所示。
图3-12根据需要建立的数据透视表
3.2 品质数据的整理与显示
3.2.1 生成频数分布图 3.2.2 定序数据的图示
2021/3/25
分类数据的整理与显示
500
1600 1300 900 800
0
2021/3/25
300 300 200
0
未结婚惯(用左吸手香烟未(结婚30(%超20重%超吸重香烟抽(雪茄危险工交作通事饮故酒 滥用药一物般工自作然放喝射咖啡医疗—X
原因
3.1 数据的预处理
Data Preparation
3.1.1. 数据的审核与筛选 3.1.2 数据的排序 3.1.3 数据透视表
2021/3/25
原因
原因 未结婚(男 性) 惯用左手 吸 香烟(男性) 未结 婚(女性) 30%超 重
寿命减少的天数 3 500 3 285 2 250 1 600 1 300
帕累托图
Percent
寿命减少天数
4000
3500 3000
3500 3285
2500 2000
2250
1500 1000
单击【确定】后出现的结果如图3-6所示。
图3-5
图3-6
3.1.3 数据的排序
1. 按一定顺序将数据排列,以发现一些明显 的特征或趋势,找到解决问题的线索
2. 排序有助于对数据检查纠错,以及为重新 归类或分组等提供依据
3. 在某些场合,排序本身就是分析的目的之 一
4. 排序可借助于计算机完成
2021/3/25
30 25 20 15 10
5 02021/3/25
矿泉水 男
绿茶
其他
碳酸饮料
图3-13

【例 】
800 700 600 500 400 300 200 100
0
2021/3/25
468 256
联想
397
285
328 247
IBM 康柏
688 563
戴尔
一季度 二季度
Value
SPSS输出效果
800
A B C D
2021/3/25
E
比例
百分比 比率
定类数据的整理
(可计算的指标)
1. 频 数(frequency):落在各类别中的 数据个数
2. 比 例:某一类别数据占全部数据的比值 3. 百分比:将对比的基数作为100而计算的
比值 4. 比 率:不同类别数值的比值
2021/3/25
表3-3 顾客性别及购买的饮料类型
第三步:点击【Statistics】或【Charts】 并选择相应的选项。点击【OK】
2021/3/25
表3-5 不同类型饮料的频数分布
表3-6 不同性别顾客的频数分布
2021/3/25
SPSS生成列联表
第一步:选择【Analyze】 【Descriptive Statistics-Crosstabs】进 入主题对话框
图3-14
2021/3/25
10 9 8 7 6 5 4 5 3 2 1 0 果汁
4 矿泉水
4 绿茶
9 男 女
6
其他
碳酸饮料
图3-14
2021/3/25
(3)饼图:使用圆形或院内扇形的角度来表示数值大小 的图形,主要用于表示一个样本(或总体 )个组成部分 的数据占全部数据的比例 。
碳酸饮料, 15, 30.00%
其他, 8, 16.00%
果汁, 6, 12.00% 矿泉水, 10, 20.00%
绿茶, 11, 22.00%
图3-16
2021/3/25
定类数据整理—频数分布表 (实例)
【 例 3.4】 为 研究 广 告市 场 的状况,一家广告公司在某 城 市 随 机 抽 取 200 人 就 广 告 问题做了邮寄问卷调查,其 中的一个问题是“您比较关 心下列哪一类广告?”
1.商品广告;2.服务广 告;3.金融广告;4.房地 产广告;5.招生招聘广告 ;6.其他广告。
2021/3/25
图3-3
图3-4
第三步:如果要选出四门课成绩都大于70分的学生, 由于设定的条件比较多,需要使用【高级筛选】命令, 使用高级筛选命令时,必须建立条件区域。这时需要 在数据清单上方至少留出三行作为条件区域。然后在 【列表区域 】选出其中要筛选的数据清单,在【条件区 域】中选择匹配的条件。比如要筛选出四门课程成绩 均大于70分的学生,如图3-5所示。
第二步:将“饮料类型”选入 【Rows】;“顾客性别”选入 【Columns】(行列可互换)。
第三步:点击【Cells】,选择相关内容, 或选其他相关选项。
2021/3/25
表3-7饮料类型和顾客性别的交叉列联表 表3-8饮料类型和顾客性别的交叉列联表及其分析
2021/3/25
(1)频 数(frequency)
第二步:选中数据清单中的任意单元格,并选择【数据】 菜单中的【数据透视表和数据透视图】,弹出对话框如图3-7 所示。然后根据需要选择“数据源类型”和“报表类型”。这里我 们选用【Microsoft Office Excel数据列表或数据库】和【数据 透视表】 ,单击下一步,探出对框如图3-8所示 图 3-7
700
600
500
400
300
200
100
2021/3/25
联想
IBM
电脑品牌
康柏
戴尔
一季度 二季度
(2)帕累托图(Pareto chart):按各类 数据频数多少排序后绘制的柱形图。
频数
16 14 12 10
8
15
6 4 2
11
9
9
6
0
可口可乐 旭日升冰茶 百事可乐 露露 汇源果汁
2021/3/25
2. 时效性审核
– 应尽可能使用最新的统计数据
3. 确认是否必要做进一步的加工整理
2021/3/25
3.1.2 数据的筛选
1. 对审核过程中发现的错误应尽可能予以纠正 2. 当发现数据中的错误不能予以纠正,或者有
些数据不符合调查的要求而又无法弥补时, 需要对数据进行筛选 3. 数据筛选的内容包括:
第三章 数据的图表展示
3.1 数据的预处理 3.2 用图表展示定型数据 3.3 用图表展示定量数据 3.4 合理使用图表
2021/3/25
不同原因引起的寿命损失
原因
寿命减少天 数
未结婚(男性) 3 500
惯用左手
3 285
吸香烟(男性) 2 250
未结婚(女性) 1 600
30%超重
1 300
20%超重
审核的内容 1. 完整性审核
– 检查应调查的单位或个体是否有遗漏 – 所有的调查项目或指标是否填写齐全
2. 准确性审核
– 检查数据是否真实反映客观实际情况,内容是否 符合实际
– 检查数据是否有错误,计算是否正确等
2021/3/25
数据的审核
(原始数据)
审核数据准确性的方法
1. 逻辑检查
– 从定性角度,审核数据是否符合逻辑,内容是否合理, 各项目或数字之间有无相互矛盾的现象
▪ 将某些不符合要求的数据或有明显错误的数
据予以剔除
▪ 将符合某种特定条件的数据筛选出来,而不
符合特定条件的数据予以剔出
2021/3/25
【例3.1 】学生四门课程的成绩数据筛选
表3-1 8名学生考试成绩
2021/3/25
第一步:选择【工具 】菜单,并选择【筛选 】,如果要筛 选出给定条件的数据,可使用【自动筛选 】命令,如图3-1所示:
这时会在第一行出现下拉键头,用鼠标点击箭头会出现如图3-2 所示的结果
第二步:在下拉键头方框内选择要筛选出的数据。比如, 要筛选出统计成绩为75分的学生。选择75,得到结果如图2-3 所示。要筛选出英语成绩最高的前四个学生,可选择【前4 个】,并在对话框中输入数据4,结果如图3-4所示。单击确定 后即可得到相应的结果。

相关主题