第2章描述性统计分析实例
- 格式:pdf
- 大小:2.87 MB
- 文档页数:37
统计学课后思考题答案统计学课后思考题答案统计学课后思考题答案~~ 来源: 张倩倩Orange的日志在百度文库上下载下来的,奉献给同胞们~统计课后思考题答案第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)第一部分思考题第一章思考题1。
1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1。
2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1。
3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据.它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的.实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1。
7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
73 单击【确定】按钮,得到客户表输出结果,如图3-26所示。
图3-26 客户表输出结果3.6 应用统计图进行描述性统计分析描述性统计分析除了应用数量指标以外,还可以应用条形图、饼图、帕累托图、直方图、箱图、茎叶图等统计图形,相应的统计图选项分布在【图形】菜单或者某些分析过程的相应选项下。
本节主要介绍在输出描述性统计量的同时,可以选择的统计图形。
在【分析】→【描述统计】→【频率】子菜单下的“图表”选项,可以选择绘制条形图、饼图和直方图。
在【分析】→【描述统计】→【探索】子菜单下的“绘制”选项,可以绘制箱图、茎叶图、直方图和检验数据正态性的Q-Q 图,并且可以选择是否按照分组来绘制箱图。
除帕累托图位于【分析】菜单的【质量控制】子菜单以外,所有的统计图都可以在SPSS 的【图形】菜单下得到。
一个好的习惯是,在进行统计分析前,总是把数据“画出来”,即做出数据的相关的统计图。
数据的类型不同,适用的统计图形也不同。
在绘制图形之前,一定要先清楚你要绘制的数据属于何种数据类型:是分类数据,还是尺度数据。
3.6.1 定性数据的图形描述——条形图、饼图、帕累托图定性数据的图形描述常用条形图、帕累托图或饼图表示。
(1)条形图给出相应每一类的频率(或者相对频率),长方形的高度(注:水平方向条形图为长方形的长度)与类的频率或者相对频率成比例。
(2)帕累托图是按照从高到低顺序排列条形图的长方形条后形成的一种特殊条形图,最高的长方形在左边。
它是质量控制中常用的一种图形工具,其中,长方形的高度通常表示生产过程中产生问题(如缺陷、事故、故障和失效)的频数,而最左边的长方形对应于最严重的问题区域。
帕累托图形就是在【分析】菜单的【质量控制】子菜单下“排列图”。
(3)饼图把一个整圆(饼)分成几份,每一份代表一个类,每份中心角与类相对频率成比例。
表3-1汇总了自1977年以来全世界45起与能源有关导致多人死亡的事故的原因。
该数据显然是定性数据,它保存在本章的数据文件“DisasterReason.sav ”中。
初中概率与统计精选教案设计第一章:概率的初步概念1.1 随机事件与确定性事件教学目标:使学生理解随机事件和确定性事件的区别,并能用实例进行区分。
教学内容:介绍随机事件和确定性事件的定义,通过实例让学生观察和分析事件的性质。
教学方法:采用讲解和案例分析的方式,引导学生通过观察和思考来理解概念。
1.2 概率的定义与计算教学目标:使学生理解概率的基本概念,学会计算简单事件的概率。
教学内容:介绍概率的定义,讲解如何计算简单事件的概率,包括抛硬币、抽签等。
教学方法:采用讲解和练习的方式,让学生通过实际计算来掌握概率的计算方法。
第二章:统计的基本概念2.1 数据的收集与整理教学目标:使学生了解数据收集和整理的重要性,学会使用图表来表示数据。
教学内容:讲解数据收集和整理的基本方法,介绍条形图、折线图等图表的表示方式。
教学方法:采用讲解和实践活动的方式,让学生通过实际操作来学习数据的收集和整理方法。
2.2 描述统计与分析教学目标:使学生理解描述统计和分析的概念,学会使用统计量来描述数据的特点。
教学内容:介绍描述统计和分析的基本概念,讲解如何使用均值、中位数、众数等统计量来描述数据。
教学方法:采用讲解和练习的方式,让学生通过实际计算和分析来掌握描述统计和分析的方法。
第三章:概率与统计的应用3.1 概率在生活中的应用教学目标:使学生了解概率在生活中的应用,学会用概率来解决实际问题。
教学内容:讲解概率在生活中的应用实例,如天气预报、健康问题等,引导学生用概率思维来分析问题。
教学方法:采用讲解和案例分析的方式,让学生通过实际问题来理解和应用概率。
3.2 统计在数据分析中的应用教学目标:使学生了解统计在数据分析中的应用,学会用统计方法来分析数据。
教学内容:讲解统计在数据分析中的应用实例,如市场调查、科学研究等,引导学生用统计方法来分析数据。
教学方法:采用讲解和案例分析的方式,让学生通过实际问题来理解和应用统计方法。
第四章:概率与统计的实践操作4.1 概率实验教学目标:使学生通过实际操作来加深对概率概念的理解,学会用实验来验证概率的结果。
第2章 描述性统计分析实例 当进行数据分析时,如果研究者得到的数据量很小,那么就可以通过直接观察原始数据来获得所有的信息;如果得到的数据量很大,那么就必须借助各种描述指标来完成对数据的描述工作。
用少量的描述指标来概括大量的原始数据,对数据展开描述的统计分析方法被称为描述性统计分析。
常用的描述性统计分析有频数分析、描述性分析、探索分析、列联表分析。
下面我们将一一介绍这几种方法在实例中的应用。
2.1 实例1——频数分析SPSS的频数分析(Frequencies)是描述性统计分析中比较常用的方法之一。
通过频数分析,我们可以得到详细的频数表以及平均值、最大值、最小值、方差、标准差、极差、平均数标准误、偏度系数和峰度系数等重要的描述统计量,还可以通过分析得到合适的统计图。
所以进行频数分析不仅可以方便地对数据按组进行归类整理,还可以对数据的分布特征形成初步的认识。
下载资源\video\chap02\...下载资源\sample\2\正文\原始数据文件\案例2.1.sav【例2.1】表2.1给出了山东省某学校50名高二学生的身高。
试分析这50名学生的身高分布特征,计算平均值、最大值、最小值、标准差等统计量,并绘制频数表、直方图。
表2.1 山东省某学校50名高二学生的身高编号身高(cm)001 175002 163003 156004 174005 167… …048 158049 164050 16315在用SPSS 进行分析之前,我们要把数据录入到SPSS 中。
本例中有两个变量,分别是编号和身高。
我们把编号定义为字符型变量,把身高定义为数值型变量,然后录入相关数据。
录入完成后,数据如图2.1所示。
图2.1 案例2.1数据先做一下数据保存,然后开始展开分析,步骤如下:进入SPSS 24.0,打开相关数据文件,选择“分析”|“描述统计”|“频率”命令,弹出如图2.2所示的对话框。
选择进行频数分析的变量。
在“频率”对话框的左侧列表框中选择“身高”选项,单击中间的按钮使之进入“变量”列表框。
选择是否输出频数表格。
选中“频率”对话框左下角的“显示频率表”复选框,要求输出频数表格。
选择输出相关描述统计量。
单击“频率”对话框右上角的“统计”按钮,弹出如图2.3所示的对话框,在该对话框中可以设置相关描述统计量。
我们在“百分位值”选项组中选中“四分位数”“分割点”复选框;在“集中趋势”选项组中选中“平均值”“中位数”“众数”“总和”复选框;在“离散”选项组中选中“标准差”“方差”“范围”“最小值”“最大值”“标准误差平均值”复选框;在“分布”选项组中选中“偏度”“峰度”复选框。
设置完毕后,单击“继续”按钮返回“频率”对话框。
设置图表的输出。
单击“频率”对话框中的“图表”按钮,弹出如图2.4所示的对话框,选择有关的图形输出。
在此我们选择直方图,并且带正态曲线。
图2.2 “频率”对话框16图2.3 “频率:统计”对话框图2.4 “频率:图表”对话框设置相关输出的格式。
单击“频率”对话框中的“格式”按钮,弹出如图2.5所示的对话框。
“排序方式”选项组用于设置频数表中各个数据值的排列顺序,其中“按值的升序排序”表示按数据值的大小升序排列;“按计数的升序排序”表示按数据值的频数升序排列。
本例我们选中“按值的升序排序”单选按钮。
“多个变量”选项组是针对按多个变量进行频数输出的情形,因为本例中我们进行频数输出依据的变量只有“身高”,所以这里选择默认设置。
设置完毕后,单击“确定”按钮,等待输出结果。
1.描述性统计表从表2.2中可以读出以下信息:有效样本数为50个,没有缺失值。
学生的平均身高为169.72,标准差为6.993,最大值为181,最小值为154。
2.频数分布表2.3给出了学生身高的频数分布。
该表从左到右分别是有效的样本值、频率、频率占总数的百分比、有效数占总数的百分比、累计百分比。
3.带正态曲线的直方图图2.6是学生身高的直方图,从图中的正太曲线可以看出学生身高近似服从正态分布,而且集中趋势是集中在170。
图2.5 “频率:格式”对话框17表2.2 描述性统计表 表2.3 频数分布表图2.6 带正态曲线的直方图2.2 实例2——描述性分析SPSS 的描述性分析(Descriptives ),其本质就是计算并输出各类相关的描述性统计指标。
其特色是通过描述性分析,可以得到由原始数据转化成的标准化取值,并且可以将标准化值以变量的形式存入数据库,以便进一步分析。
相关描述统计量主要有平均值、最大值、最小值、方差、标准差、极差、平均数标准误、偏度系数、峰度系数等。
18下载资源\video\chap02\... 下载资源\sample\2\正文\原始数据文件\案例2.2.sav【例2.2】表2.4给出了山东省某高校50名大一入学新生的体重。
试对这50名学生的体重进行描述性分析,从而了解这些学生体重的基本特征。
表2.4 山东省某高校50名大一入学新生的体重表 编号 体重(kg )001 59.3002 61.2003 63.4 004 65.2005 70.1……048 63.8049 71.0050 54.9本例中也有两个变量,分别是编号和体重。
我们把编号定义为字符型变量,把体重定义为数值型变量,然后录入相关数据。
录入完成后,数据如图2.7所示。
图2.7 案例2.2先进行数据保存,然后开始展开分析,步骤如下:进入SPSS 24.0,打开相关数据文件,选择“分析”|“描述统计”|“描述”命令,弹出如图2.8所示的对话框。
19选择进行描述分析的变量。
在“描述”对话框的左侧列表框中选择“体重”,单击按钮,使之进入“变量”列表框。
选择是否将标准化值另存为变量。
选中“描述”对话框左下角的“将标准化值另存为变量”复选框,系统会将标准化值另存为变量。
若不选中此项,则系统不会执行。
选择输出相关描述统计量。
单击“描述”对话框右上角的“选项”按钮,弹出如图2.9所示的对话框,在该对话框中可以设置相关描述统计量。
我们选择输出均值,即选中“平均值”复选框。
在“离散”选项组中选中“标准差”“方差”“范围”“最小值”“最大值”“标准误差平均值”复选框;在“分布”选项组中选中“峰度”“偏度”复选框;在“显示顺序”选项组中选中“变量列表”单选按钮。
设置完毕后,单击“继续”按钮返回“描述”对话框。
图2.8 “描述”对话框 图2.9 “描述:选项”对话框单击“确定”按钮,等待输出结果。
如表2.5所示,个案数为50个,范围为27.9,最小值为48.3,最大值为76.2,平均值为62.782,标准错误平均值为0.9506,标准差为6.7214,方差为45.177,偏度系数为0.062,峰度系数是-0.170。
表2.5 描述性分析结果描述性统计分析有一个特点,即它可以将原始数据转换成标准化的取值并以变量的形式存入当前的数据库,如图2.10所示。
图2.10 新变量“Z体重”2.3 实例3——探索分析SPSS的探索分析(Explore)是一种在对资料的性质、分布特点等完全不清楚的时候,对变量进行更加深入研究的描述性统计方法。
探索分析除了具备一般的描述性统计指标外,还增加了数据文字与图形描述,从而有助于对数据进行更深入地研究分析。
此外,相比数据描述性分析,探索分析还可以根据一定的方式分组进行统计。
下载资源\video\chap02\...下载资源\sample\2\正文\原始数据文件\案例2.3.sav【例2.3】表2.6给出了天津、济南两座城市2007年各月份的平均气温。
试据此对天津平均气温和济南平均气温进行探索性统计分析,研究天津平均气温和济南平均气温的基本特征。
表2.6 天津、济南两座城市2007年各月份的平均气温(单位:摄氏度)月份天津济南1 -2.8 0.02 3.3 7.03 5.9 8.84 14.7 16.05 22.0 23.36 25.8 26.27 27.2 26.62021(续表)月份 天津 济南8 26.4 25.49 22.1 21.810 13.2 14.711 5.6 8.312 0.02.3 本例中有3个变量,分别是月份、城市和平均气温。
我们把城市定义为字符型变量,把月份和平均气温定义为数值型变量,并对变量城市进行值标签操作,用“1”表示“天津”,“2”表示“济南”,然后录入相关数据。
录入完成后,数据如图2.11所示。
图2.11 案例2.3数据保存后,开始展开分析,步骤如下:进入SPSS 24.0,打开相关数据文件,选择“分析”|“描述统计”|“探索”命令,弹出如图2.12所示的对话框。
选择进行探索分析的变量。
在“探索”对话框的左侧列表框中,选择“平均气温”并单击按钮使之进入“因变量列表”列表框,选择“城市”并单击按钮使之进入“因子列表”列表框,选择“月份”并单击按钮使之进入“个案标注依据”列表框。
选择是否输出统计描述或统计图。
此处我们选中“两者”单选按钮。
选择输出相关描述统计量。
单击“探索”对话框右上角的“统计”按钮,弹出如图2.13所示的对话框,在该对话框中可以设置相关描述统计量。
我们选中全部复选框。
设置完毕后,单击“继续”按钮返回“探索”对话框。
图2.12 “探索”对话框图2.13 “探索:统计”对话框 “描述”复选框用于输出基本描述统计量,其中系统默认“平均值的置信区间”为95%。
“M-估计量”复选框用于输出4种权重下的最大似然数,其中Huber的方法比较适合接近于正态分布的数据,其余的方法比较适合数据中有较多极端值的情况。
“离群值”复选框用于输出5个最大值和最小值。
“百分位数”复选框用于输出5%、10%、25%、50%、75%、90%以及95%的百分位数。
设置统计图的输出。
单击“探索”对话框中的“图”按钮,弹出如图2.14所示的对话框,可以设置有关的图形输出。
在“箱图”选项组中选中“因子级别并置”单选按钮;在“描述图”选项组中选中“茎叶图”“直方图”复选框,然后选择输出带检验的正态图,并且在“含莱文检验的分布-水平图”选项组中选中“无”单选按钮。
选项设置。
单击“探索”对话框中的“选项”按钮,弹出如图2.15所示的对话框,可以设置对缺失值的处理方法。
选中“成列排除个案”单选按钮,即剔除变量中含缺失值的记录后再进行分析。
单击“继续”按钮返回“探索”对话框。
设置完毕后,单击“确定”按钮,等待输出结果。
图2.14 “探索:图”对话框图2.15 “探索:选项”对话框(1)数据记录统计表从表2.7中可以读出以下信息:天津气温组共有12个样本,济南气温组也有12个样本,没有缺失值记录。
2223表2.7 记录统计表(2)城市分组的各组描述统计量从表2.8中可以看到各组的描述统计量,包括平均值、标准差、最大值、最小值、偏度等。