实验四数据描述和数据报表

  • 格式:doc
  • 大小:402.89 KB
  • 文档页数:17

下载文档原格式

  / 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验四 数据描述和数据报表
一、实验目的
掌握 SPSS 中有关数据描述和数据报表的基本操作
二、实验内容
样本数据采集到后,不能立即用于数据分析,在进行数据分析前,需要首先了解一下样本数 据的基本特征。
1.样本描述(了解数据的基本特征)
样本数据采集到后,常用一些统计量描述原始数据的集中程度和离散状况,对数据的总体特 征进行归纳。 Spss 中的 Analyze 菜单中的“Discriptive Statistics”下面的子菜单进行样本数据的描述。
(1)频数分析过程
使用 student.sav 做例子 通过菜单项“Analyze”|“Discriptive Statistics”|“Frequencies…”,打开如图 1 所示对话框 该过程通过数据频数分析来达到整理数据的目的,利用该过程,得到一系列描述数据分布状 况的统计量
该过程可以做单 变量的频数分布 表,显示数据文件 中由用户指定变 量不同值发生的 频数,还可以用来 获得某些描述统 计量和描述数值 范围的统计量
的中点,选择此项,计算百分位数统计和数据的中位数。 Dispersion 方框:选择方框内的选项,计算并显示描述数据离散趋势的统计量 Std.deviation:标准差 Variance:方差 Range:极差 Minimum:样本数据的最小值 Maximum:样本数据的最大值 S.E.mean:均值的标准误差 Distribution 方框:设置描述数据分布的统计量 Skewness:显示样本数据的偏度和偏度的标准误差
将各变量的统计量显示在 一起还是分开
图4
(2)数据描述过程
该过程可以计算单变量的描述统计量,如可以计算商店顾客的平均收入,可以查看围绕这个 平均值变换的范围有多大或计算高于或低于平均值的某个范围内有多少观测值。 该过程主要计算描述集中趋势和离散趋势的各种统计量,并可对变量进行标准化处理 使用 student.sav 通过菜单项“Analyze”|“Discriptive Statistics”|“Descriptives…”,打开如图 5 所示的对话 框。
Kurtosis:显示样本数据的峰度和峰度的标准误差 ④Charts 按钮:单击此按钮,打开“Frequencies:Charts”对话框,如图 3,
统计图选项。注意:变 量类型,如果变量类型 为 string,统计图也许 无法显示
图3 该对话框内各选项的意义如下: None:默认,选择此项,不生成和显示图形 Bar chart(s):生成和显示条形图 Pie chart(s):生成和显示饼图 Histogram(s):生成和显示直方图 With normal curve:选择 Histogram(s)后,此复选框变为可用。选择此项,在生成和输出
2.数据列表与报表输出
采集到的数据往往都是随机的、杂乱无章的,无法一下从中看出什么规律来,对原始数据进 行列表整理,可以使数据更易于阅读、检查。 (1)OLAP Cubes(在线分析处理)过程。用于按给定的范围对一个或多个变量做出描述, 可以得到一些常用的描述统计量,其特点是可以分层变化不同水平的组合进行变量的描述。 (2)Case Summaries(个案简明统计报表)过程。对记录进行汇总,与 OLAP Cubes 过程相 比,它的功能要强大的多,不仅可以计算描述统计量,还可以分组进行汇总,并能够给出详 细的记录列表。 (3)Report Summaries in Rows/Columns(行列形式报表)过程。这两个过程的功能相似,不 过是分别按行和列输出结果。和 Case Summaries 过程相比,这两个功能显然又进了一步, 它们均可以对输出表格进行精细定义,以满足客户的各种苛刻要求。
据进行标准化,然后将标准化后的数据保存到一个变量中,变量名为原变量的变量名前面添
加字母“z”。新生成的变量和数据保存到当前数据文件中并显示在数据编辑器的最后一列。
Options 按钮:单击该按钮,打开“Descriptives:Options”对话框,如图 6 所示
输出显示顺序
图6 其中 Display Order 方框:该方框内的选项设置描述表格中数据的显示顺序。别的选项跟前 面的图 2 中的各项意义相同
只把能做数据描述 的变量显示出来(此 处 为 scale 类 型 变 量)
ቤተ መጻሕፍቲ ባይዱ
对此列表框中所有 变量的数据的分布 特征进行描述
图5 Variable(s)列表框:对此列表框中所有变量的数据的分布特征进行描述
统计量的选择
Save standardized values as variables:选择该项,对“Variable(s)”列表框中的当前变量的数
计算并显示分位数
描述集中趋势的 统计量
描述数据离散趋势 的统计
描述数据分布的统计 量(描述对称程度)
图2 该对话框中各选项的意义如下:
Percentile Values 方框:选择方框内的选项,计算并显示分位数 Quariles:计算并显示四分位数 Cut points:在后面的窗口输入数值,假设为 p(p 为 2 至 100 之间的整数),则计
算并显示 p 分位数 Percentile(s):在后面的窗口中输入数值(0 到 100),可以有选择的显示百分位数。 Central Tendency 方框:选择该方框内的选项,计算并显示描述中心趋势的统计量 Mean:计算并显示样本数据的均值 Median:计算并显示样本数据的中值 Mode:计算并显示众数 Sum:计算并显示数据的累加和 Values are group midpoints 复选框:假设数据已经分组,而且数据取值为初始分组
选中则显示频数分析表
对该列表框中的变量 进行那个频数分析
统计图
对图 1 做简单的解释
图1
对文件中的 scale 度量 类型的变量进行统计 分析(注意:一定是 scale 类型的才可以)
设置频数分析表 的输出格式
①Variable(s):对此列表框中的变量进行频数分析 ②Display frequency tables:若选中,将在输出窗口中显示频数分析表 ③Statistics…按钮:单击该按钮,打开“Frequencies:Statistics”对话框,如图 2,
直方图时添加正态曲线。 ⑤Chart Values 方框:在“Chart Type”方框内选择“Bar charts”单选钮和“Pie charts”单 选钮后,该方框中的选项变为可用。通过此项的选择,确定生成图形时条形(相对于条形图) 的长度或扇区(对于饼图)面积的度量。 Frequencies:为默认选项,用分类变量不同取值对应的个案数做为度量 Percentage:用分类变量不同取值对应个案数占总个案数的百分数做为度量。 ⑥Format…按钮:单击该按钮,打开“Frequencies:Format”对话框,如图 4 所示。利用该对 话框,设置频数分析表的输出格式。