spss第三章频数分析&描述性统计
- 格式:ppt
- 大小:866.50 KB
- 文档页数:27
实验三SPSS统计分析与统计图表的绘制一、实验目的要求学生能够进行基本的统计分析;能够对频数分析、描述分析和探索分析的结果进行解读;完成基本的统计图表的绘制;并能够对统计图表进行编辑美化与结果分析;能够理解多元统计分析的操作(聚类分析和因子分析)。
二、实验内容与步骤2.1 基本的统计分析打开“分析/描述统计”菜单,可以看到以下几种常用的基本描述统计分析方法:1.Frequencies过程(频数分析)频数分析可以考察不同的数据出现的频数与频率,并且可以计算一系列的统计指标,包括百分位值、均值、中位数、众数、合计、偏度、峰度、标准差、方差、全距、最大值、最小值、均值的标准误等。
2.Descriptives过程(描述分析)调用此过程可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,包括:均值、合计、标准差、方差、全距、最大值、最小值、均值的标准误、峰度、偏度等。
3.Explore过程(探索分析)调用此过程可对变量进行更为深入详尽的描述性统计分析,故称之为探索性统计。
它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户思考对数据进行进一步分析的方案。
Descriptives:输出均数、中位数、众数、5%修正均数、标准误、方差、标准差、最小值、最大值、全距、四分位全距、峰度系数、峰度系数的标准误、偏度系数、偏度系数的标准误;Confidence Interval for Mean:平均值的%估计;M-estimators:作中心趋势的粗略最大似然确定,输出四个不同权重的最大似然确定数;Outliers:输出五个最大值与五个最小值;Percentiles:输出第5%、10%、25%、50%、75%、90%、95%位数。
4.Crosstabs过程(列联表分析)调用此过程可进行计数资料和某些等级资料的列联表分析,在分析中,可对二维至n维列联表(RC表)资料进行统计描述和χ2 检验,并计算相应的百分数指标。
第三讲数据的基本统计频数统计•Analyze/ Descriptive Statistics/ Frequencies 注:分清下属按键的各个功能以:EG2-3中学家长问卷3进行演示输出百分位数:输出四分位数,显示25%、50%、75%的百分位数;将数据平均分为所设定的相等等份,可输入2—100 的整数,如键入4则输出第25、50、75百分位数自定义百分位数,可输入0—100 的整数。
输入值后:按Add :输入值后按此键,可反复操作键入多个百分位数;按Remove :删除已键入的数值按Change :重新输入新数离差栏分布参数栏在计算百分位数值和中位数时,假设数据已分组,且用各组的组中值代替各组数据中心趋势栏输出统计量对话框描述性统计•Analyze / Descriptive Statistics / Descriptives •会求:平均数,中位数,众数,均值,标准差,方差,全距,四分位数(Quartiles),十分位数(Percentiles),百分位数(输入具体的点)Options 对话框基本统计量当Variables 框中有多个变量时,此框确定其输出顺序:按Variables 框中的排列顺序输出按各变量的字母顺序输出按均值的升序排列按均值的降序排列分布•描述次数分布的偏态方向和程度的量数。
(与算术平均数、众数、中位数、标准差有关)偏度(skew)峰度和偏度•计算公式0X M SK S-=3()X Md SK S-=•当SK=0时分布呈对称形;•当SK>0时分布为正偏态(右偏);•当SK<0时分布为负偏态(左偏)。
•SK的绝对值越大,偏斜度越大。
•例:某校182名学生高三毕业会考数学分数的中位数为67,算术平均数为72,标准差为12,其偏态量为?呈什么状态分布?SK=1.25>0,正偏态峰态量(kurtosis)描述次数分布的高低宽窄特征的量数。
•高狭峰:K较大,分数分布高窄,集中在平均数两侧。
描述性统计分析(Descriptive Statistics)统计分析往往是从了解数据的基本特征开始的。
描述数据分布特征的统计量可分为两类:一类表示数量的中心位置,另一类表示数量的变异程度(或称离散程度)。
两者相互补充,共同反映数据的全貌。
这些内容可以通过SPSS中的“Descriptive Statistics”菜单中的过程来完成。
1 频数分析 (Descriptive Statistics - Frequencies)频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。
下面我们通过例子来学习单变量频数分析操作。
1) 输入分析数据在数据编辑器窗口打开“data1-2.sav”数据文件。
2)调用分析过程在主菜单栏单击“Analyze”,在出现的下拉菜单里移动鼠标至“Descriptive Statistics”项上,在出现的次菜单里单击“Frequencies”项,打开如图3-4所示的对话框。
图3-4 “Frequencies” 对话框3)设置分析变量从左则的源变量框里选择一个和多个变量进入“Variable(s):”框里。
在这里我们选“三化螟蚁螟 [虫口数]”变量进入“Variable(s):”框。
4)输出频数分布表Display frequency tables,选中显示。
5)设置输出的统计量单击“Statistics”按钮,打开图3-5所示的对话框,该对话框用于选择统计量:图3-5 “Statistics”对话框① 选择百分位显示“Percentiles Values”栏:Quartiles:四分位数,显示25%、50%和75%的百分位数。
Cut points for 10 equal groups:将数据平分为输入的10个等份。
Percentile(s)::用户自定义百分位数,输入值0—100之间。
选中此项后,可以利用“Add”、“Change”和“Remove”按钮设置多个百分位数。
一、统计报告l 在线分析处理报告Analyze→Reports→OLAP Cubesl 个案摘要报告Analyze→Reports→Summarize Casesl 行形式摘要报告Analyze→Reports→Report Summaries in Rowsl 列形式摘要报告Analyze→Reports→Report Summaries in Columns二、描述性统计分析1.频数分析Analyze→Descriptive Statistic→Frequencies(1)频度分布表(2)变量描述统计量的计算(3)显示频度的图形2.基本描述统计量Analyze→Descriptive Statistic→Descriptivesl 集中趋势(Central T endency)的统计量l 离散趋势(Dispersion)的统计量l 分布形态(Distribution)的统计量3.探索性分析Analyze→Descriptive Statistic→Explorel 茎叶图l 箱图l 正态分布检验Q-Q概率图l 方差齐性检验的散点-分层图4.交叉列联表分析Analyze→Descriptive Statistic→Crosstabs三、两总体均值比较l 单样本T检验Analyze→Compare Means→One-Sample T T estl 独立样本T检验Analyze→Compare Means→Independen t-Samples T T est l 配对样本T检验Analyze→Compare Means→Paired-Samples T T est四、方差分析l 单因素方差分析Analyze→Compare Means→One-way ANOV Al 多因素方差分析Analyze→General Linear Model→Univariatel 协方差分析Analyze→General Linear Model→Univariateu 假设检验的步骤1.提出原假设和备择假设对每个假设检验问题,一般可同时提出两个相反的假设:●原假设原假设又称零假设,是正待检验的假设,记为H0●备择假设备择假设是拒绝原假设后可供选择的假设,记为H1 。
spss的数据分析报告范文二、数据分析1、频数分析。
基本的统计分析往往从频数分析开始。
通过频数分析能够了解变量的取值状况,对把握数据的分布特征非常有用。
此次分析利用了某公司474名职工基本状况的统计数据表,在gender(性别)、edcu(受教育水平程度)、不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。
StatiticGenderEducationalLevel(year)NValid474474Miing00首先,对该公司的男女性别分布进行频数分析,结果如下:GenderFrequencyPercentValidPercentCumulativePercentValidFe male21645.645.645.6Male25854.454.4100.0Total474100.0100.0上表,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为45.6%和54.4%,该公司职工男女数量差距不大,男性略多于女性。
其次对原有数据中的受教育程度进行频数分析,结果如下表:EducationalLevel(year)FrequencyPercentValidPercentCumulati vePercentValid85311.211.211.21219040.140.151.31461.31.352.515116 24.524.577.0165912.412.489.517112.32.391.81891.91.993.719275.75. 799.4202.4.499.8211.2.2100.0Total474100.0100.0上表及其直方图说明,被调查的474名职工中,受过12年教育的职工是该组频数最高的,为190人,占总人数的40.1%,其次为15年,共有116人,占中人数的24.5%。
且接受过高于20年的教育的人数只有1人,比例很低。
2、描述统计分析。
SPSS SPSS主要介绍在主要介绍在SPSS SPSS中进行频数分析,交互分中进行频数分析,交互分析,相关分析,均值比较与检验,回归分析,相关分析,均值比较与检验,回归分析,方差分析,等。
析,方差分析,等。
一、频数分布表一、频数分布表在在SPSS SPSS中可以很容易地得出频数分布表,平均数,中可以很容易地得出频数分布表,平均数,标准差等。
标准差等。
频数分布:可以概略地看到资料的分布情况,可做频数分布:可以概略地看到资料的分布情况,可做初步整理之用,从中还可检查数据输入情况。
初步整理之用,从中还可检查数据输入情况。
Analyze Analyze ———— Descriptive Statistics Descriptive Statistics ———— Frequencies Frequencies 可选入多个变量。
可选入多个变量。
General Happiness 467 30.8 31.1 31.1 872 57.5 58.0 89.0 165 10.9 11.0 100.0 1504 99.1 100.0 13 .9 1517 100.0 Very Happy Pretty Happy Not Too Happy Total Valid NA Missing Total Frequency Percent Valid Percent Cumulative Percent Number of Children 419 27.6 27.8 27.8 255 16.8 16.9 44.7 375 24.7 24.9 69.5 215 14.2 14.2 83.8 127 8.4 8.4 92.2 54 3.6 3.6 95.8 24 1.6 1.6 97.3 23 1.5 1.5 98.9 17 1.1 1.1 100.0 1509 99.5 100.0 8 .5 1517 100.0 0 1 2 3 4 5 6 7 Eight or More Total V alid NA Missing Total F requency Percent V alidPercent Cumulative Percent Statistics: Statistics: Dispersion( Dispersion(离差栏)离差栏):: Std.Deviation Std.Deviation标准差标准差Variance Variance 方差方差Range Range全距全距Minimum Maximum Minimum Maximum S.E.mean S.E.mean均数的标准误均数的标准误Central Tendency ( Central Tendency (集中趋势栏)集中趋势栏)Mean Median Mode Sum Mean Median Mode Sum Skewness Skewness偏度(偏度(00,,1.5 1.5,,0.5 0.5,,--0.5 0.5))Kurtosis Kurtosis 峰度(峰度(00,正,负),正,负)例:例:09 09- -01 01 Statistics 1509 1510 8 7 1.90 12.88 .045 .077 2.00 12.00 0 12 1.765 2.984 3.114 8.904 1.034 -.168 .063 .063 1.060 .710 .126 .126 8 20 0 0 8 20 2869 19455 Valid Missing N Mean Std. Error of Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum Number of Children Highest Year of School Completed Number of Children 419 27.6 27.8 27.8 255 16.8 16.9 44.7 375 24.7 24.9 69.5 215 14.2 14.2 83.8 127 8.4 8.4 92.2 54 3.6 3.6 95.8 24 1.6 1.6 97.3 23 1.5 1.5 98.9 17 1.1 1.1 100.0 1509 99.5 100.0 8 .5 1517 100.0 0 1 2 3 4 5 6 7 Eight or More Total Valid NA Missing Total Frequency Percent Valid Percent Cumulative Percent 还可直接作出图形:还可直接作出图形:Charts: Charts: Bar charts: Bar charts:条形图条形图Pie Charts: Pie Charts:圆图、饼图圆图、饼图Histograms: Histograms:直方图。
SPSS数据分析之详细的频数分析操作大家好、今天我们一起学习频数分析,分析数据的特征、分布形态等,为之后复杂的数据分析打下基础。
SPSS统计量大致可以分为三类:集中趋势的统计量、离散型的统计量和总体分布的统计量、根据不同的目的,需要选择不同的统计量。
频数分析主要对数据进行四分位数、百分位数、中位数、均值、标准差、方差、峰度、偏度等统计量进行分析,通过频数分布表、分布图来描述不同变量的统计,使得对原数据进行初步的认识,查看数据最原始的状态。
话不多说,直接上操纵。
原始数据1、导入数据(之前讲过,这边简单操作过程)操作:文件→打开→数据→确认(选择文件)一般而言,都需要处理数据。
如:性别①转换自动重新编码(这种不能指定,哪个表示男,哪个表示女)操作:转换→自动重新编码选择“性别”→转到右边→写入新名称→确定PS:两种方法查看,哪个数字代表男,哪个代表女;输出页面、变量视图→值②重新编码为不同变量的值(重新编码为相同变量的值,一般不用,这个会将原来的变量名称替换)操作:转换→重新编码为不同变量填写变量名称→指定替换值→确定PS:这里的1指的是男,0指的是女2、频数分析操作:分析→描述统计→频率选择变量→统计量→勾选统计量百分位数介绍四分位数:将一列所有数据的25%、50%、75%位置上的数值,观察值分为四个大小相等的组分割点:自定义所有数据分为几份百分位数:自己指定输出所有数据百分之几位置上的数值集中趋势介绍平均值:总和除以个案个数;中位数、众数(多个众数输出最小值的那个众数)、合计离散介绍标准偏差、方差、范围(最大值减去最小值)、最小值、最大值、平均值的标准误差分布介绍偏度:主要用来测量分布的对称性,偏度大于0就是正偏态,偏度小于0就是负偏态;当偏度值超过标准误差的2倍时,认为该分布是不对称的峰度:对中点周围的观察值程度的测量,对于正态分布,峰度统计值为0,负峰度值表示观察值聚集在中点位置的值少,尾部较厚图表操作:直方图→在直方图上显示正态曲线3、结果统计量语文数学英语性别转N有效39 39 39 39缺失0 0 0 0均值81.13 78.41 78.03 .33均值的标准误 1.861 1.938 1.806 .076中值80.00 79.00 76.00 .00众数73a67a71a0标准差11.624 12.102 11.278 .478方差135.115 146.459 127.184 .228偏度-.042 .081 .246 .736偏度的标准误.378 .378 .378 .378峰度-1.367 -1.413 -1.063 -1.541峰度的标准误.741 .741 .741 .741全距37 38 39 1极小值61 61 60 0极大值98 99 99 1百分位数25 72.00 66.00 69.00 .00 50 80.00 79.00 76.00 .00 75 93.00 89.00 89.00 1.00a. 存在多个众数。
在"频率:格式"对话框的底端,有一个"最大类别数"(Suppress tables with more than n categories)文本框。
通过输入数值,确定频数表输出的方位,即输出数据的组数不得大于窗口中输入的数值。
分类数最大参数的默认值是10。
用户在"频率:格式"对话框中进行选择后,单击【继续】(Continue)按钮,即可返回"频率"主对话框。
一般情况下,对"频率:格式"对话框的选项都默认为系统默认值,不作调整。
单击【确定】(OK)按钮,即可在结果输出窗口中得到频数分布表、描述性统计分析输出表格和用户选择的对应的输出图形。
数值范围为0.25~2.96 mg/kg,平均值为0.36 mg/kg,中位值为0.25 mg/kg,只有10%的样品甲醛含量超过0.62 mg/kg,5%的含量超过1.23 mg/kg,1%的含量超过2.07 mg/kg。
要想得到以上图和黄色标准的指标:
(1)
(2)
(3)
Mean 平均值;median中位值;cumulative percent是百分数最初显示的图如下,可以通过修改改成上面的图。
双击上图,出现下面界面
通过调节min和max等调整坐标轴显示,还可以将拉到图里面成为:。