SPSS入门讲义
- 格式:ppt
- 大小:7.03 MB
- 文档页数:10
SPSS基础目录第一章SPSS简介1.1 SPSS概述1.2 SPSS窗口1、数据编辑窗口(data editor)2、输出窗口(Viewer)3.程序编辑窗口1.3SPSS系统参数的设置1.3.1 Options选择对话框1.3.2通用参数设置1.3.3结果输出窗口参数设置1.3.4 Currency窗口参数设置第二章数据文件的编辑与管理2.1 建立与保存数据文件2.1.1定义新变量1变量名(Name):2.变量类型(Type)3变量长度(Width):4变量小数点占位(Decimal):5变量标签(Lable):6变量值标签(Values):7缺失值的定义方式(Missing):8变量的显示宽度(Columns):9变量显示的对齐方式(Align)10变量的度量方式(Measure):2.1.2数据的输入2.1.3数据的保存2.2读如其他格式的数据文件例2.2.1读入EXCEL数据文件student.xls,并保存为同名的SPSS数据集student.sav2.3 File菜单中的其他条目2.4数据文件的编辑2.4.1单元值的查找2.4.2增加或删除一个观测2.4.3分析数据的排序2.4.4分析数据集的转置2.4.5选取数据的观测子集2.4.6分析数据归类分组汇总2.4.7缺失值的替代2.5数据变量的操作2.5.1增加或删除一个变量2.5.2从原有变量构造新变量2.5.3数据排秩2.5.4产生计数变量2.5.5数据重新编码2.5.6产生自动分组变量2.5.7变量集的定义和使用2.6 数据文件的合并与拆分2.6.1数据文件的纵向合并2.6.2数据文件的横向合并2.6.3数据文件的拆分第一章SPSS简介1.1 SPSS概述Statistical package for Social Science,社会科学统计软件包是一个组合式软件包,它集数据整理、分析过程、结果输出等功能于一身,是世界上著名的统计分析软件之一。
SPSS 讲义Chapter1.统计软件概述Chapter2.数据文件的建立和管理原始数据文件:住房状况调查.sav(默认打开文档)分布数据文件:教师职称年龄分布.sav数据定义:Name[变量名],type[变量类型],width[变量宽度],decimal[小数位宽度] label[标签],values[值标签],missing[缺失值],columns[显示列宽]align[对齐方式],measurement[测度方式]Type:要求定义变量的类型,SPSS变量类型包括八大类:▪Numeric(标准数值型):总长度为8,小数是2位▪Comma:从右向左每3位用“,”分开,小数点用“•”▪Dot:从右向左每3位用“•”分开,小数点用“,”▪Science notation:7.89E+10,6.45E-8▪Date日期型变量▪Dollar(带美元的变量):在Comma变量之前增加“$”▪Custom currency(自定义型变量):选择该项目后,机器自动提示选择方法▪String字符型变量:一般情况下没有长度限制Value:主要针对名义变量和有序变量值的进一步说明。
▪nominal[名义变量],即类别变量;▪ordinal [有序变量],即定序变量;▪Scale[尺度变量],即定距变量数据读取:Open>Data Open Database>New Query Read Text Data 住房状况调查.xls、住房状况调查.mdb住房状况调查.txt、无分割固定宽度.txt合并文件:Merge Files>Add Cases[添加个案]/Add Variables[添加变量] 职工数据.sav + 追加职工.sav / 职工奖金.sav Chapter3.数据的预处理数据排序:Data>Sort CasesSort by [Variable 1, Variable 2…]Sort Order:升序Ascending/降序Descending变量计算:Transform>Compute数据选取:Data>Select CasesIf condition is satisfied[按指定条件]Random sample of cases[随机选取]Based on time or case range[区段选取](一般是用于时间序列)Use filter variable[筛选变量](筛选缺失变量值个案)Unselected Cases Are:Filtered[已筛选]/Deleted[删除]计数:Transform>Count分组汇总:Transform>Data>Aggregate数据分组:Transform>Recode>Into Different Variables数据转置:Data>Transpose加权个案:Data>Weight Cases-----蔬菜销售.sav数据拆分:Data>Split File----职工数据.sav定义变量集:Utilities>Define SetsChapter4.基本统计分析频数分析:Analyze>descriptive statistics>frequencies----住房状况调查.sav:从业状况/房屋产权统计量[Statistics](一般不适合于未分组汇总的定距数据)Percentile Values[百分位数]Quartiles[四分位数]Cut points[割点] xx equal groups[相等组]Percenti(s) [百分位]Values are group midpoints[值为组的中点]Central Tendency[集中趋势]Mean[均值]、Median[中位数]、Mode[众数]、Sum[总和]Dispersion[离散程度]Std.deviation[标准差]、Variance[方差]、Minimum[最小值]、Maximum[最大值]Range[全距]、S E .mean[均值标准误]Distribution[分布]Skewness[偏度]、Kurtosis[峰度]格式[Format]Order by[排序方式]Ascending values[输出结果按变量值的升序排列]descending values[输出结果按变量值的降序排列]Ascending counts:[输出结果按变量值出现的频次的升序排列]Ascending counts[输出结果按变量值出现的频次的降序排列]Multiple VariablesCompare variables[把所有选中的变量的计算结果放在同一表格中显示] Organize output by variables[把所有选中的变量的计算结果单独输出显示] Suppress tables with more than n categories[把组数限制在n个以内的表格输出,否则,取消输出]图表[Chart]Chart Type[图表类型]None[无]、Bar charts[条形图]、Pie charts[饼图]、Histogram[直方图]With normal curve[带正态曲线]Chart Values[图表值]Frequencies[频数]、Percentages[百分比] 描述统计量:Analyze>descriptive statistics> descriptive (多用于定距数据的处理) ----住房状况调查.sav :人均面积交叉频数分析:Analyze>descriptive statistics> Crosstabs (一般不适合于未分组汇总的定距数据) ----住房状况调查.sav/户口状况*未来三年 显示单元[Cell Display] Counts[计数]Observed[观察值]/Expected[期望值]数合计单元格所在列的观测频 数合计单元格所在行的观测频 期望频数其中:--CT --RT f n CT RT n n CT n RT f e e--⨯=⨯⨯= Percentages[百分比]Row[行]/Column[列]/Total[总计] Residuals[残差]Unstandardized[非标准化]Standardized[标准化]eeo f f -f Residuals Std.=Adjusted standardized[调节的标准化] Noninteger Weights[非整数权重]Round cell counts[4舍5入单元格计数] Round case weights[4舍5入个案权重] Truncate cell counts[截短单元格计数] Truncate case weights[截短个案权重] No adjustments[无调节] 统计量[Statistics]Chi-square[卡方]/Correlations[相关性]Chi-Square Tests适用条件:不应有期望频数小于1的单元格,或不应有大量期望频数小于5的单元格(小于30%)Pearson 卡方检验统计量:(见P115-118)期望频数观察频数 列联表列数列联表行数 其中:----=∑∑==e 0r 1i c1j eij 2e ij 0ij 2f f --c --r f )f -(f χ精确检验[Exact Tests]Asymptotic only[仅渐近法]比率分析:(略)多选项分析:(略)Chapter5.参数检验单样本t 检验[One-Sample T Test]Analyze>Compare Means> One-Sample T Test----住房状况调查.sav/人均面积=20----各保险公司人员构成情况.sav/高等教育人员比例=0.8 & 年轻人比例=0.5 Test Value[原假设置---待检验值]Missing Values[缺失变量处理]Exclude cases analysis by analysis[逐个排除个案]Exclude cases listwise[全部排除个案]两个独立样本t 检验[Independent-Samples T Test]Analyze>Compare Means> Independent-Samples T Test----住房状况调查.sav:人均面积(本市户口=外地户口?)----各保险公司人员构成情况.sav:高等教育人员比例(全国性保险公司=外合资企业)两配对样本t 检验[Paired-Samples T Test]Analyze>Compare Means> Independent-Samples T Test----减肥茶数据.sav:喝茶前和喝茶后对比Chapter6.方差分析单因素方差分析[One-Way ANOV A]Analyze>Compare Means> One-Way ANOV A----广告地区与销售额.sav:不同广告形式对销售量的影响多因素方差分析[Univariate]Analyze>General Linear Model>Univariate----广告地区与销售额.sav:不同广告形式和地区对销售量的影响Chapter7.非参数检验单样本非参数检验卡方检验:通常用于多项分类值的总体分布检验Analyze>Nonparametric Tests>Chi-Square...----心脏病猝死.sav:给定分布2.8:1:1:1:1:1:1二项分布检验:通常用于检验总体是否服从二项分布Analyze>Nonparametric Tests>Binomial...----产品合格率.sav:合格率是否为90%K-S检验:通常适用于探索连续性随机变量的分布Analyze>Nonparametric Tests>1-Sample K-S...----儿童身高.sav:检验是否服从某种分布Normal[正态分布]/Uniform[均匀分布]/Po isson[泊松分布] /Exponential[指数分布]游程检验:也称变量随机性检验,含义如名Analyze>Nonparametric Tests>Runs...----电缆数据.savMedian[中位数]/Mode[众数]/Mean[均值]/Custom[自定义]两独立样本非参数检验:Analyze>Nonparametric Tests>2 Independent Samples...----使用寿命.savMann-Whitney U[曼-惠特尼U]/Kolmogorov-Smirnov Z[K-S检验]Wald-Wolfowitz runs[游程检验]/Moses extreme reactions[极端反映检验]多独立样本非参数检验:Analyze>Nonparametric Tests>K Independent Samples...----多城市儿童身高.savKruskaWallis H/Jonckheere-Terpstra[均类似曼-惠特尼U]/Median[中位数检验]两配对样本非参数检验:Analyze>Nonparametric Tests>2 Related Samples...----统计学学习.sav[McNemar]----训练成绩.sav[Wilcoxon/Sign]Wilcoxon/Sign/McNemar/Marginal Homogeneity多配对样本非参数检验:Analyze>Nonparametric Tests>K Related Samples...----促销方式.sav:Friedman[通用于多配对非参数检验]----航空公司.sav:Cochran's Q[通常样本值为二值变量]----评委打分.sav:Kendals W[也称K-协同系数检验,多涉及两因素并检验其中一个的一致性]Chapter8.相关分析散点图[Scatter]:Graphs>ScatterSimple[简单]/Matrix[矩阵]/Overlay[重叠]/3-D[3维]Simple Dot[SPSS 13.0,简单点图]Set Markers by[指定分组变量]Label Cases by[指定标记变量]panel by row/Columns[画布行列布局]单相关系数[Bivariate],也称双变量相关:Analyze> Correlate> Bivariate...----住房状况调查.sav:家庭收入/计划面积Pearson[简单相关系数]/Kendal's ta-b/Spearman结果解释见P275偏相关系数[Partial]:Analyze> Correlate> Partial...----住房状况调查.sav:家庭收入/计划面积[常住人口]Chapter9.回归分析线性回归分析(一元和多元):Analyze> Regression>Linear...见P 303-309----高校科研研究.sav:课时总数[因]/其他[自]|省市名称筛选方法[Method]:Enter[强行进入]/Stepwise[逐步筛选]/Remove[剔除]/Backward[向后筛选]/Forward[向后筛选] 统计量[Statistics]Regression Coefficients[回归系数]Estimates[估计]Confidence intervals[置信区间]Covariance matrix[协方差矩阵]Model fit[模拟拟合]Rsquared change[R方变化]Descriptives[描述性]Part and partial correlations[部分相关和偏相关性]Collinearity diagnostics[共线性诊断]Residuals[残差]Durbi-Watson[杜宾-沃森]Casewise diagnostics[个案诊断]Outliers outside:x standard deviations[外离群:3标准差] All cases[全部个案]图[Plots]DEPENDNT*ZPRED 标准化的预测值:Standardized predicted values*ZRESI 标准化残差:Standardized residuals*DRESI 剔除残值:Deleted residuals*ADJPR 调整后的预测值:Adjusted predicted values*SRESI 学生化残值:Studentized residuals*SDRES 学生化剔除残值:Studentized deleted residuals Standardized Residual Plots[标准化残差图]Histogram[直方图]Normal probability plot[正态概率图]Produce all partial plots[产生所有部分图]保存[Save]Predicted Values[预测值]Unstandardized[未标准化]Standardized[标准化]Adjusted[调整]S.E. of mean predictions[均值预测值的标准差] Residuals[残差]Unstandardized[未标准化]Standardized[标准化]Studentized[学生化]Deleted[剔除]Studentized deleted[学生化剔除]Distances[距离]MahalanobisCook`sLeverage values[杠杆值]Influence Statistics[影响统计量]DfBeta(s)Standardized DfBeta(s)DfFitStandardized DfFitCovariance ratioPrediction Intervals[预测区间]Mean[均值] Individual[单值]Confidence Interva[置信区间]:95%Save to New File[保存为新文件]Coefficient statistics[]Export model information to XML file[将模型信息输出到XML文件] Include the covariance matrix[包括协方差矩阵]选项[Options]Stepping Method Criteria[步进方法标准]Use probability of F[使用F 的概率]Entry[进入]:0.05 Removal[删除]:0.10Use F value[使用F 值]Entry[进入]:3.84 Removal[删除]:2.71Include constant in equation[在等侍中包含常量]Missing Values[缺失值]Exclude cases listwise[按列表排除个案]Exclude cases pairwise[按对排除个案]Replace with mean[使用均值替换]曲线回归分析:Analyze> Regression>Curve Estimation...----年人均消费支出和教育.sav :教育支出/年人均消费支出[年份],在外就餐/TChapter10. 聚类分析层次聚类:Analyze>Classify>Hierarchical Cluster----商厦评分.sav[Q]----小康指数.sav[Q]----裁判打分.sav[R]快速聚类:Analyze>Classify>K-Means Cluster----小康指数.sav[Q]Chapter11. 因子分析主成分分析:Analyze>Data Reduction>Factor----各地区年平均收入.sav)x)(ln (ln )1y 1(ln )/1/(1y )Logistic ()x)(ln x (x )(ln y)(ln x y )Power ()x /1x (x y /x y )Inverse (x)(ln y)(ln e y )l Exponentia ()x /1x (x y)(ln e y )S ()x (x x x x y x x x y )Cubic ()x)(ln (x x y ln(x)y )c Logarithmi (xy)(ln e y )Growth ()x(ln )(ln y)(ln y )Compound ()x (x x x y x x y )Quadratic (xy )Linear (10x 101110011101010x 01110/x 1i i 23121033221011101010x 10x 10211210221010111010ββμββμββββββββββββββββββββββββββββββββββββββββββββ+=-⇒+==+=⇒+==+=⇒+=+=⇒==+=⇒==+++=⇒+++==+=⇒+=+=⇒=+=⇒==++=⇒++=+=+++:逻辑函数:幂函数:逆函数:指数曲线:S型曲线:三次曲线:对数曲线:增长曲线:复合曲线:二次曲线:一元线性。