当前位置:文档之家› 多元统计学SPSS实验报告一

多元统计学SPSS实验报告一

多元统计学SPSS实验报告一
多元统计学SPSS实验报告一

华东理工大学2016–2017学年第二学期

《多元统计学》实验报告

实验名

称实验1数据整理与描述统计分析

实验报告正文:

实验 1.1数据整理

(一)对“employee data.sav ”进行数据整理

1.观察量排序 ( based on current salary)

2.变量值排序(based on current salary : rsalary)

3.计算新的变量(incremental salary=current salary - beginning salary)

4.拆分数据文件(based on gender)

结论:There are 215 female employees and 259 male employees.

5.分类汇总 (break variable: gender ; function: mean )

结论:The average current salary of female is 26031.92.

The average current salary of male is 41441.78.

(二)分别给出三种工作类别的薪水的描述统计量

实验2.2描述统计分析

1)样本均值矩阵

结论:总共分析六组变量,每组含有十个样本。

每股收益(X1)的均值为-0.0912;净资产收益率(X2)的均值为-0.0378;总资产报酬率(X3)的均值为-0.0294;销售净利率(X4)的均值为-0.4284;主营业务增长率(X5)的均值为0.6334;净利润增长率(X6)的均值为0.7797.

2)协方差阵

结论:矩阵共六行六列,显示了每股收益

(X1)、净资产收益率(X2)、总资产报酬

率(X3)、销售净利率(X4)、主营业务增

长率(X5)和净利润增长率(X6)的协方

差。

3)相关系数

结论:矩阵共六行六列,显示了每股收益(X1)、净资产收益率(X2)、总资产报酬率(X3)、销售净利率(X4)、主营业务增长率(X5)和净利润增长率(X6)之间的相关系数。

每格中三行分别显示了相关系数、显著性检验与样本个数。

4)矩阵散点图

结论:6*6的表格显示了每股收益(X1)、净资产收益率(X2)、总资产报酬率(X3)、销售净利率(X4)、主营业务增长率(X5)和净利润增长率(X6)之间的关系。

5)多维箱线图

结论:X1, X2中各出现一个异常值

多元线性回归SPSS实验报告

回归分析基本分析: 将毕业生人数移入因变量,其他解释变量移入自变量。在统计量中选择估计和模型拟合度,得到如图 注解:模型的拟合优度检验:

第二列:两变量(被解释变量和解释变量)的复相关系数R=0.999。 第三列:被解释向量(毕业人数)和解释向量的判定系数R2=0.998。 第四列:被解释向量(毕业人数)和解释向量的调整判定系数R2=0.971。在多个解释变量的时候,需要参考调整的判定系数,越接近1,说明回归方程对样本数据的拟合优度越高,被解释向量可以被模型解释的部分越多。 第五列:回归方程的估计标准误差=9.822 回归方程的显著性检验-回归分析的方差分析表 F检验统计量的值=776.216,对应的概率p值=0.000,小于显著性水平0.05,应拒绝回归方程显著性检验原假设(回归系数与0不存在显著性差异),认为:回归系数不为0,被解释变量(毕业生人数)和解释变量的线性关系显著,可以建立线性模型。 注解:回归系数的显著性检验以及回归方程的偏回归系数和常数项的估计值第二列:常数项估计值=-544.366;其余是偏回归系数估计值。

第三列:偏回归系数的标准误差。 第四列:标准化偏回归系数。 第五列:偏回归系数T检验的t统计量。 第六列:t统计量对应的概率p值;小于显著性水平0.05,拒接原假设(回归系数与0不存在显著性差异),认为回归系数部位0,被解释变量与解释变量的线性关系是显著的;大于显著性水平0.05,接受原假设(回归系数与0不存在显著性差异),认为回归系数为0被解释变量与解释变量的线性关系不显著的。 于是,多元线性回归方程为: y=-544.366+0.032x1+0.009x2+0.001x3-0.1x5+3.046x6 回归分析的进一步分析: 1.多重共线性检验 从容差和方差膨胀因子来看,在校学生数和教职工总数与其他解释变量的多重共线性很严重。在重新建模中可以考虑剔除该变量

管理统计学报告

《管理统计学》 综合性实验报告 题目:大学生消费情况综合分析 班级:____________姓名:____________学号:____________ 综合实验报告评分标准 评分项目比例得分 所有同学每月生活费的平均值,最大值和最小 10% 值 10% 男生、女生每月生活费的平均值,最大值和最 小值 所有同学每月生活费的茎叶图10% 频数分布表10% 方差分析部分40% 聚类分析部分10% 语言表达与排版10% 实验报告总评(用A,B,C,D和E表示) 1.通过综合性实验检验对SPSS的掌握情况,并作为期末的考核标准之一。 二、实验内容: 1.用SPSS分别计算农村学生的比例,女生比例 2.用SPSS计算出所有同学每月生活费的平均值,最大值和最小值。 3.用SPSS分别计算出男生、女生每月生活费的平均值,最大值和最小值。 4.作出所有同学每月生活费的茎叶图。 5.整理所有同学每月生活费数据,制作一个频数分布表(分成5组)。 6.从每个班中随机抽10人,这10人每月生活费可以看作本班的一个随机样本,试分析信 管1班,2班,3班,4班,工业工程1班,2班之间的每月生活费的方差是否齐性,判 断每个班同学的月均生活费是否有显著差异;分析户口所在地、性别对每月的生活费的 影响是否显著。(显著性水平为0.05)

7.以每月平均生活费、伙食费所占比例、生活费来源中家庭给予所占比例为观测变量,对 本专业学生进行聚类分析。 三、实验详细过程与结果 问题1解:采用频率分布表解答。将户口与性别放入变量中,得到户口与性别的频率统计 答:由上面得到的第二个表格得出农村学生的比例为48.8,女生的比例为37.7。 问题2解:采用频率分布表解答。在统计量选项中勾中均值、最大值和最小值。

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

多元回归分析SPSS1

多元线性回归分析预测法 多元线性回归分析预测法(Multi factor line regression method,多元线性回归分析法) [编辑] 多元线性回归分析预测法概述 在市场的经济活动中,经常会遇到某一市场现象的发展和变化取决于几个影响因素的情况,也就是一个因变量和几个自变量有依存关系的情况。而且有时几个影响因素主次难以区分,或者有的因素虽属次要,但也不能略去其作用。例如,某一商品的销售量既与人口的增长变化有关,也与商品价格变化有关。这时采用一元回归分析预测法进行预测是难以奏效的,需要采用多元回归分析预测法。 多元回归分析预测法,是指通过对两上或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。 [编辑] 多元线性回归的计算模型[1] 一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元性回归。

设y为因变量,为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为: 其中,b 0为常数项,为回归系数,b1为固定时,x1每增加一 个单位对y的效应,即x 1对y的偏回归系数;同理b2为固定时,x2每增加一 个单位对y的效应,即,x 2对y的偏回归系数,等等。如果两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描述为: 其中,b 0为常数项,为回归系数,b1为固定时,x2每增加 一个单位对y的效应,即x 2对y的偏回归系数,等等。如果两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描述为: y = b 0 + b1x1 + b2x2 + e 建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是: (1)自变量对因变量必须有显著的影响,并呈密切的线性相关; (2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的; (3)自变量之彰应具有一定的互斥性,即自变量之彰的相关程度不应高于自变量与因变量之因的相关程度; (4)自变量应具有完整的统计数据,其预测值容易确定。 多元性回归模型的参数估计,同一元线性回归方程一样,也是在要求误差平方和()为最小的前提下,用最小二乘法求解参数。以二线性回归模型为例,求解回归参数的标准方程组为 解此方程可求得b 0,b1,b2的数值。亦可用下列矩阵法求得 即 [编辑] 多元线性回归模型的检验[1] 多元性回归模型与一元线性回归模型一样,在得到参数的最小二乘法的估计值之后,也需要进行必要的检验与评价,以决定模型是否可以应用。

管理统计学SPSS数据的报表呈现 实验报告

数据的报表呈现 1、实验目的与要求 1.熟悉表格的基本框架及类型。 2.掌握各种统计表的制做过程。 3.熟悉表格编辑的相关操作。 二、实验内容提要 1.题目A3的标准统计报表制作 CCSS项目每月都会生成固定格式的统计表格,下图为对题目A3的固定表格格式,行标题首先为A3选项的占比,随后为题目感受值的均数,列标题则为受访月份。请用SPSS的制表模块实现该表格。 明显好转14.014.8 6.315.5 略有好转31.023.729.335.1 基本不变42.337.546.443.9 略有变差 6.712.88.9 3.3 明显变差 3.310.29.2.0 说不清/ 2.7 1.0.0 2.1 拒答 感受值122.8110.0107.2131.4 2.题目A3a的标准统计报表制作 下图所示为CCSS项目报告中题目A3a的固定表格格式,列标题仍然为受访月,行标题则分别为多选题A3a的乐观与悲观答案的列响应百分比,在其上方则分别对乐观与悲观的应答比例进行了小计,注意小计汇总指标为应答人数百分比。要求用SPSS的制表模块实现该表格。 200704200712200812200912 导致家庭经济情况改 81.151.050.483.3 善原因

改善:收入相关45.231.432.774.2 改善:就业状况相关7.9 2.6 3.6 1.1 改善:投资相关15.88.3 3.0 2.2 改善:家庭开支相关 5.1 3.9 4.2 2.2 改善:政策/宏观经 4.0.9 2.4 2.2 济 导致家庭经济情况恶 18.954.653.916.7 化的原因 恶化:收入相关7.9 6.117.3 5.6 恶化:就业状况相关 5.1 5.27.7 2.2 恶化:投资相关.6.4 6.0.0 恶化:家庭开支相关8.540.622.67.9 恶化:政策/宏观经 .0.4.6 2.2济相关 三、实验步骤 1. 题目A3的标准统计报表制作 在SPSS软件中打开CCSS数据,选择分析→表-→设定表格菜单项,打开表生成器操作界面,然后将A3拖到列项,Qa3拖到A3的下面,time拖到行项,再对变量隐藏标签,在摘要变量的统计量项里设置变量均值显示形式,最后选择输出表的形式,如下:

统计分析及SPSS的应用课后练习答案解析

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第4章SPSS基本统计分析 1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。 分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。 Statistics 户口所在 地 职业年龄 N Valid282282282 Missing000 户口所在地 Frequency Percent Valid Percent Cumulative Percent Valid 中心城市200 边远郊区82 Total282 职业 Frequency Percent Valid Percent Cumulative Percent Valid 国家机关24商业服务业54文教卫生18公交建筑业15经营性公司18学校15一般农户35种粮棉专业 户 4

种 果菜专业 户 10 工商运专业 户 34 退役人员17 金融机构35 现役军人3 Total282 年龄 Frequency Percent Valid Percent Cumulative Percent Valid 20岁以下4 20~35岁146 35~50岁91 50岁以上41 Total282

分析:本次调查的有效样本为282份。常住地的分布状况是:在中心城市的人最多,有200人,而在边远郊区只有82人;职业的分布状况是:在商业服务业的人最多,其次是一般农户和金融机构;年龄方面:在35-50岁的人最多。由于变量中无缺失数据,因此频数分布表中的百分比相同。 2、利用第2章第7题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准正态分布曲线进行对比。进一步,对不同常住地储户存款金额的基本特征进行对比分析。 分析——描述统计——描述,选择存款金额到变量中。点击选项,勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表,点击继续——确定。 分析:由表中可以看出,有效样本为282份,存(取)款金额的均值是,标准差为,峰度系数为,偏度系数为。与标准正态分布曲线进行对比,由峰度系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以看出,此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大。

spss多元回归分析报告案例

企业管理 对居民消费率影响因素的探究 ---以湖北省为例 改革开放以来,我国经济始终保持着高速增长的趋势,三十多年间综合国力得到显著增强,但我国居民消费率一直偏低,甚至一直有下降的趋势。居民消费率的偏低必然会导致我国内需的不足,进而会影响我国经济的长期健康发展。 本模型以湖北省1995年-2010年数据为例,探究各因素对居民消费率的影响及多元关系。(注:计算我国居民的消费率,用居民的人均消费除以人均GDP,得到居民的消费率)。通常来说,影响居民消费率的因素是多方面的,如:居民总 收入,人均GDP,人口结构状况1(儿童抚养系数,老年抚养系数),居民消费价格指数增长率等因素。 1.人口年龄结构一种比较精准的描述是:儿童抚养系数(0-14岁人口与 15-64岁人口的比值)、老年抚养系数(65岁及以上人口与15-64岁人口的比值〉或总抚养系数(儿童和老年抚养系数之和)。0-14岁人口比例与65岁及以上人口比例可由《湖北省统计年鉴》查得。

一、计量经济模型分析 (一)、数据搜集 根据以上分析,本模型在影响居民消费率因素中引入6个解释变量。X1:居民总收入(亿元),X2:人口增长率(‰),X3:居民消费价格指数增长率,X4:少儿抚养系数,X5:老年抚养系数,X6:居民消费占收入比重(%)。 Y:消费率(%)X1:总收入 (亿元) X2:人口增 长率(‰) X3:居民消 费价格指 数增长率 X4:少儿抚 养系数 X5:老年抚 养系数 X6:居民消 费比重(%) 1995 1997 200039 2001 2002 2003 2004 2005 2006 2007 2008 2009

管理统计学SPSS数据管理 实验报告

数据管理 一、实验目的与要求 1.掌握计算新变量、变量取值重编码的基本操作。 2.掌握记录排序、拆分、筛选、加权以及数据汇总的操作。 3.了解数据字典的定义和使用、数据文件的重新排列、转置、合并的操作。 二、实验内容提要 1.自行练习完成课本中涉及的对CCSS案例数据的数据管理操作 2.针对SPSS自带数据Employee data.sav进行以下练习。 (1)根据变量bdate生成一个新变量“年龄” (2)根据jobcat分组计算salary的秩次 (3)根据雇员的性别变量对salary的平均值进行汇总 (4)生成新变量grade,当salary<20000时取值为d,在20000~50000范围内时取值为c,在50000~100000范围内取值为b,大于等于100000时取值为a 三、实验步骤 1、针对CCSS案例数据的数据管理操作 1.1.计算变量,输入TS3到目标变量,在数字表达式中输入3,把任意年龄段分成三个组20-30设为1组,1-40设为2组41-50设为3组。图1, 图1 1.2.对已有变量的分组合并,在“名称”文本框中输入新变量名TS3单击“更改”按钮,原来的S3->?就会变为S3->TS3,单击“旧值和新值”按钮,系统打开“重新编码到其他变量:旧值和新值”,如下图2,

图2 图3 1.3.可视离散化,选择“转换”->“可视离散化”,打开的对话框要求用户选择希望进行离散化的变量,单击继续,如下图4,

图4 单击“生成分割点”,设定分割点数量为10,宽度为5,第一个分割点位置为18,单击“应用”,如下图, 图5 结果显示如下,

教育统计学与SPSS名解总结

第一章导论(阅览前必读:书上每个章节后的名解我全都列出来了,黑色字体的都是书上原文,量多,但有些不重要的名解没必要背,你挑着背不要被吓到。绿色是章节题目,红色的就是我的一些说明、补充、吐槽,一个人打字很无聊啊有木有!一直自言自语啊有木有!并非书上的名词解释,看看就好,可删。这段紫色的也删了哈。接下来……正文,走你!) 统计学(statistics):即研究统计原理与方法的科学。 教育统计学(educational statistics):是专门研究如何搜集、整理、分析在心理和教育方面有实验或调查所获得的数字资料,如何根据这些资料所传递的信息,进行数学推论,找出客观规律的一门学科。简言之,教育统计学是运用统计学的一般原理和方法研究教育科学领域数量关系的一门科学。 描述统计(descriptiive statistics):是实验或调查所获得的数据加以整理(如制表、绘图),并计算其各种代表量数(如集中量数、差异量数、相关量数等),其基本思想是平均。 Or:是研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质的一种统计方法。 推断统计(inferencial statistics):又称抽样统计,它是根据对部分个体进行观测所得到的信息,通过概括性的分析、论证,在一定可靠程度上去推测相应的团体。 Or:是研究如何通过局部数据所提供的信息,运用概率的理论进行分析论证,在一定可靠程度上推论总体或全局情形的统计方法。这是统计学中的主要内容。 实验设计(experimental statistics):是研究如何更加合理、有效的获得观测资料,如何更正确、更经济、更有效的达到实验目的,以揭示实验中各种变量关系的实验计划。 Or:实验者为了揭示实验中自变量与因变量的关系,在实验之前所制定的实验计划,称为实验设计。他是研究如何科学地、经济地以及更有效地进行实验。 统计常态法则:从总体中随机抽取一部分个体所组成的样本,差不多可以保持总体的特征。 小数永存法则:从总体中抽取的第一个样本中所表现的特性,在其他样本中也会存在。 大量惰性原则:某一事物的某一性质或状态,在反复观察或试验中是保持不变的。 有效数字:是指能影响测量准确性的数字。 随机变量(random variable):在统计学中把在取值之前不能预料到取什么值的量称为变量(随机变量)。 数据(data):如果一旦某个数值被取定了,成这个数值为随机变量的一个观察值,即数据。 总体(population):指客观存在的,并在同一性质的基础上结合起来的许多个别单位的整体,即具有某一特性的一类事物的全体,又叫母体或全域。 个体(individual): 构成总体的基本单位或单元,又称元素或个案。 样本(sample):从总体中抽取的一部分个体。 参数(parameter):表示总体特征的量数。 统计量(statistic):是直接从样本计算出的量数,代表样本的特征。

统计学上机实习心得体会

统计学上机实习心得体会 在本学期的统计学实验课上你一定做了许多类型的实验让你受益菲浅吧!小编收集了统计学上机实习心得体会欢迎阅读为期半个学期的统计学实验就要结束了这段以来我们主要通过excl软件对一些数据进行处理比如抽样分析方差分析等经过这段时间的学习我学到了很多掌握了很多应用软件方面的知识真正地学与实践相结合加深知识掌握的同时也锻炼了操作能力回顾整个学习过程我也有很多体会 统计学是比较难的一个学科作为工商专业的一名学生统计学对于我们又是相当的重要因此每次实验课我都坚持按时到实验室试验期间认真听老师讲解看老师操作然后自己独立操作数遍不懂的问题会请教老师和同学有时也跟同学商量找到更好的解决方法几次实验课下来我感觉我的能力确实提高了不少统计学是应用数学的一个分支主要通过利用概率论建立数学模型收集所观察系统的数据进行量化的分析、总结并进而进行推断和预测为相关决策提供依据和参考它被广泛的应用在各门学科之上从物理和社会科学到人文科学甚至被用来工商业及政府的情报决策之上可见统计学的重要性认真学习显得相当必要为以后进入社会有更好的竞争力也为多掌握一门学科对自己对社会都有好处 几次的实验课我每次都有不一样的体会个人是理科出来的对这种数理类的课程本来就很感兴趣经过书本知识的学习和实验的实践操作更加加深了我的兴趣每次做实验后回来我还会不定时再独立操

作几次为了不忘记操作方法这样做可以加深我的记忆根据记忆曲线的理论学而时习之才能保证对知识和技能的真正以及掌握更久的掌握就拿最近一次实验来说吧我们做的是“平均发展速度”的问题这是个比较容易的问题但是放到软件上进行操作就会变得麻烦书本上只是直接给我们列出了公式但是对于其中的原理和意义我了解的还不够多在做实验的时候难免会有很多问题不奇怪的是这次试验好多人也都是不明白操作不好不像以前几次试验老师讲完我们就差不多掌握了但是这次似乎遇到了大的麻烦因为内容比较多又是一些没接触过的东西我个人感觉最有挑战性也最有意思的就是编辑公式这个东西必须认真听认真看稍微走神就会什么都不知道很显然刚开始我是遇到了麻烦还好在老师的再次讲解下我终于大致明白了回到寝室立马独自专研了好久到现在才算没什么问题了 实验的时间是有限的对于一个文科专业来说能有操作的机会不是很多而真正利用好这些难得的机会对我们的大学生涯有很大意义不仅是学习上能掌握具体的应用方法我感觉更大的意义是对以后人生路的作用我们每天都在学习理论久而久之就会变成书呆子问什么都知道但是要求做一次就傻了眼这肯定是教育制度的问题和学校的设施问题但是如果我们能利用好很少的机会去锻炼自己得到的好处会大于他自身的价值很多倍例如在实验过程中如果我们要做出好的结果就必须要有专业的统计人才和认真严肃的工作态度这就在我们的实践工作中不知觉中知道一丝不苟的真正内涵以后的工作学习我们再把这些应用于工作学习肯定会很少被挫折和浮躁打败因为统计

《统计分析与SPSS的应用(第五版)》课后练习标准答案(第2章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第2章SPSS数据文件的建立和管理 1、SPSS中有哪两种基本的数据组织形式?各自的特点和应用场合是什么? SPSS中两个基本的数据组织方式:原始数据的组织方式和计数数据的组织方式。 ●原始数据的组织方式:待分析的数据是一些原始的调查问卷数据,或是一些基本的 统计指标。 ●计数数据的组织方式:所采集的数据不是原始的调查问卷数据,而是经过分组汇总 后的数据。 2、什么是SPSS的个案?什么SPSS的变量? 个案:在原始数据的组织方式中,数据编辑器窗口中的一行称为一个个案或观测。 变量:数据编辑器窗口中的一列。 3、在定义SPSS数据结构时,默认的变量名和变量类型是什么?如果希望增强SPSS统计分析结果的易读性,还需要对数据结构的哪些方面进行必要说明? 默认的变量名:VAR------;默认的变量类型:数值型。 变量名标签和变量值标签可增强统计分析结果的可读性。 4、收集到以下关于两种减肥产品试用情况的调查数据,请问在SPSS中应如何组织该份资料? 产品类型体重变化情况 明显减轻无明显变化 第一种产品2719 第二种产品20 33 问:在SPSS中应如何组织该数据? 数据文件如图所示: 5、什么是SPSS的用户缺失值?为什么要对用户缺失值进行定义?如何在SPSS中指定用户缺失值? 缺失值分为用户缺失值(User Missing Value)和系统缺失值(System Missing

Value)。用户缺失值指在问卷调查中,将无回答的一些数据以及明显失真的数据当作缺失值来处理。用户缺失值的编码一般用研究者自己能够识别的数字来表示,如“0”、“9”、“99”等。系统缺失值主要指计算机默认的缺失方式,如果在输入数据时空缺了某些数据或输入了非法的字符,计算机就把其界定为缺失值,这时的数据标记为一个圆点“?”。在变量视图中定义。 6、从计量尺度角度看,变量包括哪三种主要类型?请各举出一个相应的实际数据。如何在SPSS中指定变量的计算尺度? 变量类型包括:数值型(身高)、定序型(受教育程度)以及定类型(性别)。在变量视图中定义。 7、有一份关于居民储蓄调查的模拟数据存储在Excel中,文件名为“居民储蓄调查数据.xls”。该数据的第一行是变量名,格式如下图所示。请将该份数据转换成SPSS数据文件,并在SPSS中指定其变量名标签和变量值标签。(该份数据的具体含义见Excel文件的后半部分) 【文件(F)】→【打开(O)】→【数据(A)】→文件类型选“Excel(*.xls,…)”,文件名选“居民储蓄调查数据.xls”→【打开】→选中“从第一行数据读取变量名”,在“范围” 中输入“A1:Q283”→【确定】→在“变量视图”窗口,调整A1变量的宽度,输入变量名标签和变量值标签→在主菜单窗口选定【文件(F)】→【保存】→选择保存路径,保存类型为“sav”,文件名为“居民储蓄调查数据”→【保存】. 8、现有股民投资状况调查的文本数据,文件名为“股民投资数据.txt”。其中各变量的含义和编码见文件“股民投资数据.xls”。请将该文本数据读入SPSS,并定义变量名标签和变量值标签。其中各变量取值为9的均为用户缺失值,请加以定义说明。(注:本调查问卷中涉及多选项问题,以及多选项问题的编码等,可先忽略。) 【文件(F)】→【打开文本数据(D)】→【数据(A)】→文件类型选“Text(*.txt,…)”,文件名选“股民投资数据.txt”,【打开】→在“您的文本文件与预定义的格式匹配吗?”中选“否”,【下一步】→在“变量名称是否包括在文件的顶部”中选“是”,【下一步】→在“第一个数据个案从哪个行号开始”中输入“2”,其他默认,【下一步】→【下一步】→在“数据格式”中输入“字符串”,接着在弹出的窗口输入“4”,【下一步】→默认各选项,【完成】→在主菜单窗口选定【文件(F)】→【保存】→选择保存路径,保存类型为“sav”,文件名为“股民投资数据”→【保存】.

统计学实验报告

河南工业大学管理学院 课程设计(实验)报告书题目统计学实验 专业电子商务 班级1204班 学生姓名伍琴 学号201217050430 指导教师任明利 时间:2012 年 4 月 6 日

实验一:数据整理 一、项目名称:数据整理 二、实验目的 (1)掌握Excel中基本的数据处理方法; (2)学会使用Excel进行统计分组,能以此方式独立完成相关作业。 三、实验要求 1、已学习教材相关内容,理解数据整理中的统计计算问题;已阅读本次实验导引,了解Excel中相关的计算工具。 2、准备好一个统计分组问题及相应数据(可用本实验导引所提供问题与数据)。 3、以Excel文件形式提交实验报告(包括实验过程记录、疑难问题发现与解决记录)。 四、实验内容和操作步骤 (一)问题与数据 某百货公司连续40天的商品销售额如下(单位:万元): 41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35 根据上面的数据进行适当分组,编制频数分布表,并绘制直方图. (二)操作步骤: 1、在单元区域A1:E9中输入原始数据,如图:

2、并计算原始数据的最大值(在单元格B10中)与最小值(在单元格D10中)。 3、根据经验公式计算经验组距和经验组数。 4、根据步骤3的计算结果,计算并确定各组上限、下限(在单元区域F1:G6),如图所示: 5、绘制频数分布表框架,如图所示: 6、计算各组频数: (1)选定B19:B23作为存放计算结果的区域。 (2)从“公式”菜单中选择“插入函数”项。 (3)在弹出的“插入函数”对话框中选择“统计”函数FREQUENCY.

统计学 SPSS作业

频率 统计量 XB性别MRC月消费金额 N 有效126 126 缺失0 0 频率表 XB性别 频率百分比有效百分比累积百分比 有效 A.男65 51.6 51.6 51.6 A.女61 48.4 48.4 100.0 合计126 100.0 100.0 MRC月消费金额 频率百分比有效百分比累积百分比 有效 A.300元-400元 1 .8 .8 .8 B.401元-600元9 7.1 7.1 7.9 C.601元-1000元77 61.1 61.1 69.0 D.1000元以上39 31.0 31.0 100.0 合计126 100.0 100.0

通过以上交叉表可知,男性日常用品花费在41-60元和61-100元这两个区间所占比 游程检验 2 XB性别NL年龄 检验值a 1.48 19.59 案例 < 检验值65 70 案例 >= 检验值61 56 案例总数126 126 Runs 数8 35 Z -10.017 -5.112 渐近显著性(双侧) .000 .000 a. 均值 从上图中可以知道图中显示性别的分割点分别为1和1.48,,SPSS计算出游程数分别共有1和8,表格中年龄所使用的分割点为均数19和19.59,而不是原先的中位数20,导致游程增加到46和35.

可见在年龄为21时样本的信心指数均值为1.8556,低于基线水平100.样本均数抽样误差为0.13216 由上面的检验结果t=-742.635 p=0 由于p值小于检验水准0.05。因此拒绝H0,所以样本所在的均值与假设的在总体均值相同。

分析结果的第一部分为Levene’s方差齐性检验,用于判别两总体方差是否为齐性方差,这里的检测结果为F=10.975,P=0.006,因此拒绝Ho,认为本例中两个样本所在总体的方差是不齐的。 相关性 控制变量NL年龄YY MRC月消费金额NL年龄相关性 1.000 . 显著性(双侧). . df 0 15 YY 相关性. 1.000 显著性(双侧). . df 15 0 在控制了月消费金额之后计算出的年龄和总指数的偏相关矩阵,可见两者的偏相关系数为1。 G图

管理统计学-假设检验的SPSS实现-实验报告

假设检验的SPSS实现 、实验目的与要求 1. 掌握单样本 t检验的基本原理和 spss实现方法。 2. 掌握两样本 t检验的基本原理和 spss实现方法。 3. 熟悉配对样本 t检验的基本原理和 spss实现方法。 二、实验内容提要 1. 从一批木头里抽取 5根,测得直径如下(单位: cm),是否能认为这批木头的平均直径是1 2.3cm 12.3 12.8 12.4 12.1 12.7 2. 比较两批电子器材的电阻,随机抽取的样本测量电阻如题表2所示,试比较两批电子器 材的电阻是否相同(需考虑方差齐性的问题) 3. 配对 t检验的实质就是对差值进行单样本t检验,要求按此思路对例课本 13.4进行重新分析,比较其结果和配对 t检验的结果有什么异同。 4.一家汽车厂设计出 3种型号的手刹,现欲比较它们与传统手刹的寿命。分别在传统手刹,型号I、II、和型号 III中随机选取了 5只样品,在相同的试验条件下,测量其使用寿命(单位:月),结果如下: 传统手刹:21.213.417.015.212.0 型号 I :21.412.015.018.924.5 型号 II :15.219.114.216.524.5 型号 III :38.735.839.332.229.6 ( 1)各种型号间寿命有无差别 ? (2)厂家的研究人员在研究设计阶段,便关心型号III 与传统手刹寿命的比较结果。此时应 当考虑什么样的分析方法?如何使用 SPSS实现? 三、实验步骤 为完成实验提要 1. 可进行如下步骤 1. 在变量视图中新建一个数据,在数据视图中录入数据,在分析中选择比较均值,单样本t 检验,将直径添加到检验变量,点击确定。

教育统计学 SPSS练习题

1.某学校初中一年级80名学生的数学考试成绩如下,制作频数分布表和图形并作频数分布分析。 某校初一年级80名学生的数学考试成绩 88,89,90,72,89,88,84,83,92,86 90,86,76,87,91,90,90,74,85,84 90,85,89,76,77,85,93,91,81,84 91,83,80,85,87,86,87,84,89,91 84,89,88,84,83,95,85,89,89,89 80,95,83,91,86,87,92,93,89,73 95,82,87,89,80,70,85,85,68,83 82,89,88,85,90,89,80,90,77,72 2.将第1题中的80名学生的数学考试成绩分成0-60,60-70,70-80,80-90,90-100五段,进行分段频数统计,并绘制频数分布条形图 3.某班学生政治面貌分布情况为:党员21人,团员35人,群众43人,请绘制统计图。 4.某班学生政治面貌分布情况为:党员21人(其中男生11人,女生10人),团员35人(其中男生15人,女生20人),群众43人(其中男生23人,女生20人),请绘制统计图。 5.某职业技术学院2000年对其240名学生家长的职业调查结果如下:公务员58人,医生26人,军人15人,工人90人,个体工商业主45人,教师6人,请据此绘制一个圆形图。 6.对15名初三学生用一套初中数学水平测验试卷进行测试,其测验得分如下,另以这些学生的校内数学期末考试成绩为效标,试计算初中数学水平测验的效标关联效度系数。 学生序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 水平测验得分56 73 65 78 64 77 90 61 54 75 45 72 88 95 61 期末成绩63 65 70 74 68 85 92 64 59 70 50 79 90 91 65 7.某大学一年级12名学生的英语阅读理解能力测验成绩与其平时阅读作业成绩如下表所列,试计算阅读理解能力测验的效标关联效度系数。 学生序号 1 2 3 4 5 6 7 8 9 10 11 12 测验得分32 33 34 34 36 37 38 39 40 41 43 45 作业成绩(等级)6 4 2 7 5 9 1 3 11 12 10 8 8. 从某班学生中随机抽取15名,测得他们的数学成绩如下: 65,77,80,78,89,90,74,73,89,95,83,56,68,92,82 (1)试对该班学生的数学平均成绩和成绩的离散程度作出估计。 (2)试求该班成绩均值的95%和99%的置信区间。 9.已知某年级学生的语文成绩服从正态分布,其中总体平均数为76.9,标准差未知。现从该年级某班随机抽取16名学生的语文成绩,数据如下: 75,88,73,93,85,76,68,90,61,58,78,89,95,77,60,74,问该班学生的平均语文成绩是否也是76.9?(α=0.01)

《管理统计学》实验报告

《管理统计学》实验报告 学号: 姓名: 班级: 指导老师: 2020年9 月11 日

目录 熟悉SPSS的使用方法___________________________________________________________ 3实验(或实训)总结、评价 ____________________________________________________ 6描述统计、参数估计及假设检验 _________________________________________________ 6实验(或实训)总结、评价 ___________________________________________________ 24方差分析(含单因素和双因素) ________________________________________________ 24实验(或实训)总结、评价 ___________________________________________________ 31相关系数、回归参数估计和检验 ________________________________________________ 32实验(或实训)总结、评价 ___________________________________________________ 36

熟悉SPSS的使用方法 一、实验目的、任务 (1)了解SPSS 的运行模式,熟悉其主要窗口的结构; (2)理解并掌握有关数据文件创建和整理的基本操作,学习如何将收集到的数据输入计算机,建成一个正确的 SPSS 数据文件; (3)掌握如何对原始数据文件进行整理,包括数据查询,数据修改、删除,数据的排序等。 二、实验基本内容 (1)SPSS的启动和退出方法; (2)创建数据文件和读取外部数据的方法; (3)数据的编辑、保存和整理。 实验(实训)结果 例题:实验原始数据 某航空公司38 名职员性别和工资情况的调查数据,如表所示,试在SPSS 中进行如下操作: 1、将数据输入到SPSS 的数据编辑窗口中,将gender 定义为字符型变量,将salary 定义为数值型变量,并保存数据文件,命名为“实验1.sav”。 /插入一个变量income,定义为数值型变量。 将数据文件按性别分组。 查找工资大于40000 美元的职工。 当工资大于40000 美元时,职工的奖金是工资的20%;当工资小于40000 美元时, 职工的奖金是工资的10%,假设实际收入=工资+奖金,计算所有职工的实际收入,并添加到income 变量中。

《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)

WORD 格式整理 《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第 4 章 SPSS基本统计分析 1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。 分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。 Statistics 户口所在职业年龄 地 Valid282282282 N Missing 000 户口所在地 Frequency Percent Valid Cumulative Percent Percent 中心城市20070.970.970.9 Valid 边远郊区8229.129.1100.0 Total282100.0100.0 职业 Frequency Percent Valid Cumulative Percent Percent 国家机关248.58.58.5 商业服务业5419.119.127.7 文教卫生18 6.4 6.434.0 公交建筑业15 5.3 5.339.4 Valid 经营性公司18 6.4 6.445.7学校15 5.3 5.351.1 一般农户3512.412.463.5 种粮棉专业 4 1.4 1.464.9 户

WORD 格式整理 种果菜专业 10 3.5 3.568.4 户 工商运专业 3412.112.180.5户 退役人员17 6.0 6.086.5 金融机构3512.412.498.9 现役军人3 1.1 1.1100.0 Total282100.0100.0 年龄 Frequency Percent Valid Cumulative Percent Percent 20 岁以下4 1.4 1.4 1.4 20~35 岁14651.851.853.2 Valid 35~50 岁9132.332.385.5 50 岁以上4114.514.5100.0 Total282100.0100.0

SPSS多元回归分析报告实例

多元回归分析 在大多数的实际问题中,影响因变量的因素不是一个而是多个,我们称这类回问题为多元回归分析。可以建立因变量y与各自变量x j(j=1,2,3,…,n)之间的多元线性回归模型: 其中:b0是回归常数;b k(k=1,2,3,…,n)是回归参数;e是随机误差。 多元回归在病虫预报中的应用实例: 某地区病虫测报站用相关系数法选取了以下4个预报因子;x1为最多连续10天诱蛾量(头);x2为4月上、中旬百束小谷草把累计落卵量(块);x3为4月中旬降水量(毫米),x4为4月中旬雨日(天);预报一代粘虫幼虫发生量y(头/m2)。分级别数值列成表2-1。 预报量y:每平方米幼虫0~10头为1级,11~20头为2级,21~40头为3级,40头以上为4级。 预报因子:x1诱蛾量0~300头为l级,301~600头为2级,601~1000头为3级,1000头以上为4级;x2卵量0~150块为1级,15l~300块为2级,301~550块为3级,550块以上为4级;x3降水量0~10.0毫米为1级,10.1~13.2毫米为2级,13.3~17.0毫米为3级,17.0毫米以上为4级;x4雨日0~2天为1级,3~4天为2级,5天为3级,6天或6天以上为4级。 表2-1 x1 x2 x3 x4 y 年蛾量级别卵量级别降水量级别雨日级别幼虫密 度 级别 1960 1022 4 112 1 4.3 1 2 1 10 1 1961 300 1 440 3 0.1 1 1 1 4 1 1962 699 3 67 1 7.5 1 1 1 9 1 1963 1876 4 675 4 17.1 4 7 4 55 4 1965 43 1 80 1 1.9 1 2 1 1 1 1966 422 2 20 1 0 1 0 1 3 1 1967 806 3 510 3 11.8 2 3 2 28 3

相关主题
文本预览
相关文档 最新文档