spss的数据分析报告范文
- 格式:docx
- 大小:38.95 KB
- 文档页数:4
spss的数据分析报告范例一、引言数据分析是科学研究过程中不可或缺的一部分。
针对一项研究项目,本报告将借助SPSS软件对收集的数据进行详尽分析,并提供相关结果和结论。
本报告的目的是帮助读者更好地理解数据,提供决策和制定战略所需的支持。
二、研究方法本研究的数据来源于一份问卷调查,共收集了500份有效问卷。
在问卷设计中,我们采用了随机抽样的方法,以保证样本的代表性。
该问卷包括了参与者的基本背景信息、满意度评价等方面的问题。
三、数据分析1. 受访者基本背景首先,我们对受访者的基本背景信息进行了统计分析。
其中包括性别、年龄、教育水平和职业等因素。
以下是相关结果的总结:(1)性别分布:男性占65%,女性占35%。
(2)年龄分布:年龄在18-24岁的受访者占40%;25-34岁的占30%;35-44岁的占20%;45岁及以上的占10%。
(3)教育水平:高中或以下占20%;本科占50%;研究生及以上占30%。
(4)职业:学生占25%;职员占40%;自由职业者占20%;其他占15%。
2. 满意度评价为了了解受访者对某产品的满意度,我们设计了一套评价体系。
通过SPSS软件进行数据分析,得到以下结果:(1)整体满意度:根据赋分制度,平均满意度得分为4.2(满分为5),表明受访者对该产品整体上持较高满意度。
(2)各项指标:通过因子分析,我们得到了几个影响满意度的关键因素。
其中,产品质量、价格和售后服务被认为是受访者最关注的方面。
3. 相关性分析在数据分析过程中,我们还进行了一些相关性分析,以探究不同变量之间的关系。
以下是一些值得关注的相关性结果:(1)性别与满意度之间的关系:经过卡方检验,我们发现性别与满意度之间存在一定的相关性(p < 0.05),女性对产品的满意度略高于男性。
(2)年龄与满意度之间的关系:通过相关系数分析,我们发现年龄与满意度呈现出弱相关关系(r = 0.15,p < 0.05),年龄越小,满意度越高。
精选范文、公文、论文、和其他应用文档,希望能帮助到你们!SPSS简单数据分析报告目录一、数据样本描述 (4)二、要解决的问题描述 (4)1 数据管理与软件入门部分 (4)1.1 分类汇总 (4)1.2 个案排秩 (5)1.3 连续变量变分组变量 (5)2 统计描述与统计图表部分 (5)2.1 频数分析 (5)2.2 描述统计分析 (5)3 假设检验方法部分 (5)3.1 分布类型检验 (5)3.1.1 正态分布 (5)3.1.2 二项分布 (6)3.1.3 游程检验 (6)3.2 单因素方差分析 (6)3.3 卡方检验 (6)3.4 相关与线性回归的分析方法 (6)3.4.1 相关分析(双变量相关分析&偏相关分析) (6)3.4.2 线性回归模型 (6)4 高级阶段方法部分 (6)三、具体步骤描述 (7)1 数据管理与软件入门部分 (7)1.1 分类汇总 (7)1.2 个案排秩 (8)1.3 连续变量变分组变量 (10)2 统计描述与统计图表部分 (11)2.1 频数分析 (11)2.2 描述统计分析 (14)3 假设检验方法部分 (16)3.1 分布类型检验 (16)3.1.1 正态分布 (16)3.1.2 二项分布 (17)3.1.3 游程检验 (18)3.2 单因素方差分析 (22)3.3 卡方检验 (24)3.4 相关与线性回归的分析方法 (26)3.4.1 相关分析 (26)3.4.2 线性回归模型 (28)4 高级阶段方法部分 (32)4.1 信度 (32)一、数据样本描述本次分析的数据为某公司474名职工状况统计表,其中共包含11个变量,分别是:id(职工编号),gender(性别),bdate(出生日期),edcu(受教育水平程度),jobcat(职务等级),salbegin(起始工资),salary(现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。
大学生spss数据分析报告范文1. 引言本报告基于一份关于大学生学习成绩和睡眠时长的数据集,通过SPSS软件进行数据分析。
研究目的是探究学习成绩和睡眠时长之间是否存在关联性,并进一步分析影响学习成绩的因素。
2. 方法2.1 数据收集采集的数据来自于500名大学生,其中包括了学习成绩(用分数表示)和睡眠时长(以小时为单位)两个变量。
2.2 数据处理使用SPSS软件对数据进行了处理。
首先进行了数据清洗,删除了缺失值或异常值;然后进行了数据变换,将睡眠时长转化为分类变量(如低于6小时、6-8小时、高于8小时),方便后续分析。
2.3 数据分析本研究采用了描述性统计和相关分析方法对数据进行了分析。
在描述性统计中,计算了学习成绩的平均值、标准差、最小值、最大值以及睡眠时长的分布情况;在相关分析中,计算了学习成绩和睡眠时长之间的相关系数。
3. 结果3.1 描述性统计学习成绩的平均值为78.5,标准差为8.7,最低分为60,最高分为95。
睡眠时长的分布情况如下:低于6小时的有35%的学生,6-8小时的有50%的学生,高于8小时的有15%的学生。
3.2 相关分析通过Pearson相关系数分析,学习成绩和睡眠时长之间的相关系数为0.32,显著性水平为0.001。
结果显示学习成绩与睡眠时长之间存在着一定的正相关关系。
4. 讨论通过本次数据分析,我们发现学习成绩和睡眠时长之间存在着正相关关系,即睡眠时间足够的学生往往会有更好的学习成绩。
这一结果与一些先前的研究结果相一致。
睡眠不足会导致大学生的注意力不集中、思维迟钝,从而影响他们的学业表现。
然而,本次研究仅仅发现了学习成绩和睡眠时长之间的相关关系,并没有进一步分析其他可能的因素对学习成绩的影响。
未来的研究可以考虑其他自变量,如学习时间、学习方法等,以便更全面地了解影响学习成绩的因素。
此外,本次研究样本容量较小,且仅包含大学生群体,所以结果的推广性受到了一定的限制。
未来研究可以扩大样本容量,涵盖更多不同年龄组的人群,以便得到更具有代表性的结论。
SPSS实验分析报告二一、婆媳关系*住房条件检验(一)、提出原假设H0原假设: 婆媳关系的好坏程度与住房条件有关系(二)、两独立样本t检验结果及分析表(一)觀察值處理摘要觀察值有效遺漏總計N百分比N百分比N百分比婆媳关系* 住房条件600100.0%00.0%600100.0%由表(一)可知, 本次调查获得的有效样本为600份, 没有遗漏的个案。
表(二)婆媳关系*住房条件交叉列表住房条件總計差一般好婆媳关系紧张計數577860195預期計數48.868.378.0195.0婆媳关系內的%29.2%40.0%30.8%100.0%住房条件內的%38.0%37.1%25.0%32.5%佔總計的百分比9.5%13.0%10.0%32.5%殘差8.39.8-18.0一般計數458763195預期計數48.868.378.0195.0婆媳关系內的%23.1%44.6%32.3%100.0%住房条件內的%30.0%41.4%26.3%32.5%佔總計的百分比7.5%14.5%10.5%32.5%殘差-3.818.8-15.0好計數4845117210預期計數52.573.584.0210.0婆媳关系內的%22.9%21.4%55.7%100.0%住房条件內的%32.0%21.4%48.8%35.0%佔總計的百分比8.0%7.5%19.5%35.0%殘差-4.5-28.533.0總計計數150210240600預期計數150.0210.0240.0600.0婆媳关系內的%25.0%35.0%40.0%100.0%住房条件內的%100.0%100.0%100.0%100.0%佔總計的百分比25.0%35.0%40.0%100.0%由表(二)可知, 一共调查了600人, 其中婆媳关系紧张的组有195人, 占总人数的32.5%;婆媳关系一般的组有195人, 占总人数的32.5%;婆媳关系好的组有210人, 占总人数的35.0%;数据分布均匀。
SPSS数据分析报告范文1. 引言本报告旨在对所收集的数据进行分析和解释,以便为相关研究提供支持和指导。
该数据集包含了一份关于某个研究对象的信息,我们将使用SPSS统计软件对其进行数据分析。
2. 方法2.1 数据收集数据采集使用了问卷调查的方法,针对某个特定群体进行了调查。
该调查旨在了解该群体对某特定问题的看法和态度,并收集了一系列相关变量的数据。
2.2 数据清洗在进行数据分析之前,我们对数据进行了清洗和预处理。
这包括去除缺失值、异常值和重复值。
我们还检查了数据的完整性和一致性,并进行了必要的修正和调整。
2.3 数据分析我们使用SPSS软件对数据进行了多个统计分析方法的应用,包括描述统计分析、相关性分析和回归分析等。
这些方法可以帮助我们了解变量之间的关系和趋势,并对未来的发展进行预测。
3. 结果3.1 描述统计分析通过对数据进行描述统计分析,我们得到了一些关键指标和概括性信息。
例如,我们计算了每个变量的均值、中位数、标准差和最大最小值等。
这些指标可以帮助我们对数据有一个整体的了解。
3.2 相关性分析我们使用相关性分析来探索变量之间的关联程度。
通过计算相关系数,我们可以了解变量之间的线性关系的强弱。
这些结果可以帮助我们确定哪些变量彼此之间的关系较为密切,进而为进一步的分析提供基础。
3.3 回归分析回归分析是一种用于预测和解释因果关系的分析方法。
在本报告中,我们使用回归分析来确定自变量和因变量之间的关系,并建立回归模型。
通过这些模型,我们可以对未来的趋势和发展进行预测。
4. 讨论与结论4.1 讨论通过对数据的分析,我们发现了一些有意义的结果和趋势。
例如,我们观察到某些变量之间存在较强的相关性,或者某些自变量对因变量的影响较为显著。
这些发现可以为进一步的研究和分析提供线索和方向。
4.2 结论基于我们的分析结果,我们得出了一些结论和建议。
例如,我们可以建议在某些情况下采取特定的行动或改进措施,以达到某些预期的目标。
SPSS数据分析报告论文引言数据分析是现代科学研究中不可或缺的一部分,它帮助研究人员从大量数据中提取有用的信息,从而得出科学结论。
SPSS(Statistical Package for the Social Sciences)作为一款常用的统计分析软件,被广泛应用于社会科学、医学、市场研究等领域。
本文旨在通过对某研究数据的分析,展示SPSS的功能和应用。
方法本研究采用问卷调查的方式收集数据,并使用SPSS进行数据分析。
问卷设计包括一系列涉及个人信息和态度评价的问题。
通过对回收的问卷数据进行整理和输入,将数据导入SPSS软件进行分析。
本文将主要从以下几个方面进行数据分析:描述性统计、相关分析、t检验和方差分析。
数据描述经过问卷调查获得的数据包括100份有效回收问卷。
被调查者的个人信息包括性别、年龄、学历和职业等。
态度评价的问题使用5点量表进行评分,涵盖了对某个产品的满意度、购买意愿以及推荐度等方面的评估。
描述性统计描述性统计用于对数据进行整体的概括和描述。
在本研究中,我们对被调查者的个人信息进行了描述性统计分析。
性别分布通过对样本中性别的统计,我们得出以下结果:•男性:60人,占60%;•女性:40人,占40%。
从中可以看出,调查样本中男性占据了绝对优势。
年龄分布对被调查者的年龄进行统计得到以下结果:•18-25岁:30人,占30%;•26-35岁:40人,占40%;•36-45岁:20人,占20%;•45岁以上:10人,占10%。
从中可以看出,调查样本中以26-35岁的年轻人占比最高。
学历分布对被调查者的学历进行统计得到以下结果:•小学及以下:5人,占5%;•初中:15人,占15%;•高中/中专:30人,占30%;•本科及以上:50人,占50%。
从中可以看出,调查样本中本科及以上学历的人数最多。
职业分布对被调查者的职业进行统计得到以下结果:•学生:25人,占25%;•上班族:50人,占50%;•自由职业者:10人,占10%;•其他:15人,占15%。
SPSS数据分析报告金典模板三篇SPSS数据分析报告(模板一)学院:经济管理学院专业、班级: **人资*班学生姓名:某某人学二○一*年十一月十一日SPSS数据分析报告第一部分:原始资料和数据资料来源:华东交通大学经济管理学院11级人力资源管理3班29名同学实际情况编号姓名性别学科背景年龄身高体重体测成绩1 吕鑫0 文科20.5 164.2 54.2 812 王阳0 文科20 158.3 46.2 753 洪华阳0 理科21 171 57.2 714 刘卫秀0 理科21 165.5 54 755 吴梦琦0 文科21 166.2 48 696 韩玮0 文科20 164.3 47 617 汤丽娟0 文科21 162.8 48.2 668 江桂英0 理科20 157.2 44.2 709 熊如意0 文科20 166.5 54.5 7310 余婵0 文科19.5 156.2 45.5 7711 彭茜0 文科20 165.4 52.4 6612 赵丹0 文科20.5 174.3 55.6 7613 安怡君0 文科20 175 56.2 7214 武阳帆0 文科20.5 162.4 55.5 6715 倪亚萍0 文科22 157.5 48.6 7416 张明辉 1 文科21.5 170 60 7117 张春旭 1 理科20.5 168.5 57.8 8018 刘晓伟 1 文科21 170.5 59.5 7019 黄炜 1 文科20.5 171 62.2 7620 李强 1 文科20.5 167.5 56.5 6821 温明煌 1 文科21.5 170 60 7522 雷翀翀 1 理科21 168.5 60 7923 陈志强 1 文科22 180 70.4 7924 尹传萍 1 文科21.5 165.2 55.6 7825 郑南 1 理科21.5 168.5 55.9 6426 幸恒恒 1 文科21.5 168.5 58 7927 李拓 1 理科21.5 172 68.1 6628 张发宝 1 理科21 160.5 52.5 7329 杨涛 1 理科21.5 176 70.5 72原始资料和数据(SPSS软件截图):图1 变量视图图2 数据视图第二部分:数据分析一、描述性分析打开文件“11人资3班29名同学的身高、体重、年龄数据”,通过菜单兰中的分析选项,进行描述性分析,选择年龄、体重和身高,求最大值、最小值、方差、偏度、峰度和均值,得到如下结果:表1-2年龄分布表年龄频率百分比有效百分比累积百分比有效19.50 1 3.4 3.4 3.420.00 6 20.7 20.7 24.120.50 6 20.7 20.7 44.821.00 7 24.1 24.1 69.021.50 7 24.1 24.1 93.122.00 2 6.9 6.9 100.0合计29 100.0 100.0图1-3身高分布直方图图1-4体重分布条形图文字描述:从SPSS 分析结果中可以得出,有效数据共有29个。
spss地大数据分析资料报告案例spss 的大数据分析资料报告案例在当今数字化时代,数据已成为企业和组织决策的重要依据。
SPSS (Statistical Product and Service Solutions)作为一款功能强大的统计分析软件,在处理和分析大数据方面发挥着重要作用。
本文将通过一个实际的案例,展示如何运用 SPSS 进行大数据分析,并从中得出有价值的结论。
一、案例背景假设我们是一家电商公司,拥有大量的用户交易数据。
我们希望通过对这些数据的分析,了解用户的购买行为、偏好以及市场趋势,以便优化产品推荐、营销策略和供应链管理。
二、数据收集与整理首先,我们从数据库中提取了相关的数据,包括用户的基本信息(如年龄、性别、地域等)、购买记录(产品类别、购买时间、购买金额等)以及浏览行为等。
这些数据量庞大,可能达到数百万甚至数千万条记录。
在将数据导入 SPSS 之前,我们需要对数据进行预处理,包括数据清洗、缺失值处理和异常值检测。
例如,删除重复的记录、填充缺失的关键信息,并剔除明显不符合常理的异常值。
三、数据分析方法1、描述性统计分析通过计算均值、中位数、标准差等统计量,对用户的年龄、购买金额等变量进行概括性描述,了解数据的集中趋势和离散程度。
2、相关性分析分析不同变量之间的相关性,例如用户年龄与购买金额之间、购买频率与产品类别之间的关系。
3、分类分析使用聚类分析将用户分为不同的群体,以便针对不同群体制定个性化的营销策略。
4、时间序列分析对于购买时间等变量,运用时间序列分析方法预测未来的销售趋势。
四、SPSS 操作与结果解读1、描述性统计分析结果例如,我们发现用户的平均年龄为 30 岁,购买金额的中位数为 500 元,标准差为 200 元。
这表明大部分用户年龄较为年轻,购买金额分布相对较为集中。
2、相关性分析结果发现用户年龄与购买金额之间存在较弱的正相关关系,即年龄较大的用户可能购买金额相对较高。
spss数据分析报告500字SPSS数据分析报告随着信息技术的快速发展,数据分析在各个领域中变得越来越重要。
SPSS(Statistical Package for the Social Sciences)作为一款统计软件,广泛应用于社会科学和商业数据分析领域。
本文将对使用SPSS进行数据分析的过程进行探讨,并根据所得结果对数据进行解释和总结。
1. 研究目的本研究旨在探讨某公司员工满意度与其绩效之间的关系。
通过分析员工的满意度调查问卷数据,了解不同绩效水平员工的满意度表现,为公司提供人力资源管理的参考依据。
2. 数据收集与处理我们从某公司的员工中随机选取了一部分样本,共有500名员工参与了满意度调查。
他们的满意度被评分为1-5,1表示极不满意,5表示非常满意。
此外,我们还收集了每位员工的绩效评价得分,绩效评价分数范围为0-100。
3. 数据分析a. 描述性统计分析首先,我们对数据进行描述性统计分析,以了解员工满意度和绩效的整体状况。
根据统计结果显示,员工的满意度得分平均为3.8,标准差为0.9。
而绩效评价的平均得分为76.5,标准差为12.3。
这些数据为下一步的分析提供了基础。
b. 相关性分析为了探究员工满意度与绩效之间的关系,我们进行了相关性分析。
结果显示,员工满意度与绩效评价之间存在显著正相关关系(r = 0.65,p < 0.01)。
这意味着满意度较高的员工往往具有较好的绩效表现。
c. 回归分析为了更加深入地分析员工满意度对绩效的影响程度,我们进行了回归分析。
通过建立线性回归模型,我们发现员工满意度对绩效评价有显著的预测作用(β = 0.75,p < 0.01)。
这说明员工满意度每提高1个单位,其绩效评价将增加0.75个单位。
4. 结果解释与总结通过对数据分析的结果进行解释,我们可以得出以下结论:首先,员工满意度与绩效评价之间存在显著正相关关系,即满意度越高,绩效评价越好。
其次,在回归分析中,员工满意度对绩效具有预测作用,满意度的提升将促进员工绩效的提高。
spss的数据分析报告范文SPSS 的数据分析报告范文一、引言在当今的信息时代,数据成为了决策的重要依据。
通过对数据的深入分析,我们可以发现隐藏在其中的规律和趋势,为企业的发展、学术研究以及社会问题的解决提供有力的支持。
本报告将以具体数据集名称为例,运用 SPSS 软件进行数据分析,旨在揭示数据背后的有价值信息。
二、数据来源与背景(一)数据来源本次分析所使用的数据来源于具体的收集途径,如问卷调查、数据库等。
共收集了具体数量个样本,涵盖了相关的变量或指标。
(二)背景介绍这些数据是为了研究研究的主题或问题而收集的。
例如,可能是为了了解消费者的购买行为、员工的工作满意度,或者是某种疾病的发病因素等。
三、数据预处理(一)数据清理首先,对数据进行了初步的清理工作。
检查并处理了缺失值,对于少量的缺失值,采用了具体的处理方法,如均值填充、删除等;对于存在异常值的数据,通过具体的判断方法和处理方式进行了处理。
(二)数据编码对分类变量进行了编码,将其转换为数字形式,以便于后续的分析。
例如,将性别变量编码为 0 和 1,分别代表男性和女性。
(三)数据标准化为了消除不同变量量纲的影响,对部分数据进行了标准化处理,使得各个变量在相同的尺度上进行比较和分析。
四、描述性统计分析(一)集中趋势计算了各个变量的均值、中位数和众数。
例如,年龄变量的均值为具体数值,中位数为具体数值,众数为具体数值,从而了解数据的中心位置。
(二)离散程度通过计算标准差、方差和极差,来描述数据的离散程度。
例如,收入变量的标准差为具体数值,方差为具体数值,极差为具体数值,反映了收入的分布范围。
(三)分布形态绘制了直方图和箱线图,观察数据的分布形态。
例如,成绩变量呈现出近似正态分布,而工作时间变量则呈现出偏态分布。
五、相关性分析(一)变量之间的相关性计算了各个变量之间的皮尔逊相关系数,以判断变量之间的线性关系。
结果发现,变量 A 与变量 B 之间存在显著的正相关关系(r =具体数值,p < 005),而变量 C 与变量 D 之间则不存在显著的相关性(p > 005)。
spss的数据分析报告范文
二、数据分析1、频数分析。
基本的统计分析往往从频数分析开始。
通过频数分析能够了解变量的取值状况,对把握数据的分布特征非常有用。
此次分析利用了某公司474名职工基本状况的统计数据表,在gender(性别)、edcu(受教育水平程度)、不同的状况下的频数分析,从而了解该
公司职工的男女职工数量、受教育状况的基本分布。
StatiticGenderEducationalLevel(year)NValid474474Miing00首先,对该公司的男女性别分布进行频数分析,结果如
下:GenderFrequencyPercentValidPercentCumulativePercentValidFe male21645.645.645.6Male25854.454.4100.0Total474100.0100.0上表,
在该公司的474名职工中,有216名女性,258名男性,男女比例分别为45.6%和54.4%,该公司职工男女数量差距不大,男性略多于女性。
其次对原有数据中的受教育程度进行频数分析,结果如下
表:EducationalLevel(year)FrequencyPercentValidPercentCumulati vePercentValid85311.211.211.21219040.140.151.31461.31.352.515116 24.524.577.0165912.412.489.517112.32.391.81891.91.993.719275.75. 799.4202.4.499.8211.2.2100.0Total474100.0100.0上表及其直方图说明,被调查的474名职工中,受过12年教育的职工是该组频数最高的,
为190人,占总人数的40.1%,其次为15年,共有116人,占中人数的24.5%。
且接受过高于20年的教育的人数只有1人,比例很低。
2、描述统计分析。
再通过简单的频数统计分析了解了职工在性别和
受教育水平上的总体分布状况后,我们还需要对数据中的其他变量特征有
更为精确的认识,这就需要通过计算基本描述统计的方法来实现。
下面就
对各个变量进行描述统计分析,得到它们的均值、标准差、片度峰度等数据,以进一步把我数据的集中趋势和离散趋势。
3、E某ploratorydataanalyi。
(1)交叉分析。
通过频数分析能够掌握单个变量的数据分布情况,但是在实际分析中,不仅要了解单个变量的分布特征,还要分析多个变量不同取值下的分布,
掌握多个变量的联合分布特征,进而分析变量之间的相互影响和关系。
就
本数据而言,需要了解现工资与性别、年龄、受教育水平、起始工资、本
单位工作经历、以前工作经历、职务等级的交叉分析。
现以现工资与职务
等级的列联表分析为例,读取数据(下面数据分析表为截取的一部
分):单因素分析用来研究一个控制变量的不同水平是否对观测变量产
生了显著影响。
下面我们把受教育水平和起始工资作为控制变量,现工资
为观测变量,通过单因素方差分析方法研究受教育水平和起始工资对现工
资的影响进行分析。
分析结果如下:上表是起始工资对现工资的单因素
方差分析结果。
可以看出:F统计量的观测值为33.040,对应的概率P值
近似等于0,如果显著性水平为0.05,由于概率值P小于显著性水平q,
则应拒绝原假设,认为不同的起始工资对现工资产生了显著影响。
同理,上表是受教育水平对现工资影响的单因素分析结果,其结果亦
为拒绝原假设,所以不同的受教育水平对现工资产生显著影响。
4、相关分析。
相关分析是分析客观事物之间关系的数量分析法,明
确客观事物之间有怎样的关系对理解和运用相关分析是极其重要的。
函数关系是指两事物之间的一种一一对应的关系,即当一个变量某取
一定值时,另一个变量函数Y可以根据确定的函数取一定的值。
另一种普
遍存在的关系是统计关系。
统计关系是指两事物之间的一种非一一对应的
关系,即当一个变量某取一定值时,另一个变量Y无法根据确定的函数取
一定的值。
统计关系可分为线性关系和非线性关系。
事物之间的函数关系比较容易分析和测度,而事物之间的统计关系却
不像函数关系那样直接,但确实普遍存在,并且有的关系强有的关系弱,
程度各有差异。
如何测度事物之间的统计关系的强弱是人们关注的问题。
相关分析正是一种简单易行的测度事物之间统计关系的有效工具。
上表是对本次分析数据中,现工资、起始工资、本单位工作时间、以
前工作时间、年龄五个变量间的相关分析,表中相关系数旁边有两个星号(某某)的,表示显著性水平为0.01时,仍拒绝原假设。
一个星号(某)表示显著性水平为0.05是仍拒绝原假设。
先以现工资这一变量与其他变
量的相关性为例分析,由上表可知,现工资与起始工资的相关性最大,相
关系数为0.880,而与在本单位的工作时间相关性最小,相关系数为
0.084。
5、参数检验。
首先对现工资的分布做正态性检验,结果如下:由上图可知,现工
资的分布可近似看作符合正态分布,现推断现工资变量的平均值是否为$3,000,0,因此可采取单样本t检验来进行分析。
分析如下:One-SampleStatiticNMeanStd.DeviationStd.ErrorMeanOne-SampleTetTetValue=30000tdfSig.(2-
tailed)MeanDifference95%ConfidenceIntervaloftheDifferenceLowerUp perCurrentSalary5.635473.000$4,419.568$2,878.40$5,960.73由One-SampleStatitic可知,474名职工的现工资平均值为¥34,419.57,标准
差为$17,075.661,均值标准误差为$784.311。
图表One-SampleTet中,
第二列是t统计量的观测值为5.635;第三列是自由度为473(n-1);第四列是t统计量观测值的双尾概率值;第五列是样本均值和检验值的差;第六列和第七列是总体均值与原假设值差的95%的置信区间为($2,878.40,5,960.73)。
该问题的t值等于5.635对应的临界置信水平为0,远远小于设置的0.05,因此拒绝原假设,表明该公司的474名职工的现工资与$3,000,0存在显著差异。
6、非参数检验。
对本数据中的年龄做正态分布检验,结果如
下:由上图两图可知,474名职工的年龄分布并不完全符合正态分布,所以现推断其职工年龄的平均数在40-45岁之间,可对其采用非参数检验的方法进行检验。
检验结果如下:Chi-SquareTet上面的第一个表为卡方检验的频率表,输出有关频率统计。
从表中可知,职工年龄为40岁的有41名,期望值为23.5,残差为17.5,其余读取方式相同。
第二个表是卡方检验统计表,显示检验的卡方值,自由度和渐进显著性水平分别是28.489、5、0。
因为显著性水平0小于0.05,因此拒绝原假设,即474名职工的平均年龄不在40到45岁之间。