Spss数据分析报告
- 格式:docx
- 大小:26.09 KB
- 文档页数:12
SPSS数据分析报告(最终版)
本报告是基于SPSS软件对xxx的数据进行的分析以探索数据内容及特征的最终报告。
在本次数据分析中,主要使用了SPSS多维描述分析、卡方检验以及双因素方差分析
等多种统计方法,分析情况如下:
一、多维描述分析
通过SPSS对xxx的数据进行多维描述分析,我们可以获得如下结果:
1、利用计数分析,可以获得少数个变量的定量衡量索概况,如年龄段、人口性别比
例等;
2、通过求和和平均值等计算,可以得到多个变量的汇总信息,不仅可以做出宏观上
的判断,还能得到更加精准的数据判断;
3、对离散变量的分析可以通过比率图得出三维以上的图表,使变量的差异更加清晰
显示,以方便我们进行决策。
二、卡方检验
通过卡方检验,可以显示数据中变量之间的差异和关系,揭示变量的相互作用,以便
更好地弄清变量的影响程度。
本次分析结果是:xxxx变量与其它变量之间的关系属于非独立关系,有显著影响,有显著差异。
三、双因素方差分析
双因素方差分析是根据多个变量的相互作用来分析变量关系的一种方法。
SPSS双因素方差分析结果显示:两个变量xxx和yyy之间的相关性有显著的影响,差异显著,属于非
独立关系。
最终,本次数据分析结果表明,xxx的变量与其它变量之间有明显的差异和相关性,
从而可以有效地影响分析和决策,使政府、行业、公司等能够更好地掌握和把握市场发展
趋势。
SPSS数据分析报告一.研究背景数据分析是科学研究中非常重要的一个环节,它能够帮助研究者从数据中获取有用的信息以支持科学决策。
SPSS是常用的数据分析软件之一,它具有强大的数据处理和分析功能,可以帮助研究者进行多种统计分析。
二.数据收集与处理本研究收集到的数据包括100个样本,每个样本有以下三个变量:性别、年龄和收入。
数据收集过程中,通过问卷调查的方式获取了样本的性别和年龄信息,同时进行了收入的调查和记录。
对于数据的处理,首先进行了数据清洗,删去了有缺失值的样本。
然后进行了数据的转换和标准化,使得整个数据集具备可分析性。
三.描述性统计分析四.相关分析为了探究变量之间的相关关系,采用皮尔逊相关系数进行相关分析。
结果显示,性别与收入之间的相关系数为-0.15,呈现弱的负相关关系;年龄与收入之间的相关系数为0.28,呈现中等强度的正相关关系。
这些结果提示性别对收入的影响较小,而年龄对收入有一定的影响。
五.t检验六.回归分析为了探究年龄对收入的影响,进行了回归分析。
将“年龄”设为自变量,将“收入”设为因变量,进行线性回归分析。
结果显示,回归方程为Y=1000+100X,其中Y代表收入,X代表年龄。
回归方程的R^2为0.08,说明年龄可以解释收入的8%的变异性。
这个结果提示年龄对收入有一定的解释力。
七.结论与讨论通过对100个样本的数据进行SPSS分析,我们得出以下结论:性别对收入的影响不显著。
年龄与收入呈现中等强度的正相关关系,年龄可以解释收入的8%的变异性。
这些结果对我们理解收入的影响因素具有指导意义,也给我们提供了相应的决策支持。
总之,SPSS数据分析报告可以帮助研究者从收集到的数据中提取有用信息,并对变量之间的关系进行探究。
通过描述性统计分析、相关分析、t检验和回归分析等方法,我们可以得出科学的结论,为进一步的科学研究和实践提供支持。
SPSS数据分析报告书的优缺点SPSS(Statistical Package for the Social Sciences)是一种广泛使用的统计分析软件,以下是SPSS数据分析报告书的优缺点:优点:1.强大的统计分析功能:SPSS提供了丰富的统计方法和分析工具,包括描述统计、假设检验、回归分析、方差分析等,可以满足各种数据分析需求。
2.用户友好的界面:SPSS采用直观的图形用户界面,使得数据分析和结果解释相对容易。
用户可以通过菜单、对话框和图形界面直观地进行数据输入、变量定义和分析操作。
3.数据处理和数据清洗:SPSS具有数据预处理功能,可以进行数据清洗、缺失值处理、异常值检测和数据转换等操作,使得数据更加适合分析和建模。
4.输出结果的可视化和报告生成:SPSS的分析结果可以以表格、图形等形式进行可视化展示,并支持结果导出和报告生成,方便用户进行结果解释和汇报。
缺点:1.学习曲线较陡:对于初学者来说,SPSS的学习曲线可能相对较陡,特别是对于没有统计学基础的用户。
需要一定的时间和学习成本,以掌握软件的使用和数据分析的基本原理。
2.价格较高:SPSS是商业软件,相对而言价格较高,这可能对个人用户或小型团队来说是一个不小的负担。
3.输出结果的定制性有限:在某些情况下,用户可能需要对输出结果进行更加灵活和个性化的定制,但SPSS的定制性有限,无法满足所有的需求。
4.无法实现复杂的编程和自定义分析:尽管SPSS提供了各种分析方法和功能,但在处理一些复杂的数据分析和建模需求时,可能会受到软件的功能限制。
综上所述,SPSS作为一种统计分析软件,具有强大的功能和用户友好的界面,适合进行常规的统计分析。
然而,对于高级用户和需要复杂分析的用户来说,可能需要考虑其他功能更为强大、灵活性更高的工具。
spss数据分析报告一、引言数据分析是科学研究中不可或缺的一环,它通过收集、整理和解释数据,为研究者提供可靠的依据和结论。
SPSS(统计分析软件包)是一种常用的数据分析工具,它提供了丰富的统计方法和功能,可以帮助研究者深入探究数据背后的规律。
本报告基于SPSS,对某项研究中的数据进行了深入分析。
二、研究目的与方法本研究旨在探究A地区人民对X产品的满意度与其年龄、性别、教育程度以及家庭收入之间的关系。
研究采用问卷调查的方法,共调查了200名居民。
问卷中分为多个维度的评价和个人信息,调查数据被输入SPSS软件进行分析处理。
三、数据处理与描述统计首先,对收集到的调查数据进行了处理和清洗,包括删除缺失值和异常值。
处理后得到完整的200个有效样本。
1.样本描述对于参与调查的200名居民,其中男性占比为50%,女性占比为50%。
年龄分布如下图所示:(插入年龄分布图表)调查结果显示,参与调查者的年龄跨度在20岁至65岁之间,平均年龄为35岁。
另外,在教育程度方面,本样本中具有高中学历的居民占比最高,达到40%,其次是大学学历(30%)、研究生学历(20%)和博士学历(10%)。
家庭收入方面,本研究将其按照万元进行划分,结果显示家庭收入在5万元至20万元之间的居民最多,达到60%,其次是20万元以上的居民(30%),5万元以下的居民占比最低(10%)。
2.满意度分析根据调查问卷中关于X产品的评价维度,对居民的满意度进行了评估。
结果显示,在外观方面,占比较高的是“非常满意”选项,达到55%;在性能方面,占比较高的是“满意”选项,达到60%;在价格方面,占比最高的是“一般满意”选项,达到45%;在服务方面,占比最高的是“非常满意”选项,达到50%。
通过综合评估,我们发现大约有40%的居民对X产品非常满意,30%的居民对产品满意,20%的居民认为产品一般,10%的居民表示不满意。
四、相关分析为了进一步探究A地区居民对X产品的满意度与其年龄、性别、教育程度和家庭收入之间的关系,我们进行了相关分析。
SPSS数据分析报告1. 简介本报告主要针对SPSS数据分析进行详细说明和分析。
SPSS (Statistical Package for the Social Sciences)是一种常用的统计软件,广泛应用于社会科学研究、市场调研以及数据分析领域。
通过对样本数据的统计分析和建模,我们可以得出一些有关于总体的结论,以及预测和推断的结论。
2. 数据收集与准备首先我们需要收集和准备数据。
数据收集方法包括问卷调查、实地观察、实验、访谈等。
将收集的原始数据整理成适合SPSS导入的格式,例如Excel表格,确保数据的准确性和完整性。
掌握数据的基本情况是进行分析的前提。
我们可以通过查看数据的描述性统计信息了解数据的分布情况,包括平均值、标准差、最大值、最小值等。
此外,还可以使用SPSS的数据透视表功能,进行数据预处理,例如数据清洗、缺失数据处理、异常值处理等。
3. 数据分析方法在对数据进行具体分析之前,需要确定分析的目的和方法。
根据数据的类型和研究问题的要求,可以选择合适的统计方法。
常用的数据分析方法包括描述性统计、频率分析、相关分析、回归分析、聚类分析、因子分析等。
在使用SPSS进行数据分析时,需要首先导入数据。
然后根据分析的目的选择相应的分析方法,设置变量的属性和参数,运行分析过程,最后生成相应的分析结果。
4. 数据分析结果根据具体的研究问题和数据分析方法,可以得出一系列的数值结果和图表展示。
例如,在描述性统计中,我们可以得到关于数据分布的常用统计指标,如平均值、标准差、中位数、众数等。
这些指标可以帮助我们了解数据的集中趋势和离散程度。
在频率分析中,我们可以得到数据的分布情况。
通过柱状图或饼图等可视化方式,可以更直观地展示数据的分布情况。
在相关分析中,我们可以得到变量之间的相关系数,通过相关矩阵和散点图,可以了解变量之间的关系强度和方向。
在回归分析中,我们可以得到自变量和因变量之间的关系模型。
通过回归方程和回归系数,可以进一步预测和解释因变量的变化。
spss分析报告SPSS分析报告。
一、研究背景。
本次研究旨在通过SPSS软件对某公司员工满意度进行分析,以期了解员工对公司工作环境、福利待遇、领导管理等方面的满意程度,为公司提供改进管理和营造更好工作氛围的参考。
二、研究方法。
我们采用了问卷调查的方式,共有200名员工参与了本次调查。
问卷涵盖了员工满意度的各个方面,包括工作内容、薪酬福利、领导管理、团队氛围等。
在收集完问卷数据后,我们使用SPSS软件对数据进行了整理和分析。
三、数据分析结果。
1. 员工满意度整体情况。
通过对问卷数据的分析,我们发现员工整体满意度得分为75分(满分100分),整体来说员工对公司的满意度属于中等偏上水平。
2. 不同方面的满意度情况。
在工作内容方面,员工满意度得分为80分,表明大部分员工对自己的工作内容较为满意。
而在薪酬福利方面,员工满意度得分为70分,略低于整体满意度,说明公司在薪酬福利方面还有待提高。
在领导管理和团队氛围方面,员工满意度得分分别为75分和78分,整体表现较为稳定。
3. 不同部门的满意度差异。
通过对不同部门员工满意度的分析,我们发现在薪酬福利方面,销售部门的员工满意度得分最低,仅为65分,而技术部门的员工满意度得分最高,达到了85分。
这表明公司在薪酬福利方面需要重点关注销售部门的员工满意度。
四、结论与建议。
通过本次研究,我们得出了以下结论和建议:1. 公司整体员工满意度属于中等偏上水平,但在薪酬福利方面仍有提升空间,建议公司加大对薪酬福利的投入,提高员工的福利待遇。
2. 不同部门的员工满意度存在差异,公司应根据不同部门的情况,有针对性地改进管理和营造更好的工作氛围,提高员工满意度。
3. 未来可以定期进行员工满意度调查,以便及时了解员工的需求和反馈,为公司的管理决策提供科学依据。
总之,SPSS分析报告为公司提供了员工满意度的全面数据支持,为公司改进管理和提升员工满意度提供了重要参考。
希望公司能够根据本报告提出的建议,不断优化管理,营造更好的工作环境,提高员工满意度,为公司的长远发展打下良好基础。
spss的数据分析报告一、引言数据分析是研究中的关键步骤,它通过对数据的整理、描述和解释,为研究者提供了对研究问题作出有效判断和支持决策的依据。
SPSS (Statistical Package for the Social Sciences)是一种常用的统计软件工具,被广泛应用于数据分析领域。
本报告将通过使用SPSS对某研究调查数据进行分析,展示如何利用SPSS进行数据分析以得出有关研究问题的科学结论。
二、研究问题和数据说明本次研究调查旨在了解某地区大学生的学习压力与心理健康的关系。
我们采用了问卷调查的方式,共收集到了300份有效问卷。
其中,学习压力作为自变量,心理健康作为因变量。
学习压力通过1-10分的等级进行评估,分数越高表示学习压力越大;心理健康通过1-5分的等级进行评估,分数越高表示心理健康状况越良好。
三、数据处理为了进行数据分析,我们首先对数据进行处理和清洗,以确保数据的准确性和一致性。
对于缺失数据的处理,我们选择采用均值替代法,即将缺失值用该变量的平均值进行替代。
之后,我们导入SPSS中进行进一步的分析。
四、描述统计分析首先,我们对样本数据进行描述统计分析,以了解样本的整体情况。
通过SPSS的统计分析功能,我们计算了学习压力和心理健康的均值、标准差等指标。
结果显示,样本的平均学习压力评分为7.2,标准差为1.5;平均心理健康评分为3.8,标准差为0.9。
这表明,整体上大学生的学习压力较大,心理健康状况一般。
五、相关性分析为了深入了解学习压力与心理健康之间的关系,我们进行了相关性分析。
相关性分析可以帮助我们判断两个变量之间是否存在线性关系以及相关强度的大小。
在SPSS中,我们可以通过相关矩阵、散点图和相关系数来进行分析。
根据我们的分析结果,学习压力与心理健康之间存在显著的负相关关系(相关系数为-0.36,p < 0.05)。
这表明学习压力增加时,心理健康状况相对较差。
散点图也呈现了这一趋势,随着学习压力的增加,心理健康评分呈现下降的趋势。
spss的数据分析报告范文SPSS 的数据分析报告范文一、引言在当今的信息时代,数据成为了决策的重要依据。
通过对数据的深入分析,我们可以发现隐藏在其中的规律和趋势,为企业的发展、学术研究以及社会问题的解决提供有力的支持。
本报告将以具体数据集名称为例,运用 SPSS 软件进行数据分析,旨在揭示数据背后的有价值信息。
二、数据来源与背景(一)数据来源本次分析所使用的数据来源于具体的收集途径,如问卷调查、数据库等。
共收集了具体数量个样本,涵盖了相关的变量或指标。
(二)背景介绍这些数据是为了研究研究的主题或问题而收集的。
例如,可能是为了了解消费者的购买行为、员工的工作满意度,或者是某种疾病的发病因素等。
三、数据预处理(一)数据清理首先,对数据进行了初步的清理工作。
检查并处理了缺失值,对于少量的缺失值,采用了具体的处理方法,如均值填充、删除等;对于存在异常值的数据,通过具体的判断方法和处理方式进行了处理。
(二)数据编码对分类变量进行了编码,将其转换为数字形式,以便于后续的分析。
例如,将性别变量编码为 0 和 1,分别代表男性和女性。
(三)数据标准化为了消除不同变量量纲的影响,对部分数据进行了标准化处理,使得各个变量在相同的尺度上进行比较和分析。
四、描述性统计分析(一)集中趋势计算了各个变量的均值、中位数和众数。
例如,年龄变量的均值为具体数值,中位数为具体数值,众数为具体数值,从而了解数据的中心位置。
(二)离散程度通过计算标准差、方差和极差,来描述数据的离散程度。
例如,收入变量的标准差为具体数值,方差为具体数值,极差为具体数值,反映了收入的分布范围。
(三)分布形态绘制了直方图和箱线图,观察数据的分布形态。
例如,成绩变量呈现出近似正态分布,而工作时间变量则呈现出偏态分布。
五、相关性分析(一)变量之间的相关性计算了各个变量之间的皮尔逊相关系数,以判断变量之间的线性关系。
结果发现,变量 A 与变量 B 之间存在显著的正相关关系(r =具体数值,p < 005),而变量 C 与变量 D 之间则不存在显著的相关性(p > 005)。
spss数据分析报告(共7篇):分析报告数据s pss spss数据报告怎么写spss数据分析实例说明 spss有哪些数据分析篇一:spss数据分析报告关于某班级2012年度考试成绩、获奖情况统计分析报告一、数据介绍:本次分析的数据为某班级学号排列最前的15个人在2012年度学习、获奖统计表,其中共包含七个变量,分别是:专业、学号、姓名、性别、第一学期的成绩、第二学期的成绩、考级考证数量,通过运用spss统计软件,对变量进行频数分析、描述分析、探索分析、交叉列联表分析,以了解该班级部分同学的综合状况,并分析各变量的分布特点及相互间的关系。
二、原始数据:三、数据分析1、频数分析(1)第一学期考试成绩的频数分析进行频数分析后将输出两个主要的表格,分别为样本的基本统计量与频数分析的结果1)样本的基本统计量,如图1所示。
样本中共有样本数15个,第一学期的考试成绩平均分为627.00,中位数为628.00,众数为630,标准差为32.859,最小值为568,最大值为675。
“第一学期的考试成绩”的第一四分位数是602,第二四分位数为628,第三四分位数为657。
2)“第一学期考试成绩”频数统计表如图2所示。
3) “第一学期考试成绩”Histogram图统计如图3所示。
(2)、第二个学期考试成绩的频数分析1)样本的基本统计量,如图4所示。
第二学期的考试成绩平均分为463.47,中位数为452.00,众数为419,标准差为33.588,最小值为419,最大值为522。
“第二学期的考试成绩”的第一四分位数是435,第二四分位数为452,第三四分位数为496。
3)”第二学期考试成绩”频数统计表如图5所示。
3) “第二学期考试成绩”饼图统计如图6所2、描述分析描述分析与频数分析在相当一部分中是相重的,这里采用描述分析对15位同学的考级考证情况进行分析。
输出的统计结果如图7所示。
从图中我们可以看到样本数15,最小值1,最大值4,标准差0.941等统计信息。
SPSS数据分析报告影响大学生网购行为因素分析专业:学号:姓名:影响大学生网购行为因素分析本文主要利用SPSS通过对大学在校生的网购行为的数据分析,得出大学生网购市场潜力巨大,网上购物市场已经形成的结论,为进一步研究大学生购物行为和网购市场的发展提供参考。
信息技术的进步促进了电子商务的迅速发展,伴随着电子商务的蓬勃发展,消费者的消费方式随之发生了巨大变革,开始朝着个性消费、主动消费的方向展,即网络购物。
根据中国互联网信息中心发布的第20次中国互联网络发展状况统计显示,截至2007年6月,中国网民总人数达到1.62亿,使用网络购物的网民占25.5%。
其中,大学生网民(18-24)占网民总体的33.5%,使用网络购物人数占网络购物网民数的半数以上。
由此可以看到大学生构成了网络购物的主力军。
影响消费者网购行为的因素有很多。
一,调查结果统计与分析1,样本数据的总体特征(1),样本的性别、年级比例年级频率百分比有效百分比累积百分比有效一年级 1 1.3 1.3 1.3二年级65 85.5 85.5 86.8三年级 2 2.6 2.6 89.5四年级8 10.5 10.5 100.0合计76 100.0 100.0最少,其次,城镇和县乡比例相当。
(3)样本中大学生每月可支配收大学生普遍每月可支配收入在400~800之间,其次则是400元以下和800~1200,而1200以上的学生数量微乎其微,由此可以看出大学生每月能够在网购上消费的资金有一定的限制。
2、利用因子分析,了解大学生网购的有关信息(1)大学生了解网购的途径Component Matrix aComponent1 2 3您是否通过电视广播了解网购.807 .153 .076您是否通过报纸杂志了解网购.794 .244 .087通过因子分析,可得各因素得分矩阵,分析可知,被调查的大学生主要是通过电视报纸和网络了解网购的。
(2)大学生对网购的了解程度验值为0.968>0.8说明样本取样足够度大,Bartlett's Testof Sphericity检验的显著性水平为0.000,说明检验是显著的。
22SPSS 期末报告关于员工受教育程度对其工资水 平的影响统计分析报告SPSS 统计分析方法姓汤重阳号:学三班所在班级:目录一、 数据样本描述 .....................二、 要解决的问题描述 .....................1数据管理与软件入门部分11.1分类汇总 ............1.2个案排秩 ............1.3连续变量变分组变量2统计描述与统计图表部分 2.1频数分析.……2.2描述统计分析3假设检验方法部分 23.1分布类型检验3.1.1 正态分布.3.1.2 二项分布.课程名称: 名:人力资源管理所在专业:3.1.3 游程检验 (2)3.2 单因素方差分析 (2)3.3 卡方检验 (2)3.4 相关与线性回归的分析方法 (2)3.4.1 相关分析(双变量相关分析&偏相关分析) (2)3.4.2 线性回归模型 (2)4 高级阶段方法部分.....................................2三、具体步骤描述 (3)1 数据管理与软件入门部分..................................31.1 分类汇总 (3)1.2 个案排秩 (3)1.3 连续变量变分组变量 (4)5 ........................................................ 统计描述与统计图表部分22.1 频数分析 (5)2.2 描述统计分析 (6)3 假设检验方法部分.....................................73.1 分布类型检验 (7)3.1.1 正态分布 (7)3.1.2 二项分布 (8)3.1.3 游程检验 (9)3.2 单因素方差分析 (10)3.3 卡方检验 (12)3.4 相关与线性回归的分析方法 (13)3.4.1 相关分析 (13)3.4.2 线性回归模型 (15)4 高级阶段方法部分.....................................164.1 信度 (16)71 ................................................................... 效度4.2一、数据样本描述分析数据来自于“微盘一一SPSS数据包data02-01 ”。
本次分析的数据为某公司474名职工状况统计表,其中共包含11 个变量,分别是: id (职工编号),gender(性别),bdate(出生日期),edcu(受教育水平程度), jobcat (职务等级),salbegin (起始工资),salary (现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。
通过运用SPSS统计软件,对变量进行统计分析,以了解该公司职工总体状况,并分析职工受教育程度、起始工资、现工资的分布特点及相互间的关系。
二、要解决的问题描述1 数据管理与软件入门部分1.1 分类汇总以受教育水平程度为分组依据,对职工的起始工资和现工资进行数据汇总。
1.2 个案排秩对受教育水平程度不同的职工起始工资和现工资进行个案排秩。
1.3 连续变量变分组变量将被调查者的年龄分为10 组,要求等间距。
2 统计描述与统计图表部分2.1 频数分析利用了某公司474 名职工基本状况的统计数据表,在性别、受教育水平程度不同的状况下进行频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。
2.2 描述统计分析标得到它们的均值、对职工起始工资进行描述统计分析,以职工受教育水平程度为依据,准差、偏度峰度等数据,以进一步把握数据的集中趋势和离散趋势。
3 假设检验方法部分3.1 分布类型检验3.1.1 正态分布分析职工的现工资是否服从正态分布。
3.1.2 二项分布抽样数据中职工的性别分布是否平衡。
3.1.3 游程检验该样本中的抽样数据是否随机。
3.2 单因素方差分析把受教育水平和起始工资作为控制变量,现工资为观测变量,通过单因素方差分析方法研究受教育水平和起始工资对现工资的影响进行分析。
3.3 卡方检验职工的起始工资水平和现工资水平与其受教育程度之间是否存在关联性。
3.4 相关与线性回归的分析方法341相关分析(双变量相关分析&偏相关分析)对受教育程度和现工资两个变量进行相关性分析。
342线性回归模型建立用受教育程度预测现工资水平的回归方程高级阶段方法部分4对该样本数据进行信效度检测三、具体步骤描述1数据管理与软件入门部分1.1分类汇总以受教育水平为分组依据,对职工的起始工资和现工资进行数据汇总。
分类汇总数据1.1图个等年等图中所示1014受教育等级以年为单位划分可分为8年、12年、由图1.1 所示,美元,统计13064.15美元,起始工资均值为8年为例,现工资均值为24399.06级。
以等级为2015年和年的职工在公司中占大多数,教育年限为53 量为人。
经比较可知,教育年限为12年的职工现工资平均水1921年和年的职工在公司中的初始工资平均水平较高,但教育年限为平较高。
个案排秩1.2对受教育水平程度不同的职工起始工资和现工资进行个案排秩。
•1.2-1 现工资水平个案排秩统计量表统计资料Rank of salary by educ474 有效N0遗漏60.43460平均数46.50000 中位数50.975992标准偏差189.000 范围1.000最小值190.000最大值表1.2-2 初始工资水平个案排秩统计量统计资料Rank of salbegi n by educ有效474N0遗漏60.43460 平均数47.50000中位数50.865407标准偏差189.000 范围1.000 最小值190.000最大值1.3连续变量变分组变量将被调查者的年龄分为5组。
被调查者年龄分布(已分组) 1.3 表.,age次百分有效的百分累积百分<33.21.2.21.361.3>731.556.356.326733~4357.815.015.0 有7143~5372.814.16714.153~6386.913.16213.163~73100.0100.0100.0474总计根据表1.3所示,该公司474名职员年龄几乎全部在33岁以上、73岁以下,年龄层分布集中在已有工作经验的人当中,其中33~43岁的员工为该公司的主体。
2统计描述与统计图表部分2.1频数分析利用了某公司474名职工基本状况的统计数据表,在性别、受教育水平程度不同的状况下进行频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。
表2.1-1 职工性别频数统计表 .Gen der次数百分比有效的百分比累积百分比45.6216 45.6 Female45.654.4258 Male 有效54.4100.0100.0100.0总计474由表2.1-1可知,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为45.6%和54.4%,该公司职工男女数量差距不大,男性略多于女性。
下面对该公司员工受教育程度进行频数分析:2.1-2 职工受教育程度频数统计表表Educational Level (years)次数百分比有效的百分比累积百分比11.2 11.2 11.2 53 8190 51.3 40.1 40.1 1252.5 6 1.3 1.3 1477.0 116 24.5 24.5 151689.5 59 12.4 12.417 91.8 11 2.3 2.3 有效18 93.7 9 1.9 1.919 99.4 27 5.7 5.799.8 20 .4 .4 2100.0.2 .2 1 21100.0总计474100.0图 2.1-2 职工受教育程度频数分布直方图表 2.1-2 及其直方图说明,被调查的474 名职工中,受过12 年教育的职工是该组频数最高的,为190 人,占总人数的40.1%,其次为15年,共有116人,占总人数的24.5%。
且接受过高于20年的教育的人数只有 1 人,比例很低。
2.2 描述统计分析以职工受教育水平程度为依据,对职工起始工资进行描述统计分析,得到它们的均值、标准差、偏度峰度等数据,以进一步把握数据的集中趋势和离散趋势。
(由于输出结果较长,为了便于解释,仅截取职工受教育水平年限为8 年的分析结果)图 2.2-1 职工起始工资描述统计表(部分)图2.2-2 职工起始工资描述统计直方图(部分)年时职工起始工资的描述统计,由此得出结论如下:8 给出的就是以受教育年限为2.2 图截尾均数为,5%2.2-1 可知,职工起始工资均值为$13064.15(1)集中趋势指标:由图,三者差异较大,说明数据分布的对称性较差。
$13016.35 ,中位数为$13050.00 ,样2408.147 )离散趋势指标:起始工资方差为5799170.900,其平方根即标准差为(2,中间一半样本的$9000,极大值为美元18750,两者之差为全距(范围)本中极小值为$9750 。
全距为四分位间距$4875 可信区间为95%$330.784,相应的总体均数(3)参数估计:职工起始工资的标准误差为。
$12400.38-$13727.92 曲线右偏;0.148>0 ,4)分布特征指标:根据描述统计数据可知,该样本数据中偏度为(的直方图及其曲线中看出)。
-1.219<3 ,曲线较为平缓(该结论也可从图 2.2-2 峰度为假设检验方法部分3分布类型检验 3.1正态分布 3.1.1分析职工的现工资是否服从正态分布。
:职工的现工资服从正态分布H0 :职工的现工资不服从正态分布H1=0.05a 3.1.1 职工现工资正态分布检验结果表单一样本Kolmogorov-Smirnov 检定Current Salary474 N$34,419.57 平均数a,b 常态参数标准偏差$17,075.661绝对.208最极端差异正.208负-.143.208 测试统计资料 c .000 渐近显着性(双尾)检定分配是常态的。
a.从资料计算。
b.显着更正。
c. Lilliefors检验详细模型输出结果图3.1.1 K-S P=0.000P<a接受H1,认为职工的现工资统计量不服从正态分布。
3.1.2 二项分布抽样数据中职工的性别分布是否平衡。
H0:抽样数据中职工性别比例无差异H1:抽样数据中职工性别比例有差异a =0.05表 3.1.2 职工性别二项分布检验结果二项式检定精确显着性(双检定比例。
观察比例。
类别N 尾).54258 1群组male.060.50.46 female216 群组2 gender1.00474总计P=0.06a P>,认为抽样数据中职工性别比例无差异。