当前位置:文档之家› 利用SPSS软件对量表进行因素分析

利用SPSS软件对量表进行因素分析

利用SPSS软件对量表进行因素分析
利用SPSS软件对量表进行因素分析

本节将介绍利用SPSS软件对量表进行处理分析。

在获取原始数据后,我们利用SPSS对量表可以作出三种分析,即项目分析、因素分析和信度分析。

项目分析,目的是找出未达显著水准的题项并把它删除。它是通过将获得的原始数据求出量表中题项的

临界比率值——CR值来作出判断。通常,量表的制作是要经过专家的设计与审查,因此,题项一般均

具有鉴别度,能够鉴别不同受试者的反应程度。故往往在量表处理中可以省去这一步。

因素分析,目的是在多变量系统中,把多个很难解释,而彼此有关的变量,转化成少数有概念化意义而

彼此独立性大的因素,从而分析多个因素的关系。在具体应用时,大多数采用“主成份因素分析”法,它

是因素分析中最常使用的方法。

信度分析,目的是对量表的可靠性与有效性进行检验。如果一个量表的信度愈高,代表量表愈稳定。也

就表示受试者在不同时间测量得分的一致性,因而又称“稳定系数”。根据不同专家的观点,量表的信度

系数如果在0.9以上,表示量表的信度甚佳。但是对于可接受的最小信度系数值是多少,许多专家的看

法也不一致,有些专家定为0.8以上,也有的专家定位0.7以上。通常认为,如果研究者编制的量表的

信度过低,如在0.6以下,应以重新编制较为适宜。

在本节中,主要介绍利用SPSS软件对量表进行因素分析。

一、因素分析基本原理

因素分析是通过求出量表的“结构效度”来对量表中因素关系作出判断。在多变量关系中,变量间线性组合对表现或解释每个层面变异数非常有用,主成份分析主要目的即在此。变量的第一个线性组合可以解释最大的变异量,排除前述层次,第二个线性组合可以解释次大的变异量,最后一个成份所能解释总变异量的部份会较少。

主成份数据分析中,以较少成份解释原始变量变异量较大部份。成份变异量通常用“特征值”表示,有时也称“特性本质”或“潜在本质”。因素分析是一种潜在结构分析法,其模式

理论中,假定每个指针(外在变量或称题项)均由两部分所构成,一为“共同因素”、一为“唯一因素”。共同因素的数目会比指针数(原始变量数)还少,而每个指针或原始变量皆有一个唯一因素,亦即一份量表共有n个题项数,则会有n个唯一因素。唯一因素性质有两个假定:

(1)所有的唯一因素彼此间没有相关;

(2)所有的唯一因素与所有的共同因素间也没有相关。

至于所有共同因素间彼此的关系,可能有相关或可能皆没有相关。在直交转轴状态下,

所有的共同因素间彼此没有相关;在斜交转轴情况下,所有的共同因素间彼此就有相关。因素分析最常用的理论模式如下:

其中

(1)为第i个变量的标准化分数。

(2)Fm为共同因素。

(3)m为所有变量共同因素的数目。

(4)为变量的唯一因素

(5)为因素负荷量。

因素分析的理想情况,在于个别因素负荷量不是很大就是很小,这样每个变量才能与较少的共同因素产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则彼此间或与共同因素间就不能有关联存在。

从共同性的大小可以判断这个原始变量与共同因素间之关系程度。而各变量的唯一因素大小就是1减掉该变量共同性的值。(在主成份分析中,有多少个原始变量便有多少个成份,所以共同性会等于1,没有唯一因素)。

为此共同因素可以解释的变异量,因素分析的目的之一,即在因素结构的简单化,希望以最少的共同因素,能对总变异量作最大的解释,因而抽取得因素愈少愈好,但抽取因素的累积解释的变异量愈大愈好。

我们通过一个例子说明如何利用SPSS软件对量表进行分析。

二、利用SPSS对量表进行因素分析

【例6-9】现要对远程学习者对教育技术资源的了解和使用情况进行了解,设计一个里克特量表,如表6-27所示。

将该量表发放给20人回答,假设回收后的原始数据如表6-28所示。

操作步骤:

⒈录入数据

定义变量“A1”、“A2”、“A3”、“A5”、“A6”、“A7”、“A8”、“A9”、“A10”,并按照表输入数据,如图6-33所示。

⒉因素分析

(1)选择“AnalyzeData ReductionFactor…”命令,弹出“Factor Analyze”对话框,将变量“A1”到“A10”选入“Variables”框中,如图6-34所示。

(2)设置描述性统计量

单击图6-34对话框中的“Descriptives…”按钮,弹出“Factor Analyze:Descriptives”(因素分析:描述性统计量)对话框,如图6-35所示。

①“Statistics”(统计量)对话框

A “Univariate descriptives”(单变量描述性统计量):显示每一题项的平均数、标准差。

B “Initial solution”(未转轴之统计量):显示因素分析未转轴前之共同性、特征值、变异数百分比及累积百分比。

②“Correlation Matric”(相关矩阵)选项框

A “Coefficients”(系数):显示题项的相关矩阵

B “Significance levels”(显著水准):求出前述相关矩阵地显著水准。

C “Determinant”(行列式):求出前述相关矩阵地行列式值。

D “KMO and Bartlett’s test of sphericity”(KMO与Bartlett的球形检定):显示KMO 抽样适当性参数与Bartlett’s的球形检定。

E “Inverse”(倒数模式):求出相关矩阵的反矩阵。

F “Reproduced”(重制的):显示重制相关矩阵,上三角形矩阵代表残差值;而主对角线及下三角形代表相关系数。

G “Anti-image”(反映像):求出反映像的共变量及相关矩阵。

在本例中,选择“Initial solution”与“KMO and Bartlett’s test of sphericity”二项,单击“C ontinue”按钮确定。

(3)设置对因素的抽取选项

单击图6-34对话框中的“Extraction…”按钮,弹出“Factor Analyze:Extraction”(因素分析:抽取)对话框,如图6-36所示。

①“Method”(方法)选项框:下拉式选项内有其中抽取因素的方法:

A “Principal components”法:主成份分析法抽取因素,此为SPSS默认方法。

B “Unweighted least squares”法:未加权最小平方法。

C “Generalized least square”法:一般化最小平方法。

D “Maximum likelihood”法:最大概似法。

E “Principal-axis factoring”法:主轴法。

F “Alpha factoring”法:α因素抽取法。

G “Image factoring”法:映像因素抽取法。

②“Analyze”(分析)选项框

A “Correlation matrix”(相关矩阵):以相关矩阵来抽取因素

B “Covariance matrix”(共变异数矩阵):以共变量矩阵来抽取因素。

③“Display”(显示)选项框

A “Unrotated factor solution”(未旋转因子解):显示未转轴时因素负荷量、特征值及共同性。

B “Scree plot”(陡坡图):显示陡坡图。

④“Extract”(抽取)选项框

A “Eigenvalues over”(特征值):后面的空格默认为1,表示因素抽取时,只抽取特征值大于1者,使用者可随意输入0至变量总数之间的值。

B “Number of factors”(因子个数):选取此项时,后面的空格内输入限定的因素个数。

在本例中,设置因素抽取方法为“Principal components”,选取“Correlation matrix”、“U nrotated factor solution”、“Principal components”选项,在抽取因素时限定在特征值大于1者,即SPSS的默认选项。单击“Continue”按钮确定。

(4)设置因素转轴

单击图6-34对话框中的“Rotation…”按钮,弹出“Factor Analyze:Rotation”(因素分析:旋转)对话框,如图6-37所示。

①“Method”(方法)选项方框内六种因素转轴方法:

A “None”:不需要转轴

B “Varimax”:最大变异法,属正交转轴法之一。

C “Quartimax”:四次方最大值法,属正交转轴法之一。

D “Equamax”:相等最大值法,属正交转轴法之一。

E “Direct Oblimin”:直接斜交转轴法,属斜交转轴法之一。

F “Promax”:Promax转轴法,属斜交转轴法之一。

②“Display”(显示)选项框:

A “Rotated solution”(转轴后的解):显示转轴后的相关信息,正交转轴显示因素组型矩阵及因素转换矩阵;斜交转轴则显示因素组型、因素结构矩阵与因素相关矩阵。

B “Loading plots”(因子负荷量):绘出因素的散步图。

③“Maximum Iterations for Convergence”:转轴时之行的叠代最多次数,后面默认得数字为25,表示算法之行转轴时,执行步骤的次数上限。

在本例中,选择“Varimax”、“Rotated solution”二项。研究者要选择“Rotated solution”

选项,才能显示转轴后的相关信息。单击“Continue”按钮确定。

(5)设置因素分数

单击图6-34对话框中的“Scores…”按钮,弹出“Factor Analyze:Factor Scores”(因素分析:因素分数)对话框,如图6-38所示。

①“Save as variable”(因素存储变量)框

勾选时可将新建立的因素分数存储至数据文件中,并产生新的变量名称(默认为fact_1、fact_2、fact_3、fact_4等)。在“Method”框中表示计算因素分数的方法有三种:

A “Regression”:使用回归法。

B “Bartlett”:使用Bartlette法

C “Anderson-Robin”:使用Anderson-Robin法。

②“Display factor coefficient matrix”(显示因素分数系数矩阵)选项

勾选时可显示因数分数系数矩阵。

在本例中,取默认值。单击“Continue”按钮确定。

(6)设置因素分析的选项

单击图6-34对话框中的“Options…”按钮,弹出“Factor Analyze:Options”(因素分析:选项)对话框,如图6-39所示。

①“Missing Values”(遗漏值)选项框:遗漏值的处理方式。

A “Exclude cases listwise”(完全排除遗漏值):观察值在所有变量中没有遗漏值者才加以分析。

B “Exclude cases pairwise”(成对方式排除):在成对相关分析中出现遗漏值得观察值舍弃。

C “Replace with mean”(用平均数置换):以变量平均值取代遗漏值。

②“Coefficient Display Format”(系数显示格式)选项框:因素负荷量出现的格式。

A “Sorted by size”(依据因素负荷量排序):根据每一因素层面的因素负荷量的大小排序。

B “Suppress absolute values less than”(绝对值舍弃的下限):因素负荷量小于后面数字者不被显示,默认的值为0.1。

在本例中,选择“Exclude cases listwise”、“Sorted by size”二项,并勾选“Suppress abs olute values less than”,其后空格内的数字不用修改,默认为0.1。如果研究者要呈现所有因素负荷量,就不用选取“Suppress absolute values less than”选项。在例题中为了让研究者明白此项的意义,才勾选了此项,正式的研究中应呈现题项完整的因素负荷量较为适宜。单击“Continue”按钮确定。

设置完所有的选项后,单击“OK”按钮,输出结果。

⒊结果分析

(1)KMO及Bartlett’检验

如图6-40所示,显示KMO及Bartlett’检验结果。

KMO是Kaiser-Meyer-Olkin的取样适当性量数,当KMO值愈大时,表示变量间的共同因素愈多,愈适合进行因素分析,根据专家Kaiser(1974)观点,如果KMO的值小于0. 5时,较不宜进行因素分析,此处的KMO值为0.695,表示适合因素分析。

此外,从Bartlett’s球形检验的值为234.438,自由度为45,达到显著,代表母群体的相关矩阵间有共同因素存在,适合进行因素分析。

(2)共同性

如图6-41所示,显示因素间的共同性结果。

共同性中显示抽取方法威主成份分析法,最右边一栏为题项的共同性。

(3)陡坡图

如图6-42所示,显示因素的陡坡图。

从陡坡图中,可以看出从第三个因素以后,坡线甚为平坦,因而以保留3个因素较为适宜。

(4)整体解释的变异数——未转轴前的数据

如图6-43所示,显示的是未转轴前整体解释的变异数。

从图中可以看出,左边10个成份因素的特征值总和等于10。解释变异量为特征值除以题项数,如第一个特征值得解释变异量为6.358÷10 63.579%。

将左边10个成份的特征值大于1的列于右边。特征值大于1的共有三个,这也是因素分析时所抽出的共同因素数。由于特征值是由大到小排列,所以第一个共同因素的解释变异量通常是最大者,其次是第二个1.547,再是第三个1.032。

转轴后的特征值为4.389、3.137、1.411,解释变异量为43.885%、31.372%、14.108%,累积的解释变异量为43.885%、75.257%、89.366%。转轴后的特征值不同于转轴前的特征值。

(5)未转轴的因素矩阵

如图6-44所示,显示的是未转轴的因素矩阵。

从图中可以看出,有3个因素被抽取,并且因素负荷量小鱼0.1的未被显示。(6)转轴后的因素矩阵

如图6-45所示,显示了转轴后的因素矩阵。

从图中可以看出A1、A8、A6、A5、A4为因素一,A10、A9、A7为因素二,A3、A2为因素三。题项在其所属的因素层面顺序是按照因素负荷量的高低排列。

(7)因素转换矩阵

如图6-46所示,显示了因素转换矩阵。它是在“Factor Analysis:Rotation”对话框中“Dis play”选项框中选择“Rotated Solution”选项框以后生成该表。

⒋结果说明

根据因素的特征值和旋转后的因素矩阵,采用了主成份分析法抽取出3个因素作为共同因素,并使用因素转轴方法中的Varimax最大变异法,转轴后去掉了因素负荷量小于0.1的的系数,按照从大到小的顺序进行排列,使得变量与因素的关系豁然明了。对其作如表6-2

9 所示的因素分析摘要表。

spss分析里克特量表

第一步:建立数据 1. 打开SPSS 2. 在左下角点”variable view” 3. 在左上角输入“调查问卷”——将“Type类型”调成“sting字符型”——“Decimals 小数点”位数改成“0” 4. 从第二行开始依次输入“问题1,问题2,问题N”,并在每个问题的“Values 变量值”在输入:变量值Values框中为“1”/标签Label框中“非常不同意”点“add 添加”;然后依次输入2不同意3不一定4同意5非常同意 5. 以同样的方式输完所有的问题 第二步:输入数据 1. 左下角选“Data View数据视图” 2. 将每份问卷每道题的结果输入对应的框中 3. 以同样的方式将150份问卷输入 第三步:分析数据 1.在标题栏选择“Analyze分析”——“Description statistics描述性统计”——“Frequencies频数分析” 2.在频数分析对话框中,从左框选择要分析的问题到右框中 3.选择“Statistics统计”出现对话框 4.选择对应输出项即可:Mean平均数Std. deviation标准差variance方差range极差max最大min最小 5.同时也可以用“charts图表”选择要输出的图形 6.点击“OK确定”即可 7.然后再Output表中读取分析结果 8.注:因为所要分析的比较简单,能够很直观的从结果中分析出来,所以结果分析就不多解释了 PS:当然Excel也可以完成这样的分析,但SPSS软件比起Excel来要更专业些,所以用spss 做出来的结果更容易得到认可,也容易得高分,并且对于更复杂的问题Excel就显的不够用了

SPSS数据案例分析

SPSS数据案例分析

SPSS数据案例分析 目录 一.手机 APP 广告点击意愿的模型构建 (3) 1.1构建研究模型 (3) 1.2研究变量及定义 (4) 1.3研究假设 (4) 1.4变量操作化定义 (4) 1.5问卷设计 (5) 二.实证研究 (8) 2.1基础数据分析 (8) 2.2频数分布及相关统计量 (8) 2.3相关分析 (10) 2.4回归分析 (11) 2.5假设检验 (13)

一.手机APP 广告点击意愿的模型构建 1.1构建研究模型 我们知道效用期望、努力期望、社会影响对行为意愿会产生一定的影响,在模型中的性别、年龄、经验与自愿性等四个控制变量,通常都是作为控制变量来观察他们对采用因素与使用意向之间的关系的影响。因此,目前手机 APP 广告的使用人群年龄相对比较年轻,而且年龄特征分布高度集中,年龄在 30 岁以下的人群占到 70%以上,因此本研究考虑性别了这一变量,同时根据手机 APP 广告用户的特性,加入了手机流量作为控制变量,去观察它们对外部变量与点击意愿之间的关系是否有显著影响。 在本研究中,主要把调节变量和控制变量作为两个不同的研究变量,对于调节变量感知风险来说,它是直接影响了感知风险与手机 APP 广告点击意愿二者的关系;而控制变量性别、手机流量这些变量是对广告效用期望、APP 效用期望和社会影响与点击意愿直接的关系是否有显著影响。最后,本文根据手机APP 广告的特点对 UTAUT 模型进行扩展,构建了手机 APP 广告点击意愿的影响因素研究模型。

1.2研究变量及定义 1.3研究假设 (1) 广告效用期望、APP 效用期望、社会影响与手机 APP 点击意向的关系 H1:用户的广告效用期望与点击手机 APP 广告意愿正相关。 H2:用户的 APP 效用期望与点击手机 APP 广告意愿正相关 H3:社会影响与手机 APP 广告点击意愿正相关 (2)感知风险与点击手机 APP 广告意愿的关系 H4:感知风险与手机 APP 广告点击意愿负相关 H5:性别,手机流量对手机 APP 广告点击意愿没有显著影响 1.4变量操作化定义 广告效用期望:广告对我了解某品牌来说很有用 APP 效用期望:使用 APP 能够让我了解到多方面的信息 社会影响:身边的人都在使用手机 APP 广告,所以我也要使用 感知风险:在点击手机 APP 广告时,我担心我的个人隐私安全得不到保护 感知隐私安全重要性:确保点击手机 APP 广告是安全的,对我来说是很重

利用SPSS进行量表分析报告

第五节利用SPSS进行量表分析 在第五章调查研究中,我们介绍了量表得类型、编制得步骤及其应用,在本节将介绍利用SPS S软件对量表进行处理分析。 ?在获取原始数据后,我们利用SPSS对量表可以作出三种分析,即项目分析、因素分析与信度分析。 项目分析,目得就是找出未达显著水准得题项并把它删除。它就是通过将获得得原始数据求出量表中题项得临界比率值——CR值来作出判断。通常,量表得制作就是要经过专家得设计与审查,因此,题项一般均具有鉴别度,能够鉴别不同受试者得反应程度。故往往在量表处理中可以省去这一步。 因素分析,目得就是在多变量系统中,把多个很难解释,而彼此有关得变量,转化成少数有概念化意义而彼此独立性大得因素,从而分析多个因素得关系。在具体应用时,大多数采用“主成份因素分析”法,它就是因素分析中最常使用得方法。 信度分析,目得就是对量表得可靠性与有效性进行检验。如果一个量表得信度愈高,代表量表愈稳定。也就表示受试者在不同时间测量得分得一致性,因而又称“稳定系数”。根据不同专家得观点,量表得信度系数如果在0、9以上,表示量表得信度甚佳。但就是对于可接受得最小信度系数值就是多少,许多专家得瞧法也不一致,有些专家定为0、8以上,也有得专家定位 0、7以上。通常认为,如果研究者编制得量表得信度过低,如在0、6以下,应以重新编制较为 适宜。 ?在本节中,主要介绍利用SPSS软件对量表进行因素分析。 一、因素分析基本原理 因素分析就是通过求出量表得“结构效度”来对量表中因素关系作出判断。在多变量关系中,变量间线性组合对表现或解释每个层面变异数非常有用,主成份分析主要目得即在此。变量得第一个线性组合可以解释最大得变异量,排除前述层次,第二个线性组合可以解释次大得变异量,最后一个成份所能解释总变异量得部份会较少. ?主成份数据分析中,以较少成份解释原始变量变异量较大部份。成份变异量通常用“特征值”表示,有时也称“特性本质”或“潜在本质”。因素分析就是一种潜在结构分析法,其模式理论中,假定每个指针(外在变量或称题项)均由两部分所构成,一为“共同因素"、一为“唯一因素"。共同因素得数目会比指针数(原始变量数)还少,而每个指针或原始变量皆有一个唯一因素,亦即一份量表共有n个题项数,则会有n个唯一因素。唯一因素性质有两个假定: ?(1)所有得唯一因素彼此间没有相关; ?(2)所有得唯一因素与所有得共同因素间也没有相关. 至于所有共同因素间彼此得关系,可能有相关或可能皆没有相关。在直交转轴状态下,所有得共同因素间彼此没有相关;在斜交转轴情况下,所有得共同因素间彼此就有相关.因素分析最常用 得理论模式如下:??? 其中 (1)为第i个变量得标准化分数。

SPSS统计分析分析案例

SPSS统计分析案例 一、我国城镇居民现状 近年来,我国宏观经济形势发生了重大变化,经济发展速度加快,居民收入稳宦增加,在国家连续出台住房、教冇、医疗等^9^改革措施和实施“刺激消费、扩大内需、拉动经济增长” 经济政策的影响下,全国居民的消费支出也强劲增长,消费结构发生了显著变化,消费结构不合理现象得到了一立程度的改善。本文通过相关数据分折总结岀了我国城镇居民消费呈现富裕型、娱乐教育文化服务类消费攀升的趋势特点。 二、我国居民消费结构的横向分析 第一,食品消费支出比重随收入增加呈现出明显的下降趋势,这与恩格尔左律的表述一致。但最低收入户与最高收入恩格尔系数相差太过悬姝,城镇最低收入户刚刚解决了温饱问题, 而最高收入户的生活水平按照恩骼尔系数的评价标准早已达到了富裕型,甚至接近最富裕型。第二,衣着消费支出比重随收入增加缓慢上升,到高收入户又有所下降,但^$收入组支出比重相差不大。衣着支出比重没有更多的递增且最高收入户的支出比重有所下降,这些都符合恩賂尔宦律关于衣着消费的引申。随着收入的增加,衣着支出比重呈现先上升后下降的疋势。事实上,在当前的价格水平和服装业的发展水平下,城镇居民的穿着是有一是限度的,而且居民对衣着的需求也不是无限膨胀的,即使收入水平继续提高,也不需要将更大的比例用于购买服饰用品了。第三,家庭设备用品及服务、交通通讯、娱乐教育文化服务和杂项商品与服务的支出比重呈逐组上升趋势,说明居民的生活水平随收入的增加而不断提高和改善。第四,医疗保健支出比重随收入水平提高呈现一种两端高、中间低的疋势。这是因为医疗保健支出作为生活必须支岀,不论居民生活水平高低,都要将一楚比例的收入用于维持自身健康,而且由于医疗制度改革,加重了个人负担的同时,也减小了旧制度可能造成的不同行业、不同体制下居民医疗保健支出的追别,因而不同收入等级的居民在医疗保健支出比重上差别不大。第五,居住支出比重基本上呈先上升后下降的趋势,这与我国居民消费能级不断提升, 住宅商品正在越来越成为城镇居民关注的热点是相吻合的,同时打恩格尔立律的引申也是一致的。可以看出,城镇居民的消费状况虽然受价格水平、消费习惯、消费环境、消费心理预期等诸多因素的影响,但归根结底仍取决于居民的收入水平,要提高城镇居民的消费支出,必须增加居民收入。因此,采取切实有效的措施增加城镇居民的可支配收入,不仅可以提高全国城镇居民的总体消费水平,促进消费结构向着更加健康、合理的方向发展,而且在启动内需, 促进我国的经济发展方面有着重大的现实意义。 三、我国居民消费结构的纵向分析 进入21世纪以来,随着经济体制改革的深入,国民经济的迅速发展,我国城乡居民的消费水平显著提髙,居民的齐项支出显著增加。随着消费水平的提高,我国城乡居民消费从注重量的满足到追求质的提高,

spss的数据分析报告范例

关于某地区361个人旅游情况统计分析报告 一、数据介绍: 本次分析的数据为某地区361个人旅游情况状况统计表,其中共包含七变量,分别是:年龄,为三类变量;性别,为二类变量(0代表女,1代表男);收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0代表没走通道,1代表走通道);旅游的积极性,为三类变量(0代表积极性差,1代表积极性一般,2代表积极性比较好,3代表积极性好 4代表积极性非常好);额外收入,一类变量。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析,以了解该地区上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分地区359个人旅游基 本状况的统计数据表,在性别、旅游的积极性不同的状况下的频数分析,从而了解该地区的男女职工数量、不同积极性情况的基本分布。 统计量 积极性性别 N 有效359 359 缺失0 0 首先,对该地区的男女性别分布进行频数分析,结果如下 性别 频率百分比有效百分 比 累积百分 比 有效女198 55.2 55.2 55.2 男161 44.8 44.8 100.0

性别 频率百分比有效百分 比 累积百分 比 有效女198 55.2 55.2 55.2 男161 44.8 44.8 100.0 合计359 100.0 100.0 表说明,在该地区被调查的359个人中,有198名女性,161名男性,男女比例分别为44.8%和55.2%,该公司职工男女数量差距不大,女性略多于男性。 其次对原有数据中的旅游的积极性进行频数分析,结果如下表: 积极性 频率百分比有效百分 比 累积百分 比 有效差171 47.6 47.6 47.6 一般79 22.0 22.0 69.6 比较 好 79 22.0 22.0 91.6 好24 6.7 6.7 98.3 非常 好 6 1. 7 1.7 100.0 合计359 100.0 100.0 其次对原有数据中的积极性进行频数分析,结果如下表:

SPSS教程-可靠性分析

SPSS教程:可靠性分析 2.1主要功能 在精神卫生与社会医学研究中,经常需要借助量表来了解对象的某一特性。如常用的症状自评量表(SCL-90)即用于评定对象精神病症状的表现形式与强度;又如生活事件量表(LES)即用于对精神刺激进行定性和定量分析。在完成一份量表的编制工作后,或在准备将一份已有的量表作实际应用前,需要对量表的信度进行考核。 量表的使用是为了了解被测对象的某一特征,因而在编制一份量表时,所设立的一系列项目是为了体现量表需要测定的这一特征。如果所设立的测定项目无法获得这一特征,则表示该量表可靠性差,即信度低。所以,研究者有时需要了解量表中各测定项目之间的一致性(同质信度考核),有时需要将量表的测定项目按原编号的奇、偶数分半后,对各自的测定结果进行相关性检验(分半信度考核),等等,这就是量表的可靠性分析,亦即信度研究。 量表的可靠性分析可通过调用Reliability过程完成。 12.2实例操作 [例12.1]采用家庭环境量表(FES)研究30名女医师的家庭特征,测定结果按10个分量表的实际得分整理如下。请以此资料对FES的信度作评价。 12.2.1数据准备 激活数据管理窗口,定义变量名:亲密度、情感表达、矛盾性、独立性、成功性、知识性、娱乐性、道德宗教观、组织性、控制性等十个分量表的变量名依次是FES1、FES2、FES3、FES4、FES5、FES6、FES7、FES8、FES9、FES10,输入原始数据。 12.2.2统计分析 激活Statistics菜单选Scale中的Reliability Analysis...项,弹出Reliability

Analysis对话框(如图12.1示)。从对话框左侧的变量列表中选fes1~fes10共十个变量,点击 钮使之进入Items框。点击Model处的下拉菜单,系统提供5种分析模型: Alpha:计算信度系数Cronbach α值; Split half:分半信度的分析; Guttman:真实可靠性的Guttman低界; Parallel:并行模型假定下的极大似然可靠性估计; Strict parallel:严格并行模型假定下的极大似然可靠性估计。 本例选用Alpha模型。 点击Statistics...钮,弹出Reliability Analysis: Statistics对话框(图12.2),该对话框内含如下选项: 在Descriptives for栏中选Item、Scale、Scale if item deleted项,以指定对各项目、测定得分情况和项目与量表总体特征关系进行描述性统计; 在Summaries处有四个选项:Means、Variances、Covariances和Correlations,可分别要求系统计算在Descriptives for栏中指定对象的平均数、方差、协方差和相关系数,本例选Means、Variances和Correlations三项; 在Inter-Item处有Correlations和Covariances两项,前者可计算项目间的两两相关系数,后者可计算项目间的两两协方差值,本例选Correlations项; 在ANOV A Table处有None、F test、Friedman chi-square、Cochran chi-square 四个选项,其意义分别是:不作方差分析、作重复度量的方差分析、计算Friedman 和Kendall谐和系数(适用于等级资料)、计算Cohran Q值(适用于所有项目均为二分变量),本例选F test项;

SPSS多元线性回归分析报告实例操作步骤

SPSS 统计分析 多元线性回归分析方法操作与分析 实验目的: 引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价的变动因素。 实验变量: 以年份、商品房平均售价(元/平方米)、上海市城市人口密度(人/平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)和房屋空置率(%)作为变量。 实验方法:多元线性回归分析法 软件:spss19.0 操作过程: 第一步:导入Excel数据文件 1.open data document——open data——open;

2. Opening excel data source——OK. 第二步: 1.在最上面菜单里面选中Analyze——Regression——Linear ,Dependent(因变量)选择商品房平均售价,Independents(自变量)选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率;Method选择Stepwise. 进入如下界面: 2.点击右侧Statistics,勾选Regression Coefficients(回归系数)选项组中的Estimates;勾选Residuals(残差)选项组中的Durbin-Watson、

Casewise diagnostics默认;接着选择Model fit、Collinearity diagnotics;点击Continue. 3.点击右侧Plots,选择*ZPRED(标准化预测值)作为纵轴变量,选择DEPENDNT(因变量)作为横轴变量;勾选选项组中的Standardized Residual Plots(标准化残差图)中的Histogram、Normal probability plot;点击Continue.

SPSS概览--数据分析实例详解

第一章SPSS概览--数据分析实例详解 1.1 数据的输入和保存 1.1.1 SPSS的界面 1.1.2 定义变量 1.1.3 输入数据 1.1.4 保存数据 1.2 数据的预分析 1.2.1 数据的简单描述 1.2.2 绘制直方图 1.3 按题目要求进行统计分析 1.4 保存和导出分析结果 1.4.1 保存文件 1.4.2 导出分析结果 希望了解SPSS 10.0版具体情况的朋友请参见本网站的SPSS 10.0版抢鲜报道。 例1.1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同(卫统第三版例4.8)? 患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 解题流程如下:

1.将数据输入SPSS,并存盘以防断电。 2.进行必要的预分析(分布图、均数标准差的描述等),以确定应采 用的检验方法。 3.按题目要求进行统计分析。 4.保存和导出分析结果。 下面就按这几步依次讲解。 §1.1 数据的输入和保存 1.1.1 SPSS的界面 当打开SPSS后,展现在我们面前的界面如下: 请将鼠标在上图中的各处停留,很快就会弹出相应部位的名称。 请注意窗口顶部显示为“SPSS for Windows Data Editor”,表明现在所看到的是SPSS的数据管理窗口。这是一个典型的Windows软件界面,有菜单栏、

SPSS统计分析案例

SPSS统计分析案例 专业:经济学:000 学号:00000000 一、我国城镇居民现状 近年来,我国宏观经济形势发生了重大变化,经济发展速度加快,居民收入稳定增加,在国家连续出台住房、教育、医疗等各项改革措施和实施“刺激消费、扩大需、拉动经济增长”经济政策的影响下,全国居民的消费支出也强劲增长,消费结构发生了显著变化,消费结构不合理现象得到了一定程度的改善。本文通过相关数据分析总结出了我国城镇居民消费呈现富裕型、娱乐教育文化服务类消费攀升的趋势特点。 二、我国居民消费结构的横向分析 第一,食品消费支出比重随收入增加呈现出明显的下降趋势,这与恩格尔定律的表述一致。但最低收入户与最高收入恩格尔系数相差太过悬殊,城镇最低收入户刚刚解决了温饱问题,而最高收入户的生活水平按照恩格尔系数的评价标准早已达到了富裕型,甚至接近最富裕型。第二,衣着消费支出比重随收入增加缓慢上升,到高收入户又有所下降,但各收入组支出比重相差不大。衣着支出比重没有更多的递增且最高收入户的支出比重有所下降,这些都符合恩格尔定律关于衣着消费的引申。随着收入的增加,衣着支出比重呈现先上升后下降的走势。事实上,在当前的价格水平和服装业的发展水平下,城镇居民的穿着是有一定限度的,而且居民对衣着的需求也不是无限膨胀的,即使收入水平继续提高,也不需要将更大的比例用于购买服饰用品了。第三,家庭设备用品及服务、交通通讯、娱乐教育文化服务和杂项商品与服务的支出比重呈逐组上升趋势,说明居民的生活水平随收入的增加而不断提高和改善。第四,医疗保健支出比重随收入水平提高呈现一种两端高、中间低的走势。这是因为医疗保健支出作为生活必须支出,不论居民生活水平高低,都要将一定比例的收入用于维持自身健康,而且由于医疗制度改革,加重了个人负担的同时,也减小了旧制度可能造成的不同行业、不同体制下居民医疗保健支出的差别,因而不同收入等级的居民在医疗保健支出比重上差别不大。第五,居住支出比重基本上呈先上升后下降的趋势,这与我国居民消费能级不断提升,住宅商品正在越来越成为城镇居民关注的热点是相吻合的,同时与恩格尔定律的引申也是一致的。可以看出,城镇居民的消费状况虽然受价格水平、消费习惯、消费环境、消费心理预期等诸多因素的影响,但归根结底仍取决于居民的收入水平,要提高城镇居民的消费支出,必须增加居民收入。因此,采取切实有效的措施增加城镇居民的可支配收入,不仅可以提高全国城镇居民的总体消费水平,促进消费结构向着更加健康、合理的方向发展,而且在启动需,促进我国的经济发展方面有着重大的现实意义。 三、我国居民消费结构的纵向分析 进入21世纪以来,随着经济体制改革的深入,国民经济的迅速发展,我国城乡居民的消费

多维尺度分析-SPSS例析资料讲解

多维尺度分析 多维尺度分析(multidimensional scaling ,MDS )又称ALSCALE(alternative least-square SCALing),还有人称之为多维量表分析;它是将一组个体间的相异数据经过MDS 转换成空间构图,且保留原始数据的相对关系。 1多维尺度分析的目的 假设给你一张中国台湾省地图,要你算出基隆,台北,新竹,台中,台南,嘉义,高雄,花莲,台东,枋寮,苏澳,恒春等地间的距离,你可以用一把刻度尺根据比例测算出一个12x12de 距离矩阵;反之,如果给你一份12个城市间的距离矩阵,要你画出12个城市相对位置的二维台湾地图,且要他们与现实尽量保持一致,那就是一件不容易的工作了,多为尺度分析就为此工作提供了一个有效地分析手段。 2多为尺度分析与因子分析和聚类分析的异同 多为尺度分析和因子分析都是维度缩减技术,但是因子分析一般使用相关系数进行分析,使用的是相似性矩阵;而多为尺度分析采用的是不相似的评分数据或者说相异性数据来进行分析;与因子分析不同,多为尺度分析中维度或因素的含义不是分析的中心,各数据点在空间中的位置才是分析解释的核心内容; 多为尺度分析与聚类分析也有相似之处,两者都可以检验样品或者变量之间的近似性或距离,但聚类分析中样品通常是按质分组的;多维分析不是将分组或聚类作为最终结果,而是以一个多维尺度图作为最终结果,比较直观。 若你的目的是要把一组变量缩减成几个因素来代表,可考虑使用因素分析;若目的是变量缩减后以呈现在空间图上,则可以使用MDS 。如果你是想要却仍相似观测值得组别,请考虑以聚类分析来补充多为尺度分析,聚类分析虽可以确认组别,但无法在空间图中标示出观测。 3.定性的和定量的MDS MDS 分析测量的尺度不可以是nominal 的,但可以是顺序的ordinal,等距的interval,比率的ratio 。顺序量表只可以用于质的分析,又称为定性多维量表分析;它以个体间距离排序为主;而interval 和ratio 量表称为定量多维量表分析(定量多维尺度分析)。 定性的多维量表分析是目前比较常用的MDS 法,因为他可以使用使用量表要求比较宽的顺序量表,但可以得到量表比较严的数值空间图,也就是说,输入的是分类数据,输出的是数值结果。 4.MDS 分析的各种类型 定性MDS 分析------------------------------------------------------------------------------------例1 定量MDS 分析------------------------------------------------------------------------------------例2 不对称方阵MDS 分析--------------------------------------------------------------------------例3 从数据中创建距离对称矩阵MDS-----------------------------------------------------------例4 个体差异模型MDS------------------------------------------------------------------------------例6 5多维量表分析的运算原理 对定量MDS 而言,输入的距离矩阵()rs n n D d ?=是欧氏距离,如果能在某个P 维空间上 找到坐标点,是其点间的距离2' ()()rs r s r s d x x x x =--所形成的矩阵刚好等于D,即可求得 MDS 的最佳解。其求解是一个迭代过程,不在此细述。 6.拟合度的测量-------Stress 拟合的好坏的指标称为压力系数(stress 应力),系数越小拟合越好;所绘图与原数据

SPSS统计分析案例(我国城镇居民消费结构及趋势的统计分析)[1]

SPSS统计分析案例 专业:经济学姓名:000 学号:00000000 一、我国城镇居民现状 近年来,我国宏观经济形势发生了重大变化,经济发展速度加快,居民收入稳定增加,在国家连续出台住房、教育、医疗等各项改革措施和实施“刺激消费、扩大内需、拉动经济增长”经济政策的影响下,全国居民的消费支出也强劲增长,消费结构发生了显著变化,消费结构不合理现象得到了一定程度的改善。本文通过相关数据分析总结出了我国城镇居民消费呈现富裕型、娱乐教育文化服务类消费攀升的趋势特点。 二、我国居民消费结构的横向分析 第一,食品消费支出比重随收入增加呈现出明显的下降趋势,这与恩格尔定律的表述一致。但最低收入户与最高收入恩格尔系数相差太过悬殊,城镇最低收入户刚刚解决了温饱问题,而最高收入户的生活水平按照恩格尔系数的评价标准早已达到了富裕型,甚至接近最富裕型。第二,衣着消费支出比重随收入增加缓慢上升,到高收入户又有所下降,但各收入组支出比重相差不大。衣着支出比重没有更多的递增且最高收入户的支出比重有所下降,这些都符合恩格尔定律关于衣着消费的引申。随着收入的增加,衣着支出比重呈现先上升后下降的走势。事实上,在当前的价格水平和服装业的发展水平下,城镇居民的穿着是有一定限度的,而且居民对衣着的需求也不是无限膨胀的,即使收入水平继续提高,也不需要将更大的比例用于购买服饰用品了。第三,家庭设备用品及服务、交通通讯、娱乐教育文化服务和杂项商品与服务的支出比重呈逐组上升趋势,说明居民的生活水平随收入的增加而不断提高和改善。第四,医疗保健支出比重随收入水平提高呈现一种两端高、中间低的走势。这是因为医疗保健支出作为生活必须支出,不论居民生活水平高低,都要将一定比例的收入用于维持自身健康,而且由于医疗制度改革,加重了个人负担的同时,也减小了旧制度可能造成的不同行业、不同体制下居民医疗保健支出的差别,因而不同收入等级的居民在医疗保健支出比重上差别不大。第五,居住支出比重基本上呈先上升后下降的趋势,这与我国居民消费能级不断提升,住宅商品正在越来越成为城镇居民关注的热点是相吻合的,同时与恩格尔定律的引申也是一致的。可以看出,城镇居民的消费状况虽然受价格水平、消费习惯、消费环境、消费心理预期等诸多因素的影响,但归根结底仍取决于居民的收入水平,要提高城镇居民的消费支出,必须增加居民收入。因此,采取切实有效的措施增加城镇居民的可支配收入,不仅可以提高全国城镇居民的总体消费水平,促进消费结构向着更加健康、合理的方向发展,而且在启动内需,促进我国的经济发展方面有着重大的现实意义。 三、我国居民消费结构的纵向分析 进入21世纪以来,随着经济体制改革的深入,国民经济的迅速发展,我国城乡居民的消费水平显著提高,居民的各项支出显著增加。随着消费水平的提高,我国城乡居民消费从注重量的满足到追求质的提高,从以衣食消费为主的生存型到追求生活质量的享受型、发展型,消费质量和消费结构都发生了明显的变化。城镇居民在食品、衣着、家庭设备用品三项支出在消

SPSS学习系列14. 量表的初步处理

14. 量表的初步处理 一、量表层面加总 调查问卷通常是针对某个考察因素设置几个子问题,这些具有共同属性的题项需要先做加总处理,以便后续进行相关的统计分析。 例如,如下的“知识管理”量表: 题“a1-a6”,都属于“知识获取”层面,即 “a1-a6”加总= “知识获取” 题“a7-a10”都属于“知识流通”层面; “知识获取”+“知识流通”再加总到“知识管理”层面。 数据文件为:

“知识获取”层面的加总 【转换】——【计算变量】,打开“计算变量”窗口,【目标变量】框输入“知识获取”,【数字表达式】框输入“SUM(a1 TO a6)”,点【确定】 注意:“SUM(a1 TO a6)”是“SUM(a1,a2,a3,a4,a5,a6)”的简写,需要变量规律化命名。 类似地操作,再对“知识流通”层面加总,“知识管理”量表加总。得到

二、层面的平均得分 层面的平均得分,即“层面总分”除以“层面题数”,能反映出该层面的平均程度。例如,“工作满意”层面,1-5分别代表“非常同意、同意、不知道、不同意、非常不同意”,若该层面平均得分为4.30,则表示平均具有较高的工作满意度。 【转换】——【计算变量】,目标变量输入“获取平均”,数字表达式输入“知识获取/6”; 类似地,“流通平均”=“知识流通/4”; “知识管理平均”=“知识管理/10”。

得到运行结果:

三、量表的描述统计 【分析】——【描述统计】——【描述】,打开“描述性”窗口,将变量“知识获取、知识流通、知识管理、获取平均、流通平均、知识管理平均”选入【变量】框, 【选项】,(默认)勾选“均值、标准差、最小值、最大值”,点【确定】,得到 注:层面加总的均值无参考意义,层面平均的“获取平均”的均值为3.0000,流通平均的均值为3.4182,说明两个层面的“同意程度”是有差异的,该差异是否在统计学有显著意义?则需要做【分析】——【比较均值】——【配对样本T检验】。

SPSS分析报告实例

SPSS与数据统计分析期末论文影响学生对学校服务满意程度的因素分析

一、数据来源 本次数据主要来源自本校同学,调查了同学们年级、性别、助学金申请情况、生源所在地、学院、毕业学校、游历情况、家庭情况、升高、体重、近视程度、学习时间、经济条件、兴趣、对学校各方面的评价、与对学校总评价以及建议等共41条信息,共收集数据样本724条。我们将运用SPSS,对变量进行频数分析、样本T检验、相关分析等手段,旨在了解同学们对学校提供的满意程度与什么因素有关。 二、频数分析 可靠性统计 克隆巴赫Alpha项数 .98562 对全体数值进行可信度分析

本次数据共计724条,首先从可靠性统计来看,alpha值为0.985,即全体数据绝大部分是可靠的,我们可以在原始数据的基础上进行分析与处理。 其中,按年级来看,绝大多数为大二学生填写(占了总人数的67.13%),之后分别依次为大二(23.76%)、大四(4.14%)、大一(4.97%)。而从专业来看,占据了数据绝大多数样本所在的学院为机械、材料、经管、计通。 三、数据预处理 拿到这份诸多同学填写的问卷之后,我们首先应对一些数据进行处理,对于数据的缺失值处理,由于我们对本份调查的分析重点方面是关于学生的经济情况的,因此对于确实的部分数据,升高、体重、近视度数、感兴趣的事等无关项我们均不需要进行缺失值的处理,而我们可能重点关注的每月家里给的钱、每月收入以及每月支出,由于其具有较强主观性,如果强行处理缺失值反而会破坏数据的完整性,因此我们筛去未填写的数据,将剩余数据当作新的样本进行分析。 而对于一些关键的数据,我们需要做一些必要的预处理,例如一些调查项,我们希望得到数值型变量,但是填写时是字符型变量,我们就应该新建一个数字型变量并将数据复制,以便后续分析。同时一些与我们分析相关的缺省值,一些明显可以看出的虚假信息,我们都需要先

利用SPSS做数据分析报告

【本文中采用SPSS18】 首先,要把问卷中的答案都输进SPSS中,强烈建议直接在SPSS中输入,不要在EXCEL 中输入,再导入SPSS,这样可能会出问题……在输数据之前先要到变量视图中定义变量……如下图 所有类型都是数值,宽度默认,小数点看个人喜好,标签自定,其他默认……除了值……讲讲值的设定…… 点一下有三点的蓝色小框框……会跳出一个对话框,如果你的变量是性别,学历,那么就如下图

如果是五点维度的量表,那么就是 记住,每一题都是一个变量,可以取名Q1,Q2……设定好所有问卷上有的变量之后,就可以到数据视图中输入数据啦……如下图

都输完后……还有要做的就是计算你的每个维度的平均得分……如果你的问卷Q1-Q8是一个维度,那么就把Q1-Q8的得分加起来除以题目数8……那么得到的维度1分数会显示在数据视图中的最后……具体操作如下…… 转换——计算变量

点确定,就会在数据视图的最后一列出现计算后的变量……如果你的满意度有3个维度,那么就要计算3个维度,外加满意度这个总维度,满意度=3个维度的平均分=满意度量表的所有题目的平均分…………把你所有的维度变量都计算好之后就可以分析数据啦……1.描述性统计

将你要统计的变量都放到变量栏中,直接点确定……

如果你要统计男女的人数比例,各个学历或者各个年级的比例,就要用描述统计中的频率……如果要统计男女中的年级分布,比如大一男的有几个,大二女的有几个,就用交叉表……不细说了……地球人都懂的………… 2.差异性分析 差异性分析主要做的就是人口学变量的差异影响,男女是否有差异,年级是否有差异,不做的就跳过…… 对于性别来说,差异分析采用独立样本T检验,也可以采用单因素ANOVA分析,下面以T检验为例……

利用SPSS对五点式量表进行差异性分析

v1.0可编辑可修改利用SPSS寸五点式量表进行差异性分析(两个变项)

町* E 粧山』'L 峠:氐間护P) JJ 各日g.tL 居和出 :' 田口 TM 習第」?:」雋即I 删程式 1:U 1 鯉 biK+4J5r.*'^> ?| 中卑擞世0 ftl * 沾 -岷疋址事玛JU * 116 317 *11 ? 19 ui24 曲 :g 渤 3 la R 丁任疋山 1 J 12 i 5 1 flsnxaj 戍为搏*:極生0. J i d 4 巧 、 J ■1 J ?1 41 4 2 2 o ] 】L 2 1 d 护陨评件(2) ■ 1 & 5 5 ( 3 色 2 ? 2 J 4 $ J IO 1 5 L 1 d ? ? ■1 3 2 5 $ 2 2 \ x : 3 i J 2 2 S J J 4 njt ] II 1 1 1 ■ 2 1 2 1 L * > X A q d 4 』 g 2 2 * 5 如 J 11 1 r 1 Brtfipt 列 G ? 4 4 4 斗 < i t \ 、: a A 4 d i d 3 6 do & ] 山 1 j 2 t 4 4 3 2 2 1 5 % u a 4 4 4 4 2 i 10? 11 4 4 < .1A d 7 1 2 5 1 齿咽址廿03 4 4 4- 4 1 5 i £ ]L? ] 11] 2 JI 2 3 2 3 3 5 4 3 5 i 5 i 卜卜检苹+ 勺魏沖 4 5 ? 曲 1 1.2 : J 2 5 3 J 3 4 3 & 5 & 1 i 4 & 110 j L 2 £ 5 5 土 i J £ 1 1(* 1 1 1 1 7 5 力中\/化匕/k 临缶 11 111 1 11 1 r J j 1 3 2 2 3 i J < J J J % -j 4 i 11 L : ] 11 . i 1 1 3 2 5 4 4 4 J 2 1 L : 厂 a 茁 J 4 4 B iu ] 1 1 j 1 1 1 3 5 L L 4 扌 4 4 i i Q 4 a a A J 4 4 4 < 14 叮& ] B 1 i 1 1 L 2 2 4 2 4 4 3 3 3 4 扌 4 4 d 4 』 i 15 115 1 1J 2 3 2 1 1 2 3 4 2 4 3 & i i i 圍 4 3 J 4 < 百 4 4 16 11* 1 |l) 1 3: 9 1 2 7 4 j 4 4 3 4 1 i 片 4 4 a 4 4 4 4 4 i 17 117 1 11 2 j 2 j 1 3 2 ■ 1 4 4 4; 3 2 2 t ! 4 打 3 n J 4 百 4 百 5 ~~1? l]t ] II 4 1 J 4 2 4 3 J # 4 2 2 4 1 4 3 黄 4 4 4 4 4 卡 1? 119 1 11 1 1 1 1 L 2 j 2 5 4 i S & 4 £ S 4 r ■1 ■1 i S 4 J 20 1 9 a J 斗 1 J J i J 2 4 3 J 、 J J J 讥 4 4 贯 2 J J 3 :- * 21 血 2 & i L a J 2 L 2 二 4 J 1 1 2 I Q : 电 J i 2 1 2 5 4 i 22 w? 2 7 1 J 1 1. 1 3 3 L 1 4 5 5 3 2 i i 3 5 j 1 ■1 4 3 5 5 2 2 12 L 1 2 1 3 3 3 2 J 5 3 1 4 J 5 5 ? 4 J .1 4 5 J 4 ■A 丄 .| 菊逗册晦.-£离 ww SEPUMimi ITffh* 1 1』曲M 竺;'0 召?』£ 15下平网「 -r Grt* 1 瀰訂丁丁甘児 lg: I. Q 二 H >

spss的数据分析案例

s p s s的数据分析案例文件排版存档编号:[UYTR-OUPT28-KBNTL98-UYNN208]

关于某公司474 名职工综合状况的统计分析报告 一、 数据介绍: 本次分析的数据为某公司474名职工状况统计表,其中共包含十一变量,分别是:id (职工编号),gender(性别),bdate(出生日期),edcu (受教育水平程度),jobcat (职务等级),salbegin (起始工资),salary (现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用spss 统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、以了解该公司职工上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、 数据分析 1、 频数分析。基本的统计分析往往从频数分析开始。通过频数分析能够了解变 量的取值状况,对把握数据的分布特征非常有用。此次分析利用了某公司474名职工基本状况的统计数据表,在gender(性别)、edcu (受教育水平程度)、不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。 首先,对该公司的男女性别 分布进行频数分析,结果如 下: Gender

上表说明,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为%和%,该公司职工男女数量差距不大,男性略多于女性。 其次对原有数据中的受教育程度进行频数分析,结果如下表: Educational Level (years)

上表及其直方图说明,被调查的474名职工中,受过12年教育的职工是该组频数最高的,为190人,占总人数的%,其次为15年,共有116人,占中人数的%。且接受过高于20年的教育的人数只有1人,比例很低。 2、描述统计分析。再通过简单的频数统计分析了解了职工在性别和受教育水平 上的总体分布状况后,我们还需要对数据中的其他变量特征有更为精确的认识,这就需要通过计算基本描述统计的方法来实现。下面就对各个变量进行描述统计分析,得到它们的均值、标准差、片度峰度等数据,以进一步把我数据的集中趋势和离散趋势。 Descriptive Ststistics

在SPSS中问卷信度分析

在SPSS中,专门用来进行测验信度分析的模块为Scale下的Reliability Analysis 一、信度分析 Reliability Analysis模块主要功能是检验测验的信度,主要用来检验折半信度、库李及a系数以及Hoyt信度系数值。至于重测信度和复本信度,只需将样本在二次(份)测验的分数的数据合并到同一数据文件之后,利用Correlate 之下的Bivariate求其相关系数,即为重测或复本信度; 一、概念 信度是指根据测验工具所得到的结果的一致性或稳定性,反映被测特征真实程度的指标。一般而言,两次或两个测验的结果愈是一致,则误差愈小,所得的信度愈高,它具有以下特性 信度是指测验所得到结果的一致性或稳定性,而非测验或量表本身; 信度值是指在某一特定类型下的一致性,非泛指一般的一致性,信度系数会因不同时间、不同受试者或不同评分者而出现不同的结果; 信度是效度的必要条件,非充分条件。信度低效度一定低,但信度高未必表示效度也高 信度检验完全依赖于统计方法。 信度可分为:内在信度:对一组问题是否测量同一个概念,同时组成量表题项的内在一致性程度如何;常用的检测方法是Cronbach’s alpha系数。外在信度:对相同的测试者在不同时间测得的结果是否一致,再测信度是外在信度最常用的检验法 二、信度指标 1. 用信度系数来表示信度的大小。信度系数越大,表明测量的可信程度越大。究竟信度系数要多少才算有高的信度。学者DeVellis(1991)认为, 0.60~0.65(最好不要);0.65~0.70(最小可接受值);0.70~0.80(相当好); 0.80~0.90(非常好)。由此,一份信度系数好的量表或问卷,最好在0.80 以上,0.70至0.80之间还算是可以接受的范围;分量表最好在0.70以上,0.60至0.70之间可以接受。若分量表的内部一致性系数在0.60以下或者总量表的信度系数在0.80以下,应考虑重新修订量表或增删题项。 2. 信度指标多以相关系数来表示:大致可分为三类:稳定系数(跨时间的一致性)、等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)

相关主题
文本预览
相关文档 最新文档