结构方程模型基础知识
- 格式:docx
- 大小:109.58 KB
- 文档页数:6
结构方程模型解读结构方程模型是一种统计分析方法,可以用来探究因变量和自变量之间的关系。
它是一种相对比较复杂的分析方法,但当被正确解读时,它有效地帮助研究者了解变量之间的关系以及变量如何影响彼此。
下面,我们将依次阐述如何理解结构方程模型。
一、构建模型:结构方程模型的第一步是构建模型。
这意味着研究者需要选择一个理论框架,并从中选择变量进行分析。
在选择变量时,研究者需要考虑变量之间的关系以及它们可能如何相互作用。
一旦选择了变量,研究者就需要确定变量之间的箭头方向,来表示它们之间的重要性和权重。
一般来说,箭头会从自变量指向因变量。
二、拟合模型:一旦成功地构建了模型,研究者需要拟合模型,这意味着他们需要在模型中添加数据并运行分析。
在这个步骤中,研究者采集数据,并将它们输入计算机程序中。
该程序将根据构建的模型来分析数据,并根据一些统计指标来计算模型的拟合度。
如果模型与数据的拟合度较高,则说明模型比较准确,反之则说明需要重新考虑模型结构。
三、解读结果:最后,研究者需要解读结果,这是最为挑战性的一步。
结果解释并不简单,因为它们可能包含了许多因素和变量。
因此,研究者需要进行更深层次的分析和理解,以找出关键的因素和变量之间的关系。
要解读结果,需要查看概览统计数据,包括R²值和残差,以及某些中介变量、潜在变量和多重潜在变量之间的关系。
这些数据将告诉研究者各个变量之间的影响力和关系。
在这里,研究者应该花时间来分析数据,并将其与模型进行对照。
如果模型与数据的拟合度很高,则研究者可以着手对数据中发现的关键变量进行更深入的分析。
总之,结构方程模型是一种富有成果的统计分析方法。
如果您正确地构建模型,并仔细解读结果数据,就可以从中得到非常好的结论。
★结构方程模型要点一、结构方程模型的模型构成1、变量观测变量:能够观测到的变量(路径图中以长方形表示)潜在变量:难以直接观测到的抽象概念,由观测变量推估出来的变量(路径图中以椭圆形表示)内生变量:模型总会受到任何一个其他变量影响的变量(因变量;路径图会受外生变量:模型中不受任何其他变量影响但影响其他变量的变量(自变量;路中介变量:当内生变量同时做因变量和自变量时,表示该变量不仅被其他变量影响,还可能对其他变量产生影响。
内生潜在变量:潜变量作为内生变量内生观测变量:内生潜在变量的观测变量外生潜在变量:潜变量作为外生变量外生观测变量:外生潜在变量的观测变量中介潜变量:潜变量作为中介变量中介观测变量:中介潜在变量的观测变量2、参数(“未知”和“估计”)潜在变量自身:总体的平均数或方差变量之间关系:因素载荷,路径系数,协方差参数类型:自由参数、固定参数自由参数:参数大小必须通过统计程序加以估计固定参数:模型拟合过程中无须估计(1)为潜在变量设定的测量尺度①将潜在变量下的各观测变量的残差项方差设置为1②将潜在变量下的各观测变量的因子负荷固定为1(2)为提高模型识别度人为设定限定参数:多样本间比较(半自由参数)3、路径图(1)含义:路径分析的最有用的一个工具,用图形形式表示变量之间的各种线性关系,包括直接的和间接的关系。
(2)常用记号:①矩形框表示观测变量②圆或椭圆表示潜在变量③小的圆或椭圆,或无任何框,表示方程或测量的误差单向箭头指向指标或观测变量,表示测量误差单向箭头指向因子或潜在变量,表示内生变量未能被外生潜在变量解释的部分,是方程的误差④单向箭头连接的两个变量表示假定有因果关系,箭头由原因(外生)变量指向结果(内生)变量⑤两个变量之间连线的两端都有箭头,表示它们之间互为因果⑥弧形双箭头表示假定两个变量之间没有结构关系,但有相关关系⑦变量之间没有任何连接线,表示假定它们之间没有直接联系(3)路径系数含义:路径分析模型的回归系数,用来衡量变量之间影响程度或变量的效应大小(标准化系数、非标准化系数)类型:①反映外生变量影响内生变量的路径系数②反映内生变量影响内生变量的路径系数路径系数的下标:第一部分所指向的结果变量第二部分表示原因变量(4)效应分解①直接效应:原因变量(外生或内生变量)对结果变量(内生变量)的直接影响,大小等于原因变量到结果变量的路径系数②间接效应:原因变量通过一个或多个中介变量对结果变量所产生的影响,大小为所有从原因变量出发,通过所有中介变量结束于结果变量的路径系数乘积③总效应:原因变量对结果变量的效应总和总效应=直接效应+间接效应4、矩阵方程式(1)和(2)是测量模型方程,(3)是结构模型方程 测量模型:反映潜在变量和观测变量之间的关系 结构模型:反映潜在变量之间因果关系 5x x ξδ=∧+ (1)y y ηε=∧+ (2) B ηηξζ=+Γ+ (3)三、模型修正1、参考标准模型所得结果是适当的;所得模型的实际意义、模型变量间的实际意义和所得参数与实际假设的关系是合理的;参考多个不同的整体拟合指数;2、修正原则①省俭原则两个模型拟合度差别不大的情况下,应取两个模型中较简单的模型;拟合度差别很大,应采取拟合更好的模型,暂不考虑模型的简洁性;最后采用的模型应是用较少参数但符合实际意义,且能较好拟合数据的模型。
结构方程模型模型简约结构方程模型(Structural Equation Modeling,简称SEM)是统计分析中一种全面且常用的多变量分析方法,旨在为研究者提供一种综合分析因果关系和协方差关系的框架。
SEM通常被用来研究各种不同学科领域,例如心理学、社会学、经济学和教育学等。
本篇文章将对SEM模型的基本概念、模型参数、统计推断、SEM应用场景等方面进行展开分析。
一、SEM模型的基本概念1. 定义SEM模型是指一个由多个指标和潜在变量之间建立起的模型。
其中潜在变量被认为是不能被直接观察的,但是通过其他目测变量的表现来推断它们的存在。
2. 组成SEM模型由2个主要部分组成:测量模型和结构模型。
测量模型用于解释指标之间的相互影响,而结构模型则用于解释潜在变量之间的相互影响。
3. 图示SEM模型通常以图示的形式呈现。
测量模型被表示为一个菱形,而结构模型被表示为一个圆形。
指标和潜变量之间的箭头代表一个因果或协方差关系。
二、SEM模型的参数估计1. 参数含义SEM模型中,估计的参数主要包括:factor loading、path coefficient、error variance、covariance等。
2. 参数估计方法有三种主要的估计方法:最小二乘法(Least Squares)、最大似然估计(Maximum Likelihood)以及广义最小二乘(Generalized Least Squares)。
三、SEM模型的统计推断1. 假设检验在SEM模型中,主要的假设检验包括:各个因素之间的相关性是否为显著,以及是否存在其他的回归规律等。
2. 模型拟合度检验常用的模型拟合度指标包括:χ²值(Chi-Square)、比值似然比CFI (Comparative Fit Index)、标准拟合度指数NFI/NNFI(Normed Fit Index/Non-Normed Fit Index)等。
结构方程这几年热度不减,有必要研究一下它的R语言实现过程,今天先复习一下结构方程的相关理论,参考吉林大学余翠林的ppt一、为什么使用SEM?1、回归分析有几方面的限制:(1)不允许有多个因变量或输出变量(2)中间变量不能包含在与预测因子一样的单一模型中(3)预测因子假设为没有测量误差(4)预测因子间的多重共线性会妨碍结果解释(5)结构方程模型不受这些方面的限制2、SEM的优点:(1)SEM程序同时提供总体模型检验和独立参数估计检验;(2)回归系数,均值和方差同时被比较,即使多个组间交叉;(3)验证性因子分析模型能净化误差,使得潜变量间的关联估计较少地被测量误差污染;(4)拟合非标准模型的能力,包括灵活处理追踪数据,带自相关误差结构的数据库(时间序列分析),和带非正态分布变量和缺失数据的数据库。
3、结构方程模型最为显著的两个特点是:(1)评价多维的和相互关联的关系;(2)能够发现这些关系中没有察觉到的概念关系,而且能够在评价的过程中解释测量误差。
同时具有联系信息技术吸纳能力:SEM能够反映模型中要素之间的相互影响;吸纳能力概念作为一个重要的模型要素,难以直接度量,结构方程模型技术能够更为充分地体现其蕴含的要素信息和影响作用。
二、SEM的基本思想与方法SEM是基于变量的协方差矩阵来分析变量之间关系的一种统计方法,实际上是一般线性模型的拓展,包括因子模型与结构模型,体现了传统路径分析与因子分析的完美结合。
SEM一般使用最大似然法估计模型(Maxi-Likeliheod,ML) 分析结构方程的路径系数等估计值,因为ML法使得研究者能够基于数据分析的结果对模型进行修正。
1、 SEM术语(1)观测变量可直接测量的变量,通常是指标(2)潜变量潜变量亦称隐变量,是无法直接观测并测量的变量。
潜变量需要通过设计若干指标间接加以测量。
(3)外生变量是指那些在模型或系统中,只起解释变量作用的变量。
它们在模型或系统中,只影响其他变量,而不受其他变量的影响。
1.结构方程模式结构方程模式是在已有的因果理论基础上,用与之相应的线性方程系统表该因果理论的一种统计分析技术.目的在于探索事物间因果关系并将这种关系用因果模式、路径图等表述(Kline,R.B1998)。
一般,结构方程模式由测量和潜在变量两部分组成:测量部分求出观察指标与潜在变量之间的关系;潜在变量部分求出潜在变量与潜在变量之间关系。
因此,结构方程模式分为测量模式与潜在结构模式(侯杰泰,1994)。
测量模式的方程:X、Y分别是外源和内源指标;η、ε分别是内源和外源变量,δ、e分别是X、Y的测量误差;Λx是X指标与外源潜在变量ζ的关系;Λy是Y指标与内源潜在变量η的关系。
结构模式的方程:η=βη+Γε+ζη是内源潜在变量,ε是外源潜在变量间关系,ζ是内源潜在变量间关系,Γ是外源潜在变量对内源潜在变量影响,是模式内未能解释的部分。
2.结构方程模式的建构(1)模式构想出发点是为观察变量问候设的基本因果关系建立具体的模式。
这就需要清晰地说明变量间的因果联系,即通过路径图的方式,对变量间假定的因果联系予以描述。
但同时我们应该认识到.模式的建立必须以正确的理论为基础,如果某一路径缺乏理论依据,则它无法正确解释变量间的因果联系。
(2)模式限定可以用代表因果理论的线性方程系统表示理论上的模式。
在从概念理论到统计模式的过渡.可形成假设。
一假设是:线性模式可完全代表观察数据余假设分为:有关观察指标与潜在变量关系的假设;有关潜在变量或观察指标因果关系的方向及属性的假设。
(3)模式识别的判定模式形成的重要阶段是判定模式能否被识别。
要能识别某个模式,就需要说明线性方程的各个系统参数。
这些系统参数可根据观察分数的方差和协方差矩阵所提供的信息进行估计。
模式识别的必要但非充分条件是模式的参数个数不多于观察的方差和协方差数目(Duncan,1975;Everitt,1984)。
(4)模式拟合把统计模式与观察数据相拟合。
根据研究者的需要,可选用适当的拟合指标以考察模式与数据的拟合程度。
结构方程模型知识点总结一、SEM的基本概念1.1 潜变量和观察变量SEM中的变量分为潜变量和观察变量两种。
潜变量是无法直接观测到的,但通过观察变量的测量可以间接反映出来的变量,比如抽象的概念、态度或行为。
观察变量是可以直接测量和观察到的变量,它通过对潜变量的测量可以间接反映出来的现象或特征。
1.2 路径图和模型图SEM通过路径图和模型图来表示变量之间的关系。
路径图用箭头表示变量之间的因果关系,箭头的方向表示因果关系的方向,箭头的粗细表示因果关系的强度。
模型图将观察到的变量和潜变量以及它们之间的关系用图形化的方式表达出来。
1.3 测量模型和结构模型SEM包括测量模型和结构模型两个部分。
测量模型用于描述观察变量和潜变量之间的关系,它通过因子分析或确认因素分析来检验观察变量和潜变量之间的关系。
结构模型用于描述潜变量之间的因果关系,它通过路径分析来检验和估计潜变量之间的因果关系。
1.4 模型拟合度和参数估计SEM通过拟合度指标(比如χ²值、RMSEA、CFI等)来检验模型的拟合程度。
拟合度指标可以用来评估模型对观测数据的解释程度。
参数估计则是用来估计模型中的参数,比如路径系数、测量误差和因子之间的协方差等。
二、SEM的应用领域2.1 社会科学研究在社会科学研究中,SEM广泛应用于心理学、教育学、管理学、政治学等领域。
研究者可以利用SEM来检验和估计变量之间的因果关系,比如影响人们行为的因素、组织管理的影响因素等。
2.2 经济学研究在经济学研究中,SEM可以用来检验和估计宏观经济模型或微观经济模型。
研究者可以利用SEM来分析不同变量之间的关系,比如GDP和通货膨胀之间的关系、利率变动对企业盈利的影响等。
2.3 公共卫生研究在公共卫生研究中,SEM可以用来检验和估计潜变量之间的关系,比如疾病和环境因素之间的关系、健康行为和健康状况之间的关系等。
研究者可以利用SEM来揭示潜在的影响因素,从而提出有效的干预措施。
结构⽅程模型⼊门(纯⼲货!)⼀、结构⽅程模型的概念结构⽅程模型(Structural Equation Model,简称SEM)是基于变量的协⽅差矩阵来分析变量之间关系的⼀种统计⽅法,因此也称为协⽅差结构分析。
结构⽅程模型属于多变量统计分析,整合了因素分析与路径分析两种统计⽅法,同时可检验模型中的显变量(测量题⽬)、潜变量(测量题⽬表⽰的含义)和误差变量直接按的关系,从⽽活动⾃变量对因变量影响的直接效果、间接效果和总效果。
结构⽅程模型基本上是⼀种验证性的分析⽅法,因此通常需要有理论或者经验法则的⽀持,根据理论才能构建假设的模型图。
在构建模型图之后,检验模型的拟合度,观察模型是否可⽤,同时还需要检验各个路径是否达到显著,以确定⾃变量对因变量的影响是否显著。
⽬前,结构⽅程模型的分析软件较多,如Lisrel、EQS、Amos、Mplus、 Smartpls等等,其中AMOS 的使⽤率甚⾼,因此我们重点了解⼀下使⽤AMOS软件进⾏结构⽅程模型分析的过程。
⼆、结构⽅程模型的相关概念在构建模型假设图,我们⾸先需要了解⼀些有关的基本概念1、显变量显变量有多种称呼,如“观察变量”、“测量变量”、“显性变量”、“观测变量”等等。
从这些称呼中可以看到,显变量的主要含义就是:变量是实际测量的内容,也就是我们问卷上⾯的题⽬。
在Amos中,显变量使⽤长⽅形表⽰。
2、潜变量潜变量也叫潜在变量,是⽆法直接测量,但是可以通过多个题⽬进⾏表⽰的变量。
在Amos中,潜变量使⽤椭圆表⽰。
在使⽤的过程中,我们可以通过这样的⽅式区分显变量和潜变量:在数据⽂件中有具体值的变量就是显变量,没有具体值但可通过多个题⽬表⽰的则是潜变量。
3、误差变量误差变量是不具有实际测量的变量,但必不可少。
在调查中,显变量不可能百分之百的解释潜变量,总会存在误差,这反映在结构⽅程模型中就是误差变量,每⼀个显变量都会有误差变量。
在Amos 中,误差变量使⽤圆形进⾏表⽰(与潜变量类似)。
结构方程这几年热度不减,有必要研究一下它的R语言实现过程,今天先复习一下结构方程的相关理论,参考吉林大学余翠林的ppt
一、为什么使用SEM?
1、回归分析有几方面的限制:
(1)不允许有多个因变量或输出变量
(2)中间变量不能包含在与预测因子一样的单一模型中
(3)预测因子假设为没有测量误差
(4)预测因子间的多重共线性会妨碍结果解释
(5)结构方程模型不受这些方面的限制
2、SEM的优点:
(1)SEM程序同时提供总体模型检验和独立参数估计检验;
(2)回归系数,均值和方差同时被比较,即使多个组间交叉;
(3)验证性因子分析模型能净化误差,使得潜变量间的关联估计较少地被测量误差污染;
(4)拟合非标准模型的能力,包括灵活处理追踪数据,带自相关误差结构的数据库(时间序列分析),和带非正态分布变量和缺失数据的数据库。
3、结构方程模型最为显著的两个特点是:
(1)评价多维的和相互关联的关系;
(2)能够发现这些关系中没有察觉到的概念关系,而且能够在评价的过程中解释测量误差。
同时具有联系信息技术吸纳能力:
SEM能够反映模型中要素之间的相互影响;
吸纳能力概念作为一个重要的模型要素,难以直接度量,结构方程模型技术能够更为充分地体现其蕴含的要素信息和影响作用。
二、SEM的基本思想与方法
SEM是基于变量的协方差矩阵来分析变量之间关系的一种统计方法,实际上是一般线性模型的拓展,包括因子模型与结构模型,体现了传统路径分析与因子分析的完美结合。
SEM一般使用最大似然法估计模型(Maxi-Likeliheod,ML) 分析结构方程的路径系数等估计值,因为ML法使得研究者能够基于数据分析的结果对模型进行修正。
1、SEM术语
(1)观测变量可直接测量的变量,通常是指标
(2)潜变量潜变量亦称隐变量,是无法直接观测并测量的变量。
潜变量需要通过设计若干指标间接加以测量。
(3)外生变量是指那些在模型或系统中,只起解释变量作用的变量。
它们在模型或系统中,只影响其他变量,而不受其他变量的影响。
在路径图中,只有指向其他变量的箭头,没有箭头指向它的变量均为外生变量。
(4)内生变量是指那些在模型或系统中,受模型或系统中其它变量包括外生变量和内生变量影响的变量,即在路径图中,有箭头指向它的变量。
它们也可以影响其它变量。
2、结构方程模型示意图
观测变量通常用长方形或方形表示,外生观测变量用x表示,内生观测变量用y 表示。
潜变量用椭圆或圆形表示,外生潜变量通常用ξ表示,内生潜变量通常用η表示。
δ外生观测变量x的误差;ε内生观测变量y的误差。
3、结构方程
结构方程模型通常包括三个矩阵方程式:
Λx—外生观测变量与外生潜变量直接的关系,是外生观测变量在外生潜变量上的因子载荷矩阵;
Λy—内生观测变量与内生潜变量之间的关系,是内生观测变量在内生潜变量上的因子载荷矩阵;
В—路径系数,表示内生潜变量间的关系;
Г—路径系数,表示外生潜变量对内生潜变量的影响;
ζ—结构方程的残差项,反映了”在方程中未能被解释的部分。
三、结构方程模型的四大步骤
1、模型构建
构建研究模型,具体包括:观测变量(指标)与潜变量(因子)的关系,各潜变量之间的相互关系等
2、模型拟合
对模型求解,其中主要是模型参数的估计,求得参数使模型隐含的协方差距阵与样本协方差距阵的“差距”最小
3、模型评价
检查1)路径系数/载荷系数的显著性;2)各参数与预设模型的关系是否合理;3)各拟合指数是否通过
4、模型修正
模型扩展(使用修正指数)或模型限制(使用临界比率)
四、具体过程
1、数据准备
样本量:一般认为样本数最少应在100以上才适合使用最大似然估计法(MLE)来估计结构方程(侯杰泰,2004),但样本数过大(如超过400到500时),MLE会变得过度敏感,容易使所有的拟合度指标检验都出现拟合不佳的结果(侯杰泰,2004)。
缺失数据处理:列删除法、配对删除法、插补法
2、一般应用SEM的论文中的数据分析
(1).信度、效度检验
信度Cronbach’s >0.7
效度验证性因子分析
(2). 评估模型拟合度
即
估算每一个因子的载荷量
标准化因子载荷,反映了观测变量影响潜在变量的部分差异,用于表示观测变量与潜变量之间的相对重要程度。
检查每一个单一因子的测量模型对问卷数据的拟合度
检查整个模型对问卷数据的拟合度
估算潜变量之间的关系
五、SEM的主要拟合度指标
1、基本拟合标准
基本拟合标准是用来检验模型的误差以及误输入等问题。
主要包括:
(1)不能有负的测量误差;
(2)测量误差必须达到显著性水平;
(3)因子载荷必须介于0.5-0.95之间;
(4)不能有很大的标准误差。
2、模型内在结构拟合度
模型的内在结构拟合度是用来评价模型内估计参数的显著程度、各指标及潜在变量的信度。
主要包括:
(1)潜变量的组成信度(CR),0.7以上表明组成信度较好;
潜变量的CR值是其所有观测变量的信度的组合,该指标用来分析潜变量的各观测变量间的一致性
(2)平均提炼方差(AVE),0.5以上为可以接受的水平。
AVE用于估计测量模型的聚合效度,反映了潜变量的各观测变量对该潜变量的平均差异解释力,即潜变量的各观测变量与测量误差相比在多大程度上捕捉到了该潜变量的变化。
3、整体模型拟合度
整体模型拟合度是用来评价模型与数据的拟合程度。
主要包括:
(1)绝对拟合度,用来确定模型可以预测协方差阵和相关矩阵的程度;(2)简约拟合度,用来评价模型的简约程度;
(3)增值拟合度,理论模型与虚无模型的比较。
包括
(1)χ2卡方拟合指数检验选定的模型协方差矩阵与观察数据协方差矩阵相匹配的假设。
原假设是模型协方差阵等于样本协方差阵。
如果模型拟合的好,卡方值应该不显著。
在这种情况下,数据拟合不好的模型被拒绝。
(2)RMR 是残差均方根。
RMR 是样本方差和协方差减去对应估计的方差和协方差的平方和,再取平均值的平方根。
RMR应该小于0.08,RMR越小,拟合越好。
(3)RMSEA 是近似误差均方根RMSEA应该小于0.06,越小越好。
GFI 是拟合优度指数,范围在0和1间,但理论上能产生没有意义的负数。
按照约定,要接受模型,GFI 应该等于或大于0.90。
(4)PGFI 是简效拟合优度指数。
它是简效比率(PRATIO,独立模式的自由度与内定模式的自由度的比率)乘以GFI。
PGFI 应该等于或大于0.90,越接近1越好。
(5)PNFI 是简效拟合优度指数,等于PRATIO乘以NFI。
PNFI应该等于或大于0.90,越接近1越好。
(6)NFI 是规范拟合指数,变化范围在0和1间, 1 = 完全拟合。
按照约定,NFI 小于0.90 表示需要重新设置模型。
越接近1越好。
(7)TLI 是Tucker-Lewis 系数,也叫做Bentler-Bonett 非规范拟合指数(NNFI)。
TLI接近1表示拟合良好。
(8)CFI 是比较拟合指数,其值位于0和1之间。
CFI 接近1表示拟合非常好,其值大于0.90表示模型可接受,越接近1越好。
六模型修正
研究者可以参考察初始模型的显著性检验结果和软件(AMOS)提供的模型修正指标对模型进行修正。
(1)模型扩展添加新路径,提高模型的拟合度
修正指数(modification index)
整个模型改良时卡方值减少
(2)模型限制删除或限制部分路径,提高模型可识别性
临界比率(Critical ration for difference)
使结果更具有现实性和解释性
七、一个例子——消费者网上信任模型。