多层线性模型的解读:原理与应用
- 格式:doc
- 大小:31.50 KB
- 文档页数:2
hlm模型的概念和原理
HLM模型(Hierarchical Linear Model,分层线性模型)是一种用于分析多层数据结构的统计方法,可以用于研究个体差异、群体差异以及群体与个体相互作用等方面的问题。
在社会科学、心理学、医学等领域得到广泛应用。
HLM的原理是基于线性模型的,但它将数据分为多个层次,并对每个层次的变量进行单独分析和建模。
HLM可以解决一些传统线性模型无法解决的问题,例如在研究个体差异时,传统线性模型只能考虑个体内差异,而HLM可以同时考虑个体内和个体间的差异。
在具体实现上,HLM模型涉及到两个重要的专业术语,分别是‘固定效应’和‘随机效应’。
固定效应是指做HLM模型时,不涉及group 干扰时的影响关系研究;随机效应可指在group层面时的影响关系情况。
如果完全不考虑group,即不考虑‘聚集性’问题,那么直接使用线性回归即可,并不需要使用HLM模型;而HLM模型就是处理‘聚集性’问题的一种进阶方法。
如果说使用HLM模型,并且在分析时只考虑个体效应不需要考虑group层面的效应,即只有固定效应项并无随机效应项;如果说使用HLM模型,并且在分析时考虑个体效应的同时还考虑group层面的效应,即包括固定效应项和随机效应项。
多层线性模型:HLM(hierarchical linear model)计量模型,为解决传统统计方法如回归分析在处理多层嵌套数据时的局限而产生的,是目前国际上较前沿的一套社会科学数据分析的理论和方法,优势体现两个方面:一是解决了数据嵌套问题;二是为追踪研究或重复测量研究引入了新方法。
传统的线性模型,例如,ANOV A或者回归分析,只能对涉及某一层数据的问题进行分析,而不能将涉及两层或多层数据的问题进行综合分析,而多层线性模型对解决这些问题提供了有效的统计方法。
多层线性模型的参数估计方法与进行两次回归的方法在概念上是相似的, 但二者的统计估计和验证方法却是不同的, 并且多层线性模型的参数估计方法更为稳定。
因此多层模型的应用范围也相当广泛,与传统的用于处理多元重复测量数据的方法相比,该模型具有对数据资料要求低、能够明确表示个体在第一层次的变化情况、可以通过定义第一层次和第二层次的随机变异解释个体随时间的复杂变化情况、可以考虑更高一层次的变量对于个体增长的影响等特点。
多层线性模型( multilevel model ) 由Lindley 等于1972 年提出,是用于分析具有嵌套结构数据的一种统计分析技术。
作为传统方差分析模型的有效扩展Korendijk 等和Duncan 等众多的研究者对多层线性模型进行了广泛研究。
20 多年来,该方法在社会科学领域获得了广泛应用。
近年来,有研究者提出使用多层线性模型进行面板研究,并且已在社会科学领域取得较大进展。
面板研究中多层线性模型的应用优势:由上述分析可知,在面板研究中,传统的数据分析方法会遇到很多难以克服的困难,而多层线性模型可以很好地处理上述问题。
近年来,越来越多的面板研究开始采用多层线性模型的分析方法,显示出多层线性模型在面板研究中的独特优势。
首先,多层线性模型通过考察个体水平在不同时间点的差异,明确表达出个体在层次一的变化情况,因而对于数据的解释(个体随时间的增长趋势)是在个体与重复观测交互作用基础上的解释,即不仅包含不同观测时点的差异,也包含个体之间存在的差异。
多层线性模型:HLM(hierarchical linear model)计量模型,为解决传统统计方法如回归分析在处理多层嵌套数据时的局限而产生的,是目前国际上较前沿的一套社会科学数据分析的理论和方法,优势体现两个方面:一是解决了数据嵌套问题;二是为追踪研究或重复测量研究引入了新方法。
传统的线性模型,例如,ANOV A或者回归分析,只能对涉及某一层数据的问题进行分析,而不能将涉及两层或多层数据的问题进行综合分析,而多层线性模型对解决这些问题提供了有效的统计方法。
多层线性模型的参数估计方法与进行两次回归的方法在概念上是相似的, 但二者的统计估计和验证方法却是不同的, 并且多层线性模型的参数估计方法更为稳定。
因此多层模型的应用范围也相当广泛,与传统的用于处理多元重复测量数据的方法相比,该模型具有对数据资料要求低、能够明确表示个体在第一层次的变化情况、可以通过定义第一层次和第二层次的随机变异解释个体随时间的复杂变化情况、可以考虑更高一层次的变量对于个体增长的影响等特点。
多层线性模型( multilevel model ) 由Lindley 等于1972 年提出,是用于分析具有嵌套结构数据的一种统计分析技术。
作为传统方差分析模型的有效扩展Korendijk 等和Duncan 等众多的研究者对多层线性模型进行了广泛研究。
20 多年来,该方法在社会科学领域获得了广泛应用。
近年来,有研究者提出使用多层线性模型进行面板研究,并且已在社会科学领域取得较大进展。
面板研究中多层线性模型的应用优势:由上述分析可知,在面板研究中,传统的数据分析方法会遇到很多难以克服的困难,而多层线性模型可以很好地处理上述问题。
近年来,越来越多的面板研究开始采用多层线性模型的分析方法,显示出多层线性模型在面板研究中的独特优势。
首先,多层线性模型通过考察个体水平在不同时间点的差异,明确表达出个体在层次一的变化情况,因而对于数据的解释(个体随时间的增长趋势)是在个体与重复观测交互作用基础上的解释,即不仅包含不同观测时点的差异,也包含个体之间存在的差异。
多层线性模型的解读:原理与应用多层线性模型的解读:原理与应用浙江师范大学心理研究所陈海德Chenhaide351@ 一、多层数据结构的普遍性多水平、多层次的数据结构普遍存在,如学生嵌套于班级,班级有嵌套与学校。
传统的线性模型,如方差分析和回归分析,只能涉及一层数据的问题进行分析,不能综合多层数据问题。
在实际研究中,更令人感兴趣的是学生一层的变量与班级一层的变量之间的交互作用,比如,学生之间的个体差异在不同班级之间可能是相同的、也可能是不同的。
学生数据层中,不同变量之间的关系可能因班级的不同而不同。
因此,学生层的差异可以解释为班级层的变量。
另一种类型的两层嵌套数据来自纵向研究数据,不同时间观测数据形成了数据结构的第一层,而被试之间的个体差异形成了第二层。
可以探索个体在发展趋势上的差异。
二、传统技术处理多层数据结构的局限如果把变量分解到个体水平,在个体水平上分析。
但是我们知道这些学生是来自同一班级的,不符合观察独立原则。
导致个体间随机误差相互独立的假设不能满足。
如果把个体变量集中到较高水平,在较高水平上进行分析。
这样丢弃了组内信息,而组内变异可能占了大部分。
三、原理☆水平1的模型与传统的回归模型类似,所不同的是回归方程的截距和斜率不再是一个常数,而是水平2变量水平不同,其回归方程的截距和斜率也不同的,是一个随机变量。
如,每个班级的回归方程的截距和斜率都直接依赖于班级教师教学方法。
☆多层线性模型分为“随机截距模型”和“随机截距和随机斜率模型”。
“随机截距模型”假定因变量的截距随着群体的不同而不同,但各群体的回归斜率是固定,因此不同层次因素之间缺乏互动。
“随机截距和随机斜率模型”假定截距和回归斜率都因群体而异,允许不同层次因素之间的互动。
参数估计方法有:迭代广义最小二乘法、限制性的广义最小二乘估计、马尔科夫链蒙特卡罗法。
这些方法代替了传统的最小二乘法估计,更为稳定和精确。
比如,当第二层的某单位只有少量的被试,或不同组样本量不同时,多层线性模型进行了加权估计、迭代计算。
首都师范大学学报(社会科学版)Journal of Capital Normal University 2002年第2期(Social Sciences Edition )(总第145期) 心理学研究多层线性模型的原理及应用*雷 雳1 张 雷2(1.首都师范大学教育科学学院心理学系,北京100089;2.香港中文大学教育心理学系) 摘 要: 本文对多层线性模型(Hierarchical Linear Models ,HL M )的理论缘起、应用范围以及其应用原理进行了阐述,在指出经典统计技术处理多层数据结构上的局限的同时,表明了多层线性模型在这方面的优越性。
本文最后对多层线性模型的效果及局限性进行了简要分析。
关键词: 多层数据;回归;线性模型;多层模型中图分类号:G44 文献标识码:A 文章编号:1004-9142(2002)02-0110-05收稿日期:2001-12-12作者简介:雷 雳(1968-),男,汉族,重庆市人,首都师范大学教育科学学院心理学系副教授,心理学博士;张 雷,男,汉族,天津市人,香港中文大学教育心理学系副教授,心理学博士。
*联系方式:100089,北京市西三环北路83号,首都师范大学心理学系。
dr .leili @china .com 。
多层线性模型(Hierarchical Linear Models ,HLM )是针对经典统计技术在处理具有多层结构的数据时所存在的局限、以及可能产生的对分析结果的曲解而提出的,它适宜对广泛存在的多层数据结构进行恰当的、深入的分析和解释。
一、多层数据结构的普遍性在社会科学中,很多研究问题都体现为多水平的、多层的数据结构。
其中最为典型的例子就是在教育研究中学生镶嵌于班级、而班级又镶嵌于学校的现象;或者,也可以简单地把学生看成是镶嵌于学校。
在此,学生代表了数据结构的第一层,而班级或者学校则代表了数据结构的第二层。
如果数据是学生镶嵌于班级、且班级镶嵌于学校,那么就是三层的数据结构。
阶层线性模型的原理及应用1. 引言阶层线性模型(Hierarchical Linear Model,简称HLM)是一种用于处理具有分层结构数据的统计模型。
在许多领域中,数据一般不是独立同分布的,而是存在多个层次结构的。
阶层线性模型通过考虑分层结构的影响,可以更准确地反映数据的特点。
本文将介绍阶层线性模型的原理以及在实际应用中的一些案例。
2. 阶层线性模型的原理阶层线性模型基于线性回归模型,但考虑了数据的分层结构。
在阶层线性模型中,数据被分为多个层次,每个层次具有自己的参数。
参数可以在层次之间传递,并在统计分析中考虑到层次之间的关系。
阶层线性模型的数学表达式如下:$y_{ij} = \\beta_{0j} + \\beta_{1j}x_{ij} + \\epsilon_{ij}$其中,y ij是第j层第i个观测值的因变量,$\\beta_{0j}$和$\\beta_{1j}$是第j 层的截距和斜率参数,x ij是第j层第i个观测值的自变量,$\\epsilon_{ij}$是误差项。
阶层线性模型将层次之间的关系纳入模型中,通过估计各个层次的参数来获取更准确的结果。
通常,阶层线性模型中至少包含两个层次的结构,比如学生层次和学校层次,可以进一步扩展到更多的层次。
3. 阶层线性模型的应用案例阶层线性模型在各个领域都有广泛的应用,下面将介绍一些典型的应用案例。
3.1 教育领域在教育领域,阶层线性模型可用于分析学生的学习成绩。
通常,学生的学习成绩不仅与个体因素相关,还与学校因素相关。
阶层线性模型可以将学生与学校的关系纳入考虑,通过估计学校层次和个体层次的参数,了解学校对学生成绩的影响,并探究学校间的差异。
3.2 组织行为研究阶层线性模型在组织行为研究中也有广泛的应用。
例如,研究员工的工作满意度时,可以将员工嵌入到团队和组织的层次结构中,通过阶层线性模型分析不同层次因素对员工工作满意度的影响。
3.3 公共卫生研究阶层线性模型在公共卫生研究中也发挥着重要作用。
多层线性模型的原理与应用1. 简介多层线性模型是一种数据分析和建模方法,适用于解决复杂的非线性关系问题。
本文将介绍多层线性模型的原理和应用,并提供一些实际案例。
2. 原理多层线性模型基于线性回归模型的基本思想,通过添加多个隐藏层来实现对非线性关系的拟合。
具体步骤如下:2.1 数据准备首先,需要准备一组有标签的训练数据作为模型的输入。
训练数据应包括输入特征和对应的输出标签。
2.2 构建模型多层线性模型由输入层、隐藏层和输出层组成。
输入层接受输入特征,将其传递给隐藏层。
隐藏层通过计算加权和并经过一个激活函数得到输出。
输出层将隐藏层的输出进行线性组合得到最终的预测值。
2.3 定义损失函数为了评估模型的准确性,需要定义一个损失函数来衡量预测值与真实值之间的差异。
常用的损失函数包括平方损失和交叉熵损失。
2.4 模型优化使用优化算法,如梯度下降法,来最小化损失函数,找到模型参数的最优解。
通过反复迭代更新参数,逐渐优化模型性能。
3. 应用案例多层线性模型在许多领域都有广泛的应用。
以下是几个常见的应用案例:3.1 信用评分在金融领域,多层线性模型可用于信用评分模型的构建。
通过收集借贷者的相关信息,如年龄、收入、负债情况等,可以预测借贷者的信用风险。
3.2 图像识别多层线性模型也可应用于图像识别任务中。
通过将图像像素作为输入特征,使用多层线性模型可以对图像进行分类。
例如,可以将猫和狗的图像分别作为正样本和负样本,训练模型来识别图像中的动物种类。
3.3 自然语言处理在自然语言处理领域,多层线性模型可用于情感分析和文本分类任务。
通过将文本转换为向量表示,并使用多层线性模型进行分类,可以对文本进行情感判断或分类。
3.4 推荐系统多层线性模型在推荐系统中也有重要应用。
通过分析用户的历史行为和兴趣特征,可以构建个性化的推荐模型,为用户提供个性化的推荐内容。
4. 总结多层线性模型通过添加多个隐藏层,可以有效解决非线性问题。
它在信用评分、图像识别、自然语言处理和推荐系统等领域都有广泛应用。
多层线性模型的解读:原理与应用浙江师范大学心理研究所陈海德********************一、多层数据结构的普遍性多水平、多层次的数据结构普遍存在,如学生嵌套于班级,班级有嵌套与学校。
传统的线性模型,如方差分析和回归分析,只能涉及一层数据的问题进行分析,不能综合多层数据问题。
在实际研究中,更令人感兴趣的是学生一层的变量与班级一层的变量之间的交互作用,比如,学生之间的个体差异在不同班级之间可能是相同的、也可能是不同的。
学生数据层中,不同变量之间的关系可能因班级的不同而不同。
因此,学生层的差异可以解释为班级层的变量。
另一种类型的两层嵌套数据来自纵向研究数据,不同时间观测数据形成了数据结构的第一层,而被试之间的个体差异形成了第二层。
可以探索个体在发展趋势上的差异。
二、传统技术处理多层数据结构的局限如果把变量分解到个体水平,在个体水平上分析。
但是我们知道这些学生是来自同一班级的,不符合观察独立原则。
导致个体间随机误差相互独立的假设不能满足。
如果把个体变量集中到较高水平,在较高水平上进行分析。
这样丢弃了组内信息,而组内变异可能占了大部分。
三、原理☆水平1(学生)的模型与传统的回归模型类似,所不同的是回归方程的截距和斜率不再是一个常数,而是水平2变量水平不同(不同的班级),其回归方程的截距和斜率也不同的,是一个随机变量。
如,每个班级的回归方程的截距和斜率都直接依赖于班级教师教学方法。
☆多层线性模型分为“随机截距模型”和“随机截距和随机斜率模型”。
“随机截距模型”假定因变量的截距随着群体的不同而不同,但各群体的回归斜率是固定,因此不同层次因素之间缺乏互动。
“随机截距和随机斜率模型”假定截距和回归斜率都因群体而异,允许不同层次因素之间的互动。
参数估计方法有:迭代广义最小二乘法、限制性的广义最小二乘估计、马尔科夫链蒙特卡罗法。
这些方法代替了传统的最小二乘法估计,更为稳定和精确。
比如,当第二层的某单位只有少量的被试,或不同组样本量不同时,多层线性模型进行了加权估计、迭代计算。
分层线性模型分层线性模型(hierarchical linear model HLM)的原理及应用一、概念:分层线性模型(hierarchical linear model HLM)又名多层线性模型(Multilevel Linear Model MLM)、层次线性模型(Hierarch Linear Mode1)、多层分析(Multilevel Analysis/Model)。
相对于传统的两种统计方法:一般线性模型(general linear model GLM)和广义线性模型(generalized linear models GLMs),它们又有所不同,HLM中的线性模型指的是线性回归,不过它与一般的分层线性回归(Hierarchical Regression)又是不同的,具体的不同见下面数学模型部分。
HLM又被通俗的称为“回归的回归”。
Wikipedia:“一般线性回归和多重线性回归都是发生在单一层面,HLM相对于更适用于嵌套数据(nest data)。
”在理解HLM之前应了解有关回归分析和嵌套设计(分层设计)的基本知识。
二、模型:1、假设:由于个体行为不仅受个体自身特征的影响,也受到其所处环境(群体/层次)的影响。
相对于不同层次的数据,传统的线性模型在进行变异分解时,对群组效应分离不出,而增大模型的误差项。
而且不同群体的变异来源也可能分布不同,可能满足不了传统回归的方差齐性假设。
在模型应用方面,不同群体(层次)的数据,也不能应用同一模型。
鉴于传统方法的局限性,分层技术则解决了这些生态谬误(Ecological Fallacy)。
它包含了两个层面的假设:a、个体层面:这个与普通的回归分析相同,只考虑自变量X对因变量Y的影响。
b、群组层面:群组因素W分别对个体层面中回归系数和截距的影响。
2、数学模型:a、个体层面:Yij=Β0j+Β1jXij+eijb、群组层面:Β0j=γ00+γ01Wj+U0jΒ1j=γ10+γ11Wj+U1j涉及到多个群组层次的时候原理与之类似,可以把较低级层次的群组,如不同的乡镇层面与不同的县市层面,可以这样理解,乡镇即是一个个体,群组即是不同的县市。
多层统计分析模型(Multilevel Statistical Analysis Model)是一种应用于多层次数据结构的统计分析方法,也被称为混合效应模型、随机系数模型或多层线性模型。
它可以处理数据存在层级结构、嵌套关系或群组效应的情况。
以下是多层统计分析模型的方法和应用:方法:1. 模型结构:-多层统计分析模型通过将数据分为不同层级,引入随机效应和固定效应来描述不同层次之间的变异性。
-通常包括两个或多个层级,如个体与群组、学生与学校、病人与医院等。
2. 参数估计:-利用最大似然估计或贝叶斯方法对模型中的参数进行估计。
-可能需要使用迭代算法(如EM算法)来求解模型的参数。
3. 模型评估:-使用各种统计指标(如AIC、BIC等)来评估模型的拟合优度和预测效果。
-还可以进行模型比较,选择最佳的模型结构。
应用:1. 教育研究:-用于分析学生在学校之间的学术成绩差异和学校因素对学生表现的影响。
-可以揭示学校特征、教师效应等对学生学业发展的贡献。
2. 医学研究:-用于分析患者在医院之间的治疗效果差异和医院因素对患者结果的影响。
-可以考察医院特征、医生经验等对患者健康结果的影响。
3. 社会科学:-用于研究个体与群组之间的关系,如家庭与社区、员工与组织等。
-可以揭示个人特征、群组效应等对行为和态度的影响。
4. 市场调研:-用于分析消费者在不同地区或市场之间的购买行为差异和市场因素对销售的影响。
-可以揭示市场特征、产品特点等对消费者决策和市场竞争力的影响。
多层统计分析模型在处理多层次数据时具有优势,可以更准确地估计不同层级的因素对观测值的影响,并提供更全面的数据分析结果。
它在教育、医学、社会科学和市场调研等领域得到广泛应用。
多层线性模型介绍多层线性模型(Multilayer Linear Model)是一种机器学习模型,也是人工神经网络(Artificial Neural Network)的一种特例。
它由多个线性层组成,每个线性层之间通过非线性函数进行连接,以实现更强大的模型学习能力。
多层线性模型的基本结构如下:输入层(Input Layer)接收原始数据,中间层(Hidden Layer)进行特征转换,输出层(Output Layer)给出预测结果。
输入层、中间层和输出层的每个节点都是线性层,由多个输入值和对应的权重相加,并加上一个偏置项得到输出值。
而输入层、中间层和输出层之间的节点通过非线性函数激活,得到非线性模型输出。
多层线性模型的每一层都可以看作是特征提取器,通过学习不同的权重和偏置,每一层都能够将输入数据进行非线性映射。
中间层的节点数可以根据需要自定义,而层数一般较深。
模型的输出结果通过输出层的节点给出,可以是一个标量或向量,用于分类、回归等任务。
多层线性模型的训练过程非常重要。
通常使用反向传播算法进行训练,即通过计算损失函数对模型参数的偏导数,根据梯度下降法来迭代调整模型参数,使损失函数最小化。
训练过程中还会选择合适的学习率、正则化方法、优化算法等来提高模型的泛化能力和学习效率。
然而,多层线性模型也存在一些缺点。
首先,模型的结构较为复杂,参数较多,训练时间较长。
其次,模型的训练过程容易受到梯度消失和梯度爆炸等问题的影响,需要选择合适的激活函数和优化算法来解决。
此外,模型的解释性较弱,很难解释每个特征对结果的具体影响。
针对多层线性模型的缺点,研究人员提出了一系列的改进方法。
如引入卷积层、循环层等特殊层结构,可以更好地处理时空信息和序列数据;使用批标准化等技术,可以提高模型的训练效率和鲁棒性;引入残差连接、注意力机制等技术,可以提高模型的学习能力和泛化能力。
总而言之,多层线性模型作为一种机器学习模型,具有一定的应用价值和研究前景。
多层线性模型的解读:原理与应用
浙江师范大学心理研究所陈海德
********************
一、多层数据结构的普遍性
多水平、多层次的数据结构普遍存在,如学生嵌套于班级,班级有嵌套与学校。
传统的线性模型,如方差分析和回归分析,只能涉及一层数据的问题进行分析,不能综合多层数据问题。
在实际研究中,更令人感兴趣的是学生一层的变量与班级一层的变量之间的交互作用,比如,学生之间的个体差异在不同班级之间可能是相同的、也可能是不同的。
学生数据层中,不同变量之间的关系可能因班级的不同而不同。
因此,学生层的差异可以解释为班级层的变量。
另一种类型的两层嵌套数据来自纵向研究数据,不同时间观测数据形成了数据结构的第一层,而被试之间的个体差异形成了第二层。
可以探索个体在发展趋势上的差异。
二、传统技术处理多层数据结构的局限
如果把变量分解到个体水平,在个体水平上分析。
但是我们知道这些学生是来自同一班级的,不符合观察独立原则。
导致个体间随机误差相互独立的假设不能满足。
如果把个体变量集中到较高水平,在较高水平上进行分析。
这样丢弃了组内信息,而组内变异可能占了大部分。
三、原理
☆水平1(学生)的模型与传统的回归模型类似,所不同的是回归方程的截距和斜率不再是一个常数,而是水平2变量水平不同(不同的班级),其回归方程的截距和斜率也不同的,是一个随机变量。
如,每个班级的回归方程的截距和斜率都直接依赖于班级教师教学方法。
☆多层线性模型分为“随机截距模型”和“随机截距和随机斜率模型”。
“随机截距模型”假定因变量的截距随着群体的不同而不同,但各群体的回归斜率是固定,因此不同层次因素之间缺乏互动。
“随机截距和随机斜率模型”假定截距和回归斜率都因群体而异,允许不同层次因素之间的互动。
参数估计方法有:迭代广义最小二乘法、限制性的广义最小二乘估计、马尔科夫链蒙特卡罗法。
这些方法代替了传统的最小二乘法估计,更为稳定和精确。
比如,当第二层的某单位只有少量的被试,或不同组样本量不同时,多层线性模型进行了加权估计、迭代计算。
四、应用
1 用于类似组织管理、学校教育等具有多层数据结构的领域研究。
2 用于个体重复测量数据的追踪研究。
测量层面作为第一水平,个体层面作为第二水平
3 用于做文献综述,即对众多研究成果进行定量综合。
探讨不同研究中进行的处理、研究方法、被试特征和背景上的差异与效应之间的关系。
4 充分利用多层模型较为高级的统计估计方法来改善单层回归的估计和分析。
五、优势
1 由于多层线性模型建立在更合理的假设之上,考虑到了来自不同层次的随机误差和变量信息,因此能提供更加准确的标准误估计、更有效的区间估计和假设检验。
2 多层线性模型可以计算任何水平上测量的协方差,如可以通过计算不同水平变异在总变异中占的比率来确定不同水平对因变量的影响程度,例如研究者可以探讨班级和学生的其他特征对因变量变异的作用到底有多大。
还可以分析不同水平上变量之间的交互作用。
3 可以发现所得回归方程中,截距和斜率之间的相关关系,以便更好地解释自变量和因变量之间变化的规律。
4 多层次分析不仅可以用于分析观测变量之间的因果关系,而且作为协方差结构模型的拓展,可以分析具有多层结构的潜变量之间的因果关系,即建立多层水平结构方程模型。
5 不仅可以分析层次结构数据,还可以分析重复测量数据。
测量看成第一水平,测试个体看成第二水平。
6 不仅可以分析服从正态分布的连续数据,也可以分析离散型的数据,如二项分布和泊松分布的数据。
7 使用范围较广,传统单因素方差分析、回归分析都是多层分析模型的简化(假设两个水平模型中有一个水平的变量为常数)。
8
六、注意
1 如果数据不具备结构性,则不必用层次分析。
用传统的单水平分析模型可以得到更好解释。
2 虽然用多层分析可以更准确地描述事物间的因果关系,但它不能用来建立理论,不能代替专业理论方面的分析。
3 仍然以线性和正态的假设为基础。
4 仍然是研究几个变量预测一个变量的相对简单回归结构
七、步骤与结果解释
第一水平变量x,第二水平变量1为w,第二水平变量2为u,因变量为y
1 无条件均值模型(零模型):不加入任何自变量,回答是否同一群体具有较大相似性,即第二水平随机变异显著是进行后面模型分析的基础,如果不显著则没有必要进行多水平分析。
1.1固定部分的参数估计:y的总体平均值估计
1.2随机部分的参数估计:群组之间是否存在显著差异?群组之间的相关(跨级相关:
ICC)?群组变异在总变异中占的比例?
1.3 描述模型拟合的差异统计量。
比如Deviance=1200
2 无条件增长模型(随机效应模型):回答的问题是因变量y和自变量x是否有线性变化的趋势,以及这种线性变化趋势是否存在群体间差异。
模型中不加入第二层水平的自变量2.1固定部分的参数估计:y和x的关系(截距和斜率)
2.2随机部分的参数估计:第一水平的截距和斜率是否会随着第二水平的变化而变化。
2.3 描述模型拟合的差异统计量。
比如Deviance=900,与零模型相比,减少了300,如果
减少的300达到显著,则说明加入了第一水平变量,使模型拟合显著提高。
3 全模型(混合效应模型):回答的问题是第二水平中哪些变量对x-y关系(即斜率和截距)有影响,影响程度多少。
2.1固定部分的参数估计:第二水平变量(w1、w2…)对x-y关系(即斜率和截距)的影
响是否达到显著。
对截距影响显著,则说明第二水平中的w1、w2变量对因变量y有显著影响;对斜率影响显著,则说明w1、w2变量对x-y关系有显著影响。
2.2随机部分的参数估计:检验引入第二水平变量w1、w2后,模型中变异的减少程度,说明了引入w1、w2的必要性,以及它们解释多大程度的变异。
另外,检验除了考虑第二水平变量(w1、w2…)的作用外,x-y关系(即斜率和截距)的变异是否依然显著,说明是否还需考虑其他第二水平上的因素。
3.3 描述模型拟合的差异统计量。
比如Deviance=850,与无条件增长模型相比,减少了
50,如果减少的50达到显著,则说明加入的了第二水平变量,使模型拟合显著提高。