第四讲 多层模型
- 格式:pdf
- 大小:761.32 KB
- 文档页数:73
多层线性模型:HLM(hierarchical linear model)计量模型,为解决传统统计方法如回归分析在处理多层嵌套数据时的局限而产生的,是目前国际上较前沿的一套社会科学数据分析的理论和方法,优势体现两个方面:一是解决了数据嵌套问题;二是为追踪研究或重复测量研究引入了新方法。
传统的线性模型,例如,ANOV A或者回归分析,只能对涉及某一层数据的问题进行分析,而不能将涉及两层或多层数据的问题进行综合分析,而多层线性模型对解决这些问题提供了有效的统计方法。
多层线性模型的参数估计方法与进行两次回归的方法在概念上是相似的, 但二者的统计估计和验证方法却是不同的, 并且多层线性模型的参数估计方法更为稳定。
因此多层模型的应用范围也相当广泛,与传统的用于处理多元重复测量数据的方法相比,该模型具有对数据资料要求低、能够明确表示个体在第一层次的变化情况、可以通过定义第一层次和第二层次的随机变异解释个体随时间的复杂变化情况、可以考虑更高一层次的变量对于个体增长的影响等特点。
多层线性模型( multilevel model ) 由Lindley 等于1972 年提出,是用于分析具有嵌套结构数据的一种统计分析技术。
作为传统方差分析模型的有效扩展Korendijk 等和Duncan 等众多的研究者对多层线性模型进行了广泛研究。
20 多年来,该方法在社会科学领域获得了广泛应用。
近年来,有研究者提出使用多层线性模型进行面板研究,并且已在社会科学领域取得较大进展。
面板研究中多层线性模型的应用优势:由上述分析可知,在面板研究中,传统的数据分析方法会遇到很多难以克服的困难,而多层线性模型可以很好地处理上述问题。
近年来,越来越多的面板研究开始采用多层线性模型的分析方法,显示出多层线性模型在面板研究中的独特优势。
首先,多层线性模型通过考察个体水平在不同时间点的差异,明确表达出个体在层次一的变化情况,因而对于数据的解释(个体随时间的增长趋势)是在个体与重复观测交互作用基础上的解释,即不仅包含不同观测时点的差异,也包含个体之间存在的差异。
多层线性模型的原理及其运用介绍2009年03月16日星期一 21:28多层线性模型的原理及其运用介绍传统线性模型的基本假设是线性、正态、方差齐性和独立,后两个假设在嵌套的取样中很难成立。
比如在对学校的学生进行的研究中,收集到的变量可以分为一定的层次:首先是学生本身的变量,比如年龄、学习成绩等等;其次是班级的变量,比如班级的人数,男女生的比例、班主任的管理风格等等;再次是学校的变量,比如重点或者非重点,学校所在地等。
这样的数据就构成了一种具有层次的嵌套结构。
传统方法处理这种嵌套数据有几种变通的方法:(1)基于个体水平的分析,即直接把来自不同组的数据进行合并,在个体层次上进行分析,获得对个体整体状况的了解。
这样做的一个不足是放弃了对不同组之间差异的考虑,使得很多本来由分组带来的差异被解释为个体的差异。
(2)基于组水平的分析,即把个体的数据以均数或其它形式带到高一层变量的分析中,仅仅考虑组水平的因素对因变量的影响。
这种做法在一定程度上可以反映组因素的作用,不足之处是放弃了对个体差异的解释——而使得很多结论没有说服力。
多层和嵌套分析的思想由来已久,但在上世纪90年代才发展为系统完整的理论和方法。
分层技术解决了困扰社会科学很久的生态谬误(Ecological Fallacy)。
多层线性模型这一术语最早是由Lindley和Smith于1972年提出,但是由于该模型参数估计的方法较传统的回归方法不同,所以在很长一段时间,它的应用受到了计算技术的限制。
直到1977年,Dempster, Laud和Rubi。
等人提出了EM (Expectation Maximization)算法,1981年,Dempster等人将EM算法应用于解决多层线性模型的参数估计,使得这一方法的应用成为可能。
1983年,Strenio, Weisberg和Bryk等相继将这一方法应用于社会学的研究。
随后,1986年Goldstein应用迭代加权广义最小二乘法(Iteratively Reweighted Generalized Least Squares)估计参数,1987年,Longford应用费歇得分算法( Fisher Scoring Algorithm )对模型参数进行了估计。
多层线性模型的解读:原理与应用多层线性模型的解读:原理与应用浙江师范大学心理研究所陈海德Chenhaide351@ 一、多层数据结构的普遍性多水平、多层次的数据结构普遍存在,如学生嵌套于班级,班级有嵌套与学校。
传统的线性模型,如方差分析和回归分析,只能涉及一层数据的问题进行分析,不能综合多层数据问题。
在实际研究中,更令人感兴趣的是学生一层的变量与班级一层的变量之间的交互作用,比如,学生之间的个体差异在不同班级之间可能是相同的、也可能是不同的。
学生数据层中,不同变量之间的关系可能因班级的不同而不同。
因此,学生层的差异可以解释为班级层的变量。
另一种类型的两层嵌套数据来自纵向研究数据,不同时间观测数据形成了数据结构的第一层,而被试之间的个体差异形成了第二层。
可以探索个体在发展趋势上的差异。
二、传统技术处理多层数据结构的局限如果把变量分解到个体水平,在个体水平上分析。
但是我们知道这些学生是来自同一班级的,不符合观察独立原则。
导致个体间随机误差相互独立的假设不能满足。
如果把个体变量集中到较高水平,在较高水平上进行分析。
这样丢弃了组内信息,而组内变异可能占了大部分。
三、原理☆水平1的模型与传统的回归模型类似,所不同的是回归方程的截距和斜率不再是一个常数,而是水平2变量水平不同,其回归方程的截距和斜率也不同的,是一个随机变量。
如,每个班级的回归方程的截距和斜率都直接依赖于班级教师教学方法。
☆多层线性模型分为“随机截距模型”和“随机截距和随机斜率模型”。
“随机截距模型”假定因变量的截距随着群体的不同而不同,但各群体的回归斜率是固定,因此不同层次因素之间缺乏互动。
“随机截距和随机斜率模型”假定截距和回归斜率都因群体而异,允许不同层次因素之间的互动。
参数估计方法有:迭代广义最小二乘法、限制性的广义最小二乘估计、马尔科夫链蒙特卡罗法。
这些方法代替了传统的最小二乘法估计,更为稳定和精确。
比如,当第二层的某单位只有少量的被试,或不同组样本量不同时,多层线性模型进行了加权估计、迭代计算。
多层次线性理论模型综述摘要:组织的多层次系统结构逐渐显露出传统组织偏宏观或偏微观观点的局限性。
嵌套性质数据的处理方法,可以采用多层次线性模型(Hierarchical Linear Modeling,简称HLM )加以分析和处理。
本文旨在对HLM 理论分析的方法、模型、原理、优点以及局限性展开综述,以期获得更好的理解。
关键字:多层次线性模型 个人层次 群体层次 聚合一、引言在社会科学中,很多研究问题收集来的数据都体现出多水平,多层次的嵌套结构。
比较典型的例子就是:在教育研究中,学生嵌套于班级中,而班级嵌套于学校中。
传统的回归模型或从宏观的团体层次加以分析,或从微观层次加以分析,都对数据的的嵌套性视而不见,这大大降低了研究结果的现实意义。
在过去十年的组织研究中,多层次的观点逐渐发展成熟,确认了组织既是宏观亦是为官的观点而且在综合方法上应该考虑两种情形:意识群体、组织及其他情境因素如何由上而下影响个人层次的结果变量;二是个人知觉、态度及行为由下而上以形成群体、次单位与组织的现象。
针对跨层次的数据结构,利用多层次理论模型,可以较好的加以处理,其中以多层线性模型(HLM )最为常用。
这一方法的开创及发展的主要贡献者之一是英国伦敦大学的Harvey Goldstein 教授及研究者把这种方法称作“多层分析”。
另一主要开拓者美国密歇根大学的StephenW.Raudenbush 教授和同行把它称为“分层线性模型结构”。
按照张雷等人的叫法称其为“多层线性模型”或“多层模型”。
二、多层次线性理论模型在多层次线性模型中,自变量可能来自于较低层次的构念,或是较高层次的构念。
这些变量之间的关系可以由下面的模型描述:Level-1 Model :01ij j j ij ij Y X r =β+β+Level-2 Model :000010j j j G U β=γ+γ+ 110111j j j G U β=γ+γ+ij Y 是指个人i 在j 群体中的结果变量,ij X 是个人i 在j 群体中的预测因子值,0j β与1j β是每个j 群体分别被估计出的截距项与斜率,ij r 为残差项。