图1:不考虑学校之间差异的回归直线
HLM数学模型
(2)假如将数据进行简单合并,用每个学校学生 的平均成绩代替这个学校的成绩,直截了当在 学校水平上估计入学成绩对高考成绩的影响, 得到一条回归直线,如图2所示,这种方法忽 略了不同学生之间的差异;
图2:只考虑学校差异忽略学生差异回归直线
HLM数学模型
多层线性模型简介 两水平模型
回归分析模型
Yi 0 1 X i i
i ~ N 0, 2
回归分析模型的假设
线性(Linearity) 误差正态分布( normally
distributed) 误差方差齐性(homoskedastic) 误差或观测个体之间相互独立
(independent)
HLM常用模型类型
随机效应单因素协方差分析(One-way ANCOVA with Random Effects) 水平1:
Yij 0 j 1j X ij eij
水平2:
0 j g 00 u0 j 1 j g 10
HLM常用模型类型
一般的线性回归模型 第一水平 :
第二水平:
rij表示什么?
残差项 定义第 j 组第i 个观测 均值为0
模型的特征
注意到: 我们有:
ij = uj + rij
Var(ij)
= Var(uj + rij) = Var(uj) + Var(rij) + 2*Cov(uj,rij) = Var(uj) + Var(rij)
模型的特征
什么是多层(多水平)数据?
多层(多水平)数据指的是观测数据在单位上具 有嵌套的关系。如学生嵌套于班级,班级嵌套于 学校等。
同一单位内的观测,具有更大的相似性。同一 个班级的学生由于受相同的班级环境等因素的 影响有更大的相似性。