半参数回归模型及模拟实例分析_陈长生

格式：pdf
大小：110.59 KB
文档页数：3

下载文档原格式

半参数回归模型中误差方差估计之分布的非一致性收敛速度

n
n
gn∗ (t) = Unj (t)(Yj − Xjτ β)
Unk (t),
(2)
j=1
k=1
∗ n 20T0E1 6A 9 /t4 DW(170420200202e6) D6A/z218 DW7 RU
380
!%Z
27
4
Unj (t) = K
Tj − t hn
Rn,2(t) − (Tj − t)Rn,1(t) ,
0≤t≤1
0≤t≤1
1 I (ii) g(t) [0, 1] )) H 6]
(iii) f K(·) S R1 I ) T'+Dc] 9y$bu
(G 4 K(0) = 0, |u|γK(u) du < ∞, γ = 1, 2, · · ·,
νm =
" J$ < ν2 − ν12 > 0,
umK(u) du, m = 0, 1, 2.
> 27 > 2 8
"&
Vol. 27 No. 2
2004 5 5 .
ACTA MATHEMATICAE APPLICATAE SINICA
May, 2004
JL_WV]flcNRNUXi TKOShjg^ `Q ∗
pon
(
1 #'\ -; 100022)
<C Engle
[1]
mh|E@ =^ta ( ]sa/
pg
1/ (1) > YvU β 6 2 d IL ]sa/ k#98 g(t) ]
x q* ( x 3i v [3], g(t) ]xA k gn∗(t) = a, ,+ a g b (G

6.4 半参数模型解析

• 由于半参数模型估计的收敛速度慢于参数模型，必须有足够多的样本才能实现半参数模型的估计。 • 半参数离散选择模型=关于解释变量的参数部分+关于随机误差项的非
• 建议不作为课堂教学内容。
§6.4半参数计量经济学模型
一、半参数线性回归模型二、半参数二元离散选择模型
说明
• 从模型设定的角度，在实际应用研究中，一部分解释变量与被解释变量的关系是可以设定的，而一部分难于设定，提出了半参数模型问题。 • 从技术角度，完全非参数模型估计的收敛速度随着解释变量的增加而越来越慢，存在“维数诅咒 ” ，提出了半参数模型问题。 • 半参数模型在应用研究，特别在微观经济等领域具有广泛应用。因为对于微观计量经济学模型，一般需要比较多的解释变量。 • 半参数模型与微观计量经济学模型结合，是一个方向。本节以半参数离散选择模型为例。
• 最小二乘核估计不能估计出非参数部分函数的导数，在具体应用中具有较大的局限性。
• 最小二乘局部线性估计可以估计出非参数部分函数的导数，该估计方法在实际应用中被广泛使用。 • 半参数线性模型的最小二乘局部线性估计分三步进行估计。
• 第一步：先设β已知，基于以下模型，得到g(x)的局部线性估计,同时也可以获得其导数的估计。
一、半参数线性回归模型
1、半参数回归模型
Yi βZi g (Xi ) i , i 1, 2,
Zi (Z1i , , Z d0i )
,n
X i ( X1i ,, X d1i )
• 模型的参数部分作为主要部分，把握被解释变量的大势走向，适于外延预测；非参数部分，可以对被解释变量作局部调整，使模型更好地拟合样本观测值。 • 模型没有常数项。如果有了常数项，则模型不可识别。 • 随机误差序列均值为零，与所有解释变量不相关。

(整理)第七章非参数回归模型与半参数回归模型

第七章非参数回归模型与半参数回归模型第一节非参数回归与权函数法一、非参数回归概念前面介绍的回归模型，无论是线性回归还是非线性回归，其回归函数形式都是已知的，只是其中参数待定，所以可称为参数回归。

参数回归的最大优点是回归结果可以外延，但其缺点也不可忽视，就是回归形式一旦固定，就比较呆板，往往拟合效果较差。

另一类回归，非参数回归，则与参数回归正好相反。

它的回归函数形式是不确定的，其结果外延困难，但拟合效果却比较好。

设Y 是一维观测随机向量，X 是m 维随机自变量。

在第四章我们曾引进过条件期望作回归函数，即称g (X ) = E (Y |X ) （7.1.1）为Y 对X 的回归函数。

我们证明了这样的回归函数可使误差平方和最小，即22)]([min )]|([X L Y E X Y E Y E L-=-（7.1.2）这里L 是关于X 的一切函数类。

当然，如果限定L 是线性函数类，那么g (X )就是线性回归函数了。

细心的读者会在这里立即提出一个问题。

既然对拟合函数类L (X )没有任何限制，那么可以使误差平方和等于0。

实际上，你只要作一条折线(曲面)通过所有观测点(Y i ，X i )就可以了是的，对拟合函数类不作任何限制是完全没有意义的。

正象世界上没有绝对的自由一样，我们实际上从来就没有说放弃对L(X)的一切限制。

在下面要研究的具体非参数回归方法，不管是核函数法，最近邻法，样条法，小波法，实际都有参数选择问题(比如窗宽选择，平滑参数选择)。

所以我们知道，参数回归与非参数回归的区分是相对的。

用一个多项式去拟合(Y i ，X i )，属于参数回归；用多个低次多项式去分段拟合(Y i ，X i )，叫样条回归，属于非参数回归。

二、权函数方法非参数回归的基本方法有核函数法，最近邻函数法，样条函数法，小波函数法。

这些方法尽管起源不一样，数学形式相距甚远，但都可以视为关于Y i 的线性组合的某种权函数。

也就是说，回归函数g (X )的估计g n (X )总可以表为下述形式：∑==ni i i n Y X W X g 1)()(（7.1.3）其中｛W i (X )｝称为权函数。

时间序列资料预测的半参数回归模型

3.误差估计 3.误差估计
（1）大样本当定义误差的总体方差σ2的估计为
1 2 ˆ σ = N ˆ% ( X ij − bi ) 2 ∑∑
i =1 j =1 n l
(5)
ˆ 2 为σ2的一个渐进正态估计。则σ
（2）小样本误差的总体方差σ2的估计为
n l 1 2 ˆ%) 2 ˆ σ = ∑∑ ( X ij − bi N − l − 1 i =1 j =1
2.把(3)式代入(2)后b的最小二乘估计 2.
作变换
% = i − n +1, X ij = X ij − X j , i 2 % X ij % X ij i ∑ ∑i ij ˆ = ij b = % %2 i l∑i ∑
i i
则
(4)
ˆ 由文献Leabharlann 知, N (b − b) (N=nl为样本含量)收敛于 ˆ 一个0均值的正态分布,且 g ( j ) 也收敛于 g ( j )
季节性时间序列资料预测的半参数回归模型
一般的半参数回归模型是指:
Y = β ′ X + g (T ) + ε
(1)
其中(X,T)∈Rp×R1为随机向量或设计点列, T 的支撑集为有界闭集,β为P×1的未知参数向量, g(·)是定义于一有界闭集上的未知函数,ε 为随机误差,E(ε)=0,E(ε2)=σ2(未知), 且ε与(X,T)相互独立。
对季节性时间序列资料 X ij (i=1,2…,n;j =1,2…,l),其中为年份长度为季节长度。其中n为年份长度为季节长度。其中为年份长度,l为季节长度根据时间序列资料的加法原理有如下半参数回归模型 X ij = bi + g ( j ) + ε ij (2) 其中b为模型参数主要反应时间序列在年度其中为模型参数,主要反应时间序列在年度为模型参数上的增长趋势。为未知函数,主要反应时上的增长趋势。g(j)为未知函数主要反应时为未知函数 2 间序列在季节上的效应, 间序列在季节上的效应 E (ε ij ) = 0, E (ε ij ) = σ 2 相互独立。显然模型中不应包含常数项, 且 ε ij 相互独立。显然模型中不应包含常数项因为常数项可包含在季节效应中。因为常数项可包含在季节效应中。

第七章非参数回归模型与半参数回归模型

参数回归的最大优点是回归结果可以外延，但其缺点也不可忽视，就是回归形式一旦固定，就比较呆板，往往拟合效果较差。

另一类回归，非参数回归，则与参数回归正好相反。

它的回归函数形式是不确定的，其结果外延困难，但拟合效果却比较好。

设Y 是一维观测随机向量，X 是m 维随机自变量。

在第四章我们曾引进过条件期望作回归函数，即称g (X ) = E (Y |X ) （7.1.1）为Y 对X 的回归函数。

我们证明了这样的回归函数可使误差平方和最小，即22)]([min )]|([X L Y E X Y E Y E L-=-（7.1.2）这里L 是关于X 的一切函数类。

当然，如果限定L 是线性函数类，那么g (X )就是线性回归函数了。

细心的读者会在这里立即提出一个问题。

既然对拟合函数类L (X )没有任何限制，那么可以使误差平方和等于0。

实际上，你只要作一条折线(曲面)通过所有观测点(Y i ，X i )就可以了是的，对拟合函数类不作任何限制是完全没有意义的。

正象世界上没有绝对的自由一样，我们实际上从来就没有说放弃对L(X)的一切限制。

在下面要研究的具体非参数回归方法，不管是核函数法，最近邻法，样条法，小波法，实际都有参数选择问题(比如窗宽选择，平滑参数选择)。

所以我们知道，参数回归与非参数回归的区分是相对的。

用一个多项式去拟合(Y i ，X i )，属于参数回归；用多个低次多项式去分段拟合(Y i ，X i )，叫样条回归，属于非参数回归。

二、权函数方法非参数回归的基本方法有核函数法，最近邻函数法，样条函数法，小波函数法。

这些方法尽管起源不一样，数学形式相距甚远，但都可以视为关于Y i 的线性组合的某种权函数。

也就是说，回归函数g (X )的估计g n (X )总可以表为下述形式：∑==ni i i n Y X W X g 1)()(（7.1.3）其中｛W i (X )｝称为权函数。

有结构变化的半参数回归模型

有结构变化的半参数回归模型
王成勇;艾春荣;王少平
【期刊名称】《应用概率统计》
【年(卷),期】2010(26)5
【摘要】结合半参数回归模型和含未知变点的结构变化模型提出一个新的模型--
有结构变化的半参数回归模型,给出了新模型的有关参数β,β*,γ,k的加权最小二乘
估计和f(t)的核估计,证明了参数β,β*,γ的估计的√n-相合性,强相合性,讨论了模型
的检验等问题,并进一步通过随机模拟验证了新模型的优越性.
【总页数】14页(P501-514)
【作者】王成勇;艾春荣;王少平
【作者单位】襄樊学院数学与计算机科学学院,襄樊,441053;上海财经大学统计与
管理学院,上海,200433;华中科技大学经济学院,武汉,430074
【正文语种】中文
【中图分类】O212.7
【相关文献】
1.纳米填料/橡胶体系在贮存中的结构形态变化Ⅱ.结构变化的影响因素及其对性能
的影响 [J], 林桂;吴友平;张秀娟;钱燕超;贾清秀;张立群
2.焦化过程半焦孔隙结构时空变化规律的实验研究——孔结构的分形特征及其变化[J], 付志新;郭占成
3.看利通区人口年龄结构的十年变化——年龄结构十年变化透视利通区“人口红利” [J], 马桂芳;
4.弱误差结构下非参数,半参数回归模型 [J], 胡舒合; 梅门昌
5.有结构变化的半参数回归模型及其级数估计 [J], 王成勇;艾春荣
因版权原因，仅展示原文概要，查看原文内容请购买。

半参数回归断点回归

半参数回归断点回归半参数回归是一种常用的统计方法，用于研究自变量对因变量的影响。

而断点回归则是半参数回归的一种特殊形式，用于揭示自变量对因变量的影响在某一阈值点处发生了显著变化的情况。

本文将介绍半参数回归和断点回归的基本原理、应用场景以及相关的统计分析方法。

一、半参数回归的基本原理半参数回归是一种非参数统计方法，不对自变量和因变量之间的函数关系做出任何假设。

它通过拟合局部的回归线来估计自变量对因变量的影响。

半参数回归可以应用于自变量和因变量之间的线性和非线性关系，具有较强的灵活性和适应性。

二、断点回归的基本原理断点回归是半参数回归的一种特殊形式，用于研究自变量对因变量的影响在某一阈值点处发生显著变化的情况。

断点回归将自变量分为两个区间，分别估计这两个区间内的回归系数，并通过比较两个区间的回归系数来判断是否存在断点。

如果存在断点，则说明自变量对因变量的影响在断点处发生了显著变化。

三、半参数回归和断点回归的应用场景半参数回归和断点回归可以应用于各种研究领域和实际问题。

例如，在经济学中，可以使用半参数回归和断点回归来研究收入对消费的影响是否存在阈值效应；在医学研究中，可以使用半参数回归和断点回归来研究药物剂量对疗效的影响是否存在阈值效应。

四、半参数回归和断点回归的统计分析方法在进行半参数回归和断点回归分析时，需要选择合适的估计方法和假设检验方法。

常用的估计方法包括局部加权回归、核密度估计和B样条回归等；常用的假设检验方法包括断点是否存在的检验和断点位置的检验等。

这些方法可以通过统计软件来实现，如R语言中的segmented包和np包。

总结：半参数回归和断点回归是一种常用的统计方法，可以用于研究自变量对因变量的影响以及是否存在阈值效应。

它们具有较强的灵活性和适应性，可以应用于各种研究领域和实际问题。

在进行半参数回归和断点回归分析时，需要选择合适的估计方法和假设检验方法。

通过合理地运用半参数回归和断点回归，我们可以更好地理解数据背后的规律和关系，为实际问题的解决提供科学的依据。

非参数回归模型及半参数回归模型

非参数回归模型及半参数回归模型非参数回归模型是一种可以适应任意数据分布的回归方法。

在非参数回归中，不对模型的具体形式进行假设，而是利用样本数据去估计未知的函数形式。

这个函数形式可以用其中一种核函数进行近似，通过核函数的变换，使得样本点在空间中有一定的波动，从而将研究对象与有关因素的关系表达出来。

常见的非参数回归模型有局部加权回归（LOESS）和核回归模型。

局部加权回归是一种常见的非参数回归方法。

它通过给样本中的每个点分配不同的权重来拟合回归曲线。

每个点的权重根据其距离目标点的远近来确定，越近的点权重越大，越远的点权重越小。

这种方法在回归分析中可以较好地处理非线性关系和异方差性问题。

核回归模型是另一种常见的非参数回归方法。

它基于核函数的变换，通过将样本点的权重表示为核函数在目标点的取值，来拟合回归曲线。

核函数通常具有对称性和非负性的特点，常用的核函数有高斯核、Epanechikov核和三角核等。

核回归模型在处理非线性关系和异方差性问题时也具有较好的性能。

相比之下，半参数回归模型是在非参数回归的基础上引入一些参数的回归模型。

它假设一些参数具有一定的形式，并利用样本数据进行估计。

半参数模型可以更好地描述数据之间的关系，同时也可以提供关于参数的统计推断。

半参数回归模型有很多不同的形式，其中一个常见的半参数回归模型是广义加性模型（GAM）。

广义加性模型是通过将各个变量的函数关系进行加总，构建整体的回归模型。

这些函数关系可以是线性的也可以是非线性的，可以是参数化的也可以是非参数化的。

广义加性模型在回归分析中可以同时考虑到线性和非线性关系，广泛应用于各个领域。

在实际应用中，选择使用非参数回归模型还是半参数回归模型需要根据具体情况来决定。

非参数回归模型适用于对数据分布没有先验假设，并且希望对数据进行较为灵活的建模的情况。

半参数回归模型适用于对一些参数有一定假设的情况，可以更好地描述数据之间的关系，并提供统计推断的信息。

线性约束下的半参数回归模型的渐进性质

罚最ｄｘ－乘法则得到模型（１）中的参数的估计：＆＝＋ＺＲ［ＲＺＲ］（ｄ— ）而且它的协方差矩阵为Ｖａｒ（＆）＝ｏｒＢＢ，此处Ｚ＝Ｘ（，一Ｓ）（，一ｓ）ｘ，Ｂ＝［，一ＺＲ（ＲＺＲ）Ｒ］Ｚ～Ｘ（Ｉ —Ｓ）２．是无约束估计
第３１卷第１期
２０１３年０１月
佳木斯大学学报（自然科学版）
ＪｏｕｎａｒｌｏｆＪｉａｍｕｓｉＵｎｉｖｅｒｓｉｔｙ（ＮａｔｕｒａｌＳｃｉｅｎｃｅＥｄｉｔｉｏｎ）
基金项目：山东工商学院校青年基金资助（２０１１ＱＮ０６９）．作者简介：代金辉（１９８１一），女，齐齐哈尔人，讲师，硕士，主要从事非参统计及数理统计工作
１４８．［Ｌ一
其中
佳木斯大学学报（自然科学版）＋ＸＺＲ（ＲｚＲ）ＲＡ］＝０
Ｖ０１．３１Ｎｏ．１
Ｊａｎ．
２０ｌ３
文章编号：１００８ — １４０２（２０１３）Ｏ１ — ０１４７一ｏ２
线性约束下的半参数回归模型的渐进性质①
代金辉
（山东工商学院数学系。山东烟台２６４００５）
（ＲＺＲ）ＲＺ］
证明：
因为＆是的线性函数，而是Ｙ的线性函数．所以＆渐进服从正态分布．又因为＆＝［ — ｚＲ（ＲＺＲ）Ｒ］Ａｙ

半参数截尾回归模型

半参数截尾回归模型一个回归模型是截尾的，当在一定范围内的多次观察位于该范围的端点以外，切断对因变量所记录的数据。

当数据是截尾的时候，所观测的因变量的变化将低估“真实”因变量的回归元的效应。

因此，标准最小二乘法回归使用截尾数据产生的最典型地系数估计结果就是有偏与零。

传统的统计方法使用极大似然或相关程序去处理截尾数据的问题。

然而，这种方法的有效性需要正确的设定误差的分布，实践中这是有问题的。

在过去的二十年，提出了解决截尾问题的许多半参数方法。

在一个半参数方法中，通常是回归函数部分地设定为函数形式，通过研究者基于貌似可性的假定参数化的设定，模型剩余的部分是非参数化的。

理论文献已经提出了若干半参数的估计量对于截尾数据模型，发表的这些估计量应用于经济学的实证问题已经远远地滞后。

本文回顾了一小部分关于截尾回归模型建议的半参数估计量的计算，各种估计量被用来检验十九世纪60年代黑人与白人收入不等的变化，围绕1964年民权法的颁布，基于纵向的社会保障总署的收入记录。

这些收入记录在最高应纳税额处截尾，也就是说，任何人收入超过最大纳税值在社会保障规定下是要纳税的。

因此，上述的最大值，收入的数据不能精确的反映真实的收入。

普通最小二乘法分析这些数据意味着在十九世纪六十年代期间黑人和白人工作者的收入出现了小的收敛。

另一方面，半参数模型的估计量解释了截尾表明在1964年后黑人和白人收入显著的收敛。

比较参数和半参数的结果有助于准确描述参数方法在误设的情形。

截尾回归模型和估计量社会保障总署数据集我们分析时受困于数据截尾的简单形式，区间截尾，“真实”因变量*y 是可观测的，只要他们落在已知的单边的区间[a,b]。

否则，观测的区间的闭断点就会代替*y 。

Tobin (1958)应用这个模型去分析消费者汽车支出，端点0a =和b =∞，经济学家一般提到的回归模型有非负约束作为Tobit 模型。

其他的典型的这些截尾回归模型的应用就是右截尾数据，这里0a =和b =∞表示因变量的一个最大记录值。

半参数单调回归EV模型的估计

本为｛，）ｉ，，，）（，，＝１２… 礼，即
ｆｘｇｈＯ％１ …，＝Ｔ＋（＋，ｎＷ２，，
：ｔ＋，ｔ：１２，， … ，礼．
对于模型（）３的估计问题，一个简单的方法是忽略测量误差，将ｚ的观测值直接当成的
收稿日：０９１－６作者简介：孙志猛（９２月生）期２０—１０．１８年４，男，博士．究方向：应用统计．研
基金项目：国家自然科学基金（０７０７北京市自１９１０）然科学基金（０２０）中央财经大学学科建设基金；北京１７０３市教委科技计划资助项目（０００４０２．０６０５Ｋ１０）
半参数单调回归ＥＶ模型的估计半
孙志猛，张忠占，一
ｆ．中央财经大学统计学院，北京１０８；２北京工业大学应用数理学院，北京１０２）１００１．０１４摘要：半参数回归模型在工程、经济和医学问题中有着广泛的应用，但是实际问题中数据往往带有测量误差，并且许多情况下解释变量和某些响应变量之间的关系是单调的，此时普通的参数最小二乘估计是有偏的，且非参数部分的估计无法保证单调性．本文针对这两个问题研究了半参数单调回
综上所述，我们感兴趣的模型为如下的半参数单调回归ＥＶ模型
ｙ
＝
ｘＴ
ｇ＋（）＋
．
ｃ，３
ｚ：
＋Hale Waihona Puke 不失一般性，本文假设Ｗ ∈Ｗ，Ｗ为Ｒ闭子集，（在ｗ上单调递增，￡值为０・）均，方差

非参数回归模型与半参数回归模型讲解

参数回归的最大优点是回归结果可以外延，但其缺点也不可忽视，就是回归形式一旦固定，就比较呆板，往往拟合效果较差。

另一类回归，非参数回归，则与参数回归正好相反。

它的回归函数形式是不确定的，其结果外延困难，但拟合效果却比较好。

设Y 是一维观测随机向量，X 是m 维随机自变量。

在第四章我们曾引进过条件期望作回归函数，即称g (X ) = E (Y |X ) （7.1.1）为Y 对X 的回归函数。

我们证明了这样的回归函数可使误差平方和最小，即22)]([min )]|([X L Y E X Y E Y E L-=-（7.1.2）这里L 是关于X 的一切函数类。

当然，如果限定L 是线性函数类，那么g (X )就是线性回归函数了。

细心的读者会在这里立即提出一个问题。

既然对拟合函数类L (X )没有任何限制，那么可以使误差平方和等于0。

实际上，你只要作一条折线(曲面)通过所有观测点(Y i ，X i )就可以了是的，对拟合函数类不作任何限制是完全没有意义的。

正象世界上没有绝对的自由一样，我们实际上从来就没有说放弃对L(X)的一切限制。

在下面要研究的具体非参数回归方法，不管是核函数法，最近邻法，样条法，小波法，实际都有参数选择问题(比如窗宽选择，平滑参数选择)。

所以我们知道，参数回归与非参数回归的区分是相对的。

用一个多项式去拟合(Y i ，X i )，属于参数回归；用多个低次多项式去分段拟合(Y i ，X i )，叫样条回归，属于非参数回归。

二、权函数方法非参数回归的基本方法有核函数法，最近邻函数法，样条函数法，小波函数法。

这些方法尽管起源不一样，数学形式相距甚远，但都可以视为关于Y i 的线性组合的某种权函数。

也就是说，回归函数g (X )的估计g n (X )总可以表为下述形式：∑==ni i i n Y X W X g 1)()(（7.1.3）其中｛W i (X )｝称为权函数。

医学多变量重复观测资料的随机系数模型_陈长生

・研究原著・文章编号:100022790(2004)2322182204医学多变量重复观测资料的随机系数模型陈长生1,徐勇勇1,袁天峰2,赵东涛3,尚　磊1,夏结来1,潘　峰1(第四军医大学:1预防医学系卫生统计学教研室,2学报编辑部,3生物医学工程系数学教研室,陕西西安710033)收稿日期:2004208227;　修回日期:2004210214基金项目:国家自然科学基金(39900126);陕西省自然科学基金(2003F11)通讯作者:陈长生(19662),男(汉族),江西省高安市人.博士,副教授.Tel.(029)83374853　scbr @Multivariate random coeff icients model of repeated measures data in medical researchCHEN Chang 2S heng 1,XU Yong 2Yong 1,YUA N Tian 2Feng 2,ZHA O Dong 2Tao 3,S HA N G L ei 1,XIA Jie 2L ai 1,PA N Feng11Department of Health Statistics ,School of Preventive Medicine ,2Editorial Department of Journal ,3Department of Mathematics ,School of Biomedical Engineering ,Fourth Military Medical University ,Xi ’an 710033,China【Abstract 】AIM :T o study multivariate random coefficientsmodel of repeated measure s data in medical re search.METH ODS:Both diastolic and systolic blood pre ssure s repeated measure s data ,collected from 120drug abusers after taking two kinds of medicine (Drug A :X iaoyin fuzheng ,Drug B :K elening ),were analyzed by multivariate random coefficients model.The fixed effect parameters matrix x of modelcoefficients were e stimated by using least square s e stimation method ,the effects between treatment group s were compared and the variance 2covariance matrice s of random effect were also e stimated.Related analysis methods were programmed with SAS/I M L code.RESU LTS :Estimated parameters with fixed effect and random effect were obtained and graphs were drawn.Both diastolic and systolic blood pre ssure s changed with time after treatment and the trends between treatment group s were different.A slow change was observed in Drug A group ,while a greater curvature was found in Drug B group.Both diastolic and systolic blood pre ssure s in Drug A group were higher than those in Drug B group.CONC L USION :Multivariate random coefficients model can effectively analyze the dynamic change trend and random effects of multivariate repeated measure s data in medical re search.【K eyw ords 】repeated measure s ;random coefficients model ;multivariate statistics【摘　要】目的:研究医学重复观测数据的多变量随机系数模型.方法:对两种药物(A 药:消瘾扶正胶囊,B 药:可乐宁)治疗120例患者后的舒张压和收缩压重复观测数据进行多变量随机系数模型分析,对模型系数的固定效应参数矩阵ξ作最小二乘估计并进行组间比较,同时估计随机效应的方差2协方差矩阵,分析方法用SAS/IML 软件编程得以实现.结果:得到了固定效应和随机效应有关参数的估计值,并给出了曲线图.用药后患者的舒张压和收缩压随时间的变化而变化,且两个药物组曲线的变化趋势是不相同的,A 药组的变化相对平缓,而B 药组起伏波动较大,用药后A 药组的舒张压和收缩压相对来说均较B 药组为高.结论:多变量随机系数模型可有效地进行多变量重复观测数据的动态变化趋势分析以及随机效应分析.【关键词】重复观测;随机系数模型;多元统计学【中图号】R181.22 【文献标识码】A0　引言医学研究中常会遇到重复观测数据的统计分析问题,例如,在临床上,为了研究不同降压药的疗效而对高血压患者服药前、服药后2,4,6和8wk 的血压进行重复观测;在儿少卫生中,为了研究儿童体格发育情况,定期重复观察不同喂养方式的婴儿体格发育指标,如身长、坐高、体质量等.这类研究对个体的观察指标进行多次反复测量,其观测结果体现的是整个重复观测场合中个体指标发展变化趋势以及相关因素的影响.由于重复观测数据间存在自相关性且随机误差至少可分为两个层次,即个体间误差和个体内反复测量间误差,因而其分析方法有别于一般的统计分析方法[1-3].另外,在实际工作中为了了解多个变量间的关系以及变化规律,常常需要在不同的时间点同时观测个体的多个反应变量,如收缩压和舒张压,身高和体质量等,此时,需要进行多变量分析.为了充分利用该类数据所包含的信息以及更好地动态了解个体多个反应变量的变化规律,我们用SAS/IML 软件编写了分析程序[4,5],并对医学多变量重复观测数据进行了随机系数模型分析.1　资料和方法1.1　资料　取自西安市药物依赖治疗中心提供的数据,治疗中心为了比较消瘾扶正胶囊和可乐宁两种药物的治疗效果,将120名药物依赖患者随机分为两组,A 组用消瘾扶正胶囊治疗,B 组用可乐宁治疗,对其舒张压和收缩压进行测量,用药后5d 内的观测结果见Tab 1.表1　治疗后患者的舒张压和收缩压Tab 1　Diastolic and systolic pressures of patients after treatment(kPa ,x ±s ,n 1=n 2=60)t (aftertreatment )/d Diastolic pressure Drug A Drug BSystolic pressure Drug ADrug B18.06±0.91 6.92±0.8012.12±1.1011.31±0.8327.56±0.76 6.55±0.5211.81±0.8110.74±0.6737.50±0.79 6.55±0.5611.53±0.9310.92±0.6447.35±0.787.02±0.5611.59±0.8511.26±0.5757.46±0.797.25±0.5611.73±1.2311.66±0.40Drug A :Xiaoyinfuzheng ;Drug B :Kelening.1kPa =7.5mmHg.1.2　方法　假设在重复观测设计研究中,有r 个处理组,第j 组(j =1,2,…,r )的观察个体数为n j ,N =n 1+n 2+…+n r ,对每一个体的m 个反应变量(指标)重复观测p 次,相应的观察点(如时间)为t 1,t 2,…,t p ,Y ik 表示在观察点t i 处第k 个个体的m 个变量的观察值向量(i =1,2,…,p ;k =1,2,…,N ),Y k 表示第k 个个体的pm 维列向量,即由p 个向量Y ik (i =1,…,p )依次“拉直”而成,则有多变量随机系数模型[6]Y k =(B I m )βk +εk(1)其中εk 为随机误差向量,服从多元正态分布N pm (0,I p Σe ),Σe 为m 阶方阵,βk 为第k 个个体的m q 维模型系数向量,B 为p ×q 阶t i 的幂阵,称为轮廓设计阵,即B =t 01t 11…t q -11t 02t 12…t q -12…………t 0pt 1p…t q -1p式(1)中的符号“A B ”表示矩阵A 与矩阵B 的K ronecker 积,即A =(a ij ),B =(b ij ),A B =(a ij B ).随机系数模型中的βk 是与观察个体有关的向量,随个体而变化,由固定效应和随机效应两部分组成,即βk =ξa k +λk ,固定效应部分中的ξ为未知的m q ×r 阶模型参数矩阵,ξ的第j 列对应第j 组,并且前m 个元素为m 个变量t 0的系数(即截距),接着的m 个元素为t 1的系数,如此反复直到t q 21的m 个系数.固定效应部分中的a k 为已知的r ×1阶矩阵,随机效应部分中的λk 为个体随机效应向量,服从多元正态分布N m q (0,Σλ),λk 与εk 相互独立.因此,可得到以下模型Y k =(B I m )ξa k +(B I m )λk +εk(2)其中V ar (Y k )=Σ=(I p Σe )+(B I m )Σλ(B ′ I m ).未知参数ξ的最小二乘估计值为ξ^=[(B ′B )-1B ′ I m ]YA ′(A A ′)-1(3)其中Y =[Y 1,…,Y N ],A 为分块对角阵,称为处理设计阵,即A =diag [E 1n 1,E 1n 2,…,E 1n r ],E ab 表示元素全为1的a ×b 阶矩阵.ξ^的协方差阵为V ar (ξ^)=(A A ′)-1[(B ′B )-1Σe +Σλ](4)Σe 和Σλ的估计值分别为Σ^e =S eN (p -q )(5)Σ^λ=S λN -r-(B ′B )-1Σ^e其中S λ=[(B ′B )-1B ′ I m ]{Y [I -A ′(A A ′)-1A ]Y 1}[B (B ′B )-1 I m ],S e =ΣNk =1y k [I -B (B ′B )-1B ′]y ′k ,y k =[Y 1k ,Y 2k ,…,Y pk ].如果对个体模型系数βk 感兴趣,则可得到βk 的估计值为β^k =[(B ′B )-1B ′ I m ]Y k -V ^(V ^+Σ^λ)-1{[(B ′B )-1B ′ I m ]Y k -ξ^a k }(6)其中V ^=(B ′B )-1Σ^e ,β^k 的协方差阵V ar (β^k )的估计值为V ^-V ^(V ^+Σ^λ)-1V ^.2　结果2.1　模型参数ξ的估计值　在多变量随机系数模型(1)中,m =2,p =5,由文献[7,8]可知q =4,则轮廓设计阵B 为B =11111248139271416641525125已知处理设计阵A =diag (E 1,60,E 1,60),则q =4时的多变量随机系数模型ξ的最小二乘估计见Tab 2.表2　多变量随机系数模型ξ的估计值Tab 2　Estimates of ξin multivariate random coefficients model(q =4)Group Variableξ^0ξ^1ξ^2ξ^3Drug ADiastolic pressure 7.23450.5143-0.22320.0258Systolic pressure 12.6380-0.57470.06540.0027Drug BDiastolic pressure 8.2070-1.79500.5724-0.0502Systolic pressure 12.8330-2.14950.6746-0.0584Drug A :Xiaoyinfuzheng ;Drug B :Kelening. 模型参数ξ的协方差阵的第一对角分块为 V ar(ξ^)=40.1796-2.3496-40.4261 1.210312.3301-0.3328-1.16490.0541 -2.349619.2373 2.5174-21.4973-0.74637.20520.0687-0.7315 -40.4261 2.517442.3042-0.6934-13.20360.0889 1.2674-0.02911.2103-21.4973-0.693425.88140.0855-8.9648-0.0006 6.924412.3301-0.7463-13.20360.0855 4.20500.0394-0.40990.0013-0.33287.20520.0889-8.96480.0394 3.1861-0.0079-0.3341-1.16490.0687 1.2674-0.0006-0.4099-0.00790.04050.0040.0541-0.7315-0.02910.92440.0013-0.33410.00040.0355×10-22.2　Σe和Σλ的估计值　Σe和Σλ的估计值分别为 Σ^e=0.21600.07840.3199和 Σ^λ=18.8815-3.3069-17.5969 3.1433 5.0225-1.0620-0.44700.12393.8007 3.9256-3.0348-1.31010.80420.1327-0.065716.4527-3.6576-4.6442 1.24320.4065-0.14602.3011 1.2412-0.5232-0.12880.03041.2928-0.4229-0.11100.04980.08940.0443-0.00050.0093-0.0052-0.0009 为了节省篇幅,这里不再列出β^k和V ar(β^k)的估计结果.2.3　随机系数模型曲线图　见Fig1,2.Fig1　Diastolic pressure random coefficients model curves of twogroups of patients图1　两组患者舒张压的随机系数模型曲线Fig2　Systolic pressure random coefficients model curves of twogroups of patients图2　两组患者收缩压的随机系数模型曲线3　讨论随机系数模型假定模型系数向量βk是与观察个体有关的向量,随观测个体而变化,由固定效应和随机效应两部分组成,即βk=ξa k+λk,固定效应部分的模型参数矩阵ξ的分量受不同的实验设计条件或其他有关的协变量(如性别、起始年龄、社会经济地位等)的影响,但与重复观察因素(如时间)无关.由Fig1,2可见两组随机系数模型曲线不同,即两组模型参数向量ξ不等.由以上随机系数模型分析得到的βk可知,不同观察个体的曲线不同,随机系数模型不仅可得到个体和总体平均曲线参数信息,而且可分析重复观测资料的个体差异以及重复测量误差,即可估计两层随机误差的协方差阵Σe和Σλ.以上分析表明用药后患者的平均舒张压和收缩压随时间的变化而变化,且两个药物组曲线的变化趋势是不相同的,消瘾扶正胶囊组的舒张压和收缩压变化相对平缓,而可乐宁组的舒张压和收缩压起伏波动较大,且在用药后第2日达到最低点,随后舒张压和收缩压缓慢回升.两种药物均有降低舒张压和收缩压的效果,且在用药后第1日时已明显降低(用药前药物依赖患者平均舒张压和收缩压分别为9.11kPa和13.89kPa),用药后消瘾扶正胶囊组的舒张压和收缩压相对来说均较可乐宁组为高,可认为两种药物在降低血压方面存在不同的影响.【参考文献】[1]Vonesh EF ,Chinchilli VM.L i near and nonli near models f or theanalysis ofrepeated measurements [M ].New Y ork :MarcelDekker ,Inc.,1997:32-102.[2]陈长生,徐勇勇,曹秀堂.不等距重复观测数据组间比较的正交回归模型[J ].中国卫生统计,1996;13(3):1-5.Chen CS ,Xu YY ,Cao XT.Orthogonal regression models for comparison of unequally 2spaced repeated measures data across groups [J ].Chi n J Health S tat ,1996;13(3):1-5.[3]陈长生,徐勇勇,赵东涛.医学重复观测数据裂区方差分析的假定条件的检验[J ].第四军医大学学报,2001;22(7):642-644.Chen CS ,Xu YY ,Zhao DT.The test for the presuppositions concerning the validity of split 2plot analysis of variance with repeated measures in medical researches [J ].J Fourth Mil Med U niv ,2001;22(7):642-644.[4]SAS Institute Inc.S A S/IML Sof t w are [M ].Version 6.2nd ed.Cary :SAS Institute Inc.,1993:1-382.[5]SAS Institute Inc.S A S /S TA T Sof t w are :Changes andenhancements through Release 6.11[M ].Cary :SAS InstituteInc.,1996:1-267.[6]Kshirsagar AM ,Smith WB.Grow th curves [M ].New Y ork :Marcel Dekker ,Inc.,1995:32-115.[7]陈长生,徐勇勇,张　音,等.医学重复观测数据组间比较的生长曲线模型[J ].中华预防医学杂志,1998;32(4):245-247.Chen CS ,Xu YY ,Zhang Y ,et al .Growth curve model for comparison of repeated measures data across medical treatment groups[J ].Chi n J Prev Med ,1998;32(4):245-247.[8]陈长生,徐勇勇,夏结来.医学多变量追踪数据的生长曲线模型[J ].中国卫生统计,2000;17(4):194-196.Chen CS ,Xu YY ,Xia JL.Multivariate growth curve model of longitudinal data in medical research [J ].Chi n J Health S tat ,2000;17(4):194-196.编辑　王雪萍・研究简报・　文章编号:100022790(2004)2322185201药物治疗折返性心动过速的影响因素魏　毅,赵　理　(南阳医学高等专科学校第一医院心内科,河南南阳473058)收稿日期:2004209213;　修回日期:2004210217作者简介:魏　毅(19652),男(汉族),河南省南阳市人.副主任医师.Tel.(0377)3328137　Email.wyzl1688@【关键词】药物;折返性心动过速;影响【中图号】R541.7 【文献标识码】B0　引言　折返性心动过速(PSV T )是临床上常见的心律失常,射频消融术是治疗折返性心动过速的主要方法,但由于设备、技术、费用等原因,基层医院往往需要药物治疗.因此,严格选择抗心律失常药物是临床医生的重要任务.心律失常的心肌电生理[1]及抗心律失常药物和离子通道[2]的研究已有报道,心律平属Ⅰc 类广谱抗心律失常药物,单一抗心律失常药物的疗效结果往往与临床疗效不符,为探讨其原因和对策,我院近5a 来对64例折返性心动过速施行单一抗心律失常药物2心律平为基础,异丙肾上腺素和心得安为辅助的系列电生理研究,现报道如下.1　临床资料　心动过速患者(排除其他器质性心脏病)64(男23,女41)例,年龄14～52岁,心电图确诊为室上性心动过速.受试前停用一切抗心律失常药物至少5个半衰期,食管心房调搏(TEAP )采用程序刺激诱发出心动过速,测诱发窗口(心动过速带)或高频刺激诱发心动过速,然后按下列步骤进行:①诱发PSV T 后缓慢静脉注射心律平70mg 用生理盐水稀释至40mL ,若PSV T 被终止,立即停用心律平,否则在注射完后5min 重复静脉注射心律平,总量不超过140mg ,随即重复TEAP.若不能诱发出持续性PSV T ,取异丙肾上腺素静点,直至窦性心律比原来稳定提高20%～40%时重复TEAP.②上述TEAP 又能诱发出PSV T ,被超高频刺激终止后,静脉应用心得安0.1mg/kg ,10min 后再行TEAP.用高效刺激或程序刺激诱发出PSV T ,静点药物后不能再诱发,判断有效.以程序刺激诱发心动过速时诱发窗口宽度改变,诱发窗口缩小75%为有效,诱发窗口增加为无效.用药后电生理检查复发为无效.64例单用心律平显效58例,有效6例,静点异丙肾上腺素后疗效明显降低,其中34例可诱发PSV T ,加用心得安后,又有2例可诱发PSV T ,但诱发窗口缩小75%以上.2　讨论　评价药物疗效物过去是以自觉症状、12导联心电图及运动负荷试验等方法,长程心电图普及后,对评价治疗室性早搏的药物疗效更加精确,但对治疗PSV T 药物疗效的评价仍有限制,PSV T 并不经常发作,可能长程心电图也记录不到.经食管心房调搏技术,由于能重复诱发和终止各种心动过速,因而也开创了系列性药物试验以筛选有效的抗心律失常药物,从而减少了用药的盲目性并能准确预测药物的长期疗效[3].一般认为电生理学研究(EPS )是选择有效抗心律失常药物的较理想方法,但经EPS 证实有效的药物用于临床时,复发率达10%～40%,已有资料证明EPS 结果与临床疗效不相一致的主要原因之一是循环血中儿茶酚氨水平高,逆转了药物的效应.本试验结果表明:①基础状态下心律平抗心动过速的疗效明显高于静点异丙肾上腺素后,提示血中循环儿茶酚氨水平升高能降低其疗效,②适当剂量的β受体阻止剂能抵消异丙肾上腺素对抗心律失常药物效应的逆转作用,从而提高疗效.因此认为对PSV T 的预防性治疗方案宜采用食道电生理进行药物筛选,对单一药物效应能被异丙肾上腺素所逆转者,在应用单一药物基础上加用β受体阻滞剂;反之仅服一种药物即可,同时应事先证实两药合用对窦房结和房室结功能无明显抑制作用.【参考文献】[1]徐有秋.心律失常的心肌电生理研究进展[J ].心脏杂志,2003;15(2):165-168.[2]徐有秋.心律失常的心肌电生理研究进展[J ].心脏杂志,2001;13(2):143-145.[3]胡大一.室上性心动过速的研究进展[J ].心电学杂志,2002;21(2):77.编辑　潘伯荣。

半参数

半参数最近几十年大量的学者对半参数模型的参数估计和非参数估计做了大量的工作，现在我们其中主要方法进行一个概括介绍，并对其中的补偿最小二乘法和二步估计最小二乘核估计做主要详细的介绍。

第一种参数估计法，就是将非参数分量参数化的估计方法。

关于半参数模型的早期工作是这样的思路:对函数空间附施加一定的限制(主要指光滑性)，由于W 常是无穷维的，通常由光滑性可使用合理的逼近形式，使得W 中的元素参数化。

例如：在函数空间中选定一组基{}i e ，于是1()ni ii s t eλ==∑。

若W 中的元有某种光滑性，使此级数一致收敛，则可用有限和1()ni i i s t e λ==∑逼近。

于是()s t 估计的问题转化为估计有限维参数12(,,,)n λλλλ= ，从而可使用线性模型的方法(如最小二乘法，)同时估计β及λ。

由于这种估计是以非参数分量()s t 的参数化为特征，故大多以使用的参数化的方法命名(如偏光滑样条估计、偏分块多项式估计、分段多项式估计等)。

第二种是两步估计。

两步估计的思路是:先假设x 已知，我们可以做出S 的非参数估计(,)(,)()S t W t Y X βλβ=-，其中的λ为任意的参数，根据(,)W t λ采用的方法的不同，将两步估计分为不同的估计方法(如近邻估计、权估计、核估计、小波估计等).然后定义X 的估计为下述极小问题的解：min,(,)T V PV V Y X S t ββ==--求出β的解为β，从而就可以求出(,)S S t β=。

第三种估计方法是两阶段估计.其思路是：(())i E s t α=<∞，2(())i E s t <∞，()i i i e s t α=-+∆，则{}i e 是相互独立的同分布。

且0i Ee =，2i Ee <∞。

那么模型就化为：,(1,2,,)i i i y X e i n αβ=++=对于模型上面的模型使用最小二乘法得到β的估计β(称为β的一次估计):然后基于残差{}i i y X β-，在模型中使用某种方法(如核光滑、概率权、多项式、小波等)估计()s t ，记为()s t 。

非参数回归模型与半参数回归模型

参数回归的最大优点是回归结果可以外延，但其缺点也不可忽视，就是回归形式一旦固定，就比较呆板，往往拟合效果较差。

另一类回归，非参数回归，则与参数回归正好相反。

它的回归函数形式是不确定的，其结果外延困难，但拟合效果却比较好。

设Y 是一维观测随机向量，X 是m 维随机自变量。

在第四章我们曾引进过条件期望作回归函数，即称g (X ) = E (Y |X ) （7.1.1）为Y 对X 的回归函数。

我们证明了这样的回归函数可使误差平方和最小，即22)]([min )]|([X L Y E X Y E Y E L-=-（7.1.2）这里L 是关于X 的一切函数类。

当然，如果限定L 是线性函数类，那么g (X )就是线性回归函数了。

细心的读者会在这里立即提出一个问题。

既然对拟合函数类L (X )没有任何限制，那么可以使误差平方和等于0。

实际上，你只要作一条折线(曲面)通过所有观测点(Y i ，X i )就可以了是的，对拟合函数类不作任何限制是完全没有意义的。

正象世界上没有绝对的自由一样，我们实际上从来就没有说放弃对L(X)的一切限制。

在下面要研究的具体非参数回归方法，不管是核函数法，最近邻法，样条法，小波法，实际都有参数选择问题(比如窗宽选择，平滑参数选择)。

所以我们知道，参数回归与非参数回归的区分是相对的。

用一个多项式去拟合(Y i ，X i )，属于参数回归；用多个低次多项式去分段拟合(Y i ，X i )，叫样条回归，属于非参数回归。

二、权函数方法非参数回归的基本方法有核函数法，最近邻函数法，样条函数法，小波函数法。

这些方法尽管起源不一样，数学形式相距甚远，但都可以视为关于Y i 的线性组合的某种权函数。

也就是说，回归函数g (X )的估计g n (X )总可以表为下述形式：∑==ni i i n Y X W X g 1)()(（7.1.3）其中｛W i (X )｝称为权函数。

6.4 半参数模型解析

2、最小二乘核估计
• 第一步：假设β已知，对非参数部分进行核估计。
g ( Xi ) E(Yi | Xi ) βE( Zi | Xi )
ˆ (Y | X ) E i i ˆ(Z | X ) E i i
ˆ (Y | X ) βE ˆ (Z | X ) ˆ ( x, β) E g i i i i
• 由于半参数模型估计的收敛速度慢于参数模型，必须有足够多的样本才能实现半参数模型的估计。 • 半参数离散选择模型=关于解释变量的参数部分+关于随机误差项的非参数部分。
2、半参数二元离散选择模型的估计
• 建议不作为课堂教学内容。
• 第二步：估计 β。采用OLS估计模型：
ˆ (Y | X ) ( Z E ˆ ( Z | X )) v Yi E i i i i i i
• 第三步：得到最终估计。
ˆ E ˆ (Y | X ) β ˆ (Z | X ) ˆ ( x) E g i i i i
3、最小二乘局部线性估计
ˆ Z) ˆ (x) ST (x)(Y β g
二、半参数二元离散选择模型
1、半参数二元离散选择模型的含义
• 为了估计二元离散选择参数模型，必须基于效用模型的随机误差项分布已知的假定。 • 但是，在现实中该假定不一定成立，错误的分布设定必然导致错误的推断。
• 将随机误差项的分布作为待估计的未知函数，这样就可以有效克服二元离散选择模型的应用缺陷。
Yi βZi g (Xi ) ui
• 第二步：基于以下参数模型，得到β的最小二乘估计。
ˆ ( T ˆ β (Z Z) Z Y
• 第三步：得到g(x)的最终估计，以及其导数的最终估计。
ˆ) ˆ (x) g ˆ (x, β g

半参数估计方法与理论研究

半参数估计方法与理论研究在人类活动的各种领域中,常常通过回归模型来研究观测数据变量之间的关系.为此提出并发展了许多重要的回归模型来处理实际问题中的各种复杂数据,并研究了它们的统计推断方法和理论.本文主要研究单指标变系数模型、部分线性单指标变系数模型和参数回归模型中兴趣参数的估计问题.具体研究工作包含以下几个方面.针对单指标变系数模型,提出了参数分量和非参数分量的两阶段估计方法.首先,基于梯度外积估计方法给出了模型中指标参数向量的初始估计.然后,对构造的全局损失函数极小化得到指标参数向量和系数函数向量的改进估计.在适当条件下,证明了所得初始估计的相合性,以及指标参数向量和系数函数向量的改进估计的渐近正态性.利用坐标下降法给出了一种迭代算法,解决了对所提出的两阶段估计方法的计算问题.通过数据模拟和实例分析验证了本章所提方法的优良表现.针对单指标变系数模型,提出了一种估计函数方法,改进了现有的估计方程方法.采用纠偏技术和“去一分量”方法构造了关于指标参数向量的一个估计函数,并由此得到了纠偏的估计方程,同时利用局部估计方程方法给出了系数函数向量的估计.在一些正则条件下,证明了所给出的参数分量和非参数分量的估计的渐近性质.基于不动点迭代算法给出了一个求解所提估计方程的具体算法.通过数值模拟和实例分析验证了所提方法的有效性.针对部分线性单指标变系数模型,提出了一种对模型中指标参数向量、回归系数向量和系数函数向量分别进行估计的逐步估计方法.利用profile最小二乘方法,得到了模型中回归系数向量和系数函数向量的估计,同时利用估计方程方法给出了模型中指标参数向量的估计,并给出了一个迭代算法用于实现所提出的逐步估计方法.在一些正则条件下,证明了所得参数分量和非参数分量的估计的渐近性质.通过数值模拟表明所提方法在有限样本下的执行情况.研究了协变量随机缺失下单指标变系数模型的估计问题.利用逆概率加权方法构造出指标参数向量的加权估计方程,以及由局部估计方程方法得到了系数函数向量的加权局部估计方程,并对上述加权估计方程所导出的估计量的渐近性质进行了研究.通过数据模拟和实例分析表明本章所提的方法在有限样本下具有较好的表现.研究了更为一般的数据缺失形式.结合逆概率加权方法和半参数统计方法,提出了一种加权半参数估计方法,并用于研究参数回归模型中允许观测变量维数较高的情形下系数参数的估计问题.针对协变量的分量为连续型和离散型的情形,在MAR缺失机制下分别采用不同的半参数模型对选择概率函数进行建模.同时利用所得选择概率函数的半参数估计和逆概率加权估计方程得到模型中系数参数的估计,并证明所提方法得到的估计具有渐近正态性.通过在不同缺失情况下的模拟研究验证了所提方法在有限样本下的执行情况.。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

16 12.5233 4.4313 1.40592 70.742 36 13.7830 6.7970 0.10761 46.426
17 16.2130 9.0616 -7.86257 47.241 37 11.7396 6.5214 2.97025 44.074
19 12.7037 6.6083 4.72638 58.156 38 9.2977 5.9949 -4.85962 32.179
x2
ε
y
1 13.7573 9.0395 3.75143 117.821 21 13.2374 8.2352 -2.20841 38.275
2 15.0520 7.3279 1.14067 122.813 22 14.1714 6.0503 1.91203 55.233
3 8.6033 7.3862 0.23542 94.179 23 12.1480 5.0736 -5.52984 44.491
7 16.2680 6.4557 9.27355 114.115 27 14.0647 6.6078 2.63609 47.195
8 10.1680 5.2876 -3.75255 81.923 28 10.9326 6.8775 0.81989 32.828
9 13.2466 5.3008 0.40266 92.177 29 12.3795 6.8564 3.39402 40.131
模型#43;1 个解释变量 , 其中 p 维向量 xi 和数量变量 t , 如果反应变量 y 线性相
关于解释变量 x , 则有以下模型
y i = x′iβ +g(t i)+εi
(1)
其中 β 为未知的 p 维回归系数向量 , g(t)为未知的光
滑函数(如光滑样条), x 为线性变量 , t 为样条变量 , ε
若用矩阵符号来表示 S w(β , g), 则
S w(β , g)=(Y -Xβ -Ng)′W (Y -X β -Ng)+
αg′K g
(3)
当 β 和 g 为以下分块矩阵方程的解时 , 上式取最
小值。
X′WX X′WN N′WX N′WN +αK
β g
=
X′ N′WY
(4)
方程(4)是一个(p +q)元方程组 , 直接解方程组
4 8.6597 8.5354 -7.34831 75.51 24 11.0290 10.0753 3.65699 22.564
5 15.2607 4.0964 3.86252 127.148 25 10.8887 8.3597 3.08169 29.333
6 12.7431 7.4814 -3.43690 88.786 26 15.0140 5.5422 3.69035 57.719
需要计算广义交互有效 GCV(generalized cross -val i- 程序可得到一个样本模拟数据(表 1)。
dation)得分函数。GCV 得分函数为
n
GC
V
∑ (α)=i(=11
w i (y i -n -1
-yi )2 t rA)2
(11)
表 1 模拟抽样数据列表
t
x1
x2
ε
y
t
x1
将(7)代入(5), 化简得
＊国家自然科学基金资助项目(项目编号 39900126)
Chinese Journal of Health St at istics , December 2001 , V ol .18 , N o .6
· 339 ·
X′W(I -S )X β =X′W(I -S )Y
模拟实例分析
为说明半参数模型的拟合效果 , 本文用 SAS 程序进行模拟抽样实验 , 取 p =2 , n =60 , t 由 1 变化到 60 , x 1 ～ N (12.66 , 2.572), x 2 ～ N (6.7 , 1.872), 误差项 ε相互独立且服从分布 N (0.52), y =3.4 x1 5.2 x 2 +0.1(t -30)2 +30.2 +ε, 则用 SAS 模拟抽样
【关键词】半参数回归部分样条曲线拟合最小惩罚二乘
在医学科研数据统计分析过程中常常会遇到参数回归模型的某些假定不能够完全满足的情形 , 如 :反应变量与解释变量间的具体依存关系不明确、反应变量的分布不易判定等。此时 , 参数回归模型难以进行拟合处理 , 而非参数回归模型则能进行有效的分析。简单的非参数回归模型研究的是反应变量 Y 与单一解释变量 t 的依存关系 , 它能够解决医学与卫生研究工作中的许多重要问题 , 但是 , 在实际工作中 , 有许多事物或现象受多个变量的影响 , 因此 , 需要研究多个变量间的相互关系。经典统计模型在研究受多个解释变量影响的依存关系时常常采用多重回归 , 而多重回归的更一般模型即为线性模型 :y i =x′i β +εi , 为了放宽该线性模型中的某一个解释变量的线性假定 , 使模型在假定方面具有较强的适应性 , 本文对半参数回归模型进行了研究。
42 13.6616 8.4751 -0.61364 46.365
43 14.8575 10.0036 -0.35908 45.238
44 11.3236 5.1932 -4.19473 57.101
45 13.0163 4.9998 -9.97231 60.984
46 11.2934 3.7157 0.90965 75.786
· 338 ·
中国卫生统计 2001 年 12 月第 18 卷第 6 期
半参数回归模型及模拟实例分析＊
第四军医大学卫生统计学教研室(710032) 陈长生徐勇勇夏结来
【提要】目的放宽经典线性模型中的解释变量的线性假定和探讨半参数回归分析模型。方法利用最小惩罚二乘原理构造加权惩罚平方和 , 通过广义交互有效得分函数自动选择光滑参数值 , 用直接法求解方程组。结果用 SAS 程序实现了半参数回归分析 , 得到了回归系数向量和样条函数的最小惩罚二乘估计 , 模拟实例表明 , 半参数回归模型较传统的线性模型有较强的适应性。结论半参数回归模型是经典线性模型和非参数回归模型的一个混合体 , 可作为回归分析的一种新技术得到广泛应用。
13 11.1053 3.6854 -6.52679 71.167 33 7.2211 7.3388 4.36714 21.857
14 7.7996 6.2767 -1.49224 48.193 34 12.2964 7.3790 -0.13148 35.106
15 16.1694 6.3666 0.46688 75.036 35 7.5594 5.2159 6.15973 37.439
(8) 其中 trA =t rS +t r[ {X′W (I -S )X }-1 X′W (I -
这是广义最小二乘正规方程组 , 用来估计 β , 加权矩阵 S )2X ] 。
为非对角阵 W (I -S ), 解得 β 后 , 就可通过(7)求得 g 和 Ng , 因此 , 可得到光滑曲线 g(t )。
不方便 , 也很不实际 , 实际工作中 , 一般将方程(4)化为
以下形式
X′WXβ =X′W (Y -Ng)
(5)
(N′WN +αK )g =N′W (Y -X β)
(6)
求解时可采用不需迭代的直接法(di rect method)进行
求解。
由(6)可得 :
Ng =S(Y -Xβ)
(7)
其中 S =N (N′WN +αK )-1 N′W , (Ng)i =g(t i )。
对于回归系数向量 β 的估计值 , 可进行假设检
验 , β =(β1 , β2 , … , βp)′。检验假设为 H0 :βi =0 , i =1 , 2 , …, p 备择假设为 H1 :βi ≠0 , α=0.05
检验统计量为
t=
βi C iiσ2
(9)
其中 Cii 表示(X′W(I -S )X )-1的对角线上第 i 个元
与(x , t )相互独立 , 且 E(ε)=0 , V(ε)=σ2(未知), 显
然 , xi 不含常数 1 , 常数项可以包含在 g(t )中 , 则以上
模型被称为半参数回归模型(semiparamet ric reg ression
model)。
半参数回归模型可通过惩罚最小二乘方法进行求
解 , β 和 g(t )的估计使得以下加权惩罚平方和最小
n
素 , σ2
=i∑=t1r({yIi
-yi)2 -A} , A
为帽子阵。
A =S +(I -S)X {X′W (I -S)X }-1 X′W (I -
S)
(10)
当 H0 成立时 , t ～ tυ, υ=tr{I -A}。在半参数回归模型中 , 对于光滑参数的自动选择
另外 , 半参数模型的误差自由度 EDF =tr{I -A}
=n
-tr A
,
均方差
MSE
n
=
i∑=1(yi t r{I
-y i)2 -A} ,
残差平方和
SSE
n
=∑(y i =1
i
-yi )2 ,
令
y
=
1 n
n
i
∑
=1
y
i
, 则拟合优度
R2
=1
- n SSE 。
i
∑(y
=1
i
-y)2
本文利用 6.11 版 SAS 软件的 IM L 模块进行编

半参数回归模型及模拟实例分析_陈长生

合集下载

半参数回归模型中误差方差估计之分布的非一致性收敛速度

6.4 半参数模型解析

(整理)第七章非参数回归模型与半参数回归模型

时间序列资料预测的半参数回归模型

第七章非参数回归模型与半参数回归模型

有结构变化的半参数回归模型

半参数回归断点回归

非参数回归模型及半参数回归模型

线性约束下的半参数回归模型的渐进性质

半参数截尾回归模型

半参数单调回归EV模型的估计

非参数回归模型与半参数回归模型讲解

医学多变量重复观测资料的随机系数模型_陈长生

半参数

非参数回归模型与半参数回归模型

6.4 半参数模型解析

半参数估计方法与理论研究

文档推荐

最新文档