半参数回归模型及模拟实例分析_陈长生
- 格式:pdf
- 大小:110.59 KB
- 文档页数:3
第七章 非参数回归模型与半参数回归模型第一节 非参数回归与权函数法一、非参数回归概念前面介绍的回归模型,无论是线性回归还是非线性回归,其回归函数形式都是已知的,只是其中参数待定,所以可称为参数回归。
参数回归的最大优点是回归结果可以外延,但其缺点也不可忽视,就是回归形式一旦固定,就比较呆板,往往拟合效果较差。
另一类回归,非参数回归,则与参数回归正好相反。
它的回归函数形式是不确定的,其结果外延困难,但拟合效果却比较好。
设Y 是一维观测随机向量,X 是m 维随机自变量。
在第四章我们曾引进过条件期望作回归函数,即称g (X ) = E (Y |X ) (7.1.1)为Y 对X 的回归函数。
我们证明了这样的回归函数可使误差平方和最小,即22)]([min )]|([X L Y E X Y E Y E L-=-(7.1.2)这里L 是关于X 的一切函数类。
当然,如果限定L 是线性函数类,那么g (X )就是线性回归函数了。
细心的读者会在这里立即提出一个问题。
既然对拟合函数类L (X )没有任何限制,那么可以使误差平方和等于0。
实际上,你只要作一条折线(曲面)通过所有观测点(Y i ,X i )就可以了是的,对拟合函数类不作任何限制是完全没有意义的。
正象世界上没有绝对的自由一样,我们实际上从来就没有说放弃对L(X)的一切限制。
在下面要研究的具体非参数回归方法,不管是核函数法,最近邻法,样条法,小波法,实际都有参数选择问题(比如窗宽选择,平滑参数选择)。
所以我们知道,参数回归与非参数回归的区分是相对的。
用一个多项式去拟合(Y i ,X i ),属于参数回归;用多个低次多项式去分段拟合(Y i ,X i ),叫样条回归,属于非参数回归。
二、权函数方法非参数回归的基本方法有核函数法,最近邻函数法,样条函数法,小波函数法。
这些方法尽管起源不一样,数学形式相距甚远,但都可以视为关于Y i 的线性组合的某种权函数。
也就是说,回归函数g (X )的估计g n (X )总可以表为下述形式:∑==ni i i n Y X W X g 1)()((7.1.3)其中{W i (X )}称为权函数。
第七章 非参数回归模型与半参数回归模型第一节 非参数回归与权函数法一、非参数回归概念前面介绍的回归模型,无论是线性回归还是非线性回归,其回归函数形式都是已知的,只是其中参数待定,所以可称为参数回归。
参数回归的最大优点是回归结果可以外延,但其缺点也不可忽视,就是回归形式一旦固定,就比较呆板,往往拟合效果较差。
另一类回归,非参数回归,则与参数回归正好相反。
它的回归函数形式是不确定的,其结果外延困难,但拟合效果却比较好。
设Y 是一维观测随机向量,X 是m 维随机自变量。
在第四章我们曾引进过条件期望作回归函数,即称g (X ) = E (Y |X ) (7.1.1)为Y 对X 的回归函数。
我们证明了这样的回归函数可使误差平方和最小,即22)]([min )]|([X L Y E X Y E Y E L-=-(7.1.2)这里L 是关于X 的一切函数类。
当然,如果限定L 是线性函数类,那么g (X )就是线性回归函数了。
细心的读者会在这里立即提出一个问题。
既然对拟合函数类L (X )没有任何限制,那么可以使误差平方和等于0。
实际上,你只要作一条折线(曲面)通过所有观测点(Y i ,X i )就可以了是的,对拟合函数类不作任何限制是完全没有意义的。
正象世界上没有绝对的自由一样,我们实际上从来就没有说放弃对L(X)的一切限制。
在下面要研究的具体非参数回归方法,不管是核函数法,最近邻法,样条法,小波法,实际都有参数选择问题(比如窗宽选择,平滑参数选择)。
所以我们知道,参数回归与非参数回归的区分是相对的。
用一个多项式去拟合(Y i ,X i ),属于参数回归;用多个低次多项式去分段拟合(Y i ,X i ),叫样条回归,属于非参数回归。
二、权函数方法非参数回归的基本方法有核函数法,最近邻函数法,样条函数法,小波函数法。
这些方法尽管起源不一样,数学形式相距甚远,但都可以视为关于Y i 的线性组合的某种权函数。
也就是说,回归函数g (X )的估计g n (X )总可以表为下述形式:∑==ni i i n Y X W X g 1)()((7.1.3)其中{W i (X )}称为权函数。
有结构变化的半参数回归模型
王成勇;艾春荣;王少平
【期刊名称】《应用概率统计》
【年(卷),期】2010(26)5
【摘要】结合半参数回归模型和含未知变点的结构变化模型提出一个新的模型--
有结构变化的半参数回归模型,给出了新模型的有关参数β,β*,γ,k的加权最小二乘
估计和f(t)的核估计,证明了参数β,β*,γ的估计的√n-相合性,强相合性,讨论了模型
的检验等问题,并进一步通过随机模拟验证了新模型的优越性.
【总页数】14页(P501-514)
【作者】王成勇;艾春荣;王少平
【作者单位】襄樊学院数学与计算机科学学院,襄樊,441053;上海财经大学统计与
管理学院,上海,200433;华中科技大学经济学院,武汉,430074
【正文语种】中文
【中图分类】O212.7
【相关文献】
1.纳米填料/橡胶体系在贮存中的结构形态变化Ⅱ.结构变化的影响因素及其对性能
的影响 [J], 林桂;吴友平;张秀娟;钱燕超;贾清秀;张立群
2.焦化过程半焦孔隙结构时空变化规律的实验研究——孔结构的分形特征及其变化[J], 付志新;郭占成
3.看利通区人口年龄结构的十年变化——年龄结构十年变化透视利通区“人口红利” [J], 马桂芳;
4.弱误差结构下非参数,半参数回归模型 [J], 胡舒合; 梅门昌
5.有结构变化的半参数回归模型及其级数估计 [J], 王成勇;艾春荣
因版权原因,仅展示原文概要,查看原文内容请购买。
半参数回归断点回归半参数回归是一种常用的统计方法,用于研究自变量对因变量的影响。
而断点回归则是半参数回归的一种特殊形式,用于揭示自变量对因变量的影响在某一阈值点处发生了显著变化的情况。
本文将介绍半参数回归和断点回归的基本原理、应用场景以及相关的统计分析方法。
一、半参数回归的基本原理半参数回归是一种非参数统计方法,不对自变量和因变量之间的函数关系做出任何假设。
它通过拟合局部的回归线来估计自变量对因变量的影响。
半参数回归可以应用于自变量和因变量之间的线性和非线性关系,具有较强的灵活性和适应性。
二、断点回归的基本原理断点回归是半参数回归的一种特殊形式,用于研究自变量对因变量的影响在某一阈值点处发生显著变化的情况。
断点回归将自变量分为两个区间,分别估计这两个区间内的回归系数,并通过比较两个区间的回归系数来判断是否存在断点。
如果存在断点,则说明自变量对因变量的影响在断点处发生了显著变化。
三、半参数回归和断点回归的应用场景半参数回归和断点回归可以应用于各种研究领域和实际问题。
例如,在经济学中,可以使用半参数回归和断点回归来研究收入对消费的影响是否存在阈值效应;在医学研究中,可以使用半参数回归和断点回归来研究药物剂量对疗效的影响是否存在阈值效应。
四、半参数回归和断点回归的统计分析方法在进行半参数回归和断点回归分析时,需要选择合适的估计方法和假设检验方法。
常用的估计方法包括局部加权回归、核密度估计和B样条回归等;常用的假设检验方法包括断点是否存在的检验和断点位置的检验等。
这些方法可以通过统计软件来实现,如R语言中的segmented包和np包。
总结:半参数回归和断点回归是一种常用的统计方法,可以用于研究自变量对因变量的影响以及是否存在阈值效应。
它们具有较强的灵活性和适应性,可以应用于各种研究领域和实际问题。
在进行半参数回归和断点回归分析时,需要选择合适的估计方法和假设检验方法。
通过合理地运用半参数回归和断点回归,我们可以更好地理解数据背后的规律和关系,为实际问题的解决提供科学的依据。
非参数回归模型及半参数回归模型非参数回归模型是一种可以适应任意数据分布的回归方法。
在非参数回归中,不对模型的具体形式进行假设,而是利用样本数据去估计未知的函数形式。
这个函数形式可以用其中一种核函数进行近似,通过核函数的变换,使得样本点在空间中有一定的波动,从而将研究对象与有关因素的关系表达出来。
常见的非参数回归模型有局部加权回归(LOESS)和核回归模型。
局部加权回归是一种常见的非参数回归方法。
它通过给样本中的每个点分配不同的权重来拟合回归曲线。
每个点的权重根据其距离目标点的远近来确定,越近的点权重越大,越远的点权重越小。
这种方法在回归分析中可以较好地处理非线性关系和异方差性问题。
核回归模型是另一种常见的非参数回归方法。
它基于核函数的变换,通过将样本点的权重表示为核函数在目标点的取值,来拟合回归曲线。
核函数通常具有对称性和非负性的特点,常用的核函数有高斯核、Epanechikov核和三角核等。
核回归模型在处理非线性关系和异方差性问题时也具有较好的性能。
相比之下,半参数回归模型是在非参数回归的基础上引入一些参数的回归模型。
它假设一些参数具有一定的形式,并利用样本数据进行估计。
半参数模型可以更好地描述数据之间的关系,同时也可以提供关于参数的统计推断。
半参数回归模型有很多不同的形式,其中一个常见的半参数回归模型是广义加性模型(GAM)。
广义加性模型是通过将各个变量的函数关系进行加总,构建整体的回归模型。
这些函数关系可以是线性的也可以是非线性的,可以是参数化的也可以是非参数化的。
广义加性模型在回归分析中可以同时考虑到线性和非线性关系,广泛应用于各个领域。
在实际应用中,选择使用非参数回归模型还是半参数回归模型需要根据具体情况来决定。
非参数回归模型适用于对数据分布没有先验假设,并且希望对数据进行较为灵活的建模的情况。
半参数回归模型适用于对一些参数有一定假设的情况,可以更好地描述数据之间的关系,并提供统计推断的信息。
半参数截尾回归模型一个回归模型是截尾的,当在一定范围内的多次观察位于该范围的端点以外,切断对因变量所记录的数据。
当数据是截尾的时候,所观测的因变量的变化将低估“真实”因变量的回归元的效应。
因此,标准最小二乘法回归使用截尾数据产生的最典型地系数估计结果就是有偏与零。
传统的统计方法使用极大似然或相关程序去处理截尾数据的问题。
然而,这种方法的有效性需要正确的设定误差的分布,实践中这是有问题的。
在过去的二十年,提出了解决截尾问题的许多半参数方法。
在一个半参数方法中,通常是回归函数部分地设定为函数形式,通过研究者基于貌似可性的假定参数化的设定,模型剩余的部分是非参数化的。
理论文献已经提出了若干半参数的估计量对于截尾数据模型,发表的这些估计量应用于经济学的实证问题已经远远地滞后。
本文回顾了一小部分关于截尾回归模型建议的半参数估计量的计算,各种估计量被用来检验十九世纪60年代黑人与白人收入不等的变化,围绕1964年民权法的颁布,基于纵向的社会保障总署的收入记录。
这些收入记录在最高应纳税额处截尾,也就是说,任何人收入超过最大纳税值在社会保障规定下是要纳税的。
因此,上述的最大值,收入的数据不能精确的反映真实的收入。
普通最小二乘法分析这些数据意味着在十九世纪六十年代期间黑人和白人工作者的收入出现了小的收敛。
另一方面,半参数模型的估计量解释了截尾表明在1964年后黑人和白人收入显著的收敛。
比较参数和半参数的结果有助于准确描述参数方法在误设的情形。
截尾回归模型和估计量社会保障总署数据集我们分析时受困于数据截尾的简单形式,区间截尾,“真实”因变量*y 是可观测的,只要他们落在已知的单边的区间[a,b]。
否则,观测的区间的闭断点就会代替*y 。
Tobin (1958)应用这个模型去分析消费者汽车支出,端点0a =和b =∞,经济学家一般提到的回归模型有非负约束作为Tobit 模型。
其他的典型的这些截尾回归模型的应用就是右截尾数据,这里0a =和b =∞表示因变量的一个最大记录值。
第七章 非参数回归模型与半参数回归模型第一节 非参数回归与权函数法一、非参数回归概念前面介绍的回归模型,无论是线性回归还是非线性回归,其回归函数形式都是已知的,只是其中参数待定,所以可称为参数回归。
参数回归的最大优点是回归结果可以外延,但其缺点也不可忽视,就是回归形式一旦固定,就比较呆板,往往拟合效果较差。
另一类回归,非参数回归,则与参数回归正好相反。
它的回归函数形式是不确定的,其结果外延困难,但拟合效果却比较好。
设Y 是一维观测随机向量,X 是m 维随机自变量。
在第四章我们曾引进过条件期望作回归函数,即称g (X ) = E (Y |X ) (7.1.1)为Y 对X 的回归函数。
我们证明了这样的回归函数可使误差平方和最小,即22)]([min )]|([X L Y E X Y E Y E L-=-(7.1.2)这里L 是关于X 的一切函数类。
当然,如果限定L 是线性函数类,那么g (X )就是线性回归函数了。
细心的读者会在这里立即提出一个问题。
既然对拟合函数类L (X )没有任何限制,那么可以使误差平方和等于0。
实际上,你只要作一条折线(曲面)通过所有观测点(Y i ,X i )就可以了是的,对拟合函数类不作任何限制是完全没有意义的。
正象世界上没有绝对的自由一样,我们实际上从来就没有说放弃对L(X)的一切限制。
在下面要研究的具体非参数回归方法,不管是核函数法,最近邻法,样条法,小波法,实际都有参数选择问题(比如窗宽选择,平滑参数选择)。
所以我们知道,参数回归与非参数回归的区分是相对的。
用一个多项式去拟合(Y i ,X i ),属于参数回归;用多个低次多项式去分段拟合(Y i ,X i ),叫样条回归,属于非参数回归。
二、权函数方法非参数回归的基本方法有核函数法,最近邻函数法,样条函数法,小波函数法。
这些方法尽管起源不一样,数学形式相距甚远,但都可以视为关于Y i 的线性组合的某种权函数。
也就是说,回归函数g (X )的估计g n (X )总可以表为下述形式:∑==ni i i n Y X W X g 1)()((7.1.3)其中{W i (X )}称为权函数。
・研究原著・文章编号:100022790(2004)2322182204医学多变量重复观测资料的随机系数模型陈长生1,徐勇勇1,袁天峰2,赵东涛3,尚 磊1,夏结来1,潘 峰1(第四军医大学:1预防医学系卫生统计学教研室,2学报编辑部,3生物医学工程系数学教研室,陕西西安710033)收稿日期:2004208227; 修回日期:2004210214基金项目:国家自然科学基金(39900126);陕西省自然科学基金(2003F11)通讯作者:陈长生(19662),男(汉族),江西省高安市人.博士,副教授.Tel.(029)83374853 scbr @Multivariate random coeff icients model of repeated measures data in medical researchCHEN Chang 2S heng 1,XU Yong 2Yong 1,YUA N Tian 2Feng 2,ZHA O Dong 2Tao 3,S HA N G L ei 1,XIA Jie 2L ai 1,PA N Feng11Department of Health Statistics ,School of Preventive Medicine ,2Editorial Department of Journal ,3Department of Mathematics ,School of Biomedical Engineering ,Fourth Military Medical University ,Xi ’an 710033,China【Abstract 】AIM :T o study multivariate random coefficientsmodel of repeated measure s data in medical re search.METH ODS:Both diastolic and systolic blood pre ssure s repeated measure s data ,collected from 120drug abusers after taking two kinds of medicine (Drug A :X iaoyin fuzheng ,Drug B :K elening ),were analyzed by multivariate random coefficients model.The fixed effect parameters matrix x of modelcoefficients were e stimated by using least square s e stimation method ,the effects between treatment group s were compared and the variance 2covariance matrice s of random effect were also e stimated.Related analysis methods were programmed with SAS/I M L code.RESU LTS :Estimated parameters with fixed effect and random effect were obtained and graphs were drawn.Both diastolic and systolic blood pre ssure s changed with time after treatment and the trends between treatment group s were different.A slow change was observed in Drug A group ,while a greater curvature was found in Drug B group.Both diastolic and systolic blood pre ssure s in Drug A group were higher than those in Drug B group.CONC L USION :Multivariate random coefficients model can effectively analyze the dynamic change trend and random effects of multivariate repeated measure s data in medical re search.【K eyw ords 】repeated measure s ;random coefficients model ;multivariate statistics【摘 要】目的:研究医学重复观测数据的多变量随机系数模型.方法:对两种药物(A 药:消瘾扶正胶囊,B 药:可乐宁)治疗120例患者后的舒张压和收缩压重复观测数据进行多变量随机系数模型分析,对模型系数的固定效应参数矩阵ξ作最小二乘估计并进行组间比较,同时估计随机效应的方差2协方差矩阵,分析方法用SAS/IML 软件编程得以实现.结果:得到了固定效应和随机效应有关参数的估计值,并给出了曲线图.用药后患者的舒张压和收缩压随时间的变化而变化,且两个药物组曲线的变化趋势是不相同的,A 药组的变化相对平缓,而B 药组起伏波动较大,用药后A 药组的舒张压和收缩压相对来说均较B 药组为高.结论:多变量随机系数模型可有效地进行多变量重复观测数据的动态变化趋势分析以及随机效应分析.【关键词】重复观测;随机系数模型;多元统计学【中图号】R181.22 【文献标识码】A0 引言医学研究中常会遇到重复观测数据的统计分析问题,例如,在临床上,为了研究不同降压药的疗效而对高血压患者服药前、服药后2,4,6和8wk 的血压进行重复观测;在儿少卫生中,为了研究儿童体格发育情况,定期重复观察不同喂养方式的婴儿体格发育指标,如身长、坐高、体质量等.这类研究对个体的观察指标进行多次反复测量,其观测结果体现的是整个重复观测场合中个体指标发展变化趋势以及相关因素的影响.由于重复观测数据间存在自相关性且随机误差至少可分为两个层次,即个体间误差和个体内反复测量间误差,因而其分析方法有别于一般的统计分析方法[1-3].另外,在实际工作中为了了解多个变量间的关系以及变化规律,常常需要在不同的时间点同时观测个体的多个反应变量,如收缩压和舒张压,身高和体质量等,此时,需要进行多变量分析.为了充分利用该类数据所包含的信息以及更好地动态了解个体多个反应变量的变化规律,我们用SAS/IML 软件编写了分析程序[4,5],并对医学多变量重复观测数据进行了随机系数模型分析.1 资料和方法1.1 资料 取自西安市药物依赖治疗中心提供的数据,治疗中心为了比较消瘾扶正胶囊和可乐宁两种药物的治疗效果,将120名药物依赖患者随机分为两组,A 组用消瘾扶正胶囊治疗,B 组用可乐宁治疗,对其舒张压和收缩压进行测量,用药后5d 内的观测结果见Tab 1.表1 治疗后患者的舒张压和收缩压Tab 1 Diastolic and systolic pressures of patients after treatment(kPa ,x ±s ,n 1=n 2=60)t (aftertreatment )/d Diastolic pressure Drug A Drug BSystolic pressure Drug ADrug B18.06±0.91 6.92±0.8012.12±1.1011.31±0.8327.56±0.76 6.55±0.5211.81±0.8110.74±0.6737.50±0.79 6.55±0.5611.53±0.9310.92±0.6447.35±0.787.02±0.5611.59±0.8511.26±0.5757.46±0.797.25±0.5611.73±1.2311.66±0.40Drug A :Xiaoyinfuzheng ;Drug B :Kelening.1kPa =7.5mmHg.1.2 方法 假设在重复观测设计研究中,有r 个处理组,第j 组(j =1,2,…,r )的观察个体数为n j ,N =n 1+n 2+…+n r ,对每一个体的m 个反应变量(指标)重复观测p 次,相应的观察点(如时间)为t 1,t 2,…,t p ,Y ik 表示在观察点t i 处第k 个个体的m 个变量的观察值向量(i =1,2,…,p ;k =1,2,…,N ),Y k 表示第k 个个体的pm 维列向量,即由p 个向量Y ik (i =1,…,p )依次“拉直”而成,则有多变量随机系数模型[6]Y k =(B I m )βk +εk(1)其中εk 为随机误差向量,服从多元正态分布N pm (0,I p Σe ),Σe 为m 阶方阵,βk 为第k 个个体的m q 维模型系数向量,B 为p ×q 阶t i 的幂阵,称为轮廓设计阵,即B =t 01t 11…t q -11t 02t 12…t q -12…………t 0pt 1p…t q -1p式(1)中的符号“A B ”表示矩阵A 与矩阵B 的K ronecker 积,即A =(a ij ),B =(b ij ),A B =(a ij B ).随机系数模型中的βk 是与观察个体有关的向量,随个体而变化,由固定效应和随机效应两部分组成,即βk =ξa k +λk ,固定效应部分中的ξ为未知的m q ×r 阶模型参数矩阵,ξ的第j 列对应第j 组,并且前m 个元素为m 个变量t 0的系数(即截距),接着的m 个元素为t 1的系数,如此反复直到t q 21的m 个系数.固定效应部分中的a k 为已知的r ×1阶矩阵,随机效应部分中的λk 为个体随机效应向量,服从多元正态分布N m q (0,Σλ),λk 与εk 相互独立.因此,可得到以下模型Y k =(B I m )ξa k +(B I m )λk +εk(2)其中V ar (Y k )=Σ=(I p Σe )+(B I m )Σλ(B ′ I m ).未知参数ξ的最小二乘估计值为ξ^=[(B ′B )-1B ′ I m ]YA ′(A A ′)-1(3)其中Y =[Y 1,…,Y N ],A 为分块对角阵,称为处理设计阵,即A =diag [E 1n 1,E 1n 2,…,E 1n r ],E ab 表示元素全为1的a ×b 阶矩阵.ξ^的协方差阵为V ar (ξ^)=(A A ′)-1[(B ′B )-1Σe +Σλ](4)Σe 和Σλ的估计值分别为Σ^e =S eN (p -q )(5)Σ^λ=S λN -r-(B ′B )-1Σ^e其中S λ=[(B ′B )-1B ′ I m ]{Y [I -A ′(A A ′)-1A ]Y 1}[B (B ′B )-1 I m ],S e =ΣNk =1y k [I -B (B ′B )-1B ′]y ′k ,y k =[Y 1k ,Y 2k ,…,Y pk ].如果对个体模型系数βk 感兴趣,则可得到βk 的估计值为β^k =[(B ′B )-1B ′ I m ]Y k -V ^(V ^+Σ^λ)-1{[(B ′B )-1B ′ I m ]Y k -ξ^a k }(6)其中V ^=(B ′B )-1Σ^e ,β^k 的协方差阵V ar (β^k )的估计值为V ^-V ^(V ^+Σ^λ)-1V ^.2 结果2.1 模型参数ξ的估计值 在多变量随机系数模型(1)中,m =2,p =5,由文献[7,8]可知q =4,则轮廓设计阵B 为B =11111248139271416641525125已知处理设计阵A =diag (E 1,60,E 1,60),则q =4时的多变量随机系数模型ξ的最小二乘估计见Tab 2.表2 多变量随机系数模型ξ的估计值Tab 2 Estimates of ξin multivariate random coefficients model(q =4)Group Variableξ^0ξ^1ξ^2ξ^3Drug ADiastolic pressure 7.23450.5143-0.22320.0258Systolic pressure 12.6380-0.57470.06540.0027Drug BDiastolic pressure 8.2070-1.79500.5724-0.0502Systolic pressure 12.8330-2.14950.6746-0.0584Drug A :Xiaoyinfuzheng ;Drug B :Kelening. 模型参数ξ的协方差阵的第一对角分块为 V ar(ξ^)=40.1796-2.3496-40.4261 1.210312.3301-0.3328-1.16490.0541 -2.349619.2373 2.5174-21.4973-0.74637.20520.0687-0.7315 -40.4261 2.517442.3042-0.6934-13.20360.0889 1.2674-0.02911.2103-21.4973-0.693425.88140.0855-8.9648-0.0006 6.924412.3301-0.7463-13.20360.0855 4.20500.0394-0.40990.0013-0.33287.20520.0889-8.96480.0394 3.1861-0.0079-0.3341-1.16490.0687 1.2674-0.0006-0.4099-0.00790.04050.0040.0541-0.7315-0.02910.92440.0013-0.33410.00040.0355×10-22.2 Σe和Σλ的估计值 Σe和Σλ的估计值分别为 Σ^e=0.21600.07840.3199和 Σ^λ=18.8815-3.3069-17.5969 3.1433 5.0225-1.0620-0.44700.12393.8007 3.9256-3.0348-1.31010.80420.1327-0.065716.4527-3.6576-4.6442 1.24320.4065-0.14602.3011 1.2412-0.5232-0.12880.03041.2928-0.4229-0.11100.04980.08940.0443-0.00050.0093-0.0052-0.0009 为了节省篇幅,这里不再列出β^k和V ar(β^k)的估计结果.2.3 随机系数模型曲线图 见Fig1,2.Fig1 Diastolic pressure random coefficients model curves of twogroups of patients图1 两组患者舒张压的随机系数模型曲线Fig2 Systolic pressure random coefficients model curves of twogroups of patients图2 两组患者收缩压的随机系数模型曲线3 讨论随机系数模型假定模型系数向量βk是与观察个体有关的向量,随观测个体而变化,由固定效应和随机效应两部分组成,即βk=ξa k+λk,固定效应部分的模型参数矩阵ξ的分量受不同的实验设计条件或其他有关的协变量(如性别、起始年龄、社会经济地位等)的影响,但与重复观察因素(如时间)无关.由Fig1,2可见两组随机系数模型曲线不同,即两组模型参数向量ξ不等.由以上随机系数模型分析得到的βk可知,不同观察个体的曲线不同,随机系数模型不仅可得到个体和总体平均曲线参数信息,而且可分析重复观测资料的个体差异以及重复测量误差,即可估计两层随机误差的协方差阵Σe和Σλ.以上分析表明用药后患者的平均舒张压和收缩压随时间的变化而变化,且两个药物组曲线的变化趋势是不相同的,消瘾扶正胶囊组的舒张压和收缩压变化相对平缓,而可乐宁组的舒张压和收缩压起伏波动较大,且在用药后第2日达到最低点,随后舒张压和收缩压缓慢回升.两种药物均有降低舒张压和收缩压的效果,且在用药后第1日时已明显降低(用药前药物依赖患者平均舒张压和收缩压分别为9.11kPa和13.89kPa),用药后消瘾扶正胶囊组的舒张压和收缩压相对来说均较可乐宁组为高,可认为两种药物在降低血压方面存在不同的影响.【参考文献】[1]Vonesh EF ,Chinchilli VM.L i near and nonli near models f or theanalysis ofrepeated measurements [M ].New Y ork :MarcelDekker ,Inc.,1997:32-102.[2]陈长生,徐勇勇,曹秀堂.不等距重复观测数据组间比较的正交回归模型[J ].中国卫生统计,1996;13(3):1-5.Chen CS ,Xu YY ,Cao XT.Orthogonal regression models for comparison of unequally 2spaced repeated measures data across groups [J ].Chi n J Health S tat ,1996;13(3):1-5.[3]陈长生,徐勇勇,赵东涛.医学重复观测数据裂区方差分析的假定条件的检验[J ].第四军医大学学报,2001;22(7):642-644.Chen CS ,Xu YY ,Zhao DT.The test for the presuppositions concerning the validity of split 2plot analysis of variance with repeated measures in medical researches [J ].J Fourth Mil Med U niv ,2001;22(7):642-644.[4]SAS Institute Inc.S A S/IML Sof t w are [M ].Version 6.2nd ed.Cary :SAS Institute Inc.,1993:1-382.[5]SAS Institute Inc.S A S /S TA T Sof t w are :Changes andenhancements through Release 6.11[M ].Cary :SAS InstituteInc.,1996:1-267.[6]Kshirsagar AM ,Smith WB.Grow th curves [M ].New Y ork :Marcel Dekker ,Inc.,1995:32-115.[7]陈长生,徐勇勇,张 音,等.医学重复观测数据组间比较的生长曲线模型[J ].中华预防医学杂志,1998;32(4):245-247.Chen CS ,Xu YY ,Zhang Y ,et al .Growth curve model for comparison of repeated measures data across medical treatment groups[J ].Chi n J Prev Med ,1998;32(4):245-247.[8]陈长生,徐勇勇,夏结来.医学多变量追踪数据的生长曲线模型[J ].中国卫生统计,2000;17(4):194-196.Chen CS ,Xu YY ,Xia JL.Multivariate growth curve model of longitudinal data in medical research [J ].Chi n J Health S tat ,2000;17(4):194-196.编辑 王雪萍・研究简报・ 文章编号:100022790(2004)2322185201药物治疗折返性心动过速的影响因素魏 毅,赵 理 (南阳医学高等专科学校第一医院心内科,河南南阳473058)收稿日期:2004209213; 修回日期:2004210217作者简介:魏 毅(19652),男(汉族),河南省南阳市人.副主任医师.Tel.(0377)3328137 Email.wyzl1688@【关键词】药物;折返性心动过速;影响【中图号】R541.7 【文献标识码】B0 引言 折返性心动过速(PSV T )是临床上常见的心律失常,射频消融术是治疗折返性心动过速的主要方法,但由于设备、技术、费用等原因,基层医院往往需要药物治疗.因此,严格选择抗心律失常药物是临床医生的重要任务.心律失常的心肌电生理[1]及抗心律失常药物和离子通道[2]的研究已有报道,心律平属Ⅰc 类广谱抗心律失常药物,单一抗心律失常药物的疗效结果往往与临床疗效不符,为探讨其原因和对策,我院近5a 来对64例折返性心动过速施行单一抗心律失常药物2心律平为基础,异丙肾上腺素和心得安为辅助的系列电生理研究,现报道如下.1 临床资料 心动过速患者(排除其他器质性心脏病)64(男23,女41)例,年龄14~52岁,心电图确诊为室上性心动过速.受试前停用一切抗心律失常药物至少5个半衰期,食管心房调搏(TEAP )采用程序刺激诱发出心动过速,测诱发窗口(心动过速带)或高频刺激诱发心动过速,然后按下列步骤进行:①诱发PSV T 后缓慢静脉注射心律平70mg 用生理盐水稀释至40mL ,若PSV T 被终止,立即停用心律平,否则在注射完后5min 重复静脉注射心律平,总量不超过140mg ,随即重复TEAP.若不能诱发出持续性PSV T ,取异丙肾上腺素静点,直至窦性心律比原来稳定提高20%~40%时重复TEAP.②上述TEAP 又能诱发出PSV T ,被超高频刺激终止后,静脉应用心得安0.1mg/kg ,10min 后再行TEAP.用高效刺激或程序刺激诱发出PSV T ,静点药物后不能再诱发,判断有效.以程序刺激诱发心动过速时诱发窗口宽度改变,诱发窗口缩小75%为有效,诱发窗口增加为无效.用药后电生理检查复发为无效.64例单用心律平显效58例,有效6例,静点异丙肾上腺素后疗效明显降低,其中34例可诱发PSV T ,加用心得安后,又有2例可诱发PSV T ,但诱发窗口缩小75%以上.2 讨论 评价药物疗效物过去是以自觉症状、12导联心电图及运动负荷试验等方法,长程心电图普及后,对评价治疗室性早搏的药物疗效更加精确,但对治疗PSV T 药物疗效的评价仍有限制,PSV T 并不经常发作,可能长程心电图也记录不到.经食管心房调搏技术,由于能重复诱发和终止各种心动过速,因而也开创了系列性药物试验以筛选有效的抗心律失常药物,从而减少了用药的盲目性并能准确预测药物的长期疗效[3].一般认为电生理学研究(EPS )是选择有效抗心律失常药物的较理想方法,但经EPS 证实有效的药物用于临床时,复发率达10%~40%,已有资料证明EPS 结果与临床疗效不相一致的主要原因之一是循环血中儿茶酚氨水平高,逆转了药物的效应.本试验结果表明:①基础状态下心律平抗心动过速的疗效明显高于静点异丙肾上腺素后,提示血中循环儿茶酚氨水平升高能降低其疗效,②适当剂量的β受体阻止剂能抵消异丙肾上腺素对抗心律失常药物效应的逆转作用,从而提高疗效.因此认为对PSV T 的预防性治疗方案宜采用食道电生理进行药物筛选,对单一药物效应能被异丙肾上腺素所逆转者,在应用单一药物基础上加用β受体阻滞剂;反之仅服一种药物即可,同时应事先证实两药合用对窦房结和房室结功能无明显抑制作用.【参考文献】[1]徐有秋.心律失常的心肌电生理研究进展[J ].心脏杂志,2003;15(2):165-168.[2]徐有秋.心律失常的心肌电生理研究进展[J ].心脏杂志,2001;13(2):143-145.[3]胡大一.室上性心动过速的研究进展[J ].心电学杂志,2002;21(2):77.编辑 潘伯荣。
半参数最近几十年大量的学者对半参数模型的参数估计和非参数估计做了大量的工作,现在我们其中主要方法进行一个概括介绍,并对其中的补偿最小二乘法和二步估计最小二乘核估计做主要详细的介绍。
第一种参数估计法,就是将非参数分量参数化的估计方法。
关于半参数模型的早期工作是这样的思路:对函数空间附施加一定的限制(主要指光滑性),由于W 常是无穷维的,通常由光滑性可使用合理的逼近形式,使得W 中的元素参数化。
例如:在函数空间中选定一组基{}i e ,于是1()ni ii s t eλ==∑。
若W 中的元有某种光滑性,使此级数一致收敛,则可用有限和1()ni i i s t e λ==∑逼近。
于是()s t 估计的问题转化为估计有限维参数12(,,,)n λλλλ= ,从而可使用线性模型的方法(如最小二乘法,)同时估计β及λ。
由于这种估计是以非参数分量()s t 的参数化为特征,故大多以使用的参数化的方法命名(如偏光滑样条估计、偏分块多项式估计、分段多项式估计等)。
第二种是两步估计。
两步估计的思路是:先假设x 已知,我们可以做出S 的非参数估计(,)(,)()S t W t Y X βλβ=-,其中的λ为任意的参数,根据(,)W t λ采用的方法的不同,将两步估计分为不同的估计方法(如近邻估计、权估计、核估计、小波估计等).然后定义X 的估计为下述极小问题的解 :min,(,)T V PV V Y X S t ββ==--求出β的解为β,从而就可以求出(,)S S t β=。
第三种估计方法是两阶段估计.其思路是:(())i E s t α=<∞,2(())i E s t <∞,()i i i e s t α=-+∆,则{}i e 是相互独立的同分布。
且0i Ee =,2i Ee <∞。
那么模型就化为:,(1,2,,)i i i y X e i n αβ=++=对于模型上面的模型使用最小二乘法得到β的估计β(称为β的一次估计):然后基于残差{}i i y X β-,在模型中使用某种方法(如核光滑、概率权、多项式、小波等)估计()s t ,记为()s t 。
第七章 非参数回归模型与半参数回归模型第一节 非参数回归与权函数法一、非参数回归概念前面介绍的回归模型,无论是线性回归还是非线性回归,其回归函数形式都是已知的,只是其中参数待定,所以可称为参数回归。
参数回归的最大优点是回归结果可以外延,但其缺点也不可忽视,就是回归形式一旦固定,就比较呆板,往往拟合效果较差。
另一类回归,非参数回归,则与参数回归正好相反。
它的回归函数形式是不确定的,其结果外延困难,但拟合效果却比较好。
设Y 是一维观测随机向量,X 是m 维随机自变量。
在第四章我们曾引进过条件期望作回归函数,即称g (X ) = E (Y |X ) (7.1.1)为Y 对X 的回归函数。
我们证明了这样的回归函数可使误差平方和最小,即22)]([min )]|([X L Y E X Y E Y E L-=-(7.1.2)这里L 是关于X 的一切函数类。
当然,如果限定L 是线性函数类,那么g (X )就是线性回归函数了。
细心的读者会在这里立即提出一个问题。
既然对拟合函数类L (X )没有任何限制,那么可以使误差平方和等于0。
实际上,你只要作一条折线(曲面)通过所有观测点(Y i ,X i )就可以了是的,对拟合函数类不作任何限制是完全没有意义的。
正象世界上没有绝对的自由一样,我们实际上从来就没有说放弃对L(X)的一切限制。
在下面要研究的具体非参数回归方法,不管是核函数法,最近邻法,样条法,小波法,实际都有参数选择问题(比如窗宽选择,平滑参数选择)。
所以我们知道,参数回归与非参数回归的区分是相对的。
用一个多项式去拟合(Y i ,X i ),属于参数回归;用多个低次多项式去分段拟合(Y i ,X i ),叫样条回归,属于非参数回归。
二、权函数方法非参数回归的基本方法有核函数法,最近邻函数法,样条函数法,小波函数法。
这些方法尽管起源不一样,数学形式相距甚远,但都可以视为关于Y i 的线性组合的某种权函数。
也就是说,回归函数g (X )的估计g n (X )总可以表为下述形式:∑==ni i i n Y X W X g 1)()((7.1.3)其中{W i (X )}称为权函数。
半参数估计方法与理论研究在人类活动的各种领域中,常常通过回归模型来研究观测数据变量之间的关系.为此提出并发展了许多重要的回归模型来处理实际问题中的各种复杂数据,并研究了它们的统计推断方法和理论.本文主要研究单指标变系数模型、部分线性单指标变系数模型和参数回归模型中兴趣参数的估计问题.具体研究工作包含以下几个方面.针对单指标变系数模型,提出了参数分量和非参数分量的两阶段估计方法.首先,基于梯度外积估计方法给出了模型中指标参数向量的初始估计.然后,对构造的全局损失函数极小化得到指标参数向量和系数函数向量的改进估计.在适当条件下,证明了所得初始估计的相合性,以及指标参数向量和系数函数向量的改进估计的渐近正态性.利用坐标下降法给出了一种迭代算法,解决了对所提出的两阶段估计方法的计算问题.通过数据模拟和实例分析验证了本章所提方法的优良表现.针对单指标变系数模型,提出了一种估计函数方法,改进了现有的估计方程方法.采用纠偏技术和“去一分量”方法构造了关于指标参数向量的一个估计函数,并由此得到了纠偏的估计方程,同时利用局部估计方程方法给出了系数函数向量的估计.在一些正则条件下,证明了所给出的参数分量和非参数分量的估计的渐近性质.基于不动点迭代算法给出了一个求解所提估计方程的具体算法.通过数值模拟和实例分析验证了所提方法的有效性.针对部分线性单指标变系数模型,提出了一种对模型中指标参数向量、回归系数向量和系数函数向量分别进行估计的逐步估计方法.利用profile最小二乘方法,得到了模型中回归系数向量和系数函数向量的估计,同时利用估计方程方法给出了模型中指标参数向量的估计,并给出了一个迭代算法用于实现所提出的逐步估计方法.在一些正则条件下,证明了所得参数分量和非参数分量的估计的渐近性质.通过数值模拟表明所提方法在有限样本下的执行情况.研究了协变量随机缺失下单指标变系数模型的估计问题.利用逆概率加权方法构造出指标参数向量的加权估计方程,以及由局部估计方程方法得到了系数函数向量的加权局部估计方程,并对上述加权估计方程所导出的估计量的渐近性质进行了研究.通过数据模拟和实例分析表明本章所提的方法在有限样本下具有较好的表现.研究了更为一般的数据缺失形式.结合逆概率加权方法和半参数统计方法,提出了一种加权半参数估计方法,并用于研究参数回归模型中允许观测变量维数较高的情形下系数参数的估计问题.针对协变量的分量为连续型和离散型的情形,在MAR缺失机制下分别采用不同的半参数模型对选择概率函数进行建模.同时利用所得选择概率函数的半参数估计和逆概率加权估计方程得到模型中系数参数的估计,并证明所提方法得到的估计具有渐近正态性.通过在不同缺失情况下的模拟研究验证了所提方法在有限样本下的执行情况.。