当前位置：文档之家› 利用协方差法估计AR模型参数

利用协方差法估计AR模型参数

随机信号分析基础大作业

利用协方差法估计AR模型参数进而估计功率谱

严奎（学号：3222008008）

陈韬（学号：3222008022）

朱燕豪（学号：3222008021）

2011年01月15日

作业综述：

本作业中采用面向对象的程序设计方法，将用到的子程序封装在一个类中，防止其他函数的干扰，具有良好的信息内聚性。类中定义的有获得（0,1）分布随机数的函数uniform()，产生高斯分布随机数的函数gauss()，产生自回归滑动平均模型ARMA （p,q ）数据的函数arma()，用乔布斯基（Cholesky ）算法求解对称正定方程组的函数cholesky （），计算ARMA 模型的功率谱密度的函数psd （），用协方差方法估计AR 模型参数，进而实现功率谱估计的函数covar （）。采用的编程工具是V C++6.0以及VS2010，用MATLAB 对生成的数据进行画图。

一．题目要求

给定一段信号数据及采样率，利用现代谱估计理论编程估计信号的功率谱。

二．基本原理及方法

现代谱估计是通过观测数据估计参数模型再按照求参数模型输出功率的方法估计信号功率谱，主要是针对经典谱估计的分辨率低和方差性能不好等问题提出的，应用最广的是AR 参数模型。现代谱估计的参数模型有自回归滑动平均（ARMA ）模型、自回归（AR ）模型、滑动平均（MA ）模型，Wold 分解定理阐明了三者之间的关系：任何有限方差的ARMA 或MA 模型的平稳随机过程可以用无限阶的AR 模型表示，任何有限方差的ARMA 或MA 模型的平稳随机过程可以用无限阶的AR 模型表示。但是由于只有AR 模型参数估计是一组线性方程，而实际的物理系统往往是全极点系统，因而AR 应用最广。

我们用协方差法估计AR 模型参数，进而实现功率谱估计。若已知平稳随机序列x （n ）的AR 模型为

∑==-+p

i n w i n x i a n x 1

)

()()()(

其中a （i ）是AR 系数，w(n)是均值为零，均方差为σ的白噪声。

1. 计算协方差

∑-==---=1

,,1,0,),()(1),(N p

n xx p k j k n x j n x P N k j c

2. 用乔布斯基算法解对称正定方程组

N 阶对称正定方程组的矩阵形式为AX=B ，即

????????????-=??

???????

??????????

???

?????)0,()0,2()0,1()()2()1(),()

3,()2,()1,(),3()3,3()2,3()1,3(),2()

3,2()2,2()1,2(),1()3,1()2,1()1,1(p c c c p a a a p p c p c p c p c p c c c c p c c c c p c c c c xx xx xx xx xx xx xx xx xx xx xx xx xx xx xx

xx xx xx xx

矩阵A 的乔布斯基分解

T LDL A =

这里D 是主对角元素都为正实数的对角阵，即D=diag(d1,d2,…,dn)，L 为主对角元素是1的

下三角矩阵。用乔布斯基算法解对称正定方程组的方法是，先用回代法求解方程组LY=B ，

得到Y 之后，再用回代法求解方程

D L -1T =

3.计算激励白噪声的方差

∑=+=r

k xx xx k c k a c 1

,0()()0,0(σ

4．用AR 模型参数的估计值，可以计算功率谱密度

)(1)(∑=-+

p i jwi

i a w S σ

三．算法设计与实现

1．程序流程图

采用协方差的方法进行功率谱估计。如下图所示

图1算法流程图1 2.主要模块的设计：

1.产生随机序列的函数uniform（），

采用线性同余法由种子seed产生随机数。

2.产生高斯白噪声的函数gauss（），

gauss(double mean,double sigma,long int * s)

{

int i;double x,y;

for(x=0,i=0;i<12;i++)

x+=uniform(0.0,1.0,s);

x=x-6.0;

y=mean+x*sigma; return(y);

}

3. ARMA 模型数据的生成函数为arma （）略

4. 乔里斯基算法解对称正定方程组的函数cholesky （）略

5. 由协方差函数covar （）求AR 参数；

6. 再根据AR 参数求出功率谱的函数psd()略；

7. 最终用MA TLAB 的画图工具给出直观的功率谱图形，

四．结果分析

输入平稳随机序列x （n ）的AR 模型为

)()4(924.0)3(654.2)2(809.3)1(76.2)(n w n x n x n x n x n x =-+---+--

其中1，-2.76,3.809,-2.654,0.924为AR 系数，根据要求产生W(n)是均值为零，方差为1的白噪声。

根据均匀分布产生（0,1）分布的随机序列，再由均值和方差生成高斯白噪声如下图所示：

高斯白噪声

N (n )

高斯白噪声分布图

由图可知产生的随机序列近似于高斯分布，符合题目要求。由白噪声求自回归滑动平均模型ARMA （p,q ）模型的数据，

用协方差法估计AR 模型参数，结果为： a(0)= 1.0000000 a(1)=—2.7310949 a(2)= 3.7478402 a(3)=—2.5951549 a(4)= 0.9022404

可以看出估计出的AR 模型参数与原AR 模型系数基本接近，但是不相等，这是因为现代谱估计是由有限长序列估计无限长的随机序列AR 模型参数，但是结果基本接近。

其中预测误差功率是Pe=1.0995336，与原方差1较接近。计算AR 模型系数功率谱密度

根据已存储在covar1.dat 的数据，用Matlab 做图在归一化频率的基础上做的功率谱

五．任务分工

三人合作进行了前期的资料查找，阅读文献，确定现代谱估计，分析算法。

严奎（学号：3222008008）完成了程序调试，绘图。

陈韬（学号：3222008022）完成答辩PPT 的制作，以及负责主讲。朱燕豪（学号：3222008021）完成论文的撰写。六.心得

00.050.10.15

0.20.250.30.350.40.450.5

-30

-20-10010203040

50窄带AR 模型功率谱

归一化频率

功率谱密度(d b )

通过这次的大作业提高了我们的合作能力，文献查取能力，编程能力，使我们掌握了书本上的知识，复习了前面的高斯分布，白噪声的产生，特别是掌握了功率谱的多种分析方法，了解了现代谱估计的方法与原理，极大地提高了我们的综合能力。

在选题时，我们以勇于专研问题的精神，选了现代谱分析。在做课题时，我们发现了很多问题，自己对谱分析的了解只停留在很基础的方面。特别是在完成算法分析时我们花了很多时间，开始我们只建立了AR模型，为了更加完善，我们加上了ARMA模型，最后在此基础上我们采用协方差分析使结果更趋于逼真。程序编写时，我们参照了大量的网上资源，但是调试过程中，变量的定义出了很多问题，很多地方都出了问题，我们只能一步一步调试改进。

虽然开始时我们遇到很多困难，编程能力太差，书本知识体系不完整缺少功率谱分析具体算法，上网条件差，图书馆资源有限等。但是怀着认真、踏实的态度我们完成了预期的任务，达到了一定的效果。总的来说，这次的课题我们都收获颇多。

七．参考文献

[1]殷福亮，宋爱军数字信号C语言程序集.辽宁科技出版社，1997

[2]张贤达，现代信号处理，清华大学出版社，2002

[3]常建军，李海林，随机信号分析，科学出版社，2006

八．附录

程序源代码

#include

#include"stdlib.h"

#include"stdio.h"

#include"math.h"

#include"malloc.h"

using namespace std;

class Power

{

public:

Power(){}

~Power(){}

double uniform(double a,double b,long int * seed);

double gauss(double mean,double sigma,long int * s);

void cholesky_1(double a[],double b[],int n);

void covar(double x[],int n,int p,double a[],double *v,int mode);

void arma(double a[],double b[],int p,int q,double mean,double sigma,long *seed,double x[],int n);

void psd(double b[],double a[],int q,int p,double sigma2,double fs,double x[],double freq[],int len,int sign);

};

double Power::uniform(double a,double b,long int *seed)

{

double t;

*seed=2045*(*seed)+1; //seed为种子

*seed=*seed-(*seed/1048576)*1048576;

t=(*seed)/1048576.0;

t=a+(b-a)*t;

return(t);

}

double Power::gauss(double mean,double sigma,long int * s)

{

int i;double x,y;

for(x=0,i=0;i<12;i++)

x+=uniform(0.0,1.0,s);

x=x-6.0;

y=mean+x*sigma;

return(y);

}

void Power::cholesky_1(double a[],double b[],int n)

{

int i,j,k,m;

double *d,*y,*xl,eps;

d=(double *)malloc(n*sizeof(double));

y=(double *)malloc(n*sizeof(double));

xl=(double *)malloc(n*n*sizeof(double));

eps=1.0e-15;

m=0;

d[0]=a[m];

for(i=1;i

{

for(j=0;j

{

m=m+1;

xl[i*n+j]=a[m]/d[j];

if(j==0)continue;

for(k=0;k

{xl[i*n+j]=xl[i*n+k]*xl[j*n+k]*d[k]/d[j];}

}

m=m+1;

d[i]=a[m];

for(k=0;k

{d[i]=d[i]-d[k]*xl[i*n+k]*xl[i*n+k];}

if(fabs(d[i])

{

printf("\nill-conditioned! \n");

return;

}

y[0]=b[0];

for(k=1;k

{

y[k]=b[k];

for(j=0;j

{y[k]=y[k]-xl[k*n+j]*y[j];}

}

b[n-1]=y[n-1]/d[n-1];

for(k=(n-2);k>=0;k--)

{

b[k]=y[k]/d[k];

for(j=(k+1);j

{b[k]=b[k]-xl[j*n+k]*b[j];}

}

free(d);

free(y);

free(xl);

}

void Power::covar(double x[],int n,int p,double a[],double *v,int mode)

{

int i,j,k,m;

double cc,sum,*c;

c=(double *)malloc((p*(p+1)/2)*sizeof(double));

m=0;

for(k=1;k<=p;k++)

{

for(j=1;j<=k;j++)

{

c[m]=0.0;

for(i=p;i

{

c[m]+=x[i-j]*x[i-k];

}

if(mode==1)

{

for(i=0;i<(n-p);i++)

{

c[m]+=x[i+j]*x[i+k];// 计算Cxx(i,k)

}

m=m+1;

}

for(j=1;j<=p;j++)

{

a[j-1]=0.0;

for(i=p;i

{

a[j-1]-=x[i-j]*x[i];

}

if(mode==1)

{

for(i=0;i<(n-p);i++)

{

a[j-1]-=x[i+j]*x[i]; //计算Cxx(j,0) }

}

cholesky_1(c,a,p); //解得a(i) for(k=(p-1);k>=0;k--)

{

a[k+1]=a[k];

}

a[0]=1.0;

sum=0.0;

for(k=0;k<=p;k++)

{

cc=0.0;

for(i=p;i

{

cc+=x[i]*x[i-k];

}

if(mode==1)

{

for(i=0;i<(n-p);i++)

{

cc+=x[i]*x[i+k]; //计算Cxx(0,k) }

}

if(k==0)

{

sum+=cc;

}

else

{

sum+=cc*a[k]; //计算a(k)*Cxx(0,k)

}

if(mode==1)

{

v[0]=sum/(2*(n-p));

}

else

{

v[0]=sum/(n-p); //计算sigma2 }

free(c);

}

void Power::arma(double a[],double b[],int p,int q,double mean,double sigma,long *seed,double x[],int n)

{

int i,k,m;

double s,*w;

w=(double *)malloc(n*sizeof(double));

for(k=0;k

w[k]=gauss(mean,sigma,seed); //得到高斯白噪声x[0]=b[0]*w[0];

for(k=1;k<=p;k++) //得到前p个数据

{

s=0.0;

for(i=1;i<=k;i++)

{

s+=a[i]*x[k-i];

}

s=b[0]*w[k]-s;

if(q==0)

{

x[k]=s;

continue;

}

m=(k>q)?q:k;

for(i=1;i<=m;i++)

{

s+=b[i]*w[k-i];

}

x[k]=s;

}

for(k=(p+1);k

{

s=0.0;

for(i=1;i<=p;i++)

{

s+=a[i]*x[k-i];

}

s=b[0]*w[k]-s;

if(q==0)

{

x[k]=s;

continue;

}

for(i=1;i<=q;i++)

{s+=b[i]*w[k-i];}

x[k]=s;

}

free(w);

}

void Power::psd(double b[],double a[],int q,int p,double sigma2,double fs,double x[],double freq[],int len,int sign)

{

int i,k;

double ar,ai,br,bi,zr,zi,im,re,xre,xim;

double ang,den,numr,numi,temp;

for(k=0;k

{

ang=k*0.5/(len-1);

freq[k]=ang*fs;

zr=cos(-8.0*atan(1.0)*ang);

zi=sin(-8.0*atan(1.0)*ang);

br=0.0;

bi=0.0;

for(i=q;i>0;i--)

{

re=br;

im=bi;

br=(re+b[i])*zr-im*zi;

bi=(re+b[i])*zi+im*zr; //分子的傅里叶变换

}

ar=0.0;

ai=0.0;

for(i=p;i>0;i--)

{

re=ar;

im=ai;

ar=(re+a[i])*zr-im*zi; //分母的傅里叶变换

ai=(re+a[i])*zi+im*zr;

}

br=br+b[0];

ar=ar+1.0;

numr=ar*br+ai*bi; //分母有理化后分子的实部

numi=ar*bi-ai*br;

den=ar*ar+ai*ai;

xre=numr/den;

xim=numi/den;

switch(sign)

{

case 0:

{

x[k]=xre*xre+xim*xim;

x[k]=sigma2*x[k]/fs;

break;

}

case 1:

{

temp=xre*xre+xim*xim;

temp=sigma2*temp/fs;

if(temp==0.0)

temp=1.0e-20;

x[k]=10.0*log10(temp);

}

void main()

{

Power P;

int i,n,p,q,len;

long seed;

double v,mean,var,c[10],x[500],freq[200];

double fs,sigma2;

static double a[5]={1.0,-2.76,3.809,-2.645,0.924}; static double b[1]={1.0};

FILE *fp;

p=4;

q=0;

seed=135791;

mean=0.0;

var=1.0;

n=500;

P.arma(a,b,p,q,mean,var,&seed,x,n);

for(i=0;i<300;i++)

x[i]=x[i+200];

n=300;

P.covar(x,n,p,c,&v,0);

printf("The coefficient of AR model\n");

for(i=0;i<=p;i++)

{

printf("a(%d)=%10.7lf\n",i,c[i]);

}

printf("The reflet coefficient of AR model\n"); printf("Pe=%10.7lf\n",v);

fs=1.0;

sigma2=v;

len=200;

P.psd(b,c,q,p,sigma2,fs,x,freq,len,1);

fp=fopen("covar1.dat","w");

for(i=0;i

fprintf(fp,"%lf %lf\n",freq[i],x[i]);

fclose(fp);

}

用R语言做非参数和半参数回归笔记学习资料

用R语言做非参数和半参数回归笔记

由詹鹏整理，仅供交流和学习根据南京财经大学统计系孙瑞博副教授的课件修改，在此感谢孙老师的辛勤付出！教材为：Luke Keele: Semiparametric Regression for the Social Sciences. John Wiley & Sons, Ltd. 2008. ------------------------------------------------------------------------- 第一章 introduction: Global versus Local Statistic 一、主要参考书目及说明 1、Hardle(1994). Applied Nonparametic Regresstion. 较早的经典书 2、Hardle etc (2004). Nonparametric and semiparametric models: an introduction. Springer. 结构清晰 3、Li and Racine(2007). Nonparametric econometrics: Theory and Practice. Princeton. 较全面和深入的介绍，偏难 4、Pagan and Ullah (1999). Nonparametric Econometrics. 经典 5、Yatchew(2003). Semiparametric Regression for the Applied Econometrician. 例子不错 6、高铁梅（2009）. 计量经济分析方法与建模：EVIEWS应用及实例（第二版）. 清华大学出版社. （P127/143） 7、李雪松（2008）. 高级计量经济学. 中国社会科学出版社. （P45 ch3） 8、陈强（2010）. 高级计量经济学及Stata应用. 高教出版社. （ch23/24）【其他参看原ppt第一章】二、内容简介方法： ——移动平均（moving average） ——核光滑（Kernel smoothing） ——K近邻光滑（K-NN） ——局部多项式回归（Local Polynormal） ——Loesss and Lowess ——样条光滑（Smoothing Spline） ——B-spline ——Friedman Supersmoother 模型： ——非参数密度估计 ——非参数回归模型 ——非参数回归模型 ——时间序列的半参数模型 ——Panel data 的半参数模型 ——Quantile Regression 三、不同的模型形式 1、线性模型linear models 2、Nonlinear in variables

非参数回归模型与半参数回归模型

第七章非参数回归模型与半参数回归模型第一节非参数回归与权函数法一、非参数回归概念前面介绍的回归模型，无论是线性回归还是非线性回归，其回归函数形式都是已知的，只是其中参数待定，所以可称为参数回归。参数回归的最大优点是回归结果可以外延，但其缺点也不可忽视，就是回归形式一旦固定，就比较呆板，往往拟合效果较差。另一类回归，非参数回归，则与参数回归正好相反。它的回归函数形式是不确定的，其结果外延困难，但拟合效果却比较好。设Y 是一维观测随机向量，X 是m 维随机自变量。在第四章我们曾引进过条件期望作回归函数，即称 g (X ) = E (Y |X ) （7.1.1）为Y 对X 的回归函数。我们证明了这样的回归函数可使误差平方和最小，即 22)]([min )]|([X L Y E X Y E Y E L -=- （7.1.2）这里L 是关于X 的一切函数类。当然，如果限定L 是线性函数类，那么g (X )就是线性回归函数了。细心的读者会在这里立即提出一个问题。既然对拟合函数类L (X )没有任何限制，那么可以使误差平方和等于0。实际上，你只要作一条折线(曲面)通过所有观测点(Y i ，X i )就可以了是的，对拟合函数类不作任何限制是完全没有意义的。正象世界上没有绝对的自由一样，我们实际上从来就没有说放弃对L(X)的一切限制。在下面要研究的具体非参数回归方法，不管是核函数法，最近邻法，样条法，小波法，实际都有参数选择问题(比如窗宽选择，平滑参数选择)。所以我们知道，参数回归与非参数回归的区分是相对的。用一个多项式去拟合(Y i ，X i )，属于参数回归；用多个低次多项式去分段拟合(Y i ，X i )，叫样条回归，属于非参数回归。二、权函数方法非参数回归的基本方法有核函数法，最近邻函数法，样条函数法，小波函数法。这些方法尽管起源不一样，数学形式相距甚远，但都可以视为关于Y i 的线性组合的某种权函数。也就是说，回归函数g (X )的估计g n (X )总可以表为下述形式： ∑==n i i i n Y X W X g 1 )()( （7.1.3）

用R语言做非参数和半参数回归笔记

由詹鹏整理，仅供交流和学习根据南京财经大学统计系孙瑞博副教授的课件修改，在此感谢孙老师的辛勤付出！教材为：Luke Keele:Semiparametric Regression for the Social Sciences.John Wiley &Sons,Ltd.2008. ------------------------------------------------------------------------- 第一章introduction:Global versus Local Statistic 一、主要参考书目及说明 1、Hardle(1994).Applied Nonparametic Regresstion.较早的经典书 2、Hardle etc(2004).Nonparametric and semiparametric models:an introduction. Springer.结构清晰 3、Li and Racine(2007).Nonparametric econometrics:Theory and Practice.Princeton.较全面和深入的介绍，偏难 4、Pagan and Ullah(1999).Nonparametric Econometrics.经典 5、Yatchew(2003).Semiparametric Regression for the Applied Econometrician.例子不错 6、高铁梅（2009）.计量经济分析方法与建模：EVIEWS应用及实例（第二版）.清华大学出版社.（P127/143） 7、李雪松（2008）.高级计量经济学.中国社会科学出版社.（P45ch3） 8、陈强（2010）.高级计量经济学及Stata应用.高教出版社.（ch23/24）【其他参看原ppt第一章】二、内容简介方法： ——移动平均（moving average） ——核光滑（Kernel smoothing） ——K近邻光滑（K-NN） ——局部多项式回归（Local Polynormal） ——Loesss and Lowess ——样条光滑（Smoothing Spline） ——B-spline ——Friedman Supersmoother 模型： ——非参数密度估计 ——非参数回归模型 ——非参数回归模型 ——时间序列的半参数模型 ——Panel data的半参数模型 ——Quantile Regression 三、不同的模型形式 1、线性模型linear models 2、Nonlinear in variables

非参数回归模型与半参数回归模型

用R语言做非参数和半参数回归笔记.docx

由詹鹏整理 ,仅供交流和学习根据南京财经大学统计系孙瑞博副教授的课件修改 ,在此感谢孙老师的辛勤付出！教材为：Luke Keele: Semiparametric Regression for the Social Sciences. John Wiley & Sons, Ltd. 2008. ------------------------------------------------------------------------- 第一章 introduction: Global versus Local Statistic 一、主要参考书目及说明 1、Hardle(1994). Applied Nonparametic Regresstion. 较早的经典书 2、Hardle etc (2004). Nonparametric and semiparametric models: an introduction. Springer. 结构清晰 3、Li and Racine(2007). Nonparametric econometrics: Theory and Practice. Princeton. 较全面和深入的介绍 ,偏难 4、Pagan and Ullah (1999). Nonparametric Econometrics. 经典 5、Yatchew(2003). Semiparametric Regression for the Applied Econometrician. 例子不错 6、高铁梅（2009）. 计量经济分析方法与建模：EVIEWS应用及实例（第二版）. 清华大学出版社. （P127/143） 7、李雪松（2008）. 高级计量经济学. 中国社会科学出版社. （P45 ch3） 8、陈强（2010）. 高级计量经济学及Stata应用. 高教出版社. （ch23/24）【其他参看原ppt第一章】二、内容简介方法： ——移动平均（moving average） ——核光滑（Kernel smoothing） ——K近邻光滑（K-NN） ——局部多项式回归（Local Polynormal） ——Loesss and Lowess ——样条光滑（Smoothing Spline） ——B-spline ——Friedman Supersmoother 模型： ——非参数密度估计 ——非参数回归模型 ——非参数回归模型 ——时间序列的半参数模型 ——Panel data 的半参数模型 ——Quantile Regression 三、不同的模型形式 1、线性模型linear models 2、Nonlinear in variables

非参数计量经济学

【内容提要】内容简介本书分为四部分．第一部分为密度函数和条件密度函数，包括密度函数的非参数估计、一元条件密度函数的非参数估计和多元条件密度函数的投影追踪估计；第二部分为非参数计量经济模型，包括非参数计量经济模型的核估计和变窗宽核估计、局部线性估计和变窗宽局部线性估计、非参数计量经济模型的异方差问题和多重共线性问题；第三部分为非参数计量经济联立方程模型，包括非参数计量经济联立模型的局部线性工具变量估计和变窗宽局部线性工具变量估计、局部线性两阶段最小二乘估计和变窗宽局部线性两阶段最小二乘估计、局部线性广义矩估计和变窗宽局部线性广义矩估计；第四部分为半参数计量经济模型和联立方程模型，包括半参数计量经济模型的最小二乘估计、半参数计量经济联立模型的工具变量估计和其他工具变量估计．本书的附录包括准备知识和R软件介绍．本书适合高等院校经济、管理学科的研究生和研究人员使用．【节选】序言非参数计量经济学作为现代计量经济学的一个分支，近20年来得到了迅速的

发展．从国际权威的计量经济学学术刊物的论文中，我们不难发现，关于非参数计量经济学理论方法的研究，一直是理论计量一个重要的和前沿的研究领域．在应用研究方面，将非参数、半参数模型方法与微观计量、宏观计量以及金融计量结合，也成为这些计量经济学分支领域的研究热点．在国外著名大学的经济学研究生课程表中，非参数计量经济学已经成为计量经济学高级课程重要的一部分．在国内，近年来，一批年青学者将该领域作为主要研究方向，在跟踪研究的同时，取得了一些创新成果；不少大学已经将非参数计量经济学纳入研究生高级计量经济学的教学内容，甚至为博士研究生开设了专门的课程．但是，国内目前关于非参数计量经济学的出版物相当少．2003年7月，南开大学出版社出版了叶阿忠教授的《非参数计量经济学二》一书，在它的序言中，我写下了如下一段话：“在国内，尚缺少全面系统的、既具有学术水平又具有应用指导价值的著作奉献给广大读者．在这个意义上，这本《非参数计量经济学》填补了这个空白．”时隔几年，这种状况没有改变．从这个意义上说，叶阿忠教授即将出版的《非参数和半参数计量经济模型理论》专著对于推动国内的计量经济学研究与教学都具有十分重要的价值．叶阿忠教授近10年来以非参数计量经济学模型理论为自己的主要研究方向，取得了显著的成绩，完成了国家自然科学基金项目“半参数计量经济联立模型单方程估计方法的理论研究”、教育部人文社会科学基金项目“非参数计量经济模型的理论研究”和教育部人文社会科学重点研究基地重大项目“非经典计量经济

半参数混合效应模型的稳健估计(精)

半参数混合效应模型的稳健估计【摘要】:人们利用实际观测数据作统计推断时,一些假定是必不可少的。然而这些假定与实际情况几乎不可能完全相符,只是实际情况一种近似描述。人们通常希望所假定的统计模型与实际数据之间微小的差异不会对最终结论产生大的影响,但是实际情况并非人们所希望的那样。最近几十年来,人们发现假定模型与实际数据之间看上去微小的偏离会对很多常用的统计方法产生很大的影响。因此,开始研究稳健的统计方法。所谓“稳健的统计方法”简单的说就是指那些对模型假定与实际数据之间存在的微小偏差不敏感的统计方法。或者说模型假定与实际数据之间的微小偏差对这些方法影响不大。八十年代中期,Green等(1985在研究农业实验和Engle等(1986在研究气候条件对电力需求的影响这两个实际问题时分别独立地提出了一种重要的统计模型,即半参数统计模型。在此基础上又发展到半参数混合效应模型。半参数混合效应模型,既含有固定效应,又含有随机效应;既含有参数部分,又含有非参数部分,综合了参数模型,非参数模型以及混合效应模型的诸多优点,具有更大的灵活性,也更加接近现实,充分利用了数据中的信息。而广义半参数混合效应模型则是半参数混合效应模型与广义线性模型的自然推广。本论文针对半参数混合效应模型,研究了它的稳健统计推断问题。现将主要内容概述如下:1.第一章首先简要地介绍了半参数混合效应模型;其次,介绍了稳健统计的背景和研究现状;并介绍了广义估计方程的背景和研究现状;最后, 介绍了本文的主要工作。2.第二章主要研究了广义半参数混合效应模型均值部分的稳健估计问题,包括回归参数和非参数函数的稳健估计。主要内容包括:首先基于B-样条的非参数方法,构造了带有条件数学期望的稳健估计方程;第二,利用MonteCarloMarkovChain(MCMC方法从随机效应后验分布中抽取样本来估计稳健估计方程中的条件期望;第三,给出了稳健估计的渐近性质;第四,通过随机模拟检验稳健估计的有效性,并在正态模型下与He,FungZhu(2005中提出的稳健估计进行了比较,发现在数据中存在异常点时,该模型下我们研究的稳健估计具有更高的效率。最后,通过对四个实际例子的分析说明了方法的可行性。3.第三章主要研究了响应变量为连续变量的半参数模型下协方差参数的稳健估计。首先,构造了均值分量和协

第27章-非参数与半参数估计

? 陈强,《高级计量经济学及Stata 应用》课件，第二版，2014 年，高等教育出版社。第 27 章非参数与半参数估计 27.1 为什么需要非参数与半参数估计 “参数估计法”(parametric estimation)假设总体服从带未知参数的某个分布(比如正态)，或具体的回归函数，然后估计这些参数。其缺点是，对模型设定所作的假定较强，可能导致较大的设定误差，不够稳健。 1

“非参数估计法”(nonparametric estimation)一般不对模型的具体分布或函数形式作任何假定，更为稳健。缺点是要求样本容量较大，且估计量收敛的速度较慢。作为折衷，同时包含参数部分与非参数部分的“半参数方法” (semiparametric estimation)，降低对样本容量的要求，又有一定稳健性。非参及半参方法与传统的参数法互补；后者不太适用时，可考虑前者。 2

27.2 对密度函数的非参数估计考虑根据样本数据来推断总体的分布，即密度函数。如用参数估计法，则先对总体分布的具体形式进行假定。比如，假设总体服从正态分布N (μ, σ2)，然后估计参数(μ, σ2 )。如果真实总体与正态分布相去甚远，则统计推断有较大偏差。如不假设总体分布的具体形式，则为非参数方法。最原始的非参数方法是画直方图，即将数据的取值范围等分为若干组，计算数据落入每组的频率，以此画图，作为对密度函数的估计。 3

直方图的缺点是，即使随机变量连续，直方图始终是不连续的阶梯函数。为得到对密度函数的光滑估计，Rosenblatt(1956)提出“核密度估计法”(kernel density estimation)。首先考察直方图的数学本质。假设要估计连续型随机变量x 在x 0处的概率密度f (x )。概率密度f (x 0 )是累积分布函数F (x)在x 处的导数： f (x ) = lim h→0 F (x +h) -F (x 2h -h) = lim P(x0-h < x