非线性时间序列 第五章
- 格式:doc
- 大小:1.23 MB
- 文档页数:17
127
第五章 非参数密度估计
5.1 引论
在非参数函数估计中,平滑是最基本的方法之一,通常被称为一维散点图平滑和密度估计. 在多维框架下,平滑是建立非参数估计的有用的构建模块. 平滑首先从时间序列中的谱密度估计中产生. 在对Bartlett (1946)的富有创新的文章的讨论中,Henry E. Daniels 指出,谱密度估计的一个可能的修正可以通过平滑周期图来实现. 然后,这一问题的理论和方法由Bartlett (1948,1950)系统地发展起来. 这样,早在半个世纪以前,平滑方法便已是时间序列分析的一个重要部分.
平滑问题在时间序列分析的各个方面经常出现. 平滑方法为概述一个给定的时间序列的边缘分布提供了有用的图解工具. 它们还可用于估计和消除慢变时间趋势. 这就产生了时域平滑. 研究一个时间序列和它的延迟序列联系的需要产生了状态域平滑. 这些方法能够容易地推广到估计一个时间序列的条件方差(波动性). 为了检验周期形式和别的特征,比如时间序列的功率谱,平滑方法常常用来估计谱密度. 在拟合一个时间序列数据时,一个重要的问题是拟合模型的残差的行为是否像白噪声. 对这类非参数拟合优度检验,非参数函数估计提供了有用的工具. 这个内容将本章和下一章中讨论.
最简单的非参数函数估计问题可能是密度估计. 这种简单结构对理解非参数建模和推断中更复杂的问题提供了有用的工具. 这就是我们在本章中讨论非参数密度估计的目的.
5.2 核密度估计
国库券收益的分布是什么?直方图是回答这类问题的经典的方法. 核密度估计是对直方图方法的改善. 它用来验证数据集合的所有分布特征. 这些包括密度峰和谷的数目和位置以及密度的对称性. 它是揭示非参数函数估计基本特性的最简单的工具. 对密度估计和它的应用的全面的讨论在Devroye 和Gy örfi (1985),Silverman (1986)以及Scott (1992)给出.
给定T 个数据点1,,T X X ,通过对每一个观测点乘以量1/T 可得到这些数据点的
经验分布函数:
1
1()()T
t t F x I X x T ==≤∑.
这个累积分布函数是非降的,对验证给定分布的全面的结构不是太有用的. 当人们论及分布时,其脑海里常常有密度函数. 然而,经验分布函数的密度是不存在的. 对经验分布函
128
数的改进是在每一个数据点及其邻近重新平滑地分配量1/T (见图5.1). 这通常是通过引进一个核函数K 来实现. 核函数通常取为非负对称的单峰概率密度函数. 令h 是带宽参数,在图5.1中,我们重机关报表示窗的大小(实际上,它是密度函数的标准差,以虚岁线画出). 这时,核密度估计定义为
图5.1 核密度估计对点群重新建立分布. 在每一个数据点处,由实的重直线来表示,
并把重新建立分布的点群和已获得的最终估计放在一起
1
1
1()()()T
t h h t X x f x T
K K u x d F u h h -=-⎛⎫==- ⎪⎝⎭∑⎰, (5.1) 其中()(/)/h K K h h ⋅=⋅.
常用的核函数包括高斯核
12()exp(/2)K u u -=-
和对称贝塔(Beta )族
21
()(1)(||1)Beta(1/2,1)
K u u I u γγγ=
-≤+.
选择0,1,2γ=和3,则分别对应于均匀核函数、Epanechnikov 核函数、双权核函数和三权核函数. 当γ取大的数值时,通过适当的重新排列,对称卡玛(Gamma )核近似于高斯核函数. 注意,不同的核函数有不同的支撑. 例如,均匀核函数的有效支撑是[1,1]-,而三权核函数的有效支撑更短(原因是在尾部有较小的权),高斯核函数的有效支撑更长(见图5.2). 这样,即使具有相同的带宽,不同的核获得的x 点周围的局部数据所提供的信息也不同. 下面的公式(5.7)试图显示使用两个不同核的平滑量间的等价关系.
由
129
Marron 和Nolan (1988)引入的经典核的概念减弱了这个问题.
图5.2 常用的核函数. 它们被标准化使得最大高度为1,以便于表示. 粗曲线是高斯核, 它比别的核有更长的有效支撑
为了使用核密度估计,人们需要选择核函数和带宽. 众所周知,对核密度估计,无论是从经验的角度,还是从理论的角度,核函数的选择都不是太重要的. 只要它们是对称和单峰的,当带宽h 是最优选择时,所得核密度估计的表现几乎都相同. 见§5.4中的表5.1. 这样,正如图5.3所示,在一个大的带宽h 下,得到一个过度平滑的估计,遗漏一些可能的细节,比如多峰情形和所得的估计密度低于峰值. 换句话说,使用大的带宽可能导致估计产生大的偏差. 当使用较小的带宽时,没有太多的局部数据点被使用,从而减少了估计的方差,其结果可能产生一条摆动的曲线. 为了得到满意的结果,我们需要反复试验. 带宽的数据驱动选择可以帮助我们确定最优的平滑量(更多的细节参阅§5.4).
如图5.3所示,描绘了用带宽分别为0.61/3,0.61h =和30.61⨯的高斯核所得的3个月期国库券收益的分布估计. S-Plus 函数“density ”被用来计算核密度估计. 带宽
0.61h =通过下面(5.9)所述的标准参考的带宽来选择,显然,小的带宽导致平滑不足
的估计,产生一个具有不自然摆动样式的密度函数,而大的带宽则给出一条过度平滑的曲线,使得原来分布好的结构变得模糊. 虽然所得的曲线稍微出现过度平滑,但简单的供参考带宽0.61h =通常被认为是对h 的一个初步选择.
正如在图5.3中所看到的那样,利率的分布有长的右尾. 分布的中位数和众数大约是5.34%,而均值是5.97%. 在1980年代初,利率高达
15%.