当前位置:文档之家› 最新地震处理教程——1 第一章 时间序列分析基础

最新地震处理教程——1 第一章 时间序列分析基础

最新地震处理教程——1 第一章 时间序列分析基础
最新地震处理教程——1 第一章 时间序列分析基础

第一章时间序列分析基础

一维傅里叶变换

首先观察一个实验。将弹簧的一端固定并悬垂,另一端挂一重物。向下拉重物使弹簧拉伸某一距离,比如说0.8个单位,使其振动。现假定弹簧是弹性的,那么它将无休止地上下运动。若将运动起始的平衡位置定为时间零,那么重物的位移量将随着时间函数在极限[+0.8—-0.8]之间变化。如果有一装置能给出位移振幅随时间函数变化的轨迹,就会得到一条正弦波曲线。其相邻两峰值间的时间间隔为0.08秒(80毫秒)。我们称它为弹簧的周期,它取决于所测弹簧刚度的弹性常数。我们说弹簧在一个周期时间内完成了一次上下振动。在1秒的观测时间内记下其周期数,我们发现是12.5周,这个数被称为弹簧振动的频率。你一定会注意到,1/0.08=12.5,这就是说频率为周期的倒数。

我们取另一个刚性较大的弹簧,并重复上面的实验。不过这次弹簧的振幅峰值位移为0.4个单位。它的运动轨迹所显示的是另一条正弦曲线。量其周期和频率分别为0.04秒和25周/秒,为了记下这些测量结果,我们做每个弹簧峰值振幅与频率的关系图,这便是振幅谱。

现在取两个相同的弹簧。一个弹簧从0.8个单位的峰值振幅位移开始松开,并使其振动。这时注意弹簧通过零时平衡位置的时间,就在它通过零时的一刹那,请你将另一弹簧从0.8个单位的同样峰值振幅位移处松开。这样由于起始的最大振幅相同,所以两个正弦时间函数的振幅谱也应该一样。但肯定两者之间是有差别的,特别是当第1个正弦波达到峰值振幅时,另一个的振幅为零。两者的区别为:第2个弹簧的运动相对于第1个弹簧的运动有一个等于四分之一周期的时间延迟。四分之一周期的时间延迟等于90°相位滞后。所以除振幅谱之外,我们还可以作出相位延迟谱,至此,这个实验做完了。那么我们学到了什么呢?这就是弹簧的弹性运动可以用正弦时间函数来描述,更重要的是,可以用正弦波的频率、峰值振幅及相位延迟来全面地描述正弦波运动。这个实验告诉我们弹簧的振动是怎样随时间和频率函数变化的。

现在设想有一组弹簧,每个弹簧的正弦运动都具有特定的频率、峰值振幅和相位延迟。所有弹簧的正弦响应如图1所示。我们可以把该系统的运动“合成”为一个总的波动,来代替该组中的各单个分量的运动。这一合成是直接把所有记录道相加,其结果得到一个与时间相关的信号,在图1中由第一道表示。我们通过这种合成可以把这一运动由频率域变换到时间域。这一变换是可逆的:即给定时间域信号,我们可以把它变换到频率域的正弦分量。在数学上,这种双向过程是由傅里叶变换完成的。在实际应用中,标准的运算是所谓快速傅氏变换。通过傅氏正变换可以把与时间相关的信号分解成它的频率分量,而所有的频率分量合成为时间域信号又是通过反傅氏变换来实现的。图2概括了信号的傅氏变换。振幅谱和相位谱(严格地讲是相位延迟谱)是图1中所显示的正弦波最简单的表示形

式。我们很容易看到两种波形显示间的对应性。特别是,振幅谱在大约20赫兹和40赫兹处分别有一个强峰值和一个较小的峰值,在图1中大约相同的频率位置上可以见到较暗的频带。另一方面,在大约30赫兹处的弱振幅区和振幅谱上的高频和低频端在两种显示中也都是明显的。要记住,振幅谱曲线表示的是各个正弦波峰值振幅与频率的关系。现在我们来研究不太好理解的相位谱。这回忆一下弹簧试验,相位延迟是指一个特定频率分量的时间延迟。为了更好地说明相位延迟与频率的关系,让我们在图1

上追踪以零计时线截取的

正峰值。我们观察到,在谱

的低频端这些峰值落在零

计时线后面(即负时间值)。

然后在大约20赫兹处,它们

跳到时间轴正的一边,并且

在频率轴的剩余部分它们

基本上都在这一边。在图1

中我们追踪的路径可以画

成图2中显示的相位谱,如

果所有的峰值沿用图1中的零计时线排列,那么它可能对应于零相位谱。在这种情况下,所有的正弦波将彼此加强,在零时产生极大峰值。相对来讲,振幅谱比相位谱容易理解,在本节后面再深入研究这一问题。

假频

地震信号是一个连续的时间函数。由于数字记录的引入,连续的地震信号要

以离散的时间间隔进行采样,其

时间间隔称为采样率。通常,对

于大多数反射地震工作其采样率

的范围在l至4毫秒。高分辨率研

究要求采样率小到0.25毫秒。图3

是一个连续的时间信号。黑点表

示实际记录的离散采样点。离散

的时间函数称为“时间序列”。

图3的下图是企图恢复上图的起始连续信号的曲线。很明显,重建的信号缺少了原来信号所表现的细节。这些细节对应着高频分量,它们由于离散化而明显地丢失了。假如我们选择较小的采样率,就可能更精确地再现原来的信号。在零采样间隔的这种极限情况下,我们就能精确地表示连续信号。

由于离散化,可能恢复的频带宽度是否有个量度?通常,若给定采样间隔为dt,那么可以恢复的最高频率是1/2dt。这就是所谓的尼奎斯特频率。若dt为2毫秒,尼奎斯特频率为250赫兹,对这一时间序列重采样,得到采样率5毫秒和8毫秒的时间序列,对应的尼奎斯特频率分别为125赫兹和62.5赫兹。可以想象到,采样间隔越大,时间序列就越平滑,即高频损失越严重。当我们用4毫秒重新采样时,在2毫秒采样的时间序列中存在于125—250赫兹之间的频率分量完全丢失了。同样,8毫秒重采样的序列在62.5至125赫兹之间频率含量也丢失了。我们能否恢复这些频率呢?绝对不能。一旦我们离散化了连续信号,那么我们期望恢复的最高频率就是尼奎斯特频率。人们也可能提出对4毫秒或8毫秒采样的时间序列进行内插成2毫秒采样就应拾回高频。事实上,4毫秒和8毫秒采样的时间序列用同一作图比例尺内插回2毫秒,得出的采样点数目与原始系列相同,这种内插不能恢复由于离散而损失的频率,仅仅产生一些多余的采样点。在野外就其连续信号采样来说,此意义是重要的。如果大地信号具有的频率比如说是高达150赫兹,那么4毫秒采样将丢失125—150赫兹之间的频率。

仅仅是丢失高频吗?它们真的丢失了吗?我们举一个正弦波的例子。对25赫兹正弦波信号像前面所说的以4毫秒和8毫秒采样重采样,振幅谱表明三种不同采样的信号具有相同的频率25赫兹。这就是说在以较大的采样间隔重采样后,信号未发生变化。现在我们再用较高的50赫兹频率的正弦波重采样,也没有损害信号,也就是振幅谱显示了与原来相同的50赫兹频率。我们继续对75赫兹的正弦波重采样,用4

毫秒重采样

没有改变其

振幅谱。但

用8毫秒重

采样的信号

实际上已改

变了信号,

它表现为较

低频率的正

弦波,重采

样的信号具

有50赫兹的

频率。8毫秒

采样率的尼

奎斯特频率

是62.5赫

兹。该信号

频率是75赫

兹,我们丢

失了这一部

分信号,但

这是以较低频率的信号重新出的,我们说在重采样后它折回到这个谱上。

应用单一频率的正弦波,我们了解的只是并不太复杂情况下出现的一些现象。现在,我们讨论图4中的两个频率分别为12.5赫兹和75赫兹的正弦波的重叠的情形。以2毫秒和4毫秒的采样率离散这一信号未改变原来的信号,因为所有的频率分量都在2毫秒和4毫秒采样有关的尼奎斯特频率以下(分别为250赫兹和125赫兹)。但是以较大采样率比如8毫秒离散该信号时,可以见到振幅谱被改变了。

12.5赫兹的分量没有受到影响,看来对这种低频分量采样,8毫秒采样率是足够了。但是75赫兹的分量却以较低的频率出现。我们可以用简单的公式:f

假频

=2×f

尼-f

来计算它应该以什么样的频率出现。在我们这个例子中,f

假频

=2×62.5赫兹

-75赫兹=50赫兹。这样我们又一次看到,可以出现在高于采样率所确定的尼奎斯特频率的那部分原始连续信号被折叠到离散信号的振幅谱上。可以把这组分析扩

展到不同频率的正弦波的重叠。特别是,对连续信号用太大的采样而得到的限带离散的时间序列,实际上包含着来自更后面高频分量的贡献。其表现方式是这些高频折回到该离散序列的谱上,并以较低频率出现。这种现象通常称之为“假频”。实际上,该问题是由于对连续信号采样不足引起的。

总之,采样不足有两个影响:

(1)有限带宽的连续信号频谱的最高频率是尼奎斯特频率。

(2)可能已经存在于连续信号中的超过尼奎斯特频率的高频造成的有限带宽频谱上的“污染”。

关干第1个问题我们无能为力。第2个问题,即离散信号的高频端“污染”问题实际上是很重要的。为了保护零到尼奎斯特频率间的可能恢复的频带不受假频的影响,在模拟信号数字化之前在野外应用高截去假频滤波,这种滤波器把由于离散化而可能产生假频的那些频率分量消除掉。通常,高截去假频滤波器具有等于二分之一尼奎斯特频率的截止频率,并在尼奎斯特频率处频率响应下降到零振幅。近来大多数记录的数据都具有四分之

三尼奎斯特频率的高截频。

相位研究

在第2节我们知道了如何由信号的频

率分量合成一个时间域信号。现在我们举

一个零相位谱的简单例子。图5是一组频率

范围大约在1至32赫兹的正弦波,它们都具

有零相位延迟,这样,其峰值振福便在t

=0排列起来。对所有正弦波求和,便得到

右边用星号“*”标志的时间域信号。这就

完成了一次反傅氏变换。我们称这样的一

个时间域信号为“子波”。后面我们还将

进一步讨论这种子波,而现在我们暂时把

它看成是有限长度的瞬变信号。它有起始位置和终止位置,其能量限定在这两个时间位置之间,我们刚建立起的这个子波相对于t=0 对称,这种子波叫做零相位子波,实际上,可用峰值振幅相等的许多零相位正弦波合成这种子波。

零相位子波并非一定是相对于零时间对称。我们在求和之前使每个正弦波有一个线性相移,线性相移定义为相位=常数×频率。我们发现,该子波的形状未变,但是,在时间上移动了0.2秒,这个常数实际上是时移量。我们作下面重要陈述:

线性相移相当于常数时移,相位延迟谱的直线斜率由时移给出。

人们可以直接改变相位延迟谱的直线斜率如图6所示,以所期望的时移量来移动子波。从左边的零相位子波开始,我们增加线性相位延迟的斜率,这就顺次造成较大的时移。如果改变相位延迟谱斜率的符号,我们就可以沿相反的时间移动子波。

我们取与图5中显示的相同正弦波,并

使图7所示的每个正弦波有恒定的相位延

迟,换言之,该相位谱是由方程:相位=常数

给定的。该常数假定为90o,我们注意到:

在t=0时,所有的零变号点排齐,其求和的

结果便产生右边用星号“*”标注的非对称

子波。零相位子波(图5)和有线性相移的子

波,其振幅谱相同,因为它们具有相同的频

率成分。其差别在于它们的相位延迟谱。前

者是零相位谱,而后者是某一常数的相位

谱。所以我们可以做出这样的结论:子波形

状的差异是由于相位谱的不同造成的。

现在我们研究几个不同的相移常数的例子。图8显示出几组子波,每个都具有不同的相移常数,它们都是由左边的零相位子波导出的。90o相移把零相位子波转化成非对称子波,180o相移改变了零相位子波的极性,270o相移把零相位子

波转化成非对称子波的同时并反转其极性。最后,我们应预料到,360o相移使子波又回到原始子波的形状。现在我们作出第二个重要的陈述:

常数相移改变了子波的形状。尤其是 90o相移将零相位子波变成了非对称子波;180o相移改变了子波的极性。

至此,我们已研究了两种基本的相位

延迟谱:即线性相移和常数相移。现在我

们再看看两者的综合效应。用下面的方程:

相位=a+b*频率,来确定相位延迟谱,这里

a 是常数相移,b是线性相移量。图9是具

有90o常数相移加上线性相位分量的相位

延迟谱合成的子波。具有与图5中相同振幅

谱的零相位子波,由于线性相移而在时间

上移动了0.2秒,又由于常数90o相移而变

成非对称的子波。可见,借助直接改变相

位延迟谱,零相位子被可以被修改成与原

来子波完全不同的形状。下面给出第三条

结论:

为了保持振幅谱相同,我们可以借助改变相位延迟谱来改变子波形状。

频率滤波

在保持子波零相位特征的同时,改变其振幅谱,子波会有什么变化呢?我们从图10所显示的由两个甚低频分量的合成入手,然后我们逐渐增加这一傅氏合成的频率分量。用表示零相位子波记录道顺顶部用数字标注出合成的子波。增加更多的频率分量就意味着振幅谱展宽。我们应该作出的重要观测结果是随着频带加宽,时间域中子波被压缩。如果我们在反傅氏变换中包括所有的频率,那么其子波就变成了一个脉冲。所以,我们可以把这个脉冲定义成从零到尼奎斯特频率的所有频率分量的合成结果。脉冲振幅谱是均匀的,而它的所有频率的相位谱都为

零。

尽管我们知道了如何通过傅里叶合成一个脉冲,但我们还可以作其它实际数值的观测,如子波都有带限的振幅谱。频带宽度越大,子波压缩就越好。零相位带限子波可用来“滤波”地震记录道,其输出应仅包含组成滤波子波的那些频率,这种时间域表示的子波称为“滤波因子”。由于我们没有改变输入道的相位延迟谱,而仅仅改变了振幅谱带宽,所以这里所描述的滤波过程特称之为“频率滤波”。

频率滤波的形式可以是带通、带阻、高通(低截)或低通(高截)。它们的理论基础是相同的,也就是建立一个满足上述四种特性之一的振幅谱的零相位子波。实际上最常用的是带通滤波,原因是:一般地震记录包含着诸如地滚波那样的一些低频干扰,又包含着某些高频环境噪声。包含反射能量的有用地震信号大约限定在10至50赫兹的频带内,其主频约在25至30赫兹。

带通滤波是在资料处理的不同阶段进行的、必要时,带通滤波也可以在反褶积之前使用,这样便于压制影响信号自相关的残余地滚波和高频环境噪音。在估算剩余静校正量,对CMP道集记录作互相关之前应用窄带通滤波。为提高分辨力,这种滤波亦可在计算互相关之前作速度谱时完成。最后,对叠加资料应用时变滤

波,这是标准的方法。

下而我们研究带通滤波的某些特征。参见图11,我们对频率滤波的基本特点

作如描述:

带宽越宽,滤波因子压缩越甚,要求的系数数目愈少。

它所遵循的基本原理是:时间序列的有效时间间隔与它的有效谱宽成反比。 我们实际上可以通过某一频带,完全阻止谱的其余部分。对于该滤波因子来说,期望确定的振幅谱应是下面的形式:

H(f)=其它)2(||)1(0

11f f f ≤≤??? 式中 f(1)和 f(2)是截频,这就是所谓的“矩形”振幅谱。把这一系列的运算依顺序作如下描述:

确定一个矩形振幅谱→快速反傅氏变换→滤波因子→截断→快速傅氏正变换→计算实际振幅谱。

图11(a)的上图是滤波因子,下图是它的实际振幅谱和期望的振幅谱的叠合图。在实际的振幅上存在着振荡现象,这就是众所周知的吉普斯现象,这是由于采用有限个傅里叶系数表示矩形函数造成的。从实践的角度出发,这种现象显然是我们所不期望的,因为它使通频带内某些频率分量被放大了,而另外一些频率分量未被放大。另外,在矩形两边的压制带内某些频率得不到压制。克服吉普斯现象的办法是:不用纯矩形函数确定通频带,可以在其两边设计斜边如图11(b)所示,这时可见其滤波因子只有少数波动,实际的和期望的振幅谱比较接近。进而,我们用足够缓的斜边去获得像图11(c)所见到的那样满意的结果,这里实际的和期望的谱是非常一致的。这时,滤波算子被进一步压缩了;也就是说,它的非零系数更少了,事实上这是求知不得的事情。我们喜欢尽可能用短的滤波算子,镶斜边的通带,在效果上增加了带宽,会产生较短的因子。

我们可以用多短的算子工作呢?虽然我们对通带镶上合适的斜边,但对算子过量的截断也会造成实际振幅谱与期望振幅谱有一大的偏离。扩展算子长度可以使实际谱与期望谱彼此更加一致,算子有一定长度,超过这个长度我们可以直接

加零系数。我们还记得,频率带宽与算子的有效长度成反比,这是实践中用来建立算子的原则。就通带的镶边而言,高频一边相对于低频一边要设计的更缓一点才好。

频率滤波与垂直(时间)分辨力是密切相联的。现在研究一下图12中的滤波因子。它们的有效频带宽度相同,而通带的中心频率不同,因为它们的有效带宽相同,所以两者的算子有相同的延续度。但由于它们的中心频率不同,所以一个有低频波动,另一个有高频波动。人们往往有一种误解,就是如果要提高时间分辨率就需要高频。其实并非如此,我们可以通过图13的窄带通滤波扫描更好地解释

这一点。图的上面,有单一反射层以及彼此相距为24毫秒、12毫秒和6毫秒的三个反射层。对这一资料我们应用这一系列的窄带通滤波,应用10—20赫兹的通带似乎能较合理地分辨出相距24毫秒的反射层。然而,总的来说,这些窄带通滤波没有哪一个能提供较好的分辨力。所以,仅有低频不能改善时间分辨率,而只有高频也不能提高分辨率。

因此,若提高分辨率既需要高频也需要低频,过点可由图14说明。我们注意到随着频带的加宽可以分辨靠得很近的反射层。带宽为10-30赫兹足以分辨相距24毫秒的反射层;10—50赫兹带宽对于分辨相距12毫秒的反射层也是足够的了;为了分辨相距

6毫秒的反射

层我们需要10

-100赫兹的

通带宽度。实

际上,所能分

辨的间隔大小

与期望的通带

宽度之间有密

切关系,这点

在第6章关于

地震分辨率一

节中再给予阐

述。

由于地层

固有衰减,地

震波沿传播路

径其谱的高频

分量被吸收,

这一点共炮点

道集频率扫描

可以明确地说

明。现在我们

来看图15中第

1幅的一段叠

加剖面。对这

一数据集用了

一系列的窄带

通滤波。在10

—20赫兹和20—30赫兹内从上到下都有信号;在30—40赫兹的频率内在4秒以下开始见到噪声,对于较高频带,噪声在较早的时间很快出现。例如,40—50赫兹的频带其有用信号达2.6秒,而50—60赫兹、60—70赫兹的频率有用信号只达到1.6秒。这个事实说明:高频有用信号限于剖面的成层部位,这就意味着随着反射层的加深,时间分辨力逐渐降低。在实际工作中,根据信号带宽的时变特点要求以时变的方式应用频率滤波。通过这种作法,我们排除了噪声并获得了清晰的

剖面。在这个例子中,时变滤波的参数选择是:

时间(毫秒) 带宽(赫兹)

0 10—60

1600 10—60

2600 10—50

3700 10—40

6000 10—30

为了建立一个平滑过渡的通带范围,滤波器应用的时窗应是相互重叠的。对于不同时期作的或是用不同震源作的两套资料进行滤波时要建立统一的频带宽

度,闭合两条测线并追踪相交的反

射层时,这一点尤其重要。解释员

把标准层的频率特征作为追踪对

比的参考,这样,如果两相交测线

是用不同频率滤波,其反射特征可

能改变,会给解释对比造成困难。

频率滤波从根本上说就是将输入

地震记录道的振幅谱与滤波因子

的振幅谱相乘。我们可以用左图概

括地描述:

时间域运算:

现在我们来看看时间域的滤波过程。考虑一个时间序列(1,0,1/2)所表示的反射系数序列,同时考虑一个在t=0时刻起爆的,其振幅为 1的脉冲震源。反射系数序列对这一脉冲的响应通常称之为“脉冲响应”,我们可以用下面的图解法概括地描述这一物理过程:

起始时间反射系数序列震源(子波) 响应

0 0 1 1/2 1 1 0 1/2

延迟一个单位时间,脉冲震源产生一个振幅为-1/2的压缩脉冲,这时的脉冲响应用下面的形式描述:

起始时间反射系数序列震源(子波) 响应

1 1 0 1/

2 -1/2 -1/2 0 -1/4

因为我们可以把震源当成一个膨胀和压缩脉冲的序列,所以可以把单个脉冲响应相加来获得综合响应,这就是线性叠加。如:

起始时间反射系数序列震源(子波) 响应

0 1

1 0 1/2

1 0 1/2

1

-1/2

1 0 1/2

-1/2 0 –1/4 (1,0,1/2) * (1,-1/2)= (1,–1/2,1/2,-1/4)

*号表示褶积。通过两个序列的褶积我们得到了反对系数序列(1,0,1/2)对震源子波(1,1/2)的响应。

在计算上完成褶积的方法如下:

反射系数序列输出响应10 1/2

-1/2 1

-1/2 1

-1/2 1

-1/2 1

1 -1/

2 1/2 -1/4

我们由反射系数序列建立一个固定数组。然后折叠震源子波并每次将其移动1个样点。每次延迟都将两个数组中排齐的元素则乘,并将各乘积相加。褶积的机理概括为一般形式如下:

固定数组 a(1) a(2) a(3) a(4) a(5) a(6) a(7) a(8)

移动数组 b(3) b(2) b(1)

给定两个数组a(i)和b(j).

首先:折叠移动数组b(j),

第1步:在垂直方向上相乘,

第2步:各乘积求和,并作为输出点记下。

第3步:将b(j)数组向右移动一个样点并重复第1,2步。

输出数组c(k)的元素个数为m + n - 1,m和n分别为运算对象数组a(i)和运算因子数组b(j)的长度。

我们把前表中的两个数组交换。

震源子波输出响应

1 -1/2

1/2 0 1

1/2 0 1

1/2 0 1

1/2 0 1

1 -1/

2 1/2 -1/4

我们发现,输出响应与前表中的情况一样。这就是说,作褶积运算时固定或移动那一个数组是没有关系的。

一旦设计好滤波算子,就不难把它应用于输入时间序列。下面对时间域中滤波器的设计和应用给予全面的概括:

左边流程图描述的带通滤波器在时

间域中的应用与在频率域中的应用产生

的结果相同。在实践中,时间域运算比较

方便,因为仅包含滤波因子这类的短数组

的褶积比做傅氏变换容易。

这些滤波过程蕴含着时间序列分析

中的一个非常重要的概念。滤波过程可以

看成是滤波器振幅谱与输入的时间序列

的振幅谱相乘;或是滤波因子与输入时间序列的褶积运算。所以:时间域的褶积相当于频率域的乘积;同样,频率域的褶积相当于时间域的乘积。

由多次覆盖给出的地震数据具有重复性,这是CMP道集固有的特点,为了提高信噪比,我们很需要这种重复性。在CMP道集中记录道都是“相似的”,它们都包含着共同的地下信息。我们只是说它们是相似的,但不是相同的,实际上也不可能完全相同。因为与每个CMP记录道有关的射线路径是不同的,并存在着静态时移。两道记录何以能相类似呢?我们试举一个简单的例子:

子波1:(2,1,-1,0,0)

子波2:(0,0,2,1,-1)

这两个子波的形状相同,但第2个子波相对于第1个子波时移了两个样点。我们应该能够确定一个时间延迟,在这个延迟上,它们有最大的相似。让我们将子波1和子波2的逆形式作褶积。这个过程就是所谓的互相关,这是两个时间序列相似程度的一个量度,时间序列与其自身作互相关称之为自相关,即

2 1 -1 0 0 输出延迟

0 0 2 1 –1 -2 -4

0 0 2 1 –1 1 -3

0 0 2 1 –1 6 -2

0 0 2 1 –1 1 -1

0 0 2 1 –1 -2 0

0 0 2 1 –1 0 1

0 0 2 1 –1 0 2

0 0 2 1 –1 0 3

0 0 2 1 –1 0 4

延迟-2时出现相关极大值。这表明如果把子波2沿时间轴向回移动2个样点,那么这两个子波具有最大的相似性。

将两个数组进行交换,我们得到下面的互相关值,即

0 0 2 1 -1 输出延迟

2 1 -1 0 0 0 -4

2 1 -1 0 0 0 -3

2 1 -1 0 0 0 -1

2 1 -1 0 0 0 -0

2 1 -1 0 0 -2 0

2 1 -1 0 0 1 1

2 1 -1 0 0 6 2

2 1 -1 0 0 1 3

2 1 -1 0 0 -2 4

这次相关极大值出现在延迟2上,这样,如果我们把子波1沿时间轴向前移动2个样点,那么这两个子波可具有最大对相似性。

现在我们作子波1与其本身的互相关,也就是计算它的自相关,即:

2 1 -1 0 0 输出延迟

2 1 -1 0 0 0 -4

2 1 -1 0 0 0 -3

2 1 -1 0 0 -2 -2

2 1 -1 0 0 1 -1

2 1 -1 0 0 6 0

2 1 -1 0 0 1 1

2 1 -1 0 0 -2 2

2 1 -1 0 0 0 3

2 1 -1 0 0 0 4

我们发现在零延迟出现最大相关值,这是自相关的重要特点,另外,自相关是对称的,这是实时序列的一个特点,所以我们只需要计算半边自相关就可以了。

前面已提过,时间域的褶积相当于频率域的乘积。因为相关也是一种褶积。只是其中一个数组被反转了。所以上面的描述对于相关也是适用的,下面是频率域相关和褶积的概括描述:

相当于褶积和相关的频率域运算

正如上图所见,褶积和相关都产生一个与输入序列频谱宽度相同的输出。直接的例子是带通滤波处理。我们还注意到,在褶积时相位是相加的,而在相关时相位是相减的。这进一步表明,自相关时输出序列是零相位的,我们已证实了自相关是相对于零延迟呈对称的这一事实。

互相关是衡量记录道之间的相似程度的,它在数字处理的不同阶段被广泛应用。例如:将CMP道集中的记录道与一模型道互相关计算剩余静校正。速度谱的

基本要点也是互相关。建立维纳滤波的程序块是期望得到输出波形与输入子波的互相关和输入子波的自相关。

另一项重要的处理是可控震源资料的相关处理。它包括扫描信号与记录的可控震源记录道的互相关。有关可控震源资料的褶积模型在第2章予以阐述。

二维傅里叶变换

如果我们只是研究水平层状介质的话,单道处理就足够了,但是倾斜同相轴必须用多道处理来解决。请

看图1显示的六个道集记录,

其道距为25米。它们都有单

色12赫兹同相轴,倾角在(0

—15)毫秒/道之间变化。通过

一维傅里叶变换,我们已经

熟悉了频率的概念,尤其是,

我们一直在研究“时间频

率”。然而,地震波场不仅

是时间的函数,也是空间变

量的函数,这样我们对后者

必须确定傅里叶对,即空间

频率(它是单位距离的周期数,通常称为“波数”)。和我们确定已知正弦波的时间频率一样,通过在单位距离比如1公里内,沿水平方向其波峰数来确定“倾斜同相轴”的波数。此外,同定义时间尼奎斯特频率为(1/2×采样间隔)一样,我们可以定义尼奎斯特波数为(1/2×道间距)。对图1中的所有道集,由于道距为25米,所以尼奎斯特波数为20周/千米。现在我们来计算与倾角为15毫秒/道对应的道集有关的波数。沿水平方向

其整个道集有4个满周

期,该道集空间长度为

575米,所以这一倾角为

15毫秒/道和频率为12赫

兹相联系的波数是6.95

周/千米。把这些道集映

射到时间频率—水平波

数平面上,该平面分两个

象限。规定向右下倾的同

相轴定为正倾角,向右上

倾的同相轴定为负倾角。

我们还规定所有正倾角

映射到对应正波数的右

边象限;所有负倾角映射到对应负波数的左边象限。图1中每个道集的下面就是这种频率波数平面(通常称之为f-k平面)。具有零倾角的同相轴映射到频率轴上12赫兹的一个点,零倾角相当于零波数。该脉冲幅度对应于道集中组成记录道的正弦波峰值振幅,所以,f-k平面实际上代表原道集的二维振幅谱,现在我们已经把数据由时-空域变换到频率-波数域,在数学上,这一过程由二维傅里叶变换来完成。

空间—时间(x,t)和它的博氏对(k,f)这四个变量之间,实际上存在某种关系。15毫秒/道的道集中的时差如图1所示,该时差定义为斜率dt/dx。实际上,更有用的是时差的倒数,我们称量dx/dt为水平相速度(水平相速度也是真介质速度与倾角的比)。对这个具体例子,dx/dt=600米/0.345秒=1.73千米/秒。现在让我们来计算比值f/k=(12周/秒)/(6.95周/千米)=1.73千米/秒,由此可见,在(x,t)空间沿固定相位测定的斜率

dt/dx的倒数等于倾

角为dt/dx的平面波

分量的频率与波数

之比。

现在再看图1

中的其它道集。所

有道集具有相同的

频率分量,但随其

倾角从0毫秒/道到

15毫秒/道,每个道

集沿水平方向的峰

值数增加。这就是

说,对给定的频率,

倾角愈陡,波数亦

愈大,如f-k平面上

所见那样。

图2和图3是倾角相同而频率不同的情况。把每个道集映射到f-k平面上。图2的36赫兹15毫秒/道倾角的道集之前未发现异常的情况,直到15毫秒的道集上与我们期望的实际情况相反,再也见不到正倾角了。实际上,该道集整体显示出一种“搓板”特征,确定不出倾角是正还是负。这就说明碰到了f-k平面的右边缘,也就是尼奎斯特频率。

我们继续看较高的频率分量。在48赫兹时(图3),头四个道集为右倾方向,但12毫秒/道正倾角的第五个道集实际上显示出负倾角,因此也就映射到负象限,这对于该道集本应映射到的象限来说是错误的象限。我们说,在这一频率时这个倾角分量(12毫秒/道)为空间假频,而且在这一频率时,任何倾角大于12毫秒/道的道集均出现空间假频。我们还发现,60赫兹时倾角9毫秒/道出现空间假频;

72赫兹时6毫秒/道的倾角分量刚好是出现空间假频的边缘。进而倾角分量为15毫秒/道时出现二次假频,

因为它又折回到正倾角

象限上,并以较低的倾

角出现。实际上,所有

空间假频的分量不仅映

射到错误的象限,而且

以不同于原倾角的角度

出现。

对于负倾角分量,

我们可以做同样的分

析。查看这些道集,并

确定哪些倾角分量在哪个频率出现空间假频。我们得到了一个重要的观察结果,即每个道集作为一个整体,映射成频率-波数域中的一个点,每个道集都被赋予唯一频率和波数。我们可

以研究与垂直方向呈独

特角度传播并载有单色

信号的许多平面波的这

类道集显示。波前定义为

固定相位的连线,波的传

播方向与波前垂直。因为

地震波场是许多倾角和

频率分量的叠加,所以,

实质上它相当于许多平

面波的合成。在这点上,

二维傅氏变换的物理意

义是非常重要的,因为它

是分解波场为平面波分

量的工具。

记录到的波场是许多倾角和频率分量的合成。我们可以把频率不同而倾角相同的那些道集叠加起来,这种合成的道集示于图4,它们分别对应于正倾角和负倾角以及它们的振幅谱。我们发现,对于给定的倾角,所有频率分量沿着通过原点的直线映射在f-k平面上。另外,我们观察倾角为9毫秒/道,12毫秒/道和15毫秒/道的合成道集时看出,其空间假频沿着一些直线段分布,这些线段是在振幅谱中折叠到相反的象限中去。另一个重要结论:倾角愈大,f-k域的映射线离波数轴愈近;零倾角的频率分量沿频率轴映射。到现在我们只谈了有限个数离散的频率,可以预料,如果我们有与某一倾角有关的连续的频率分量,那么它们在f-k 域中就能映射成一条连续的直线,如图5所示。(x,t)域的倾向与其在f-k域上的

映射线方向正交,这在实际工作中是很有用的法则。

现在回过头来看图1至图3中单频单倾角道集,我们知道在f-k域中它们都映射成一个点,这些同相轴的总合在f-k域中映射成一条直线,所以我们说,在(x,t)域中具有相同倾角的同相轴,不管它们的位置如何,在f-k域中都映射在一条直

线上。由这个概念我们可

以引出后面将要讨论的

f-k倾角滤波,f-k域具有

分离(x,t)域中可能是相

互干涉的各类倾斜同相

轴的功能。

二维傅里叶变换的

数值计算是一维傅氏变

换的推广,左面是变换步

骤的流程图。

空间假频

当研究f-k平面时,不可避免地要涉及到空间假频问题。实际上,这个问题对于f-k滤波和偏移多道处理的效果有着重要影响。问题在于,由于空间假频、高频陡倾角的同相轴在这些处理中将以相反的倾角出现,因此它们不能得到正确的处理。例如:我们看到,偏移会以错误的方向移动空间假频的频率分量,并产生危及偏移剖面质量的波散干扰。

怎样避免空间假频呢?现在我们提出几种避免假频的方法:

(1) 对陡倾角用线性时差使它们以较低的倾角出现,但是这可能使道集中较低倾角的成分变成较高倾角,并产生假频。所以这是很不现实的方法。

(2) 对道集应用低通滤波,这样可消除折叠到振幅负象限中的那一部分,即消除了空间假频,但这却是以牺牲记录资料中有效频率范围为代价的,因此这种方法也是不足取的。

时间序列完整教程(R)

时间序列完整教程(R) 简介 在商业应用中,时间是最重要的因素,能够提升成功率。然而绝大多数公司很难跟上时间的脚步。但是随着技术的发展,出现了很多有效的方法,能够让我们预测未来。不要担心,本文并不会讨论时间机器,讨论的都是很实用的东西。? 本文将要讨论关于预测的方法。有一种预测是跟时间相关的,而这种处理与时间相关数据的方法叫做时间序列模型。这个模型能够在与时间相关的数据中,找到一些隐藏的信息来辅助决策。? 当我们处理时间序列数据的时候,时间序列模型是非常有用的模型。大多数公司都是基于时间序列数据来分析第二年的销售量,网站流量,竞争地位和更多的东西。然而很多人并不了解时间序列分析这个领域。? 所以,如果你不了解时间序列模型。这篇文章将会向你介绍时间序列模型的处理步骤以及它的相关技术。? 本文包含的内容如下所示:? 目录? * 1、时间序列模型介绍? * 2、使用R语言来探索时间序列数据? * 3、介绍ARMA时间序列模型? * 4、ARIMA时间序列模型的框架与应用 1、时间序列模型介绍 本节包括平稳序列,随机游走,Rho系数,Dickey Fuller检验平稳性。如果这些知识你都不知道,不用担心-接下来这些概念本节都会进行详细的介绍,我敢打赌你很喜欢我的介绍的。 平稳序列 判断一个序列是不是平稳序列有三个评判标准:? 1. 均值,是与时间t 无关的常数。下图(左)满足平稳序列的条件,下图(右)很明显具有时间依赖。?

1. 方差,是与时间t 无关的常数。这个特性叫做方差齐性。下图显示了什么是方差对齐,什么不是方差对齐。(注意右图的不同分布。)? 2. 3. 协方差,只与时期间隔k有关,与时间t 无关的常数。如下图(右),可以注意到随着时间的增加,曲线变得越来越近。因此红色序列的协方差并不是恒定的。?

时间序列分析课程教学大纲

《时间序列分析》课程教学大纲 Time Series Analysis 课程代码:课程性质:专业基础理论课/必修 适用专业:统计开课学期:6 总学时数:56 总学分数:3.5 编写年月:2007.5 修订年月:2007.7 执笔:涂钰青 一、课程的性质和目的 本课程是经济学中较新的、较重要的分支,主要对依时间次序观测的数据进行统计分析。近几年随着计算机的普及发展,时间序列分析在许多领域都得到较好的应用,特别是在金融领域的应用也日益突出。学好时间序列分析已成为对金融工程专业学生的基本要求,同时也为他们今后的工作打好基础。通过该门课程的学习,要求学生能较深刻地理解时间序列的基本理论、思想和方法,掌握时间序列分析中水平指标和速度指标的计算,并根据时间序列用最小平方法配合趋势方程用以预测未来。并能应用于解决实践中遇到的问题,从而提高学生的数理金融素质,加强学生开展数学科研工作和解决实际问题金融的能力,掌握用时间序列模型进行基本实证分析的方法。 二、课程教学内容及学时分配 本课程主干内容包括:时间序列概述、时间序列的水平分析、时间序列的速度分析、时间序列的长期趋势分析和季节变动与循环变动的测定。 第一章时间序列概述(8学时) 本章内容:时间序列的概念及构成,时间序列的种类(绝对数时间序列、相对数时间序列、平均数时间序列),时间序列的编制原则(时间长短要统一、总体范围要一致、指标的 经济内容应统一、各指标的计算方法、计算价格、计量单位都应统一) 本章要求 1. 了解时间序列的概念及构成; 2. 了解绝对数时间序列、相对数时间序列和平均数时间序列; 3. 了解时间序列的编制原则。

时间序列分析第一章王燕习题解答

时间序列分析习题解答 第一章 P. 7 1.5 习题 1.1 什么是时间序列?请收集几个生活中的观察值序列。 答:按照时间的顺序把随机事件变化发展的过程记录下来就构成一个时间序列。 例1:1820—1869年每年出现的太阳黑子数目的观察值; 年份黑子数年份黑子数年份黑子数年份黑子数年份黑子数1820 16 1830 71 1840 63 1850 66 1860 96 1821 7 1831 48 1841 37 1851 64 1861 77 1822 4 1832 28 1842 24 1852 54 1862 59 1823 2 1833 8 1843 11 1853 39 1863 44 1824 8 1834 13 1844 15 1854 21 1864 47 1825 17 1835 57 1845 40 1855 7 1865 30 1826 36 1836 122 1846 62 1856 4 1866 16 1827 50 1837 138 1847 98 1857 23 1867 7 1828 62 1838 103 1848 124 1858 55 1868 37 1829 67 1839 86 1849 96 1859 94 1869 74 例2:北京市城镇居民1990—1999年每年的消费支出按照时间顺序记录下来,就构成了一个序列长度为10的消费支出时间序列(单位:亿元)。 1686,1925,2356,3027,3891,4874,5430,5796,6217,6796。 1.2 时域方法的特点是什么? 答:时域方法特点:具有理论基础扎实,操作步骤规范,分析结果易于解释的优点,是时间序列分析的主流方法。 1.3 时域方法的发展轨迹是怎样的? 答:时域方法的发展轨迹: 一.基础阶段: 1. G.U. Yule 1972年AR模型 2. G.U.Walker 1931年 MA模型、ARMA模型 二.核心阶段:G.E.P.Box和G.M.Jenkins 1. 1970年,出版《Time Series Analysis Forecasting and Control》 2. 提出ARIMA模型(Box-Jenkins模型) 3. Box-Jenkins模型实际上主要运用于单变量、同方差场合的线性模型 三.完善阶段: 1.异方差场合: a.Robert F.Engle 1982年 ARCH模型

时间序列分析期末论文 (1)

课程论文时间序列分析 题目时间序列模型在人口增长中的应用学院数学与统计学院 专业统计学 班级统计(二)班 学生殷婷 2010101217 指导教师翠霞 职称 2012 年10 月29 日

引言 人口问题是一个世界各国普遍关注的问题。人作为一种资源,主要体现在人既是生产者,又是消费者。作为生产者,人能够发挥主观能动性,加速科技进步,促进社会经济的发展;作为消费者,面对有限的自然资源,人在发展的同时却又不得不考虑人口数量的问题。我国是一个人口大国,人口数量多,增长快,人口素质低;由于人口众多,不仅造成人均资源的数量很少,而且造成住房、教育、就业等方面的很大压力。所以人口数量是社会最为关注的问题,每年新增加的国民生产总值有相当一部分被新增加的人口所抵消,从而造成社会再生产投入不足,严重影响了国民经济的可持续发展。因此,认真分析研究我国目前的人口发展现状和特点,采取切实可行的措施控制人口的高速增长,已经成为我国目前经济发展中需要解决的首要问题。 本文通过时间序列模型对人口的增长进行预测,国家制定未来人口发展目标和生育政策等有关人口政策的基础,对于国民经济计划的制定和社会战略目标的决策具有重要参考价值。人口的预测,作为经济、社会研究的需要,应用越来越广泛,也越来越受到人们的重视。在描绘未来小康社会的蓝图时,首先应要考虑的是未来中国的人口数量、结构、分布、劳动力、负担系数等等,而这又必须通过人口的预测来一一显示。人口数量在时间上的变化,可以用时间序列模型来预测其继后期的数量。 本文通过时间序列分析的方法对人口增长建立模型,取得了较好

的预测结果。时间序列分析是研究动态数据的动态结构和发展变化规律的统计方法。以1990年至2008年中国人口总数为例,用时间序列分析Eviews软件建立模型,并对人口的增长进行预测,研究时间序列模型在人口增长中的应用。 基本假设 (1) 在预测中国人口的增长趋势时,假设全国人口数量的变化是封闭的即人口的出生率和死亡率是自然变化的,而不考虑与其他国家的迁移状况; (2)在预测的年限,不会出现意外事件使人口发生很大的波动,如战争,疾病; (3) 题目数据能够代表全国的整体人数。。 问题分析 根据抽样的基本原理,预测人口增长趋势最直接的方法就是预测出人口总数的增长量,因此我们运用中华人民国国家统计局得到的1990年到2008年度总人口数据。考虑到迁移率、死亡率、出生率、年龄结构等多个因素对人口数量的影响,求解人口增长趋势的关键是如何在我们的模型中充分的利用这些影响因素从而使我们的预测结果具有较高的精确性。 研究数据:

时间序列分析 第一章 时间序列分析简介

input time monyy7. price; format time monyy5. ; cards; jan2005 101 feb2005 82 mar2005 66 apr2005 35 may2005 31 jun2005 7 ; run; proc print data=example1_1; run; 实验结果: 实验分析:该程序的到了一个名为sasuser.example1_1的永久数据集。所谓的永久数据库就是指在该库建立的数据集不会因为我们退出SAS系统而丢失,它会永久的保存在该数据库中,我们以后进入SAS系统还可以从该库中调用该数据集。 3.查看数据集 data example1_1; input time monyy7. price; format time monyy5. ; cards; jan2005 101 feb2005 82 mar2005 66 apr2005 35 may2005 31 jun2005 7 ; run; proc print data=example1_1; run; 实验结果:

2.序列变换 data example1_3; input price; logprice=log(price); time=intnx('month','01jan2005'd,_n_-1); format time monyy.; cards; 3.41 3.45 3.42 3.53 3.45 ; proc print data=example1_3; run; 实验结果: 实验分析:在时间序列分析中,我们得到的是观测值序列xt,但是需要分析的可能是这个观察值序列的某个函数变换,例如对数序列lnxt。在建立数据集时,我们可以通过简单的赋值命令实现这个变换。再该程序中,logprice=log(price);是一个简单的赋值语句,将price的对数函数值赋值给一个新的变量logprice,即建立了一个新的对数序列。 3.子集 data example1_4; set example1_3; keep time logprice; where time>='01mar2005'd; proc print data=example1_4; run; 实验结果:

时间序列分析期末考试2010B

. 浙江农林大学 2009 - 2010 学年第 二 学期考试卷(A 卷) 课程名称: 应用时间序列分析 课程类别: 必修 考试方式: 闭卷 注意事项:1、本试卷满分100分。 2、考试时间 120分钟。 一、单项选择题(在每小题的四个备选答案中,选出一个正确 答案,并将正确答案的选项填在题后的括号内。每小题2分,共12分) 1. 关于严平稳与(宽)平稳的关系,不正确的为 。 ( ) A. 严平稳序列一定是宽平稳序列 B. 当序列服从正态分布时,两种平稳性等价 C. 二阶矩存在的严平稳序列一定为宽平稳的 D. MA(p)模型一定是宽平稳的 2. 下图为某时间序列的相关检验图,图1为自相关函数图,图2为偏自相关函数图,请选择模型 。 ( ) 图1 学院: 专业班级: 姓名: 学号: 装 订 线 内 不 要 答 题

图2 A. AR(1) B. AR(2) C. MA(1) D. MA(2) 3. 下图中,图3为某序列一阶差分后的自相关函数图,图4为某序列一阶差分后的偏自相关函数图,请对原序列选择模型。( ) 图3

图4 A.ARIMA(4,1,0) B. ARIMA(0,2,1) C. ARIMA(0,1,2) D.ARI MA(0,1,4) 4. 记B 为延迟算子,则下列不正确的是 。 ( ) A. 0 1B = B. (1)k t t k t X X B X --=- C. 12t t BX X --= D. 11()t t t t B X Y X Y --±=± 5.对于平稳时间序列,下列错误的是 ( ) A.)(212εσεE = B.),(),(k t t k t t y y Cov y y Cov -+=

spss教程第四章时间序列分析

第四章时间序列分析 由于反映社会经济现象的大多数数据是按照时间顺序记录的,所以时间序列分析是研究社会经济现象的指标随时间变化的统计规律性的统计方法。.为了研究事物在不同时间的发展状况,就要分析其随时间的推移的发展趋势,预测事物在未来时间的数量变化。因此学习时间序列分析方法是非常必要的。 本章主要内容: 1. 时间序列的线图,自相关图和偏自关系图; 2. SPSS 软件的时间序列的分析方法季节变动分析。 §4.1 实验准备工作 §4.1.1 根据时间数据定义时间序列 对于一组示定义时间的时间序列数据,可以通过数据窗口的Date菜单操作,得到相应时间的时间序列。定义时间序列的具体操作方法是: 将数据按时间顺序排列,然后单击Date Define Dates打开Define Dates对话框,如图4.1所示。从左框中选择合适的时间表示方法,并且在右边时间框内定义起始点后点击OK,可以在数据库中增加时间数列。 图4.1 产生时间序列对话框 §4.1.2 绘制时间序列线图和自相关图 一、线图 线图用来反映时间序列随时间的推移的变化趋势和变化规律。下面通过例题说明线图的制作。 例题4.1:表4.1中显示的是某地1979至1982年度的汗衫背心的零售量数据。

试根据这些的数据对汗衫背心零售量进行季节分析。(参考文献[2]) 表4.1 某地背心汗衫零售量一览表单位:万件 1979 1980 1981 1982 1 23 30 18 22 2 3 3 37 20 32 3 69 59 92 102 4 91 120 139 155 5 192 311 324 372 6 348 334 343 324 7 254 270 271 290 8 122 122 193 153 9 95 70 62 77 10 34 33 27 17 11 19 23 17 37 12 27 16 13 46 解:根据表4.1的数据,建立数据文件SY-11(零售量),并对数据定义相应的时间值,使数据成为时间序列。为了分析时间序列,需要先绘制线图直观地反映时间序列的变化趋势和变化规律。具体操作如下: 1. 在数据编辑窗口单击Graphs Line,打开Line Charts对话框如图4. 2.。从中选择Simple单线图,从Date in Chart Are 栏中选择Values of individual cases,即输出的线图中横坐标显示变量中按照时间顺序排列的个体序列号,纵坐标显示时间序列的变量数据。 图4.2 Line Charts对话框 2. 单击Define,打开对话框如图4.4所示。选择分析变量进入Line Represents,,在Category Labels 类别标签(横坐标)中选择Case number数据个数(或变量年 度 月 份

eviews教程第25章时间序列截面数据模型

eviews教程第25章时间序列截面数据模型 (3) 对转换后变量使用OLS (X 包括常数项和回归 量x ) (25.12) 其中。 EViews在输出中给 出了由(3)得到的的参数估计。使用协方差矩阵的标准估计量计算 标准差。 EViews给出了随机影响的估计值。计算公式为: (25.13) 得到的是的最优线性无偏预测值。最后, EViews 给出了加权和不加权的概括统计量。加权统计量来自(3)中的 GLS 估计方程。未加权统计量来自普通模型的残差,普通模型中包括 (3)中的参数和估计随机影响: (25.14) 三、截面加权当残差具有截面异方差性和 同步不相关时最好进行截面加权回归: (25.15) EViews进行FGLS ,并且从一阶段Pool 最小 二乘回归得出。估计方差计算公式为: (25.16) 其中是OLS 的拟合值。估计系数值和协方差矩阵 由标准GLS 估计量给出。四、SUR 加权当残差具有截 面异方差性和同步相关性时,SUR 加权最小二乘是可行的GLS 估计量: (25.17) 其中是同步相关的对称阵: (25.18) 一般项,在所有的t 时为常 数。 EViews估计SUR 模型时使用的是由一阶段Pool 最小二乘回归得到: (25.19) 分母中的最大值函数是为了解决向下加权协方差项产 生的不平衡数据情况。如果缺失值的数目可渐进忽略,这种方法生成 可逆的的一致估计量。模型的参数估计和参数协方差矩阵计 算使用标准的GLS 公式。五、怀特(White )协方差估计在Pool 估计中可计算怀特的异方差性一致协方差估计(除了SUR 和 随机影响估计)。EViews 使用堆积模型计算怀特协方差矩阵: (25.20) 其中K 是估计参数总数。这种方差估计量足以解释各截面 成员产生的异方差性,但不能解释截面成员间同步相关的可能。 * * 第二十五章时间序列/截面数据模型在经典计量经济学模型 中,所利用的数据(样本观测值)的一个特征是,或者只利用时间序

《时间序列分析》课程教学大纲

《时间序列分析》课程教学大纲 课程编号:33330775课程名称:时间序列分析 课程基本情况: 1.学分:3 学时:51学时(课内学时:45 课内实验:6)2.课程性质:专业必修课 3.适用专业:统计学适用对象:本科 4.先修课程:概率论、数理统计、随机过程 5.首选教材:王燕:《应用时间序列分析》,中国人民大学出版社,2008出版。 备选教材:王振龙等编著:《时间序列分析》,中国统计出版社,2000年。 6.考核形式:闭卷考试 7.教学环境:多媒体教室及实验室 一、教学目的与要求 本课程是数理统计学的一个重要分支,先期需完成的课程有概率论、随机过程。通过本课程的学习,使学生掌握时间序列数据的分析方法,包括时间序列简介、平稳时间序列分析、时间序列分解、非平稳序列的随机分析、多元时间序列分析。利用Eviews软件进行本课程的实验教学。 二、教学内容及学时分配 课程内容及学时分配表 三、教学内容安排 第一章时间序列分析简介 【教学目的】1、了解时间序列的定义及常用分析方法;2、掌握时间序列的几个基本概念:随机过程、平稳随机过程、非平稳随机过程、自相关、记忆性。 【教学重点】时间序列的相关概念。 【教学难点】随机过程、系统自相关性。 【教学方法】课堂讲授 【教学内容】 第一节时间序列的定义 第二节时间序列分析方法 第三节时间序列分析软件EVIEWS简介

第二章时间序列的预处理 【教学目的】1、掌握平稳性检验的原理和方法;2、掌握纯随机性检验的原理和方法。【教学重点】平稳时间序列的定义及统计性质。 【教学难点】时间序列的相关统计量。 【教学方法】课堂讲授 【教学内容】 第一节平稳性检验 一、特征统计量 二、平稳时间序列的定义 三、平稳时间序列的统计性质 四、平稳时间序列的意义 五、平稳时间序列的检验 第二节纯随机性检验 一、纯随机序列的定义 二、白噪声序列的定义 三、纯随机性检验 第三章平稳时间序列序列分析 【教学目的】1、理解ARMA模型的定义及性质。2、掌握平稳序列建模方法。3、掌握平稳时间序列的预测 【教学重点】平稳时间序列建模 【教学难点】模型识别,参数估计,序列预测 【教学方法】课堂讲授与上机实验 【教学内容】 第一节方法性工具 一、差分运算 二、延迟算子 三、线性差分方程 第二节 ARMA模型的性质 一、AR模型 二、MA模型 三、ARMA模型 第三节平稳序列建模 一、建模步骤 二、样本自相关系数与偏相关系数 三、模型识别 四、参数估计 五、模型检验 六、模型优化 第四节序列预测 一、线性预测函数 二、预测方差最小原则 三、线性最小方差预测的性质 四、修正预测 第四章非平稳序列的确定性分析 【教学目的】1、理解时间序列的分解原理。2、掌握时间序列的确定因素分解、趋势分解、季节效应分解方法。3、了解时间序列综合效应分解方法。4、了解X-11过程。

时间序列分析课程设计报告

安徽建筑大学 时间序列分析课程设计报告书 院系数理学院 专业统计学 班级统计学三班 学号11207040302 姓名朱敏 指导教师俞泽鹏

基于时间序列分析的股票预测模型研究 摘要 在现代金融浪潮的推动下,越来越多的人加入到股市,进行投资行为,以期得到丰厚的回报,这极大促进了股票市场的繁荣。而在这种投资行为的背后,越来越多的投资者逐渐意识到股市预测的重要性。所谓股票预测是指:根据股票现在行情的发展情况地对未来股市发展方向以及涨跌程度的预测行为。这种预测行为只是基于假定的因素为既定的前提条件为基础的。但是在股票市场中,行情的变化与国家的宏观经济发展、法律法规的制定、公司的运营、股民的信心等等都有关联,因此所谓的预测难于准确预计。即使是证券分析师的预测也只能作为股民入市操作的一般参考意见。时间序列数据因为接受到许多偶然因素的影响,会常常表现出随机性,在统计学上称之为序列的依赖关系。时间序列分析是经济预测领域研究的重要工具之一,它描述历史数据随时间变化的规律,并用于预测经济数据。在股票市场上,时间序列预测法常用于对股票价格趋势进行预测,为投资者和股票市场管理管理方提供决策依据。本文主要介绍了时间序列分析方法的概念,性质,特点以及时间序列模型,包括建模时对数据时间序列的预处理、模型识别、参数估计、模型检验、模型优化以及模型预测等。并根据道琼斯指数对收盘价进行短期预测,通过对时间序列分析理论的实证研究分析,建立时间序列模型,说明时间序列分析的方法对于股票价格

的预测趋势有一定的参考价值。 关键词:股票,预测,时间序列分析,AR(1 )模型 ABSTRACT In the modern financial wave, more and more people join the stock market to invest, expecting to get rich return, which has greatly promoted the stock market’s prosperity. While under this behavior, an increasing large number of people become to realize the importance of stock forecast. The so-called stock forecast is defined: with the help of the stock’s recent condition, we’ll predict the future stock’s development, including its later development directions and fluctuations. This prediction based on the assumption of behavior is the prerequisite for established factor basis. But the stock’s index is always changing with the country’s macroeconomic development, the formulation of laws and regulations, the company’s operations, the confidence of investors and so on, which results in that it is very difficult to accurately predict. Even securities analysts’forecast results can only be operated as a general reference. Time-series data often show some kinds of randomness and dependence between each other because of the influence of various accidental factors. Time series analysis is one of the most important tools for economy research, and it describe the variation of data with time, and used to forecast economic data.Time series analysis is often used to predict the stock price, which provides decision-making basis for investors and the stock market managers. This thesis mainly introduces time series analysis theory, including its notion, character as well as the expression and description of some models derived from it ,including method of data simulation, method of parameter estimation and method of testing degree of fitting and arrange them by the numbers. And according to the Dow Jones

最新地震处理教程——1 第一章 时间序列分析基础

第一章时间序列分析基础 一维傅里叶变换 首先观察一个实验。将弹簧的一端固定并悬垂,另一端挂一重物。向下拉重物使弹簧拉伸某一距离,比如说0.8个单位,使其振动。现假定弹簧是弹性的,那么它将无休止地上下运动。若将运动起始的平衡位置定为时间零,那么重物的位移量将随着时间函数在极限[+0.8—-0.8]之间变化。如果有一装置能给出位移振幅随时间函数变化的轨迹,就会得到一条正弦波曲线。其相邻两峰值间的时间间隔为0.08秒(80毫秒)。我们称它为弹簧的周期,它取决于所测弹簧刚度的弹性常数。我们说弹簧在一个周期时间内完成了一次上下振动。在1秒的观测时间内记下其周期数,我们发现是12.5周,这个数被称为弹簧振动的频率。你一定会注意到,1/0.08=12.5,这就是说频率为周期的倒数。 我们取另一个刚性较大的弹簧,并重复上面的实验。不过这次弹簧的振幅峰值位移为0.4个单位。它的运动轨迹所显示的是另一条正弦曲线。量其周期和频率分别为0.04秒和25周/秒,为了记下这些测量结果,我们做每个弹簧峰值振幅与频率的关系图,这便是振幅谱。 现在取两个相同的弹簧。一个弹簧从0.8个单位的峰值振幅位移开始松开,并使其振动。这时注意弹簧通过零时平衡位置的时间,就在它通过零时的一刹那,请你将另一弹簧从0.8个单位的同样峰值振幅位移处松开。这样由于起始的最大振幅相同,所以两个正弦时间函数的振幅谱也应该一样。但肯定两者之间是有差别的,特别是当第1个正弦波达到峰值振幅时,另一个的振幅为零。两者的区别为:第2个弹簧的运动相对于第1个弹簧的运动有一个等于四分之一周期的时间延迟。四分之一周期的时间延迟等于90°相位滞后。所以除振幅谱之外,我们还可以作出相位延迟谱,至此,这个实验做完了。那么我们学到了什么呢?这就是弹簧的弹性运动可以用正弦时间函数来描述,更重要的是,可以用正弦波的频率、峰值振幅及相位延迟来全面地描述正弦波运动。这个实验告诉我们弹簧的振动是怎样随时间和频率函数变化的。 现在设想有一组弹簧,每个弹簧的正弦运动都具有特定的频率、峰值振幅和相位延迟。所有弹簧的正弦响应如图1所示。我们可以把该系统的运动“合成”为一个总的波动,来代替该组中的各单个分量的运动。这一合成是直接把所有记录道相加,其结果得到一个与时间相关的信号,在图1中由第一道表示。我们通过这种合成可以把这一运动由频率域变换到时间域。这一变换是可逆的:即给定时间域信号,我们可以把它变换到频率域的正弦分量。在数学上,这种双向过程是由傅里叶变换完成的。在实际应用中,标准的运算是所谓快速傅氏变换。通过傅氏正变换可以把与时间相关的信号分解成它的频率分量,而所有的频率分量合成为时间域信号又是通过反傅氏变换来实现的。图2概括了信号的傅氏变换。振幅谱和相位谱(严格地讲是相位延迟谱)是图1中所显示的正弦波最简单的表示形

课程教学大纲_时间序列分析

《时间序列分析》教学大纲 课程编号:120403B 课程类型:□通识教育必修课□通识教育选修课 □√专业必修课□专业选修课 □学科基础课 总学时:48 讲课学时:32实验(上机)学时:16 学分:3 适用对象:统计学、经济统计学 先修课程:概率论、数理统计 毕业要求: 1.应用专业知识,解决数据分析问题 2.可以建立统计模型,获得有效结论 3.掌握统计软件及常用数据库工具的使用 4.关注国际统计应用的新进展 5.基于数据结论,提出决策咨询建议 6.具有不断学习的意识 7.扎实的数学基础和完整的统计知识体系 8.计算机编程技能与经济学基本常识 9.解决实际问题的能力,具有获取新知识的能力和创新意识 一、课程的教学目标 时间序列分析是一种根据动态数据特征揭示系统动态结构和规律的统计方法,是统计学的一个分支。通过本课程的学习让学生掌握时间序列分析的基本原理、方法、模型,重点培养学生运用相关软件包进行经济金融学定量实证分析的能力,为以后的理论应用研究打下坚实的基础。本课程要求学生掌握时间序列分

析的基本概念和模型,掌握用时间序列模型进行基本实证分析的方法。 二、教学基本要求 1. 对教学内容讲授上的要求 本课程重点讲授平稳时间序列模型的性质和建模方法,对于平稳时间序列模型的定义、平稳时间序列的类型、平稳时间序列的自协方差函数和自相关函数、平稳时间序列的性质、平稳时间序列建模中参数估计方法和白噪声检验等内容应细将、精讲,对于这些内容要结合大量案例和统计软件,使学生做到理论与实践的有机结合;其他内容应粗讲。 2. 对拟实现的教学目标所采取的教学方法、教学手段 教学方法以教师讲授为主,辅以大量的上机模拟,教学手段多样化。 3. 课程的考核方式 本课程采用上机作业和模型设计方式进行考核,其中上机练习占50%,模型设计占30%,平时考勤和作业占20%。 三、各教学环节学时分配 以表格方式表现各章节的学时分配,表格如下:(宋体,小四号字)

时间序列分析基于R——习题答案

第一章习题答案 略 第二章习题答案 2.1 (1)非平稳 (2)0.0173 0.700 0.412 0.148 -0.079 -0.258 -0.376 (3)典型的具有单调趋势的时间序列样本自相关图 2.2 (1)非平稳,时序图如下 (2)-(3)样本自相关系数及自相关图如下:典型的同时具有周期和趋势序列的样本自相关图

2.3 (1)自相关系数为:0.2023 0.013 0.042 -0.043 -0.179 -0.251 -0.094 0.0248 -0.068 -0.072 0.014 0.109 0.217 0.316 0.0070 -0.025 0.075 -0.141 -0.204 -0.245 0.066 0.0062 -0.139 -0.034 0.206 -0.010 0.080 0.118 (2)平稳序列 (3)白噪声序列 2.4 ,序列LB=4.83,LB统计量对应的分位点为0.9634,P值为0.0363。显著性水平=0.05 不能视为纯随机序列。 2.5 (1)时序图与样本自相关图如下

(2) 非平稳 (3)非纯随机 2.6 (1)平稳,非纯随机序列(拟合模型参考:ARMA(1,2)) (2)差分序列平稳,非纯随机 第三章习题答案 3.1 ()0t E x =,2 1 () 1.9610.7 t Var x ==-,220.70.49ρ==,220φ= 3.2 1715φ=,2115 φ= 3.3 ()0t E x =,10.15 () 1.98(10.15)(10.80.15)(10.80.15) t Var x += =--+++ 10.8 0.7010.15 ρ= =+,210.80.150.41ρρ=-=,3210.80.150.22ρρρ=-= 1110.70φρ==,2220.15φφ==-,330φ= 3.4 10c -<<, 1121,1,2 k k k c c k ρρρρ--?=? -??=+≥? 3.5 证明: 该序列的特征方程为:32 - -c 0c λλλ+=,解该特征方程得三个特征根: 11λ=,2λ=3λ=

应用时间序列分析课程论文

应用时间序列分析课程论文 班级:13应用统计1班学号:20133695 姓名:彭鹏 学习了本学期的应用时间序列分析课程内容,学习了使用EVIEWS软件对平稳时间序列的平稳性进行分析,学习平稳时间序列模型的建立、学会根据自相关系数和偏自相关系数判断ARMA模型的阶数p 和q,学会利用信息准则对估计的ARMA模型进行诊断,以及掌握利用ARMA模型进行预测。 在统计研究中,有大量的数据是按照时间顺序排列的,用数学方法来表述就是使用一组随机序列表示随机事件的时间序列即为{Xt} 通常的ARMR建模过程,B-J方法具体步骤如下: 一、对时间序列进行特性分析。从随机性、平稳性、季节性考虑。 对于一个非平稳时间序列,若要建模首先将其平稳化,其方法 有三种: 1差分,一些序列可以通过差分使其平稳化。 2季节差分,如果序列具有周期波动特点,为了消除周期波动 的影响,通常引用季节差分。 3函数变换与差分结合运用,某些序列如果具有某类函数趋势,我们可以先引入某种函数变换将序列转化为线性趋势,然后再 进行差分以消除线性趋势。 二、模型识别与建立。模型识别和模型定阶。 三、模型的评价,并利用模型进行评价。

下面从网上搜寻数据,1949-2014年城镇人口数(单位万人,其中有些年份缺失数据,数据来源于中国统计年鉴)。进行处理分析 绘制序列时序图有看来有明显增长趋势为非平稳序列,进行一阶差分y=d(r): 由图得出序列y仍然非平稳

1.对原序列进行二阶差分z=d(r,2) 相关图检 验:序列z为平稳序列,进行单位根检验: 稳序列。有相关图看出为非白噪声序列。

可见均值非零;在原序列上生成0均值序列在输入x=z-28.59184 得到序列x为0均值的平稳非白噪声序列 由相关图看出自相关系数一阶截尾,考虑MA(1)模型

时间序列分析课程教学大纲

《时间序列分析》(双语)课程教学大纲 (2001年制订,2004年修订) 课程编号:060063 英文名:Time Series Analysis 课程类别:统计学专业选修课 前置课:线性代数、概率论与数理统计、计算机基础 后置课: 学分:2学分 课时:36课时(其中实验课12课时) 主讲教师:王芳 选定教材:易丹辉,数据分析与Eviews应用,北京:中国统计出版社,2002 自编英文讲义 课程概述: 时间序列分析是一门实用性极强的课程,是进行科学研究的一项重要工具。近年来,时序分析已普遍应用于工农业生产、科学技术和社会经济生活的许多领域。本课程着重介绍平稳时间序列数据的分析、建模及预测,如AR,MA和ARMA三个模型,并且针对非平稳时间序列,介绍其平稳化的一些方法及建模方法,如ARIMA模型等。 教学目的: 本课程的教学,目的在于让学生能从数量上揭示某一现象的发展变化规律或从动态的角度刻划某一现象与其他现象之间的内在数量关系及其变化规律性,达到认识客观世界之目的。具体来说是使得学生能分析时间序列的统计规律性,构造拟合它的最佳数学模型,浓缩时间序列的信息,简化对时间序列的表示,给出预报结果的精度分析;使学生掌握时间序列的基本概念以及时序的分类,学会对具体时序的分析步骤与建模方法,进而掌握如何判断已建立模型与原来数据的适应性及对未来值的预报。 教学方法: 采取理论讲授、课堂讨论、上机实习及课下收集相关资料的方式。理论课采用多媒体教学,有效的利用课堂时间,要求学生上机完成作业。由于本课程重在要求学生能利用所学的方法来分析实际经济问题,所以鼓励学生收集与本课程有关的期刊论文,从中学习如何利用数据结果来分析问题。本课程课堂讲授34学时。每章应布置2-4道思考题,并根据具体

时间序列分析教程

3.3时间序列分析 3.3.1时间序列概述 1.基本概念 (1)一般概念:系统中某一变量的观测值按时间顺序(时间间隔相同)排列成一 个数值序列,展示研究对象在一定时期内的变动过程,从中寻找 和分析事物的变化特征、发展趋势和规律。它是系统中某一变量 受其它各种因素影响的总结果。 (2)研究实质:通过处理预测目标本身的时间序列数据,获得事物随时间过程的 演变特性与规律,进而预测事物的未来发展。它不研究事物之间 相互依存的因果关系。 (3)假设基础:惯性原则。即在一定条件下,被预测事物的过去变化趋势会延续 到未来。暗示着历史数据存在着某些信息,利用它们可以解释与 预测时间序列的现在和未来。 近大远小原理(时间越近的数据影响力越大)和无季节性、无趋 势性、线性、常数方差等。 (4)研究意义:许多经济、金融、商业等方面的数据都是时间序列数据。 时间序列的预测和评估技术相对完善,其预测情景相对明确。 尤其关注预测目标可用数据的数量和质量,即时间序列的长度和 预测的频率。 2.变动特点 (1)趋势性:某个变量随着时间进展或自变量变化,呈现一种比较缓慢而长期的 持续上升、下降、停留的同性质变动趋向,但变动幅度可能不等。 (2)周期性:某因素由于外部影响随着自然季节的交替出现高峰与低谷的规律。 (3)随机性:个别为随机变动,整体呈统计规律。 (4)综合性:实际变化情况一般是几种变动的叠加或组合。预测时一般设法过滤 除去不规则变动,突出反映趋势性和周期性变动。 3.特征识别 认识时间序列所具有的变动特征,以便在系统预测时选择采用不同的方法。(1)随机性:均匀分布、无规则分布,可能符合某统计分布。(用因变量的散点图 和直方图及其包含的正态分布检验随机性,大多数服从正态分布。) (2)平稳性:样本序列的自相关函数在某一固定水平线附近摆动,即方差和数学 期望稳定为常数。 样本序列的自相关函数只是时间间隔的函数,与时间起点无关。其 具有对称性,能反映平稳序列的周期性变化。 特征识别利用自相关函数ACF:ρ k =γ k /γ 其中γ k 是y t 的k阶自协方差,且ρ =1、-1<ρ k <1。 平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋 近于0,前者测度当前序列与先前序列之间简单和常规的相关程度,后者是在控制其它先前序列的影响后,测度当前序列与某一先前序列之间的相关程度。

时间序列分析课程设计(最终版)

《时间序列分析》 课程设计报告 学院 专业 姓名 学号 评语: 分数 二○一二年十一月

目录 1.平稳序列分析(选用数据:国内工业同比增长率)-------------------------3 1.1 序列分析--------------------------------------------------------------3 1.2 附录(程序代码)------------------------------------------------------7 2.非平稳序列分析I(选用数据:国家财政预算支出)-------------------------8 2.1 使用ARIMA进行拟合-------------------------------------------------8 2.2 使用残差自回归进行拟合---------------------------------------------11 2.3 附录(程序代码)-----------------------------------------------------12 3.非平稳序列分析II(选用数据:美国月度进出口额)------------------------13 3.1序列分析--------------------------------------------------------------13 3.2附录(程序代码)------------------------------------------------------18

一、平稳序列分析(选用数据:国内工业同比增长率,2005年01月-2012年5月)绘制时序图 rate 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 01JAN0501JUL0501JAN0601JUL0601JAN0701JUL0701JAN0801JUL0801JAN0901JUL0901JAN1001JUL1001JAN1101JUL1101JAN1201JUL12 time 图1-1 国内工业月度同比增长率序列时序图 的趋势以及周期性,波动稳定,可以初步判定为平稳序列。下面进一步考察序列的自相关图。 图1-2 国内工业月度同比增长率序列的样本自相关图 认为该序列平稳。下面对序列进行白噪声检验。

时间序列分析考试卷及答案(推荐文档)

考核课程 时间序列分析(B 卷) 考核方式 闭卷 考核时间 120 分钟 注:B 为延迟算子,使得1-=t t Y BY ;?为差分算子,。 一、单项选择题(每小题3 分,共24 分。) 1. 若零均值平稳序列{}t X ,其样本ACF 和样本PACF 都呈现拖尾性,则对{}t X 可能建立( B )模型。 A. MA(2) B.ARMA(1,1) C.AR(2) D.MA(1) 2.下图是某时间序列的样本偏自相关函数图,则恰当的模型是( B )。 A. )1(MA B.)1(AR C.)1,1(ARMA D.)2(MA 3. 考虑MA(2)模型212.09.0--+-=t t t t e e e Y ,则其MA 特征方程的根是( C )。 (A )5.0,4.021==λλ (B )5.0,4.021-=-=λλ (C )5.2221==λλ, (D ) 5.2221=-=λλ, 4. 设有模型112111)1(----=++-t t t t t e e X X X θφφ,其中11<φ,则该模型属于( B )。 A.ARMA(2,1) B.ARIMA(1,1,1) C.ARIMA(0,1,1) D.ARIMA(1,2,1) 5. AR(2)模型t t t t e Y Y Y +-=--215.04.0,其中64.0)(=t e Var ,则=)(t t e Y E ( B )。 A.0 B.64.0 C. 1 6.0 D. 2.0 6.对于一阶滑动平均模型MA(1): 15.0--=t t t e e Y ,则其一阶自相关函数为( C )。 A.5.0- B. 25.0 C. 4.0- D. 8.0 7. 若零均值平稳序列{}t X ?,其样本ACF 呈现二阶截尾性,其样本PACF 呈现拖尾性,则可初步认为对{}t X 应该建立( B )模型。 A. MA(2) B.)2,1(IMA C.)1,2(ARI D.ARIMA(2,1,2) 8. 记?为差分算子,则下列不正确的是( C )。 A. 12-?-?=?t t t Y Y Y B. 212 2--+-=?t t t t Y Y Y Y C. k t t t k Y Y Y --=? D. t t t t Y X Y X ?+?=+?) ( 二、填空题(每题3分,共24分);

相关主题
文本预览
相关文档 最新文档