时间序列分析与动态数据建模
- 格式:doc
- 大小:1.30 MB
- 文档页数:25
时间序列、动态计量与非平稳性时间序列分析是一种研究时间上观测到的数据的方法,它通常用来预测未来的数据走势,或者揭示数据背后的规律和模式。
时间序列分析的基本假设是数据是按照时间顺序收集和记录的,因此数据中的观测值之间存在一定的内在关联。
动态计量是时间序列分析的一种方法,它关注变量之间的相互影响和动态调整过程。
动态计量的核心思想是当前时刻的变量取值受到过去时刻的变量取值的影响,而且这种影响是不断调整和改变的。
动态计量模型通常使用回归分析、向量自回归(VAR)模型、脉冲响应分析等方法,来研究变量之间的时序关系和相互作用。
然而,时间序列和动态计量在实际应用中都面临一个重要的问题,那就是非平稳性。
非平稳性是指时间序列数据在整个时间范围内存在明显的长期趋势、季节性变化、周期性波动等,这会导致时间序列的统计性质发生变化,使得传统的时间序列模型无法有效地拟合和预测数据。
非平稳性在金融、经济学、气象学等领域中普遍存在,因此如何处理非平稳性是时间序列分析的重要课题。
为了处理非平稳性,可以使用一系列的技术,如差分、变换、季节调整和模型拟合等。
其中,差分是最常见的一种方法,它通过计算相邻时刻的观测值之间的差异,来消除数据中的趋势和季节性变化。
变换则是将原始数据进行数学变换,如对数变换、平方根变换等,以改变数据的统计性质。
季节调整是将季节性因素从数据中剔除,以便更好地研究数据的长期趋势。
而模型拟合则是利用时间序列模型来拟合和预测非平稳数据,如自回归移动平均模型(ARMA)、自回归积分移动平均模型(ARIMA)等。
非平稳性的处理不仅能够改善模型的拟合效果,还能够提高模型的预测准确性和可解释性。
通过去除非平稳性的影响,我们可以更好地理解数据的本质和规律,更准确地进行预测和决策。
对于金融市场而言,处理非平稳性可以帮助投资者更好地判断市场趋势和价值,从而制定更科学和有效的投资策略。
总之,时间序列、动态计量和非平稳性是现代统计学中重要的研究领域。
第五讲传统时间序列分析与动态时间序列模型传统时间序列分析和动态时间序列模型是时间序列分析中的两个重要领域,本文将分别介绍这两个领域的基本概念和主要方法。
传统时间序列分析是指对时间序列数据进行统计建模和分析的方法。
时间序列数据是按照时间顺序排列的一连串观测值,常见的时间序列数据包括自然灾害的发生次数、股票价格的变动、销售额的波动等。
传统时间序列分析主要通过观察数据的规律和趋势,构建数学模型,预测未来的发展趋势。
在传统时间序列分析中,常见的方法包括平稳性检验、自相关函数和偏自相关函数分析、移动平均和自回归模型、季节性调整和趋势分析等。
首先,平稳性检验是检验时间序列数据是否具有平稳性的重要步骤。
平稳性是指时间序列数据在任意时刻的统计特性都是稳定的,即均值和方差不随时间变化。
如果时间序列数据不具备平稳性,就需要进行差分变换等处理使其满足平稳性要求。
然后,自相关函数和偏自相关函数分析可以帮助判断时间序列数据是否存在自相关性,即观测值之间的相关性。
移动平均和自回归模型是传统时间序列分析中常用的模型。
移动平均模型是通过对时间序列数据进行滑动平均计算,来得到预测值。
自回归模型则是根据时间序列数据的过去值来预测未来值。
季节性调整和趋势分析可以帮助分析时间序列数据中的季节性和长期趋势。
与传统时间序列分析不同,动态时间序列模型是一类建立在时间序列数据上的动态系统模型。
它基于时间序列数据的动态性质,考虑了时间序列数据的变化趋势和波动性,并能够利用过去的观测值来预测未来的观测值。
动态时间序列模型可以通过参数估计和模型检验来选择最优的模型。
常见的动态时间序列模型包括ARIMA模型、GARCH模型和VAR模型等。
ARIMA模型是自回归移动平均自回归模型的简称,它是一种以时间序列数据的自相关和移动平均为基础的模型。
GARCH模型是广义自回归条件异方差模型,它主要用于对时间序列数据的波动性进行建模。
VAR模型是向量自回归模型,它可以用来同时预测多个相关联的时间序列数据。
第4章统计学动态分析方法4.1引言统计学是一门应用数学的学科,它研究如何收集、分析和解释数据。
在实际应用中,我们往往需要对数据的变化进行动态分析,以了解其趋势和规律。
本章介绍了几种常见的统计学动态分析方法,包括时间序列分析、动态因子分析和波动率模型。
4.2时间序列分析时间序列是按时间顺序排列的一系列观察值。
时间序列分析是通过对时间序列数据进行建模和分析,来研究其内在的规律和趋势。
常用的时间序列分析方法包括趋势分析、季节性分析和周期性分析。
趋势分析是通过拟合一条线性或非线性的趋势线,来描述时间序列数据的总体变化趋势。
拟合趋势线的常见方法包括移动平均法、指数平滑法和多项式拟合法。
季节性分析是用来研究时间序列数据在不同季节性因素下的变化规律。
常用的季节性分析方法包括季节指数法和ARIMA模型。
周期性分析是用来研究时间序列数据在长期周期因素下的变化规律。
常用的周期性分析方法包括傅里叶分析和周期图法。
4.3动态因子分析动态因子分析是一种用于研究多个变量之间的相关性和因果关系的统计分析方法。
它建立在因子分析的基础上,通过引入时间维度,将因子模型扩展为动态因子模型。
在动态因子分析中,变量和因子都是时间相关的。
通过对观测变量的因子载荷和因子的权重进行估计,可以得到动态因子模型的参数。
然后,可以利用动态因子模型来预测未来的变量值,从而进行动态的数据分析。
动态因子分析可以应用于各种领域,例如经济学中的宏观经济因子分析、金融学中的股票市场因子分析等。
它可以帮助我们了解变量之间的关系和变化趋势,从而做出更准确的预测和决策。
4.4波动率模型波动率是指价格或收益率在一段时间内的变化幅度。
波动率模型是用来研究和预测金融市场波动率的统计模型。
常用的波动率模型包括ARCH 模型、GARCH模型和EGARCH模型等。
ARCH模型是自回归条件异方差模型,它假设波动率是过去一段时间内的观测值的函数。
GARCH模型是ARCH模型的一种扩展,它引入了过去的波动率数据,以更好地捕捉波动率的动态特性。
数据分析中的时间序列方法与模型随着大数据时代的到来,数据分析在各个领域中扮演着越来越重要的角色。
而时间序列分析作为数据分析的一种重要方法和模型,被广泛应用于金融、经济、气象、交通等领域。
本文将介绍时间序列分析的基本概念、常用方法和模型,并探讨其在实际应用中的意义和局限性。
一、时间序列分析的基本概念时间序列是指按时间顺序排列的一系列数据点的集合。
时间序列分析旨在通过对时间序列数据的观察和建模,揭示其中存在的模式、趋势和周期性,并对未来的数据进行预测和预测。
二、时间序列分析的常用方法1. 描述性分析:通过绘制时间序列图、计算均值和方差等统计指标来描述时间序列数据的特征和变化趋势。
2. 平稳性检验:平稳性是进行时间序列分析的基本假设之一。
常用的平稳性检验方法有ADF检验、KPSS检验等。
3. 自相关函数和偏自相关函数:自相关函数(ACF)和偏自相关函数(PACF)可以帮助我们判断时间序列数据是否存在自相关性,并确定适合的模型。
4. 白噪声检验:白噪声是指时间序列数据中的残差项之间没有相关性。
通过对残差进行白噪声检验,可以验证模型是否合适。
5. 模型选择与建模:根据数据的特点和目标,选择适合的时间序列模型。
常用的模型包括ARIMA模型、ARCH/GARCH模型、指数平滑模型等。
6. 模型诊断与验证:对建立的模型进行诊断和验证,检查残差是否符合正态分布、是否存在异方差等问题。
三、时间序列模型的应用时间序列分析在实际应用中广泛用于以下领域:1. 经济学:时间序列模型可以帮助分析宏观经济变量的走势和周期性,为经济政策制定者提供决策依据。
2. 金融学:时间序列模型可以用于股票价格预测、波动率估计和风险管理等金融领域的问题。
3. 生态学:时间序列模型可以用于分析动态生态系统的变化趋势和周期性,提供环境保护和资源管理的决策支持。
4. 气象学:时间序列模型可以用于天气预测、气候模拟和环境监测等气象领域的问题。
5. 物流和交通:时间序列模型可以用于交通流量预测、供应链管理和物流规划等领域。
数学建模有哪些方法
数学建模是指将实际问题用数学的方法进行描述和分析的过程。
常见的数学建模方法有以下几种:
1. 形式化建模:将实际问题抽象成数学模型,通过符号和公式的形式进行描述和求解。
2. 统计建模:利用统计学的方法对数据进行收集、整理和分析,从中提取规律和模式,对未知的情况进行预测和决策。
3. 数值模拟:利用计算机和数值方法对问题进行模拟和求解,通过近似计算得到结果。
4. 最优化建模:通过建立优化模型,寻找使目标函数达到最大或最小值的最优解。
5. 离散建模:将连续的问题离散化,转化为离散的数学模型进行分析和求解。
6. 动态建模:对问题进行时间序列的分析和建模,预测未来的变化和趋势。
7. 图论建模:将问题抽象成图的形式,利用图的相关理论和算法进行分析和求解。
8. 概率建模:利用概率论的方法对问题进行建模和分析,从中推断出一些未知的情况。
以上是一些常见的数学建模方法,具体的方法选择要根据实际问题的特点和要求进行判断和决策。
生命科学中的时间序列数据分析方法随着生命科学研究的深入,越来越多的实验数据被收集和存储下来。
这些数据通常是在一段时间内进行收集并记录下来的。
由此,时间序列数据成为生命科学领域中数据分析研究的重要内容。
时间序列数据分析方法是科学家们应对这种大量生命科学数据的一个必备工具。
时间序列数据分析方法可以帮助科学家们从大量的数据中分辨出有用的信息。
比如,生命科学领域中的一些实验需要大量的数据来观察细胞、物种、环境等的变化。
这些变化通常是随时间发生的。
例如,在细胞实验中,可以观察到细胞的生长速度、细胞质的变化等等。
所有这些数据都可以被视为时间序列数据。
然后,通过时间序列数据分析方法,科学家们可以发现其中变化的规律性,从而为生物学、生态学、环境科学等研究提供支持。
时间序列数据分析方法已经在各种生命科学领域中应用。
例如,在生态学中,时间序列数据可以被使用来预测种群动态、物种的遗传变异等等。
在医学中,时间序列数据可以被用来分析病人的电生理、生化数据等。
不同的分析方法可以被使用来处理时间序列数据。
第一种方法是采用频谱分析法。
这种方法将时间序列数据转化为频谱数据(幅度和相位),然后分析序列中的频率。
采用这种方法,科学家们可以了解样本中其中的周期性、频率和振幅分布情况。
然而,这种方法只适用于具有规律性和周期性的数据。
另外,采用频谱分析法分析大量数据时,需要较长的计算时间。
第二种方法是使用自回归模型。
这种方法使用时间序列数据中先前时间点的信息来预测未来的值。
在预测时,较早的时间点数据对未来的预测值的贡献相对较小,而较近的时间点数据则贡献较大。
自回归模型适合预测没有规律性但是有自相似性的数据。
不过,这种方法只能处理相对较小数据集,以达到高准确性的预测结果和较短的计算时间。
第三种方法是使用市场模型。
市场模型是用来预测时间序列数据的变化范围和分布情况的。
市场模型可以建模样本间的关系,提供市场呼吸动态中的均值、方差和协方差等。
通常情况下,这种方法用于预测有随机性但是有序的数据。
时序预测中的多变量预测方法分享时序预测是指通过历史数据分析,预测未来一段时间内的数据趋势或变化规律。
在实际应用中,我们往往会遇到多变量的时序预测问题,即需要同时考虑多个变量的变化趋势。
本文将分享一些常用的多变量预测方法,希望能够为相关领域的研究者和从业者提供一些参考。
1. 多元时间序列模型多元时间序列模型是一种常见的多变量预测方法,它能够考虑多个变量之间的相互影响和相关性。
其中,VAR(Vector Autoregression)模型是一种经典的多元时间序列模型,在金融、经济学等领域得到了广泛的应用。
VAR模型假设各个变量之间存在线性关系,通过考虑各个变量之间的滞后效应,能够有效地捕捉它们之间的相互作用。
另外,VAR模型还可以通过引入外生变量,扩展为VARX模型,从而更好地适用于实际问题。
通过对VAR模型的参数估计和预测,我们能够得到多个变量在未来时期的预测结果,从而为决策提供参考依据。
2. 因果关系分析在多变量预测中,我们往往需要考虑各个变量之间的因果关系。
Granger 因果关系检验是一种常用的方法,它通过检验一个变量是否能够对另一个变量的变化提供有效的预测,来判断它们之间的因果关系。
如果一个变量能够显著地提高对另一个变量的预测准确性,那么我们就可以认为这两个变量之间存在因果关系。
通过对因果关系的分析,我们能够更好地理解多变量之间的相互作用,从而选择合适的变量进行预测建模。
此外,因果关系的分析还能够帮助我们发现隐藏在数据背后的规律和机制,为实际问题的解决提供更深层次的指导。
3. 动态因子模型动态因子模型是一种基于主成分分析的多变量预测方法,它能够通过提取多个变量共同的信息,来进行预测建模。
在动态因子模型中,我们假设观测数据是由潜在因子和特殊因子的线性组合得到的,通过对潜在因子和特殊因子的估计,我们能够得到对未来时期的预测。
动态因子模型在处理高维数据和大样本数据时具有一定的优势,它能够有效地减少变量之间的相关性,提高预测的准确性。
计算机财务管理财务建模方法与技术财务建模方法与技术主要包括数学建模技术、统计分析技术和计算机技术等。
一、数学建模技术(一)线性规划模型:线性规划模型是指在一定的约束条件下,利用线性方程组来表达财务问题的优化目标,并通过计算机技术求解最优解。
线性规划模型可以应用于财务决策中的资金分配、项目投资等问题。
(二)整数规划模型:整数规划模型是在线性规划模型基础上添加整数约束条件,即决策变量必须是整数的一类优化模型。
整数规划模型可以应用于财务决策中的生产计划、库存管理等问题。
(三)动态规划模型:动态规划模型是一种将多阶段决策问题转化为一系列子问题,并通过递归的方式求解的优化模型。
动态规划模型可以应用于财务决策中的投资组合优化、资产负债管理等问题。
二、统计分析技术(一)回归分析:回归分析是一种通过建立数学模型来研究变量之间关系的统计分析方法。
在财务建模中,回归分析可以应用于财务指标与经济变量之间的关系分析和预测。
(二)时间序列分析:时间序列分析是一种通过对时间序列数据进行建模和分析来研究变量随时间变化的规律的统计分析方法。
在财务建模中,时间序列分析可以应用于股票价格预测、汇率变动分析等问题。
(三)假设检验:假设检验是通过对样本数据进行统计分析,来对总体参数进行推断的一种统计方法。
在财务建模中,假设检验可以应用于财务数据的可靠性评估和决策结果的显著性检验。
三、计算机技术(一)数据挖掘技术:数据挖掘是利用计算机技术从大量的数据中提取有用的模式和信息的一种技术。
在财务建模中,数据挖掘技术可以应用于财务数据的分类、聚类、关联规则挖掘等分析工作。
(二)人工神经网络:人工神经网络是一种模拟脑神经元结构和功能的计算模型,通过训练神经网络来实现对数据的分类和预测。
在财务建模中,人工神经网络可以应用于财务数据的风险评估、信用评级等问题。
(三)决策支持系统:决策支持系统是一种利用计算机技术和模型方法来帮助决策者进行决策的信息系统。
动态系统的建模与分析方法动态系统是由一组相互作用的元素所组成的,其特点是随时间的推移而变化,常常被用来描述现实世界中复杂的自然现象和社会现象。
例如,经济模型、气候模型、生态模型、交通模型等等。
为了对这些复杂的现象进行理解和预测,需要对动态系统进行建模和分析。
本文将介绍动态系统的建模和分析方法。
一、动态系统的基本概念在开始介绍建模和分析方法之前,首先需要了解一些动态系统的基本概念。
1.状态和状态变量:状态是指动态系统所处的状态,其通常由一组状态变量描述。
例如,气候模型中的状态变量可以包括气温、湿度、风速等。
2.状态空间:状态空间是指所有可能的状态所组成的空间,通常由状态变量的取值范围定义。
3.状态转移:状态转移是指系统从一种状态转移到另一种状态的过程,通常由状态转移函数描述。
例如,气候模型中的状态转移函数可以描述气温、湿度、风速等如何随时间变化。
4.控制变量:控制变量是指可以对系统进行控制的变量,其值可以由外部因素所决定。
例如,气候模型中的控制变量可以包括太阳辐射、海洋表面温度等。
二、建模方法建模是指将现实世界中的动态系统抽象为一个数学模型,以便于对其进行定量分析和预测。
动态系统的建模方法可以分为以下几种。
1.微分方程法微分方程法是最常用的动态系统建模方法之一。
它将动态系统的状态描述为一个或一组关于时间的微分方程,以描述状态随时间的演化规律。
例如,经济学家常常使用微分方程来描述物价的变化,生态学家则使用微分方程来描述生态系统中物种的数量变化。
2.差分方程法差分方程法是一种离散化的建模方法,它将动态系统的状态描述为一个或一组关于时间序列的差分方程,以描述状态随时间的变化规律。
例如,交通规划师可以使用差分方程来描述道路网络中车辆数量和速度的变化规律。
3.系统动力学法系统动力学法是一种基于不同元素之间的相互作用和反馈机制来描述系统行为的建模方法,通常涉及到决策制定和政策评估等问题。
使用系统动力学法建立的模型可以用来预测政策改变或新政策的影响。
第五章目录第五章极大熵谱估计 (1)5.1 谱熵和极大熵准则 (1)1.问题的提出 (1)2.高斯过程的熵和熵率 (1)3.功率谱和熵率的关系 (3)5.2 极大熵准则的谱估计 (6)5.3 极大熵谱估计的伯格算法 (9)5.4 极大熵谱估计的LS—LUD算法 (16)第五章 极大熵谱估计1967年伯格(J .P .Burg)刚一发表:极大熵谱分析”的方法就在工程和科技界产生很大影响,成为相当流行的功率谱密度估计方法。
伯格在谱估计准则的提出和具体算法上有所创新,由此演变出来的算法有很多种,被统称为“现代谱分析”。
5.1 谱熵和极大熵准则1.问题的提出从19世纪未舒斯特(Schuster)在利用富氏级数分析信号隐含的周期特性时提出了“周期图”,到1985年由伯来克曼和杜奇提出了谱估计的“间接法”和1965年FFT 算法提出后流行的“直接法”,它们本质上都是把原序列经过开窗截取处理来获得对序列谱密度的估计。
不论对数据加窗还是对自相关函数加窗,其目的都在于使谱估计的方差减小,然而加窗不可避免地产生频域“泄漏”,使功率谱失真,尽管在窗函数形式的选择和处理方法上做了很多分析研究,使得以周期图为基础的方法达到相当成熟和实用的程度,但是任何抑制旁瓣的方法都是以损失谱分辨力为代价的,这个难题在数据量少的情况下更为突出。
问题的实质是:在周期图估计中,我们对数据或是它的相关函数所做的加窗处理,等于是假定在窗口外数据(或自相关)为零,而窗口内的部分则加上某种形式的修正。
这些人为措施使来自观察的信息受到了一定程度的歪曲。
伯格提出的新概念是;和估计的功率谱相对应的自相关和由观察数据算得的自相关一致,同时对已有的区段之外的自相关值采用外推的办法求取,而不是一概假定为零,外推的原则是使相应的序列在未知点上取值的可能性具有最大的不确定性,亦即不对结果人为地强添任何增加的信息。
数学家申农最早提出“熵”的概念,在统计学中用它作为各种随机试验的不肯定性程度的度量。
在热力学和信息论中,“熵”都有其具体的物理背景和应用。
后面介绍将会看到,满足熵极大的谱估计是自回归模型的谱。
1971年凡登包士(V an Den Bos )证明,一维极大熵谱估计和自回归谱的最小二乘估计是等效的。
尽管如此,伯格关于熵谱估计的概念和他对自回归参数的递推算法却独树一帜,随后还有人提出了各种改进算法,但要注意把极大熵概念本身同等法区别开来。
2.高斯过程的熵和熵率假定我们研究的随机试验a 只有有限个不相容的结果12,,,n A A A ,它们相应的概率为12(),(),,()n P A P A P A ,且满足1()1ni i p A ==∑,简单描述如下:()()1212,,,:,,,()nn A A A P A P A P A α⎛⎫ ⎪⎪⎪⎪⎝⎭申农找到并证明了可以用()H α这个量来度量α的不肯定性的程度:()1()log ()ni i i H P A P A α==-∑或简写成:1()log ni i i H p P α==-∑()H α称为试验α的熵当随机变量的可能取值是连续的,则H 定义式中的和式用积分代替()log ()[log ()]H p x p x dx E p x ∞-∞=-=-⎰(5-1-1)其中()p x 为随机变量,对数可以取10或取e 为底,在比较熵的大小时并没有影响,下面为计算方便均以自然对数ln 来定义,如x为正态随机变量,22/(2)()x x p x σ-=,则有1x H n =σ (5-1-2)进一步,如果讨论的是时间序列的实现12{,,,}N x x x 则这一过程的熵用下面N 维积分表示:()ln ()H p x p x dx ∞-∞=-⎰(5-1-3)其中()p x 是联合概率密度函数12(,,,)N p x x x ,若时间序列是高斯的,则1/211()[(2)det ]exp[()()]2Nx x T x x p x R x R x π--=--μ-μ (5-1-4)其中x R 为自协方差阵()(0)1(1)(1)(0)(2)(1)(2)(0)x x x x x x x xx x R R R N R R R R N R N R N R ⎛⎫- ⎪⎪⎪≡--⎪ ⎪⎪--⎝⎭(5-1-5)它的i 行j 列元素为()[()()],x i x i x x i f R j i E x x x x -=-μ-μμ为或的均值,x μ表均值向量。
将式(5-1-4)代入式(5-1-3)求过程x 的熵1/21111()[(2)det]()()()211ln[(2)det]()()()()2211ln(det)ln221ln(det)ln2N Tx x x x xN Tx x xx x xxH p x ln R dx p x x R x dxR p x dx trR x x P x dxR N trR RR Nππ∞∞---∞-∞∞∞--∞-∞-=-+-μ-μ=+-μ-μ=++=+⎰⎰⎰⎰(5-1-6)式(5-1-6)就是长度为N的正态时间序列的熵。
若有正态白噪声ε(方差为2εσ),则1122(,,)()()()ln(det)ln2lnN NP p p pR N Nεεεεεεεε==σ=σ可求得其熵为12[ln((()()())]lnNH E p p p Nεεεεε=-=σ(5-1-7) 由于H随N增长而发散,定义熵率h为limNHhN←∞=(5-1-8) 故白噪声过程的熵率为h loεε=σ(5-1-9) 3.功率谱和熵率的关系下面给出功率谱和熵率间的一些重要性质和关系。
(1)如果随机向量12(,,)Ny y y y T≡ 是随机向量12(,,)Nx x x x≡ ,则由于y Ax=(5-1-10)其中A是N×N非奇异矩阵,X的联合概率密度为12(,,)Np x x x,则由于12121(,,,)(,,,)N Np y y y p x x xA=(5-1-11) 可得1212121212,,,(,,,)[ln][ln(,,,)ln],,,ln[ln(,,,)ln]y NNMNNH H y y yp x x xEAE p x x x AH x x x AE p x x x A≡=-=--=+=-+(5-1-12)(2)若t x 是一个稳定的因果系统的输入,该系统的传递函数为G(B)(这在单位园内无极点),系统单位脉冲响应为t g 。
设t x 在t =-∞时开始输入,因而系统输出t y 是平稳的,以x y h h x y 和分别表示和的熵率,则1/221/211()2y x h h n G f -⎰=+(5-1-13)其中2exp(2)()()()j f B j f G f G e G B ππ-=-== (5-1-14)证明:若t x 在t=0时开始输入,则系统输出为1itt t i i gy x -==∑ (5-1-15)t t y →∞t 时趋于平稳的y 。
式(5-1-15)是随机变量{}01,,,t x x x 通过线性变换Ax成为随机变量{},,, 01t y y y ,这里0101000t t g g g A g g g =⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦1det t A g+=根据式(5-1-12)得0(1)ln x y H H t g =++除以(t+1)并令t →∞则0ln y x h h g =+现在只要证明0ln g 等于式(5-1-13)中的第二项积分就够了。
由于()2()()Gf G f G f =-,exp(2)B j f π=-情况下有()()()1221121ln ln[]2G f df G B G BdB jπ---=⎰⎰-1顺B这里的线积分是沿单位园进行的,因()()11ln ln G B dB BG BdB --=⎰⎰-1顺顺B故式(5-1-13)中的第二项积分等于()11ln 2BG B dB jπ--⎰ 顺,所以需要证明()101ln ln 2g BG B dB jπ--=⎰ 顺由于G(B)在单位园内是解析的,所以上式中的积分路线可以任意小,当()00B G B g →=时。
故上式右边等于()100011ln ln 2ln 22g B dB g j g jjπππ---=-=⎰ 顺,证明完成。
(3)若t x 是正态过程,其功率谱()x G f 满足()1212ln xG f -⎰(5-1-15)则有()12121lnln 2x xh G f df -=⎰ (5-1-16)注:⎰⎰顺逆和分别表示顺时针和逆时针方向的围道积分。
这一结论是不难看出的,因为非白正态过程的功率谱密度()x G f 可以看作是方差为1的白噪声通过频率响应模的平方等()x G f的线性系统所产生的过程的谱,因此利用式(5-1-13)和(5-1-9)就可导出式(5-1-16)。
式(5-1-16)给出了过程的功率谱密度和它的熵率之间的关系式,由于右边第一项是常数,比较x h 的大小等价于比较第二项积分的大小,因此称()1212ln xt G f df x -⎰为序列的谱熵,并以它作为推导极大熵谱估计的出发点。
例如已知过程t x 的方差为x 2σ,即()1212xxG f df 2-σ⎰= (5-1-17)要导出能使x h 为最大的功率谱()x G f 。
这个问题可以通过求泛函极值来解决。
以λ表拉格伦日乘子作泛函()()()()121212121212()ln [ln ]x xxxx J G G f dfG f dfG f G f df---=-λ=-λ⎰⎰⎰其变为()12121212([ln(]1[()()x x x dfx x x x x x J G J G G G G G G G f dfG f λα=0α=0--∂δ()=[+αδ)]∂α∂=+αδ)-+αδ∂α=-λ]δ⎰⎰达到极值的条件为0J δ=,故应有()1x G f λ=代回式(5-1-17)可得()x x G f 2σ=,即()x G f 必须为常数x 2σ,因此只有当过程为白噪声时才能使熵率达到最大,这里约束条件是方差为x 2σ。
5.2 极大熵准则的谱估计根据伯格所提出的概念,功纺谱密度估计的准则应当是:设 ()x Gf 表示估计的谱,则它在满足约束条件 12212()()j fr x Gf e df R r π-=⎰M r M -≤≤ (5-2-1) 的同时,应使谱熵 1212ln ()x Gf df -⎰达到极大,其中 ()x G f 是f 的正、实、偶函数,这样对应的R(r)自然也是r 的偶函数。
下面论证满足以上要求的 ()x Gf 所应具有的形式。
设已知自相关函数R(r)在M r M -≤≤内的2M +1个值,以λ表拉格伦日乘子作泛函()()()()121212112212()ln (){ln [()]}Mj kf x x xK M Mj kfx x K MJ G G f df G f e dfR k G f G f e R k dfππK--=-K -=-⎡⎤⎢⎥⎣⎦=-λ-=-λ-∑⎰⎰∑⎰()1221212212{ln(}1[]()()Mj kf x x x x K MMj kf x x K MdfJ G G e G G e G f dfG f ππα=0K -=-K -=-∂δ=+αδ)-λ+αδ∂α=-λδ∑⎰∑⎰由0J δ=得2()j kfxG f eπK λ∑M K=-M=1() (5-2-2)这里应有*-κκλ=λ (5-2-3)以保证 ()x Gf 是实的。