气象统计方法第二章
- 格式:ppt
- 大小:1.61 MB
- 文档页数:43
现代气象统计方法一、EOF1、寻找Vk特征向量的原则:使得这些空间型为基向量展开该场时,场的总误差方差达最小,或使空间型和时间系数表示出场的总方差最小。
2、场的总方差:用特征值表示方差贡献率计算公式:Vk的方差贡献率:,前K个空间型的累积方差贡献率3、特征向量性质:相互正交,各自归一时间系数性质:相互正交,各自的方差等于对应的特征值,方差自大到小排列。
4、写出标准化距平场EOF主要结果(特征向量、时间系数)的两种表达式:对于场的EOF展开,分量形式:,i=1,2,3.....m,t=1,2,3.....n矩阵形式:对于空间型的表示,1、Vk图,采用距平为分析对象,只给出分布形式,其分量值大小没有意义。
2、图,取为新的空间型,如果分析对象是标准化的这时的图又是每个格点上的原变量与第k个主成分的相关系数分布图,值在-1到+1之间,所以,图也称特征向量图或EOF 图,它的空间分布形式与Vk图完全一样,但包含了更多的数量信息。
5、时空转换技术:当空间格点m远大于样本数n时,计算矩阵的特征根很困难,使用时空转换技术。
6、求特征值、特征向量、方差贡献率、相关系数二、主成分分析(PCA)1、概念:对于反映某现象的所有变量(设为m个,m≥2),构成k个新变量,一则要求k 各新变量相互相关,二则要求k个新变量在反映现象的信息尽可能保持原有信息的原则下,使k<m,"信息"的大小用离差平方和或方差来衡量。
这种方法称为主成分分析或主分量分析。
2、主成分的定义和性质:在EOF展开中,把m个格点上给定值的气象变量场看作PCA里的m维随机变量,则EOF 展开的时间序列完全满足PC的定义,就死这里要寻求的新变量,就是第k个主成分。
性质1:主成分的协方差矩阵是对角矩阵性质2:所有原变量方差之和等于所有主成分方差之和性质3:第k个主成分与第i个原变量之间的相关系数性质4:性质5:3、EOF和PCA的功能。
EOF:经验正交函数,从气象变量场的资料集中识别出主要的相互正交的空间分布。
第二章气象学中的分布函数上一章讨论的概念可以用于包括社会科学在内的众多学科。
本章则转向如何把它用于分析气象学所关注的种种气象现象。
正确地提出问题常常是科学地解决问题的先导。
这一章中我们的中心问题是效仿统计物理中的一些做法,从新的角度提出问题。
其中某些问题将在本书后边的几章中逐步予以解答。
但是仍留有一定数量的问题,我们并没有给出理论答案。
我们相信这些问题的提法是正确的。
希望在今后找出适当的理论解答。
而这类解答很可能是从统计物理原理、熵原理的角度找到的。
我们并没有用分布函数的概念去分析每个气象问题。
下面介绍的仅是初步分析得到的一些结果。
从中可以看到在云物理学中气象工作者早已用上了这种概念,仅是名称不同。
而在大气环流等研究中尚没有从这个角度提出问题。
第一节介绍的云物理学中的谱是直接与分布函数对应的。
而后边介绍的分布函数在概念上还要做些说明才能与大气流体的连续分布问题相对应。
这就使我们先对大气微团概念和统计方法做些讨论,此后再介绍一个个的分布。
§1 云物理学中的谱气象学领域内与分布函数相对应的概念是云物理领域中的“谱”。
云滴谱、雨滴谱、冰雹谱等等实际上都是分布函数。
任何一个云体都是由充分多的云滴或冰晶组成的。
这些云滴的直径(对冰晶也可以换算成相应的液态直径即直径当量)大小并不相等。
N个云滴中不同直径的云滴各占多少?云滴直径与其对应的个数的关系在云物理中称为云滴谱,它恰好是我们定义的分布函数。
图2.1是云滴谱的一个实例,它是根据文献[1]绘成的。
图中显示它呈现为一种偏态的单峰分布。
直径为15—20微米的云滴最多。
它的分布形态实际对多数云体有代表性。
图2.1 云滴谱示例据[1],1963年Khrgian和Mazin推荐用Ar2e-Br来计算半径在r→r+1区间内的云滴个数(A,B为两个常数)。
后边将看到我们依据熵极大原理导出了与此有别的谱方程[2],(见第6章)。
云滴的数据要把仪器装在飞机上去收集,而雨滴大小与个数的观测可在地面上进行。
2⽓象统⽅法复习思考题《⽓象统计⽅法》复习要点及思考题1、⽓候变化上通常说的异常,可以⽤距平这个基本统计量来描述,它反映数据偏离平均值(⽓候态)的状况,把资料处理成该统计量的形式,叫做资料的中⼼化。
2、距平是指要素偏离平均值(⽓候态)的状况,把资料处理为距平的⽅法叫中⼼化。
3、如果⼀⽉南京⽓温的标准差⽐北京⼩,说明⼀⽉南京⽓温变化幅度⽐北京⼩,预报较为容易。
4、对资料进⾏标准化可以消除单位量纲不同造成的影响,其表达式为xt zt s x x x -=,标准化以后资料的均⽅差为1,平均值是_0_。
5、频率表是⽤来描述状态资料的统计特征的。
6、⼀元线性回归分析中回归系数b 与相关系数r 之间的关系为b=lxy/lxx,r=lyy(1-r2)7、多元线性回归中常采⽤最⼩⼆乘法求回归系数。
8、滑动平均是趋势拟合技术最基础的⽅法,它相当于低通滤波器。
9、最后⼀个累积距平值为 0 。
10、复相关系数是衡量⼀个变量和多个变量之间的线性关系程度的量。
11、变量场X 表⽰为,则第i 个特征向量对变量X的⽅差贡献为,前P 个特征向量对变量场的累积⽅差贡献为。
12、对上题中的变量场X ,当 m>>n 时在实际计算中通常需进⾏时空转换。
13、相关系数的绝对值越⼤,表⽰变量之间关系越密切(紧密)。
14、在事件B 已经发⽣的条件下计算事件A 的概率,称为事件A 在事件B 已出现条件下的条件概率。
15、⼆分类预报是指只预报事件A 出现或者不出现,⼜称为正反预报。
16、在对回归问题进⾏⽅差分析时,预报量的⽅差可以表⽰成_回归⽅差与误差或残差⽅差之和。
17、⽓象中⼀些⽓象要素,如冰雹、晕、雾等天⽓现象,⽓象资料中仅记录为“有”或“⽆”可⽤“1”或“0”⼆值数字化表征,这类变量可看成离散型随机变量。
对于这种状态要素,可以⽤条件概率选择预报因⼦并且⽤⼆项分布检验预报因⼦的可靠程度。
⽓温、⽓压及降⽔量等⽓象要素,观测值在正、负⽆穷之间,这种类型要素可看成为连续型随机变量。
气象数据统计分析方法
气象数据统计分析是指对气象数据进行统计、图形化展示和数值表示,从而不断探索和提取气象特征信息的过程。
气象数据统计分析一般以下几个步骤:第一步,建立气象数据统计分析模型,即定义气象数据变量的概念、属性、分类标准,并给出分析变量的数据源及测量渠道;第二步,收集气象数据,采集实际气象数据,以及相关历史资料;第三步,清洗气象数据;第四步,分析气象数据,例如均值、方差、标准差、最大值、最小值、极差等;最后一步,使用合理有效的统计方法,对气象数据进行可视化分析或机器学习分析以及其他发现时空格局或趋势的方法,以便研究隐藏的气象知识,最终得出气象状态的规律性及特点。
气象统计方法
气象统计学是一门应用数学的科学.它研究的内容主要是气象观测、气象数据处理和通过数学方法研究大气现象的统计学。
气象统计方法有助于测算出有关气象变化和气象现象的统计量。
气象统计方法,主要包括:描述统计和推断统计。
描述统计是一种统计方法,它将观测数据进行汇总和分析,从而说明某一观测系统的本质特点。
比如,气象观测数据中存在的平均气温、总降水量及其月均等属性就属于描述统计的范畴。
推断统计是一种统计方法,它研究的是观测数据的统计特征,从而推断出随机变量的分布情况,并处理相应的方面,研究大气现象的发展趋势及其可能的影响因素。
比如,在讨论气象变化问题时,利用推断统计的方法,可以推断出某一地区气温变化的规律和可能的变化范围,以便做出预测性判断。
气象统计方法在实践中广泛应用。
其中,描述统计方法可用于研究某一观测数据的特征,比如对日最高气温、最低气温进行描述,推断统计方法可用于研究大气现象的发展趋势,比如利用推断统计方法进行气温变化预测。
气象统计方法还可以用于台风移动路径的预测、大气现象的预测和气候模拟实验等研究。
气象统计方法的实施需要许多数学和统计处理技术,如时间序列分析、概率论、统计推断、多元分析、通用线性模型等。
此外,气象统计方法还受到地理空间和数据空间结构的影响,了解大气现象的时空变化规律及其影响因素,还有必要分析其时空演变规律。
总之,气象统计方法作为气象学中重要的研究方法之一,在有效
分析观测数据和研究大气现象的发展趋势方面显示出了其独特的优势。
它的实施需要多种统计计算技术的结合,而且受到地理空间及数据结构的影响,因此,它是一个具有很高难度的研究内容。
第一章气象资料及其表示方法一、数据资料的统计特征要素样本中资料分布的特点----用一些统计量表征。
1、平均值含义:平均值是要素总体数学期望的一个估计。
反映了该要素的平均(气候)状况。
2、距平含义:反映数据偏离平均值的状况,也是通常所说的异常。
**中心化**概念:把资料处理为距平的方法叫中心化特性:距平值的平均值为0,使用方便;直接作为预报值,比较直观(偏高/偏低)。
3、方差和均方差(标准差)含义:是均方差,描述样本中资料与平均值差异的平均状况,反映变量围绕平均值的平均变化程度(离散程度),是方差。
标准差大-----变化幅度大;均方差小的要素预报比大容易,变化幅度小;变量减去某常数后均方差相同。
累积频率:变量小于某上限的次数与总次数之比。
二、总体和样本1、总体(母体):统计分析对象的全体。
2、样本:总体中的一部分。
三、数据的标准化各要素单位不同、平均值和标准差也不同。
为使它们在同一水平上比较,采用标准化方法,使它们变成同一水平的无单位的变量----标准化变量(消除单位量纲的影响)。
证明:(1)标准化变量的平均值为0。
(2)标准化变量的方差为1。
峰度系数与偏度系数是用来衡量随机变量分布密度曲线形状的数字特征,描述了气候变量的分布特征。
偏度系数:表征曲线峰点对期望值(平均值)偏离的程度。
峰度系数:表征分布形态图形顶峰的凸平度(即渐进于横轴的陡度)。
三、状态资料和统计特征1.状态资料(离散型随机变量)表征气象要素的各种状态,观测结果无法用数据表示。
2.频率表、分布列----------列出各个状态出现的频率。
对样本而言是频率表,总体而言就是分布列。
四、多要素的气象资料两个方面来研究问题:“R型分析”:研究不同变量(要素)或同一要素不同格点之间的关系。
(行)“Q型分析”:研究样本之间的关系(列)。
五、统计量---协方差和协方差矩阵1.协方差衡量任意两个气象要素(变量)之间关系的统计量(正、负相关关系)(另外一个统计量叫相关系数)(距平的内积)反映了两个气象要素异常关系的平均状况,或者两个变量的正、负相关关系。