气象统计方法第三章.
- 格式:ppt
- 大小:850.50 KB
- 文档页数:73
现代气象统计方法一、EOF1、寻找Vk特征向量的原则:使得这些空间型为基向量展开该场时,场的总误差方差达最小,或使空间型和时间系数表示出场的总方差最小。
2、场的总方差:用特征值表示方差贡献率计算公式:Vk的方差贡献率:,前K个空间型的累积方差贡献率3、特征向量性质:相互正交,各自归一时间系数性质:相互正交,各自的方差等于对应的特征值,方差自大到小排列。
4、写出标准化距平场EOF主要结果(特征向量、时间系数)的两种表达式:对于场的EOF展开,分量形式:,i=1,2,3.....m,t=1,2,3.....n矩阵形式:对于空间型的表示,1、Vk图,采用距平为分析对象,只给出分布形式,其分量值大小没有意义。
2、图,取为新的空间型,如果分析对象是标准化的这时的图又是每个格点上的原变量与第k个主成分的相关系数分布图,值在-1到+1之间,所以,图也称特征向量图或EOF 图,它的空间分布形式与Vk图完全一样,但包含了更多的数量信息。
5、时空转换技术:当空间格点m远大于样本数n时,计算矩阵的特征根很困难,使用时空转换技术。
6、求特征值、特征向量、方差贡献率、相关系数二、主成分分析(PCA)1、概念:对于反映某现象的所有变量(设为m个,m≥2),构成k个新变量,一则要求k 各新变量相互相关,二则要求k个新变量在反映现象的信息尽可能保持原有信息的原则下,使k<m,"信息"的大小用离差平方和或方差来衡量。
这种方法称为主成分分析或主分量分析。
2、主成分的定义和性质:在EOF展开中,把m个格点上给定值的气象变量场看作PCA里的m维随机变量,则EOF 展开的时间序列完全满足PC的定义,就死这里要寻求的新变量,就是第k个主成分。
性质1:主成分的协方差矩阵是对角矩阵性质2:所有原变量方差之和等于所有主成分方差之和性质3:第k个主成分与第i个原变量之间的相关系数性质4:性质5:3、EOF和PCA的功能。
EOF:经验正交函数,从气象变量场的资料集中识别出主要的相互正交的空间分布。
1.三基点温度及其共同特征作物生命活动的每一个过程,都有三个基本点温度,即三基点温度。
●最低(下限)温度●最适温度●最高(上限)温度对于作物的生长,在最适温度下生长迅速而良好,在最低和最高温度下作物停止生长,但是仍然能够维持生命而不受害。
如果温度继续降低或升高,作物就会逐渐受到不同程度的危害直至死亡。
所以在三基点温度之外,还可以确定作物的受害温度(受害高温或受害低温)以及致死温度(致死高温或致死低温)。
这就是通常所说的五基点温度或者七基点温度。
特征区别●不同作物的三基点温度不同;●同一作物不同品种的三基点温度不同;●同一作物不同生育期的三基点温度不同;●同一作物不同生理过程三基点温度不同;●同一植株上不同器官的三基点温度不同。
共同特征●最低、最适、最高温度指标不是一个具体的数值,而是具有一定的范围,不仅与强度有关,还与作用的持续时间有关。
●无论是生存、生长还是发育,其最适温度基本上是在同一个变幅范围,差异很小。
●各种作物的最低温度的最低点差异很大,且最低温度与最适温度差值较大。
●各种作物最高温度指标值差异较小。
且各种作物的最高温度与最适温度值也比较接近。
●在作物的生命过程中,最低温度远较最高温度出现的机率大。
2.根据作物对温度条件的要求和引种成败的经验,作物引种的三条规律●北种南引(高山引向平原)比南种北移(平原引向高山)容易成功。
因为南种北移是作物能否成活的问题,而北种南引则是温度可能影响产品质量的问题。
●草本植物要比木本植物引种容易成功,一年生植物较多年生植物引种容易成功,落叶植物比常绿植物引种容易成功,灌木要比乔木引种容易成功。
●温度对植物生长的作用,在一定程度上是相对的,各种植物都有一定的适应性,因此在植物引种的过程中,存在着气候驯化现象。
3.温度对作物生长(光合、呼吸)的影响(1)不同作物的光合作用强度与温度的关系不完全相同,但各种作物“光合作用—温度”曲线的一般形状是基本一致的。
(2)“光合作用—温度”曲线和“呼吸作用—温度”曲线的变化趋势近似。
精品文档学习内容:Chapter1-气象资料及其表示方法Chapter2-选择最大信息的预报因子Chapter3-气候稳定性检验Chapter4-气候趋势分析Chapter5-一元线性回归Chapter6-多元线性回归Chapter7-逐步回归Chapter-8-气象变量场时空结构别离复习题:1、气象统计预报是利用统计学方法对气象〔气候〕样本进行分析来估计和推测总体的规律性。
2、突变可分为:均值突变、变率突变、趋势突变。
3、气候统计诊断分析与天气统计诊断分析的不同点是研究对象不同,一个是〔气候特征〕,一个是〔天气特征〕。
相同点是数据资料都必须是〔长时间〕的观测数据。
4、〔〕需要对结论进行一系列的推断,分析结论的可信程度以及是否为因果关系。
A统计分析;B统计诊断;5、采用统计诊断的方法研究天气、气候现象,可以用于哪些方面〔〕<多项选择>。
.A了解区域性或者全球性天气、气候现象的时空分布特征、变化规律及异常程度;探索气候变量及其与其它物理因素之间的联系;对数值模拟结果与实际变化状况之间的差异进行统计诊断,为改良模式提供线索和指导;6、对天气、气候现象进行统计诊断分析,一般分为四步。
首先,〔〕;其次,〔〕;再次,〔〕;最后,〔〕。
A科学综合和诊断;B选择诊断方法;C资料预处理;D收集资料;7、气候统计预测,一般分为四步。
首先,〔〕;其次,〔〕;再次,〔〕;最后,〔〕。
A建立统计模型;B统计检验;C预测结论;D收集资料;8、统计预测模型在利用大量〔〕观测资料对气候系统内部或与其它变量之间关系的变化规律及特征分析根底上建立的,用于对〔〕状态进行估计。
在这一预测过程中,假设气候变化的成因和物理机制至少在〔〕期间与〔〕期间一致;气候系统保持稳定。
A过去;B未来;C预测;D观测;9、气候统计预测过程主要由以下4个要素构成:1、〔〕,例如:夏季降水量,8月份高温日数、暴雨日数;2、〔〕,通常为从某些统计上显著相关的预报因子群提取的有效信息;3、〔〕,根据数据性质、预测对象和预测因子特点,选择适宜的统计预测模型;4、〔〕,对未来气候变化状态时间、空间、数量、性质等方面的预测。
《气象统计方法》复习要点及思考题1、 气候变化上通常说的异常,可以用距平这个基本统计量来描述,它反映数据偏离平均值(气候态)的状况,把资料处理成该统计量的形式,叫做资料的中心化。
2、 距平是指要素偏离平均值(气候态)的状况,把资料处理为距平的方法叫中心化。
3、 如果一月南京气温的标准差比北京小,说明一月南京气温变化幅度比北京小,预报较为容易。
4、 对资料进行标准化可以消除单位量纲不同造成的影响,其表达式为xt zt s x x x -=,标准化以后资料的均方差为1,平均值是_0_。
5、 频率表是用来描述状态资料的统计特征的。
6、 一元线性回归分析中回归系数b 与相关系数r 之间的关系为b=lxy/lxx,r=lyy(1-r2)7、 多元线性回归中常采用最小二乘法求回归系数。
8、 滑动平均是趋势拟合技术最基础的方法,它相当于低通滤波器。
9、 最后一个累积距平值为0。
10、 复相关系数是衡量一个变量和多个变量之间的线性关系程度的量。
11、变量场X的方差贡献为,前P 12、 对上题中的变量场X 13、 14、在事件B 已经发生的条件下计算事件A 的概率,称为事件A 在事件B 已出现条件下的条件概率。
15、 二分类预报是指只预报事件A 出现或者不出现,又称为正反预报。
16、 在对回归问题进行方差分析时,预报量的方差可以表示成_回归方差与误差或残差方差之和。
17、气象中一些气象要素,如冰雹、晕、雾等天气现象,气象资料中仅记录为“有”或“无”可用“1”或“0”二值数字化表征,这类变量可看成离散型随机变量。
对于这种状态要素,可以用条件概率选择预报因子并且用二项分布检验预报因子的可靠程度。
气温、气压及降水量等气象要素,观测值在正、负无穷之间,这种类型要素可看成为连续型随机变量。
对于这种定量数据要素,主要用相关系数选择预报因子或因子集,并用t_检验方法检验其可靠性。
18、 如果序列的__自_相关系数为较大正值,表明序列具有_高持续性_;如果序列的滞后自相关系数接近0或为负值,表明序列无持续性。
第一章气象资料及其表示方法一、数据资料的统计特征要素样本中资料分布的特点----用一些统计量表征。
1、平均值含义:平均值是要素总体数学期望的一个估计。
反映了该要素的平均(气候)状况。
2、距平含义:反映数据偏离平均值的状况,也是通常所说的异常。
**中心化**概念:把资料处理为距平的方法叫中心化特性:距平值的平均值为0,使用方便;直接作为预报值,比较直观(偏高/偏低)。
3、方差和均方差(标准差)含义:是均方差,描述样本中资料与平均值差异的平均状况,反映变量围绕平均值的平均变化程度(离散程度),是方差。
标准差大-----变化幅度大;均方差小的要素预报比大容易,变化幅度小;变量减去某常数后均方差相同。
累积频率:变量小于某上限的次数与总次数之比。
二、总体和样本1、总体(母体):统计分析对象的全体。
2、样本:总体中的一部分。
三、数据的标准化各要素单位不同、平均值和标准差也不同。
为使它们在同一水平上比较,采用标准化方法,使它们变成同一水平的无单位的变量----标准化变量(消除单位量纲的影响)。
证明:(1)标准化变量的平均值为0。
(2)标准化变量的方差为1。
峰度系数与偏度系数是用来衡量随机变量分布密度曲线形状的数字特征,描述了气候变量的分布特征。
偏度系数:表征曲线峰点对期望值(平均值)偏离的程度。
峰度系数:表征分布形态图形顶峰的凸平度(即渐进于横轴的陡度)。
三、状态资料和统计特征1.状态资料(离散型随机变量)表征气象要素的各种状态,观测结果无法用数据表示。
2.频率表、分布列----------列出各个状态出现的频率。
对样本而言是频率表,总体而言就是分布列。
四、多要素的气象资料两个方面来研究问题:“R型分析”:研究不同变量(要素)或同一要素不同格点之间的关系。
(行)“Q型分析”:研究样本之间的关系(列)。
五、统计量---协方差和协方差矩阵1.协方差衡量任意两个气象要素(变量)之间关系的统计量(正、负相关关系)(另外一个统计量叫相关系数)(距平的内积)反映了两个气象要素异常关系的平均状况,或者两个变量的正、负相关关系。
编制说明本标准是根据城乡建设环境保护部(84)城设字第124号通知的要求,为了适应工业与民用建筑工程的需要,由中南地区建筑标准设计协作组办公室会同国家气象局北京气象中心气候资料室共同编制。
在编制过程中,广泛征求了建筑、气象、城建等专业部门及各有关规范编制组的意见;通过对6个城镇的试编工作,确定了编制原则、成果表现形式、全国城镇定点与气象参数的项目内容;在征求意见稿完成后,又征求了全国有关单位的意见,然后修改成本稿。
我国城镇较多,各专业需求的气象参数项目较广,限于当前条件,本标准仅选取了209个城镇,每个城镇列出55项常用的气象参数及气候特征分析,供工业与民用建筑工程设计、施工中使用。
为使各有关标准规范的数值统一起见,本标准中的“最热月14时平均温度、相对湿度”、“三十年一遇最大风速”、“日平均气温W5°C的日数及度日数等”及“冬、夏季太阳辐射强度”系来源于《采暖通风与空气调节设计规范》(送审稿)、《工业与民用建筑结构荷载规范》、《民用建筑节能设计标准》及《民用建筑热工设计规程》等。
本标准共分三章,五个附录,主要内容有:总则、参数的分类及其应用、参数的统计方法与标准及全国城镇参数定点示意图、参数表等。
第一章总则第1.0.1条为满足工业与民用建筑工程的勘察、设计、施工以及城镇小区规划设计的需要而提供统一的建筑气象参数,特制订本标准。
第1.0.2条本标准中所选用的参数系工业与民用建筑工程中通用的建筑气象参数。
在编制有关规划、设计等文件时所用的气象参数,已列入本标准的应以本标准为准。
其他未列入本标准中的各专业专用的参数,仍应按各专业的有关规范执行。
第1.0.3条本标准按城镇定点提供气象参数。
其地名以经国务院批准的截至1985年底的行政区划资料所列为准。
第1.0.4条本标准所列的参数是根据各城镇气象台站30年(1951年〜1980年)气象记录资料编制的。
不足30年记录者,按实有记录资料整理编制。