气象统计方法复习资料
- 格式:pdf
- 大小:418.98 KB
- 文档页数:9
气象资料及其表示方法 选择最大信息的预报因子 气候稳定性检验 气候趋势分析 一元线性回归 多元线性回归 逐步回归 气象变量场时空结构分离 复习题:1、 气象统计预报是利用 统计学方法对气象(气候)样本进行 分析来估计和推测 总体 的规律性。
2、 突变可分为: 均值突变、变率突变、趋势突变 。
3、 气候统计诊断分析与天气统计诊断分析的不同点是研究对象不同, 一个是(气候特征),一个是(天气特征)。
相同点是数据资料都 必须是(长时间)的观测数据。
4、 ()需要对结论进行一系列的推断,分析结论的可信程度以及 是否为因果关系。
A 统计分析;B 统计诊断;5、 采用统计诊断的方法研究天气、气候现象,可以用于哪些方面( )<多选>。
A 了解区域性或者全球性天气、 气候现象的时空分布特征、 变化规律 及异常程度;B 探索气候变量及其与其它物理因素之间的联系;学习内容:Chapter 1-Chapter 2-Chapter 3-Chapter 4-Chapter 5-Chapter 6-Chapter 7-Chapter-8-C 对数值模拟结果与实际变化状况之间的差异进行统计诊断,为改进模式提供线索和指导;6、对天气、气候现象进行统计诊断分析,一般分为四步。
首先,();其次,();再次,();最后,()。
A科学综合和诊断;B选择诊断方法;C资料预处理;D收集资料;7、气候统计预测,一般分为四步。
首先,();其次,();再次,();最后,()。
A建立统计模型;B统计检验;C预测结论;D收集资料;8、统计预测模型在利用大量()观测资料对气候系统内部或与其它变量之间关系的变化规律及特征分析基础上建立的,用于对()状态进行估计。
在这一预测过程中,假设气候变化的成因和物理机制至少在()期间与()期间一致;气候系统保持稳定。
A过去;B未来;C预测;D观测;9、气候统计预测过程主要由以下4 个要素构成:1、(),例如:夏季降水量,8 月份高温日数、暴雨日数;2、(),通常为从某些统计上显著相关的预报因子群提取的有效信息;3、(),根据数据性质、预测对象和预测因子特点,选择合适的统计预测模型;4、(),对未来气候变化状态时间、空间、数量、性质等方面的预测。
《气象统计方法》复习要点与思考题1、 气候变化上通常说的异常,可以用距平这个基本统计量来描述,它反映数据偏离平均值(气候态)的状况,把资料处理成该统计量的形式,叫做资料的中心化。
2、 距平是指要素偏离平均值(气候态)的状况,把资料处理为距平的方法叫中心化。
3、 如果一月南京气温的标准差比小,说明一月南京气温变化幅度比小,预报较为容易。
4、 对资料进行标准化可以消除单位量纲不同造成的影响,其表达式为xt zt s x x x -=,标准化以后资料的均方差为1,平均值是_0_。
5、 频率表是用来描述状态资料的统计特征的。
6、 一元线性回归分析中回归系数b 与相关系数r 之间的关系为b=lxy/lxx,r=lyy(1-r2)7、 多元线性回归中常采用最小二乘法求回归系数。
8、 滑动平均是趋势拟合技术最基础的方法,它相当于低通滤波器。
9、 最后一个累积距平值为0。
10、 复相关系数是衡量一个变量和多个变量之间的线性关系程度的量。
11、变量场X 表示为 ,则第i 个特征向量对变量X的方差贡献为,前P 个特征向量对变量场的累积方差贡献为。
12、 对上题中的变量场X ,当m>>n 时在实际计算中通常需进行时空转换。
13、 相关系数的绝对值越大,表示变量之间关系越密切(紧密)。
14、 在事件B 已经发生的条件下计算事件A 的概率,称为事件A 在事件B 已出现条件下的条件概率。
15、 二分类预报是指只预报事件A 出现或者不出现,又称为正反预报。
16、 在对回归问题进行方差分析时,预报量的方差可以表示成_回归方差与误差或残差方差之和。
17、气象中一些气象要素,如冰雹、晕、雾等天气现象,气象资料中仅记录为“有”或“无”可用“1”或“0”二值数字化表征,这类变量可看成离散型随机变量。
对于这种状态要素,可以用条件概率选择预报因子并且用二项分布检验预报因子的可靠程度。
气温、气压与降水量等气象要素,观测值在正、负无穷之间,这种类型要素可看成为连续型随机变量。
现代气象统计复习题1、 向量正交且归一化的概念及表达式?2、 m 维空间中的任一向量X 可以用基向量V 1,V 2,...,V m 线性组合表示,即∑==mk k k a 1V X ,k a 的几何意义是什么?3、 一个实对称矩阵A ,其特征值和特征向量有哪些性质?4、 一个m 阶方阵,其特定特征值和相应特征向量哪一个是唯一的。
5、详细了解EOF 展开的原理,一个气象变量标准化距平场EOF 展开中,给定协方差矩阵,如∑⎥⎦⎤⎢⎣⎡--=0.16.06.00.1,计算其特征值、特征向量、方差贡献率。
6,多元统计中多维随机变量主成分的定义是什么?主成份的性质有哪些?7,一个场先处理成标准化距平,再进行主成分分析。
第k 个归一化的特征向量图和场的每个格点序列与第k 个主成份序列之间的相关系数分布图有何关系?某个特征向量图与以哪个格点为定点的“一点相关图”最相似?8, EOF 和PCA 的功能是什么?9, EOF 分析方法中特征向量矩阵和时间系数矩阵的特点和性质?10, PCA 与EOF 的异同11, 在EOF 或者PCA 的实际应用中,空间型可以有哪些表示方法,请叙述各自所表征的含义12, EOF 和REOF 在气象要素时空特征分析用,各自的用途和优缺点是什么?13, REOF 旋转中截取多少个模态旋转是如何确定的(三种)(参考题目总会2012)8,旋转EOF 分析的问题的提法(或旋转的原则)是什么?了解其原理。
9,旋转EOF 的性质1、2的理解10,了解REOF 结果的分析11,奇异值分解(SVD )方法在气象研究中的功能是什么?12,数学中一般实矩阵SVD 的定义是什么?13,了解实一般矩阵SVD 的性质15,SVD 分析中,两个场之间总的联系用什么衡量?与两个场之间交叉协方差矩阵的奇异值有什么关系?每一对SVD 模态解释两个场总协方差平和的百分率、以及解释左右场各自方差的百分率怎么确定?SVD 分析的原理保障反映出两个场之间的联系达最大还是反映两个场的方差量最大?左、右同类和异类相关图与左、右奇异向量图有何关系。
51气象中的统计方法总结2、判别分析;广东省徐闻气象局[20]用二级判别做台风登陆地段;3、相关分析;近20年来在气象统计中用得较多的主要有典型相关(;奇异值分解(SVD)也是提取两个场的最大线性相关;4、气象场的分解及其应用;50年代中期由Loreng引入到大气科学研究中的;4.1经验正交函数(EOF)分解;章基嘉等[30]应用经验正交函数对亚洲500hP;4.2主成份(主分量)2、判别分析广东省徐闻气象局[20]用二级判别做台风登陆地段的预报。
Fisher、Bayes以及逐步判别等虽然在气象实际中广泛应用,但严格地说,这些方法仅当变量为正态分布时才可应用, Logistic判别对变量的基本假设条件较宽,对未经正态检验的变量应用本方法是可行的,且可用于既有连续变量又有多值离散变量的情形。
吕纯濂等[21] 将Logistic判别引入中国气象界,并研究了二次Logistic判别[22]分析及逐步判别[23]在气象中的应用。
3、相关分析近20年来在气象统计中用得较多的主要有典型相关(CCA)分析和奇异值分解(SVD)方法。
CCA是提取两个气象场的最大线性相关摸态的方法。
朱盛明、祝浩敏[24]在数值预报的解释应用中用典型相关分析提取有物理意义的预报因子作预报方程。
陈嘉玲、谢炯光[25]用典型相关分析作中期冷空气预报。
黄嘉佑[26]用典型相关分析作副高的统计动力预报。
近年来发展了一种新的CCA改进方法,称为典型相关分析的BP(Barnert 和Preisendorfer)方法,在气象统计中也得到了应用[27]。
奇异值分解(SVD)也是提取两个场的最大线性相关摸态的方法,SVD 方法可以变成是两个要素场关系的扩大EOF分析。
谢炯光等[28]用奇异值分解方法,求出了广东省前汛期(4-6月)西太平洋场海温与广东省降水场的6对奇异向量,来作汛期降水趋势预报。
江志红等[29]用SVD方法讨论了中国夏半年降水与北太平洋海温异常的关系。
第一章 气象资料及其表示方法 1、 平均值2、 距平 含义:反映数据偏离平均值的状况 距平序列:单要素样本中每个样本资料点的距平值组成的序列称为距平序列,也可以记为距平向量。
3、中心化的概念:把资料处理为距平的方法叫中心化。
气象上常用距平值代替原样本中的资料值作为研究对象。
4、 中心化的必要性:因为气象要素的年变化周期影响很大,各月的平均值不一样,为了使之能在同一水平下比较,常使用距平值(比如之前的举例)。
5、中心化的特性:距平值的平均值为/偏低)。
6、方差和均方差(标准差) 对气象要素x,资料长度n, 含义:S X 是均方差,描述样本中资料与平均值差异的平均状况,反映变量围绕平均值的平均变化程度(离散程度),S X 2是方差。
7、 方差和均方差(标准差)气象上的应用:1)如果12月份气温标准差比1月份大,反映了12月份气温随时间变化幅度比1月大。
2)对于同一个月,如果南京气温的标准差比北京小,说明北京气温变化幅度大。
(内陆日变化较沿海大,这个日变化大小的比较就使用标准差比较的)3)均方差小的要素预报比大的容易。
均方差越大,变量不确定性越大,预报越困难。
4)变量减去某常数后均方差相同。
8、累积频率:变量小于某上限的次数与总次数之比。
(样本特征—直方图)9、总体(母体):统计分析对象的全体。
样本:总体中的一部分。
10、为何要进行标准化?各要素单位不同、平均值和标准差也不同。
为使它们在同一水平上比较,采用标准化方法,使它们变成同一水平的无单位的变量----标准化变量。
Sx X Xt Xzt /)(-=目的:为了消去单位量纲不同所造成的影响。
正态化的必要性:各类统计预报模型和统计检验方法(F,t,u,X 2检验)要求资料是符合正态分布 正态化的处理方法:立方根或四次方根;双曲正切转换;化为有序数后的正态化转换(标准化和正态化)11、标准化变量的平均值为0。
标准化变量的方差为1。
12、峰度系数与偏度系数峰度系数与偏度系数是用来衡量随机变量分布密度曲线形状的数字特征,描述了气候变量的分布特征。
应用气象统计分析复习重点第一章绪论1.田间试验就是在人为控制条件下进行试验处理,使非研究条件对试验的影响接近一致,突出主要研究内容,以差异对比法为基础,观测比较不同处理的反应和效果。
田间试验是在田间条件下,以作物生长发育的各种性状、产量和品质等作指标,研究作物与环境之间关系的农业科学试验方法。
2.盆栽、实验室试验与大田差异较大,试验结果不能代表田间试验结果,难以直接应用。
多用于植物营养、土壤养分等机理性研究及探索性研究。
3.田间试验的任务:其基本任务是在大田条件下研究新品种、新产品、新技术、新方法或环境改变的影响效果,客观地评定优质高产品种及其适应区域,评定新产品的增产效果及其对环境的反应,正确的评判最有效的增产技术措施及其适用范围,使农业科研成果合理地应用和推广!4.田间试验的来源1)农业生产实践中发现或提出新的问题;2)科研工作者开展的田间试验研究;3)受其他地区或单位委托进行的田间试验研究;4)根据农业生产发展的需要,农业行政部门或科研主管部门下达的田间试验项目。
5、农作物田间试验的特点(1)田间试验不破坏农田土壤结构,不改变田间的气候状况,试验条件符合生产实际,便于推广应用。
(2)试验单元是一定面积的小区。
(3)田间试验中各种生长因子难以控制,试验误差大,只有通过周密的试验设计和认真的试验实施、严密的统计分析才能得出科学结论。
6.田间试验的基本要求(1)试验目的要明确(2)试验条件要有代表性(3)试验结果要可靠(4)试验结果要有重演性7.制定试验方案的要点1)明确的目的性:突出重点,抓住关键2)严密的可比性○1唯一差异原则:除了试验处理不同外,其它一切试验条件尽量保持一致。
○2设置对照(CK)3)试验的高效性:适当减少因素,合理确定水平数及其级差来提高试验效率。
第二章田间试验设计及实施1.试验设计广义是指整个课题(包括试验方案的确定、小区技术、相应的资料收集整理和统计分析方法等的设计)的设计,狭义的讲专指小区技术。
气象统计方法题库第一题:某地2019年1月份的平均气温数据如下:-1℃,2℃,3℃,0℃,-3℃,4℃,-2℃,1℃。
请你计算该地1月份的平均气温。
解析:平均气温的计算方法是将所有观测值相加,然后除以观测次数。
根据给出的数据,我们可以将所有的气温相加,得到总和为:-1 + 2 + 3 + 0 + (-3) + 4 + (-2) + 1 = 4。
观测次数为8次,所以平均气温为总和除以观测次数,即:4 / 8 = 0.5℃。
所以该地1月份的平均气温为0.5℃。
第二题:某地区连续5天的日平均气温数据如下:20℃,22℃,21℃,24℃,23℃。
请你计算这5天的平均气温。
解析:同样,平均气温的计算方法是将所有观测值相加,然后除以观测次数。
根据给出的数据,我们可以将所有的气温相加,得到总和为:20 + 22 + 21 + 24 + 23 = 110。
观测次数为5次,所以平均气温为总和除以观测次数,即:110 / 5 = 22℃。
所以这5天的平均气温为22℃。
第三题:某地区某月份的日最高气温数据如下(单位:摄氏度):1日:20℃,2日:22℃,3日:18℃,4日:23℃,5日:21℃,6日:25℃,7日:24℃,8日:19℃,9日:20℃,10日:22℃。
请你计算这个月的最高气温的平均值。
解析:计算方法同样是将所有观测值相加,然后除以观测次数。
根据给出的数据,我们可以将所有的最高气温相加,得到总和为:20 + 22 + 18+ 23 + 21 + 25 + 24 + 19 + 20 + 22 = 214。
观测次数为10次,所以平均最高气温为总和除以观测次数,即:214 / 10 = 21.4℃。
所以这个月的最高气温的平均值为21.4℃。
第四题:某地区5月份30天的最低气温数据如下(单位:摄氏度):1日:10℃,2日:11℃,3日:9℃,4日:12℃,5日:11℃,6日:14℃,7日:13℃,8日:9℃,9日:10℃,10日:12℃,11日:11℃,12日:10℃,13日:12℃,14日:15℃,15日:14℃,16日:11℃,17日:13℃,18日:12℃,19日:14℃,20日:15℃,21日:12℃,22日:11℃,23日:9℃,24日:10℃,25日:11℃,26日:14℃,27日:13℃,28日:10℃,29日:12℃,30日:11℃。
气象统计预报习题一、名词解释S x ,描述样本中资料与平均值差异的平均状况,反映变量围绕平均值的平均变化程度(离散程度).样本:总体中的一部分资料组成样本。
j的自相关系数记为r (j )。
自相关系数也是总体相关系数ρ(j )的渐进无偏估计。
作为研究对象。
,也是通常所说的异常。
其公式为:X t 和 Y t (t=1,2,…,n ),分别为两个时间序列,则对时间间隔j 的落后交叉协方差为:二、简答题1。
● 距平序列相关系数: nt ,,2,1 =n t ,,2,1 =1. 相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化。
2. 相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量。
3. 相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制。
1)根据分析目的,确定X 的具体形态(距平或者标准化距平);2)由X 求协方差矩阵;3)求A 的全部特征值 、特征向量 ,h =1~H (通常使用Jacobi 法);4)将特征值作非升序排列(通常使用沉浮法),并对特征向量序数作相应变动;5)根据 ,h =1~H 和X 总方差,求出全部 、 , h =1~H ;6)由X 及主要 求其时间系数 、h =1~H ,主要的数量由分析目的及分析对象定;7)输出主要计算结果。
在气象统计预报中,选择因子往往需要计算很多相关系数,逐个检验很麻烦。
实际上,在样本量固定情况下,可以计算统一的判别标准相关系数, 若 ,则通过显著性的t 检验。
的计算过程如下:由 ,样本容量固定时,通过检验的t 值应该至少等于 ,故有 式中, 三、解答题 1. 应用实例[3.4]赤道东太平洋地区1982~1990年春季海温已在应用实例[3.3]中给出。
第一章气象资料及其表示方法一、数据资料的统计特征要素样本中资料分布的特点----用一些统计量表征。
1、平均值含义:平均值是要素总体数学期望的一个估计。
反映了该要素的平均(气候)状况。
2、距平含义:反映数据偏离平均值的状况,也是通常所说的异常。
**中心化**概念:把资料处理为距平的方法叫中心化特性:距平值的平均值为0,使用方便;直接作为预报值,比较直观(偏高/偏低)。
3、方差和均方差(标准差)含义:是均方差,描述样本中资料与平均值差异的平均状况,反映变量围绕平均值的平均变化程度(离散程度),是方差。
标准差大-----变化幅度大;均方差小的要素预报比大容易,变化幅度小;变量减去某常数后均方差相同。
累积频率:变量小于某上限的次数与总次数之比。
二、总体和样本1、总体(母体):统计分析对象的全体。
2、样本:总体中的一部分。
三、数据的标准化各要素单位不同、平均值和标准差也不同。
为使它们在同一水平上比较,采用标准化方法,使它们变成同一水平的无单位的变量----标准化变量(消除单位量纲的影响)。
证明:(1)标准化变量的平均值为0。
(2)标准化变量的方差为1。
峰度系数与偏度系数是用来衡量随机变量分布密度曲线形状的数字特征,描述了气候变量的分布特征。
偏度系数:表征曲线峰点对期望值(平均值)偏离的程度。
峰度系数:表征分布形态图形顶峰的凸平度(即渐进于横轴的陡度)。
三、状态资料和统计特征1.状态资料(离散型随机变量)表征气象要素的各种状态,观测结果无法用数据表示。
2.频率表、分布列----------列出各个状态出现的频率。
对样本而言是频率表,总体而言就是分布列。
四、多要素的气象资料两个方面来研究问题:“R型分析”:研究不同变量(要素)或同一要素不同格点之间的关系。
(行)“Q型分析”:研究样本之间的关系(列)。
五、统计量---协方差和协方差矩阵1.协方差衡量任意两个气象要素(变量)之间关系的统计量(正、负相关关系)(另外一个统计量叫相关系数)(距平的内积)反映了两个气象要素异常关系的平均状况,或者两个变量的正、负相关关系。
气象统计方法复习资料学习内容:Chapter 1-气象资料及其表示方法Chapter 2-选择最大信息的预报因子Chapter 3-气候稳定性检验Chapter 4-气候趋势分析Chapter 5-一元线性回归Chapter 6-多元线性回归Chapter 7-逐步回归Chapter-8-气象变量场时空结构分离复习题:1、气象统计预报是利用统计学方法对气象(气候)样本进行分析来估计和推测总体的规律性。
2、突变可分为:均值突变、变率突变、趋势突变。
3、气候统计诊断分析与天气统计诊断分析的不同点是研究对象不同,一个是(气候特征),一个是(天气特征)。
相同点是数据资料都必须是(长时间)的观测数据。
4、()需要对结论进行一系列的推断,分析结论的可信程度以及是否为因果关系。
A 统计分析;B统计诊断;5、采用统计诊断的方法研究天气、气候现象,可以用于哪些方面()<多选>。
A 了解区域性或者全球性天气、气候现象的时空分布特征、变化规律及异常程度;B 探索气候变量及其与其它物理因素之间的联系;C 对数值模拟结果与实际变化状况之间的差异进行统计诊断,为改进模式提供线索和指导;6、对天气、气候现象进行统计诊断分析,一般分为四步。
首先,();其次,();再次,();最后,()。
A科学综合和诊断;B选择诊断方法;C资料预处理;D收集资料;7、气候统计预测,一般分为四步。
首先,();其次,();再次,();最后,()。
A建立统计模型;B统计检验;C预测结论;D收集资料;8、统计预测模型在利用大量()观测资料对气候系统内部或与其它变量之间关系的变化规律及特征分析基础上建立的,用于对()状态进行估计。
在这一预测过程中,假设气候变化的成因和物理机制至少在()期间与()期间一致;气候系统保持稳定。
A过去;B未来;C预测;D观测;9、气候统计预测过程主要由以下4个要素构成:1、(),例如:夏季降水量,8月份高温日数、暴雨日数;2、(),通常为从某些统计上显著相关的预报因子群提取的有效信息;3、(),根据数据性质、预测对象和预测因子特点,选择合适的统计预测模型;4、(),对未来气候变化状态时间、空间、数量、性质等方面的预测。
学习内容:Chapter 1-气象资料及其表示方法Chapter 2-选择最大信息的预报因子Chapter 3-气候稳定性检验Chapter 4-气候趋势分析Chapter 5-一元线性回归Chapter 6-多元线性回归Chapter 7-逐步回归Chapter-8-气象变量场时空结构分离复习题:1、气象统计预报是利用统计学方法对气象(气候)样本进行分析来估计和推测总体的规律性。
2、突变可分为:均值突变、变率突变、趋势突变。
3、气候统计诊断分析与天气统计诊断分析的不同点是研究对象不同,一个是(气候特征),一个是(天气特征)。
相同点是数据资料都必须是(长时间)的观测数据。
4、()需要对结论进行一系列的推断,分析结论的可信程度以及是否为因果关系。
A 统计分析; B统计诊断;5、采用统计诊断的方法研究天气、气候现象,可以用于哪些方面()<多选>。
A 了解区域性或者全球性天气、气候现象的时空分布特征、变化规律及异常程度;B 探索气候变量及其与其它物理因素之间的联系;C 对数值模拟结果与实际变化状况之间的差异进行统计诊断,为改进模式提供线索和指导;6、对天气、气候现象进行统计诊断分析,一般分为四步。
首先,();其次,();再次,();最后,()。
A科学综合和诊断; B选择诊断方法; C资料预处理;D收集资料;7、气候统计预测,一般分为四步。
首先,();其次,();再次,();最后,()。
A建立统计模型; B统计检验; C预测结论; D收集资料;8、统计预测模型在利用大量()观测资料对气候系统内部或与其它变量之间关系的变化规律及特征分析基础上建立的,用于对()状态进行估计。
在这一预测过程中,假设气候变化的成因和物理机制至少在()期间与()期间一致;气候系统保持稳定。
A过去; B未来; C预测; D观测;9、气候统计预测过程主要由以下4个要素构成:1、(),例如:夏季降水量,8月份高温日数、暴雨日数;2、(),通常为从某些统计上显著相关的预报因子群提取的有效信息;3、(),根据数据性质、预测对象和预测因子特点,选择合适的统计预测模型;4、(),对未来气候变化状态时间、空间、数量、性质等方面的预测。
A预测技术; B预测依据; C预测结果; D预测对象;10、气象统计研究对象可以划分为()、多要素气象资料。
例如:1950-2016年南京7月份高温日数,属于()气象资料;例如某气象站7月份日降水量与08时相对湿度,属于()气象资料。
A 单要素; B多要素;11、根据预报(或预测、预估)对象的时间尺度可以进行如下划分:1、(),小于10天;2、(),10-30天;3、(),月、季、年;4、(),年代际或更长。
A天气预报; B延伸期预测; C气候预测; D气候变化预估;12、()是要素总体数学期望的一个估计,反映了该要素的平均(气候)状况;()是将变量值按大小顺序排列,处于中间位置的那个数,表征变量的中心趋势;()是要素(变量)值中出现次数最多的那个数,表征最容易发生的情况。
()是变量小于某上限的次数与总次数之比。
A 平均值;B 中位数;C 众数;D 累积频率;13、观测序列为(1,3,3,3,5,6,7,8,9),平均值是(),中位数是(),众数是()A 3;B 5;C 6;D 7;14、观测序列为(1,3,3,3,5,6,7,8,18),平均值是(),中位数是(),众数是()A 3;B 5;C 6;D 7;15、甲地区12月份气温的均方差(标准差)为1.75,1月份气温均方差为1.09。
乙地区12月份气温的均方差(标准差)为1.61,1月份气温均方差为2.03。
对甲地区来说,()月份气温变化幅度较大;对乙地区来说,()月份气温变化幅度较大;就12月份而言,()地区气温变化幅度较大。
A 甲;B 乙;C 12;D 1;16、累积频率是变量小于某上限的次数与总次数之比。
观测序列为(1,3,3,3,5,6,7,8,9)。
上限为4的累积频率为()/9,上限为7的累积频率为()/9。
A 2;B 4;C 6;D 8;17、()是指统计分析对象的全体。
()是指总体中的一部分。
气象上的总体指无限总体,一组气象资料就是无限总体的()。
1950-2016年南京地区夏季降水量这组气象观测资料属于()。
()的特征是客观存在的,不是随机变量。
()的特征随所取的样本而变化,与其有关的变量也称为随机变量,如平均值、均方差等。
A 总体;B 样本;18、在随机事件中,随着试验次数的增加,事件发生的频率趋于一个稳定值(概率)。
()是事件的总体特征;()是事件的样本值。
A 概率;B 频率;19、为使不同要素的观测数据在同一水平上比较,采用标准化方法,使它们变成同一水平的无单位的变量。
气象观测数据标准化后的平均值是(),均方差是()。
A -1;B 0;C 1;20、研究某一区域时,若区域中m个站气象要素变化具有较好的一致性,可以把这一区域当作一个点来研究。
可使用()法,选用最具代表性的站; 或使用()法,采用m个站的平均值。
A 区域平均; B代表站;21、 n次观测次数中,事件A出现nA次,则事件A的频率P(A)为nA/n。
观测次数n足够大,P(A)稳定接近某个常数,这就是( )。
概率描述的是总体特征,而()是样本的特征。
A 概率;B 频率;C 事件;22、布袋中有4个球,分别标有A、B、C、D。
从布袋中拿出1个球。
拿到的球有()种可能。
从布袋中拿出2个球(考虑先后顺序),总共有()种可能。
从布袋中拿出2个球(不考虑先后顺序),总共有()种可能。
A 4;B 6;C 8;D 12;23、夏天某地区冰雹出现概率为0.03。
5天中有一次冰雹的概率为();至少有一次冰雹的概率为()(多选)。
A、0.03×5=0.15;B、C51×0.031×0.974=0.1328;C、C51×0.031×0.974+C52×0.032×0.973+C53×0.033×0.972+C54×0.034×0.971+C55×0.035×0.970=0.1413;D、1- C50×0.030×0.975=0.1413;24、自然界中各现象间存在普遍的关联。
这种关系可分为两种:物理意义明确,可用数学函数表达的关系称为();统计上的相互关联称为()。
A 确定性关系;B 非确定性关系;25、统计分析中用相关系数度量各现象(各要素)间的相关程度。
下列三个相关关系示意图中,表示非线性相关关系的是(),表示完全线性相关的是(),表示负线性相关关系的是()。
26、相关系数r的绝对值越(),表示两变量之间关系越密切。
r越接近1.0,()相关越显著;r越接近-1.0,()相关越显著。
A 小;B 大;C 正;D 负;27、根据统计学中大样本定理,通常认为样本量n大于()才有统计意义。
当样本量较小时,计算所得相关系数可能会离总体相关系数甚远。
这时,需要对相关系数加以校正。
A 10;B 20;C 30;D 40;28、检验某一地区气候是否具有稳定性、两个地方的气候是否有显著差异可以基于均值进行检验,检验方法有()和t检验。
方差反映了某一变量观测数据的偏离程度,它也是变量稳定与否的重要测度。
基于方差的检验方法有()和F检验。
A χ2检验;B u检验;C t检验;D F检验;29、随时间变化的一列气候数据构成了一个()。
例如:1921-2000年南京地区夏季降水量。
它的特征有:数据的取值随时间变化;数据采样可能受到不确定因素的影响;还有,()<多选>。
A 气候时间序列;B 前后时刻的数据之间可能存在关联;C 时间序列整体可能上有上升或下降趋势;D 时间序列可能呈现周期性振荡;E 从某一时刻开始,数据取值可能出现转折或突变;30、用xi表示样本量为n的某一气候变化,用ti表示xi所对应的时间,建立xi和ti之间的一元线性回归方程:。
其中,为回归方程计算值,a为( ),b为( )回归系数。
使n对计算值( )和观测值(xi)的误差平方和达到最小,可采用( )计算出a和b。
系数b表示了()。
b符号为正,说明变量随时间t的增加呈()趋势,反之则为()趋势。
r为时间ti和观测数据xi所的相关系数。
r表示变量x与时间变化的关联程度。
要判断变化趋势的程度是否显著,就要对()进行显著性检验。
A 回归系数;B 回归常数;C 最小二乘法;D 变量x随时间的趋势倾向;E 下降;F 上升; H 相关系数;31、下列回归方程中,表示非线性回归的是( ),表示一元线性回归的是( ),表示多元线性回归的是( )。
32、在气象预报中,对预报量的预报常常需要从可能影响预报量y的诸多因素中挑选一批关系显著的作为预报因子。
在应用多元线性回归的方法建立回归方程来做预报时,既要选择对预报量影响显著的因子,又要使回归方程的残差方差估计很小,这样才有利于气象预报。
()方法就是选择这种最优的回归方程。
一般分为三种方案:逐步剔除方案,逐步引进方案,双重检验的逐步回归方案。
从包含全部变量的回归方程中逐步剔除不显著的因子的方案是,()。
在一批待选的因子中,考查他们对预报量y的方差贡献,挑选所有因子中方差贡献最大者,经统计检验是显著的,进入回归方程,这种方案是()。
将因子一个个引入,引入因子的条件是该因子的方差贡献显著;同时,每引入一个新因子,要对老因子逐个检验,将方差贡献变为不显著的因子剔除。
这种方案是()。
A 逐步回归;B 逐步剔除方案;C 逐步引进方案;D 双重检验的逐步回归方案;33、利用一元线性回归方法进行线性趋势分析中,回归系数b的符号说明了气候变量x的趋势倾向。
当b>0说明随时间的增加,变量x是呈(上升或下降)趋势;当b<0,则变量x是呈____上升或下降)趋势。
b 值的大小反映了上升或下降的速率,b的绝对值越大,表明直线越(倾斜或平滑)。
34、标准化的气象资料的平均值是 0 ,均方差为 1 ,无单位。
二:简答题1、什么是累积频率?变量小于某上限值的次数与总次数之比。
2、什么是分布函数?在无限总体中的累积频率3、什么是均值突变?从一个气候基本状态向另一个气候基本状态的急剧变化。
4、在气象中如何利用回归方程进行预报,写出预报过程。
答:1) 确定预报量并选择恰当的因子2) 根据数据计算回归系数标准方程组所包含的有关统计量(因子的交叉积、矩阵协方差阵或相关阵,以及因子与预报量交叉积向量)3)解线性方程组定出回归系数4)建立回归方程并进行统计显著性检验5)利用已出现的因子值代入回归方程作出预报量的估计,求出预报值的置信区间5、试举例说明哪些方法(不少于三种)可以进行气候变化趋势分析?答:1)线性倾向估计2)滑动平均3)三次样条函数6、何谓偏相关系数?答:当存在三个以上变量相互影响时,如(x1,x2,y ),当消除 x1(或x2)的影响,计算x2 (或x1 )与 y的相关系数时,就称为偏相关系数。