当前位置:文档之家› 形势场相似计算方案的比较研究0803

形势场相似计算方案的比较研究0803

形势场相似计算方案的比较研究

董良淼1),李宇中2)

1)(广西自治区气象台,广西南宁 530022)

2)(广西气象局,广西南宁 530022)

摘要

结合天气分析方法,对常用的形势场相似算法效果进行了对比分析,结果表明:“相关系数”是较好的“形”相似判据;对经向和纬向分别计算相似度可以发掘出更多有预报参考价值的信息;另外,对相似计算方案的边界条件及执行效率等问题也作了探讨。

关键词:形势场相似判据相似算法天气分析

Comparison of Several Analogue Arithmetic for Situation Field

Dong Liang-miao1),Li Yuzhong2)

1) (Guangxi Meteorological Observatory, Nanning,Guangxi, 530022, China)

2) (Guangxi Meteorological Bureau, Nanning,Guangxi, 530022, China)

Abstract: Combine synoptic analysis method, several analogue arithmetic frequently used are tested and discussed.Result indicated that correlation coefficient is better shape similarity criterion;calculate longitude and latitude similarity separatly can dig out more informations that have the forecast reference value.

Keywords: Situation Field,Similarity Criterion,Analogue Arithmetic,Synoptic Analysis

引言

相似预报方法是一种在台站天气预报业务中得到广泛使用的统计预报方法,由于它能够综合考虑天气发展过程的三维结构特征,并且兼顾大气本身的线性和非线性变化规律〔1〕,因而在各种动力、数值预报方法迅速推广普及的今天,仍有其生命力和独特的实用价值。

相似预报效果的好坏,关键在于相似性判据的选择及其计算方案的实现。一般来说,衡量两个样本属性相似程度的判据可分为两大类:“值”相似判据和“形”相似判据。具体到对天气形势场这类研究对象而言,前者主要刻画了样本间的振幅(能量)差异,后者则侧重于样本间的流型(位相)差异。常用的“值”相似判据有“绝对距离”(海明距离)、“欧氏距离”等,“形”相似则多采用“相关系数”、“相似系数”等来衡量,文献〔1〕对这几种判据作了介绍和比较。

显然,对两个天气形势场之间的相似性判别,需要综合考虑“值”和“形”的差异,并在二者之间做出合理的权衡。李开乐〔2〕较早地提出以综合考虑了“值”“形”相似的“相似离度”统计量作为相似预报的相似性判据,此后得到普遍推广,目前在广西气象台的一些天气预报业务系统中仍有使用〔3,4〕;阎惠芳〔1〕等经分析比较后认为,使用相似系数和相对欧式距离系数分别作为“形”、“值”相似的判据,进行综合分析效果较好。与上述两种方案不同,毛卫星〔5〕等提出用“相关系数”作为“形”相似的判别标准,并采用了一种将“形”、“值”系数相乘的非线性综合方案。此外,钟元〔6〕等还提出了一种将形势场的经向相似和纬向相似分别计算、最后再综合的相似系数求解思路。

上述几种现代常用相似分析方法的实际业务效果如何?本文将从天气分析的角度出发,对它们及一些相关的边界问题进行比较研究,以期归纳出最适合实际预报业务使用的形势场相似求解方案。

1 资料和方法

以ECWMF 24小时500hpa格点预报场作为“实况”天气形势场;历史个例样本资料库选用ECWMF1970~2001年北半球逐日格点分析场资料。

进行对比分析的形势场相似系数计算方案有四种,分别是“常规相似离度法”(即李开乐法,简称方法1)、“综合相似系数法”(即阎惠芳法,简称方法2)、“非线性相似离度法”(即毛卫星法,简称方法3)和“经纬向复合离度相似法”(简称方法4)。

编制上述四种方法的计算程序,在初始条件(实况场)一致的情况下分别对历史资料库进行检索;遍历1970~2001年同期天气形势场,计算出每个历史形势场与当前实况场的相似系数值,然后排序输出该方案判定的前10个最相似个例日期;最后用MICAPS系统分别调出这10个最相似个例的形势场分析图,与实况场进行人工比对,根据预报员的天气分析经验来判定每种方法检索结果的优劣。

2 相似计算方案的比较分析

2.1 几种相似计算方案的算法比较

由于方法1、2、3对“形”和“值”相似的判据选择各不相同,直接导致这3种相似系数算法有明显的区别:其中,方法1使用了原创性的“形”相似判据,其特点是计算简便、且两个相似系数具有相同的数量级,可简单地进行线性加权综合。方法2使用“相似系数”作为“形”相似的判据、“值”相似也采用了其

它两种方案都不推荐的“欧氏距离”判据;由于二者直接计算结果的数量级不同,该方法对欧氏距离作了标准化处理改进。方法3使用“相关系数”作为“形”相似的判据,尽管计算愈发复杂,但其理论依据却更为充分;为克服“形”“值”两种相似系数数量级不同的缺陷,该方法以“形”、“值”系数相乘的方式来进行非线性综合,其总体计算复杂度反而较方法2有了明显简化。以上三种计算方案的区别具体列表如下:

表1 三种相似计算方案的比较

常规相似离度法(方法1)综合相似系数法

(方法2)

非线性综合相似离度法

(方法3)

“形”相似判据平均因子差值

离散度

相似系数相关系数

“值”相似判据海明距离相对欧氏距离海明距离

“形”“值”相似

综合方案

线性综合(相加)线性综合(相加)非线性综合(相乘)

算法特点

以加、减法运算为

主,算法简便。

求解相似系数时乘、

除、乘方、开方运算多,

且还需计算相对距离,运

算最为繁琐。

求解相关系数时乘、除、

乘方、开方运算多,运算较

复杂;但综合方案简便。

方法4比较特殊,它的新颖之处是对经向、纬向相似的分别处理。本文着重验证该创新思路对相似预报结果产生的影响。

2.2 相似计算效果比较

相似方案实际应用效果的好坏与“形”、“值”相似判据的优劣,以及两判据综合方式的合理程度这三个方面有直接关系,以下对这几个方面分别进行分析比较。

2.2.1 “形”相似计算效果比较

表2 三种“形”相似判据计算结果比较

最相似个例排序常规相似离度法

(方法1)

综合相似系数法

(方法2)

非线性综合相似离度法

(方法3)

日期

“形”

系数值

日期

“形”

系数值

日期

“形”

系数值

1 1995.12.2918.661995.12.290.000009991993.1.270.0113

2 1978.2.2819.691993.1.270.000012311995.12.290.0167

3 1993.1.2721.111978.2.280.000012631982.1.180.0176

4 1981.1.1522.901996.2.90.000014051970.1.150.0190

5 1972.3.323.101972.3.30.000014271977.3.40.0199

6 1996.12.2224.121981.1.150.000014571987.1.120.0203

7 1996.2.924.141996.12.220.000015291972.3.20.0204

8 2001.3.1124.661981.1.160.000015621976.1.50.0204

9 1999.12.2425.302001.3.110.000015711996.2.90.0205

10 1979.2.1725.311979.2.170.000016371978.2.280.0208

备注平均因子差值离散度相似系数相关系数表2为分别采用三种不同的“形”判据方案对2007年2月1日20时500hpa

实况场(即ECWMF 的2007年1月31日20时500hpa 24小时预报场,以下同)进行检索,得出的1970~2001历史同期(历年2月1日的前后45天)前10个最为“形”相似的个例结果。其中为统一起见,方法2、3的“形”系数值(Sij)都作了“1-Sij”的处理,以便能从小到大地排序表示最相似的程度。

从表中可以看出,尽管“相似系数”和“相关系数”这两种方案的计算公式极为相近(区别在于后者使用距平值来进行运算),但得出的结果却大相径庭,最相似个例的排序也有明显区别。而方法1、2的计算方案虽有差异,但得出的最相似个例结果却非常接近,只是次序稍有不同而已。例如,1982.1.18这一天是方法3选出的第三“形”相似个例,而方法1、2均未将其列入前十名之列;1978.2.28在前两个方法中均有较高的排名,而方法3只将它列在靠后的位置。调出实况场和上述个例的历史形势场,可以直观地分析判断三种方案计算结果的优劣(扇形框内为进行相似检索计算的格点范围):

图1、典型个例形势场的“形”相似度比较单位:位势米/ dgpm

实况场(图1a)的典型特征是:青藏高原东侧有一个明显的低槽,云贵高原到华南西部一带则受高压脊控制;这两个特征在1993.1.27(图1b)、1982.1.18(图1c)的分析图中都有不同程度的反映;相比之下,1978.2.28(图1d)分析图的青藏高原东侧已经是弱高压脊控制、云贵高原上空也是一个浅槽区,流型的相位有明显差异。这说明,方法3的排序结果更为合理。

“相关系数”一直以来是描述两个序列波动位相异同程度的首选,有充分的理论依据;大量类似的对比分析表明,使之作为“形”相似的判据,较之其它两种方案有更好的效果。文献[1]也曾指出,“相似系数”并非完全反映“形”相似的特征,其中还掺杂有“值”相似的成分;鉴于方案1、2的输出结果近似,有理由认为,文献[2]提出的“形”相似判据也可能或多或少地包含有“值”相似

的信息,因此,当它们与“值”相似系数进行1:1线性综合时,实际上是突出了“值”相似的特征、而将“形”相似弱化了。

2.2.2 值相似计算效果比较

表2为两种不同“值”判据方案对2007年2月1日20时500hpa实况场32年历史同期最相似个例检索结果。比较发现,这两种方案的排序结果基本相同。可以认为,使用绝对距离和欧氏距离来表征两个序列的“值”差异程度,其效果是等同的。

表3、两种“值”相似判据计算结果的比较

最相似个例排序绝对(海明)距离法

(方法1、3)

相对欧氏距离法

(方法2)

日期“值”系数日期“值”系数

1 1995.12.2918.851995.12.290.0649

2 1996.2.924.551996.2.90.0760

3 1972.3.324.671972.3.30.0768

4 1996.12.2224.791981.1.150.0810

5 1981.1.1525.271996.12.220.0832

6 1999.12.2425.491999.12.240.0842

7 1979.2.1726.201979.2.170.0846

8 1972.3.1226.271981.1.160.0883

9 1981.1.1626.521978.2.280.0888

10 2001.3.1126.711995.2.50.0907

备注平均因子差值离散度相似系数

值得指出的是,计算海明距离只需进行简单的加减和符号判断运算,而计算欧氏距离则需使用复杂的乘方和开方运算;从计算效率上看,前者显然优于后者。

2.2.3 综合相似结果比较

除了与判据的选择有关外,综合相似结果的优劣还取决于“形”“值”两个判据综合方式的合理程度。从表2、表3的对比分析可以看出,方法1“形”“值”两个相似系数的量级相同,相近个例之间系数差值的量级也基本相同,采用线性综合方案是合理的;方法2尽管可以保证“形”“值”两个相似系数的取值在0~1之间,但二者之间仍有3~4个数量级的差距,采用线性综合方案仍无法做到“形”“值”均等兼顾。方案3的设计者显然注意到了两种判据物理意义上的本质区别并不能简单用标准化方法来彻底消除,进而采用了将两系数相乘的非线性综合方案,从而相对合理地解决了这个问题。

表4是三种计算方案的综合输出结果排序,其中,为均衡起见,我们对方法2的“形”系数作了三个量级的放大,使之与“值”系数具有相同的量级。

表4 三种综合相似计算结果的比较

最相似个例排序

常规相似离度法

(方法1)

综合相似系数法

(方法2)

非线性综合相似离度法

(方法3)

日期

“形”

系数

“值

系数

综合

系数

日期

“形”

系数

“值”

系数

综合

系数

日期

“形

系数

“值”

系数

综合

系数

1 1995.12.29 18.66 18.85 18.76 1995.12.29 0.010 0.065 0.037 1995.12.29 0.017 18.85 0.32

2 1972.3.

3 23.10 24.67 23.88 1996.2.9 0.01

4 0.076 0.04

5 1993.1.27 0.012 32.99 0.39

3 1981.1.15 22.90 25.27 24.09 1972.3.3 0.01

4 0.077 0.046 1996.2.9 0.020 24.5

5 0.50

4 1996.2.9 24.14 24.5

5 24.35 1981.1.15 0.015 0.081 0.048 1972.3.3 0.023 24.67 0.57

5 1996.12.22 24.12 24.79 24.45 1996.12.22 0.015 0.083 0.049 1970.1.15 0.019 30.70 0.58

6 1978.2.28 19.70 30.52 25.11 1979.2.1

7 0.016 0.085 0.051 1981.1.15 0.024 25.27 0.60

7 ………………………………(10) 1996.12.22 0.025 24.79 0.62 (13) 1993.1.27 21.11 32.99 27.05

(15) 1993.1.27 0.012 0.102 0.057

备注1:1线性平均综合1:1线性平均综合相乘综合

从表中可以看出,尽管作了量级方面的改进,方法2的输出结果仍与单独考虑“值”相似的计算结果基本相同;前面分析已指出,尽管方法1的“形”“值”

综合方案比较合理,但由于其“形”系数可能包含有“值”相似的信息,最后的个例输出与方法2吻合度较高也就不难理解了。相比之下,方法3的输出结果有明显的不同:其中1993年1月27日位居最相似个例的第二位,而该日在方法1、2的结果排序中分别位于第13、15位。

图2、三种相似计算方案第二最相似个例形势场的相似度比较单位:位势米/ dgpm

图2是三种方案第二相似个例的对比图。可以看出,1993.1.27(图2b)形势场与实况场(图2a)的关键天气系统(槽脊)特征基本相同,只是在青藏高原到华南西部一带地区上空的位势梯度有较大差异(实况场的等高线较为稀疏、相似场则较稠密);相比之下,1972.3.3形势场(图2c)中的云贵高原上空没有高压脊存在、而1996.2.9形势场(图2d)中的青藏高原一带完全处于高压脊控制,流型有了明显的改变。

在区域天气预报实践中,槽脊的位置往往对天气现象的发生起关键作用。从这个角度看,方法3排序结果的预报参考价值更高。

2.3 经、纬向分别处理对计算结果的影响

方法1~3在处理不同经纬度的格点信息时,都是按一定顺序以一维序列的处理方式进行的。方法4则采用了文献[4]首先提出的先分别计算经向相似和纬

向相似系数、最后再综合的思路:使用与方法3相同的、以“相关系数”为“形”判据、“海明距离”为“值”判据的序列相似计算方案;在扫描区域网格内,对每一条经线计算南北向序列相似系数、对每一条纬线计算东西向序列相似系数;以所有经向序列相似系数的平均值作为经向相似度、所有纬向序列相似系数的平均值作为纬向相似度;最后将经、纬向相似度的线性和作为整个形势场的综合相似离度。将最后输出与方法3作一比较,结果是“戏剧性”的(见表5):

表5 经纬向相似分别计算后的输出结果比较

最相似

个例 排序 经纬向复合离度相似法

(方法4)

非线性综合相似离度法

(方法3)

日期 经向 系数 纬向 系数 经纬向综合 日期

“形” 系数 “值” 系数 综合 系数 1 1995.12.29 4.246 0.722 4.968 1995.12.29 0.017 18.854 0.315 2 1970.1.15 3.720 2.002 5.722 1993.1.27 0.012 32.989 0.386 3 1978.2.28 4.457 1.400 5.857 1996.2.9 0.020 24.547 0.502 4 1994.3.4 3.213 2.919 6.132 1972.3.3 0.023 24.668 0.571 5 1970.2.11 4.800 1.754 6.554 1970.1.15 0.019 30.697 0.582 6 1995.1.5 4.982 1.679 6.661 1981.1.15 0.024 25.268 0.601 7 1972.3.12 4.103 2.718 6.821 1977.3.4 0.020 30.454 0.608 8

1979.2.14

5.556

1.376

6.932

1972.3.12

0.023

26.275

0.616

对比后可以看出,将经、纬不同方向的相似度差异分别加以考虑后,输出的相似个例结果有了非常明显的改变,而且这些新个例往往是前3种计算方案都不曾考虑到的。

图3 方法3和方法4典型相似个例形势场的相似度比较 单位:位势米/ dgpm

图3d 是综合考虑经、纬向不同相似度后的第二最相似个例输出结果,从中可以分析出该方案与方法3的细微差别:图中广西区域上空处于脊前,这与实况场(图3a )中的特征相吻合,而在方法3第二最相似个例场(图3c )中广西区

域则处在脊后槽前;另外,图3d青藏高原东部一带的高空槽结构也比图3c中的更加完整。单从天气分析的角度考虑,图3d所描述的天气形势较之图3c更接近实况。

另一方面,更重要的是,类似图3d这样的、预报员认为更有分析参考价值的形势场,采用前3种计算方案却无法发掘出来,这充分表明:对经向和纬向的差异性应区别考虑,这在相似预报方案设计中有其独特的重要性。

2.4 边界条件对计算结果的影响

相似计算方案主要有时间和空间两个边界条件:即“历史同期”过程的时间检索范围、以及对每个形势场的扫描(对比)区域范围。

“历史同期”时间段的选取决定了进行相似检索计算的样本量,它对输出结果有直接影响。分别按每一年起报日的前后30天、前后45天、前后60天和前后90天这四个时间范围进行相似过程检索,结果表明,起报日前后30天范围一般可涵盖70% 以上的最相似个例(前十个统计,以下同),但不太稳定(最少时候只能达到50% );若将检索范围增加到起报日前后45天,则可稳定集中90%以上的最相似个例;而继续增加样本范围到历史同日的前后60天、乃至前后90天,已几乎不会对输出结果(特别是前五名个例的排序)产生影响。

在空间扫描范围方面,大量的对比分析表明,程序实际扫描区域比预报关注的中心区域扩大5~10个经纬距为宜;向海洋、高原等测站稀疏区域外延时幅度可适当缩小。过大或太小的扫描区域都会显著改变相似计算结果及其预报可参考性――可能使相似个例在预报中心区的关键系统特征被弱化、或者在大范围的流场特征上不尽人意(图略)。

2.5 计算效率的比较

在检索时段设置为历史同日前后45天、扫描区域设定为90°E~130°E、10°N~40°N,在同一台P4 2.9GHz计算机运行条件下,对上述4种方案的计算耗时进行了比较,依次为137.578″(方法1)、139.375″(方法2)、138.78″(方法3)和139.515″(方法4)(每次测试均采用重新开机启动、第一次进入窗口界面后再执行程序的方法,以杜绝系统高速缓存对程序运行带来的影响),差距微乎其微。由此可以看出,尽管方法4的计算过程最为繁琐,但现今IT技术发展水平已使得普通电脑的CPU运算能力已不再是进行类似运算的瓶颈;进一步的对比发现,程序在存取资料方面的耗时最多(历史格点分析资料都存储在硬盘上):例如,将检索时间段设置为起报日前后30天(总存取样本量减少了1/3),各种方法的运算时间缩短为约1分半钟;而改变格点扫描范围则几乎对运算时间没有影响。系统高速缓存对程序运行时间的影响非常明显――重复运行相似程序或执行检索操作,其结果输出时间可比程序首次运行输出时间要缩短2/3~1/2左右,这说明数据被缓存到内存缓冲区后,再次访问耗时就显著减少。

3 小结和讨论

(1)采用“相关系数”作为“形”相似的判据更为合理,而采用“绝对距离”来表征“值”相似则效率更高。

(2)采用对经向相似和纬向相似分别计算、再进行综合的方案可以发掘出更多有预报参考价值的形势场相似个例。

(3)历史相似日期的检索时间范围应设置在历史同日的前后45天~60天;超出该范围,要么导致有价值的相似个例被遗漏,要么造成运算时间过多耗费、

达不到理想的检索效果。

(4)相似空间的扫描范围以比预报关注中心区域稍扩大5~10个经纬距为宜。

此外,经过大量的过程对比分析也发现,现有相似计算方案在实现预报员所期望的、能客观分析出“形”“值”俱佳、排序合理的最佳相似个例方面仍有一些缺憾:即便是计算出来的“最相似个例”,从天气分析的角度看与实况场仍存在较大的差别,这也说明相似预报方法存在一些局限性。鉴于大气是一个复杂的非线性系统,近几十年来的气候变化因素又使得现今的天气形势及其发展变化规律较之从前又有了明显的不同;基于历史形势相似的分析方法对实际预报来说只能作为一种参考。较合理的相似方法应用途径是:将相似分析结果作为预报结论的初始场,通过数值预报产品和指标进行订正,最后得出更贴近实况、准确率更高的预报结果。

参考文献:

[1]阎惠芳, 李社宗,黄跃青等.常用相似性判据的检验和综合相似系数的使用[J].气象科技,2003,31(4):211—215.

[2]李开乐. 相似离度及其使用技术[J].气象学报,1986,44(2):174-183.

[3]林宗桂,胡勇林,陈翠敏.玉林市前汛期暴雨短期定量预报方法初探[J] .广西气象,2004,25(B12):9-12.

[4]何小娟. 相似离度在钦州市月降水量预报中的应用[J].广西气象,2002,23(2):16-18.

[5]毛卫星,许晨海,何立富等. 多时次多尺度波谱相似预报风要素[J]. 气象,2005,31(10):28-31.

[6]钟元,胡波. 综合评估环境场影响的热带气旋路径客观相似预报模式 [J]. 热带气象学报,2003,19(2):147-156.

作者简介董良淼(1973-),女,壮族,广西南宁人,广西自治区气象台高级工程师,主要从事中短期天气预报工作。

通讯地址:广西南宁市民族大道81号广西自治区气象台邮编:530022

电话:0771-*******;138********;email:nnliangmiao@https://www.doczj.com/doc/318884690.html,

相关主题
文本预览
相关文档 最新文档