当前位置:文档之家› 气象统计方法实习BD

气象统计方法实习BD

气象统计方法实习BD
气象统计方法实习BD

实习一:气候场、距平场、均方差场

编程如下:

parameter(ii=37,jj=17,mon=12,year=4)

real var(ii,jj,mon,year),ave(ii,jj,mon),jp(ii,jj,mon,year)

real s(ii,jj,mon)

integer i,j,iy,m

open(5,file='d:\ex1\h500.dat')

open(6,file='d:\ex1\ave.grd',form='binary')

open(7,file='d:\ex1\jp.grd',form='binary')

open(8,file='d:\ex1\s.grd',form='binary')

open(12,file='d:\ex1\outall.grd',form='binary'

open(9,file='d:\ex1\ave.txt')

open(10,file='d:\ex1\jp.txt')

open(11,file='d:\ex1\s.txt')

!读数据

DO iy=1,4

do m=1,12

!ccc read h500

read(5,1000)

read(5,2000) ((var(i,j,m,iy),i=1,ii),j=1,jj)

enddo

enddo

!计算气候场

do j=1,jj

do i=1,ii

do m=1,12

ave(i,j,m)=var(i,j,m,1)+var(i,j,m,2)+var(i,j,m,3)+var(i,j,m,4)

ave(i,j,m)=ave(i,j,m)/4.0

enddo

enddo

enddo

!计算距平场

do iy=1,4

do m=1,12

do j=1,jj

do i=1,ii

jp(i,j,m,iy)=var(i,j,m,iy)-ave(i,j,m)

enddo

enddo

enddo

enddo

!计算均方差场

do j=1,jj

do i=1,ii

do m=1,12

s(i,j,m)=jp(i,j,m,1)*jp(i,j,m,1)+jp(i,j,m,2)*jp(i,j,m,2)+jp(i,j /,m,3)*jp(i,j,m,3)+jp(i,j,m,4)*jp(i,j,m,4)

s(i,j,m)=s(i,j,m)/4.0

s(i,j,m)=sqrt(s(i,j,m))

enddo

enddo

enddo

do iy=1,4

do m=1,12

write(6)((ave(i,j,m),i=1,ii),j=1,jj)

write(7)((jp(i,j,m,iy),i=1,ii),j=1,jj)

write(8)((s(i,j,m),i=1,ii),j=1,jj)

write(9,2000)((ave(i,j,m),i=1,ii),j=1,jj)

write(10,2000)((jp(i,j,m,iy),i=1,ii),j=1,jj)

write(11,2000)((s(i,j,m),i=1,ii),j=1,jj)

write(12)((ave(i,j,m),i=1,ii),j=1,jj)

write(12)((jp(i,j,m,iy),i=1,ii),j=1,jj)

write(12)((s(i,j,m),i=1,ii),j=1,jj)

enddo

enddo

1000 format(2i7) 2000 format(37f8.1) close(5)

close(6)

close(7)

close(8)

close(9)

close(10)

close(11)

close(12)

end

给ave配的ctl文件:

dset ^d:\ex1\ave.grd

undef -9.99E+33

title NCEP/NCAR REANALYSIS PROJECT xdef 37 linear 60.000 2.500 ydef 17 linear 0.000 2.500

zdef 1 levels 500

tdef 12 linear JAN1982 12mo vars 1

ave 1 99 H500

endvars

给ave配的gs文件:

'reinit'

'open d:\ex1\ave.ctl'

'enable print d:\ex1\ave.gmf'

mon=1

while(mon<=12)

'set t 'mon''

'd ave'

'draw title qihouchang of 'mon' '

'print'

'c'

mon=mon+1

endwhile

'disable print'

;

气候场图:

一月份高度的气候场呈现南高北低的状态,陆地上的高度场比较稀疏,而在西太平洋上高度场比较密集。

八月份高度的气候场呈现东高西低的状态,在我国东北部以北以及印度东北部出现低压中心,而在赤道西太平洋地区出现高压中心。35°N以北高度分布很密集,而35°N以南比较稀疏。

给jp配的ctl文件:

dset ^d:\ex1\jp.grd

undef -9.99E+33

title NCEP/NCAR REANALYSIS PROJECT

xdef 37 linear 60.000 2.500

ydef 17 linear 0.000 2.500

zdef 1 levels 500

tdef 48 linear JAN1982 1mo

vars 1

jp 1 99 H500

endvars

给jp配的gs文件:

'reinit'

'open d:\ex1\jp.ctl'

'enable print d:\ex1\jp.gmf'

year=1982

while(year<=1985)

mon=1

while(mon<=12)

'set t 'mon''

'd jp'

'draw title jupingchang of 'year'.'mon''

'print'

'c'

mon=mon+1

endwhile

year=year+1

endwhile

'disable print'

;

距平场图:

1983年6月距平场在日本地区出现低压中心,在我国南部出现高压中心,在亚洲西北部也有

高压中心。赤道至25°N间以及25°N-40°N,60°E-100°E间基本都是正距平,而在25°N-40°N,100°E-150°E间基本都是负距平。

1984年7月距平场在亚洲大陆西部、日本地区、赤道西太平洋地区形成低压中心,太平洋西北部形成高压中心。

给s配的ctl文件:

dset ^d:\ex1\s.grd

undef -9.99E+33

title NCEP/NCAR REANALYSIS PROJECT

xdef 37 linear 60.000 2.500

ydef 17 linear 0.000 2.500

zdef 1 levels 500

tdef 12 linear JAN1982 12mo

vars 1

s 1 99 H500

endvars

给s配的gs文件:

'reinit'

'open d:\ex1\s.ctl'

'enable print d:\ex1\s.gmf'

mon=1

while(mon<=12)

'set t 'mon''

'd s'

'draw title junfangchachang of 'mon' ' 'print'

'c'

mon=mon+1

endwhile

'disable print'

;

均方差场图:

一月份高度的均方差场整体呈现南小北大的状态。说明低纬地区高度的波动幅度比较小,而中高纬地区高度的波动比较大。

八月份高度的均方差场在亚洲大陆西部有极大值,在30°N处包括赤道-30°N 、60°E-85°E这些区域高度的波动幅度比较小,30°N以南以北地区高度的波动幅度较大。

实习二:相关系数

Fortran程序如下:

program ex2

integer,parameter::n=20,p=10

integer i,j,t1,t2,t3

real a(n),b(n),jpa(n),jpb(n),zxfc1(p),zxgxs1(p),zxfc2(p),zxgxs2(p),lhxfc(p),lhxgxs(p) real::s1=0.0,s2=0.0,sum1=0.0,sum2=0.0,sum3=0.0,ave1,ave2,r,fc1,fc2

data

a/3.40,3.30,3.20,2.90,3.40,2.80,3.60,3.00,2.80,3.00,3.10,3.00,2.90,2.70,3.50,3.20,3.10, 2.80,2.90,2.90/

data

b/3.24,3.14,3.26,2.38,3.32,2.71,2.84,3.94,2.75,1.83,2.80,2.81,2.63,3.20,3.60,3.40,3.07, 1.87,2.63,2.47/

data jpa/0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0/

data jpb/0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0/

data zxfc1/0,0,0,0,0,0,0,0,0,0/

data zxgxs1/0,0,0,0,0,0,0,0,0,0/

data zxfc2/0,0,0,0,0,0,0,0,0,0/

data zxgxs2/0,0,0,0,0,0,0,0,0,0/

data lhxfc/0,0,0,0,0,0,0,0,0,0/ data lhxgxs/0,0,0,0,0,0,0,0,0,0/

!求均值

do i=1,n

s1=s1+a(i)

enddo

ave1=s1/n

do i=1,n

s2=s2+b(i)

enddo

ave2=s2/n

!求距平

do i=1,n

jpa(i)=a(i)-ave1

enddo

do i=1,n

jpb(i)=b(i)-ave2

enddo

!求相关系数

do i=1,n

sum1=sum1+jpa(i)*jpa(i)

sum2=sum2+jpb(i)*jpb(i)

sum3=sum3+jpa(i)*jpb(i)

enddo

r=sum3/(sqrt(sum1*sum2))

print*,'中国1970-1989年年平均和冬季平均气温的相关系数为r=',r !求方差

fc1=sum1/n

fc2=sum2/n

!求自协方差

do j=1,p

do i=1,n-j

zxfc1(j)=zxfc1(j)+jpa(i)*jpa(i+j)

enddo

zxfc1(j)=zxfc1(j)/(n-j)

enddo

do j=1,p

do i=1,n-j

zxfc2(j)=zxfc2(j)+jpb(i)*jpb(i+j)

enddo

zxfc2(j)=zxfc2(j)/(n-j)

!自相关系数

do i=1,p

zxgxs1(i)=zxfc1(i)/fc1

zxgxs2(i)=zxfc2(i)/fc2

enddo

!落后交叉协方差

do j=1,p

do i=1,n-j

lhxfc(j)=lhxfc(j)+jpa(i)*jpb(i+j)

enddo

lhxfc(j)=lhxfc(j)/(n-j)

enddo

!落后相关系数

do i=1,p

lhxgxs(i)=lhxfc(i)/(sqrt(fc1*fc2))

enddo

print*,'年平均气温不同滞后时刻所对应的自相关系数为:' print *,((zxgxs1(i),','),i=1,P)

print*,'冬季平均气温不同滞后时刻所对应的自相关系数为:'

print *,((zxgxs2(i),','),i=1,P)

print *

print*,'年平均气温和冬季平均气温之间不同滞后时刻所对应的落后交叉相关系数为:' print *,((lhxgxs(i),','),i=1,P)

print *

!最大绝对值

t1=1

t2=1

t3=1

do i=2,p

if(abs(zxgxs1(i))>abs(zxgxs1(t1)))t1=i

if(abs(zxgxs2(i))>abs(zxgxs2(t2)))t2=i

if(abs(lhxgxs(i))>abs(lhxgxs(t3)))t3=i

enddo

print *,'中国1970-1989年年平均气温自相关系数绝对值最大的滞后时间长度为:',t1,zxgxs1(t1)

print *,'中国1970-1989年冬季平均气温自相关系数绝对值最大的滞后时间长度为:',t2,zxgxs2(t2)

print *,'中国1970-1989年平均气温和冬季平均气温之间落后相关系数绝对值最大的滞后

时间长度为:',t3,lhxgxs(t3) end

程序运行如下:

中国1970-1989年年平均气温自相关系数绝对值最大的滞后时间长度是7,自相关系数是-0.3724,说明在这些年的数据中,滞后7年的序列与原序列的相关系数绝对值最大,呈反相关。

中国1970-1989年冬季平均气温自相关系数绝对值最大的滞后时间长度是4,自相关系数是-0.3678,说明在这些年的数据中,滞后4年的序列与原序列的相关系数绝对值最大,呈反相关。

中国1970-1989年平均气温和冬季平均气温之间落后相关系数绝对值最大的滞后时间长度

是3,自相关系数是-0.4066,说明在这些年的数据中,滞后3年的冬季平均气温序列与原平均气温序列的相关系数绝对值最大,呈反相关。

实习三:一元线性回归

Fortran程序如下:

program ex3

integer,parameter::n=17

integer i,j

real::suma1=0,suma2=0,avea1,avea2,s1=0,s2=0,b0,b,x=14.5,y

integer a1(n)

real a2(n),a3(n)

data a1/0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16/

data

a2/30.0,29.1,28.4,28.1,28.0,27.7,27.5,27.2,27.0,26.8,26.5,26.3,26.1,25.7,25.3,24.8,

多元统计分析期末试题

一、填空题(20分) 1、若),2,1(),,(~)(n N X p 且相互独立,则样本均值向量X 服从的分布 为 2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。 3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。 4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。 5、设样品),2,1(,),,(' 21n i X X X X ip i i i ,总体),(~ p N X ,对样品进行分类常用的距离 2 ()ij d M )()(1j i j i x x x x ,兰氏距离()ij d L 6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。 7、一元回归的数学模型是: x y 10,多元回归的数学模型是: p p x x x y 22110。 8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。 9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。 二、计算题(60分) 1、设三维随机向量),(~3 N X ,其中 200031014,问1X 与2X 是否独立?),(21 X X 和3X 是否独立?为什么? 解: 因为1),cov(21 X X ,所以1X 与2X 不独立。 把协差矩阵写成分块矩阵 22211211,),(21 X X 的协差矩阵为11 因为12321),),cov(( X X X ,而012 ,所以),(21 X X 和3X 是不相关的,而正态分布不相关与相互

气象统计方法复习资料

气象资料及其表示方法 选择最大信息的预报因子 气候稳定性检验 气候趋势分析 一元线性回归 多元线性回归 逐步回归 气象变量场时空结构分离 复习题: 1、 气象统计预报是利用 统计学 方法对气象(气候)样本进行 分析来估计和推测 总体 的规律性。 2、 突变可分为: 均值突变、变率突变、趋势突变 。 3、 气候统计诊断分析与天气统计诊断分析的不同点是研究对象不同, 一个是(气候特征),一个是(天气特征)。相同点是数据资料都 必须是(长时间)的观测数据。 4、 ()需要对结论进行一系列的推断,分析结论的可信程度以及 是否为因果关系。 A 统计分析; B 统计诊断; 5、 采用统计诊断的方法研究天气、气候现象,可以用于哪些方面 ( )<多选>。 A 了解区域性或者全球性天气、 气候现象的时空分布特征、 变化规律 及异常程度; B 探索气候变量及其与其它物理因素之间的联系; 学习内容: Chapter 1- Chapter 2- Chapter 3- Chapter 4- Chapter 5- Chapter 6- Chapter 7- Chapter-8-

C 对数值模拟结果与实际变化状况之间的差异进行统计诊断,为改进模式提 供线索和指导; 6、对天气、气候现象进行统计诊断分析,一般分为四步。首先,();其次,();再次,();最后,()。 A科学综合和诊断;B选择诊断方法;C资料预处理;D收集资料; 7、气候统计预测,一般分为四步。首先,();其次,();再次,();最后,()。 A建立统计模型;B统计检验;C预测结论;D收集资料; 8、统计预测模型在利用大量()观测资料对气候系统内部或与其它变量之间关系的变化规律及特征分析基础上建立的,用于对()状态进行估计。在这一预测过程中,假设气候变化的成因和物理机制至少在()期间与() 期间一致;气候系统保持稳定。 A过去;B未来;C预测;D观测; 9、气候统计预测过程主要由以下4 个要素构成:1、(),例如: 夏季降水量,8 月份高温日数、暴雨日数;2、(),通常为从某些统计上显著相关的预报因子群提取的有效信息;3、(),根据 数据性质、预测对象和预测因子特点,选择合适的统计预测模型;4、 (),对未来气候变化状态时间、空间、数量、性质等方面的预测。 A预测技术;B预测依据;C预测结果;D预测对象; 10、气象统计研究对象可以划分为()、多要素气象资料。例如:1950-2016 年南京7 月份高温日数,属于()气象资料;例如某气象站7 月份日降水量与08时相对湿度,属于()气象资料。

多元统计分析期末试题及答案

22121212121 ~(,),(,),(,),, 1X N X x x x x x x ρμμμμσρ ?? ∑==∑= ??? +-1、设其中则Cov(,)=____. 10 31 2~(,),1,,10,()()_________i i i i X N i W X X μμμ=' ∑=--∑L 、设则=服从。 ()1 2 34 433,4 92, 3216___________________ X x x x R -?? ?'==-- ? ?-? ? =∑、设随机向量且协方差矩阵则它的相关矩阵 4、 __________, __________, ________________。 215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--L 、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。 12332313116421(,,)~(,),(1,0,2),441, 2142X x x x N x x x x x μμ-?? ?'=∑=-∑=-- ? ?-?? -?? + ??? 、设其中试判断与是否独立? (), 1 2 3设X=x x x 的相关系数矩阵通过因子分析分解为 211X h = 的共性方差111X σ= 的方差21X g = 1公因子f 对的贡献1213 30.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.10320 13 R ? ? - ????? ? -?? ? ? ?=-=-+ ? ? ? ??? ? ? ????? ? ???

应用多元统计分析试题及答案

一、填空题: 1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法. 2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著. 3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 Q型聚类和 R型聚类。 4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。 5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。 6、若 () (,), P x N αμα ∑=1,2,3….n且相互独立,则样本均值向量x服从的分布 为_x~N(μ,Σ/n)_。 二、简答 1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。 在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。 2、简述相应分析的基本思想。 相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A

和因素B 具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A 、B 的联系。 3、简述费希尔判别法的基本思想。 从k 个总体中抽取具有p 个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数 系数: 确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。 5、简述多元统计分析中协差阵检验的步骤 第一,提出待检验的假设 和H1; 第二,给出检验的统计量及其服从的分布; 第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域; 第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。 协差阵的检验 检验0=ΣΣ 0p H =ΣI : /2 /21exp 2np n e tr n λ???? =-?? ? ???? S S 00p H =≠ΣΣI : /2 /2**1exp 2np n e tr n λ???? =-?? ? ???? S S

气象统计方法实习报告

气象统计方法实习报告

目录 实习一求500hPa高度场气候场、距平场和均方差场 ----------------------------------------------------- 5 1、资料介绍------------------------------------- 5 2.要求------------------------------------------- 5 3、实习结果------------------------------------- 6 1)、FORTRAN源程序 --------------------- 6 (2)、grads文件 ----------------- 10 (3)、实习结果------------------------ 11 实习二计算给定数据资料的简单相关系数和自相关系数 ---------------------------------------------- 19 1、资料介绍------------------------------------ 19 2、要求------------------------------------------ 20 3、实习结果------------------------------------ 20 (1)、Fortran源程序 ---------------- 20

(2)、程序运行结果: --------------- 25 实习三分析中国夏季降水线性趋势的分布特征26 1.资料介绍及要求: -------------------------- 26 2.实习结果------------------------------------- 26 (1).matlab程序 ---------------------- 26 (2).程序运行结果 -------------------- 27 实习四求给定数据的一元线性回归方程 ------ 29 1、资料介绍及要求--------------------------- 29 2、实习结果------------------------------------ 30 (1)、MATLAB程序 ---------------- 30 (2)、程序运行结果------------------ 31 (3)、结果分析------------------------ 32 实习五对给定的海温数据进行EOF分析 ---- 35 1、资料介绍------------------------------------ 35 2、要求------------------------------------------ 35

多元统计分析期末复习试题

第一章: 多元统计分析研究的内容(5点) 1、简化数据结构(主成分分析) 2、分类与判别(聚类分析、判别分析) 3、变量间的相互关系(典型相关分析、多元回归分析) 4、多维数据的统计推断 5、多元统计分析的理论基础 第二三章: 二、多维随机变量的数字特征 1、随机向量的数字特征 随机向量X 均值向量: 随机向量X 与Y 的协方差矩阵: 当X=Y 时Cov (X ,Y )=D (X );当Cov (X ,Y )=0 ,称X ,Y 不相关。 随机向量X 与Y 的相关系数矩阵: )',...,,(),,,(2121P p EX EX EX EX μμμ='=Λ)')((),cov(EY Y EX X E Y X --=q p ij r Y X ?=)(),(ρ

2、均值向量协方差矩阵的性质 (1).设X ,Y 为随机向量,A ,B 为常数矩阵 E (AX )=AE (X ); E (AXB )=AE (X )B; D(AX)=AD(X)A ’; Cov(AX,BY)=ACov(X,Y)B ’; (2).若X ,Y 独立,则Cov(X,Y)=0,反之不成立. (3).X 的协方差阵D(X)是对称非负定矩阵。例2.见黑板 三、多元正态分布的参数估计 2、多元正态分布的性质 (1).若 ,则E(X)= ,D(X)= . 特别地,当 为对角阵时, 相互独立。 (2).若 ,A为sxp 阶常数矩阵,d 为s 阶向量, AX+d ~ . 即正态分布的线性函数仍是正态分布. (3).多元正态分布的边缘分布是正态分布,反之不成立. (4).多元正态分布的不相关与独立等价. 例3.见黑板. 三、多元正态分布的参数估计 (1)“ 为来自p 元总体X 的(简单)样本”的理解---独立同截面. (2)多元分布样本的数字特征---常见多元统计量 样本均值向量 = 样本离差阵S= 样本协方差阵V= S ;样本相关阵R (3) ,V分别是 和 的最大似然估计; (4)估计的性质 是 的无偏估计; ,V分别是 和 的有效和一致估计; ; S~ , 与S相互独立; 第五章 聚类分析: 一、什么是聚类分析 :聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。用于对事物类别不清楚,甚至事物总共可能有几类都不能确定的情况下进行事物分类的场合。聚类方法:系统聚类法(直观易懂)、动态聚类法(快)、有序聚类法(保序)...... Q-型聚类分析(样品)R-型聚类分析(变量) 变量按照测量它们的尺度不同,可以分为三类:间隔尺度、有序尺度、名义尺度。 二、常用数据的变换方法:中心化变换、标准化变换、极差正规化变换、对数变换(优缺点) 1、中心化变换(平移变换):中心化变换是一种坐标轴平移处理方法,它是先求出每个变量的样本平均值,再从原始数据中减去该变量的均值,就得到中心化变换后的数据。不改变样本间的相互位置,也不改变变量间的相关性。 2、标准化变换:首先对每个变量进行中心化变换,然后用该变量的标准差进行标准化。 经过标准化变换处理后,每个变量即数据矩阵中每列数据的平均值为0,方差为1,且也不再具有量纲,同样也便于不同变量之间的比较。 3、极差正规化变换(规格化变换):规格化变换是从数据矩阵的每一个变量中找出其最大值和最小值,这两者之差称为极差,然后从每个变量的每个原始数据中减去该变量中的最小值,再除以极差。经过规格化变换后,数据矩阵中每列即每个变量的最大数值为1,最小数值为0,其余数据取值均在0-1之间;且变换后的数据都不再具有量纲,便于不同的),(~∑μP N X μ∑μp X X X ,,,21Λ),(~∑μP N X ) ,('A A d A N s ∑+μ)()1(,, n X X ΛX )',,,(21p X X X Λ)')(()()(1X X X X i i n i --∑=n 1X μ∑μX )1,(~∑n N X P μ),1(∑-n W p X X

气象统计方法实习BD

实习一:气候场、距平场、均方差场 编程如下: parameter(ii=37,jj=17,mon=12,year=4) real var(ii,jj,mon,year),ave(ii,jj,mon),jp(ii,jj,mon,year) real s(ii,jj,mon) integer i,j,iy,m open(5,file='d:\ex1\h500.dat') open(6,file='d:\ex1\ave.grd',form='binary') open(7,file='d:\ex1\jp.grd',form='binary') open(8,file='d:\ex1\s.grd',form='binary') open(12,file='d:\ex1\outall.grd',form='binary' open(9,file='d:\ex1\ave.txt') open(10,file='d:\ex1\jp.txt') open(11,file='d:\ex1\s.txt') !读数据 DO iy=1,4 do m=1,12 !ccc read h500 read(5,1000) read(5,2000) ((var(i,j,m,iy),i=1,ii),j=1,jj)

enddo enddo !计算气候场 do j=1,jj do i=1,ii do m=1,12 ave(i,j,m)=var(i,j,m,1)+var(i,j,m,2)+var(i,j,m,3)+var(i,j,m,4) ave(i,j,m)=ave(i,j,m)/4.0 enddo enddo enddo !计算距平场 do iy=1,4 do m=1,12 do j=1,jj do i=1,ii jp(i,j,m,iy)=var(i,j,m,iy)-ave(i,j,m) enddo enddo enddo enddo !计算均方差场

多元统计分析自己写

多元统计分析有哪些应用? 比较 关系 预测 分类 评价 各种应用对应的多元统计分析方法 比较:多元方差分析 关系:回归模型 预测:回归模型 分类:聚类分析与判别分析、回归模型 评价:主成分分析与因子分析 ?多元回归、logisitic回归、Cox回归、Poisson回归 多元统计分析方法主要内容 多元T检验、多元方差分析 ?Hotelling T2 ?multivariate analysis of variance (MANOV A) 多元线性回归(multivariate linear regression) logistic回归(logistic regression) Cox比例风险模型(Cox model) Poisson回归(Poisson regression) 聚类分析(cluster analysis) 判别分析(discriminant analysis) 主成分分析和因子分析 生存分析 本课程的要求 上机做练习,分析实际资料 学会看文献,判断统计分析的应用是否正确 统计软件SAS,或Stata, SPSS10.01 考试: 理论占30%,实验占70% 二、多元统计分析的基本概念 研究因素从广义的角度看,所有可以测量的变量都可以成为研究因素,比如:年 龄、性别、文化程度、人体的各种生物学特征和生理生化指标环境因素、心理因素等。狭义来看,研究因素是指可能与研究目的有关的影响因素 多元统计分析对多变量样本的要求 ①分布:多元正态分布、相互独立、多元方差齐 ②样本含量 目前尚没有多元分析的样本含量估计方法,一般认为样本含量应超过研究因素5-10倍以上即可。 数值变量→分类成有序分类变量 哑变量的数量=K-1(K为分类数)

数学建模多元统计分析

实验报告 一、实验名称 多元统计分析作业题。 二、实验目的 (一)了解并掌握主成分分析与因子分析的基本原理和简单解法。 (二)学会使用matlab编写程序进行因子分析,求得特征值、特征向量、载荷矩阵等值。(三)学会使用排序、元胞数组、图像表示最后的结果,使结果更加直观。 三、实验内容与要求

四、实验原理与步骤 (一)第一题: 1、实验原理: 因子分析简介: (1) 1.1 基本因子分析模型 设p维总体x=(x1,x2,....,xp)'的均值为u=(u1,u2,....,u3)',因子分析的一般模型为 x1=u1+a11f1+a12f2+........+a1mfm+ε 1 x2=u2+a21f1+a22f2+........+a2mfm+ε 2 ......... xp=up+ap1f1+fp2f2+..........+apmfm+εp 其中,f1,f2,.....,fm为m个公共因子;εi是变量xi(i=1,2,.....,p)所独有的特殊因子,他们都是不可观测的隐变量。称aij(i=1,2,.....,p;j=1,2,.....,m)为变量xi的公共因子fi上的载荷,它反映了公共因子对变量的重要程度,对解释公共因子具有重要的作用。上式可以写为矩阵形式 x=u+Af+ε

其中A=(aij)pxm 称为因子载荷矩阵;f=(f1,f2,....,fm)'为公共因子向量;ε=(ε1,ε2,.....εp)称为特殊因子向量 (2) 1.2 共性方差与特殊方差 xi的方差var(xi)由两部分组成,一个是公共因子对xi方差的贡献,称为共性方差;一个是特殊因子对xi方差的贡献,称为特殊方差。每个原始变量的方差都被分成了共性方差和特殊方差两部分。 (3) 1.3 因子旋转 因子分析的主要目的是对公共因子给出符合实际意义的合理解释,解释的依据就是因子载荷阵的个列元素的取值。当因子载荷阵某一列上各元素的绝对值差距较大时,并且绝对值大的元素较少时,则该公共因子就易于解释,反之,公共因子的解释就比较困难。此时可以考虑对因子和因子载荷进行旋转(例如正交旋转),使得旋转后的因子载荷阵的各列元素的绝对值尽可能量两极分化,这样就使得因子的解释变得容易。 因子旋转方法有正交旋转和斜交旋转两种,这里只介绍一种普遍使用的正交旋转法:最大方差旋转。这种旋转方法的目的是使因子载荷阵每列上的各元素的绝对值(或平方值)尽可能地向两极分化,即少数元素的绝对值(或平方值)取尽可能大的值,而其他元素尽量接近于0. (4) 1.4 因子得分 在对公共因子做出合理解释后,有时还需要求出各观测所对应的各个公共因子的得分,就比如我们知道某个女孩是一个美女,可能很多人更关心该给她的脸蛋、身材等各打多少分,常用的求因子得分的方法有加权最小二乘法和回归法。 注意:因子载荷矩阵和得分矩阵的区别: 因子载荷矩阵是各个原始变量的因子表达式的系数,表达提取的公因子对原始变量的影响程度。因子得分矩阵表示各项指标变量与提取的公因子之间的关系,在某一公因子上得分高,表明该指标与该公因子之间关系越密切。简单说,通过因子载荷矩阵可以得到原始指标变量的线性组合,如X1=a11*F1+a12*F2+a13*F3,其中X1为指标变量1,a11、a12、a13分别为与变量X1在同一行的因子载荷,F1、F2、F3分别为提取的公因子;通过因子得分矩阵可以得到公因子的线性组合,如F1=a11*X1+a21*X2+a31*X3,字母代表的意义同上。 (5) 1.5 因子分析中的Heywood(海伍德)现象 如果x的各个分量都已经标准化了,则其方差=1。即共性方差与特殊方差的和为1。也就是说共性方差与特殊方差均大于0,并且小于1。但在实际进行参数估计的时候,共性方差

多元统计分析期末复习试题

第一章: 多元统计分析研究的容(5点) 1、简化数据结构(主成分分析) 2、分类与判别(聚类分析、判别分析) 3、变量间的相互关系(典型相关分析、多元回归分析) 4、多维数据的统计推断 5、多元统计分析的理论基础 第二三章: 二、多维随机变量的数字特征 1、随机向量的数字特征 随机向量X均值向量: 随机向量X与Y的协方差矩阵: 当X=Y时Cov(X,Y)=D(X);当Cov(X,Y)=0 ,称X,Y不相关。 随机向量X与Y的相关系数矩阵: 2、均值向量协方差矩阵的性质 (1).设X,Y为随机向量,A,B 为常数矩阵 E(AX)=AE(X); E(AXB)=AE(X)B; D(AX)=AD(X)A’; )' ,..., , ( ) , , , ( 2 1 2 1P p EX EX EX EXμ μ μ = ' = )' )( ( ) , cov(EY Y EX X E Y X- - = q p ij r Y X ? =) ( ) , (ρ

Cov(AX,BY)=ACov(X,Y)B ’; (2).若X ,Y 独立,则Cov(X,Y)=0,反之不成立. (3).X 的协方差阵D(X)是对称非负定矩阵。例2.见黑板 三、多元正态分布的参数估计 2、多元正态分布的性质 (1).若 ,则E(X)= ,D(X)= . 特别地,当 为对角阵时, 相互独立。 (2).若 ,A为sxp 阶常数矩阵,d 为s 阶向量, AX+d ~ . 即正态分布的线性函数仍是正态分布. (3).多元正态分布的边缘分布是正态分布,反之不成立. (4).多元正态分布的不相关与独立等价. 例3.见黑板. 三、多元正态分布的参数估计 (1)“ 为来自p 元总体X 的(简单)样本”的理解---独立同截面. (2)多元分布样本的数字特征---常见多元统计量 样本均值向量 = 样本离差阵S= 样本协方差阵V= S ;样本相关阵R (3) ,V分别是 和 的最大似然估计; (4)估计的性质 是 的无偏估计; ,V分别是 和 的有效和一致估计; ; S~ , 与S相互独立; 第五章 聚类分析: 一、什么是聚类分析 :聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。用于对事物类别不清楚,甚至事物总共可能有几类都不能确定的情况下进行事物分类的场合。聚类方法:系统聚类法(直观易懂)、动态聚类法(快)、有序聚类法(保序)...... Q-型聚类分析(样品)R-型聚类分析(变量) 变量按照测量它们的尺度不同,可以分为三类:间隔尺度、有序尺度、名义尺度。 二、常用数据的变换方法:中心化变换、标准化变换、极差正规化变换、对数变换(优缺点) 1、中心化变换(平移变换):中心化变换是一种坐标轴平移处理方法,它是先求出每个变量的样本平均值,再从原始数据中减去该变量的均值,就得到中心化变换后的数据。不改变样本间的相互位置,也不改变变量间的相关性。 2、标准化变换:首先对每个变量进行中心化变换,然后用该变量的标准差进行标准化。 经过标准化变换处理后,每个变量即数据矩阵中每列数据的平均值为0,方差为1,且也不再具有量纲,同样也便于不同变量之间的比较。 3、极差正规化变换(规格化变换):规格化变换是从数据矩阵的每一个变量中找出其最大值和最小值,这两者之差称为极差,然后从每个变量的每个原始数据中减去该变量中的最小值,再除以极差。经过规格化变换后,数据矩阵中每列即每个变量的最大数值为1,最小数值为0,其余数据取值均在0-1之间;且变换后的数据都不再具有量纲,便于不同的变量之间的比较。 4、对数变换:对数变换是将各个原始数据取对数,将原始数据的对数值作为变换后的新值。它将具有指数特征的数据结构变换为线性数据结构。 三、样品间相近性的度量 研究样品或变量的亲疏程度的数量指标有两种:距离,它是将每一个样品看作p 维空),(~∑μP N X μ∑μp X X X ,,,21 ),(~∑μP N X ),('A A d A N s ∑+μ)()1(,,n X X X )',,,(21p X X X )')(()()(1X X X X i i n i --∑=n 1X μ ∑μX )1,(~∑n N X P μ),1(∑-n W p X X

气象统计方法实习报告

目录实习一求500hPa高度场气候场、距平场和均方差场 -------------------------------- 3 1、资料介绍 ------------------------------------------------------------------------------------------------- 3 2.要求-------------------------------------------------------------------------------------------------------- 3 3、实习结果 ------------------------------------------------------------------------------------------------- 3 1)、FORTRAN源程序 ---------------------------------------------------------------------------------- 3 (2)、grads文件 --------------------------------------------------------------- 5 (3)、实习结果 ------------------------------------------------------------------------------------- 5 实习二计算给定数据资料的简单相关系数和自相关系数---------------------------- 7 1、资料介绍 ------------------------------------------------------------------------------------------------- 7 2、要求-------------------------------------------------------------------------------------------------------- 7 3、实习结果 ------------------------------------------------------------------------------------------------- 7 (1)、Fortran源程序 ------------------------------------------------------------------------------ 7 (2)、程序运行结果:---------------------------------------------------------------------------- 9 实习三分析中国夏季降水线性趋势的分布特征---------------------------------------- 9 1.资料介绍及要求: --------------------------------------------------------------------------------------- 9 2.实习结果 -------------------------------------------------------------------------------------------------- 9 (1).matlab程序------------------------------------------------------------------------------------- 9 (2).程序运行结果 -------------------------------------------------------------------------------- 10 实习四求给定数据的一元线性回归方程------------------------------------------------ 10 1、资料介绍及要求 --------------------------------------------------------------------------------------- 10

多元统计分析期末考试考点整理共5页

多元统计分析 题型一定义、名词解释 题型二计算(协方差阵、模糊矩阵) 题型三解答题 一、定义 二名词解释 1、多元统计分析:多元统计分析是运用数理统计的方法来研究多变量(多指标)问题的理论和方法,是一元统计学的推广 2、聚类分析:是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。将个体或对象分类,使得同一类中的对象之间的相似性比与其他类的对象的相似性更强。使类内对象的同质性最大化和类间对象的异质性最大化 3、随机变量:是指变量的值无法预先确定仅以一定的可能性(概率)取值的量。它是由于随机而获得的非确定值,是概率中的一个基本概念。即每个分量都是随机变量的向量为随机向量。类似地,所有元素都是随机变量的矩阵称为随机矩阵。 4、统计量:多元统计研究的是多指标问题,为了了解总体的特征,通过对总体抽样得到代表总体的样本,但因为信息是分散在每个样本上的,就需要对样本进行加工,把样本的信息浓缩到不包含未知量的样本函数中,这个函数称为统计量 三、计算题 解: 答:

答: 题型三解答题 1、简述多元统计分析中协差阵检验的步骤 答: 第一,提出待检验的假设和H1; 第二,给出检验的统计量及其服从的分布; 第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域; 第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。 2、简述一下聚类分析的思想 答:聚类分析的基本思想,是根据一批样品的多个观测指标,具体地找出一些能够度量样品或指标之间相似程度的统计量,然后利用统计量将样品或指标进行归类。把相似的样品或指标归为一类,把不相似的归为其他类。直到把所有的样品(或指标)聚合完毕. 3、多元统计分析的内容和方法 答:1、简化数据结构,将具有错综复杂关系的多个变量综合成数量较少且互不相关的变量,使研究问题得到简化但损失的信息又不太多。(1)主成分分析(2)因子分析(3)对应分析等 2、分类与判别,对所考察的变量按相似程度进行分类。(1)聚类分析:根据分析样本的各研究变量,将性质相似的样本归为一类的方法。(2)判别分析:判别样本应属何种类型的统计方法。

多元统计分析期末考试考点整理

二名词解释 1、 多元统计分析:多元统计分析是运用数理统计的方法来研究多变量(多指标)问题的理 论和方法,是一元统计学的推广 2、 聚类分析:是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方 法。将个体或对象分类,使得同一类中的对象之间的相似性比与其他类的对象的相似性更强。 使类内对象的同质性最大化和类间对象的异质性最大化 3、 随机变量:是指变量的值无法预先确定仅以一定的可能性 (概率)取值的量。它是由于随 机而获得的非确定值,是概率中的一个基本概念。即每个分量都是随机变量的向量为随机向 量。类 似地,所有元素都是随机变量的矩阵称为随机矩阵。 4、统计量:多元统计研究的是多指标问题 ,为了了解总体的特征,通过对总体抽样得到代表 总体的样本,但因为信息是分散在每个样本上的 ,就需要对样本进行加工,把样本的信息浓缩 到不包含未知量的样本函数中,这个函数称为统计量 二、计算题 ^16 -4 2 k 设H = 其中启= (1Q —纣眉=-4 4-1 [― 试判断叼+ 2吟与 「花一? [是否独立? 解: "10 -6 -15 -6 1 a 2U -16 20 40 故不独立口 -r o 2丿 按用片的联合分帚再I -6 lti 20 -1G 20 ) -1V16 -4 0 -4 A 2 丿"-1

2.对某地区农村的百名2周宙男翌的身高、胸圉、上半骨圉进行测虽,得相关数据如下』根据汶往资料,该地区城市2周岁男婴的遠三个指标的均值血二(90Q乩16庆现欲在多元正态性的假定下检验该地区农村男娶是否与城市男婴有相同的均值?伽厂43107-14.62108.946^1 ]丼中乂=60.2x^)-1=(115.6924)-1-14.6210 3.172-37 3760 、8.9464-37 376035.S936」= 0.01, (3,2) = 99.2, 03) =293 隔亠4) =16.7) 答: 2、假设检验问题:比、# =险用‘//H地 r-8.o> 经计算可得:X-^A 22 厂 「3107 -14.6210 ST1=(23J3848)-1 -14.6210 3.172 8 9464 -37 3760 E9464 -37.3760 35.5936 构造检验统计量:尸=旳(丟-間)〃丿(巫-角) = 6x70.0741=420.445 由题目已知热“(3,)= 295由是 ^I =^W3,3)^147.5 所以在显著性水平ff=0.01下,拒绝原设尽即认 为农村和城市的2周岁男婴上述三个指标的均 值有显著性差异 (] 4、设盂=(耳兀.昂工/ ~M((XE),协方差阵龙=P P (1)试从匸出发求X的第一总体主成分; 答: (2)试|可当卩取多大时才链主成分册贡蕭率达阳滋以上.

生物统计学 第九章 多元统计分析

第九章多元统计分析简介 多元统计分析主要研究多个变量之间的关系以及具有这些变量的个体之间的关系。无论是自然科学还是社会科学,无论是理论研究还是应用决策,多元统计分析都有较广泛的应用。近年来,随着计算机的普及和广泛应用,多元统计分析的应用越来越广泛,越来越深入。生物学研究中,有许多问题要考虑样本与样本之间的关系、性状与性状之间的关系,也要考虑样本与性状之间的关系,为了能够正确处理这些错综复杂的关系,就需要借助于多元统计分析方法来解决这些问题。 从应用的观点看,多元统计分析就是要研究多个变量之间的关系,但哪些问题才是多元统计的内容,并无严格的界限。一般认为,典型的多元统计分析主要可以归结为两类问题:第一类是决定某一样本的归属问题:根据某样品的多个性状(特征)判定其所属的总体。如判别分析、聚类分析即属于此类内容。第二类问题是设法降低变量维数,同时将变量变为独立变量,以便更好地说明多变量之间的关系。主成分分析、因子分析和典型相关分析均属于此类问题。此外,多因素方差分析、多元回归与多元相关分析和时间序列分析,均是研究一个变量和多个变量之间的关系的,也是多元统计分析的内容。 第一节聚类分析(Cluster Analysis) 聚类分析是研究分类问题的一种多元统计方法,聚类分析方法比较粗糙,但由于这种方法能解决许多实际问题,应用比较方便,因此越来越受到人们的重视。近年来聚类分析发展较快,内容也越来越多。常见的有系统聚类、模糊聚类、灰色聚类、信息聚类、图论聚类、动态聚类、最优分割、概率聚类等方法,本节重点介绍系统聚类法。 系统聚类法是目前应用较多的聚类分析方法,这种聚类方法从一批样本的多个观测指标(变量)中,找出能度量样本之间相似程度的统计数,构成一个相似矩阵,在此基础上计算出样本(或变量)之间或样本组合之间的相似程度或距离,按相似程度或距离大小将样本(或变量)逐一归类,关系密切的归类聚集到一个小分类单位,关系疏远的聚集到一个大的分类单位,直到把所有样本(或变量)都聚集完毕,形成一个亲疏关系谱系图,直观地显示分类对象的差异和联系。 第二节判别分析(Discriminant Analysis) 判别分析是多元统计分析中较为成熟的一类分类方法,它是根据两个或多个总体的观测结果,按照一定的判别准则和相应的判别函数,来判断某一样本属于哪一类总体。判别分析的内容很多,常见的有距离判别、贝叶斯判别、费歇判别、逐步判别、序贯判别等方法。 第三节主成分分析(Principal components analysis)

应用多元统计分析应用报告(DOC)

应用多元统计分析 课程报告 班级专业:_ 市调0901 _ 学号: 2009***** __ 姓名:__ CYQ _____ 成绩:______________ 2010年10月7日

我国部分城市主要经济指标统计 ——官方与民间数据差异分析 一、引言 经济指标是反映一定社会经济现象数量方面的名称及其数值。本题主要经济指标包括人均GDP 1x (元)、人均工业产值2x (元)、客运总量3x (万人)、货运总量4x (万吨)、5x (亿元)、固定资产投资总额6x (亿元)、在岗职工占总人口的比例7x (%)、在岗职工人均工资额8x (元)、城乡居民年底储蓄余额9x (亿元)。所以我们借助这一指标体系对我国部分城市的主要经济指标进行分析。 二、数据分析 过程 1. 在SPSS 窗口中选择Analyze→Classify→Hierachical Cluster ,调出系统聚类分析主界面,并将变量X 1~X 5移入Variables 框中。在Cluster 栏中选择Cases 单选按钮,即对样品进行聚类(若选择Variables ,则对变量进行聚类)。在Display 栏中选择Statistics 和Plots 复选框,这样在结果输出窗口中可以同时得到聚类结果统计量和统计图。

2. 点击Statistics按钮,设置在结果输出窗口中给出的聚类分析统计 量。这里我们选择系统默认值,点击Continue按钮,返回主界面。 3. 点击Plots按钮,设置结果输出窗口中给出的聚类分析统计图。选 中Dendrogram复选框和Icicle栏中的None单选按钮,即只给出聚类树形图,而不给出冰柱图。单击Continue按钮,返回主界面。 4. 点击Method按钮,设置系统聚类的方法选项。这里我们仍然均沿 用系统默认选项。单击Continue按钮,返回主界面。 5. 点击Save按钮,指定保存在数据文件中的用于表明聚类结果的新 变量。None表示不保存任何新变量;Single solution表示生成一

教学大纲_多元统计分析(双语)

《多元统计分析(双语)》教学大纲 课程编号:120303B 课程类型:□通识教育必修课□通识教育选修课 □专业必修课□专业选修课 □√学科基础课 总学时:48讲课学时:32 实验(上机)学时:16 学分:3 适用对象:统计学专业 先修课程:高等代数、概率论、数理统计 毕业要求: 1.扎实的数学基础和完整的统计知识体系 2.计算机编程技能与经济学基本常识 3.解决实际问题的能力 一、教学目标 多元统计分析是数理统计学的一个重要分支,它的研究对象是多个随机变量组成的随机向量。本课程讲授经典的多元统计分析方法,对于统计学专业来说要求掌握各个方法的基本原理与算法,并且学会使用统计软件实现计算。使得学生在掌握多元分析基础理论和方法的同时,能够对多变量的实际问题进行数据处理分析应用。本课程为双语教学。 二、教学内容及其与毕业要求的对应关系 使学生掌握经典的多元统计分析理论与方法,并能将其应用于社会经济领域的问题研究。本课程共分十章。第一章绪论,首先介绍了多元统计分析的概况,

然后复习矩阵代数知识,之后再复习随机向量的知识,在此基础上拓展相关的内容,这是本课程的基础。第二章和第三章是将一元统计推广到多元统计的理论内容,主要讲解多元分布的基本概念和多元正态总体的统计推断。第四章为多元数据的图表示法。第五章至第十章是多元统计分析的方法部分,包括:聚类分析[Cluster analysis]、判别分析[Discriminant analysis]、主成分分析[Principal Components Analysis]、因子分析[Factor Analysis]、对应分析[Correspondence Analysis]和典型相关分析[Canonical correlation analysis]等。 为实现教学目标所采取的教学方法:以教师讲授为主,以学生自主学习为辅。除了课堂上多元分析理论与方法精讲之外,还有实验课配合,使用SPSS等统计软件计算实现。 三、各教学环节学时分配 教学课时分配

相关主题
文本预览
相关文档 最新文档