一组空气污染数据的主成分分析

  • 格式:docx
  • 大小:166.60 KB
  • 文档页数:24

下载文档原格式

  / 24
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一组空气污染数据的主

成分分析

一组空气污染数据的主成分分析

AppliedMultivariateStatisticalAnalysis(5th Ed).PearsonEducati on,Inc.2003。我看的是中国统计出版社(ChinaStatisticsPress)2003年发行的影印本。

第一题为原书第1.6题,即第1章的第6题,第二题为原书第8.12题,即第8章的第12题。

第二题用的是第一题的数据。

1习题

1.6.ThedatainTable1.5are42measurementsonair-pollutionvariablesrecordedat12:00noonintheLos Angelesareaondifferentdays.

(a)Plotthemarginaldotdiagramsforallthevariables.

(b)Constructthe x,S n,and R arrays,andinterprettheentriesin R. TABLE1.5AIR-POLLUTIONDATA

Wind(x1)Solarradi

ation(x2)CO(x3)NO(x4)NO2(x5)O3(x6)HC(x7)

710743953 710343563 1088528154 691428103 8905212124 9847412155 5726421144 7825111113 864521394 671541033

7727418103 1070421173 1072418103 977419103 87641773 871531644 967421323 96933953 1062531444 98842763

53033523 6835110234 88432763 6784211113 879217103 66243983 103731723 871411073 752411284 54865843

103541692 885419102 586316122 5867213182 779749253 77952862 6686211143 84043652 Source

8.12.p=7dimensionsifpossible.Conductaprincipalcomponentanal ysisofthedatausingboththecovariancematrix S andthecorrelationm

atrix R.WhathaveyoulearnedDoesitmakeanydifferencewhichmatri xischosenforanalysisCanthedatabesummarizedinthreeorfewerdi mensionsCanyouinterprettheprincipalcomponents

2部分解答

2.1部分统计参数

利用Excel计算的平均值(x)和标准差

Wind Solarradiation CO NO NO2O Average7.573.857143 4.5476192.190476210.0476199.404 Stdev1.581138817.3353881.23372091.08735743.37098375.565 Excel给出的协方差矩阵S

Wind Solarradiation CO NO NO2 Wind 2.4404762

Solarradiation-2.714286293.36054

CO-0.369048 3.81632651.4858277

NO-0.452381-1.3537410.6575964 1.154195

NO2-0.571429 6.60204082.25963721.062358311.092971 O3-2.17857130.0578232.7545351-0.7913833.0521542 HC0.16666670.60884350.1383220.17233561.0192744 Excel给出相关系数矩阵R

Wind Solarradiation CO NO NO2 Wind1

Solarradiation-0.1014421

CO-0.1938030.18279341

NO-0.269543-0.0735690.50215251

NO2-0.1098250.1157320.55658380.29689811 O3-0.2535930.31912370.4109288-0.1339520.1666422 HC0.15609790.05201040.16603230.23470430.4477678

从相关系数矩阵可以看出,CO与NO、NO2相关性明显,O3与Solarradiation、CO相关性明显。后面的主成分分析将CO与NO、

NO2归并到一个主成分,将O3与Solarradiation归并到一个主成分,

将HC、Wind归并到一个主成分。HC与Wind的相关系数并不高,但

从正相关的角度看,二者的数值倒是最高的。方差极大正交旋转之后,

HC与CO、NO、NO2归并到一个因子,因为HC与NO2的相关系数较

高,与CO、NO的相关系数高于其他变量。

2.2主成分分析之一——数据未经标准化

下面是从相关矩阵R出发,SPSS给出的结果。原始数据未经标准

化。所谓从R出发,就是在SPSS的FactorAnalysis:Extraction—Analysis选项中选中CorrelationMatrix。

SPSS给出的相关系数矩阵(CorrelationMatrix),与Excel计算

的结果一样。