最新Matlab与统计分析
- 格式:doc
- 大小:317.50 KB
- 文档页数:10
MATLAB中的统计分析工具箱使用技巧引言:统计分析是一门广泛应用于各个领域的学科,它帮助我们理解和解释现实世界中的数据。
MATLAB作为一种强大的科学计算软件,提供了丰富的统计分析工具箱,可以帮助我们在数据处理和分析中取得更好的结果。
本文将介绍一些MATLAB中的统计分析工具箱使用技巧,希望可以为读者带来一些启发和帮助。
一、数据的导入与导出在进行统计分析之前,首先需要将数据导入MATLAB中。
MATLAB提供了多种数据导入方式,包括从文本文件、Excel表格和数据库中导入数据等。
其中,从文本文件导入数据是最常用的方法之一。
可以使用readtable函数将文本文件中的数据读入到MATLAB的数据框中,方便后续的操作和分析。
对于数据的导出,MATLAB也提供了相应的函数,例如writetable函数可以将数据框中的数据写入到文本文件中。
二、数据的预处理在进行统计分析之前,通常需要对数据进行预处理。
预处理包括数据清洗、缺失值处理、异常值处理和数据变换等步骤。
MATLAB提供了一系列函数和工具箱来方便进行数据的预处理。
例如,可以使用ismissing函数判断数据中是否存在缺失值,使用fillmissing函数对缺失值进行填充。
另外,MATLAB还提供了一些常用的数据变换函数,例如log、sqrt、zscore等,可以帮助我们将数据转化为正态分布或者标准化。
三、常用的统计分析方法1. 描述统计分析描述统计分析是对数据进行基本的统计描述,包括计算均值、中位数、标准差、百分位数等。
MATLAB提供了一系列函数来进行描述统计分析,例如mean、median、std等。
这些函数可以帮助我们快速计算和分析数据的基本统计指标。
2. 假设检验假设检验是统计分析中常用的方法之一,用于根据样本数据来推断总体的性质。
MATLAB提供了多种假设检验的函数,例如ttest、anova1、chi2test等。
这些函数可以帮助我们进行双样本或多样本的方差分析、配对样本的t检验、独立样本的t检验等。
MATLAB中的统计推断与参数估计方法解析MATLAB(Matrix Laboratory)是一种基于数值计算和编程语言的工具,广泛应用于科学、工程和金融等领域。
在统计学中,MATLAB提供了丰富的函数和工具箱,可以进行统计推断和参数估计等分析。
本文将针对MATLAB中的统计推断和参数估计方法进行解析,包括假设检验、置信区间估计和最大似然估计等。
一、假设检验假设检验是统计学中常用的一种方法,用于验证关于总体参数的假设。
在MATLAB中,可以利用t检验和χ²检验等函数进行假设检验分析。
1. t检验t检验主要用于比较两个样本均值是否存在显著差异。
在MATLAB中,可以使用ttest2函数进行双样本t检验,使用ttest函数进行单样本t检验。
例如,我们有两组数据x和y,想要判断它们的均值是否显著不同。
可以使用以下代码进行双样本t检验:```[h,p,ci,stats] = ttest2(x,y);```其中,h表示假设检验的结果,为0表示接受原假设,为1表示拒绝原假设;p 表示假设检验的p值;ci表示置信区间;stats包含了相关统计信息。
2. χ²检验χ²检验主要用于比较观察频数和期望频数之间是否存在显著差异。
在MATLAB 中,可以使用chi2gof函数进行χ²检验分析。
例如,我们有一组观察频数obs和一组对应的期望频数exp,可以使用以下代码进行χ²检验:```[h,p,stats] = chi2gof(obs,'Expected',exp);```其中,h表示假设检验的结果,为0表示接受原假设,为1表示拒绝原假设;p 表示假设检验的p值;stats包含了相关统计信息。
二、置信区间估计置信区间估计是用于估计总体参数范围的方法,可以帮助我们对总体参数进行合理的推断。
在MATLAB中,可以利用confint函数进行置信区间估计分析。
例如,我们有一组数据x,想要对它的均值进行置信区间估计。
MATLAB中的统计指标计算与分析技术1. 引言统计指标是用于描述和衡量数据集中分布特征的数值,对于数据分析和处理有着重要的作用。
而MATLAB作为一种强大的科学计算软件,提供了丰富的统计函数与工具,可以方便地进行统计指标的计算与分析。
本文将详细介绍MATLAB中常用的统计指标计算与分析技术,包括均值、中位数、方差、标准差等指标的计算方法,以及数据分布的可视化分析等内容。
2. 均值与中位数计算均值和中位数是常用的描述数据集中趋势的指标。
在MATLAB中,计算均值使用mean()函数,计算中位数使用median()函数。
这两个函数的使用方法非常简单,只需要输入数据集即可。
例如,对于一个包含100个数据点的数据集,可以使用以下代码计算均值和中位数:```matlabdata = randn(1, 100); % 生成一个包含100个随机数据点的数据集mean_value = mean(data); % 计算均值median_value = median(data); % 计算中位数```通过这样的计算,我们可以获得数据集的中心趋势信息,帮助我们进一步分析和理解数据。
3. 方差与标准差计算方差和标准差是度量数据集分散程度的重要指标。
方差表示数据点与均值之间的差异程度,标准差则是方差的平方根。
在MATLAB中,分别可以使用var()和std()函数来计算方差和标准差。
同样地,我们只需要输入数据集作为输入参数即可。
下面是一个例子:```matlabdata = randn(1, 100); % 生成一个包含100个随机数据点的数据集variance = var(data); % 计算方差standard_deviation = std(data); % 计算标准差```方差和标准差的计算结果可以用来描述数据集的分散情况,提供了对数据集变异程度的度量。
4. 数据分布可视化除了计算常见的统计指标,MATLAB还提供了各种数据分布可视化的函数,例如直方图、箱线图等。
利用MATLAB进行统计分析使用 MATLAB 进行统计分析引言统计分析是一种常用的数据分析方法,可以帮助我们理解数据背后的趋势和规律。
MATLAB 提供了一套强大的统计工具箱,可以帮助用户进行数据的统计计算、可视化和建模分析。
本文将介绍如何利用 MATLAB 进行统计分析,并以实例展示其应用。
一、数据导入和预处理在开始统计分析之前,首先需要导入数据并进行预处理。
MATLAB 提供了多种导入数据的方式,可以根据实际情况选择合适的方法。
例如,可以使用`readtable` 函数导入Excel 表格数据,或使用`csvread` 函数导入CSV 格式的数据。
导入数据后,我们需要对数据进行预处理,以确保数据的质量和准确性。
预处理包括数据清洗、缺失值处理、异常值处理等步骤。
MATLAB 提供了丰富的函数和工具,可以帮助用户进行数据预处理。
例如,可以使用 `fillmissing` 函数填充缺失值,使用 `isoutlier` 函数识别并处理异常值。
二、描述统计分析描述统计分析是对数据的基本特征进行概括和总结的方法,可以帮助我们了解数据的分布、中心趋势和变异程度。
MATLAB 提供了多种描述统计分析的函数,可以方便地计算数据的均值、标准差、方差、分位数等指标。
例如,可以使用 `mean` 函数计算数据的均值,使用 `std` 函数计算数据的标准差,使用 `median` 函数计算数据的中位数。
此外,MATLAB 还提供了 `histogram`函数和 `boxplot` 函数,可以绘制数据的直方图和箱线图,从而更直观地展现数据的分布特征。
三、假设检验假设检验是统计分析中常用的推断方法,用于检验关于总体参数的假设。
MATLAB 提供了多种假设检验的函数,可以帮助用户进行单样本检验、双样本检验、方差分析等分析。
例如,可以使用 `ttest` 函数进行单样本 t 检验,用于检验一个总体均值是否等于某个给定值。
可以使用 `anova1` 函数进行单因素方差分析,用于比较不同组之间的均值差异是否显著。
Matlab中常用的统计分析方法与函数统计分析是一种通过数理统计方法对数据进行分析和处理的方式,是研究各类现象的规律性和变异性的重要手段。
在实际应用中,Matlab作为一种功能强大的数学软件,提供了许多常用的统计分析方法与函数,能够方便地进行数据处理和分析。
本文将介绍一些Matlab中常用的统计分析方法与函数,帮助读者更好地运用这些功能。
一、数据可视化分析数据可视化是统计分析的重要环节,可以直观地展示数据的分布和趋势,有助于我们对数据的理解和分析。
在Matlab中,有许多函数可以帮助我们进行数据可视化分析,如plot函数可以绘制一维数据的曲线图;scatter函数可以绘制二维数据的散点图;histogram函数可以绘制数据的直方图等等。
通过这些函数,我们可以直观地看到数据的分布情况,从而对数据进行更深入的分析。
二、数据处理与统计分析在数据处理和统计分析方面,Matlab也提供了丰富的函数和方法。
对于数据处理,Matlab中有一系列的函数可以帮助我们进行数据的读取和写入,数据的清洗和筛选等操作。
通过这些函数,我们可以方便地对各种格式的数据进行处理,提高数据的质量和准确性。
在统计分析方面,Matlab提供了许多统计量的计算函数,如mean函数可以计算数据的均值;median函数可以计算数据的中位数;std函数可以计算数据的标准差等等。
此外,Matlab还支持假设检验、方差分析、回归分析等常用的统计方法,通过调用相应的函数可以实现这些分析。
三、概率分布及随机数生成概率分布是描述随机变量取值的概率特征的数学函数,是统计分析中常用的工具之一。
在Matlab中,有许多函数可以用来模拟各种常见的概率分布,如正态分布、均匀分布、指数分布等。
通过这些函数,我们可以生成服从指定概率分布的随机数,以进行模拟实验和概率计算。
此外,Matlab还提供了一些函数来计算概率密度函数、累积分布函数以及分布的随机数等。
四、回归分析回归分析是一种用于研究两个或多个变量之间关系的统计方法,广泛应用于各个领域。
第四讲 数据的基本统计分析数据的基本统计分析1.数据的描述性统计分析通常在得到数据并对数据进行除错的预处理后,需要对数据进行描述性的统计分析。
比如:对数据中变量的最小值、最大值、中位数、平均值、标准差、偏度、峰度以及正态性检验等进行分析。
对于这些经常性遇到的重复过程,我们可以自己编写函数,将函数保存在MATLAB自动搜索文件夹下,然后就可以直接调用自己定义的函数了。
对于上述描述性统计分析,我们可以在MATLAB命令窗口中输入:edit discription,然后在弹出的窗口中选择yes,就创建了一个文件名为discription的M文件。
然后在弹出的空白文件中编写以下M函数: function D=discription(x)%descriptive statistic analysis%input:%x is a matrix, and each colummn stands for a variable%output:%D:structure variable,denotes Minimium,Maximium,Mean,Median,%Standard_deviation,Skewness,Kurtosis,and normal distribution test,respectively.%notes:when the number of oberservations of the colummn variables less than 30,%Lilliefors test is used for normal distribution test,and output D.LSTA denotes%test statistic and D.LCV denote critical value under 5% significant level;%otherwise, Jarque-Bera test is used, and output D.JBSTA denotes test statistic%and D.JBCV denote critical value under 5% significant level.If test statistic is%less than critical value,the null hypothesis (normal distribution) can not%be rejected under 5% significant level.D.Minimium=min(x);D.Maximium=max(x);D.Mean=mean(x);D.Median=median(x);D.Standard_deviation=std(x);D.Skewness=skewness(x);D.Kurtosis=kurtosis(x);if size(x,1)<30disp('small observations,turn to Lilliefors test for normal distribution')for i=1:size(x,2)[h(i),p(i),Lilliefors(i),LCV(i)]=lillietest(x(:,i),0.05);endD.LSTA=Lilliefors;D.LCV=LCV;elsefor i=1:size(x,2)[h(i),p(i),Jarque_Bera(i),JBCV(i)]=jbtest(x(:,i),0.05);endD.JBSTA=Jarque_Bera;D.JBCV=JBCV;end注意在上面给出的函数例子中,我们使用了discription作为文件名,这与函数文件中第一行中的discription保持了一致。
利用Matlab进行数据分析与统计方法详解数据分析和统计方法在现代科学、工程和商业领域中是非常重要的工具。
而Matlab作为一种强大的计算软件和编程语言,提供了丰富的功能和工具,可以帮助我们进行数据分析和统计。
一、Matlab数据分析工具介绍Matlab提供了许多数据分析工具,包括数据可视化、数据处理、统计分析等。
其中,数据可视化是数据分析中重要的一环,可以用于展示数据的分布、趋势和关系。
Matlab中的绘图函数可以绘制各种类型的图形,如折线图、散点图、柱状图等。
我们可以利用这些图形来直观地理解数据并发现潜在的模式。
二、常用的数据处理方法在进行数据分析之前,我们通常需要对数据进行预处理,以去除噪声、填补缺失值和标准化数据等。
Matlab提供了丰富的函数和工具来处理这些问题。
例如,可以使用滤波函数对信号进行平滑处理,使用插值函数填补缺失值,并使用标准化函数将数据转化为标准分布。
三、基本的统计分析方法在进行统计分析时,我们常常需要计算各种统计量,如均值、方差、标准差等。
Matlab提供了一系列统计函数,如mean、var和std等,可以轻松计算这些统计量。
此外,Matlab还提供了假设检验、方差分析、回归分析等高级统计方法的函数,方便我们进行进一步的研究。
四、数据挖掘和机器学习方法数据挖掘和机器学习是数据分析的前沿领域,能够从大量的数据中发现隐藏的模式和规律。
Matlab作为一种强大的计算工具,提供了丰富的数据挖掘和机器学习函数。
例如,可以利用聚类分析函数对数据进行聚类,使用分类函数进行分类,还可以使用神经网络函数构建和训练神经网络模型。
五、案例分析:利用Matlab进行股票市场分析为了更好地理解Matlab在数据分析和统计方法中的应用,我们以股票市场分析为例进行讲解。
股票市场是一个涉及大量数据和复杂关系的系统,利用Matlab可以对其进行深入分析。
首先,我们可以利用Matlab的数据导入和处理函数,将股票市场的历史数据导入到Matlab中,并对数据进行预处理,如去除异常值和填补缺失值。
MATLAB在数据分析中的应用数据分析是一个庞大的领域,不同类型的数据需要不同的分析工具和技术。
MATLAB作为一种用于数学计算和数据处理的工具,具有广泛的应用。
本文将介绍MATLAB在不同数据分析领域中的应用。
一、统计分析MATLAB提供了许多用于统计分析的函数和工具。
例如,可以使用boxplot函数绘制箱线图以显示数据的分布情况;可以使用histogram函数绘制直方图以分析数据的分布情况;可以使用mean和std函数计算数据的平均值和标准差。
此外,MATLAB还提供了用于回归分析、假设检验和方差分析等的函数和工具。
二、信号处理信号处理是指将信号转换为更有用的形式或提取信号中的特定信息。
MATLAB具有强大的信号处理工具箱,可以进行卷积、滤波、傅里叶变换和功率谱估计等操作。
通过这些工具,可以对音频、图像、视频等信号进行处理和分析,并提取其中的特征或信息。
三、机器学习机器学习是一种通过对大量数据进行学习来自动获取知识和规律的方法。
MATLAB提供了丰富的机器学习工具箱,包括用于分类、聚类、回归、降维和深度学习的函数和工具。
这些工具可以应用于各种数据集,如图像、文本和声音等。
四、金融分析金融分析是指利用金融数据进行分析和决策。
MATLAB提供了许多用于金融分析的工具箱和函数,包括用于投资组合分析、风险管理和衍生品定价的工具。
这些工具可以帮助投资者、金融分析师和风险管理人员做出更好的决策。
五、图像处理图像处理是指对图像进行处理和分析,如去噪、边缘检测、图像增强和目标识别等。
MATLAB提供了丰富的图像处理工具箱,可以用于分析、处理和可视化各种类型的图像。
这些工具可以应用于各种领域,如医疗、自动驾驶和安全监控等。
六、生物信息学生物信息学是指将计算机科学和统计学等技术应用于生命科学中的数据分析和研究。
MATLAB提供了用于生物数据分析的工具箱和函数,包括用于基因识别、蛋白质序列分析和生物图像处理的工具。
Matlab中常用的统计分析方法统计分析是一项对数据进行收集、整理、分析和解释的过程,它对于研究和决策具有重要意义。
在各个领域中,Matlab作为一种强大的数据分析工具,为我们提供了许多常用的统计分析方法。
本文将介绍一些常见的统计分析方法,并讨论它们在Matlab中的应用。
一、描述性统计分析描述性统计分析是对数据进行描述和总结的一种方法。
它通过计算数据的均值、中位数、标准差、最大值、最小值等指标来揭示数据的集中趋势和离散程度。
在Matlab中,我们可以利用函数mean()、median()、std()、max()、min()等来进行描述性统计分析。
例如,我们可以使用mean()函数计算数据的均值:```matlabdata = [1, 2, 3, 4, 5];mean_value = mean(data);```二、假设检验假设检验是用来评估两个或多个数据集之间是否存在显著差异的方法。
在Matlab中,我们可以利用ttest2()函数来进行双样本t检验,利用anova1()函数来进行单因素方差分析。
双样本t检验常用于比较两个样本平均值是否有显著差异。
例如,我们想比较两组学生的成绩是否存在差异,可以使用ttest2()函数:```matlabgroup1 = [80, 85, 90, 95, 100];group2 = [70, 75, 80, 85, 90];[p, h] = ttest2(group1, group2); % p值表示差异的显著性```单因素方差分析用于比较多个样本平均值是否有显著差异。
例如,我们想比较三个不同条件下的实验结果是否有差异,可以使用anova1()函数:```matlabdata = [80, 85, 90; 70, 75, 80; 90, 95, 100];p = anova1(data); % p值表示差异的显著性```三、相关性分析相关性分析用于评估两个或多个变量之间的关联程度。
M a t l a b与统计分析Matlab 与统计分析一、 回归分析1、多元线性回归1.1 命令 regress( ), 实现多元线性回归,调用格式为[b,bint,r,rint,stats]=regress(y,x,alpha)其中因变量数据向量Y 和自变量数据矩阵x 按以下排列方式输人⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=n nk n n k k y y y y x x x x x x x x x x 21212222111211,111 对一元线性回归,取k=1即可。
alpha 为显著性水平(缺省时设定为0.05),输出向量b ,bint 为回归系数估计值和它们的置信区间,r ,rint 为残差及其置信区间,stats 是用于检验回归模型的统计量,有三个数值,第一个是2R , 其中R 是相关系数,第二个是F 统计量值,第三个是与统计量F 对应的概率P ,当α<P 时拒绝0H ,回归模型成立.注:1、两组数据的相关系数在概率论的标准定义是:R= E{(x - E{x}) * (y - E{y})} / (sqrt({(x - E{x})^2) * sqrt({(y - E{y})^2))E{}求取期望值。
也就是两组数据协方差与两者标准差乘积的商。
如果|R|=1说明两者相关,R=0说明两者不相关.1、F 是方差分析中的一个指标,一般方差分析是比较组间差异的。
F 值越大,P 值越小,表示结果越可靠.1.2 命令 rcoplot(r ,rint),画出残差及其置信区间.1.3 实例 1已知某胡八年来湖水中COD 浓度实测值(v)与影响因素湖区工业产值(x1)、总人口数(x2 )、捕鱼量(x3 )、降水量( x4)资料,建立污染物Y 的水质分析模型.Step 1 输入数据x1=[1.376, 1.375, 1.387, 1.401, 1.412, 1.428, 1.445, 1.477];x2=[0.450,0.475,0.485,0.500,0.535,0.545,0.550,0.575];x3=[2.170,2.554,2.676,2.713,2.823,3.088,3.122,3.262];x4=[0.8922, 1.1610,0.5346,0.9589, 1.0239, 1.0499,1.1065, 1.1387];Y=[5.19, 5.30,5.60,5.82,6.00,6.06,6.45,6.95];Step 2 保存数据(以数据文件.mat 形式保存,便于以后调用)save data x1 x2 x3 x4 yload data %取出数据Step 3 执行回归命令x=[ones(8,1),x1,x2,x3,x4];[b,bint,r,rint,stats]=regress(y,x)得到结果:b=(-16.5283, 15.7206, 2.0327.-0.2106,-0.1991)'stats=(0.9908,80.9530,0.0022)'即Y= -16.5283+15.7206x1+2.0327x2-0.2106xl+0.1991x42R=0.9908, F=80.9530,P=0.00222、非线性回归2.1 命令 nlinfit( ) 实现非线性回归,调用格式为[beta,r,J]=nlinfit(x,y,‘model’,beta0)其中,输入数据x,y分别为n×m矩阵和n维列向量,对一元非线性回归,x为n维列向量;model是事先用m-文件定义的非线性函数,beta0是回归系数的初值.beta是估计出的回归系数,r是残差,J是Jacobian矩阵,它们是估计预测误差需要的数据.2.2 命令 nlpredci( ) 预测和预测误差的估计,调用格式为[y,delta]=npredci('model',x,beta,r,j)2.3 实例 2对实例1中COD 浓度实测值(Y),建立时序预测模型,这里选用logistic 模型,即ktbe a y -+=1Step 1 建立非线性函数对所要拟合的非线性模型建立m-文件model.m 如下function yhat=model(beta,t)yhat=beta(1)./(1+beta(2)*exp(-beta(3)*t))Step 2 输入数据t= 1:8load data y(在data .mat 中取出数据y)beta0=[50,10,1]’Step 3 求回归系数[beta ,r ,J]=nlinfit(t ,Y ,‘model ’, beta0)得结果:beta=(56.1157,10.4006,0.0445)’即0445.04006.1011157.56-+=e yStep 4 预测及作图[YY,delta]=nlpredci(‘model ’,x',beta,r ,J);plot(x,y,'k+',x,YY,'r')3、逐步回归逐步回归的命令是stepwise , 它提供了一个交互式画面.通过此工具可自由地选择变量,进行统计分析.调用格式为:stepwise (x ,y ,inmodel ,alpha )其中x 是自变量数据,是m n ⨯阶矩阵,y 是因变量数据,1⨯n 阶矩阵,inmodel 是矩阵的列数指标(给出初始模型中包括的子集(缺省时设定为全部自变量),alpha 是显著性水平(缺省时为0.5). 运行stepwise 命令时产生三个图形窗口:Stepwise Plot ,Stepwise Table ,Stepwise History.在Stepwise Plot 窗口,显示出各项的回归系数及其置信区间.Stepwise Table 窗口中列出了一个统计表,包括回归系数及其置信区间,以及模型的统计量剩余标准差(RMSE )、相关系数(R-square )、F 值、与F 对应的概率P.二、 主成分分析这里给出江苏省生态城市主成份分析实例。
我们对江苏省十个城市的生态环境状况进行了调查,得到生态环境指标的指数值,见表1。
现对生态环境水平进行分析和评价。
我们利用Matlab6.5中的princomp 命令实现。
具体程序如下x=[0.7883 0.7391 0.8111 0.6587 0.6543 0.8259 0.8486 0.6834 0.8495 0.78460.7633 0.7287 0.7629 0.8552 0.7564 0.7455 0.7800 0.9490 0.8918 0.8954 0.4745 0.5126 0.8810 0.8903 0.8288 0.7850 0.8032 0.8862 0.3987 0.3970 0.8246 0.7603 0.6888 0.8977 0.7926 0.7856 0.6509 0.8902 0.6799 0.9877 0.8791 0.8736 0.8183 0.9446 0.9202 0.9263 0.9185 0.9505 0.8620 0.88730.9538 0.9257 0.9285 0.9434 0.9154 0.8871 0.9357 0.8760 0.9579 0.9741 0.8785 0.8542 0.8537 0.9027 0.8729 0.8485 0.8473 0.9044 0.8866 0.9035 0.6305 0.6187 0.6313 0.7415 0.6398 0.6142 0.5734 0.8980 0.6186 0.7382 0.8928 0.7831 0.5608 0.8419 0.8464 0.7616 0.8234 0.6384 0.9604 0.8514]x=x';stdr=std(x);%求各变量标准差[n,m]=size(x);sddata= x./stdr(ones(n,1),:);%标准化变换[p,princ,egenvalue]=princomp(sddata) %调用主成分分析程序p3=p(:,1:3) %输出前三个主成分系数sc=princ(:,1:3) %输出前三个主成分得分egenvalue %输出特征根per=100*egenvalue/sum(egenvalue) %输出各个主成分贡献率执行后得到所要结果,这里是前三个主成分、主成分得分、特征根。
即egenvalue=[3.8811,2.6407,1.0597]' , per=[43.12,29.34,11.971]' .这样,前三个主成分为Zl = -0.3677xl+ 0.3702x2+ 0.1364x3+ 0.4048x4+ 0.3355x5-0.1318x6+0.4236x7+ 0.4815x8-0.0643x9Z2 = 0.1442xl+ 0.2313x2-0.5299x3+ 0.1812x4-0.1601x5+ 0.5273x6+0.3116x7-0.0267x8+ 0.4589x9Z3 = -0.3282xl-0.3535x2+ 0.0498x3+ 0.0582x4+ 0.5664x5-0.0270x6-0.0958x7-0.2804x8+ 0.5933x9第一主成分贡献率为43.12%,第二主成分贡献率为29.34%,第三主成分贡献率为11.97%,前三个主成分累计贡献率达84.24%。
如果按80%以上的信息量选取新因子,则可以选取前三个新因子。
第一新因子Z1包含的信息量最大为43.12%%,它的主要代表变量为x8(城市文明)、x7(生产效率)、x4(城市绿化),其权重系数分别为0.4815、0.4236、0.4048,反映了这三个变量与生态环境水平密切相关,第二新因子Z2包含的信息量次之为29.34%,它的主要代表变量为x3(地理结构)、x6(资源配置)、 x9(可持续性),其权重系数分别为0.5299、0.5273、0.4589,第三新因子 Z3包含的信息量为11.97%,代表总量为x9(可持续性)、 x5(物质还原),权重系数分别为0.5933、0.5664。
这些代表变量反映了各自对该新因子作用的大小,它们是生态环境系统中最重要的影响因素。
根据前三个主成分得分,用其贡献率加权,即得十个城市各自的总得分F = 43.12%princ(:,1)+29.34%princ(:,2)+11.97%princ(:,3)=[0.0970,-0.6069,-1.5170,1.1801,0.0640,-0.8178,-0.9562,1.1383,0.1107,1.3077]'根据总得分排序,结果见表1。