主成分回归分析在确定大坝效应量分量中的应用
- 格式:pdf
- 大小:357.53 KB
- 文档页数:4
主成分分析在地震预测中的应用摘要:鉴于所提供的电压、电磁波辐射EW、电磁波辐射NS、地温、水位、气温、气压、水温、气氡、雨量、倾斜仪NS、倾斜仪EW等12个地震影响因子间存在相关性,数据冗余较大,而且仅根据某单一指标进行评估和预测,可靠性较差。
本文基于主成分分析法对各指标数据进行简化,选取信息量较大的前几个主成分,估算能够反映地震强度特征的综合指标W。
结果表明,几次地震前后,综合指标W均表现出较明显的异常现象,或是明显增加,或是明显减少,一定程度上能够反映地震异常活动情况。
关键词:主成分分析,特征向量,贡献率,地震预测Abstract: in view of the voltage, provided by electromagnetic radiation EW, electromagnetic wave radiation temperature, water level, NS, temperature, atmospheric pressure, water temperature, gas radon, precipitation, tiltmeter NS, tiltmeter EW and so on 12 earthquake influence the correlation factor, data redundancy is bigger, and only a single index according to evaluate and prediction, reliability is poorer. This paper, based on the principal component analysis of each index data is simplified, the selection of larger information before a few principal components, estimation can reflect the characteristics of earthquake intensity comprehensive indexes W. The results show that a few times before and after the earthquake, the comprehensive index W all represent more apparent anomalies, or significantly increased, or significantly reduce and, to some extent, can reflect earthquake abnormal activity.Keywords: principal component analysis, feature vector, contribution, earthquake prediction一、引言地震是地下岩层受应力作用错动破裂造成的地面震动,是一种破坏性极强的自然灾害。
大坝安全监测中三种统计回归分析方法的比较分析发表时间:2019-01-03T15:49:50.847Z 来源:《基层建设》2018年第35期作者:陆游1 吕国辉2[导读] 摘要:大坝安全监测是掌握大坝运行状态,保证大坝安全运行的重要措施,也是检验设计成果和监察施工质量的有效手段。
1.广东天信电力工程检测有限公司广州 510600;2.中水东北勘测设计研究有限责任公司长春 130021摘要:大坝安全监测是掌握大坝运行状态,保证大坝安全运行的重要措施,也是检验设计成果和监察施工质量的有效手段。
本文通过对多元线性回归、逐步回归、主成分分析回归三种统计模型进行分析,讨论了这三种模型的建模原理、计算步骤、特点和优劣,最后引用某大坝的变形监测数据进行验证,得出了适应性最强的回归分析方法。
关键词:大坝安全监测;统计回归;多元线性回归;逐步回归分析;多重相关性;主成分分析回归Comparison of three methods of statistical regression analysis in dam safety monitoring.LU You 1 and LV Guohui 2(1.Guang Dong TianXin Electric Power Engineering Testing Co.,Ltd,Guangzhou 5106002.China Water Northeastern Investigation,Design & Research Co.,Ltd,Changchun 130021)Abstract:Dam safety monitoring is not only an important measure that can grasp the operational status and guarantee safe operation of the dam but also an effective mean that can test design results and monitor dam construction quality.This paper based on multivariate linear regression,stepwise regression,and principal component analysis,three kinds of statistical regression model analysis,discusses the model of the three principle,calculation steps and advantages.Finally,the deformation monitoring data of the dam is used to verify and the most adaptive regression analysis method is obtained.Key words:Dam safety monitoring,Statistical regression,Multivariate linear regression,Stepwise regression analysis,multiple correlativity,principle components analysis regression1 引言建国以来,我国共修建近8.6万多座各类水库,数量居世界之首,但是由于水文、地质、施工质量、材料老化、运行管理等多种原因,部分大坝存在着不同程度的病险问题。
某水电站大坝扬压力统计回归分析摘要:影响水坝稳定性的重要因素是坝基扬压力,而坝基扬压力又受上游和下游的水位、排水系统问题、降水及雨水渗透作用等影响。
本文以某流域的水电站的工程为背景,以该站的工程情况及当地的气候和地势条件为基础,采用逐步回归的方法,建立的一套计算统计模型,使用该模型能够分析出水位、温度和时效这三个变量对该水电站大坝扬压力的影响。
通过现场数据的监控,获取了监测系统中各个测试点的数据,形成各个测试点有效的扬压力、年浮动区间等图表和曲线。
通过现场实测资料对统计模型计算数值进行论证,结果数据拟合较好,说明该坝基反渗透作用较好。
关键词:扬压力逐步回归时效因子1.工程情况本工程以重庆龙溪河梯级水坝为背景,该水坝属于钢筋混泥土重力坝,分为左右两岸挡水坝,左坝的挡水长度达到79.4米,坝顶高度达到225米;右岸的挡水长度达到52.3米,加固改造后的坝顶达到231米,整个坝顶的长度达到212.5米。
该大坝流域面积达到3280平方公里,该坝建设有四个梯级水电站,即狮子滩、上硐、回龙寨、下硐。
该水电站位于我国四川省,属于亚热带季风湿润气候区,具有冬夏季气温、降水变化剧烈等特点。
该站在地势条件上属于弧形褶皱带,无断层和无牵引褶皱。
2.建模模型2.1 监测系统结构及测试点监测系统中设有44个监测孔,采用测深钟和压力表,测孔分别布置在⑻、⑽、⒀、⒁、⒂、⒃、⒄、⒅八个坝段上,设有二个渗漏水测试点(QL和QR),均匀布置在河坝廊道中,用于测试坝段的渗漏水。
现场测试时,根据水位与孔口两者之间的高低关系,正确的选择扬压力的观测方法,当监测孔的水位低于该孔口时,采用测深钟法;反之,则采用压力表法。
2.2扬压力分析数学模型常用的大坝监测资料分析的数学模型有统计、确定性及混合性等。
结合本工程案例自身的特征,本数学分析模型使用逐步回归法。
统计模型分析中,模型的变量选择很复杂,影响坝基扬压力不仅仅受上游和下游水位的影响,也受排水系统问题、自然降水量及渗透能力等影响。
回归分析法在坝基测压管水位预测中的应用陆健;杨子敬【摘要】坝基水位是一个复杂的随机系统.根据坝基测压管水位与其影响因素之间存在的相关关系,运用回归分析理论和方法,建立了一个基于多元线性回归分析法的坝基测压管水位动态预测模型,并将该模型用于淡溪水库大坝坝基动态预测.预测结果表明预测精度较高,建立的模型较符合该研究区的实际情况.【期刊名称】《黑龙江水利科技》【年(卷),期】2016(044)003【总页数】4页(P110-113)【关键词】坝基;动态预测;回归分析;水位;应用【作者】陆健;杨子敬【作者单位】浙江乐清市淡溪水库管理所,浙江乐清325600;浙江乐清市淡溪水库管理所,浙江乐清325600【正文语种】中文【中图分类】P332.3淡溪水库坝址座落在淡溪镇石龙头村上游(E120°59′,N28°15′),位置图见图1。
在坝基的安全分析工作中,坝基水位的预测至关重要,坝基水位预测是大坝管理、评价和管理工作的基础。
文章采用多元线性回归分析方法对研究区坝基水位进行动态预测,结果表明预测精度较高。
一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用2个或2个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。
当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元性回归。
设y为因变量,x1,x2,……,xk为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为:式中:b0为常数项,b1,b2……bk为回归系数,b1为x2,x3…xk固定时,x1每增加一个单位对y的效应,即x1对y的偏回归系数;同理b2为x1,x3…xk固定时,x2每增加一个单位对y的效应,即,x2对y的偏回归系数,等等。
如果两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描述为:可用二元线性回归模型描述为:建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是:1)自变量对因变量必须有显著的影响,并呈密切的线性相关;2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的;3)自变量之彰应具有一定的互斥性,即自变量之彰的相关程度不应高于自变量与因变量之因的相关程度;4)自变量应具有完整的统计数据,其预测值容易确定。
第30卷湖北师范学院学报(自然科学版)Vol.30第1期Journal of Hubei Normal University(Natural Science)No.1,2010回归模型与时间序列在大坝变形监测中的应用郑箫,金青(湖北师范学院数学与统计学院,湖北黄石435002)摘要:对大坝监测的GPS数据,利用回归分析和时间序列的方法建立了大坝形变模型,并进行数值模拟。
结果表明误差为AR(1)的回归模型优于普通的回归模型,而且优于一般小波方法的非线性回归模型。
关键词:回归模型;时间序列;形变分析中图分类号:O212.1文献标识码:A文章编号:1009-2714(2010)01-0083-060引言大坝在各种力的作用和自然因素的影响下,其形状、大小及位置在时间域和空间域中会发生变化,即变形。
在一定范围内变形是允许的,但当超出允许值时,变形就会带来各种灾害。
因此,科学、准确地进行变形监测,及时地分析和预报变形状况极为重要。
回归分析方法一种常用建模方法,尤其是线性回归分析,但是仅仅依靠线性回归分析的方法,实际问题有时难于满足误差项的全部假定。
因此,针对不同的情况应采用相应的数据处理方法。
本文结合一个大坝由GPS定位技术监测到的数据,采用回归分析方法与时间序列分析方法对大坝形变进行建模。
某大坝一个位于拱坝圆弧顶部监测点OP03径向的变化数据见表1[4].1线性回归分析方法1.1二元线性回归模型设变量x1为相对水位,x2为温度,y为径向形变量,利用SAS软件计算得回归方程为:y=20.778-1.148x1-0.0182x2(1)通过检验x1对y有显著性影响,但x2的回归系数不是显著的,故该模型不能合理拟合变形量数据。
另外,我们通过对残差(见图1)进行分析,发现模型中有非线性关系。
如果线性回归模型的假定成立,学生化残差相互独立且近似服从N(0,1),则关于预测值的残差图中散点应随机地分布在-2.0到2.0的带子里(正常的残差图),而图1中散点分布呈U型曲线。
浅谈多元线性回归在大坝变形监测数据处理中的应用【摘要】本文主要介绍了多元线性回归在大坝变形监测数据处理中的应用。
首先从背景介绍和研究意义入手,解释了为什么需要使用多元线性回归来处理大坝变形监测数据。
接着详细介绍了多元线性回归的原理以及大坝变形监测数据的采集方法。
然后通过一个实例展示了多元线性回归在大坝变形监测数据处理中的具体应用,并对模型进行了评估和数据分析。
在结论部分总结了多元线性回归在大坝变形监测数据处理中的优势,并展望了未来的研究方向。
通过本文的阐述,读者可以更深入地了解多元线性回归在大坝变形监测数据处理中的重要性和实际应用价值。
【关键词】大坝变形监测、多元线性回归、数据处理、模型评估、数据分析、优势、未来研究、应用实例。
1. 引言1.1 背景介绍大坝是水利工程中非常重要的建筑物,它们承担着蓄水、防洪等重要功能。
由于大坝受到地质条件、水文条件等多种因素的影响,会出现一定程度的变形。
这种变形可能会对大坝的安全性产生一定的影响,因此大坝的监测工作显得至关重要。
传统的大坝监测主要通过传感器等设备采集变形监测数据,但是这些数据往往受到环境、设备、人为因素的影响,数据之间可能存在一定的相关性。
采用多元线性回归这种统计方法对大坝变形监测数据进行处理,能够更好地分析数据之间的关系,揭示数据背后的规律性和趋势性。
通过对多元线性回归在大坝变形监测数据处理中的应用研究,可以更好地把握大坝变形的趋势变化,为大坝的安全监测提供更加准确、可靠的数据支持。
研究多元线性回归在大坝变形监测数据处理中的应用具有重要的理论和实践意义。
1.2 研究意义大坝是人类为了防洪、灌溉、发电等目的而修建的水利工程,对于保障人们的生命财产安全和促进社会经济发展具有重要意义。
由于大坝长期受到水压和地质构造等因素的影响,可能会导致大坝发生变形,进而威胁到大坝的稳定性和安全性。
对于大坝的变形监测至关重要。
本研究旨在探讨多元线性回归在大坝变形监测数据处理中的应用,旨在为大坝安全监测和管理提供更加科学的手段,促进大坝的安全运行,保障人们的生命财产安全。
大坝安全监测数据分析方法研究摘要:大坝监测数据分析理论和方法的研究与应用已经取得了相当的进展,为保证大坝安全运行发挥了巨大的作用,本文基于笔者多年从事大坝安全分析的相关工作经验,以大坝安全监测数据分析为研究对象,探讨了安全监测数据分析的意义和内容,给出了安全监测数据分析方法,全文是笔者长期工作实践基础上的理论升华,相信对从事相关工作的同行能有所裨益。
关键词:大坝安全监测数据分析1 大坝安全监测的意义大坝所具有的潜在安全问题既是一个复杂的技术问题,也是一个日益突出的公共安全问题,因此,我国对大坝安全越来越重视。
随着坝工理论和技术的不断发展与完善,为了更好地实现水资源的进一步开发利用,我国的大坝建设正向着更高更大方向发展,如三峡重力坝、小湾拱坝(最大坝高294.5 m)、拉西瓦拱坝(最大坝高250 m)、溪洛渡拱坝(最大坝高285.5 m)等,这些工程的建设将为我国的经济发展做出巨大贡献,也将推动我国的坝工理论和技术水平上升到一个新的高度。
但是,这些工程一旦失事,将是不可想象的毁灭性灾难,因此,大坝安全问题就显得日益突出和重要。
保证大坝安全的措施可分为工程措施和非工程措施两种,两者相互依存,缺一不可。
回顾大坝安全监测的发展历史,最早可追溯到19世纪90年代,1891年德国的挨施巴赫重力坝开展了大坝位移观测,随后于1903年美国新泽西州Boont。
n重力坝开展了温度观测,1908年澳大利亚新南威尔士州巴伦杰克溪薄拱坝开展了变形观测,1925年美国爱达荷州亚美尼加一佛尔兹坝开展了扬压力观测,1826年美国垦务局在Stevenson一creek试验拱坝上开展了应力及应变观测,这是最早开展安全监测的几个实例。
我国从20世纪50年代开始进行安全监测工作,大坝安全监测的作用是逐渐被人们认识的,赵志仁将大坝安全监测的发展历程划分为以下3个阶段。
3.1 多元回归分析多元回归分析方法是大坝监测数据分析中应用最为广泛的方法之一,最常用的方法就是逐步回归分析方法,基于该方法的回归统计模型广泛应用于各类监测变量的分析建模工作。
浅谈多元线性回归在大坝变形监测数据处理中的应用多元线性回归是一种统计方法,适用于多个自变量对一个因变量产生影响的情况。
在大坝变形监测数据处理中,多元线性回归可以用于分析与大坝变形相关的多个因素,从而提取有用的信息。
大坝变形监测数据通常包含多个变量,如水位、温度、土壤湿度等。
这些变量可能同时对大坝的变形产生影响。
通过多元线性回归,可以建立一个数学模型,将这些变量与大坝的变形进行关联,从而了解它们之间的关系。
这有助于确定对大坝变形影响最大的因素,以及它们之间的相对重要性。
多元线性回归还可以用于预测大坝的变形程度。
通过建立一个合适的回归模型,可以根据输入的各个因素的数值,对大坝的变形进行预测。
这对于大坝的安全管理和维护非常重要,可以提前发现可能出现的变形问题,以便及时采取措施。
多元线性回归可以用于检测大坝变形数据中的异常值。
通过分析回归模型的残差,可以发现不符合模型的那些数据点。
这些异常值可能是由于数据采集的误差或其他外部因素引起的,可以帮助我们排除数据的干扰,提高数据的准确性。
多元线性回归还可以进行因素的筛选和优化。
在许多大坝变形监测数据中,可能存在很多与变形无关的因素,这些因素对回归模型的准确性和可解释性可能产生负面影响。
通过多元线性回归,可以筛选出对大坝变形影响较大的因素,从而简化模型的复杂度,提高模型的可靠性和可解释性。
多元线性回归在大坝变形监测数据处理中具有广泛的应用价值。
通过建立回归模型,我们可以了解大坝变形与各个因素之间的关系,进行预测和异常检测,优化模型,并为大坝的安全管理和维护提供重要参考。
主成分分析(principal components analysis,PCA)又称:主分量分析,主成分回归分析法什么是主成分分析法主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。
在统计学中,主成分分析(principal components analysis,PCA)是一种简化数据集的技术。
它是一个线性变换。
这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。
主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。
这是通过保留低阶主成分,忽略高阶主成分做到的。
这样低阶成分往往能够保留住数据的最重要方面。
但是,这也不是一定的,要视具体应用而定。
[编辑]主成分分析的基本思想在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。
这些涉及的因素一般称为指标,在多元统计分析中也称为变量。
因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。
在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。
主成分分析正是适应这一要求产生的,是解决这类题的理想工具。
同样,在科普效果评估的过程中也存在着这样的问题。
科普效果是很难具体量化的。
在实际评估工作中,我们常常会选用几个有代表性的综合指标,采用打分的方法来进行评估,故综合指标的选取是个重点和难点。
如上所述,主成分分析法正是解决这一问题的理想工具。
因为评估所涉及的众多变量之间既然有一定的相关性,就必然存在着起支配作用的因素。
根据这一点,通过对原始变量相关矩阵内部结构的关系研究,找出影响科普效果某一要素的几个综合指标,使综合指标为原来变量的线性拟合。
基于主成分回归的大坝位移模型李红祥,岳东杰,李立瑞(河海大学土木工程学院,江苏省南京市210098)摘要:位移监测是大坝安全运行过程中一项重要的工作。
在建立大坝位移预报模型的过程中,常会出现影响因子之间存在严重相关性的情况,会影响模型系数的稳定性,采用主成分回归分析的方法可以很好地解决这个问题。
在简述主成分回归分析原理的基础上,结合工程实测数据,建立了坝体位移量与相关因子的主成分回归模型和逐步回归模型,并对两者进行比较,取得了良好的效果。
关键词:大坝安全监测;位移监测;主成分回归模型;预报中图分类号:TV698.11收稿日期:2008-04-06;修回日期:2008-06-15。
0 引言在对已建成的大坝安全监测的过程中,及时、简捷地对数据进行分析,特别是在洪水、高水位时期,迅速地对所测数据资料进行整理归纳,掌握大坝工作情况并评估其安全程度,是十分重要的。
回归分析作为评估系统的一部分,可以预报大坝未来时段的工作状态,及时发现大坝异常变形[1]。
目前,国内外广泛采用最小二乘法进行回归参数的无偏估计,以实现对水利工程各种安全监测数据的模型拟合与预测。
然而,最小二乘法回归是建立在自变量因子之间不存在密切相关关系的假定基础上,而实际工程情况往往与该假定不符,比如,在影响水工建筑物及其地基变形、应力应变和渗流的各种自变量因子之间,总是存在着一定的相关关系(称为多重相关性),会导致回归分析的正则方程组出现病态,从而使最小二乘法的参数估计不稳定,模型拟合精度难以保证,若在此基础上进行预测,将可能产生严重的偏差甚至错误,因此,建立良好的回归方程极为重要。
为了消除多重相关性给回归模型带来的不良影响,人们提出了一些改进的回归方法,其中的一种主成分分析回归方法比较有效,该方法采用了在自变量集合中提取成分的思想[2-4]。
本文结合工程实际,利用主成分回归对某大坝所采集的位移监测数据进行相关分析和预报,取得了良好的效果。
1 主成分回归建模基本思想及流程主成分回归建模的基本思想是,首先对所有自变量进行主成分分析,即将原来众多具有一定相关性的指标,比如P 个指标,重新组合成一组新的线性无关的综合指标,代替原来的指标,提取主成分,再对所得的主成分进行回归。
逐步回归分析在大坝安全监测中应用研究
摘要:ﻭ
安全监测是大坝安全运行过程中1项重要的工作.在简述逐步回归分析原理的基础上,结合工程实际,利用实测数据建立了坝移量与相关因子的逐步回归模型,并进行预报,并取得了良好效果。
ﻭ
同行评议:
ﻭ本文用逐步回归法对大坝的安全性进行评估和预报研究,数据翔实,方法适当,得出的结论有1定的可靠性和参考价值。
但是综观全文,逐步回归分析也不是什么新方法,得出的结论也是1些比较常规的结果,没什么新意,而且大坝安全的最终预报也没有针对性。
ﻭ
ﻭ
注:同行评议是由特聘的同行专家给出的评审意见,综合评价是综合专家对各要素的评议得出的数值,以1至5颗星显示。
ﻭ。
’主成分回归分析在确定大坝效应量分量中的应用郑付刚1,2(1.河海大学水资源高效利用与工程安全国家工程研究中心,江苏南京210098;2.河海大学水利水电学院,江苏南京210098)摘要:大坝资料分析表明,水位、温度和时效等因素决定了坝体结构中各种效应量的发展变化情况。
对某些具体问题进行研究或定量分析评价大坝的运行状态时,需要用到各分量的具体数值,通常这些分量是组合在一起的,很难得到其准确可靠的分量比例,特别是温度和水位,它们具有较高的相关性。
而主成分分析方法可将原大量相关性较高的自变量转化为少数不相关的指标,从而为效应量的分离提供可靠的方法。
将这种方法应用于一工程,结果验证了该方法实用、有效。
关键词:主成分分析;影响量;效应量;比重;大坝A p pl i c at i on of Pr i nc i pal C om ponent R egr es s i o n A nal ysi s i n D et eI’m i ni ngt he C om ponent Proport i o n of D a m E f f ec t V ar i a bl eZ heng Fugan91,2(1.N at i onal Engi nee r i ng R ese a r ch C e nt e r of W at er R es our c es Em ci ent U t i l i zat i on and En舀neer i ng Safe t y,H o ha i U ni ver s i t y,N anj i ng Ji angs u210098;2.C ol l eg e of W at e卜cons er vancy and H yd r op ow er,H oh a i U ni ver s i t y,N anj i ng Ji angs u210098)A bs t r a ct:The f act or s of w at er l eve l,t e m per at ur e and t i m e ef kct det enI l i ne t he var i et y of e ff e ct var i abl e s i n dam body.‘I he c o m p onent s of ef kct var i abl e ar e nee ded f or eva l uat i ng da m ope r at i on quant i t at i vel y or st udyi n g s o m e8peci f i c pm bl em s.T he c o m p onent s ar e c o m bi ned and i t i sdi m c ul t t o obt a i n ac cur at e c o m ponent pr op or t i on,especi a l l y f or t he w at er—l evel and t em pe m t ure as t hei r hi gh cor r e l at i on.T he pr i nci pal c o m ponent r egr e ssi on anal ysi s w hi c h c an t m nsl at e a l a唱e num ber of hi gh—coI Tel at i ve f actor s i n t o a f bw non—cor I℃l at i ve i ndi cat oI s c an be r eg ar d as a m et hod t o sol ve t he pr obl e m.A ca s e st u dy us i ng pr i nci pa l c o m ponent anal ys i s m et ho d i s c o ndu c t e d and s h ow s t hat t he m et ho d i s f ea si ble.K ey W ords:pri nci pa l c om pon e nt analys i s;ef玷ct f act or;ef毡ct va r i a bl e;p m po r t i on;da m中图分类号:’r V698.1l文献标识码:A文章编号:0559—9342(2010)12—0084一04大坝资料分析过程中,准确地分离水位、温度、时效等分量具有重要的作用,它可以进行环境影响量的定量分析从而掌握大坝的工作性态和变化情况,为判断大坝安全度提供可靠的理论依据和正确的反馈信息。
但是,由统计学最小二乘法回归方法得到的观测效应量和环境量之间的数学模型,不能很好地分离相关性较高的因子(如温度和水位):而且不同的分离方法得到的结果不同,即使相同方法在不同时段内结果也不一致。
本文便以此为研究内容。
引用主成分分析法将含有大量重复信息的变量.通过其线性组合降维转化为少几个互不相关的综强缓w m er PoⅢer vo|.36N o.12合指标。
这样既能充分反映原来变量的信息,又可使新的指标互不相关,从而可以有效地得到影响量在效应量中的比重。
收稿日期:2010—01一12基金项目:国家自然科学基金资助项目(51079046,50909041,50809025,50879024);国家科技支撑计划课题(2006B A C l4803,2008B A B29803):江苏省“333高层次人才培养工程”科研项目f2017一B08037)作者简介:郑付刚(1987~),男,山东临沂人,硕士研究生,研究向为水利水电工程安全监控理论及其应用.=::==::=:::::::三:=::==:::三=竺::竺=竺三:三二::竺=墨譬i警翟譬l目§啊1效应量分离的重要性和最小二乘法回归模型的不足1.1效应量分离的重要性分析影响因素的重要性可以定量分析水位、温度等环境量对效应量的影响,以便在设计、施工和监测过程中把握主要影响因素及其影响规律。
效应量分量分离是坝体材料弹性模量、混凝土线膨胀系数以及其他物理力学参数进行反演的前提和基础;同时大坝效应量的分离,可使荷载及其响应量之间的关系明确化,有助于改进大坝安全监控各种统计模型的不足,为更加合理有效地分析大坝监测资料提供理论依据,有助于大坝设计监控指标和运行监控指标的拟定。
1。
2最小二乘法回归模型的不足在分析处理观测数据时,一般对数据序列建立各种数学统计模型,得到水压、温度与时效分量的表达式。
用最小二乘法的回归分析和逐步回归分析6(f)=6仃(£)+6r(£)+岛(f)(1)式中,6(t)为f时刻的效应量值;粕(£)、6,(f)、&(f)分别为£时刻由水位、温度和时效引起的分量值。
这些模型都是求出水位、温度等对应的回归系数后,计算出各影响量的分量。
得到各分量的时间序列代表水位、温度等环境量的变化过程,并由此定量分析评价各个影响因素对大坝整体影响的。
但是,各次观测量用模型分离的分量随自变量的不同而不同。
因此,一般选择典型观测量(如最大年变幅或最大观测值)的分量来分析评价大坝的运行状态。
这样会出现几点问题:(1)运行多年的大坝,每年各个分量占效应量的比例都不相同,有时同一分量的差异达到15%。
(2)运行良好的大坝,效应量分量因温度和水位的影响而出现不太合理的现象。
运行正常的坝体在没有出现破坏的情况下,效应量的时效分量是随运行时间的增长而逐渐减小趋于稳定的,但是由统计模型得到的结果中某年的时效分量比上一年的分量反而更大。
(3)同一大坝的相邻测点间得到的影响分量理论上应该具有相近的比例,但由以上各模型得到结果有时却有较大差别。
传统回归模型由于自变量之间具有多重共线性而存在以上互相矛盾的问题。
主成分分析可以将原大量相关性较高的自变量转化为少数不相关的指标,从而为效应量的分离提供一种简单、可靠的方法。
由本文提出的法,基于主成分回归分析后可以直接由回归系得到自变量在效应量中的比重,从而不会出现传统回归模型中的(1)、(2)点的不足;主成分很好地解决了变量共线性问题.可有效提取相关变量问的信息。
从后面的实例可以看出它在一定程度上弥补了第(3)点的不足。
2主成分回归分析方法2.1主成分几何意义主成分利用降维思想,把多变量转化为少数几个综合指标。
以两个变量为例(见图1),变换的目的是为了让几个样本点在y1轴方向上方差达到最大。
也就是说,变量y。
代表了原始数据的绝大部分信息,对弛忽略也无损大局。
即由两个指标压缩成一个指标,而c的每行向量则代表了主成分的方向。
若待解决的问题含有p个指标,只用一个主成分可能不足以代表所有变量的信息,因此需要寻找更多的主成分,原则上后增加的主成分不应该含有前列主成分的信息。
因此在统计学上的描述就是.让各个主成分的协方差为零,而几何上的意义就是让主成分方向彼此正交。
X2..喀●●●一1蓖毛与\.衫’≯\;图1主成分几何意义示意2.2主成分数学实现方法所谓主成分从数学角度来看,就是_p个变量X=晖,,X:,x,,…,瓦)7的一些特殊线性组合。
即如果找到一个适当的数学变化C,则y。
=C i X(扛1,2,…,m;m≤p)(2)其中,G为待定的1冲的单位向量;】,。
是j一切线性组合中方差最大的;y:与y,不相关,且是X一切线性组合中方差第二大的;依次类推。
这样y。
,l,:,…,y。
就为X的m个主成分。
数学定理已经证明主成分仅依赖于各个变量之间的协方差(或相关矩阵)。
若X的相关矩阵为足,由于R为对称非负性的,故其特征值非负,将特征值从大到小排列为:A。
≥A2≥…≥A。
≥0,相应的特征向量为厶,则厶就为变量X到主成分的系数,而/,生A。
/艺~为第i主成分的贡献率,在实际应用中为了f J=1.保证主成分包含了所有变量的信息.我们一般要求累积贡献率式(3)不小于85%,此时d就是我们所需的主成分的目。
即譬翟冒翟圜::::兰::::=::∑A!/∑A,≥85%(3)Fl fJ=12.3主成分回归分析确定效应量分量主成分通过正交变换y=C X可以有效地将具有共线性的回归变量转化到相互独立的变量中.由于C为X相关矩阵尺的特征根所对应的标准化特征向量构成,因而特征根的大小就度量了主成分在样本点中的取值变化的大小。
用主成分进行效应量和自变量逐步回归以后,它们的回归系数很好地反映了各回归系数在效应量中的比例关系.也就是构成各主成分的自变量经过线性组合后对效应量的影响,而主成分彼此之间是互相独立的。
因此,将自变量在主成分中的系数和主成分的回归系数相乘叠加就代表了自变量对效应量的贡献g。