基于Gibbs抽样的马尔科夫蒙特卡罗方法在结构物理参数识别及损伤定位中的研究
- 格式:pdf
- 大小:308.91 KB
- 文档页数:5
基于Gibbs抽样算法的贝叶斯动态面板数据模型分析朱慧明;周帅伟;李素芳;曾昭法【摘要】针对现有动态面板数据分析中存在偶发参数和没有考虑模型参数的不确定性风险问题,提出了基于Gibbs抽样算法的贝叶斯随机系数动态面板数据模型.假设初始值服从平稳分布,自回归系数服从Logit正态分布的条件下,设计了Markov 链Monte Carlo数值计算程序,得到了模型参数的贝叶斯估计值.实证研究结果表明:基于Gibbs抽样方法的贝叶斯动态面板回归模型能有效地揭示跨截面滞后变量对响应变量的位置、尺度和形状的影响.【期刊名称】《经济数学》【年(卷),期】2011(028)001【总页数】9页(P52-60)【关键词】动态面板数据;MCMC;Gibbs抽样算法;贝叶斯推断;后验分布【作者】朱慧明;周帅伟;李素芳;曾昭法【作者单位】湖南大学工商管理学院,湖南长沙,410082;湖南大学工商管理学院,湖南长沙,410082;湖南大学工商管理学院,湖南长沙,410082;湖南大学金融与统计学院,湖南长沙,410079【正文语种】中文【中图分类】F064.1;O212.8AbstractWe developed the hierarchical Bayesian approach for inference in random coefficient dynamic panel data models.Our approach allows forthe initial values of each unit's process to be correlated with the unit-specific coefficients.A stationarity assumption was imposed on each unit's process by assuming that the unit-specific autoregressive coefficient is drawn from a logitnormal distribution.The research shows that our approach can efficiently reveal how the lagged variables affect the location,scale and shape of the response variable across section.Key wordsdynamic panel data;MCMC;Gibbs sampling algorithm;Bayesian inference;Posterior distribution自 Mundlak(1961),Balwstra 和 Nerlove(1966)把面板数据引入到计量经济学以来,面板数据的理论与应用研究得到了众多学者的关注.经济分析中经常会遇到具有三维(个体、时间、指标)信息的数据结构,即面板数据(panel data),是指在时间序列上取多个截面,在这些截面上同时选取样本观测值所构成的样本数据,也就是把截面数据和时间序列数据融合在一起的数据.由于面板数据利用了更多数据的信息,提高了自由度和有效性,能得到更有效和更可靠的参数估计量,从而能够更加精确地估计复杂的行为方程,检测和度量单纯使用横截面数据或时间序列数据无法观测到的影响.目前,面板数据在经济管理学、社会学、心理学等领域都得到了广泛应用.动态面板数据模型常用于描述很多经济变量的动态关系,因为经济变量不仅受到本期因素的影响,而且受到非本期因素的影响.比如,物价往往受到上期物价的影响;各部门的投资额不仅影响本期生产量而且影响今后各期生产量.线性或非线性参数动态面板数据模型广泛应用于当今经济研究[1],这些模型都是建立在各截面自回归系数相同且为常数的假设之上.然而,在很多研究中,将各截面自回归系数假设为跨截面变化更为符合实际.如购买力平价(Purchasing Power Parity,PPP)的回复速度(Speed of Reversion)[2],个体对收入冲击的调整速度[3],以及各国储蓄行为的差异等[4].Yu,Jong和Lee使用伪极大似然估计方法研究了具有大N和大T的固定效应空间动态面板数据模型[5],但没有考虑外生变量对模型参数估计的影响.Pesaran和Smith研究发现,即使在具有大N和大T的面板数据中,忽略各截面的异质性会导致自回归系数估计非一致[6].因此,Pesaran和Smith提出了使用组平均估计,即对各截面分别回归估计的系数进行平均.Hsiao,Pesaran和Tahmiscioglu指出,只要,组平均估计是模型系数的一致渐进正态估计[7].然而对于大N和小T的传统面板数据来说,组平均估计为非一致估计.Hsiao,Pesaran和Tahmiscioglu提出了使用层次贝叶斯方法对随机效应自回归面板数据模型进行参数估计,指出对于大N和大T的面板数据,他们提出贝叶斯估计量渐进等价于组平均估计量,并且通过Monte Carlo实验,说明其方法在小样本下要优于组平均估计.Park,Sickles和Simar研究了仅含一个滞后因变量的动态面板数据模型的半参数有效估计量[8].朱慧明基于VAR模型对中国居民消费水平进行贝叶斯单位根检验,解决了向量自回归模型超参数估计的难题,克服了经典单位根检验在经济时序小样本下功效偏低的缺陷[9].汪朝晖利用静态面板数据模型研究了湖南省城镇居民收入与消费的关系[10];王立平基于空间动态面板数据模型研究了中国产业结构变迁对区域经济增长的影响,发现产业结构变动对地区经济增长存在显著的促进作用,且外溢性显著[11].Ciarreta和Zarraga则利用1970~2007年的年度数据结合动态面板数据方法研究了欧洲12国电力消费和实际GDP的长期因果关系[12],结果显示电价与GDP之间存在双向因果关系;Sarafidis,Yamagata和Robertson使用广义矩估计方法(GMM)研究了英国企业劳动力雇佣情况[13].假定变量初始值服从平稳分布,相比将初始变量假定为固定值的传统假设更为合理;同时,假定待估计随机系数服从Logit正态分布,保证了自回归过程的平稳性.在贝叶斯理论框架下,对含外生变量的动态随机系数面板数据模型进行了贝叶斯推断,并且使用层次贝叶斯超参数先验设置,利用贝叶斯方法对模型进行参数估计,以我国东中西部六省的城镇居民人均消费和可支配收入构成的面板数据进行实证研究,发现贝叶斯方法可以有效地对动态面板数据模型进行参数估计.考虑动态面板数据模型:选取我国东中西部六省山东、广东、河南、湖南、甘肃、贵州的1997~2008年的居民收入、消费年度数据建立城镇居民的消费模型,对各省的居民消费结构进行分析.模型中的被解释变量CS为城镇居民人均全年消费;同时,根据美国经济学家杜森贝利的观点:人们的消费具有惯性,前期消费水平高,会影响下一期的消费水平,故将前期城镇居民人均全年消费和当期城镇居民人均全年可支配收入YD作为模型的解释变量.首先对各截面时间序列数据的统计特征进行分析,然后建立随机系数动态面板数据消费模型,之后对模型进行贝叶斯参数估计.1)数据特征分析由表1可见,六省城镇居民家庭平均消费序列中,均值广东最高,河南最低;方差广东最大;甘肃最低,贵州方差最小.Jarque-Bera检验统计量在1%的水平上不能拒绝正态分布的原假设,可以认为各省人均消费时间序列服从正态分布.从表2可以发现,六省城镇居民可支配收入序列中,广东的均值和方差最大,甘肃的均值和方差最小.Jarque-Bera检验统计量在1%的水平上也不能拒绝正态分布的原假设,说明各省人均可支配收入时间序列也服从正态分布.2)模型形式设定设CSit为第t年第i省城镇居民家庭平均消费支出,CSit-1表示前期第i省城镇居民家庭平均消费支出,YDit为第t年第i省城镇居民人均可支配收入.针对人均消费和人均可支配收入的时间序列进行数据统计特征分析之后,建立随机系数动态面板数据模型:其中,CSit-1为消费的前一期值,综合反映了前一期收入和消费对当前消费变量的影响,αi为各省的自发消费水平.3)参数估计根据所构建的动态面板数据消费模型,基于层次贝叶斯方法,利用MCMC方法估计模型的参数.在模型运行中共进行了200 000次抽样,为消除初始值的影响,将迭代的前100 000次舍弃,然后用100 001次到200 000次迭代得到的样本进行参数估计.图2~4给出了各截面参数α,β,γ的动态迭代轨迹.从迭代轨迹图可以发现各参数的两条马尔可夫链是收敛的,说明MCMC仿真过程是平稳的.图5~7给出了各截面参数α,β,γ的Gelman-Rubin统计量收敛性诊断,从图中可以看出各参数的GR统计量随着迭代次数增加趋近于1,表明抽样方法的收敛性很好.图8~10给出了各截面参数α,β,γ的后验分布的核密度估计曲线,其形状比较平滑随着截面个体的不同而改变,说明Gibbs迭代过程有效地模拟了模型中各参数的边缘后验分布.根据抽样结果,利用MCMC算法可以进行动态面板数据模型的贝叶斯估计,表3给出了各截面参数α,β,γ的后验均值、标准差、MC误差、2.5%分位数和97.5%分位数的贝叶斯估计值.通过对表3的分析,可以得出如下结论:1)参数α表示自发消费水平,α4的后验估计值为161.5,可以发现湖南的自发消费水平在六省中最高;2)参数γ表示前期消费对当期消费的影响程度,即消费惯性,从参数估计值上看,γ4的后验估计值为0.5342,六省中消费惯性最高的为湖南,说明对于湖南来说,前期消费水平对当期消费水平有较大影响,应当重视消费惯性对居民消费水平的影响;3)参数β表示可支配收入对当期消费的影响程度,从参数估计值上看,β2的后验均值为0.398 1,说明可支配收入对消费影响最高者也是广东,即由于广东有较高的人均可支配收入,对当期消费可形成较大解释力度.另外,从参数估计的其他性质来看,所构建的随机系数动态面板数据模型较好地拟合了不同截面个体的城镇居民消费模式,其中参数估计的标准差和MC误差都比较小,说明贝叶斯随机系数动态面板数据模型是有效的.基于贝叶斯理论构建了含外生变量的随机系数动态面板数据模型,考虑经济运行实际将经济变量初始值假定为服从平稳分布;为保证待估计参数的平稳性,假定自回归模型参数服从Logit正态分布.利用层次先验方法基于Gibbs抽样算法实现了对随机系数动态面板数据模型的参数估计,解决了贝叶斯方法在应用中遇到的数值计算问题,模拟了各参数的MCMC迭代轨迹,参数的贝叶斯估计和参数的边缘后验分布.各参数的MCMC迭代轨迹是收敛的,说明Gibbs抽样方法很好地模拟了参数的边缘后验分布,且各参数模拟的标准差和MC误差都比较小,且参数的边缘后验密度呈钟形,由此可见贝叶斯随机系数动态面板数据模型的有效性.如何利用贝叶斯方法分析高阶动态面板数据模型以及在经济金融中的应用有待进一步研究.【相关文献】[1]J Heckman,E Leamer.Handbook of Econometrics[M].Amsterdam:Elsevier,2001,3229-3296.[2]J Imbs,H Mumtaz,M Ravn,et al.PPP strikes back:aggregation and the Real Exchange Rate[J].The Quarterly Journal of Economics,2005,120(1):1-43.[3]X Hu,S Ng.Estimating Covariance Structures of Dynamic Heterogeneous Panels [R].Colambia:Columbia University Working Paper.[4]N Haque,M Pesaran,S Sharma.Neglected Heterogeneity and Dynamics in Cross-country Saving Regressions[R].IMF Working Paper,1999.[5]J Yu,R Jong,L Lee.Quasi-maximum likelihood estimators for spatial dynamic panel data with fixed effects when both n and T are large[J].Journal of Econometrics,2008,146(1):118-134.[6]M Pesaran,R Smith.Estimating long-run relationship from dynamic heterogeneous panels[J].Journal of Econometrics,1995,68(1):79-113.[7]C Hsiao,M Pesaran,A tahmiscioglu.bayes estimation of short-run coefficients in dynamic panel data models[C]//C Hsiao,K Lahiri,L Lee,et al.analysis of panelsand limited dependent variables:a volume in honour of G S Maddala.Cambridge:Cambridge University Press,1999:268-296.[8]B Park,R Sickles,L Simar.Semiparametric efficient estimation of dynamic panel data models[J].Journal of Econometrics,2007,136(1):281-301.[9]朱慧明,李素芳.基于VAR模型的中国居民消费水平贝叶斯单位跟检验[J].财经理论与实践,2008,29(154):97-101.[10]汪朝晖,刘万荣.利用面板数据模型分析湖南城镇居民的收入与消费之间的关系[J].经济数学,2007,24(1):54-58.[11]王立平,王建.中国产业结构变迁对区域经济增长分析——基于空间动态面板数据模型[J].统计与信息论坛,2010,25(7):92-97.[12]A Ciarreta,A Zarraga.Economic growth-electricity consumption causality in12European countries:A dynamic panel data approach[J].Energy Policy,2010,38(7):3790-3796.[13]V Sarafidis,T Yamagata,D Robertson.A test of cross section dependence for a linear dynamic panel model with regressors[J].Journal of Econometrics,2009,148(2):149-161.[14]C Hsiao.Analysis of panel data[M].Cambridge:Cambridge University Press.2003:69-109.[15]B Nandram,J Petruccelli.A bayesian analysis of autoregressive time series panel data[J].Journal of Business &Economic Statistics,1997,15(3):328-334.。
GJR-CAViaR模型的贝叶斯分位数回归——基于Gibbs抽样的MCMC算法实现张颖;傅强【摘要】本文将基于Gibbs抽样的MCMC算法引入GJR-CAViaR模型,实现模型的贝叶斯推断.G JR-CAViaR模型是含有递归形式的分位数回归方程,尚未有文献提出如何对其进行贝叶斯分析和MCMC估计.本文首先利用不对称拉普拉斯分布建立GJR-CAViaR模型的似然函数,并通过引入标准指数分布和标准正态分布的混合分布得到不对称拉普拉斯分布的参数解析的条件分布,然后讨论模型的Gibbs抽样过程以及算法实现.对上证综指日收益率数据建立GJR-CAViaR模型,并得到模型参数的贝叶斯估计值.在马尔科夫链收敛的前提下,发现中国证券市场VaR具有自回归性质,且呈现收益对风险的不对称特征.这一特征不会受到样本容量大小及置信水平的影响.【期刊名称】《中央财经大学学报》【年(卷),期】2017(000)007【总页数】9页(P87-95)【关键词】GJR-CVAiaR;Gibbs抽样;不对称拉普拉斯分布;贝叶斯分位数回归【作者】张颖;傅强【作者单位】西北政法大学经济学院;中央财经大学财经研究院【正文语种】中文【中图分类】F011一、引言目前,常用的分位数回归模型的估计方法分为两类。
一类是直接进行优化求解,如单纯形法和内点法。
另一类是借助于贝叶斯原理进行参数估计。
直接优化求解属于频率学派的范畴,是传统的经典统计学方法。
经典估计方法将参数视为固定常数,然后利用最小二乘或极大似然等方法计算参数的估计值,得到参数的渐近分布和统计性质,并进行假设检验。
贝叶斯学派与经典统计法在参数估计的原理上存在不同。
贝叶斯学派将待估参数视为随机变量,利用贝叶斯原理和观测样本得到参数的后验分布。
在无法得到参数后验分布的具体表达形式时,采用重复抽样技术解决参数的估计问题。
因此,相对于传统统计对样本量的敏感,贝叶斯统计在小样本情形下也能得到可靠的参数信息。
2023年10月水 利 学 报SHUILI XUEBAO第54卷 第10期文章编号:0559-9350(2023)10-1236-12收稿日期:2023-04-08;网络首发日期:2023-10-19网络首发地址:https:??kns.cnki.net?kcms?detail?11.1882.TV.20231018.1051.001.html基金项目:国家自然科学基金重点项目(U21A2004)作者简介:刘墉达(1998-),硕士生,主要从事地下水数值模拟研究。
E-mail:liuyongda@tju.edu.cn通信作者:陈喜(1964-),博士,教授,主要从事地下水数值模拟研究。
E-mail:xi_chen@tju.edu.cn基于MCMC和ES-MDA方法的地下水数值模型非均质参数场及开采量的反演研究刘墉达,陈 喜,高 满,孟详博,刘维翰,黄日超(天津大学地球系统科学学院表层地球系统科学研究院,天津300072)摘要:马尔科夫链蒙特卡罗方法(MCMC)和多重数据同化集合平滑器方法(ES-MDA)近年来在地下水参数反演得到广泛应用,但对三维多层非均质含水层参数反演精度和计算效率还缺乏对比分析。
本文构建了含有基于Karhunen-Loève展开的非均质参数场的潜水和多层承压水含水层案例,并建立了地下水数值模型和基于Kriging方法的替代模型,模拟含水层分层水头变化,探讨了基于替代模型的MCMC、替代模型和数值模型相结合的两阶段MCMC以及ES-MDA方法反演的含水层渗透系数以及开采量。
结果表明,针对本文算例,在非均质参数和开采量的反演中,相比而言,两阶段MCMC反演参数精度更高,ES-MDA方法计算效率更高。
本研究为地下水数值模型参数反演方法选择提供参考依据。
关键词:MCMC算法;ES-MDA算法;替代模型;地下水参数;地下水数值模拟 中图分类号:TV123文献标识码:Adoi:10.13243?j.cnki.slxb.202301971 研究背景对于复杂的多层含水层,根据有限的地下水水位等观测数据,反演水文地质参数、开采量等通常存在不唯一性、不确定性问题,且在调用地下水数值模型进行参数反演时,随着调用次数和参数维度增加,反演计算成本变高。
Gibbs蒙特卡洛收敛指标是指在使用Gibbs采样方法进行蒙特卡洛模拟时,对模拟结果的收敛性进行评估的指标。
在统计学和机器学习中,蒙特卡洛方法是一种常用的统计模拟技术,它通过随机抽样的方式来近似求解复杂的数学问题。
Gibbs采样是蒙特卡洛模拟中的一种重要方法,它通过对联合分布进行条件抽样的方式来模拟多维随机变量的分布。
1. 收敛性概念在蒙特卡洛模拟中,收敛性是指随着样本量的增加,模拟结果趋于稳定的性质。
对于Gibbs蒙特卡洛方法而言,收敛性是指在给定的条件下,随着采样次数的增加,模拟结果逐渐接近真实分布的性质。
2. Gibbs蒙特卡洛收敛诊断方法Gibbs蒙特卡洛收敛指标可以通过多种方法进行评估,常用的方法包括:2.1 Gelman-Rubin收敛诊断Gelman-Rubin收敛诊断是一种基于多链蒙特卡洛模拟的收敛性评估方法。
该方法通过比较不同链之间的变异程度和总体变异程度来判断模拟结果是否收敛。
如果不同链的模拟结果趋于一致,那么模拟结果就可以认为是收敛的。
2.2 自相关函数自相关函数是一种衡量时间序列相关性的方法,可以用于评估蒙特卡洛模拟的收敛性。
在Gibbs蒙特卡洛方法中,可以通过计算不同变量之间的自相关函数来判断模拟结果的收敛程度。
如果自相关函数的值在采样次数增加时逐渐趋于0,那么可以认为模拟结果是收敛的。
3. 收敛指标的应用Gibbs蒙特卡洛收敛指标在实际应用中具有重要的意义。
通过对模拟结果的收敛性进行评估,可以有效地判断模拟结果的准确性和稳定性,为进一步的数据分析和建模提供可靠的基础。
收敛指标还可以用于优化模拟算法的参数选择,提高模拟效率和准确性。
4. 总结Gibbs蒙特卡洛收敛指标是对蒙特卡洛模拟收敛性进行评估的重要工具,可以通过多种方法进行评估,包括Gelman-Rubin收敛诊断和自相关函数等。
在实际应用中,收敛指标可以帮助分析人员判断模拟结果的准确性和稳定性,为数据分析和建模提供可靠的支持。
d o i :10.3963/j .i s s n .1674-6066.2024.02.026基于径向基神经网络代理模型的贝叶斯损伤识别方法研究卢小丽,文 韬,郭丽丽(武汉工程科技学院机械与工程学院,武汉430200)摘 要: 提出了一种将径向基神经网络作为代理模型用于贝叶斯框架的损伤识别方法㊂首先采用拉丁超立方抽样技术,选取一定数量的结构输入输出样本,训练出一个径向基神经网络㊂然后将其用于基于马尔科夫链蒙特卡洛抽样的贝叶斯损伤识别方法㊂其中抽样方法采用吉布斯抽样㊂数值算例显示,在考虑测量误差的情况下,提出的方法能准确识别出简支梁的损伤,有效避免了损伤识别反问题的不适定性㊂其计算效率较传统的方法提高了数十倍,是一种很有潜力的损伤识别方法㊂关键词: 径向基神经网络; 损伤识别; 马尔科夫链蒙特卡罗; 吉布斯抽样R e s e a r c ho nB a y e s i a nD a m a g e I d e n t i f i c a t i o n M e t h o dB a s e do nR a d i a l B a s i sN e u r a lN e t w o r kS u r r o ga t eM o d e l L UX i a o -l i ,WE N T a o ,G U OL i -l i(S c h o o l o fM a c h i n e r y a n dE n g i n e e r i n g ,W u h a nU n i v e r s i t y o fE n g i n e e r i n g S c i e n c e ,W u h a n430200,C h i n a )A b s t r a c t : A m e t h o dw a s p r o p o s e d t o u s e r a d i a l b a s i s f u n c t i o n n e u r a l n e t w o r k s a s s u r r o g a t em o d e l s f o r d a m a g e i d e n -t i f i c a t i o nw i t h i n t h eB a y e s i a n f r a m e w o r k .I n i t i a l l y ,L a t i nh y p e r c u b e s a m p l i n g w a s e m p l o y e d t os e l e c t a s p e c i f i cn u m b e r o f s t r u c t u r a l i n p u t -o u t p u t s a m p l e s ,l e a d i n g t o t h e t r a i n i n g o f a r a d i a l b a s i s f u n c t i o nn e u r a l n e t w o r k .S u b s e q u e n t l y ,t h i s n e t w o r kw a s a p p l i e d t o aB a y e s i a nd a m a g e i d e n t i f i c a t i o nm e t h o db a s e do n M a r k o vc h a i n M o n t eC a r l os a m p l i n g .G i b b s s a m p l i n g w a su t i l i z e da st h es a m p l i n g m e t h o d .N u m e r i c a l e x a m p l e sd e m o n s t r a t e dt h a t ,c o n s i d e r i n g m e a s u r e m e n te r -r o r s ,t h e p r o p o s e dm e t h o d a c c u r a t e l y i d e n t i f i e d d a m a g e i n s i m p l y s u p p o r t e db e a m s ,e f f e c t i v e l y a v o i d i n g t h e i l l -p o s e dn a -t u r eo f t h e i n v e r s e p r o b l e mi nd a m a g e i d e n t i f i c a t i o n .T h e c o m p u t a t i o n a l e f f i c i e n c y o f t h i sm e t h o dw a s i m p r o v e db y s e v -e r a l o r d e r so f m a g n i t u d ec o m p a r e dt ot r a d i t i o n a la p p r o a c h e s ,m a k i n g i ta h i g h l y p r o m i s i n g d a m a g ei d e n t i f i c a t i o n m e t h o d .K e y wo r d s : r a d i a l b a s i sn e u r a l n e t w o r k ; d a m a g e i d e n t i f i c a t i o n ; M a r k o vC h a i n M o n t eC a r l o ; G i b b s s a m p l i n g 收稿日期:2023-11-03.基金项目:2022湖北省教育厅科学技术研究计划指导性项目(B 2022387).作者简介:卢小丽(1981-),副教授.E -m a i l :l u x i a o l i 1981w h u e s @163.c o m 通讯作者:郭丽丽(1985-),讲师.E -m a i l :G u o l i l i 1985W h u e s @163.c o m 改革开放40多年来,土木工程与基础设施建设迅猛发展㊂建筑结构朝着大型和超大型方向发展,例如2018年通车的港珠澳跨海大桥就创造了世界桥梁史上数个世界之最㊂这些超大型建筑结构在国民经济发展中起着极其重要的作用㊂实时准确地掌握这些大型建筑结构的健康状况,基于监测数据对这些结构潜在的损伤进行识别,从而对结构的安全评估提供准确的依据,显得至关重要[1]㊂当某一结构出现损伤时,其动静力特性会发生变化㊂结构损伤识别即是采用实测的动静力响应来反演结构参数,并与基准值进行对比,从而确定损伤的位置和大小㊂目前,结构损伤识别主要包含优化方法[2]㊁正则化方法[3]㊁贝叶斯方法[4]等㊂从这些已有的文献可以发现,结构损伤识别是一种力学反问题,经常会遇到反问题的不适定性㊂目前尽管开发出了很多正则化方法来处理反问题的不适定性[5],但如何正确选择最优的正则化参数仍然需要进一步研究㊂值得一提的是,在这些结构损伤识别方法中,贝叶斯方法为解决反问题的不适定性提供了有效的思路㊂B e c k [6,7]将贝叶斯理论引入到结构有限元模型修正和损伤识别方法中,该011建材世界 2024年 第45卷 第2期建材世界2024年第45卷第2期方法基于贝叶斯理论,巧妙地将反问题转化为正向计算问题,并采用马尔科夫链蒙特卡罗(M a r k o vc h a i n M o n t eC a r l o,M C M C)抽样来获得损伤参数的最可能值㊂贝叶斯损伤识别方法一经提出,便获得了广泛的应用[8-11]㊂然而,基于M C M C抽样的贝叶斯损伤识别方法的一个潜在问题是需要进行大量重复的有限元计算[12]㊂这对于中小型结构的损伤识别问题较为有效,但当识别大结构的损伤时,会遇到计算效率低下的问题㊂因此,开发一种高效的代理模型来代替耗时的有限元计算能极大地推进基于贝叶斯M C M C的损伤识别方法在大结构中的应用㊂许多学者在这一领域开展了广泛的研究㊂方圣恩等[13]提出了使用响应面代理模型来进行结构损伤识别㊂马静静等[14]使用K r i g i n g代理模型来对平面桁架结构进行损伤识别㊂许泽伟[15]采用多项式来代替耗时的有限元计算㊂这些方法较为有效推动了大型结构的损伤识别问题㊂但大多数的这类代理模型均是多输入单输出的情况,当用于结构损伤识别的响应参数类型及数量较多时,需要构建多个代理模型,这使得该类代理模型的使用受到一定的影响㊂基于此,提出了一种采用径向基神经网络(R a d i a lB a s i sF u n c t i o nN e u r a lN e t w o r k,R B F-N N)来拟合结构输入输出关系的新型有限元代理模型㊂该方法最早由Z h u等[16]于1988年提出,并广泛应用于机器学习的研究㊂径向基神经网络的一个较大的优势是能进行多输入多输出的预测㊂并且由于结构简单,其训练速度非常快,又将其用于贝叶斯损伤识别方法中M C M C抽样过程中的有限元计算,从而提高计算效率㊂另外在M C M C抽样方法上,考虑到待识别参数的高维特性,选用吉布斯抽样[17]来对损伤参数空间进行探索和抽样㊂论文首先介绍了贝叶斯M C M C损伤识别方法的框架,然后分别介绍了吉布斯抽样方法和径向基神经网络代理模型,并给出了采用径向基神经网络代理模型和贝叶斯M C M C方法进行结构损伤识别的流程图㊂然后以一个简支梁的数值模型为例,验证了提出的方法在结构损伤识别中的有效性㊂1贝叶斯损伤识别方法对于一个具有N个自由度的大型工程结构,定义其未损伤时的刚度为K0㊂结构的损伤可以等效为结构刚度的降低㊂因此,可以将结构损伤后的刚度矩阵的变化量定义为各个单元的刚度该变量之和ΔK=ðn i=1αi K i(1)式中,n为结构的单元数量;i为结构单元序号,且i=1,2, ,n;K i为整体坐标系下的第i个单元的刚度;αi 为第i个单元的损伤因子㊂损伤后结构的刚度矩阵K d可以表示为K d=K0+ΔK(2)初始结构的频率和振型可以通过以下特征值方程进行计算,即K0-λi()Mϕi=0i=1, ,N(3)式中,λi和ϕi为初始结构的特征值和特征向量㊂同理,损伤结构也满足以下特征值方程K d-λ*i()Mϕ*i=0i=1, ,N(4)式中,λ*i和ϕ*i分别为实际结构的特征值和特征向量,通过模态测试获得㊂结构损伤识别即通过实测的结构响应来找到满足式(4)的损伤因子αi㊂通过贝叶斯M C M C方法来估计损伤因子αi的马尔科夫链和最可能值㊂假设损伤因子αi的先验分布为π(α),则测量数据x的联合概率密度分布可表示为p(αi/x)=p(x/αi)π(αi)ʏαi p(x/αi)π(αi)dαi=c㊃p(x/αi)π(αi)(5)对于结构的损伤识别问题,似然函数可以表示为p(x/αi)=e x p-12[y-y(αi)]T㊃Σ-1y[y-y(αi)](6)式中,y为损伤结构的测量响应;y(αi)是与y对应的结构响应的计算值,通常由有限元方法计算;Σy为测量信息方差,通过多次测量结果统计得到㊂111损伤因子的后验概率密度函数可以表示为pαi/()x=p(x/αi)㊃e x p-12[αi-μ0]T㊃Σ-1σ0[αi-μ0](7)式中,μ0为损伤因子的先验值;Σσ0为先验参数的方差㊂基于式(7)的后验概率密度函数,采用M C M C方法,可以得到损伤因子的马尔科夫链,进而求得损伤参数αi的最可能值㊂2吉布斯抽样M C M C是一种用于从复杂分布中抽样的技术,被广泛的应用于贝叶斯参数估计方法中㊂吉布斯抽样(G i b b sS a m p l i n g)是M C M C中的一种特殊方法,特别适合处理高维数据㊂在吉布斯抽样中,假定目标是多元分布P(α1,α2, ,αn),则吉布斯抽样方法一次只从一个参数αi的条件分布中抽样,同时固定其他参数㊂重复该过程多次便可以获得完整的后验样本㊂具体的抽样步骤如下:1)选择一个初始点α(0)=α(0)1,α(0)2, ,α(0)()p2)对于t=1,2, 重复以下步骤:(1)从P(α1α(t-1)2, ,α(t-1)p,D)中抽样得到α(t)1;(2)从Pα2α(t)1,α(t-1)3, ,α(t-1)p,()D中抽样得到α(t)2;(3)从Pαpα(t)1, ,α(t)p-1,()D中抽样得到α(t)p㊂通过上述步骤(1)~(3),可以得到参数α的一个序列样本,这些样本来自于后验分布Pα()D㊂3径向基神经网络R B F-N N是一种浅层神经网络,特点是其隐藏层使用径向基函数作为激活函数㊂这种神经网络特别适合进行函数逼近㊁模式识别等任务,因为它具有出色的局部逼近能力㊂R B F-N N作为一种前馈型三层神经网络,如图1所示㊂给定输入向量x,则R B F-N N的输出表示为O(x)=ðNωiϕ( x-c i )(8)式中,N为隐藏层神经元的数量;ωi为第i个神经元的权重;c i为第i个神经元的中心;ϕ(㊃)为径向基函数,㊃ 为欧几里得距离㊂径向基函数ϕ(㊃)的选择是径向基神经网络的核心,最常见的径向基函数是高斯函数ϕ(r)=e-βr2(9)式中,r= x-c i 为输入x到中心c i的距离;β为控制径向基函数的宽度㊂论文采用该神经网络来拟合结构参数和结构动力响应关系,从而代替大结构中耗时的有限元重复计算㊂基于R B F-N N和G i b b s-S a m p l i n g的贝叶斯M C M C损伤识别方法的主要步骤如下:1)选择待识别的结构参数,并采用拉丁超立方抽样生成一定数量的结构参数样本,并采用A N S Y S来计算每个样本对应的结构响应㊂2)用获得的结构参数和结构响应样本训练出一个R B F-N N神经网络,并验证精度㊂3)采用吉布斯抽样获得结构参数样本,并用R B F-N N获得结构动力响应数据,与动力测量数据一起代入式(4)中的似然函数,最终得到结构损伤参数的后验概率密度函数㊂4)收敛和分析:通过进行足够多的吉布斯抽样迭代,得到的样本序列将逐渐收敛到后验概率密度函数㊂将这些样本进行分析㊁计算统计量㊂具体的流程图如图2所示㊂2114数值算例以一个12单元简支梁进行说明,梁的跨长为3600m m,横截面为矩形,宽为250m m,高为150m m㊂梁的有限元模型采用三维实体单元建模㊂整个梁被划分为12个长度相等的子结构,每个子结构的长度为300m m㊂每个子结构包含100个单元,每个单元8个节点,每个节点包括x㊁y㊁z三个方向的3个自由度㊂整个结构的总自由度数量为7986个㊂假设梁的初始模型弹性模量为2.8ˑ1010P a,密度为2.5ˑ103k g/m3㊂定义梁的第③㊁⑤㊁⑦㊁⑨子结构的弹性模量分别减少10%㊁20%㊁30%和15%㊂其他子结构的弹性模量保持初始值不变㊂且梁的质量已知㊂将梁的12个子结构的弹性模量相对于初始值的改变率定义为损伤因子㊂并从左到右编号为α1~α12,如图3所示㊂首先采用拉丁超立方抽样方法分别将α1~α12在(-0.6~0.6)范围内各抽取500个样本,组成500组结构参数,作为R B F-N N的输入㊂然后将这些样本输入到A N S Y S中计算出500组结构频率和振型,作为神经网络的输出㊂并采用梯度下降的方法进行训练,经过如图4所示的75次迭代后,其误差逐渐下降到0.00997,低于1%的预设值,在允许的误差范围内㊂最终获得结构参数与结构动力响应的映射关系,从而得到数值梁的有限元代理模型㊂将预设的结构弹性模量代入A N S Y S中,计算出结构动力响应,选取前四阶频率和振型,并添加3%的高斯白噪声作为仿真的测量结果,然后用提出的方法进行结构损伤识别㊂在构建式(4)的似然函数时,采用式(8)来计算抽取的样本对应的结构动力响应,然后采用吉布斯抽样获得损伤参数的马尔科夫链㊂去掉燃烧期(舍去前3000个样本),并统计出各损伤因子的最可能值,如图5所示㊂从图5中可以看到,该方法识别出的结构损伤与预设的损伤几乎完全吻合,这说明了该方法损伤结果的准确性㊂另外,从计算时间来看,由于采用了R B F-N N代理模型来代替耗时的有限元计算,该方法的计算速度比传统的采用有限元计算响应的贝叶斯方法高出约30倍,这表明该方法的计算效率是高效的㊂综合整个识别结果来看,该方法是一种处理大结构损伤识别问题的有效方法㊂3115结语提出了一种使用径向基神经网络(R B F-N N)作为代理模型的贝叶斯损伤识别方法㊂该方法基于贝叶斯框架,采用M C M C来获得损伤因子的后验概率分布及最可能的损伤值㊂在M C M C过程中,采用吉布斯抽样并结合提出的代理模型来快速计算似然函数,最终获得损伤因子㊂提出的代理模型能直接进行多输入多输出预测㊂所采用的吉布斯抽样方法更适合处理高维参数㊂通过一个十二单元简支梁验证了所提方法的准确性和高的计算效率㊂该方法在大型工程结构的损伤识别中具有较好的应用前景,下一步拟将该方法应用于实际工程结构的损伤识别中㊂参考文献[1]闫桂荣,段忠东,欧进萍.基于结构振动信息的损伤识别研究综述[J].地震工程与工程振动,2007,27(3):95-103.[2]陈承滨,余岭,潘楚东,等.基于蚁狮优化算法与迹稀疏正则化的结构损伤识别[J].振动与冲击,2019,38(16):71-76.[3]黄斌,鲁溢.基于L1正则化的随机梁式结构静力损伤识别方法[J].计算力学学报,2020,37(1):69-74.[4] X i aY,H a o H.S t a t i s t i c a lD a m a g e I d e n t i f i c a t i o no fS t r u c t u r e sw i t hF r e q u e n c y C h a n g e s[J].J o u r n a l o fS o u n da n dV i b r a-t i o n,2003,263(4):853-870.[5]谭颖轩,陈衍茂,汪利,等.基于模态修正策略和稀疏正则化的损伤识别[J].中山大学学报(自然科学版),2022,61(3):116-122.[6] B e c kJL,K a t a f y g i o t i sLS.U p d a t i n g M o d e l sa n dT h e i rU n c e r t a i n t i e s I:B a y e s i a nS t a t i s t i c a lF r a m e w o r k[J].J o u r n a l o fE n g i n e e r i n g M e c h a n i c s,1998,124(4):455-461.[7] B e c kJL,A US i u-k u i.B a y e s i a nU p d a t i n g o f S t r u c t u r a lM o d e l s a n dR e l i a b i l i t y U s i n g M a r k o vC h a i n M o n t eC a r l oS i m u l a-t i o n[J].J o u r n a l o fE n g i n e e r i n g M e c h a n i c s,2002,128(4):380-391.[8] L u o J,H u a n g M,X i a n g C,e ta l.B a y e s i a nD a m a g eI d e n t i f i c a t i o nB a s e do n A u t o r e g r e s s i v e M o d e l a n d MH-P S O h y b r i dM C M CS a m p l i n g M e t h o d[J].J o u r n a l o fC i v i l S t r u c t u r a lH e a l t h M o n i t o r i n g,2022,12(2):361-390.[9] Z h o uZ,T a r t a k o v s k y D M.M a r k o vC h a i n M o n t eC a r l o w i t h N e u r a lN e t w o r kS u r r o g a t e s:A p p l i c a t i o nt oC o n t a m i n a n tS o u r c e I d e n t i f i c a t i o n[J].S t o c h a s t i cE n v i r o n m e n t a lR e s e a r c ha n dR i s kA s s e s s m e n t,2021,35:639-651.[10]干露,陈辉.基于贝叶斯方法的统计模型修正和结构概率损伤识别[J].机械强度,2022,44(1):133-139.[11]N i j k a m p E,H i l lM,H a nT,e t a l.O n t h eA n a t o m y o fM c m c-b a s e dM a x i m u mL i k e l i h o o dL e a r n i n g o f E n e r g y-b a s e dM o d e l s[J].P r o c e e d i n g s o f t h eA A A IC o n f e r e n c e o nA r t i f i c i a l I n t e l l i g e n c e,2020,34(4):5272-5280.[12]C h i n g J i a n y e,C h e nY i c h u.T r a n s i t i o n a lM a r k o vC h a i nM o n t eC a r l oM e t h o d f o r B a y e s i a nM o d e lU p d a t i n g,M o d e l C l a s s S e-l e c t i o n,a n d M o d e lA v e r a g i n g[J].J o u r n a l o fE n g i n e e r i n g M e c h a n i c s,2007,133(7):816-832.[13]方圣恩,陈杉,董照亮.结构概率损伤识别的改进近似贝叶斯计算[J].振动工程学报,2019,32(2):224-233.[14]马静静,殷红,彭珍瑞,等.基于K r i g i n g模型的损伤识别方法[J].机械强度,2020,42(4):786-792.[15]许泽伟,彭珍瑞,张亚峰,等.基于多项式混沌展开和K L散度的随机有限元模型修正[J].机械强度,2022,43(6):1297-1302.[16]Z h uQ,C a iY,L i uL.A G l o b a l L e a r n i n g A l g o r i t h mf o r aR B FN e t w o r k[J].N e u r a lN e t w o r k s,1999,12(3):527-540.[17]L a r o c q u eJR,R e i l l y JP.R e v e r s i b l eJ u m p M C M Cf o r J o i n tD e t e c t i o na n dE s t i m a t i o no fS o u r c e s i nC o l o r e d N o i s e[J].I E E ET r a n s a c t i o n s o nS i g n a l P r o c e s s i n g,2002,50(2):231-240.411。
2012年第35期(总第50期)科技视界Science &Technology VisionSCIENCE &TECHNOLOGY VISION 科技视界0引言多输入多输出(MIMO)多天线技术由于能提供更高的容量、更大的分集增益和干扰抑制性能[1],因而成为移动通信的一种关键技术。
MIMO 系统接收机接收到的是在时间上和频带上相互重叠的多路信号,信号检测性算法直接影响到MIMO 通信系统的性能,因此对高性能、低复杂度的MIMO 检测技术的研究已经成为无线通信研究领域热点之一。
传统的MIMO 检测中常用的传统算法有MIMO 最大似然(ML,MaximumLikelihood)检测算法[2]、迫零(ZF,ZeroForcing)检测算法[3]、最小均方误差(MMSE,MinimumMean-SquareError)检测算法[4],迭代算法[5-6]有Gibbs 抽样、随机化搜索。
本文详细阐述了这些算法的工作原理,进行了误码性能仿真和复杂度分析。
1MIMO 系统模型MIMO 通信系统的模型,如图1所示:图1所示的MIMO 系统,其等效模型表示为:y=Hx+n (1)其中,M 是发射天线数、N 是接收天线数,且N ≥M ,y=[y 1,…,y N ]T 是1×N 维的接收信号,H 是N×M 维的信道矩阵,x=[x 1,…,x M ]T 是1×M 维的发射信号向量,x i ∈Ω(i =1,2,…,M ),其中Ω为调制符号集合,如4-QAM 调制,有四个调制符号,组成的集合为Ω={-1-i ,-1+i ,+1-i ,+1+i },i 为虚部的表示符号。
Ω集合的元素个数为Ω。
n 是1×N 维的噪声。
h ij 为矩阵H 的第(i ,j )项,表示从第j 根发射天线到第i 根接收天线的信道增益,服从瑞利分布。
x 为各项独立同分布。
n 为各项独立同分布且服从均值为零,方差为δn 2的复高斯分布。