序贯高斯模拟
- 格式:ppt
- 大小:2.62 MB
- 文档页数:19
流线模拟技术在油藏数值模拟中的应用X王 冰1,王 焕2(1.中国石油大学,北京 102249;2.北京温菲尔德石油技术开发有限公司技术中心,北京 100191) 摘 要:流线模拟具有计算速度快,收敛性强的特点,可以快速优选随机地质模型。
给出了流线模拟的数学方法,以国内某油田为实例,应用序贯高斯随机模拟方法建立了三个等概率的随机地质模型,并进行了流线模拟,通过计算机流线模拟再现了地下流体的流动动态。
对三个等概率随机模拟模型进行优选,流线模拟结果表明,随机地质模型应该优选模型1,并给出模型1的流线图。
流线图显示了流体从注水井流向采油井的方向和数量,相当准确地确定了注水井和采油井之间的连通情况。
关键词:流线模拟;随机建模;数值模拟;油田开发 中图分类号:T E319 文献标识码:A 文章编号:1006—7981(2012)07—0080—03 多学科油藏研究是实现现代油藏管理的手段,而油田开发信息化是多学科油藏研究的基础条件[1]。
目前,多学科油藏研究已经实现了地质建模和数值模拟的一体化。
地质建模国际上流行的是随机建模,该方法所建立的模型不是一个,而是多个,而数值模拟必须是选择一个与实际油藏最接近的模型,若采用常规数值模拟的方法优选随机地质模型计算速度比较慢,一个百万节点的模型需要计算五天左右,而采用流线模拟只需运行几个小时。
流线模拟的时间步长可以比较大,实现快速运算的可能。
另外,流线模拟还可以提供油藏的流动模式和连通方面的可视化数据。
因此,先采用流线模拟优选随机地质模型,然后再进行数值模拟,是多学科、数字化油田的发展方向。
1 流线模拟的理论模型流水线是流动场中始终与速度向量相切的线。
因此所有流线型算法都以确定速度场作为开始[2]。
速度场由网格块表面的流量线性插值得到,其根据:v x=v x,0+a x(x-x0),a x=v x,$x-v x,0$x(1)v y=v y,0+a y(y-y0),a y=v y,$y-v y,0$y(2)v z=v z,0+a z(z-z0),a z=v z,$z-v z,0$z(3)其中,v x,v y和v z分别是速度场的x-,y-和z-定定期校准。
StatMod只适用于三维工区。
主要算法:1. Sequential Gaussian Simulation (序贯高斯模拟) SGS2. Sequential Gaussian Collocated Co-simulation (序贯高斯配置协模拟) SGCCS3. Sequential Gaussian Co-simulation (序贯高斯协模拟) SGCS4. Sequential Indicator Simulation (序贯指示模拟,岩性模拟) SIS5. Lithology masks (遮挡岩性指示模拟)6. Sequential Indicator Simulation with a trend (带趋势的序贯指示模拟) SIS with trend7. Stochastic inversion (随机反演)一 、Sequential Gaussian Simulation (序贯高斯模拟) :----只用井数据作一种曲线的随机模拟例如对某一层(layer),用多井的孔隙度,进行 孔隙度的随机模拟。
一般需要15-20口井才会有效果分析:porosity first histogramfirst variogram(一) StatMod StatMod analysis …1、Input :(1) Variograms / transforms file … ( 键入文件名)simu.var(2) Trace gate … (3) Time / Depth mode … Time(4) Solid model … tdc1 ( 选EarthModel 的结果)(5) Layers … 选层(layer),例如:b.c 层(6) (作直方图分析)Well logs data …Model data …data …a) 选井文件:(选多个时域井文件)Log type : ( 选单一井曲线,如:porosity )出现 StatMod Transform 窗口Nr of intervals : 10 (直方图条数)出现直方图DoneUse automatic fitType Log – Ganssion (选任一种来拟By table 合分布函数)porosity_hist ( 存入simu.var )Assign current transform to selected layersOk Donee) Line width (置线条宽度)Title (写图名)Done(7)Data for variogram sampling and modeling --(作变异图分析)Primary data …Well log data ……a)选多个时域井文件选井曲线( porosity ),出现StatMod variogram 窗口Function注意:Indicator出现变异图)c) 可以扫描岩性的横向与纵向变化:(各向同性)(各向异性)(扫描储层的大致走向方向)Lateral Direction ( Azimuth )# of angles Angle Tolerance Bandwidth (m)Vertical Direction ( Dip ):Tolerance Bandwidth ( m )d) Anisotropy : Anisotropice) Okf)Func Type:可选 Gaussian或 Spherical来拟合数据点填写 sill 值与 x.y.z ( lag 值),可以反复调。
GOCAD地质建模Gocad是以工作流程为核心的一款地质建模软件,达到了半智能化建模的世界最高水平,具有功能强,界面友好,易学易用,并能在几乎所有平台上(Sun, SGI, PC-Linux, PC-Windows)运行的特点。
以下通过一个简单的例子,说明GOCAD地质建模的主要过程。
第一部分 GOCAD的启动1、双击桌面上的Gocad启动图标,即可启动Gocad程序。
2、选择New project建立新工程,给工程起个名字,选择路径在文件夹Project中,点击保存,打开下图:3、选择Select All,点击OK即可。
4、弹出选择工程单位窗口如下。
此处选择平面上单位是英尺(Feet),深度单位也是英尺(Feet);时间选择毫秒;深度方向选择向上为增大;z值是时间域或深度域,选择深度域(最终如下图)。
选择完后点击OK。
5、打开如下Gocad主窗口。
第二部分 GOCAD数据加载一、地震数据加载以SEGY格式为例,加载三维地震数据选择File > Import objects >Seismic Data > SEG-Y 3D as Voxet。
在Data文件夹下选择文件“tornado.sgy”,点击OK即可加载,如下图。
二、井数据加载1、井位数据加载不同的数据格式有不同的加载方法。
以普通的文本格式为例,包括井名、x坐标、y坐标、补心海拔、井深等。
(1)加载方式是:File > Import objects > Well data > (path)Locations from column-based File ,在Data\Wells文件夹中选择文件“WellPaths”,接受默认,按next两次,打开下图:(2)对问题What information do you have for the path? 选择X-Y-TVDSS-MD。
下来的两个问题各选Feet和Use a Column。
序贯高斯模拟基本原理
嘿,朋友们!今天咱来唠唠序贯高斯模拟基本原理。
这东西啊,就像是搭积木一样有趣!比如说吧,想象一下你面前有一堆五颜六色的积木,你想怎么搭就怎么搭,最后搭出你心目中的城堡,序贯高斯模拟差不多也就是这个道理啦!
它首先呢,会去收集一堆数据,就像我们收集各种颜色的积木一样。
这些数据可能来自于地质探测啦、环境监测啦等等好多地方。
然后呢,它可神奇了,它会利用这些数据来构建一个模型,就如同我们用积木搭建出城堡的大致轮廓。
接着呀,它会一点一点地填充细节,就好像给城堡加上窗户、门这些小部件一样。
在这个过程中,它不是死板地进行的哦,而是充满了灵活性,可会“随机应变”啦!比如在一个区域数据比较密集的时候,它就能很准确地模拟;要是数据比较稀疏的地方呢,它也能发挥想象,给出一个合理的推测。
这多有意思啊!
比如说在石油勘探领域,序贯高斯模拟就能大显身手呀!勘探人员可以用它来模拟地下油藏的分布情况,说不定就能找到大油田呢,那可就发财啦,
哈哈!在环境保护中,也可以用它来模拟污染物的分布,这样就能更好地制定治理方案啦。
序贯高斯模拟就是这样一个神奇又实用的工具!它能让我们从一堆看似杂乱无章的数据中,找出规律,构建出一个有意义的模型。
是不是超级厉害?所以呀,千万可别小瞧了它,它真的能给我们的生活和工作带来很多惊喜和帮助呢!。
Petrel建模中的几点认识引言20世纪初年代发展起来的以井资料为主的三维地质建模技术,目前已成为油田开发阶段油藏研究的重要手段之一。
Schlumberger公司的Petrel虽然在地震解释方面有不错的表现,但己经不再是仅仅定位在建模上的勘探开发一体化工具,建模仍然是它的突出特点。
在完成构造建模的基础上,分2个阶段进行建模:①采用针对离散变量(如岩相)的模拟方法,建立储层骨架模型;②在储层骨架边界的控制下,对储层连续性变量的模拟方法建立储层参数模型,相建模是2个阶段建模的关键。
笔者旨在探讨Petrel软件中进行相建模和变差函数求取中的几点认识。
1.相模型的建立相分布控制着砂体分布,只有砂体内才具有有效的储层参数,不同相的储层参数分布规律不同,相控建模过程充分体现了地质思维和地质知识,更增加了地质因素对于属性模型的控制。
尤其是对于成岩与后生改造作用不强的储层,原始沉积作用控制着储层宏观非均质性,沉积相带的交替是制约储层性质的根本因素叫,当没有相约束时,各个储层参数建模之间的差别相当大,用沉积相或者岩相约束进行相控建模成为必然选择。
相控建模时可采用沉积相约束和岩相约束2种方法,Petrel在相建模和属性建模中采用了GSLIB中成熟的技术和方法。
随机模拟的方法很多,目前应用最多、最成功的方法是序贯模拟方法,至于模拟相模型时采用哪种计算方法,这里不再赘述。
尽管Petrel提供了多达7种建立相模型的方法,笔者仅就实际操作过程中常用的3种进行讨论。
1.1手工勾绘沉积相图使用手工勾绘的沉积相图作为约束条件时,PeIrel中的相控建模,就变成了相带图的立体化,模拟出的孔、渗边界就是生硬的沉积相边界。
相的引入是作为参数模拟的边界条件,在不同相的内部实现参数模拟,笔者认为这种做法使Petrel的功能削弱了,可见,手工勾绘沉积相图只适于对随机模拟的相模型进行局部修改。
1.2采用岩相模型代替沉积相模型当没有足够细致的沉积微相研究时,模拟的沉积相模型的精细程度将有所欠缺,进而导致井间单砂体的连通性、砂体的尖灭及砂体内部的泥岩夹层等得不到很好的反映;相反,当用泥质含量曲线划分岩相时,模型的纵向分辨率可以直接和0.125m采样率的电测曲线进行对比,单砂体的连通性、砂体的尖灭等都得到很好的反映。
地质统计学反演(StatMod)一、方法原理JASON的StatMod是一个集多种随机模拟技术的软件包,是以概率论为其理论基础的。
其目的是提供一个或多个在某种概率条件下的,既满足数据的地质统计学特征又满足地质、测井和地震信息的三维储层参数概率模型。
数据的地质统计学特征由数据的概率分布图和变异函数描述。
由于地质统计模拟是基于概率意义上的随机模拟。
为满足概率条件必须有足够多的井资料。
软件要求的已知井数不少于6口。
地质统计学主要的算法是岩性指示模拟和序贯高斯模拟技术(SGS)。
序贯高斯模拟方法是一种产生来自高斯场模型实现的方法。
它基于序贯模拟思想。
该方法首先是将研究区域离散为网格系统,然后序贯地处理每一个网格节点。
由于每个节点处随机变量是服从条件化的正态分布,因此,网格节点值完全由均值和方差两个参数确定。
通过求解克里金方程组就可给出该网格节点处的均值和方差,从而将节点处的正态分布确定下来,并采用相应的抽样方法得到该网格节点处的一个样本。
直至全部网格节点计算完毕。
需要指出的是:求解克里金方程组时的条件数据包括原始数据,先前已模拟的、落在模拟邻域内所有被模拟的网格节点处的值。
序贯高斯模拟方法是一种条件模拟,它保证原始数据和直方图及变异函数都被条件化。
在地震储层预测中,每一道就是一个网格节点。
在模拟过程中,需要求取的最典型的属性是波阻抗和孔隙度。
地质统计学考虑了模拟过程中结果的不唯一因素,故而增加了结果的误差分析。
通过用户定义方式在三维地质模型的每个网格节点上计算出的概率密度函数,可以计算出结果数据体。
概率密度函数是数据体中能够对不确定性进行正常估算的参数分布规律。
地质统计学反演对测井曲线的应用方式,与Jason其它的反演方法截然不同。
Jason其它反演方法再队测井曲线进行应用过程中,除子波估算外。
只有在地震数据中没有低频信息时,在最终的反演结果中才会反映测井曲线的信息。
然而地质统计学将重采样后的测井曲线沿井轨迹复制到三维网格点中。
2023年第13卷第6期油气藏评价与开发PETROLEUM RESERVOIR EVALUATION AND DEVELOPMENT大民屯凹陷沈水501中深层地热田三维地质建模技术研究丛淑飞,周宏,赵艳,靳海龙,刘鹏,吴荣碧,陈元春(中国石油辽河油田环境工程公司,辽宁盘锦124010)摘要:随着地热开发的不断深入,持续高效开发地热资源,实现地热资源的采灌均衡,是亟待解决的问题。
在Petrel (勘探开发一体化软件平台)这一石油行业地质建模软件基础上开发出适合地热地质建模的应用。
应用多种地热地质资料在Petrel 软件建立地学平台,开展地热地质要素研究,最大限度地集成多种资料信息,提高了地热地质要素的研究水平。
将规模比较小的油气藏建模拓宽到建立大规模热储层模型,不但保证建模精度,在规模上也满足地热地质的需要。
能够根据地热地质概念,利用多种信息,采用确定性建模和随机建模相结合方式,建立热储层温度场模型、压力场模型和有效热储层模型,形成了用Petrel 软件建立热储层地质模型的方法。
利用三维地质模型计算有效热储层资源量,受储层非均质的影响较小,更符合地下真实情况。
准确的热储层三维地质模型及资源量评价,为辽河大民屯凹陷区热藏数值模拟及热藏开发方案的制定提供了扎实的地质基础,为科学开发利用该地区地热资源提供了数据支撑。
关键词:有效热储层;热储层地质模型;随机模拟;序贯高斯模拟;有效热储资源量中图分类号:P641.1文献标识码:A3D geological modeling technology of medium-deep geothermal field in Shenshui 501geothermal field in Damintun SagCONG Shufei,ZHOU Hong,ZHAO Yan,JIN Hailong,LIU Peng,WU Rongbi,CHEN Yuanchun(Petrochina Liaohe Oilfield Environmental Engineering Company,Panjin,Liaoning 124010,China )Abstract:As geothermal resource development continues to advance,addressing the challenge of sustainably and efficiently harnessing these resources becomes increasingly critical.This involves achieving a balance between the exploration and sustainable use (or "irrigation")of geothermal resources.To this end,the application of Petrel,a geological modeling software originally designed for the petroleum industry,has been adapted for geothermal geological modeling,offering a promising solution.The adaptation of Petrel for geothermal purposes involves establishing a geospatial platform within the software to manage and analyze a wide range of geothermal geological data.This platform enables comprehensive research into geothermal geological elements by integrating diverse data sets to the fullest extent,thereby enhancing the quality and scope of geothermal geological studies.This approach involves scaling up from traditional small-scale oil and gas reservoir modeling to large-scale thermal reservoir modeling.Such a transition not only maintains the accuracy of the models but also aligns with the scale requirements unique to geothermal geology.Utilizing Petrel,models of the thermal reservoir temperature field,pressure field,and effective thermal reservoir can be constructed.This is achieved by combining various types of data and employing both deterministic and stochastic modeling techniques,thereby establishing a robust method for thermal reservoir geological modeling using Petrel.A key advantage of employing a 3D geological model for calculating effective thermal reservoir resources is its reduced sensitivity to reservoir heterogeneity.This approach more accurately reflects real subterranean conditions,providing a more reliable basis for resource evaluation.The resulting accurate 3D geological models and resource assessments lay a solid foundation for the numerical simulation of thermal reservoirs and the development of comprehensive thermal reservoir management plans.This,in turn,supports the scientific and sustainable exploitation and utilization of geothermal resources in the area,ensuring their efficient and responsible development.Keywords:effective geothermal reservoir;geology model of thermal reservoir;stochastic simulation;sequential Gaussian simulation;effective thermal reservoir resources收稿日期:2023-07-25。
基于地质统计先验信息的随机地震反演叶端南;印兴耀;孙瑞莹;王保丽【摘要】基于地质统计先验信息的随机地震反演方法是一种基于蒙特卡洛的非线性反演方法.在贝叶斯理论框架下,通过序贯高斯模拟方法(sequential Gaussian simulation,SGS)和逐渐变形算法(Gradual Deformation Method,GDM)得到基于地质统计学的先验信息,然后构建似然函数,最终利用Metropolis算法实现后验概率密度的抽样,得到反演问题的解.与确定性反演结果相比,该方法能够有效地融合测井资料中的高频信息,提高反演结果的分辨率.数值模拟试验表明:本方法的反演结果与理论模型吻合较好,具有较高的分辨率;序贯高斯模拟采用一种新的逐点模拟方式,并结合GDM,有效提高了随机反演的计算效率.【期刊名称】《物探化探计算技术》【年(卷),期】2015(037)003【总页数】7页(P341-347)【关键词】地质统计先验信息;贝叶斯理论;高分辨率;计算效率【作者】叶端南;印兴耀;孙瑞莹;王保丽【作者单位】中国石油大学(华东)地球科学与技术学院,青岛 266580;中国石油大学(华东)地球科学与技术学院,青岛 266580;中国石油大学(华东)地球科学与技术学院,青岛 266580;中国石油大学(华东)地球科学与技术学院,青岛 266580【正文语种】中文【中图分类】P631.4石油勘探和开发已经从简单的构造识别转向复杂构造、薄储层以及老油区剩余油的研究。
目前工业目标地质体的厚度一般在10m甚至10m以下,而实际的反演方法较难区分10m以下的薄层顶底[1],所以提高分辨率以反演薄层信息在储层识别和油藏描述中起到了重要的作用。
随着地球物理研究的深入,非线性反演方法更适用于复杂隐蔽性储层的研究。
地球物理反演中普遍存在非线性和不适定性的问题,若采用线性方法来反演非线性反演问题通常较难得到其真值[2],而随机反演能够在空间相关性和井的约束下,模拟出地震频带以外的信息,分辨率高于常规的确定性反演方法。
PETREL以三维地质模型为中心的一体化油藏工作平台斯伦贝谢科技服务(北京)有限公司PETREL 综合油藏描述平台实现以地质模型为中心的地震综合解释到油藏数值模拟的工作流程面对当今日益复杂的油气藏的勘探开发技术挑战,Petrel 为您提供了一个以地质模型为中心的综合油藏描述研究的完整工作流程,创造了一个允许地质、地震、测井、油藏、钻井、储量评价和数据管理多专业共享知识和成果的开放环境。
Petrel 也成为国际油公司解决油气藏勘探开发技术难题的首选。
勘探和开发团队的统一工作流程 —— 在相同的地质模型里实现地球物理、地质和油藏工程的无缝整合。
在一个相同的环境和系统里,综合整个团队的专家意见,高效地得到精确的工作成果。
通过以地质模型为中心的工作流程,Petrel 消除了传统系统从一个技术领域到另一个技术技术领域存在的鸿沟。
风险和不确定性分析 —— 通过Petrel 可以容易的进行多个工作场景的试验。
Petrel 从地震到数值模拟工作流程的一个重要部分,就是通过工作流程的编辑来获取参数和数据之间的相关关系。
当新的数据到来的时候,你能够快速的更新模型,通过流程运行管理得到数值模拟历史拟合的细节,或在油田开发方案中存在的风险和不确定性。
能够进行知识和最佳方案的管理 —— 通过流程编辑器,专家能够得到在一个地区的最佳方案,从而帮助其他人快速得到首选的工作流程。
简便的操作和直观的流程意味着减少团队新成员开展工作的曲折。
地球物理师地质工程师油藏工程师钻井工程师采油工程师储量评估目标勘探 油藏评价 油藏开发 油气生产PETREL 主要功能地球物理解释分析¾ 基于Iinux 集群并行技术的地震解释服务器功能 ¾ 三维地震数据体标准化方块格式(ZGY )存储功能 ¾ 大三维数据体快速磁盘浏览功能¾ 大层位数据的管理以及多分辨率层位显示功能 ¾ 地震混合体制作显示功能 ¾ 二维/三维混合任意线操作功能 ¾ 多达86种地震属性提取分析功能 ¾ 合成地震记录制作功能¾地震反演 地质建模¾ 多点地质统计算法 ¾ 高斯随机函数算法 ¾ 序贯高斯模拟 ¾ 序贯指示模拟 ¾ 改进的克里金算法 ¾ 截断高斯模拟算法 ¾ 神经网络综合预测 ¾ 目标模拟 ¾ 分级目标模拟技术 ¾ 裂缝建模¾断层建模的质量控制油藏工程¾ 双孔介质的处理 ¾ 粗化技术的提高 ¾ 井的生产数据管理 ¾ 多段井设计和管理 ¾ 模拟生产曲线的输出 ¾ 优化模拟结果的加载 ¾ 开发方案制定 ¾ 水体的处理 ¾ 岩石压缩系数 ¾生产历史拟合分析实时传输2D/3D复合任意线显示裂缝建模地震与数模成果展示¾ 标准WITSML 格式实时钻井、测井数据传输¾ 通过InterACT 和第三方WITSML 服务器进行井场数据的实时传输 ¾与相关的EDM 相连,传输第三方的井轨迹和测井曲线数据管理¾ 多用户项目数据共享 ¾相关项目数据查询¾ ProSource 成果管理器协同工作环境¾ 肢体移动的跟踪 ¾ 指针鼠标¾三维目标识别和操作配套插件¾ InteractivePetrophysics 测井综合解释插件 ¾ DrillingVisualization 钻井可视化插件¾ ProSource 成果管理插件Ocean 应用软件编程接口Petrel 为勘探开发软件提供了一个开放的.Net 开发平台—Ocean, 用户可以将自己的软件通过Ocean 加入到Petrel 中,强化Petrel 的完善工作流程。
一种基于改进Markov模型的插值方法杜奕;张挺;卢德唐;李道伦【摘要】重建过程中常常需要使用多种插值方法来提高重建精度,并结合多来源的数据进行整合.不同尺度、不同分辨率或不同类型的数据结合可以提高空间插值结果的精度.协同序贯高斯模拟(COSGSIM)能够利用已知的主要信息(硬数据)和一些模糊的辅助信息(软数据)来预测重建.协同区域化线性模型(LMC)和最初的Markov 模型(简称MM1)被.COSGSIM用于融合主要信息和辅助信息.但是LMC不能解决不同变量间交叉矩阵不稳定的问题.而MM1模型只有当主要信息定义在比较大的空间尺度时,才可以实现对COSGSIM的逼近.对于上述情况,提出一种改进的Markov模型(简称MM2).MM2模型假设一个位置的辅助信息屏蔽了其他位置辅助信息对该位置主要信息的影响.实验结果表明,当主要信息定义在比辅助信息小的空间尺度时,COSGSIM方法在MM2模型下比MM1有效.%Reconstruction always uses some kinds of interpolation methods and its accuracy can be improved by using multiple data with different dimensions, resolutions or types. COSGSIM (sequential Gaussian co-simulation) has been a widely used geostatistical interpolation method and is introduced into other fields for prediction and reconstruction in recent years because it can estimate unknown values by multiple known data including known primary data (hard data) and some auxiliary data (soft data). The LMC (linear model of coregionalization) and the original MM1 (Markov model 1) are proposed for COSGSIM to fulfill the integration of the primary data and auxiliary data. The main limitation of LMC is the requirement of modeling a positive definite cross covariance matrix for different variables. MM1 is areasonable model only when the primary data are defined on the larger volume support than the auxiliary data. Then MM2 (Markov model 2) for such a case is presented to meet the above condition in an improved Markov model. MM2 screening hypothesis indicates that an auxiliary datum screens the influence of any other auxiliary datum on its primary collocated datum. Experimental results show that the interpolated results of COSGSIM under MM2 are much better than those of COSGSIM under MM1 if the primary data are defined on a larger volume support.【期刊名称】《计算机研究与发展》【年(卷),期】2012(049)003【总页数】7页(P565-571)【关键词】插值;协同序贯高斯模拟;Markov模型;硬数据;软数据【作者】杜奕;张挺;卢德唐;李道伦【作者单位】上海第二工业大学计算机与信息学院上海 201209;上海电力学院计算机与信息工程学院上海200090;中国科学技术大学近代力学系合肥230027;中国科学技术大学近代力学系合肥230027【正文语种】中文【中图分类】TP391.41空间数据可视化在地质勘探、环境监测和医学等领域有着广泛的应用,其所采用的插值方法可分为“确定”性插值方法和“不确定”性插值方法.插值就是利用散乱采样信息,根据一定的物理、数学等有效法则,对未采样点处的属性值进行估计.“确定性”插值方法的“确定性”指其插值形式、插值函数参数的确定均采用确定性算法[1-2].而“不确定性”插值方法的“不确定”性一方面表现在插值形式的随机性上,另一方面表现在插值参数的选取和确定需要依赖于概率统计原则[3-4].综合利用硬数据(主要信息)和软数据(次要信息或辅助信息)进行插值有利于提高插值结果的精度.划分硬数据和软数据的依据是数据是否来自于客观的实在依据.硬数据是基于对客观存在的事物或现象进行测量和观察的结果,而软数据是基于人们的主观判断所得到的统计数据.如果能充分利用较为丰富的软数据,那么必然会提高插值结果的精度[5].“不确定性”插值方法的一大类是可以产生多种可能结果的随机模拟算法.这些随机模拟算法属于全通滤波器.作为一种可以用于结合不同类型数据的全通滤波器,协同序贯高斯模拟(sequential Gaussian co-simulation,COSGSIM)被广泛应用.最初,协同区域化线性模型(linear model of coregionalization,LMC)被COSGSIM用于结合不同信息进行预测,这个模型利用耦合克里格方法进行插值.然而,耦合克里格方法存在着不同变量间交叉矩阵不稳定的问题,这大大限制了COSGSIM在实际工程领域中的应用.解决该问题的关键在于在每个硬数据的待预测位置只是保留一个相同位置的软数据,而对于其他软数据并不考虑.对应上述方法的一个模型被称为Markov模型1(Markov model 1,MM1)[6-8].但是只有当硬数据定义在等于或者大于软数据的空间尺度时,MM1模型才比较适用.但是当软数据的空间尺度大于硬数据的空间尺度时,就不适合使用MM1模型.可是如果将MM1模型中软硬数据的位置进行翻转,就可以引入一个改进的模型:Markov模型2(Markov model 2,MM2).它适用于当软数据大于硬数据的空间尺度的情况[8].根据上述思想,提出了一种使用 MM2的COSGSIM来实现对于原始COSGSIM 的逼近,这种方法适用于软数据的空间尺度较大的情况.实验结果证明该方法的有效性.1 主要思想和方法1.1 序贯模拟和高斯型随机模拟序贯模拟是以某一位置u邻域内的所有已知数据作为条件数据进行模拟,条件数据的数目一般是确定的.考虑N个随机变量Zi的联合分布.Zi在本文中可以视为某一区域内离散在N 个网格节点上的同一属性.这N个随机变量的n个数据,其相应的N元的条件累积分布函数(conditional cumulative distribution function,CCDF)可表示成[9-10]:其中Prob{·}是求概率.式(1)可以看为一个不断的抽样过程,先前已模拟的数据可作为下一个抽样的条件数据,条件数据不断增加,已知信息集由(n)更新为(n+1).高斯型随机模拟的基本思想是:在待模拟区域A中,如果连续型空间变量{Z (u),u∈A}是由一些具有相似的独立空间分布的现象{yk(u),u∈A,k=1,2,…,K}的和所产生,则其空间分布可用如下多元高斯随机函数模型表示:式(2)成立的前提条件是yk(u)相互独立.1.2 基于全局协同克里格的协同序贯高斯模拟协同序贯高斯模拟利用协同克里格方法.结合软硬数据的协同克里格表达式如下[6]:式(3)中的(u)是估计值.z1(uα)表示uα 位置的第α个硬数据,而z2(uβ)表示uβ位置的第β个软数据.分别表示硬数据和软数据的权值.n1和n2分别表示硬数据和软数据的数目.权值协同克里格方程组给出.uα=u+h,h是描述uα与u由之间距离关系的向量.协同克里格与克里格之间的区别在于前者利用4个协同克里格的耦合协方差函数取代了克里格方法中唯一的协方差函数,这些协同克里格的耦合协方差函数分别表示为:C11(h),C12(h),C21(h)和C22(h),通常假定C12(h)等于C21(h).在K(>2)个数据变量的情况下,全局协同克里格表示如下[6]:式(4)中的mk(k=1,…,K)表示第k个变量的均值,uαk(ak=1,…,nk)表示与第k个变量相关联的第ak个数据的位置,λαk是与uαk对应的协同克里格的权值.结合K个变量的协同克里格需要一个由这K个变量组成的协方差函数交叉矩阵,该矩阵最大包含K2个矩阵元素,每个元素的表示式如下:式(5)中的k和k′分别为1,…,K,Ckk′(·)表示第k和第k′个变量间的交叉协方差矩阵,Cov{·}表示的是一个变量或者两个交叉变量间的协方差函数.在结合软硬数据模拟的过程中,协同序贯高斯模拟使用全局协同克里格来替代序贯高斯模拟中的简单克里格方法,就可以实现对软硬数据的结合.它与序贯高斯模拟整个模拟过程的区别就在于使用了全局协同克里格,而后者使用简单克里格方法.假设硬数据z1(u)和软数据z2(u)的标准正态变换为:那么基于全局协同克里格的协同序贯高斯模拟在提取CCDF均值(u)时采用的全局协同克里格表示式为[6]:其中y1(uα)(α=1,2,…,n1)和y2(u′β)(β=1,2,…,n2)分别表示硬数据和软数据正态变换后的值和由克里格方程组获得.1.3 基于MM1的协同序贯高斯模拟然而,上述协同序贯高斯模拟存在交叉协方差矩阵不稳定且不易获取的问题.因此有人提出一种协同序贯高斯模拟的逼近方法[6],该方法引入了Markov模型的屏蔽效应假设:待模拟硬数据可以屏蔽在其位置以外的其他硬数据对其所在位置软数据的影响.因此,一种协同序贯高斯模拟的逼近方法就是保留与硬数据同位置的软数据zk′(u),逼近后的同位置协同克里格表示式和对应的克里格方程组 6-8 如下:式(9)中mk′是第k′(k′=1,…,K)个变量的均值,该变量与硬数据关系最为密切.λ0是与第k′(k′=1,…,K)个变量对应的权值.zk′(u)与z1(u)都是在u位置的预测值.式(10)是式(9)对应的克里格方程组,λβ是软数据的权值.式(11)所示的是 Markov模型1的屏蔽假设[11]:根据式(11),可见硬数据z1(u)屏蔽了其他位置硬数据z1(u+h)对软数据z2(u)的影响.引入 Markov模型1的屏蔽假设,可以实现对于交叉方差C12(h)的逼近.在上述假设下,可以得到[7]:或者等价地得到:其中ρ12(0)表示同位置情况下(u=0时)软硬数据的相关系数,并有:其中,ρ11(h)表示硬数据的相关系数,ρ12(h)表示软硬数据的相关系数.1.4 基于MM2的协同序贯高斯模拟由MM1模型可以看出,硬数据z1(u)屏蔽了其他硬数据z1(u+h)对软数据z2(u)的影响.然而,MM1只是在下列情况下适用:与软数据z2(u)相比,硬数据z1(u)定义在相同或者较大的空间尺度上.即MM1的屏蔽效益假设不适用于软数据尺度空间较大的情况.在该种情况下,如果将原来MM1模型中软硬数据的位置进行互换,就可以引入一个改进的模型:Markov模型2(MM2),可以实现对交叉方差C12(h)的逼近.该 MM2模型与 MM1形成了对称关系,MM2的屏蔽假设如下:可见软数据z2(u)屏蔽了其他软数据z2(u+h)对硬数据z1(u)的影响.首先我们假定软硬数据间的线性回归关系:同时假设fh(z,z′)是软数据z2(u)和z2(u+h)的二元概率密度函数,软硬数据的相关系数ρ12(h)表示为[6-8]:由式(18)可得:根据式(15)和式(19)可以获得:式(20)是在 MM2模型下对交叉方差C12(h)的逼近,MM1和MM2模型均是对于式(10)的简化,只是使用的前提不同.Markov模型2的CCDF可用式(21)表示:基于MM2的协同序贯高斯模拟算法流程如下:1)确定单变量的累积分布函数FZ(Z),使其不仅代表Z样本信息,同时代表整个区域的信息.2)进行正态转换,使FZ(Z)成为标准正态.3)对转换后的数据进行二元正态性检查,若不符合,则采用其他方法.4)进行协同序贯高斯模拟:①定义随机路径,路径上每个节点只计算一次,每个节点在计算时只保留一定数目的条件数据;②使用基于MM2的协同克立格法来确定位置u处的随机函数Y(u)的累积条件分布函数CCDF的参数;③ 从CCDF中计算模拟数值,将计算结果加入到数据集;④ 计算下一个节点,直到随机路径上的所有节点均被模拟完毕.5)进行正态反变换,转换到原始数据域.2 实验结果与分析实验中的软数据如图1所示,尺寸为80×80×80体素.图1(a)(b)分别表示了软数据的外表面和剖面图(X=40,Y=40,Z=40).实验中的硬数据由若干个采样点数据所组成,分布在80×80×40体素的待模拟空间区域内.采样点(硬数据)实际上是从软数据中抽取的,如图2所示.我们可以通过比较模拟结果与软数据之间的相似度来评价本文方法的性能.这种相似度越高,说明本文方法性能越好.软数据的直方图如图3所示.显见软数据定义在一个更大的尺度空间内,因此适用于我们提出的MM2模型.利用图2的采样点作为硬数据,图1中的数据为软数据,将MM1模型下的COSGSIM方法用于模拟.机器配置:CPU采用Intel酷睿2GHz,内存为2GBDDR,操作系统Windows XP.模拟结果见图4(a)~(e).可见在图4中模拟结果的下半部分与其上半部分差异较大,同样与软数据差异也是较大,这是因为硬数据在待模拟区域的下半部分的对应区域正好为“空”,即在待模拟区域下半部分没有硬数据分布.然后将MM2模型下的COSGSIM用于插值模拟,同样是以图2的采样点作为硬数据,图1中的数据为软数据.模拟结果见图5.可见图5的下半部分的分布与其上半部分差异较小,整个插值结果的值分布比较平均,反映了MM2下的插值效果较好.插值结果的直方图如图6所示.可见MM2的直方图与软数据相似,而MM1的直方图与软数据差别较大,说明MM2的插值效果好于MM1.MM1插值结果、MM2插值结果以及软数据的均值和方差见表1,可见MM2与软数据的均值和方差较为接近.Fig.3 Histogram of soft data.图3 软数据直方图Fig.6 Histograms of interpolated results under MM1and MM2using COSGSIM.图6 COSGSIM在MM1和MM2下的插值结果直方图Table 1 Average and Variance of MM1,MM2and Soft Data表1 MM1插值结果,MM2插值结果,软数据的均值和方差Item MM1 MM2 Soft Data Average 0.671 0.523 0.543 Variance 0.043 0.021 0.0123 结论最初的协同序贯高斯模拟具有交叉矩阵不稳定的问题,因此人们提出基于Markov 模型1的协同序贯高斯模拟方法.然而Markov模型1假设只是适用于当硬数据的空间尺度不小于软数据空间尺度的情况,因此本文提出Markov模型2来解决上述问题,它适用于当软数据的空间尺度大于硬数据空间尺度的情况.MM2假定待模拟位置软数据屏蔽了其他软数据对该位置硬数据的影响.实验结果显示MM2模型实用有效,结合MM2的协同序贯高斯模拟在软数据空间尺度较大时的插值结果较好.参考文献[1] Zhang Ting, Lu Detang, Li Daolun. A method of reconstruction of porous media using a two dimensional image and multiple point statistics[J].Journal of University of Science and Technology of China,2010,40(3):271-277(in Chinese)(张挺,卢德唐,李道伦.基于二维图像和多点统计方法的多孔介质三维重构研究[J].中国科学技术大学学报,2010,40(3):271-277)[2] Zhang Ting,Li Daolun,Lu Detang,et al.Research on the reconstruction method of porous media using multiple-point geostatistics [J].Science China:Physics, Mechanics &Astronomy,2010,53(1):122-134[3] Lu Detang, Zhang Ting, Yang Jiaqing, et al. A reconstruction method of porous media integrating soft data with hard data [J].Chinese Science Bulletin,2009,54(11):1876-1885[4] Eulogio P I,Peter M A.Modelling the semivariograms and cross-semivariograms required in downscaling cokriging by numerical convolution-deconvolution [J]. Computers &Geosciences,2007,33(2):1273-1284[5] Strebelle S.Conditional simulation of complex geological structures using multiple-point statistics[J].Mathematical Geology,2002,34(1):1-21[6] Wang Yanlong,Liu Jinhua,Zhang Ting.An interpolation method using the Markov model and COSGSIM [J].Journal of Computer-Aided Design & Computer Graphics,2010,22(10):1715-1720(in Chinese)(汪彦龙,刘金华,张挺.结合Markov模型和COSGSIM的插值方法[J].计算机辅助设计与图形学学报,2010,22(10):1715-1720)[7] Journel A G. Markov models for cross-covariances [J].Mathematical Geology,1999,31(8):955-964[8] Shmaryan L E,Journel A G.Two Markov models and their application[J].Mathematical Geology,1999,31(8):965-988 [9] Zhang Ting,Lu Detang,Li Daolun,et al.Research on statistical information reconstruction of images based on multiple-point geostatistics integrating soft data with hard data[J].Journal of Computer Research and Development,2010,47(1):43-52(in Chinese)(张挺,卢德唐,李道伦,等.基于软硬数据的多点地质统计法在图像统计信息重构中的应用研究[J].计算机研究与发展,2010,47(1):43-52)[10] Wu J B.4DSeismic and multiple-point pattern data integration using geostatistics [D].Stanford,California:Stanford University,2007[11] Remy N,Boucher A,Wu J B.Applied Geostatistics with SGeMS:A Users'Guide [M].Cambridge:Cambridge University Press,2009:100-120。
序贯高斯模拟在矿石品位估计中的应用研究刘占宁;宋宇辰;孟海东;于晓燕【摘要】随机模拟是地质统计方法的重要内容.在矿石品位估计方法中克里格方法作为一种无偏估计方法,常被用于矿石品位的估计.但克里格法估值存在平滑效应.作者在分析序贯高斯模拟和普通克里格法基本原理的基础上,运用序贯高斯模拟方法和普通克里格方法对某铁矿体内全铁(TFe)品位进行估计,给出了品位估计结果模型.研究从勘探线方向、垂直勘探线方向和竖直方向分别计算变差函数,对球状模型、指数模型、高斯模型的变差函数拟合效果进行了优选,结果表明球型模型拟合效果最好.针对序贯模拟和克里格品位估值效果进行了分析,结果显示:序贯高斯模拟结果在品位分布形态上更接近样品品位分布形态,其平滑效应更小;克里格方法估计与序贯高斯模拟方法相比仅在品位均值方面更接近样本品位均值.因此,认为序贯高斯模拟方法可以更好地刻画矿体内品位分布状态.%Stochastic simulation is an important method of geological statistics.The Kriging method is a unbiased estimation method,ften used for ore grade estimation with smoothing effect.Based on analysis of principle of Sequential Gaussian Simulations and Ordinary Kriging method they are used to estimate the TFe grade of a iron ore body and the grade model is given.The variation function is calculated from the direction of the exploration line,the vertical exploration line direction and the vertical direction.The variation function is fitted with the spherical model,the exponential model and the Gaussian model.The fitting effect of he spherical model is the best.The result show that distribution of the Sequential Gaussian Simulation is closer to the distribution of sample grade,with smaller smoothing pared withSequential Gaussian method only mean grade value of the Kriging method is closer to to that of the sample.Therefore,the authors believe that the Sequential Gaussian Simulation can better characterize the distribution of ore in the ore body.【期刊名称】《地质找矿论丛》【年(卷),期】2018(033)001【总页数】7页(P149-155)【关键词】序贯模拟;变差函数;矿石品位;克里格法【作者】刘占宁;宋宇辰;孟海东;于晓燕【作者单位】内蒙古科技大学矿业研究院,内蒙古包头014010;内蒙古科技大学矿业研究院,内蒙古包头014010;内蒙古科技大学矿业研究院,内蒙古包头014010;内蒙古科技大学矿业研究院,内蒙古包头014010【正文语种】中文【中图分类】P628.20 引言条件模拟技术是地质统计学中继克里格估计技术之后,迅速发展的一个新方法[1]。
高斯回归模型
机器之心专栏
火山语音团队提出了一种能够有效建模不同领域之间相关性的迁移核函数(transfer kernel),在一些多源但低资源回归场景下显著提升了迁移效果。
一直以来,高斯过程回归模型(Gaussian process regression model, i.e., GP)作为一类基础的贝叶斯机器学习模型,在工程与统计等领域的回归问题中有着广泛应用;传统的高斯过程回归模型需要大量的有监督数据进行训练才可发挥好的效果,但在具体实践中,收集和标记数据是一项昂贵且费时的工程。
相比之下,迁移高斯过程回归模型(Transfer GP)能够高效利用不同领域(domain)的数据来降低标记成本,使多源数据应用更加高效。
基于此,火山语音团队对目前研究领域关注较少的多源数据迁移回归问题做了基础探究,提出一种基于多源迁移核函数的迁移高斯回归过程模型(TRANSFERKERNELLEARNINGFORMULTI-SOURCETRANSFERGAUSSIANPROCESSREGRESSION),并在理论与实验两个层面验证了模型的有效性:即理论上展示了迁移效果优劣与域相关性的必然关联;实验中验证了模型可以高效提升多源数据的迁移效果。
基于ArcGIS_10.0的地表高程序贯高斯模拟和地质统计建模1.数据需求:总共需要四个文件夹:即两个输入型文件夹和两个输出型文件夹,其中输入型文件夹包括一个存放原始数据的文件夹和一个存放shp格式数据的文件夹;而输出型文件夹包含一个存放简单克里金估计结果(dbf格式)的文件夹和一个存放序贯高斯模拟结果(dbf格式)的文件夹。
以及三个gdb数据库:即一个存放简单克里金输出结果(Table格式)的数据库,一个存放100次序贯高斯模拟的直接云图结果的数据库以及一个存放序贯高斯模拟输出结果(Table格式)的数据库。
(之所以需要给出简单克里金插值结果,是因为序贯高斯模拟只能在简单克里金插值结果的基础上进行计算和分析)2.数据关系1)Import_Surface_Data&Background_Grid_xlsx&txt文件夹:①Import_Surface_Data.xlsx(原始数据,包含位置坐标和属性值,供建立shp用)②Import_Surface_Data.txt(原始数据,包含位置坐标和属性值,供Surfer插值生成背景网格用以及后期和ArcGIS插值结果作对比)③Background_Grid.xlsx(只包含待插值点的位置坐标,一般来说插值高程的话为x,y;插值属性的话可以为x,y,z;)④Import_Surface_Data.grd⑤Output_grid_of_kriging_standard_deviation_from_surfer.grd⑥Out_import_Surface_Data.dat⑦Out_Transform.dat⑧Out_Convert.dat2)Import_Map_shp文件夹:①Import_Surface_Data.dbf②Background_Grid.dbf③Kriging_Estimation_Result_Second.dbf④Kriging_Estimation_Result_Third.dbf3)Export_Kriging_Result_shp文件夹:①Export_Output_Second.dbf②Export_Output_Third.dbf4)Extract_Simulation_Results_shp文件夹:1~100次的模拟结果(dbf格式),在此不详细列出5)Sequential_Gaussian_Simulation.gdb数据库:1~100次的模拟结果,在此不详细列出6)Export_Kriging_Result.gdb数据库:①Export_Output_Second②Export_Output_Third7)Extract_Simulation_Results.gdb数据库:1~100次的模拟结果(Table格式),在此不详细列出3.实施方案本文以广州龙头山表面高程数据为例,本次序贯高斯模拟总共含有3大步骤:A.首先需要建立基于龙头山表面高程原始数据的shp文件和利用Surfer软件生成的待插值背景网格节点的shp文件,其中需要通过Surfer软件先生成10m*10m的插值结果grd文件,在把其转换成dat格式文件,方便得到背景网格的shp文件;B.然后通过简单克里金对原始数据进行插值,在得到克里金插值结果的同时结合背景网格文件生成一个基于验证和预测的克里金插值结果shp文件,从中可以看到每个网格节点上的预测结果值与预测标准差;C.最后利用上述克里金插值结果来获得100次序贯高斯随机模拟的结果,其中包含每个网格节点上的最大值、最小值、均值和标准差等等,以及每一次模拟所生成的云图,并通过提取功能得到模拟的输出结果以便于后期外部处理和利用。