当前位置:文档之家› 确定性建模

确定性建模

第四章
确定性建模
Deterministic Modeling
确定性建模概述 地质统计学克里金方法

三维地质建模
数据库
三维构造建模
油藏数模
三维相建模
模型粗化
三维储层参数建模

储层建模
三维网格赋值
(相控)
资料:井数据 和/或地震数据
属性:相 孔、渗、饱

? 确定性建模
? 随机建模
地质 测井 测试 地震 离散型地质变量 连续型地质变量

建模的核心是井间储层预测 横向预测的依据: 地震信息转换
确定性转换 随机转换 模式认知 模式拟合
沉积规律 (线性趋势) 统计规律
沉积单元对比 常规线性插值
克里金插值 随机模拟

第一节 确定性建模概述
对井间未知区给出确定性的预测结果。
储层地震学方法
(地震资料的确定性转换)
储层沉积学方法
(对比方法)
常规插值与克里金插值
(插值方法)
(上述方法可综合应用)

一、储层地震学方法
(地震资料的确定性转换) ★ 应用地震资料研究储层的几何形态、岩性及储层
参数的分布。
确定性转换
地震属性
地质参数
注意:
地震资料不仅用于确定性建模, 也可以随机建模

步骤:
提取地震属性 优选地震属性
地震属性与地质参数的关系
地震属性的确定性转换
连续地震属性:速度、波阻抗、 振幅、频率等 离散地震属性:波形结构类型 (地震相)等

步骤:
提取地震属性 优选地震属性
地震属性与地质参数的关系
泥岩 砂岩
地震属性的确定性转换 地震属性
速度、 波阻抗、 振幅、 频率等 波形结构类型
AI
地质参数
地质相、 岩性、 孔隙度 流体(?)
Φ
AI

步骤:
提取地震属性 优选地震属性
地震属性与地质参数的关系
地震属性的确定性转换
确定性转换
地震属性
速度、 波阻抗、 振幅、 频率、 波形结构类型
地质参数
地质相、 岩性、 孔隙度 流体(?)

二、储层沉积学方法
通过井间砂体确定性对比, 建立储层结构模型 构型分析 构型建模

模式拟合
实际资料 定量模式

模式拟合
实际资料 定量模式

三维可视化储层构型分析
★数字油藏技术

三维储层构型模型

三、插值方法
1. 传统数学插值
传统方法 克里金方法
如:三角剖分法(三角网方法)、 距离反比加权法等
趋势分析 将变量视为纯随机变量, 未考虑变量的空间结构性 仅考虑待估点位置与已知数 据位置的相互关系。
z * (x 0 ) =
∑ λ z (x )
i =1 i i
n

2. 克里金插值
不仅考虑待估点位置与已 知数据位置的相互关系, 而且还考虑变量的空间相 关性。 因此,更能反映客观地质 规律,估值精度更高。
z
*
(x 0 ) = ∑ λ i z (x i )
i =1
n

第二节 克里金插值方法
克里金方法(Kriging), 是以南非矿业 工程师D.G.Krige (克里格)名字命名的一项 空间估值技术,是地质统计学的核心。

D.G. Krige (1951) “根据样品空间位置不同、样品间相关程度不 同,对每个样品品位赋予不同的权,进行滑动 加权平均,以估计中心块段平均品位”
z * (x 0 ) =
∑ λ z (x )
i i i =1
n
Kriging方法

理论依据? 插值: 依据邻近点,推断待估点
z * (x 0 ) =
(?)
∑ λ z (x )
i i i =1
n
??

第 2 章 确定性时间序列模型—经典方法

第2章确定性时间序列模型—经典方法 2.1 时间序列的分解 确定性时间序列分析认为时间序列数据去掉随机干扰因素后,剩余部分可以视为确定性的时间函数,即时间序列Y可以表示为下面四种要素的函数 Y= f(T,C,S,e) 其中,趋势项T是时间t的单调函数,它反映了时间序列Y的长期发展趋势; 循环项C是时间t的长周期函数,它反映了时间序列Y在长期变化过程中的周期性,例如股价的技术分析中的三波动法; 季节项S是时间t的短周期函数,反映了时间序列Y长期变化过程中的短期波动性; 随机项e是时间序列Y中不可预测的偶发因素对时间序列变化的干扰。 为了简化分析,这里合并趋势项和循环项,统称为时间序列Y的趋势循环项。这样Y= f(T,S,e) 在实际应用中,函数f的形式常常为 加法模型Y= T+S+e,时间序列是趋势项、季节项和随机项的合成 乘法模型Y= T×S×e,时间序列是趋势项、季节项和随机项的乘积 社会消费品零售总额原序列社会消费品零售总额的自然对数序列及其趋势周期因素 没有统一的标准,常用的方法是 图示法:如果数据偏离趋势项的大小不随时间的变化而改变,用加法模型;否则,如果数据偏离趋势项的大小随时间的变化而增加,用乘法模型。实际上,加法模型使用的较为广 泛。

2.2 时间序列的平滑方法——剔除随机项 本节讨论不存在趋势项和季节因素的时间序列如何剔除随机项。 2.2.1 简单滑动平均法 1. M -期简单滑动平均 M -期简单滑动平均:使用最近M 个数的平均值做为平滑值,即,对于时间序列{t A } 11 t t t M t A A A A M ??++++= " 预测:1t t F A += 2. 平滑期数M 的选择 选择的准则: (1)平均误差最小 选择使得()()1T t t t M ME A F T M =+=??∑最小的平滑期数M (2)误差平方和最小 选择使得() 2 1T t t t M SSE A F =+=?∑最小的平滑期数M (3)误差标准差最小 选择使得 RSE = 最小的平滑期数M (4)平均绝对误差和最小 选择使得1 T t t t MAD A F T == ?∑最小的平滑期数M 3. 简单滑动平均的缺陷 (1) 不能处理存在趋势因素和季节因素的时间序列 (2) 平滑期数M 的选择缺乏科学性 4. 简单滑动平均的应用 股价的技术分析方法 5. 加权滑动平均 1211t t t M t M A w A w A w A ??+=+++" 其中,121M w w w +++=",01t w <<. 2.2.2 指数平滑法 1. 简单指数平滑计算公式 简单指数平滑是加权滑动平均法在M=∞时的推广,即令

算法简答题

1.在对算法进行复杂性分析时,时间复杂度用什么来度量其间做了什么假定渐进复杂性指的是什么精确到什么程度强调渐进复杂性的意义是什么 答:○1程序中关键步骤的操作计数。 ○2假定每种基本操作所用时间都是一个单位。 ○3设T(n)是算法A的复杂性函数。,则。一般说来,算法的渐进复杂性是该算法复杂度 函数的主项,且一般只考虑渐进复杂性的阶。 ○4算法的渐进复杂性是该算法复杂度函数的主项,且一般只考虑渐进复杂性的阶。 ○5意义:简化算法复杂性分析的方法和步骤。以方便于对各类算法进行分析和比较。 2. 陈述算法在最坏情况下的时间复杂度和平均时间复杂度;这两种评估算法复杂性的方法各自有什么实际意义 答:○1最坏情况下的时间复杂度称最坏时间复杂度。一般不特别说明,讨论的时间复杂度均是最坏情况下的时间复杂度。 意义:最坏情况下的时间复杂度是算法在任何输入实例上运行时间的上界,这就保证了算法的运行时间不会比任何更长。 ○2平均时间复杂度是指所有可能的输入实例均以等概率出现的情况下,算法的期望运行时间。 意义:在输入不同的情况下算法的运行时间复杂度可能会发生变化。平均时间复杂度给出了算法的期望运行时间,有助于算法好坏的评价以及在不同算法之间比较时有一个统一标准。 3.归并排序算法和快速排序算法各自强调了那个方面各自提高效率的策略是什么 答:○1归并排序在简单插入排序的基础上强调了通过归并减少元素的挪动次数,从而降低运行时间。策略是通过递归和归并减少了元素的挪动这样一个耗时操作的次数。 ○2快速排序相比与归并排序强调了通过划分操作来避免“归并”这样的耗时步骤。策略是使用分治法,通过递归划分操作不断将序列划分成两个子序列,其中第一个子序列中的元素都比第二个小(或大)。 4.在连通图无向图的宽度优先搜索树和深度优先搜索树中,哪棵树的最长路径可能会更长些试说明你的理由。 答:深度。因为深度优先搜索是沿着顶点的邻点一直搜索下去,直到当前被搜索的顶点不再有未被访问的邻点为止,且在此过程中记录的边构成了搜索树。而宽度优先搜索算法访问图中由一顶点可能到达的所有顶点。因此深度搜索树的最长路径里一定包含图中的最长路,而宽度搜索则不一定包括。因此,在每个顶点邻点均较少的图上两者得到的树最长路径可能差不多,但是在每个顶点邻点较多的图上深度搜索可以产生最长路径更长的搜索树。 5.何谓最优化原理采用动态规划算法必须满足的条件是什么动态规划算法是通过什么问题的什么特性提高效率的比较贪心算法与动态规划算法的异同,它们都有那些优势和劣势 答:○1一个最优化策略的子策略总是最优的。一个问题满足最优化原理又称其具有最优子结构性质。 ○2最优子结构性质,子问题重叠性质是计算模型采用动态规划算法求解的两个基本要素。 ○3动态规划算法利用子问题重叠性质,对每一个子问题只计算一次,将其解保存在一个表格中。不同的子问题个数随着输入问题的规模呈多项式增长,因此,动态规划算法通常只

数学建模定性分析方法解析

定性研究数据采集 定量研究往往具有足够样本量支持,丰富的统计分析技术,可以得出具有一定代表性的结论,但对于某个问题消费者为何如此回答,其所给解释是否是其真实想法,这样的问题便显得有些束手无策了。相对而言,定性技术对数理性的要求低一些,但对消费者动机的深层挖掘要求却更高,更具针对性,因而 与定量研究形成互补。 常规定性研究的方法主要是个别深度访谈与座谈会访谈。其中深度访谈是深层次地挖掘个体的表现特征与背后的原因,而座谈会是利用几个人一起进行头脑风暴(brainstorming)的优势,相互激发、相互启迪, 从而挖掘出深层次的原因。 座谈会(FDG) 座谈会的成功依赖于两个系统,一个是主持人培训系统,一个是被访者约访系统。华通现代建立起专职主持人与研究员水平主持人两个体系。一方面保持几个专职主持人,以利于他们不断提高公司在座谈会主持方面的技术水平,适应一些难度非常大的主持项目;另一方面又更鼓励一部分研究人员掌握主持技巧, 完成常规项目中必须的座谈会需求。 专职主持人的特点是主持技巧水平较高,缺点是研究设计、分析能力弱。必须要研究人员与主持人的高度配合才能够拿出高水平的研究报告。研究员水平的主持人对于一些特别复杂的技巧没有专职主持人那么强,但由于自己完全参与项目设计、数据分析、报告撰写等过程,容易对消费者有特别深入的理解、对数据的理解也会有独到的方面,比较容易出好的研究报告。 深层访谈(In-depth Interview) 深访是一种无结构的、直接的、一对一的访问,在访问过程中,由掌握高级访谈技巧的调查员对调查对象进行深入的访谈,用以揭示对某一问题的潜在动机、态度和情感,此方法最适合于做探测性调查。深层访谈的优点是更能深入地了解被调查者的内心想法和态度;便于对一些保密性、敏感性问题进行调查;能够自由地交换信息,常常会取得一些意外的资料。缺点是调查的无结构性使得这种方法首调查员自身素

确定性与不确定性推理主要方法-人工智能导论

确定性与不确定性推理主要方法 1.确定性推理:推理时所用的知识与证据都是确定的,推出的结论也是确定的,其真值或者为真或者为假。 2.不确定性推理:从不确定性的初始证据出发,通过运用不确定性的知识,最终推出具有一定程度的不确定性但却是合理或者近乎合理的结论的思维过程。 3.演绎推理:如:人都是会死的(大前提) 李四是人(小前提) 所有李四会死(结论) 4.归纳推理:从个别到一般:如:检测全部产品合格,因此该厂产品合格; 检测个别产品合格,该厂产品合格。 5.默认推理:知识不完全的情况下假设某些条件已经具备所进行的推理; 如:制作鱼缸,想到鱼要呼吸,鱼缸不能加盖。 6.不确定性推理中的基本问题: ①不确定性的表示与量度: 1)知识不确定性的表示 2)证据不确定性的表示 3)不确定性的量度 ②不确定性匹配算法及阈值的选择 1)不确定性匹配算法:用来计算匹配双方相似程度的算法。 2)阈值:用来指出相似的“限度”。 ③组合证据不确定性的算法 最大最小方法、Hamacher方法、概率方法、有界方法、Einstein方 法等。 ④不确定性的传递算法 1)在每一步推理中,如何把证据及知识的不确定性传递给结论。 2)在多步推理中,如何把初始证据的不确定性传递给最终结论。 ⑤结论不确定性的合成 6.可信度方法:在确定性理论的基础上,结合概率论等提出的一种不确定性推

理方法。其优点是:直观、简单,且效果好。 可信度:根据经验对一个事物或现象为真的相信程度。可信度带有较大的主观性和经验性,其准确性难以把握。C-F模型:基于可信度表示的不确定性推理的基本方法。 CF(H,E)的取值范围: [-1,1]。 若由于相应证据的出现增加结论 H 为真的可信度,则 CF(H,E)> 0,证据的出现越是支持 H 为真,就使CF(H,E) 的值越大。 反之,CF(H,E)< 0,证据的出现越是支持 H 为假,CF(H,E)的值就越小。若证据的出现与否与 H 无关,则 CF(H,E)= 0。 证据E的可信度取值范围:[-1,1] 。 对于初始证据,若所有观察S能肯定它为真,则CF(E)= 1。 若肯定它为假,则 CF(E) = –1。 若以某种程度为真,则 0 < CF(E) < 1。 若以某种程度为假,则-1 < CF(E) < 0 。 若未获得任何相关的观察,则 CF(E) = 0。 静态强度CF(H,E):知识的强度,即当 E 所对应 的证据为真时对 H 的影响程度。 动态强度 CF(E):证据 E 当前的不确定性程度。 C-F模型中的不确定性推理:从不确定的初始证据出发,通过运用相关的不确定性知识,最终推出结论并求出结论的可信度值。 模糊逻辑给集合中每一个元素赋予一个介于0和1之间的实数,描述其属于一个集合的强度,该实数称为元素属于一个集合的隶属度。集合中所有元素的隶属度全体构成集合的隶属函数。 模糊知识表示 人类思维判断的基本形式: 如果(条件)→则(结论)

第9章怎样研究算法遗传算法示例练习题答案解析

第9章怎样研究算法:遗传算法示例 1、P类问题、NP类问题、NPC类问题是计算机科学领域关于可求解性可计算性很重要的概念。关于P、NP和NPC类问题,回答下列问题。 (1)下列说法不正确的是_____。 (A) P类问题是计算机可以在有限时间内能够求解的问题; (B) NP类问题是计算机可以在有限时间内能够验证“解”的正确性的问题; (C) NPC类问题是对问题的每一个可能解,计算机都可以在有限时间内验证“解”的正确性的问题,被称为NP完全问题; (D)上述说法有不正确的; 答案:D 解释: 本题考核P类问题、NP类问题、NPC类问题的概念。 P类问题指计算机可以在有限时间内求解的问题,(A)正确;NP类问题指虽然在多项式时间内难于求解但不难判断给定一个解的正确性问题,(B)正确;NPC问题指NP问题的所有可能答案都可以在多项式时间内进行正确与否的验算,称为NP-Complete问题,(C)正确;(A)(B)(C)都正确,所以(D)错误。 具体内容请参考第九章视频之“可求解与难求解问题”以及第九章课件。 (2)可解性问题是指能够找到多项式时间复杂性算法进行求解的问题,难解性问题是指找不到多项式时间复杂性算法进行求解的问题。下列说法不正确的是_____。 (A) P类问题是可解性问题,NP类问题是难解性问题。 (B) NP类问题不一定是难解性问题,因为P类问题也一定是NP类问题; (C) NP类问题不确定是否是P类问题,但NPC类问题一定是难解性问题; (D)上述说法有不正确的; 答案:A 解释: 本题考核对可解性问题和难解性问题概念的理解。 P类问题指计算机可以在有限时间内求解的问题,所以是可解性问题;NP类问题指虽然在多项式时间内难于求解但不难判断给定一个解的正确性问题,但P类问题是NP类问题的一个子集,所以NP类问题不一定是难解性问题;NPC问题指NP问题的所有可能答案都可以在多项式时间

非确定性问题

非确定性问题 什么是非确定性问题呢?有些计算问题是确定性的,比如加减乘除之类,你只要按照公式推导,按部就班一步步来,就可以得到结果。但是,有些问题是无法按部就班直接地计算出来。比如,找大质数的问题。有没有一个公式,你一套公式,就可以一步步推算出来,下一个质数应该是多少呢?这样的公式是没有的。再比如,大的合数分解质因数的问题,有没有一个公式,把合数代进去,就直接可以算出,它的因子各自是多少?也没有这样的公式。这种问题的答案,是无法直接计算得到的,只能通过间接的“猜算”来得到结果。这也就是非确定性问题。而这些问题的通常有个算法,它不能直接告诉你答案是什么,但可以告诉你,某个可能的结果是正确的答案还是错误的。这个可以告诉你“猜算”的答案正确与否的算法,假如可以在多项式时间内算出来,就叫做多项式非确定性问题。而如果这个问题的所有可能答案,都是可以在多项式时间内进行正确与否的验算的话,就叫完全多项式非确定问题。完全多项式非确定性问题可以用穷举法得到答案,一个个检验下去,最终便能得到结果。但是这样算法的复杂程度,是指数关系,因此计算的时间随问题的复杂程度成指数的增长,很快便变得不可计算了。人们发现,所有的完全多项式非确定性问题,都可以转换为一类叫做满

足性问题的逻辑运算问题。既然这类问题的所有可能答案,都可以在多项式时间内计算,人们於是就猜想,是否这类问题,存在一个确定性算法,可以在指数时间内,直接算出或是搜寻出正确的答案呢?这就是著名的NP=P?的猜想。解决这个猜想,无非两种可能,一种是找到一个这样的算法,只要针对某个特定NP完全问题找到一个算法,所有这类问题都可以迎刃而解了,因为他们可以转化为同一个问题。另外的一种可能,就是这样的算法是不存在的。那么就要从数学理论上证明它为什么不存在。有些看来好像是非多项式的问题,其实是多项式问题,只是人们一时还不知道它的多项式解而已。

确定性存储问题数学模型

第三节确定性存储问题数学模型 对于工厂来说,任务是把进来的原料加工成产品,并把它销售出去。要生产就要库存一定量的原材料,要销售也需要库存一定量的产品。库存材料和产品就有存储费的问题,而需求又有确定型和随机型等情况。如何确定一个最优的生产周期,使得在单位时间内所花费的生产费用最少。这是摆在工厂管理者面前的现实问题。 我们这节讨论确定性需求存储问题的数学建模。 一、仓库只库存产品的简单情况 记k为工厂生产线运转时产品的生产速率,r为商品的销售速率,Q为库存量。仓库的库存以这样的方式变化:开始时边生产边销售,库存量以速率k-r增加,到时刻t只销售不生产,Q以速率r减少,而到时刻T,Q减少到零,如此为一个周期。Q与t的关系如图2.3.1所示。再记c为每开动一次生产线的成本,s为单位时间Q 每件产品的存储费,W为单 位时间总费用。则问题可做 如下描述:确定周期T,使 单位时间的总费用W最小。 图2.3.1 库存量Q与时间t关系图(情况1)我们作如下分析: 由假设条件知,单位时间成本为c/T,单位时间库存费为sA/T,其中A为三角形OPT的面积,即 A k r T t = - 2

又有k t = rT , 所以单位时间总费用为 W c T sA T c T s k r T T t s k r k T r c T sr k r k T =+=+ -= -= + -()()()222 记 B sr k r k =-()2 则 W c T BT =+ (2.3.1) 为求最小总费用点,令dW dT = 0, 得-c /T 2 +B = 0 从而有 T min = c b / (2.3.2) 代入式(2.3.1)得 W min = 2bc (2.3.3) 式(2.3.2)表明,最优周期与生产成本的平方根成正比,与存储费的平方根成反比。这样一个结论是经过建立数学模型并进行分析计算才得出来的。 计算出来的这个最优 周期T 往往不易在实际生 产过程中操作实施,这就 需要作一点微调(或者说 做一点摄动),那么会对 W 产生多大的影响呢?我 们简单分析一下这种敏感性。 图2.3.2 摄动函数?(α )的图象 设T 被αT 代替,这里α = 1+ε, 或者 α = 1-ε (ε > 0),考虑哪一种变动较好一点。 由式(2.3.1)和式(2.3.2),有 W T c T B T Bc ()()ααααα = +=+ 1

算法简答题

1.在对算法进行复杂性分析时,时间复杂度用什么来度量?其间做了什么假定?渐进复杂性指的是什么?精确到什么程度?强调渐进复杂性的意义是什么? 答:○1程序中关键步骤的操作计数。 ○2假定每种基本操作所用时间都是一个单位。 ○3设T(n)是算法A的复杂性函数。,则。一般说来,算法的渐进复杂性是该算法复杂度 函数的主项,且一般只考虑渐进复杂性的阶。 ○4算法的渐进复杂性是该算法复杂度函数的主项,且一般只考虑渐进复杂性的阶。 ○5意义:简化算法复杂性分析的方法和步骤。以方便于对各类算法进行分析和比较。 2. 陈述算法在最坏情况下的时间复杂度和平均时间复杂度;这两种评估算法复杂性的方法各自有什么实际意义? 答:○1最坏情况下的时间复杂度称最坏时间复杂度。一般不特别说明,讨论的时间复杂度均是最坏情况下的时间复杂度。 意义:最坏情况下的时间复杂度是算法在任何输入实例上运行时间的上界,这就保证了算法的运行时间不会比任何更长。 ○2平均时间复杂度是指所有可能的输入实例均以等概率出现的情况下,算法的期望运行时间。 意义:在输入不同的情况下算法的运行时间复杂度可能会发生变化。平均时间复杂度给出了算法的期望运行时间,有助于算法好坏的评价以及在不同算法之间比较时有一个统一标准。 3.归并排序算法和快速排序算法各自强调了那个方面?各自提高效率的策略是什么? 答:○1归并排序在简单插入排序的基础上强调了通过归并减少元素的挪动次数,从而降低运行时间。策略是通过递归和归并减少了元素的挪动这样一个耗时操作的次数。 ○2快速排序相比与归并排序强调了通过划分操作来避免“归并”这样的耗时步骤。策略是使用分治法,通过递归划分操作不断将序列划分成两个子序列,其中第一个子序列中的元素都比第二个小(或大)。 4.在连通图无向图的宽度优先搜索树和深度优先搜索树中,哪棵树的最长路径可能会更长些?试说明你的理由。 答:深度。因为深度优先搜索是沿着顶点的邻点一直搜索下去,直到当前被搜索的顶点不再有未被访问的邻点为止,且在此过程中记录的边构成了搜索树。而宽度优先搜索算法访问图中由一顶点可能到达的所有顶点。因此深度搜索树的最长路径里一定包含图中的最长路,而宽度搜

人工智能不确定性推理部分参考答案教学提纲

人工智能不确定性推理部分参考答案

不确定性推理部分参考答案 1.设有如下一组推理规则: r1: IF E1 THEN E2 (0.6) r2: IF E2 AND E3 THEN E4 (0.7) r3: IF E4 THEN H (0.8) r4: IF E5 THEN H (0.9) 且已知CF(E1)=0.5, CF(E3)=0.6, CF(E5)=0.7。求CF(H)=? 解:(1) 先由r1求CF(E2) CF(E2)=0.6 × max{0,CF(E1)} =0.6 × max{0,0.5}=0.3 (2) 再由r2求CF(E4) CF(E4)=0.7 × max{0, min{CF(E2 ), CF(E3 )}} =0.7 × max{0, min{0.3, 0.6}}=0.21 (3) 再由r3求CF1(H) CF1(H)= 0.8 × max{0,CF(E4)} =0.8 × max{0, 0.21)}=0.168 (4) 再由r4求CF2(H) CF2(H)= 0.9 ×max{0,CF(E5)} =0.9 ×max{0, 0.7)}=0.63 (5) 最后对CF1(H )和CF2(H)进行合成,求出CF(H) CF(H)= CF1(H)+CF2(H)+ CF1(H) × CF2(H) =0.692

2 设有如下推理规则 r1: IF E1 THEN (2, 0.00001) H1 r2: IF E2 THEN (100, 0.0001) H1 r3: IF E3 THEN (200, 0.001) H2 r4: IF H1 THEN (50, 0.1) H2 且已知P(E1)= P(E2)= P(H3)=0.6, P(H1)=0.091, P(H2)=0.01, 又由用户告知: P(E1| S1)=0.84, P(E2|S2)=0.68, P(E3|S3)=0.36 请用主观Bayes方法求P(H2|S1, S2, S3)=? 解:(1) 由r1计算O(H1| S1) 先把H1的先验概率更新为在E1下的后验概率P(H1| E1) P(H1| E1)=(LS1× P(H1)) / ((LS1-1) × P(H1)+1) =(2 × 0.091) / ((2 -1) × 0.091 +1) =0.16682 由于P(E1|S1)=0.84 > P(E1),使用P(H | S)公式的后半部分,得到在当前观察S1下的后验概率P(H1| S1)和后验几率O(H1| S1) P(H1| S1) = P(H1) + ((P(H1| E1) – P(H1)) / (1 - P(E1))) × (P(E1| S1) – P(E1)) = 0.091 + (0.16682 –0.091) / (1 – 0.6)) × (0.84 – 0.6) =0.091 + 0.18955 × 0.24 = 0.136492 O(H1| S1) = P(H1| S1) / (1 - P(H1| S1)) = 0.15807 (2) 由r2计算O(H1| S2) 先把H1的先验概率更新为在E2下的后验概率P(H1| E2) P(H1| E2)=(LS2×P(H1)) / ((LS2-1) × P(H1)+1)

算法的特点

算法的特点: (1)有限性:一个算法的步骤序列是有限的. (2)确定性:算法中的每一步应该是确定的. (3)顺序性:算法分为若干有序的步骤,按顺序运行. (4)不唯一性:求解某一个问题的解法不一定是唯一的,对于一个问题可以有不同的算法. (5)普遍性:很多具体的问题,都可以设计合理的算法去解决,如心算、计算器计算都要经过有限、事先设计好的步骤加以解决. 1.算法的三种基本结构是 ( ) A.顺序结构、条件结构、循环结构 B.顺序结构、流程结构、循环结构 C.顺序结构、分支结构、流程结构 D.流程结构、循环结构、分支结构 2.程序框图中表示判断框的是 ( ) A.矩形框 B.菱形框 D.圆形框 D.椭圆形框 3.算法共有三种逻辑结构,即顺序逻辑结构,条件逻辑结构和循环逻辑结构,下列说法正确的是 ( ) A.一个算法只能含有一种逻辑结构 B.一个算法最多可以包含两种逻辑结构 C.一个算法必须含有上述三种逻辑结构 D.一个算法可以含有上述三种逻辑结构的任意组合 4.如图所示是一个算法的程序框图,则该程序框图所表示的功能是 . (4) 5.下列程序框图表示的算法功能是( ) (5) A.计算小于100的奇数的连乘积. B.计算从1开始的连续奇数的连乘积. C.计算从1开始的连续奇数的连乘积, 当乘积大于100时,计算奇数的个数. D.计算100321≥???????n 成立时n 的最小值.

6.如图(1)、(2),它们都表示的是输出所有立方小于1000的正整数的程序框图,那么应分别补充的条件为 ( ) A.⑴3 n ≥1000 ? ⑵3 n <1000 ? B. ⑴3 n ≤1000 ? ⑵3 n ≥1000 ? C. ⑴3 n <1000 ? ⑵3 n ≥1000 ? D. ⑴3 n <1000 ? ⑵3 n <1000 ? 7.设计一个计算1+2+---+100的值的算法,并画出程序框图。(要求用循环结构) 8.给出以下一个算法的程序框图(如下图所示),该程序框图的功能是 ( ) A.求输出,,a b c 三数的最大数 B.求输出,,a b c 三数的最小数 C.将,,a b c 按从小到大排列 D.将,,a b c 按从大到小排列 9.右边的程序框图-,能判断任意输入的数x 的奇偶性:其中判断框内的条件是( ) A.0m =? B.0x = ? C.1x = ? D.1m =? ⑴ ⑵

人工智能原理教案03章 不确定性推理方法3.3 主观BAYES方法

3.3主观Bayes方法 R.O.Duda等人于1976年提出了一种不确定性推理模型。在这个模型中,他们称推理方法为主观Bayes方法,并成功的将这种方法应用于地矿勘探系统PROSPECTOR中。在这种方法中,引入了两个数值(LS,LN),前者体现规则成立的充分性,后者则表现了规则成立的必要性,这种表示既考虑了事件A的出现对其结果B的支持,又考虑了A的不出现对B的影响。 在上一节的CF方法中,CF(A)<0.2就认为规则不可使用,实际上是忽视了A不出现的影响,而主观Bayes方法则考虑了A 不出现的影响。 t3-B方法_swf.htm Bayes定理: 设事件A1,A2,A3,…,An中任意两个事件都不相容,则对任何事件B有下式成立: 该定理就叫Bayes定理,上式称为Bayes公式。 全概率公式: 可写成: 这是Bayes定理的另一种形式。

Bayes定理给出了一种用先验概率P(B|A),求后验概率P (A|B)的方法。例如用B代表发烧,A代表感冒,显然,求发烧的人中有多少人是感冒了的概率P(A|B)要比求因感冒而发烧的概率P(B|A)困难得多。 3.3.1规则的不确定性 为了描述规则的不确定性,引入不确定性描述因子LS,LN:对规则A→B的不确定性度量f(B,A)以因子(LS,LN)来描述: 表示A真时对B的影响,即规则成立的充分性 表示A假时对B的影响,即规则成立的必要性 实际应用中概率值不可能求出,所以采用的都是专家给定的LS,LN值。从LS,LN的数学公式不难看出,LS表征的是A的发生对B发生的影响程度,而LN表征的是A的不发生对B发生的影响程度。 几率函数O(X): 即,表示证据X的出现概率和不出现的概率之比,显然O(X)是P(X)的增函数,且有: P(X)=0,O(X)=0

基于确定性算法识别对流—扩散方程的参数及应用研究

基于确定性算法识别对流—扩散方程的参数及应用研究 随着社会经济的快速发展,环境污染问题日益突出,尤其是近几年地下水源污染事件以及河流污染突发事件频频发生。针对这两类水污染事件,如何快速有效地确定污染源,掌握污染物的时空分布,制定有效的应急预案是当务之急。然而,如何根据地下水源污染与河流污染事件建立水质模型;如何确定地下水污染的初值,即初值重构问题;如何确定地下水污染源的位置、强度、时间历程,即源项识别问题,以及含水层的渗流速度及弥散系数,即参数估计问题;如何确定河流污染的模型参数,即参数估计问题,是模拟污染物时空分布中亟待解决的问题。本论文以地下水和河流中污染物迁移输运模型为研究对象,设计了Landweber迭代、PRP 共轭梯度和变步长梯度正则化三种确定性算法,系统地研究了一维的和二维的、整数阶的和分数阶的污染物迁移输运的初值重构、源项识别以及参数识别问题。 论文的主要研究内容及研究结论如下:(1)设计了一种新的迭代算法—Landweber迭代重构一维地下水污染物迁移输运的初值反问题,并应用纯扩散和对流—扩散实例检验所提算法的有效性。同时,分析了正则化参数、初始值及测量误差对重构结果的影响。对流—扩散实例初值重构的数值结果表明:正则化参数取为1.9,大约迭代50余次,所提算法即反演出了精度较高的初值,较为接近真值,从而证明了Landweber迭代算法是一种非常有效的解决一维地下水污染初值反问题的方法。(2)提出了PRP共轭梯度算法识别一维地下水污染物迁移输运的污染源项反问题。 应用淄博地区地下水硫酸根入渗强度反演实例验证所提算法的有效性,并研究了初始值和测量误差对污染源项识别结果的影响。研究结果表明:当初始值选择合理时,所提算法能快速有效地反演出精度较高的硫酸根平均入渗强度,从而证明了应用PRP共轭梯度算法求解一维地下水污染物迁移输运的污染源项是有效的。为了消除PRP共轭梯度算法对初始值的依赖,本论文设计了一种新的混合算法HM,该算法耦合了遗传算法和PRP共轭梯度算法,具有全局搜索能力强、反演精度高的特点。通过淄博地区地下水中硫酸根平均入渗强度的反演结果得出:混合算法对于求解污染源项反问题是稳定有效的。 (3)引入了梯度正则化算法求解一维河流污染物迁移输运的参数识别反问题,并以常系数河流模型、线性相关和线性无关的变系数河流模型的多项模型参数识

算法

算法是对问题求解过程的准确描述,由有限条指令组成,这些指令能在有限时间内执行完毕并产生确定性的输出。 算法需满足的4个性质: 输入:零个或多个外部量作为输入。 输出:至少产生一个量作为输出, 它(们)与输入量之间存在某种特定的联系。 确定性:组成算法的每条指令都是清晰、无歧义的。 有限性:每条指令的执行次数有限,执行每条指令的时间也有限。 程序与算法的区别: 程序是算法用某种程序设计语言的具体实现。 程序可以不满足算法的有限性性质。 算法复杂度: 复杂度:算法运行时需要耗费计算机资源的量,可以分为时间复杂度和空间复杂度。 算法复杂度依赖于三个方面:待求解问题的规模、算法的输入和算法本身。 用n,I,A分别表示问题的规模、算法的输入和算法本身,用表示C复杂度,则有:C=F(n,I,A)。如果将时间复杂度和空间复杂度分开,则有T=T(n,I,A)和S=S(n,I,A)。通常,我们让A隐藏在复杂度函数名中,所以有T=T(n,I)和S=S(n,I)。 由于时间复杂度和空间复杂度概念类似,计量方法类似,且空间复杂度分析相对简单,因此本课程主要讨论算法的时间复杂度。 4种阶:O, Ω, Θ,和o 定义1 (O):如果存在正的常数C和自然数n0,使得当n≥n0时,有f(n)≤C·g(n),则称函数f (n) 在n 充分大时有上有界,且g(n) 是它的一个上界,记做f (n) = O(g(n)) ,并称f (n) 的阶不高于g(n) 的阶。 定义2(Ω):如果存在正的常数C 和自然数n0 ,使得当n ≥ n0时,有f(n)≥C·g(n),则称函数f (n) 在n 充分大时有下有界,且g(n) 是它的一个下界,记做f (n) = Ω(g(n)) ,并称f (n) 的阶不低于g(n) 的阶。 下界的阶越高,则评估精度越高,也就越有价值。 定义3(Θ):f (n) = Θ(g(n)) ,当且仅当f (n) = O(g(n)) ,且f (n) = Ω(g(n)) ,称f (n) 和g(n) 是同阶。 定义4( o ) :对于任意给定的ε > 0 ,存在正整数n0 ,使得当n ≥ n0 时,有f (n) / g(n) ≤ε ,则称函数f (n) 在n 充分大时的阶比g(n) 低,记为f (n) = o(g(n)) 。 估算算法的时间复杂度方法: 计算迭代次数 使用递归方程 频度分析

(完整版)数学建模五步法与灵敏度分析

灵敏度分析 简介: 研究与分析一个系统(或模型)的状态或输出变化对系统参数或周围条件变化的敏感程度的方法。在最优化方法中经常利用灵敏度分析来研究原始数据不准确或发生变化时最优解的稳定性。通过灵敏度分析还可以决定哪些参数对系统或模型有较大的影响。因此,灵敏度分析几乎在所有的运筹学方法中以及在对各种方案进行评价时都是很重要的。 用途: 主要用于模型检验和推广。简单来说就是改变模型原有的假设条件之后,所得到的结果会发生多大的变化。 举例(建模五步法): 一头猪重200磅,每天增重5磅,饲养每天需花费45美分。猪的市场价格为每磅65美分,但每天下降1美分,求出售猪的最佳时间。 建立数学模型的五个步骤: 1.提出问题 2.选择建模方法 3.推到模型的数学表达式 4.求解模型 5.回答问题 第一步:提出问题 将问题用数学语言表达。例子中包含以下变量:猪的重量w(磅),从现在到出售猪期间经历的时间t(天),t天内饲养猪的花费C(美元),猪的市场价格p(美元/磅),出售生猪所获得的收益R(美元),我们最终要获得的净收益P(美元)。还有一些其他量,如猪的初始重量200磅。 (建议先写显而易见的部分) 猪从200磅按每天5磅增加 (w磅)=(200磅)+(5磅/天)*(t天) 饲养每天花费45美分 (C美元)=(0.45美元/天)*(t天) 价格65美分按每天1美分下降 (p美元/磅)=(0.65美元/磅)-(0.01美元/磅)*(t天) 生猪收益 (R美元)=(p美元/磅)*(w磅) 净利润 (P美元)=(R美元)-(C美元) 用数学语言总结和表达如下: 参数设定: t=时间(天)

w=猪的重量(磅) p=猪的价格(美元/磅) C=饲养t天的花费(美元) R=出售猪的收益(美元) P=净收益(美元) 假设: w=200+5t C=0.45t p=0.65-0.01t R=p*w P=R-C t>=0 目标:求P的最大值 第二步:选择建模方法 本例采用单变量最优化问题或极大—极小化问题 第三步:推导模型的数学表达式子 P=R-C (1) R=p*w (2) C=0.45t (3) 得到R=p*w-0.45t p=0.65-0.01t (4) w=200+5t (5) 得到P=(0.65-0.01t)(200+5t)-0.45t 令y=P是需最大化的目标变量,x=t是自变量,现在我们将问题转化为集合S={x:x>=0}上求函数的最大值: y=f(x)=(0.65-0.01x)(200+5x)-0.45x (1-1) 第四步:求解模型 用第二步中确定的数学方法解出步骤三。例子中,要求(1-1)式中定义的y=f (x)在区间x>=0上求最大值。下图给出了(1-1)的图像和导数(应用几何画板绘制)。在x=8为全局极大值点,此时f(8)=133.20。因此(8,133.20)为f在整个实轴上的全局极大值点,同时也是区间x>=0上的最大值点。 第五步:回答问题 根据第四步,8天后出售生猪的净收益最大,可以获得净收益133.20美元。只要第一步中的假设成立,这一结果正确。

方程法剔除确定性趋势后的ARMA模型建模

实验四 方程法剔除确定性趋势后的ARMA 模型建模 一、实验目的 掌握根据数据的变化形态,找到合适的方法提取确定性趋势;学会验证数据的平稳性;学会根据自相关系数和偏自相关系数来初步判断ARMA 模型的阶数p 和q ,学会利用最小二乘法等方法对ARMA 模型进行估计,学会利用信息准则对估计的ARMA 模型进行诊断,以及掌握利用ARMA 模型进行预测。掌握在实证研究中如何运用Eviews 软件进行ARMA 模型的识别、诊断、估计和预测和相关具体操作。 二、基本概念 确定性趋势就是时间序列在一个比较长的时期内,受某种或某几种确定性因素影响而表 现出的某种持续上升或持续下降的趋势。可以通过适当的数学模型很好地拟合这种趋势。 AR 模型:AR 模型也称为自回归模型。它的预测方式是通过过去的观测值和现在的干扰值的线性组合预测, 自回归模型的数学公式为: 1122t t t p t p t y y y y φφφε---=++++ 式中: p 为自回归模型的阶数,i φ(i=1,2, ,p )为模型的待定系数,t ε为误差, t y 为一个平稳时间序列。 MA 模型:MA 模型也称为滑动平均模型。它的预测方式是通过 过去的干扰值和现在的干扰值的线性组合预测。滑动平均模型的数学公式为: 1122t t t t q t q y εθεθεθε---=---- 式中: q 为模型的阶数; j θ(j=1,2, ,q )为模型的待定系数;t ε为误差; t y 为平稳时间 序列。 ARMA 模型:自回归模型和滑动平均模型的组合, 便构成了用于描述平稳随机过程的自回归滑动平均模型ARMA, 数学公式为: 11221122t t t p t p t t t q t q y y y y φφφεθεθεθε------=++++---- 三、实验内容及要求 1、实验内容: (1)根据时序图的形状,采用相应的数学模型拟合趋势; (2)对剔除趋势后的序列,判断其平稳性,进而运用经典B-J 方法对剔除了确定性趋势后的1978~2006年国内石油消费量序列cx 建立合适的ARMA (,p q )模型,并能够利用此模型进行2007年石油需求的预测。 2、实验要求: (1)深刻理解确定性趋势和残差平稳性的要求以及ARMA 模型的建模思想; (2)如何通过观察自相关,偏自相关系数及其图形,利用最小二乘法,以及信息准则建立合适的ARMA 模型;如何利用ARMA 模型进行预测; (3)熟练掌握相关Eviews 操作,读懂模型参数估计结果。 四、实验指导 1、模型识别

从数据中发现不确定性知识研究

从数据中发现不确定性知识研究 发表时间:2010-03-22T22:16:52.310Z 来源:《价值工程》2010年第2期供稿作者:杨庆仙;宋绍云;唐合文 [导读] 知识是人类(或系统)对信息(数据)加工后产生的高级产品,知识可以表示成各种形式:规则、科学规律、方程或概念网杨庆仙① Yang Qingxian;宋绍云② Song Shaoyun;唐合文② Tang Hewen (①云南交通职业技术学院,昆明 650101;②玉溪师范学院信息技术工程学院,玉溪 653100) 摘要:从数据中发现不确定知识并进行量化一直是研究的难点,在阐述不确定性知识概念的基础上,λ构造叠加算子,并应用该算子从实际例子中发现不确定性知识,从结果可以看出,该算法得到的不确定知识可靠性较高。 关键词:数据挖掘;不确定性;知识表示;知识处理 中图分类号:TP183 文献标识码:A 文章编号:1006-4311(2010)05-0154-03 0 引言 当今是一个数据泛滥的时代,虽然我们能从大量的数据中来获取知识,并用得到的知识进行决策和预测等工作,但从庞大数据中获得的知识是匮乏的,由于现实世界中客观事物或现象的不确定性,导致了人们在认识领域中的信息和知识大多是不精确的,知识真正是,并永远是不确定的[1]。 1 数据与知识 数据是客观事物的符号表示,它被看作自然对象,其主要形态有数字、符号、图形、图像、声音数据,主要组织有结构化、半结构化和非结构等。 知识是人类(或系统)对信息(数据)加工后产生的高级产品,知识可以表示成各种形式:规则、科学规律、方程或概念网。主要有两类知识的来源,首先是经验知识(专家知识),主要是针对特定领域的问题求解,不仅依赖于特定领域确定的理论知识,而且更多地依赖于专家的经验和常识。由于现实世界中客观事物或现象的不确定性,导致了人们在各认识领域中的信息和知识大多是不精确的,这就要求专家系统中知识的表示和处理模式能够反映这种不确定性。其次的知识来源是数据中挖掘的知识,其主要对象是数据,面临的问题是怎样通过推理发现数据中隐藏的知识,以便提供决策,主要的手段是通过不确定性方法(模糊集、粗糙集、概率、信息熵等)来获得数据中的知识。 2 知识发现 知识发现是指从数据集中抽取和精炼有用的模式。 2.1 知识发现的任务 数据总结:对数据进行总结与概括。传统的最简单的数据总结方法是计算出数据库的各个字段上的求和值、平均值、方差值等统计值或者用直方图、饼状图等图形方式表示。 聚类:根据数据的不同特征,将其划分为不同的类,属于无导师学习。 分类:根据分类模型对数据集合分类,即将给定对象划归于某个类。分类(Classification)是知识发现中一项非常重要的任务,是一种有指导的学习(机器学习中的称谓)。 偏差分析:基本思想是寻找观察结果与参照量之间的差别。通过发现异常, 可以引起人们对特殊情况的加倍注意。 建模:构造描述一种活动或状态的数学模型(如贝叶斯模型)。 2.2 问题的不确定性 随机性:主要用概率论来揭示随机现象的统计规律性。 模糊性:主要用模糊集和粗糙集来揭示模糊现象的规律性。 随机性和模糊性是不确定性的两个方面,确定性可以被看作是不确定性的特例。 2.3 知识发现的方法 知识发现方法主要有:传统方法(回归分析、聚类分析等);模糊集方法;粗糙集方法和机器学习(规则归纳、决策树、范例推理、支持向量机、神经网络、贝叶斯信念网络等)。下面介绍粗糙集方法的应用。 3 粗糙集的应用 3.1 粗糙集简介 粗糙集作为一种处理不精确(imprecise)、不一致(inconsistent)、不完整(incomplete)等各种不完备信息的有效工具,一方面得益于他的数学基础成熟、不需要先验知识;另一方面在于它的易用性。由于粗糙集理论创建的目的和研究的出发点就是直接对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律,因此是一种天然的数据挖掘或者知识发现方法,它与基于概率论的数据挖掘方法、基于模糊理论的数据挖掘方法和基于证据理论的数据挖掘方法等其他处理不确定性问题理论的方法相比较,最显著的区别是它不需要提供问题所需处理的数据集合之外的任何先验知识,而且与处理其他不确定性问题的理论有很强的互补性(特别是模糊理论)。基于粗糙集的方法可用于:近似推理、信息检索、机器学习和数据挖掘等。 3.2 属性约简 3.2.1 基本概念 设,U:为非空对象集,称为论域。R:为U 上的等价关系,且其具有以下性质。 自反性:(a,a)∈R; 对称性:if(a,b)∈R,then(b,a)∈R 传递性:if(a,b)∈R,(b,c)∈R,then(a,c)∈R 由U上的等价关系R定义U上的划分,每个划分块称为等价类。U/R定义为由R导出的等价类。[x]R定义为包含对象x的等价类。例1:设U={x1,x2,…,x8}为积木集。 设 R1:颜色(红,黄,蓝)

中科大黄刘生算法第一次作业

算法实验报告 Ex.1 若将y ← uniform(0, 1) 改为 y ← x, 则上述的算法估计的值是什么? 实验结果如下: 可见结果趋近于2*sqrt(2) Ex.2 在机器上用1 20 4 1x dx -? 估计π值,给出不同的n 值及精度。 计算方法就采用课上讲到的HitorMiss 算法,伪代码如下: f ←sqrt(1 – x*x) HitorMiss (f, n) { k ← 0; for i ← 1 to n do { x ← uniform(0, 1); y ← uniform(0, 1); if y ≤ f(x) then k++; }//endfor return 4*k/n; } 实验结果如下:

从总的趋势来看,n的值越大,给出的pai的精度越高。但对应到两次实验结果未必n 大的精度一定高,这是概率算法的特点。 EX.3 采用算法类似HitorMiss算法,不过加入了一些特殊处理,以便能够正确计算穿越x 轴、周期函数等的积分。 算法伪代码如下: f ← x^2 / - sqrt(x) / sin(x) MyCalc(f , minx, maxx, miny, maxy, n) { k ← 0; for i ← 1 to n do { x ← uniform(minx, maxx); y ← uniform(miny, maxy); if f(x) >= 0//函数在x轴上方,积分是f与x轴之间的部分,积分值为正 then if y <= f(x) && y >=0 k++; else//函数在x轴下方,积分是f与x轴之间的部分,积分值为负 if y >= f(x) && y <= 0 k--; }//endfor if miny > 0//函数在x轴上方 then return k / n * (maxx - minx) * (maxy - miny) + miny * (maxx - minx)); else if maxy < 0//函数在x轴下方 then return k / n * (maxx - minx) * (maxy - miny) + maxy * (maxx - minx);

相关主题
文本预览
相关文档 最新文档