有序地质量最优分割法
- 格式:doc
- 大小:926.00 KB
- 文档页数:21
三 黄金分割法——0.618法(一)一、基础达标1.有一优选问题,存优X 围为[10,20],在安排试点时,第一个试点为16,则第二个试点最好为( )A.12B.13C.14D.15解析 在优选过程中,安排试点时,最好使两个试点关于[10,20]的中点15对称,所以第二个试点最好为14.答案 C2.在存优X 围[10,100]安排两个实验点x 1,x 2,则x 1,x 2关于( )对称.解析 x =x 1+x 22=10+1002=55. 答案 C3.用0.618法确定试点,则经过4次试验后,存优X 围缩小为原来的( )2345解析 由黄金分割法知:每次舍去的区间占舍去前的区间的比例数相等,故4次试验后,存优X 围缩小为原来的0.6183.答案 B4.假设因素区间为[0,1],取两个试点0.1和0.2,则对峰值在(0,0.1)内的单峰函数,两次试验存优X 围缩小到区间________上.解析 如图所示:因为峰值在(0,0.1)内,故应舍去区间[0.2,1],两次试验后存优X 围缩小到区间[0,0.2]上.答案 [0,0.2]5.人体的正常体温为36~37 ℃,在炎炎夏日将空调设为__________℃,人体感觉最佳.(精确到0.1 ℃)解析 36×0.618到37×0.618,即22.2~22.8.答案 22.2~22.86.一个身高为170 cm 的人,肚脐离地面的最佳高度为__________ cm(精确到 1 cm).解析 由170×0.618=105.06≈105.答案 105二、能力提升7.已知一种材料的最佳加入量在110 g 到210 g 之间,若用0.618法安排试验,则第一次试点的加入量可以是________g.解析 根据0.618法可知,第一试点的加入量为110+0.618×(210-110)=171.8(g)或110+210-171.8=148.2(g)答案 171.8或148.28.在炼钢过程中为了得到特定用途的钢,需要加入含有特定元素的材料.若每吨钢需要加入某元素的量在1 000 g 到2 000 g 之间,假设最佳点在1 400 g ,如果用0.618法试验,求第三个试验点.解 由0.618法知x 1=1 000+0.618(2 000-1 000)=1 618(g),x 2=1 000+2 000-x 1=1 382(g).由于1 382 g 接近1 400 g ,所以此时的存优X 围为(1 000,1 618),∴x 3=1 000+1 618-1 382=1 236(g).9.如图,椭圆中心在坐标原点,F 为左焦点,A 为长轴的右端点,B 当FB ⊥AB 时,其离心率为5-12,此类椭圆为“黄金椭圆”. (1)类似“黄金椭圆”,推算“黄金双曲线”的离心率.(2)设AB 为黄金双曲线x 2a 2-y 2b2=1的弦,M 为AB 的中点,若AB ,OM 的斜率存在,求k OM ·k AB .解 (1)类似“黄金椭圆”,作出“黄金双曲线”,如图,则BF ⊥AB .则BO =b ,FO =c ,OA =a ,在Rt△ABF 中,b 2=ac .又∵b 2=c 2-a 2,∴c 2-a 2=ac ⇒⎝ ⎛⎭⎪⎫c a 2-c a-1=0.∴e =c a =1±52.又e >1, ∴e =1+52. (2)如图,设A (x 1,y 1),B (x 2,y 2),M (x 0,y 0),则⎩⎪⎨⎪⎧x 21a 2-y 21b 2=1, ①x 22a 2-y 22b 2=1. ②由①-②得(x 1-x 2)(x 1+x 2)a 2=(y 1-y 2)(y 1+y 2)b2. ∵M 是AB 的中点,且x 1≠x 2,∴x 0=x 1+x 22,y 0=y 1+y 22,从而y 1-y 2x 1-x 2=b 2a 2·x 0y 0. 故k OM ·k AB =y 0x 0·y 1-y 2x 1-x 2=b 2a 2=1+52. 三、探究与创新10.已知线段AB ,怎样作出它的黄金分割点?解 法一 在AB 的端点B 作BD ⊥AB ,使BD =12AB ,连接AD ,在AD 上截取DE =DB ,再在AB 上截取AC =AE ,则点C 为所求作的黄金分割点,如图1. 事实上,由作法可知AD =52AB ,则AC =AE =AD -DB =AD -12AB =5-12AB , 即证.图1法二 在AB 上作正方形ABMN ,在AN 上取中点E ,在NA 的延长线上取EF =EB .以AF 为一边作正方形ACDF ,则点C 为所求作的黄金分割点,如图2.事实上,由AC =AF =EF -AE =EB -AE =AB 2+⎝ ⎛⎭⎪⎫12AB 2-12AB =5-12AB ,即证.图2。
提高产品设计开发速度和质量的有效方法——“五环法随着科学技术的不断发展,产品生产机械化、自动化水平的提高,人操作干预相对减少,产品制造过程的质量保证能力大大提高,产品质量的形成过程逐渐移向其源头一一设计开发过程。
日本曾作过统计,产品在使用过程中暴露出的问题(包括顾客反馈意见、投拆以及索赔等)约70%是属于设计开发中存在的问题,笔者所在的公司也统计了产品质量波动的原因,约65%的情况属于设计开发中存在的问题或缺陷。
新产品诞生后先天不足的情况,在很多制造企业里都不同程度也存在着,这给后续的生产和使用过程带来相当大的麻烦,也造成产品内、外部质量的损失,增加了质量保证成本。
“五环法”能从根本上很好地解决这个问题,它既能加快设计开发的速度,又能提高设计开发质量,并且还能降低产品的单台材料成本。
“五环法”是笔者综合当今世界上一些经济发达国家的企业在产品设计领域里的先进理念和科学方法提出的。
笔者在公司亲自对设计开发和工艺人员进行了培训,并得到了设计开发人员的认可,取得了满意的效果。
“五环法”以设计开发新理念为指导,其由“DOE正交试验设计”、“田口三次设计”、“可靠性设计”、“设计评审”和“同步小组的设立实施同步行动”这五个有着密切内在联系、缺—不可的环节构成,如图1所示。
下面就“五环法”每一环节的主要内容和“五环法”实施的步骤作简要的说明。
一、设计开发新理念1.以顾客为导向设计者只有通过市场调研和顾客访谈,较充分地掌握顾客的需求和期望,做好产品定位,才能设计开发出顾客喜欢的产品,所设计的产品也才具有较强的生命力。
2.加快新产品设计开发速度在当今日趋激烈的市场竞争环境中,产品更新换代加快,企业间的竞争由原来的“大鱼吃小鱼”变为“快鱼吃慢鱼”,它迫使企业加快产品创新速度,如果还像以往一样,设计开发一个新产品用1~2年的时间,产品量产投放市场时,不是市场已被竞争对手的同类产品占满,就是该类产品已经处在更新换代的边缘了。
基于 ArcGIS 空间分析技术的永久基本农田优化调整摘要:在城镇化发展与农田保护矛盾突显,第三次全国土地调查显示部分永久基本农田现状为非耕地的背景下,结合双评价等资料,引入集中连片度的概念,运用ArcGIS软件的数据处理功能,对优化永久基本农田空间布局进行探讨。
关键词:永久基本农田调出补划 ArcGIS 空间分析永久基本农田即对基本农田实行永久性保护,是2008年中共十七届三中全会提出此概念。
“永久基本农田”即无论什么情况下都不能改变其用途,不得以任何方式挪作它用的基本农田。
将优质耕地划入永久基本农田,用最严格的的要求管控,对国家粮食安全和社会稳定具有重要意义。
1研究背景随着我国城镇化进程不断加快,开发建设占用大量优质耕地,粮食安全的问题日益突显。
我国是拥有14亿人口的大国,农业基础地位任何时候都不能忽视和削弱的,发展与保护的矛盾冲突要解决好。
2017年划定的永久基本农田与当前的发展用地需求冲突明显,与此同时,第三次全国土地调查(以下简称三调)成果趋于完善,部分永久基本农田调查现状为非耕地,在此背景下,永久基本农田的优化调整十分必要。
为做好永久基本农田优化调整工作,国家先后印发多个文件指导工作。
《中共中央国务院关于建立国土空间规划体系并监督实施的若干意见》(中发【2019】18 号)文件中明确提出:科学有序统筹布局生态、农业、城镇等功能空间,划定生态保护红线、永久基本农田、城镇开发边界等空间管制边界以及各类海域保护线,强化底线约束,为可持续发展预留空间。
2021年6月2日自然资源部国土空间规划局和自然资源部耕地保护监督司联合印发《关于加快推进永久基本农田核实整改补足和城镇开发边界划定工作的函》(自然资空间规划函【2021】121号)(以下简称121号文),要求统筹推进永久基本农田核实整改补足和城镇开发边界划定工作。
2研究的目的在现有永久基本农田划定成果的基础上,分析永久基本农田中划定不实、不适宜的区域,并根据国家对永久基本农田的划定要求进行调出。
数学地质一、名词解释1、数学地质:地质学与数学和计算机科学相互渗透、紧密结合而逐步形成的一门地质学的边缘学科。
它是以数学为方法、以计算机为主要研究手段,定量研究地质学基础理论和定量探矿法的一门方法性学科。
2、研究对象和任务:地质系统、地质工作方法。
3、数学模型:是指用定量方法描述地质体系发生、演化过程及其变量间关系的模型。
4、地质系统:一个动态的由相互联系的若干地质成分组成的集合。
5、地质概念模型:是指在对地质体系深刻理解和抽象思维的基础上,以定性方式表达地质体系发生和演化过程及其变量间关系的模型。
6、地质数据:是表示地质信息的数、字母和符号的集合。
它是用来表示地质客观事实这一地质信息的。
7、狭义地质数据类型:分为观测、综合、经验数据三类。
其中观测数据又可分为定性(名义型、有序型)、定量(间隔型,比例型)数据两类。
8、误差:观测值与真实值之间的差异称为误差,误差与真实值之比称为相对误差。
包括随机、系统和过失误差。
9、离群数据:由于各种原因造成的观测数据局部异常局部的异常高值和异常低值称为离群数据。
10、地质变量:反映某地质现象在时间或空间上变化规律的量。
11、回归分析:依据相关变量y、x i(i=1, 2, …, m)的n组观测值(x1k, x2k, …, x mk, y k)(k=1, 2, …, n),研究变量y、x i(i=1,2, …, m)间相关关系并确定近似定量关系的一种统计分析方法。
12、趋势面分析:在空间中已知点M i(x i, y i, z i) 的控制下,拟合一个连续的数学曲面,并以此研究地质变量在区域上和局部范围内变化规律的一种统计方法。
13、趋势值:数据中反映总体规律的部分,即由某些地质特征的大区域因素决定的地质变量趋势值,常用趋势面函数表示。
14、局部异常值:反映局部范围的变化特征,即由局部因素引起的地质变量的局部异常值。
15、随机干扰值:由各种随机因素所造成的干扰值(偏差)。
三分法设计原理-概述说明以及解释1.引言1.1 概述概述部分的内容可以从以下方面进行描述:在设计中,三分法设计原理是指将一个整体、一个完整的事物划分为三个部分或阶段,通过这种划分的方法来进行系统、有序的设计和组织。
这种设计原理被广泛应用于多个领域,如艺术、建筑、产品设计、管理等。
三分法设计原理的核心思想是将事物的组成部分或阶段划分为三个相对独立而又有联系的部分,通过这种划分可以更好地理解和处理事物的复杂性。
这种设计原理帮助我们将整体看作是由相互关联的部分构成的,每个部分都能够在整体中承担特定的功能和作用。
在实践中,三分法设计原理可以帮助设计者更好地进行事物的系统设计和组织。
通过将事物划分为三个部分,每个部分都可以独立进行设计和优化,然后再整合起来形成一个完整的整体。
这种设计方法有助于减少设计过程中的复杂性和混乱性,提高设计的效率和质量。
此外,三分法设计原理还可以用于帮助理解事物的演化和变化过程。
通过将事物的发展过程分为三个阶段,可以更好地理解事物的演变规律和发展趋势。
这种设计原理可以用来帮助预测未来的发展方向,从而更好地指导设计和决策。
综上所述,三分法设计原理是一种将事物划分为三个相对独立而又有联系的部分或阶段的设计方法。
它可以帮助设计者进行系统、有序的设计和组织,提高设计的效率和质量。
这一设计原理在多个领域都有着广泛的应用,并且对于理解事物的发展和演化过程也具有重要的作用。
1.2 文章结构文章结构的主要目的是为读者提供一个清晰的框架,帮助他们更好地理解文章的内容和逻辑结构。
本文将采用三分法设计原理,在文章结构上分为引言、正文和结论三个部分。
引言部分(1.1)将对三分法设计原理的概述进行介绍。
我们将简要说明三分法设计原理的定义和意义,为读者提供一个整体认识。
接着,文章正文(2)将进一步展开三分法设计原理的具体内容。
第一要点(2.1)将详细介绍三分法设计原理的第一个方面,并提供相关的定义和解释。
我们将深入探讨该方面的应用场景和实例,以帮助读者更好地理解其实际意义。
标准二分法-概述说明以及解释1.引言1.1 概述概述标准二分法是一种常见的算法思想,用于在有序数组或有序列表中查找特定元素的位置。
这种方法通过将待查找区间不断缩小一半,最终找到目标元素或确定其不存在。
标准二分法是计算机科学中最基础、最常用的算法之一,被广泛应用于各个领域,包括数据结构、算法设计、搜索技术等。
在标准二分法中,首先需要一个有序的数据结构,通常是一个有序数组或有序列表。
然后,将待查找区间的起点和终点分别标记为left和right。
接下来,在每一次循环中,我们都计算待查找区间的中间位置mid,然后比较目标元素与中间位置的值。
如果目标元素等于中间位置的值,则找到了目标元素,算法结束。
如果目标元素小于中间位置的值,则说明目标元素位于中间位置的左侧,将右边界right更新为mid-1。
反之,如果目标元素大于中间位置的值,则说明目标元素位于中间位置的右侧,将左边界left更新为mid+1。
通过不断缩小待查找区间的大小,最终可以找到目标元素或确定其不存在。
标准二分法具有较高的时间效率,可以在较大规模的有序数组或有序列表中快速查找目标元素。
其时间复杂度为O(log n),其中n表示数组或列表的大小。
此外,标准二分法还具有简单清晰的思路和易于实现的特点,使得其成为工程和科研中首选的查找算法之一。
然而,标准二分法也有一些局限性。
首先,标准二分法要求数据结构必须是有序的,这就意味着如果数据结构不是有序的话,需要先进行排序操作,增加了额外的时间开销。
其次,对于一些特殊情况,标准二分法可能失效。
比如,当数组中存在重复元素时,标准二分法可能无法准确判断目标元素的位置,需要进行额外的操作来解决。
总之,标准二分法是一种非常重要和常用的算法思想,其通过将待查找区间不断缩小一半的方法,在有序数组或有序列表中高效地查找目标元素。
虽然具有一定的局限性,但标准二分法的优点仍然使其在各个领域得到广泛应用。
在接下来的内容中,我们将进一步探讨标准二分法的应用场景、优点和局限性,以及对其未来发展进行探讨。
【转】三种快速排序算法以及快速排序的优化⼀. 快速排序的基本思想快速排序使⽤分治的思想,通过⼀趟排序将待排序列分割成两部分,其中⼀部分记录的关键字均⽐另⼀部分记录的关键字⼩。
之后分别对这两部分记录继续进⾏排序,以达到整个序列有序的⽬的。
⼆. 快速排序的三个步骤1) 选择基准:在待排序列中,按照某种⽅式挑出⼀个元素,作为 “基准”(pivot);2) 分割操作:以该基准在序列中的实际位置,把序列分成两个⼦序列。
此时,在基准左边的元素都⽐该基准⼩,在基准右边的元素都⽐基准⼤;3) 递归地对两个序列进⾏快速排序,直到序列为空或者只有⼀个元素;三. 选择基准元的⽅式对于分治算法,当每次划分时,算法若都能分成两个等长的⼦序列时,那么分治算法效率会达到最⼤。
也就是说,基准的选择是很重要的。
选择基准的⽅式决定了两个分割后两个⼦序列的长度,进⽽对整个算法的效率产⽣决定性影响。
最理想的⽅法是,选择的基准恰好能把待排序序列分成两个等长的⼦序列。
⽅法⼀:固定基准元(基本的快速排序)思想:取序列的第⼀个或最后⼀个元素作为基准元。
/// <summary>/// 1.0 固定基准元(基本的快速排序)/// </summary>public static void QsortCommon(int[] arr, int low, int high){if (low >= high) return; //递归出⼝int partition = Partition(arr, low, high); //将 >= x 的元素交换到右边区域,将 <= x 的元素交换到左边区域QsortCommon(arr, low, partition - 1);QsortCommon(arr, partition + 1, high);}/// <summary>/// 固定基准元,默认数组第⼀个数为基准元,左右分组,返回基准元的下标/// </summary>public static int Partition(int[] arr, int low, int high){int first = low;int last = high;int key = arr[low]; //取第⼀个元素作为基准元while (first < last){while (first < last && arr[last] >= key)last--;arr[first] = arr[last];while (first < last && arr[first] <= key)first++;arr[last] = arr[first];}arr[first] = key; //基准元居中return first;}注意:基本的快速排序选取第⼀个或最后⼀个元素作为基准。
地质块段法计算步骤:首先,在矿体投影图上,把矿体划分为需要计算储量的各种地质块段,如根据勘探控制程度划分的储量类别块段,根据地质特点和开采条件划分的矿石自然(工业)类型或工业品级块段或被构造线、河流、交通线等分割成的块段等;然后,主要用算术平均法求得各块段储量计算基本参数,进而计算各块段的体积和储量;所有的块段储量累加求和即整个矿体(或矿床)的总储量。
地质块段法储量计算参数表格式如表下所列。
表地质块段法储量计算表块段编号资源储量级别块段面积(m2)平均厚度(m)块段体积(m3)矿石体重(t/m3)矿石储量(资源量)平均品位(%)金属储量(t)备注需要指出,块段面积是在投影图上测定。
一般来讲,当用块段矿体平均真厚度计算体积时,块段矿体的真实面积S需用其投影面积S′及矿体平均倾斜面与投影面间的夹角α进行校正。
在下述情况下,可采用投影面积参加块段矿体的体积计算:①急倾斜矿体,储量计算在矿体垂直纵投影图上进行,可用投影面积与块段矿体平均水平(假)厚度的乘积求得块段矿体体积。
图在矿体垂直投影图上划分开采块段(a)、(b)—垂直平面纵投影图;(c)、(d)—立体图1—矿体块段投影;2—矿体断面及取样位置②水平或缓倾斜矿体,在水平投影图上测定块段矿体的投影面积后,可用其与块段矿体的平均铅垂(假)厚度的乘积求得块段矿体体积。
优点:适用性强。
地质块段法适用于任何产状、形态的矿体,它具有不需另作复杂图件、计算方法简单的优点,并能根据需要划分块段,所以广泛使用。
当勘探工程分布不规则,或用断面法不能正确反映剖面间矿体的体积变化时,或厚度、品位变化不大的层状或脉状矿体,一般均可用地质块段法计算资源量和储量。
缺点:误差较大。
当工程控制不足,数量少,即对矿体产状、形态、内部构造、矿石质量等控制严重不足时,其地质块段划分的根据较少,计算结果也类同其他方法误差较大。
一维搜索:1精确一维搜索精确一维搜索可以分为三类:区间收缩法、函数逼近法(插值法)、以及求根法。
区间收缩法:用某种分割技术缩小最优解所在的区间(称为搜索区间)。
包括:黄金分割法、成功失败法、斐波那契法、对分搜索法以及三点等间隔搜索法等。
优化算法通常具有局部性质,通常的迭代需要在单峰区间进行操作以保证算法收敛。
确定初始区间的方法:进退法①已知搜索起点和初始步长;②然后从起点开始以初始步长向前试探,如果函数值变大,则改变步长方向;③如果函数值下降,则维持原来的试探方向,并将步长加倍。
1.1黄金分割法:黄金分割法是一种区间收缩方法(或分割方法),其基本思想是通过取试探点和进行函数值比较,使包含极小点的搜索区间不断缩短以逼近极小值点。
具有对称性以及保持缩减比原则。
优点:不要求函数可微,除过第一次外,每次迭代只需计算一个函数值,计算量小,程序简单;缺点:收敛速度慢;函数逼近法(插值法):用比较简单函数的极小值点近似代替原函数的极小值点。
从几何上看是用比较简单的曲线近似代替原的曲线,用简单曲线的极小值点代替原曲线的极小点。
1.2牛顿法:将目标函数二阶泰勒展开,略去高阶项后近似的替代目标函数,然后用二次函数的极小点作为目标函数的近似极小点。
牛顿法的优点是收敛速度快,缺点是需要计算二阶导数,要求初始点选的好,否则可能不收敛。
1.2抛物线法:抛物线法的基本思想就是用二次函数抛物线来近似的代替目标函数,并以它的极小点作为目标函数的近似极小点。
在一定条件下,抛物线法是超线性收敛的。
1.3三次插值法:三次插值法是用两点处的函数值和导数值来构造差值多项式,以该曲线的极小点来逼近目标函数的极小点。
一般来说,三次插值法比抛物线法的收敛速度要快。
精确一维搜索的方法选择:1如目标函数能求二阶导数:用Newton法,收敛快。
2如目标函数能求一阶导数:1如果导数容易求出,考虑用三次插值法,收敛较快;2对分法、收敛速度慢,但可靠;3只需计算函数值的方法:1二次插值法, 收敛快,但对函数单峰依赖较强;2黄金分割法收敛速度较慢,但实用性强,可靠;4减少总体计算时间:非精确一维搜索方法更加有效。
1 / 21 第七章 有序地质量最优分割法 第一节 概 述 地层划分与对比是煤田地质勘探的主要任务之一。在地质工作中,通常是寻找地层的不整合或假整合界线,或者利用古生物化石、岩石矿物等地质特征对地层进行划分与对比。这种划分方法比较直观,适用于较大地层单元的划分与对比。当地质特征间的差异性不显著时,运用上述直观、定性的方法来解决较小地层单元的进一步划分就有一定的困难。因此,近年来开始利用有序地质量,即运用数学方法,并借于电子计算机定量地划分地层,提出了“有序地质量最优分割法”。 地质数据中有相当多是有序的。这些按一定顺序排列的地质变量,叫做有序地质量。例如,沿地层露头剖面采集的岩石标本;钻孔取出的岩芯样品;与这些岩石、样品有关的岩性、物理化学和古生物数据;以及地球物理测井数据等。它们都是有序地质量。这类数据的特点是样品的前后次序不能变更。所以,一些不考虑样品排列顺序的数学处理方法,对此不适用。有序地质量最优分割法,就是对一批有序数据(地质体)进行分段的统计方法。 设有n个按顺序排列的样品,每个样品测得p个变量,这批2 / 21
数据可用数据矩阵的形式表示为 nxpnpnnppilxxxxxxxxxxX2122221
11211
其中,ilx表示第i个样品第l个变量的取值。 若对以上n个有序样品进行分割(分段),可能有
121112211nnnnnccc
种划分方法,每一种分法称为一种分割。在所有这些分割中,存在这样一种分割,它使得各段(组)内部样品之间的差异性最小(即样品数据的组内离差平方和最小),而使段(组)之间的差异性最大(即样品数据的组间离差平方和最大)。这种对n个样品分段并使组内离差平方和最小的分割方法,称为最优分割法。 样品变量总离差平方和的分解式为 BWT (7—1) 式中,T为总离差平方和;W为组内离差平方和;B为组间离差平方和。 由式(7—1)可知,如果n个样品分为K段,每段的样品个数为kn,若每个样品只取一个变量,则 3 / 21
KknikikkxxW112)( (7—2) KkkkKknikxxnxxBk12112)()( (7—3) 因此,寻求最优分割,就是用计算的分法找出使组内离差平方和(W)最小的那些分割点。这与判别分析中费歇准则相似,所以有序地质量最优分割法,有人又称为“F-分割法”或“有序样品的聚类分析”。 第二节 单元有序数据的最优分割 若有n个有序样品,每个样品只取一个变量,则有n个有序数据序列,为
nxxxX,,,21
现在试图将这n个样品按顺序分割为K段,使段(组)内离平差和尽可能小,而组间离差平方和尽可能大。为此,用jiixxx,,,1表示从第i个样品数据开始至第j个样品数据为止的
某段样品,其中
nji1
该段样品变量的离差平方和为 4 / 21
2),(,jijijixxd (7-4) 式中
jixijjix11,
由于),(jid能够反映样品段jiixxx,,,1内样品间差异的情况,),(jid愈小,表示段内各样品之间差异性愈小;反之,),(jid愈大,表示段内各样品之间差异性愈大。因此,又把),(jid称为ji,,段的直径。 若n个样品分为K段:111211,,,nxxx kKnKKnxxxxxx,,,,,22222212,为最优K段分割。其各段离差平方
和(段直径)分别为:),(1jid,),(),,(2jidjidK。根据最优分割的原则,其组内离差平方和必须满足
min,.,,21112jidjidjidjixxWkKknikikk (7-5) 或 KkkkxjixnB12max, (7-6) 在实际应用时,往往事先不知道n个有序样品客观上究竟能划分为几段。因此,必须从最优分成二段、三段、…、K段进行5 / 21
分析。 一、最优二段分割 若把n个有序样品nxxx,,,21分为两段,则有如下1n种不同的分法,即
1x
nxxx,,,32
21,xxnxxx,,,43
321,,xxxnxxx,,,54
121,,,nxxx
nx
在上述1n种分法中,究竟哪一种方法最优?只须计算出每一种分割的组内离差平方和,并从其中找出组内离差平方和W
最小的那一种分割,就是所求的最优二段分割。 在n个有序样品中,对任意一个11njj都可以确定一个二段分割,即j,,1nj,,1。若把对n个样品在第j个样品处进行的二段分割的组内离差平方和记为 nddjWn,21,1;2 (7-7) 式中,n表示被分割的样品数;2表示把n个样品分为二段;j表示以第j个样品为分割点。 6 / 21
上述1n种分割的组内离差平方和分别为
nddWn,21,11;2
nddWn,32,12;2
……………………………
nndndnWn,1,11;2
在ji,,中,当ji时,则
0,2,21,1nnddd
假设当1aj时,jWn;2达到最小,即
jWaWnnjn;2min;2111
则最优二段分割为1,,,21axxxnaxx,,1,其中iax为最优二段分割点。 二、最优三段分割 若把n个有序样品nxxx,,,21分为三段,其中必有两个分割点。假设第ja1和第j个样品为分割点,则三段分割为
1,,1axxjaxx,,11njxx,,1
若把三段分割的组内离差平方和记为:jaWn,;31,其中ja,1为
两个分割点12;111njja,则
njdjadadjaWn,1,1,1,;3111
njdaWj,1,21 7 / 21
显然,如果有jaWn,;31为最优三段分割,则1;2aWj必为最优二段分割,否则必存在另一个最优二段分割1;2aWj,使
jaWjaWnn,;3,;311
这与jaWn,;31为最优三段分割相矛盾。因此,如果对n个有序数据进行最优三段分割,必须对任意一个12njj,即前j
个数据先求出其最优二段分割,为
jadjadjaWj,1,1;2111
若
jaWaWjjjaj1111;2min;21
则前j个样品的最优二段分割与njxx,,1构成一个三段分割。最后,找出一个适当的j,如2aj,使得
njdaWaaWjn,1;2min,;3121
jjaWnnj,;3min112
则jaxx,,12,,1aaxxjnaxx,,12为n个样品的最优三段分割,其中1a和2a为最优三段分割点。 三、最优K段分割 若对n个有序样品数据nxxx,,,21进行最优K段分割,可先找出11njKj个样品的最优1K段最优分割,即 221,,;1kjaaaKW 8 / 21
从而得21,,1aaxxjaxxk,,12与njxx,,1构成K段分割,但不一定是最优K段分割。可选择一个适当的11njKj,如
1Kaj时,使得 jajajaKWaaaaKWKnnjKKKj,,,;min,,,;1221111221
可得最优K段分割为1,,1axx21,,1aaxxnaxxK,,11,其中
121,,,Kaaaxxx为最优K段分割点。 应当指出,分割的段数K一直可做到所要 求的段数K为止;或者可以预先给定一个小正 数,使K段分割的组内离差平方和 121,,,;knaaaKW
后为止。这样得出的
K就是最后的分割的段数。由图17所示,组 内离差平方和是随分段段数K的增加而单调地 减少。所以当nK时,组内离差平方和 0,,,;121nnaaanW。因此,可根据组内离
差平方和随段数增加而下降到比较稳定的时候(即 图中曲线平缓时)再确定分段段数。