模糊地理实体不确定性综合描述研究(武大学报EI)
- 格式:pdf
- 大小:343.36 KB
- 文档页数:5
简析模糊综合评判中合成算子的选取1 引言自Zadeh建立了模糊数学以来,模糊综合评判就成为解决各种问题强有力的工具。
但在实际应用时,选取不同的模糊合成算子,会得到不同的评价结果。
因此,需要根据具体的问题来选择适当的算子,这就是本文所讨论的主要内容。
2 模糊综合评判2.1 综合评判的含义所谓模糊综合评判,是以模糊数学为基础,应用模糊关系的合成原理,对受多种因素制约的事物或对象,将一些不清、不易定量的因素定量化然后进行综合评价的一种方法。
它须要经过建立评判对象的因素集U={u1u2…un},建立评判集V={v1v2…vm},专家评定或其它方法生成的评判矩阵以及通过合理的模糊算子进行评判的数学模型。
2.2 几种常见的模糊算子(1):Zadeh算子,又称“取大取小算子”,在决策分析中不确定型决策问题的乐观主义准则也就是采取的取大取小的方法。
在模糊综合评判中,由于取大取小有很好的代数性质,而且算法思路清晰、运算简单、易于掌握,是模糊综合评判的首选方法。
运算规则为:,(j=12…m)。
从运算规则可以看出:ai是rij的上限,即在合成u的评价对任何评判标准vj的隶属度都不能大于ai,而且该算法只考虑rij中最大那个起作用的因素,而忽略了其它一些次要因素。
可见,这是一种“主因素决定型”的合成方式。
用该合成方式,与bj与有关的R阵中的数据只有几个,淘汰的信息太多,利用的信息太少,这些对于实际问题的刻化是很不利的。
用Zadeh算子评判的问题应满足:因素集中的各因素相互独立,各因素状态间不能相互补偿;因素集中单因素的满意度在综合评价中的作用不能超过其权重比例;评价结果受权重影响。
(2):最大乘积算子,运算规则为:从运算规则可以看到,对rij乘以小于1的权重ai,表明ai是在考虑多因素时rij的修正植,直接决定bj的R阵中的数据不一定是每列中最大的那个数,它不仅要求rij大,而且也要求所对应的ai也大,可见ai在这里起了权衡因素重要性的作用,在这种合成算子中,与bj有关的R阵的数据也只有几个,最终合成中淘汰的信息也很多,可见这是一种“主因素突出型”。
重点一空间数据库模型1.空间数据库空间数据库是地理信息系统在计算机物理存储介质上存储的与应用相关的地理空间数据的总和,一般是以一系列特定结构的文件的形式组织在存储介质之上的。
2.空间数据库模型空间数据库模型是关于现实世界中空间实体及其相互间联系的概念,为描述空间数据组织和设计空间数据库模式提供了基本的方法。
一般而言,GIS 空间数据模库型由概念数据库模型、逻辑数据库模型和物理数据库模型三个有机联系的层次所组成。
3.数据库概念模型:( conceptual model)概念模型为了把现实世界中的具体事物抽象、组织为某一数据库管理系统支持的数据模型。
人们常常首先将现实世界抽象为信息世界,然后将信息世界转换为机器世界。
也就是说,首先把现实世界中的客观对象抽象为某一种信息结构,这种信息结构并不依赖于具体的计算机系统,不是某一个数据库管理系统(DBMS)支持的数据模型,而是概念级的模型,称为概念模型。
4.逻辑模型逻辑模型,是指数据的逻辑结构。
在数据库中,逻辑模型有关系、网状、层次,可以清晰表示个个关系。
在管理信息系统中,逻辑模型:是着重用逻辑的过程或主要的业务来描述对象系统,描述系统要“做什么”,或者说具有哪些功能。
1)关系数据模型是把数据的逻辑结构归结为满足一定条件的二维表格,每个二维表格称为一个关系。
关系模型以记录组或数据表的形式组织数据,便于利用各种地理实体与属性之间的关系进行存储和变换,不分层也无指针,是建立空间数据和属性数据之间关系的一种非常有效的数据组织方法。
2)关系数据库:是建立在关系数据库模型基础上的数据库,借助于集合代数等概念和方法来处理数据库中的数据。
目前主流的关系数据库有oracle 、SQL、access 、db2 等。
3)对象—关系管理模式是指在关系型数据库中扩展,通过定义一系列操作空间对象(如点、线、面)的API 函数,来直接存储和管理非结构化的空间数据的空间数据库管理模式。
5.物理模型,在管理信息系统中,物理模型:描述的是对象系统“如何做”、“如何实现”系统的物理过程。
地理信息系统名词解释数据数据是通过数字化或直接记录下来的可以被鉴别的符号,包括数字、文字、符号、图形、图像以及它们能够转换成的数据等形式。
数据结构即指数据组织的形式,是适合于计算机存储、管理和处理的数据逻辑结构。
对空间数据则是地理实体的空间排列方式和相互关系的抽象描述。
数据模型:是表达现实世界的规格化说明,在数据库中用形式化的方法描述数据的逻辑结构和操作。
空间数据模型:就是对空间实体及其联系进行描述和表达的数学手段,使之能反映实体的某些结构特性和行为功能。
一般而言,GIS空间数据模型由概念数据模型、逻辑数据模型和物理数据模型三个有机联系的层次所组成。
关系数据模型用表格数据表示实体和实体之间关系的数据模型,表为二维表,满足一定的条件。
数据处理即对数据进行运算、排序、转换、分类、增强等,其目的就是为了得到数据中包含的信息。
地理数据是以地球表面空间位置为参照,描述自然、社会和人文景观的数据,主要包括数字、文字、图形、图像和表格等形式。
地理信息(2005) 地理信息是地理数据所蕴含和表达的地理意义,是指表征与地理环境要素有关的物质的数量、质量、分布特征、联系和规律等的数字、文字、图像和图形的总称。
地理信息具有空间、属性、时态三种特征。
地理信息流即地理信息从现实世界到概念世界,再到数字世界(GIS),最后到应用领域。
地球信息科学(2004) 与地理信息系统相比,它更加侧重于将地理信息视作为一门科学,而不仅仅是一个技术实现,主要研究在应用计算机技术对地理信息进行处理、存储、提取以及管理和分析过程中提出的一系列基本问题。
地理信息科学在对于地理信息技术研究的同时,还指出了支撑地理信息技术发展的基础理论研究的重要性。
(邬伦,《地理信息系统原理、方法和应用》)地理信息系统(2004,2008,2009) GIS是由计算机硬件、软件和不同的方法组成的系统,该系统设计支持空间数据采集、管理、处理、分析、建模和显示,以便解决复杂的规划和管理问题。
1998一、选择1、世界上第一个地理信息系统产生于:A.中国B.美国C.加拿大D.澳大利亚2、判断点是否在多边形内常用:A.空间内插B.半线理论C.平板技术D.维数变化3、空间集合分析主要完成:A.地形分析B.缓冲区分析C.逻辑运算D.叠置分析4、以线性四*树表示8*8的栅格矩阵时,第6行第5列位置处的栅格的MORTON码值为:A.57B.39C.54D.365、建立空间要素之间的拓扑关系属于____功能A.空间分析B.图形分析C.空间查询D.地图整饰二、简述在栅格数据中提取多边形边界的一般方法三、地理信息系统中的数据输入包含几项内容?输入过程中可能产生的误差有几种?四、图画题给出一个四*树要求画出栅格矩阵,并用线性四*树和二维行程编码表示七、简答题1、地理坐标2、地图投影研究的主要内容3、地理信息系统中的地图投影配置应遵循的原则八、介绍两种商用GIS基础软件的主要特性和适应的场合九、某城市由于人口增长较快,原有的地下基础设施已经不能满足要求,为此须重新进行规划,目的是为了满足今后10—20年内城市人口发展的需要。
现用GIS辅助规划其要求是:1、能随时知道任意地方的地下管线的各类指标2、能随时了解那些管线需要重新建设3、能随时了解任意区域的人口指标4、管线应铺设在道路的两侧、单侧或中央。
5、管线铺设时应距离附近的建筑至少10米6、管线铺设和指标计算应结合地形进行7、输出规划成果,主要包括人口分布图和规划后的底下综合管线图现提供如下条件:1、规划区域的地形图及属性数据2、规划区域的道路图及属性数据3、规划区域的地下综合管线现状图及属性数据4、规划区域的人口分布规划图及属性数据5、规划区域的建筑分布分布图几属性数据6、已提供了由人口计算相应管线的负载的全套公式7、已提供了计算管线各种指标的公式8、所有的图件都已经入库根据以上的条件,设计用地理信息系统实现上述规划要求的方法,分别说明其中使用了哪些数据和GIS的那些主要功能。
第35卷第1期2010年1月武汉大学学报・信息科学版G eomatics and Information Science of Wuhan University Vol.35No.1Jan.2010收稿日期:2009210229。
项目来源:国家科技支撑计划资助项目(2008BA K50B01);中国博士后科学基金资助项目(20080430586)。
文章编号:167128860(2010)0120046205文献标志码:A模糊地理实体不确定性综合描述研究郭继发1,2 崔伟宏2 刘 臻1,2 彭光雄2(1 中国科学院研究生院,北京市玉泉路甲19号,1000491)(2 中国科学院遥感应用研究所,北京市朝阳区大屯路9718信箱,100101)摘 要:从二型模糊的角度讨论了模糊地理实体的不确定性,基于空间数据的位置误差,利用模糊集的λ2截集和圆误差带模型推导了模糊地理实体隶属度的误差模型,并给出了隶属度不确定性的度量方法,提出了用隶属度误差立方体来综合描述模糊点的不确定性。
关键词:模糊地理实体;二型模糊集;圆误差带;隶属度误差立方体中图法分类号:P208 地理信息中大量的空间数据既包含位置误差、模型误差,同时还具有地理实体本身的模糊性。
在位置不确定性方面,一些研究人员综合考虑了矢量数据的模型误差和随机误差,建立了线元的综合不确定带[1,2];基于信息熵理论,研究了矢量数据的误差熵带,建立了不等同的误差熵带模型[325]。
但是,基于信息熵的不确定性模型仍然属于统计不确定性,因为误差熵是基于概率密度函数推导出来的。
这里的误差熵模型是一种基于统计理论的不确定性模型[6]。
对于综合量化随机不确定性和模糊不确定性,文献[6]提出了一种矢量数据不确定性的混合熵模型。
但是,目前概率熵和模糊熵的结合尚处于研究阶段,针对不同的应用,模糊熵、混合熵存在多种表达方式,因此,应用混合熵来度量空间数据的混合不确定性,首先需要寻找一种合适的度量空间数据混合熵的数学模型。
经典模糊集在实际运用中带有较大的主观性,而二型模糊集考虑了隶属度的误差,因此,运用二型模糊集理论来研究模糊点、线、面的数学模型更具实际意义[7]。
针对不同的研究和应用领域,目前已经提出了许多模糊熵函数,并扩展到模糊集的广义熵、直觉模糊集的模糊熵、Vague 集的模糊熵[8210],Deluca 等提出用总熵(total ent ropy ,混合熵)来描述其不确定性[11]。
同样也有许多描述混合熵的函数[12]。
误差熵不确定带模型的理论基础是信息熵及其最大熵原理。
最大熵原理包括峰值功率受限条件下信源的最大熵和平均功率受限条件下信源的最大熵原理,均有特殊的限制条件。
峰值功率受限条件下信源的最大熵是在∫bap (x )d x =1下信源的最大相对熵。
平均功率受限条件下信源的最大熵是在约束条件∫bap (x )d x =1和σ2=∫ba(x -m )2p (x )d x =K <∞(1)下求的信源差熵的极大值[13]。
误差熵由观测误差的熵确定,即由残余信息熵H (X/X n )决定:Δ=12e H (X/X n )(2)式中,X n 为随机变量;X n 为观测矢量,观测结果越精确,误差熵越小。
对于空间对象,Δ为不确定范围的度量。
但是,模糊熵是事物固有模糊性的一种度量,对于一个模糊对象A ,∑ni =1μA(x i)不一定等于1,即模糊熵和混合熵不存在上述限制条件;而误差熵是测量值在位置偏差的一种度量,通过熵半径来描述其范围。
它们分别属于模糊空间和随机空间的两种测度,因此,对于模糊性和随机性共存的地理实体不适合用式(2)描述其位置不确定性。
从数值的角度来看,由参数(a ,b,c )定义三角模糊 第35卷第1期郭继发等:模糊地理实体不确定性综合描述研究数的模糊熵为12(c -a ),由参数(a ,b,c ,d )定义的梯形模糊数的模糊熵为12(d -a )+(ln2-0.5)(c -b ),其值均为参数的线性分布,即当三角模糊数和梯形模糊数的模糊性线性递增时,其模糊熵线性递增,但式(2)不是一个线性函数,若用式(2)计算其误差熵,会与实际值不符。
因此,当地理实体的不确定性同时存在模糊性和随机性时,不能用误差熵带模型来度量其不确定性。
对于模糊数据,由于观测数据均不可避免地带有误差,于是可以将观测数据的误差转化为隶属度的误差。
但是经典模糊数学不能处理这种隶属度带有误差的模糊集,针对这一缺陷,Zadeh 针对数据的不确定性再次提出了模糊二型理论。
文献[14]给出了二型模糊集的定义和主隶属度不确定性的度量方法。
二型模糊集可分为二型一般模糊集合和二型区间模糊集,其中二型一般模糊集是指二型模糊集中次隶属成员函数为一般函数的模糊集;当次隶属函数是一型区间模糊集时称为二型区间模糊集[15]。
1 模糊点的模糊随机不确定性综合描述模型的建立 地理信息矢量数据不可避免地存在误差,同样模糊点在任意位置的隶属度也存在误差,在此考虑模糊点测量误差造成的隶属度误差。
设任意点P (x 0,y 0)的协方差阵为D P =σ2x Pσx P y P σ2y P x P σ2y P 。
模糊性方面,定义模糊点p (x 0,y 0)的隶属度为:μp (x 0,y 0)=C -(x -x 0)2+(y -y 0)2R,(x -x 0)2+(y -y 0)2≤R20,(x -x 0)2+(y -y 0)2>R 2(3)式中,C 为模糊点中心的隶属度;R 为模糊点的半径。
模糊集合与经典集合之间的转化关系通过模糊集合的截集实现,模糊截集可以知道某元素对模糊集合的明确归属。
通过取该模糊数的λ2截集,可以得到不同半径的同心圆,其半径为:R λ=R (C -λ),λ∈(0,C](4)1.1 圆曲线误差带圆有多种构造方法,在此设圆的参数方程为x =x O +R λcos (θ)y =y O +R λsin (θ),0≤θ<2π,同时假定半径没有长度误差。
在已知圆心和半径的情况下,以参数方程通过误差传播率得出不确定性方程,此时K =1001,根据协方差传播率D x =K ×D P ×KT可求得圆上任意点误差,D x 为圆上任意点的协方差阵,如图1(b )所示。
图1 圆不确定带模型Fig.1 Uncertainty Band Model of Circle圆曲线误差带的构造如图1(a )所示,图中P为圆形,椭圆为圆上T i 点的误差椭圆。
以误差椭圆上斜率与圆曲线上点斜率相等的点作为圆曲线误差带的内外包络带,以此作为圆曲线的“G 2带”模型。
以误差椭圆与圆曲线半径延长线的交点为圆曲线误差带的内外包络带,以此作为圆曲线的“G 2带”模型。
以误差椭圆与圆曲线半径延长线的交点为圆曲线误差带的内外包络带,以此作为圆曲线的“εσ2带”,在图1(a )中圆θi 方向上的半径延长线与点T i 上误差椭圆的交点t 1、t 2的集合构成圆曲线的“εσ2带”的包络带。
在此为了讨论方便,以“εσ2带”进行讨论。
1.2 模糊点不确定性的综合描述模型的建立取不同的λ∈(0,C],可以得到不同半径的同心圆,通过求不同半径的同心圆的误差带,可以得到点的不同截集的误差带簇。
过点P 隶属度为C 的位置作一任意竖直平面,如图2(a )所示,其剖面如图2(b )所示,可以看出在不考虑隶属度误差且C 取1时,为经典三角模糊集。
在顾及隶属度误差的情况下,图2(b )中填充区域为隶属度不确定性区域,三根竖线表示为1、2、3处的隶属度误差,对隶属度不确定区域的研究将在后文中展开。
2 模糊点不确定性的综合描述模型分析 由于点位误差的存在,造成平面各点对模糊74武汉大学学报・信息科学版2010年1月图2 模糊点的不确定性分析Fig.2 Uncertainty Analysis of Fuzzy Points点P的隶属度均存在误差,那么描述模糊点的隶属度从以经典模糊集转化为用二型模糊集来描述。
由§2可知,不同的同心圆在θ方向上的误差相同,如图2(b)所示,有:rθi =rθj=rθ(5)αθi =αθj=a tanCR(6)那么隶属度误差为:hθ=hθi =rθitan(aθi)=rθRC(7)式中,rθ表示模糊点在θ方向上的误差,r2θ=σ2xP・co s2(θ)+σxP y P sin(2θ)+σ2yPsin2(θ)。
于是可以导出模糊点在任意位置的次隶属度函数。
利用R、rθ、αθ、h i及其相互关系很容易推导出该二型模糊集的上边界、下边界、左右肩和左右底。
当Pθ-rθ≤P≤Pθ+rθ时隶属度为C,成为左、右肩。
当Pθ-R-rθ≤P≤Pθ-R+rθ、Pθ+R -rθ≤P≤Pθ+R+rθ时隶属度为0,称为左、右底。
该二型模糊集的上边界通过式(8)、式(9)确定,多边形的下边界通过式(10)、式(11)确定。
μL T(P)=CR(P-Pθ+rθ)+C,Pθ-R-rθ≤P≤Pθ-rθ(8)μRT(P)=-CR(P-Pθ-rθ)+C,Pθ+rθ≤P≤Pθ+R+rθ(9)μLB(P)=CR(P-Pθ+R-rθ),Pθ-R+rθ≤P≤Pθ(10)μRB(P)=-CR(P-Pθ-R+rθ),Pθ≤P≤Pθ+R-rθ(11) 2.1 模糊点隶属度误差的近似计算目前,对一般二型模糊集的求解是一个难点,尚未有一种公认的合理方法,对于一般二型模糊集的简化通常有以下两种方法[16]:①将一般二型模糊集简化为区间二型模糊集,然后对主隶属函数离散化;②将一般二型模糊集离散化,包括对主隶属函数和次隶属函数的离散化。
方向隶属度的误差可以采用第一种方法。
另外,对于点位误差可以采用误差圆代替误差椭圆亦可降低计算量来近似计算。
模糊点在θ方向上主隶属函数的不确定性即为图2(b)中的填充区域,那么考虑模糊点点位误差时θ方向上的隶属函数为:f(θ,P)=(μL T(θ))/2,Pθ-R-rθ≤P≤Pθ-R+rθ(μL T(θ)+μLB(θ))/2,Pθ-R+rθ≤P≤Pθ-rθ(C+μLB(θ))/2,Pθ-rθ≤P≤Pθ(C+μRB(θ))/2,Pθ≤P≤Pθ+rθ(μRT(θ)+μRB(θ))/2,Pθ+rθ≤P≤Pθ+R-rθ(μRT(θ))/2,Pθ+R-rθ≤P≤Pθ+R-rθ(12)各位置对模糊点的隶属度的不确定性为:U(θ,P)=μL T(θ),Pθ-R-rθ≤P≤Pθ-R+rθμL T(θ)-μLB(θ)=2hθ,Pθ-R+rθ≤P≤Pθ-rθC-μLB(θ),Pθ-rθ≤P≤PθC-μRB(θ),Pθ≤P≤Pθ+rθμRT(θ)-μRB(θ)=2hθ,Pθ+rθ≤P≤Pθ+R-rθμRT(θ),Pθ+R-rθ≤P≤Pθ+R-rθ(13)84 第35卷第1期郭继发等:模糊地理实体不确定性综合描述研究2.2 模糊点的隶属度误差度量方法对于当点位误差的误差椭圆为标准误差椭圆时,隶属度区间一般为[μθi -h θ,μθi +h θ]。