第6章_空间索引与空间信息查询
- 格式:ppt
- 大小:3.42 MB
- 文档页数:102
第一章绪论:1. 基本概念地理数据:各种地理特征和现象间关系的数字化表示。
(地理数据是与地理环境要素有关的物质的数量、质量、分布特征、联系和规律等的梳子、文字、图像和图形的总称。
)地理信息:有关地理实体和地理现象的性质、特征和运动状态的表征和一切有用的知识,是对表达地理特征和地理现象之间关系的地理数据的解释(特征:空间、时间、属性)地理信息系统:在计算机软、硬件系统支持下,对整个或部分地球表层(包括大气层)的有关地理分布数据进行采集、储存、管理、运算、分析、显示和描述的技术系统。
2. GIS的定义:即地理信息系统(Geographic Information System或Geo—Information system,GIS)有时又称为“地学信息系统”或“资源与环境信息系统”。
它是一种特定的十分重要的空间信息系统。
它是在计算机硬、软件系统支持下,对整个或部分地球表层(包括大气层)空间中的有关地理分布数据进行采集、储存、管理、运算、分析、显示和描述的技术系统。
3. GIS由哪几部分组成?①硬件系统:输入设备、处理设备、存储设备和输出设备②软件系统:GIS支撑软件、GIS平台软件、GIS应用软件③网络:局域网、广域网、无线网络、Internet/Intranet/Extranet;主要作用信息传输④空间数据:是指地球表面空间位置为参照的自然、社会和人文景观数据⑤人员4. GIS的主要功能有哪些①空间数据的采集和输入②空间数据的编辑与管理③空间数据的处理与转换④空间查询与空间分析⑤空间数据的显示与输出应用功能:包括资源管理、区域规划、国土监测、辅助决策第二章1.地理空间数据的描述有哪些坐标系?相互的关系是什么?2.我国常用地图投影,各种投影的适用性1.高斯-克里格投影:横轴切圆柱等角投影(1:50万以上)2.横轴墨卡托投影(UTM,横轴割圆柱等角投影)3.兰勃特等角投影(正轴等角割圆锥投影)(1:100万以下)我国规定1:1万、1:2.5万、1:5万、1:10万、1:25万、1:50万比例尺地形图,均采用高斯投影。
信息检索:理论与方法第一部分信息检索理论一.掌握和熟悉1.信息检索的基本原理.........:即对信息集合与需求集合的匹配与选择。
*2.信息检索常用技术........:*·布尔检索:逻辑与:如,A*B ,表明一篇文献中A和B必须同时存在。
例:郭沫若*语言学(同时满足两个条件)逻辑或:如,A+B ,表明文献中A或B必须存在,包含同时存在。
逻辑非:如,A- B ,表明一篇文献中包含A但不包含B。
例:郭沫若;除去语言学(对某一个检索要求进行限制)逻辑“或”提高查全率,逻辑“与”和“非”提高查准率。
·截词检索:后截断:computer*,可检索出:computeracy, computerise, computers 前截断:*computer,可检索出:microcomputer, minicomputer中截断:organi ? ation,可检索出:organisation,organization前后截断:*computer*·限制检索:为缩小命中文献的数量,将检索范围限定在某个字段或范围中。
·全文位置检索:可以反映出两个检索词在文献中的邻近关系。
常用在全文检索中,弥补布尔检索的不足。
·加权检索:·多媒体检索:基于内容的检索是指根据媒体对象的内容及上下文联系,在大规模多媒体数据库中进行检索。
它的目标是提供在没有人类参与的情况下能自动识别或理解声音、图象、视频重要特征的算法。
·超文本检索:超文本是一种信息的组织方法。
3.信息检索当代技术........:*•并行检索:两个或两个以上的程序或任务并行处理。
• 分布式检索:允许检索请求在不同地点、不同结构的系统平台上运作。
Z39.50 协议是一种信息检索标准,常用于分布在各地的图书馆书目数据库系统的检索。
遵循了Z39.50协议,只要进入一个界面,不需要重新退出再进入。
近年来推出了基于OAI协议的分布式检索。
地理信息系统掌握要点集锦第一章绪论:1. 基本概念● 地理信息:有关地理实体和地理现象的性质、特征和运动状态的表征和一切有用的知● 识,是对表达地理特征和地理现象之间关系的地理数据的解释。
● 地理数据:各种地理特征和现象间关系的数字化表示。
● 地理信息系统:在计算机软、硬件系统支持下,对整个或部分地球表层(包括大气层)的有关地理分布数据进行采集、储存、管理、运算、分析、显示和描述的技术系统。
2. GIS的定义● 地理信息系统:在计算机软、硬件系统支持下,对整个或部分地球表层(包括大气层)的有关地理分布数据进行采集、储存、管理、运算、分析、显示和描述的技术系统。
3. 如何理解GIS?● GIS的物理外壳是计算机化的技术系统● GIS的操作对象是空间数据● GIS的技术优势在于它的空间分析能力● GIS与地理学、测绘学联系紧密4. GIS由哪几部分组成硬件基本配置软件 GIS软件空间数据人员5. GIS的主要功能有哪些?● 空间数据采集● 空间数据处理与编辑● 空间数据存储与管理● 空间查询与分析● 空间信息输出6. GIS与相关学科之间的关系GIS具有多学科交叉的特征,它既要吸取诸多相关学科的精华和营养,并逐步形成独立的边缘学科,又将被多个相关学科所运用,并推动他们的发展。
与之联系最为紧密的是地理学、制图学、计算机、测绘与遥感。
第二章地学基础:1. 基本概念● 地球椭球: 近似表示地球的形状和大小,并且其表面为等位面的旋转椭球。
(百度)● 大地体: 由大地水准面所包围的地球形体,称为大地体。
(百度)● 地图投影:将地球椭球面上的点映射到平面上的方法。
● 高斯—克吕格投影:横轴切椭圆柱等角投影,假想用一个椭圆柱横切于椭球面上投影带的中央子午线,按规定投影条件,将中央子午线两侧一定经差范围内的经纬线交点投影到椭圆柱上,并将此圆柱面展为平面,即得本投影● 横轴墨卡托投影:等角正切圆柱投影,假设地球被围在一中空的圆柱里,其标准纬线与圆柱相切接触,然后再假想地球中心有一盏灯,把球面上的图形投影到圆柱体上,再把圆柱体展开就得到一幅选定标准纬线上的“墨卡托投影”绘制出的地图● 兰勃特等角投影:正轴等角割圆锥投影,设想用一个正圆锥割于球面两标准纬线,应用等角条件将地球面投影到圆锥面上,然后沿一母线展开,即为兰勃特投影平面。
Oracle 表空间索引存储与碎片检查Oracle 表空间索引存储检查,Oracle 表空间索引碎片查看,包括查看系统表中的用户索引、索引的存储情况检查、索引的选择性、确定索引的实际碎片。
1、查看系统表中的用户索引在 Oracle 中,SYSTEM 表是安装数据库时自动建立的,它包含数据库的全部数据字典Oracle 表空间索引存储检查,Oracle 表空间索引碎片查看,包括查看系统表中的用户索引、索引的存储情况检查、索引的选择性、确定索引的实际碎片。
1、查看系统表中的用户索引在 Oracle 中,SYSTEM 表是安装数据库时自动建立的,它包含数据库的全部数据字典,存储过程、包、函数和触发器的定义以及系统回滚段。
一般来说,应该尽量避免在 SYSTEM 表中存储非 SYSTEM 用户的对象。
因为这样会带来数据库维护和管理的很多问题。
一旦 SYSTEM 表损坏了,只能重新生成数据库。
我们可以用下面的语句来检查在 SYSTEM 表内有没有其他用户的索引存在。
以下为引用内容:SELECT *FROM dba_indexesWHERE tablespace_name = 'SYSTEM' AND owner NOT IN ('SYS', 'SYSTEM')2、索引的存储情况检查Oracle 为数据库中的所有数据分配逻辑结构空间。
数据库空间的单位是block 、extent 和 segment 。
Block :Oracle 使用和分配的最小存储单位。
由数据库建立时设置的DB_BLOCK_SIZE 决定的。
一旦数据库生成了,数据块的大小不能改变。
要想改变只能重新建立数据库。
Extent :由一组连续的 block 组成的。
一个或多个 extent 组成一个segment 。
当一个 segment 中的所有空间被用完时,Oracle 为它分配一个新的extent 。
索引方法:网格索引——点要素(图元),线、面要素,有冗余四叉树索引——线、面要素,有冗余改进的四叉树索引——线、面要素R树——空间重叠一、网格索引,四叉树索引在介绍空间索引之前,先谈谈什么叫“索引“。
对一个数据集做”索引“,是为了提高对这个数据集检索的效率。
书的”目录“就是这本书内容的”索引“,当我们拿到一本新书,想查看感兴趣内容的时候,我们会先查看目录,确定感兴趣的内容会在哪些页里,直接翻到那些页,就OK了,而不是从第一章节开始翻,一个字一个字地找我们感兴趣的内容,直到找到为止,这种检索内容的效率也太低了,如果一本书没有目录,可以想象有多么不方便…可见书的目录有多重要,索引有多重要啊!现在大家对索引有了感性认识,那什么是“空间索引“呢?”空间索引“也是”索引“,是对空间图形集合做的一个”目录“,提高在这个图形集合中查找某个图形对象的效率。
比如说,我们在一个地图图层上进行矩形选择,确定这个图层上哪些图元被这个矩形所完全包含呢,在没有”空间索引“的情况下,我们会把这个图层上的所有图元,一一拿来与这个矩形进行几何上的包含判断,以确定到底哪些图元被完全包含在这个矩形内。
您是不是觉得这样做很合理呢?其实不然,我们先看一个网格索引的例子:我们对这个点图层作了网格索引,判断哪些点在这个矩形选择框内,是不需要把这个图层里所有的点都要与矩形进行几何包含运算的,只对 a,b,c,d,e,f,g这七个点做了运算。
可以推想一下,如果一个点图层有十万个点,不建立空间索引,任何地图操作都将对整个图层的所有图元遍历一次,也就是要For循环10万次;建立索引将使得For循环的次数下降很多很多,效率自然提高很多!呵呵…想必大家都知道空间索引的好处了,也不知不觉向大家介绍了点图层的网格索引,还有哪些常用的空间索引呢?这些空间索引又该如何实现呢?带着这样的问题,下面介绍几种常用的空间索引。
网格索引网格索引就是在一个地图图层上,按每个小网格宽△w,高△h打上均匀的格网,计算每个图元所占据的网格或者所经过的网格单元集合,在这些网格单元中,记录下图元对象的地址或者引用,比如:声明一个对象二维数组List grid[m][n]; m代表网格的行数,n代表网格的列数,每个数组元素为一个“集合对象”,用于存储这个网格单元所关联的所有图元的地址或引用,这样网格索引就建立好了。
信息检索1.信息检索的概念。
狭义信息检索是指用户找出有关信息的过程。
广义信息检索是将信息按照一定的方式组织和存储起来,并根据用户的需求找出有关信息的过程。
2. 信息检索的类型(1)按照检索对象的不同划分早期分为:文献检索、事实检索、数据检索。
当前三分方法:文本检索、音频与视频检索、数值检索。
(2)按检索手段划分:手工检索、机器检索3.简述信息检索的基本原理信息检索的基本原理:对信息集合与需求集合的匹配与选择。
实现信息检索,主要涉及三个关键要素:信息集合、用户信息需求、匹配选择。
一、信息集合:信息集合是指有关某一领域的,经采集、加工的信息集合体。
二、需求集合:用户的信息需求是在社会实践活动中产生的。
当人们在完成某一任务或工作时,经常觉得缺少某些知识,这就产生了信息需求。
三、选择与匹配:要在信息集合中快速获取用户所需信息,需要信息检索提供一种匹配机制,能够把需求集合与信息集合依据某种相似性标准进行比较与判断,进而选择出符合用户需要的信息。
匹配机制至少包括两个要素:第一是匹配标准,即相似性标准;第二是执行匹配的动因。
4.计算机信息检索经历了脱机检索阶段、联机检索阶段、光盘检索阶段、网络检索阶段。
5.信息检索领域的主要研究问题有哪些?⑴信息检索理论:检索语言、检索模型、标引理论、相关性理论、知识组织与表示理论⑵信息检索工具/系统:信息检索系统的结构、功能、设计开发、管理运营、应用评价等⑶信息资源及其收集、加工:信息存储、数据库⑷检索技术与方法:文本检索技术、数值检索技术、音频与视频检索技术、网络搜索技术⑸用户研究与检索策略:用户的查询心理、检索需求及其类型、用户查询信息的行为特征等、用户信息需求分析、检索式构造、相关反馈方法、检索过程调整与控制等⑹其他密切相关的自动化处理技术:自动聚类与分类、自动摘要、信息可视化、信息过滤、信息提取、机器翻译、人机交互等。
信息检索的两种研究方式:以计算机为中心和以用户为中心,以计算机为中心的IR问题是主流。