当前位置:文档之家› 空间数据采集与处理

空间数据采集与处理

空间数据采集与处理
空间数据采集与处理

第三章空间数据采集与处理

3.1 空间数据采集

【学时安排】

1学时

【目的要求】

1、掌握地理信息系统数据源的种类;

2、理解数据采集的方式。

【教学方法与手段】

示例式教学法并通过实验课程理解与掌握数据采集方法。

一、数据源种类

地理信息系统的数据源是指建立地理信息系统数据库所需要的各种类型数据的来源。地理信息系统的数据源是多种多样的,并随系统功能的不同而不同,主要包括以下各种:

1、地图

各种类型的地图是GIS最主要的数据源,因为地图是地理数据的传统描述形式,是具有共同参考坐标系统的点、线、面的二维平面形式的表示,内容丰富,图上实体间的空间关系直观,而且实体的类别或属性可以用各种不同的符号加以识别和表示。我国大多数的GIS 系统其图形数据大部分都来自地图。

2、遥感影像数据

遥感影象是GIS中一个极其重要的信息源。

通过遥感影象可以快速、准确地获得大面积的、综合的各种专题信息,航天遥感影象还可以取得周期性的资料,这些都为GIS提供了丰富的信息。但是因为每种遥感影象都有其自身的成像规律、变形规律,所以对其的应用要注意影象的纠正、影象的分辨率、影象的解译特征等方面的问题。

3、统计数据

国民经济的各种统计数据常常也是GIS的数据源。如人口数量、人口构成、国民生产总值等等。

4、实测数据

各种实测数据特别是一些GPS点位数据、地籍测量数据常常是GIS 的一个很准确和很现势的资料。

5、数字数据

目前,随着各种专题图件的制作和各种GIS系统的建立,直接获取数字图形数据和属性数据的可能性越来越大。数字数据也成为GIS信息源不可缺少的一部分。但对数字数据的采用需注意数据格式的转换和数据精度、可信度的问题。

6、各种文字报告和立法文件

各种文字报告和立法文件在一些管理类的GIS系统中,有很大的应用,如在城市规划管理信息系统中,各种城市管理法规及规划报告在规划管理工作中起着很大的作用。对于一个多用途的或综合型的系统,一般都要建立一个大而灵活的数据库,以支持其非常广泛的应用范围。而对于专题型和区域型统一的系统,则数据类型与系统功能之间具有非常密切的关系。

二、数据采集方式

1、手工方式

通过手工在计算机终端上输入数据,主要是键盘输入。主要用于属性数据的输入。

2、手扶跟踪数字化仪输入

(1)手扶跟踪数字化仪

手扶跟踪数字化仪,根据其采集数据的方式分为机械式、超声波式和全电子式三种,其中全电子式数字化仪精度最高,应用最广。按照其数字化版面的大小可分为A0、A1、A2、A3、A4 等。

数字化仪由电磁感应板、游标和相应的电子电路组成。这种设备利用电磁感应原理:在电磁感应板的x,y方向上有许多平行的印刷线,每隔200μm一条。游标中装有一个线圈。当使用者在电磁感应板上移动游标到图件的指定位置,并将十字叉丝的交点对准数字化的点位,按动相应的按钮时,线圈中就会产生交流信号,十字叉丝的中心也便产生了一个电磁场,当游标在电磁感应板上运动时,板下的印制线上就会产生感应电流。印制板周围的多路开关等线路可以检测出最大信号的位置,即十字叉线中心所在的位置,从而得到该点的坐标值。

(2)数字化过程

把待数字化的图件固定在图形输入板上,首先用鼠标器输入图幅范围和至少四个控制点的坐标,随后即可输入图幅内各点、曲线的坐标。

通过数字化仪采集数据数据量小,数据处理的软件也比较完备,但由于数字化的速度比较慢,工作量大,自动化程度低,数字化的精度与作业员的操作有很大关系,所以,目前很多单位在大批量数字化时,已不再采用它。

3、扫描输入

(1)扫描仪简介

扫描仪直接把图形(如地形图)和图象(如遥感影象、照片)扫描输入到计算机中,以象素信息进行存储表示的设备。按其所支持的颜色分类,可分为单色扫描仪和彩色扫描仪;按所采用的固态器件又分为电荷耦合器件(CCD)扫描仪、MOS电路扫描仪、紧贴型扫描仪等;按扫描宽度和操作方式分为大型扫描仪、台式扫描仪和手动式扫描仪。

CCD扫描仪的工作原理是:用光源照射原稿,投射光线经过一组光学镜头射到CCD器件上,再经过模/数转换器,图象数据暂存器等,最终输入到计算机。CCD感光元件阵列是逐行读取原稿的。为了使投射在原稿上的光线均匀分布,扫描仪中使用的是长条形光源。对于黑白扫描仪,用户可以选择黑白颜色所对应电压的中间值作为阈值,凡低于阈值的电压就为0(黑色),反之为1(白色)。而在灰度扫描仪中,每个象素有多个灰度层次。彩色扫描仪的工作原理与灰度扫描仪的工作原理相似,不同之处在于彩色扫描仪要提取原稿中的彩色信息。扫描仪的幅面有A0,A1,A3,A4等。扫描仪的分辨率是指在原稿的单位长度(英寸)上取样的点数,单位是dpi,常用的分辨率有300-1000 dpi之间。扫描图象的分辨率越高,所需的存储空间就越大。现在多数扫描仪都提供了可选择分辨率的功能。对于复杂图象,可选用较高的分辨率;对于较简单的图象,就选择较低的分辨率。

(2)扫描过程

扫描时,必须先进行扫描参数的设置,包括:

a、扫描模式的设置,(分二值、灰度、百万种彩色),对地形图的扫描一般采用二值扫

描,或灰度扫描。对彩色航片或卫片采用百万种彩色扫描,对黑白航片或卫片采用灰度扫描。

b、扫描分辨率的设置,根据扫描要求,对地形图的扫描一般采用300dpi或更高的分辨

率。

c、针对一些特殊的需要,还可以调整亮度、对比度、色调、GAMMA曲线等。

d、设定扫描范围。

扫描参数设置完后,即可通过扫描获得某个地区的栅格数据。

通过扫描获得的是栅格数据,数据量比较大。如一张地形图采用300dpi灰度扫描其数据量就有20兆左右。除此之外,扫描获得的数据还存在着噪声和中间色调像元的处理问题。噪声是指不属于地图内容的斑点污渍和其它模糊不清的东西形成的像元灰度值。噪音范围很广,没有简单有效的方法能加以完全消除,有的软件能去除一些小的脏点,但有些地图内容如小数点等和小的脏点很难区分。对于中间色调像元,则可以通过选择合适的阈值选用一些软件如Photoshop等来处理。

一般对获得的栅格数据还要进行一些后续处理如图象纠正、矢量化等。扫描输入因其输入速度快、不受人为因素的影响、操作简单而越来越受到大家的欢迎,再加之计算机运算速度、存储容量的提高和矢量化软件的踊跃出现,使得扫描输入已成为图形数据输入的主要方法。

4、影像处理和信息提取方式

从遥感影像上直接提取专题信息。

5、数据通讯方式

联网方式下,信息系统内部各子系统之间以及与其它信息系统之间实现信息交流和信息共享的主要方式。

3.2 空间数据编辑处理

【学时安排】

3学时

【目的要求】

1、理解空间数据编辑;

2、理解数据处理的概念、内容及意义;

3、了解坐标系的转换,坐标校核,地图的手工编辑;

4、掌握数据压缩的目的;了解数据压缩的途径及方法;

5、理解栅格数据与矢量数据相互转换的方法与步骤;

6、了解空间数据插值;

【重点难点】

数据处理的方法。

【教学方法与手段】

示例式教学方法,多媒体教学手段。

一、空间数据编辑

通过矢量数字化或扫描数字化所获取的原始空间数据,都不可避免的存在着错误或误差,属性数据在建库输入时,也难免会存在错误,所以,对图形数据和属性数据进行一定的检查、编辑对于修正数据输入错误、维护数据的完整性和一致性、更新地理信息是很有必要的。

图形数据和属性数据的误差或错误主要包括以下几个方面:

1、空间数据的不完整或重复:主要包括空间点、线、面数据的丢失或重复、区域中心点的遗漏、栅格数据矢量化时引起的断线等;

2、空间数据位置的不准确:主要包括空间点位的不准确、线段过长或过短、线段的断

裂、相邻多边形结点的不重合等;

3、空间数据的比例尺不准确;

4、空间数据的变形;

5、空间属性和数据连接有误;

6、属性数据不完整;

图3-1是几种图形误差的示例。

为发现并有效消除误差,一般采用如下方法进行检查:

1、叠合比较法,是空间数据数字化正确与否的最佳检核方法,按与原图相同的比例尺

用把数字化的内容绘在透明材料上,然后与原图叠合在一起,在透光桌上仔细的观察和比较。

一般,对于空间数据的比例尺不准确和空间数据的变形马上就可以观察出来,对于空间数据

的位置不完整和不准确则须用粗笔把遗漏、位置错误的地方明显地标注出来。如果数字化的

范围比较大,分块数字化时,除检核一幅(块)图内的差错外还应检核已存入计算机的其它图

幅的接边情况;

2、目视检查法,指在屏幕上用目视检查的方法,检查一些明显的数字化误差与错误,

如图 所示,包括线段过长或过短、多边形的重叠和裂口、线段的断裂等;

3、逻辑检查法,如根据数据拓扑一致性进行检验,将弧段连成多边形,进行数字化误

差的检查。有许多软件已能自动进行多边形结点的自动平差。另外,对属性数据的检查一般

也最先用这种方法,检查属性数据的值是否超过其取值范围。属性数据之间或属性数据与地

理实体之间是否有荒谬的组合。

对于空间数据的不完整或位置的误差,主要是利用GIS 的图形编辑功能,如删除(目标、

属性、坐标),修改(平移、拷贝、连接、分裂、合并、整饰),插入等进行处理。

对空间数据比例尺的不准确和变形,可以通过比例变换和纠正来处理。

二、空间数据处理

数据处理是对采集的各种数据,按照不同的方式方法对数据进行编辑运算,清除数据冗

余,弥补数据缺失,形成符合用户要求的数据文件格式。处理内容主要包括:数踞编辑、数

据压缩、数据变换、数据格式转换、空间数据内插、边沿匹配、数据提取等。数据处理对于

空间数据有序化、检验数据质量、实现数据共享、提高资源利用效果都具有重要意义。

空间

数据处理的方法主要有以下几种:

(一) 坐标变换

空间数据坐标变换的实质是建立两个平面点之间的一一对应关系,是空间数据处理的基

本内容之一。主要包括平移变换、旋转变换、比例变换(图形缩放)、地图投影变换 。

1、平移变换:如图3-2所示,x ′=x+Δx ′,y ′=y+Δy ′。

2、旋转变换:如图3-3所示,x ′=x ?cos θ-y ?sin θ,y ′=x ?sin θ+y ?cos θ。

3、比例变换(图形缩放):点可以通过对其P (x ,y )坐标分别乘以各自的比例因子Sx 和

Sy 来改变它们到坐标原点的距离。x ′=x ·Sx ,y ′=y ·Sy 或x ′=x0+(x- x0) ·Sx ,y ′=y0+(y-

y0) ·Sy 。

y )

图3-3 空间数据旋转变换

y 图3-2 空间数据平移变换

4、地图投影变换:当系统使用的数据取自不同地图投影的图幅时,需要将一种投影的数字

化数据转换为所需要投影的坐标数据。投影转换的方法可以采用:

⑴正解变换: 通过建立一种投影变换为另一种投影的严密或近似的解析关系式,直接

由一种投影的数字化坐标x 、y 变换到另一种投影的直角坐标X 、Y 。

⑵反解变换: 即由一种投影的坐标反解出地理坐标(x 、y →B 、L),然后再将地理坐标

代入另一种投影的坐标公式中(B 、L →X 、Y),从而实现由一种投影的坐标到另一种投影坐标

的变换(x 、y →X 、Y)。

⑶数值变换: 根据两种投影在变换区内的若干同名数字化点,采用插值法,或有限差

分法,最小二乘法、或有限元法,或待定系数法等,从而实现由一种投影的坐标到另一种投

影坐标的变换。

目前,大多数GIS 软件是采用正解变换法来完成不同投影之间的转换,并直接在GIS

软件中提供常见投影之间的转换。

(二)图幅变形校正

此处的图幅主要指通过扫描得到的地形图和遥感影象。由于如下原因,使扫描得到的地

形图数据和遥感数据存在变形,必须加以纠正。

1、由于受地形图介质及存放条件等因素的影响,使地形图的实际尺寸发生变形;

2、在扫描过程中,工作人员的操作会产生一定的误差,如扫描时地形图或遥感影象没

被压紧、产生斜置或扫描参数的设置等因素都会使被扫入的地形图或遥感影象产生变形,

直接影响扫描质量和精度;

3、由于遥感影象本身就存在着几何变形;

4、由于所需地图图幅的投影与资料的投影不同,或需将遥感影象的中心投影或多中心

投影转换为正射投影等。

5、由于扫描时,受扫描仪幅面大小的影响,有时需将一幅地形图或遥感影象分成几块

扫描,这样会使地形图或遥感影象在拼接时难以保证精度。 图幅变形校正最常用的方法是六系数的线性变换法(Sprhsky ,1987;黄杏元等,1989): y A x A A X 210++=,y B x B B Y 210++=。上式中x ,y 为数字化的坐标,X ,Y 为转换

后的坐标,A 0,A 1,A 2,B 0,B 1,B 2为六个未知系数。设有n 个控制点(n >2),可用最小二乘

法原理来计算这六个未知数: i i i x y A x A A u Q 210(++-=,

)i i i y B x B B v Qy 210(++-=。

上式中x i ,y i 为第i 个控制点的数字化坐标,u i ,v i 认为对应的实测坐标,由

∑2Qy 最小

和∑2x Q 最小,可以解出A 0,A 1,A 2,B 0,B 1,B 2,实现图幅的变形校正。 (三)空间数据的压缩处理

数据压缩的目的主要有两点:节省存贮空间和节省处理时间。

数据压缩途径主要有:

1、压缩软件:原数据信息基本不丢失而且可以大大节省存贮空间,缺点是压缩后的文件

必须在解压缩后才能使用。

2、数据消冗处理:原数据信息不会丢失,得到的文件可以直接使用,缺点是技术要求高,

工作量大,对冗余度不大的数据集合效用小。

3、用数据子集代替数据全集:在规定的精度范围内,从原数据集合中抽取一个子集,缺

点以信息损失为代价,换取空间数据容量的缩小。

常见空间数据的压缩方法

1、曲线数据的压缩:常采用特征点筛选法,即筛选抽取曲线特征点,并删除全部多余点以达到节省存贮空间的目的。

2、面域栅格数据的压缩:通过压缩编码技术来消除冗余数据,如链码、游程长度编码、块码、四叉树编码。

3、面域邻接线段的删除:数据属性的重新分类和空间图形的化简需要对数据进行压缩、相邻界线的删除、共同属性的合并。

(四)空间数据类型的转换

不同数据类型间的转换主要包括矢量到栅格数据的转换和栅格到矢量数据的转换两种。

矢量数据转换成栅格数据也称栅格化。矢量空间数据一般是以点、线、面存放的。点状数据转成栅格数据时是取离点最近的一个栅格单元来存放,线状数据转成栅格数据时就变成连续的锯齿状的栅格点,必要时可以加宽,面状数据的转换主要是在每个多边形内部用等值的栅格填满。

栅格数据转换成矢量数据也称矢量化。普通地图经扫描仪输入后可以通过软件自动或半自动的转成矢量数据。把栅格数据转成矢量点的方法比较简单。栅格数据转成线大致有三个步骤: (1)分类;(2)线的细化; (3) 线的提取。

面状信息的矢量化和线状信息的矢量化类似:(1) 分类; (2) 获得边界;(3) 边界线的矢量化。

(五)空间数据内插

空间数据的内插是已知一组空间数据,它们可以是离散点的形式,也可以是分区数据的形式,现在要从这些数据中找到一个函数关系式,使该关系式最好地逼近这些已知的空间数据,并能根据该函数关系式推求出区域范围内其它任意点或任意分区的值。这种通过已知点或分区的数据,推求任意点或分区数据的方法称为空间数据内插。对于离散空间和连续空间,空间数据内插的方法不尽相同。

离散空间具有跳跃特征(土地利用类型),重要变化发生在边界上,边界内的变化则是均匀的,同质的,即在各个方面都是相同的。常采用邻近元法,即以最相邻近图元的特征值表征未知图元的特征值。

连续空间具有渐变特征(地形表面),内插技术必须采用连续的空间渐变模型实现这些连续变化,可用一种平滑的数学表面加以描述。这类技术可分为整体拟合和局部拟合技术两大类。整体拟合技术拟合模型是由研究区域内所有采样点上的全部特征观测值建立的,通常采用的技术是整体趋势面拟合,这种内插技术一般用于模拟大范围内的变化,而不能提供内插区域的局部特性。局部拟合技术则是仅仅用邻近的数据点来估计未知点的值,而不受局部范围外其它点的影响,这类技术包括双线性多项式内插、样条函数、移动拟合法等等。

(六)边界匹配(图幅接边)

在相邻图幅的边缘部分,由于原图本身的数字化误差,使得同一实体的线段或弧段的坐标数据不能相互衔接,或是由于坐标系统、编码方式等不统一,需进行图幅数据边缘匹配处理。可分为自动处理方法和手工处理方法。自动处理方法是小心地修改空间数据库中点和矢量的坐标,以维护数据库的连续性;手工处理方法是先对准两幅图的一条边缘线,然后再小心地调整其它线段使其取得连续。

3.3 空间数据质量

【学时安排】

2学时

【目的要求】

1、掌握空间数据质量的相关概念;

2、了解空间数据质量评价;

3、理解空间数据误差及质量控制。

【重点难点】

空间数据质量控制的有关概念,空间数据精度。

【教学方法与手段】

示例式教学方法,多媒体教学手段。

一、空间数据质量的概念

1、空间数据质量

空间位置、专题特征以及时间是表达现实世界空间变化的三个基本要素。空间数据是有关空间位置、专题特征以及时间信息的符号记录。而数据质量则是空间数据在表达这三个基本要素时,所能够达到的准确性、一致性、完整性,以及它们三者之间统一性的程度。

空间数据是对现实世界中空间特征和过程的抽象表达。由于现实世界的复杂性和模糊性,以及人类认识和表达能力的局限性,这种抽象表达总是不可能完全达到真值的,而只能在一定程度上接近真值。从这种意义上讲,数据质量发生问题是不可避免的;另一方面,对空间数据的处理也会导致出现一定的质量问题;例如,在某些应用中,用户可能根据需要来对数据进行一定的删减或扩充,这对数据记录本身来说也是一种误差。

因此,空间数据质量的好坏是一个相对概念,并具有一定程度的针对性。尽管如此,我们仍可以脱离开具体的应用,从空间数据存在的客观规律性出发来对空间数据的质量进行评价和控制。

2、与数据质量相关的几个概念

(1)误差(Error):误差反映了数据与真实值或者大家公认的真值之间的差异,它是一种常用的数据准确性的表达方式。

(2)数据的准确度(Accuracy):数据的准确度被定义为结果、计算值或估计值与真实值或者大家公认的真值的接近程度。

(3)数据的精密度(Resolution):数据的精密度指数据表示的精密程度,亦即数据表示的有效位数。它表现了测量值本身的离散程度。由于精密度的实质在于它对数据准确度的影响,同时在很多情况下。它可以通过准确度而得到体现,故常把二者结合在一起称为精确度,简称精度。

(4)不确定性(Uncertainty):不确定性是关于空间过程和特征不能被准确确定的程度,是自然界各种空间现象自身固有的属性。在内容上,它是以真值为中心的一个范围,这个范围越大,数据的不确定性也就越大。

(5)空间分辨率:分辨率是空间目标可辨识的最小尺寸。如遥感影像上最小可分辨的地物目标。在一个图形扫描仪中最小的物理分辨率从理论上讲是由设施的像元大小来确定的。在一个激光打印机上这是84.67xlO-3mm,而且在高质量的激光扫描仪上,这会细化10倍。

(6)比例尺:比例尺是地图上一个记录的距离和它所表现的“真实世界的”距离之间的一个比例。地图的比例尺将决定地图上一条线的宽度所表现的地面的距离。例如,在一个

1:10000比例尺的地图上,一条O.5mm宽度的线对应着5m的地面距离。如果这是线的最小的宽度,那么就不可能表示小于5m的现象。

二、空间数据质量评价

1、空间数据质量标准

空间数据质量标准是生产、使用和评价空间数据的依据,数据质量是数据整体性能的综合体现。目前,世界上已经建立了一些数据质量标准,如美国FGDC的数据质量标准等。

空间数据质量标准的建立必须考虑空间过程和现象的认知、表达、处理、再现等全过程。空间数据质量标准要素及其内容如下:

(1)数据情况说明:要求对地理数据的来源、数据内容及其处理过程等作出准确、全面和详尽的说明。

(2)位置精度或称定位精度:为空间实体的坐标数据与实体真实位置的接近程度,常表现为空间三维坐标数据精度。它包括数学基础精度、平面精度、高程精度、接边精度、形状再现精度(形状保真度)、像元定位精度(图像分辨率)等。平面精度和高程精度又可分为相对精度和绝对精度。

(3)属性精度:指空间实体的属性值与其真值相符的程度。通常取决于地理数据的类型,且常常与位置精度有关,包括要素分类与代码的正确性、要素属性值的准确性及其名称的正确性等。

(4)时间精度:指数据的现势性。可以通过数据更新的时间和频度来表现。

(5)逻辑一致性:指地理数据关系上的可靠性,包括数据结构、数据内容(包括空间特征、专题特征和时间特征),以及拓扑性质上的内在一致性。

(6)数据完整性:指地理数据在范围、内容及结构等方面满足所有要求的完整程度,包括数据范围、空间实体类型、空间关系分类、属性特征分类等方面的完整性。

(7)表达形式的合理性:主要指数据抽象、数据表达与真实地理世界的吻合性,包括空间特征、专题特征和时间特征表达的合理性等。

2、空间数据质量的评价

空间数据质量的评价,就是用空间数据质量标准要素对数据所描述的空间、专题和时间特征进行评价。下面给出了空间数据质量评价矩阵(表3-1)。

(1)质量评价过程。空间数据的质量对数据生产者和用户来说都是一个非常重要的考虑因子,它可以使数据生产者正确描述他们的数据集符合生产规范的程序,也是用户决定数据集是否符合他们应用目的的依据。因此,探索数据质量的理论问题便成为地理空间数据标准化的重要组成部分。在元数据标准中,质量信息主要在标识信息、数据质量信息及其数据继承关系等元数据部分中出现,其所涉及的主要元素有数据集的完备性、逻辑一致性、位置精度、时间精度、专题精度等,而每一元素又有各自的子元素。由于用户需要不同层次的数据质量,有些用户需要高精度的信息,而另一些用户则有较低层次的精度便可以满足他们的需求,这祥对数据集的质量标准就有不同的评价依据。但作为质量中的几何精度评价,则通过一定的计算公式和相应的精度指标可以获得数据集的几何精度。

(2)多尺度评价依据。在质量评定过程中,一般来说,数据的精度或准确度越高越好,但在实际应用中却不能不分对象一概而论。事实上有的数据在应用中的意义很大(如地籍数据的界址点等),其本身精度也可以达到很高,因此对这些数据的精度要求也就很高;而另一些数据本身的精度不可能很高,如不同土壤类型的面积,由于它们之间的界限是模糊的,所以面积也是相对的,因此精度要求不可能很高;有的数据精度可以达到很高,但需要花费很多的人力、物力和时间,而生产上或应用上又不一定要求很高。因此,在实际应用中应根据具体需要来评定数据的质量。地球是一个复杂的系统,不少物体具有不确定性或模糊性特

征。有些物体本身就没有明确的界限,它们是逐渐过渡的,在由量变到质变过程中,难以确定其边界线;有些虽然有明确的定义,但很难操作;有些数据是动态的,甚至是瞬间的。通过上面的“冗余”精度,以避免造成精度浪费。

(3)数据的实效性与惟一性。地球系统的数据,有些具有明显的时效(时间)特征,有的则对时间的反应比较迟缓,例如土地利用图的时效性,随地区的差异在时间上有明显的变化;而相对来说,地质图、地形图则没有明显的时效性。在图形的时效性上,一般来说具有动态特征的数据,它们的时间有效性较短,相反则长。但从研究历史变化或发展过程来说,任何时间的数据集都是有用的。所以不同时效性的数据集将根据其作用的不同来确定其重要性,而这些因素在元数据体系中都应有所反应。另外,地球系统的数据有可派生数据和不可派生数据之分,而在数据集描述中应避免派生数据。如在气象和水文数据中,每天的降雨量是基本数据,或不可派生数据,而月平均降雨量都是派生的。因此,在元数据描述中,应只限于基础数据,而不应包括可派生数据。这样,便需要有专门的元素来描述数据集的这些特征,并需要对不同的计算公式等加以阐述。

(4)数据精度的测试与报告。对于用户和数据生产者来说,他们各自所关心的数据质量是有一定联系的。数据集生产者必须使所生产的数据集满足制图规范,而用户则根据数据集的质量信息确定该数据集是否满足他们的应用需求,所以数据集生产者提供的数据集信息应是用户所关心的信息。因此,在数据集报告中应包括相应的精度测试方法及其测试结果等内容。

三、误差的类型

空问数据的质量通常用误差来衡量,而误差定义为空间数据与其真值的差别。空间数据误差的来源是多方面的,例如,GIS的原始录入数据本身包含着数据采集过程中引入的源误差。另外,在原始数据录入到空间数据库以及随后的数据分析处理和结果输出过程中,每一步都会引入新误差。根据P.A.Burrough(1986)的建议,可以将GIS数据误差的来源归纳为三类,如表5-3所示。

1、源误差

GIS数据的来源主要有,直接从现场利用GPS或全站仪采集的数字数据;现有纸质地图的数字化;航空影像和遥感数字数据或统计调查数据等。这些数据受表5—3中前两类误差来源的部分或全部影响。

表3-2 空间数据误差的来源

(1) 地面测量数字数据的误差

来源于地面测量的数字数据中含有控制测量和碎部测量误差。其中控制点误差又受控制网的参考基准、网形和观测精度以及观测费用等因素的影响。碎部点误差随继承了控制点的误差外,还受自身的观测方法、观测精度和地界的人为判断,以及地物地貌的取舍等因素的影响。当然,原始观测误差受观测仪器、观测者和外界环境三种因素影响。地面测量数据中的误差可以表现为随机误差、系统误差或粗差。一般而言,粗差采用可靠性理论探测剔除,系统误差采用实验方法校正或建立系统误差模型处理,随机误差采用随机模型,如最小二乘法平差处理。利用误差传播律可求得点坐标的方差—协方差阵或误差椭圆(球)元素采表达点坐标数据的精度。

(2) 地图数字化数据的误差

目前GIS数据的主要来源之一是现有地图数字化。原因固有误差和数字化过程误差是地图数字化数据误差的主要来源。原因固有误差除含有上述地面控制测量和碎部测量的全部误差外,还含有制图误差。

①制图误差

a 、控制点展绘误差展绘控制点是成图的第一步。对于与立体测图仪相连的直角坐标展点仪而言,该项误差的均方根为0.17—0.32mm,这在地图精度要求不高时可不予考虑。

b、编绘误差地形图的编绘一般用摄影测量手段把各种原始资料化为同一比例尺的过程,其中所引入的误差大约在0.30一O.33mm之间。

c、绘图误差绘图误差是在绘图过程中产生的。误差的范围为0.06-0.18mm之间。

d、综合误差地图综合误差的大小取决于特征的类型与复杂程度,故该项误差极难量化。象曲线这类特征,其综合误差可能很大,而直线的综合误差又近似为零。当两个或两个以上的特征无法在图上适当表示时,需要人为地在地图上将特征表示符移位,使地图清晰易渎。这种移位也会引起综合误差,其大小主要取决于特征的接近程度和成图比例尺的大小。比例尺越小,移位越大,误差也越大。

e、地图复制误差地图复制误差的均方差为O.1一O.2mm。

f、分色板套合误差彩色地图是由一系列金属分色板套合生成的,每一块分色板在图上印出一种颜色。该项误差的均方差为O.17—0.30mm。

g、绘图材料的变形误差地图一般印刷于纸质载体上,随着温度和湿度的变化,纸的尺寸也会改变。如果温度不变,湿度从0%增至25%,则纸的尺寸改变1.6%。由于纸的膨胀系数和收缩系数并不相等,因此,即使湿度又降至原来大小,图纸也不可能恢复到原来尺寸。由于纸张在印刷时温度升高,纸张长度会伸长1.5%,宽度伸长2.9%,而当纸干燥或冷却后,其长度和宽度又分别收缩0.25%和0.75%。因此,印刷冷却后,图纸在长、宽方向上的净伸长分别为1.25%和2.15%,

h、归化到同一比例尺所引起的误差地图的比例尺是指真实的主比例尺。例如,对兰勃特正形投影而言,主比例尺只有沿着标准纬线时才是不变的,而标准纬线之内的比例尺变小,之外的比例尺变大。因此,在将地图数字化或者从地图量距时,必须利用适当的比例尺因子进行修正。

i、特征的定义自然界的许多特征并无明确的界限。例如,海岸线的实际位置在哪里? 森林和草地间的界线如何确定?因此,特征定义会引起特征位置的某些不确定性,但并非所有的特征都有此误差。

j、特征夸大误差为了增强图的可读性,有时需要夸大某些特征,因为它们在图上难以按其真实情况表示。例如,分界线应是无宽线、但表示在图上时,却占有一定宽度。有时根据地图的用途,需要将某些特征夸大,以区别于其它特征。如,在道路上将道路特征夸大以示醒目。特征夸大误差取决于地图的比例尺、用途和所涉及特征的类型。同样地,并非所有的特征都具有此类误差。

由于很难知道制图过程中各种误差间的关系以及图纸尺寸的不稳定性,因此,很难准确地评价原图固有误差。

②数字化误差

数字化方式主要有手工数字化和扫描数字化。目前在生产实践中多采用扫描数字化,然后屏幕半自动化跟踪。线划跟踪与扫描数字化所引起的平面误差较小,只是在扫描数字化时,要素结合处出现的误差较大。

(3)遥感数据误差

遥感数据的误差累积过程可以区分为:数据获取误差、数据处理误差、数据分析误差、数据转换误差和人工判断误差。

①数据获取误差

遥感资料获取时,存在着多种误差。其中有些误差源是可控的,例如,几何误差或辐射误差;有些则是不可控的,如气候条件和景观的自然变化。可控的数据获取误差又包括几何误差和遥感平台误差。

②数据预处理误差

数据预处理包括利用地面控制进行校正,几何校正、图像增强和分类等。这些预处理会引入各种各样的误差。例如,几何校正会引起平面位置和专题误差。位置误差取决于校正模型的逼近和校正模型参数求解时所用控制数据中的误差。专题误差来自重新抽样。分类本身就是一个引入显著误差的过程。潜在的分类误差源可能有遥感数据测量中的随机误差,类型清晰度中的模糊度,混合类型分类系统,以及不同的分类系统缺少相容性。

③数据转换误差

在矢量—栅格数据转换过程中,会出现显著误差。引起矢量数据栅格化误差的主要原因有两个:属性概括误差;拓扑匹配错误。栅格化误差的大小与下列因素有关:转换中所用的算法,格网的尺寸,栅格表达时的定向,以及地图图形的复杂性等。

④人工判读误差

在数据分析和判读阶段会引入人工判读误差。在GIS中使用遥感数据时,人工判读误差会影响随后的GIS分析结果。这种误差是主观的,因此难以量化,它与判读员从遥感影像中提取信息的能力和技能有关,还与影像的尺度和所需的概括程度有关。

2、操作误差

除了GIS原始录入数据本身带有的源误差外,空间数据在GIS的模型分析和数据处理等操作中还会引入新误差。如,由计算机字长引起的误差,拓扑分析引入的误差和叠置中引入的误差等。

(1)由计算机字长引起的误差

在计算机中,数据是由一定字长的编码数字表示的。舍入误差是由计算机字长引起的一种误差。这种误差出现在GIS的各种数值运算和模型分析过程中。由舍入误差引起的问题很多,例如GIS空间数据库中整数编码对面积和周长计算的影响,比例尺变换和旋转变换对拓扑关系的影响等。削弱舍入误差影响的方法主要有:增加字长并用带小数的实数表示数据;改变数据在计算机中的表达方式;采用合适的算法等。

除了数据处理精度外,数据存储精度也与计算机字长有关。16位的计算机在存储低分辨率的栅格图像时不会出现问题,但存储高精度的控制点坐标或点位精度要求高的地理数据时,则不能胜任。减少存储误差影响的方法有:采用双精度字长存储数据,使用有效位数多的数据记录控制点坐标;使用32位整数运算法处理数据,即把坐标数据转换成以厘米或毫米为单位的整数,然后用整数存储和运算;采用嵌套法,即先把研究区域划分成若干块,并用粗略的分辨率来定义它们,每块再以有限精度建立局部原点,以此为基准确定块中各细节的坐标。这种方法可以用单精度字长记录非控制点坐标,用双精度字长记录控制点坐标,并可将它们联接起来。嵌套可以是多级嵌套。

(2)由拓扑分析引起的误差

GIS中的拓扑分析会产生大量的误差。如矢量数据栅格化引起的拓扑匹配误差,多层叠置过程中产生的无意义多边形等。这是由于GIS中进行的大多数拓扑空间操作都隐含地假设:原始数据是均匀分布的,数字化过程没有错误;拓扑网络的叠置仅仅是网络多边形边界相交和重新构成网络问题;边界线能明确定义和描绘;所有的算法都假定为完全确定的操作;对某类型或其它自然因素所确定的分类区间是最合适的。

(3)数据分类和内插引起的误差

GIS空间数据库中数据的许多不规则性是由所使用的分类方法和从点数据到面数据的内插方法引起的,即它们作为GIS中的一种操作会引入许多误差。

以上讨论了GIS空间数据库中原始录用数据本身含有的源误差和随后空间操作中引入的新误差。一般来说,源误差远大于操作误差,因此,要想控制GIS产品的质量,良好的原始录用数据是首要的。

四、空间数据质量的控制

数据质量控制是个复杂的过程,要控制数据质量应从数据质量产生和扩散的所有过程和环节入手,分别用一定的方法减少误差。空间数据质量控制常见的方法有:

1、传统的手工方法质量控制的人工方法主要是将数字化数据与数据源进行比较,图形部分的检查包括目视方法、绘制到透明图上与原图叠加比较,属性部分的检查采用与原属性逐个对比或其它比较方法。’

2、元数据方法数据集的元数据中包涵了大量的有关数据质量的信息,通过它可以检查数据质量,同时元数据也记录了数据处理过程中质量的变化,通过跟踪元数据可以了解数据质量的状况和变化。

3、地理相关法用空间数据的地理特征要素自身的相关性来分析数据的质量。例如,从地表自然特征的空间分布着手分析,山区河流应位于微地形的最低点,因此,叠加河流和等高线两层数据时,若河流的位置不在等高线的外凸连线上,则说明两层数据中必有一层数据有质量问题,如不能确定哪层数据有问题时,可以通过将他们分别与其它质量可靠的数据层叠加来进一步分析。因此,可以建立一个有关地理特征要素相关关系的知识库,以备各空间数据层之间地理特征要素的相关分析之用。

数据质量控制应体现在数据生产和处理的各个环节。下面以地图数字化生成地图数据过程为例,说明数据质量控制的方法。数字化过程的质量控制,主要包括数据预处理、数字化设备的选用、对点精度、数字化误差和数据精度检查等项内容。

1、数据预处理工作主要包括对原始地图、表格等的整理、誊清或清绘。对于质量不高的数据源,如散乱的文档和图面不清晰的地图,通过预处理工作不但可减少数字化误差,还可提高数字化工作的效率。对于扫描数字化的原始图形或图像,还可采用分版扫描的方法,来减少矢量化误差。

2、数字化设备的选用主要根据手扶数字化仪、扫描仪等设备的分辨率和精度等有关参数进行挑选,这些参数应不低于设计的数据精度要求。一般要求数字化仪的分辨率达到0.025mm,精度达到O.2mm;扫描仪的分辨率则不低于0.083mm。

3、数字化对点精度(准确性) 是数字化时数据采集点与原始点重合的程度。一般要求数字化对点误差应小于O.1mm。

4、数字化限差限差的最大值分别规定如下:采点密度(O.2mm)、接边误差(0.02mm)、接合距离(0.02mm)、悬挂距离(0.007mm)、细化距离(O.O07mm)和纹理距离(0.01mm)。

接边误差控制,通常当相邻图幅对应要素间距离小于0.3mm时,可移动其中一个要素以使两者接合;当这一距离在0.3mm与0.6mm之间时,两要素各自移动一半距离;若距离大于0.6mm,则按一般制图原则接边,并作记录。

5、数据的精度检查主要检查输出图与原始图之间的点位误差。一般要求,对直线地物和独立地物,这一误差应小于0.2mm;对曲线地物和水系,这一误差应小于0.3mm;对边界模糊的要素应小于0.5mm。

空间数据的采集与处理工作,是建立GIS的重要环节,了解GIS数字化数据的质量与不确定性特征,最大限度地纠正所产生的数据误差,对保证GIS分析应用的有效性具有重要意义。

3.4 空间数据的元数据

【学时安排】

2学时

【目的要求】

1、理解空加数据元数据的有关概念;

2、理解空间数据元数据的应用。

【教学方法与手段】

示例式教学方法,多媒体教学手段。

一、元数据的概念

Metadata可译成元数据,是描述数据的数据。在地理空间数据中,元数据说明数据内容、质量、状况和其他有关特征的背景信息。它应尽可能多地反映数据集自身的特征规律,以便于用户对数据集的准确、高效与充分的开发与利用,不同领域的数据库,其元数据的内容会有很大差异。通过元数据可以检索、访问数据库,可以有效利用计算机的系统资源,可以对数据进行加工处理和二次开发等。

随着计算机技术和GIS技术发展,特别是网络通信技术的发展,空间数据共享日益普遍。管理和访问大型数据集的复杂性正成为数据生产者和用户面临的突出问题。数据生产者需要有效的数据管理和维护办法;用户需要找到更快、更加全面和有效的方法,以便发现、访问、获取和使用现势性强、精度高、易管理和易访问的空间数据。在这种情况下,空间数据的内容、质量、状况等元素数据信息变得更加重要,成为信息资源有效管理和应用的重要手段。地理信息元数据标准和操作工具已经成为国家空间数据基础设施的一个重要组成部

分。

到目前为止,一般关于元数据认识的共同点是:元数据的目的就是促进数据集的高效利用,并为计算机辅助软件工程服务。元数据的主要内容包括:

(1)对数据集的描述,对数据集中各数据项、数据来源、数据所有者及数据序代(数据生产历史)等的说明;

(2)对数据质量的描述,如数据精度、数据的逻辑一致性、数据完整性、分辨率、元数据的比例尺等;

(3)对数据处理信息的说明,如量纲的转换等;

(4)对数据转换方法的描述;

(5)对数据库的更新、集成等的说明。

在地理信息系统应用中,元数据的主要作用可以归纳为如下几个方面:

(1)帮助数据生产单位有效地管理和维护空间数据,建立数据文档,并保证即使其主要工作人员离退时,也不会失去对数据情况的了解;

(2)提供有关数据生产单位数据存储、数据分类、数据内容、数据质量、数据交换网络及数据销售等方面的信息,便于用户查询检索空间数据:

(3)帮助用户了解数据,以便就数据是否能满足其需求做出正确的判断;

(4)提供有关信息,以便于用户处理和转换有用的数据。

可见,元数据是使数据充分发挥作用的重要条件之一,它可以用于许多方面,包括数据文档建立、数据发布、数据浏览、数据转换等,对于促进数据的管理、使用和共享也均有重要的作用。

二、元数据的类型

元数据分类研究的目的在于充分了解和更好地使用元数据。分类的原则不同,元数据的分类体系和内容将会有很大的差异。

1、根据元数据描述对象分类

(1)数据层元数据。指描述数据集中每个数据的元数据,内容包括日期、位置、量纲、注释、误差标识、缩略标识、存在问题标识、数据处理过程等。

(2)属性元数据。是关于属性数据的元数据,内容包括为表达数据及其含义所建的数据字典、数据处理规则(协议),如采样说明、数据传输线路及代数编码等。

(3)实体元数据。是描述整个数据集的元数据,内容包括数据集区域采样原则、数据库的有效期、数据时间跨度等。

2、根据元数据在系统中的作用分类

(1)系统级别元数据。指用于实现文件系统特征或管理文件系统中数据的信息,如访问数据的时间、数据的大小、在存储级别中的当前位置、如何存储数据块以保证服务控制质量等。

(2)应用层元数据。指有助于用户查找、评估、访问和管理数据等与数据用户有关的信息,如

文本文件内容的摘要信息、图形快照、描述与其他数据文件相关关系的信息。它往往用于高层次的数据管理,用户通过它可以快速获取合适的数据。

3、根据元数据的作用分类

(1)说明元数据。是为用户使用数据服务的元数据。它一般用自然语言表达,如元数据覆盖的空间范围、元数据图的投影方式及比例尺的大小、数据集说明文件等,这类元数据多为描述性信息,侧重于数据库的说明。

(2)控制元数据。是用于计算机操作流程控制的元数据,这类元数据由一定的关键词和

特定的句法来实现。其内容包括数据存储的检索文件、检索中与目标匹配的方法、目标的检索和显示、分析查询结果排列显示、根据用户要求修改数据库中原有的内部顺序、数据转换方法、空间数据和属性数据的集成、根据索引项把数据绘制成图、数据模型的建设和利用等。这类元数据主要是与数据库操作有关的方法。

空间数据元数据中所用到的概念:

·空间数据(Geospatial data):用于确定具有自然特征或者人工建筑特征的地理实体的地理位置、属性及其边界的信息;

·类型(Type) 在元数据标准中,数据类型指该数据能接收的值的类型;

·对象(Object) 对地理实体的部分或整体的数字表达;

·实体类型(Entity type) 对于具有相似地理特征的地理实体集合的定义和描述;

·点(Point) 用于位置确定的零维地理对象;

·结点(Node) 拓扑连接两个或多个链或环的一维对象;

·标识点(Label point) 显示地图或图表时用于特征标识的参考点;

·线(Line) 一维对象的一般术语;

·线段(Line segment) 两个点之间的直线段;

·线(String) 由相互连接的一系列线段组成的没有分支线段的序列,线可以自身或与其它线相切;

·弧(Arc) 由数学表达式确定的点集组成的弧状曲线;

·链(Link) 两个结点之间的拓扑关联;

·链环(Chain) 非相切线段或由结点区分的弧段构成的有方向无分支序列;

·环(Ring) 封闭状不相切链环或弧段序列;

·多边形(Polygon) 在二维平面中由封闭弧段包围的区域;

·外多边形(Universe Polygon) 数据覆盖区域内最外则的多边形,其面积是其它所有多边形的面积之和;

·内部区域(Interior area) 不包括其边界的区域;

·格网(Grid) 组成一规则或近似规则的棋盘状镶嵌表面的格网集合,或者组成一规则或近似规则的棋盘状镶嵌表面的点集合;

·格网单元(Grid cell) 表示格网最小可分要素的二维对象

·矢量(Vector) 有方向线的组合;

·栅格(Raster) 同一格网或数字影像的一个或多个叠加层;

·像元(Pixel) 二维图形要素,它是数字影象最小要素;

·栅格对象(Raster object) 一个或多个影象或格网,每一个影象或格网表示一个数据层,各层之间相应的格网单元或像元一致且相互套准;

·图形(Graph) 与预定义的限制规则一致的0维(如Node点)、一维(Link或Chain)和二维(T多边形)有拓扑相关的对象集;

·数据层(Layer) 集成到一起的面域分布空间数据集,它用于表示一个主体中的实体,或者有一公共属性或属性值的空间对象的联合(Association);

·层(Stratum) 在有序系统中数据层、级别或梯度序列;

·纬度(Latitude) 在中央经线上度量,以角度单位度量离开赤道的距离;

·经度(Longitude) 经线面到格林尼治中央经线面的角度距离;

·中央经线(Meridian) 穿过地球两极的地球的大圆圈;

·坐标(Ordinate) 在笛卡儿坐标系中沿平行于X轴和y轴测量的坐标值;

·投影(Projection) 将地球球面坐标中的空间特征(集)转化到平面坐标体系时使用的数学转化方法。

·投影参数(Projection Parameters) 对数据集进行投影操作时用于控制投影误差、变形实际分布的参考特征。

·地图(Map) 空间现象的空间表征,通常以平面图形表示;

·现象(Phenomenon) 事实、发生的事件、状态等;

·分辨率(Resolution) 由涉及到或使用的测量工具或分析方法能区分开的两个独立测量或计算的值的最小差异;

·质量(Quality) 数据符合一定使用要求的基本或独特的性质;

·详述(Explicit) 由一对数或三个数分别直接描述水平位置和三维位置的方法;

·介质(Media) 用于记录、存贮或传递数据的物理设备。

三、空间数据元数据的标准

空间数据是一种结构比较复杂的数据类型。它涉及对于空间特征的描述,也涉及对于属性特征及其他们之间关系的描述,所以空间数据元数据标准的建立是项复杂的工作;只有建立起规范的空间数据元数据才能有效利用空间数据。目前,针对空间数据元数据,已经形成了一些区域性的或部门性的标准。

四、空间数据元数据的获取与管理

1、空间数据元数据的获取

空间数据元数据的获取是一个较复杂的过程,相对于基础数据的形成时间,它的获取可分为三个阶段:数据收集前、数据收集中和数据收集后。对于模型元数据,这三个阶段分别是模型形成前、模型形成中和模型形成后。第一阶段的元数据是根据要建设的数据库的内容面设计的元数据,内容包括:普通元数据、专题性元数据;第二阶段的元数据随数据的形成同步产生出三阶段的元数据,是在上述数据收集到以后,根据需要产生的,包括数据处理过程描述、数据利用情况、数据质量评估、浏览文件的形成、拓扑关系、影像数据的指标体系及指标、数据集大小、数据存放路径等。

空间数据元数据的获取方法主要有五种:键盘输入、关联表、测量法、计算法和推理法。键盘输入一般工作量大且易出错;关联表方法是通过公共项(字段)从已存在的元数据或数据中获取有关的元数据;测量法容易使用且出错较少,如用全球定位系统测量数据空间点的位置等;计算法指由其他元数据或数据计算得到的元数据,如水平位置可由仪器设置及时间计算得到;推理法指根据数据的特征获取元数据。在元数据获取的不同阶段,使用的方法也有差异。在第一阶段主要是键入方法和关联表方法;第二阶段主要采用测量方法;第三阶段主要是计算和推理方法。

2、空间数据元数据的管理

空间数据元数据的理论和方法涉及数据库和元数据两方面。由于元数据的内容、形式的差异,元数据的管理与数据涉及的领域有关,它是通过建立在不同数据领域基础上的元数据信息系统实现的。在元数据管理信息系统中,物理层存放数据和元数据,该层由一些软件通过一定的逻辑关系与逻辑层关联起来。在概念层中用描述语言及模型定义了许多概念,如实体名称、别名等。通过这些概念及其限制特征,经过与逻辑层关联可获取、更新物理层的元数据及数据。

五、空间数据元数据的应用

1、为什么在地理信息系统中使用元数据

在地理信息系统中使用元数据的原因如下:

(1)完整性(Completeness)

面向对象的地理信息系统和空间数据库的目标之一,是把事物的有关数据都表示为类的形式,而这些类也包括类自身,即复杂的“类的类”结构。这就要求有支持类与类之间相互印证和操作的机制,而元数据可以帮助这个机制的实现。

(2)可扩展性(Extensibility)

有意地延伸一种计算机语言或者数据库特征的语义是很有用途的,如把跟踪或引擎信息的生成结果添加到操作请求中,通过动态改变元数据信息可以实现这种功能。

(3)特殊化(Specialization)

继承机制是靠动态连接操作请求和操作体来实现的,语言及数据库以结构化和语义信息的关联文件(Context)方式把操作请求传递给操作体,而这些信息可以通过元数据表达。

(4)安全性(Safety)

分类完好的语言和数据库都支持动态类型检测,类的信息表示为元数据,这样在系统运行时,可以被类检测者访问。

(5)查错功能(Debugging)

在查错时使用元数据信息,有助于检测可运行应用系统的解释和修改状态。

(5)浏览功能(Browsing)

为数据的控制类开发浏览器时,为显示数据,要求能解译数据的结构,而这些信息是以元数据来表达的。

(6)程序生成(Program generation)

如果允许访问元数据,则可以利用关于结构的信息自动生成程序。如,数据库查询的优化处理和远程过程调用残体(Stub)生成。

2、空间数据元数据的应用

(1)帮助用户获取数据

通过元数据,用户可对空间数据库进行浏览、检索和研究等。一个完整的地学数据库除应提供空间数据和属性数据外,还应提供丰富的引导信息,以及由纯数据得到的分析、综述和索引等。通过这些信息用户可以明白诸如:“这些数据是什么数据?”,“这个数据库对我有用吗?”,“这是我需要的数据吗?”,“怎样得到这些数据?”等一系列问题。

(2)空间数据质量控制

不论是统计数据还是空间数据都存在数据精度问题,影响空间数据精度的原因主要有两个方面:一是源数据的精度,一是数据加工处理工程中精度质量的控制情况。空间数据质量控制内容包括:①有准确定义的数据字典,以说明数据的组成,各部分的名称,表征的内容等;②保证数据逻辑科学地集成,如植被数据库中不同亚类的区域组合成大类区,这要求数据按一定逻辑关系有效的组合;③有足够的说明数据来源、数据的加工处理工程、数据释译的信息。

这些要求可通过元数据来实现,这类元数据的获取往往由地学和计算机领域的工作者来完成。数据逻辑关系在数据中的表达要由地学工作者来设计,空间数据库的编码要求要有一定的地学基础,数据质量的控制和提高要有数据输入、数据查错、数据处理专业背景知识的工作人员,而数据再生产要由计算机基础较好的人员来实现。所有这方面的元数据,按一定的组织结构集成到数据库中构成数据库的元数据信息系统来实现上述功能。

(3)在数据集成中的应用

数据集层次的元数据记录了数据格式、空间坐标体系、数据的表达形式、数据类型等信息;系统层次和应用层次的元数据则记录了数据使用软硬件环境、数据使用规范、数据标准等信息。这些信息在数据集成的一系列处理中,如数据空间匹配、属性一致化处理、数据在各平台之间的转换使用等是必需的。这些信息能够使系统有效地控制系统中的数据流。

(4)数据存贮和功能实现

元数据系统用于数据库的管理,可以避免数据的重复存贮,通过元数据建立的逻辑数据索引可以高效查询检索分布式数据库中任何物理存贮的数据。减少用户查寻数据库及获取数据的时间,从而降低数据库的费用。数据库的建设和管理费用是数据库整体性能的反映,通过元数据可以实现数据库设计和系统资源利用方面开支的合理分配,数据库许多功能(如数据库检索、数据转换、数据分析等)的实现是靠系统资源的开发来实现的,因而这类元数据的开发和利用将大大增强数据库的功能并降低数据库的建设费用。

数据采集与处理技术

数据采集与处理技术 参考书目: 1.数据采集与处理技术马明建周长城西安交通大学出版社 2.数据采集技术沈兰荪中国科学技术大学出版社 3.高速数据采集系统的原理与应用沈兰荪人民邮电出版社 第一章绪论 数据采集技术(Data Acquisition)是信息科学的一个重要分支,它研究信息数据的采集、存贮、处理以及控制等作业。在智能仪器、信号处理以及工业自动控制等领域,都存在着数据的测量与控制问题。将外部世界存在的温度、压力、流量、位移以及角度等模拟量(Analog Signal)转换为数字信号(Digital Signal), 在收集到计算机并进一步予以显示、处理、传输与记录这一过程,即称为“数据采集”。相应的系统即为数据采集系统(Data Acquisition System,简称DAS)数据采集技术以在雷达、通信、水声、遥感、地质勘探、震动工程、无损检测、语声处理、智能仪器、工业自动控制以及生物医学工程等领域有着广泛的应用。 1.1 数据采集的意义和任务 数据采集是指将温度、压力、流量、位移等模拟量采集、转换为数字量后,再由计算机进行存储、处理、显示或打印的过程。相应的系统称为数据采集系统。 数据采集系统的任务:采集传感器输出的模拟信号并转换成计算机能识别的数字信号,然后送入计算机,根据不同的需要由计算机进行相应的计算和处理,得出所需的数据。与此同时,将计算得到的数据进行显示或打印,以便实现对某些物理量的监视,其中一部分数据还将被生产过程中的计算机控制系统用来控制某些物理量。 数据采集系统的好坏,主要取决于精度和速度。 1.2 数据采集系统的基本功能 1.数据采集:采样周期

基于LabVIEW的数据采集与处理系统设计

基于LabVIEW的数据采集与处理系统设计 摘要:虚拟仪器作为一种基于图形化编程的新型概念仪器,以计算机作为运行媒介,节省了大量的显示、控制硬件,越来越显示出它独有的优势。基于LabVIEW的数据采集与处理系统,整体采用了循环结构与顺序结构相结合的形式,实现了模拟信号的采集与实时动态显示,并且仿真出了对数据的采集和报警功能,并且能够存储数据,进行各种自定义设置,显示效果良好,对现实中的数据采集与处理系统具有很大的借鉴作用。 关键词:虚拟仪器;数据采集;数据处理;LabVIEW

The Design of Data Acquisition and Processing System Based on LabVIEW Abstract:As a kind of virtual instrument based on graphical programming the new concept of instruments, run at the computer as a medium, save a large amount of display, control hardware, more and more shows its unique advantages. Data acquisition and processing system based on LabVIEW, and the overall adopted loop structure and order structure, in the form of the combination of the dynamic analog signal acquisition and real-time display, and the simulation of the data collection and alarm function, and the ability to store data, for a variety of Settings, display effect is good, the reality of the data acquisition and processing system has a great reference. Keywords:Virtual Instrument;Data Collection;Data Processing;LabVIEW;

第三章 空间数据采集与处理练习..

一、单选题 1、对于离散空间最佳的内插方法 是: A.整体内插法 B.局部内插法 C.移动拟合法 D.邻近元法 2、下列能进行地图数字化的设备 是: A.打印机 B.手扶跟踪数字化仪 C.主 机 D.硬盘 3、有关数据处理的叙述错误的 是: A.数据处理是实现空间数据有序化的必要过程 B.数据处理是检验数据质量的关键环节 C.数据处理是实现数据共享的关键步骤 D.数据处理是对地图数字化前的预处理 4、邻近元法 是: A.离散空间数据内插的方法 B.连续空间内插的方法 C.生成DEM的一种方法 D.生成DTM的一种方法 5、一般用于模拟大范围内变化的内插技术是: A.邻近元法 B.整体拟合技术 C.局部拟合技术 D.移动拟合法 6、在地理数据采集中,手工方式主要是用于录入: A.属性数据 B.地图数据 C.影象数 据 D.DTM数据

7、要保证GIS中数据的现势性必须实时进行: A.数据编辑 B.数据变换 C.数据更 新 D.数据匹配 8、下列属于地图投影变换方法的 是: A.正解变换 B.平移变换 C.空间变 换 D.旋转变换 9、以信息损失为代价换取空间数据容量的压缩方法是: A.压缩软件 B.消冗处理 C.特征点筛选 法 D.压缩编码技术 10、表达现实世界空间变化的三个基本要素是。 A. 空间位置、专题特征、时间 B. 空间位置、专题特征、属性 C. 空间特点、变化趋势、属性 D. 空间特点、变化趋势、时间 11、以下哪种不属于数据采集的方式: A. 手工方式 B.扫描方式 C.投影方 式 D.数据通讯方式 12、以下不属于地图投影变换方法的是: A. 正解变换 B.平移变换 C.数值变 换 D.反解变换 13、以下不属于按照空间数据元数据描述对象分类的是: A. 实体元数据 B.属性元数据 C.数据层元数据 D. 应用层元数据 14、以下按照空间数据元数据的作用分类的是: A. 实体元数据 B.属性元数据 C. 说明元数据 D. 分类元数据 15、以下不属于遥感数据误差的是: A. 数字化误差 B.数据预处理误差 C. 数据转换误差 D. 人工判读误差

数据采集与处理讲解

1数据的采集与处理 1.1数据的采集 施工监控中需对影响施工及控制精度的数据进行收集,主要包括环境参数和结构参数,前者又主要是指风速风向数据;后者主要指结构容重、弹模等数据。施工监控需进行收集的数据如表1-1所示。 1.1.2数据采集方法 基于港珠澳大桥特殊的地理位置,采用远程数据采集系统,与传统的数据采集系统相比,具有不受地理环境、气候、时间的影响等优势。而借助无线传输手段的远程数据采集系统,更具有工程造价和人力资源成本低,传输数据不受地域的影响,可靠性高,免维护等优点。远程无线数据采集系统的整体结构如图1-2所示。 1-2 远程无线数据采集系统组成结构图

1.2数据的处理与评估 在数据分析之前, 数据处理要能有效地从监测数据中寻找出异常值, 必须对监测数据进行可靠性检验, 剔除粗差的影响, 以保证监测数据的准确、可靠。我们拟采用的是最常用的μ检验法来判别系统误差; 用“3σ准则”剔除粗差; 采用了“五点二次中心平滑”法对观测数据进行平滑修正。同时, 在数据处理之后, 采用关联分析技术寻找某一测点的最佳关联点, (为保证系统评判的可靠性, 某一测点的关联点宜选用2 个以上)。我们选用3 个关联测点, 如果异常测值的关联测点有2 个以上发生异常, 且异常方向一致, 则认为测值异常是由结构变化引起, 否则, 认为异常是由监测系统异常引起。出现异常时, 经过判定, 自动提醒用户检查监测系统或者相应的结构(根据测点所在位置), 及时查明情况, 并采取一些必要的应急措施, 同时对测值做标注, 形成报表, 进行评估。 1.2.1系统误差的判别 判别原则: 异常值检验方法是建立在随机样本观测值遵从正态分布和小概率原理的基础之上的。根据观测值的正态分布特征性, 出现大偏差观测值的概率是很小的。当测值较少时, 在正常情况下, 根据小概率原理, 它们是不会出现的, 一旦出现则表明有异常值。依统计学原理: 偏差处于2 倍标准差或3 倍标准差范围内的数据为正常值, 之外的则判定为异常。事实上标准差σ多数情况下是求知的, 通常用样本值计算的标准差S 来替代。桥梁健康监测资料的数据量特别大, 一般都为大样本, 所以我们用μ检验。在分析中, 我们将所得的数据分成两组Y1 、Y2,并设()1211,1Y N u δ, ()2222,2Y N u δ择统计量为 : 'y y U -= (1) 式中12y y 、—两组样本的平均值: 21n 、n —两组样本的子样数: 21S S 、 —两组样本的方差。若 '2 a U U ≥ (2) 则存在系统误差。否则, 不存在系统误差。 1.2.2 粗差点的剔除 在观测次数充分多的前提下, 其测值的跳动特征描述如下式: ()112j j j j d y y y +-=-+ (3) 式中j y (j=1,2,3,4,……,n- 1)是一系列观测值。

数据采集和处理技术试题(卷)

一、绪论 (一)、1、“数据采集”是指什么? 将温度、压力、流量、位移等模拟量经测量转换电路输出电量后再采集转换成数字量后,再由PC 机进行存储、处理、显示或打印的过程。 2、数据采集系统的组成? 由数据输入通道,数据存储与管理,数据处理,数据输出及显示这五个部分组成。 3、数据采集系统性能的好坏的参数? 取决于它的精度和速度。 4、数据采集系统具有的功能是什么? (1)、数据采集,(2)、信号调理,(3)、二次数据计算,(4)、屏幕显示,(5)、数据存储,(6)、打印输出,(7)、人机联系。 5、数据处理系统的分类? 分为预处理和二次处理两种;即为实时(在线)处理和事后(脱机)处理。 6、集散式控制系统的典型的三级结构? 一种是一般的微型计算机数据采集系统,一种是直接数字控制型计算机数据采集系统,还有一种是集散型数据采集系统。 7、控制网络与数据网络的结合的优点? 实现信号的远程传送与异地远程自动控制。 (二)、问答题: 1、数据采集的任务是什么? 数据采集系统的任务:就是传感器输出信号转换为数字信号,送入工业控制机机处理,得出所需的数据。同时显示、储存或打印,以便实现对某些物理量的监视,还将被生产过程中的PC机控制系统用来控制某些物理量。 2、微型计算机数据采集系统的特点是 (1)、系统结构简单;(2)、微型计算机对环境要求不高;(3)、微型计算机的价格低廉,降低了数据采集系统的成本;(4)、微型计算机数据采集系统可作为集散型数据采集系统的一个基本组成部分;(5)、微型计算机的各种I/O模板及软件齐全,易构成系统,便于使用和维修; 3、简述数据采集系统的基本结构形式,并比较其特点? (1)、一般微型计算机数据采集与处理系统是由传感器、模拟多路开关、程控放大器、采样/保持器、A/D转换器、计算机及外设等部分组成。 (2)、直接数字控制型数据采集与处理系统(DDC)是既可对生产过程中的各个参数进行巡回检测,还可根据检测结果,按照一定的算法,计算出执行器应该的状态(继电器的通断、阀门的位置、电机的转速等),完成自动控制的任务。系统的I/O通道除了AI和DI外,还有模拟量输出(AO)通道和开关量输出(FDO)通道。 (3)、集散式控制系统也称为分布式控制系统,总体思想是分散控制,集中管理,即用几台计算机分别控制若干个回路,再用监督控制计算机进行集中管理。 (三)、分析题: 1、如图所示,分析集散型数据采集与处理系统的组成原理,系统有那些特点? 集散式控制系统也称为分布式控制系统,总体思想是分散控制,集中管理,即用几台DDC计算机分

GNSS数据采集与处理技术设计书

************大学 GNSS数据采集与处理 技术设计书 课程名称 专业 班级 组员姓名 任课教师

目录 1 基本概况 (2) 2 主要任务 (2) 3 作业依据 (2) 4 使用的仪器及物品 (2) 5 已有起始资料情况 (3) 6 坐标系统 (3) 7 GPS控制网的布设 (3) 7.1 GPS网图形设计及设计原则 (3) 7.1.1 GPS网图形设计原则 (4) 7.1.2 GPS网图形设计 (3) 7.2 GPS网的密度设计 (4) 7.3 GPS控制网的选点 (4) 7.4 埋石 (5) 8 制定观测计划 (5) 9 静态外业观测 (6) 9.1 外业基本要求 (6) 9.2 外业观测记录要求 (6) 9.3 静态数据传输与备份 (7) 10 静态数据处理 (7) 10.1 静态数据处理任务 (7) 10.2 数据处理的具体事项 (7) 10.2.1 基线解算及其质量检验 (7) 10.2.2 GPS网平差 (9) 11 提交的成果 (9) 附录 (11)

GNSS数据采集与处理 技术设计书 1 基本概况 *******大学北校区位于****省****市******新城,校园地势整体平坦,校内绿化面积较大,校园环境优美,周末时间人流量较少。 2 主要任务 进行GPS外业静态测量,并进行数据处理,建立二级GPS控制网。 3 作业依据 a.《全球定位系统GPS测量规范》GB/T 18314-2009; b.《工程测量规范》GB 50026-2007; c.《全球定位系统城市测量技术规程》CJJ73-2010; d.《测绘成果质量检查与验收》GB/T 24356-2009。 4 使用的仪器及物品 表1 仪器及物品列表

数据采集与处理描述

数据处理地一般过程 数据处理一般包括收集数据、、和分析数据等过程.数据处理可以帮助我们更好地了解周围世界,对未知事物作出合理地推断和预测.文档来自于网络搜索 全面调查和是收集数据地两种方式,全面调查通过调查来收集数据,抽样调查通过调查来收集数据.文档来自于网络搜索 实际调查中常采用抽样调查地方法获取数据.用样本估计是统计地基本思想. 抽样调查具有花费少、省时地特点,还适用一些不宜使用全面调查地情况.采用抽样调查需要注意:①样本容量要适中,一般为总体地~;②抽取时要尽量使每一个个体都有相等地机会被抽到.这样抽取地样本才具有代表性和广泛性.才能使样本较好地反映总体地情况.文档来自于网络搜索 要考察地全体对象称为,组成总体地每一个考察对象称为,被抽取地那些个体组成一个,样本中个体地数目称为.文档来自于网络搜索 利用统计图表描述数据是统计分析地重要环节.四种统计图地各自特点: ()条形统计图:能清楚地表示出每个项目地具体数目; ()扇形统计图:能清楚地表示出各部分在全体中所占地百分比; ()折线统计图:能清楚地反映事物地变化情况; ()直方图:能清楚地表示出每组频数地大小. 扇形统计图表明地是部分在总体中所占地百分比,一般不能直接从图中得到具体数量,用圆代表地是总体,圆地大小与具体数量大小没有关系. 扇形圆心角该部分百分比×°文档来自于网络搜索 画扇形统计图地步骤:先调查收集数据,根据数据计算百分比,圆心角,画出扇形,标出百分比. 画直方图地一般步骤:⑴计算最大值与最小值地差⑵决定组距和组数⑶列频数分布表⑷画频数分布直方图(或频数折线图).文档来自于网络搜索 注意对以下概念地理解: ⑴组距:把所有数据分成若干组,每个小组地两个端点之间地距离(组内数据地取值范围)称为组距.⑵频数:对落在各个小组内地数据进行累计,得到各个小组内数据地个数叫做频数.⑶频数分布直方图⑷频数折线图文档来自于网络搜索 频数分布直方图是以小长方形地来反映数据落在各个小组内地频数地大小.小长方形地高是频数与地比值.在等距分组时,各小长方表地面积(频数)与高地比是常数(组距).文档来自于网络搜索 熟悉以下各题: 调查收集数据地方式通常有和两种.当总体中个体数目较少时用地方式获得数据较好,当总体中个体数目较多时用地方式获得数据较好.但关于电视机寿命、火柴质量等具有破坏性地调查不宜采用,国家人口普查采用.文档来自于网络搜索

数据采集与处理系统毕业设计论文[2

、 第一章概述 1数据采集和数据处理 数据采集是指从传感器和其它待测设备等模拟和数字被测单元中自动采集信息的过程。数据采集系统是结合基于计算机的测量软硬件产品来实现灵活的、用户自定义的测量系统。比如条码机、扫描仪等都是数据采集工具 数据处理系统是指运用计算机处理信息而构成的系统。其主要功能是将输入的数据信息进行加工、整理,计算各种分析指标,变为易于被人们所接受的信息形式,并将处理后的信息进行有序贮存,随时通过外部设备输给信息使用者。

2系统研究开发的价值和意义 经调查,目前数据采集器的市场需求量大,以数据采集器为核心构成的小系统应用广泛,因此开发高性能的数据采集器具有良好的市场前景。随着计算机技术的飞速发展和普及,数据采集系统在多个领域有着广泛的应用。数据采集是工、农业控制系统中至关重要的一环,在医药、化工、食品、等领域的生产过程中,往往需要随时检测各生产环节的温度、湿度、流量及压力等参数。同时,还要对某一检测点任意参数能够进行随机查寻,将其在某一时间段内检测得到的数据经过转换提取出来,以便进行比较,做出决策,调整控制方案,提高产品的合格率,产生良好的经济效益。随着工、农业的发展,多路数据采集势必将得到越来越多的应用,为适应这一趋势,作这方面的研究就显得十分重要。在科学研究中,运用数据采集系统可获得大量的动态信息,也是获取科学数据和生成知识的重要手段之一。本文以实验室数据采集、工业现场数据采集、野外数据采集为主要方向,设计一款结构简单、操作方便、高性价比、具有显示、记录存储功能的数据采集系统。单片机构成的数据采集处理系统适用于各种现场自动化监测及控制,能够适应油田野外恶劣环境,;具有性能稳定、可靠性高、响应速度快操作简单、费用低廉、等优点。回放过程的信号可以直观的观察。它与有线数传相比主要有布线成本低、安装简便、便于移动的优点 3.课题的意义及发展状况 数据采集是指将温度、压力、流量、位移等模拟量采集转换成数字量后,再由计算机进行存储、处理、显示或打印的过程。相应的系统称为数据采集系统。从严格意义上说,数据采集系统应该是用计算机控制的多路数据自动检测或巡回检测,并且能够对数据实行存储、处理、分析计算,以及从检测的数据中提取可用的信息,供显示、记录、打印或描绘的系统。总之,不论在哪个应用领域中,数据的采集与处理越及时,工作效率就越高,取得的经济效益就越大。数据采集领域正在发生着重要的变化。首先,分布式控制应用场合中的智能数据采集系统正在发展。其次,总线兼容型数据采集插件的数量正在增大,与个人计算机兼客的数据采集系统的数量也在增加。数据处理对数据(包括数值的和非数值的)进行分析和加工的技术过程。包括对各种原始数据的分析、整理、计算、编辑等的加工和处理。比数据分析含义广。随着计算机的日益普及,在计算机应

数据采集与处理

第三章:模拟多路开关 1.作用:将多路被测信号分别传送到A/D 转换器进行转换。 类型:机电式用于大电流、低速切换;电子式:用于小电流、高速切换。 (1)双极型晶体管开关电路如图: 工作原理:设选择第1路模拟信号。 则令通道控制信号U C1= 0,晶体管T1′截止集电极为高电平,晶体管T1导通,输入信号电压U i1被选 中。 优点:开关切换速度快,导通电阻小,可两个方向传送信号。 缺点:为分立元件,需专门的电平转换电路驱动,使用不方便。 (2)结型场效应晶体管开关 工作原理:则令通道控制信号U C1=1,则开关控制管T1′导通,集电极为低电平,场效应管T 1导通,U O =U i1。 当U C1 =0时, T1′截止,T 1也截止,第1路输入信号被切断。 优点:开关切换速度快,导通电阻小,可两个方向传送 信号。 缺点:为分立元件,需专门的电平转换电路驱动,使用不方便。 (3)绝缘栅场效应管开关 优点:开关切换速度快,导通电阻小,且随信号电压 变化波动小;易于和驱动电路集成。 缺点:衬底要有保护电压。 (5)集成电路开关 工作原理:设选择第1路输入信号,则计算机输出一个4位二进制码,把计数器置成0001状态,经四 — 十六线译码器后,第1根线输出高电平,场 效应管T 1导通, U O = U i1 ,选中第1路信号。如果要连续选通第1路到第3路的信号,可以在计数器 加入计数脉冲,每加入一次脉冲,计数器加1,状 态依次变为 0001,0010,0011。 2. 多路开关的主要指标:导通电阻;开关接通电流、开关断开时的泄漏电流、开关断开时,开关对地电容、开关断开时,输出端对地电容。 3. 多路开关集成芯片 AD7510,芯片中无译码器,四个通道开关都有各自的控制端每一个开关可

基于80C51单片机的通用数据采集与处理系统

———————————————— 收稿日期:2007-08-12 作者简介:陈延奎(1971-),四川渠县人,主要研究方向为仪器仪表技术。 基于80C51单片机的通用数据采集与处理系统 陈延奎 (达州职业技术学院,四川 达州 635000) 摘要:数据采集是单片机应用系统中最为普遍的应用需求,数据采集的对象可以是温度、压力、流量等连续变化的模拟量,也可以是代表某些状态特性的开关量等脉冲信号。数据采集和处理系统可以是复杂控制系统的一部分,也可以是配备显示(或打印)输出的独立系统(或仪表)。介绍了一种基于80C51单片机的通用数据采集与处理系统,其模拟输入通道由传感器、多路开关、放大器、采样保持器和A/D 转换器五部分组成。 关键词:80C51;数据采集与处理;模拟输入通道;系统功能;硬件电路;流程图 中图分类号:TP274+.2 文献标识码:A 文章编号:1006-0316(2008)04-0049-04 General data acquisition and processing system based on 80C51 microcontroller CHEN Yan-kui (Dazhou Vocational Technical College ,Dazhou 635000,China) Abstract :Data acquisition is the most common application needs of microcontroller, the data acquisition object may be the simulation quantity such as temperature, pressure, current capacity and so on which change continuously, also may be represents some certain condition characteristic such as switch quantity signal impulses and so on. The data acquisition and the processing system may be a plurality of controls system's part, may also be provides the independent system which the demonstration (either printing) outputs (or measuring appliance). Introduce a conventional data gathering and processing system based on 80C51 microcontroller, its analog input channel is composed by the sensor, the multi-channel switches, the amplifier, the sampling retainer and the A/D switch. Key words :80C51;data acquisition and processing ;analog input channels ;system functions ;hardware circuits ;flowchart 单片机通用数据采集和处理系统是单片机应用领域中使用最多的一类系统。它主要是实时采集外界诸如温度、压力、流量和转速等连续变化的模拟量,通过模/数转换器把这些模拟信号转换成数字信号送入单片机;也可以直接采集代表某些状态特性的开关量,单片机系统对这些采集信号进行数据处理,并根据用户的要求,将处理后的数据送显示、打印,也可通过串行口送给其它计算机,或者通过数/模转换器变换成模拟信号控制外部设备,输出的开关量也可直接用于控制目的。 1 模拟输入通道的组成 模拟输入通道的一般构成如图1所示,主要由传感器、多路开关、放大器、采样保持器和A/D 转换器五部分组成。 图1 模拟输入通道的一般构成 (1)传感器 传感器把被测物理量(如温度、压力等)作为输入参数,转换为电量(电流、电压、电阻等)输出。物理量性质和测量范围不同,传感器的工作机理和结构就不同。通常传感器输出的电信号是模拟信号(已有许多新型传感器采用数字量输出)。当信号的数值符合A/D 转换器的输入等级时,可以不用

数据采集与处理技术

数据采集与处理技术——EPA工业总线 一、引言 炼油企业常减压蒸馏装置因其加工量大、产品品种多、分离精度高以及对下游生产装置影响面广等特点,在炼油企业占据核心地位。常减压蒸馏装置技术水平的高低,对炼厂的产品质量、收率以及对原油的有效利用有很大影响。其中居于装置核心地位的控制系统的可靠安全运行,是常减压蒸馏装置“安稳长满优”运行的必要保证。 随着国产控制系统技术水平和性能不断提升,其先进性与国外系统日益接近,越来越多的大型炼油装置尝试使用国产控制系统。其中中海石油大榭石化实际加工能力800万吨/年常减压蒸馏装置,采用中控的WebField ECS-100控制系统一次开车成功。目前系统运行正常,各项指标满足工艺要求,装置生产平稳,实现了炼油行业大型主装置上国产控制系统的成功应用。 二、系统典型设计方案 (一)装置构成 早在2003年,大榭石化的一期200万吨/年常减压蒸馏装置就采用中控JX-300X DCS顺利投运,系统一直稳定运行至今。此次新上二期项目包括800万吨/年常减压蒸馏装置、30万吨原油罐区、20万吨燃料油罐区、3万吨码头、循环水污水处理场、储运码头等工段,除两期常减压蒸馏主装置系统机柜和操作在主控室外,其它工段与主控室相距500米到3000米之间。 项目要求一二期系统要无缝连接,所有工段最终在一套控制系统中运行,实现统一的监控和操作。 基于工艺要求,整个装置共2436个I/O信号点和700个通讯数据点。系统配置如下: 控制站7个,通讯站8个,及相应的安全栅、接线端子、继电器等。所有控制卡、数据转发卡、电源、网络、交换机、光纤、直流电源、控制I/O卡件等关键部件均采用冗余配置; 上位机部分配置2台工程师站(含一期一台),12台操作员站(含一期3台),1台OPC服务器,1台辅助操作台; 各个工段之间采用冗余单模光纤连接。 具体系统配置简图见图1:

数据采集与处理系统的设计说明

附件1: 学号: 课程设计 题目数据采集及处理系统的设计 学院自动化学院 专业自动化 班级 姓名 指导教师 2015 年月日

课程设计任务书 学生:专业班级:自动化1205班 指导教师:道远工作单位:自动化学院 题目: 数据采集及处理系统的设计 初始条件: 设计一个64路巡回数据采集及处理系统,系统循环周期为1秒,16路模拟信号输入,16路开关信号输入,16路模拟输出,16路数字输出,模拟信号采用数字滤波去掉干扰信号,数字信号采用光耦隔离,将采集数据循环显示在LED或LCD上。 要求完成的主要任务: 1.输入通道及输出通道设计(0~20MV输入),(0~10V输出)2.每周期各通道采样10次; 3.采用各种(三种)数字滤波算法并比较结果; 4.软件流程及各程序模块设计并用仿真软件演示; 5.完成符合要求的设计说明书。 时间安排: 2015年7月1日~2015年7月8日 指导教师签名:年月日 系主任(或责任教师)签名:年月日

摘要 数据采集(DAQ),是指从传感器和其它待测设备等模拟和数字被测单元中自动采非电量或者电量信号,送到上位机中进行分析,处理。数据采集系统是结合基于计算机或者其他专用测试平台的测量软硬件产品来实现灵活的、用户自定义的测量系统。数据采集和处理是计算机控制系统的重要组成部分,在工业控制机和生产过程之间,要对生产过程进行实时控制,就要实时的了解生产状态,这就要求采集大量的模拟信号或数字信号进行分析,并输出有一定意义的、更直观和易于理解的模拟量或数字量,以对控制进行指导,调整控制方案。 针对目前实时存盘采集系统存在体积大、设计复杂、成本较高等不足之处,本课题设计了一种基于高速串行总线和数字信号处理器的多路数据采集系统,具有成本较低、集成度较高等特点,同时具有一定数字处理能力。 关键词:数据采集和处理,A/D转换,D/A转换,采样保持

《数据采集与处理技术》马明建试卷试题

《数据采集技术与处理》试题 一、填空题(一个空1分,总共25分) 1、数据采集系统性能的好坏,主要取决于它的和。 2、目前数据采集系统的结构形式主要有两种:一种是数 据采集系统;另一种是数据采集系统。 3、连续的模拟信号转换成离散的数字信号,经历两个断续的过程: 断续和断续。 4、模拟信号的采样控制方式有:、、。 5、 A/D转换器有两种量化方法:和。 6、电子多路开关根据其结构可分 为、、和三种类型。 7、减小模拟多路开关漏电流引起的输出误差电压的改进方法 是。 8、模拟多路开关的配置有两种方式:和。 9、采样/保持器具有两个稳定的工作状态:和。 10、A/D转换器位数的确定,应该从数据采集系统的 以及两个方面进行考虑。 11、D/A转换器的基本组成可分为四个部 分:、、 、。 二、选择题(一题4分,总共20分) 1、假设量化单位用q表示,如果采用“只舍不入”的量化方法,最 大量化误差为() A. 0 B. C. q D.

2、假设量化单位用q表示,如果采用“有舍有入”的量化方法,量 化误差的标准差为() A. 2 q 2 B. 2 q 12 3、量化噪声的峰-峰值等于() A. 0 B. C. q D. 4、对于4位偏移二进制码,负满量程值FSR 用下列哪个代码表示() A. “0000” B. “0001” C.“1000” D. “1111” 5、孔径时间影响A/D转换的什么参数() A. 分辨率 B. 转换精度 C.偏移误差 D. 线性误差 三、判断题(一题3分,总共15分) 1、与反馈型采样/保持器相比,串联型采样/保持器结构简单、跟 踪速度较高,但精度偏低。 () 2、量化噪声的变化频率取决于量化单位q和模拟信号x(t)的变化情 况,q越大,x(t)变化越快,则量化噪声的频率越高。 () 3、符号-数值码的优点是信号在零附近变动1LSB时,数值码只有最 低位改变,但缺点是会产生严重的瞬态响应。 () 4、当信号源的信噪比比较小时,模拟多路开关必须采用双端接法。 () 5、逐次逼近比较式A/D转换器虽然不能消除尖峰噪声干扰的影响, 但是可以消除周期性噪声干扰的影响。

数据采集与处理

一.填空: 1.采集模拟量,转化成数字量,由计算机进行存储、处理、打印的过程称为 数据采集 。 2.按处理方式的不同,数据处理可分为 实时(在线)处理 和 事后(脱机)处理 两种类型。 3.按处理性质的不同,数据处理可分为 预处理 和 二次处理 两种类型。 4.评价数据采集系统性能优劣的标准有 采样精库 和 采样速度 。 5.模拟信号数字化包括 采样 、 量化 和 编码 三个过程。 6.采样时,若采样的点数过多,会导致占用大量的计算机 内存 。 7.为了保证采样信号不失真,采样频率不能低于模拟信号最高频率的 两 倍。 8.采样过程可以看作为 脉冲 调制过程。 9.当采样脉冲序列是方波脉冲时,采样称为 自然采样 。 10.当采样脉冲序列是冲激序列时,采样称为 冲激采样 。 11.采样信号频谱是模拟信号频谱的 无穷多 次搬移。 12.采样定理在 c f s T 12 时是不适用的。 13.奈奎斯特频率是指采样频率的最 小 值。 14.奈奎斯特间隔是指采样周期的最 大 值。 15.当采样频率不满足采样定理时,会发生 频混 现象,造成失真。 16.对于频域衰减较快的信号,可以用 提高采样频率 的方法解决频混的问题。 17.对于频域衰减较慢的信号,可以用 削除频混滤波器 的方法解决频混的问题。 18.采样技术分为常规采样、 间歇采样 、 变频采样 和 下采样 四种。 19.采样控制方式分为 无条件采样 、中断方式、 查询方式 和 DMA 方式 四种

20.A/D 转换器的量化方法可分为“只舍不入”和 “有舍有入” 两种。 21.量阶等于常数的量化方法称为 均匀量化 。 22.量阶不等于常数的量化方法称为 非均匀量化 。 23.“只舍不入”量化时,量化误差只能是 正 误差,可以取q ~0之间的任意值。 24.“有舍有入”量化时,量化误差可以取2 ~2q q 之间的任意值。 25.A/D 转换器的位数越多,量化误差越 小 。 26.十进制数327对应的BCD 码是 001100100111 。 27.自然二进制代码10111010对应的格雷码是 11100111 。 28.格雷码11001010对应的自然二进制码是 10001100 。 29.自然二进制码01100111对应的折叠码是 10011000 。 二.单项选择 1.连续的模拟信号转换成离散的数字信号,需要经过几个断续过程( A )。 A)2 B)3 C)4 D)1 2.模拟信号数字化时,不需要的环节是( C )。 A)采样 B)量化 C)检波 D)编码 3. 采样时,若s T 取的过大,将会发生模拟信号中高频成分被叠加到低频成分上的现象,称为( C )。 A)失真 B)误码 C)频混 D)失调 4. 采样时,若采样过程不连续进行,而是时断时续,这种采样方法称为( B )。 A)常规采样 B)间歇采样 C)平顶采样 D)冲激采样 5. 下列四种采样技术中,需要存储容量最大的是( A )。 A)常规采样 B)间歇采样 C)变频采样 D)下采样

第三章 空间数据采集与处理练习

第三章空间数据采集与处理 着重看加粗题目 名词解释 1、数据压缩 2、空间数据的内插 3、空间数据处理 4、误差 5、空间数据 6、类型 7、对象 8、点 9、结点 10、线段11、线 12、弧 13、链 14、多边形 15、格网16、矢量17、栅格18、象元19、栅格对象20、数据精度 简答题 1、基于图像数据的矢量化方法从栅格数据向矢量数据转换的步骤有哪些? 2、从技术角度看,地理信息系统常用的数据采集方法包括哪些? 3、为什么在地理信息系统中使用元数据?元数据有哪些应用? 4、元数据的作用有哪些? 5、元数据的获取分为哪几个阶段?获取方法有哪些? 6、空间数据源的种类有哪些? 7、空间数据的一般性错误有哪些?主要有哪些检查方法? 8、空间数据质量标准要素及其内容如何? 第三章空间数据采集与处理 名词解释 1、所谓数据压缩,指从所取得的某个数据集合S中抽出一个子集A,这个子集作为一个新的信息源,在规定的精度范围内最好地逼近原集合,而又取得尽可能大的压缩比。 2、空间数据的内插可以作如下简单的描述:设已知一组空间数据,它们可以是离散点的形式,也可以是分区数据的形式,现在要从这些数据中找到一个函数关系式,使该关系式最好地逼近这些已知的空间数据,并能根据该函数关系式推求出区域范围内其他任意点或任意分区的值。这种通过已知点或分区的数据,推求任意点或分区数据的方法就称为空间数据的内插。

3、空间数据处理:对采集的各种数据,按照不同的方式方法对数据进行编辑运算,清除数据冗余,弥补数据缺失,形成符合用户要求的数据文件格式。 4、误差误差反映了数据与真实值或者大家公认的真值之间的差异,它是一种常用的数据准确性的表达方式。 5、空间数据:用于确定具有自然特征或者人工建筑特征的地理实体的地理位置、属性及其边界的信息。 6、类型:在元数据标准中,数据类型指该数据能接收的值的类型。 7、对象:对地理实体的部分或整体的数字表达。 8、点:用于位置确定的零维地理对象。 9、结点:拓扑连接两个或多个链或环的一维对象。 10、线段:两个点之间的直线段。 11、线:由相互连接的一系列线段组成的没有分支线段的序列,线可以自身或与其它线相切。 12、弧:由数学表达式确定的点集组成的弧状曲线。 13、链:两个结点之间的拓扑关联。 14、多边形:在二维平面中由封闭弧段包围的区域。 15、格网:组成一规则或近似规则的棋盘状镶嵌表面的格网集合,或者组成一规则或近似规则的棋盘状镶嵌表面的点集合。 16、矢量:有方向线的组合。 17、栅格:同一格网或数字影像的一个或多个叠加层。 18、象元:二维图形要素,它是数字影象最小要素。 19、栅格对象:一个或多个影象或格网,每一个影象或格网表示一个数据层,各层之间相应的格网单元或像元一致且相互套准。 20、数据精度:数据的准确度与精确度的总称。数据的准确度是指结果、计算值或估计值与真实值或者大家公认的真值的接近程度。数据的精密度指数据表示的精密程度,亦即数据表示的有效位数。

数据采集与处理

数据采集与传输系统 摘要 该数据采集与传输系统以89C51及89C2051为核心,由数据采集模块、调制解调模块、模拟信道、测试码发生器、噪声模拟器、结果显示模块等构成。在本方案中仅使用通用元器件就较好的实现了题目要求的各项指标。其中调制解调模块、噪声模拟器分别采用单片机和可编程逻辑器件实现。本数据采集与传输系统既可对8路数据进行轮检,也可设置为对一路数据单独监控。本系统硬件设计应用了EDA 工具,软件设计采用了模块化的编程方法。传输码元速率为16kHz~48kHz的二进制数据流。另外,还使用了“1”:“01”、“0”:“10”的Manchester编码方法使数据流的数据位减少,从而提高传输速率。

一、方案设计与论证 首先,我们分析一下信道与信噪比情况。本题中码元传输速率为16k波特,而信号被限定在30k~50kHz的范围内,属于典型的窄带高速率数字通信。而信噪比情况相对较好。这是因为信号带宽仅为20kHz,而噪声近似为0~43kHz(145% )的窄带白噪声,这样即 Ts 使在信号和噪声幅度比值为1:1的情况下,带内的噪声功率仍然比较小,所以系统具有较高的信噪比。 方案一: 常用的数字调制系统有:ASK、FSK、PSK等。其中FSK具有较强的抗干扰能力,但其要求的的带宽最宽,频带利用率最低,所以首先排除。ASK理论上虽然可行,但在本题目中,由于一个码元内只包括约两个周期的载波,所以采用包络检波法难以解调,也不可行。另外,对于本题目,还可以考虑采用基带编码的方法进行传输,如HDB3码,但这种编码方法其抗干扰能力较差,因此也不太适合。 方案二: PSK调制方式具有较强的抗干扰能力,同时其调制带宽相对也比

数据采集与处理技术试卷.docx

一、绪论 (一) 、1、“数据采集”是指什么? 将温度、压力、流量、位移等模拟量经测量转换电路输出电量后再采集转换成数字量后,再由 PC 机进行存储乜理F 示或打印的过程。 2、 数据采集系统的组成? 由数据输入通道,数据存储与管理,数据处理,数据输出及显示这五个部分组成。 3、 数据采集系统性能的好坏的参数? — 取决于它的精度和速度。 4、 数据采集系统具有的功能是什么? (1)、数据采集,(2)、信号调理,(3)、二次数据计算,(4)、屏幕显示,(5)、数据存储,(6)、 打印输出,(7)、人机联系。 5、 数据处理系统的分类? 分为预处理和二次处理两种;即为实时(在线)处理和事后(脱机)处理。 6、 集散式控制系统的典型的三级结构 一种是一般的微型计算机数据采集系统, 一种是直接数字控制型计算机数据采集系统, 还有一种是 集散型数据采集系统。 7、 控制网络与数据网络的结合的优点? 实现信号的远程传送与异地远程自动控制。 (二) 、问答题: 1、 数据采集的任务是什么? 数据采集系统的任务:就是传感器输出信号转换为数字信号, 送入工业控制机机处理,得出所需的 数据。同时显示、储存或打印,以便实现对某些物理量的监视,还将被生产过程中的 PC 机控制系 统用来控制某些物理量。 2、 微型计算机数据采集系统的特点是 (1)、系统结构简单;(2)、微型计算机对环境要求不高;(3)、微型计算机的价格低廉,降低了数 据采集系统的成本;(4)、微型计算机数据采集系统可作为集散型数据采集系统的一个基本组成部 分;(5)、微型计算机的各种I/O 模板及软件齐全,易构成系统,便于使用和维修; 3、简述数据采集系统的基本结构形式,并比较其特点? (1) 、一般微型计算机数据采集与处理系统是由传感器、模拟多路开关、程控放大器、采样 /保持 器、A/D 转换器、计算机及外设等部分组成。 (2) 、直接数字控制型数据采集与处理系统 (DDC 是既可对生产过程中的各个参数进行巡回检测, 还可根据检测结果,按照一定的算法,计算出执行器应该的状态(继电器的通断、阀门的位置、电 机的转速等),完成自动控制的任务。系统的I/O 通道除了 AI 和DI 夕卜,还有模拟量输出(AO 通 道和开关量输出(FDO 通道。 (3) 、集散式控制系统也称为分布式控制系统,总体思想是分散控制, 集中管理,即用几台计算机 分别控制若干个回路,再用监督控制计算机进行集中管理。 (三) 、分析题: 1、如图所示,分析集散型数据采集与处理系统的组成原理,系统有那些特点? 集散式控制系统也称为分布式控制系统, 总体思想是分散控制,集中管理,即用几台DDC 计算机分 打印机 十T 擦口卜十IMP1???幵关 I I 1 y ∣≠?打机构甘 =

数据采集与处理

数据采集与处理 实验指导书 山东理工大学 二00二年十一月

实验一数据采集系统认识实验 一、实验目的 熟悉数据采集系统的组成、工作过程,熟悉不同传感器的使用,增加感性认识,为后面的课堂教学打下基础。 二、实验仪器 自动控制温室中的温度传感器、湿度传感器、CO2传感器、风向风速传感器、计算机、A/D板卡、8255板卡、电气控制柜。 三、实验步骤 1. 在温、湿度传感器的安装处,介绍温、湿度传感器的工作原理、模拟信号的传送和计算机数据采集过程和方法,讲解数据处理的方法。 2. 在CO2传感器的安装处,介绍CO2传感器的类型、红外式CO2传感器的工作原理和特点。 3. 在风向风速传感器的安装处,介绍风向数字信号并行传送的原理、数据采集方法和处理,介绍风速(转速)脉冲信号的采集和处理方法。 4. 在电气控制柜处,介绍温室电气控制的工作原理和工作过程。 5. 在计算机处,运行温室环境测控程序,介绍数据采集程序的工作过程,介绍编程技术的最新发展趋势和方法。 四、作业 1. 数据采集系统的任务是什么? 2. 数据采集系统由哪几部分组成? 3. 模拟信号是如何采集到计算机? 4. 并行数字信号如何采集到计算机? 5. 转速脉冲信号如何采集到计算机?

实验二模拟信号的数据采集实验 一、实验目的 让同学在计算机上输入自编的程序,并调试程序,使同学掌握模拟信号的采集方法,掌握相应数据采集程序的编程方法。 二、实验仪器 万用表、信号接口箱、温度传感器。 计算机、A/D板卡、31 2 三、实验步骤 1. 用万用表检查温度传感器输出信号的电压值。 2. 将温度信号接入接口箱。 3. 用并行信号线分别与接口箱和计算机上的A/D卡相连接。 4. 接通计算机、温度传感器电源。 5. 进入Quick BASIC语言环境。 6. 由每组同学将自编的程序(题目见作业)输入计算机,并调试运行程序、输出运行结果。 四、作业 题目:用PC-6319板卡采集温室的温度数据。 对象:温度传感器 要求: ⑴每隔10s钟采集一次温度数据。 ⑵ A/D板卡采用双极性方式工作。 ⑶用0通道采集模拟信号。 ⑷A/D转换结果要做标度变换。 ⑸每个采样点上连续采集10个数据,然后作数字滤波处理。 ⑹在计算机上显示出温度值。 五、思考题 1. 什么是数据采集板卡? 2. 现有一BASIC语句中为“U=(H*256+L)*10 / 4096”,试说明该语句完成什么任务?语句中的“H*256+L”部分起到什么作用?为什么要有“H*256”? 3. 什么是标度变换?为什么要进行标度变换?

相关主题
文本预览
相关文档 最新文档