当前位置:文档之家› 元数据的概念

元数据的概念

元数据的概念
元数据的概念

元数据的概念

元数据(Metadata),即关于数据的数据,是对数据和信息资源进行描述的信息。通常认为,元数据是为了更为有效地管理和使用数据而对它进行说明的信息。所以元数据与其描述的数据内容有着密切联系,不同领域的数据的元数据在内容

上差异很大。地理空间数据的元数据是地理空间的空间数据和属性数据以外的描述地理信息空间数据集的内容、质量、状态和其它特性的一类数据,它是实现地理空间信息共享的核心标准之一。其中,对空间数据某一特征的描述,称为一个空间元数据元素。空间元数据是一个由若干复杂或简单的元数据项组成的集合。它与非空间元数据的主要区别在于其内容中包含大量与空间位置有关的描述性信息。

研究元数据的作用和意义

元数据可用来帮助数据提供者和数据使用者解决数据转换、沟通和理解的问题。归纳起来,元数据主要有下列几个方面的作用:

1)、用来组织、管理和维护空间数据,建立数据文档,并保证即使其主要工作人员退休或调离时,也不会失去对数据情况的了解

2)、提供数据存储、数据分类、数据内容、数据质量及数据分发等方面的信息,帮助数据使用者查询检索所需地理空间数据

3)、用来建立空间信息的数据目录和数据交换中心,提供通过网络对数据进行查询检索的方法或途径,以及与数据交换和传输有关的辅助信息

4)、通过空间元数据,人们可以接受并理解空间信息,帮助数据使用者了解数据,

以便就数据是否能满足其需求作出正确的判断并与自己的空间信息集成在一起,进行不同方面的科学分析和决策。

元数据是使数据充分发挥作用的重要条件之一。它可以用于许多方面,包括数据文档建立、数据发布、数据浏览、数据转换等。元数据对于促进数据的管理、使用和共享均有重要的作用。元数据对于建立空间数据交换网络是十分重要的,往往网络中心通过设在中心的元数据库可以实时地连接各个分发数据的分节点元数据库,帮助潜在的用户找到其特定应用所需要的数据,实现数据共享。

一个完整的元数据系统通常包括三部分,即元数据标准、元数据管理工具和元数据库。不同的元数据库可能采用不同的管理工具,唯一能够在不同数据管理软件间交换元数据的途径是统一元数据标准,只有在统一的标准前提下,才能跨越操作系统平台和数据库软件平台进行数据的互操作,实现数据共享。

DIF 元数据标准

在地球科学(包括地圈、水圈、气圈、生命圈、卫星遥感科学)、空间科学和天文学领域,国际目录网络的目录交换格式是事实上的国际数据目录标准,并在上述科学领域获得了广泛的应用。

一条完整的DIF记录包含了详细描述数据的各项信息字段。不过其中只有8个

必选字段,完成这8个字段就可以在网上发布该数据(集),其它的可选字段扩展并进一步阐述数据信息,可以在以后逐步添加和更新。DIF的字段中有些是任意文本域,而另外一些则是有值域限制的,比如空间范围、时间限制等。因为包含了那些必需的信息,通过对一个DIF记录的查看,用户可以决定该数据集是否对自己有用。

一条格式书写的数据目录共包含了三十多个数据目录元数(或者称为字段),按照性质分为必选、条件必选和可选三类,另外有些字段可以重复,比如数据集引用、参数、作者、联系电话等。标准采用组结构,每组内容包括相关的各种内容,组可以嵌套。

ISO 元数据标准

目前ISO/T211正开展个国际标准项目的研制工作,每个项目都是以一些比较成熟的国家标准、地区性标准为基础。该委员会下分五个工作组如图,分别从事框架和参考模型、地理空间数据模型和算法、地理空间数据管理、地理空间服务以及专用标准等方面的研究。

在ISO/T211中,元数据的内容标准由两大部分组成,一部分是标准化部分,它是用户必须遵循的标准;另一部分是信息化部分,它用于通过提供示例等方法来帮助

指导用户,以便更好地理解标准。同时为了使标准能够满足不同应用需求,把标准内容又分为目录信息和标准部分两层,其中目录信息用于从宏观上获取元数据信息,而标准部分则是元数据的详细信息,以全面地描述地理数据集的内容。ISO/T211元数据标准的目的是提供一个描述地理空间数据集的过程,以便用户能够查询和访问地理空间数据,并可以判断确定所拥有的数据集的适用性。具体来说就是通过建立一个元数据术语、定义及扩展的公用集合,使地理数据的管理、检索和使用更加方便有效,为那些不熟悉地理空间数据的人们提供他们所需的地理数据信息。

ISO/T211元数据标准规定元数据的内容项分为三种类型必须型、条件型、可选型。元数据内容采用逐行方式表达,并且给出了元数据制作、管理规范。元数据标准的内容分为14类,每一类中又包括若干子类或具体元数据项,整个ISO/FDIS 19115一共有409个具体的元数据项。下表列出该标准中较高层次的元数据内容:

CSDGM元数据模型

CSDGM的实现是通过制定一个描述地理空间数据及其相应含义的集合。主要包括数据元素、复合元素。以及它们的定义以及数据元索提供值域的信息,用以描述数字地理空间数据集的元数据信息内容.数据元素被定义为数据一个逻辑上的原始项,一个数据元素的条目包括数据元素的命名、定义、缩略名和值域的描述信息而复合元素则是一组数据元素和其他复合元素的集合。复合元素只能代表

更高层次的概念抽象,而不能代表一个具体的数据元素。表一列出了元数据模型中的七个元数据主要子集以及其标识和内容描述。

CSDGM在数据质量信息子集中定义了数据志的标准,数据志被定义为关于构建数据

集的事件、参数和数据源信息和责任方信息

现有的国内外元数据标准体系与比较

目前研究元数据标准的研究机构正在层出不穷地发展,它们所制定的元数据标准既有许多共同之处,又因行业自身特点而有其特殊的指标。

现以ISO/TC211元数据标准为基础,从元数据的层次结构、元数据分级、元数据性质、元数据特征、元数据内容、元数据扩展六个方面来比较现有国内外元数据标准,并探讨其各自的优势和不足,见下表。

由上表比较可以看出,尽管各元数据标准因各自行业特色而有所不同,但基本上都包括以下几方面

在元数据性质上,都提供必选、一定条件下必选和可选三种性质。

在元数据内容上,都有以下几方面

1)标识信息唯一标识一个数据集,说明标题名称、其地理空间和时间范围、状况、法律限制和保密限定所需的信息,是数据集的基本信息

2)空间数据组织信息包含与数据集中表示空间信息所用方法有关的信息,如数据结构及描述空间位置的方法和目标数目等

3)空间参考信息:包含元数据的现势性及其负责单位信息

4)实体及属性信息:包含数据集的内容及数据集中要素的类型、功能、属性等信息

5)数据质量信息包含数据集质量的评价

6)发行信息:包含有关获取该信息所需的数据发行者及买卖权限的信息。

1、数据格式多样化和语义的差异化,导致数据之间的交互能力差;

2、数据存储的形态多样化和分散的特点,增加了统的数据共享与体化集成的难度;

3、数据应用需求的多样性增加了应用集成的难度。

样品采集:站位,取样时间,经度坐标,纬度坐标,取样方式,样品特征重力:站位、经度坐标,纬度坐标,高程,观测日期,布格重力异常,均衡重力异常、中间层密度公式。

磁力:站位,经度坐标,纬度坐标,高程,观测日期,观测值,日变,正常

场,异常场。

地震:站位,经度坐标,纬度坐标,震源深度,震级,震中距

在DIF中,下述六个字段是必需的:登录目录标识、登录目录名称、参数、原始数据中心、数据中心(包括名称、数据集标识、联系人等)及数据概要等。为使信息更加明晰,并尽可能与FGDC的元数据标准一致,增加了一些字段,如传感器名称、地点、数据分辨率、计划、质量、访问和使用限制、分发、多媒体样本等。新增加的字段有助于用户更好的决定数据集的可用程度。

DIF字段中一部分是文本字段,其他字段则使用有效值。尽管DIF增加了

若干字段,以求与FGDC的元数据内容标准一致。但是,它仍然局限于数据字典范畴,重点从数据存储的角度说明数据,缺乏数据分发、数据使用等方面的信息。

ISO/TC 211的元数据标准草案

该标准以FGDC等现有标准为基础,按照国际标准化组织制定的标准导则要求制定。其工作范围是:定义说明地理信息和服务所需要的信息。它提供有关数字地理数据标识、覆盖范围、质量、空间和时间模式、空间参照系统和发行等信息。该标准适用于数据集编目、数据交换网络,以及数据集的详尽说明。适用于地理数据集、数据集系列、地理要素和属性。它定义:必选和一定条件下必选的元数据实体和元素──提供元数据应用、数据发现、决定数据对于应用的适合程度、数据访问、数据转换和数据应用所需要的最少的核心内容;可选的元数据元素──如果需要,对地理数据的更加详细的标准说明;为适应特殊需要对元数据进行扩展的方法。

尽管该标准是用于数字数据的,它的原则也能扩展用于许多其他形式的地理资料,如地图、图表、文本文件等。

该标准的正文内容包括:工作范围、一致性、引用标准、术语和定义、符

号 (和缩写词)、元数据要求等。附录包括:A. 元数据特征、B. 元数据模型、

C. 元数据扩展和专用标准(Profile)、

D. 元数据的ISO标准相互参照、

E. 元数据扩展方法、

F. 元数据实施、

G. 元数据的等级、

H. 实施示例、J. 参考文献。标准确定了两级元数据,即:一级元数据-—编目信息:包含数据集编目所需的最少的元数据内容。二级元数据,它包含八个子集和三个可重复的实体。八个子集是:标识信息。包含唯一标识一个数据集、说明其空间和时间范围、状况、法律限制和保密限定所需的信息;时间质量信息。包含数据集质量的一般评价;数据志信息。包含有关数据集应用、数据源,以及生产数据集时所用的工艺方法;空间数据表示信息。包含与数据集中表示空间信息所用方法有关的信息;参照系统信息。包含数据集中应用的空间和时间参照系统说明;要素分类信息。包含数据集中具有的要素类型、要素功能、要素属性和要素关系的定义和说明;发行信息。包含有关获取信息所需的数据发行者及买卖权限的信息;元数据参考信息。包含元数据现势性及其负责单位信息。三个可重复的实体不是独立的元数据子集,它们不单独使用,而总是作为一个单元插在前述某一个子集中,且仅作为该子集的实体和元素。这三个可重复的实体是:引用文献信息实体。提供引用文献的标准格式;负责单位信息实体。包含与数据集有关的单位和/或个人的标识;地址信息实体。提供与数据集有关的单位和/或个人的地址及其他通信办法。

1)南极物理海洋和海洋气象数据库

●海洋气象

——气压、风速、风向、气温、湿度、总云量、低云量、能见度等

●海洋水文

——海水温度、海水盐度、流速、流向、水位、湍混合系数、水色、透明度、波高、波向、波周期等

●海冰(雪)

——海冰及其表层雪的物理特性、冰型、冰量、海冰面积、海冰(雪)厚度、海冰覆盖率、海冰密集度、冰表面特征、冰状、冰块水平尺度、冰漂流方向和速度、冰温、海冰盐度等。

●海-冰-气相互作用要素

——海-气边界层参数(风速、温度、湿度、长波辐射、短波辐射、海-气界面热量与动量交换、潜热、感热通量等)、海冰冰芯化学与海冰生物、海冰区与气候相关的反照率和物质平衡要素等。

2)南极重点海域海底底质数据库

●悬浮体

●冰筏体

●底质

●沉积物类型

●矿物分布

●元素分布

●微生物古体分布

●悬浮体分布

●工程地质

●表生矿产资源

●古环境演化

3)南极海洋地球物理数据库

●历史资料

——重力异常、磁力异常、综合地球物理剖面、构造区划等

●多波束测探

●单道地震

●浅剖

●重力勘测

●磁力勘测

4)南极海洋化学与碳通量数据库

●海水化学要素

——常规要素(温度、盐度、溶解氧、pH、悬浮物),有机生源要素(溶解有机碳、溶解有机氮、颗粒有机碳和颗粒有机氮),营养盐(总氮、总磷、溶解态氮、溶解态磷、硝酸盐、亚硝酸盐、铵盐、活性磷酸盐、活性硅酸盐等)。

●沉积化学要素

——氧化还原环境(Eh、硫化物、pH),有机要素(有机碳、有机氮等),营养元素(总氮、总磷、生物硅等),沉积物成分等。

●海洋大气化学要素

——气溶胶,MSA,气体(二氧化碳、甲烷气、二氧化硫、氮氧化物、碳黑等),营养盐(碳、氮、磷、铁、钠、钙、镁等)等要素。

●物质垂直输运考察

——沉积物捕获器颗粒物分析、Th同位素等。

●其它重要微量生源元素

——Fe、F等

●水体环境考察

——油类,重金属(铜、铅、锌、铬、镉、汞、砷等)。

●大气环境

——重金属污染(铜、铅、锌、汞、铬、铝、钒等)。

●沉积污染物

——油类,重金属污染(铜、铅、锌、铬、镉、汞、砷等),持久性污染有机物(POPs)等。

●生物体残毒

——石油类,重金属(铜、铅、锌、铬、镉、汞、砷等),持久性污染有机物(POPs)等

●CO2

——大气CO2、水体pCO2、溶解无机碳、碱度等。

●氟里昂

——大气和海水中氟里昂

●历史资料

5)南极海洋生物多样性与生态数据库

●生物多样性

●生境类型

●菌株资源信息

●遗传信息

●极地微生物天然产物

●海洋微生物信息

●浮游生物

6)南极磷虾等资源数据库

●磷虾分布

●七星柔鱼分布

●其它生物资源分布

●中心渔场分布

7)南极周边海域矿产资源数据库

●油气资源

●天然气水合物

●固体矿产资源

●历史资料

8)南极大陆站基生物生态环境本底数据库

●生态系统本底数据

——近岸海洋生态系统考察(浮游和底栖生物丰度、群落结构与空间分布)、潮间带生态系统考察(软体动物、甲壳类、大型藻类)、

陆地生态系统(苔藓、地衣、藻类组成与空间分布)、陆地微生物考察(南极陆基环境微生物的多样性分布)、淡水湖泊生态系统(浮游生物群落结构)、鸟类和哺乳动物(飞鸟、企鹅、海豹种类组成、数量与空间分布)

●环境本底数据

——大气(阴、阳离子,污染物)、海洋(温、盐、营养盐、叶绿素、污染物)、淡水湖泊(温、盐、营养盐、叶绿素、污染物)、陆地(温度、酸碱度、污染物)

●人类活动考察数据

——考察内容、考察区域、参与人数等资料数据

9)南极大陆冰盖综合断面考察数据库

●冰盖综合断面

●冰穹A深冰芯钻探

10)大气、空间环境及天文观测数据库

●大气环境化学

——气溶胶的化学成分及浓度、粒度和形态、分布和变化特征,影响气溶胶化学的关键生物和大气化学过程以及人类活动;持久性有机污染物;各种形态的汞及影响汞浓度变化的关键大气化学过程;臭氧、CO、碳黑等大气痕量气体。

●中高层大气参量

——25-75 km高度范围内大气的密度、温度、压力、湿度、波动、风场、各种大气微量成份以及气溶胶和云层特性,80-100 km高

度范围内金属钠原子密度等

11)航空重磁和遥感数据库

●航空摄影

●LiDAR探测、

●地面三维激光扫描

●航空重磁

●陆地地震台站数据

●大地电磁测深

12)南极大陆矿产资源数据库

●野外实地考察数据

●航空遥感波谱测量数据

●航空及地面磁法

●电法测量数据

13)北极物理海洋和海洋气象数据库

1)海洋气象

——气压、风速、风向、气温、湿度、总云量、低云量、能见度等

2)海洋水文

——海水温度、海水盐度、流速、流向、水位、湍混合系数、水色、透明度、波高、波向、波周期等

3)海冰(雪)

——海冰及其表层雪的物理特性、冰型、冰量、海冰面积、海冰

(雪)厚度、海冰覆盖率、海冰密集度、冰表面特征、冰状、冰块水平尺度、冰漂流方向和速度、冰温、海冰盐度等。

4)海-冰-气相互作用要素

——海-气边界层参数(风速、温度、湿度、长波辐射、短波辐射、海-气界面热量与动量交换、潜热、感热通量等)、海冰冰芯化学与海冰生物、海冰区与气候相关的反照率和物质平衡要素等。

14)北极重点海域海底底质数据库

●悬浮体

●冰筏体

●底质

●沉积物类型

●矿物分布

●元素分布

●微生物古体分布

●悬浮体分布

●工程地质

●表生矿产资源

●古环境演化

15)北极海洋地球物理数据库

●历史资料

——重力异常、磁力异常、综合地球物理剖面、构造区划等

●多波束测探

●单道地震

●浅剖

●重力勘测

●磁力勘测

16)北极海洋化学与碳通量数据库

●海水化学要素

——常规要素(温度、盐度、溶解氧、pH、悬浮物),有机生源要素(溶解有机碳、溶解有机氮、颗粒有机碳和颗粒有机氮),营养盐(总氮、总磷、溶解态氮、溶解态磷、硝酸盐、亚硝酸盐、铵盐、活性磷酸盐、活性硅酸盐等)。

●沉积化学要素

——氧化还原环境(Eh、硫化物、pH),有机要素(有机碳、有机氮等),营养元素(总氮、总磷、生物硅等),沉积物成分等。●海洋大气化学要素

——气溶胶,MSA,气体(二氧化碳、甲烷气、二氧化硫、氮氧化物、碳黑等),营养盐(碳、氮、磷、铁、钠、钙、镁等)等要素。

●物质垂直输运考察

——沉积物捕获器颗粒物分析、Th同位素等。

●其它重要微量生源元素

——Fe、F等

●水体环境考察

——油类,重金属(铜、铅、锌、铬、镉、汞、砷等)。

●大气环境

——重金属污染(铜、铅、锌、汞、铬、铝、钒等)。

●沉积污染物

——油类,重金属污染(铜、铅、锌、铬、镉、汞、砷等),持久性污染有机物(POPs)等。

●生物体残毒

——石油类,重金属(铜、铅、锌、铬、镉、汞、砷等),持久性污染有机物(POPs)等

●CO2

——大气CO2、水体pCO2、溶解无机碳、碱度等。

●氟里昂

——大气和海水中氟里昂

●历史资料

17)北极海洋生物多样性与生态数据库

●生物多样性

●生境类型

●菌株资源信息

●遗传信息

●极地微生物天然产物

●海洋微生物信息

●浮游生物

18)穿越北极点综合科学考察数据库

●水样采集与分析

●地质取样

●大气环境

●走航观测

●XBT/XCTD观测

●常规生态采集分析数据●地震剖面测量数据

●生态观测

●海冰观测

元数据的概念

元数据的概念 元数据(Metadata),即关于数据的数据,是对数据和信息资源进行描述的信息。通常认为,元数据是为了更为有效地管理和使用数据而对它进行说明的信息。所以元数据与其描述的数据内容有着密切联系,不同领域的数据的元数据在内容 上差异很大。地理空间数据的元数据是地理空间的空间数据和属性数据以外的描述地理信息空间数据集的内容、质量、状态和其它特性的一类数据,它是实现地理空间信息共享的核心标准之一。其中,对空间数据某一特征的描述,称为一个空间元数据元素。空间元数据是一个由若干复杂或简单的元数据项组成的集合。它与非空间元数据的主要区别在于其内容中包含大量与空间位置有关的描述性信息。 研究元数据的作用和意义 元数据可用来帮助数据提供者和数据使用者解决数据转换、沟通和理解的问题。归纳起来,元数据主要有下列几个方面的作用: 1)、用来组织、管理和维护空间数据,建立数据文档,并保证即使其主要工作人员退休或调离时,也不会失去对数据情况的了解 2)、提供数据存储、数据分类、数据内容、数据质量及数据分发等方面的信息,帮助数据使用者查询检索所需地理空间数据 3)、用来建立空间信息的数据目录和数据交换中心,提供通过网络对数据进行查询检索的方法或途径,以及与数据交换和传输有关的辅助信息 4)、通过空间元数据,人们可以接受并理解空间信息,帮助数据使用者了解数据, 以便就数据是否能满足其需求作出正确的判断并与自己的空间信息集成在一起,进行不同方面的科学分析和决策。 元数据是使数据充分发挥作用的重要条件之一。它可以用于许多方面,包括数据文档建立、数据发布、数据浏览、数据转换等。元数据对于促进数据的管理、使用和共享均有重要的作用。元数据对于建立空间数据交换网络是十分重要的,往往网络中心通过设在中心的元数据库可以实时地连接各个分发数据的分节点元数据库,帮助潜在的用户找到其特定应用所需要的数据,实现数据共享。 一个完整的元数据系统通常包括三部分,即元数据标准、元数据管理工具和元数据库。不同的元数据库可能采用不同的管理工具,唯一能够在不同数据管理软件间交换元数据的途径是统一元数据标准,只有在统一的标准前提下,才能跨越操作系统平台和数据库软件平台进行数据的互操作,实现数据共享。 DIF 元数据标准

中文数字化期刊的dc 元数据标准设计实例情报科学vol1 21no1 6

中文数字化期刊的DC 元数据标准设计实例 刘廷元 (西南石油学院图书馆,成都610500) 摘 要 文章将元数据标准的使用作为各种不同的数字化期刊仓储资源共享的一种可行性方法进行了论 述。研究集中在三个方面:首先,讨论了数字化期刊采用元数据标准的必要性;其次,讨论了数字化期刊的 DC 元数据定义与限定;最后,提供了一个用DC 111元数据和H TM L 410语法设计的中文数字化期刊元数据 标准实例。 关键词 元数据 标准 数字化期刊 中文期刊 设计 中图分类号 G 35311 文献标识码 A 文章编号 100727634(2003)0620609204 An Exam ple of the DC M etada ta Standard D esign for Ch i nese D ig ita l Journa ls L iu T ingyuan (L ib rary of Sou thw est Petro leum In stitu te ,Chengdu 610500) Abstract T h is article deseribes the u se of m etadata standards as a viab le m ean s fo r shared resou rces among vari ou s differen t digital j ou rnalw arehou ses .O u r study concen trates on th ree con ten ts :F irst ,the article discu ssed under the necessity of u sing the m etadata standard in digital j ou rnals .Second ,the article discu ssed the sem an tic defin iti on and li m itati on of the DC elem en t set fo r digital j ou rnals .F inally ,w e p rovided the m etadata standard of the Ch inese digital j ou rnals and an examp le of the design w ith the DC 1.1m etadata and H TM L 4.0syn tax . Keywords M etadata Standard D igital Jou rnal Ch inese Jou rnal D esign 收稿日期:2002-09-09 数字化信息的结构化存储、有序化组织和高效、准确的 检索,是数字化图书馆与商业数据库共同面临的一个问题。由于WWW 空间的无限扩大,使得解决全球信息资源的无组织问题更加迫切。目前,因特网上既有OCL C 、U nCover 那样庞大的数字化期刊服务,也有BaderL ine 、EBSCO ho st 、P roQ uest D irect 、Sp ringer 数字化期刊、CN K I 中国学术期刊网、维普中文科技期刊、万方中国数字化期刊网这样新兴的数字化全文期刊数据库服务,以及不断增加的上千种的网上出版期刊。然而,这样巨大的期刊信息资源仓储却是以异构方式存在的,它们提供各自不同的信息存储、组织、检索与浏览方法,不能实现跨仓储的统一查找利用,造成了极大的信息资源浪费。 因特网上分布式的异构数字化期刊仓储如同一个没有索引卡片的传统图书馆。但是,如果我们为这些数字化期刊的信息存储、组织、检索与浏览加上一个无形的统一索引目录——元数据标准,网上数字化期刊就会成为一个单一的、虚拟的、有组织的信息集合体,实现全球期刊信息的资源共享和跨仓储无缝查找,使期刊文献检索的查全率和查准率大大提高,从而极大地方便广大读者和用户。 1 数字化期刊采用DC 元数据标 准的必要性 大多数数字化期刊(尤其是全文期刊数据库)都习惯采用自己特有的数字信息储存、检索技术,人为地使自己的产品在使用方式、字段、接口设计等方面造成差异和封闭。强调产品的差异性而又不遵守统一的制作标准与规范,谋求利润最大化而又自我封闭,这就是数字化期刊制作与出版过程中普遍存在的二律悖反现象。正是由于这种分布式的异构与封闭,才阻碍了当今信息资源的透明、公开、可扩展、互操作性、组织性和规模化建设,使数字化期刊在当今知识经济时代难以受到人们更多的喜爱。 具体地说,数字化期刊采用元数据标准的必要性主要有以下四个方面。 (1)元数据描述能够为数字化期刊建立一种计算机普遍 可以理解的框架体系,使数字化期刊资源得以透明、公开。因为元数据描述了数字化信息的内容、权利和外部环境这些基本特征,使得计算机系统可以自动辨识、抽取、分析和整合,进而使得数字化期刊信息简单、有效的被其它信息资源仓储利用。 (2)元数据的描述、标识和语法能够融入因特网通用的 语言中,被迅速地装载或转换进各种索引数据库,使数字化期刊资源具有可扩展和互操作性。一方面,建立在通用标记语言(SG M L )和扩展标记语言(X M L )之上的元数据语言,是国际互联网的通用语言,能够非常方便地被相同的元数据语言装载。另一方面,即使是对于各种不同数字化期刊仓储类型的元数据体系,只要我们以W F 和RD F 为基础,通过语 第21卷第6期 2003年6月     情 报 科 学   V o l 121,N o 16June, 2003

元数据_基础知识

元数据 一、定义 元数据(Metadata)是关于数据的数据。它是用于描述信息资源的高度结构化数据。 元数据在数据生产过程中或完成后建立的。 二、功能 元数据是数据与数据用户之间的桥梁 1.支持资源发现 2.组织数字信息资源 3.支持资源的互操作 4.支持数字识别 5.支持存档和保存 三、分类 1. 按功能分 描述性元数据:与事物本质有关的元数据。 管理性元数据:与事物处理方式有关的元数据。包括权限管理、防伪管理、存储和使用管理。 技术性元数据

保存性元数据 使用性元数据 2.按复杂程度分 采用简单的记录格式 结构化的格式 复杂格式 3.按描述的资源类型分 网络资源:Dublin Core、IAFA Template、CDF、Web Collections 文献资料:MARC(with 856 Field),Dublic Core 人文科学:TEI Header 社会科学数据集:ICPSR SGML Codebook 博物馆与艺术作品:CIMI、CDWA、RLG REACH Element Set、VRA Core 政府信息:GILS 地理空间信息:FGDC/CSDGM 数字图像:MOA2 metadata、CDL metadata、Open Archives Format、VRA Core、NISO/CLIR/RLG Technical Metadata for Images 档案库与资源集合:EAD 技术报告:RFC 1807 连续图像:MPEG-7 四、结构 1.内容结构(数据元/字段/数据项) 定义元数据的构成元素,可包括描述性元素、技术性元素、管理性元素和结构性元素。 这些构成元素要满足元数据的功能要求,因此,往往与元数据的功能相对应。 当某个元素来自某个外部标准时,要在内容结构中对此说明。 2.句法结构(元数据实体/数据表/数据结构) 定义元数据内元素之间的相互关系(例如,树状结构)。 定义元数据的格式及其描述方式。包括: (1)元素的分区分段组织 (2)元素选取使用规则 (3)元素描述方法(如Dublin Core采用ISO/IEC 11179标准)

元数据与元数据标准现状

元数据与元数据标准现状 福建省空间工程研究中心黄瑞垠 目前国内外研究领域对元数据含义的理解虽然存在认识深浅的区别,但总体上达成了共识[[i]]。学者们大都认可“元数据是关于数据的数据”或“描述数据的数据”的观点,但对于其具体含义,又有不同阐述。张晓林等[[ii]]认为“元数据是描述信息资源或数据等对象的数据,其使用目的在于:识别资源、评价资源、追踪资源在使用过程中的变化,实现简单高效地管理大量网络化数据,实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理”。肖珑[[iii]]认为元数据“是用于提供某种资料的有关信息的结构化数据(Structured data)”。张智雄[[iv]]将元数据定义为“描述任何Internet数据和资源,促进Internet信息资源的组织和发现的数据”。李郎达[[v]]引用国际图联对元数据的定义:“Metadata即描述资料的资料,可用来协助对网络电子资源的辨识、描述、指示其位置的任何资料”。 根据以上定义,参考其他学者的观点,关于元数据,可小结如下: (1)元数据的目标:元数据的根本目标是使数据库更易于使用,或为计算机辅助软件工程(CASE)服务。 (2)元数据的内容:元数据包括对数据集的描述;对数据集中各数据项(来源、数据所有者、数据生产历史)等的说明;数据质量的描述,如:数据精度、分辨率、源数据的比例尺等;数据处理信息,如量纲的转换等;数据转换方法;数据库更新、集成的方法等等。 (3)元数据的性质:元数据是数据的描述性数据;对不同领域的数据库,元数据的内容有很大差异;元数据应尽可能反映数据的特征及规律。 (4)元数据的作用:通过元数据可以检索、访问数据库,可以有效利用计算机的系统资源,可以对数据进行加工处理和二次开发等。 在此基础上,我们将元数据概括为以数据高效利用和交换为目的的数据集说明性数据,它主要包括对数据集、与数据集相关信息、数据集各数据项说明以及数据用户访问、检索、更新数据库的方法,同时元数据也包括基于不同数据领域,如何尽可能全面反映基本数据的信息。

CELTS-42基础教育教学资源元数据规范1

基础教育教学资源元数据应用规范 (CELTS-41) 教 育信息化技术标准 CELTS-42 基础教育教学资源元数据规范 CELTS-42 CD1.6 教育部教育信息化技术标准委员会 发布

目录 1 概述 (2) 1.1 目的 (2) 1.2 范围 (2) 2 规范性引用文件 (2) 3 术语定义与缩略语 (3) 3.1 本应用规范使用的基础术语 (3) 3.2 缩略语 (5) 4 元数据元素属性定义 (6) 4.1 元数据元素的属性描述 (6) 4.2 数据元素定义的规定 (7) 5 元数据结构 (7) 5.1 元数据的基本结构 (7) 5.2 元数据元素及定义 (7) 6 限定词汇与编目词汇表 (11) 6.1 限定词汇 (11) 6.2 本规范的限定词与编目方式定义 (14) 6.3 受控词汇和编目方案 (22) 6.4 一致性 (29) 7 参考文献 (31) 附录 A 供参考的部分教育学科课程分类第三级词汇表(课程内容) (33) A.1 语文课程内容分类 (33) A.2 数学课程内容分类 (34) A.3 英语课程内容分类 (37) A.4 地理课程内容分类 (38) A.5 历史课程内容分类 (39) A.6 化学课程内容分类 (40) A.7 物理课程内容分类 (43) A.8 生物课程内容分类 (48) A.9 信息技术课程内容分类 (49) A.10 音乐课程内容分类 (50) A.11 美术课程内容分类 (50)

CELTS-42基础教育教学资源元数据规范 1 概述 1.1 目的 本规范提供一个面向基础教育的教学资源数据模型。制定本规范旨在对希望在学校、企业、其他机构和个人的教学资源中使用元数据的用户提供一套资源编目准则,以使读者能快速、有效地在国家基础教育资源库及门户网站中检索到所需的教学资源,广泛地实现资源共享。 1.2 范围 本规范在《CELTS-3学习对象元数据:信息模型规范》(以下简称《学习对象元数据规范》)的基础上,结合我国基础教育的实际,定义了一组面向基础教育的教学资源元数据元素。 本规范依照教育部颁布的《义务教育课程设置实验方案》、《义务教育各学科课程标准(实验稿)》以及《学习对象元数据规范》,同时参考《都柏林核心集元数据(DCMES)》、《中国图书馆图书分类法》、美国GEM项目及澳大利亚EdNA项目的词汇分类方法,定义了一组用于元数据元素编目的受控词汇及相应的词汇表。 本规范通过与《学习对象元数据规范》的元素间映射来实现与CELTS的一致性。 本规范包括﹕ ?概述 ?规范性引用文件 ?术语定义与缩略语 ?元数据元素属性定义 ?元数据结构 ?限定词汇及编目词汇表 ?一致性 ?参考文献 2 规范性引用文件 下列文件中的条款通过本规范的引用而成为本应用规范的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本应用规范。然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本应用规范。 ?ISO 639:规定人类语言表示方法的国际标准。 ?ISO 646:规定ASCII字符集的国际标准。 ?ISO 8601:规定日期和时间表示方法的国际标准。 ?ISO 3166:规定国家名称表示方法的国际标准。

专门数字对象描述元数据规范

专门数字对象描述元数据规范 研制工作手册 (试行) 《专门数字对象描述元数据规范》子项目组 2003年3月 为了保证子项目组研制的各种元数据规范在功能、数据结构、格式、语义语法等方面的一致性和整体性,同时也为了今后在更大范围内实现与其他系统或数字图书馆的互操作和数据共享,项目组特制定本手册。 手册主要内容包括: 1,描述元数据的定义及功能 2,元数据规范的设计原则 3,描述元数据的基本结构、元素组成与扩展规则 4,描述体系与定义方法 5,元数据规范应用的相关规则 6,设计流程与工作规范 7,文档规范 本手册为试行稿,其中很多内容尚需在实际工作过程进行修订,涉及到核心元素集、元素定义方法、扩展规则、描述体系等方面的内容,将与“基本描述元数据规范”子项目组进一步探讨后确定。各工作小组可暂时按此执行,在执行过程中如有问题,可向子项目组提出,并在子项目组会议上讨论修改并通过。 一、描述元数据的定义及功能 描述元数据:即用于描述或标识数字对象内容的元数据。 设计描述元数据规范时,要充分考虑和实现元数据的下列功能: 描述:对信息对象的内容、属性等的描述,是元数据最基本的功能,为信息对象的检索与利用奠定了基础。 定位:即有关信息资源的位置方面的信息,如DOI、URL、URN等的记录,由此可知信息对象之所在,有利于信息的发现和检索。 管理:对信息对象的权限管理(版权、所有权、使用权)的揭示和描述。 检索:在描述过程中,将信息对象中的重要信息抽出标引并加以组织,建立它们之间的关系,为用户提供多层次、多途径的检索体系,从而有利于用户发现其真正需要的信息。 评估和选择:由于元数据的描述,使用户在不必浏览信息对象本身的情况下,对信息对象有了基本了解和认识,可以对其价值进行评估,从而决定信息的取舍。 交互:包括与编目人员和用户之间的交互。元数据在结构上呈现出一定的开放性,允许

国家基础地理信息系统元数据标准(草案)

国家基础地理信息系统(NFGIS)元数据标准草案(初稿) 1. 主题内容与适用范围 本标准提供国家基础地理信息系统(NFGIS)元数据的内容,包括NFGIS数据的标识、内容、质量、状况及其他有关特征。本标准可用于对NFGIS数据集的全面描述、数据集编目及信息交换网络服务。 2. 参考标准 ISO 15046-15地理信息--元数据(CD 2.0) FGDC 地理空间数据元数据内容标准(CSDGM)v.2.0 3. 术语 3.1 元数据 是关于数据的数据,即关于数据的内容、质量、状况和其他特性的信息。也可译为描述数据或诠释数据。 3.2 元数据元素(元数据Element) 元数据最基本的信息单元。 3.3 元数据实体(元数据Entity) 同类元数据元素的集合。 3.4 元数据子集(元数据Section) 相互关联的元数据实体和元素的集合。 3.5 信息交换网络(Clearinghouse) 数据生产者、管理者和用户之间的分布式、电子连接的网络。 3.6 数据志(Lineage) 数据继承信息,包括获取或生产数据使用的原始资料说明、数据处理中的参数、步骤等情况及负责单位的有关信息等。 3.7 引用文献(Citation) 数据集引用或参考使用的资料、数据集、模型、文献等。 4. NFGIS 元数据层次结构和性质 4.1 元数据层次结构 本标准规定NFGIS元数据分为三层:元数据子集、元数据实体和元数据元素。 元数据元素是元数据的最基本的信息单元,元数据实体是同类元数据元素的集合,元数据子

集是相互关联的元数据实体和元素的集合。在同一个子集中,实体可以有两类即简单实体和复合实体,简单实体只包含元素,复合实体既包含简单实体又包含元素,同时复合实体与简单实体及构成这两种实体的元素之间具有继承关系。 4.2 元数据性质 本标准定义三种性质的元数据子集、实体和元素: 必选(Mandatory)──元数据的核心内容,适用于各种被描述对象,是元数据文件必须包含的子集、实体或元素。 一定条件下必选(Conditional )──针对不同的被描述对象特征元数据文件所必须提供的子集、实体或元素。 可选(Optional)──该子集、实体或元素是可选的,由用户决定是否将其包含在元数据文件中。 5. NFGIS 元数据分级和特征 5.1 元数据分级 本标准规定元数据分为两级,即: 基本元数据──提供地理数据源基本文档所需要的最少的元数据元素集。它包括回答下列问题的元数据元素: "是否有特定主题的数据集('什么')?"、"是否有特定地区的数据集('何处')?"、"是否有特定时段的数据集('何时')?" 以及"订购或了解数据集更多情况的联系人('谁')? 完全元数据──提供完整的地理数据源(单独的数据集、数据集系列、各种地理要素)文档所需要的必选的和可选的元数据元素集。它完整地定义全部元数据,以便标识、评价、摘录、使用和管理地理信息。 5.2 元数据特征 本元数据标准定义了8种特征: 5.2.1 名称 赋给元数据实体或元素的标记。 5.2.2 标识码 计算机中使用的定义每个元数据实体和元素的唯一代码。代码结构为: xx xx xx 前两位为元数据子集,两位数字码 中间两位为元数据实体/独立元素,两位数字码 后两位为元数据实体包含的元素,两位数字码

科学数据规范化分析与管理

科学数据规范化分析与管理
中国科学院计算机网络信息中心 胡良霖 2008年05月

提纲
1. 2. 3.
基本概念 科学数据的特点 科学数据规范化
规范化分析 3.2 规范化管理
3.1
4. 5.
示例模型 科学数据规范化工作模式

1. 基本概念
数据(data) 对事实、概念或指令的一种形式化表示,适用于以人 工或自动方式进行通信、解释或处理。 数据集(dataset) 可以标识的数据集合。 注:数据集可以是一个数据库或一个或多个数据文件。 元数据 (metadata)
定义和描述其他数据的数据。
数据模型(data model) 以反应信息结构的某种方式对数据组织的描述。 描述数据、数据关系、数据语义以及一致性约束的概 念工具的集合。[《数据库系统概念》(第三版)]
注:以上概念除特殊注明外均摘自GB/T18391.1-2002《信息技术的规范化与标准化 第一部分:数据 元的规范化与标准化框架》

1. 基本概念
数据元(data element)
用一组属性描述其定义、标识、表示和允许值的数据单元,在 一定语境下,通常用于构建一个语义正确、独立且无歧义的特 定概念语义的信息单元。
注:数据元也是构建元数据和元数据实体的基本单元。
数据元目录(data element directory)
列出并定义了全部相关数据元的一种信息资源。
注:数据元目录可有不同层级,例如,ISO/IEC委员会级、国际协会 级、行业部门级、公司级、应用系统级。
数据元值(data element value)
数据元允许值集合中的一个值。
数据元值的长度(data element value length)
数据元值中字符的数目。
注:按ASCII字符数目计算数据元值的长度,一个汉字相当于2个字符。
注:以上概念释义均出自GB/T18391.1-2002。

《元数据的作用 [元数据的构成方式]》

《元数据的作用[元数据的构成方式]》 (徐枫宦茂盛)通过元数据的描述,能够使信息资源的使用者了解数据的内容、特征、作用、获取方式等信息。元数据是关于数据的数据,在建立信息资源目录体系的过程中,元数据主要是对信息资源从外部特征进行而非从内部结构进行描述。通俗地讲,元数据就是信息资源的标签或卡片,通过元数据的描述,可以使信息资源的使用者能够了解数据的内容、特征、作用、获取方式等信息,能够对信息资源是否满足特定的应用需求做出适当的评价,并根据评价的结果决定是否采取进一步的措施来获取该信息资源。 元数据是信息资源目录体系建立的基础,构建一个信息资源目录体系首要和基础性的工作就是建立描述各个信息资源的元数据库,元数据库中存储的是描述各种来源、各种类型的信息资源的描述信息。无论用户以何种方式查询信息资源目录,包括以分类目录的形式进行查询、或者以多关键词的形式进行查询,其本质都是对后台元数据库的检索,只是从表现层提供了不同形式的人机查询接口。根据所描述的信息资源对象的不同,可以建立不同的元数据库,分别对各类信息资源进行描述。 元数据的组成 为能够对信息资源进行准确和高效的描述,元数据本身具有自身的逻辑结构。一般来说,元数据本身是层次化、树状结构的。处于树状结构最底端的叶子节点称之为元数据元素,包含了元数据元素的节点称之为元数据实体,当然元数据实体也可以只包含元数据实体。根

据实际需求,元数据实体或者元数据元素可以多次出现。例如,信息资源可以有不同的分类,可以按照信息资源的来源进行分类,也可以按照信息资源的不同应用主题进行分类,因此,“信息资源分类”元数据实体就可以出现多次。 元数据一般分三个方面对信息资源进行描述。 一是对信息资源基本内容的描述。包括信息资源的标题、摘要、关键词等基本信息。标题是信息资源的名称,通过标题使用者能够初步掌握信息资源的基本范围。其次,使用者可以通过摘要,了解信息资源的主要内容、用途等各种信息。一般情况下,用户主要通过摘要作为信息资源适用性评价的主要依据。所以,在信息资源元数据的著录过程中,摘要的填写一般都由专业人员完成,只有专业人员才能够对信息资源的内容有准确的把握和深入的理解,能够提供有关信息资源内容的更加权威的解释。根据信息资源对象的不同,描述信息资源基本内容的元数据实体和元数据元素还可以进行有选择的增加。例如,描述空间信息资源时,可以增加空间参照系、图示表达等元数据实体,描述科学数据资源时需要增加数据质量等元数据实体。 二是对信息资源的获取方式进行描述。包括信息资源的分发者信息、信息资源的在线获取地址信息等。通过提供分发者联系信息,使用者可以直接联系信息资源的分发部门,这对于不能直接在网络上进行数据交换的信息资源获取非常有效。其次,使用者还可以通过信息资源的在线地址来下载、查询、浏览信息资源。使用者甚至可以提供专门的电子订单处理系统,并将入口信息加入到元数据内容中,方便

元数据的标准

元数据的标准 1、数字图书馆资源组织框架 2. 元数据开发应用框架 元数据的基本意义Metadata(元数据)是“关于数据的数据”; 元数据为各种形态的数字化信息单元和资源集合提供规范、普遍的描述方法和检索工具;元数据为分布的、由多种数字化资源有机构成的信息体系(如数字图书馆)提供整合的工具与纽带。 离开元数据的数字图书馆将是一盘散沙,将无法提供有效的检索和处理。 3. 元数据应用环境 3.1 Metadata的应用目的 (1)确认和检索(Discovery andentification),主要致力于如何帮助人们检索和确认所需要的资源,数据元素往往限于作者、标题、主题、位置等简单信息,Dublin Core是其典型代表。(2)著录描述(Cataloging),用于对数据单元进行详细、全面的著录描述,数据元素囊括内容、载体、位置与获取方式、制作与利用方法、甚至相关数据单元方面等,数据元素数量往往较多,MARC、GILS和FGDC/CSDGM是这类Metadata的典型代表。 (3)资源管理(Resource Administration),支持资源的存储和使用管理,数据元素除比较全面的著录描述信息外,还往往包括权利管理(Rights/Privacy Management)、电子签名(Digital Signature)、资源评鉴(Seal of Approval/Rating)、使用管理(Access Management)、支付审计(Payment and Accounting)等方面的信息。 (4)资源保护与长期保存(Preservation and Archiving),支持对资源进行长期保存,数据元素除对资源进行描述和确认外,往往包括详细的格式信息、制作信息、保护条件、转换方式(Migration Methods)、保存责任等内容。 3.2 Metadata在不同领域的应用根据不同领域的数据特点和应用需要,90年代以来,许多Metadata格式在各个不同领域出现 例如: 网络资源:Dublin Core、IAFA Template、CDF、Web Collections 文献资料:MARC(with 856 Field),Dublic Core 人文科学:TEI Header 社会科学数据集:ICPSR SGML Codebook 博物馆与艺术作品:CIMI、CDWA、RLG REACH Element Set、VRA Core 政府信息:GILS 地理空间信息:FGDC/CSDGM 数字图像:MOA2 metadata、CDL metadata、Open Archives Format、VRA Core、NISO/CLIR/RLG Technical Metadata for Images 档案库与资源集合:EAD 技术报告:RFC 1807 连续图像:MPEG-7 3.3 Metadata格式的应用程度 不同领域的Metadata处于不同的标准化阶段: 在网络资源描述方面,Dublin Core经过多年国际性努力,已经成为一个广为接受和应用的事实标准;在政府信息方面,由于美国政府大力推动和有关法律、标准的实行,GILS已经

林业科学数据元数据标准

林业科学数据元数据标准(V3.10版) 1 主题容与适应围 本标准规定了用来描述林业科学数据集及提供信息服务所需要的信息,包括林业科学数据共享元数据容框架和林业科学数据共享元数据标准。提供了有关林业科学数据集的标识、容、分发、数据质量、数据表现、参照系和元数据参考信息等容。 本标准适用于林业科学数据集元数据整理、建库、汇编、发布及共享服务。 本标准的元数据分为两级,即核心元数据和详细元数据。核心元数据规定了描述数据集最关键的信息容。在核心元数据的基础上,考虑林业科学研究的特点,建立满足林业科学数据共享建设的详细元数据。用户可以在核心元数据的基础上,根据具体需求和数据的实际情况选用、扩充详细元数据容,建立相应级别的元数据库。 2 规性引用文件 下列规性引用文件通过本部分的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的容)或修订版均不适用于本标准。但是,鼓励根据本标准达成协议的各方,研究是否可使用这些文件的最新版本。但是不注日期的引用文件,其最新版本适用于本标准。ISO和IEC成员维护目前有效国际标准的注册。 科学数据共享工程技术标准—科学数据共享元数据标准容1.4 SDS/T 2112—2004 科学数据共享工程技术标准 GB/T 1.1—2000 标准化工作导则 GB/T 7408-1994 数据元和交换格式信息交换日期和时间表示方法 GB/T 4880.2-2000 语种名称代码第2部分:3字母代码 GB/T 2260-2002 中华人民国行政区划代码 GB/T 7156-1987 文献等级代码 SDS/T 2111—2004 元数据标准化原则与方法 SDS/T 2122—2004 科学数据共享工程数据分类编码 ISO 19115 地理信息—元数据(Geographic information—Metadata) 3 术语和定义 3.1 数据集dataset 数据集是可以表示的数据集合,数据集可以是数据库,也可以是数据库中的一个(逻辑组成)部分。本标准所指的数据集是指不可再细分的数据集,即可以用一个数据字典能够唯一描述的数据集合。3.2 数据集系列dataset series 数据集系列是同一主题的多个数据集的组合,都符合相同产品规。 3.3 元数据metadata 元数据是关于数据的数据,用来描述数据的容、覆盖围、质量、管理方式、数据的所有者、数据的提供方式等有关信息。 3.4 元数据元素 metadata element

关于主数据、元数据、交易数据的概念及典型应用

企业数据管理的内容和范畴通常包含交易数据、主数据以及元数据。本文将主要针对主数据、元数据的相关概念以及应用跟大家做一个探讨。(文章内容来自互联网,kuangfeng88588整理) 1 主数据和主数据管理的概念 企业主数据是用来描述企业核心业务实体的数据,比如客户、合作伙伴、员工、产品、物料单、账户等;它是具有高业务价值的、可以在企业内跨越各个业务部门被重复使用的数据,并且存在于多个异构的应用系统中。 企业主数据可以包括很多方面,除了常见的客户主数据之外,不同行业的客户还可能拥有其他各种类型的主数据,例如:对于电信行业客户而言,电信运营商提供的各种服务可以形成其产品主数据;对于航空业客户而言,航线、航班是其企业主数据的一种。对于某一个企业的不同业务部门,其主数据也不同,例如市场销售部门关心客户信息,产品研发部门关心产品编号、产品分类等产品信息,人事部门关心员工机构,部门层次关系等信息。 1.1数据管理的范畴和主数据管理的概念 企业数据管理的内容及范畴通常包括交易数据、主数据以及元数据。 ?交易数据:用于纪录业务事件,如客户的订单,投诉记录,客服申请等,它往往用于描述在某一个时间点上业务系统发生的行为。 ?主数据:主数据则定义企业核心业务对象,如客户、产品、地址等,与交易流水信息不同,主数据一旦被记录到数据库中,需要经常对其进行维护,从而确保其时效性和准确性;主数据还包括关系数据,用以描述主数据之间的关系,如客户与产品的关系、产品与地域的关系、客户与客户的关系、产品与产品的关系等。 ?元数据:即关于数据的数据,用以描述数据及其环境的结构化信息,便于查找、理解、使用和管理数据。 主数据管理是指一整套的用于生成和维护企业主数据的规范、技术和方案,以保证主数据的完整性、一致性和准确性。 1.2主数据管理的意义 集成、共享、数据质量、数据治理是主数据管理的四大要素,主数据管理要做的就是从企业的多个业务系统中整合最核心的、最需要共享的数据(主数据),集中进行数据的清洗和丰富,并且以服务的方式把统一的、完整的、准确的、具有权威性的主数据分发给全企业范围内需要使用这些数据的操作型应用和分析型应用,包括各个业务系统、业务流程和决策支持系统等。

.数据分析篇——空间元数据

空间元数据库知识点一、知识点结构

二、知识点内容 知识点(优先级)描述定位 1元数据编辑相关插件(A) 与元数据编辑相关的视图为元数据视图。 与元数据编辑相关的插件有元数据编辑插件,加载之后的工具条为: ?元数据库列表框用于选择元数据库,如图所示:元数据库列表框; ?元数据集列表框用于选择元数据集,如图所示:元数据集列表框; ?样式表列表框用于选择样式表,如图所示:元数据显示样式表列表框; ?单击编辑按钮,可以实现对元数据的编辑,如图所示:编辑元数据按钮; ?单击创建按钮,可以实现对元数据的创建,如图所示:创建元数据按钮; ?单击导入按钮,可以导入元数据,如图所示:导入元数据按钮; ?单击导出按钮,可以导出元数据,如图所示:导出元数据按钮; ?单击元数据和空间数据的一致性检查按钮,可以浏览检查元数据和空间数据的一致性,如图所示:元数据和空间数据的一致性检查按钮; ?单击浏览附件按钮,可以浏览元数据附件,如图所示:浏览元数据附件按钮。 MapGIS7.x 数据管理 篇.chm 25.2.2

2元数据创建(A)1、创建元数据库和元数据集 在“元数据库”文件夹右键选择“创建”功能,输入元数据库的名称,如test。 展开元数据库,找到test点击右键选择创建元数据集,输入元数据集名称。 图1创建元数据库和元数据集 2、元数据的创建方法有多种,以下逐一介绍。 (1)在元数据集上右键点击元数据导入,其具体的操作参见元数据的批量导入。 (2)工具条上点击创建元数据按钮,如果当前选中的是“元数据库”,就会在元数据库文件夹下的第一个元数 据库中的第一个元数据集中建立元数据;如果选中的是某个元数据库(如test),就会在该元数据库中的最先建的 元数据集中建立元数据;如果选中的是某个元数据集(如meta),就会在该元数据集中建立元数据。 (3)为地理实体建立元关系,在建立了元关系的元数据集上右键点击,选择同步元数据,则会在元数据列表中新 建元数据,其具体的操作请参考创建同步和更新同步。 MapGIS7.x 数据管理 篇.chm 25.2.1 3元数据浏览(A)在MapGisCatalog目录树中选中某个元数据集,将视图切换到元数据视图,在元数据视图中的元数据列表中会列出 该元数据集下的所有元数据,选择某条元数据,在元数据视图中即会显示该条元数据的信息。 可以从下拉列表中,选择已有的显示方式对该条元数据的显示方式进行更改。 MapGIS7.x 数据管理 篇.chm 25.2.1

元数据管理

1.前言 数据仓库中的数据是从许多业务处理系统中抽取、转换而来,对于这样一个复杂的企业数据环境,如何以安全、高效的方式来对它们进行管理和访问就变得尤为重要。解决这一问题的关键是对元数据进行科学有效的管理。元数据是关于数据、操纵数据的进程和应用程序的结构和意义的描述信息,其主要目标是提供数据资源的全面指南。元数据不仅定义了数据仓库中数据的模式、来源以及抽取和转换规则等,而且整个数据仓库系统的运行都是基于元数据的,是元数据把数据仓库系统中的各个松散的组件联系起来,组成了一个有机的整体。2.元数据 2.1 元数据的概念 按照传统的定义,元数据(Metadata)是关于数据的数据。在数据仓库系统中,元数据可以帮助数据仓库管理员和数据仓库的开发人员非常方便地找到他们所关心的数据;元数据是描述数据仓库内数据的结构和建立方法的数据,可将其按用途的不同分为两类:技术元数据(Technical Metadata)和业务元数据(Business Metadata)。 技术元数据是存储关于数据仓库系统技术细节的数据,是用于开发和管理数据仓库使用的数据。

业务元数据从业务角度描述了数据仓库中的数据,它提供了介于使用者和实际系统之间的语义层,使得不懂计算机技术的业务人员也能够“读懂”数据仓库中的数据。业务元数据主要包括以下信息:使用者的业务术语所表达的数据模型、对象名和属性名;访问数据的原则和数据的来源;系统所提供的分析方法以及公式和报表的信息。 2.2 元数据的作用 在数据仓库系统中,元数据机制主要支持以下五类系统管理功能:(1)描述哪些数据在数据仓库中;(2)定义要进入数据仓库中的数据和从数据仓库中产生的数据;(3)记录根据业务事件发生而随之进行的数据抽取工作时间安排;(4)记录并检测系统数据一致性的要求和执行情况;(5)衡量数据质量。 与其说数据仓库是软件开发项目,还不如说是系统集成项目[1],因为它的主要工作是把所需的数据仓库工具集成在一起,完成数据的抽取、转换和加载,OLAP分析和数据挖掘等。 3.数据仓库元数据管理现状 元数据管理的主要任务有两个方面:一是负责存储和维护元数据库中的元数据;二是负责数据仓库建模工具、数据获取工具、前端工具等之间的消息传递,协调各模

电子文件元数据规范

电子文件元数据规范 1 范围 本规范适用于九省区各级国家档案馆、各级党政机关、社会团体、企事业单位对电子文件进行以保证凭证性为目的的管理活动。其他社会组织可参照执行 在电子文件管理过程中使用元数据可实现以下目的: ——确保并证明归档电子文件的真实性、完整性与有效性,从而保证其凭证价值; ——有利于归档电子文件的保护,实现长期保存; ——在异构的信息系统中对归档电子文件进行规范、有效的管理,保证归档电子文件的可捕获、可收集、查长期利用; ——对归档电子文件及馆(室)藏档案数字化资源进行集成管理,实现有效、方便地查询、检索与利用。 2 规范性引用文件 下列文件中的条款通过本规范的引用而成为本规范的条款。凡是注明日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本规范,然而,鼓励根据本规范达成协议的各方研究是否可使用这些文件的最新版本。 GB 2312-1980 信息交换用汉字编码字符集基本集 GB/T 3760-1995 文献叙词标引规则 GB/T 3792.1-1983 文献著录总则 GB/T 7156-2003 文献保密等级代码 GB/T 7408-2005 数据元和交换格式信息交换日期和时间表示法 GB/T 9704-1999 国家行政机关公文格式 GB/T 11714-1997 全国组织机构代码编制规则 GB/T 11821-2002 照片档案管理规范 GB/T 13959-1992 文件格式与代码编制方法 GB/T 13967-1992 全宗单 GB/T 15418-1994 档案分类标引规则 GB 18030-2000 信息技术信息交换用汉字编码字符集基本集的扩充 GB/T 18894-2002 电子文件归档与管理规范 DA/T 1-2000 档案工作基本术语 DA/T 12-1994 全宗卷规范 DA/T 13-1994 档号编制规则 DA/T 18-1999 档案著录规则 DA/T 19-1999 档案主题标引规则 DA/T 22-2000 归档文件整理规则 DA/T 31-2005 纸质档案数字化技术规范 《中华人民共和国电子签名法》 中办发[1996]14号中国共产党机关公文处理条例 国发﹝2000﹞23号关于发布《国家行政机关公文处理办法》的通知 国档发[1987]4号关于颁发《编制全国档案馆名称代码实施细则》的通知 国家档案局第6号令《电子公文归档管理暂行办法》,2003年7月28日 国家档案局第8号令《机关文件材料归档范围和文书档案保管期限规定》,2006年12月19日ISO 15489 Information and documentation—Records management ISO 23081-1 Information and documentation – Records Management Processes – Metadata for Records—Part 1: Principles

什么叫做元数据

什么叫做元数据 胡经国 本文作者的话 云计算具有很强的知识性和专业性。对于业外读者来说,云计算可谓“博大精深”。业外公众要学习云计算,有必要循序渐进地学习有关云计算的一系列基础知识。本文作为《漫话云计算》系列文稿和学习云计算笔录之一,供云计算业外读者进一步学习和研究参考。希望能够得到大家的指教和喜欢! 下面是正文 一、元数据基本概念 1、元数据基本概念解读(1) 元数据(Meta data),又叫做中介数据、中继数据,是指描述数据的数据(data about data,关于数据的数据),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。元数据算是一种电子式目录,为了达到编制目录的目的,必须描述并收藏数据的内容或特色,进而达到协助数据检索的目的。 元数据是关于数据的组织、数据域及其关系的信息。简言之,元数据就是关于数据的数据(data about data)。 元数据(Meta Data)是关于数据仓库的数据,是指在数据仓库建设过程中所产生的有关数据源定义,目标定义,转换规则等相关的关键数据。同时,元数据还包含关于数据含义的商业信息。所有这些信息都应当妥善保存,并很好地管理,为数据仓库的发展和使用提供方便。 元数据是一种二进制信息,用以对存储在公共语言运行库中的可移植可执行文件——PE文件或存储在内存中的程序进行描述。将您的代码编译为PE文件时,便会将元数据插入到该文件的一部分中;而将代码转换为Microsoft中间语言(MSIL)并将其插入到该文件的另一部分中。在模块或程序集中定义和引用的每个类型和成员,都将在元数据中进行说明。当执行代码时,运行库将元数据加载到内存中,并引用它来发现有关代码的类型、成员、继承等信息。 链接:PE文件 PE文件(Portable Executable File,可移植可执行文件),一种文件格式,用于编写可执行程序和链接在一起形成可执行程序的文件。 链接:MSIL

相关主题
文本预览
相关文档 最新文档