卫生信息数据集元数据规范的研究
- 格式:pdf
- 大小:231.23 KB
- 文档页数:4
卫生信息数据集元数据规范1 范围本标准规定了数据集概述、卫生信息数据集元数据规范、元数据内容框架、卫生信息数据集核心元数据、元数据子集、引用信息与代码表。
本标准适用于作为医药卫生领域数据集属性的统一规范化描述,也可用于医药卫生领域针对数据集制定专用元数据标准的依据。
2 规范性引用文件下列规范性引用文件通过本部分的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准。
但是,鼓励根据本标准达成协议的各方,研究是否可使用这些文件的最新版本。
但是不注日期的引用文件,其最新版本适用于本标准。
ISO和IEC 成员维护目前有效国际标准的注册。
GB/T 2260-2002 中华人民共和国行政区划代码GB/T 7408-2005 数据元和交换格式 信息交换 日期和时间表示方法WS/T XXXX-XXXX 卫生信息数据集分类与编码规则RFC 2396 统一资源定义符:通用语法3 术语和缩略语下列术语和缩略语适用于本标准。
3.1 术语3.1.1元数据 metadata定义和描述其它数据的数据。
3.1.2数据集 dataset具有一定主题,可以标识并可以被计算机化处理的数据集合。
3.1.3元数据元素 metadata element元数据的基本单元。
3.1.4元数据实体 metadata entity一组说明数据相同特性的元数据元素。
可以包含一个或若干个元数据实体。
3.1.5元数据子集 metadata section元数据的子集合,由相关的元数据子集和元数据元素组成。
3.1.6数据元 data element用一组属性规定其定义、标识、表示和允许值的数据单元。
3.2 缩略语XML (Extensible Markup Language)可扩展标记语言4 数据集概述4.1 数据集基本概念对数据集概念的详细解释可见WS/T XXXX。
4.2 卫生信息数据集对卫生信息数据集的阐述可见WS/T XXXX。
卫健委数据集标准指的是卫生健康信息基本数据集编制标准,具体标准号为WS/T 370-2022,该标准由中华人民共和国国家卫生健康委员会发布,代替了WS 370-2012《卫生信息基本数据集编制规范》。
与旧标准相比,该标准除编辑性修改外,主要技术变化如下:
1. 增加了第4章缩略语。
2. 修改了第5章内容结构,卫生健康信息基本数据集至少包含的内容由原来的7部分增加为9部分,增加的部分是术语和定义、索引。
3. 修改了 6.3 b)数据集类目编码(DCC),二级类目代码由原来的2位增加为3位。
此外,根据WS/T 305中规定的7个元数据子集,该标准选取了核心元数据中的8个“必选(M)”元数据元素,分为2个元数据子集,对卫生信息基本数据集进行描述。
WS 305中的数据集核心元数据描述规范适用于该文件。
以上内容仅供参考,如需更多信息,建议查阅国家卫健委官网或咨询专业律师。
卫生健康信息数据元目录第1部分:总则1范围本标准规定了卫生健康信息数据元目录内容结构、属性与描述规则、数据元目录格式和数据元索引的编制规则。
本标准适用于卫生健康领域卫生健康信息数据元目录的编制。
2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本标准必不可少的条款。
其中,注日期的引用文件,仅该日期对应的版本适用于本标准;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本标准。
GB/T2312信息交换用汉字编码字符集基本集GB/T7408数据元和交换格式信息交换日期和时间表示法GB/T17295国际贸易计量单位代码GB/T18391.3信息技术元数据注册系统(MDR)第3部分:注册系统元模型与基本属性GB/T19488.1电子政务数据元第1部分:设计和管理规范WS/T303卫生健康信息数据元标准化规则WS/T305卫生健康信息数据集元数据规范WS/T306卫生健康信息数据集分类与编码规则JT/T697.1交通信息基础数据元第1部分:总则3术语和定义GB/T7408、GB/T17295、GB/T18391.3、GB/T19488.l、WS/T303、WS/T305、WS/T306和JT/T 697.1中界定的以及下列术语和定义适用于本标准。
3.1数据元标识符data element identifier数据元目录中为数据元分配的与语言无关的唯一标识。
3.2数据元公用属性public attribute在数据元目录中数据元的属性值均相同的属性。
如本标准中注册机构。
3.3数据元专用属性specialized attribute在数据元目录中数据元属性值不相同的属性。
4缩略语DE数据元(Data Element)DI数据标识符(Data Identifier)VI版本标识符(Version Identifier)5内容结构卫生健康信息数据元目录包括以下内容:封面前言名称1范围2规范性引用文件3术语和定义4数据元目录4.1数据元公用属性4.2数据元专用属性数据元索引6数据元属性与描述规则6.1数据元属性设置数据元属性设置参照WS/T303,统一规定釆用5类13项属性,并按通用性程度分为两类:数据元公用属性和数据元专用属性。
卫生健康信息数据集元数据扩展原则与方法卫生健康信息数据集元数据的扩展是指为了更好地说明与描述卫生健康信息数据集中所包含的信息,从而提供更准确、全面、一致和可理解的数据,使其更易于被发现、使用和管理。
通过元数据的扩展,可以提高数据集的质量和可信度,促进数据的共享与复用。
扩展卫生健康信息数据集元数据的原则与方法如下:1.定义清晰的数据集范围:在扩展元数据之前,需要明确数据集的范围和目标。
明确数据集所涉及的主题、内容、时间范围、数据源等相关信息,以便可以更具体和准确地扩展元数据。
2.增加元数据字段:根据数据集的特点和需求,可以增加相应的元数据字段。
例如,可以增加数据集的主题、关键词、地理位置、时间范围、数据质量评估指标、数据格式、采集方式等字段,以便更好地描述数据集的特征和属性。
3.优化元数据标准与规范:在进行元数据的扩展之前,可以对已有的元数据标准与规范进行评估和优化。
通过比较与分析不同的元数据标准,选择适合数据集的标准,并对其进行扩展和修改,以便更好地描述卫生健康信息数据集。
4.建立元数据词汇表:为了统一和规范元数据的定义和描述,可以建立元数据词汇表。
在词汇表中定义元数据字段的含义、取值范围、格式等信息,以便用户在使用和管理数据集时能够准确理解和应用元数据。
5.添加数据质量与可信度指标:卫生健康信息数据的质量和可信度是数据应用的重要基础,在扩展元数据时可以添加相应的数据质量和可信度指标。
例如,可以添加数据的准确性、完整性、一致性等指标,以便用户能够更好地评估和使用数据集。
8.持续更新与维护元数据:元数据是动态的,随着数据集的更新和演化,需要持续更新和维护元数据。
及时更新元数据的变更、补充和删除,以保证元数据与数据集的一致性和时效性。
通过以上的原则和方法,可以有效地扩展卫生健康信息数据集的元数据,提供更详细、准确和可理解的数据,促进卫生健康信息的共享与复用,推动卫生健康信息化建设。