数据质量评测方法与指标体系
- 格式:doc
- 大小:10.04 MB
- 文档页数:28
数据质量具体评测指标及方法说明一、主要评测内容重点评测个案库的数据完整性、逻辑关系准确性。
评测内容及指标计算方法会根据需要作适当调整。
二、具体评测指标及方法(一)主要数据项完整情况1、评测内容:重点评测个案库中的基本情况表,具体数据项包括姓名、性别、现居住地代码、户籍所在地代码、公民身份号码、出生日期、婚姻状况、户口性质等8项必填内容。
其中:每条个案记录中,只要任意一项主要数据项缺失,即认定为该条记录的主要数据项不完整。
2、评测指标:主要数据项完整率3、计算公式:主要数据项完整的人口总数—————————————×100%个案信息库包含的人口总数其中:主要数据项要通过单项逻辑校验,没有通过单项逻辑校验的视为数据项缺失。
校验规则如下:(1)性别、户口性质、婚姻状况数据项均不能为空错值;(2)姓名:7岁以上(含7岁)“姓名”不含“未取名”、阿拉伯数字、英文字母等不符合规范的文字,不少于两个汉字。
7岁以下人口不做此单项逻辑校验。
(3)公民身份号码:7岁以上(含7岁)“公民身份号码”不含空格、性别码与性别匹配、长度为15或18位、校验码正确。
7岁以下人口不做此单项逻辑校验。
(4)出生日期:不大于汇总数据时点。
(5)现居住地代码:不为空错值,当人员类别为外出时,现居住地代码不应为本地(6)户籍地代码:不为空错值,当人员类别为外来时,户籍地代码不应为本地(二)逻辑关系准确情况1、评测内容:分为单表审核、表间审核两种类型,共计7个审核内容。
其中,每条个案记录中,只要任意一项逻辑关系不准确,即认定为该条记录的逻辑关系不准确。
(1)若总人口数据“婚姻状况”为已婚(代码为20 – 23 29),则与配偶有关的信息项目配偶姓名、配偶身份证(配偶身份证错误也视为空)项均不为空;(2)育妇卡片“育龄妇女初婚日期”加15年不能小于“育龄妇女出生日期”;(3)若15-49岁育龄妇女总人口数据“婚姻状况”不为“未婚”或“未说明的婚姻状况”,则育妇卡片“育龄妇女初婚日期”不为空;(4)若15-49岁育龄妇女总人口数据“婚姻状况”不为“未婚”或“未说明的婚姻状况”,则育龄妇女至少有一条避孕记录。
住建大脑让数据成为生产力广联达成立于1998年,公司立足建筑产业,围绕工程项目的全生命周期,致力于实现建筑行业的数字化转型,我们以数字建构平台为引擎,打造住建大脑,让数据成为生产力。
为了发挥数据价值,提升决策效率,广联达以I T系统与数据为双轮驱动辅助决策。
随着数据量、数据种类、数据维度越来越多,要解决的问题越来越复杂,以算法驱动的大数据创新开始兴起。
建筑行业是劳动密集型、资金密集型行业,我们需要分析数据来创新业务模式。
为此,广联达承接了贵州住建云D T项目规划。
该项目构建了“1235N”的顶层设计架构:“1”是指建筑产业大数据中心,“2”是指省级、市级两级组织,“3”是指基础政策、基础规范、基础平台,“5”是指智慧政务、智慧建设、智慧房产、智慧运行、智慧增值,N是指数据共享交换、数据子系统等多项扩展。
在确定了顶层设计架构之后,我们需要思考的是如何利用数据提高决策效率,因此,我们提出了“住建大脑”。
“住建大脑”是基于智慧住建云平台,以“云、大、物、移、智、CI M、BIM”等现代科技为支撑手段,全面整合住房和城乡建设各领域运行数据,打造“零时间决策、零距离指挥、零时空监管”的精准决策大脑中枢。
我们在应用层提出了“3336”架构。
第一个“3”指的是三类用户对象:业务用户、技术用户、社会用户。
第二个“3”指的是三大方向:政用、民用、商用。
第三个“3”指的是三级步骤:—广联达科技股份有限公司产业大数据总监李胜旗目前,建筑行业智能化、数字化、产业化转型已然来临。
未来,广联达将围绕规建管一体化部署战略,以期达到建筑行业的物联、数联和智联。
从数据资源到数据资产,再到数据资本转变;最后一个“6”指的是六大模块:数据资源、数据流通、数据应用、数据问责、管理中心和数据运营。
贵州住建云D T项目的实施成效如何呢?第一,聚集了数据资源,把数据资源聚成数据“超市”,数据就像超市里的商品一样,被整整齐齐地码在货架上,数据的来源、内容、功能都一目了然。
iqa评测方法iQA评测方法是指利用信息技术和统计学方法对实验数据进行分析,从而得出质量评价结论的方法。
iQA评测方法主要适用于对生产质量及其变化趋势进行监控,为生产提供指导,并对产品进行质量比对,为不断提高产品质量提供有力支持。
iQA评测方法主要包括样本准备、实验设计、数据采集、质量指标计算、统计分析、结论得出等步骤。
首先,需要准备符合要求的样本,并进行实验设计。
其次,采集数据并进行质量指标计算,将数据进行整理与处理,以便进行统计分析。
最后,通过统计分析得出结论,并对生产进行指导。
iQA评测方法主要有以下特点:1、准确性高:iQA评测方法采用了信息技术和统计学方法,可以通过收集大量的数据并对其进行分析,提高评价的准确性。
2、可重复性强:iQA评测方法可以对数据进行分析和比对,从而减少人为的干扰,增强评价结果的可重复性。
3、应用范围广:iQA评测方法可以适用于各种生产领域,对生产质量进行监控,具有广泛的应用前景。
iQA评测方法可以发挥以下作用:1、正确判断质量:iQA评测方法提供了一种科学的手段,可以帮助生产者准确判断产品的质量,避免出现质量问题。
2、实现效率提升:iQA评测方法可以对生产过程进行监控,从而提高工作效率,减少浪费,节省成本。
3、提高产品质量:iQA评测方法可以比对产品质量,指导生产过程,并及时发现问题,不断改进产品质量,提高客户满意度。
在实施iQA评测方法时,需要注意以下几点:1、选取恰当的样本,样本应具备代表性;2、建立起完善的质量指标体系,对数据进行充分的收集与整理;3、选用适当的统计学方法,对数据进行正确的分析;4、为了得到可信的结论,需要充分考虑干扰因素的影响,进行充分的数据比对。
总之,iQA评测方法是一种科学有效的质量评价方法,可以帮助生产者正确判断产品质量,改进产品质量,提高生产效率,为生产提供指导。
在实施中需要注意充分准备和合理设计,以保证该方法的可靠性、准确性和可行性。
大模型合规标准和评测体系与方法
1. 法律法规与伦理道德,大模型的合规性评估需要考虑国家和
地区的法律法规,以及伦理道德标准。
例如,个人隐私保护、数据
安全性、歧视性风险等方面的合规要求,评估体系需要包括对这些
法律法规和伦理道德准则的遵守程度。
2. 安全性与可解释性,大模型的安全性评估需要考虑模型的鲁
棒性和抗攻击能力,以及模型的可解释性。
评估体系可以包括对模
型的对抗攻击测试、鲁棒性评估、可解释性分析等内容。
3. 数据质量与可靠性,评估大模型的数据质量和可靠性也是重
要的一环。
评估体系可以包括对数据采集、清洗、标注等环节的质
量控制,以及数据在模型训练和应用过程中的可靠性分析。
4. 公平性与包容性,大模型的公平性和包容性也是评估的重要
方面。
评估体系需要考虑模型在不同群体之间的公平性表现,以及
模型对多样性和包容性的支持程度。
5. 社会影响与风险评估,评估大模型还需要考虑其对社会的影
响和潜在风险。
评估体系可以包括对模型应用场景的社会影响分析,
以及模型可能带来的潜在风险的评估。
总的来说,大模型合规标准和评测体系与方法需要综合考虑法律法规、伦理道德、安全性、可解释性、数据质量、公平性、包容性以及社会影响等多个方面,以确保大模型的合规性和可信度。
同时,评测方法需要不断更新和完善,以适应人工智能技术的快速发展和应用。
附件中小企业数字化水平评测指标(2024年版)一、主要内容《中小企业数字化水平评测指标(2024年版)》延续2022年版整体架构,从数字化基础、经营、管理、成效四个维度综合评估中小企业数字化发展水平,并对评测方式进行了调整优化,其中,数字化基础、管理和成效三个维度采用评分的方式确定等级,数字化经营部分用场景等级判定的方式确定等级。
主要内容如下:1.数字化基础、管理和成效维度由3个一级指标,9个二级指标,15个采集项组成。
采用评分方式判定中小企业该部分数字化水平等级。
一级指标数字化基础数字化管理数字化成效二级指标设备系统数据采集信息系统信息安全规划管理要素保障绿色低碳产品质量市场效益采集项网络建设设备数字化设备联网数据采集信息系统网络安全数据安全规划实施管理机制人才建设资金保障绿色低碳产品质量市场表现价值效益2.数字化经营维度由4个一级指标、16个二级指标组成,均为中小企业数字化转型的应用场景,并将应用场景进行等级划分。
结合中小企业数字化转型实际,按照不同等级场景选择的要求,判定中小企业该部分数字化水平等级。
一级指标产品生命周期数字化生产执行数字化供应链数字化管理决策数字化二级指标产品设计*工艺设计营销管理*售后服务计划排程生产管控*质量管理*设备管理*安全生产*能耗管理*采购管理*仓储物流*财务管理*人力资源协同办公决策支持备注:标*为约束性场景(共计10项),是引导企业深度改造的重点场景;剩余为指导性场景(共计6项)。
二、判定方法依据数字化基础、管理及成效评测得分和数字化经营应用场景等级判定(须同时满足两部分要求),将中小企业数字化水平划分为四个等级:一级(初始级)、二级(规范级)、三级(集成级)、四级(协同级)。
判定方法为:等级要求(同时满足)数字化基础、管理及成效数字化经营应用场景一级(初始级)≥20分不少于6个应用场景(其中不少于3个约束性场景)等级需达到一级二级(规范级)≥40分不少于6个应用场景(其中不少于3个约束性场景)等级需达到二级三级(集成级)≥60分不少于8个应用场景(其中不少于5个约束性场景)等级需达到三级四级(协同级)≥80分不少于10个应用场景(其中不少于6个约束性场景)等级需达到四级备注:如企业无法满足最低级一级相关要求,则归类为无等级。
信通院大数据评测标准-概述说明以及解释1.引言1.1 概述在当今信息技术日益发展的背景下,大数据已经成为推动社会进步和经济发展的重要力量。
然而,由于大数据的特点和复杂性,评测大数据系统的性能和质量也变得尤为重要。
为此,信通院(中国信通院)制定了一套综合评测标准,旨在对大数据系统进行全面、客观、科学的评测和验证。
大数据评测是指通过一系列系统化的方法和工具,对大数据系统的功能、性能、可靠性、安全性等各方面进行检验和测评。
这项工作旨在为企业、政府和研究机构提供科学决策和参考,推动大数据技术的应用与创新。
信通院大数据评测标准是在对现有国内外相关研究和标准进行深入分析和比较的基础上,结合我国大数据产业发展的实际需求而制定的。
该标准包括了大数据系统的基本要求、评测指标、评测方法和评测流程等内容,具有较高的权威性和可操作性。
本文将详细介绍信通院大数据评测标准的概念、内容和应用,旨在帮助读者深入了解大数据评测的重要意义以及信通院标准在此领域中的地位和作用。
同时,本文还将对未来大数据评测的发展进行展望,探讨如何进一步完善评测标准,提高评测效率和准确性。
请继续阅读下文,以了解信通院大数据评测标准的全貌和其对于大数据产业发展的积极意义。
1.2文章结构文章结构的主要内容包括引言、正文和结论三个部分。
引言部分主要是对整篇文章进行概述,简要介绍大数据评测标准的背景和意义,并给读者提供预期结果。
引言部分的目的是为了吸引读者的注意力,让读者了解文章的重要性和价值。
正文部分是文章的核心部分,是对信通院大数据评测标准的深入介绍。
正文部分主要包括以下内容:2.1 大数据评测概念:首先对大数据评测的概念进行解释和阐述,说明大数据评测的定义、目的和基本原则,为读者打下基础。
2.2 信通院大数据评测标准介绍:详细介绍信通院制定的大数据评测标准,包括标准的起源、制定的背景和过程。
同时,对标准的主要内容、关键指标和评测方法进行详细说明,以便读者了解该标准的具体内容和实施方式。
数据质量评估指标 36344
数据质量评估指标是用来衡量数据质量的标准和指标。
在数据管理和数据分析中,确保数据质量是非常重要的,因为低质量的数据会导致错误的决策和分析结果。
以下是一些常见的数据质量评估指标:
1. 完整性,衡量数据是否完整,即数据是否缺失某些字段或数值。
常见的指标包括缺失值的百分比和数据记录的完整性。
2. 准确性,评估数据的准确性,即数据是否真实、可信。
准确性可以通过与其他数据源的比对来评估,或者通过专家判断来确定数据的准确性。
3. 一致性,指数据在不同数据集之间是否一致。
例如,同一实体的数据在不同数据库中是否一致。
4. 及时性,衡量数据更新的及时性,即数据是否及时反映了最新的信息。
这对于需要实时数据的应用非常重要。
5. 唯一性,评估数据中是否存在重复记录,以及如何处理重复
数据。
6. 合法性,评估数据是否符合相关法律法规和标准,例如个人隐私保护法规等。
7. 可理解性,评估数据是否易于理解和解释,包括数据的命名规范、单位标准等。
这些指标可以根据具体的数据管理需求进行调整和补充,但通常来说,综合考虑以上指标可以全面评估数据的质量。
在实际应用中,可以结合使用这些指标来建立数据质量评估体系,以确保数据质量得到有效管理和控制。
信息化水平评测体系指标说明随着信息技术的快速发展,信息化已经深深地渗透到我们的日常生活和各个行业领域中,贯穿于经济、政治、文化、军事、教育、医疗等各个方面。
信息化水平评测体系的建立对于各个单位和组织来说具有重要意义,它不仅可以帮助评估信息化的成效和效益,还可以指导全面推进信息化建设,提高整体的信息化水平。
一、信息化基础设施建设信息化基础设施是实现信息化的物质基础,它包括硬件、软件、网络和数据等方面。
信息化基础设施建设是评价一个单位或组织信息化水平的重要指标。
1.硬件设施建设:包括计算机设备、服务器、存储设备、网络设备等硬件设备的规模、质量和使用情况。
2.软件应用建设:包括应用软件的种类、使用率、安全性等方面。
3.网络建设:包括宽带网络的覆盖范围、速度、稳定性等指标。
4.数据管理:包括数据采集、存储、管理和共享等方面。
二、信息化应用水平信息化应用水平是评价一个单位或组织信息化水平的核心指标,它反映了信息技术在工作和生活中的应用程度和广泛程度。
1.信息系统建设:包括各类管理信息系统、决策支持系统、企业资源计划系统等的建设和使用情况。
2.数据资源利用:包括数据的获取、整理、分析和利用情况。
3.业务流程:包括对现有业务流程进行改造和优化,实现信息化管理和服务的全面升级。
4.应用创新:包括创新型应用软件的开发和普及,推动信息化在各行各业的深度应用。
三、信息安全保障水平信息安全是信息化建设的重要问题,信息安全保障水平是评价一个单位或组织信息化水平的关键指标。
1.网络安全:包括防火墙、入侵检测、数据加密等网络安全技术的使用和安全防护措施的建立。
2.信息安全管理体系:包括信息安全政策、安全责任制度、安全培训和安全审计等方面。
3.数据保护:包括数据备份、恢复和数据隐私保护等方面。
4.信息安全事件应对:包括信息安全事件的监测、溯源、处置和应急响应能力。
四、信息化管理水平信息化管理是保证信息化建设顺利进行和持续发展的关键因素。
数据资产的价值如何评估?正文开始摘要作为一项公司资产,数据的重要性正日益凸显。
伴随着数据量和数据种类的不断增加,数据产生价值的机会也随之增多。
未来数据将成为一个重要的财富创造来源,并且越来越多地被视为一项值得重视的企业资产。
数据资产的评估问题,也将成为企业估值的核心问题之一。
数据资产作为一种新型的无形资产,在这方面的研究还十分欠缺,目前还没有一种完整的数据资产评估体系。
笔者基于对数据资产特点的分析,引入层次分析法(AHP)构建指标评价体系,采用专家打分法(Delphi)予以权重和得分的赋值,力求构建一个完整的数据资产评估模型,并实现评估结果的量化分析。
一数据资产的特点数据资产具有无形资产的属性,从这个角度出发,我们可以发现数据资产主要有以下特性:无消耗性、增值性、依附性、价值易变性。
无消耗性:数据资产的每次使用只需要花费很低的成本,不会因为使用频率的增加而磨损、消耗,与其他传统无形资产有相似性。
增值性:企业通过稳定发展,会促使数据资产在原有的基础上,数据规模和数据维度的不断积累,整体价值进一步提升。
依附性:与其他无形资产类似,数据资产不能独立发挥作用,其发挥作用和效应往往依附于相应的软件、硬件。
价值易变性:数据资产时刻受到数据容量、数据时效程度、应用场景等因素的影响,与其他无形资产相比,其价值更易发生变化。
二数据资产价值的构成数据资产受控于企业主体,依附于有形资产。
数据资产的价值受到众多变量因素的影响,例如数据的质量、数据在不同场景下的应用价值。
1数据质量价值数据只有应用在具体的场景中,才会体现其价值。
因此伴随着不同的场景,同样的数据会表现不同的价值。
数据价值是恒定的,但是又是需要不断被挖掘的,随着我们对不同行业的逐渐认知,数据的价值不断丰富。
我们可能难以穷尽数据在所有行业的整体价值,但我们可以就数据在某一具体行业、在当前阶段的价值的相对高低予以评估。
数据的价值受两个主要因素的影响:数据质量和数据应用。
项目编号文档编号中国科学院数据应用环境建设与服务数据质量评测方法与指标体系(征求意见稿)中国科学院数据应用环境建设与服务项目组2009 年9 月前言本规范是“中国科学院数据应用环境建设与服务”之标准规范建设成果之一。
本规范由中国科学院计算机网络信息中心科学数据中心提出并归口。
本规范由中国科学院计算机网络信息中心科学数据中心负责起草。
目录1 范围..........................................................................................................2 规范性引用文件................................................................................................3 应用..........................................................................................................4 术语..........................................................................................................5 数据质量评测制度..............................................................................................6 数据质量评测原则..............................................................................................6.1 科学性原则 (5)6.2 客观性原则 (5)6.3 系统性原则 (5)6.4 可操作性原则 (6)6.5 针对性原则 (6)6.6 引导性原则 (6)7 数据质量评测一般流程..........................................................................................7.1 数据质量需求分析 (7)7.2 确定评价对象及范围 (7)7.3 选取数据质量维度及评价指标 (7)7.4 确定质量测度及其评价方法 (8)7.5 运用方法进行评价 (8)7.6 结果分析及评级 (9)7.7 质量结果及报告 (9)8 数据质量评价主体的要求........................................................................................9 数据质量指标体系...............................................................................................9.1 数据质量结构 (10)9.2 主要数据质量指标 (11)9.2.1 基本层 (12)9.2.2 准则层 (13)9.2.3 评价指标选取的基本要求 (16)9.2.4 评价指标的筛选和权重 (16)9.2.5 评测指标的冲突处理原则 (17)10 数据质量评测方法...........................................................................................10.1 定性方法 (18)10.1.1 第三方评测法 (19)10.1.2 用户反馈法 (19)10.1.3 专家评议法 (20)10.2 定量方法 (20)10.2.1 访问量统计 (20)10.2.2 计算机辅助检查 (21)10.3 综合方法 (21)10.3.1 层次分析法 (21)10.3.2 缺陷扣分法 (26)数据质量评测方法与指标体系1 范围本规范明确了用于中国科学院数据应用环境建设与服务项目中数据(资源)质量评测的一般方法与数据质量指标体系的建立方法。
本规范所提供的流程、方法和指标可适用于中国科学院数据应用环境建设与服务项目中建库单位内部的产品质量评价,日常统计监测制度,以及专家委员会领导下的项目质量检查。
本规范提供的评测方法与指标体系适用于数据资源(包括中间产物),不包括对数据生产与服务过程的评测。
2 规范性引用文件下列文件对于本文件的引用是必不可少的。
凡是注日期的引用文件,仅所注日期的版本适用于本文件。
凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
TR‐REC‐061 数据应用环境建设与服务标准规范框架3 应用本规范所提供的流程、方法与指标均为通用性内容,意在面向不同规模、不同学科背景和不同数据类型的各类数据库提供适应性,在执行过程中评测方可根据实际情况适当增删评测流程,并决定具体的指标体系和采样方法。
4 术语本规范所使用之术语遵循《TR‐REC‐061 数据应用环境建设与服务标准规范框架》第七部分的约定。
5 数据质量评测制度为确保科学数据信息资源管理与使用的有效与安全,最大限度保障投资者的利益与建设者的劳动,促进科学数据资源的共享利用,“中国科学院数据应用环境建设与服务”项目要求项目内数据库应建立数据质量评测制度。
“中国科学院数据应用环境建设与服务”项目资助建设的数据资源,应在项目结题前达到本规范提出的质量要求,并接受项目质量检查。
此外,建库单位应当根据具体情况适当开展以本标准为依据的日常数据质量监测统计。
6 数据质量评测原则科学数据质量评价应注重以下原则:6.1 科学性原则质量评价的结果应能正确反映数据资源的质量状况。
主要体现在正确的质量指标选择,以及采用科学合理的评价方法等方面。
评价必须有一定的理论作为基础,但又不能够脱离实际。
另外,科学性还反映适度的简单,评价不可能穷尽所有因素,也不能过于简单。
6.2 客观性原则评价应是符合实际、客观可信的。
评价指标的选择须考虑当前数据资源环境的总体水平,反映出不同学科领域的差异。
6.3 系统性原则由于评价对象的广泛性、复杂性、必须使用若干指标来衡量,同时指标间可能相互联系、相互制约。
但是,在评价中,每个指标又必须是独立的,不互相包容的,需考虑指标的层次性、系统性,避免指标间冲突。
6.4 可操作性原则科学合理的评价体系应该是可行的、操作方便的,指标的设计避免过于繁琐,还要考虑指标体系所涉及指标的量化及数据获取的难易程度和可靠性,注意选择能够反映科学数据质量状况的综合指标和具有代表性的指标。
6.5 针对性原则科学数据资源种类繁多,数据积累具有续性,各种资源除了具有与其他资源相同的共性之外,也具有其自身的特殊性。
数据质量评价应能充分考虑各类科学数据资源所特有的类型特征并能将其揭示出来,要在指标的权重和分值上予以区分,以体现其针对性的导向作用。
6.6 引导性原则进行科学数据质量评价,目的在于了解科学数据资源的质量情况,为有关的取舍提供判断依据,以帮助用户快速选择有针对性的信息。
因此,必须以方便专业人员快捷而有效的选择和获取有价值的信息资源为导向。
7 数据质量评测一般流程科学数据质量评价过程是评价者将数据质量评价程序应用于目标数据或数据集并最终获取评价对象质量状态的一系列步骤。
本规范提出科学数据质量评价的一般流程,具体于一个具体的执行过程中根据数据对象或学科背景有所不同仍可根据具体情况适当增删。
科学数据质量评价包括以下一般流程:数据质量评测一般流程数据质量评测过程是一个迭代过程,各个过程的先后顺序仅表达阶段活跃的大致顺序,根据实际执行情况的好坏决定,一些过程可能需要重复执行。
7.1 数据质量需求分析对科学数据的数据质量评价是以用户为中心进行的数据质量评价。
数据需求是人们在各项实践活动过程中,为解决所遇到的问题而产生的对数据的不足感和求足感。
数据资源不同于实体产品,具有用途个性化、多样化、不稳定等特点,因此,必须首先了解用户针对特定数据资源的需求特征才能建立针对性的评价指标体系。
7.2 确定评价对象及范围确定评价对象及其范围,评价对象既可以是数据项也可以是数据集。
7.3 选取数据质量维度及评价指标数据质量维度是进行质量活动中客体的具体质量反映,如正确性、准确性等,它是控制和评价数据质量的主要内容,因此,首先,要确定影响质量维度的因素有哪些,如人员素质、设备、设施等,必要时,要将这些质量影响因素在评价报告中进行分别说明。
对于有些影响多个质量维度的因素,应在具体情况下根据需要进一步细化其影响因素,或针对进一步细化目标环节在确定质量行为中的影响因素。
另外,要选取可测、可用的质量维度作为评价指标准则项,在不同的数据类型和不同的数据生产阶段,同一质量维度有不同的具体含义和内容,应该根据实际需要和生命阶段确定质量维度。
在此阶段要注意指标之间避免冲突,同时也要注意新增评价指标的层次、权重问题,以及与其它同层次指标的冲突问题。
对三级评价指标的选择可根据评价对象的类别、评价要求进行量化处理,必要时可进行计量评价法。
以当前技术条件无法量化的质量维度可适当使用具有相关性的替代指标。
7.4 确定质量测度及其评价方法数据质量评价在确定其对象范围后,应该根据每个评价对象的特点,确定其测度及实现方法,对于不同的评价对象一般是存在不同的测度的,以及需要不同的实现方法支持,所以应该根据质量对象的特点确定其测度和实现方法。
常用定性方法和定量方法,前者采用权重打分等方法进行,后者依据信息生产各阶段的质量规范一级缺陷判据进行。
7.5 运用方法进行评价就是根据前面四步确定的质量对象、质量范围、测量及其实现方法实现质量评测的活动过程。
评价对象的质量应当由多个质量维度和三级评价指标的评测来反映,单个数据质量测量是不能充分、客观评价由某一数据质量范围所限定的信息的质量状况,也不能为数据集的所有可能的应用提供全面的参考。
多个质量维度和三级评价指标的组合能提供更加丰富的信息,故对某数据质量范围限定的信息,应提供多个质量维度和三级评价指标的综合测量。
数据质量评测过程中应保证所采用的方法的正确和客观,尽量避免增加质量评价的干扰因素,最大程度的借助计算机及网络技术的自动化处理实现,追求全面客观的反映数据质量的真实情况。
特别对于定量的质量维度,要确定科学的定量测量的指标和方法,质量测量应当保证其所涉及的数据边界范围、系统参数等的正确和完备性。
7.6 结果分析及评级评测后要对评测结果进行分析:·对评价目标与结果进行对比分析,确定是否达到评价指标;·对评价的方案的有效性进行分析,确认是不是合适等。