医学统计学
第二章数据管理与质量控制
掌握:EpiData软件的操作;数据管理的目的与组成。 熟悉:数据管理过程中的质量控制;常用的数据管理软件。 了解:数据库的产生与应用
从数据本身上来说,是指对数据的组织、定位、存储、 读写、检索等;从实验角度而言,是指才能够研究开始至研 究结束所得到得全部研究数据,转换为最终分析数据库全过 程中所进行的数据方面的据库的构成
3.数据库的应用
4.数据库的优越性
1.EpiData:数据的管理,数据的录入、整理。 2.统计分析软件:SPSS
SQLserver/Oracle/Access/excel
EpiData 是由丹麦的Jens M、Michael B和英国Mark M 设计,编程者为Michael B。免费从互联网下载。
质量控制就是运用先进的科学技术和统计学方法控制科学试 验及其过程,使得结果符合事先设计的标准,并保证试验数 据真实可靠。
尤其是原始数据的获取,是数据录入及数据整理的基础和前提。
1.数据的获取首先要保证操作规范 2.对获取的数据进行逐级审核 资料的完整性和衔接的正确性; 3.手工审查原始资料,数据获取的质量控制应在数据录入前 完成
录入文件:录入完一份数据选择存盘
1.数据双录入:是指两个人对同一资料进行 录入,然后对两个人的录入结果进行差异比 对纠错,以保证速度的可靠性和准确性。具 2.体操作:先将建立好的数据库备份到另一 个盘或电脑中,然后双人录入。数据录入完 成后,在数据处理阶段,由“一致性检验” 进行差异比对,然后对照原数据(纸质版原 始数据),修改不同数据即可。
打开文件:建立QES文件 打开epidata文件(可对REC文件编辑) 1.提前编辑的word版问卷直接复制。 2.手工录入,一行表示1个变量,词与词之间用空格键。 word版简单的姓名、年龄、性别可直接做变量名,较长变 量名可以使用n1,n2,n3或v1,v2,v3 注意:变量名一定要以英文字母开头,如n1,n2 3.字段编辑器对变量格式定义 根据专业要求和变量特点,定义好数据长度。 文本型用____定义。一个中文占2个字符,一般名字3-4个 字,加6-8个下划线。 数值型用#定义。一个#代表1个数值,如果最大值可能达 到1000,就有#### 日期类型用<yyyy/mm/dd>定义