医学科研数据的整理与分析

  • 格式:ppt
  • 大小:13.24 MB
  • 文档页数:67

下载文档原格式

  / 67
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

结 果
一、原始数据的检查
检 主要检查内容: 查 有无缺失(漏填)数据。
有无字迹不清。 整 有无用错单位的数据。 理 有无数据超出范围。如年龄超出入组标准的允许 范围。 分 有无不合逻辑数据。如舒张压大于收缩压。

结 果
检 原始记录的修改: 查 发现错误应当由研究人员在原始记录上修改。 整 修改时不可覆盖原数据,以便以后了解。 理 一般用一条细线条划过原来的数据,写上正确数据,

五、数据的整理
检 (二)数据的分组 查
数值变量资料:频数分布表
整 理
资料的类型
分类变量资料:行×列表
有序分类资料 无序分类资料
分 析
结 果
第二节 科研数据分析方法的选择
检 查
统计指标
整 理
统计描述 统计表
统计图
统计分析
统计推断
假设检验
Text
区间估计
分 析
变量间关系的研究、判别分析等
结 果
统计描述
整 理
分 析
机检查,即由数据管理人员编写检查程序并检查, 检查内容主要是范围检查和逻辑检查。 运行检查程序可以检查出在目视检查时没有查出 的超出范围、不合逻辑和各变量数据间互相矛盾 的数据。 对于检查出来的错误,需再次送往研究者进行改 正。数据管理人员以改正后的数据再次更正数据 文件,如此反复,直至再也找不出错误。
检 录入数据之前有要做: 查 1. 给每一个对象一个编号以识别录入的数据与对象的对应 关系 2. 给输入的变量定义名称 整 3. 需要对变量的调查结果进行数量化 理
数据的双份输入:
分 析 为避免输入错误,由2名输入员独立地对同一批数据输入, 由此应该形成2个相同的数据文件。
结 果
数据的计算机检查
检 当2份数据完全一致后,应当再进行数据的计算 查
检 查
整 理
分 析
结 果
检 查
整 理
分 析
结 果
检 查
整 理
分 析
结 果
统计推断
检 查
估计与检验
总体
整 理
分 析
样本 统计量
样本
结 果
统计推断:区间估计
检 查
▲概念:根据样本统计量,按一定的可信度 计算 出总体参数很可能在的一个数值范 围,这个范围称为参数的可信区间。
整 理
分 析
结 果
区间估计
检 总体均数(μ)的100(1-α)%可信区间(CI): 查
(1)已知总体标准差σ,按正态分布原理,计算公式为:
整 理
x uα σ x
(2)σ未知,n较小,按t分布原理计算:
分 析 (3)σ未知,n足够大(如n>100),按正态分布原理计算: 结 果
x t,υ s x
x uα s x
区间估计
医学科研数据的整理与分析
主要内容
检 查 1
2 3 分 析
科研数据分析前的准备工作 科研数据分析方法的选择 不同设计类型的数据分析方法 论文中统计结果的表达与解释
整 理
4
5
结 果
数据分析中存在的问题
第一节 科研数据分析前的准备工作
检 查
原始数据的检查
整 理 数据的计算机录入
分 析
缺失及可疑数据 数据的整理
整 理
分 析
结 果
例:在一个滴眼药的临床试验中,入选者58人,其中3 例失访,另有5 检 例因未能坚持定期随诊而被淘汰。作者以50 例计算不良反应率。结 查 果,国产制剂组30 例,不良反应率为13/30=43.3%。进口制剂组20 例 不良反应率为2/20=10% 。作者说:“患者失访及淘汰的8例中,主要 原因之一是点药后疼痛感明显”。
结 果
三、缺失及可疑数据
检 查
整 理
缺失数据是指其测量结果缺失。 例如在问卷调查时遗漏出生日期和年龄,调 查结束后又无法补救而使个别研究对象的 年龄成为缺失数据;血脂或血糖因为血清 量不足或研究对象拒绝采血而导致某些研 究对象实验室的检测结果成为缺失数据。
分 析
结 果
可疑数据的处理
检 查
过大或过小的数据称为可疑值。可疑值可能是测 定值随机波动的极度表现,它虽与其它数据相差 较远,也可能同属一个总体。 发现可疑值后,首先应从专业、技术与操作方面 进行检查,寻找可能发生失误的原因。若查明属 于粗枝大叶、中途条件改变、未遵守操作规程、 仪器或试剂失灵等,则应舍弃该可疑值。若进行 认真检查,未发现可以解释的原因,则应以统计 方法判断取舍。
修改者必须在修改处旁边签名并写明修改日期。
分 析
结 果
二、数据的计算机录入
检 查
整 理
常用的数据管理软件有: Microsoft FoxPro、Microsoft Access、 Microsoft Excel 应用广泛的数据分析软件有: SAS 和 SPSS
分 析
结 果
二、数据的计算机录入
结 果
四、数据的整理
检 (一) 数据的转换 查 偏态分布资料数据转换
数据变量转换的方法很多,可以根据数据的分 布特征,选择合适的数据转换方法。常用的方 整 法有对数变换,平方根变换或倒数变换等。 理 数据转换的目的: 分 ① 使偏态分布接近正态分布; 析 ② 消除多组资料均数与标准差的正比关系。多见 于用百分比做观察结果的数值变量资料。 结 资料类型的转换
检 查
数值变量资料
整 理
分类变量资料
绝对数 相对数:率 相对比 构成比 R ×C表
分 析
正态分布 x s 非正态分布 M Q 频数分布表
结 果
直方图 、 线图、 条图等
检 查
整 理
分 析
样本不是过小时,按正态分布规律,平均数减3个标准差仍应是正数。
结 果
Leabharlann Baidu
此例应采用适合偏态分布的中位数和四分位数间距。
整 理 显然,这8例都曾用药,而且反应不良,应该参加不良反应的分析。
分 析
由于排除了这8 例,大大地缩小了不良反应率。由于作者未能说明这 8例各用的是什么药,因而,我们也无法计算这2 种药真正的不良反 应率。作者的结论为:“药物的不良反应以疼痛为主,但大多数患者 均能忍受”。这一结论显然是不够确切的,因为太多的人不能忍受。
检 查
总体率的可信区间估计
查表法 当n≤50时 正态近似法 当样本含量足够大,且样本率p和(1-p)均不
太小。一般认为np和n(1-p)≥5。
整 理
分 析
p±uαsp
结 果
统计推断:假设检验
检 查
什么是假设检验?
已知健康成年男子脉搏均数为 72次/min 。
整 理
某医生随机抽查了 25 名某病成年男性病人,求 得脉搏的均数为 75.5 次 /min ,标准差为 5.0 次 /min ,能否据此认为该病病人的脉搏均数与一 般健康成年男子的脉搏均数有差别?