第九章 常见偏倚及其控制
- 格式:doc
- 大小:79.50 KB
- 文档页数:4
第九章临床科研中常见偏倚及其控制方法第一节真实性、偏倚与机遇的概念一、真实性指一项观察或研究所推论观点的正确性及可靠程度,即所得结果反映研究对象的真实情况。
临床医学研究的目的是从样本人群,通过观察或研究,努力取得研究变量同结果变量间的真实联系,并将此真实联系推广到样本人群及其所属目标人群(或参照人群)范围内。
流行病学上将能正确反映样本人群及目标人群真实状况的研究结果的外延性称作内部真实性,若将该项研究成果推广到目标人群以外的其他人群仍然得到同样的结果,表明该项研究成果不但具有内部真实性,而且同时具有外部真实性。
一项没有内部真实的研究结果,不可能具有外部真实性,但有内部真实性的研究成果,不一定具有外部真实性。
样本偏倚是临床科研中特别值得注意的问题,许多临床研究是在三级医院中进行的,而三级医院是重病集中的场所,容易将疾病描绘得严重一些,在三级医院中所获得的研究结论有时并不适用于一般人群。
例如急性心肌梗死病死率,三级医院的资料常低于一般社会人群,原因是心肌梗死死亡的病人50%是发生在未送医院之前。
样本偏倚与后面要讲的选择性偏倚不同,样本偏倚仅涉及将医院里的研究结论推广到群体时产生,而不涉及内部真实性,而选择性偏倚涉及内部真实性,因此,临床工作者必须注意树立群体观点。
(见图9-1)(图9-1内部真实性与外部真实性二、偏倚指研究所得资料的推论偏离真值。
或者说,自样本人群所得变量与结果变量的联系,不能反映目标人群的暴露变量与结果变量的真实联系。
在临床科研中,偏倚是在研究对象各组间某变量有否差异的过程中产生的一种系统误差。
例如,甲治疗组的疗效优于乙治疗组;急性心肌梗死范围大的患者其预后比梗死范围小的患者要差;CT诊断脑瘤的符合率比放射性核素扫描为高等。
临床研究中所获得之各组变量间的差异,有时并非代表真实情况,这种现象就是偏倚(对真实情况的偏离)。
必须指出,与基础科学研究相比较,临床科研特别容易产生偏倚,因为临床科研的对象是人,不可能象动物那样做到组间基本情况均相等,而且病人还有心理变化,拒绝试验或中途退出试验等影响科研结果正确性的情况。
第九章常见偏倚及其控制(Biases and Their Control)第一节研究结果的变异性1、研究结果的变异性(Variability)数据(指标)的变动或波动。
它可存在于不同水平,包括个体水平,群体水平和样本(研究)水平。
2、变异性的来源:⑴生物学(真实)变异和测量变异:物学变异反映真实的客观变异,测量变异反映测量过程的误差。
⑵随机变异和系统变异:随机变异(误差)的绝对值和方向(符号)交错变化,并呈有界范围的正态分布。
系统变异(误差)的绝对值和方向保持恒定。
测量误差分为随机误差和系统误差。
3变异的水平:⑴个体水平的变异性:指某个体特征测量值的变化,它可以是个体真值随时间的改变,也可以是由于测量误差引起的变化⑵群体水平的变异性:可以看成是各个体的累计变异,因为构成群体的各个体具有不同的遗传素质并受到不同的环境影响。
群体的变异程度常常大于个体的变异。
也受到测量误差的影响。
⑶样本水平的变异性:指通过不同样本的研究所得结果的差异性。
第二节研究的真实性一、概述研究真实性或效度(Validity)指研究收集的数据、分析结果和所得结论与客观实际的符合程度。
研究误差是研究真实性的反面。
研究误差的两种常见类型:随机误差(random error)系统误差(systematic error)随机误差(random error):指随机抽样所得统计量与总体参数的差异由抽样(机遇)所致,通常与测量过程及其它变量的影响无关,无方向性可通过统计学方法估计和评价是不可避免的,但通过合理的设计、正确的抽样(加大样本量等)可使之减小系统误差(systematic error)随机误差以外的误差,任何研究都有发生的可能在流行病学调查研究中系统误差又叫偏倚(bias)可以通过严格的设计、实施、分析来尽可能地控制重复试验及增加样本含量并不能减小系统误差研究的可靠性或信度(reliability)亦称精确度(precision),就是反映研究结果中随机误差大小的程度,随机误差小则研究信度高。
第九章偏倚及其控制1.error2.bias3.validity4.reliability5.internal validity6.external validity7.selection bias8.information bias 9.confounding bias选择题1.下列偏倚中不属于选择偏倚的是A 入院偏倚B 现患病例偏倚C 回忆偏倚D 志愿者偏倚E 失访偏倚2.下列措施中不能控制混杂的是(A 匹配B 随机化C 分层分析D 多变量分析E 盲法简答题1.研究变异的来源有哪些?2.何谓选择偏倚,如何对其进行控制?填空题1.偏倚的类型分为、、。
信息偏倚的种类:和,后者常见类型有和。
参考答案1.误差:是指研究结果与真实性的偏差,可分为随机误差和系统误差。
2.偏倚:即系统误差。
样本人群测得的变量值系统地偏离了目标人群中该变量值的真实值,使在研究结果或推论结果时与真实情况间出现的偏差。
可分为选择偏倚、信息偏倚和混杂偏倚。
3.真实性:也称效度,是指研究收集的数据、分析结果和所得结论与客观实际的符合程度。
4.可靠性:也称信度或精确度,是反映研究结果重随机误差大小的程度,随即误差小择研究信度高。
5.内部真实性:是指研究结果与实际研究对象真实情况的符合程度。
6.外部真实性:是指研究结果与推论对象真实情况的符合程度。
7.选择偏倚:是在研究对象的选取过程重,由于选取方式不当,导致入选对象与未入选对象之间存在系统差异。
8.信息偏倚:又称测量偏倚或观察偏倚,是来自于测量或资料收集方法的问题。
9.混杂偏倚:是指混杂因素对暴露因素与疾病发生的相关(关联)程度产生的歪曲或干扰。
选择题1.C2.E简答题1.研究变异的来源有哪些?答:变异的来源分为两个层次:①生物学(真实)变异和测量变异,生物学变异反映真实的客观变异,测量的变异反映测量过程的误差。
②随机变异和系统变异,随机变异(误差)的绝对值和方向(符号)交错变化,并呈有界范围的正态分布。
第九章偏倚及其控制一、学习要求1. 应掌握内容偏倚的概念,以及流行病学三种主要偏倚的概念;控制混杂偏倚的分层分析方法的基本思路。
2. 需熟悉的内容研究真实性的概念,分类;选择偏倚、信息偏倚及混杂偏倚产生的原因及对结果真实性的影响。
3. 需了解的内容研究结果变异的概念及来源;分层分析的计算方法。
二、学习要点(一)研究结果的变异性1. 变异性的概念研究结果包括描述性和分析性数据(指标)的变动或波动,称为研究结果的变异性(variability)。
2. 变异性的来源与水平(1)变异的来源:包括生物学真实变异和测量误差,其中测量误差可再分为随机误差和系统误差。
(2)变异的水平:包括个体水平、群体水平和样本水平三个层次。
个体水平的变异性是指某个体特征测量值的变化,它可以是个体真值随时间的改变,也可以是由于测量误差引起的变化。
群体水平的变异性可以看成是各个体的累计变异,因为构成群体的各个体具有不同的遗传素质并受到不同的环境影响。
样本(研究)水平的变异性是指通过不同样本的研究所得结果的差异性。
(二)研究的真实性1. 真实性的概念及与研究变异性的关系(1)研究的真实性或效度(validity)是指研究收集的数据、分析结果和所得结论与客观实际的符合程度。
(2)研究的误差是研究真实性的反面,反映了研究数据的测量误差的程度,因此包括系统误差和随机误差两部分。
研究中的系统误差部分称为偏倚(bias)。
研究中的随机误差大小用信度(reliability)来反映,信度越高则随机误差越小,反之则随机误差越大。
2. 内部真实性和外部真实性(1)内部真实性(internal validity):是指研究结果与实际研究对象真实情况的符合程度,它回答一个研究本身是否真实或有效。
(2)外部真实性(external validity):是指研究结果与推论对象真实情况的符合程度,它回答一个研究能否推广应用到研究对象以外的人群。
(三)研究的偏倚1. 偏倚(bias)的概念研究误差中的系统误差部分称为偏倚。
第九章常见偏倚及其控制(Biases and Their Control)第一节研究结果的变异性1、研究结果的变异性(Variability)数据(指标)的变动或波动。
它可存在于不同水平,包括个体水平,群体水平和样本(研究)水平。
2、变异性的来源:⑴生物学(真实)变异和测量变异:物学变异反映真实的客观变异,测量变异反映测量过程的误差。
⑵随机变异和系统变异:随机变异(误差)的绝对值和方向(符号)交错变化,并呈有界范围的正态分布。
系统变异(误差)的绝对值和方向保持恒定。
测量误差分为随机误差和系统误差。
3变异的水平:⑴个体水平的变异性:指某个体特征测量值的变化,它可以是个体真值随时间的改变,也可以是由于测量误差引起的变化⑵群体水平的变异性:可以看成是各个体的累计变异,因为构成群体的各个体具有不同的遗传素质并受到不同的环境影响。
群体的变异程度常常大于个体的变异。
也受到测量误差的影响。
⑶样本水平的变异性:指通过不同样本的研究所得结果的差异性。
第二节研究的真实性一、概述研究真实性或效度(Validity)指研究收集的数据、分析结果和所得结论与客观实际的符合程度。
研究误差是研究真实性的反面。
研究误差的两种常见类型:随机误差(random error)系统误差(systematic error)随机误差(random error):指随机抽样所得统计量与总体参数的差异▪由抽样(机遇)所致,通常与测量过程及其它变量的影响无关,无方向性▪可通过统计学方法估计和评价▪是不可避免的,但通过合理的设计、正确的抽样(加大样本量等)可使之减小系统误差(systematic error)▪随机误差以外的误差,任何研究都有发生的可能▪在流行病学调查研究中系统误差又叫偏倚(bias)▪可以通过严格的设计、实施、分析来尽可能地控制▪重复试验及增加样本含量并不能减小系统误差研究的可靠性或信度(reliability)亦称精确度(precision),就是反映研究结果中随机误差大小的程度,随机误差小则研究信度高。
二、内部真实性内部真实性internal validity指研究结果与实际研究对象真实情况的符合程度,它回答一个研究本身是否真实或有效。
改善措施:限制研究对象的类型和研究的环境条件。
三、外部真实性外部真实性(external validity)研究结果与推论对象真实情况的符合程度,又称为普遍性(generalizability)。
它回答一个研究能否推广应用到研究对象以外的人群。
改善措施:增加研究对象的异质性,使得研究对象的代表性范围扩大。
如:多中心临床试验的开展第三节研究的偏倚1946年,Berkson做最著名的偏倚研究并给予证实,又称为Berkson偏倚。
选择偏倚1976年,Miettinen详细讨论了偏倚的定义,并给出分类框架,分三类信息偏倚混杂偏倚一、选择偏倚(selection bias)㈠定义:研究对象的选取过程中,由于选取方式不当,导致入选对象与未入选对象之间存在系统差异,由此造成的偏倚称为选择偏倚。
例如研究对象采用志愿者,方便样本,或者研究对象的无应答或失访等。
㈡常见的种类:1、入院率偏倚(admission rate bias)也叫Berkson偏倚,当利用医院病人作为病例和对照时,由于各种疾病的入院率不同导致病例组与对照组某些特征上的系统差异而导致的系统误差常见于以医院为基础的病例对照研究、临床防治试验、预后判断等。
2、现患病例—新病例偏倚(prevalence-incidence bias)也称奈曼偏倚(Neyman’s bias)在病例对照研究或现况研究中,用于研究的病例一般是现患病例或存活病例,由于形成的病例样本与单纯由新病例构成的样本暴露特点等不同,致使调查结果出现的系统误差在病例对照和现况研究中产生此偏倚的原因:⑴用于研究的病例一般是研究时的存活者- 现患病例(暴露特点和死亡病例不同)⑵某些病人在患病后,可能会改变其原来某些因素的暴露状况3、检出征候偏倚(detection signal bias)在疾病和暴露之外存在一个征候因素,即一种临床症状或体征;这种症状或体征不是疾病的危险因素,但人们因具有这种征候去就诊,从而提高了早期病例的检出率;致使过高地估计了暴露程度,因而发生了系统误差,最终可能得出该征候因素与该疾病有联系的错误结论4、无应答偏倚和志愿者偏倚(non-respondent and volunteer bias):无应答者是指研究对象中那些因为各种原因不能回答调查研究工作所提出的问题的人。
一项研究工作中的无应答者可能在某些重要特征或暴露上与应答者不同,由此产生的偏倚称为无应答偏倚。
常见于现况研究和队列研究。
大学生健康状况调查志愿者偏倚是与无应答偏倚相对的情况5、时间效应偏倚:㈢选择偏倚控制方法1、建立健全的健康信息系统(health information system,HIS)2、采用严格的科学的研究设计,了解整个研究中可能出现的选择偏倚严格掌握研究对象纳入排除标准取得研究对象合作,减少无应答、失访病例对照研究中尽量选择新诊断的病人作研究对象;用医院病人作研究对象时,尽量采用多种对照二、信息偏倚(information bias)㈠定义又称测量偏倚(measurement bias)或观察偏倚(observation bias),是来自于测量或资料收集方法的问题,使得获取的资料存在系统误差。
由于流行病学的暴露或疾病多为分类测量,所以信息偏倚又可称为错误分类(错分)偏倚(misclassification bias)。
表现为研究对象的特征被错误分类由于所收集的有关暴露或疾病的信息不准确或不完整,造成对研究对象的归类错误差异错分(differential misclassification)暴露或疾病的错误分类同研究分组有关,各比较组间存在差异;由于错误分类组间存在差异的偏向可能不同,所以造成高估或低估研究效应值无差异错分(non-differential misclassification)暴露或疾病的错误分类同研究分组无关,各比较组间不存在差异;在多数情况下模糊了研究组的差异,一般使研的效应值偏低(OR趋向1)㈡差异性信息偏倚的两种常见类型回忆偏倚(recall bias)产生于研究对象记忆过去活动和暴露能力的差异。
不可避免调查者偏倚(interviewer bias)产生于调查者对研究对象有差异性地收集信息。
采取盲法,可以降低调查者偏倚。
㈢信息偏倚的控制:①明确资料收集方法和严格质量控制②尽可能采用“盲法”收集资料③尽量收集客观指标的资料铅暴露④采用调查技巧避免回忆偏倚⑤严格的调查设计和研究人员的科学态度⑥调查之前应开展预调查三、混杂偏倚(confounding bias)㈠定义是指暴露因素与疾病发生的相关(关联)程度受到其他因素的歪曲或干扰。
混杂的本来含义是“混合掺杂”( mixing together ),这里是指暴露因素对疾病的独立效应与混杂因素的效应混在一起,造成对暴露因素效应的估计偏差。
㈡混杂因素的判断条件:必须同时具备以下三个条件:①必须是所研究疾病的独立危险因素②必须与所研究的暴露因素存在统计学联系以上是判断可疑混杂因素的两项基本条件③不应是暴露因素与疾病因果链中的一个环节或中间变量(否定或排除条件)(饮酒-肝硬化-肝癌)㈢混杂偏倚引起的假关联Ⅰ继发关联(secondary association)是一种纯粹由混杂偏倚产生的关联。
即怀疑的病因(暴露)E与疾病D并不存在因果关系,而是由于两者(E,D)有共同的原因C,E,D同C存在关联,从而继发产生E与D的关联。
Ⅱ直接因果关联的歪曲:如果怀疑的病因(暴露)E与疾病D既存在直接关联,又存在间接关联或与其他危险(保护)因素F存在相关,E与D的总关联等于E-D直接关联同E-F-D间接关联之和。
如果直接关联与间接关联混在一起,而将其作为直接关联的估计,就会出现混杂偏倚。
㈣判定原则:比较混杂因素调控前后的暴露因素效应估计值,如果存在专业上有意义的差异(注意不是统计学的显著性差异),就产生了混杂偏倚。
㈤混杂偏倚的控制设计阶段:采用随机化(randomization)、限制(restriction)进入或匹配(matching)分析阶段:采用分层分析、标准化率分析、多变量分析四、混杂偏倚的分层分析M-H(Mantel-Haenszel)分层分析方法的步骤对可能的混杂因素进行分层判定层间RR或OR是否相等或相近得到控制混杂后的调整RR或OR再将调整RR或OR与分层前的粗RR或粗OR(cRR或cOR)进行比较五、混杂偏倚与其它偏倚(选择及信息偏倚)的异同相同:是一种系统误差,不能通过增大样本量来控制不同:①后两种偏倚主要都限于样本内,即人群中实际无此误差。
②而混杂偏倚不止是样本的问题。
首先是某第三因子在目标人群中同所研究的结果变量存在固有的联系。
③一般偏倚(选择及信息偏倚)是一种错误,所造成的误差是我们不愿看到的,因此应尽量避免。
④对混杂偏倚来说,它告戒我们在下结论时应特别谨慎,但同时它在认识整个病因网的过程中起了一定的作用。
因为混杂因子往往正是某个结果变量的危险因子,应尽量去发现。
⑤有时受科学知识的限制,在设计和分析阶段未对其作适当的处理,结论仍会有第三因子、第四因子的混杂。