同济大学流行病学-第三章队列研究
- 格式:pdf
- 大小:135.59 KB
- 文档页数:15
流行病学中的队列研究设计队列研究设计在流行病学中的应用流行病学是研究疾病在人群中的分布和影响因素的科学,为了更好地理解和控制疾病,研究设计起着关键作用。
其中一种重要的研究设计是队列研究,它被广泛运用于流行病学研究中。
本文将详细介绍队列研究的设计和应用,以及其在流行病学中所扮演的角色。
一、什么是队列研究队列研究是一种观察性研究,它追踪研究人群中的个体,并记录他们的暴露情况和可能发生的结果,以便研究人员可以辨别暴露与结果之间的联系。
队列研究中,研究人员首先选择一个暴露群体和一个非暴露群体,并收集相关的暴露和结果数据。
然后,在一个相对长的时间段内,观察研究参与者的暴露历史和结果发展情况。
队列研究有两种类型:前瞻性队列研究和回顾性队列研究。
前瞻性队列研究也称为纵向队列研究,研究开始时参与者尚未发生预定结果,随着时间的推移观察结果的发展。
回顾性队列研究也称为历史队列研究,研究开始时参与者已经发生了指定的结果,然后研究人员回顾过去的暴露历史。
二、队列研究的优势队列研究设计有一些独特的优势,使其在流行病学中广泛应用。
首先,队列研究可以提供有关暴露和结果之间因果关系的强有力证据。
由于观察时间较长,研究人员可以确定暴露是否先于结果发生,并排除其他潜在因素的影响,从而更准确地评估暴露与结果的关联性。
其次,队列研究可以测量暴露对结果的影响的相对风险。
通过计算事件风险比或相对危险度,我们可以了解不同暴露组与非暴露组之间结果发生的概率差异。
另外,队列研究也可以同时研究多个结果,从而提供更全面的信息。
通过追踪参与者的多个结果,研究人员可以更好地了解暴露对不同结果的影响,进而提供更准确的流行病学信息。
三、队列研究的应用队列研究被广泛应用于流行病学的各个领域,尤其是慢性疾病的研究。
例如,通过前瞻性队列研究,研究人员可以追踪参与者的长期暴露情况,以评估吸烟与肺癌发生的关系。
此外,队列研究还可以用于研究其他慢性疾病,如心脏病、糖尿病和癌症等。
流行病学研究中的队列研究设计与分析在流行病学研究中,队列研究是一种常用的研究设计和分析方法。
队列研究是一种观察性研究,旨在探究暴露因素与疾病发生之间的关系。
本文将详细介绍队列研究的设计和分析原理,以及其在流行病学研究中的应用。
一、队列研究的设计队列研究可以根据研究对象的选择分为两类:前向队列研究和后向队列研究。
前向队列研究,也称为前瞻性队列研究或追踪研究,研究对象在研究开始时没有发生疾病,研究者根据暴露情况将研究对象分为暴露组和非暴露组,随后对其进行长期的观察,记录暴露因素与疾病的发生情况。
而后向队列研究,也称为回顾性队列研究或历史队列研究,研究对象在研究开始时已经发生疾病,研究者通过回顾相关数据来判断暴露因素与疾病的关系。
队列研究的优点在于可以确定因果关系,能够观察到疾病发生前的暴露因素情况,能够计算相对危险度,并且可以进行长期的追踪观察。
但是,队列研究也存在一些局限性,如研究周期长、费用高、可能存在记忆偏倚等。
二、队列研究的分析在队列研究中,研究者通常需要进行一系列的数据收集和分析操作。
下面将介绍队列研究中常见的一些分析方法。
1. 累积发生率(cumulative incidence rate)累积发生率是指在一段时间内,某种疾病在暴露组和非暴露组中的发生率。
研究者可以计算出两组的累积发生率,并比较差异。
2. 风险比(relative risk)风险比是队列研究中常用的一种相对危险度指标,用来比较暴露组和非暴露组在患病风险上的差异。
研究者可以通过计算相对风险比来评估暴露因素对疾病的影响程度。
3. 生存分析(survival analysis)生存分析是一种常用的队列研究的时间性质分析方法,用于研究通过时间来评估事件的发生概率。
生存分析可以帮助研究者估计一段时间内某种事件(如疾病发生)的发生率,并进行统计学检验。
4. 卡方检验(chi-square test)卡方检验是队列研究中常用的一种假设检验方法,用于比较观察频数与期望频数之间的差异。
流行病学中的队列研究设计与分析在流行病学研究中,队列研究是一种常用的观察性研究设计,用于探究某种特定疾病或健康结果与暴露因素之间的关系。
本文将介绍队列研究的基本概念、研究设计和分析方法。
一、队列研究介绍队列研究是一种长期观察个体的疾病发生情况和暴露因素的关联性研究设计,从而推测因果关系。
研究对象可分为前瞻性队列和回顾性队列。
前瞻性队列研究则先选择一群暴露和未暴露于某种因素的个体,再随访观察他们的发病情况;而回顾性队列研究则是在已经发生的事件或疾病群体中追溯暴露因素,然后判断发病的原因。
二、队列研究设计1. 前瞻性队列研究设计前瞻性队列研究的设计包括以下几个步骤:(1)选择研究人群:根据研究目标选择暴露和未暴露于某种因素的个体。
(2)暴露测量:明确暴露因素的测量方法,并且定期收集相关数据。
(3)随访观察:对研究人群定期进行随访,记录他们的暴露情况和疾病发生情况。
(4)结果评估:分析和比较研究人群的发病率,进而评估暴露因素与疾病之间的关系。
2. 回顾性队列研究设计回顾性队列研究的设计包括以下几个步骤:(1)选择研究人群:从已知事件或疾病的个体群体中选取暴露于某种因素的个体。
(2)暴露回溯:通过回顾性的方法收集个体的暴露历史和相关数据。
(3)结果评估:分析和比较研究人群的发病率,进而评估暴露因素与疾病之间的关系。
三、队列研究数据分析在队列研究中,数据分析是非常重要的一步,分析方法应遵循以下原则:1. 计算发病率:根据研究人群的发病情况和随访时间,计算出不同暴露组的发病率。
2. 构建生存曲线:使用卡普兰-迈尔曲线或其他相关方法构建生存曲线,比较不同暴露组的生存曲线是否有差异。
3. 风险评估:根据发病率和生存曲线,计算不同暴露组的风险比、风险差异等风险评估指标。
4. 考虑混杂因素:队列研究中可能存在多种混杂因素,需要进行控制或分层分析来减少混杂效应的影响。
5. 统计学检验:使用适当的统计学方法,如卡方检验、t检验或logistic回归等,评估暴露因素与疾病之间的关系是否具有统计学意义。
第三章 队列研究第一节 基本原理一、概念(一)定义队列研究(cohort study)又称群组研究、前瞻性研究(prospective study)、发生率研究(incidence study)、随访研究(follow-up study)及纵向研究(longitudinal study)。
队列研究——是将一个范围明确的人群按是否暴露于某可疑因素分为暴露组和非暴露组,或是按是否不同程度地暴露于某种可疑因素分为不同的亚组,追踪其各自的结局,比较不同亚组之间结局的差异,分析和推断该暴露因素是否是所研究疾病的危险因素或病因的一种研究方法。
(二)关键词1、暴露(exposure):是指研究对象接触过某种待研究的物质(如重金属)、具备某种待研究的特征(如年龄、性别及遗传等)或行为(如吸烟)。
暴露可以是有害的,也可以是无害的。
2、结局(outcome):是指疾病(包括疾病的不同类型和不同程度),或是某种健康状态或是死亡。
3、队列(cohort):是指一个特定的人群(群组)。
它是一组在特定时期出生的人群,或是一组有某种共同暴露或特征的人群。
固定队列(fixed cohort)——对象入队出队自始自终。
动态人群(dynamic population)——新对象随时加入,原成员不断退出。
4、危险因素(risk factor):又称为危险因子,泛指能引起某种疾病或不良健康状态发生或发生率增加的各种环境、行为、社会和遗传等因素。
二、基本原理:在一个特定人群中选择所需的研究对象,根据目前或过去某个时期是否暴露于某个待研究的危险因素,或其不同的暴露水平而将研究对象分成不同的组,如暴露组和非暴露组,高剂量暴露组和低剂量暴露组等,随访观察一段时间,检查并登记各组人群待研究的预期结局的发生情况(如疾病、死亡、或其他健康状况),比较各组结局的发生率,从而评价和检验危险因素与结局的关系。
判定:假使暴露组(或高剂量暴露组)预期结局的发生率显著高于非暴露组(或低剂量组)。
第三章 队列研究第一节 基本原理一、概念(一)定义队列研究(cohort study)又称群组研究、前瞻性研究(prospective study)、发生率研究(incidence study)、随访研究(follow-up study)及纵向研究(longitudinal study)。
队列研究——是将一个范围明确的人群按是否暴露于某可疑因素分为暴露组和非暴露组,或是按是否不同程度地暴露于某种可疑因素分为不同的亚组,追踪其各自的结局,比较不同亚组之间结局的差异,分析和推断该暴露因素是否是所研究疾病的危险因素或病因的一种研究方法。
(二)关键词1、暴露(exposure):是指研究对象接触过某种待研究的物质(如重金属)、具备某种待研究的特征(如年龄、性别及遗传等)或行为(如吸烟)。
暴露可以是有害的,也可以是无害的。
2、结局(outcome):是指疾病(包括疾病的不同类型和不同程度),或是某种健康状态或是死亡。
3、队列(cohort):是指一个特定的人群(群组)。
它是一组在特定时期出生的人群,或是一组有某种共同暴露或特征的人群。
固定队列(fixed cohort)——对象入队出队自始自终。
动态人群(dynamic population)——新对象随时加入,原成员不断退出。
4、危险因素(risk factor):又称为危险因子,泛指能引起某种疾病或不良健康状态发生或发生率增加的各种环境、行为、社会和遗传等因素。
二、基本原理:在一个特定人群中选择所需的研究对象,根据目前或过去某个时期是否暴露于某个待研究的危险因素,或其不同的暴露水平而将研究对象分成不同的组,如暴露组和非暴露组,高剂量暴露组和低剂量暴露组等,随访观察一段时间,检查并登记各组人群待研究的预期结局的发生情况(如疾病、死亡、或其他健康状况),比较各组结局的发生率,从而评价和检验危险因素与结局的关系。
判定:假使暴露组(或高剂量暴露组)预期结局的发生率显著高于非暴露组(或低剂量组)。
可推测该暴露因子可能是所预期结局的危险因素或两者之间存在病因学联系。
注意:队列研究开始时,全部的研究对象都还没有发生所研究的预期结局。
也就是说并不是所研究疾病的病人,而是在研究的观察期间,这些对象具有发生这种结局的可能性。
因此,队列研究具有以下特征:(1)观察性——对象的暴露是客观存在的,而不是人为安排的。
(2)比较性——研究比较不同暴露状态下,各组预期结局的发生率。
(3)时序性——观察对象在某种暴露状态下,疾病从无到有,是由“因”及“果”的研究。
(4)可以确证暴露与结局的因果联系,能准确地计算特定数目的暴露人群中结局时间的发生率,估计暴露人群发生结局事件的危险性。
这和描述性研究是不同的。
三、研究目的1. 检验病因假设:由于队列研究具有时序性特征,即由“因”及“果”的研究,并对结局的发生可较为准确的测量。
因此可深入检验一个或多个病因假设。
2. 评价因素的保护性效果:有些暴露有预防某结局发生的效应,即出现预防效果。
如戒烟可减少吸烟者肺癌发生的危险等,这里的预防措施不是人为给予的,而是研究对象自发行为。
这种现象被称为“人群的自然实验”。
3. 研究疾病自然史:队列研究可以观察人群从暴露于某因素后,疾病逐渐发生、发展,直至结局的全过程,不但可了解个体疾病的全部自然史,而且可了解全部人群疾病的发展过程。
四、研究类型队列研究依据研究对象进入队列时间及终止观察的时间不同分为:(一)前瞻性(prospective)队列研究,亦称为同时性或即时性队列研究,前瞻性队列研究的研究对象是在研究开始时即时纳入的,对象的确定和分组是根据其暴露状态分成的。
此时,研究的结局还没有出现,还需要前瞻观察一段时间才能得到。
优点:可以直接获得暴露和结局的资料,结果受偏倚影响小。
缺点:人群样本大,观察时间长,人力和物力消耗多,研究设计和实施较复杂。
(二)回顾性(retrospective)队列研究,亦称为历史性队列研究和非即时性队列研究。
回顾性队列研究的研究对象的确定和分组是根据研究开始时已获得的历史资料中的暴露情况而决定,结局在研究开始时已从历史资料中获得。
由于对象在过去某个时点进入队列,然后又从历史资料中获得的对象从该时点至现时点中结局的发生情况,虽然暴露资料的收集和结局的判断在同时完成,但其性质仍属于前瞻性的。
优点:在较短的时间内完成需要数年或数十年的观察和资料的收集工作,研究时间短,节省人力、物力。
缺点:暴露情况不能为研究者所控制,观察及收集暴露和结局信息受历史资料的限制。
研究的有效性受历史资料的完整性、全面性和准确性的影响。
(三)双向性(ambispective)队列研究,也称混和型队列研究,即在回顾性队列研究之后,继续进行前瞻性队列研究,因而发挥了两者的优点,弥补了两者的不足。
第二节 队列研究的设计和实践一、确定研究因素研究因素又称为暴露因素、暴露因子、暴露变量,通常是在描述性研究和病例对照研究的基础上确定的。
应根据对象的暴露水平、暴露时间等对暴露因素进行定量,即规定具体的标准和方法,并收集有关暴露方式、暴露间歇的信息。
对可能影响暴露因素与疾病结局联系的其他暴露因素和对象的背景资料也应加以收集。
二、确定研究结局结局变量(outcome variable)也叫结果变量,简称为结局,是指观察人群中出现的预期结果事件(疾病、死亡或某种健康状态)。
结局是队列研究的观察终点。
要说明的是,在研究中因其他疾病而死亡,则不是结局。
此外,结局不仅限于发生某种疾病而死亡,还可以是各种检查指标达到了某一水平。
三、确定研究现场与研究人群(一)研究现场由于队列研究要求获得足够的预期结局发生数,并且要求长时间的随访。
因此,既要考虑研究现场具有代表性,又要考虑那些较好的组织管理体系,能够完成长期随访的现场,同时获得调查人群的理解和支持也很重要。
(二)研究人群队列研究的人群包括暴露组和非暴露组,及不同水平的暴露亚组。
1、暴露人群的选择暴露人群是指已经处于某种暴露因子或已有某种暴露史的人群。
(1)职业人群——选择因某种职业原因,暴露于某种特殊危险因素的人群作为暴露人群。
(2)特殊暴露人群——某些特殊的暴露可能与疾病关联。
此时选择有特殊暴露史的人群作为暴露人群。
(3)一般人群——对人群中常见疾病的危险因素研究时,常选择一般行政区域或社区人群为对象。
(4)有组织的人群——是一般人群的特殊形式。
如学生、军人、医生、护士等,这类人群便于医疗就诊和随访观察结果。
2、对照人群的选择对照人群的设立是为了与暴露人群进行比较,这也是分析性流行病学研究的共性之一。
通过与暴露人群的比较,来验证病因假设。
原则要求对照人群除所研究的暴露因素外,其他各种因素或人群特征尽可能与暴露组相似。
(1)内对照——是指在同一人群中,根据某暴露因素的分布的不同,分为暴露组和非暴露组。
(2)外对照——是指先选定暴露因素外,其他方面与暴露组相似的对照组。
(3)特设对照——另选一个除暴露因素外,其他方面与暴露组相似的对照组。
(4)总人口对照——是根据现有的发病或死亡统计资料,以某个地区的总人口的率为对照。
(5)多重对照——是设计不同暴露程度的多组对照组与暴露组进行比较,也可以选择上述两种对照组分别与暴露组比较,旨在减少或去除由于一种对照带来的偏倚。
四、确定队列大小(一)队列研究样本量的决定因素1、一般人群(对照人群)中所研究疾病的发病率(P0),P0越接近0.5,要求样本量越大。
2、暴露组与非暴露组的发病率之差用(d)表示,暴露组的发病率用(P1)表示,两组发病率之差d= P1- P0,d越小,要求的样本量越大。
3.显著性水平即检验假设时的第Ⅰ类错误(假阳性错误)α值。
α值越小,要求样本量越大。
4. 效力又称把握度(1-β),β为检验假设时出现第Ⅱ类错误的概率,而1-β为检验假设时能够避免假阴性的能力。
若要求效力(1-β)越大,即β值越小,则所需样本量越大。
(二)样本量计算公式(详见教材)五、资料的收集和随访(一)基础资料的收集1、收集人口学资料——指收集对疾病的发生或死亡频率可能有影响的一般人口学资料。
2、查阅记录和档案——特殊暴露人群的职业史或医疗记录常有暴露水平或个体暴露剂量的资料。
3、询问队列中的研究对象——通常采用问卷调查表方式。
要注意的是:由于测量方式、应答率和回忆准确度的影响,所提供的资料有可能出现信息偏倚。
4、医学检查和生物标志的信息——有的研究因素需通过检查或检验才能得到数据。
5、环境测量资料——当暴露水平是基于环境中的累积暴露时,往往需要依赖环境监测信息。
(二)随访随访——是指在完成了对象纳入和基础资料收集后,确定各比较组研究结局变量发生情况的过程。
1、观察终点和终止时间观察终点——指一个研究对象出现了预期的结局。
终止时间——是指全部观察工作截止的时间。
失访——指某个研究对象因其他原因死亡或离开观察队列。
2、随访追踪对各比较组对象的追踪随访应持续到对象出现观察终点或达到观察终止时间。
随访观察的时间根据疾病的潜隐期、自然史、暴露时间的累积暴露程度而异,可长可短。
而间隔与次数将视研究结局的变化速度、研究的人力、物力等条件而定。
一般慢性病的随访间隔期定为1~2年。
第三节 数据资料的整理和分析一、 资料整理收集的资料,须经核查后,再输入事先建立的数据库中,并整理成表。
二、 人时的计算常用的人时单位是人年、人月、人日,最常用的是人年。
总人时——是指所观察对象的观察年(月、日)数。
例如100人观察10年等于1000人年。
三、 率的计算及其显著性1、累积发病率(cumulative incidence)累积发病率或死亡率适用于比较稳定的观察队列。
累积发病率=观察期内发病人群/观察开始时队列人数 ×10万/10万2、发病密度(incidence density)发病密度适用于动态队列,以人时为单位估计发病率。
用人时为单位计算发病率具有瞬时频率性质,故称为发病密度。
较常用的是人年发病率。
3、率的显著性检验样本量大,正态分布,疾病发生率不很低——u检验样本量大,正态分布,疾病发生率很低——二项分布或泊松分布也可以用卡方检验。
四、 效应的估计队列研究资料分析:首先是计算各组发病率、发病密度或发病率;然后对组内率的差异进行统计学检验。
差异有统计学意义则进一步确定暴露因素与疾病的关联强度。
1、相对危险度(relative risk,RR)也叫危险比(risk ratio)或率比(rate ratio),是反映暴露组发病率(死亡率)与非暴露组发病率(死亡率)的比值。
也可以是比较不同暴露程度组发病率(死亡率)的比值。
RR说明暴露与某可疑危险因素后,暴露组发生结局的危险性是非暴露组的多少倍。
说明:RR=1,暴露因素与疾病无关联。