样本含量的估计(流行病学应用)
- 格式:pdf
- 大小:12.20 MB
- 文档页数:132
应用Epi info2002流行病学分析软件进行样本量的计算(“Epi info2002流行病学分析软件应用讲座”补充资料,主讲人:李海闽) (一)关于Epi info2002计算样本量涉及的几个概念1、把握度又称检验效能(power of test),是用数量描述的事物现象之间如果确定有一个真正的差别存在,能被显著性检验所检出的概率。
数理统计学用β表示II型错误的概率,1-β称为把握度。
做研究设计时,如果要求检出差别显著性的把握度越大,则要求样本含量也越多。
2、置信水平置信水平(confidence level)是置信度的互补概率。
例如95%置信度,其置信水平为0.05;99%置信度,其置信水平为0.01。
一般情况α取0.05,则置信度为95%(1-α=0.95)。
3假设检验的两类错误由于假设检验是根据有限的样本信息对总体作推断,不论做出哪一种推断结论,都有可能发生错误。
这就是假设检验的两类错误。
如果实际情况与H0不一致,检验结论为拒绝H0,接受H1, ;或者实际情况与H0一致,检验结论为接受H0;这两种推断结论都是正确的。
如果实际情况与H0一致,仅仅由于抽样的原因,使得统计量的观察值落到拒绝域,拒绝原本正确的H0,导致推断结论错误。
这样的错误称为第I类错误。
如果实际情况与H0不一致,也仅仅是抽样的原因使得统计量的观察值落到接受域,不能拒绝原本错误的H0,则导致了另一种推断错误。
这样的错误称为第II类错误。
表6-3 归纳了假设检验中两种实际情况和不同检验结论的关系。
犯第 I 类错误的概率用α来控制,其大小与检验水准相同。
根据研究者的需要。
常取为0.05 或0.01 等。
当α取为0.05 时,其意义是:如果原假设H0 成立,按照同样的方法在原假设H0 规定的总体中重复抽样,那么在每100 次检验结论中平均可以有5 次拒绝H0 (犯第I类错误)。
犯第II类错误的概率用β来控制。
因为H0 不成立时检验统计量的精确分布往往难以确定,所以在多数情况下准确估计β的数值比较困难。
无论是调查研究还是实验性研究,医学研究大都是抽样研究,最终目的在于利用实际观测得到的样本信息推断未知的总体特征,即统计推断。
抽样研究设计时需要回答一个非常关键的问题:样本中包含多少个研究对象(人、动物、生物学材料等)才能既满足统计学要求,完成有效的统计推断,又照顾研究的可行性、伦理学等实际问题,从而最大限度控制研究成本和研究风险,提高研究效率。
这就是样本含量估计(estimation of sample size)。
本章将从统计推断的目的出发,介绍样本含量估计意义及常用的计算公式,并在此基础上介绍检验效能的估计(power analysis)。
第一节样本含量估计的意义及方法一、样本含量估计的意义由于抽样研究中抽样误差不可避免,样本统计量与其所对应的总体参数间总是存在一定差异。
因此,尽量减小抽样误差是提高统计推断精度的必然要求。
在总体变异性确定的条件下,样本中所含的研究对象数越多,抽样误差必然越小,样本统计量的稳定性肯定越高,总体参数的估计精度越好,假设检验中的检验效能(power=1- )亦会越高,从而避免出现假阴性的结论。
同时在实验性研究中,只有在研究对象数量足够大时才能使随机分组更加有效,从而保证组间均衡性。
但在实际研究中,除了要考虑抽样误差外,还需考虑研究的可行性、结论的时效性、医学伦理以及非随机误差的影响等实际问题,并非研究对象数越多越好。
比如在改良肩周炎贴膏临床试验中,如果片面地追求大样本,研究中所需的人力、物力、财力等物质支持必然增大,研究的可行性下降。
由于需纳入更多病例,可能会延长产品研发周期,影响新药投产上市;若增加医院或临床实验中心参与该研究,又增加了组织协调的工作量和工作难度。
同时增加各种混杂、偏倚发生的机会,比如由于肩周炎发病、预后与季节、气候密切相关,临床病例接收时间太长,组内病例同质性差;测量仪器增多导致测量误差增大,观察疗效的医院、医生增多,研究结果的一致性降低等现实问题,使得试验结果难于分析或者难以合理解释,影响研究结论的科学性。
第十八章样本含量估计无论是调查研究还是实验性研究,医学研究大都是抽样研究,最终目的在于利用实际观测得到的样本信息推断未知的总体特征,即统计推断。
抽样研究设计时需要回答一个非常关键的问题:样本中包含多少个研究对象(人、动物、生物学材料等)才能既满足统计学要求,完成有效的统计推断,又照顾研究的可行性、伦理学等实际问题,从而最大限度控制研究成本和研究风险,提高研究效率。
这就是样本含量估计(estimation of sample size)。
本章将从统计推断的目的出发,介绍样本含量估计意义及常用的计算公式,并在此基础上介绍检验效能的估计(power analysis)。
第一节样本含量估计的意义及方法一、样本含量估计的意义由于抽样研究中抽样误差不可避免,样本统计量与其所对应的总体参数间总是存在一定差异。
因此,尽量减小抽样误差是提高统计推断精度的必然要求。
在总体变异性确定的条件下,样本中所含的研究对象数越多,抽样误差必然越小,样本统计量的稳定性肯定越高,总体参数的估计精度越好,假设检验中的检验效能(power=1- )亦会越高,从而避免出现假阴性的结论。
同时在实验性研究中,只有在研究对象数量足够大时才能使随机分组更加有效,从而保证组间均衡性。
但在实际研究中,除了要考虑抽样误差外,还需考虑研究的可行性、结论的时效性、医学伦理以及非随机误差的影响等实际问题,并非研究对象数越多越好。
比如在改良肩周炎贴膏临床试验中,如果片面地追求大样本,研究中所需的人力、物力、财力等物质支持必然增大,研究的可行性下降。
由于需纳入更多病例,可能会延长产品研发周期,影响新药投产上市;若增加医院或临床实验中心参与该研究,又增加了组织协调的工作量和工作难度。
同时增加各种混杂、偏倚发生的机会,比如由于肩周炎发病、预后与季节、气候密切相关,临床病例接收时间太长,组内病例同质性差;测量仪器增多导致测量误差增大,观察疗效的医院、医生增多,研究结果的一致性降低等现实问题,使得试验结果难于分析或者难以合理解释,影响研究结论的科学性。
《流行病学》教学大纲epidemiology一、课程说明课程编码 NN101412 课程总学时20(理论总学时20/实践总学0时)周学时(理论学时2/实践学时0)学分2课程性质限制性选修课适用专业临床医学、临床医学(专升本)、全科医学、眼视光(七年制)、眼视光学(专升本)专业1.教学内容与学时安排表2.课程教学目的与要求:流行病学是预防医学中的一门主导课程,也是医学各学科的方法学基础。
随着临床流行病学和循证医学等兴起,使得流行病学也日益成为临床医学重要的基础性学科。
本课程的教学目的主要是培养学生掌握流行病学基本理论、基本知识、流行病学方法的选择与应用,并了解相应的扩展知识和新进展知识,为临床专业学生学习预防医学及培养防治结合型人才奠定流行病学理论基础,也为今后在临床实际工作中或其他有关学科中运用流行病学的理论和方法奠定基础。
本课程教学要求是根据教学大纲的要求,重点讲解基本理论和基本知识,同时注意传授一定比例的扩展知识、新进展知识和实际应用知识,加强学生创新能力的培养,开拓思路、启发思维,调动学生的学习积极性。
内容精练,条理清楚,合理使用教学设备和教具。
并根据本章节的特点,结合课时安排规定学生必要的自学内容。
3、本门课程与其它课程关系:临床医学各学科中,凡涉及专业问题的调查设计、资料的获取和数据资料的分析及其解释,都要以流行病学方法为基础。
流行病学应用广泛,涉及面宽,几乎涉及社会科学、自然科学和医学科学的各主要学科。
流行病学是伴随卫生统计学、微生物学和免疫学以及传染病学发展起来。
现在除基础医学和临床医学外,流行病学与社会医学、心理学及一系列预防医学学科,包括卫生管理学也建立了密切的联系。
在非传染病研究上与病理学、生化学、遗传学、分子生物学、临床医学相应各科及预防医学有关学科关系密切。
研究健康流行病学与生理学、生化学、医学心理学、社会医学等有关。
4、推荐教材及参考书:1.李立民主编.《流行病学》(第四版).北京:人民卫生出版社,19992.曾光主编.现代流行病学方法与应用.北京:北京医科大学中国协和医科大学联合出版,19943.谭红专主编.现代流行病学.北京:人民卫生出版社,20014.赵忠堂主编.流行病学研究方法与应用.北京:科学出版社,20005.林果为,沈福民主编.现代临床流行病学.上海:上海医科大学出版社,20006.王家良主编.临床流行病学.北京:人民卫生出版社,20007.MacMahon B, Trichopoulos D. Epidemiology-Principles and Methods, Second edition.Boston, New York, Toronto and London: Little, Brown and Company,19968.施侣元主编,《流行病学》,人民卫生出版社,20039.谭红专主编,《现代流行病学》,人民卫生出版社,200810.叶临湘主编,《现场流行病学》,人民卫生出版社,200911. 王建华主编,《流行病学》,人民卫生出版社, 200812.王建华主编,《流行病学》,人民卫生出版社, 201313.沈洪兵主编,《流行病学》,人民卫生出版社, 20185、课程考核方法与要求:本课程考核方法采用期末闭卷考试方式进行。
流行病学名词解释流行病学(Epidemiology)是研究疾病及健康有关状态在人群中发生、发展的原因和分布的规律,以及制定预防、控制和消灭这些疾病及促进健康的对策与措施,并评价其效果的科学。
疾病分布(distribution of disease):通过观察疾病在人群中的发生、发展和消退,描述疾病不同时间、不同地区和不同人群中的频率与分布的现象。
发病率 (incidence rate):是一定时期内,特定人群中发生某病新发病例的频率。
新发病例数:指观察时间内新发生的某病的病人数暴露人口数:必须符合两个条件:必须是观察时间内观察地区内的人群,必须有患所要观察的疾病的可能罹患率 (attack rate):量新发病例频率的指标,通常指在某一局限范围内,短时间内的发病率患病率 (prevalence rate):又称现患率或流行率,指某特定时间内总人口中某病新旧病例所占的比例。
时点患病率(point prevalence):指群体中个体在某时点为病例的概率期间患病率(period prevalence): 是群体中个体在给定期间内任一时点为病例的概率。
死亡率 (mortality rate):指某人群在一定时期内总死亡人数与该人群同期平均人口数之比。
死亡专率按不同特征,如年龄、性别、职业、民族、种族、婚姻状况、病因等分别计算的死亡率。
分母必须是与分子相对应的人口病死率(fatality rate):指一定时间内,患某病的病人中因该病而死亡者的比值存活率(survival rate)散发 (sporadic):指某病发病人数不多,病例间无明显的相互传播关系,或在一定地区的发病率呈历年一般水平。
适用于范围较大的地区。
流行 (epidemic):指某地区某病发病率显著超过历年的散发发病率水平。
大流行 (pandemic):指某疾病的发病蔓延迅速,涉及地域广,人口比例大,在短时间内可以越过省界国界甚至洲界形成世界性流行。
流行病学复习资料一、绪论1、流行病学:流行病学是研究人群中疾病与健康状况的分布及其影响因素,并研究防治疾病及促进健康的策略和措施的科学。
2、流行病学研究的三个层次:疾病、伤害和健康。
疾病包括:传染病、寄生虫病和非传染病等一切疾病。
伤害包括意外、残疾、弱智和身心伤害。
健康状态包括身体生理生化的各种功能状态、疾病前状态和长寿。
◆流行病学研究的任务和三个范畴:(1)“揭示现象”,由描述性流行病学来完成。
仅提供深入讨论原因的基础,但可对现象作初步分析。
(2)“找出原因”需借助分析流行病学的工作来完成,来检验或验证所提出的疾病线索。
(3)以找到原因为基础而“提供措施”,并进一步确证措施的有效性,这要用人群流行病学实验,即实验流行病学的工作来完成。
◆流行病学研究的三种基本方法:观察法、数理法、实验法。
◆流行病学的原理:①疾病与健康在人群中分布的原理,其中包括疾病的流行现象②疾病的发展过程,其中涵盖了机体的感染过程和疾病的流行过程③人与环境的关系,即疾病的生态学④病因推断原则⑤疾病防治的原则和策略⑥疾病防治的原则和策略,其中包括:疾病的三级预防,疾病发展的数学模型等。
◆流行病学的实际应用:①疾病预防和健康促进②疾病的监测③疾病病因和危险因素的研究④疾病的自然史⑤疾病预防的效果3、流行病学的特征:(1)群体特征(2)以分布为起点的特征(3)对比的特征(4)概率论和数理统计的特征(5)社会医学的特征(6)预防为主的特征二、疾病的分布1、疾病测量指标:◆发病指标:①发病率:表示在一定期间内(1年),一定人群中某病新病例出现的例数。
发病率=(一定期间内某人群中某病新病例例数/同期人口暴露数)×K(K=100%,1000‰,或10000/万)②罹患率:指在某一局限范围,短时间内的发病率。
它可以根据暴露来精确地测量发病几率③患病率:指某特定时间内的总人口中,患有某病(包括新旧病例)者所占的比例,也称现患率。
分为期间患病率和时点患病率(常用)。