样本含量的估计(流行病学应用)
- 格式:pdf
- 大小:12.20 MB
- 文档页数:132
应用Epi info2002流行病学分析软件进行样本量的计算(“Epi info2002流行病学分析软件应用讲座”补充资料,主讲人:李海闽) (一)关于Epi info2002计算样本量涉及的几个概念1、把握度又称检验效能(power of test),是用数量描述的事物现象之间如果确定有一个真正的差别存在,能被显著性检验所检出的概率。
数理统计学用β表示II型错误的概率,1-β称为把握度。
做研究设计时,如果要求检出差别显著性的把握度越大,则要求样本含量也越多。
2、置信水平置信水平(confidence level)是置信度的互补概率。
例如95%置信度,其置信水平为0.05;99%置信度,其置信水平为0.01。
一般情况α取0.05,则置信度为95%(1-α=0.95)。
3假设检验的两类错误由于假设检验是根据有限的样本信息对总体作推断,不论做出哪一种推断结论,都有可能发生错误。
这就是假设检验的两类错误。
如果实际情况与H0不一致,检验结论为拒绝H0,接受H1, ;或者实际情况与H0一致,检验结论为接受H0;这两种推断结论都是正确的。
如果实际情况与H0一致,仅仅由于抽样的原因,使得统计量的观察值落到拒绝域,拒绝原本正确的H0,导致推断结论错误。
这样的错误称为第I类错误。
如果实际情况与H0不一致,也仅仅是抽样的原因使得统计量的观察值落到接受域,不能拒绝原本错误的H0,则导致了另一种推断错误。
这样的错误称为第II类错误。
表6-3 归纳了假设检验中两种实际情况和不同检验结论的关系。
犯第 I 类错误的概率用α来控制,其大小与检验水准相同。
根据研究者的需要。
常取为0.05 或0.01 等。
当α取为0.05 时,其意义是:如果原假设H0 成立,按照同样的方法在原假设H0 规定的总体中重复抽样,那么在每100 次检验结论中平均可以有5 次拒绝H0 (犯第I类错误)。
犯第II类错误的概率用β来控制。
因为H0 不成立时检验统计量的精确分布往往难以确定,所以在多数情况下准确估计β的数值比较困难。
无论是调查研究还是实验性研究,医学研究大都是抽样研究,最终目的在于利用实际观测得到的样本信息推断未知的总体特征,即统计推断。
抽样研究设计时需要回答一个非常关键的问题:样本中包含多少个研究对象(人、动物、生物学材料等)才能既满足统计学要求,完成有效的统计推断,又照顾研究的可行性、伦理学等实际问题,从而最大限度控制研究成本和研究风险,提高研究效率。
这就是样本含量估计(estimation of sample size)。
本章将从统计推断的目的出发,介绍样本含量估计意义及常用的计算公式,并在此基础上介绍检验效能的估计(power analysis)。
第一节样本含量估计的意义及方法一、样本含量估计的意义由于抽样研究中抽样误差不可避免,样本统计量与其所对应的总体参数间总是存在一定差异。
因此,尽量减小抽样误差是提高统计推断精度的必然要求。
在总体变异性确定的条件下,样本中所含的研究对象数越多,抽样误差必然越小,样本统计量的稳定性肯定越高,总体参数的估计精度越好,假设检验中的检验效能(power=1- )亦会越高,从而避免出现假阴性的结论。
同时在实验性研究中,只有在研究对象数量足够大时才能使随机分组更加有效,从而保证组间均衡性。
但在实际研究中,除了要考虑抽样误差外,还需考虑研究的可行性、结论的时效性、医学伦理以及非随机误差的影响等实际问题,并非研究对象数越多越好。
比如在改良肩周炎贴膏临床试验中,如果片面地追求大样本,研究中所需的人力、物力、财力等物质支持必然增大,研究的可行性下降。
由于需纳入更多病例,可能会延长产品研发周期,影响新药投产上市;若增加医院或临床实验中心参与该研究,又增加了组织协调的工作量和工作难度。
同时增加各种混杂、偏倚发生的机会,比如由于肩周炎发病、预后与季节、气候密切相关,临床病例接收时间太长,组内病例同质性差;测量仪器增多导致测量误差增大,观察疗效的医院、医生增多,研究结果的一致性降低等现实问题,使得试验结果难于分析或者难以合理解释,影响研究结论的科学性。
第十八章样本含量估计无论是调查研究还是实验性研究,医学研究大都是抽样研究,最终目的在于利用实际观测得到的样本信息推断未知的总体特征,即统计推断。
抽样研究设计时需要回答一个非常关键的问题:样本中包含多少个研究对象(人、动物、生物学材料等)才能既满足统计学要求,完成有效的统计推断,又照顾研究的可行性、伦理学等实际问题,从而最大限度控制研究成本和研究风险,提高研究效率。
这就是样本含量估计(estimation of sample size)。
本章将从统计推断的目的出发,介绍样本含量估计意义及常用的计算公式,并在此基础上介绍检验效能的估计(power analysis)。
第一节样本含量估计的意义及方法一、样本含量估计的意义由于抽样研究中抽样误差不可避免,样本统计量与其所对应的总体参数间总是存在一定差异。
因此,尽量减小抽样误差是提高统计推断精度的必然要求。
在总体变异性确定的条件下,样本中所含的研究对象数越多,抽样误差必然越小,样本统计量的稳定性肯定越高,总体参数的估计精度越好,假设检验中的检验效能(power=1- )亦会越高,从而避免出现假阴性的结论。
同时在实验性研究中,只有在研究对象数量足够大时才能使随机分组更加有效,从而保证组间均衡性。
但在实际研究中,除了要考虑抽样误差外,还需考虑研究的可行性、结论的时效性、医学伦理以及非随机误差的影响等实际问题,并非研究对象数越多越好。
比如在改良肩周炎贴膏临床试验中,如果片面地追求大样本,研究中所需的人力、物力、财力等物质支持必然增大,研究的可行性下降。
由于需纳入更多病例,可能会延长产品研发周期,影响新药投产上市;若增加医院或临床实验中心参与该研究,又增加了组织协调的工作量和工作难度。
同时增加各种混杂、偏倚发生的机会,比如由于肩周炎发病、预后与季节、气候密切相关,临床病例接收时间太长,组内病例同质性差;测量仪器增多导致测量误差增大,观察疗效的医院、医生增多,研究结果的一致性降低等现实问题,使得试验结果难于分析或者难以合理解释,影响研究结论的科学性。
《流行病学》教学大纲epidemiology一、课程说明课程编码 NN101412 课程总学时20(理论总学时20/实践总学0时)周学时(理论学时2/实践学时0)学分2课程性质限制性选修课适用专业临床医学、临床医学(专升本)、全科医学、眼视光(七年制)、眼视光学(专升本)专业1.教学内容与学时安排表2.课程教学目的与要求:流行病学是预防医学中的一门主导课程,也是医学各学科的方法学基础。
随着临床流行病学和循证医学等兴起,使得流行病学也日益成为临床医学重要的基础性学科。
本课程的教学目的主要是培养学生掌握流行病学基本理论、基本知识、流行病学方法的选择与应用,并了解相应的扩展知识和新进展知识,为临床专业学生学习预防医学及培养防治结合型人才奠定流行病学理论基础,也为今后在临床实际工作中或其他有关学科中运用流行病学的理论和方法奠定基础。
本课程教学要求是根据教学大纲的要求,重点讲解基本理论和基本知识,同时注意传授一定比例的扩展知识、新进展知识和实际应用知识,加强学生创新能力的培养,开拓思路、启发思维,调动学生的学习积极性。
内容精练,条理清楚,合理使用教学设备和教具。
并根据本章节的特点,结合课时安排规定学生必要的自学内容。
3、本门课程与其它课程关系:临床医学各学科中,凡涉及专业问题的调查设计、资料的获取和数据资料的分析及其解释,都要以流行病学方法为基础。
流行病学应用广泛,涉及面宽,几乎涉及社会科学、自然科学和医学科学的各主要学科。
流行病学是伴随卫生统计学、微生物学和免疫学以及传染病学发展起来。
现在除基础医学和临床医学外,流行病学与社会医学、心理学及一系列预防医学学科,包括卫生管理学也建立了密切的联系。
在非传染病研究上与病理学、生化学、遗传学、分子生物学、临床医学相应各科及预防医学有关学科关系密切。
研究健康流行病学与生理学、生化学、医学心理学、社会医学等有关。
4、推荐教材及参考书:1.李立民主编.《流行病学》(第四版).北京:人民卫生出版社,19992.曾光主编.现代流行病学方法与应用.北京:北京医科大学中国协和医科大学联合出版,19943.谭红专主编.现代流行病学.北京:人民卫生出版社,20014.赵忠堂主编.流行病学研究方法与应用.北京:科学出版社,20005.林果为,沈福民主编.现代临床流行病学.上海:上海医科大学出版社,20006.王家良主编.临床流行病学.北京:人民卫生出版社,20007.MacMahon B, Trichopoulos D. Epidemiology-Principles and Methods, Second edition.Boston, New York, Toronto and London: Little, Brown and Company,19968.施侣元主编,《流行病学》,人民卫生出版社,20039.谭红专主编,《现代流行病学》,人民卫生出版社,200810.叶临湘主编,《现场流行病学》,人民卫生出版社,200911. 王建华主编,《流行病学》,人民卫生出版社, 200812.王建华主编,《流行病学》,人民卫生出版社, 201313.沈洪兵主编,《流行病学》,人民卫生出版社, 20185、课程考核方法与要求:本课程考核方法采用期末闭卷考试方式进行。