样本含量的估计(流行病学应用)

格式：pdf
大小：12.20 MB
文档页数：132

下载文档原格式

样本量计算(Epiinfo2002流行病学分析软件的应用讲座补充资料)

应用Epi info2002流行病学分析软件进行样本量的计算（“Epi info2002流行病学分析软件应用讲座”补充资料，主讲人：李海闽）（一）关于Epi info2002计算样本量涉及的几个概念1、把握度又称检验效能（power of test），是用数量描述的事物现象之间如果确定有一个真正的差别存在，能被显著性检验所检出的概率。

数理统计学用β表示II型错误的概率，1-β称为把握度。

做研究设计时，如果要求检出差别显著性的把握度越大，则要求样本含量也越多。

2、置信水平置信水平（confidence level）是置信度的互补概率。

例如95％置信度，其置信水平为0.05；99％置信度，其置信水平为0.01。

一般情况α取0.05，则置信度为95%（1-α=0.95）。

3假设检验的两类错误由于假设检验是根据有限的样本信息对总体作推断，不论做出哪一种推断结论，都有可能发生错误。

这就是假设检验的两类错误。

如果实际情况与H0不一致，检验结论为拒绝H0，接受H1, ；或者实际情况与H0一致，检验结论为接受H0；这两种推断结论都是正确的。

如果实际情况与H0一致，仅仅由于抽样的原因，使得统计量的观察值落到拒绝域，拒绝原本正确的H0，导致推断结论错误。

这样的错误称为第I类错误。

如果实际情况与H0不一致，也仅仅是抽样的原因使得统计量的观察值落到接受域,不能拒绝原本错误的H0，则导致了另一种推断错误。

这样的错误称为第II类错误。

表6-3 归纳了假设检验中两种实际情况和不同检验结论的关系。

犯第 I 类错误的概率用α来控制，其大小与检验水准相同。

根据研究者的需要。

常取为0.05 或0.01 等。

当α取为0.05 时，其意义是：如果原假设H0 成立，按照同样的方法在原假设H0 规定的总体中重复抽样，那么在每100 次检验结论中平均可以有5 次拒绝H0 （犯第I类错误）。

犯第II类错误的概率用β来控制。

因为H0 不成立时检验统计量的精确分布往往难以确定，所以在多数情况下准确估计β的数值比较困难。

常用流行病学研究方法

医学
哲学
流行病学研究方法
数学
预防医学第5版
20世纪中期开始，为适应多病因论的需求，在统计学的帮助下，流行病学群体研究方法又有了突飞猛进的发展。混杂因子、效应修饰因子的处理技术不断完善，解决了在多个病因存在的条件下生物现象的或然性问题及巧合现象，因果判断的能力进一步加强。如今，流行病学的群体研究方法已被医学各领域广泛应用，成为医学各学科不可或缺的研究方法。
预防医学第5版
二、现况研究
（一）现况研究的概念:
现况研究是在某一人群中，应用普查或抽样调查的方法收集特定时间内、特定人群中疾病、健康状况及有关因素的资料，并对资料的分布状况、疾病与因素的关系研究所获得的资料是在某一时间横断面上收集的，故又称横断面研究（cross sectional study）。
预防医学第5版
二、现况研究
（三）现况研究的种类：
1.普查：
普查（census）就是对总体中所有个体均进行调查。现况研究中普查的含义为：在特定时间
对特定范围内人群中的每一成员进行的调查。
普查分为以了解人群中某病的患病率、健康状况等为目的的普查和以早期发现病人为目的的筛检（screening）。工作目的是早发现早诊断病人，使其得到及时治疗时，必须采用普查。
预防医学第5版
一、概述
（二）描述性资料的来源：现况研究
专门设计的调查研究生态学研究个案调查爆发调查
死亡报告出生登记常规记录资料出生缺陷监测药物不良反应监测疾病监测等资料
预防医学第5版
一、概述
（三）描述流行病学的用途：描述流行病学可以回答所描述的事件存在于什么时间、什么
地点和哪些人群中，数量是多少。对这些问题的回答可以：为病因研究提供线索。掌握疾病和病因的分布状况，为疾病防制工作提供依据。用来评价防制策略和措施的效果。

流行病学方法—筛查试验

➢
由金标准证实未患研究疾病的非病例组：代表未患研究疾病的全体，与
病例组有好的可比性。
（三）确定样本含量：
公式如下：
=
2 ×(1−)

2
式中：α为一类错误的概率；
μ α为α对应的u值；
δ为容许误差；
P为灵敏度或特异度的估计值。
（四）确定截断值：

即确定试验阳性与阴性的界值

确定方法
✓
ҧ ± 2s
N
灵敏度：筛检试验阳性者占受检
病人总数的百分比，是指将实际
有病的人正确地判断为患者的能
力。
假阴性率：又称漏诊率，是指实
际有病者而被判定为非病者的百
分比。
特异度：是指将实际无病的人正
确地判断为非患者的能力。
假阳性率：又称误诊率，是指实
际无病者而被判定为有病的百分
比。
约登指数：又称正确指数，是灵敏度和特异度之和减去1。约登
✓
百分位数法
✓
基于防治实际确定
（一）评价指标

真实性(validity)：有效性，准确性(accuracy)。是指筛检试验测量值与
实际情况的符合程度，是正确地判定有病与无病的能力。
表11-8 评价资料整理表
金标准
试验
患者
非患者
合计
阳性
a真阳性
b假阳性
a+b
阴性
c假阴性
d真阴性
c+d
合计
a+c
b+d
度均高
便于判断筛检
效果
有早期可识别
的症状体征
有确诊条件和
治疗方法
疾病自然史
考虑经费

临床研究中样本量的估计方法

! 1 # 徐勇勇 + 医学统计学 ! 3 # + 北京 0 高等教育出版社 * "--10 & 2 1!""# $%&$ ’ ()*% +# *$ ’ $,&- . / !!!" #$%&’(" &)* ! " # 雷鸣 * 刘鸿里 * 丛雪峰 * 等 + 手术时机对高血压脑出血康复疗效的影响 ! , # + 中国临床康复 * "--"* ’ . ) / 0 11&’ ! $ # 赵清波 * 徐勇勇 + 如何确定抽样研究所需要的样本量 ! , # + 中华预防医学杂志 * "--1* $& . $ / 0 "-$ 2 % ! % # 李良寿 * 孙长生 * 李远贵 + 临床医学研究原理与方法 ! 3 # + 西安 0 陕西科学技术出版社 * 144&0 "") 2 4 ! & # 陈倩予 + 胃癌术后肠内外早期营养支持对比观察 ! , # + 中国临床康复 * "--"* ’ . ) / 0 11’1 ! ’ # 王红 * 王永岗 * 危淑梅 * 等 + 肺癌术前呼吸锻炼的临床意义 ! , # + 中国临床康复 * "--"5 ’ . ) / 0 11)) ! ( # 王芳 * 韩丽莎 * 闫秀英ቤተ መጻሕፍቲ ባይዱ* 等 + 旋磁场对糖尿病大鼠血糖及组织细胞学影响的观察 ! , # + 中国临床康复 * "--"* ’ . $ / 0 $(’ ! ) # 鲁燕莉 + 肩周炎的康复治疗 ! , # + 中国临床康复 * "--"* ’ . ) / 0 11(’ 临床研究中样本量的估计方法

(完整版)第18章样本含量的估计

无论是调查研究还是实验性研究，医学研究大都是抽样研究，最终目的在于利用实际观测得到的样本信息推断未知的总体特征，即统计推断。

抽样研究设计时需要回答一个非常关键的问题：样本中包含多少个研究对象(人、动物、生物学材料等)才能既满足统计学要求，完成有效的统计推断，又照顾研究的可行性、伦理学等实际问题，从而最大限度控制研究成本和研究风险，提高研究效率。

这就是样本含量估计(estimation of sample size)。

本章将从统计推断的目的出发，介绍样本含量估计意义及常用的计算公式，并在此基础上介绍检验效能的估计(power analysis)。

第一节样本含量估计的意义及方法一、样本含量估计的意义由于抽样研究中抽样误差不可避免，样本统计量与其所对应的总体参数间总是存在一定差异。

因此，尽量减小抽样误差是提高统计推断精度的必然要求。

在总体变异性确定的条件下，样本中所含的研究对象数越多，抽样误差必然越小，样本统计量的稳定性肯定越高，总体参数的估计精度越好，假设检验中的检验效能(power=1- )亦会越高，从而避免出现假阴性的结论。

同时在实验性研究中，只有在研究对象数量足够大时才能使随机分组更加有效，从而保证组间均衡性。

但在实际研究中，除了要考虑抽样误差外，还需考虑研究的可行性、结论的时效性、医学伦理以及非随机误差的影响等实际问题，并非研究对象数越多越好。

比如在改良肩周炎贴膏临床试验中，如果片面地追求大样本，研究中所需的人力、物力、财力等物质支持必然增大，研究的可行性下降。

由于需纳入更多病例，可能会延长产品研发周期，影响新药投产上市；若增加医院或临床实验中心参与该研究，又增加了组织协调的工作量和工作难度。

同时增加各种混杂、偏倚发生的机会，比如由于肩周炎发病、预后与季节、气候密切相关，临床病例接收时间太长，组内病例同质性差；测量仪器增多导致测量误差增大，观察疗效的医院、医生增多，研究结果的一致性降低等现实问题，使得试验结果难于分析或者难以合理解释，影响研究结论的科学性。

(完整版)第18章样本含量的估计

第十八章样本含量估计无论是调查研究还是实验性研究，医学研究大都是抽样研究，最终目的在于利用实际观测得到的样本信息推断未知的总体特征，即统计推断。

这就是样本含量估计(estimation of sample size)。

本章将从统计推断的目的出发，介绍样本含量估计意义及常用的计算公式，并在此基础上介绍检验效能的估计(power analysis)。

因此，尽量减小抽样误差是提高统计推断精度的必然要求。

同时在实验性研究中，只有在研究对象数量足够大时才能使随机分组更加有效，从而保证组间均衡性。

比如在改良肩周炎贴膏临床试验中，如果片面地追求大样本，研究中所需的人力、物力、财力等物质支持必然增大，研究的可行性下降。

样本含量估计及等效性检验

取α＝0.05，β＝0.1，将各组的 i的估计值： 2.79、4.01、3.84，及 i ：0.26、0.27、1.11代入公式，计算 i / k = （2.79+4.01+3.84） /3 = 3.55，查表α＝0.05，β＝0.1,ν1= 3 - 1 = 2，ν2= ∞，查表得＝ 2.52 ，代入公式:
2 2 n i / k / i /( k 1) i 1 i 1
2 k k
将有关数据代入公式：
(0.26 0.27 1.11 ) 3 2.52 [ ] 2 2 2 ((2.79 3.55) (4.01 3.55) (3.84 3.55) ) / 2) 7
n
2 12.65 (2 sin
1
0.548 2 sin
1
0.149)
2
33
注：本公式采用三角函数的弧度计算
完全随机设计多个率样本比较样本含量的估计公式（二）
n 1641.6 (sin
1
max
1 2 sin min )
注意本公式采用三角函数的角度计算
将数据代入公式（二）
2.等效检验条件： (1).必须Λ>δ（δ为两样本率差值）； (2).应先作一般u检验，当P>α 时，再进行等效检验。
三、计数资料两样本率比较：
两样本率比较的等效性检验可用u检验。
计数资料的等效性检验（公式）：
u=（Λ-|P1-P2|）/Sp
SP = uc=（Λ-|P1-P2|-（1/n1-1/n2）/2）/Sp （此式为校正公式）

式中Λ为等效差值， P1、 P2 为两样本率，Sp为两样本率合并标准误。

样本含量的计算

• 一般取0.8、0.9、0.95 • 即组间确有差别,则在100次试验中能发现 • 此差别的平均概率 • 检验效能不宜低于0.75 • β一般取单侧Z值
15
计算机模拟举例1
• 假设： • -试验组死亡率为20% • -对照组死亡率为50% • -试验组和对照组的样本量均为n=50 • -显著性水平为双侧0.05 • -检验方法=卡方检验
7
按试验类型
• 估计总体 • 样本与总体比较 • 配对资料 • 两样本比较 • 多样本比较
主要变量的性质
• 分类变量 • 数值变量
• 一般情况下,分类变量所需要的样本量多于数值变量
9
按结局指标
•计数定性指标死亡与存活, 阳性与阴性, 正常与异常
•计量定量指标血压、血糖、血清酶
•结局指标有多个时,估计样本含量时需要选择其中最重要的结局指标,或按照所需样本量最多的指标,
当k=1时两组样本含量相等,
24
• 例4：某一项研究吲达帕胺治疗原发性高血压的治疗, 经预试验得治疗前后舒压差值 mmHg 资料如下与安慰剂比较,两药治疗前后差异均有统计学差异 ,当 α=0.05,β=0.10时需要治疗多少例可以认为吲达帕胺有效
z z n
211/k
2
2
s s 2(2k2 )/1 ( 1/k)
p(p1p22p)/2
本设计至少需要观察235例
30
2.2.4 两样本率比较
• 例8：某医师研究某药对产后宫缩痛、外阴创伤痛效果,预试验旧药镇痛率为55%,新药镇痛率为75%, 当α=0.05,β=0.1时需要观察多少例能说明新药镇痛效果优于旧药
N zz2 p1e 1p/ ck2p(1p)p

医学研究中样本量的估计

n
(u
u )2
2
（3）样本均数与总体均数比较的样本量估计
COMPUTE n=((1.96 + 1.282) *3/ 1.5 ) **2. EXECUTE.
樱桃.gif
n=43
（4）完全随机设计两样本含量相等时均数比较的样本量估计
例题4：某药厂对新研发的降压中成药与标准降压药的疗效比较。已知
2 2
) )
（11）两样本相关系数比较的样本量估计
COMPUTE n=8 * ((1.645 + 1.282) / (LN(((1 + 0.90)*(1-0.80)) /((1 0.90)*(1+0.80))))) ** 2 + 3.
EXECUTE.
樱桃.gif
（12）不配对病例-对照研究设计（病例数与对照数相等时的样本含量）
EXECUTE.
（8）完全随机设计两样本率比较的样本含量估计（当两样本量相等时）
例题8：拟研究新研制的抗菌药物对某感染性疾病的治疗效果。经预试验，试验药有效率为80%，对照药有效率为60%。问正式临床试验每组需要观察多少病例（假设采用双侧检验）？
单侧：n1 n2 u2
樱桃.gif
2
2 p(1 p) u2 p1 (1 p1 ) p2 (1 p2 )
n
(t
t
)sd
2
（6）配对设计两样本均数比较的样本量估计
COMPUTE n=((1.96 + 1.645) * 25 / 15) ** 2. EXECUTE.
樱桃.gif
n=37
（7）完全随机设计多样本均数比较的样本量估计
例题7：某中医院应用中西医结合治疗肺气虚、脾气虚、肾气虚慢性阻塞性肺疾病（COPD）患者，并与单纯西药为对照组，观察中西医结合治疗 COPD患者不同中医证型的肺功能改善效果，根据查阅相关资料，肺气虚的 FVC（L）为2.44±0.32；脾气虚为樱2桃..g4if0±0.36；肾气虚为2.31±0.29；对照组为2.51±0.32。问该项临床研究估计需要观察多少病例数？

8.《流行病学》(第9版)教学大纲(适用临床医学等专业)

《流行病学》教学大纲epidemiology一、课程说明课程编码 NN101412 课程总学时20（理论总学时20/实践总学0时）周学时（理论学时2/实践学时0）学分2课程性质限制性选修课适用专业临床医学、临床医学（专升本）、全科医学、眼视光（七年制）、眼视光学（专升本）专业1.教学内容与学时安排表2.课程教学目的与要求：流行病学是预防医学中的一门主导课程，也是医学各学科的方法学基础。

随着临床流行病学和循证医学等兴起，使得流行病学也日益成为临床医学重要的基础性学科。

本课程的教学目的主要是培养学生掌握流行病学基本理论、基本知识、流行病学方法的选择与应用，并了解相应的扩展知识和新进展知识，为临床专业学生学习预防医学及培养防治结合型人才奠定流行病学理论基础，也为今后在临床实际工作中或其他有关学科中运用流行病学的理论和方法奠定基础。

本课程教学要求是根据教学大纲的要求，重点讲解基本理论和基本知识，同时注意传授一定比例的扩展知识、新进展知识和实际应用知识，加强学生创新能力的培养，开拓思路、启发思维，调动学生的学习积极性。

内容精练，条理清楚，合理使用教学设备和教具。

并根据本章节的特点，结合课时安排规定学生必要的自学内容。

3、本门课程与其它课程关系：临床医学各学科中，凡涉及专业问题的调查设计、资料的获取和数据资料的分析及其解释，都要以流行病学方法为基础。

流行病学应用广泛，涉及面宽，几乎涉及社会科学、自然科学和医学科学的各主要学科。

流行病学是伴随卫生统计学、微生物学和免疫学以及传染病学发展起来。

现在除基础医学和临床医学外，流行病学与社会医学、心理学及一系列预防医学学科，包括卫生管理学也建立了密切的联系。

在非传染病研究上与病理学、生化学、遗传学、分子生物学、临床医学相应各科及预防医学有关学科关系密切。

研究健康流行病学与生理学、生化学、医学心理学、社会医学等有关。

4、推荐教材及参考书：1.李立民主编．《流行病学》（第四版）．北京：人民卫生出版社，19992.曾光主编．现代流行病学方法与应用．北京：北京医科大学中国协和医科大学联合出版，19943．谭红专主编．现代流行病学．北京：人民卫生出版社，20014．赵忠堂主编．流行病学研究方法与应用．北京：科学出版社，20005．林果为，沈福民主编．现代临床流行病学．上海：上海医科大学出版社，20006．王家良主编．临床流行病学．北京：人民卫生出版社，20007．MacMahon B, Trichopoulos D. Epidemiology-Principles and Methods, Second edition.Boston, New York, Toronto and London: Little, Brown and Company,19968.施侣元主编，《流行病学》，人民卫生出版社，20039.谭红专主编，《现代流行病学》，人民卫生出版社，200810.叶临湘主编，《现场流行病学》，人民卫生出版社，200911. 王建华主编,《流行病学》，人民卫生出版社, 200812.王建华主编，《流行病学》，人民卫生出版社, 201313.沈洪兵主编，《流行病学》，人民卫生出版社, 20185、课程考核方法与要求：本课程考核方法采用期末闭卷考试方式进行。

流行病学名词解释

流行病学名词解释流行病学(Epidemiology)是研究疾病及健康有关状态在人群中发生、发展的原因和分布的规律，以及制定预防、控制和消灭这些疾病及促进健康的对策与措施，并评价其效果的科学。

疾病分布（distribution of disease）：通过观察疾病在人群中的发生、发展和消退，描述疾病不同时间、不同地区和不同人群中的频率与分布的现象。

发病率 (incidence rate)：是一定时期内，特定人群中发生某病新发病例的频率。

新发病例数:指观察时间内新发生的某病的病人数暴露人口数:必须符合两个条件:必须是观察时间内观察地区内的人群，必须有患所要观察的疾病的可能罹患率 (attack rate)：量新发病例频率的指标，通常指在某一局限范围内，短时间内的发病率患病率 (prevalence rate)：又称现患率或流行率，指某特定时间内总人口中某病新旧病例所占的比例。

时点患病率(point prevalence):指群体中个体在某时点为病例的概率期间患病率(period prevalence): 是群体中个体在给定期间内任一时点为病例的概率。

死亡率 (mortality rate):指某人群在一定时期内总死亡人数与该人群同期平均人口数之比。

死亡专率按不同特征，如年龄、性别、职业、民族、种族、婚姻状况、病因等分别计算的死亡率。

分母必须是与分子相对应的人口病死率(fatality rate):指一定时间内，患某病的病人中因该病而死亡者的比值存活率（survival rate）散发 (sporadic):指某病发病人数不多，病例间无明显的相互传播关系，或在一定地区的发病率呈历年一般水平。

适用于范围较大的地区。

流行 (epidemic):指某地区某病发病率显著超过历年的散发发病率水平。

大流行 (pandemic):指某疾病的发病蔓延迅速，涉及地域广，人口比例大，在短时间内可以越过省界国界甚至洲界形成世界性流行。

分析流行病学方法

例号
病例
四个对照平均
病例
对照
病例对照病例对照病例对照
1
25
32
有
2/4
否
0/4
有
1/4
有
0/4
2
30
30
有
3/4
否
0/4
有
1/4
有
0/4
3
22
31
有
1/4
有
0/4
否
1/4
有
0/4
4
33
30
有
3/4
有
0/4
有
0/4
有
0/4
5
22
27
有
3/4
否
1/4
否
1/4
否
0/4
6
21
29
有
3/4
有
2．成组匹配(frequency matching)
01
亦称群体匹配、频数匹配，即要求某种或某些因素（匹配因素）在对照组与病例组总的分布相同。
02
如病例组中男性的比例为50%，则选择对照中，男性的比例也为50%。
01
如果所研究的是罕见病，或所能获得的合格病例数很少，则采用个体匹配的设计方法；
2.对照的来源
自然人群：从产生病例的自然人
A
群中选择，或选取病例的邻居、
亲属、同事或配偶作为对照等。
B
医院对照：选取与病例同一医院的其他疾病患者
（三）样本含量的估计
所允许犯假阳性错误的概率α；
所希望达到的检验把握度（1-β）；
病例组的暴露率（P1 ）和对照组暴露（P0 ）；

抽样及样本含量估计

10 0.792495 8 0.708996 1 0.704446 2 0.566829
11 0.358031 7 0.297145 6 0.251854 3 0.009253
样本估计和总体参数
对于简单随机抽样，可以用样本均数来估计总体均数
简单随机抽样的特点
优点：（1）比较容易理解和掌握；（2）抽样框不需要其他辅
以95%的可信度，估计有效成分含量的均值在真值的 10%范围内，需要多大的样本？
222=277.56≈278 22/(2.25*10%)2=54.38≈55
简单随机抽样样本量估计是其他概率抽样方法样本量估计的基础
其他概率抽样样本量估计可以用简单随机抽样样本量乘以设计效应deff
如多阶段抽样deff范围约在1.3～3之间
简单随机抽样样本量估计（总体参数为均数)
2
2
u n
/2 2
2：总体的方差，根据预试验估计
= x
当用相对容许误差（与总体均数相差不超过真值的（% ））表示时，则 =
举例：抽样调查时估计总体均数时
以α=0.05，估计有效成分含量的均值在真值的± 0.10范围内，需要调查多少样本？
抽样框中应该有抽样单元名称和地理位置的信息，以便研究人员能找到被选中的单元.
好的抽样框不仅与目标总体保持一致，而且还尽可能的提供与研究的目标量有关的辅助信息。
年龄、性别等
举例：
居委会住户名单
抽样的类型
概率抽样按一定的概率以随机原则抽取样本概率抽样中抽样框是关键抽中的概率已知当用样本对总体目标进行估计时，要考虑到该样本被抽中的概率 “概率抽样”不等于“等概率抽样”

样本含量的估算(共55页)

2
75
简历
返回总目录
返回章目录
结束第14页
统计学讲座样本含量的估算
5、两样本率的检验
公式（5）为：
( z (1 )( Q Q ) z (1 ) / Q (1 ) / Q c 1 1 1 2 2 2 N c 1 2
1 1 1 2 2
（5）
式中：
c Q11 Q2 2
返回总目录返回章目录结束第15页
简历
统计学讲座样本含量的估算
【例5】两样本率的检验
【例5】研究针炙配合心理疗法治疗失眠的效果。预试验中，针炙和心理联合治疗的有效率为94%，单纯应用针炙治疗的有效率为85%。若取双侧α=0.05，则z0.05=1.96，β取单侧 0.10，Z0.1=1.282，则检验功效为0.9。若联合治疗的样本含量占60%（Q1），单纯治疗的样本含量占40%（Q2），则两组样本含量各为多少？计算：
简历
返回总目录
返回章目录
结束第5页
统计学讲座样本含量的估算
（二）样本含量估算的方法
样本含量估算的公式：往往是通过假设检验的公式反推而得到。 1、单样本均数的检验或配对样本均数的检验：公式为
( z z ) N
2
（1）
单侧或双侧检验：取决于α的取值。如双侧，单侧。
2
(1.96 0.904(1 0.904)(0.601 0.401 ) 1.282 0.94(1 0.94) / 0.60 0.85(1 0.85) / 0.40 0.94 0.85 495
2
联合治疗组：n1=0.60×495=297 单纯组：n2=0.40×495=198

流行病学复习资料

流行病学复习资料一、绪论1、流行病学：流行病学是研究人群中疾病与健康状况的分布及其影响因素，并研究防治疾病及促进健康的策略和措施的科学。

2、流行病学研究的三个层次：疾病、伤害和健康。

疾病包括：传染病、寄生虫病和非传染病等一切疾病。

伤害包括意外、残疾、弱智和身心伤害。

健康状态包括身体生理生化的各种功能状态、疾病前状态和长寿。

◆流行病学研究的任务和三个范畴：（1）“揭示现象”，由描述性流行病学来完成。

仅提供深入讨论原因的基础，但可对现象作初步分析。

（2）“找出原因”需借助分析流行病学的工作来完成，来检验或验证所提出的疾病线索。

（3）以找到原因为基础而“提供措施”，并进一步确证措施的有效性，这要用人群流行病学实验，即实验流行病学的工作来完成。

◆流行病学研究的三种基本方法：观察法、数理法、实验法。

◆流行病学的原理：①疾病与健康在人群中分布的原理，其中包括疾病的流行现象②疾病的发展过程，其中涵盖了机体的感染过程和疾病的流行过程③人与环境的关系，即疾病的生态学④病因推断原则⑤疾病防治的原则和策略⑥疾病防治的原则和策略，其中包括：疾病的三级预防，疾病发展的数学模型等。

◆流行病学的实际应用：①疾病预防和健康促进②疾病的监测③疾病病因和危险因素的研究④疾病的自然史⑤疾病预防的效果3、流行病学的特征：（1）群体特征（2）以分布为起点的特征（3）对比的特征（4）概率论和数理统计的特征（5）社会医学的特征（6）预防为主的特征二、疾病的分布1、疾病测量指标：◆发病指标：①发病率：表示在一定期间内（1年），一定人群中某病新病例出现的例数。

发病率=（一定期间内某人群中某病新病例例数/同期人口暴露数）×K（K=100%，1000‰，或10000/万）②罹患率：指在某一局限范围，短时间内的发病率。

它可以根据暴露来精确地测量发病几率③患病率：指某特定时间内的总人口中，患有某病（包括新旧病例）者所占的比例，也称现患率。

分为期间患病率和时点患病率（常用）。

临床医学科研常用流行病学研究方法

例美国匹兹堡大学Fisher，应用RCT ，在长达十年的研究中，推翻了乳腺癌根治术为唯一必要的手术的论点。从而，Fisher获得了1986 年Lasker奖（仅次于诺贝尔医学奖）。
随机分组
研究对象总体
研究对象样本
随机化分组
合格的研究对象
施予
实组
验干预
措施
对照组
有效无效有效
无效
剔除标淮不符合本试验入选标淮者；观察期间同时接受其他化痰药物治疗者；不能坚持按计划完成试验或出现明显不良反应而中断治疗者，后者不参加疗效统计但列入不良反应统计。
例赖诺普利治疗原发性高血压的临床疗效观察
120例轻、中度原发性高血压患者进入随机双盲对照试验，试验药赖诺普利与对照药依那普利各60例。
急性心肌梗死早期门冬氨酸钾镁治疗多中心随机对照试验
资料与方法患者选择入选标准：（1）发病24 h内的急性心肌梗死，包括Q波性和非Q波性心肌梗
死；（2）有或无心律失常和心力衰竭等并发症。排除标准（1）收缩压＜ 80 mm Hg ，二度二型房室传导阻滞，三度房
室传导阻滞，严重窦性心动过缓（心率＜ 50次／ min），若24 h以内恢复者仍可入选；（2）血钾＞55mmol／L；（3）肾功能不全（血肌酸＞ 20mg/dl。
04 前瞻性研究（追踪随访研究结果）单击添加文本具体内容
四、研究对象的选择
纳入标准研究对象具有代表性，在所选病人的年龄、性别、病型、病情方面要符合研究目的的要求；所选研究对象对处理因素的反应较强烈，以利于实验容易取得预期的结果。在临床上，尽可
能选择新发病例作为研究对象，一些老病例及重症病人对药物的疗效反应可能较差；在医学研究中，研究对象应是自愿参加试验并签署知情同意书者，以减少伦理道德问题。

医学科研设计样本含量估计

N

(z
z
)
2
两个样本均数比较
N

2

(z

z

)
2
第6版流行病学电子版
人民卫生出版社
Sample size
• Two sample randomized parallel design
• 2-sided test • α = 0.05, 1-β = 90% • σ = 2hr • δ = 1 hr
暴露人群发病率P1 =1/千人
2
2 pq z p0q0 p1q1
p1 p0 2
显著性检验 α=0.05
(1.96 2 0.00055 0.99945 1.28 0.0001 0.9999 0.001 0.999)2
N
(0.001 0.0001)2
把握度（1-β=0.90）
影响样本含量估计的因素 —估计样本含量的先提条件
实验允许的第一类错误的概率[α] 提出所期望的检验效能 [1-β] 对实验精度的要求，即容许误差 [δ] 观察指标的变异程度，即标准差[σ]
参数获得途径预试验文献检索专家意见
第6版流行病学电子版
人民卫生出版社
单个样本均数和配对检验
第6版流行病学电子版
c

2
人民卫生出版社
多个样本均数比较
k
S
2 i
k
N 2
i 1
k
( X i X )2 (k 1)
i 1
X i 和 S i 分别为第 i 个样本的均数和标准差的初估值，
k
X X i k ， k 为组数。值由值表查得。 i 1

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

样本含量的估计
流行病学与卫生统计学教研室戴江红
中药治疗子宫肌瘤的疗效研究
• 确诊为子宫肌瘤的患者60例，随机分为2组 • 中药组（消瘤散剂）30例 • 西药组（米非司酮）30例 • 分别治疗6个月 –中药组有效率60% –西药组有效率50% –P>0.05
以率的变化作为终点指标计算样本量
α水平相应的标准正态差
N
[Z

2 p (1 p ) Z

p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• 规定α水平为0.05，β水平为0.05 （ 1-β=0.95） • Zα/2=1.96，Zβ=1.64 • p1=50%，p2=60% [1.96(2×0.55×0.45)1/2+1.64(0.5×0.5+0.6×0.4)1/2]2 N= =639例 (0.5 － 0.6) 2
计量资料对照组血清胆固醇水平为215mg/dl，合理膳食可以使干预组较对照组降低15mg/dl，已知从其他资料获得胆固醇标准差为25mg/dl，规定=0.05（双侧），=0.05，计算各组样本数？
N
2( Z a Z ) 2 2 d2
σ=25, d=15, Zα=1.96，Zβ=1.64 N=72 每组需要72例
N
[Z

2 p (1 p ) Z

p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• 规定α水平为0.05，β水平为0.1 • Zα/2=1.96，Zβ=1.28 • p1=50%，p2=80% [1.96(2×0.65×0.35)1/2+1.28(0.5×0.5+0.8×0.2)1/2]2 N= (0.5 － 0.8) 2 =50例
（p1+p2）/2
对照组发生率
N
[ Z 2 p (1 p ) Z
p1 (1 p1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
为1-β水平相应的标准正态差
试验组发生率
N：为计算所得一个组的样本大小
样本含量的确定与以下因素有关：
• 设计的类型 • 主要变量的性质 • 临床上认为有意义的差值 • 显著性水平α • 把握度1-β
病例分析（3）
• 实验室检查 – 尿：潜血+ 白细胞胆红素葡萄糖++++ 酮体+ • 实验室检查 – 血液：葡萄糖+++ 尿素氮++ 碳酸氢盐正常
病例分析（4）
• 女孩可能：І型糖尿病 • 她的父母向护理专家进行咨询糖尿病的知识胰岛素的自我给药饮食控制葡萄糖监测
N
[ Z 2 p (1 p ) Z
p1 (1 p1 ) p 2 (1 p 2 ) ]2
( p1 p 2 ) 2
• Zα/2=2.58，Zβ=1.64 p1=50%，p2=80% N =111例如果随访过程可能10～20%的脱失则最少每组应保证：111/0.90=124人 111/0.80=139人
N
[Z

2 p (1 p ) Z

p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• 规定α水平为0.05，β水平为0.1 （ 1-β=0.9 ） • Zα/2=1.96，Zβ=1.28 • p1=50%，p2=70%
[1.96(2×0.6×0.4)1/2+1.28(0.5×0.5+0.7×0.3)1/2]2 N= =124例 (0.5 － 0.7) 2
样本含量的确定与以下因素有关：
• 设计的类型（流行病学） • 观察性研究 • 实验性研究
样本含量的确定与以下因素有关：
• 主要变量的性质 • 分类变量 • 数值变量 • 计数资料所需的样本含量要大些 • 计量资料所需的样本含量可少些
样本含量的确定与以下因素有关：
• 临床上认为有意义的差值 • 对照组的发生率 • 实验组的发生率
练习：用旧药治疗慢性肾炎的有效率为30%，现试验新药疗效，新药的有效率必须达到50%才认为有推广价值，问每组各需要多少例患者？设α=0.05，β=0.10
查表：Zα/2=1.96，Zβ=1.28
计算：N=？
N
[ Z 2 p(1 p) Z p1 (1 p1 ) p2 (1 p2 ) ]2 ( p1 p2 )
病例分析（1）
• 一名活泼的13岁中学生向她的父母抱怨说： – 一周来总是口渴、尿频和疲劳
• 一家人去拜见他们的家庭儿科医生
– 女孩每天要喝3升以上的水 – 24小时排尿8次，至少有一次夜尿 – 学习成绩有所下降
病例分析（2）
• 临床查体无发热脉搏80次/分（有些偏高）血压正常呼吸次数正常女孩体重比3个月前减轻了1kg 其他未发现异常
N
[Z

2 p (1 p ) Z

p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• 规定α水平为0.05，β水平为0.1（ 1-β=0.9 ） • Zα/2=1.96，Zβ=1.28 • p1=50%，p2=60% [1.96(2×0.55×0.45)1/2+1.28(0.5×0.5+0.6×0.4)1/2]2 N= (0.5 － 0.6) 2 =518例
*双侧检验时Zβ与单侧检验时相同
流行病学研究中的第Ⅰ类和第Ⅱ类错误
人群样本有差别有差别 1﹣β 把握度 β（第Ⅱ类错误）假阴性无差别 α（第Ⅰ类错误）假阳性 1-α
无差别
中药治疗子宫肌瘤的疗效研究
• 确诊为子宫肌瘤的患者60例，随机分为2组 • 中药组（消瘤散剂）30例 • 西药组（米非司酮）30例 • 分别治疗6个月 –中药组有效率60% –西药组有效率50% –P>0.05
2
练习：用旧药治疗慢性肾炎的有效率为30%，现试验新药疗效，新药的有效率必须达到50%才认为有推广价值，问每组各需要多少例患者？设α=0.05，β=0.10
查表：Zα/2=1.96，Zβ=1.28
计算：N=124
中药治疗子宫肌瘤的疗效研究
• 确诊为子宫肌瘤的患者60例，随机分为2 组 • 中药组（消瘤散剂）30例 • 西药组（米非司酮）30例
• 比较瘤体缩小
以定量指标的变化作为终点指标计算样本量
为1-β水平相应的标准正态差
估计的标准差
N
2( Z a Z ) 2 2 d2
两组连续变量均值之差
α水平相应的标准正态差
公式适用于N≥30时
n1 n
2
( z 2
/ 2
z

)
2
【例】为研究某地正常成年男、女末稍血液的红细胞的差别，据文献报道，男性红细胞均数为465万/mm3 ，女性红细胞均数为422万/mm3，标准差为52万/mm3，取双侧α=0.05，把握度(1-β)=0.9，问要抽查多少人才能发现男女间红细胞的差别？
样本含量（sample size）
• 为了保证研究结论的可靠性，确定的实验研究或调查研究所需要的最低观察对象的数量。 • 样本含量少，指标不稳定，精密度和准确度差；检验功效低。研究结论不可靠。 • 样本含量过多，造成人财物的不必要浪费。混杂因素多，影响数据质量。
N
[Z

2 p (1 p ) Z
N
[Z

2 p (1 p ) Z
Hale Waihona Puke p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• 规定α水平为0.01，β水平为0.05 （ 1-β=0.95） • Zα/2=2.58，Zβ=1.64 • p1=50%，p2=60% [2.58(2×0.55×0.45)1/2+1.64(0.5×0.5+0.6×0.4)1/2]2 N= =878例 (0.5 － 0.6) 2
N
[Z

2 p (1 p ) Z

p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• Zα/2=2.58，Zβ=1.64 p1=50%，p2=80% [2.58(2×0.65×0.35)1/2+1.64(0.5×0.5+0.8×0.2)1/2]2 N= (0.5 － 0.8) 2 =111例估计随访过程可能10～20%的脱失，则最少每组应保证多少人？
结局+ 实验组（干预措施）
随机分组
结局－随访观察结局+ 对照组（对照措施）结局－
病人群体
样本
临床试验原理示意图
可能比较的结局指标
• 生存率 • 生存质量 • 不良反应 • 并发症：如由于糖尿病所致的血管问题的危险 • 测量糖化血红蛋白，一种监测长期血糖水平的指示剂 • 在特定时间点上的血糖水平

p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• 规定α水平为0.01，β水平为0.05 • Zα/2=2.58，Zβ=1.64 • p1=50%，p2=80% [2.58(2×0.65×0.35)1/2+1.64(0.5×0.5+0.8×0.2)1/2]2 N= =111例 (0.5 － 0.8) 2
以率的变化作为终点指标计算样本量
α水平相应的标准正态差
（p1+p2）/2

样本含量的估计(流行病学应用)

合集下载

样本量计算(Epiinfo2002流行病学分析软件的应用讲座补充资料)

常用流行病学研究方法

流行病学方法—筛查试验

临床研究中样本量的估计方法

(完整版)第18章样本含量的估计

(完整版)第18章样本含量的估计

样本含量估计及等效性检验

样本含量的计算

医学研究中样本量的估计

8.《流行病学》(第9版)教学大纲(适用临床医学等专业)

流行病学名词解释

分析流行病学方法

抽样及样本含量估计

样本含量的估算(共55页)

流行病学复习资料

临床医学科研常用流行病学研究方法

医学科研设计样本含量估计

文档推荐

最新文档