医学研究关于某样本例数选择
- 格式:doc
- 大小:3.17 MB
- 文档页数:24
临床医学研究对象样本量的估计临床医学研究对象样本量的估计宁夏医学杂志副主编蒋兴国临床医学研究没有绝对的样本量标准,不同的研究⽅法、研究⽬的,研究要求和研究资料决定了样本量。
⼀般⽽⾔,样本越⼩,结果的估计越精确。
但样本过⼤或过⼩均可影响研究的可⾏性。
因此,科学地确定样本量可增加研究的可靠性,得到可信的研究结果。
1.估计样本量的决定因素[1]1.1 资料性质计量资料如果设计均衡,误差控制得好,样本可以⼩于30例; 计数资料即使误差控制严格,设计均衡, 样本需要⼤⼀些,需要30-100例。
1.2 研究事件的发⽣率研究事件预期结局出现的结局(疾病或死亡),疾病发⽣率越⾼,所需的样本量越⼩,反之就要越⼤。
1.3 研究因素的有效率有效率越⾼,即实验组和对照组⽐较数值差异越⼤,样本量就可以越⼩,⼩样本就可以达到统计学的显著性,反之就要越⼤。
1.4 显著性⽔平即假设检验第⼀类(α)错误出现的概率。
为假阳性错误出现的概率。
α越⼩,所需的样本量越⼤,反之就要越⼩。
α⽔平由研究者具情决定,通常α取0.05或0.01。
1.5 检验效能检验效能⼜称把握度,为1-β,即假设检验第⼆类错误出现的概率,为假阴性错误出现的概率。
即在特定的α⽔准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。
检验效能即避免假阴性的能⼒,β越⼩,检验效能越⾼,所需的样本量越⼤,反之就要越⼩。
β⽔平由研究者具情决定,通常取β为0.2,0.1或0.05。
即1-β=0.8,0.1或0.95,也就是说把握度为80%,90%或95%。
1.6 容许的误差(δ)如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最⼤的误差为多少。
容许误差越⼩,需要样本量越⼤。
⼀般取总体均数(1-α)可信限的⼀半。
1.7 总体标准差(s)⼀般因未知⽽⽤样本标准差s代替。
1.8 双侧检验与单侧检验采⽤统计学检验时,当研究结果⾼于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就⼤; 当研究结果仅⾼于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就⼩。
临床试验的病例选择确保研究结果的代表性和推广性临床试验是医学研究中至关重要的环节,它通过对病例的选择来研究治疗手段的有效性和安全性。
在进行临床试验时,病例的选择对于研究结果的代表性和推广性具有至关重要的作用。
本文将就如何确保临床试验病例的选择以提高研究结果的代表性和推广性,进行探讨。
1. 临床试验病例的涵盖范围在进行临床试验时,首先要确保研究对象的涵盖范围足够广泛,能够代表目标人群的特征。
例如,对于一种新型药物的研究,应该选择各个年龄段、性别、地域分布、疾病类型等不同特征的病例进行试验。
这样可以最大程度地反映真实世界中各类患者对该药物的反应情况,提高研究结果的代表性。
2. 试验病例的随机选择为了更加客观地评估治疗手段的效果,临床试验通常采用随机分组的方法来选择试验病例。
通过将病例随机分配到治疗组和对照组,可以减少个体差异对结果的影响,提高研究结果的可靠性。
在随机选择试验病例时,应该确保选取的样本具有一定的数量,以便结果的统计学分析能够具备一定的可信度。
3. 考虑不同疾病的特点不同的疾病有着不同的特点和临床表现,因此在进行临床试验时,需要考虑到疾病的特点对研究结果的影响。
例如,在进行心血管疾病的临床试验时,应该选择有心血管疾病史的病例,并且需要按照不同的病情严重程度进行分组。
这样可以更准确地评估治疗手段对不同疾病情况下的效果,增加研究结果的推广性。
4. 关注病例的代表性为了确保研究结果的代表性,临床试验选取的病例应能够反映真实世界中的各类情况。
例如,在对一种新型药物进行临床试验时,应该选择不同医疗机构的病例,以保证研究结果具有一定的普遍适应性。
此外,还应特别关注一些特殊群体的代表性,如年龄较大、合并疾病较多,或是孕妇、儿童等特殊人群。
只有在病例选择上充分考虑到代表性,临床试验的结果才具有更高的价值和推广性。
总结起来,为了确保临床试验的病例选择能够提高研究结果的代表性和推广性,需要注意病例涵盖范围的广泛性、随机性的引入、疾病特点的考虑以及病例的代表性。
复习资料第一大题:单项选择题1、欲了解某市8岁小学生的身高情况,该市某小学二年级8岁小学生是:()∙ A. 样本∙ B. 有限总体∙ C. 无限总体∙ D. 个体2、抽样调查了某地4岁男孩的生长发育情况,得到身高均数为98.67cm,标准差为4.63cm,头围均数为46.23cm,标准差为3.16cm,欲比较两者的变异程度,下列结论正确的是:()∙ A. 身高变异程度大∙ B. 头围变异程度大∙ C. 身高和头围的变异程度相同∙ D. 由于两者的均数相差很大,无法比较两者的变异程度3、在计算方差时,若将各观察值同时减去某一常数后求得的方差:( )∙ A. 会变小∙ B. 会变大∙ C. 不变∙ D. 会出现负值4、某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为( )∙ A. 概率∙ B. 构成比∙C. 发病率∙D. 相对比5、两个分类变量的频数表资料作关联性分析,可用( )∙A. 积距相关或等级相关∙B. 积距相关或列联系数∙C. 列联系数或等级相关∙D. 只有等级相关6、对于服从双变量正态分布的资料,如果直线相关分析算出的值越大,则经回归分析得的相应的b 值:∙A. 越大∙B. 越小∙C. 比r小∙D. 可能较大也可能较小7、多组均数的两两比较中,若不用q检验而用t 检验,则:()∙A. 结果更合理∙B. 结果一样∙C. 会把一些无差别的总体判断为有差别∙D. 会把一些有差别的总体判断为无差别8、在比较甲、乙两种监测方法测量结果是否一直时,若采用配对设计秩和检验,甲、乙两法测量值之差中有-0.02、0.02,若差值绝对值的位次为3、4,则这两个差值的秩次分别为:()∙A. -3.5,3.5∙ B. -3.5,-3.5∙ C. 3.5,3.5∙ D. -3,49、Y=14+4X是1~7岁儿童以年龄(岁)估计体重(市斤)回归方程,若体重换成国际单位kg,则此方程:()∙ A. 截距改变∙ B. 回归系数改变∙ C. 两者都改变∙ D. 两者都不变10、某卫生局对其辖区内甲、乙两医院医疗技术人员的业务素质进行考核,在甲医院随机抽取100人,80人考核结果为优良;乙医院随机抽取150人,100人考核结果为优良。
第一章绪论1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。
2、研究对象:具有不确定性结果的事物。
3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。
4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。
5、医学统计学根本内容:统计设计、数据整理、统计描述、统计推断。
6、医学统计学中的根本概念(1) 同质与变异同质,指根据研究目的所确定的观察单位其性质应大致相同。
变异,指总体内的个体间存在的、绝对的差异。
统计学通过对变异的研究来探索事物。
(2) 变量与数据类型变量,是反映实验或观察对象生理、生化、解剖等特征的指标。
变量的观测值,称为数据分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。
〔如身高、体重、血压、温度等〕定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。
包括二分类、无序多分类。
〔进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、A B等〕有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。
统计方法的选用与数据类型有密切的关系。
〔3〕总体与样本总体,指根据研究目确实定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。
样本,是从研究总体中随机抽取局部有代表性的观察单位,对变量进行观测得到的数据。
抽样,是从研究总体中随机抽取局部有代表性的观察单位。
参数,指描述总体特征的指标。
统计量,指描述样本特征的指标。
〔4〕误差误差,指观测值与真实值、统计量与参数之间的差异。
可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。
随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。
抽样误差,是抽样引起的统计量与参数间的差异。
抽样误差主要来源于个体的变异。
工作总结医学研究中的样本收集与处理在医学研究中,样本的收集与处理是非常重要的环节。
它涉及到研究结果的准确性和可靠性。
本文将从样本收集的主要步骤、样本处理的方法以及注意事项等方面进行总结。
一、样本收集1. 研究对象的选择在进行医学研究时,首先需要明确研究对象。
根据研究的目的和假设,选择合适的研究对象,如人体组织、血液、尿液、细胞等。
同时,要确定样本的数量和质量要求。
2. 规范化的操作步骤在样本收集过程中,需要严格按照规范化的操作步骤进行。
这包括消毒、穿戴无菌手套和口罩,避免污染样本。
3. 采集合适的样本量样本的数量要根据研究的需求和统计学原理进行确定。
过少的样本容易导致研究结果不够准确,而过多的样本则会增加工作量。
在样本采集过程中,要确保获得足够的样本量。
4. 样本记录和标识在收集样本的同时,要记录详细的信息,如样本编号、采集时间、采集者等。
同时,每个样本都需要进行标识,以便后续的处理与分析。
二、样本处理1. 样本保存与储存在医学研究中,样本的保存非常重要。
不同的样本要采用不同的保存方式,如低温冷冻、冷藏、干燥等。
在进行样本储存时,要确保样本的完整性和稳定性。
2. 样本预处理有时,样本需要经过预处理才能进行进一步的分析。
例如,血液样本可能需要离心来分离血清或血细胞。
在进行样本预处理时,要确保操作准确,避免对样本造成不必要的损伤。
3. 数据采集与分析样本处理后,需要进行数据采集与分析。
这包括对样本的性质、成分、浓度等进行测量和统计。
根据需要,可以采用各种各样的实验技术和仪器来获取所需数据。
三、注意事项1. 符合伦理要求在进行医学研究时,样本的收集和处理要符合伦理要求,尊重研究对象的权益。
研究项目需经过伦理委员会的审核和批准。
2. 严格控制实验条件样本的收集与处理过程中,实验条件的严密控制是确保结果准确的关键。
如操作环境的清洁、温度的控制、时间的准确记录等。
3. 重复实验与验证结果为了确保结果的可靠性,对于重要的实验结果,需进行重复实验与验证。
医学统计学案例选第一章绪论部分案例1-1着手撰写一份研究计划书,你所选的研究课题应该关系到人类健康。
简单叙述立题依据、研究背景、研究目的、研究内容、研究方法和需要什么样的资料,如何获得和分析资料,用什么方法表达与展示结果等,请保留你的这份作业,并在学习完本书后再重新翻阅。
你发现了什么问题,应如何修改?你的收获是什么?第二章实验设计部分案例2-1《丹栀逍遥散治疗混合性焦虑抑郁障碍的临床研究》(河南中医2004年第24卷第8期第62页)欲观察丹栀逍遥散治疗混合性焦虑抑郁障碍的临床疗效,以某西药作为对照组。
将64例符合纳入标准的病例按诊疗次序交替分组,即单号为中药组,双号为西药组。
请讨论该分组方法是否随机?案例2-2《单宫颈双子宫畸形28例人工流产分析》(中国实用妇科与产科杂志1999年3月第15卷第3期172页)通过回顾分析某医院1990年1月至1998年3月期间28例单宫颈双子宫畸形早孕流产的结果,发现人流术前先给予米索前列醇素制剂可使得流产更容易、安全,减少病人痛苦并且可避免并发症的发生。
而文中两组的分组方法为:所有病例按就诊先后顺序分组,1995年10月以后的为A组,1995年10月以前的为B组。
A组(米索组)于手术前3小时服米索600μg或手术前1小时后穹隆放置米索200μg,然后进行人工流产吸宫术,共14例;B组(对照字)单纯采用常规流产术机械扩张宫颈后吸宫。
作者认为该法“符合随机分配法则”。
请讨论对照组的设置是否合适?案例2-3《用24小时食管pH监测法诊断食管原性胸痛》(中华外科杂志1995年33卷第2期第69页)一文中,作者对30例疑为食管原性胸痛患者的24小时食管pH监测,其中16例昼夜均异常,8例白天异常,2例夜里异常,18例胸痛与酸暴露有关。
得出食管pH监测是诊断胃食管反流所致的食管原发性胸痛的有效方法的结论,请讨论该文结果是否成立?案例2-4《强骨胶囊治疗原发性骨质疏松症的临床试验》(中药新药与临床药理,2004年15卷第4期284页)目的是观察强骨胶囊与骨松宝颗粒对骨质疏松症患者的疗效与安全性。
《医学统计学》习题解答(最佳选择题和简答题)孙振球主编.医学统计学习题解答. 第2版. 北京:人民卫生出版社2005目录第二章计量资料的统计描述 (2)第三章总体均数的估计与假设检验 (3)第四章多个样本均数比较的方差分析 (6)第五章计数资料的统计描述 (7)第六章二项分布与Poisson分布 (9)第七章χ2检验 (11)第八章秩和检验 (13)第九章回归与相关 (14)第十章统计表与统计图 (17)第十一章多因素试验资料的方差分析 (19)第十二章重复测量设计资料的方差分析 (19)第十五章多元线性回归分析 (20)第十六章logistic回归分析 (22)第十七章生存分析 (23)第二十五章医学科学研究设计概述 (26)第二十六章观察性研究设计 (26)第二十七章实验研究设计 (28)第二十七章临床试验研究设计 (29)第二章 计量资料的统计描述(注:题号上有“方框” 的简答题为基本概念,下同)第三章总体均数的估计与假设检验简答题:第四章多个样本均数比较的方差分析简答题:第五章计数资料的统计描述简答题:第六章二项分布与Poisson分布简答题:第七章χ2检验简答题:1. 说明χ2检验的用途2. 两个样本率比较的u检验与χ2检验有何异同?3. 对于四格表资料,如何正确选用检验方法?4. 说明行×列表资料χ2检验应注意的事项?5. 说明R×C表的分类及其检验方法的选择。
第八章秩和检验简答题:5. 两独立样本比较的Wilcoxon秩和检验,当n1>10或n2-n1>10时用u检验,这时检验是属于参数检验还是非参数检验,为什么?6. 随机区组设计多个样本比较的Friedman M 检验,备择假设H1如何写?为什么?第九章回归与相关简答题:第十章统计表与统计图简答题:5. 统计表与统计图有何联系和区别?6. 茎叶图与频数分布图相比有何区别,有何优点?第十一章多因素试验资料的方差分析一、简答题1. 简述析因试验与正交试验的联系与区别。
医学研究的样本例数读者须知在医学研究中样本例数的确定是一个难点,医学统计学家认为样本含量的确定有两种方法:公式法和查表法,公式法和查表法本质一样,查表法是统计学家由公式做出的,而公式法需要研究者自己做,因为医学研究中尚有不少问题还搜索不到相应的计算公式来确定样本例数,本书搜集到的公式也十分有限,那么通过搜索文献来估计样本例数也是读者需要学习的一种方法。
须知,不存在无限定条件的样本例数。
现行统计教材中的样本例数没有特别强调这一点,以导致使用时,常提出如下问题:“了解吸烟是否是肺癌的危险因素,需要调查多少人?”,类似这样的问题是没人能回答出的。
医学研究中样本例数都是建立在一组限定条件之下的样本例数,若这一组限定条件改变,那么样本例数的值随之改变。
简言之,样本例数是这一组限定条件的函数。
这种函数关系具体由计算样本例数的公式表述。
那么,确定公式等号右端的各参数就变成了计算样本例数的前提。
根据此思路我们设计了一个确定样本例数的流程图(见下页),同时,这个流程图也是我们撰写本书具体内容和阅读本书的思路。
这个小册子中的例题均来自各种卫生统计学的教材和相关著作,其本质没有变化,但读起来却更加符合人们的认知习惯,你会感觉到更容易读懂了。
本书由一附院医学统计咨询室集体讨论,具体由孙奇执笔撰写和排版,几经修订,历时超过百天。
尽管如此,鉴于我们知识的局限性,也只能做到抛砖引玉,而且书中错误肯定难免。
欢迎读者不吝指正,我们将深表谢意!样本例数估计流程图目录4 1.两样本率比较的数··································6 2.多个样本率比较的数······························8 3.两样本均数比较的数······························10 4.多个样本均数比较的数·····························12 5.诊断试验的样数·········································13 6.现况研究的样数 (13)15 7.病例对照研究的数 (15)17 8.队列研究的样数 (17)19 9.多元统计的样数 (19)10.20他······················································21 11.表·······························································1 两样本率比较的样本例数提出专业问题某课题的研究目的是比较两种药物治疗乙型肝炎后表面抗原HBsAg 的改善情况,问两组各需要乙肝患者多少名? 转化为统计问题上述研究所对应的统计问题为:两样本率比较的样本例数 选择相应的公式两样本率比较的样本例数公式()[1]139221222211112112/)(]/)1(/)1())(1(2[p p Q p p Q p p Z Q Q p p Z N a --+-++-=--β确定公式等号右端各参数1.公式中a Z 、βZ 、P 、1P 、2P 、1Q 、2Q 的确定方法如下: (1)a Z 的确定:统计学家建议05.0=a ,则96.12/05.0=Z 。
医学统计学复习必过《卫⽣学习题集》《卫⽣学习题集》6.0 复习第⼋章、医学统计基本内容【A型题】1. 统计⼯作的前提和基础是A. 搜集资料B. 调查资料C. 整理资料D. 校对资料E. 分析资料2. 为了由样本推断总体,样本应当是A. 总体中任意⼀部分B. 总体中的典型部分C. 总体中有价值的⼀部分D. 总体中有意义的⼀部分E. 总体中有代表性的⼀部分3. 计量数据、计数数据和等级数据的关系有A. 计数数据兼有计量数据和等级数据的⼀些性质B. 计量数据兼有计数数据和等级数据的⼀些性质C. 等级数据兼有计数数据和计量数据的⼀些性质D. 计数数据有计量数据的⼀些性质E. 等级数据⼜可叫半计数资料4. 统计表有简单表和复合表两种,复合表是指A. 有主辞和宾词B. 主辞分成两个或两个以上标志C. 宾辞分成两个或两个以上标志D. 包含两张简单表E. 包含两张或两张以上简单表5. 要制定某年某地恶性肿瘤男、⼥年龄别死亡率的统计分析表,则主要标志是A. 年龄别B. 性别C. 死亡率D. 性别和年龄别E. 性别、年龄别和死亡率6. 图⽰某年某医院门诊患者的年龄分布,宜绘制A. 直⽅图B. 圆图C. 百分柱形图D. 柱形图E. 普通线图7. 某研究者准备通过分析800⼈的⾎压数据以评价当地⾼⾎压患病情况,问可以考虑将⾎压测量值按哪种变量类型进⾏处理A. 计量资料B. 计数资料C. 等级数据D. 以上均可E. 以上均不可8. 半对数线图A. 纵横轴都必须为对数尺度B. 纵轴为对数尺度,横轴为算术尺度C. 横轴为对数尺度,纵轴为算术尺度D. 纵横轴都必须为算数尺度E. 以对数的1/2值作纵横轴尺度9. ⽐较某年某地四种病的病死率时,宜绘制A. 普通线图B. 半对数线图C. 直⽅图D. 百分柱形图E. 柱形图10. 要反映某市连续5年甲肝发病率的变化情况,宜选⽤A. 柱形图B. 直⽅图C. 线图D. 百分柱形图E. 散点图11. 下列哪些统计图适⽤于计数资料A. 柱形图、直⽅图B. 线图、半对数线图C. 柱形图、百分柱形图D. 百分柱形图、直⽅图E. 散点图、线图12. 下列哪种统计图纵坐标必须从0开始A. 半对数线图B. 散点图C. 百分柱形图D. 普通线图E. 柱形图13. 关于统计表的列表要求,下列哪项是错误..的A. 标题应写在表的上端,简要说明表的内容B. 横标⽬是研究对象,列在表的右侧;纵标⽬是分析指标,列在表的左侧C. 线条主要有顶线、底线及纵标⽬下⾯的横线,不宜有斜线和竖线D. 数字右对齐,同⼀指针⼩数位数⼀致,表内不宜有空格E. 备注⽤“*”标出,写在表的下⾯14. 医学统计⼯作的基本步骤是A. 调查、搜集数据、整理数据、分析数据B. 统计数据收集、整理数据、统计描述、统计推断C. 设计、搜集数据、整理数据、分析数据D. 调查、统计描述、统计推断、统计图表E. 设计、统计描述、统计推断、统计图表15. 统计分析的主要内容有A. 描述性统计和统计学检验B. 区间估计与假设检验C. 统计图表和统计报告D. 描述性统计和分析性统计E. 描述性统计和统计图表16. 抽样误差是指A. 不同样本指针之间的差别B. 样本指针与总体指针之间由于抽样产⽣的差别(参数与统计量之间由于抽样⽽产⽣的差别)C. 由于抽样产⽣的观测值之间的差别D. 样本中每个个体之间的差别E. 随机测量误差与过失误差的总称17. 概率是描述某随机事件发⽣可能性⼤⼩的数值,以下对概率的描述哪项是错误..的A. 其值的⼤⼩在0和1之间B. 当样本含量n充分⼤时,我们有理由将频率近似为概率C. 随机事件发⽣的概率⼩于0.05或0.01时,可认为在⼀次抽样中它不可能发⽣D. 必然事件发⽣的概率为1E. 其值必须由某⼀统计量对应的概率分布表中得到18. 统计学中所说的总体是指A. 任意想象的研究对象的全体B. 根据研究⽬的确定的研究对象的全体C. 根据时间划分的研究对象的全体D. 根据⼈群划分的研究对象的全体E. 根据地区划分的研究对象的全体19. 搞好统计⼯作,达到预期⽬标,最重要的是A. 原始数据要正确B. 原始资料要多C. 分析资料要先进D. 整理资料要详细E. 统计计算精度要⾼20. 医学统计⼯作的四个基本步骤中,搜集资料的过程不包括...A. 实验B. 统计报告C. ⽇常医疗卫⽣⼯作记录D. 专题调查E. 录⼊计算机21. 对统计表和统计图标题的要求是A. 两者标题都在下⽅B. 两者标题都在上⽅C. 统计表标题在上⽅,统计图标题在下⽅D. 统计表标题在下⽅,统计图标题在上⽅E. 可随意设定位置22. 制作统计图时要求A. 纵横两轴应有标⽬,⼀般不注明单位B. 纵轴尺度必须从0开始C. 标题应注明图的主要内容,⼀般应写在图的上⽅D. 在制作柱形图和线图时,纵横两轴长度的⽐例⼀般取5:7E. 柱形图是以⾯积⼤⼩来表⽰数值的【B型题】A. ⽤清点数⽬数出来的资料B. ⽤仪器量出来的数据C. 按观察单位的类别清点各观察单位数得来的数据D. ⽤定量⽅法测定观察单位某个量的⼤⼩得来的数据E. 按观察单位的等级清点各等级观察单位数得来的数据23.计量资料是24.计数资料是25.等级数据是A. 数值变数B. 独⽴的两类C. 不相容的多类D. 类间有程度差别E. 以上均不是26.⽩细胞数属于27.⾎型A、B、AB、O属于28.痊愈、显效、进步、⽆效属于【X型题】29.统计⼯作的基本步骤是A. 搜集资料B. 整理资料C. 分析资料D. 核对资料E. 计算机录⼊数据30.构成图是指A. 柱形图B. 圆图C. 直⽅图D. 百分柱形图E. 线图31.整理数据的⽬的是A. 为了分组B. 使资料条理化C. 检查核对资料D. 便于统计分析E. 使资料系统化32.统计资料可分为A. 计量资料B. 频数表资料C. 计数资料D. 四格表资料E. 等级数据33.以下哪些属于计量资料A. ⾝⾼的测定值B. 体重的测定值C. ⾎压的测定值D. 脉搏数E. ⽩细胞数34.以下数据中,按等级分组的数据是A. 治疗效果B. ⾎型分布C. 某项化验指标的测定结果D. ⽩细胞分类百分⽐E. ⾝⾼35.根据医学研究资料的特点,医学统计中常⽤的分组⽅法有A. 品质分组B. 数量分组C. 年龄分组D. 性别分组E. 体重分组36.以统计图表⽰连续性资料,可选⽤A. 普通线图B. 直⽅图C. 半对数线图D. 柱形图E. 圆图37.以统计图表⽰住院患者中主要疾病的构成情况,可⽤A. 柱形图B. 百分柱形图C. 直⽅图D. 圆图E. 普通线图【名词解释】38.总体39.样本40.概率41.计量资料42.计数资料43.等级数据44.柱形图45.普通线图46.半对数线图47.直⽅图【简答题】48.何谓统计表?其基本结构是什么?49.统计表的种类有哪⼏种?50.统计表设计的基本要求是什么?51.统计表和统计图在资料的表达中有什么作⽤?52.常⽤的统计图有哪些种类?其各⾃的适⽤条件是什么?53.普通线图与半对数线图的区别是什么?54.资料搜集计划应包括哪些⽅⾯的内容?55.统计⼯作的基本步骤是什么?56.统计设计包括哪些内容?57.统计资料的来源有哪些途径?58.直⽅图与百分柱形图有何区别?【应⽤题】59.请根据下表资料考虑:⑴若⽐较两个年龄组⼉童四种疾病的发病率,应绘制什么图?⑵若⽐较两个年龄组⼉童四种疾病的疾病构成情况,应绘制什么图?表某年某地两个年龄组四种疾病发病情况病种例数构成⽐(%) 发病率(‰)例数构成⽐(%) 发病率(‰)百⽇咳80 16 4. 0 60 32 1. 5 ⿇疹320 64 16. 0 48 25 1. 2 猩红热60 12 3. 0 45 24 1. 1 ⽩喉40 8 2. 0 36 19 0.960.请按绘制统计表的要求对下表进⾏修改。
案例分析—四格表确切概率法【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。
经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。
表1-4 两种药物治疗急性心肌梗塞的疗效比较药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7西药 6(8.67)7(4.33)1346.2合计1892766.7【问题1-5】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?【分析】(1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。
(2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。
(3) 患者总例数n=27<40,该医师用χ2检验是不正确的。
当n<40或T<1时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率案例分析-卡方检验(一)【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。
该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。
【问题1-1】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法?【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。
(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。
医学研究中统计分析方法的选择与应用一般人认为统计学在医学研究中的应用就是资料的统计分析,这是因为这部分工作容易被人觉察到,并且也是统计学中非常重要的一部分,然而这是一种不太全面的看法。
因为统计学在医学科研中的作用不仅仅是资料的统计分析,它的应用贯穿于整个研究过程之中,包括计划、设计、实施、资料处理与分析,到结果的展示和解释,直至到最后论文发表,都需要统计学知识的支持。
因此,学好统计学基本理论,掌握每一种统计方法的适用条件及其使用技巧,对每一位医学研究人员来讲是必须具备的基本功之一。
第1节临床科研中研究变量的类型在进行资料统计分析之前,必须辨别清楚将要统计分析的研究变量的性质和在研究中所起的作用。
因为不同类型的资料所选用的统计量和统计方法不同,在病因学科研中研究变量所起的作用以及研究其目的不同,对它们的处理也不一样。
以下按测量单位和病因学研究的目的对研究变量的类型加以介绍。
一、按测量尺度分类1.计量资料对每个观察单位用定量的方法测定某项指标的大小,所得的资料称为计量资料(measurement data),一般有度量衡等单位。
例如在研究血压与身高、体重等身体型态指标的关系时,以人为观察单位,测得的身高(cm)、体重(kg)和血压(mmHg)属于计量资料。
又如在环境污染与人体健康关系的研究时,以每个采样点为观察单位,测量不同采样点空气中二氧化碳、氮氧化物、悬浮颗粒等的浓度(mg/L)。
再如临床实验室检验中,血脂的浓度、血糖的含量、血清中肌酸磷酸激酶浓度(IU)等也属于计量资料。
计量资料又可分为离散型和连续型资料两种。
离散型资料往往是一种计数,如每名儿童口腔中的龋齿个数、单位面积内细菌菌落的个数、显微镜下每个方格中的红细胞数。
这种计数只能是0和正整数,不可能是负数,也不会有小数点。
连续型资料,理论上在任何两个数值之间都会有无穷多个数据,如身高,在175厘米与176厘米之间理论上存在无穷多个数据。
2.计数资料将观察单位按某种属性或类别分组,然后清点各组观察单位的个数所得的资料称为计数资料(enumeration data)。
实习一统计工作的基本步骤及图表制备一、目的要求1、正确理解统计工作的四个基本步骤:统计设计、搜集资料、整理资料、分析资料,它们之间的关系。
2、学会拟制调查表,整理表的统计表的基本原则和方法。
3、重点学会如何对原始资料进行整理,并正确绘制图表。
二、时间2学时三、内容(一)统计表1、按下题要求自制调查卡片一份,某医师想观察胎盘娩出方式与人工流产史的关系,须要统计项目是人工流产史(流产胎次)和胎盘娩出方式(包括自娩、人工剥离和子宫切除),请你帮他拟制调查卡片,以便调查登记。
总例数:252例自娩:176例。
其中有人工流产史1次者34例,有2次者1例,无人工流产史者141例。
人工剥离:75例。
其中有人工流产史1次者17例,2次者6例,3次者1例;无人工流产史者51例。
子宫切除:1例。
该例为植入性胎盘,既往无人工流产史。
2、按下题要求编制统计表某研究者研究文化活动与老年人生活满意率的关系,调查了经常参加文化活动的老年人306人,对生活满意者有219人,不经常参加文化活动者246人,对生活满意者有159人。
(二)统计图1、对以下资料绘制适当统计图(1)某年某地儿童近视情况:年龄8 9 10 11 12 13 14 15人数100 150 120 110 120 130 100 120近视人数20 32 28 25 30 38 40 58(2)某年某地某病按月发病人数月份 1 2 3 4 5 6 7 8 9 10 11 12发病人数9 8 14 26 32 43 45 45 40 18 12 10(3)两种气管炎病人疗效比较分组临床治愈显效好转无效单纯型60985112喘息型238365112、以下表资料绘成下面的统计图,你有何意见?试根据资料性质选择正确的统计图表示。
1955年某地几种传染病的病死率传染病病死率(%)白喉10.9流行性乙型脑炎18.0流行性脑脊髓膜炎11.0伤寒与副伤寒 2.7痢疾 1.2脊髓灰质炎 3.41955年某地几种传染病的病死率3、根据下面资料绘成的图是否恰当,如不当,请改制。
医学研究中常见的样本量估算方法一、本文概述在医学研究中,样本量估算是一项至关重要的工作,它直接影响到研究结果的可靠性和有效性。
正确的样本量估算能够确保研究具有足够的统计效力,从而得出准确且可信的结论。
本文旨在深入探讨医学研究中常见的样本量估算方法,帮助研究人员在设计和实施研究时能够科学、合理地确定样本量,以提高研究的质量和效率。
文章将先对样本量估算的基本概念进行介绍,然后重点阐述几种常用的样本量估算方法,包括基于效应量、基于统计效力、基于预试验数据等方法。
文章还将讨论影响样本量估算的因素,如研究设计、目标总体、效应大小等,并提供一些实用的建议和指导,以帮助研究人员更好地进行样本量估算。
通过本文的学习,读者将能够掌握医学研究中样本量估算的基本方法和技巧,为成功开展医学研究奠定坚实的基础。
二、样本量估算的基本概念在医学研究中,样本量估算是一个至关重要的步骤,它决定了研究所需的数据量,进而影响到研究结果的准确性和可靠性。
样本量估算的基本概念主要包括以下几个方面:总体与样本:总体是指我们想要研究的全部观察对象的集合,而样本则是从总体中随机抽取的一部分观察对象。
样本量就是样本中所包含的观察对象的数量。
样本量的选择应当足以代表总体,并能够提供足够的信息来推断总体的特性。
效应量:效应量是指研究中预期的处理效应或差异的大小。
它可以是两组之间的均值差、比例差或其他任何形式的度量。
效应量的大小直接影响了样本量的需求,因为较大的效应量通常需要较小的样本量来检测。
误差与置信水平:在样本量估算中,我们通常会考虑到两类误差:一类是第一类错误(或称为α错误),即错误地拒绝了原假设(即实际上没有差异,但研究结果显示有差异);另一类是第二类错误(或称为β错误),即错误地接受了原假设(即实际上有差异,但研究结果显示没有差异)。
样本量估算需要在这两类错误之间进行权衡,以确定一个合适的样本量。
置信水平也是影响样本量估算的一个重要因素,它表示我们对研究结果的信任程度。
《医学统计学》课程考试试题(B卷)(评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷)注意:第1-80小题的答案全部涂到答题卡上。
一、选择题(每题1分,共55分,只选一个正确答案)1、下列指标中不属于离散趋势的指标()A.样本均数 B.方差 C.全距 D.离均差平方和2、计量资料编制频数表时,组段数的选择()A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关3、比较一组人群身高与体重的变异度应选()A.极差 B.方差 C.标准差 D.变异系数4、若要用标准差描述资料的离散趋势,对资料的要求是()A.未知分布类型的资料 B.等级资料C.呈倍数关系的资料 D.正态分布资料5、频数分布两端有超限值时,描述其集中趋势的指标是()A.标准差 B.几何均数 C.相关系数 D.中位数6、医学统计工作的步骤是()A、研究设计、收集资料、整理资料和分析资料B、计量资料、计数资料、等级资料和统计推断C、研究设计、统计分析,统计描述和统计推断D、选择对象、计算均数、参数估计和假设检验7、下列关于变异系数的说法,其正确的是()A.比较均数相差较大的两组或多组资料的变异程度B.描述一组资料的离散趋势C.其度量横单位与均数的度量衡单位一致 D.其度量横单位与标准差的度量衡单位一致8、10名食物中毒的病人潜伏时间(小时)分别为3,4,5,3,2,5.5,2.5,6,6.5,7,其中位数是()A.4 B.4.5 C.3 D.2 9、调查一组正常成人的白细胞数,如果资料属于正态分布,描述这组资料集中趋势的指标为()A.中位数 B.算术均数 C.二者均不可 D.二者均可10、正态分布曲线下,当μ不变,σ变大时,()A.曲线形态不变,中心位置向左移 B.曲线形态不变,中心位置向右移C.曲线形态变的矮胖,中心位置不变 D.曲线形态变的瘦高,中心位置不变11、用于描述一组对称分布资料全部观察值变异程度大小的指标是()A.S B.R C. D.CV12、下列指标中,不属于集中趋势指标的是()A.算术均数 B.中位数 C.变异系数 D.几何均数13、总体是由()组成A.部分个体 B.全部个体 C.相同的观察指标 D.同质个体的所有变量值14、随着样本例数的增大,样本标准差()A.增大 B.减小 C.不变 D.与总体标准差更加接近15、抽样误差产生的原因是()A.资料不是正态分布 B.个体变异 C.仪器测量不准确D.观察对象不纯16、观察单位为研究中的()A.样本 B.全部对象 C.个体 D.观察指标17、变异系数CV是()A.构成比 B.率 C.标准差 D.相对比18、各观察值同加上一个不等于0的常数后,()不变A、算术均数B、标准差C、几何均数D、变异系数19、下列资料()为等级资料A、体重B、血型C、某病发病率D、病人的病情分级20、标准正态分布曲线下,0到2.58的面积为()A.90% B.95% C.49.5% D.50%21、测定一组人群的听力,已知听力过低为异常,若制定其医学参考值范围,应选择()A.单侧上限 B.单侧下限 C.双侧 D.单侧22、关于医学参考值范围的制定,下列说法正确的是()A.样本例数不能太少 B.只能选95%的百分界限C.不受资料分布类型的限制 D.选择单侧和双侧的结果是一样的23、正常成年男子收缩压的医学参考值范围一般指()A、所有正常成年男子收缩压的最小值到最大值范围B、绝大多数正常成年男子收缩压的波动范围C、所有正常成年男子收缩压的波动范围D、少部分正常成年男子收缩压的波动范围24、有关样本均数的标准误,下列说法正确的是()A.与样本例数的大小无关 B.表示样本均数离散趋势的大小C.表示样本变量值差异的大小 D.与样本所代表的总体变量值的离散趋势无关25、下列哪项不是样本均数标准误的用途()A.可用来计算总体均数的可信区间 B.可表示样本均数抽样误差的大小C.可用来计算医学参考值范围 D. 可用于均数假设检验的计算.26.t分布曲线随自由度的增大()A.曲线下的总面积变小 B.曲线的中心位置向左移C.曲线的高峰变低,尾部翘得较高 D.曲线的高峰变高,尾部翘得较低27.自由度一定的t分布曲,当t值增大时,其尾部面积()A.变小 B.变大 C.不变 D.不清楚28、总体均数95%的可信区间主要是用于()A.估计总体均数有95%的可能性在此区间内 B.反映某指标的可能取值范围C.95%的样本均数在此范围内 D.确定医学参考值范围29、要提高总体均数可信区间的把握度与精确度,最好的方法是()A.改变计算公式 B.减小样本例数 C.增加样本例数 D.样本例数保持不变30、假设检验中,确定单双侧的依据是()A.资料的类型B.计算出统计量后再作决定C.专业知识或研究目的D.检验水准的大小31.样本均数与已知总体均数比较的目的是()A.推断未知总体均数是否小于零 B.推断已知总体均数与未知总体均数是否相等C.推断样本均数与未知总体均数是否相等 D.推断未知总体均数是否为负数32、配对设计的目的是()A.提高组间可比性 B.计算简便 C.易于理解 D.为了使用t检验33、配对设计t检验的目的是()A.推断差数的总体均数是否等于零.B.推断差数的样本均数是否等于零.C.推断差数的总体均数是否大于1. D.推断差数的样本均数是否大于1.34、两样本均数t检验的目的是()A.推断两总体均数是否相等.B.推断两样本均数是否相等.C.推断两总体例数是否相等. D.推断两样本例数是否相等.35、甲乙两人分别从同一总体中抽得30个变量值作为两个样本,求得、S12,、S22,则有()A、做两样本t检验,必然得差别无统计学意义的结论B、做两样本t检验,必然得差别有统计学意义的结论C、分别有甲、乙两样本求出的总体均数的95%的可信区间,必然有重叠D、分别有甲、乙两样本求出的总体均数的95%的可信区间,很可能有重叠36、两样本均数的t检验,若两样本例数分别为n1和n2,自由度为()A.n1+n2 B.n1+n2-1 C.n1+n2+1 D.n1+n2-237、反映某现象发生的频率或者强度的指标宜采用()A.构成比 B.率 C.相对比 D.标准化率38、某地某年冠心病的发病人数占同年心血管疾病病人数的15%,该指标为()A.构成比 B.率 C.相对比 D.发病率39、甲乙两地进行高血压发病率的比较,需要进行率的标准化的情况有()A.年龄内部构成不同 B.年龄内部构成相同C.两地的发病率相差太大 D.两地各年龄组的发病率相差不大40、甲、乙两组资料进行率的标准化时,选择标准人口数或选择该标准人口数换算成相应的标准人口构成比,两方法得出的结论()A.相同 B.甲组标化率大于乙组标化率C.不同 D.甲组标化率小于乙组标化率41、某医师给某地全部的麻疹易感儿童进行免疫接种,共有3000人,一个月后,从中随机抽取400人进行抗体水平的测定,其中阳性人数是200人,若计算该疫苗接种的阳性率,其数值为()A.10% B.25% C.50% D.60%42、某医师从工人与干部两个总体中进行高血压发病情况的抽样研究,样本例数为n1、n2 ,高血压的患病人数为x1、x2 ,则两样本合计的高血压发病率为()A.x1/ n1 B.x2 / n2 C.x1 / n1+ x2 / n2 D.(x1+x2)/ (n1+n2)43、有关样本率的标准误,下例错误的是()A.表示样本率围绕总体率的离散趋势B.表示样本率相互之间的离散趋势C.表示样本率抽样误差的大小D.表示样本阳性率与样本阴性率之间的差异44、总体率估计的最佳方法是()A.点值估计 B.区间估计 C.概率估计 D.频率估计45、值是反映实际频数与理论频数()A.相差多少的指标 B.吻合程度的指标 C.是否相等的指标D.以上均不对46、四格表检验时,不需要进行连续性校正的条件是()A.n≥40, T≥5 B.n<40,1≤T<5 C.n≥40,T<1 D.n ≥40,1≤T<547、四格表资料的检验,理论频数T的计算是根据()A.π1 =π2 B.π1≠π2 C.π1<π2 D.π1 >π248、用甲乙两种方法检查已确诊的鼻咽癌患者100名,甲法阳性者80名,乙法阳性者60名,两法均为阳性者50名,欲检验两法结果有无差别,宜选用()A.行X列表资料的检验 B.配对设计四格表检验C.t检验 D.两样本率比较的四格表检验49、4个样本率作比较,< 0.05,3,则在α=0.05检验水准下,可认为()A.各总体率不等或不全相等 B.各总体率均相等C.各样本率均相等 D.各样本率不全等50、相关系数是表示两变量x与y之间()A .有无数量关系的指标 B.那个变量较大的指标 C.有无依存关系的指标 D.相关关系的密切程度与相关方向的指标51、相关系数假设检验的备择假设是()A .ρ≠0 B.ρ=0 C.β≠0 D.β=052、相关系数假设检验的自由度为()A.n - 1 B.n - 2 C.n D.n + 1 53.最小二乘法原理是()A.各实测点距所求直线的纵向距离最小B.各实测点距所求直线的纵向距离相等C.各实测点距所求直线的纵向距离平方和最小D.各实测点距所求直线的垂直距离平方和最小54、对于同一资料的直线相关系数和直线回归系数,下列论断正确的是()A.相关系数越小,回归系数也越小 B.相关系数与回归系数无关系C.回归系数有单位,相关系数没有单位 D.样本相关系数为0时,样本回归系数也为055、关于回归系数b,下列说法错误的是()A.是直线回归方程的斜率 B.同一资料x作自变量与y作自变量计算的b相等C.取值范围为 (-∞,+∞) D.b>0时,随x的增大y也增大二、判断题(若正确,请在答题卡上涂A,若错误,请在答题卡上涂B,每题1分,共17分)56、绘制计量资料的频数表时,各组段的组距可以相等,也可以不等。
医学研究的样本例数估算方法总结一、常用的样本例数估算方法1.假设检验的样本例数估算方法:假设检验是最常用的统计分析方法之一,用来比较不同组之间的差异。
在样本例数估算中,可以根据所需的显著水平、样本效应大小和统计功效来估算样本例数。
常用的假设检验样本例数估算方法有:双样本均数比较、单样本均数比较和比例比较。
2. 相关性分析的样本例数估算方法:相关性分析用于评估两个或多个变量之间的相关性。
在样本例数估算中,一般根据研究所关心的最小相关系数、显著水平和统计功效来估算样本例数。
常用的相关性分析样本例数估算方法有:Pearson相关系数和Spearman相关系数。
3. 生存分析的样本例数估算方法:生存分析用于评估其中一事件(如死亡、复发等)发生的时间。
在样本例数估算中,通常需要考虑最小有效差、显著水平和统计功效来估算样本例数。
常用的生存分析样本例数估算方法有:Kaplan-Meier方法和Cox比例风险模型。
4. 回归分析的样本例数估算方法:回归分析用于评估自变量对因变量的影响程度。
在样本例数估算中,需要考虑到自变量个数、最小效应大小、显著水平和统计功效来估算样本例数。
常用的回归分析样本例数估算方法有:线性回归分析和Logistic回归分析。
二、样本例数估算方法的原则和步骤1.显著性水平:根据研究要求和统计学常识设定显著性水平,通常常见的选择是0.05或0.012. 功效(Power):选择合适的统计功效,通常常见的选择是0.9或0.83.效应大小:根据研究问题具体情况选择合适的效应大小,一般可以通过文献综述或实验预测试验来确定。
4.统计方法:根据研究设计和研究问题选择合适的统计方法,包括假设检验、相关性分析、生存分析和回归分析等。
5.样本例数估算公式:根据所选择的统计方法和具体情况,使用对应的样本例数估算公式进行计算。
6.参数估计:根据样本例数估算结果,计算所需要的参数估计值,通常包括均数、比例、相关系数、风险比等。
医学研究的样本例数读者须知在医学研究中样本例数确实定是一个难点,医学统计学家认为样本含量确实定有两种方法:公式法和查表法,公式法和查表法本质一样,查表法是统计学家由公式做出的,而公式法需要研究者自己做,因为医学研究某某有不少问题还搜索不到相应的计算公式来确定样本例数,本书搜集到的公式也十分有限,那么通过搜索文献来估计样本例数也是读者需要学习的一种方法。
须知,不存在无限定条件的样本例数。
现行统计教材中的样本例数没有特别强调这一点,以导致使用时,常提出如下问题:“了解吸烟是否是肺癌的危险因素,需要调查多少人?〞,类似这样的问题是没人能回答出的。
医学研究中样本例数都是建立在一组限定条件之下的样本例数,假如这一组限定条件改变,那么样本例数的值随之改变。
简言之,样本例数是这一组限定条件的函数。
这种函数关系具体由计算样本例数的公式表述。
那么,确定公式等号右端的各参数就变成了计算样本例数的前提。
根据此思路我们设计了一个确定样本例数的流程图〔见下页〕,同时,这个流程图也是我们撰写本书具体内容和阅读本书的思路。
这个小册子中的例题均来自各种卫生统计学的教材和相关著作,其本质没有变化,但读起来却更加符合人们的认知习惯,你会感觉到更容易读懂了。
本书由一附院医学统计咨询室集体讨论,具体由孙奇执笔撰写和排版,几经修订,历时超过百天。
尽管如此,鉴于我们知识的局限性,也只能做到抛砖引玉,而且书中错误肯定难免。
欢迎读者不吝指正,我们将深表谢意!样本例数估计流程图目录 (4) (6) (8) (10) (12) (13) (15) (17) (19)··························20 ·····················································21 ··································1 两样本率比拟的样本例数某课题的研究目的是比拟两种药物治疗乙型肝炎后外表抗原HBsAg 的改善情况,问两组各需要乙肝患者多少名?上述研究所对应的统计问题为:两样本率比拟的样本例数两样本率比拟的样本例数公式〔1.3〕[1]139221222*********/)(]/)1(/)1())(1(2[p p Q p p Q p p Z Q Q p p Z N a --+-++-=--β1.公式(1.3)中a Z 、βZ 、P 、1P 、2P 、1Q 、2Q 确实定方法如下:(1)a Z 确实定:统计学家建议05.0=a ,如此96.12/05.0=Z 。
医学研究的样本例数读者须知在医学研究中样本例数的确定是一个难点,医学统计学家认为样本含量的确定有两种方法:公式法和查表法,公式法和查表法本质一样,查表法是统计学家由公式做出的,而公式法需要研究者自己做,因为医学研究中尚有不少问题还搜索不到相应的计算公式来确定样本例数,本书搜集到的公式也十分有限,那么通过搜索文献来估计样本例数也是读者需要学习的一种方法。
须知,不存在无限定条件的样本例数。
现行统计教材中的样本例数没有特别强调这一点,以导致使用时,常提出如下问题:“了解吸烟是否是肺癌的危险因素,需要调查多少人?”,类似这样的问题是没人能回答出的。
医学研究中样本例数都是建立在一组限定条件之下的样本例数,若这一组限定条件改变,那么样本例数的值随之改变。
简言之,样本例数是这一组限定条件的函数。
这种函数关系具体由计算样本例数的公式表述。
那么,确定公式等号右端的各参数就变成了计算样本例数的前提。
根据此思路我们设计了一个确定样本例数的流程图(见下页),同时,这个流程图也是我们撰写本书具体内容和阅读本书的思路。
这个小册子中的例题均来自各种卫生统计学的教材和相关著作,其本质没有变化,但读起来却更加符合人们的认知习惯,你会感觉到更容易读懂了。
本书由一附院医学统计咨询室集体讨论,具体由孙奇执笔撰写和排版,几经修订,历时超过百天。
尽管如此,鉴于我们知识的局限性,也只能做到抛砖引玉,而且书中错误肯定难免。
欢迎读者不吝指正,我们将深表谢意!样本例数估计流程图目录1.两样本率比较的样本例数 (4)2.多个样本率比较的样本例数 (6)3.两样本均数比较的样本例数 (8)4.多个样本均数比较的样本例数 (10)5.诊断试验的样本例数 (12)6.现况研究的样本例数 (13)7.病例对照研究的样本例数 (15)8.队列研究的样本例数 (17)9.多元统计的样本例数 (19)20 10.他·····················································21 11.表···························································1 两样本率比较的样本例数1.1提出专业问题某课题的研究目的是比较两种药物治疗乙型肝炎后表面抗原HBsAg 的改善情况,问两组各需要乙肝患者多少名? 1.2转化为统计问题上述研究所对应的统计问题为:两样本率比较的样本例数 1.3选择相应的公式两样本率比较的样本例数公式(1.3)[1]139221222211112112/)(]/)1(/)1())(1(2[p p Q p p Q p p Z Q Q p p Z N a --+-++-=--β1.4确定公式等号右端各参数1.公式(1.3)中a Z 、βZ 、P 、1P 、2P 、1Q 、2Q 的确定方法如下: (1)a Z 的确定:统计学家建议05.0=a ,则96.12/05.0=Z 。
(2)βZ 的确定:统计学家建议10.0=β,则282.101.0=Z 。
预试验如下:一个研究组将随机抽取的乙肝患者分为2组,试验者要求两组例数不等,其中甲药组的样本含量占55%,乙药组的样本含量占45%;通过试验后测得甲药的转阴率为60%,乙药的转阴率为75%。
(3)1Q 、2Q 的确定:一般由研究者根据试验需要规定。
(4) 样本率1P 、2P :一般由研究者根据预试验或查文献来估计,见前述预试验:60.01=P 、75.02=P 。
(5)P 的确定:2211P Q P Q P +==(0.55×0.6+0.45×0.75)=0.6675。
1.5计算求出样本例数将96.12/05.0=Z 、282.101.0=Z 、55.01=Q 、45.02=Q 、60.01=P 、75.02=P 、6675.0=P 代入公式(1.3)后可得411≈N 名。
1.6结论比较两种药物治疗乙型肝炎后表面抗原HBsAg 的转阴情况,欲使保持置信水平为 95%,检验功效为0.9,两组共需要411名乙肝患者。
其中甲药组需要 22641155.011=⨯==N Q n 名;乙药组需要 18541145.022=⨯==N Q n 名。
1.7参考文献1.7.1本文参考文献1.方积乾主编.卫生统计学,第5版.北京:人民卫生出版社,2003.1391.7.2其他参考文献1.颜虹主编.医学统计学,供8年制及7年制临床医学等专业用.北京:人民卫生出版社,2005,2542.周利锋,高尔生主编.卫生研究中样本含量的确定.上海:复旦大学出版社、上海医科大学出版社联合出版,2001,113.孙振球主编.医学统计学,第二版研究生教学用书.北京:人民卫生出版社,2005,6264.王仁安主编.要医学实验设计与统计分析.北京:北京大学医学出版社,1999,235.徐天和主编.医学研究统计设计分册.北京:人民卫生出版,2004,1446.马斌荣主编.医学科研中的统计方法,第三版.北京:科学出版社,2005,1422 多个样本率比较的样本例数2.1提出专业问题某课题的研究目的是比较三种矫治近视眼方法的效果有无差异,问各法需观察多少例?2.2转化为统计问题上述研究所对应的统计问题为:多个样本率比较的样本例数 2.3选择相应的公式多个样本率比较的样本例数公式(2.3)[1]1482min 1max 1)sin 2sin2(2p p n ---=λ2.4确定等号右端各参数1.公式(2.3)中λ、m ax P 、m in P 的确定方法如下: (1)α 的确定:统计学家建议05.0=a 。
(2)β的确定:统计学家建议10.0=β预试验如下:防疫站在某小学采用三种方法矫治近视眼,治疗后得到A 法有效率为37.78%,B 法为18.75%,C 法为27.78%。
(3) λ的确定:查附表1得, 65.122,10.0,05.01,,==-λλβk a 。
(4) m ax P 、m in P 的确定:分别为最大率和最小率,由研究者根据预试验或查文献来估计,3778.0max =P 、1875.0min =P 。
2.5计算求出样本例数将65.12=λ、3=k 、3778.0max =P 、1875.0min =P 代入公式(2.3)后可得138≈n 名。
2.6结论比较三种矫治近视眼方法的效果即采用三种不同的方法矫治近视眼,欲使保持置信水平为95%,检验功效为0.9,每组各需要138名患者,三组共需要414名患者。
2.7参考文献 2.7.1本文参考文献1.杨树勤主编.卫生统计学,第3版.北京:人民卫生出版社,1992.1482.7.2其它参考文献1.颜虹主编.医学统计学,供8年制及7年制临床医学等专业用.北京:人民卫生出版社,2005,2552 孙振球主编.医学统计学,第二版研究生教学用书.北京:人民卫生出版社,2005,6273.徐天和主编.医学研究统计设计分册.北京:人民卫生出版,2004,1473 两样本均数比较的样本例数3.1提出专业问题某课题的研究目的是欲比较黄芪与生血散对粒细胞减少症的疗效,问每组需要观察多少例?3.2转化为统计问题上述研究所对应的统计问题为:两样本均数比较的样本例数 3.3选择相应的公式两样本均数比较样本例数公式(3.3)[1]146222)(δσβZ Z Na +=()1211--+Q Q3.4确定等号右端各参数1.公式(3.3)中 a Z 、βZ 、σ、δ、1Q 、2Q 的确定方法如下: (1) a Z 的确定:统计学家建议05.0=a ,则96.12/05.0=Z 。
(2) βZ 的确定:统计学家建议20.0=β,则842.020.0=Z 。
预试验如下:一个研究组将随机抽取的粒细胞减少症的病例平均分为两组,分别用黄芪和生血散治疗后测得,黄芪组平均增加粒细胞9101⨯个/L,生血散组平均增加粒细胞9102⨯个/L,合并标准差为9108.1⨯=σ个/L。
(3) σ的确定:此处标准差为由公式2/)(2221S S +=σ[2]32计算得出。
(4) δ的确定:见前述预试验,112=-=δ (L /109个⨯)。
(5) 1Q 、2Q 的确定:见前述预试验,5.01=Q 、5.02=Q 。
3.5计算求出样本例数将96.12/05.0=Z 、842.020.0=Z 、9108.1⨯=σ、9101⨯=δ、5.01=Q 、5.02=Q 代入公式(3.3)后可得80≈N 名。
3.6结论比较黄芪与生血散对粒细胞减少症的疗效,欲使保持置信水平为95%,检验功效为0.8,共需要80名患者。
其中黄芪组需要 40805.011=⨯==N Q n 名;生血散组需要40805.022=⨯==N Q n 名。
3.7参考文献 3.7.1本文参考文献1.方积乾主编.卫生统计学,第5版.北京:人民卫生出版社,2003.1462.周利锋,高尔生主编.卫生研究中样本含量的确定.上海:复旦大学出版社、上海医科大学出版社联合出版,2001,323.7.2其他参考文献1.颜虹主编.医学统计学,供8年制及7年制临床医学等专业用.北京:人民卫生出版社,2005,2572.周利锋,高尔生主编.卫生研究中样本含量的确定.上海:复旦大学出版社、上海医科大学出版社联合出版,2001,31-333.孙振球主编.医学统计学,第二版研究生教学用书.北京:人民卫生出版社,2005,6254.王仁安主编.要医学实验设计与统计分析.北京:北京大学医学出版社,1999,225.徐天和主编.医学研究统计设计分册.北京:人民卫生出版,2004,1436.马斌荣主编.医学科研中的统计方法,第三版.北京:科学出版社,2005,1407.徐端正主编.生物统计学在实验和临床药理学中的应用.北京:科学出版社,2004,504 多个样本均数比较的样本例数4.1提出专业问题某课题的研究目的是比较三种方案治疗血红蛋白不满100g /L 的婴幼儿贫血患者后,血红蛋白增的变化有无差异,问三组各需要观察多少例?4.2转化为统计问题上述研究所对应的统计问题为:多个样本均数比较的样本例数4.3选择相应的公式多个样本均数比较样本例数公式(4.3)[1]146)]1/()(/[)/(222--∑∑=k X X k S n i i ψ4.4确定等号右端各参数1.公式(4.3)中ψ、i S 、k 、X 、i X 的确定方法如下:(1)α 的确定:统计学家建议05.0=a 。