医学期刊统计学错误思考
- 格式:docx
- 大小:16.24 KB
- 文档页数:5
医学论文常见统计学错误与纠正一、设计与实施1.对象合格标准不明确●只报告来源和时间段,总体不清晰:大杂烩,得不到科学结论;●事前未规定合格标准和排除标准,事后排除;●不报告按照合格标准和排除标准筛选对象的过程。
2.结局指标多而杂--是事先规定的最重要的结局指标,通常以此为准来计算样本量。
常见错误:终点指标过多, 大海捞针临床试验时,不知道哪个指标在组与组间有差异;“确定某个指标后,万一组间没有差异,岂不被动?!”生理、生化、组织学、基因,都做;“内容丰富,显得水平高?!”许多仪器一下子可以做许多项目;“许多项目一一分析,哪个有意义,就报告哪个指标?!”哪些指标可能有组间差异,必须心中有数。
假说:预计将要得到的结论——假说是科研的灵魂心中无数,不要“先上马再说”●指标多,实验工作量大。
大海捞针——碰运气,不是科研!●指标多,翻来覆去分析,制造假阳性!Nature杂志统计学指南:➢常见错误之一。
仅分析1个指标时,P(假阳性)=0.05,P(1次分析不犯错误)=0.95 λ,同时分析2个指标时,P(2次分析均不犯错误) = [P(1 次分析不犯错误)] 2 P(假阳性)=1 - 0.952 ≈ 0.10, 同时分析3 个指标时,P(假阳性)=1 - 0.953 ≈ 0.14 λ同时分析10个指标时,P(假阳性)=1 - 0.9510 ≈ 0. 40➢常见错误之一(Nature) ----多重比较不校正多重比较: 对一组数据作多项比较时,必须说明如何校正α水平,以避免增大第一类错误的机会---- Bonfferoni校正(α/k来校正,k为两两比较次数)3 不重视对照为何必需对照?●消除非研究因素的混杂实验组和对照组受非研究因素的影响尽可能相同,使两组的差异主要反映研究因素的效应。
●鉴别研究因素的效应和自然发展结果。
例如,研究某药物对口腔溃疡模型兔的疗效,口腔溃疡有自愈的倾向,必须有对照扣除自愈效应。
常见错误➢没有对照!千方百计省去对照组,以减少一半工作量!? ω自身前后对照/历史对照/文献对照/ “标准”对照➢对照不当ω对照太弱:安慰剂对照/对照过强:西药+加中药~西药/对照剂量有争议:试验药,大剂量~对照药,中小剂量/对照基线不可比:试验组年轻、病轻~ 对照组年老、病重应当如何?ω事先明确研究假说,例如,新药比常规药好:以常规药为对照ω设计:研究组新药~ 对照组常规药可比性:基线可比、过程可比、终点可比ω保证可比性措施:干预性研究: 随机化观察性研究:匹配4样本量无根据ω干预性研究:“ 500 例患者随机分成两组……” 为什麽500 例?不多不少?500 例从天而降?现成送上门来?ω观察性研究:“ 10年期间A组3000例,B组258例……” ---- 有多少用多少!?应当如何?---- 报告最小样本量估算及其依据1. 比较两组测定值的均数依据:(1)预计欲比较的两总体参数的差值δ(2)预计总体标准差σ(3)允许出现假阳性结果的机会α(4)允许出现假阴性结果的机会β :例:格列美脲、格列苯脲对比研究以HbA1c 为主要终点报告依据✓欲检出HbA1c临床差异≥0.65%✓假定标准差为1.3%✓双侧检验水平0.05✓功效80% ω✓退出率20% 计算:157例2. 比较两组达标率依据:(1)预计一组发生某结局的百分比为π1(2)预计另一组发生某结局的百分比为α(3)允许犯假阳性错误的机会β(4)允许犯假阴性错误的机会π2例:格列美脲、格列苯脲对比研究以HbA1c达标为主要终点(1)预计一组发生某结局的百分比为45%(2)预计另一组发生某结局的百分比为25%(3)允许犯假阳性错误的机会α= 5%(4)允许犯假阴性错误的机会β= 20% 计算: 176 例5. 随机化,说而不做,做而不严处理分配的随机化为什么这么重要?(1) 消除分配处理有意或无意的偏倚。
忧心:我国80%的医学杂志论著有统计学错误范文一份忧心:我国80%的医学杂志论著有统计学错误 1军事医学科学院__研究所胡良平教授对医学界出现的统计学错误很是忧心。
他提及了一个令人触目惊心的数据:全国各类医学期刊中,有统计学错误的论著竟占到80%。
他说:“随便拿起一本我国的医学杂志,我就几乎肯定能找出其中的统计错误。
”胡良平教授说:“让人忧虑的不仅是上述现象,它们背后所反映出来的是我国整个医学界对统计学的不重视,对统计学方法掌握和应用的不合格。
”他谈到,不可否认,__为了自己的私利,增添、省略或篡改某些实验数据是造成医学统计错误的原因之一,但就整个医学界的整体来看,统计学的处境不容乐观__行政主管部门没有给予医学统计以正确、恰当的认识;有关业务人员统计学知识和基本功底太薄弱;相关学校的统计教学内容陈旧,方法落后,以为完成了教学大纲布置的任务便能让学生有足够的统计知识去完成日后的工作和研究;有关医学杂志并没有统计学专家参与稿件审阅;有关科研课题和科研成果的评审也没有统计学专家参与。
于是,在这种氛围下,一系列不良现象不可避免地发生了:许多课题缺乏统计研究设计方案或设计方案经不起推敲;有些实验研究缺乏必要的预实验,以至出现异常现象时,研究者措手不及;有些因收集数据不当,不可避免地导致误用统计分析方法;有些实验设计的基本原则有误,用单因素设计取代多因素设计,以至于无法考察因素之间的交互作用;有些研究人员误用t检验分析一切定量资料,误用χ2检验分析一切定性资料,误用直线回归方程表示有明显曲线变化趋势的资料,用一元统计分析方法取代多元统计分析方法。
更为严重的是,这些在错误的统计研究设计指导下收集的错误数据,又用错误的方法进行处理后得出的错误结论常被写进论文,“证明”了新发现或新发明,然后这些充斥错误统计数据和结论的论文堂而皇之地刊登在我国优秀期刊上。
“其后果可想而知。
有严重统计学错误的论文怎能说明作者的观点,质量不高的杂志怎能推动医学新知识的严肃交流,有错不改或根本不知道有错误存在又怎能促进整个国家医学的发展呢?”胡良平教授十分忧虑地说道。
【编者按】统计学方法在科研工作中的正确应用是决定科研结果的科学性和严谨性的重要因素之一,应引起读者和作者的高度重视。
我们在审阅稿件的过程中,发现统计学方法的错误使用时有发生,导致结果的科学性和严谨性受到质疑;尤其是一些投入了大量的科研经费的基金资助的论文也不例外。
为此,邀请了生物医学统计学者对我刊2006和2007年两年发表的相关论文,采用连载的形式针对统计学方法的应用情况进行辨析,希望对读者和作者在科研设计和工作中能正确运用统计学方法有所帮助。
《中国骨伤》杂志论文中存在的统计学错误辨析(1)柳伟伟,胡良平(军事医学科学院生物医学统计学咨询中心,北京100850)ZhongguoGushang/ChinaJOrthop&Trauma,2008,21(2):158!160www.zggszz.com本文对《中国骨伤》杂志2006年与2007年第1期所载论著、临床研究和基础研究文章进行了仔细阅读,针对论文中统计学方法的应用情况做了细致的考察,就实验设计、统计描述和统计分析3个方面可能存在的问题进行了辨析,提出了改进的建议和意见,希望在提高科研工作的科学性和严谨性方面能够发挥一定的作用。
1实验设计方面的错误辨析实验设计对于结果的可靠与否、误差的控制和准确估计、实验中耗费的成本大小都有着至关重要的作用与意义,在设计过程中必须遵循的4个原则是随机、对照、重复、均衡,其中任何一者如果在实施中不严格,就有可能导致研究结论存在偏倚甚至错误。
对于未开始的实验研究,需要选择合适的实验设计类型安排实验因素及其水平、控制重要非实验因素对结果的干扰和影响;而对于已完成的实验研究,则需要对研究的实验设计类型做出准确的判断,才能正确合理地选择统计分析方法处理资料。
本文通过下面的例子说明何为“多因素非平衡组合实验”以及如何对其进行辨析。
例1《杜仲腰痛丸对大鼠非压迫性髓核突出神经根损伤的组织形态学研究》[1]一文,将50只大鼠随机分为5组,每组10只,本文将具体分组情况整理为表1。
医学论文中常用统计分析方法错误大全在医学研究领域,准确和恰当的统计分析是得出可靠结论的关键。
然而,在众多医学论文中,却存在着各种各样的统计分析方法错误,这些错误可能会导致研究结果的偏差甚至错误解读,从而影响医学研究的质量和临床实践的指导价值。
接下来,我们就来详细探讨一下医学论文中常见的统计分析方法错误。
一、样本量计算错误样本量的合理计算对于研究的可靠性和有效性至关重要。
许多研究在设计阶段未能充分考虑研究的主要目的、预期效应大小、检验效能以及显著性水平等因素,导致样本量过小或过大。
样本量过小可能使研究无法检测到真实存在的差异,从而得出假阴性结论;样本量过大则会造成资源浪费,同时可能增加研究的复杂性和误差。
例如,在一项比较新药物与传统药物疗效的临床试验中,如果预期的疗效差异较小,而研究者没有充分考虑这一点,计算出的样本量不足,那么即使新药物实际上更有效,也可能由于样本量的限制而无法得出有统计学意义的结果。
二、数据类型错误医学研究中数据类型多样,包括计量资料(如身高、体重、血压等)、计数资料(如疾病的发生例数、治愈例数等)和等级资料(如疾病的严重程度分为轻、中、重)。
错误地判断数据类型会导致选择错误的统计分析方法。
例如,将原本属于计数资料的数据(如疾病的治愈与未治愈),错误地当作计量资料进行 t 检验,这样得出的结果是不准确的。
反之,将计量资料当作计数资料处理,也会造成同样的问题。
三、选择错误的统计检验方法不同的研究问题和数据类型需要相应的统计检验方法。
常见的错误包括:在多个组间比较时,错误地使用 t 检验而不是方差分析;在非正态分布的数据中使用参数检验方法;在不符合独立性假设的情况下使用独立样本检验等。
比如,在比较三种不同治疗方法对患者生存率的影响时,应该使用方差分析或非参数的KruskalWallis 检验,而不是多次进行两两t 检验,因为这样会增加一类错误(即假阳性)的概率。
四、忽视方差齐性检验在进行 t 检验和方差分析时,通常需要先进行方差齐性检验。
医学论文常见统计学错误及期刊编辑应对策略分析总之,期刊学术影响力是一个动态过程,在不同的年限其变化趋势或规律可能不同。
在2003-2008年肝病期刊的学术影响力较高,高于CJCR期刊与医药卫生期刊,但仍存在基金论文比低、国际化程度低、发展不平衡等问题;其中(WJG》、《世界华人消化杂志》、《中华肝脏病杂志》的学术影响力居领先地位,但《世界华人消化杂志》的波动较大。
学术影响力变化趋势有5种,其中震荡上升是主要的。
医学论文常见统计学错误及期刊编辑应对策略分析罗明媚叶萍高岩医药150076摘要将近年来医学期刊论文中常见的统计学问题分为统计学方法的误用、不注明统计方法或统计量、不注明所应用的统计分析软件、统计表格的不规使用、率和比混淆等多个方面,并结合实例进行分析,指出目前医学期刊论文的统计学应用现状不容乐观。
从医学期刊编辑的角度提出编审在今后工作中的应对策略和努力方向。
医学统计学应用是医学科学研究中必需的手段,是医学论文中不可缺少的重要组成部分。
胡良平等认为,一篇医学论文的质量主要取决于专业、文字和统计学三个方面,但近年来医学期刊发表的论文中存在大量统计方法误用、统计描述不准确等现象,直接影响着科研结果的科学性和可靠性。
现对我国医学期刊刊载论文中存在的统计学问题进行简要分析,并谈谈为避免这些统计学错误的出现,医学科技期刊编辑在今后工作中的努力方向。
1医学论文中常见的统计学问题1.1统计学方法的误用医学统计中常用的统计学推论方法有很多种,主要是根据实验的数据类型和实验目的来确定使用哪种统计方法。
如,计量资料应用啦验或方差分析,计数资料则应选用x谶秩和检验,这对于医学科研工作者是最为基本的统计学知识。
1.1.1用槛验代替方差分析:处理因素不同,多个处理组均数比较采用凇验代替方差分析,使假阳性的概率增加,又使其检验效率减小,这是最为常见的统计学方法的误用。
如某刊201lt〕Z第8期一文中,将90ff0需剖宫产产妇随机分为A、B、C---组,观察不同剂量盐酸罗哌卡因对麻醉效果的影响,进行三组患者痛觉阻滞最高平面比较。
“医学论文审稿中常见”资料汇总目录一、医学论文审稿中常见的统计学错误定量资料统计方法的误用分析二、医学论文审稿中常见的统计学错误重复测量方法的误用分析三、医学论文审稿中常见的统计学错误相关回归分析方法的误用分析四、医学论文审稿中常见的统计学错误2检验的误用分析医学论文审稿中常见的统计学错误定量资料统计方法的误用分析在医学研究领域,正确地理解和使用统计学方法对于论文的质量和可靠性至关重要。
然而,在实际审稿过程中,我们发现定量资料的统计方法误用是一个常见的问题。
以下将对这些问题进行详细的分析,并提供正确的使用方法。
对于定量数据,正确地描述是统计分析的基础。
常见的问题包括对数据的总结不全面、遗漏关键信息以及使用不恰当的描述方法。
例如,简单地给出平均数和标准差而忽略中位数和四分位数,或者错误地使用算术平均数而非几何平均数等。
正确的做法是针对数据的特点选择恰当的描述方式,同时给出必要的统计指标,如均值、中位数、标准差、四分位数等。
t检验是医学论文中常用的统计方法,但在审稿过程中经常发现其误用。
主要问题包括未满足正态性和同方差假设的情况下使用t检验,以及将t检验用于比较两个相关样本的均值。
正确的做法是,在应用t检验前,首先要检查数据是否满足正态性和同方差假设,同时要了解t检验只能用于比较两个独立样本的均值。
回归分析是研究变量之间关系的重要方法,但在医学论文中经常出现误用。
常见的问题包括将非线性关系强行拟合为线性关系,遗漏自变量,以及违反回归假设。
正确的做法是,在建立回归模型前,要对数据的分布和变量之间的关系进行充分的了解,选择合适的回归模型,并仔细检查回归假设是否满足。
生存分析是一种用于研究生存时间影响因素的方法,但在医学论文中也存在误用现象。
常见的问题包括使用错误的生存时间衡量指标(如直接使用死亡人数而非生存时间),错误地解读竞争风险等。
正确的做法是,首先了解生存分析的基本原理和方法,选择正确的生存时间衡量指标,如生存率、中位生存时间等,同时也要正确地理解和处理竞争风险。
两阶段交叉设计误用t检验将临床诊断符合皮肤划痕症的患者36例随机分为两组,A组咪唑斯汀片,10 mg,po qd,共2周;B组酮替芬片,l mg,po bid,共2周。
洗脱期1周。
然后A组与B组患者的服用药物交换,各药用法和服药时间相同。
观察治疗前、第l 周期末及第2周期末每例患者瘙痒程度、风团横径、风团持续时间和嗜睡程度,并作统计学处理。
咪唑斯汀治疗皮肤划痕症临床观察.pdf9存在问题:(1)临床医学研究中,常会遇到将两种不同处理措施交叉实施给同一受试者, 即一半受试者先接受A 处理后接受B 处理, 而另一半受试者先接受B 再接受A ,A 、B 两种处理先后以同等的机会出现在两个试验阶段中, 故称为两阶段交叉设计。
这种设计类型的资料,其总变异包括了:A 、B 处理间的变异, Ⅰ、Ⅱ阶段间变异,受试者间变异及误差四部分, 对于这类资料的统计分析应该采用两阶段设计的方差分析。
上述文献所采用的设计明显为两阶段交叉设计,但文献却采用配对t检验的方法进行差异比较,这种处理方法是错误的。
10(2)文献题目不恰当。
文献的主要内容是咪唑斯汀片和酮替芬片两种药物交叉作用于患者后的效果的比较。
辨析:统计分析采用两阶段交叉设计的方差分析,得出正确的统计结果。
文献的研究内容与文献题目应保持一致。
文献题目可以改为咪唑斯汀片与酮替芬片治疗皮肤划痕症的作用比较。
11⏹存在问题(1)作者将40只制成烧冻复合伤的家兔随机分成2组,1组为单纯植皮组,2组为复合高压氧植皮组,分别于伤后2、4、8、10、14d观察皮片向四周生长情况,统计分析采用t检验,结果为复合高压氧植皮组皮片生长在2、4、8、10d均快于单纯植皮组,差别具有统计学意义(P<0.001)。
(2)作者将两组家兔创面皮片愈合情况采用t检验判断两组有显著性差异。
⏹分析:家兔创面皮片愈合情况属于计数资料,作者用t检验来判断两组间的显著性差异显然是不正确的。
并且没有写出检验结果的具体数据。
医学期刊统计学错误思考
本文作者:张巧莲郑玉建单位:新疆医科大学学报编辑部新疆医科大学公共卫生学院
在医学论文写作中,医学统计学方法应用是必不可少的,正确使用能保证科研工作顺利进行,并使科研成果更具有科学性、代表性和可靠性。
反之,如果使用不当或者误用,会直接影响研究结果的质量,反而会使读者产生误解,甚至有时会导致错误的结论。
近年来,医学统计学方法在医学科研中的应用越来越受到国内广大医学科研工作者的重视,统计分析结果表达已成为医学论文中一个不可缺少的重要组成部分。
医学统计学是评价医学科技论文质量优劣的重要依据,然而从近年发表的论文来看,有不少作者对统计方法的使用还不熟悉,实际应用中统计方法滥用、错用和误用的情况时有发生[1]。
据国外20世纪60年代到80年代对不同医学期刊发表论文的调查,有统计学错误的论文比例最高者达66%,最低者也有20%[2-4]。
国内有学者对5种中华医学会系列杂志论著中统计学方法的应用状况进行了调查,结果显示,1985年统计错误的论文比例为24%,1995年为36%[5]。
这些调查研究均说明统计方法误用的严重性以及正确应用的紧迫性。
国外从20世纪70年代起就有针对医学论文的科研设计与统计方法应用情况的调查研究,国内学者也进行了相关研究[6]。
这种研究有助于及时了解医学科研论文中统计方法的应用质量,发现存在的问题,提高医学科研工作者应用统计方法的水平。
笔者总结了近年来已发表的医学科技论文中常见的统计学问题,希望能引起各位专家学者和临床医生
的共识与重视,促进我国医学期刊质量的提高。
1统计设计存在的常见问题
统计设计是整个研究中最重要的一环,是研究工作应遵循的依据。
常见的统计设计问题有:忽视组间均衡性,样本缺乏代表性,样本例数不足,未设置对照组,未随机分组,未提出统计分析方法等。
针对以上问题,在科研设计中一定要遵循实验设计的四大原则即“随机、对照、均衡、重复”的原则[6]。
1.1不遵循或不重视随机化原则
随机化是科研设计的重要原则,直接影响研究结果的可信度。
随机化既要随机抽样,还要随机分组,并有足够的样本量作前提。
然而,在医学论文中许多作者对此不够重视,主要表现在论文中统计处理随机化不突出,随机化缺失情况比较常见,有的论文甚至将随机误解为随意、随便,不采用随机化处理方法,导致结果缺乏可靠性。
还有些文章中没有提出“随机”抽样的设计与方法,没有排除标准,给人随意选择病例之感,且病例数少,因此没有代表性,所得出的结论不可靠。
部分文章虽然注明了“随机”,但未提及采取什么方法进行随机化研究或两组间的例数相差甚远,不符合随机化的一般规律,没有临床参考价值[7]。
1.2缺少对照研究或对照组设计不合理
正确设立对照是临床或实验研究的一个核心问题,设立对照的意义在于说明临床试验或实验研究中干预措施的效应,减少或防止偏倚和机遇产生的误差对试验结果的影响。
目前,国内许多期刊发表的论
文对照组设计不合理现象比较普遍,尤其有些作者对某种新药或新技术在临床的应用观察研究中,不设对照组,缺乏对照观察,得出的结论缺乏科学性,令人怀疑。
有的文章虽然设立了对照组,但在分析结果时,却没有将试验组与对照组的结果进行比较,而仅将各组间的自身前后进行比较,从而使该研究失去对照意义。
对照组选择不当,还表现在两组间重要的临床特征和基线情况相差太大,无可比性,如性别、年龄、病情、经济情况和文化程度等不一致,如有些论文将健康人或志愿者作为对照组,使结果受到非处理因素的影响,产生偏倚或系统误差,使结论不可信[7]。
1.3均衡性原则掌握不够
均衡性原则要求实验中的各组之间除处理因素不同外,其他可控制的非处理因素要尽可能保持一致。
特别对疾病预后有重要影响的临床特性一定要在组间分布均衡。
各组间越均衡,可比性越强。
有些作者在对病例进行分组时,忽视了均衡性原则,两组之间没有可比性,结论自然是错误的。
具体表现在:有的文章对治疗组与对照组的相应统一指标没有设在均衡的水平上。
对治疗组情况交代的比较详细,而对对照组的年龄、性别、病情等不予交代,或所选对照组的年龄与治疗组不在一个年龄段,影响了作者对指标的观察[7]。
1.4重复的原则掌握不好
所谓重复,一是指重复试验或平行试验,二是指各样本组的例数要有一定的数量,即样本的例数要足够大。
虽然随机化是增强非处理因素均衡性的重要方法,但当各组内例数过少时,尽管采用了随机化分组
的方法,也难以保证非处理因素的均衡一致。
在随机化分组的基础上,只有样本例数足够大,才能使非处理因素均衡一致,同时也才能使抽样误差减小,增强样本对总体的代表性。
一般来说,在随机分组的前提下,样本例数越大,各组之间非处理因素的均衡性越好;但当样本量太大时,往往又会给整个实验和质量控制工作带来更多的困难,同时也会造成浪费。
为此,在实验设计时,还应保证在实验结果具有一定可靠性的前提下,确定最少的样本例数。
一般说来,计数指标每组样本不得少于20~30例,计量指标每组样本不得少于5~10例。
在多因素分析时,一般认为样本例数至少为观察指标的5~10倍[8]。
1.5样本的含量
样本的含量的大小直接影响到结论的可靠性。
样本量过少,则抽样误差大,结果可靠性差,且经不起重复验证;反之,盲目加大样本量也会造成人、财、物的浪费,同时也造成非抽样误差增大。
故应在保证研究结果精确可靠的前提下,确定最小的样本量。
如某篇论文报道某药治疗的临床疗效,实际总例数为10例,其中6例有效,于是作者得出有效率为60%。
显然,有限的病例数不能充分说明该药是否有效,作者贸然得出结论,容易给他人造成假象甚至误导[9]。
2统计方法选择与使用不当
在选择统计方法之前,首先应确定研究资料是计数资料还是计量资料。
只划分其类别而得到的资料为计数资料,也叫定性资料,如根据治疗结果计算出的治愈率、阴性率、阳性率等。
测定某个具体数值而得到的资料为计量资料,如血压值、血细胞计数、血氧分压测定等许
多物理诊断和化验检查的结果。
目前,医学论文中计数资料最常用的统计方法为χ2检验,计量资料最常用的统计方法为t检验。
值得注意的是,各种假设检验方法均有其适用条件,应根据资料特点来选用最适当的方法。
均数与标准差分别是描述正态分布资料集中和离散趋势的指标。
能否选用“均数±标准差”来描述某一资料的分布特征,关键看该资料是否符合正态分布。
当资料不符合正态分布或方差不齐时,应将资料转换使之符合正态分布,方差齐性后再用t检验或方差分析,否则用秩和检验。
有些作者在使用t检验时,未考虑到上述适用条件而盲目使用,造成统计学处理不当或统计学计算错误[10]。