科研设计与统计常见错误解析

格式：ppt
大小：148.50 KB
文档页数：54

下载文档原格式

医学论文常见统计学错误与纠正

医学论文常见统计学错误与纠正一、设计与实施1.对象合格标准不明确●只报告来源和时间段，总体不清晰：大杂烩,得不到科学结论；●事前未规定合格标准和排除标准，事后排除；●不报告按照合格标准和排除标准筛选对象的过程。

2.结局指标多而杂--是事先规定的最重要的结局指标，通常以此为准来计算样本量。

常见错误：终点指标过多, 大海捞针临床试验时，不知道哪个指标在组与组间有差异；“确定某个指标后，万一组间没有差异，岂不被动?！”生理、生化、组织学、基因，都做；“内容丰富，显得水平高?！”许多仪器一下子可以做许多项目；“许多项目一一分析，哪个有意义，就报告哪个指标?！”哪些指标可能有组间差异，必须心中有数。

假说：预计将要得到的结论——假说是科研的灵魂心中无数，不要“先上马再说”●指标多，实验工作量大。

大海捞针——碰运气，不是科研！●指标多，翻来覆去分析，制造假阳性！Nature杂志统计学指南：➢常见错误之一。

仅分析1个指标时，P(假阳性)=0.05，P(1次分析不犯错误)=0.95 λ，同时分析2个指标时，P(2次分析均不犯错误) = [P(1 次分析不犯错误)] 2 P(假阳性)=1 - 0.952 ≈ 0.10, 同时分析3 个指标时，P(假阳性)=1 - 0.953 ≈ 0.14 λ同时分析10个指标时，P(假阳性)=1 - 0.9510 ≈ 0. 40➢常见错误之一(Nature) ----多重比较不校正多重比较: 对一组数据作多项比较时，必须说明如何校正α水平，以避免增大第一类错误的机会---- Bonfferoni校正（α/k来校正，k为两两比较次数）3 不重视对照为何必需对照？●消除非研究因素的混杂实验组和对照组受非研究因素的影响尽可能相同，使两组的差异主要反映研究因素的效应。

●鉴别研究因素的效应和自然发展结果。

例如，研究某药物对口腔溃疡模型兔的疗效，口腔溃疡有自愈的倾向，必须有对照扣除自愈效应。

常见错误➢没有对照！千方百计省去对照组，以减少一半工作量!? ω自身前后对照/历史对照/文献对照/ “标准”对照➢对照不当ω对照太弱：安慰剂对照/对照过强：西药+加中药~西药/对照剂量有争议：试验药，大剂量~对照药，中小剂量/对照基线不可比：试验组年轻、病轻~ 对照组年老、病重应当如何？ω事先明确研究假说，例如，新药比常规药好：以常规药为对照ω设计：研究组新药~ 对照组常规药可比性：基线可比、过程可比、终点可比ω保证可比性措施：干预性研究: 随机化观察性研究：匹配4样本量无根据ω干预性研究：“ 500 例患者随机分成两组……” 为什麽500 例？不多不少？500 例从天而降？现成送上门来？ω观察性研究：“ 10年期间A组3000例，B组258例……” ---- 有多少用多少!?应当如何？---- 报告最小样本量估算及其依据1. 比较两组测定值的均数依据：（1）预计欲比较的两总体参数的差值δ（2）预计总体标准差σ（3）允许出现假阳性结果的机会α（4）允许出现假阴性结果的机会β :例：格列美脲、格列苯脲对比研究以HbA1c 为主要终点报告依据✓欲检出HbA1c临床差异≥0.65%✓假定标准差为1.3%✓双侧检验水平0.05✓功效80% ω✓退出率20% 计算：157例2. 比较两组达标率依据：（1）预计一组发生某结局的百分比为π1（2）预计另一组发生某结局的百分比为α（3）允许犯假阳性错误的机会β（4）允许犯假阴性错误的机会π2例：格列美脲、格列苯脲对比研究以HbA1c达标为主要终点（1）预计一组发生某结局的百分比为45%（2）预计另一组发生某结局的百分比为25%（3）允许犯假阳性错误的机会α= 5%（4）允许犯假阴性错误的机会β= 20% 计算: 176 例5. 随机化，说而不做，做而不严处理分配的随机化为什么这么重要?(1) 消除分配处理有意或无意的偏倚。

统计工作中常见的错误有哪些

统计工作中常见的错误有哪些在当今数据驱动决策的时代，统计工作的重要性日益凸显。

然而，在实际的统计工作中，由于各种原因，常常会出现一些错误。

这些错误可能会导致数据分析结果的偏差，进而影响决策的科学性和准确性。

下面，我们就来探讨一下统计工作中常见的一些错误。

一、数据收集阶段的错误1、样本选择偏差在收集数据时，如果样本不具有代表性，就会导致样本选择偏差。

例如，在调查消费者对某产品的满意度时，如果只选择了经常购买该产品的消费者作为样本，而忽略了偶尔购买或从未购买的消费者，那么得出的结论就可能高估了产品的满意度。

2、数据缺失数据缺失是数据收集过程中常见的问题。

如果缺失的数据量较大或者缺失的数据不是随机分布的，就会对统计分析产生影响。

例如，在调查员工的收入情况时，如果很多高收入员工拒绝提供数据，那么统计结果就会低估员工的平均收入。

3、测量误差在收集数据时，由于测量工具不准确、测量方法不正确或者测量人员的主观因素等，可能会导致测量误差。

例如，在测量物体的长度时，如果尺子的刻度不准确，那么测量结果就会存在误差。

二、数据处理阶段的错误1、数据录入错误在将收集到的数据录入到计算机系统时，可能会出现录入错误。

例如，将数字“12”误录为“21”，或者将“男性”误录为“女性”等。

这些错误如果不及时发现和纠正，就会影响后续的数据分析。

2、数据重复计算在对数据进行汇总和计算时，如果不小心对某些数据进行了重复计算，就会导致结果的偏差。

例如，在计算销售额时，如果将同一笔交易计算了两次，那么销售额就会被高估。

3、数据转换错误在对数据进行转换和标准化处理时，如果方法不正确，就会导致数据的失真。

例如，在将不同单位的数据转换为统一单位时，如果转换系数错误，那么转换后的数据就会不准确。

三、数据分析阶段的错误1、选择错误的统计方法不同的统计问题需要选择不同的统计方法。

如果选择了不恰当的统计方法，就可能得出错误的结论。

例如，在分析两组数据的差异时，如果数据不满足正态分布，却使用了 t 检验，那么得出的结论就可能不可靠。

医学科研中常见统计学错误(朱继民)总论

第十五章医学科研中常见的统计学错误第一节科研设计中的常见错误一、抽样设计二、实验设计中的随机原则三、实验设计中的对照原则四、实验设计中的重复原则五、实验设计中的均衡原则第二节科研数据描述中的常见错误一、统计指标的选取二、统计图表第三节医学科研统计推断中的错误一、t检验二、方差分析三、卡方（ 2）检验四、相关与回归分析五、结论表达不当第十五章医学科研中常见的统计学错误医学科研中，研究者关心的研究对象的特征往往具有变异性；如年龄、性别皆相同的人其身高不尽相同、体重、血型等也都存在类似的现象。

同时，由于研究对象往往很多，或者不知到底有多少，或者研究对象不宜全部拿来做研究；所以人们往往借助抽样研究，即从总体中抽取部分个体组成样本，依据对样本的研究结果推断总体的情况。

恰恰是这种变异的存在，以及如何用样本准确推断总体的需求，使得统计学有了用武之地和发展的机遇。

诚然，合理恰当地选用统计学方法，有助于人们发现变异背后隐藏的真面目，即一般规律。

但是，如果采用的统计学方法不当，不但找不到真正的规律，反而可能得出错误的结论，进而影响研究的科学性，甚至会使错误的结论蔓延，造成不良影响。

作为医学工作者，尤其是科研工作者，必须了解当前医学科研中常见的统计学错误，以便更好地开展科研和利用科研成果。

本章借助科研中统计学误用实例，介绍常见的错用情况，以帮助读者避免类似错误的发生。

第一节科研设计中的常见错误统计学是一门重要的方法学，是一门研究数据的收集、整理和分析，从而发现变幻莫测的表面现象之后隐含的一般规律的科学。

医学科研是研究医学现象中隐含规律的科学，包括基础医学研究、临床医学研究和预防医学研究等，不管哪类医学科研都离不开统计学的支持。

要想做好医学科研，必须掌握一定的统计学知识，如总体与样本、小概率原理、资料的类型和分布、科研设计类型、统计分析的主要工作、常用统计方法以及方法的种类和应用条件等，尤其要了解当前医学科研中常见的统计学错误。

医学论文中常用统计分析方法错误大全

医学论文中常用统计分析方法错误大全在医学研究领域，统计分析方法的正确应用对于得出科学、可靠的结论至关重要。

然而，在实际的医学论文中，我们常常能发现各种各样的统计分析方法错误，这些错误不仅影响了研究结果的准确性和可信度，还可能导致错误的临床决策。

下面，我们就来详细梳理一下医学论文中常见的统计分析方法错误。

一、样本量不足样本量的大小直接关系到研究结果的可靠性和普遍性。

如果样本量过小，可能无法准确反映总体的特征，导致统计效能不足，从而得出错误的结论。

例如，在比较两种治疗方法的疗效时，如果每组的样本量只有十几例，那么很可能因为偶然因素而得出错误的差异结论。

二、数据类型错误医学研究中数据类型多种多样，包括计量数据（如身高、体重、血压等）、计数数据（如治愈人数、死亡人数等）和等级数据（如病情的轻、中、重）。

如果对数据类型的判断错误，就会选择错误的统计分析方法。

例如，将本来应该是计数数据的治愈率当作计量数据进行 t 检验，这是不正确的。

三、忽视数据分布许多统计方法都有其适用的数据分布条件。

例如，t 检验和方差分析要求数据服从正态分布。

如果数据不服从正态分布而强行使用这些方法，就会得出错误的结果。

在这种情况下，应该先对数据进行正态性检验，如果不满足正态分布，可以考虑使用非参数检验方法，如秩和检验。

四、多重比较问题在医学研究中，常常需要进行多个组之间的比较。

如果不注意控制多重比较带来的误差，就会增加得出错误阳性结果的概率。

例如，在比较多个药物剂量组的疗效时，如果不进行适当的校正（如 Bonferroni 校正），就可能因为多次比较而错误地认为存在显著差异。

五、相关与回归分析的错误相关分析用于研究两个变量之间的线性关系，但不能得出因果关系。

在医学论文中，有时会错误地将相关关系解释为因果关系。

回归分析中，自变量的选择、模型的拟合度评估等方面也容易出现错误。

例如，没有考虑自变量之间的共线性问题，导致回归结果不准确。

六、生存分析的错误生存分析常用于研究疾病的发生、发展和预后。

科研设计中的常见错误分析

和评价（ｄｅｓｉｇｎ，ｍｅａｓｕｒｅｍｅｎｔａｎｄｅｖａｌｕａｔｉｏｎ，简称ＤＭＥ）三步骤，其每一步骤均遵循一定的原则：设计要遵循“分层、区组随机化分组，可比性（均衡）的平行对照，盲法，可重复性（样本量足够）”四大原则【３１，好的科研设计，必须把握好科研设计的三个基本要素，即研究（受试）对象、处理因素和试验效应；必须保证取得的测量数据真实、可靠，避免各种可能的测量偏倚；评价包括正确选择统计分析技术及对统计分析结果的统计学推断和专业推断。１．１科研设计的三要素
２医学论文常见的设计问题
由于科研设计是科学研究的开始，设计中的错误会导致严重的后果，甚至可能导致整个科研工作的全盘否定。２．１对照组设计问题对照是临床科研设计的重要原则之一，一个理想的对照应该除研究因素外，其余方面均与研究组相同。如果没有恰当的对照，就无法确定所观察到结果是由试验因素引起的，还是由其他没有控制的因素引起的。常见对照组设立的问题有：（１）缺少对照组。最常见的是医院内的回顾性病例总结，只根据计算的治愈率、有效率得出某种治疗方法有效、疗效较好、无效等肯定性结论，甚至据此认为某种疗法值得推广等。（２）对照组不恰当：使用非同期对照或历史对照；组间基本条件缺乏可比性；对照组例数太少；对照不全或多余对照；配对设计，但两组例数却不一致。
ｉｎｈｉｂｉｔｉｏｎ［Ｊ］．ＢｉｏｃｈｅｍＰｈａｒｍａｃ０１．２００８。７６：７９６－８０４．ｆ４】ＭｕｎｄｅｌＰ．ＲｅｉｓｅｒＪ．ＢｏｒｊａＡＺ．ｅｔａ１．Ｒｅａｒｒａｎｇｅｍｅｎｔｏｆｔｈｅ
各种科研设计有其自身的规律，应把握其个性特征：如调查研究关键在于调查表的设计质量和调查过程中的质量控制；临床试验研究关键在于伦理道德的考虑，受试者的纳人和排除标准的制定，受试者依从性的提高和临床试验过程中的质量控制；而实验研究，关键

医学统计方法常见错误

t检验或方差分析、秩和检验
二、统计学推断常见错误
01
02
03
04
单向有序R×C表资料秩和检验
双向有序且属性不同等级相关分析
双相有序且属性相同 Kappa检验
R×C表资料 2检验
两个定性变量资料的统计分析
1.t检验应用时常见的错误
t检验是目前医学研究中使用频率最高，医学论文中最常见到的处理定量资料的假设检验方法。 t检验得到如此广泛的应用，究其原因：现有的医学期刊多在统计学方面作出了要求，研究结论需要统计学支持。传统的医学统计教学都把t检验作为假设检验的入门方法进行介绍。 t检验方法简单，其结果便于解释。
1
2
注： *P<0.05, **P<0.01
3
表5 大豆黄酮sp2/0肿瘤细胞DNA合成影响的时间-效应关系
结论：用t检验，P<0.05为差异有统计学意义。大豆黄酮作用于肿瘤细胞后，其[3H]TdR掺入量随时间的延长而逐渐增加，但抑制率呈下降趋势。
误用t检验分析重复测量设计资料对差错的分析随着时间的变化，肿瘤细胞数目的变化有较强的自相关性，而且又涉及两个影响因素，资料和设计类型都不满足t检验的要求，因此统计学处理结果不可信。释疑此例是一个具有重复测量的两因素设计资料，应采用相应的方差分析进行统计学处理。对重复测量数据进行方差分析常采用轮廓分析（profile analysis），它可从总体特征上较快地得到反应变量随重复观测资料的组间轮廓性比较结果。
表4 两组患者头孢唑啉钠药物动力学参数比较
忽视t检验的前提条件。
研究者依据P值认为两组在α，k10两项指标上差异无统计学意义。
03
01
02
实例研究单味中药对小鼠细胞免疫机能的影响，把40只小鼠随机均分为4组，每组10只，雌雄各半，用药15d后测定E-玫瑰结形成率（%），结果如下，试比较各组总体均值之间的差别有无统计学意义？

医学论文常见统计错误点评-210-2019年华医网继续教育答案

2019年华医网继续教育答案-医学论文常见统计错误
点评
备注:红色选项或后方标记“[正确答案]”为正确选项
(一)科研设计误用纠错
1、医学论文中常见的问题不包括
A、科研设计
B、统计学方法
C、相对数
D、理论值[正确答案]
E、统计图表
2、常见的假随机分组不包括
A、交替分组
B、按就诊时间先后顺序分组
C、队列分组[正确答案]
D、按出生日期分组
E、按病案/病历号分组
答案详见：
3、科研设计的
四原则不包括
A、对照
B、随机
C、科学[正确答案]
D、均衡
E、重复
4、制订临床生化指标的正常值范围时
A、样本含量不少于300例[正确答案]
B、样本含量为200例
C、样本含量不大于50例
D、样本含量超过18例即可
E、样本量为18例。

国内检验医学临床研究常见科研设计缺陷和统计学错误辨析

了这些研究论文结论的可靠性。在此，笔者拟就目前国内检验
差的慨率，并不能体现实验因素引起效应量的变化幅度。因此，如果仅仅在研究论文中报道Ｐ值，可能会误导读者，夸大研究的价值。比如，某研究发现丁冠心病患者（ ” 二ｌ－ｌ８）血浆载
数比较的时候，并不严格区分两组资料是否符合正态分布，是
否为配对设计，几乎千篇一律地采用ｔ检验进行两组均数的比较。有的研究在处理两组以卜数据间的比较时，甚至反复采用ｔ检验进行，增加了Ｉ类误差的风险。１．２分类资料统计中的常见错误对于分类资料的比较，首先需要明确的两个问题是：（１）日标变量的分类描述之间是否
在开展检验医学临床研究的过程中，严谨认真地对待每 …
个试验细节，对获取的科学数据进行科学的统计学分析，是保
结沦。在某些情况下，有统计学意义不・定有专业意义，反之
亦然。统汁学处理结果的Ｐ值，只能反映这一结论犯Ｉ类误
异具有统讨‘ 学意义（Ｐ＜０．０５）Ｊ。但众所周知，载脂蛋白Ｍ的检测误差和生物学变异都远大于０．０２（）Ｄｕ／ｍｍ，如此微小的差异虽然有统计学差异，但是井尤多大临床价值。如果能列出两组患者载脂蛋白Ｍ差异的９５（、ｊ，则读者便可以一目了然地判断研究实验因素效应的大小，并根据专业判断该研究是

医学统计中的典型错误

释疑：在判断资料的性质时，应从资料的本质加以分析，即看从每一个受试对象测得指标的具体内容是什么，而不要仅从资料的表面现象去判断资料的性质。在判断资料的实验设计类型时，应确定资料所涉及的因素的个数和各因素水平的组合情况，还要注意研究者在收集和整理资料时所采用的方法，综合分析，才能对实验设计类型做出较为准确的判断。本资料应采用与重复测量设计相匹配的方差分析进行处理。
文题目：《盆腔动脉插管灌注化疗及栓塞治疗恶性滋养细胞肿瘤》，用改良的 Seldinger’s插管技术对8例经临床及病理证实的恶性滋养细胞肿瘤进行选择性盆腔动脉插管灌注化疗。治疗前后测血hCG 放免测定值。结果见表4.5。采用一般t检验进行分析，治疗前后血hCG值经统计学处理有显著性差异（P<0.05）。
分析：严格地说，每个哮喘患者都能提供一个药物发生疗效的时间，因而此资料从本质上讲应为定量资料，表4.2只是为了表达的方便列出不同时间点上的频数分布，并不代表此资料中的结果变量就为定性资料。原作者采用一般χ2检验对资料进行处理，χ2检验所能回答的问题与原作者的分析目的不一致。此时得出的结论只能是美喘清组和博利康尼组在不同起效时间的构成上存在的差别是否具有统计学意义，并不能得出两组起效时间之间的差别具有显著性意义。
疑：本资料的受试对象为病例标本，测量指标为“阳性细胞百分率”，因而应为定量资料，其涉及一个实验因素，即样品类别，有五个水平，即“毛细血管瘤”、“混合型血管瘤”、“海绵状血管瘤”、“淋巴管瘤”和“正常皮肤”。对于百分率的定量指标，一般根据经验，宜做平方根反正弦变换，在对资料检验满足正态性和方差齐性的前提条件后，可按单因素 5水平设计资料进行方差分析，如变量变换后仍不满足前提条件，则用非参数检验18402。

常见科研设计类型与分析方法正误辨析-wusong6

随机原则------假随机分组
对照原则----无对照
对照原则------假对照
例：某人在研究某药物治疗铅中毒的驱铅效果时,将30名铅中毒工人脱离现场后住院治疗的结果列出来,发现无论是“血铅”还是“尿铅”的数值,治疗后都明显低于治疗前,经统计学处理得出差异有统计学意义的结论。虽然“疗前与疗后”是自身对照研究,但未排除患者“自动排泄的影响”,将人体自身排泄的血铅量和尿铅量都归功于驱铅药物的效果显然是不妥的。
试验设计核心内容之二

四原则
所谓“四原则”就是随机、对照、重复和均衡原则,它们在选取和分配受试对象、控制重要非试验因素对观测结果的干扰和影响、提高组间均衡性、提高结论的可靠性和说服力等方面将起到“保驾护航”的作用；
2
随机化原则
随机化原则：指在选取样本时,应确保总体中任何一个个体都有同等的机会被抽取进入样本。在分配样本时,应确保样本中任何一个个体都有同等的机会被分入任何一个组中去，或同等机会先后参加试验。随机：随机抽样、随机分组和随机顺序王家良教授曾抽样调查了1985—1990年35种中华医学会系列杂志发表的RCT的研究论著，共计164篇，其中交待了随机分组方法者仅为约2%;交待了随机分组方法，但有错误者为5.5%;79.3%的论著提到研究为随机对照试验，但文中根本未见关于随机分组方法与方式的叙述。
现代生物统计学的奠基人之一 Fisher说:“试验完成后再去找统计学者求教,无异于请统计学者为试验结果进行‘尸体解剖’。统计学者或许只能告诉你试验失败的原因”。
R. A. Fisher
汇报提纲
一、科研设计概述二、常规统计分析方法三、科研设计错误辨析四、常见统计学错误辨析

临床试验中常见科研设计与统计分析错误辨析

临床试验中常见科研设计与统计分析错误辨析临床试验过程包括设计、测量和评价( design，measurement and evaluation ，简称DME) 三大步骤，其每一步骤均遵循一定的原则：设计要遵循“分层、区组随机化分组，可比性(均衡)的平行对照，盲法，可重复性(样本量足够)”四大原则；测量必须保证取得的数据真实、可靠，避免各种可能的测量偏倚；评价包括正确选择统计分析技术及对统计分析结果的统计学推断和专业推断。

临床试验论文是反映药物临床设计、实施过程，并对试验结果作出分析、评价以供循证医学进行系统评价参考的总结性文章，真实、完整地描述事实，科学、准确地分析数据，客观、全面地评价结局是撰写试验论文的基本准则。

因此，充分理解DME过程遵循的原则有助于临床医生合理设计临床试验，选择正确的统计分析方法，书写科学严谨的试验论文。

本文拟系统分析医学论文中常见的科研设计与统计分析错误。

一、临床试验论文设计问题辨析临床试验论文中设计问题主要表现在违反试验设计的四大原则和测量方法的描述上。

因试验设计是科学研究的开始，设计中的错误所导致的后果是很严重的，甚至可能导致整个科研工作的全盘否定。

1．随机化问题随机化是临床科研设计的重要原则之一，是避免偏倚和混杂因素的最有效的方法。

常见随机化方面的问题有：未注明分组是否随机，或未采用随机化分组方法。

未说明随机的方法，只是笼统地说“将病例随机分为两组”，如某已发表论文对分组的描述：“35 例均为住院患者，随机分为两组，治疗组21 例，对照组15 例。

”从两组样本数相差悬殊即可断定分组并非随机。

随机化方法错误，如按奇偶数、单双日、入院顺序等。

如“按病情和就诊的先后顺序分组”，因病人就诊的先后顺序往往暗示其病情不同，尤其是当病人的病情轻重难以判断时若将先来就诊者分在一组，后来就诊者分在另一组，就不可避免的导致顺序误差(即一组病人的病情较另一组病人的病情重)，从而得出错误结论。

医学论文中常用统计分析方法错误大全

医学论文中常用统计分析方法错误大全在医学研究领域，准确和恰当的统计分析是得出可靠结论的关键。

然而，在众多医学论文中，却存在着各种各样的统计分析方法错误，这些错误可能会导致研究结果的偏差甚至错误解读，从而影响医学研究的质量和临床实践的指导价值。

接下来，我们就来详细探讨一下医学论文中常见的统计分析方法错误。

一、样本量计算错误样本量的合理计算对于研究的可靠性和有效性至关重要。

许多研究在设计阶段未能充分考虑研究的主要目的、预期效应大小、检验效能以及显著性水平等因素，导致样本量过小或过大。

样本量过小可能使研究无法检测到真实存在的差异，从而得出假阴性结论；样本量过大则会造成资源浪费，同时可能增加研究的复杂性和误差。

例如，在一项比较新药物与传统药物疗效的临床试验中，如果预期的疗效差异较小，而研究者没有充分考虑这一点，计算出的样本量不足，那么即使新药物实际上更有效，也可能由于样本量的限制而无法得出有统计学意义的结果。

二、数据类型错误医学研究中数据类型多样，包括计量资料（如身高、体重、血压等）、计数资料（如疾病的发生例数、治愈例数等）和等级资料（如疾病的严重程度分为轻、中、重）。

错误地判断数据类型会导致选择错误的统计分析方法。

例如，将原本属于计数资料的数据（如疾病的治愈与未治愈），错误地当作计量资料进行 t 检验，这样得出的结果是不准确的。

反之，将计量资料当作计数资料处理，也会造成同样的问题。

三、选择错误的统计检验方法不同的研究问题和数据类型需要相应的统计检验方法。

常见的错误包括：在多个组间比较时，错误地使用 t 检验而不是方差分析；在非正态分布的数据中使用参数检验方法；在不符合独立性假设的情况下使用独立样本检验等。

比如，在比较三种不同治疗方法对患者生存率的影响时，应该使用方差分析或非参数的KruskalWallis 检验，而不是多次进行两两t 检验，因为这样会增加一类错误（即假阳性）的概率。

四、忽视方差齐性检验在进行 t 检验和方差分析时，通常需要先进行方差齐性检验。

统计学中的类型I和类型II错误

统计学中的类型I和类型II错误统计学是一门研究数据收集、分析和解释的学科。

在统计学中，我们经常会遇到两种不同的错误类型：类型I错误和类型II错误。

这两种错误类型在实际研究和决策过程中具有重要意义，本文将介绍统计学中的类型I和类型II错误，以及其对实践的影响。

一、类型I错误类型I错误，又称为α错误，是指在进行假设检验时，拒绝了真实的无效假设（零假设）的错误。

换句话说，类型I错误发生时，我们错误地认为有一个关联或差异存在，而事实上并没有。

在统计学中，我们进行假设检验来判断样本数据是否支持或拒绝某一假设。

通常情况下，我们设置一个显著性水平（一般为0.05），当p 值小于显著性水平时，我们拒绝零假设，并得出结论。

然而，如果我们设置了过高的显著性水平或者在多次重复试验中进行了多重假设检验，那么就会增加犯下类型I错误的风险。

类型I错误可能会导致假阳性结果的产生。

例如，在药物实验中，如果我们错误地拒绝了药物对疾病没有治疗效果的零假设，那么我们可能会得出一个错误的结论，即认为该药物有效。

这可能导致不必要的治疗和资源浪费。

二、类型II错误类型II错误，又称为β错误，是指未能拒绝无效假设（零假设）的错误。

换句话说，类型II错误发生时，我们无法检测到实际存在的关联或差异。

类型II错误通常与样本容量的大小有关。

当样本容量过小，检验的功效就会降低，从而导致类型II错误的风险增加。

另外，当效应大小较小或困难度较高时，也可能增加类型II错误的概率。

类型II错误可能会导致假阴性结果的出现。

例如，在临床试验中，如果我们未能拒绝一种药物无效的零假设，可能会导致需要治疗的患者无法获得有效的药物。

这可能延误或甚至危及患者的生命。

三、类型I和类型II错误对实践的影响类型I和类型II错误的发生对实践都有重要影响。

过于关注避免类型I错误可能导致犯下更多的类型II错误，而过于关注避免类型II错误可能导致犯下更多的类型I错误。

在科学研究和医学实践中，我们需要在类型I和类型II错误之间寻找平衡点。

论文统计图表常见的那些错，附大量实例！

论文统计图表常见的那些错，附大量实例！1、“率”与“构成比”的混用【原文1】600 例烧伤患儿中，210 例早期有休克症状，其中3岁以下者110例，占52%；3岁以上者100例，占48%，年龄越小，休克发生率越高，随着年龄逐渐增长，机体调节机能及其对体液丧失的耐受性会逐步改善。

（《中华烧伤杂志》2000年发表）【原文2】表1. 101例术后病人对探视时机、探视时段的需求（《中华护理杂志》2001年发表）【分析】“率”是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比，用以说明该现象发生的频率或强度。

“构成比”即比例，是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比，用以说明事物内部各组成部分所占的的比重。

二者都是相对指标，计算公式相似，但是存在本质区别。

原文1中，210例发生早期休克患儿中，3岁以下的占52%，3岁以上占48%，实际上是构成比，而文中却将其误认为“发病率”，得出了“年龄越小，休克发生率越高”的结论，明显是错误的。

如果要计算不同年龄段的休克发生率，则计算公式应为（某年龄段发生休克的患儿数/该年龄段可能发生休克的患儿总数）×100%。

原文2表格中的相对数实际上也是“构成比”，“百分率”的表述方式并不准确，应该改为“构成比”。

2、分母太小不适合计算比例【原文】环丙沙星治疗实验感染动物鼠疫疗效观察：表2结果表明治疗组30只动物全部存活，治愈率为100%。

（《中国地方病学杂志》2005年发表）表2. 环丙沙星治疗实验感染动物鼠疫疗效观察【分析】原文中统计表的主要问题在于计算相对数的分母太小。

分母太小，会使结果显得过分夸张，易失真，不能正确反映事实情况，给人造成错觉。

一般来说，只有当观察的研究对象数量足够多的时候，计算相对数才比较稳定，才能反映真实的情况。

研究中对照组的动物数仅有3只，“治愈率为0”的表达显然是不合适的。

此外，表2要表达的是两组治疗疗效的差异，“攻击剂量”是对实验动物进行感染的剂量，文中也明确说明了两组动物的攻击剂量是一样的，因此攻击剂量没有必要出现在表格中。

试验设计与统计分析中的常见问题

6.试验数据的综合分析
（1）单因素试验数据的综合分析
有了单因素试验数据，可得到以下分析结果：
①通过方差分析得到因素对指标影响的显著性。
②通过回归分析得到因素对指标的影响规律。
③利用回归方程可得到最佳的参数水平及其指标值。
三、统计分析问题
（2）双因素试验数据的综合分析有了双因素试验数据，可得到以下分析结果： ①通过方差分析得到因素及其交互作用对指标影响的显著性。
“试验设计与统计分析”中的常见问题四、写论文问题 1.题目要有吸引人眼球的地方（1）试验手段先进，如：用流化床干燥大枣（2）研究方法先进，如：用二次通用旋转组合设计方法进行大枣干燥的研究，或大枣干燥工艺参数的优化等。（3）研究内容新颖，即无人进行过研究，如：狗对牡丹花的看法。
四、写论文问题
“试验设计与统计分析”中的常见问题三、统计分析问题常用的统计分析方法有：方差分析，多重比较，极差分析，回归分析，相关分析等。能得到的分析结果如下：
三、统计分析问题 1.方差分析
以单因素试验为例，试验结果如下表。
重复次数
因素水平
1
x11 x21 … xi1
2
x12 x22 … …
…
… … … …
②通过方差分析得到因素及其交互作用对指标影响的显著性。 ③对符合条件的正交试验数据，可进行回归分析。
三、统计分析问题
（4）多指标的参数优化
即找到一组最佳参数组合，使所有指标都较好的过程。
对于正交试验数据，可采用综合平衡法或加权综合评分法。
对于回归试验数据，可采用加权综合评分法或主目标优化法。
二、试验设计问题 5.回归试验
回归试验的目的是为了得到好的回归方程。有用的是得到二次回归方程，可得到最佳参数组合。常采用二次通用旋转组合设计，其优点是：利用回归方程预报精度高，试验次数少。因为二次通用旋转组合设计各因素都取5个水平，且试验点在编码空间分布合理（分布在距中心点距离不等的3个球面上，且有星号臂r控制回归方程的精度）。而BOX法设计，各因素都取3个水平，分布在2个球面上，且无星号臂r控制，回归成二次方程，不是也得是。因此，若是实际应用，建议采用二次通用旋转组合设计。

医学杂志论文中常见的统计学错误分析及对策

医学杂志论文中常见的统计学错误分析及对策随着医学科研的发展，统计学在医学杂志论文中扮演着重要的角色。

但是，由于研究者对统计学方法的理解不足或应用不当，常常会出现一些统计学错误。

本文将分析常见的统计学错误，并提出相应的对策，以帮助研究者提高论文质量。

2.样本量不足：样本量的大小对于统计结果的可靠性和代表性至关重要。

样本量不足可能导致结果不具有统计学意义。

因此，研究者在进行实验设计时，应该根据研究目的和预期效应大小，通过统计学方法计算出所需的最小样本量，并确保实际样本量达到或超过计算的结果。

3.忽略数据分布的假设：一些统计学方法要求数据满足特定的分布假设，例如正态分布。

然而，研究者在应用统计方法时往往忽略了这个前提条件，并未对数据的分布进行充分检验。

为了避免这个问题，研究者应该在应用统计方法之前，使用合适的统计检验或图表来检验数据是否符合假设的分布。

4. 未进行多重比较校正：当进行多组比较时，如果未进行多重比较校正，可能会导致假阳性结果的出现，即错误地认为存在差异或关联。

为了避免这种错误，研究者应该在进行多重比较时采用适当的校正方法，例如Bonferroni校正或Benjamini-Hochberg过程。

5.缺乏效应大小的解释：纯粹依靠显著性检验结果来判断研究结果的重要性是不足够的。

研究者应该解释效应的大小，例如使用点估计和置信区间来表示效应的大小范围，并进行实际意义和临床可应用性的讨论。

6.忽略混杂因素的校正：在观察性研究中，混杂因素可能会影响到统计分析的结果。

如果在统计分析中未对混杂因素进行校正，可能会引入偏差。

因此，研究者应该在进行统计分析之前，充分考虑可能的混杂因素，并使用适当的统计方法进行校正。

7.未进行复杂数据分析：对于复杂数据结构，例如多层次数据（例如医生-病人数据）或长期纵向数据，简单的统计方法可能无法提供准确的结果。

研究者应该使用适当的复杂数据分析方法，例如多层次回归分析或混合效应模型，以更好地处理这种类型的数据。

医学科研论文中的统计学问题汇总分析

------------------------------------------ 最新资料推荐------------------------------------ 医学科研论文中的统计学问题汇总分析医学科研论文中的统计学问题汇总分析作者：郑华宾ARS医学统计学是一门帮助人们透过偶然现象，分析和判断事物内在规律的科学。

随着医学科研工作的深入，医学统计学的应用越来越广泛。

由于统计学的内容非常丰富，并且仍在不断发展，而医务工作者常因各种原因不愿花费许多精力钻研统计学知识，故医学论文中误用统计学的现象较为严重。

为了减少这一现象，提高论文的水平，现就论文中常见的统计学错误，分析讨论如下。

1 .文中未交待所用统计方法论文中应将所用的统计方法交待清楚，例如，是配对设计的t检验还是成组设计的t检验，是Ridit 分析还是卡方检验，是作相关分析还是作回归推断。

使用不正确的统计方法会得出错误的结论，所以统计方法交待不清或根本不予交待，会使读者对论文结论的正确与否无法判断。

有的作者只提一句经统计学处理后，就写出结论;有的甚至于直接用P值说明问题了事。

正确的做法应写明具体的统计方法，如有特殊情况，还应说明是否采用了校正，这样才有说服力。

严格地说，应写明精确的统计量值和P值,如t值、F值、2 值等,不应笼统地以P0.05或P0.05代替。

此外,最好能交待所使用的计算工具与统计软件名称。

因采用公认的统计软件（如SAS、SPSS等）或程序型计算器进行计算，与手工计算相比,既准确又快捷，其计算结果易于被人接受。

2.使用统计方法时不考虑其应用条件每一种统计方法都有其适用条件。

在表示数值变量资料（计量资料）的平均水平时常用到平均数。

然而平均数有算术平均数（均数）、几何均数和中位数，各有其应用条件。

应用均数时，必须首先确定数据为正态分布。

如果数据是偏态分布，仍用均数表示其平均水平势必导致错误的结论，不少作者没有注意到这一点。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

科研设计与统计常见错误解析
中日友好医院李光伟
一、选题
临床科研系指以病人为研究对象的医学科学研究其目的是为了提高诊断水平和治疗效果，改善预后和对疾病病因做宏观研究。
选题是临床科研的起点体现科研设计和实施的指导思想影响临床科研工作的全过程因此在科研过程中自始至终处于主导地位。从这个角度来说，选题比科研方法更重要。
选题必须具有科学性。所提出的新问题、新假设、新思路必须要符合客观规律。临床实践是临床科研选题的源泉: 在日常临床实践中，人们无时无刻不面临着许多诊断、治疗、病因和预后估计等问题，诊断方法和治疗措施有待于科学的系统评价,这些课题其中不少可能具有较高的研究价值临床医学已发展成为一门综合性的学科，不仅涉及生物医学，而且涉及临床经济学和医学社会等,这一方面有许多有待研究的临床问题。
妇女健康倡议研究（WHI)
-----再好的研究也有缺陷！忽略了HRT最明显的益处：（缓解更年期症状，治疗泌尿生殖道萎缩，防止骨质疏松）没有遵照处方药应该严格掌握适应症的原则（性激素低下而非所有老年妇女，更不是健康老年妇女。该研究中80%以上是没有绝经期症状的老年妇女。不具有HRT适应症结论不应随意扩大（品种，剂量，种族）与某些风险相比WHI所阐明的HRT对各种事件的绝对风险是很低的
选题就是要正确地发现和提出问题这些问题有的来自于临床实践有的来自文献资料所谓正确就是这些提出的问题要符合科学的认识规律
提出新问题、新假设比完成一项科研工作更难没有好的科研假设，再好的科研方法也不会有好的科研成果。
例: 提出新问题
医生的共识----冠心病来自已知危险因素。但是无已知危险因素的人为什么发生冠心病？冠心病人群血同型半胱氨酸水平显著升高，那末同性半胱氨酸是否是冠心病新的危险因素？使之下降发生冠心病危险是否会下降？
(1)、描述性统计
描述性统计分析是统计检验的基础，能提供资料的总体特征，不论在最后的论文报告中描述性统计分析的结果占多大的比重，它都是实际的资料分析过程中的起点它为选择进一步的分析方法如选择合理的变量提供重要的信息, 发现原始资料中的错误
忽略必须的描述性统计分析是导致统计方法应用不当的原因。
为保证科研的成功 , 一个完整的科研设计应包括以下几项内容:
有理论或实用价值的选题选择合适的研究对象制定可靠的测量指标选择科学的统计分析方法
若能对结果做恰当的描述，则会得出符合实际的结论。
随机化分组在大多数情况下十分重要，但随机化并非总是有利的和有道理的。
在某些情况下有比随机化更重要的东西那就是要满足适应症的要求。适应症不合理，随机化反使结果变糟。
现在大多数的国际医学刊物发表的论文中要求作者同时给出点估计、区间估计和具体的检验统计值，如相对危险度（Relative Risk , RR, RR值就是暴露人群发病机与非暴露人群发病机率之比，即a/(a+b)与c/(c+b)之比），RR的95%可信限和P值。诸如95%可信限的区间估计可以提供更多有价值的信息但在我国临床科研的统计学应用中尚未引起足够的重视。片面地认为越复杂的统计方法越好，而忽视统计检验方法的适用性和恰当性。
变量的梯度是成功的关键。
4、设定恰当的入选和排除标准
恰当的入选和排除标准可防止混杂因素的干
扰，保证研究结果的科学性，这是在各项研究遵守的。
例如，看血压与胰岛关系，不可纳入有心功障碍及肾病患者，否则可结果会有偏差。
4、设定恰当的入选和排除标准
入组的研究对象的准入指标，是保证研究质量的最重要和最基本的条件，在研究设计和发表的论著中务必详细交代。但这种选入排除标准应是实事求是的而不是过于苛求。
“前瞻性‛研究,无前瞻性的设计
几年前做了几万人的糖尿病普查 , 发现了 400 例糖尿病和500 例糖耐量低减，几年后的今天忽然想起这些病例很可能出一篇文章，于是又去调查了一番，找到了200例糖尿病和300例糖耐量低减。
写出 1.糖尿病人冠心病危险因素分析 2.高危人群糖尿病的危险因素.
这种研究是残缺不全的随访 ,并不是前瞻性研究 ,缺点是难以弥补的。高达 50% 的失访率会造成严重的信息偏差（ information Bias ） : 若是有问题的人’召之即来’ , 则发病率会被高估 ; 若严重者已去医院看病不来参加，来的只有轻的病人，则会低估疾病的发病率。
例1, 看生长激素水平与身高的关系：对25—74岁者测GH与身高结果发现GH与身高不相关结论肯定错了因为GH的最重要作用在于促生长原因是人群选择失当 GH促生长表现在身高增长期，即儿童期成人身高已不再增高。
研究肥胖与糖尿病的关系不能仅选择超重和肥胖的人群（BMI 25-30）因为（BMI 25-27）与（BMI 27-30）的人群糖尿病的患病率可能无明显差别，但与BMI〈24人群差别会很显著
没达到‚狭窄‛切点, 只是时间尚短。这并不能说明胰岛素与冠心病无关。
(二)、选择试验效果测试指标：
对测量的方法和指标的要求
① 敏感性要好：对于治疗出现的客观反应，要能敏感地发现并能量度，其敏感性越高越好； ② ③
(二)、选择试验效果测试指标：选择要求
关联性：指标与研究目的有本质的联系，应能确切反映处理因素的作用。生物学意义合理：冠脉造影，HbA1c看降糖药物疗效。灵敏性：指标能正确反映效应变化的最小数量或最小水平。特异性：对治疗反应的阳性结果要能准确地测量和确定，其特异性越强越好；尽量选用客观指标作为主要观察指标。精确性：包含准确度(效度)和精密度(信度)两个方面。稳定性：变异程度经济可行：在考虑敏感性和特异性的基础上，应从各种方法比较中，选择经济及可行性良好的测试方法和指标。指标的选择要少而精
终点事件过少
有些研究者为了某种原因，希望尽早发表自己研究的结果，仅随访极短的时间 ( 半年或一年 ) ，仅有几个或十几个终点事件（如死亡）就进行多因素分析，寻找危险因素。
终点事件过少的这种分析看上去可能条条是道，但其结果往往是不可靠的。应延长随访时间，增加终点事件后再分析 Navigntor 研究设计出现 1000 个终点事体时才结题。
过度严格的选择会有轻型病人被排除, 使研究结果出现偏差。
例：冠心病与胰岛素的关系仅用冠脉造影资料作为诊断标准结果发现冠脉造影（-）者：FINS 22 mm/ml 冠脉造影（+）者：FINS 23 mm/ml 结论是冠心病与胰岛素无关问题出在什么地方？
问题出在‚诊断标准‛:
冠脉造影（-）的人为什么能接受这种不无危险的检查？因为这些人已有许多危险因素！！或有轻度狭窄但达不到‚狭窄的定义‛的切点
女性激素补充治疗的循证研究
（妇女健康倡议研究WHI) 19世纪70年代结论：雌激素加孕激素能有效缓解更年期症状，治疗泌尿生殖道萎缩，防止骨质疏松。但不会增加子宫内膜癌危险。
WHI（大规模，多中心，随机对照）结论：
雌激素孕激素联合治疗不宜用于绝经后妇女心血管疾病预防，预防骨质疏松时应考虑乳腺及心血管病风险。弊多利少！心脏事件 29%，卒中 41%，乳腺癌 26%，结肠癌 37%，髋骨骨折 34%
从简单到复杂
最基本的分析形式为单个因素的不匹配不分层资料组间比较的分析这是病例对照研究推断性统计的基础。可比较病例组与对照之间危险因素的分布情况，分析其危险因素与患病之间的联系。
由于病例和对照只是总体的代表, 无法直接计算真实的患病率，也就无法直接计算RR值，可以估计相对危险度OR，用以来代替RR。
1.
1. 研究对象要有代表性
随机化抽样的缺点是研究对象地域较为分散，每个单位仅有少量病例，这对于干预治疗的前瞻性研究的病人管理极为不利，耗费更多人力，常使研究无法进行。
而在人群较多的社区进行‚整群‛调查，会在相对较小的地域找到较大样本，从而有利干预治疗的管理。如果其人群结构接近全局的人群，其统计的‚率‛也有重要参考价值。

三. 统计分析
在我国临床科研的统计学应用中，在统计方法的选择上存在过分强调统计检验而忽略统计学估计的倾向，存在统计方法越复杂越好的片面看法。在发表的医学论文中，大多强调是否得到差别有统计学意义，而较少对测定值进行 95% 可信区间估计，提及样本量估计及抽样方法、样本代表性问题的文章就更少了在 80 年代初期，国外医学杂志针对类似的情况曾进行广泛的讨论，提出应重视区间估计的意义而不能将注意力集中在P值是否小于0.05上。
(2)、统计分析中变量的选择
变量的确定：
研究的目的是相看哪两个变量之间的关系（不妨假设一因，一果）
例 ;高血压为因，冠心病为果
A.明确变量的性质
重点和首要的看变量是否为正态分布分析中对变量进行正态分布检验血胰岛素、血脂、生长激素、皮质醇、尿微量白蛋白，骨密度等都常为非正态分布。非正态分布的变量是不能以原始资料进行参数统计分析，此时不进行正态化处理，得出结论会面目全非。

(一). 研究对象的选择
要想证实研究者的思想，确定入选和排除标准，选择合理的研究对象是关键的一环。
1.
1. 研究对象要有代表性
做疾病患病率的调查，随机化的原则可保证研究样本是总体人群的‚缩影‛，从而避免结果失真。从某一局部地区‚整体人体‛调查出的 ‚率‛如推广到普遍认群，应说明该局部的 ‚整体‛人群与全局的人群结构相似。
选题----同型半胱氨酸是否是冠心病新的危险因素？
临床科研选题的原则
首先是研究的问题要涉及我国的常见病、多发病、危害人民健康较严重的疾病。第二个原则是所选的课题要有创造性和先进性，要选择前人没有解决或没有完全解决的问题。研究的结果应该是前人不明了或不完全明了的。

开拓性（独创性）研究最有价值。发展性研究，争鸣性研究也有一定的价值没有探索性，缺乏创造性，只是重复前人做过的工作，不能算作好的科研。

科研设计与统计常见错误解析

合集下载

医学论文常见统计学错误与纠正

统计工作中常见的错误有哪些

医学科研中常见统计学错误(朱继民)总论

医学论文中常用统计分析方法错误大全

科研设计中的常见错误分析

医学统计方法常见错误

医学论文常见统计错误点评-210-2019年华医网继续教育答案

国内检验医学临床研究常见科研设计缺陷和统计学错误辨析

医学统计中的典型错误

常见科研设计类型与分析方法正误辨析-wusong6

临床试验中常见科研设计与统计分析错误辨析

医学论文中常用统计分析方法错误大全

统计学中的类型I和类型II错误

论文统计图表常见的那些错，附大量实例！

试验设计与统计分析中的常见问题

医学杂志论文中常见的统计学错误分析及对策

医学科研论文中的统计学问题汇总分析

文档推荐

最新文档