当前位置:文档之家› 最新生物医学研究的统计方法假设检验

最新生物医学研究的统计方法假设检验

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

生物医学研究统计方法 第25章 Meta分析思考与练习参考答案

第25章Meta分析 思考与练习参考答案 一、最佳选择题 1. Meta分析中,如果异质性检验不拒绝H0,一般采用(B)进行效应合并。 A.随机效应模型 B. 固定效应模型C.混合效应模型 D. 回归模型 E. 贝叶斯模型 2. 关于meta分析,以下(C)说法不正确。 A.meta分析本质上是一种观察性研究,因而可能存在各种偏倚 B.meta分析是用定量的方法综合同类研究结果的一种系统评价 C.采用随机效应模型能使meta分析的结果更加可靠 D.meta分析时,如果研究间异质性很大,应认真考察异质性的来源,并考虑这些研究的可合并性 E.亚组分析能使meta分析的结果更有针对性 3. 对连续型变量资料的meta分析,如果各纳入研究的测量单位不同,应采用(A)作为效应合并指标。 A.标准化均数差 B. 加权均数差C.均数差 D. 标准化P值 E. 危险度差值 4. 异质性检验采用的统计量是(B)。 A.F统计量 B. Q统计量C.t统计量 D.H统计量 E. Z统计量 5. 关于发表偏移,以下说法(C)不正确。 A.通过漏斗图可大致判断是否存在发表偏倚 B.产生发表偏倚的主要原因是作者往往只把统计学上有意义的阳性研究结果拿来写文章并投稿 C.若发表偏倚对meta分析的影响较大,则需要增加很多个研究,才能使meta分析的结果被逆转 D.尽量搜集未发表的阴性研究结果,可减少发表偏倚 E.漏斗图的基本思想是纳入研究效应的精度随着样本含量的增加而增加

二、思考题 1. Meta分析的基本步骤有哪些? 答:Meta分析的基本步骤包括:提出问题,制定研究计划;检索相关文献;选择符合要求的纳入文献;提取纳入文献的数据信息;纳入研究的质量评价;资料的统计学处理;敏感性分析;结果的分析和讨论。 2. Meta分析的目的和意义是什么? 答:通过meta分析能增加统计功效,评价研究结果的一致性,增强结论的可靠性和客观性,通过亚组分析,得出新结论,寻找新的假说和研究思路。 3. Meta分析时,固定效应模型和随机效应模型有什么不同?如果研究间有异质性,应如何处理? 答:Meta分析进行效应合并时的变异可能来源于两个部分,一是研究内变异,二是研究间变异。采用固定效应模型只考虑研究内变异,即认为研究间的差别只是抽样引起,纳入meta分析的各个独立研究来自一个相同的总体,各个独立研究的效应是效应合并值这一总体参数的估计值。采用随机效应模型则同时考虑了研究内变异和研究间变异,即认为研究间的差异不仅仅是抽样引起的,纳入meta 分析的各个独立研究分别来自不同但互有关联的一些总体,每个研究有其相应的总体参数,meta分析的效应合并值是多个不同总体参数的加权平均。 Meta分析时,如果异质性检验的结果不拒绝H0,即研究间的差异没有统计学意义,可采用固定效应模型得到效应合并值。如果拒绝H0,则认为研究间存在异质性,此时应考察异质性来源,并通过敏感性分析或亚组分析等异质性处理方法,使之达到同质后,再采用固定效应模型。若经异质性分析和处理后,多个独立研究的结果仍然不具有同质性,可选择随机效应模型、meta回归及混合效应模型进行效应合并。如果异质性很大,应考虑这些研究结果的可合并性,或放弃meta分析,只对结果进行定性分析。 4. Meta分析有哪些常见的偏倚? 答:Meta分析本质上是一种观察性研究,在meta分析的各个步骤中均有可能产生偏倚。偏倚的存在对meta分析的结果产生较大影响。偏倚的类型主要包括文献发表偏倚、文献查

医学科研方法简答题

1.简述医学科研方法的基本步骤 (1)科研选题:确定所要研究的题目是选题的起点 a.准备工作,文献的阅读 b.科研选题的原则:创新性,先进性,科学型,实用性,可行性 c.研究条件和优势。研究条件:人力、物力、财力 (2)科研设计:是对科学研究具体内容与方法的设计和计划安排,分为专业设计和统计设计。 专业设计:是运用专业理论技术知识来进行的设计,即从专业理论角度来选定具体的研究课题,提出假说,围绕检验假设制定技术路线和实验方案。主要解决科学研究的有用性和独创性,决定了科研成果的大小。专业设计的成功与否是科研成败的关键。 统计设计:控制误差、改善实验有效性、确定资料分析方法,同时保证展开设计的布局合理性和实验结论的可信性。 (3)实施方法:调查、实验、临床观察 (4)统计分析: A.以正确的方式收集资料 B.描述资料的统计特征 C.统计推断得出正确而结论 (5)总结归纳:需要注意根据已有的数据来推理,按照自己本次研究的范围下结论总结归纳的基本形式:学术论文。 2.医学科研的任务是什么 (1)发现医学中的未知事物和内在规律 (2)寻找医学中已知事物的未知规律 (3)探索生存环境对人类身心健康的联系 (4)开发医学的应用 3.请简要叙述医学科研设计中专业设计和统计学设计的基本内容 专业设计:是运用专业理论技术知识来进行的设计,即从专业理论角度来选定具体的研究课题,提出假说,围绕检验假设制订技术路线和实验方案。主要解决科学研究的有用性和独创性,决定了科研成果的大小。专业设计的正确与否是科研成败的决定因素。 统计设计:是运用统计学知识和方法来进行的设计。减少抽样误差和排除系统误差,保证样本的代表性和样本间的可比性,确保实验观察内容的合理安排,以便使研究结果进行高效率的统计分析,以最少的实验观察次数(例数)得出相对最优的结果和可靠的结论。主要解决科研的可重复性和经济性问题,是科研结果可靠性和经济性的保证。 4.简述医学科研中误差的种类和控制方法 答案一:按误差的来源,误差的性质和误差的可控性等划分,主要可分为抽样误差和非抽样误差两大类,非抽样误差分为系统误差和过失误差。 抽样误差的控制主要在设计阶段。为了减少抽样误差,必须注意:①力求使抽取的样本具有代表性②具有一定数量的调查对象③在抽样时必须随机化。 非抽样误差的控制: ①调查设计阶段: a在调查设计时,首先应正确确定目标总体。 b在调查计划时,应明确定义调查项目,尤其是可能引起混淆的那些调查项目。 c问卷设计时应紧扣调查目的,合理设置调查问题,在众多问题中精选最具代表性的问题,这也是保证调查质量的重要环节。 d根据调查对象的特点,选择恰当的调查方式,以保证调查质量。

生物医学研究统计方法 第15章 样本含量估计思考与练习参考答案

第15章 样本含量估计 思考与练习参考答案 一、最佳选择题 1. 在假设检验中,样本含量的确定( C )。 A. 只与Ⅰ类错误概率α有关 B. 只与Ⅱ类错误概率β有关 C. 与α、β都有关 D. 与α、β都无关 E. 只与α、β有关 2. 以下关于检验功效的描述,不正确的是( C )。 A. 假设检验中,若0H 客观上不成立,但根据假设检验的规则,将有β大小的概率错误地得出“差异无统计学意义”的推断结论,这种错误称为Ⅱ类错误,相应地,推断正确的概率为β-1,称为检验功效。 B. 检验功效受客观事物差异的大小、个体间变异的大小、样本量和α值等要素的影响。 C. 假设检验的“阴性”结果(P >0.05)可以作为“总体参数之间的差异无统计学意义”这一结论的证据。 D. 假设检验得出“阴性”结果(P >0.05)是“总体参数之间的差异无统计学意义”这一结论的必要条件而非充分条件。 E. 当假设检验出现“阴性”结果(P >0.05)时,有必要复核样本含量和检验功效是/否偏低,以便正确分析假设检验“阴性”结论的正确性。 3.在调查研究中,计算配对设计均数比较所需样本含量的公式为( A )。 A. 2])([δβαS t t n += B. 2])([2δβαS t t n +?= C. 2])([δβαS t t N += D. 2 2 21)() )(1(2p p Z Z p p n -+-=βα E. =n 22212211)(] )1()1()1(2[p p p p p p Z p p Z --+-+-βα 4. 在调查研究中,计算两样本率比较所需样本含量的公式为( E )。

研究生医学统计学上机考试习题

医学科研中的统计学方法上机试题 时间:2014-12-15 共4题,共100分 1. 某医院病理科研究人体两肾的重量,20例男性尸解时的左、右肾的称重记录 见下表,问左、右肾重量有无不同? 表1: 20例男性尸解时左、右肾的称重记录 编号左肾(克)右肾(克) 1 170 150 2 155 145 3 140 105 4 11 5 100 5 235 222 6 125 115 7 130 120 8 145 105 9 105 125 10 145 135 11 155 150 12 110 125 13 140 150 14 145 140 15 120 90 16 130 120 17 105 100 18 95 100 19 100 90 20 105 125 2. 在评价某药物耐受性及安全性的I期临床试验中,对符合纳入标准的40名健康自愿者随机分为4组,每组10名,各组注射剂量分别为0.5U、1U、2U、3U,观察48小时后部分凝血活酶时间(s)。试比较任意两两剂量间的部分凝血活酶时间有无差别?

表2各剂量组48小时部分凝血活酶时间(s) 0.5 U 1 U 2 U 3 U 36.8 40.0 32.9 33.0 34.4 35.5 37.9 30.7 34.3 36.7 30.5 35.3 35.7 39.3 31.1 32.3 33.2 40.1 34.7 37.4 31.1 36.8 37.6 39.1 34.3 33.4 40.2 33.5 29.8 38.3 38.1 36.6 35.4 38.4 32.4 32.0 31.2 39.8 35.6 33.8 3.某神经内科医师观察291例脑梗塞病人,其中102例病人用西医疗法,其它189 例病人采用西医疗法加中医疗法,观察一年后,单纯用西医疗法组的病人死亡13 例,采用中西医疗法组的病人死亡9例,请分析两组病人的死亡率差异是否有统计学意义? 4.某省卫生防疫站对八个城市进行肺癌死亡回顾调查,并对大气中苯并(a)芘 进行监测,结果如下,试检验两者有无相关? 表4 八个城市的肺癌标化死亡率和大气中苯并(a)芘浓度 城市编号肺癌标化死亡率(1/10万)苯并(a)芘(卩g/100m3) 1 5.60 0.05 2 18.50 1.17 3 16.23 1.05 4 11.40 0.10 5 13.80 0.75 6 8.13 0.50 7 18.00 0.65 8 12.10 1.20

生物医学统计学

统计学是应用概率论和数理统计的方法,研究数据的搜集、整理、分析与推断的学科,是认识世界的一种重要手段。 变量(variable):就是反映个体特征或属性的量.变量值(variable value):变量的观察结果或测量值。定量变量quantitative variable/数值变量numerical variable 定性变量qualitative variable/分类变量categorical variable 同质(homogeneity)是指被研究指标的影响因素相同。但在医学研究中,有些影响因素往往是难以控制的(如遗传、营养等),甚至是未知的。因此,在实际工作中只有相对的同质。 变异(variation):同质基础上的各观察单位间的差异称为变异。 总体:是根据研究目的所确定的同质观察对象的全体,或者说所有同质的某指标实测值的集合。样本:根据随机化的原则从总体中抽取有代表性的部分观察单位,其变量实测值构成样本。 参数(parameter):根据总体变量值统计计算出来的、描述总体特征的统计指标。统计量(statistic):根据样本变量值统计计算出来的、描述样本特征的统计指标。 误差:指测量值和真实值之间的差别 准确度(accuracy) :观察值与真值的接近程度,受系统误差的影响。可靠度(reliability):也称精密度(precision)或重复性(repeatability):是重复观察时观察值与其均值的接近程度,受随机误差的影响。 概率:是描述随机事件发生的可能性大小的一种度量,常用P表示。0≤P≤1 随机事件 P=1 必然事件P=0 不可能事件P≤0.05或P≤0.01为小概率事件 统计工作的基本步骤: 统计设计(研究对象,处理因素,统计分析),搜集资料(任务:遵循统计学原理,按照设计要求,采取必要措施得到准确可靠的原始资料。原则:及时、准确、完整。),整理资料(编码,将数据输入计算机;纠错改错、补漏等;根据研究目的将原始数据进行归纳、分组或计算),分析资料如何对数值变量进行统计描述。1频数表与频数分布图2集中趋势的统计描述3离散趋势的统计描述 相对数的概念包括率、构成比、相对比和动态数列,由于它是两个有联系的指标之比,因而叫作相对数。相对数应用中的注意事项1计算相对数的分母不易过小2防治概念混淆, 分析时不能以构成比代替率3对观察单位不等的几个率,不能直接相加求其平均率。4资料的对比应注意同质5对样本率的比较应遵循随机抽样,要作假设检验。 率:表示在一定条件下,发生某现象的观察单位数与可能发生某现象的观察单位数之比。 构成比表示某一现象内部各组成部分所占的比重或分布。特征1各组成部分的构成比之和为100% 2某一部分构成比增大或减小,必然使其它部分产生相应的变化。注意区别率和构成比虽然两者均为两个指标之比,但意义却完全不同。率反应了某项指标的平均强度或平均水平,它具有数值变量中平均数的含意,构成比表示某一现象内部各组成部分所占的比重或分布,不能反应该现象的平均强度或平均水平。 正态分布的概念若将各直条顶端的中点顺次连接起来,得到一条折线。当样本量n越来越大时,组段越分越细,此时直方渐进直条,这条折线就越来越接近于一条光滑的曲线(见图3.1),我们把这条呈中间高,两边低,左右基本对称的“钟型”曲线称为正态分布曲线,近似于数学上的正态分布(高斯分布; Gauss)。正态分布的特征1.集中性:正态曲线在横轴上方均数处最高2.对称性:以均数为中心,左右对称。3.正态分布的图形由均数和标准差两个参数决定。位置参数μ;变异度参数σ4. 正态分布曲线下的面积分布有一定规律:正态曲线与横轴所夹的面积为1(1.64,1.96,2.58)应用1. 制定医学参考值范围2. 估计频数分布3. 进行质量控制4.正态分布是许多统计方法的理论基础 二项分布在医学研究中,许多观察或试验的可能结果可以归结为二个相互排斥的结果。性质与特征⑴形态取决于π和n:当π接近0.5时,分布对称,π离

几则很有趣的医学统计学故事

几则很有趣的医学统计学故事 医学统计学是一门很奇妙的科学。要说它简单吧,其实也挺简单的,常见的统计方法也就十余种,在教科书上都能找到,只要熟练掌握了,虽不敢夸下海口说可以“以秋风扫落叶的气概横扫四海之内的杂志”,但足以轻车熟路地应付99%的科学研究。要说它复杂吧,也挺复杂的,毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。 很多同行在学习医学统计学时,都在抱怨自己很难走出“一学就会,一会就用,一用就错,一错就懵”的怪圈。究其原因,主要是部分同行学习医学统计学时都抱着一副“依葫芦画瓢”的态度,试图“套用统计学方法”来解决自己面临的问题,而不去仔细思考统计学方法的来龙去脉。本文拟谈几则与医学统计学相关的故事,希望能帮助大家从宏观上正确认识医学统计学这门科学。 1、两个指标诊断疾病的问题 路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。路人甲以A和B 的参考范围上限作为诊断界值,得出了A和B在该界值下对应的诊断敏感性和特异性。结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。 路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A和B的诊断价值。文章的结论到底是想说明A优秀还是B优秀呢?Reject! 这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。 稿件被退了,路人甲有些许郁闷。经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。路人甲很快绘制了ROC 曲线,统计结果表明,A的曲线下面积为0.80,B的曲线下面积为0.82。路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:B的诊断效率是优于A的,其理由就是因为B的曲线下面积大于A。 路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上看,B的曲线下面积高于A,但是导致这种差异的原因有两种,一种是抽样误差,一种是试验效应,即B确实是高于A的。你怎么能确定这不是抽样误差呢?在统计学上,要确定0.82是否高于0.80,就一定要经过统计学检验的。Reject! 这个故事说明:在医学科研中,没有经过统计学检验的结论多半是不科学的。

2018年度医学统计学试卷及其规范标准答案

医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。

生物医学研究的统计学方法_课后习题答案 2014 主编 方积乾

思考与练习参考答案 第1章绪论 一、选择题 1. 研究中的基本单位是指( D)。 A.样本 B. 全部对象C.影响因素 D. 个体 E. 总体 2. 从总体中抽取样本的目的是( B )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例 D. 研究总体统计量E. 计算统计指标 3. 参数是指( B )。 A.参与个体数 B. 描述总体特征的统计指标 C.描述样本特征的统计指标 D. 样本的总和 E. 参与变量数 4. 下列资料属名义变量的是(E)。 A.白细胞计数B.住院天数 C.门急诊就诊人数D.患者的病情分级 E. ABO血型 5.关于随机误差下列不正确的是(C)。 A.受测量精密度限制B.无方向性 C. 也称为偏倚 D.不可避免 E. 增加样本含量可降低其大小 二、名称解释(答案略) 1. 变量与随机变量 2. 同质与变异 3. 总体与样本 4. 参数与统计量 5. 误差 6. 随机事件 7. 频率与概率 三、思考题 1. 生物统计学与其他统计学有什么区别和联系? 答:统计学可细分为数理统计学、经济统计学、生物统计学、卫生统计学、医学统计学等,都是关于数据的学问,是从数据中提取信息、知识的一门科学与艺术。而生物统计学是统计学原理与方法应用于生物学、医学的一门科学,与医学统计学和卫生统计学很相似,其

不同之处在于医学统计学侧重于介绍医学研究中的统计学原理与方法,而卫生统计学更侧重于介绍社会、人群健康研究中的统计学原理与方法。 2. 某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高,并求其平均身高。如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么? 答:不能。因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。即使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。 3. 某地区有10万个7岁发育正常的男孩,为了研究这些7岁发育正常男孩的身高和体重,在该人群中随机抽取200个7岁发育正常的男孩,测量他们的身高和体重,请回答下列问题。 (1) 该研究中的总体是什么? 答:某地区10万个7岁发育正常的男孩。 (2) 该研究中的身高总体均数的意义是什么? 答:身高总体均数的意义是: 10万个7岁发育正常的男孩的平均身高。 (3) 该研究中的体重总体均数的意义是什么? 答:体重总体均数的意义是: 10万个7岁发育正常的男孩的平均体重 (4) 该研究中的总体均数与总体是什么关系? 答:总体均数是反映总体的统计学特征的指标。 (5)该研究中的样本是什么? 答:该研究中的样本是:随机抽取的200个7岁发育正常的男孩。 (宇传华方积乾) 第2章统计描述 思考与练习参考答案 一、最佳选择题 1. 编制频数表时错误的作法是( E )。 A. 用最大值减去最小值求全距 B. 组距常取等组距,一般分为10~15组 C. 第一个组段须包括最小值 D. 最后一个组段须包括最大值

医学期刊统计学错误思考

医学期刊统计学错误思考 本文作者:张巧莲郑玉建单位:新疆医科大学学报编辑部新疆医科大学公共卫生学院 在医学论文写作中,医学统计学方法应用是必不可少的,正确使用能保证科研工作顺利进行,并使科研成果更具有科学性、代表性和可靠性。反之,如果使用不当或者误用,会直接影响研究结果的质量,反而会使读者产生误解,甚至有时会导致错误的结论。近年来,医学统计学方法在医学科研中的应用越来越受到国内广大医学科研工作者的重视,统计分析结果表达已成为医学论文中一个不可缺少的重要组成部分。医学统计学是评价医学科技论文质量优劣的重要依据,然而从近年发表的论文来看,有不少作者对统计方法的使用还不熟悉,实际应用中统计方法滥用、错用和误用的情况时有发生[1]。据国外20世纪60年代到80年代对不同医学期刊发表论文的调查,有统计学错误的论文比例最高者达66%,最低者也有20%[2-4]。国内有学者对5种中华医学会系列杂志论著中统计学方法的应用状况进行了调查,结果显示,1985年统计错误的论文比例为24%,1995年为36%[5]。这些调查研究均说明统计方法误用的严重性以及正确应用的紧迫性。国外从20世纪70年代起就有针对医学论文的科研设计与统计方法应用情况的调查研究,国内学者也进行了相关研究[6]。这种研究有助于及时了解医学科研论文中统计方法的应用质量,发现存在的问题,提高医学科研工作者应用统计方法的水平。笔者总结了近年来已发表的医学科技论文中常见的统计学问题,希望能引起各位专家学者和临床医生

的共识与重视,促进我国医学期刊质量的提高。 1统计设计存在的常见问题 统计设计是整个研究中最重要的一环,是研究工作应遵循的依据。常见的统计设计问题有:忽视组间均衡性,样本缺乏代表性,样本例数不足,未设置对照组,未随机分组,未提出统计分析方法等。针对以上问题,在科研设计中一定要遵循实验设计的四大原则即“随机、对照、均衡、重复”的原则[6]。 1.1不遵循或不重视随机化原则 随机化是科研设计的重要原则,直接影响研究结果的可信度。随机化既要随机抽样,还要随机分组,并有足够的样本量作前提。然而,在医学论文中许多作者对此不够重视,主要表现在论文中统计处理随机化不突出,随机化缺失情况比较常见,有的论文甚至将随机误解为随意、随便,不采用随机化处理方法,导致结果缺乏可靠性。还有些文章中没有提出“随机”抽样的设计与方法,没有排除标准,给人随意选择病例之感,且病例数少,因此没有代表性,所得出的结论不可靠。部分文章虽然注明了“随机”,但未提及采取什么方法进行随机化研究或两组间的例数相差甚远,不符合随机化的一般规律,没有临床参考价值[7]。 1.2缺少对照研究或对照组设计不合理 正确设立对照是临床或实验研究的一个核心问题,设立对照的意义在于说明临床试验或实验研究中干预措施的效应,减少或防止偏倚和机遇产生的误差对试验结果的影响。目前,国内许多期刊发表的论

住院医师培训课程-常用医学科研中的统计学方法1

1、两组数据中的每个变量值减去同一常数后做两个样本均数差异的t检验() *c ? A.t值变小 ? B.t值变大 ? C.t值不变 ? D.t值变小或变大 2、作单组样本均数与一个已知的总体均数比较的t检验时,正确的理解是() *c ? A.A.统计量t越大,说明两总体均数差别越大 ? B.B.统计量t越大,说明两总体均数差别越小 ? C.C.统计量t越大,越有理由认为两总体均数不相等 ? D.D.P值就是αa 3、随机区组设计的方差分析用于() * ? A.多个样本均数间的两两比较 ? B.比较各个区组间的样本均数有无差别 ? C.比较各个区组间的总体均数有无差别 ? D.比较各个处理组间的样本均数有无差别 4、各组数据方差不齐时,可以做() *D ? A.近似检验 ? B.秩和检验 ? C.数据转换 ? D.ABC均可 5、第I类错误的概念是() *D ? A.H0是不对的,统计检验结果未拒绝H0 ? B.H0是对的,统计检验的结果未拒绝H0 ? C.H0是不对的,统计检验结果拒绝H0 ?

6、下列哪种说法是错误的() *B ? A.计算相对数尤其是率时应有足够数量的观察单位数或观察次数 ? B.分析大样本数据时可以构成代替率 ? C.应分别将分子和分母合计求合计率或平均率 ? D.相对数的比较应注意其可比性 7、配对计量资料进行假设检验时() *Dd ? A.仅能用配对t检验 ? B.仅能用成组t检验 ? C.仅能用随机区组设计的方差分析 ? D.用配比t检验和随机区组设计的方差分析均可 8、方差分析的前提条件是() *A ? A.计量资料非参数统计的 ? B.正态性 ? C.随机性 ? D.方差齐性 9、设配对设计资料的变量为X1与X2,则配对设计的符号的秩检验() *B ? A.把X1与X2的差数军队之从小到大编秩,排好后秩次保持原差数的正负号 ? B.把X1与X2的差数绝对值从小到大编秩,秩次不保存正负号 ? C.把X1与X2综合按绝对值从小到大编秩 ? D.把X1与X2的差数从小到大编秩 10、对于配对t检验和成组t检验,下列哪一种说法是错误的() *B ? A.对于配对设计资料应作配对t检验,如果作成组t检验,不但不合理,而且平均起来统计效率降低 ? B.成组设计的资料用配对t检验,不但合理,而且平均起来可以提高统计效率 ? C.成组设计的资料,无法用配对t配对t检验 ?

生物医学论文中统计结果的表达及解释

生物医学论文中统计结果的表达及解释 【摘要】统计学是生物医学研究所必需的重要手段, 生物医学研究的实验设计、资料收集、数据处理分析以及结论都离不开统计学应用。生物医学研究论文主要由摘要、引言、材料与方法、结果和讨论5个部分组成, 各个部分都涉及统计结果的表达和解释, 统计学是专业结论成立与否的重要依据。统计学应用不当不仅影响论文的科学性, 还有可能得出错误的专业结论。 【关键词】统计学科研论文统计分析统计表达 近年来, 统计学在生物医学科研中的应用越来越受到重视, 统计分析结果的表达及解 释已成为医学科研论文中不可缺少的重要组成部分。除论文涉及的专业(如细胞与分子免疫学杂志为免疫学专业)和表述的文字2个方面外, 统计学是评价论文质量优劣的重要依据, 然而国内生物医学论文中统计学应用仍存在着较为严重的问题[1-4], 如2003年某大学学报拟发表论著中统计方法误用率为57%[3]。细胞与分子免疫学杂志虽然在国内生物医学系列杂志中具有较高的学术地位[5], 但拟发表及刊出论文在科研设计、统计学分析、结果解释等方面也不同程度地存在一些问题, 作者的统计学应用水平有待进一步提高。许多生物医学杂志, 如国外著名杂志JAMA、新英格兰医学杂志(NEJM)和英国医学杂志(BMJ)等, 以及国内中华医学会系列杂志及细胞与分子免疫学杂志等, 对来稿都有统计学表达的基本要 求或统计学指导原则。国际生物医学杂志编辑协会在其《生物医学期刊投稿的统一要求》中也包含了统计学表达的基本要求。生物医学研究性论文主要由摘要、引言、材料与方法、结果和讨论5个部分组成, 各个部分或多或少都涉及到统计结果的表达和解释问题。例如在论文的“引言”部分需要给出文献复习的综合结果, 如文献报告的组间差别及P值等。其他重要的统计表达和解释主要集中在论文的“摘要”、“材料和方法”、“结果”及“讨论”4个部分[6]。 1 摘要 “摘要”中要有表示研究结果的重要统计指标(统计量)的数值、可信区间及假设检验结果(P值)。如处理组和对照组的均数(中位数)、标准差(标准误)、率、P值, 或2组均数(率)之差、95%可信区间、OR值及多个观察指标的相关系数等。这些数据是循证医学Meta分析的基本依据。 2 材料和方法 “材料和方法”中的统计学描述包括以下两个方面。 2.1 描述研究设计的内容内容包括研究类型、观察对象类型、入选和剔除标准、观察方法和测量技术以及实验、试验或调查资料的搜集过程等。尤其应具体地描述研究对象的来源和选择方法(如是否配对、随机抽样), 包括观察对象的基本情况、有无随机分组(随机抽样)、随机化分组方法、样本含量及其估计的依据等。对于非随机化分组的观察性研究(含调查研究), 还应给出影响因素(如年龄、性别、病情)的均衡性分析结果。对于临床试验, 还需要特别说明诊断标准、疗效评价标准、病例入选标准、病例剔除标准、依从性如何、

常用医学科研中的统计学方法(1)

正确答案错误答案 1.从同一总体抽样,则样本标准差() A随着样本含量增大而增大 B样本含量增大而标准差不变 C随着样本含量减少而减少 D随着样本含量增大而减小 2.用图表示某地区近30年三种疾病的发病率,在各年度的动态发展速度情况,宜绘制() A普通线性图 B.直方图 C.百分条图 D.半对数线图。 3.均数与标准误的关系() A.均数越大,标准误越大 B.均数越大,标准误越小 C标准误越小,用均数推测总体均数的可靠性越大。 E标准误越大,用均数推测总体均数的可靠性越大。 4.多重线性回归分析中,度量一组自变量与应变量线性相关程度的统计量是() A.负相关系数 B.决定系数 C.偏相关系数 D.偏回归系数 5.变异系数cv的数值() A.一定大于1 B.一定小于1 C.可以大于1,也可以小于1 D.一定小于标准差。 6.在样本量为n,自变量个数为3的线性回归方程的假设检验中,回归变异和剩余变异的

自由度分别为() A. 3和n-3 B. 3和n-4 C. 2和n-2 D. 2和n-3 7.比较某地区解放以来三种病的发病率在各个年度的发展速度,应该绘制() A.半对数线图 B.圆图 C.直方图 D.普通线图 8.在同一总体中随机抽取多个样本,用样本均数估计总体均数95%的可信区间,则估计精 密度高的是() A.均数小的样本 B.标准差小的样本 C.标准误大的样本 D.标准误小的样本 9.均数的标准误反映了() A.个体的变异程度 B.集中趋势的位置 C.指标的分布规律 D.样本均数与总体均数的差异 10.由样本均数估计总体均数可靠性大小的指标是() A.标准差 B.标准误 C.方差 D.变异系数 11.表示血清抗体滴度资料平均水平最常用的指标是()

医学统计学练习

1.假设检验在设计时应确定的是 A.总体参数B.检验统计量C.检验水准 D.P值E.以上均不是 2.如果t≥2,υ,,可以认为在检验水准α=处。 A.两个总体均数不同B.两个总体均数相同C.两个样本均数不同D.两个样本均数相同E.样本均数与总体均数相同 3. 计量资料配对t检验的无效假设(双侧检验)可写为。 A.μd=0 B.μd≠0 C.μ1=μ2 D.μ1≠μ2E.μ=μ0 4.两样本均数比较的t检验的适用条件是。 A.数值变量资料B.资料服从正态分布C.两总体方差相等 D.以上ABC都不对E.以上ABC都对 5.在比较两组资料的均数时,需要进行t/检验的情况是: A.两总体均数不等B.两总体均数相等C.两总体方差不等D.两总体方差相等E.以上都不是 6.有两个独立的随机样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度为。 A.n1+n2 B.n1+n2-1 C.n1+n2+1 D.n1+n2-2 E.n1+n2+2 7. 已知某地正常人某定量指标的总体均值μ0=5,今随机测得该地特殊人群中的30人该指标的数值。若用t检验推断该特殊人群该指标的总体均值μ与μ0之间是否有差别,则自由度为。 A.5 B.28 C.29 D.4 E.30 8. 两大样本均数比较,推断μ1=μ2是否成立,可用。 A.t检验B.u检验C.方差分析 D.ABC均可以E.χ2检验 9.关于假设检验,下列说法中正确的是 A.单侧检验优于双侧检验 B.采用配对t检验还是成组t检验由实验设计方法决定

C.检验结果若P值大于,则接受H0犯错误的可能性很小 D.用Z检验进行两样本总体均数比较时,要求方差齐性 E.由于配对t检验的效率高于成组t检验,因此最好都用配对t检验 10. 为研究新旧两种仪器测量血生化指标的差异,分别用这两台仪器测量同一批样品,则统计检验方法应用。 A.成组设计t检验B.成组设计u检验C.配对设计t检验 D.配对设计u检验E.配对设计χ2检验 11. 阅读文献时,当P=,按α=水准作出拒绝H0,接受H1的结论时,下列说法正确的是。A.应计算检验效能,以防止假“阴性”结果 B.应计算检验效能,检查样本含量是否足够 C.不必计算检验效能D.可能犯Ⅱ型错误 E.推断正确的概率为1-β 12.两样本均数假设检验的目的是判断 A. 两样本均数是否相等B. 两样本均数的差别有多大 C.两总体均数是否相等D. 两总体均数的差别有多大 E. 两总体均数与样本均数的差别有多大 13.若总例数相同,则成组资料的t检验与配对资料的t检验相比: A.成组t检验的效率高些B.配对t检验的效率高些 C.两者效率相等D.两者效率相差不大E.两者效率不可比 15. 两个总体均数比较的t的检验,计算得t>2,n1+n2-2时,可以认为。 A.反复随机抽样时,出现这种大小差异的可能性大于 B.这种差异由随机抽样误差所致的可能性小于 C.接受H0,但判断错误的可能性小于 D.拒绝H0,但犯第一类错误的概率小于 E.拒绝H0,但判断错误的概率未知 16. 为研究两种仪器测量血生化指标的差异,分别用这两台仪器测量同一批血样,则统计检验方法应用。 A.配对设计t检验B.成组设计u检验C.成组设计t检验 D.配对设计u检验E.配对设计χ2检验 17. 在两组资料的t检验中,结果为P<,差别有统计学意义,P愈小,则: 。

医学统计学课后习题全

第一章:单选题 (5/5 分数) 1.统计学中所说的样本是指()。 .随意抽取的总体中任意部分.有意识的选择总体中的典型部分.依照研究者要求选取总体中有意义的一部分.依照随机原则抽取总体中有代表性的一部分.依照随机原则抽取总体中有代表性的一部分 - 正确 . 有目的的选择总体中的典型部分 2.下列资料属等级资料的是()。 .白细胞计数.住院天数.门急诊就诊人数.病人的病情分级.病人的病情分级 - 正确 . ABO血型分类 3.为了估计某年华北地区家庭年医疗费用的平均支出,从华北地区的5个城市随机抽样调查了1500户家庭,他们的平均年医疗费用支出是 997元,标准差是 391 元。该研究中研究者感兴趣的总体是() .华北地区1500户家庭.华北地区的5个城市.华北地区1500户家庭的年医疗费用.华北地区所有家庭的年医疗费用.华北地区所有家庭的年医疗费用 - 正确 . 全国所有家庭的年医疗费用 4.欲了解研究人群中原发性高血压病(EH)的患病情况,某研究者调查了1043人,获得了文化程度(高中及以下、大学及以上)、高血压家族史(有、无)、月人均收入(元)、吸烟(不吸、偶尔吸、经常吸、每天)、饮酒(不饮、偶尔饮、经常饮、每天)、打鼾(不打鼾、打鼾)、脉压差(mmHg)、心率(次/分)等指标信息。则构成计数资料的指标有()

.文化程度、高血压家族史吸烟、饮酒、打鼾.月人均收入、脉压差、心率.文化程度、高血压家族史、打鼾.文化程度、高血压家族史、打鼾 - 正确.吸烟、饮酒 . 高血压家族史吸烟、饮酒、打鼾 5.总体是指() .全部研究对象.全部研究对象中抽取的一部分.全部样本.全部研究指标 . 全部同质研究对象的某个变量的值-正确 第二章- 单选题 (10/10 分数) 1.描述一组偏态分布资料的变异度,以()指标较好。 . 全距 . 标准差 . 变异系数 . 四分位数间距 . 四分位数间距 - 正确.方差 2.用均数和标准差可以全面描述()资料的特征。 . 正偏态分布 . 负偏态分布 . 正态分布 . 正态分布 - 正确 . 对称分布.对数正态分布 3.各观察值均加(或减)同一数后()。 . 均数不变 . 几何均数不变 . 中位数不变 . 标准差不变 . 标准差不变 - 正确.变异系数不变 4.比较某地1~2岁和5~5.5岁儿童身高的变异程度,宜用()。

生物医学研究统计方法 第12章 实验设计思考与练习参考答案

第12章实验设计 思考与练习参考答案 一、最佳选择题 1. 处理因素作用于受试对象的反映须通过观察指标来表达,则选择指标的依据具有( E )。 A.客观性 B. 特异性 C. 敏感性 D. 特异性和敏感性 E. A与D 2. 以前的许多研究表明,血清三酰甘油的含量与冠心病危险性有关,即三酰甘油的含量越高,患冠心病的危险性就越大,有的医生以此筛选危险人群。后来的研究表明,冠心病还与其他因素有关,特别是血清中高含量胆固醇和低含量的高密度脂蛋白,它们常与冠心病同时发生联系,采用严格的实验设计平衡了其他因素的作用后,发现三酰甘油的含量与冠心病发病的危险性之间的联系就不复存在了。这是以下选项中的(B)选项把握得较好所致。 A. 重复实验次数较多 B.均衡性原则考虑得周到 C.用多因素设计取代单因素设计 D.提高实验人员的技术水平 E.严格按随机化原则进行分组 3. 实验共设4个组,每组动物数均为4只,在4个不同的时间点上对每只犬都进行了观测,资料概要列于教材表12-7中,此资料取自(B)。(注:B100 mg代表用B药的剂量) 教材表12-7 Beagle犬受6.5 Gy不均匀γ射线照射再用B药后外周血白细胞总数的结果━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━时间白细胞总数(S X ,×109/L) ─────────────────────────────────────── /天照射对照照射+B100 mg 照射+阳性对照药照射+B100 mg+阳性对照药────────────────────────────────────────────照射前 14.30±3.77 14.70±2.83 14.08±1.60 13.98±1.37 照射后: 6 3.68±0.82 4.26±1.40 5.28±1.52 6.90±0.97 12 7.23±0.83 7.44±1.10 8.75±1.02 10.53±1.57 18 6.87±1.50 9.26±1.36 9.87±1.23 12.78±1.83 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ A. 具有一个重复测量的两因素 B.具有一个重复测量的三因素设计 C.两因素析因设计 D. 三因素析因设计 E.交叉设计 4. 已知A、B、C都是三水平因素,且根据预试验结果得知,三个因素之间的各级交互作用都很重要,需要考察。好在这个实验作起来比较方便,需要的费用和时间都比较少。最好选用(A)。 A.析因设计B. 交叉设计C. 随机区组设计 D. 配对设计 E. 单因素三水平设计

相关主题
文本预览
相关文档 最新文档