医学论文写作指导之统计学问题全攻略
- 格式:docx
- 大小:15.87 KB
- 文档页数:2
论文撰写中常见的统计学问题及其处理【摘要】统计学在论文撰写中扮演着至关重要的角色,它影响着论文的质量和可信度。
在撰写论文过程中常见的统计学问题包括样本量的确定、数据处理方法的选择、结果的解释和呈现,以及如何避免常见的统计学错误。
解决这些问题需要早期咨询统计学专家,并且重视统计学在论文中的作用和意义。
只有正确处理统计学问题,才能确保论文的科学性和准确性。
建议学者们在撰写论文前要深入了解统计学知识,提前咨询专家,以确保论文的统计学部分能够科学可靠地支撑研究结论。
【关键词】统计学、论文撰写、样本量、数据处理、分析方法、结果解释、统计学错误、解决方法、重视意义、咨询专家。
1. 引言1.1 统计学在论文撰写中的重要性统计学在论文撰写中扮演着至关重要的角色。
论文的质量很大程度上取决于统计学的严谨性和正确性。
统计学能够帮助研究者从大量的数据中提取有效信息,得出科学的结论,并验证假设和研究问题。
在论文中,统计学的应用不仅可以帮助读者更好地理解研究结果,还能提高研究的可信度和说服力。
统计学在论文撰写中的重要性体现在几个方面。
通过统计学分析,研究者可以对研究问题进行量化和定量的描述,使研究结论更加客观和可靠。
统计学可以帮助研究者有效地处理大量的数据,提取有用信息,并进行数据的比较和推导。
统计学还可以帮助研究者发现数据中的规律性和趋势,从而指导下一步的研究方向和决策。
1.2 统计学问题对论文质量的影响统计学问题对论文质量的影响非常重要,因为统计学是对数据进行收集、分析和解释的科学方法。
如果在论文撰写过程中出现统计学问题,可能会导致以下几个方面的影响:统计学问题可能导致数据分析结果不准确或者失真。
如果数据的收集、处理以及分析方法不正确,很可能会得出不准确的结论,从而影响论文的科学性和可信度。
选择错误的统计分析方法或者忽略样本量的影响都可能导致数据分析结果产生偏差。
统计学问题可能导致结论的不可靠性。
统计学问题可能使得对数据结果的解释产生误导或者错误的理解,从而影响读者对论文的信服度。
文章编号:1005-619X (2021)02-0223-02D O I 编码:10.13517/m .2021.02.042作者单位:066104应急管理部北戴河康复院中国疗养医学编辑部通信作者:丛乃霞医学论文中常见的统计学问题分析及对策丛乃霞陈颂医学统计学在医学科学研究中应用比较广泛。
在文献研究设计、实验观察、数据收集、资料分析、结果表达与解释、论文写作和发表等环节无不涉及统计学问题。
如果统计学内容出了差错,就会造成实验设计不合理、实验方法错误、数据错误,导致结果和结论出现偏差等严重问题,因此,医学论文正确运用统计学是保证科学研究可信度的关键,也是确保医学论文质量的关键[1-2]。
程亮星发现[3],《肿瘤基础与临床》编辑部修回稿件的直观性统计学差错分析中,796篇修回稿件,直观性统计学差错率为85.93%。
郝丽洁等[4]发现,某医学期刊413篇论文中,255篇存在统计学差错问题,发生率为61.74%。
汪媛等[5]发现,24种肿瘤学期刊中,18种期刊在论文报告值时出现了值的误用情况,占75.00%。
近几年,作者和编辑越来越重视统计学问题,但从作者投稿和出刊情况来看,统计学差错问题依然很多。
本文通过整理常见问题加以分析,希望引起作者和编辑的重视,减少统计学常见差错问题。
1一般资料和方法在《中国疗养医学》杂志稿件库中,随机抽取某一年100篇连续编号的文章,其中有3篇文章未涉及统计学内容,97篇文章纳入统计学分析,通过直观审核和SPSS 26.0软件统计分析判断正误。
2结果通过对97篇文章的审核,发现统计学问题比较突出,主要表现在5个方面,见表1。
3统计学问题分析3.1统计学方法描述不全面统计学方法描述过于简单和笼统,不能很好地解释和概况研究方法,编辑人员也无法审核研究方法的正误,统计学方法应写的具体和详细。
比如,对于计量资料,只写采用检验,没有写清楚具体采用了何种检验,因为检验包括单样本检验、独立样本检验和配对样本检验。
论文撰写中常见的统计学问题及其处理统计学作为一门学科,旨在通过收集、处理、分析和解释数据来描述和预测事物之间的关系。
然而,在撰写论文时,研究者常常遇到一些常见的统计学问题。
以下我将介绍几个常见的问题,并讨论它们的处理方法。
首先,一个常见的问题是样本选择偏倚。
在研究中,研究者可能无意中选择了特定类型的样本,而不是随机选择。
这可能导致结果不准确或不具有代表性。
为了解决这个问题,研究者可以使用随机抽样技术来选择样本,确保样本具有代表性。
此外,还可以通过与全体人口进行比较来验证样本的代表性。
第二个问题是样本容量太小。
如果样本容量太小,研究结果可能不具备统计显著性。
为了解决这个问题,研究者可以使用统计学方法来计算所需的样本大小,以达到一定的置信度和效应大小。
此外,研究者还可以通过增加样本容量来提高统计显著性。
第三个问题是数据的缺失。
在研究中,数据可能由于各种原因而缺失,例如受访者未完全回答问题或由于设备故障而丢失。
为了解决这个问题,研究者可以使用适当的数据插补方法来填充缺失值。
有一些常用的插补方法,例如最大似然估计、多重插补和概率插补。
第四个问题是多重比较。
当研究者进行多个统计检验时,他们可能会遇到多重比较问题。
多重比较可能导致假阳性错误的增加。
为了解决这个问题,研究者可以使用适当的校正方法,如Bonferroni校正、False Discovery Rate校正或Benjamini-Hochberg过程来调整p值。
最后,一个常见的问题是相关性与因果性之间的混淆。
在统计学中,相关性仅仅描述了两个变量之间的关系,并不表示因果关系。
在撰写论文时,研究者应该小心使用正确的表述,避免将相关性误解为因果关系。
此外,如果研究目的是探讨因果关系,研究者可以使用其他设计,如实验设计或断点回归设计。
总的来说,统计学在撰写论文时常常涉及一些常见的问题。
通过正确处理样本选择偏倚、样本容量不足、数据缺失、多重比较和相关性与因果性之间的混淆等问题,研究者可以确保研究结果准确可靠,并为科学研究做出贡献。
医学论文中的统计学问题一项科研能否取得有价值的成果,一篇论文学术水平的高低,很大程度上得取决于实验设计的水平。
周密的科研设计是科学实验过程的依据,对实验数据进行合理的统计学处理是提高科研质量的必要手段。
随着现代科学的发展,特别是医学统计学、生物医学工程学和电子计算机在医学科研中的应用,广大临床工作者越来越有必要更多地熟悉一些数理统计知识,以便获得可靠的资料,从而得出正确的结论。
全国不少医学期刊,从七十年代以来对这个问题日益引起广泛注意。
为了让临床医务工作者在科研和写作、评阅论文中,对实验设计与数据统计问题引起足够重视,笔者近几年来学习国内医学、生物学期刊中见到的一些统计学问题,略加讨论。
临床疗效观察的实验设计问题:在各种医学期刊中,半数以上是疗效观察方面的论著。
现择其较普遍存在的统计学问题,结合实验设计基本原则加以讨论。
(一)对照与均衡性测定国内医学期刊有关临床疗效观察的文章甚多,不少杂志刊登了一些事先未设计对照的文章,其结论难以令人信服。
如《用柴葛解肌汤治疗上呼吸感染》一文,报道治愈好转率为97.7%,因无对照,无法断定其效果如何,因此,治愈好转率中含有假像。
对照的方法虽有多种,但对照的基本原则是与实验组齐同可比,最好作均衡性测定。
(二)安慰剂与盲法试验安慰剂与盲法试验是医研(主要是比较性研究)中常用的科研方法,结果准确、误差性小。
安慰剂在形、量、色、味等要与实验药物一样,不能给受试者和执行者任何暗示。
这种试验就是双盲法试验。
但近年来,尚有人用改良的双盲法,此法分两期:第一期(公开期)试验有效者留,无效者弃。
有效者进入第二期(双盲试验),以确定疗效是否系安慰剂的作用。
在预防效果观察时可采用该法,临床上应用诸多困难,应视具体情况而定。
(三)样本含量与重复原则没有足够样本的研究结果,是经不起重复试验的,有的论文凭少数病例观实的结果下结论,是不慎重的。
如《重症肺炎并发DIC29例》一文,作者观察脑型患者3例,其中死亡一例,就得出一般脑型病死率高达57%,本组脑型病死率较低,看来及早用肝素阻断DIC过程,对降低脑型病死率可能具有重要意义的结论。
论文撰写中常见的统计学问题及其处理据不完全统计,在难以发表的、已凝聚着作者心血并花费较长时间与较大财力撰写的研究论文中,约半数以上是由于统计错误致其结果与原文主要结论相违背。
如一文采用某新药引产,96例足月孕妇的产后出血与新生儿低Apgar评分率均为2.1%(各2例),明显低于应用原药引产的19例,其产后出血与新生儿低Apgar评分发生率均为15.8%(各3例,χ2=7.164,P<0.001)。
故认为采用新药引产是一更安全的措施。
原药引产组例数偏少暂且不谈,该资料比较应采用精确法分析,结果是与原结果恰恰相反(P>0.05),这样上述的主要结论就欠可靠而难以发表,否则论文可起误导作用。
类似问题文稿中还常有出现。
现就文稿中常见的统计问题及其相应的处理方法简述如下。
一、常用的统计术语统计学中常用的概念有总体与样本、随机化与概率、计量与计数、等级资料及正态与偏态分布资料、标准差与标准误等。
如某研究采用经会阴途径测定宫颈长度,以探讨不同宫颈长度与临产时间的关系。
结果显示35例宫颈长度为25~34mm者与32例宫颈长为15~24mm者临产时间的均值±标准差(x±s)各为57.6±58.1与47.3±49.1小时。
该计量资料,经t检验显示t=0.780,P>0.05,并未提示不同宫颈长度的临产时间差异有显著意义;从标准差大于均值,显示各变量值离散程度大,呈偏态分布,故不能采用x±s这一算术均数法计算均数。
经偏态转换成近似正态分布资料后结果是:35例与32例的临产时间各为34.5±4.1与26.7±4.1小时,(t=7.778,P<0.001),两组差异有极显著意义。
可认为随着宫颈长度的缩短、临产时间也缩短。
此外,当两组资料单位不同时,其S单位也不同;即使两组单位相同的变量值,若其均数差异较大,也都应以变异系数替代s来比较两组值的离散度的大小。
医学科技论文常见统计学问题分析摘要:针对医学科技论文中常见统计学问题以及稿件退修和编辑加工过程中遇到的共性的统计学问题进行分析,并提出可能避免统计学方面错误的方法及建议,便于科研人员撰写论文时学习借鉴,也为医学期刊编辑处理类似稿件提供参考。
关键词:统计学;医学;科研;论文;问题1描述性分析时存在的统计学问题2统计分析方法不满足假设条件2.1不满足参数检验的数据采用了参数检验方法2.2不满足卡方检验条件的数据采用了卡方检验2.3不满足线性回归条件的数据采用了线性回归分析线性回归模型的前提条件包括线性、独立性、正态性和方差齐性。
其中,线性是指因变量的总体平均值与自变量呈线性关系。
可以通过绘制散点图判断回归关系是否成立[11]。
独立性是指任意2条记录互相独立。
正态性是指模型的误差项需服从正态分布(等价于当自变量某为定值时因变量Y也呈正态分布),而在样本量较大时可以忽略正态性要求。
方差齐性是指在自变量某的取值范围内,不论某取什么值,Y都具有相同的方差,等价于残差的方差齐性。
需要注意的是,线性、正态性和方差齐性通常通过绘制散点图或正态概率图等即可快速判断,但独立性往往容易被研究人员忽视,即纳入分析的研究对象不应有多条记录,如果有部分研究对象有多条记录,则应只保留一条记录,否则不能采用线性回归模型进行分析,只能改用混合效应模型进行分析。
同时,还需注意,如果是多因素回归分析,则上述线性、正态性和方差齐性的条件应在各变量和因变量之间均得以满足。
3结果阐释时存在的问题3.1受制于P值,未按常用界值对数据进行划分在进行多元回归分析之前,比较可取的是先进行单因素回归分析。
如某单因素为连续型变量,且已知其为结局变量的危险因素可能性较大,若将其直接纳入模型进行单因素回归分析,则可能发现其回归系数β无统计学意义(P>0.05),这时某些研究者可能会采用将连续型变量分类的方式以获得较好结果,可能为得到较小的P值而未采用常用的有意义界值进行划分,如在研究血压对某种慢性病的影响时,未按照临床定义的高血压界定值对血压值进行分类,而是以在数据分析时获得最小P值为目标取最佳截断值进行分析,这种方法会使结果产生较大偏倚。
医学论文中统计学处理常见问题及应对措施1存在问题1)统计软件名称和版本不全。
最常见的问题是作者只写统计软件名称而漏掉了统计软件版本。
2)统计数据描述含糊不清。
如笼统说“用-x±s 表示”,而不分定量资料或定性资料。
3)误用统计学方法并且统计方法描述不详细。
例如:对定量资料盲目套用t检验,多组均数比较没有采用方差分析和q检验;对定性资料,盲目套用χ2检验;非参数检验资料没有采用秩和检验或Ridit检验; 对回归分析没有结合专业知识和散点图选用合适的回归类型,而盲目套用简单直线回归分析;在逻辑上无明显相关的2个或2个以上指标检测结果勉强进行相关性分析等;对随访资料没有使用生存分析等。
另一个问题是统计学方法的描述不详细。
例如: 使用t检验,没有说明是完全随机设计资料的t检验, 还是配对设计资料的t检验;使用方差分析时,没有说明是完全随机设计资料的方差分析,还是随机区组设计资料的方差分析,或是巢式设计资料的方差分析;对于四格表资料,没有交代是一般四格表资料χ2检验, 还是四格表资料的校正的χ2检验。
4)假设检验结果的表达和解释中存在的问题。
假设检验的结果表达没有根据不同的统计分析方法, 给出相应的检验统计量的实际值及相应的值,如t检验的t值、方差分析的F值、卡方检验的χ2值、相关分析的相关系数及相应的r值等。
此外,统计结果的解释存在如下问题:假设检验是在“无效假设”正确(比如2种药物的疗效没有差异) 的前提下,用P值大小说明实际观察结果是否符合“无效假设”。
P值小(如P<0·05或P<0. 01)则怀疑“无效假设”的正确性,应得2种药物疗效的差异有统计学意义或差异有高度统计学意义的结论,而不应得差异显著或差异非常显著的结论;P值大(如P> 0·05),则不能拒绝“无效假设”,应得2种药物疗效的差异无统计学意义的结论,而不应得无差异的结论。
这是典型地把统计结论作为专业结论而犯的错误。
医学论文中材料和方法部分应注意的统计学问题医学论文的正文中,“材料和方法”作为重要组成部分,医学统计学的应用贯穿于其中,作者投稿后,期刊编辑会对该部分内容中的统计学问题分别进行审查,一旦发现统计学错误,稿件就会被退回。
因此,为避免因为该部分统计学问题被退稿,医刊汇编译认为,作者应在论文撰写时,注意论文“材料和方法”部分内容中常出现的统计学问题,特别是对稿件退修中编辑提出的统计学方法修改意见要引起足够的重视。
医学论文中所涉及的统计学方法,通常会在“材料和方法”中作为一个比较独立的部分予以专门介绍,这部分应该包括统计软件的介绍、数据表达方式的介绍、检验方法的交代和检验水准的设定等至少四方面的内容。
除了有些论文中会遗漏全部或部分这方面内容外,其他常见的问题还有以下几个:1.统计软件介绍中没有提及版本。
版本是软件名称的组成部分,版本不同,软件就不同,如SPSS统计软件就有十几种版本,所以在介绍统计软件时不能缺少版本的介绍。
2.对数据表达方式的描述比较笼统,没有对定量资料和定性资料的数据表达方式分别予以介绍。
不同的资料类型,其数据表达方式不同,如正态分布的定量资料应该用均数±标准差来表示,偏态分布的定量资料用中位数和四分位间距表示,定性资料应该用比、构成比和率来表示,对于不同类型数据的表达方式均应分别予以说明。
3.检验方法交代得不够全面。
t检验和卡方检验是研究中经常用到的统计方法,作者一般会予以交代,但仔细审查文中的“结果”部分时,发现作者还用了其他检验方法,如相关分析、回归分析等,但在统计学方法中却往往没有交代,另外t检验还分为两独立样本的t 检验、配对t检验等,卡方检验还分为四格表卡方检验、R×C表卡方检验、配对卡方检验等,均应明确而具体地予以说明。
4.检验水准α不作介绍。
α值是预先规定的判断小概率事件的概率尺度,不同的研究目的,α值设定的大小不同,所以应该介绍本研究所采用的α值,并明确是双侧检验还是单侧检验。
医学论文写作指导之统计学问题全攻略
在核心期刊越来越多的成为发刊主流的当前,统计学分析便成为论文写作的一个不可避免的部分。
然而根据小编多年与作者沟通的经验,对于大多数医生而言,统计学分析是难点,是障碍。
本期,创新医学网为了让医生朋友们在科研和写作、评阅论文中,对实验设计与数据统计问题引起足够重视,学习国内医学、生物学期刊中见到的一些统计学问题,略加讨论。
临床疗效观察的实验设计问题
在各种医学期刊中,半数以上是疗效观察方面的论著。
现择其较普遍存在的统计学问题,结合实验设计基本原则加以讨论。
(一)对照与均衡性测定
国内医学期刊有关临床疗效观察的文章甚多,不少杂志刊登了一些事先未设计对照的文章,其结论难以令人信服。
如《用柴葛解肌汤治疗上呼吸感染》一文,报道治愈好转率为97.7%,因无对照,无法断定其效果如何,因此,治愈好转率中含有假像。
对照的方法虽有多种,但对照的基本原则是与实验组齐同可比,最好作均衡性测定。
(二)安慰剂与盲法试验
安慰剂与盲法试验是医研(主要是比较性研究)中常用的科研方法,结果准确、误差性小。
安慰剂在形、量、色、味等要与实验药物一样,不能给受试者和执行者任何暗示。
这种试验就是双盲法试验。
但近年来,尚有人用改良的双盲法,此法分两期:第一期(公开期)试验有效者留,无效者弃。
有效者进入第二期(双盲试验),以确定疗效是否系安慰剂的作用。
在预防效果观察时可采用该法,临床上应用诸多困难,应视具体情况而定。
(三)样本含量与重复原则
没有足够样本的研究结果,是经不起重复试验的,有的论文凭少数病例观实的结果下结论,是不慎重的。
如《重症肺炎并发DIC29例》一文,作者观察脑型患者3例,其中死亡一例,就得出“一般脑型病死率高达57%,本组脑型病死率较低,看来及早用肝素阻断DIC过程,对降低脑型病死率可能具有重要意义”的结论。
因无对照,结论不可靠。
(四)随机分组与实验设计类型
随机化分组即每个实验对象有同等机会被抽样(分配)到各组去,而不受任何系统因素的影响。
常用的实验设计类型有完全随机设计、自身对照设计、交义设计、配偶设计、随机区组设计、拉丁方设计、正文(析因)设计、序贯设计、半数效量实验设计(动物试验),回顾性与前赡性调查研究设计等。
科研设计时应根据研究目的要求选择不同类型的实验设计方法,进行相应的统计处理。
(五)诊断与疗效标准——指标设计问题
观察对象应确诊无疑,事先要制订好诊断标准,保证样本的真实性与代表性。
疗效判断要有科学的指标,有特异性和定量指标更好。
研究记录表格扣记录要完整统一,仪器、试有等要核校,人员要相对稳定,操作及观察方法要严格执行统一标准。