统计学不得不说的二三事
- 格式:doc
- 大小:17.15 KB
- 文档页数:8
统计学关我什么事读后感以前我觉得统计学是那种离我特别遥远的东西,就像天上的星星,看得见却摸不着。
可是这本书让我发现,统计学就在我们身边呢。
就拿我们班的考试成绩来说吧。
每次考完试,老师都会统计分数。
老师会算出平均分,这个平均分就是一种统计的结果呀。
老师通过这个平均分就能知道我们整体学得怎么样。
如果平均分很高,说明大家都学得不错;要是平均分低了,那可能就是有很多地方大家没掌握好。
这就像书里说的,统计能让我们快速了解一群事物的大致情况。
还有我们学校的运动会。
在比赛的时候,要统计每个项目有多少人参加。
比如说跑步比赛,有短跑、长跑,不同的距离参加的人数不一样。
学校会根据这些统计的人数来安排比赛的场次、时间什么的。
要是不统计,那运动会肯定会乱成一团。
这就像我们整理自己的小玩具一样,要先知道有多少个,才能更好地摆放它们。
在生活里,我和爸爸妈妈去超市买东西也有统计学的影子。
超市里会统计哪种商品卖得好,哪种卖得不好。
卖得好的商品就会多进货,放在显眼的位置。
就像我最爱吃的薯片,每次去超市都能在很容易看到的地方找到它。
这是因为超市统计了很多顾客的购买情况,知道像我这样喜欢吃薯片的小朋友很多呢。
从这本书里我还知道,统计能帮助我们做选择。
就像我们小组做活动的时候,要决定去哪里玩。
我们可以统计一下大家想去的地方,哪个地方被选的次数最多,我们就去哪里。
这样大家都能玩得开心。
读完这本书,我再也不觉得统计学和我没关系了。
它就像一个隐藏在生活各个角落的小助手,默默地帮助我们把事情做得更好。
我现在看周围的事情都会想到统计学呢,感觉自己变得更聪明了,能发现好多以前没注意到的有趣的事情。
我希望更多的小伙伴也能了解统计学,因为它真的很有用。
统计学知识点总结好嘞,以下是为您总结的统计学知识点,希望能对您有所帮助!咱们先来说说啥是统计学。
统计学呀,简单来说,就是一门研究如何收集、整理、分析和解释数据的学问。
它就像是一个神奇的工具,能帮我们从一堆看似杂乱无章的数据中找出有用的信息和规律。
比如说,咱们去超市买东西,收银员会记录每种商品的销售数量和金额,这其实就是在收集数据。
然后超市经理会把这些数据整理起来,看看哪些商品卖得好,哪些卖得不好,这就是整理数据。
接着,他们会分析为什么某些商品受欢迎,是因为价格便宜,还是质量好,这就是分析数据。
最后,根据分析的结果,决定要多进哪些货,少进哪些货,这就是解释数据的作用啦。
咱们从小学开始,其实就已经在不知不觉中接触到统计学的一些小知识啦。
比如说,老师会让咱们数一数班级里有多少男生,多少女生,这就是在收集简单的数据。
到了初中,统计学的知识就更深入一些啦。
咱们会学习如何画统计图,像什么条形统计图、折线统计图、扇形统计图等等。
比如说,要统计一个班级同学的身高情况,咱们就可以用条形统计图,一眼就能看出哪个身高段的同学最多。
要是想看看一个同学的成绩变化趋势,折线统计图就派上用场啦,能清楚地看到成绩是上升还是下降。
高中的时候,统计学就更复杂也更有趣啦!咱们会学习到一些重要的概念,比如平均数、中位数、众数。
就拿平均数来说吧,有一次我们班组织了一场数学测验,大家的成绩出来后,老师就给我们计算了平均数。
结果发现,全班的平均成绩是 85 分。
这能让我们大概了解全班同学的总体水平。
中位数也很有意思。
还是说那次数学测验,把大家的成绩从小到大排列,正中间的那个数就是中位数。
如果有偶数个成绩,那就取中间两个数的平均值。
比如说,成绩从小到大排列是 60、70、80、90、100、110,那中位数就是 85 分。
众数呢,就是一组数据中出现次数最多的那个数。
比如成绩分别是80、85、85、90、95、95,那众数就是 85 分。
除了这些,高中还会学到方差和标准差。
调侃统计学专业
1、每到年底,都会有看不完的各种报告。
这些报告,往往会以诡异的角度,插入我们的生活,有时候让我们开心,有时候让我们郁闷。
于是大家都会骂,什么破榜单,什么破统计。
统计学是不是一门玄学?
恭喜你,意识到了统计学的本质。
2、发现问题了吗?
统计学本身并不代表真理,只是代表某种手段。
既然是手段,那么有阳间的,自然也有阴间的。
优秀的会计可以把亏损做成赚钱,把赚钱做成亏损,这就是统计学+规则的妙用。
只要用的人骚,统计学可以被玩儿出无数花招。
3、之前和几个朋友去野营,晚上没事儿干瞎聊天,有个是在地质局工作的,有个是把荒野求生刷了好几遍的程序员,有个搞统计的,还有一个我。
我们商量,如果咱们在沙漠里面迷路了,谁活下来的几率大。
我肯定很快就被剔除了,除了以前做尽调被狗追着跑的时候展现过强大的求生欲,野外生存能力几乎为零。
地质局工作的觉得自己能很好的分辨自己在哪里需要如何行进,贝爷爱好者觉得自己终于可以喝大象粪便里面的水了,还有点小期待,但是搞统计的伙伴一句话,我们都服了。
他说搞统计的水分多,活得久。
统计学不得不说的二三事毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。
还有很多医疗同行,对于统计甚为迷恋,能统计的也统计,不能统计创造条件也要统计,看见P小于0.05比亲爹还亲爹。
话说,统计是门很有神奇的学科,在讲之前我又要开始讲几个冷笑话,看懂了的可以举手。
话说:你知道吗,这个世界上绝大多数人拥有的腿的数量高于平均值?(第一遍没有看懂的小伙伴可以去面壁)再讲一个:你知道一个普通的民众有多笨吗?世界上一半的人都比他更聪明。
(其实这是不对的,世界上一多半的人都比他更聪明。
因为人类的智能有上限,愚蠢却没有下限,所以不是一个完美的正态分布。
)不过瘾,再讲一个:曼德勃罗有一次说,他出生在波兰,但在法国上的学,所以平均而言他是个德国人。
(所以,我出生在广东,但在东北上过学,所以平均而言我是个湖北人……)好冷好冷,我们还是来讲点正事,分享几则统计小故事。
1、两个指标诊断疾病的问题路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。
路人甲以A和B的参考范围上限作为诊断界值,得出了A和B 在该界值下对应的诊断敏感性和特异性。
结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。
路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。
路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。
诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A和B的诊断价值。
文章的结论到底是想说明A优秀还是B优秀呢?Reject!这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。
稿件被退了,路人甲有些许郁闷。
经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。
统计学解释
嘿,你知道吗?统计学就像是一个神奇的魔法盒子!比如说,我们
每天的生活就好像是一场数据的大冒险。
早上你看了看天气决定穿什
么衣服,这其实就是一种基于过往天气数据的小小统计呀!
你想想,统计学不就是在帮我们从一堆杂乱无章的数据中找出规律嘛!就像你在一堆糖果中寻找自己最喜欢的口味一样。
我们去超市买
东西,看到那些商品的销量排行榜,那可就是统计学的成果展示呢!“哇,这个东西卖得这么好,肯定很不错!”这就是我们下意识根据统
计结果做出的判断呀。
再说说学校里,老师统计同学们的考试成绩,通过平均分、最高分、最低分这些数据来了解大家的学习情况。
这不就像是给整个班级画了
一幅画像嘛!而且,统计学还能告诉我们很多有趣的事情呢。
比如说,为什么某种疾病在某个地区更容易发生?那就是统计学家们通过大量
的数据研究发现的呀。
我记得有一次,我和朋友们讨论最喜欢的电影类型。
我们各自说出
自己喜欢的,然后发现喜欢科幻片的人最多。
这不就是一个小小的统
计案例嘛!这就好像是在茫茫人海中找到了大家共同的兴趣点。
统计学真的无处不在呀!它就像我们生活中的一个默默付出的伙伴,时刻在帮我们分析、理解这个复杂的世界。
难道你还不觉得统计学超
级有趣、超级重要吗?我反正觉得它就是那个能让我们更好地认识世
界、做出决策的神奇工具!所以呀,一定要好好了解统计学,让它为我们的生活增添更多的精彩!。
统计学的小故事节选为了从数量上认识和理解,大家在日常生活和工作中看到的各种现象所发生的规律,我们就必须收集、整理和分析数据。
这样子的数据不是一个两个,而是足够多的、大量的,因为只有这样,我们才能得到一般性的规律性的结论。
比如说,出生性别比,如果你调查新出生的5个婴儿的性别,很可能你会发现这五个婴儿中只有1个,或者2个、3个、4个是女孩;如果你把调查的数目增加到10个,其中就几乎一定有3到7个婴儿是女孩;你再把调查的数目扩展到100个,你会发现,一般总是有那么四十多个或五十多个婴儿是女孩;当你把调查的数目扩展到1000个时,令你惊奇的事情发生了,你会发现男婴和女婴的数量比越来越接近于1比1,你会发现1000个婴儿中有四百七八十个男婴,五百一二十个女婴,而不是有700个男婴和300个女婴。
你跟我说,在10个婴儿当中,有7个男婴和3个女婴,这我相信。
但是如果你竟然胆敢说,随意挑选1000个婴儿,里面有700个左右的男婴和300个左右的女婴,这我是很难相信的,除非这些婴儿是经过精心挑选出来的。
所以说,几个特例并不能说明问题,只有当你掌握的数据和材料足够多时,你才有资格说话,你得出的结论才是可信的。
这,就是统计的含义所在。
其实,再说多一点,统计学的基本思想,就来源于两个源头,一个是国情调查,一个是赌博游戏。
三百多年前,在西方工业化早期,西方资本主义国家之间的竞争和资源争夺也比较激烈,那时德国的官员和学者们为了本国的强盛和发展,就搜集和调查了大~量的国情资料,其中不仅包括本国的,也包括他们的竞争对手--英国、法国等国家,他们把搜集过来的资料仔细地整理和分析,希望能够从中找到一些有益于本国长治久安的策略。
这是统计学的一个源头之一。
赌博游戏那一头呢?也是三百年前从法国开始的,那个时候法国的赌博游戏引起了数学家的极大关注。
比如说掷色子、抛硬币、赛马呀等等。
就说抛硬币吧,你抛出一枚硬币,当它落回地面的时候,它向你微笑的那一面,究竟是正面还是反面呢?这太不可预测了!你无从知道!现在你抛10次,你发现了,在地面向你微笑的硬币,它出现了4次正面,6次反面!你再抛,你抛100次,出现了45次正面,55次反面!然后你还抛,一直抛到第1000次,结果出来了,你数了数--一共出现了485次正面,515次反面。
关于统计的常识统计是一种科学的方法,用于收集、整理、分析和解释数据。
统计学是一门广泛应用于各个领域的学科,包括社会科学、自然科学、医学、商业和工程等。
在现代社会中,统计学已经成为了一种必不可少的工具,它可以帮助我们更好地理解和解决各种问题。
统计学的基本概念包括总体、样本、参数和统计量。
总体是指我们要研究的所有对象的集合,样本是从总体中随机抽取的一部分对象。
参数是总体的某种特征值,如平均数、标准差等,而统计量是样本的某种特征值,如样本均值、样本标准差等。
通过对样本的统计量进行分析,我们可以推断出总体的参数。
统计学的应用范围非常广泛,其中最常见的应用之一是调查研究。
调查研究是指通过问卷、访谈等方式收集数据,然后对数据进行分析和解释,以了解人们的态度、行为和观点等。
调查研究可以应用于各种领域,如政治、经济、社会和文化等。
除了调查研究,统计学还可以应用于财务分析、市场营销、医学研究、环境保护等领域。
例如,在财务分析中,统计学可以帮助我们分析公司的财务数据,以了解其财务状况和经营绩效。
在市场营销中,统计学可以帮助我们分析市场需求和消费者行为,以制定更有效的营销策略。
在医学研究中,统计学可以帮助我们分析药物的疗效和副作用,以确定最佳的治疗方案。
在环境保护中,统计学可以帮助我们分析环境数据,以了解环境污染的程度和影响。
统计学的应用需要遵循一定的原则和方法。
首先,我们需要确定研究的目的和问题,以确定需要收集哪些数据和如何收集数据。
其次,我们需要对数据进行清理和整理,以确保数据的准确性和完整性。
然后,我们需要对数据进行分析和解释,以得出结论和推断。
最后,我们需要对结论和推断进行验证和评估,以确定其可靠性和有效性。
总之,统计学是一门非常重要的学科,它可以帮助我们更好地理解和解决各种问题。
无论是在学术研究还是实际应用中,统计学都具有广泛的应用价值。
因此,我们应该加强对统计学的学习和应用,以提高我们的分析和解决问题的能力。
统计工作者座右铭
作为一名统计工作者,我们需要时刻牢记自己的座右铭,这不仅能够让我们在工作中更加有方向,更能够激励我们不断进取,成为更好的自己。
我的座右铭是:“数据说话,但也会撒谎。
”这句话的意思是,数据在很多情况下都是非常有力的证据,但同时也存在很多局限性,容易被误解和误用。
因此,我们在使用数据时必须谨慎,不能仅仅看到表面的数字,还要深入分析数据背后的意义,了解各种数据之间的关系,并且要考虑到数据的来源和采集方式等因素。
在统计工作中,我们经常需要面对各种复杂的数据和问题,这时候需要我们有耐心和毅力去分析和解决。
我的座右铭也提醒自己要更加勤奋和认真,因为只有在真正深入分析数据的过程中,才能真正找到问题的根源,提出有效的解决方案。
另外一个重要的座右铭是:“数据是为人类服务的。
”这句话的意思是,我们在做统计工作时不应该只是关注数据本身,更应该将数据的应用和服务对象放在首位。
我们需要了解客户或用户的需求和期望,将数据转化为可用的信息和知识,从而为人类的工作和生活带来更多的价值和意义。
在实际工作中,这个座右铭也提醒自己要多与客户和用户进行交流和沟通,了解他们的需求和反馈,积极改进和优化数据分析和应用的过程和结果,为他们提供更好的服务和体验。
以上是我个人的两个座右铭,它们不仅是我工作的指南,更是我
人生的信条。
希望广大统计工作者也能够有自己的座右铭,并且在工作和生活中不断践行,成为更加优秀的自己。
关于统计的趣闻一、统计的起源和发展统计学作为一门独立的学科,其起源可以追溯到18世纪末的欧洲。
当时,人们开始使用数字和图表来描述社会现象和经济现象,从而形成了统计学这门学科。
随着工业革命的到来,统计学得到了更加广泛的应用,成为了现代社会中不可或缺的一部分。
二、统计数据中的趣闻1. 诞生于1883年的“贝比”名字来源在19世纪末期,英国统计学家弗朗西斯·高尔顿·贝比(Francis Galton)提出了“回归到平均数”的概念。
他通过研究父母身高和子女身高之间的关系,发现子女身高总是趋向于平均水平。
为了表示这种趋势,他用“regression”一词来描述这种现象,并将其缩写为“reg”,后来被称为“回归”。
而后人则将其发音改为“regress”,并缩写为“reg”,最终演变成了今天我们所熟知的“Regression”。
2. 统计数据中的谬误:莫比乌斯带上没有内侧和外侧莫比乌斯带是一种特殊的拓扑结构,其特点是只有一个面和一个边。
然而,如果我们将莫比乌斯带嵌入三维空间中,并且给它染上不同的颜色,就可以得到一种看似有内侧和外侧的结构。
这种谬误在统计学中也很常见,例如当我们只关注数据中的某些特征时,可能会忽略掉其他重要的因素。
3. 统计数据中的巧合:生日悖论生日悖论是指,在一个房间里只需要23个人,就有50%以上的可能性至少有两个人生日相同。
这个结果看起来非常令人惊讶,但实际上它是由于概率计算中的组合问题导致的。
在统计学中,类似的巧合也经常出现,因此我们需要谨慎地处理数据并进行充分的分析。
三、统计学在现代社会中的应用1. 统计学在医学领域中的应用统计学在医学领域中起着至关重要的作用。
通过对大量病例进行分析和研究,可以发现疾病发生和传播规律,并制定相应的预防和治疗方案。
例如,在新冠肺炎疫情期间,统计学家通过对病例数据的分析,帮助医生和政府制定了有效的防控措施,有效地遏制了疫情的传播。
2. 统计学在市场营销中的应用在现代商业社会中,市场营销是企业获得成功的关键之一。
大部分机构在派发调查样本的时候都会采取一些激励手段。
比如官方统计机构进行的住户调查,即抽查一些城乡家庭做居民开支等情况的跟踪统计,会对配合的记账户家庭给予每月几十元的补贴激励。
但某一些物品奖励则可能对结果造成影响,比如如果用运动水壶和微波炉餐具吸引来的接受调查者可能是完全不同的两个群体,他们给出的答案会让调查结果呈现不同倾向。
04 普查常常不是由一家机构完成官方统计机构的调查方法分为普查和抽样调查两种方式。
“一般来说经济普查、人口普查这样的大型调查,才会是全样本统计,结果也会相对可靠一些。
”北京市一位统计局人士介绍。
但对于大型普查的审核也是一个难题,如人口普查,现有的统计站人员是绝对不够的,就会划区分给当地社区工作者或基础公务员来辅助入户调查。
“对于这类普查的审核也只能靠随机抽查才能发现问题,这本身相当于另一项专项调查的任务量。
”05 它们会用“特技”吸引眼球商业报告中常常喜欢用百分比来描述和展示统计结果,很可能是为了掩盖样本容量过小的事实,而达到宣传商品价值、影响读者的作用等。
比如广告中常常出现“80%的测试人员”一致认可某种牙膏、某种咖啡的质量,而参加测试的人员可能只有5个人。
这一手法被广泛运用到商业报告中。
另外改变图表的横纵坐标范围或比例,也会产生惊人的效果,如为了强调某产品成本的上升,改变了横纵坐标范围或比例,实际成本其实上升了10%,就可以使视觉效果看起来像是30%。
06 选择用同比还是环比有讲究一些房地产网站上统计出的成交量文章和图表,有同比分析的,也有环比分析的,这并不是随机的。
它们的数据来源于房产中介企业,商业目的是要保持市场成交的活跃,也会人为选择数据表述方式。
如果2月成交量很低,3月就用环比分析,让读者以为成交量是大幅增加的,但有可能同比是负增长。
如果3月基数大了,4月就采用同比分析,看起来也是大幅增长,而可能环比只增长了一点。
07 它们的字典与我们日常概念不同“统计在国内的发展时间还比较短,很多是参考国外成熟的指标进行设计的,一些规范和框架一直在微调之中。
统计学不得不说的二三事毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI 杂志上,乱用统计学的现象多如牛毛。
还有很多医疗同行,对于统计甚为迷恋,能统计的也统计,不能统计创造条件也要统计,看见P小于0.05比亲爹还亲爹。
话说,统计是门很有神奇的学科,在讲之前我又要开始讲几个冷笑话,看懂了的可以举手。
话说:你知道吗,这个世界上绝大多数人拥有的腿的数量高于平均值?(第一遍没有看懂的小伙伴可以去面壁)再讲一个:你知道一个普通的民众有多笨吗?世界上一半的人都比他更聪明。
(其实这是不对的,世界上一多半的人都比他更聪明。
因为人类的智能有上限,愚蠢却没有下限,所以不是一个完美的正态分布。
)不过瘾,再讲一个:曼德勃罗有一次说,他出生在波兰,但在法国上的学,所以平均而言他是个德国人。
(所以,我出生在广东,但在东北上过学,所以平均而言我是个湖北人……)好冷好冷,我们还是来讲点正事,分享几则统计小故事。
1、两个指标诊断疾病的问题路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。
路人甲以A和B的参考范围上限作为诊断界值,得出了A和B在该界值下对应的诊断敏感性和特异性。
结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。
路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。
路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。
诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A 和B的诊断价值。
文章的结论到底是想说明A优秀还是B 优秀呢?Reject!这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。
稿件被退了,路人甲有些许郁闷。
经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。
路人甲很快绘制了ROC曲线,统计结果表明,A的曲线下面积为0.80,B的曲线下面积为0.82。
路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:B的诊断效率是优于A 的,其理由就是因为B的曲线下面积大于A。
路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上看,B的曲线下面积高于A,但是导致这种差异的原因有两种,一种是抽样误差,一种是试验效应,即B确实是高于A的。
你怎么能确定这不是抽样误差呢?在统计学上,要确定0.82是否高于0.80,就一定要经过统计学检验的。
Reject!这个故事说明:在医学科研中,没有经过统计学检验的结论多半是不科学的。
稿件被退了,路人甲很是郁闷。
他吸取了经验教训,自学了很多统计学理论,终于弄清楚了采用何种方法去比较曲线下面积。
接下来的事情就是改稿,然后另选杂志继续投稿。
路人甲在文稿中特别注明了,曲线下面积是经过了统计学检验的,B的曲线下面积(0.82)与A的曲线下面积(0.80)之间的差异是有统计学意义的,而且还大摇大摆地在后面加了个括号,写明P=0.01。
路人甲仰天长叹了一口气,很郑重地给自己的研究下了结论:本研究表明B的诊断效率是优于A的。
路人丁是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:B是常见的诊断指标,其检测结果并不对临床医师设盲,在很大程度上可以检测影响临床医师对疾病的诊断。
A是新进发现的诊断指标,其结果完全对临床医师设盲,不可能影响医生的诊断。
所以作者的结论(B 比A优秀)是不可靠的。
再说得通俗点,如果把A和B分别理解成法庭上的原稿和被告,那B无疑既充当了辩护律师,又充当了法官的角色。
在这种情况下,A输掉了官司是十分正常的。
如果换一个公平的、独立的法官来断案,B能否胜出就不好说了。
Reject!这个故事说明:实(试)验设计有缺陷,再优秀、再正规的统计学方法也于事无补。
稿件又被退了,路人甲的心情极度郁闷。
思来想去,决定把实验重做一遍,让A和B在一个公平的环境中比较(为便于描述,此处忽略医学伦理学问题)。
在新开展的研究中,A和B都是对临床医生设盲的,不可能影响金标准。
这下A和B的比较结果应该比较可靠了吧,路人甲又仰天长叹了一口气,感觉自己如释重负了。
科研太折腾人了,太不容易了!统计结果很快出来,A的曲线下面积是0.80,B的曲线下面积则变成了0.77,经过统计学检验后发现,A的诊断效能确实是高于B 的。
整个研究的试验设计滴水不漏,统计学过程天衣无缝,我就不信还有人敢拒这篇稿件,路人甲心中开始暗喜。
路人戊是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:A和B的检测并不矛盾,他们之间的关系不应该是竞争关系,而应该是合作关系。
读者最关心的问题显然不是A和B“孰强孰弱”的问题,虽然这个问题有一定的专业价值。
如果我是坐诊医生,我会说:A和B 谁强谁弱关我什么事?总之来一个病人我就A和B都检测,我的患者都不差钱!作者的研究重点应该是明确A和B能否互补,联合使用是否能有助于提高诊断准确性的问题,而非A和B“孰强孰弱”的问题。
简单地说,就是明确1 1是否大于1的问题。
Reject!文章又被拒稿了。
这个故事说明:研究方向错了,即使是无懈可击的实(试)验设计和天衣无缝的统计方法,也是无济于事。
这四个故事说明:医学科研是很痛苦的,不重视统计学和科研设计,会走很多弯路的。
2、降糖药的研究、学生自杀事件路人甲长期从事降糖药的研究,最近他发现了一种药物,可以降低患者的血糖。
为了评价该药的降糖效果,路人甲费尽心机地设计了一个看似完美的随机对照试验(RCT),为了保证结果可靠,路人甲严格遵守RCT设计准则,包括随机、双盲、安慰剂对照等措施。
研究结果表明,实验组和对照组在接受药物治疗前血糖浓度的均值都是10mmol/L,差异无统计学意义,表明两组研究对象的基线特征具有可比性。
对照组未经任何药物治疗(为便于描述,此处忽略医学伦理学问题),血糖浓度还是10mmol/L;实验组经过药物干预后,血糖浓度变成了9mmol/L,统计学检验结果表明,实验组和对照组治疗后的血糖浓度的差异是有统计学意义的(P)。
路人甲赶紧撰写论文,并毫不客气地给研究下了个结论:该药可以降低患者血糖。
路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:却要确实可以降低血糖,但是一个只能降低1mmol/L的降糖药有何临床价值?Reject!这个故事说明:有统计学意义不一定有专业意义。
路人甲做了一个调查,同处一地的A和B两所中学,各有1000名学生,过去的一年,A校有5名学生自杀(自杀率为0.5%),B校没有学生自杀(自杀率为0%)。
统计学结果表明,两校自杀率的差异无统计学意义(P=0.07,Fisher确切概率法,笔者进行了统计)。
于是路人甲得出结论:A和B两校的自杀率是没有差异的,A校5名学生自杀纯属小概率事件。
路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:5个鲜活的生命就这样没有了,5个家庭就这样毁了,你却告诉我这纯属小概率事件,你就不怕“人神共愤”吗?Reject!这个故事说明:有专业意义不一定有统计学意义。
这两个故事说明:做医学科研,不能死磕统计。
3、如何看待统计学结果路人甲经历数十年的研究,动用了各种高精尖的研究手段,发现了一个新的蛋白(命名为蛋白A)。
在肝癌患者中展开的研究表明,蛋白A和甲胎蛋白(AFP)有很好的相关性,其相关程度之好,几乎可以用“一塌糊涂”来形容,相关系数达到了0.99(P)。
路人甲欣喜若狂,尽管蛋白A的检测过程还十分繁琐,检测费用还十分高,但是路人甲还是把持不住内心的激动,日夜兼程地撰写论文,宣称自己找到了一个新的肝癌标志物。
路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:统计结果表明蛋白A和AFP的相关性十分明显。
如果是这样,在临床实践中,通过检测AFP完全就可以得知蛋白A的浓度了,蛋白A在肝癌中的临床价值完全可以被AFP代替,还不说蛋白A的检测过程繁琐,费用太高的问题,你说蛋白A还有什么价值?Reject!这个故事说明:统计学阳性的结果未必是“好结果”。
路人甲发明了两套诊断肺癌的方案,分别命名为A和B。
为了明确这两种方到底谁“更胜一筹”,路人甲找了100个肺癌患者和100个疑似肺癌患者(结核、肺炎等),分别用A、B两套方案去进行鉴别诊断。
在200个研究对象中(100个肺癌和100个非肺癌),方案A正确了100回,准确率50%,方案B仅仅正确了50回,准确率仅为25%。
卡方检验表明:方案A和B准确率之间的差异有统计学意义(P)。
很明显,方案A的准确性要高于方案B。
路人甲赶紧发表论文,指出:方案A诊断肺癌的准确性优于方案B。
路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:如果我(审稿人本人)是坐诊医生,他就会反着看方案B的结果,凡是方案B认为是肺癌的,他就认为病人不是肺癌;反之亦然。
这样下来,200个病人中,方案B应该能正确识别150个人,准确率为75%,统计学结果表明,方案B的准确率(75%)是高于方案A(50%)的,所以真实的情况是方案B优于方案A。
实际上,当面对这200名患者的时候,随便到城隍庙找个瞎子来“算命(猜患者是否患病)”,按照统计学理论,准确率也应该是50%,方案A的价值可以说是“一无是处”。
Reject!这个故事说明:统计学阴性的结果未必是“坏结果”。
还是那个AFP与蛋白A 的例子。
路人甲发现蛋白A和甲胎蛋白(AFP)之间有很好的相关性,也开始撰写论文,但是他的结论并不是“蛋白A是诊断肝癌的标记物”。
他认为,既然蛋白A与AFP之间有很强的相关性,那提示AFP和蛋白A之间可能存在十分密切的“调节”或者“被调节”关系。
最终,路人甲围绕“蛋白A与AFP之间的调节或者被调节关系”做了很多分子生物学试验,指出蛋白A是调节AFP表达的唯一(注意“唯一”这两个字)因子,因此二者之间才会呈现如此强烈的相关性。
这是一项基础研究,虽然未能直截了当地地指出蛋白A的临床价值,但是这个研究形象生动地讲述了一个完整的分子生物学事件,丰富了我们对于肝癌发生与发展分子机制的认识。
最终,论文“堂而皇之”地accept了。
这个故事说明:同一统计学结果,从不同的专业角度去解释,结论是完全不同的。
这三个故事说明:对统计学结果的解读一定要结合专业!从专业中来,到专业中去!今天就策到这里,我也理解统计对于临床大夫很难,所以,大家要是时间搞不懂,别自己闷着头苦干,可以像统计专业人士寻求帮助!。