第六章 统计学悖论
- 格式:ppt
- 大小:323.00 KB
- 文档页数:67
统计学辛普森悖论引言:统计学是一门研究数据收集、分析和解释的学科,它在科学研究、商业决策、政策制定等领域都发挥着重要作用。
然而,我们常常会遇到一个现象,即当我们将数据进行细分分析后,得出的结论与整体数据的结论相反。
这就是统计学中著名的辛普森悖论。
一、什么是辛普森悖论?辛普森悖论,又称为辛普森效应,是指当我们对数据进行细分分析时,得出的结论与整体数据的结论相反的现象。
这种现象常常出现在数据集中存在不同的类别或组群时。
二、辛普森悖论的经典案例为了更好地理解辛普森悖论,我们可以通过一个经典案例来说明。
假设某个学校在招生过程中有两个不同的专业:专业A和专业B。
我们对该学校的录取情况进行统计分析,得出以下数据:专业A:200名男生中有120人被录取,300名女生中有100人被录取;专业B:300名男生中有150人被录取,200名女生中有120人被录取。
整体数据显示,男生的录取率高于女生。
然而,当我们对不同的专业进行分别分析时,却发现女生的录取率在每个专业中都高于男生。
这就是典型的辛普森悖论。
三、辛普森悖论的成因辛普森悖论产生的原因主要有两个方面:样本大小和类别之间的关系。
1. 样本大小:在上述案例中,男生和女生的样本大小存在差异,男生的样本数量要大于女生。
当我们只看整体数据时,男生的录取率较高,但当我们对不同的专业进行分别分析时,女生的录取率却在每个专业中都高于男生。
这是因为男生的样本量大,整体数据中占比较大,从而影响了整体数据的结论。
2. 类别之间的关系:在上述案例中,男生和女生在不同专业的录取情况存在差异。
男生在专业A中录取率高于专业B,而女生在专业A 中录取率低于专业B。
这种差异导致了整体数据和分组数据的结论相反。
四、如何避免辛普森悖论的影响辛普森悖论的出现给我们的数据分析带来了挑战,但我们可以采取一些方法来避免其影响。
1. 充分了解数据:在进行数据分析之前,我们应该充分了解数据的来源、样本数量以及类别之间的关系。
统计学辛普森悖论的内容统计学辛普森悖论(Simpson's Paradox),又称辛普森效应,是指在统计数据分析中,一个总体的不同子集中出现的关系与整体数据的关系恰好相反。
简单来说,当我们将数据分组并进行分析时,得出的结论可能会与整体数据相矛盾。
辛普森悖论最早由英国统计学家E.H.辛普森于1951年提出,他在研究统计学考试成绩的数据时发现了这个现象。
为了更好地说明辛普森悖论,我们将针对一个具体的例子进行讨论。
假设某家医院正在研究针对某种疾病的两种不同疗法的疗效。
研究人员将患者分为两个子集:男性(子集A)和女性(子集B),然后比较两种疗法在不同子集中的成功率。
在子集A中,疗法A有80%的成功率,而疗法B只有40%的成功率;在子集B中,疗法A的成功率为60%,而疗法B的成功率为70%。
这个结果可能导致人们错误地认为疗法A比疗法B更有效。
然而,当我们将整体数据考虑进来时,情况就完全不同了。
整体上,疗法A的成功率为65%,而疗法B的成功率为67.5%。
这个结果与我们之前的结论相反,疗法B在整体上比疗法A更有效。
辛普森悖论的发生是由于子集A和子集B在整体数据中所占比例的差异导致的。
在这个例子中,虽然在子集A和子集B中,疗法A的成功率都不如疗法B,但是子集A在整体数据中所占比例远大于子集B。
所以,整体上疗法A的平均成功率反而比疗法B低。
为了更好地理解辛普森悖论,我们可以通过一个可视化的例子来说明。
假设我们有一个学校的招生数据,该学校有两个专业:科学(子集A)和文科(子集B)。
我们将招生成功率与考试成绩进行比较。
具体数据如下:子集A:科学专业-学生甲:考试成绩80分,成功录取-学生乙:考试成绩70分,未录取子集B:文科专业-学生丙:考试成绩80分,未录取-学生丁:考试成绩70分,成功录取看上去,科学专业的成功录取率为50%,而文科专业的成功录取率为50%。
这暗示我们两个专业的录取机会是相同的。
然而,当我们将整体数据考虑进来时,结果却完全不同。
统计力学里好几个著名的悖论
统计力学中存在多个著名的悖论,这些悖论挑战了我们对物理世界的基本理解。
以下是其中几个著名的悖论:
1. 辛普森悖论(Simpson's Paradox):这个悖论是指当两个独立实验的结果在总体上呈现出相反的趋势时,但在分组合计时却显示出一个完全不同的结果。
这种现象似乎违反了概率论中的独立性原则,因为在分组合计时,两个独立实验的相互影响导致了结果的反转。
2. 赌徒谬误(Gambler's Fallacy):这个谬误是指一种错误地认为某事因为连续没有发生,所以下一次的结果更有可能是相反的信念。
例如,一个赌徒可能会认为,因为连续几次掷骰子都是六点,所以下一次掷骰子更可能是三点。
然而,这种观点忽略了概率的独立性原则,每次掷骰子都是独立的,不会受到前一次的结果影响。
3. 观察者效应(Observer Effect):这个效应是指在观察过程中观察者的行为和状态会对被观察对象产生影响,从而改变被观察对象的状态或结果。
这个效应挑战了我们对客观世界的认知,因为我们无法排除观察者对被观察对象的影响。
4. 测量问题(Measurement Problem):这个问题是关于量子力学的测量问题,它涉及到观察者对被观察对象的测量结果的影响。
根据量子力学的哥本哈根解释,当我们对一个量子系统进行测量时,我们只能得到一个确定的结果,而这个结果并不是量子系统本身的状态,而是观察者与量子系统之间的相互作用的结果。
这个解释似乎将观察者的意识引入了物理世界中,引发了许多哲学和科学上的争议。
这些悖论是统计力学中的重要问题,它们挑战了我们对物理世界的理解,并引发了许多深入的研究和讨论。
数据科学家应了解的五个悖论统计悖论在机器学习模型中无处不在。
这是一些最臭名昭著的例子。
要通过人工智能(AI)重建人类认知,就必须应对许多数据无法轻易解释的现象。
长期以来,人们一直将悖论视为违反逻辑和数据规则的异常情况。
通过悖论进行推理对机器学习模型提出了难以置信的挑战,因此,数据科学家在训练新模型时应该意识到这些情况。
悖论是人类认知的奇迹之一,难以使用数学和统计学。
从概念上讲,悖论是根据问题的原始前提得出明显的自相矛盾结论的陈述。
即使是最著名的和有据可查的悖论,也经常使领域的专家蒙蔽,因为它们从根本上与常识相矛盾。
人工智能(AI)希望重现人类的认知,因此机器学习模型在训练数据中遇到自相矛盾的模式并乍一看似乎得出矛盾的结论是非常普遍的。
今天,我想探讨一些机器学习模型中常见的著名悖论。
悖论通常是在数学和哲学的交叉点上提出的。
一个臭名昭著的哲学悖论被称为These修斯之船,它质疑一个已经将其所有组成部分都替换掉的物体是否根本上仍然是同一物体。
首先,假设英雄These修斯(Thusus)在一场激烈的战斗中航行的那艘著名船已被保留在港口中作为博物馆作品。
随着时间的流逝,一些木制零件开始腐烂,并被新的木制零件取代。
一个世纪左右后,所有零件都被更换了。
'恢复'的船是否仍与原始船相同?或者,假设每个拆下的零件都存储在仓库中,并且在本世纪之后,技术不断发展,可以治愈它们的腐烂,并使它们重新组合在一起制成一艘船。
这艘'改建'的船是原船吗?如果是这样,港口中恢复的船舶还是原始船舶吗?数学和统计领域,如果充满着著名的悖论。
举几个著名的例子,传说中的数学家和哲学家贝特朗·罗素提出了一个悖论,突显了集合论中一些最强大的思想中的矛盾,而这是有史以来最伟大的数学家之一:格雷格·坎托。
本质上,罗素悖论质疑'一个不包含自身的所有列表的列表'。
悖论是在自然集合论中通过考虑并非其自身成员的所有集合的集合而产生的。
社会统计悖论与转变问题0引言社会统计分析的数据绝大数是分类意义上的。
它们要么是定性的定类、定序数据,要么是定量的离散数据[1],并不具备严格意义上的+、-、×、÷等数学运算特性[2]。
社会研究对象的这一分类特征,使得列联表成为社会统计分析中应用最为广泛的首选统计工具之一。
因为列联表是非参数的或仅要求很弱的参数分布假定。
但在列联表分析中,如何解释隐现其中的辛普森悖论一直是一个重要问题。
此外,由于分类数据的非线性特征,回归函数不可能是线性的,需要寻找一个链接函数,将分类变量的期望值变换成自变量的一个线性函数。
然而,在实际应用中,变换与变换的内在差异与背后假定问题常为人们所忽视,进而影响了参数解释。
1辛普森悖论问题辛普森悖论最早于1899年由卡尔•皮尔森-提出,但一直到1951年辛普森才正式描述并解释这一现象,后来就以他的名字命名该悖论。
关于辛普森悖论,国内学者关注不多,只有李思一1984、王轶豪1986、倪加勋1992、吴素萍2000、耿直2000、史希来2006、王健2008等人作过介绍性研究。
辛普森悖论是指,在分组比较中都占优势的一方,在总体评价中却并不占优势。
我们先来看一个源自真实生活的案例。
1979年初,《美国历史画报》杂志对读者类型和获得期刊的方式进行了统计[3]。
见表1。
从表1可以看出,五种订阅方式中,老订户1月份的续订率要高于2月份,但合计后总的续订率却要低于2月份。
除了上述案例外,还有其他很多真实的数据表现出了辛普森悖论现象,如等1975,1982,1995。
总之,辛普森悖论不是虚幻的,而是客观存在的。
问题是如何解释辛普森悖论的产生原因。
由于统计的基础在于概率,于是人们就从概率论加以解释。
辛普森悖论可定义为以下三种情况同时发生1|,>|,;2|,>|;3|虽然从概率角度可以诠释辛普森悖论问题,但在笔者看来,这种诠释具有柏拉图理念论的色彩。
因为这里遵从的是概率的频率定义列联表中表征的是频率,即=→∞=→∞事实上,由于试验或观测次数为∞是做不到的,因此,列联表中的相对频率只能说是对概率的一种柏拉图意义上的理念摹本,近似到何种程度仍然是有疑问的。
产品分析之统计学悖论在做产品分析时,统计结果截然相反,是何种原因引起的呢?这种情况该如何应对呢?近期面试聊到了产品分析时统计结果截然相反时,分析人员变成了热锅上的蚂蚁,手足无措。
这到底是什么引起的呢?早在1951年性别歧视的案子中就发现了这种相悖的统计结果。
最典型的例子:?1973年加利福尼亚大学伯克利分校性别歧视案的例子:大家从表格里可以看到,如果只看整体录取率,那么男生的录取率是44%,女生的是30%。
但加利福尼亚大学伯克利分校的统计学教授 Peter Bickel 后来发现,如果按照院系分类,女生实际上比男生的录取率还高一些。
一、细节和整体趋势完全不同辛普森悖论(Simpsons paradox):当你把数据拆开细看的时候,细节和整体趋势完全不同的现象。
我们简化上述表格,发现悖论是由于基数产生的影响——男生在学院1和学院2的分布和女生的分布截然相反引起的。
在日常分析工作也经常存在这样的现象,经常在两端分析时,大都以为两端作为拆分对比,如iOS、Android投放广告的转化率分析中,通过两端的转化率可以得到结论1,但将iOS、Android按照网页版本、移动版本拆分后会得到完全相反的结论:结论1: iOS的总体转化率低于Android。
基于此可以得到的结论是该批次广告不适合iOS平台;iOS平台需要做在转化过程中需要做进一步的漏斗分析以便优化。
结论2: 网页版本iOS的转换率高于Android,且移动端iOS的转化率也高于Android。
基于此可以得到的结论是该批次广告不适合Android平台;Android平台需要做在转化过程中需要做进一步的漏斗分析以便优化。
如果没有辩证的结合多个维度分析该数据表现,则会被误导,在错误的方向上投入更多的精力,甚至是完全相反的决策。
二、相关分析中,整体相关性和组间相关性相反。
假设我们有每周运动小时属于两组患者(50岁以下、50岁以上的患者)患病风险的对比数据。
——在此前提下,在对住院病人进行研究时,
相当于控制了“住院”这个因子.正如我们所知的,
撞因子为条件这一操作制造了“疾病1”和“疾病
间的伪相关.因为辩解效应的存在,这种伪相关多呈负
相关,但在这个例子中,这种伪相关是正向的,
者住院的前提就是同时患有两种疾病(而不是只患有
一种疾病).
然而,长期以来,流行病学家拒绝相信这一悖论
的存在.直到1979年,麦克马斯特大学的一位研究统
文化时空
张奠宙王善平
这个错误对我们来说特别有启发性,因为它精确
地说明了我们大脑思考机制的缺陷.我们在实际生活
中似乎就是遵循着共因原则行事的,无论何时,
观察到某种模式,我们就会去寻找一个因果解释。
7种常见的统计学悖论
1. 辛普森悖论(Simpson's paradox):当将数据分组或进行比较时,两个或多个独立数据集的关系可能与整体数据集的关系相反。
这可能导致误导性的结论。
2. 聚集悖论(The aggregation paradox):当将数据以不同的方式进行聚合时,可能会得出不同的结论。
这可能导致对整体趋势的错误理解。
3. 伯克森悖论(Berkeley's paradox):当使用频率统计推断个体特征时,可能会得出与实际情况相悖的结论。
这是由于忽略了基本样本大小的影响。
4. 数据欺骗悖论(Data dredging paradox):当进行多次假设检验时,可能会出现偶然的显著结果,而不是真正的关联。
这可能导致错误的结论。
5. 吉布斯悖论(Gibbs paradox):在概率论中,当将无序事件转化为有序事件时,可能会导致悖论。
这涉及到对事件的定义和顺序的解释。
6. 奥姆斯特恩悖论(Omphaloskeptic paradox):当进行统计推断时,可能会陷入无尽的怀疑和自我怀疑的循环中,导致无法得出可靠的结论。
7. 美索不达米亚悖论(Mesopotamian paradox):当进行历史数据分析时,可能会面临缺乏准确和完整数据的挑战,导致无法得出确凿的结论。
统计学悖论——⾟普森悖论今天给⼤家介绍⼀个统计学悖论——⾟普森悖论,对以后看数据或许有帮助。
作者:七君来源:把科学带回家我们平时在做重⼤决策的时候,⽐如择校啊,选专业啊,总是会参考这些⽐较对象的硬指标,⽐如它们的录取率啊,就业率啊等等。
像是,哪个学校的就业率⾼,我们就会去报考这个学校。
统计数字可以帮助我们了解这些⽐较对象的优劣,让我们做出明智的决策。
不光是个⼈,公司和国家也是这样做决策的。
那么这样做对吗?其...实...不...对今天我们就来介绍⼀个让⼈⾮常头疼,但⾮常有⽤的悖论,它会告诉你,很多时候统计数字相当不可靠,特别容易误导⼈。
先来看⼀个假设的例⼦。
⼩明⽣了慢粒⽩⾎病,她的失散多年的哥哥找到有2家⽐较好的医院,医院A和医院B供⼩明选择就医。
⼩明的哥哥多⽅打听,搜集了这两家医院的统计数据,它们是这样的:医院A最近接收的1000个病⼈⾥,有900个活着,100个死了。
医院B最近接收的1000个病⼈⾥,有800个活着,200个死了。
作为对统计学懵懵懂懂的普通⼈来说,看起来最明智的选择应该是医院A对吧,病⼈存活率很⾼有90%啊!总不可能选医院B吧,存活率只有80%啊。
呵呵,如果⼩明的选择是医院A,那么她就中计了。
就这么说吧,如果医院A最近接收的1000个病⼈⾥,有100个病⼈病情很严重,900个病⼈病情并不严重。
在这100个病情严重的病⼈⾥,有30个活下来了,其他70⼈死了。
所以病重的病⼈在医院A的存活率是30%。
⽽在病情不严重的900个病⼈⾥,870个活着,30个⼈死了。
所以病情不严重的病⼈在医院A的存活率是96.7%。
在医院B最近接收的1000个病⼈⾥,有400个病情很严重,其中210个⼈存活,因此病重的病⼈在医院B的存活率是52.5%。
有600个病⼈病情不严重,590个⼈存活,所以病情不严重的病⼈在医院B的存活率是98.3%。
画成表格,就是这样的——医院A:医院B:你可以看到,在区分了病情严重和不严重的病⼈后,不管怎么看,最好的选择都是医院B。
统计学辛普森悖论产生的原因辛普森悖论是一个有着非常深刻内涵以及针对复杂系统部分深刻讽刺的经典谜题。
它表明,尽管在复杂系统中单个组件往往具有良好性能,然而,当多个组件组合在一起成为复杂系统时,性能系数反而会变得惊人。
令人吃惊的是,当这些组件按照组合规则组装起来时,最终的性能和单独的组件的性能成正比。
辛普森悖论产生的原因有以下几点:一、设计问题:在复杂系统中,一些关键模块可能并不得当地组合在一起,这可能导致关键模块之间的相互冲突,而这种冲突反过来导致复杂系统的性能急剧下降。
二、过度依赖:当复杂系统中,出现了过度依赖的概念时,其可能性以及由此产生的复杂性也可能成为辛普森悖论的一部分。
这是由于一个模块依赖另一个模块,而另一个模块又依赖另一个模块,最终导致整体性能急剧下降。
三、系统不可复制:复杂系统的单个组件是非常容易组装的,但它们不能复制,这是辛普森悖论的重要原因之一。
因为复杂系统中的每一个模块都具有独特的特点,这就导致其他模块无法复制或模拟。
四、软件配置错误:如果开发人员忽略了必要的软件配置,可能导致某些软件出现问题,从而导致复杂系统的性能受到严重影响。
五、内存限制:随着复杂系统单元的增加,内存的使用可能会受到极大的影响,特别是当复杂系统的模块数量达到某个特定的水平时,内存的使用可能会迅速增加,继而导致系统性能的急速下降。
六、硬件限制:硬件限制也会影响复杂系统性能,如光驱等设备可能存在性能和容量限制,如果超出限制,就会影响系统的性能。
总之,辛普森悖论的产生是由多种原因造成的,包括设计问题、过度依赖、系统不可复制、软件配置错误、内存限制和硬件限制等。
这些原因是系统性能下降的根本原因,所以在实际应用中,设计人员应充分考虑这些因素,采取有效措施,尽量避免复杂系统悖论的发生。
统计学谬误论证评价统计学谬误是指在统计学研究中常见的错误或误解。
在统计学中,因为人们对数据的处理和分析往往存在主观性和盲目性,容易导致谬误的产生。
本文旨在探讨统计学谬误的几种常见类型,并对其进行评价和分析。
一种常见的统计学谬误是样本选择偏差。
在实际研究中,样本的选择往往受到各种限制和条件的影响,从而导致样本结果不能代表整个总体。
例如,如果在选取样本时只选择了某个特定群体的人,那么得出的结论就不能代表整个人群。
这种谬误会导致结果的不准确性和误导性。
相关与因果的混淆也是一个常见的统计学谬误。
相关性指的是两个变量之间存在的关联关系,而因果性则是指一个变量的变化引起了另一个变量的变化。
然而,很多时候人们往往将相关性误解为因果关系,从而得出错误的结论。
例如,有人发现冰淇淋销量与溺水死亡人数之间存在正相关关系,就错误地得出了吃冰淇淋会导致溺水死亡的结论。
这种混淆会导致错误的因果推断和不准确的结论。
抽样误差也是一个常见的统计学谬误。
抽样误差是指由于样本选择的随机性导致的误差。
在实际研究中,由于样本数量的限制,往往无法完全代表整个总体,从而导致样本结果与总体结果存在差异。
这种误差会影响到研究结论的准确性和可靠性。
统计学中的假设检验也容易引发谬误。
假设检验是一种用于判断样本结果是否代表总体的统计方法。
然而,由于假设检验的前提假设和判断标准往往是主观的,因此容易产生谬误。
例如,在进行假设检验时,如果将显著性水平设定过低,就会导致错误地拒绝原假设;而将显著性水平设定过高,则会导致错误地接受原假设。
这种谬误会影响到研究结果的可靠性和有效性。
统计学谬误在统计学研究中是不可避免的。
然而,通过了解和认识这些谬误,我们可以更加客观和准确地进行数据的处理和分析,从而得出更可靠和有效的结论。
因此,在实际研究中,我们应该注意避免这些谬误的产生,并对研究结果进行谨慎评价和分析,以确保研究的准确性和可靠性。
同时,我们也应该加强对统计学的学习和理解,提高自身的统计学素养,避免在研究中犯这些常见的统计学谬误。
统计案例经典悖论统计案例经典悖论是指在统计学中出现的一些经典的悖论或矛盾现象。
这些悖论揭示了统计学中的一些困境和问题,对我们进行数据分析和决策时提出了重要的警示和启示。
下面列举了一些经典的统计案例悖论:1. 辛普森悖论(Simpson's paradox):当我们根据不同的子群体进行分析时,得出的结论与整体数据的结论相矛盾。
这是因为不同的子群体的结构不同,导致整体数据的结论被子群体的影响所扭曲。
2. 霍尔悖论(Hall's paradox):在进行多元回归分析时,当我们增加一个变量进入模型后,原来的显著变量可能变得不显著,甚至改变方向。
这是因为增加的变量与原来的变量之间存在相关性,导致模型的解释能力发生了变化。
3. 蒙蒂霍尔问题(Monty Hall problem):在一个游戏中,参赛者面对三扇门,其中一扇门后有奖品,参赛者选择一扇门后,主持人会打开另外一扇没有奖品的门。
然后,参赛者可以选择是否更换选择。
悖论在于,更换选择的获奖概率比不更换选择的获奖概率更高。
4. 伯克逊悖论(Berkeley's admissions paradox):在加州大学伯克利分校的录取数据中,尽管每个系别都倾向于录取男性,但整体上却更倾向于录取女性。
这是因为女性更倾向于申请相对热门的专业,而男性更倾向于申请相对冷门的专业,导致整体录取率出现了悖论。
5. 赌徒谬误(gambler's fallacy):赌徒们常常认为在连续多次失败之后,下一次获胜的概率会增加。
实际上,每一次独立事件的概率是相同的,之前的失败并不会影响下一次的结果。
6. 雷吉斯悖论(Reversal paradox):在比较两个不同的治疗方法时,研究结果可能会出现悖论。
比如,治疗方法A在总体上是有效的,但在某个子群体中却没有效果,而治疗方法B在总体上是无效的,但在该子群体中却是有效的。
7. 轮盘赌悖论(roulette paradox):轮盘赌悖论指的是在进行多次赌博时,连续多次赢得的结果反而增加了下一次输的概率。
统计学辛普森悖论统计学辛普森悖论是统计学中的一个重要现象,经常会出现在实际问题中,这个悖论揭示了一个非常有趣的现象。
本文将介绍辛普森悖论的背景、定义和原理,并提供一些实际的例子来帮助读者更好地理解这个悖论。
辛普森悖论最早由英国统计学家辛普森(Yule S.Simpson)在20世纪中期提出,其背景是他对加利福尼亚大学伯克利分校的录取率进行统计分析时发现的一个现象。
当时,辛普森发现,在整体上,男性的录取率高于女性的录取率。
然而,当将数据按照性别和不同专业进行划分后,却发现在每个专业中,女性的录取率普遍高于男性的录取率。
这个现象引起了他的兴趣,从而提出了辛普森悖论。
辛普森悖论的定义是指当我们将数据按照一定的分组方式进行分类时,不同的分组结果可能会导致与整体逻辑相反的结论。
简单来说,辛普森悖论是一个由于分组方式的不同而导致结论相反的现象。
这个悖论的原理可以通过以下的例子来说明。
假设某个医学研究人员对一种药物的疗效进行了实验,结果显示,在总体上,该药物的治愈率明显高于安慰剂。
然而,如果将研究对象按照不同的年龄分组,会发现在每个年龄组中,安慰剂的治愈率都高于药物的治愈率。
这种情况下,如果只考虑总体数据,我们可能会错误地认为该药物是有效的,但实际上在每个年龄组内的数据中,药物的治愈率又相对较低。
这个例子清楚地展示了辛普森悖论的原理,即在整体数据统计的基础上,如果不考虑具体的细分情况,很容易得出错误的结论。
辛普森悖论的出现是由于不同分组下的样本数量和特征的不同所导致的。
在统计分析中,如果样本数量不均衡,或者不同分组的特征差异较大,都有可能出现辛普森悖论。
因此,在进行统计推断时,我们必须考虑到不同分组的分布情况,并对数据进行充分的分析和解读。
为了更好地理解辛普森悖论,我们再举一个实际例子。
假设某公司在两个不同城市进行了销售活动,结果显示在每个城市中,男性销售员的销售额都高于女性销售员。
然而,当将数据按照不同年龄段进行划分后,发现在每个年龄段中,女性销售员的销售额都高于男性销售员。
统计学悖论1. 什么是统计学悖论?统计学悖论是指在统计学中,可能出现的违背直觉的现象。
这些现象通常违反着我们的常识和直觉,但在统计学中却是有可能出现的。
2. 统计学悖论的例子一个著名的例子是著名的蒙提霍尔问题。
问题是这样的:有三扇门,其中一扇门后面有一辆汽车,另外两扇门后面是山羊。
你选择一扇门,主持人会打开另外一扇门,露出一只山羊。
然后,主持人问你是否要更换选择。
直觉上,更换选择并不会影响胜率。
然而,实际上更换选择可以使你的胜率提高到2/3。
另一个例子是著名的赫尔曼-玛斯洛夫斯基悖论。
这个悖论是关于一个人在一个大城市中的出租车司机。
这个司机有两个儿子,一个是医生,一个是出租车司机。
问题是:哪个儿子更有可能是司机的大儿子?直觉上,两个儿子的概率应该是相等的。
然而,实际上司机的大儿子更有可能是医生,因为题目已经给出了他是出租车司机。
3. 统计学悖论的原因统计学悖论的原因在于我们的直觉和常识往往是基于我们的经验和日常生活中的观察。
然而,统计学中的问题往往涉及到大量的数据和概率,这使得我们的直觉和常识很容易被误导。
此外,统计学悖论的出现也与统计学中的假设和模型有关。
当我们使用不恰当的假设和模型时,就有可能出现悖论。
4. 如何避免统计学悖论?为了避免统计学悖论,我们应该注意以下几点:- 理解概率和统计学的基本原理,包括贝叶斯定理等。
- 使用恰当的假设和模型,以及合适的统计方法。
- 尽可能地获取更多的数据,并进行充分的分析和解释。
这可以帮助我们更好地理解数据和模型,从而避免悖论的出现。
5. 结论统计学悖论是一个令人困惑和令人惊讶的现象,但它也提醒我们在进行数据分析和统计建模时要谨慎,要保持警觉。
只有通过正确的理论和实践,才能最大限度地利用数据和统计学的力量。
统计学陷阱——辛普森悖论如果你在数据科学领域还只是个新手,那么建议你先看看《五本书带你入门数据科学》,入门之后,再看《R语言案例实战》系列。
辛普森悖论当人们尝试探究两种变量(比如新生录取率与性别)是否具有相关性的时候,会分别对之进行分组研究。
然而,在分组比较中都占优势的一方,在总评中有时反而是失势的一方。
该现象于20世纪初就有人讨论,但一直到1951年,E.H.辛普森在他发表的论文中阐述此一现象后,该现象才算正式被描述解释。
后来就以他的名字命名此悖论,即辛普森悖论。
辛普森悖论案例一所美国高校的两个学院,分别是法学院和商学院。
新学期招生,人们怀疑这两个学院有性别歧视。
现作如下统计:法学院:商学院:根据上面两个表格来看,女生在两个学院都被优先录取,即女生的录取比率较高。
现在将两学院的数据汇总:在总评中,女生的录取比率反而比男生低。
辛普森悖论原因分析辛普森悖论出现的原因,可以使用下面这幅图来进行解答。
在上面这个图形中,X 轴代表申请的总人数,Y 轴代表录取的人数,那么 Y/X,也就是直线的斜率,和录取率正相关。
(a1, a2) 代表法学院的男生,(A1, A2) 代表法学院的女生。
可以看到,法学院女生的斜率比法学院男生的斜率要高,代表法学院女生的录取率比法学院的男生的录取率要大。
同理,(b1, b2) 代表商学院的男生,(B1, B2) 代表商学院的女生。
可以看到,商学院女生的斜率比商学院男生的斜率要高,代表商学院女生的录取率比商学院的男生的录取率要大。
尽管如此,来看总体直线的斜率,总体男生的斜率(A1+B1, A2+B2) 的斜率,比总体女生的斜率 (a1+b1, a2+b2) 的斜率,还要大。
这个就是辛普森悖论的图形化解释,非常直观清晰。
如何避免辛普森悖论为了避免辛普森悖论的出现,就需要斟酌各分组的权重,并乘以一定的系数去消除以分组数据基数差异而造成的影响。
同时,我们必需清楚了解情况,以综合考虑是否存在造成此悖论的潜在因素。
王孟源:逻辑——一个重要的统计悖论王孟源事实与逻辑两个多月前,我在留言栏(参见《我的新冠经验》,第40楼)讨论了培养推理能力的几个步骤:首先必须熟悉逻辑叙述(Logical Statement)的基本规则,然后可以研究常见的狡辩术,再进一步则要瞭解常被用来欺矇外行人的假专业论述,例如统计。
之前,我已经写过《常见的狡辩术》和《统计与谎言》两篇博文来介绍若干相关的细节,今天我想对后者做一个补充。
《统计与谎言》一文所讨论的是有意用统计数字来撒谎的一些事例,但其实统计本身就蕴含许多陷阱,即使是诚实的研究人员也往往陷入错误的结论而不自知,其中很重要的一个误区叫做Simpson’s Paradox(辛普森悖论)。
这是选择性偏差的一个特例;其他常见的选择性偏差还包括倖存者偏差和Berkso n’s Paradox辛普森悖论最著名的案例来自一篇1975年发表在《Science》的论文(参见《Sex Bias in Graduate Admissions》,/~mbognar/1030/Bickel-Berkeley.pdf ),文章对UC Berkeley在1973学年研究所招生的数据做了统计,发现男生的录取率是3738/8442=44.3%,而女生则是1494/4321=34.6%。
如果这个结果就这样被媒体报导,几乎可以确定校方会被严厉批评為性别歧视的男性沙文主义者,然而…论文作者把录取人数根据不同的系所细分开来。
因为系所太多,这里我们只检验其中最大的四个,这时男生的录取率是1123/2127=52.8%,女生是439/1101=39.9%,差距更大了!不过请看更详细的资料:四个系所中,只有C略偏男生,而且差别很小,A、B和D都优先录取女生,其中A对女性的偏爱程度极高,明显不是统计噪音。
之所以会有这样互相矛盾的两种结论,在於决定录取率的最重要变数其实是系所:A和B的整体录取率是2/3,而C和D只有1/3。
如果忽略这个主要变数,硬是把所有的数据迭加在一起,那么真正影响男女录取率差别的,就是他们的系所选择偏好,而不是性别本身。