【精选】统计学 统计学-——典型案例、问题和思想-精心整理
- 格式:doc
- 大小:390.78 KB
- 文档页数:57
使用统计学方法解决实际问题的案例分析统计学是一种应用数学,它通过收集、整理、分析和解释数据,来帮助人们理解和解决实际问题。
统计学方法可以应用于各个领域,包括商业、医疗、环境、教育等。
本文将通过案例分析的形式,了解如何使用统计学方法解决实际问题。
案例一:零售业销售数据分析某零售业公司想要了解其销售数据的走势,以便做出更好的营销决策。
他们提供了过去一年的销售数据,包括每月销售额、销售量、促销活动等信息。
首先,利用统计学方法对销售数据进行分析。
通过统计学方法,我们可以计算出销售额和销售量的平均值、中位数和标准差,以了解销售数据的分布情况。
同时,我们可以利用相关系数分析销售额和促销活动之间的关系,以确定促销活动对销售额的影响程度。
接下来,我们可以利用数据可视化工具,如折线图、柱状图等,将销售数据进行可视化展现。
通过可视化分析,我们可以清晰地看到销售额和销售量的变化趋势,以及促销活动对销售额的影响程度。
司提供相关建议,比如哪些产品在不同月份的销售额最高,何时进行促销活动效果最好等。
这些建议将帮助零售业公司改进营销策略,提高销售业绩。
案例二:医疗数据分析某医疗机构想要了解患者的就诊情况,以便改进医疗服务。
他们提供了过去一年的门诊和住院病例数据,包括就诊人数、疾病种类、就诊费用等信息。
首先,利用统计学方法对就诊数据进行分析。
我们可以计算出就诊人数和就诊费用的平均值、中位数和标准差,以了解就诊数据的分布情况。
同时,我们可以利用频数分析疾病种类的分布情况,以确定不同疾病在就诊人群中的比例。
接下来,我们可以利用数据可视化工具,如饼状图、条形图等,将就诊数据进行可视化展现。
通过可视化分析,我们可以清晰地看到不同疾病在就诊人群中的比例,以及不同疾病的就诊费用情况。
提供相关建议,比如哪些疾病在就诊人群中的比例较高,哪些疾病的就诊费用较高等。
这些建议将帮助医疗机构改进医疗服务,提高患者满意度。
综上所述,统计学方法可以帮助人们理解和解决实际问题。
案例2 美国国家健康照顾协会美国国家健康照顾协会的主要任务是了解健康照顾人力资源的短缺情况,并为未来制定发展规划。
为了掌握护理人员对所从事工作的满意程度,该协会发起了一场全国性的有关医院护理人员的调查研究。
调查项目包括:工作满意度、收入、晋升机会等,填答方式采用打分制,从0~100分,分值高表示满意度高。
下面是其中的一部分调查结果:工作收入晋升工作收入晋升714958727631845363712574847437694716876649905623725979842862723786863759725740703854634878867272846029875157906266779051735655713655946052755392844266745982855664765154885552956652747051896662714568855767884942654268902767823754858946826056795941898064726045744763883647824891776075907670644361785272另外,按医院招募护理人员的方式,对上述资料的分组结果如下:私人医院退伍军人医院大学附属医院工作收入晋升工作收入晋升工作收入晋升7259407149588453639062668474378766498442667237867259798556646348768855527145688460297470518849427356558589464 11 01628726045946052795941883647902767494716776075727637905623644361863759779051712574867272713655842862956652755392703854654268765154875157823754898064745982826056896662907670855767785272744763824991要求:运用描述统计方法对资料进行处理,采用的表示方法要让人能够方便地获取相应的信息,对你发现出的问题给予讨论。
统计学误用案例案例一:平均数的陷阱。
咱就说有个小公司,老板想显示员工工资待遇还不错。
公司有10个员工,1个经理月薪10万,然后9个普通员工月薪3000。
老板一算,平均工资=(100000 + 9×3000)÷10 = 12700元。
然后对外宣称公司平均月薪12700元,好多人一听,哇,这工资挺高啊。
但实际上呢,除了那个经理,大部分普通员工的工资少得可怜,这个平均数就完全误导了大家对这个公司工资水平的真实印象。
这就像是拿姚明的身高和一群小学生的身高求平均,然后说这个平均身高就代表大家的身高水平,那可太扯了。
案例二:样本偏差。
有个保健品公司想做个产品调查,证明他们的保健品特别有效。
他们就在自己的专卖店门口找那些来买保健品的人做调查,问“您觉得我们的保健品效果好不好呀?”结果大部分人都说好。
为啥呢?因为来专卖店买的人本来就是相信这个产品才来买的呀,这就是一个有偏差的样本。
就好比你想知道大家喜不喜欢吃榴莲,你专门跑到榴莲专卖店门口去问,那肯定大部分人都说喜欢,这根本就不能代表全体人群的真实想法。
这保健品公司就拿着这个不靠谱的调查结果到处宣传,这就是对统计学的误用。
案例三:相关性误为因果性。
你看,有人发现,在某个城市,冰淇淋的销量和溺水死亡人数在夏天都上升了。
然后就有个“天才”说,冰淇淋会导致溺水。
这可就太荒谬了。
其实呢,这两者只是有相关性,因为夏天到了,天气热,吃冰淇淋的人多了,同时去游泳的人也多了,所以溺水死亡人数也增加了。
这就像每次公鸡打鸣之后太阳就升起来了,但我们不能说公鸡打鸣是太阳升起的原因一样,这种把相关性硬说成因果性的事儿,在统计学里可是个大错特错的事儿。
《统计学》案例——相关回归分析案例一质量控制中的简单线性回归分析1、问题的提出某石油炼厂的催化装置通过高温及催化剂对原料的作用进行反应,生成各种产品,其中液化气用途广泛、易于储存运输,所以,提高液化气收率,降低不凝气体产量,成为提高经济效益的关键问题。
通过因果分析图和排列图的观察,发现回流温度是影响液化气收率的主要原因,因此,只有确定二者之间的相关关系,寻找适当的回流温度,才能达到提高液化气收率的目的。
经认真分析仔细研究,确定了在保持原有轻油收率的前提下,液化气收率比去年同期增长1个百分点的目标,即达到12.24%的液化气收率。
2、数据的收集目标值确定之后,我们收集了某年某季度的回流温度与液化气收率的30组数据(如上表),进行简单直线回归分析。
3.方法的确立设线性回归模型为εββ++=x y 10,估计回归方程为x b b y10ˆ+= 将数据输入计算机,输出散点图可见,液化气收率y 具有随着回流温度x 的提高而降低的趋势。
因此,建立描述y 与x 之间关系的模型时,首选直线型是合理的。
从线性回归的计算结果,可以知道回归系数的最小二乘估计值b 0=21.263和b 1=-0.229,于是最小二乘直线为x y229.0263.21ˆ-= 这就表明,回流温度每增加1℃,估计液化气收率将减少0.229%。
(3)残差分析为了判别简单线性模型的假定是否有效,作出残差图,进行残差分析。
从图中可以看到,残差基本在-0.5—+0.5左右,说明建立回归模型所依赖的假定是恰当的。
误差项的估计值s=0.388。
(4)回归模型检验 a.显著性检验在90%的显著水平下,进行t 检验,拒绝域为︱t ︱=︱b 1/ s b1︱>t α/2=1.7011。
由输出数据可以找到b 1和s b1,t=b 1/ s b1=-0.229/0.022=-10.313,于是拒绝原假设,说明液化气收率与回流温度之间存在线性关系。
b.拟合度检验判定系数r 2=0.792。
《统计学》案例——综合分析关于居民月收入和居民金融资产影响因素关系的调查1、问题的提出改革开放以来。
中国居民家庭财富的效量不断增长。
居民储蓄存款持续稳定的增加。
从1978年的210.6亿元一路攀升,到2008年已达217885.4亿元。
在三十年的时间里增加了一千多倍。
与此同时,经济的货币化程度大大提高,金融市场特别是资本市场得到发展,使得居民金融资产选择的空同逐步扩大,导致了家庭金融资产多样化。
影响家庭金融资产组合的主要因素家庭金融资产选择主要受三类因素的影响:l、家庭内部因素(收入水平以及家庭财务状况;家庭的特征:成员的性别、年龄、婚姻状况、受教育程度、职业、健康状况、以及家庭人口数等;家庭成员的风险厌恶程度;住房所有权)。
2、金融资产特性随着资本市场的发展。
3、经济金融环境。
这些影响因素对居民金融资产的影响程度到底孰重孰轻呢?2、数据的收集为确定各类因素对居民金融资产的大小影响,有效地解居民关于金融资产和有关因素的现状,做了以下调查。
随机抽取了64户温州居民代表,以下为64位家庭各行业月收入和家庭金融资产(各种储蓄、有价证券、手存现金等)资料。
表1温州64位家庭各行业月收入和家庭金融资产信息表表1是一个样本总体,由随机抽取的64户居民家庭组成,总体则是温州市的全体居民家庭。
从这64户家庭中所调查登记的月收入和金融资产的具体数据是标志值。
3、方法的确定3.1.按标志对数据分组对这64户的调查资料进行整理,按月收入和金融资产两标志进行分组。
对于按月收入进行分组整理的结果见表2。
表2.按月收入分组(元)户数月收入(元)金融资产(万元)甲(1)(2)(3)500以下 3 1466 2.95500-1000 6 4125 8.931000-1500 13 16556 33.43表2中的各组和总体的“户数”是单位总量,各组和总体的“月收入”、“金融资产”是标志总量,它们是反映总体综合数量特征的指标。
对原始数据进行因果依存关系分组,见表3。
统计学案例案例一我国高等教育国际竞争力的分析研究一、教学目的1、明确对高等教育国际竞争力进行研究的意义及方法;2、学会根据研究的问题,正确、科学地设置对该问题进行评价的统计指标;3、掌握统计数据的收集与整理的方法,认识到统计数据在统计分析中的重要性;4、在综合掌握各种统计分析方法的基础上,根据所提问题的性质,能选择合适的统计分析方法;5、明确指标无量纲化的意义,掌握无量纲化的一般方法;6、掌握统计分析中权数的确定方法,明确模糊综合评价法在统计分析中应用;7、学会根据统计资料,对所研究的问题进行分析研究,并提供有情况、有分析、有对策的分析研究报告。
二、背景材料我国高等教育国际竞争力的分析研究经济全球化趋势及知识经济浪潮使包括人才在内的资源竞争更加激烈,信息共享程度更高,我国高等教育面临严峻的考验和挑战,对现代大学教育提出了新的要求和使命。
研究我国高等教育国际竞争力,科学发展我国的高等教育,应站在全球化高度,优化资源配置,增强创新能力,提高高等教育的竞争力,把握机遇,谋划未来,深化改革,提高教学质量,增强其国际竞争力。
因此,进行高等教育国际竞争力的研究,保持我国高等教育的可持续发展,具有非常重要的理论意义和现实意义。
一、高等教育国际竞争力的基本理论1、竞争、竞争力及高等教育国际竞争力的基本涵义“竞争系个人(或集团)间的角逐;凡两方或多方力图取得并非各方均能获得的某些东西时,就会有竞争,竞争与人类历史同样悠久。
”竞争是市场经济的基本法则,它不仅是经济学家和生物学家研究的对象,也是教育学家常常思考的问题。
从理论上讲,竞争力具有相对与绝对两种含义:绝对竞争力指个人、单位或国家在竞争日趋激烈的条件下其持续发展的能力,它很难用一个准确的计量单位来衡量。
而相对竞争力指个人、单位或国家其持续发展的能力在相互比较中所处的位置,一般可通过比较排名来相对体现。
从统计学的角度来说,绝对竞争力采用的是定距尺度,而相对竞争力采用的是定序尺度。
统计学案例总量指标与相对指标案例1:指出下面的统计分析报告摘要错在哪里?并改正:1、本厂按计划规定,第一季度的单位产品成本应比去年同期降低10%,实际执行结果是,单位产品成本较去年同期降低8%,仅完成产品成本计划的80%(即8%÷10%=80%)。
2、本厂的劳动生产率(按全部职工计算)计划在去年的基础上提高8%,计划执行结果仅提高4%,劳动生产率的计划任务仅实现一半(即4%÷8%=50%)。
3、该车间今年1月份生产老产品的同时,新产品首次小批投产,出现了2件废品(按计算,车间废品率为1.2%)。
2月份老产品下马,新产品大批投产,全部制品1000件,其中废品8件,废品量是1月份的4倍,因此产品质量下降了。
4、在组织生产中,本厂先进小组向另一组提出高产优质的挑战竞赛。
本月先进小组的产量超过了另一小组的1倍,但是在两组废品总量中该组却占了60%,所以在产品质量方面,先进小组明显地落后了。
案例11试计算所有可能计算的相对指标。
案例2:根据下表资料分析哪个企业对社会贡献更大?平均指标与变异指标案例3、以组平均数补充说明总平均数案例4:某单位有10个人,其中1人月工资为10万元,9人每人月工资为1000元。
该单位职工月平均工资为10900元。
即:)(109001091000100000元=⨯+你认为这个平均数有代表性吗?如果缺乏代表性应如何改正?案例5:以下是各单位统计分析报告的摘录1、 本局所属30个工厂,本月完成生产计划的情况是不一致的。
完成计划90%的有3个,完成96%的有5个,完成102%的有10个,完成110%的有8个,完成120%的有4个。
平均全局生产计划完成程度为104.33%。
即:304%1208%11010%1025%963%90⨯+⨯+⨯+⨯+⨯=104.33%2、 本厂开展增产节约运动以后,产品成本月月下降,取得显著的成绩,根据财务部门的报告,1 月份开支总成本15000元,平均单位产品成本为15元,2月份开支总成本25000元,平均单位产品成本下降为10元,3月份开支总成本45000元,平均单位产品成本仅8元。
《统计学》案例——描述性分析大学毕业生的表现1、问题的提出某大学是一所综合性大学,有三个附属学院,分别是商贸学院、生物学院和医学院。
近期高校管理层为了了解社会对本校学生的满意程度,以此促进本校教学改革,其中进行了一项对本校的毕业生调查,随机抽取了48名毕业生组成样本,要求他们所在的工作单位对其工作表现、专业水平和外语水平三个方面的表现进行评分,评分由0到10,分值越大表明满意程度越高。
2、数据的收集表:48名毕业生工作表现、专业水平和外语水平评分资料表表:三个学院的48名毕业生的工作表现、专业水平和外语水平评分汇总表校管理层希望在调查分析报告中阐述以下几个问题:(1)用人单位对该校毕业生哪个方面最为满意? 哪个方面最不满意?应在哪些方面做出教学改革?(2)用人单位对该校毕业生哪个方面的满意程度差别最大?什么原因产生?(3)社会对三个学院的毕业生的满意程度是否一致?能否提出提高社会对该校毕业生的满意程度的建议?2、方法的确定将数据输入计算机,我们用Excel中的数据分析功能实现对数据的描述。
输出结果如下图表。
表:48名毕业生的评分统计汇总表表7 三个学院的48名毕业生的评分统计汇总表图24、结果分析从图可看出,随机抽取48名毕业生是由附属商贸学院、生物学院和医学院毕业生组成,各学院毕业生人数分别是17人、17人和14人,分别占样本的35.4%、35.4%和29.2%,可见各学院抽取毕业生人数大致相同,样本具有一定代表性。
从表可看出:①用人单位对某大学毕业生的工作表现评估分最高,而外语水平评估分最低。
工作表现平均评估分为8.04分,外语水平平均评估分为5.08分,两者平均评估分相差2.96分,由此可见用人单位最满意该校毕业生的工作表现,最不满意毕业生的外语水平,这反映出某大学注意培养学生社会实践能力,也反映出毕业生适应能力较强。
从用人单位对毕业生外语水平评分普遍偏低看,反映出该校的外语教学方面存在严重问题,今后需要在外语教学方面加大力度全面改革。
统计学案例简介统计学是一门研究如何收集、整理、分析和解释数据的学科。
它是现代社会科学中不可或缺的一部分,广泛应用于各个领域,如经济学、医学、社会学等。
本文将介绍一个统计学案例,以便读者更好地理解统计学的应用和意义。
案例背景假设我们是一家制药公司的市场营销团队成员,我们的公司最近开发了一种新的镇痛药,并希望通过市场调查来了解目标患者对该药物的需求和接受程度。
我们决定进行一项调查研究,以便更好地了解市场需求,从而能够制定出更好的推广策略。
调查目的我们的调查目的是测量目标患者对我们的新镇痛药的需求和接受程度。
通过收集和分析相关数据,我们希望能够回答以下问题:1.目标患者对新药的认知程度如何?2.目标患者使用镇痛药的频率和用途是什么?3.目标患者对新药的满意度如何?4.目标患者是否愿意推荐给其他患者?调查设计为了回答上述问题,我们决定设计一份问卷调查。
问卷包括以下几个方面的问题:1.基本信息:包括患者年龄、性别、教育水平等。
2.药物认知程度:包括患者是否了解过该药物,了解程度如何。
3.使用频率和用途:包括患者使用镇痛药的频率、使用的原因和目的等。
4.满意度评价:包括患者对新药的满意度评级。
5.推荐意愿:包括患者是否愿意向其他患者推荐该药物。
我们将根据实际情况,选择合适的调查方式,如在线调查、电话访谈或面对面访谈。
为了提高问卷回收率,我们可能采取一些奖励措施,如抽奖或赠送小礼品。
数据收集与分析在进行调查时,我们将努力收集尽可能多的数据样本,以确保结果的可靠性和准确性。
通过统计学的方法,我们可以对数据进行分析,并得出一些有意义的结论。
例如,通过计算样本中不同年龄和性别的患者所占的比例,我们可以了解患者的分布情况。
通过计算药物认知程度的回答情况,我们可以找出不同患者群体对该药物的认知程度有何差异。
我们还可以计算患者使用镇痛药的频率和用途的统计数据,如平均值、中位数和众数等,以更好地了解患者对药物的需求和使用情况。
统计学数据分析案例在统计学中,数据分析是一项重要的工作。
通过对数据的收集、整理、分析和解释,我们可以发现数据背后的规律和趋势,为决策提供支持和参考。
下面,我们将通过几个实际案例来展示统计学数据分析的应用。
案例一,销售数据分析。
某公司在过去一年的销售数据显示,不同产品的销售额有所不同。
为了更好地了解产品销售情况,我们对销售额进行了统计分析。
通过对比不同产品销售额的均值、中位数和标准差,我们发现其中一款产品的销售额波动较大,而另一款产品的销售额相对稳定。
结合市场情况和产品特点,我们提出了针对性的销售策略建议,以优化产品组合和提高销售效益。
案例二,用户行为数据分析。
某互联网平台收集了大量用户的行为数据,包括浏览量、点击量、购买量等。
我们通过对用户行为数据的分析,发现了不同用户群体的行为特点。
通过构建用户行为模型,我们可以预测用户的行为偏好和购买意向,为平台运营和营销活动提供了有力的数据支持。
案例三,医疗数据分析。
在医疗领域,数据分析对于疾病预测、诊断和治疗具有重要意义。
通过对患者的临床数据进行统计分析,我们可以发现不同疾病的发病规律和影响因素。
同时,结合医学知识和统计模型,我们可以建立疾病预测和诊断模型,为临床决策提供科学依据。
通过以上案例,我们可以看到统计学数据分析在不同领域的广泛应用。
通过对数据的深入挖掘和分析,我们可以发现隐藏在数据背后的规律和价值,为决策和实践提供有力支持。
因此,数据分析不仅是统计学的重要内容,也是现代社会决策和管理的重要工具。
希望通过本文的案例分析,能够加深对统计学数据分析的理解,提高数据分析能力,为工作和生活带来更多的价值和意义。
第1篇一、引言统计学是一门研究数据的收集、整理、分析和解释的学科。
在教育领域,统计学发挥着至关重要的作用。
通过对学生成绩的统计分析,教育工作者可以更好地了解学生的学习状况,从而制定有效的教学策略。
本文将以一个经典案例为例,探讨统计学在教育中的应用。
二、案例背景某市一所中学为了提高教学质量,决定对七年级全体学生的数学成绩进行一次全面调查。
学校希望通过统计分析,了解学生的整体学习水平,为教师提供有针对性的教学建议。
三、数据收集该校七年级共有300名学生,其中男生150人,女生150人。
在调查中,学校采用了问卷调查和考试成绩两种方式收集数据。
问卷调查主要收集学生的基本信息,如年龄、家庭背景等;考试成绩则反映了学生在数学学科的学习水平。
四、数据分析1. 数据整理首先,将收集到的数据进行整理,包括学生的基本信息和数学考试成绩。
将数据录入Excel表格,便于后续分析。
2. 描述性统计(1)计算平均成绩、中位数、众数、标准差等指标,了解学生数学成绩的集中趋势和离散程度。
平均成绩 = 总成绩 / 学生人数中位数 = 将所有成绩从小到大排序后,位于中间的数值众数 = 出现次数最多的成绩标准差 = 各个成绩与平均成绩之差的平方和的平均数的平方根(2)分析性别对成绩的影响,比较男生和女生在数学成绩上的差异。
3. 相关性分析(1)计算数学成绩与年龄、家庭背景等变量的相关系数,了解这些因素对成绩的影响。
(2)分析各科成绩之间的相关性,判断是否存在学科间的相互影响。
4. 交叉分析(1)根据性别、家庭背景等变量,将学生分为不同群体,分析各群体在数学成绩上的差异。
(2)根据学生的成绩水平,将学生分为优秀、良好、一般、较差四个等级,分析各等级学生的性别、家庭背景等特征。
五、结果与讨论1. 描述性统计结果显示,该校七年级学生的数学平均成绩为75分,中位数为70分,众数为80分,标准差为10分。
说明该校学生的数学成绩整体处于中等水平,但存在一定程度的波动。
经济管理类“十二五”规划教材统计学-基于典型案例、问题和思想主讲林海明第一章绪论【引言】我们从如下9个重要事例,说明统计学有什么用。
事例1:二次世界大战中,最激烈的空战是英国抗击德国的空战,英军为了提高战斗力,急需找到英军战机空战中的危险区域加固钢板,统计学家瓦尔德用统计学方法找到了危险区域,英军用钢板加固了这些危险区域,使英军取得了空战的胜利。
事例2:上世纪20-30年代,为了找到中国革命的主力军和道路,政治家毛泽东悟出了统计学的频数方法,用此找到了中国革命的主力军是农民,中国革命的道路是农村包围城市。
由此不屈不饶的奋斗,由弱变强,建立了独立自主的中华人民共和国,他还发现了“没有调查,就没有发言权”的科学论断。
事例3:1998年,美国博耶研究型大学本科生教育委员会发表了题为《重建本科生教育:美国研究型大学发展蓝图》的报告,该报告指出:为了培养科学、技术、学术、政治和富于创造性的领袖,研究型大学必须“植根于一种深刻的、永久性的核心:探索、调查和发现”。
这说明了统计学中调查的重要性。
事例4:在居民收入贫富差距的测度方面,美国统计学家洛仑兹(1907)、意大利经济学家基尼(1922)找到了统计学的洛仑兹曲线、基尼系数,由此给出了居民收入贫富差距的划分结果,为政府改进居民收入贫富不均的问题提供了政策依据。
事例5:二战后产品质量差的日本,以田口玄一为代表的质量管理学者用统计学方法找到了3σ质量管理原则,用其大幅提高了企业的产品质量,其产品畅销海内外,日本因此成为当时的第二经济强国。
该学科现已发展到了6σ质量管理原则。
事例6:在第二次世界大战的苏联卫国战争中,专家们用英国统计学家费歇尔(1 925)的最大似然法、无偏性,帮助苏军破解了德军坦克产量的军事秘密,由此苏军组织了充足的军事力量并联合盟军,打败了德军的疯狂进攻并占领了柏林。
事例7:在产品质量检验方面,英国统计学家戈赛特(1908)、波兰统计学家奈曼(1934)找到了统计学的t-检验方法,为企业、质量监督部门、消费者的产品质量检验,大大提高了工作效率,t-检验成为二十世纪质量改进的第一次大贡献。
统计学典型案例想象有个医院,要比较两种治疗方法,一种是传统疗法,一种是新疗法。
医院有两个科室,内科和外科。
在内科呢,用传统疗法治疗了100个病人,有80个人康复了,康复率那就是80%。
用新疗法治疗了50个病人,有40个人康复了,康复率是80%。
看起来两种疗法在内科效果一样好。
再看外科,传统疗法治疗了50个病人,有20个康复了,康复率是40%。
新疗法治疗了100个病人,有60个康复了,康复率是60%。
在外科新疗法更好。
但是啊,如果把内科和外科的数据合起来看,传统疗法总共治疗了100 + 50=150个病人,康复的有80 + 20 =100个,康复率是100/150≈66.7%。
新疗法总共治疗了50+100 =150个病人,康复的有40+60 =100个,康复率也是100/150≈66.7%。
你看,单独看每个科室的时候,新疗法在外科表现更好,和传统疗法在内科表现一样好。
但整体看呢,两种疗法又好像一样好。
这就是辛普森悖论,它告诉我们在看统计数据的时候,可不能光看总体,有时候得拆开不同的分组来看,不然就很容易被数据骗啦。
还有个关于平均数的有趣例子。
有个小公司,老板想给员工涨工资,来激励大家好好干活。
这个公司里有普通员工和经理。
普通员工的工资普遍比较低,比如有5个普通员工,工资分别是3000、3500、4000、4500、5000元。
那普通员工的平均工资就是(3000 + 3500 + 4000 + 4500 + 5000)÷5 = 4000元。
有3个经理,工资分别是10000、12000、15000元,经理的平均工资就是(10000 + 12000 + 15000)÷3 = 12333元左右。
整个公司员工(5个普通员工 + 3个经理)的平均工资就是(3000 + 3500 + 4000 + 4500 + 5000+10000 + 12000 + 15000)÷8 = 6750元左右。
经济管理类“十二五”规划教材统计学-基于典型案例、问题和思想主讲林海明努力第一章绪论【引言】我们从如下9个重要事例,说明统计学有什么用。
事例1:二次世界大战中,最激烈的空战是英国抗击德国的空战,英军为了提高战斗力,急需找到英军战机空战中的危险区域加固钢板,统计学家瓦尔德用统计学方法找到了危险区域,英军用钢板加固了努力这些危险区域,使英军取得了空战的胜利。
事例2:上世纪20-30年代,为了找到中国革命的主力军和道路,政治家毛泽东悟出了统计学的频数方法,用此找到了中国革命的主力军是农民,中国革命的道路是农村包围城市。
由此不屈不饶的奋斗,由弱变强,建立了独立自主的中华人民共和国,他还发现了“没有调查,就没有发言权”的科学论断。
努力事例3:1998年,美国博耶研究型大学本科生教育委员会发表了题为《重建本科生教育:美国研究型大学发展蓝图》的报告,该报告指出:为了培养科学、技术、学术、政治和富于创造性的领袖,研究型大学必须“植根于一种深刻的、永久性的核心:探索、调查和发现”。
这说明了统计学中调查的重要性。
事例4:在居民收入贫富差距的测度方努力面,美国统计学家洛仑兹(1907)、意大利经济学家基尼(1922)找到了统计学的洛仑兹曲线、基尼系数,由此给出了居民收入贫富差距的划分结果,为政府改进居民收入贫富不均的问题提供了政策依据。
事例5:二战后产品质量差的日本,以田口玄一为代表的质量管理学者用统计学方法找到了3σ质量管理原则,用其大幅提高了企业的产品质量,其产品畅销海内外,努力日本因此成为当时的第二经济强国。
该学科现已发展到了6σ质量管理原则。
事例6:在第二次世界大战的苏联卫国战争中,专家们用英国统计学家费歇尔(1 925)的最大似然法、无偏性,帮助苏军破解了德军坦克产量的军事秘密,由此苏军组织了充足的军事力量并联合盟军,打败了德军的疯狂进攻并占领了柏林。
事例7:在产品质量检验方面,英国统努力计学家戈赛特(1908)、波兰统计学家奈曼(1934)找到了统计学的t-检验方法,为企业、质量监督部门、消费者的产品质量检验,大大提高了工作效率,t-检验成为二十世纪质量改进的第一次大贡献。
事例8:在身高方面,矮父亲儿子的身高有比父亲高的趋势吗?高父亲儿子的身高有比父亲矮的趋势吗?英国统计学家高尔顿(1 886)用德国数学家高斯的最小二努力乘法(1801)找到了统计学的回归分析方法,解决了该问题。
该方法推广应用到经济学中,获得了三届诺贝尔经济学奖。
事例9:某些商品或大量商品价格的骤然上涨,会给老百姓的生活带来恐慌,会引起社会的普遍关注,如何及时反映市场商品价格的变化呢?德国经济学家帕歇(1 874)找到了统计学的指数分析方法,为政府解决问题提供了政策依据。
努力上述事例,我们看到了统计学在军事、政治、教育、社会、经济、质量管理、生物学领域的重要应用,看到了学者领袖瓦尔德、毛泽东、洛仑兹、基尼、田口玄一、费歇尔、戈赛特、高斯、高尔顿、帕歇的人文贡献和力量,看到了如下变量的数据:战机空战中的危险区域,革命的主力军和道路,大学的核心,居民收入,产品质量,坦克产量,身高,商品价格。
这些事例的努力进一步描述是本书一些章节开头部分的典型案例,通过这些典型案例读者可以对统计学的作用有一个较深入的了解,由此衔接各章所要学习的内容。
经济学家萨缪尔森认为:在许多与经济学有关的学科中,统计学特别重要。
事实上,在诺贝尔经济学奖获奖者中,三分之二以上的成果与统计和定量分析有关。
杜邦公司总经理理查德指出:现代公努力司在许多方面是根据统计来行事的。
2001年,我国经济学家、教育学家顾海良认为,统计学是二十一世纪最有前途的一门学科。
鉴于统计学为世界社会经济、科学技术的发展和进步作出了巨大贡献,2010年,第64届联合国大会第90次会议通过决议,每年10月20日为“世界统计日”。
2011年,我国将统计学上升为一级学努力科。
事实上,统计学和数据已渗透到社会生活、科学技术的方方面面。
统计学如此重要,那么究竟什么是统计学?统计学是如何解决实际问题的?统计学与数学、经济学等实质性学科有何区别与联系?这些是本章第一节所要介绍的内容。
第一节统计学的含义和作用努力一、什么是统计学?统计学发展至今已有300多年。
历史上,英文中的统计statistics与“国家”同一词根,即自从有了国家,统治者就用统计来管理国家。
1846年,比利时统计学家凯特勒在他的《概率论书简》《社会物理学》中认为:统计学是一门既研究社会现象又努力研究自然现象的方法论科学。
我们将从如下案例来认识统计学的含义和作用:【典型案例1】瓦尔德帮助英军找到了英军战机空战中的危险区域二战时期,英国和德国在英吉利海峡上空的空战非常惨烈,正义与邪恶达到了你死我活的胶着状态,为了提高英国空军的战斗力,英国统计学家瓦尔德被英国空军司令咨询:飞机上什么区域应该加强钢努力板?计,他和助手拿了飞机模型到机场,查看从空战中返航的军机受敌军创伤的弹孔位置,在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,英国统计学家瓦尔德努力几天后,他的飞机模型上几乎布满了有弹孔的区域,因为没有弹孔区域被击中的飞机都没有返航,有弹孔区域被击中的飞机照样返航,故没有弹孔区域是军机的危险区域,于是他提议,把剩下少数几个没有弹孔的区域加强钢板(颠覆了事前哪里有弹孔,钢板就加强哪里的传统做法)。
英国人按此加固了飞机,在最后一次空战后,英国空军司令说:如果德国再发动一次空努力战,我们就完了……但德国再也没有对英国发动一次空战了,英国胜利了!该案例是军事问题+统计学+智慧的成果,生动而充满人性的力量!瓦尔德因在统计决策领域的贡献而成为该领域的领袖。
从典型案例1中分析和提炼有《大不列颠百科全书》中的定义:统计学是收集、处理、分析和解释数据,以便更好决策的一门方法论学科。
努力数据是反映客观事物的特征及其表现,是统计学的研究对象。
当其表现是非数值时,是定性数据,如飞机员的姓名、性别等;当其表现是数值时,是数量数据,如飞机的弹孔位置等;当其表现是图像时,是图像数据,如飞机模型上布满了弹孔的区域等;当其表现是声音时,是声音数据,如飞机的轰鸣声等。
分析数据的方法有描述统计、推断统努力计。
如典型案例1中,“瓦尔德在他的飞机模型上逐个不重不漏地标示从空战中返航军机受敌军创伤的弹孔位置,几天后,他的飞机模型上几乎布满了有弹孔的区域”是描述统计及其结果。
描述统计是将所收集的数据处理后,用数值、表格或图形形式表现的有用信息。
“他的飞机模型上没有弹孔区域是军努力机的危险区域”是推断统计及其结果。
英军所有军机称为总体,总体的部分称为样本,推断统计就是根据样本数据特征去估计或检验总体的数据特征。
典型案例1的调查有特殊性:所掌握的数据只有样本数据-从空战中返航军机受敌军创伤的弹孔位置,这里的调查是破坏性的,不可能对总体的所有个体都进行观察和实验取得结果,而我们所需要的是总体的数据特征-英军所努力有军机空战中的危险区域。
这时必须用推断统计来解决问题,这是现代统计学的主要内容。
从典型案例1中分析和归纳有统计学的作用:在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。
当然,领袖是少数,执行者和参与者努力是多数,每个人都有自己的合理位置。
面对事例3中美国培养各领域领袖和当今各学科领域尖端知识、技术的严峻挑战,中国各学科领域应努力践行“探索、调查、发现”,培养和拥有自己各领域的领袖,这些领袖能引领中国人在相应的领域获得应有的独立性、自主性、平等性和话语权。
各学科领域培养和拥有自己的领袖应该是每个学科领域应有的使命和奋斗目标。
努力要发现客观世界规律,对统计数据通常有要求:客观性、适用性、准确性和及时性。
客观性是指能反映客观事实而不受任何偏见的影响或任何势力的干扰;适用性是指统计数据能适应解决问题的目的;准确性是指统计数据能够反映真实情况,不出现较大的误差;及时性是指统计数据应及时收集、整理、使用。
努力二、统计学是如何解决实际问题的?古人云:与其给人一堆猎物,不如给人一杆猎枪。
因此,统计学解决实际问题的思路(步骤)很重要。
从典型案例1中分析和提炼有统计学解决实际问题的基本思路(步骤)是:①提出与统计有关的实际问题;②建立有效的指标体系;努力③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据推断给出更好决策的建议。
不解决问题时,重复第②-⑥步。
学习中,当我们识别了这六步,就有了一个结构较完整的知识理解。
上述第一努力步尤其重要,数学家哈尔莫斯指出“问题是数学的心脏”,同样我们认为,问题是科学的心脏,因为有问题才知道目的,有问题才知道做什么,有问题才有进步、提高和希望。
三、统计学的发展和应用领域上述引言的重要事例中,从统计学的努力深入发展看,产生了统计调查、统计分布、参数估计、假设检验、相关与回归分析、时间序列分析、多元统计分析等丰富的统计学理论。
从统计学在各领域的应用上看,产生了应用统计学领域及其家族,见表1- 1。
事实上,只要有数据的地方,就会有统计学的应用,而各个领域都有数据,因此,统计学在各个领域都在发挥发现客观世界规律,更好决策的作用。
努力表1-1 应用统计学一览表努力统计学理论和应用统计学总是互相促进,共同提高的。
统计理论的研究为应用统计提供方法论基础,应用统计学在对统计方法的实际应用中,常会对统计学理论提出新的问题,开拓统计学理论的研究领域。
当然,统计学也可从自身不完善的理论中提出新问题。
作为经济和管理类的学生,所要学习的统计学主要是社会经济统计学。
其是一努力门以社会经济现象的数据为特定研究对象的应用统计学。
由于社会经济现象所具有的复杂性和特殊性,社会经济统计学不仅要应用一般的统计方法,而且还需要研究自己独特的方法,如核算的方法、指数方法、综合评价方法等。
通过社会经济统计,国家可以准确、及时、全面、系统地掌握国民经济和社会发展情况,对国民经济和社会运行监督和努力预警,为宏观调控和决策提供依据。
企业可以及时了解商品市场和要素市场运行的状况和企业自身的经营动态,为企业营销决策、投资理财决策提供参考。
四、统计学与数学、经济等实质性学科的联系与区别(一)统计学与数学努力在典型案例1中,数学只用到了空间解析几何的飞机模型。
即在统计学解决实际问题的步骤中,在数据的特征描述环节中会用到数学的一些公式和结论,但用得不多,会用就行,基本上不需要数学推导和证明。
数学中的概率论等,为统计学提供了数量分析的理论基础。
统计学理论以抽象的数量为研究对象,其大部分内容也可以看作是数学的分支。
努力统计学与数学的区别:从成果评价标准看,数学注重从假设到结论逻辑推导的正确性,而统计注重从客观世界发现规律及其更好决策。