当前位置:文档之家› 浅析统计学的起源

浅析统计学的起源

浅析统计学的起源
浅析统计学的起源

浅析统计学的起源

摘要从逻辑和历史两个角度对推断统计学的起源进行了尝试性的索关键词:统计史;起源

引言:史学研究历来受思想家们的重视,说史学研究应成为任何学科永恒的研究主题丝毫也不过分,因为早在两千多年前,中国古代伟大的思想家孔子,在论语中就曾留下了温故而知新的至理名言,而16世纪著名的英国哲学家培根也曾说过,读史使人明智。如果套用统计学里的一句专业术语,那就是历史具有遍历性。。

任何历史研究都必须首先限定其研究的时间范畴,对于推断统计史而言,一个首要问题就是:推断统计学的历史应该从哪里开始?为说明这个问题,我们首先探究一下统计学是什么。按一般统计学教材或百科全书上的定义:统计学是一门关于如何有效地收集、整理、表述、分析和解释数据的学科。其中的数据即为统计学的研究对象,因此统计学也被认为是一门从数据中获得有用信息的数据分析学科。需要强调的是,统计学研究的数据一定要具有随机性,也就是说可以通过某种概率分布规律来描述数据的分布状态,这一点也是统计学有别于其他处理数据学科的最重要特征。

在上述统计学的定义下,统计学又可划分为描述统计与推断统计。描述统计是一种通过图形、列表、数量化度量等方法描述样本数据基本特征的统计方法,其作用是对样本数据进行初步精炼,虽然在很多情况下样本数据的特征可用来推断总体的特征,但这需要给出推断的误差精度,由于描述统计中不包含任何关于误差精度的陈述,故

其结论也就仅局限于样本数据,与总体无关,从而也不存在推断问题。不过统计学的终极目的是希望通过样本来获取总体信息,故推断统计,即利用样本信息以及其它信息,获取有关样本所处总体信息的推断理论,就成为描述统计进一步发展的必然产物。下面我们引述有关文献给出的几个相当久远的例子加以说明。

古印度部落国王图潘纳为了炫耀自己的数学能力,他告诉自己的马车夫纳拉一个被放逐的国王,说他猜测出了一颗巨大果树两个枝干上的树叶与果实的数量,纳拉经过一夜的计算,吃惊地发现图潘纳的猜测非常接近实际的真实数量。这个故事来源于印度史诗摩诃婆罗多它最迟完成于公元400年。相当多的现代学者们认为,图潘纳是通过计算某一个典型小枝上树叶与果实的数量后,将其乘以整个果树上小枝的个数得到他的猜测的。

在伯罗奔尼撒战争中,古希腊的雅典人曾采取过架云梯突破敌人城墙的方法。由于建造适当高度的云梯就必须知道敌方城墙的高度,为此雅典人采取了如下方法来估算城墙高度:首先派一些士兵同时数前方敌城裸露部分城墙所砌砖的层数。虽然有一部分士兵的计数会发生错误,但大多数的计数结果应该是正确的,特别是出现最频繁的层数与那部分无法看见的城墙的层数会足够接近。然后通过猜测出来的城砖厚度乘以最频繁的层数估算出城墙的高度。这个故事来源于古希腊历史学家修西得底斯所著的伯罗奔尼撒战争史

应该说在我们给出的这些例子中,古人所使用的推断方法在形式上是属于推断统计学的,但这些方法没有给出有关推断结果的不确

定性的说明,因此也就没有资格纳入推断统计学的范畴,否则推断统计学的早期历史将是一串横亘数千年的高度离散且相互独立的离散点。

在另一个方向上,估计线性方程组中未知参数的工作首先起源于1750年德国天文学家梅耶(1723-1762)关于月亮天平动理论的研究。他设计出一套精巧的方法用来求解包含3个未知量却有27个观测数据的方程,具体做法是:以其中一个未知量的系数为准,按各方程中此系数的大小分组,即最大的9个,最小的9个,最后剩下的9个各成一组,然后将各组方程加总,并利用加总后的三个方程求解未知量。梅耶这样做的原因是,他相信加总后方程之间的差异越大,方程解的精度就会越高0[2]23。接下来的一个突破性的成果属于出生在拉古萨的著名学者波斯科维奇( 1711-1787)。1757年,波斯科维奇为了解决测量子午线长度问题提出了在假定误差之和为零的条件下,采用误差绝对值之和最小的求解原则。到了1787年,我们又一次看到了拉普拉斯,他在研究与梅耶类似的问题时,扩展了梅耶的方法,采用几种不同的组合方程方法来压缩方程的个数。最后是勒让德( 1752-1833),1805年他提出的最小二乘方法彻底地解决了求解方程组个数多于未知量的问题。但使上述两条主线最终汇聚在一起则要归功于德国伟大的科学家高斯( 1777-1855)。1809年高斯在其发表的天体物力学名著5天体绕日运行理论6中以出人意料的手法论证了观测误差服从正态分布,并利用拉普拉斯的逆概率方法证明了后验概率最大化与最小二乘方法的等价性。高斯的这一成就使18世纪以来的

推断统计学研究达到了巅峰,随后1810年拉普拉斯利用其刚刚发现的中心极限定理对高斯的结论进行了进一步的完善,从而导致了一个革命性的拉普拉斯与高斯思想相融合的新体系的建立。

从18世纪中叶至19世纪初,古典概率已走出以赌博游戏为主要研究对象的狭隘小圈子,投入到了科学领域的研究,并导致了推断统计的兴起。因此作者认为推断统计的历史始于1750年代。

上文从逻辑和历史两个角度对推断统计学的起源进行了尝试性的探索,然而历史研究,尤其是科学史的研究,是一项非常艰辛的工作。它要求研究者要认真地反复检查已被现代人遗忘了的史料,同时还要从更宽泛的视角来审视历史。但即便如此,也不能保证研究成果是完美的。正如肯德尔指出的:历史一定从某一点开始,历史没有开始.这句话似乎有点让人疑惑,但如果用非常简洁的斯蒂格勒错误命名律来解释,则会立即释然,那就是没有什么科学发现是以他的最初发明者命名的。

数理统计学的起源和发展doc

统计学起源于收集数据的活动,小至个人的事情,大至治理一个国家,都有必要收集种种有关的数据,如在我国古代典籍中,就有不少关于户口、钱粮、兵役、地震、水灾和旱灾等等的记载。现今各国都设有统计局或相当的机构。当然,单是收集、记录数据这种活动本身并不能等同于统计学这门科学的建立,需要对收集来的数据进行排比、整理,用精炼和醒目的形式表达,在这个基础上对所研究的事物进行定量或定性估计、描述和解释,并预测其在未来可能的发展状况。例如根据人口普查或抽样调查的资料对我国人口状况进行描述,根据适当的抽样调查结果,对受教育年限与收入的关系,对某种生活习惯与嗜好(如吸烟)与健康的关系作定量的评估。根据以往一般时间某项或某些经济指标的变化情况,预测其在未来一般时间的走向等,做这些事情的理论与方法,才能构成一门学问——数理统计学的内容。 这样的统计学始于何时?恐怕难于找到一个明显的、大家公认的起点。一种受到某些著名学者支持的观点认为,英国学者葛朗特在1662年发表的著作《关于死亡公报的自然和政治观察》,标志着这门学科的诞生。中世纪欧洲流行黑死病,死亡的人不少。自1604年起,伦敦教会每周发表一次“死亡公报”,记录该周内死亡的人的姓名、年龄、性别、死因。以后还包括该周的出生情况——依据受洗的人的名单,这基本上可以反映出生的情况。几十年来,积累了很多资料,葛朗特是第一个对这一庞大的资料加以整理和利用的人,他原是一个小店主的儿子,后来子承父业,靠自学成才。他因这一部著作被选入当年成立的英国皇家学会,反映学术界对他这一著作的承认和重视。 这是一本篇幅很小的著作,主要内容为8个表,从今天的观点看,这只是一种例行的数据整理工作,但在当时则是有原创性的科研成果,其中所提出的一些概念,在某种程度上可以说沿用至今,如数据简约(大量的、杂乱无章的数据,须注过整理、约化,才能突出其中所包含的信息)、频率稳定性(一定的事件,如“生男”、“生女”,在较长时期中有一个基本稳定的比率,这是进行统计性推断的基础)、数据纠错、生命表(反映人群中寿命分布的情况,至今仍是保险与精算的基础概念)等。 葛朗特的方法被他同时代的政治经济学家佩蒂引进到社会经济问题的研究中,他提倡在这类问题的研究中不能尚空谈,要让实际数据说话,他的工作总结在他去世后于1690年出版的《政治算术》一书中。 当然,也应当指出,他们的工作还停留在描述性的阶段,不是现代意义下的数理统计学,那时,概率论尚处在萌芽的阶段,不足以给数理统计学的发展提供充分的理论支持,但不能由此否定他们工作的重大意义,作为现代数理统计学发展的几个源头之一,他们以及后续学者在人口、社会、经济等领域的工作,特别是比利时天文学家兼统计学家凯特勒19世纪的工作,对促成现代数理统计学的诞生起了很大的作用。 数理统计学的另一个重要源头来自天文和测地学中的误差分析问题。早期,测量工具的精度不高,人们希望通过多次量测获取更多的数据,以便得到对量测对象的精度更高的估计值。量测误差有随机性,适合于用概率论即统计的方法处理,远至伽利略就做过这方面的工作,他对测量误差的性态作了一般性的描述,法国大数学家拉普拉斯曾对这个问题进行了长时间的研究,现今概率论中著名的“拉普拉斯分布”,即是他在这研究中的一个产物,这方面最著名且影响深远的研究成果有二:一是法国数学家兼天文家勒让德19世纪初(1805)在研究慧星轨道计算时发明的“最小二乘法”,他在估计过巴黎的子午线长

概率论与数理统计发展史

概率论与数理统计发展简史 姓名:苗壮学号:1110810513 班级:1108105 指导教师:曹莉 摘要:在这里,我们将简略地回顾一下概率论与数理统计的发展史,包括发展过程中所经历的一些大事,以及对这门学科的创立和发展有特别重大影响的那些学者的贡献. 关键词:概率论、数理统计、发展史 正文: 1.概率论的发展 17世纪,正当研究必然性事件的数理关系获得较大发展的时候,一个研究偶然事件数量关系的数学分支开始出现,这就是概率论. 早在16世纪,赌博中的偶然现象就开始引起人们的注意.数学家卡丹诺(Cardano)首先觉察到,赌博输赢虽然是偶然的,但较大的赌博次数会呈现一定的规律性, 卡丹诺为此还写了一本《论赌博》的小册子,书中计算了掷两颗骰子或三颗骰子时,在一切可能的方法中有多少方法得到某一点数.据说,曾与卡丹诺在三次方程发明权上发生争论的塔尔塔里亚,也曾做过类似的实验. 促使概率论产生的强大动力来自社会实践.首先是保险事业.文艺复兴后,随着航海事业的发展,意大利开始出现海上保险业务.16世纪末,在欧洲不少国家已把保险业务扩大到其它工商业上,保险的对象都是偶然性事件.为了保证保险公司赢利,又使参加保险的人愿意参加保险,就需要根据对大量偶然现象规律性的分析,去创立保险的一般理论.于是,一种专门适用于分析偶然现象的数学工具也就成为十分必要了. 不过,作为数学科学之一的概率论,其基础并不是在上述实际问题的材料上形成的.因为这些问题的大量随机现象,常被许多错综复杂的因素所干扰,它使难以呈“自然的随机状态”.因此必须从简单的材料来研究随机现象的规律性,这种材料就是所谓的“随机博弈”.在近代概率论创立之前,人们正是通过对这种随机博弈现象的分析,注意到了它的一些特性, 比如“多次实验中的频率稳定性”等,然后经加工提炼而形成了概率论. 荷兰数学家、物理学家惠更斯(Huygens)于1657年发表了关于概率论的早期著作《论赌博中的计算》.在此期间,法国的费尔马(Fermat)与帕斯卡(Pascal)也在相互通信中探讨了随机博弈现象中所出现的概率论的基本定理和法则.惠更斯等人的工作建立了概率和数学期望等主要概念,找出了它们的基本性质和演算方法,从而塑造了概率论的雏形.18世纪是概率论的正式形成和发展时期.1713年,贝努利(Bernoulli)的名著《推想的艺术》发表.在这部著作中,贝努利明确指出了概率论最重要的定律之一――“大数定律”,并且给出了证明,这使以往建立在经验之上的频率稳定性推测理论化了,从此概率论从对特殊问题的求解,发展到了一般的理论概括. 继贝努利之后,法国数学家棣谟佛(Abraham de Moiver)于1781年发表了《机遇原理》.书中提出了概率乘法法则,以及“正态分”和“正态分布律”的概念,为概率论的“中心极限定理”的建立奠定了基础. 1706年法国数学家蒲丰(Comte de Buffon)的《偶然性的算术试验》完成,他把概率和几何结合起来,开始了几何概率的研究,他提出的“蒲丰问题”就是采取概率的方法来求圆周率π的尝试.

浅谈我对统计学的认识

浅谈我对统计学的认识 摘要:在经历了一个学期的学习之后,我们对《统计学》的学习也来到了最后的阶段。在这一个学期的学习中,有很多感想,也有很多收获。虽然课程有些枯燥,但无疑的是,我们掌握了统计学这门实用的工具,在我们未来的人生中,也必将会运用这个工具,陪伴我们前行。 关键字; 科学统计计算机发展 一,对统计学的认识 在学习统计学之前,我一直把统计学看成另外一种数学——也就是文科生的梦靥。虽然在很多方面统计学和数学存在着紧密联系,例如统计中会用大量的数学工具,所以为了掌握它,你必须要复习一下相关的数学知识,这样才能在学习中灵活运用。但是它和数学在某些方面也会存在很大的不同。在我看来,统计学更加地贴近实际,因此我们在学习中必须紧密联系到它的现实意义,在统计过后,我们还必须理解分析出来的数据所具有的实际的经济意义,这样才算是完成了整个统计的过程。希望在这个统计学的课程完成之后,在未来的学习或者是工作中,我能够运用统计学的知识,提高我的学习和工作效率及水平,让我能够成为一个更加符合社会需求的人才! 二,统计学的概述 统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。统计学主要分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。 统计学是一门研究随机现象,以推断为特征的方法论科学,“由部分推及全体”的思想贯穿于统计学的始终。具体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。用统计来认识事物的步骤是:研究设计—>抽样调查—>统计推断—>结论。这里,研究设计就是制定调查研究和实验研究的计划,抽样调查是搜集资料的过程,统计推断是分析资料的过程。显然统计的主要功能是推断,而推断的方法是一种不完全归纳法,因为是用部分资料来推断总体。统计学是通过数据来进行分析和推断的。因此,统计研究的基础是数据。这些数据的特点是,对于每一个数据而言,都具有不确定性,我们需要抽取一定数量的数据,才可能从中获取信息。因此,统计学的研究依赖于对数的感悟,甚至是对一堆看似杂乱无章的数的感悟。通过对数据的归纳整理、分析判断,可以发现其中隐藏的规律。因为可以用各种方法

统计学的起源

打印版 统计学的起源 统计学起源于收集数据的活动,小至个人的事情,大到治理一个国家,都有必要收集种种有关的数据,如在我国古代典籍中,就有不少关于户口、钱粮、兵役、地震、水灾和旱灾等等的记载。现今各国都设有统计局或相当的机构。当然,单是收集、记录数据这种活动本身并不能等同于统计学这门学科的建立,需要对收集来的数据进行排比、整理,用精炼和醒目的形式表达,在这个基础上对所研究的事物进行定量或定性估计、描述和解释,并预测其在未来可能的发展状况。例如根据人口普查或抽样调查的资料对我国人口状况进行描述,根据适当的抽样调查结果,对受教育年限与收入的关系,对某种生活习惯与嗜好(如 吸烟)与健康的关系作定量的评估。根据以往一般时间某项或某些经济指标的变化情况,预测其在未来一段时间的走向等,做这些事情的理论与方法,才能构成一门学问——数理统计学的内容。 这样的统计学始于何时?恐怕难以找到一个明显的、大家公认的起点。一种受到某些著名学者支持的观点认为,英国掌者葛朗特在1662年发表的著作《关于死亡公报的自然和政治观察》,标志着这门学科的诞生。中世纪欧洲流行黑死病,死亡的人不少。自1604年起,伦敦教会每周发表一次“死亡公报”,记录该周内死亡的人的姓名、年龄、性别、死因。以后还包括该周的出生情况——依据受洗的人的名单,这基本上可以反映出生的 情况。几十年来,积累了很多资料,葛朗特是第一个对这一庞大的资料加以整理和利用的人。 数理统计学的另一个重要源头来自天文和测地学中的误差分析问题。早期,测量工具的精确度不高,人们希望通过多次量测获取更多的数据,以便得到对量测对象的精确度更高的估计值。量测误差有随机性,适合于用概率论即统计的方法处理,远至伽利略就做过这方面的工作。 趣味活动 走走试试 星期天,昊吴和牛牛约好到公园去玩。吴吴先到牛牛家,喊牛牛一块儿走。从吴吴家到牛牛家有4条不同的路。从牛牛家到公园有3条不同的路。昊昊经过牛牛家到公园有多少种不同的走法呢?

统计学的发展历程

统计学的发展历程 统计学的英文statist ics最早是源于现代拉丁文statisticum collegium (国会)以及意大利文statista (国民或政治家)。德文Statistik,最早是由Gottfried Achenwall(1749)所使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。 统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”,“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而属于数学的范畴。 统计学的发展过程的三个阶段 第一阶段称之为“城邦政情”(Matters of state)阶段 “城邦政情”阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十馀种纪要,其内容包括各城邦的历史,行政,科学,艺术,人口,资源和财富等社会和经济情况的比较,分析,具有社会科学特点。“城邦政情”式的统计研究延续了一两千年,直至十七世纪中叶才逐渐被“政治算数”这个名词所替代,并且很快被演化为“统计学”(Statistics)。统计学依然保留了城邦(state)这个词根。 第二阶段称之为“政治算数”(Politcal arthmetic)阶段 与“城邦政情”阶段没有很明显的分界点,本质的差别也不大。 “政治算数”的特点是统计方法与数学计算和推理方法开始结合。分析社会经济问题的方式更加注重运用定量分析方法。 1690年英国威廉·配弟出版(政治算数)一书作为这个阶段的起始标志. 威廉·配弟用数字,重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征。因此,威廉?配弟的(政治算数)被后来的学者评价为近代统计学的来源,威廉?配弟本人也被评价为近代统计学之父。 配弟在书中使用的数字有三类: 第一类是对社会经济现象进行统计调查和经验观察得到的数字.因为受历史条件的限制,书中通过严格的统计调查得到的数据少,根据经验得出的数字多; 第二类是运用某种数学方法推算出来的数字。其推算方法可分为三种: “(1)以已知数或已知量为基础,循著某种具体关系进行推算的方法; (2)通过运用数字的理论性推理来进行推算的方法; (3)以平均数为基础进行推算的方法”; 第三类是为了进行理论性推理而采用的例示性的数字.配弟把这种运用数字和符号进行的推理称之为“代数的算法”。从配弟使用数据的方法看,“政治算数”阶段的统计学已经比较明显地体现了“收集和分析数据的科学和艺术”特点,统计实证方法和理论分析方法浑然一体,这种方法即使是现代统计学也依然继承。

浅析统计学的起源

浅析统计学的起源 摘要从逻辑和历史两个角度对推断统计学的起源进行了尝试性的索关键词:统计史;起源 引言:史学研究历来受思想家们的重视,说史学研究应成为任何学科永恒的研究主题丝毫也不过分,因为早在两千多年前,中国古代伟大的思想家孔子,在论语中就曾留下了温故而知新的至理名言,而16世纪著名的英国哲学家培根也曾说过,读史使人明智。如果套用统计学里的一句专业术语,那就是历史具有遍历性。。 任何历史研究都必须首先限定其研究的时间范畴,对于推断统计史而言,一个首要问题就是:推断统计学的历史应该从哪里开始?为说明这个问题,我们首先探究一下统计学是什么。按一般统计学教材或百科全书上的定义:统计学是一门关于如何有效地收集、整理、表述、分析和解释数据的学科。其中的数据即为统计学的研究对象,因此统计学也被认为是一门从数据中获得有用信息的数据分析学科。需要强调的是,统计学研究的数据一定要具有随机性,也就是说可以通过某种概率分布规律来描述数据的分布状态,这一点也是统计学有别于其他处理数据学科的最重要特征。 在上述统计学的定义下,统计学又可划分为描述统计与推断统计。描述统计是一种通过图形、列表、数量化度量等方法描述样本数据基本特征的统计方法,其作用是对样本数据进行初步精炼,虽然在很多情况下样本数据的特征可用来推断总体的特征,但这需要给出推断的误差精度,由于描述统计中不包含任何关于误差精度的陈述,故

其结论也就仅局限于样本数据,与总体无关,从而也不存在推断问题。不过统计学的终极目的是希望通过样本来获取总体信息,故推断统计,即利用样本信息以及其它信息,获取有关样本所处总体信息的推断理论,就成为描述统计进一步发展的必然产物。下面我们引述有关文献给出的几个相当久远的例子加以说明。 古印度部落国王图潘纳为了炫耀自己的数学能力,他告诉自己的马车夫纳拉一个被放逐的国王,说他猜测出了一颗巨大果树两个枝干上的树叶与果实的数量,纳拉经过一夜的计算,吃惊地发现图潘纳的猜测非常接近实际的真实数量。这个故事来源于印度史诗摩诃婆罗多它最迟完成于公元400年。相当多的现代学者们认为,图潘纳是通过计算某一个典型小枝上树叶与果实的数量后,将其乘以整个果树上小枝的个数得到他的猜测的。 在伯罗奔尼撒战争中,古希腊的雅典人曾采取过架云梯突破敌人城墙的方法。由于建造适当高度的云梯就必须知道敌方城墙的高度,为此雅典人采取了如下方法来估算城墙高度:首先派一些士兵同时数前方敌城裸露部分城墙所砌砖的层数。虽然有一部分士兵的计数会发生错误,但大多数的计数结果应该是正确的,特别是出现最频繁的层数与那部分无法看见的城墙的层数会足够接近。然后通过猜测出来的城砖厚度乘以最频繁的层数估算出城墙的高度。这个故事来源于古希腊历史学家修西得底斯所著的伯罗奔尼撒战争史 应该说在我们给出的这些例子中,古人所使用的推断方法在形式上是属于推断统计学的,但这些方法没有给出有关推断结果的不确

统计学家高尔顿与回归分析的起源

“回归”是由英国著名生物学家兼统计学家高尔顿(Galton)在研究人类遗传问题时提 出来的。为了研究父代与子代身高的关系,高尔顿搜集了1078对父亲及其儿子的身高数据。 他发现这些数据的散点图大致呈直线状态,也就是说,总的趋势是父亲的身高增加时,儿子 的身高也倾向于增加。但是,高尔顿对试验数据进行了深入的分析,发现了一个很有趣的现 象—回归效应。因为当父亲高于平均身高时,他们的儿子身高比他更高的概率要小于比他更 矮的概率;父亲矮于平均身高时,他们的儿子身高比他更矮的概率要小于比他更高的概率。 它反映了一个规律,即这两种身高父亲的儿子的身高,有向他们父辈的平均身高回归的趋势。 对于这个一般结论的解释是:大自然具有一种约束力,使人类身高的分布相对稳定而不产生 两极分化,这就是所谓的回归效应。 1855年, 高尔顿发表《遗传的身高向平均数方向的回归》一文,他和他的学生卡尔? 皮尔逊Karl·Pearson通过观察1078对夫妇的身高数据,以每对夫妇的平均身高作为自变 量,取他们的一个成年儿子的身高作为因变量,分析儿子身高与父母身高之间的关系,发现 父母的身高可以预测子女的身高,两者近乎一条直线。当父母越高或越矮时,子女的身高会 比一般儿童高或矮,他将儿子与父母身高的这种现象拟合出一种线形关系,分析出儿子的身 高y与父亲的身高x大致可归结为一下关系: y=33.73+0.516*x (单位为英寸) 根据换算公式1英寸=0.0254米, 1米=39.37英寸。 所以:Y= 0.8567+0.516*X (单位为米); 这种趋势及回归方程表明父母身高每增加一个单位时,其成年儿子的身高平均增加 0.516个单位。这就是回归一词最初在遗传学上的含义。 有趣的是,通过观察,高尔顿还注意到,尽管这是一种拟合较好的线形关系,但仍然存 在例外现象:矮个父母所生的儿子比其父要高,身材较高的父母所生子女的身高却回降到多 数人的平均身高。换句话说,当父母身高走向极端,子女的身高不会象父母身高那样极端化, 其身高要比父母们的身高更接近平均身高,即有“回归”到平均数去的趋势,这就是统计学 上最初出现“回归”时的涵义,高尔顿把这一现象叫做“向平均数方向的回 归”(regression toward mediocrity)。虽然这是一种特殊情况,与线形关系拟合的一般规 则无关,但“线形回归”的术语却因此沿用下来,作为根据一种变量(父母身高)预测另一种 变量(子女身高)或多种变量关系的描述方法。 它要比其原始意义广泛的多。具体地说,回归分析的内容包括: ? 确定响应变量与预报变量间的回归模型,即变量间相关关系的数学表达式(通常称为 经验公式); ? 根据样本估计并检验回归模型及未知参数; ? 从众多的预报变量中,判断哪些变量对响应变量的影响是显著的,哪些是不显著的; ? 根据预报变量的已知值或给定值来估计或预测响应变量的平均值并给出预测精度或 根据响应变量的给定值来估计预报变量的值,即所谓的预报与控制问题。 第 1页

统计学的发展历程复习进程

统计学的发展历程

统计学概述 [编辑本段] 统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。 统计学主要又分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。另外也有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。 统计学的发展历程 [编辑本段] 统计学的英文statistics最早是源于现代拉丁文statisticum collegium (国会)以及意大利文 statista (国民或政治家)。德文Statistik,最早是由Gottfried Achenwall(1749)所使用, 代表对国家的资料进行分析的学问,也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。 统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”,“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说它是统计学在第三个发展阶段所形成的所有收集和分析数据

统计学试题 来源

统计学试题来源: 一.单选题(每题2分,共20分) 1.在对工业企业的生产设备进行普查时,调查对象是 A所有工业企业B每一个工业企业 C工业企业的所有生产设备D工业企业的每台生产设备 2.一组数据的均值为20,离散系数为0.4,则该组数据的标准差为 A 50 B 8 C 0.02 D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4.已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为A.5%×7%×9%B. 105%×107%×109% C.(105%×107%×109%)-1 D. 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –4.76% C. –33.3% D. 3.85% 6.对不同年份的产品成本配合的直线方程为,回归系数b=-1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位 B. 时间每增加一个单位,产品成本平均下降1.75个单位 C. 产品成本每变动一个单位,平均需要1.75年时间 D. 时间每减少一个单位,产品成本平均下降1.75个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:=70件,=5.6件乙车间:=90件,=6.3件 哪个车间日加工零件的离散程度较大: A甲车间B.乙车间C.两个车间相同D.无法作比较 9.根据各年的环比增长速度计算年平均增长速度的方法是 A用各年的环比增长速度连乘然后开方 B用各年的环比增长速度连加然后除以年数 C先计算年平均发展速度然后减“1” D以上三种方法都是错误的 10.如果相关系数r=0,则表明两个变量之间 A.相关程度很低 B.不存在任何相关关系 C.不存在线性相关关系 D.存在非线性相关关系

浅析统计学的起源

浅析统计学的起源

浅析统计学的起源 摘要从逻辑和历史两个角度对推断统计学的起源进行了尝试性的索关键词:统计史;起源 引言:史学研究历来受思想家们的重视,说史学研究应成为任何学科永恒的研究主题丝毫也不过分,因为早在两千多年前,中国古代伟大的思想家孔子,在论语中就曾留下了温故而知新的至理名言,而16世纪著名的英国哲学家培根也曾说过,读史使人明智。如果套用统计学里的一句专业术语,那就是历史具有遍历性。。 任何历史研究都必须首先限定其研究的时间范畴,对于推断统计史而言,一个首要问题就是:推断统计学的历史应该从哪里开始?为说明这个问题,我们首先探究一下统计学是什么。按一般统计学教材或百科全书上的定义:统计学是一门关于如何有效地收集、整理、表述、分析和解释数据的学科。其中的数据即为统计学的研究对象,因此统计学也被认为是一门从数据中获得有用信息的数据分析学科。需要强调的是,统计学研究的数据一定要具有随机性,也就是说可以通过某种概率分布规律来描述数据的分布状态,这一点也是统计学有别于其他处理数据学科的最重要特征。 在上述统计学的定义下,统计学又可划分为描述统计与推断统计。描述统计是一种通过图形、列表、数量化度量等方法描述样本数据基本特征的统计方法,其作用是对样本数据进行初步精炼,虽然在很多情况下样本数据的特征可用来推断总体的特征,但这需要给出推断

的误差精度,由于描述统计中不包含任何关于误差精度的陈述,故其结论也就仅局限于样本数据,与总体无关,从而也不存在推断问题。不过统计学的终极目的是希望通过样本来获取总体信息,故推断统计,即利用样本信息以及其它信息,获取有关样本所处总体信息的推断理论,就成为描述统计进一步发展的必然产物。下面我们引述有关文献给出的几个相当久远的例子加以说明。 古印度部落国王图潘纳为了炫耀自己的数学能力,他告诉自己的马车夫纳拉一个被放逐的国王,说他猜测出了一颗巨大果树两个枝干上的树叶与果实的数量,纳拉经过一夜的计算,吃惊地发现图潘纳的猜测非常接近实际的真实数量。这个故事来源于印度史诗摩诃婆罗多它最迟完成于公元400年。相当多的现代学者们认为,图潘纳是通过计算某一个典型小枝上树叶与果实的数量后,将其乘以整个果树上小枝的个数得到他的猜测的。 在伯罗奔尼撒战争中,古希腊的雅典人曾采取过架云梯突破敌人城墙的方法。由于建造适当高度的云梯就必须知道敌方城墙的高度,为此雅典人采取了如下方法来估算城墙高度:首先派一些士兵同时数前方敌城裸露部分城墙所砌砖的层数。虽然有一部分士兵的计数会发生错误,但大多数的计数结果应该是正确的,特别是出现最频繁的层数与那部分无法看见的城墙的层数会足够接近。然后通过猜测出来的城砖厚度乘以最频繁的层数估算出城墙的高度。这个故事来源于古希腊历史学家修西得底斯所著的伯罗奔尼撒战争史 应该说在我们给出的这些例子中,古人所使用的推断方法在形

统计学的产生与发展简介

统计学的产生与发展简介 人类的统计实践是随着记数活动而产生的。因此,对统计发展的历史可追溯到远古的原始社会。但是,使人类的统计实践上升到理论予以总结和概括成一门系统的科学----统计学,却是近代的事情,距今只有300多年的历史。 从统计学的产生和发展过程来看,大致可以分为三个时期: 萌芽期?近代期?现代期 1.萌芽期(17世纪中叶~18世纪) 主要学派: 国势学派(代表人物为德国的H.Conring和G.Achenwall); 政治算术学派(代表人物为英国的W.Petty)。 国势学派所做的工作主要是对国家重要事项的记录,因此又称为“记述学派”。严格讲,这一学派的研究对象和研究方法都不符合统计学的要求,但国势学派对统计学的创立和发展作了不少贡献:(1)为这门新兴的学科起了一个至今仍为世界公认的名词:“统计学”(statistics); (2)提出了至今仍为统计学者所采用的一些术语,如:“显著事项“,“统计数字资料”,“数字对比”等等。 政治算术学派的代表人物W.Petty曾被马克思称为“政治经济学

之父,在某种程度上也可以说是统计学的创始人”。原因就是W.Petty 在他所著的《政治算术》一书中,对当时的英国、荷兰、法国之间的“国富和力量”进行了数量上的计算和比较,做了前人从没有做过的从数量方面来研究社会经济现象的工作。 政治算术学派对统计学的主要贡献: (1)不仅满足于社会经济现象的数量登记、列表、汇总、记述等过程,还要求把这些统计经验加以全面系统地总结, 并从中提炼出某些理论原则。 (2)在搜集资料方面,提出了“大量观察法”、“典型调查”、“定期调查”等思想。 (3)在处理资料方面,广泛运用了分类、制表以及各种指标来浓缩与显现数量资料的内涵信息。 2.近代期(18世纪末~19世纪) 主要学派: 数理统计学派(代表人物为法国的https://www.doczj.com/doc/2e9577730.html,place和比利时的A .Quetelet); 社会统计学派(代表人物为德国的K.G.A.Knies和C.L.E.Engel)。 Laplace是第一个把概率论引进统计学领域的,他是一位天文学家、数学家、统计学家,他对统计学的贡献:

数理统计的起源

课程文化2-数理统计的起源 数理统计是伴随着概率论的发展而发展起来的一个数学分支,研究如何有效 的收集、整理和分析受随机因素影响的数据,并对所考虑的问题作出推断或预测,为采取某种决策和行动提供依据或建议. 数理统计的发展大致可分为古典时期、近代时期和现代时期三个阶段. 古典时期(19世纪以前).这是描述性的统计学形成和发展阶段,是数理统计的萌芽时期.在这一时期里,瑞土数学家雅各布·伯努利(Jakob Bernoulli?,1654-1705)较早地系统论证了大数定律.1763年,英国数学家贝叶斯(Thomas Bayes,1701-1761)提出了一种归纳推理的理论,后被发展为一种统计推断方法― 贝叶斯方法,开创了数理统计的先河.法国数学家棣莫佛(de Moivre,1667-1754)于1733年首次发现了正态分布的密度函数并计算出该曲线在各种不同区间内的概率,为整个大样本理论奠定了基础.1809年,德国数学家高斯(Gauss.Garl Friedrich,1777-1855,德国)和法国数学家勒让德(Adrien Marie Legendre1752-1833)各自独立地发现了最小二乘法,并应用于观测数据的误差分析.在数理统计的理 论与应用方面都作出了重要贡献,他不仅将数理统计应用到生物学,而且还应用到教育学和心理学的研究.并且详细地论证了数理统计应用的广泛性,高斯曾预言:"统计方法,可应用于各种学科的各个部门." 近代时期(19世纪末至1845年).数理统计的主要分支建立,是数理统计的形成时期.上一世纪初,由于概率论的发展从理论上接近完备,加之工农业生产迫切需要,推动着这门学科的蓬勃发展. 1889年,英国数学家皮尔逊(Karl Pearson,1857-1936)提出了矩阵估计法,次年 又提出了频率曲线的理论,并于1900年在德国大地测量学者赫尔梅特(F.Helmert)1876年研究正态总体的样本方差时发现的一个十分重要的分布的基础上提出了 检验,这是数理统计发展史上出现的第一个小样本分布. 1908年,英国的统计学家戈塞特(W.S.Gosset,1876-1937)创立了小样本检验代替了大样本检验的理论和方法(即t分布和t检验法),这为数理统计的另一分支---多元分析奠定了理论基础. 1912年,英国统计学家费歇(R.A.Fisher,1890-1962)推广了t检验法,同时发展了显著性检验及估计、方差分析等数理统计新分支. 这样,数理统计的一些重要分支如假设检验、回归分析、方差分析、正交设 计等都有了决定其基本面貌的内容和理论框架.数理统计成为应用广泛、方法独特的一门数学学科. 现代时期(1945年以后).美籍数理统计学家瓦尔德(A.Wald,1902-1950)致力于用数学方法使统计学精确化、严密化,取得了很多重要成果.他发展了决策理论,提出了一般的判别问题,创立了序贯分析理论,提出了著名的序贯概率比检验 法(比如,用于贵重产品的抽样检查与验收).瓦尔德的两本著作《序贯分析》和《统计决策函数论》,被认为是数理发展史上的经典之作.统计决策理论从人与大自 然进行博弈的观点出发,把形形色色的统计问题纳入一个统一的模式之下,对战后数理统计许多分支的发展产生了很大的影响,特别是参数估计这个分支.

我国统计学发展前景

吴喜之 吴喜之 教育背景 博士:美国北卡罗来那大学(Chapel Hill)统计系 本科:北京大学数学力学系 再教育:四川甘孜藏族自治州得荣县 教学经历 美国加利福尼亚大学(Davis)统计系 美国北卡罗来那大学(Chapel Hill)统计系 美国北卡罗来那大学(Charlotte)数学系 南开大学数学学院 北京大学光华管理学院 北京大学数学学院 中国人民大学统计学院 曾涉及的统计方向 序贯分析及最优停时,回归诊断,有错抽样检查,模型选择,纵向数据分析,稳健统计,偏最小二乘法,贝叶斯统计,经济计量模型的非参数回归,列联表和分类数据等。 曾经在国际国内专业杂志上发表过五六十篇文章,并且为十本专著和教科书的作者。 ??科研成果: ??出版著作 ??1. 非参数统计方法, 高等教育出版社,1996。 ??2. 描述统计学,中国统计出版社,1996。 ??3. 非参数统计,中国统计出版社,1996。 ??4. 医学统计,广西师范大学,1999。 ??5. 统计学(翻译),高等教育出版社-Springer,1999。 ??6. 统计学(中专用),中国统计出版社,1999。 ??发表论文

??1. Local influence on a Selected coffiecient in linear regression model, Acra Scientiarum Naturalium Universitatis,Nankaiensis No.2. 33-38 ??2. A Direct Approach to Bayesian Sequential Test for a Normal Mean,Statistics & Probability Letters 27,37-41 ??3. Influence diagnostics for cross-validated smoothing parameter in kenel smo, System Science and System Engineering,Vol.5,No.4,385-390 ??4. Diagnosis in Linear Regression Model,System Science and System Engineering,Vol.6,No.1,37-44 ??5. Finding Masking Effect From Interaction of Cases, Advances in the Theory and Practice of Statistics:A volume in hon ??6. Tests on differently formed contigency,Mathematical Statistics and Applied Probability,Vol.12,No.2,176-1 ??7. 统计学到底是什么?一个本不成为问题的问题,中国统计11期文??8. The Examimation of residual plots,STATISTIA SINICA Vol.8 No.2 pp445-465 ??9. Assessment of local influence of Cox's proportional hazard model,ACTA MATH,Sinica,1998,No.4,414-424 ??10.A new order selection criterion for Linear model,Acta Scientiarum Naturalum universitiatis Nankaiensis ,Vol.31,No.2 ??11. Robust diagnostics of ourliers in linear regression,Proceeding of Joint Statistical conference Peking Univ.25-26 ??12. Another way to see criterion AICC,Acta Scientiarum Naturalum universitiatis Nankaiensis ,Vol.31,No.4 ??13. 13.A modification of PLS methods,Advances in Mathematics Vol.28,No.4,375,Aug. ??14. Assessing local influence in PLS regression by the second order approach,Advances in Mathematics Vol.28,No.4,376-377,Aug. ??15. 从不湿泳装能否学会游泳谈起--略谈统计教学,统计专业定位及统计的普及,统计教育,30,No.4 16. 跳汰机的性能及统计模型,数理统计与管理 ??承担的在研项目:数据分析与模型选择国家自然科学基金 2003年 https://www.doczj.com/doc/2e9577730.html,/grade04/04jista.web_old/%B7%A2%D5%B92.htm https://www.doczj.com/doc/2e9577730.html,/p-11661823905.html

统计学历史中的学派

一、-世纪——统计学的创立和发展 德国的斯勒兹曾说过:“统计是动态的历史,历史是静态的统计。”可见统计学的产生与发展是和生产的发展、社会的进步紧密相联的。 ()统计学的创立时期 统计学的萌芽产生在欧洲。世纪中叶至世纪中叶是统计学的创立时期。在这一时期,统计学理论初步形成了一定的学术派别,主要有国势学派和政治算术学派。 、国势学派 国势学派又称记述学派,产生于世纪的德国。由于该学派主要以文字记述国家的显著事项,故称记述学派。其主要代表人物是海尔曼·康令和阿亨华尔。康令第一个在德国黑尔姆斯太特大学以“国势学”为题讲授政治活动家应具备的知识。阿亨华尔在格丁根大学开设“国家学”课程,其主要著作是《近代欧洲各国国势学纲要》,书中讲述“一国或多数国家的显著事项”,主要用对比分析的方法研究了解国家组织、领土、人口、资源财富和国情国力,比较了各国实力的强弱,为德国的君主政体服务。因在外文中“国势”与“统计”词义相通,后来正式命名为“统计学”。该学派在进行国势比较分析中,偏重事物性质的解释,而不注重数量对比和数量计算,但却为统计学的发展奠定了经济理论基础。但随着资本主义市场经济的发展,对事物量的计算和分析显得越来越重要,该学派后来发生了分裂,分化为图表学派和比较学派。 、政治算术学派 政治算术学派产生于世纪中叶的英国,创始人是威廉·配第(),其代表作是他于年完成的《政治算术》一书。这里的“政治”是指政治经济学,“算术”是指统计方法。在这部书中,他利用实际资料,运用数字、重量和尺度等统计方法对英国、法国和荷兰三国的国情国力,作了系统的数量对比分析,从而为统计学的形成和发展奠定了方法论基础。因此马克思说:“威廉·佩第——政治经济学之父,在某种程度上也是统计学的创始人。” 政治算术学派的另一个代表人物是约翰·格朗特()。他以年伦敦教会每周一次发表的“死亡公报”为研究资料,在年发表了《关于死亡公报的自然和政治观察》的论著。书中分析了年来伦敦居民死亡的原因及人口变动的关系,首次提出通过大量观察,可以发现新生儿性别比例具有稳定性和不同死因的比例等人口规律;并且第一次编制了“生命表”,对死亡率与人口寿命作了分析,从而引起了普遍的关注。他的研究清楚地表明了统计学作为国家管理工具的重要作用。 ()统计学的发展时期

0-1分布到f分布统计学的发展历程

从0—1分布到f分布漫谈 统计学的发展历程 0—1分布就是n=1情况下的二项分布。即只先进行一次事件试验,该事件发生的概率为p,不发生的概率为q=1-p。这是一个最简单的分布,任何一个只有两种结果的随机现象,任何现象都可以用它来描述。设离散型随机变量的分布律为P{X=k}=p(1-p),其中k=0,1. 定义的格式则称X服从(0-1)分布,其中0

浅谈我对统计学的认识

浅谈我对统计学的认识 1、统计学的概述及发展历程 1.1统计学的发展历程 统计学是一门聚集了人类上千年智慧结晶的深奥科学,对其的研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史,经历了“城邦政情”,“政治算数”和“统计分析科学”三个发展阶段,十九世纪末,欧洲大学开设“统计分析科学”课程,该课程的出现是现代统计发展阶段的开端,现代统计学的代表人物首推比利时统计学家奎特莱,他将统计分析科学广泛应用于社会科学,自然科学和工程技术科学领域。 1.2统计学的概述 统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。统计学主要分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。 统计学是一门研究随机现象,以推断为特征的方法论科学,“由部分推及全体”的思想贯穿于统计学的始终。具体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。用统计来认识事物的步骤是:研究设计—>抽样调查—>统计推断—>结论。这里,研究设计就是制定调查研究和实验研究的计划,抽样调查是搜集资料的过程,统计推断是分析资料的过程。显然统计的主要功能是推断,而推断的方法是一种不完全归纳法,因为是用部分资料来推断总体。统计学是通过数据来进行分析和推断的。因此,统计研究的基础是数据。这些数据的特点是,对于每一个数据而言,都具有不确定性,我们需要抽取一定数量的数据,才可能从中获取信息。因此,统计学的研究依赖于对数的感悟,甚至是对一堆看似杂乱无章的数的感悟。通过对数据的归纳整理、分析判断,可以发现其中隐藏的规律。因为可以用各种方法对数据进行归纳整理、分析判断,所以,得到的结论也可能是不同的。 2、统计学的分支学科 统计学的分支学科有:理论统计学、统计调查分析理论、经济统计学、

相关主题
文本预览
相关文档 最新文档