当前位置：文档之家› 0-1分布到f分布统计学的发展历程

0-1分布到f分布统计学的发展历程

从0—1分布到f分布漫谈

统计学的发展历程

0—1分布就是n=1情况下的二项分布。即只先进行一次事件试验，该事件发生的概率为p,不发生的概率为q=1-p。这是一个最简单的分布，任何一个只有两种结果的随机现象,任何现象都可以用它来描述。设离散型随机变量的分布律为P{X=k}=p(1-p),其中k=0,1. 定义的格式则称X服从（0-1）分布，其中0

F分布三大抽样分布之一，其实他们都是基于正态分布建立起来的。F分布：F分布是以统计学家R.A.Fisher姓氏的第一个字母命名的. F分布的用途：用于方差分析、协方差分析和回归分析等。（一）F分布定义为:设X、Y为两个独立的随机变量，X服从自由度为m的卡方分布，Y服从自由度为n的卡方分布，这2 个独立的卡方分布被各自的自由度除以后的比率这一统计量的分布即F=（x/m）/(y/n)服从自由度为（m,n)的F-分布，上式F服从第一自由度为m，第二自由度为n的F分布，F分布的性质：1、它是一种非对称分布；2、它有两个自由度，即n -1和m-1，相应的分布记为F（n –1，m-1），n –1通常称为分子自由度，m-1通常称为分母自由度；3、F分布是一个以自由度n –1和m-1为参数的分布族，不同的自由度决定了F 分布的形状。

统计学的英文statist ics最早是源于现代拉丁文statisticum collegium (国会)以及意大利文statista (国民或政治家)。德文Statistik，最早是由Gottfried Achenwall(1749)所使用，代表对国家的资料进行分析的学问，也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义，并且由John Sinclair引进到英语世界。

统计学是一门很古老的科学，一般认为其学理研究始于古希腊的亚里斯多德时代，迄今已有两千三百多年的历史。它起源于研究社会经济问题，在两千多年的发展过程中，统计学至少经历了“城邦政情”，“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科，确切地说它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础，但是它不属于统计学的范畴，而属于数学的范畴。

统计学的发展过程的三个阶段

第一阶段称之为“城邦政情”(Matters of state)阶段

“城邦政情”阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十馀种纪要，其内容包括各城邦的历史，行政，科学，艺术，人口，资源和财富等社会和经济情况的比较，分析，具有社会科学特点。“城邦政情”式的统计研究延续了一两千年，直至十七世纪中叶才逐渐被“政治算数”这个名词所替代，并且很快被演化为“统计学”(Statistics)。统计学依然保留了城邦(state)这个词根。

第二阶段称之为“政治算数”(Politcal arthmetic)阶段

与“城邦政情”阶段没有很明显的分界点，本质的差别也不大。

“政治算数”的特点是统计方法与数学计算和推理方法开始结合。分析社会经济问题的方式更加注重运用定量分析方法。

1690年英国威廉·配弟出版(政治算数)一书作为这个阶段的起始标志.

威廉·配弟用数字，重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征。因此，威廉？配弟的(政治算数)被后来的学者评价为近代统计学的来源，威廉？配弟本人也被评价为近代统计学之父。

配弟在书中使用的数字有三类：

第一类是对社会经济现象进行统计调查和经验观察得到的数字.因为受历史条件的限制，书中通过严格的统计调查得到的数据少，根据经验得出的数字多；

第二类是运用某种数学方法推算出来的数字。其推算方法可分为三种：

“(1)以已知数或已知量为基础，循著某种具体关系进行推算的方法；

(2)通过运用数字的理论性推理来进行推算的方法；

(3)以平均数为基础进行推算的方法”；

第三类是为了进行理论性推理而采用的例示性的数字.配弟把这种运用数字和符号进行的推理称之为“代数的算法”。从配弟使用数据的方法看，“政治算数”阶段的统计学已经比较明显地体现了“收集和分析数据的科学和艺术”特点，统计实证方法和理论分析方法浑然一体，这种方法即使是现代统计学也依然继承。

第三阶段称之为“统计分析科学”(Science of statistical analysis)阶段

在“政治算数”阶段出现的统计与数学的结合趋势逐渐发展形成了“统计分析科学”。

十九世纪末，欧洲大学开设的“国情纪要”或“政治算数”等课程名称逐渐消失，代之而起的是“统计分析科学”课程.当时的“统计分析科学”课程的内容仍然是分析研究社会经济问题。

“统计分析科学”课程的出现是现代统计发展阶段的开端. 1908年，“学生”氏(William Sleey Gosset的笔名Student)发表了关于t分布的论文，这是一篇在统计学发展史上划时代的文章。它创立了小样本代替大样本的方法，开创了统计学的新纪元。

现代统计学的代表人物首推比利时统计学家奎特莱(Adolphe Quelet)，他将统计分析科学广泛应用于社会科学，自然科学和工程技术科学领域，因为他深信统计学是可以用于研究任何科学的一般研究方法.

现代统计学的理论基础概率论始于研究赌博的机遇问题，大约开始于1477年。数学家为了解释支配机遇的一般法则进行了长期的研究，逐渐形成了概率论理论框架。在概率论进一步发展的基础上，到十九世纪初，数学家们逐渐建立了观察误差理论，正态分布理论和最小平方法则。于是，现代统计方法便有了比较坚实的理论基础。

统计学简答题完整版

一、统计的含义和本质是什么P2 含义：“统计”一词可以有三种含义：统计活动、统计数据和统计学。统计活动是对各种统计数据进行搜集、整理并做出相应的推断、分析的活动，通常被划分为统计调查、统计整理和统计分析三个阶段；统计数据是通过统计活动获得的、用以表现研究现象特征的各种形式的数据；统计学则是指导统计活动的理论和方法，是关于如何搜集、整理和分析统计数据的科学。本质：统计的本质就是关于为何统计，统计什么和如何统计的思想。二、统计数据有哪些分类不同类型数据有什么不同特点P7 1.统计数据按照所采用的计量尺度不同，可以分为定性数据与定量数据。定性数据是指只能用文字或数字代码来表现事物的品质特征或属性特征的数据，具体又分为定类数据与定序数据两种。定量数据是指用数值来表现事物数量特征的数据，具体又分为定距数据与定比数据两种。 2.统计数据按照其表现形式不同，可以分为绝对数、相对数和平均数。绝对数是用以反映现象或事物绝对数量特征的数据，有明确的计量单位。相对数是用以反映现象或事物相对数量特征的数据，它通过另外两个相关统计数据的对比来体现联系关系。平均数是用以反映现象或事物平均数量特征的数据，体现现象某一方面的一般数量水平。 3.统计数据按照其来源不同，可以分为观测数据与实验数据两类。观测数据是通过统计调查或观测的方式而获取的反映研究现象客观存在的数量特征的数据。实验数据是在人为控制的条件下，通过实验的方式而获得的关于实验对象的数据。 4.统计数据按照其加工程度不同，可以分为原始数据与次级数据两类。原始数据是指直接向调查对象搜集的、尚待加工整理、只反映个体特征的数据。次级数据也称为加工数据或二手数据，是指已经经过加工整理、能反映总体数量特征的各种非原始数据。 5.统计数据按照其时间或空间状态不同，可以分为时序数据与截面数据。时序数据是对同一现象在不同时间上搜集到的数据（即空间状态相同，时间状态不同）。截面数据是对一些同类现象在相同或近似相同的时间上搜集到的数据（即空间状态不同，时间状态相同）。三、总体和样本概念以及它们之间的关系如何P14 概念：总体，就是统计研究的客观对象的全体，是由所有具有某种共同性质的事物所组成的集合体。样本，就是从总体中抽取的一部分个体所组成的集合。关系：1.总体是所要研究的对象，而样本则是所要观测的对象，样本是总体的代表和缩影。 2.样本是用来推断总体的。对样本进行观测的目的是要对总体数量特征做出估计或判断，即通常所说的以样本推断总体。 3.总体和样本的角色是可以改变。随着考察角度的改变，一定的研究总体也可成为另一意义上总体的一个样本，这说明总体与样本的角色是可以改变的。四、标志和指标之间的关系如何P17 区别:1.指标和标志说明的对象不同，指标说明总体的特征，标志则说明个体的特征。 2.指标和标志的表现形式不同，指标是用数值来表现的，而标志则既有只能用文字来表现的品质标志，又有用数值来表现的数量标志。联系:1.标志是计算统计指标的依据，即统计指标数值是根据个体的标志表现综合而来的。 2.由于总体与个体的确定是相对的、可以换位的，因而指标与标志的确定也是相对的、可以换位的。五、统计数据收集方案包括哪些内容P25 数据收集目的(why)、数据及其类型(what type)、数据收集对象与观测单位(whom)、观测标

概率论与数理统计发展史

概率论与数理统计发展简史姓名：苗壮学号：1110810513 班级：1108105 指导教师：曹莉摘要：在这里，我们将简略地回顾一下概率论与数理统计的发展史，包括发展过程中所经历的一些大事，以及对这门学科的创立和发展有特别重大影响的那些学者的贡献．关键词：概率论、数理统计、发展史正文： 1.概率论的发展 17世纪，正当研究必然性事件的数理关系获得较大发展的时候，一个研究偶然事件数量关系的数学分支开始出现，这就是概率论．早在16世纪，赌博中的偶然现象就开始引起人们的注意．数学家卡丹诺(Cardano)首先觉察到，赌博输赢虽然是偶然的，但较大的赌博次数会呈现一定的规律性, 卡丹诺为此还写了一本《论赌博》的小册子，书中计算了掷两颗骰子或三颗骰子时，在一切可能的方法中有多少方法得到某一点数．据说，曾与卡丹诺在三次方程发明权上发生争论的塔尔塔里亚，也曾做过类似的实验．促使概率论产生的强大动力来自社会实践．首先是保险事业．文艺复兴后，随着航海事业的发展，意大利开始出现海上保险业务．16世纪末，在欧洲不少国家已把保险业务扩大到其它工商业上，保险的对象都是偶然性事件．为了保证保险公司赢利，又使参加保险的人愿意参加保险，就需要根据对大量偶然现象规律性的分析，去创立保险的一般理论．于是，一种专门适用于分析偶然现象的数学工具也就成为十分必要了．不过，作为数学科学之一的概率论，其基础并不是在上述实际问题的材料上形成的．因为这些问题的大量随机现象，常被许多错综复杂的因素所干扰，它使难以呈“自然的随机状态”．因此必须从简单的材料来研究随机现象的规律性，这种材料就是所谓的“随机博弈”．在近代概率论创立之前，人们正是通过对这种随机博弈现象的分析,注意到了它的一些特性, 比如“多次实验中的频率稳定性”等，然后经加工提炼而形成了概率论. 荷兰数学家、物理学家惠更斯（Huygens）于1657年发表了关于概率论的早期著作《论赌博中的计算》．在此期间，法国的费尔马（Fermat）与帕斯卡（Pascal）也在相互通信中探讨了随机博弈现象中所出现的概率论的基本定理和法则．惠更斯等人的工作建立了概率和数学期望等主要概念，找出了它们的基本性质和演算方法，从而塑造了概率论的雏形．18世纪是概率论的正式形成和发展时期．1713年，贝努利（Bernoulli）的名著《推想的艺术》发表．在这部著作中，贝努利明确指出了概率论最重要的定律之一――“大数定律”，并且给出了证明，这使以往建立在经验之上的频率稳定性推测理论化了，从此概率论从对特殊问题的求解，发展到了一般的理论概括．继贝努利之后，法国数学家棣谟佛（Abraham de Moiver）于1781年发表了《机遇原理》．书中提出了概率乘法法则，以及“正态分”和“正态分布律”的概念，为概率论的“中心极限定理”的建立奠定了基础． 1706年法国数学家蒲丰（Comte de Buffon）的《偶然性的算术试验》完成，他把概率和几何结合起来，开始了几何概率的研究，他提出的“蒲丰问题”就是采取概率的方法来求圆周率π的尝试．

统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系[1] 张柏林 41060045 理实1002班摘要：本文首先将介绍2χ分布，t 分布，F 分布和正态分布的定义及基本性质，然后用理论说明2χ分布，t 分布，F 分布与正态分布的关系，并且利用数学软件MATLAB 来验证之. 1. 三大分布函数[2] 1.12χ分布 2()n χ分布是一种连续型随机变量的概率分布。这个分布是由别奈梅 (Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现，它是由正态分布派生出来的，主要用于列联表检验。定义：若随机变量12n ,,X X …X 相互独立，且都来自正态总体01N （，），则称统计量2222 12n =+X X χ++…X 为服从自由度为n 的2χ分布，记为22~()n χχ. 2χ分布的概率密度函数为 122210(;),2()200n x n x e x n f x n x --?≥??=Γ???? ，2χ分布的密度函数图形是一个只取非负值的偏态分布，如下图.

卡方分布具有如下基本性质：性质1：22(()),(())2E n n D n n χχ==；性质2：若221122(),()X n X n χχ==，12,X X 相互独立，则21212~()X X n n χ++；性质3：2 n χ→∞→时，（ n ）正态分布；性质4：设)(~2 2n αχχ，对给定的实数 ),10(<<αα称满足条件: αχχαχα==>? +∞ ) (222 )()}({n dx x f n P 的点)(2 n α χ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查用. 2()n χ分布的上α分位数 1.2t 分布 t 分布也称为学生分布，是由英国统计学家戈赛特在1908年“student”的笔名首次发表的，这个分布在数理统计中也占有重要的位置. 定义：设2 ~0~X N χ（，1），Y （n ），,X Y 相互独立，，则称统计量 T = 服从自由度为n 的t 分布，记为~()T t n . t 分布的密度函数为

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布，（1）可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验；（2）采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐，（1）采用Satterthwate 的t’检验；（2）采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布，采用配对t检验。 1.2.2 两组差值不服从正态分布，采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布，且各组方差齐性，直接采用完全随机的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有LSD检验，Bonferroni法，tukey 法，Scheffe法，SNK法等。 1.3.2资料不符合正态分布，或各组方差不齐，则采用非参数检验的Kruscal－Wallis法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用Bonferroni法校正P值，然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布，且各组方差齐性，直接采用随机区组的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有LSD检验，Bonferroni法，tukey 法，Scheffe法，SNK法等。 1.4.2资料不符合正态分布，或各组方差不齐，则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用Bonferroni法校正P值，然后用符号配对的Wilcoxon检验。 ****需要注意的问题：（1）一般来说，如果是大样本，比如各组例数大于50，可以不作正态性检验，直接采用t 检验或方差分析。因为统计学上有中心极限定理，假定大样本是服从正态分布的。（2）当进行多组比较时，最容易犯的错误是仅比较其中的两组，而不顾其他组，这样作容易增大犯假阳性错误的概率。正确的做法应该是，先作总的各组间的比较，如果总的来说差别有统计学意义，然后才能作其中任意两组的比较，这些两两比较有特定的统计方法，如上面提到的LSD检验，Bonferroni法，tukey法，Scheffe法，SNK法等。**绝不能对其中的两

统计学简答题答案资料讲解

1、什么是统计学，有哪些特点？统计学是收集、整理、分析、解释数据并从数据中得到结论的学科。特点：客观性~~相关性~~实用性~~科学性~~严谨性~~逻辑性~~~ 2、何谓标志，按能否用数量表示可以分为哪两种类型，分别举例说明标志是指说明总体单位属性或特征的名称。可以分为数量标志和质量标志品质标志:说明总体单位属性特征的名称，用文字描述。Ex：性别，名族，工种，籍贯数量标志：说明总体单位数量特征的名称，用数量表示。数量标志的具体表现称标志值。 Ex：工人的年龄，工资，工龄 3、什么是离散型变量，连续性变量？举例说明变量：可变的数量标志和指标；离散型变量：指变量的数值只能以计数的方法取得，（变量值只能取整数）；连续型变量：指变量的取值连续不断，（变量值能取小数）。 4、简述品质标志和数量标志的区别，并举例说明。区别：数量标志说明的是总体的数量特征，而品质标志说明的是总体的属性特征。 5、什么是数量指标和质量指标？二者有何关系？统计指标：反映总体数量特征的科学概念和具体数值。注意：从理论上讲，一个完整的统计指标由两部分构成：指标名称+指标数值例如：某地区2009年完成利税总额（指标名称）为1500（指标数值）亿元。数量指标：用来反映现象的总规模、总水平、或工作总量的指标。其数值大小随总体的研究范围的大小而增减。质量指标：反映客观现象的劳动效果或工作质量等事物内部数量关系的指标，其数值的大小与总体的研究范围大小无直接联系。 6、统计标志和统计指标有和联系与区别？区别：1、标志是反映总体单位特征；指标反映总体特征。 2、指标都能用数量表示，标志只有数量标志能用数量表示； 3、标志是一个理论概念，实际应用中只有指标。联系：1、标志与指标可以相互转化，随研究目的的转化而改变； 2、指标值一般是标志值汇总来的； 3、标志的名称常常就是指标名称。 7、制定一份完整的统计调查方案，应包括哪些内容？ 1）明确调查的目的和任务 2）确定调查的对象和调查单位、 3）确定带调查项目、设计调查表或问卷 4）确定调查时间、调查地点和调查方式方法 5）制定调查的组织实施计划 8、举例说明重点调查的概念和特点重点调查：是在调查对象范围内部选择部分重点调查单位进行的调查。特点：调查单位少、适用于调查对象的标志值比较集中于某些单位的场合、重点调查的调查方式主要采取专门调查的组织形式（一种是专门组织的一次性调查；另一种是利用定期统计报表经常性地对一些重点单位进行调查。）；有点在于花费较少的人力物力和时间就可以获得总体的基本情况资料。 9、简述重点调查、典型调查、抽样调查的联系与区别P31 抽样调查是一种非全面调查，它是按照随机的原则，从总体中抽取一部分单位作为样本来进行观测研究，以抽样样本的指标去推算总体指标的一种调查。

(完整版)t分布的概念及表和查表方法.doc

t分布介绍在概率论和统计学中，学生 t - 分布（t -distribution ），可简称为 t 分布，用于根据小样本来估计呈正态分布且方差未知的总体的均值。如果总体方差已知（例如在样本数量足够多时），则应该用正态分布来估计总体均值。 t 分布曲线形态与 n（确切地说与自由度 df ）大小有关。与标准正态分布曲线相比，自由度df 越小， t 分布曲线愈平坦，曲线中间愈低，曲线双侧尾部翘得愈高；自由度 df 愈大， t 分布曲线愈接近正态分布曲线，当自由度 df= ∞时， t 分布曲线为标准正态分布曲线。中文名t 分布应用在对呈正态分布的总体外文名t -distribution 别称学生 t 分布学科概率论和统计学相关术语t 检验目录 1历史 2定义 3扩展 4特征 5置信区间 6计算历史在概率论和统计学中，学生 t -分布（ Student's t-distribution ）经常应用在对呈正态分布的总体的均值进行估计。它是对两个样本均值差异进行显著性测试的学生t 测定的基础。 t 检定改进了Z 检定（en:Z-test ），不论样本数量大或小皆可应用。在样本数量大（超过 120 等）时，可以应用Z 检定，但 Z 检定用在小的样本会产生很大的误差，因此样本很小的情况下得改用学生t 检定。在数据有三组以上时，因为误差无法压低，此时可以用变异数分析代替学生t 检定。当母群体的标准差是未知的但却又需要估计时，我们可以运用学生t-分布。学生 t-分布可简称为t 分布。其推导由威廉·戈塞于 1908 年首先发表，当时他还在都柏林的健力士酿酒厂工作。因为不能以他本人的名义发表，所以论文使用了学生（Student ）这一笔名。之后t 检验以及相关理论经由罗纳德·费雪的工作发扬光大，而正是他将此分布称为学生分布。定义

统计学的发展历程

统计学的发展历程统计学的英文statist ics最早是源于现代拉丁文statisticum collegium (国会)以及意大利文statista (国民或政治家)。德文Statistik，最早是由Gottfried Achenwall(1749)所使用，代表对国家的资料进行分析的学问，也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义，并且由John Sinclair引进到英语世界。统计学是一门很古老的科学，一般认为其学理研究始于古希腊的亚里斯多德时代，迄今已有两千三百多年的历史。它起源于研究社会经济问题，在两千多年的发展过程中，统计学至少经历了“城邦政情”，“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科，确切地说它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础，但是它不属于统计学的范畴，而属于数学的范畴。统计学的发展过程的三个阶段第一阶段称之为“城邦政情”(Matters of state)阶段 “城邦政情”阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十馀种纪要，其内容包括各城邦的历史，行政，科学，艺术，人口，资源和财富等社会和经济情况的比较，分析，具有社会科学特点。“城邦政情”式的统计研究延续了一两千年，直至十七世纪中叶才逐渐被“政治算数”这个名词所替代，并且很快被演化为“统计学”(Statistics)。统计学依然保留了城邦(state)这个词根。第二阶段称之为“政治算数”(Politcal arthmetic)阶段与“城邦政情”阶段没有很明显的分界点，本质的差别也不大。 “政治算数”的特点是统计方法与数学计算和推理方法开始结合。分析社会经济问题的方式更加注重运用定量分析方法。 1690年英国威廉·配弟出版(政治算数)一书作为这个阶段的起始标志. 威廉·配弟用数字，重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征。因此，威廉？配弟的(政治算数)被后来的学者评价为近代统计学的来源，威廉？配弟本人也被评价为近代统计学之父。配弟在书中使用的数字有三类：第一类是对社会经济现象进行统计调查和经验观察得到的数字.因为受历史条件的限制，书中通过严格的统计调查得到的数据少，根据经验得出的数字多；第二类是运用某种数学方法推算出来的数字。其推算方法可分为三种： “(1)以已知数或已知量为基础，循著某种具体关系进行推算的方法； (2)通过运用数字的理论性推理来进行推算的方法； (3)以平均数为基础进行推算的方法”；第三类是为了进行理论性推理而采用的例示性的数字.配弟把这种运用数字和符号进行的推理称之为“代数的算法”。从配弟使用数据的方法看，“政治算数”阶段的统计学已经比较明显地体现了“收集和分析数据的科学和艺术”特点，统计实证方法和理论分析方法浑然一体，这种方法即使是现代统计学也依然继承。

统计学简答题整理

统计学简答题整理第一章P11 1．获取直接统计数据的渠道主要有哪些？及区别在于？普查、抽样调查普查是为某一特定目的，专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。花费的时间、人力、财力和物力都较大，间隔的时间较长。而两次普查之间的年份以抽样调查方法获得连续的统计数据。抽样调查是统计调查中应用最广、最为重要的调查方法，它是通过随机样本对总体数量规律性进行推断的调查研究方法。存在着由样本推断总体产生的抽样误差，但统计方法可以估计出误差的大小进一步控制误差；节省人力、财力、物力，又能保证实效性 2.简要说明抽样误差和非抽样误差。非抽样误差是由于调查过程中各有关环节工作失误造成的。（它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误，不完整的抽样框导致的误差，调查中由于被调查者不回答产生的误差，还有一种人为干扰造成的误差即有意瞒报或低报数据等）。非抽样误差在普查、抽样调查中都有可能发生，但可以避免。抽样误差是利用样本推断总体时产生的误差。（由于样本只是总体的一部分，用样本的信息去推断总体，或多或少总会存在误差，因而抽样误差对任何一个随机样本来讲都是不可避免的。但可计量、可控制）。抽样误差与样本量的平方根成反比关系。第二章P51

1.统计的计量尺度 ①列名尺度（定类尺度）：是按照某一品质标志将总体分组之后，对属性相同的单位进行计量的方法。各组之间的关系是并列的，没有大小、高低、先后之别。 ②顺序尺度（定序尺度）:是按照某一品质标志将总体分组，对等级相同的单位进行计量的方法。各组之间的关系是有顺序的，可以进行排序。 ③间隔尺度（也称定距尺度）：是按某一数量标志将总体分组，对相同数量或相同数量范围的单位或其标志值进行计量的方法。其特点是不仅可以进行排序，还可以计算不同数值之间的绝对差距。 ④比例尺度（也称定比尺度）：是类似于间隔尺度，又高于间隔尺度的计量方法。其特点是不仅可计算数值的绝对差异，还可以计算数值的相对差异。 2.简述统计分组的概念和作用。概念：统计分组是根据统计研究目的，选择一定的分组标志，将总体划分为若干组的统计方法。其目的是使组与组有明显差别，同一组中具有相对的同质性。（例：人口按性别、年龄、民族、职业分组；企业按规模分为大型、中型和小型。）作用：1.划分社会经济现象的类型 2.反映总体的内部结构 3.分析现象之间的依存关系 3.简述众数、中位数和均值的特点与应用场合。众数是总体中出现次数最多的标志值。反映了标志值分布的集中趋势，是一种由位置决定的平均数。可以没有众数也可有两个。

spss教程常用的数据描述统计：频数分布表等统计学

第二节常用的数据描述统计本节拟讲述如何通过SPSS菜单或命令获得常用的统计量、频数分布表等。 1．数据这部分所用数据为第一章例1中学生成绩的数据，这里我们加入描述学生性别的变量“sex”和班级的变量“class”，前几个数据显示如下（图2－2），将数据保存到名为“2-6-1.sav”的文件中。图2－2：数据输入格式示例 1．Frequencies语句（1）操作打开数据文件“2-6-1.sav”，单击主菜单Analyze /Descriptive Statistics / F requencies…，出现频数分布表对话框如图2-3所示。图2－3：Frequencies定义窗口把score变量从左边变量表列中选到右边，并请注意选中下方的Display frequency table复选框（要求

显示频数分布表）。如果您只要求得到一个频数分布表，那么就可以点OK按钮了。如果您想同时获得一些统计量，及统计图表，还需要进一步设置。 ①Statistics选项单击Statistics按钮，打开对话框，请按图2-4自行设置。有关说明如下：（ⅰ）在定义百分位值（percentile value）的矩形框中，选择想要输出的各种分位数，SPSS提供的选项有： ●Quartiles四分位数，即显示25%、50%、75%的百分位数。 ●Cut points equal 把数据平均分为几份。如本例中要求平均分为3份。 Percentile显示用户指定的百分位数，可重复多次操作。本例中要求15%、50%、85%的百分位数。(ⅱ) 在定义输出集中趋势（Central Tendency）的矩形框中，选择想要输出的集中统计量，常用的选项有： ●Mean 算术平均数 ●Median 中数 ●Mode 众数 ●Sum 算术和（ⅲ）在定义输出离散统计量（Dispersion）的矩形框中，选择想要输出的离散统计量，常用的选项有： ●Std. Deviation 标准差 ●Variance 方差 ●Range 全距 ●Minimum 最小值 ●Maximum 最大值 ●S.E. mean 平均数的标准误（ⅳ）描述数据分布（Distribution）的统计量 ●Skewness 偏度，非对称分布指数。 ●Kurtosis 峰度，CASE围绕中心点的扩展程度。另外，频数过程（Frequence）除了能够提供上面常用的统计量外，还可以对分组数据计算百分位数和中数（Values are group midpoints），即对于已经分组的数据，并且数据中的原始数据表示的是组中数的数据计算百分位数的值和中位数。

浅析统计学的起源

浅析统计学的起源摘要从逻辑和历史两个角度对推断统计学的起源进行了尝试性的索关键词:统计史;起源引言：史学研究历来受思想家们的重视,说史学研究应成为任何学科永恒的研究主题丝毫也不过分,因为早在两千多年前,中国古代伟大的思想家孔子,在论语中就曾留下了温故而知新的至理名言,而16世纪著名的英国哲学家培根也曾说过,读史使人明智。如果套用统计学里的一句专业术语,那就是历史具有遍历性。。任何历史研究都必须首先限定其研究的时间范畴,对于推断统计史而言,一个首要问题就是:推断统计学的历史应该从哪里开始?为说明这个问题,我们首先探究一下统计学是什么。按一般统计学教材或百科全书上的定义:统计学是一门关于如何有效地收集、整理、表述、分析和解释数据的学科。其中的数据即为统计学的研究对象,因此统计学也被认为是一门从数据中获得有用信息的数据分析学科。需要强调的是,统计学研究的数据一定要具有随机性,也就是说可以通过某种概率分布规律来描述数据的分布状态,这一点也是统计学有别于其他处理数据学科的最重要特征。在上述统计学的定义下,统计学又可划分为描述统计与推断统计。描述统计是一种通过图形、列表、数量化度量等方法描述样本数据基本特征的统计方法,其作用是对样本数据进行初步精炼,虽然在很多情况下样本数据的特征可用来推断总体的特征,但这需要给出推断的误差精度,由于描述统计中不包含任何关于误差精度的陈述,故

其结论也就仅局限于样本数据,与总体无关,从而也不存在推断问题。不过统计学的终极目的是希望通过样本来获取总体信息,故推断统计,即利用样本信息以及其它信息,获取有关样本所处总体信息的推断理论,就成为描述统计进一步发展的必然产物。下面我们引述有关文献给出的几个相当久远的例子加以说明。古印度部落国王图潘纳为了炫耀自己的数学能力,他告诉自己的马车夫纳拉一个被放逐的国王,说他猜测出了一颗巨大果树两个枝干上的树叶与果实的数量,纳拉经过一夜的计算,吃惊地发现图潘纳的猜测非常接近实际的真实数量。这个故事来源于印度史诗摩诃婆罗多它最迟完成于公元400年。相当多的现代学者们认为,图潘纳是通过计算某一个典型小枝上树叶与果实的数量后,将其乘以整个果树上小枝的个数得到他的猜测的。在伯罗奔尼撒战争中,古希腊的雅典人曾采取过架云梯突破敌人城墙的方法。由于建造适当高度的云梯就必须知道敌方城墙的高度,为此雅典人采取了如下方法来估算城墙高度:首先派一些士兵同时数前方敌城裸露部分城墙所砌砖的层数。虽然有一部分士兵的计数会发生错误,但大多数的计数结果应该是正确的,特别是出现最频繁的层数与那部分无法看见的城墙的层数会足够接近。然后通过猜测出来的城砖厚度乘以最频繁的层数估算出城墙的高度。这个故事来源于古希腊历史学家修西得底斯所著的伯罗奔尼撒战争史应该说在我们给出的这些例子中,古人所使用的推断方法在形式上是属于推断统计学的,但这些方法没有给出有关推断结果的不确

统计学简答题

1常用的统计调查方式主要有哪些? 答:⑴统计报表。是按照国家有关法规的规定，自上而下地统一布置，自下而上地逐级提供基本统计数据的一种调查方式。⑵普查。是为特定目的而专门组织的一次性全面调查。⑶抽样调查。是从研究对象的总体中随机抽取一部分个体作为样本进行调查，并根据调查结果来推断总体数量特征的一种非全面调查方法。 2分类数据、顺序数据的整理及图示方法各有哪些？答：对于分类数据：（1）数据的整理方法有列出所分的类别，计算每一类别的频数、频率、比例、比率等。（2）图示方法有条形图和圆形图。对于顺序数据：（1）数据的整理方法中包括所有的处理分类数据的方法，同时还可以计算累积频数和累积频率（2）图示方法包括累积分布图和环形图 3数值型数据的整理及图示方法有哪些？试述组距分组的步骤。 ⑴用频数分布表（变量数列）展示数值型数据①单变量值分组②组距分组 ⑵用图示展示数值型数据①直方图②箱线图③线图④茎叶图组距分组的步骤：①确定组数②确定各组的组距③整理成频数分布表 4误差主要包括哪两类?引起误差的原因分别是什么？答：主要包括抽样误差和非抽样误差抽样误差：是指由样本数据对总体特征进行估计时所引起的代表性误差，原因是由于每次抽取一个样本，而样本中包含的哪些单元是随机的，不同的样本由于包含的单元不同，得到的估计值自然不同，各个估计值与总体特征之间不可避免的出现差距，由此产生了抽样误差。非抽样误差：其来源比较复杂，主要有抽样框未能不重不漏包含所有抽样单元导致的抽样框误差，调查测量不准确引致的测量误差，还有无回答误差和粗大误差。 5什么是抽样平均误差？抽样平均误差、方差和偏差的关系？抽样平均误差是反映抽样误差一般水平的指标，它的实质含义是指抽样平均数（或成数）的标准差。即它反映了抽样指标与总体指标的平均离差程度。 6影响样本容量的主要因素有哪些？答：（1）总体各单位标志变异程度；（2）允许误差的大小；（3）概率度的大小；（4）抽样方法不同；（5）抽样方式不同。 7什么是多重共线：多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确 8方差分析的基本原理是什么？答：方差分析总的思想是通过计算来比较因某一特定因素带来的样本值的差异与随机偶然因素对样本值的差异的大小，从而判断该因素对总体是否有统计意义。 9简述方差分析的基本步骤？（1建立检验假设； H0：多个样本总体均值相等； H1：多个样本总体均值不相等或不全等。检验水准为0.05。（2计算检验统计量F值；（3确定P值并作出推断结果。 10简述方差分析和回归分析的异同？答：方差分析主要用来研究数据分布的离散与集中,稳定与波动的情况,回归分析是通过数据的分布情况拟合出其分布规律.两者不是一回事 11简述回归方程的显著性检验与回归系数的显著性检验的区别和联系。答：t检验常能用作检验回归方程中各个参数的显著性，而f检验则能用作检验整个回归关系的显著性。各解释变量联合起来对被解释变量有显著的线性关系，并不意味着每一个解释

三大抽样分布

三大抽样分布众所周知，在概率论中有二项分布、正态分布、泊松分布着三大分布，而统计学中也有三大抽样分布，分别是x2 分布、t布和F分布。这三大抽样分布的发现正好是现代统计学的形成时期，对于以参数统计推断为主要内容的现代统计学理论的形成有着重要意义。X2分布的发现来源于Kad Pears0n创立X2拟合优度理论的过程，而t分布的发现来源于Gosset小样本理论的创立过程，F分布则是来源于Fisher创立方差分析理论的过程。三大抽样分布的研究意义 c．R．Rao曾经说过“在终极的分析中，一切知识都是历史，在抽象的意义下，一切科学都是数学，在理性的基础上，所有的判断都是统计学。”这句话一语道破统计学的重要性。三大抽样分布在统计学理论中占据着重要地位，由此可见，研究三大抽样分布对于科学研究有着重要意义。在实际工作中，统计工作者对于三大抽样分布的研究必不可少，通过研究三大抽样分布的产生、发展和完善，能够充分了解三大抽样分布理论的重要性。具体到统计学三大分布，对于三大分布理论的研究，能够在充分吸收前人研究成果的基础上不断进行理论创新，从而推动科学技术的进步。纵观所有的科技进步，无一不是在充分研究前人成果的基础上发展而来的研究统计学三大抽样分布，对于我国社会经济发展有着重要的推动作用。三大抽样分布产生于19世纪末20世纪初，在统计学的发展过程中，每一次新的分析统计数据概率模型的发现，统计学理论都会发生一次重大飞跃。为此，要想研究三大抽样分布，就应该对其发展过程进行研究。统计量是样本的函数，是随机变量，有其概率分布，统计量的分布称为抽样分布。 X2分布 x2的早期发展由于受到中心极限定理和正态误差理论的影响，正态分布一直在统计学中占据重要地位。在很多数学家和哲学家心目中，正态分布是唯一可用的分析和解释统计数据的方法。但是随着时代的发展，一些学者开始对正态性提出了质疑，随后，在多位科学家的试验验证下，正态分布与实际数据拟合不好的情况日渐凸显出来，科学家纷纷开始研究比正态分布范围更广的分布类型，波那个人产生了偏态分布，其中，x2就是最早的偏态分布最早引入偏态分布的是JamesClerk Maxwel，他在研究气体分子运动的过程中引入了X2分布。1891年，X2分布首次被作为统计量的分布导出。Pizzetti在求线性模型最小二乘估计残差平方和的分布时，通过富氏分析法得出了X2的分布。随着时代的发展，正态分布理论的局限更加明显，更加推动了偏态分布的发展。KarlPearson是对偏态分布贡献最大的人，成为了一代统计学巨人。按照他的观点，统计学应该把在模型基础上对观测数据进行有效预测作为基本任务，所以他开创了一族曲线对观测数据进行拟合，使得分布拟台数据的应用范围进一步扩大。 X2模型

统计学简答题整理精编版

统计学简答题整理 GE GROUP system office room 【GEIHUA16H-GEIHUA GEIHUA8Q8-

统计学简答题整理第一章P11 1．获取直接统计数据的渠道主要有哪些及区别在于普查、抽样调查普查是为某一特定目的，专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。花费的时间、人力、财力和物力都较大，间隔的时间较长。而两次普查之间的年份以抽样调查方法获得连续的统计数据。抽样调查是统计调查中应用最广、最为重要的调查方法，它是通过随机样本对总体数量规律性进行推断的调查研究方法。存在着由样本推断总体产生的抽样误差，但统计方法可以估计出误差的大小进一步控制误差；节省人力、财力、物力，又能保证实效性 2.简要说明抽样误差和非抽样误差。非抽样误差是由于调查过程中各有关环节工作失误造成的。（它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误，不完整的抽样框导致的误差，调查中由于被调查者不回答产生的误差，还有一种人为干扰造成的误差即有意瞒报或低报数据等）。非抽样误差在普查、抽样调查中都有可能发生，但可以避免。

抽样误差是利用样本推断总体时产生的误差。（由于样本只是总体的一部分，用样本的信息去推断总体，或多或少总会存在误差，因而抽样误差对任何一个随机样本来讲都是不可避免的。但可计量、可控制）。抽样误差与样本量的平方根成反比关系。第二章P51 1.统计的计量尺度 ①列名尺度（定类尺度）：是按照某一品质标志将总体分组之后，对属性相同的单位进行计量的方法。各组之间的关系是并列的，没有大小、高低、先后之别。 ②顺序尺度（定序尺度）:是按照某一品质标志将总体分组，对等级相同的单位进行计量的方法。各组之间的关系是有顺序的，可以进行排序。 ③间隔尺度（也称定距尺度）：是按某一数量标志将总体分组，对相同数量或相同数量范围的单位或其标志值进行计量的方法。其特点是不仅可以进行排序，还可以计算不同数值之间的绝对差距。 ④比例尺度（也称定比尺度）：是类似于间隔尺度，又高于间隔尺度的计量方法。其特点是不仅可计算数值的绝对差异，还可以计算数值的相对差异。 2.简述统计分组的概念和作用。概念：统计分组是根据统计研究目的，选择一定的分组标志，将总体划分为若干组的统计方法。其目的是使组与组有明显差别，同一组中具有相对的同质性。（例：人口按性别、年龄、民族、职业分组；企业按规模分为大型、中型和小型。）

统计学附录F分布,t分布临界值表全.docx

统计学附录F—分布临界值表 ——α（ 0.005 ―0.10 ） α=0.005 Fα k112345681224∞k2 116211200002161522500230562343723925244262494025465 2198.5199.0199.2199.2199.3199.3199.4199.4199.5199.5 355.5549.8047.4746.1945.3944.8444.1343.3942.6241.83 431.3326.2824.2623.1522.4621.9721.3520.7020.0319.32 522.7818.3116.5315.5614.9414.5113.9613.3812.7812.14 618.6314.4512.9212.0311.4611.0710.5710.039.478.88 716.2412.4010.8810.059.529.168.688.187.657.08 814.6911.049.608.818.307.957.507.01 6.50 5.95 913.6110.118.727.967.477.13 6.69 6.23 5.73 5.19 1012.839.438.087.34 6.87 6.54 6.12 5.66 5.17 4.64 1112.238.917.60 6.88 6.42 6.10 5.68 5.24 4.76 4.23 1211.758.517.23 6.52 6.07 5.76 5.35 4.91 4.43 3.90 1311.378.19 6.93 6.23 5.79 5.48 5.08 4.64 4.17 3.65 1411.067.92 6.68 6.00 5.56 5.26 4.86 4.43 3.96 3.44 1510.807.70 6.48 5.80 5.37 5.07 4.67 4.25 3.79 3.26 1610.587.51 6.30 5.64 5.21 4.91 4.52 4.10 3.64 3.11 1710.387.35 6.16 5.50 5.07 4.78 4.39 3.97 3.51 2.98 1810.227.21 6.03 5.37 4.96 4.66 4.28 3.86 3.40 2.87 1910.077.09 5.92 5.27 4.85 4.56 4.18 3.76 3.31 2.78 209.94 6.99 5.82 5.17 4.76 4.47 4.09 3.68 3.22 2.69

(完整word版)统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系 [1] 张柏林 41060045 理实1002班摘要：本文首先将介绍 2分布，t 分布，F 分布和正态分布的定义及基本性质，然后用理论说明2分布，t 分布，F 分布与正态分布的关系，并且利用数学软件 MATLAB 来验证之. 1.三大分布函数[2] 1.1 2分布 2（n ）分布是一种连续型随机变量的概率分布。这个分布是由别奈梅（Benayme ）赫尔默特（Helmert ）、皮尔逊分别于1858年、1876年、1900年所发现，它是由正态分布派生出来的，主要用于列联表检验。定义：若随机变量X 1,X 2,…X n 相互独立，且都来自正态总体 N （0,，）,则称统计量 2 =x ； X ；…+X ；为服从自由度为n 的2分布，记为 2 2 ~ （n ）. 2 分布的概率密度函数为 1 x e 2 x 0 J x 0 其中伽玛函数（X ） e t t x 1dt,x 0， 2 分布的密度函数图形是一个只取非负值的偏态分布，如下图? x 2 n 2° f(x; n)

2(n2) ,X!,X2相互独立，则X! X2~ 2g n2); 性质3: n 时，2(n) 正态分布; 性质4:设2~ 2(n),对给定的实数 (0 1),称满足条件： P{ 2 2(n)} 2(、f(x)dx (n) 的点2(n)为2(n)分布的水平的上侧分位数. 简称为上侧分位数.对不同的与n,分位数的值已经编制成表供查分布，是由英国统计学家戈赛特在1908年“student的'笔名布在数理统计中也占有重要的位置. 1), Y?2(n), X,Y相互独立，，则称统计量T —X VY/ n 分布，记为T~t( n). 为性质1: E( 2(n)) n,D( 2(n)) 2n ; 性质2:若X! 2(nJ,X2

统计学常用分布及其分位数

§1、4 常用得分布及其分位数 1、卡平方分布卡平方分布、t 分布及F 分布都就是由正态分布所导出得分布,它们与正态分布一起,就是试验统计中常用得分布。当X 1、X 2、… 、Xn 相互独立且都服从N(0,1)时,Z=∑i i X 2 得分布称为自由度等于n 得2χ分布,记作Z ～2χ(n),它得分布密度 p(z )=??? ????>??? ??Γ--,,00,2212122其他z e x n z n n 式中得??? ??Γ2n =u d e u u n ?∞+--012,称为Gamma 函数,且()1Γ=1, ?? ? ??Γ21=π。2χ分布就是非对称分布,具有可加性,即当Y 与Z 相互独立,且Y ～2χ(n ),Z ～2χ(m ),则Y+Z ～2χ(n+m )。证明: 先令X 1、X 2、…、X n 、X n+1、X n+2、…、 X n+m 相互独立且都服从N(0,1),再根据2χ分布得定义以及上述随机变量得相互独立性,令 Y=X 21+X 22+…+X 2n ,Z=X 21+n +X 22+n +…+X 2m n +, Y+Z= X 21+X 22+…+X 2n + X 21+n +X 22+n +…+X 2m n +, 即可得到Y+Z ～2χ(n +m )。 2、 t 分布若X 与Y 相互独立,且 X ～N(0,1),Y ～2χ(n ),则Z =n Y X 得分布称为自由度等于n 得t 分布,记作Z ～ t (n ),它得分布密度 P(z)=)()(221n n n ΓΓ+2121+-???? ??+n n z 。请注意:t 分布得分布密度也就是偶函数,且当n>30时,t

统计学简答题答案

1.“统计”一词有哪些含义？什么就是统计学？ (1)统计工作或统计实践活动:对现象的数量进行搜集、整理与分析的活动过程 (2)统计资料:通过统计实践活动取得的说明对象某种数量特征的数据 (3)统计学:就是关于数据的一门科学统计学就是一门收集、整理、显示与分析统计数据的科学,其目的就是探索数据内在的数量规律性。 2.一组数据的分布特征可以从哪几个方面进行测度？一组数据的分布特征可以从以下三个方面进行测度: 集中趋势的测度(众数、中位数、分位数、均值、几何平均数、切尾均值) 离散程度测度(极差、内距、方差与标准差、离散系数) 偏态与峰度测度(偏态及其测度、峰度及其测度) 3.分布集中趋势的测度指标有哪些？众数、中位数、分位数、均值、几何平均数、切尾均值 4.简述众数、中位数与均值的特点与应用场合。众数最容易计算,但不就是永远存在,它不受极端值影响、具有不惟一性、作为集中趋势代表值应用的场合较少,数据分布偏斜程度较大时应用,在编制物价指数时,农贸市场上某种商品的价格常以很多摊位报价的中数值为代表。中位数很容易理解、很直观,它不受极端值的影响,这既就是它有价值的方面,也就是它数据信息利用不够充分的地方; 均值就是对所有数据平均后计算的一般水平代表值,数据信息提取的最充分,数据对称分布或接近对称分布时应用,它在整个统计方法中应用最广,对经济管理与工程等实际工作也就是最重要的代表值与统计量。 5.分布离散程度的测度指标有哪些？极差、内距、方差与标准差、离散系数 6、常用的概率抽样方法有哪些？各自的含义如何？ (1)简单随机抽样:从总体N个单位中随机地抽取n个单位作为样本,使得每一个总体单位都有相同的机会(概率)被抽中,这样的抽样方式称为简单随机抽样。 (2)分层抽样:在抽样之前先将总体的单位按某种特征或某种规则划分为不同的层,然后从不同的层中抽取一定数量的单位组成一个样本,这样的抽样方式称为分层抽样。 (3)系统抽样:在抽样中先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点,每隔一定的间隔抽取一个单位,直至抽取n个单位形成一个样本。 (4)整群抽样:调查时先将总体划分成若干群,然后再以群作为调查单位从中抽取部分群,进而对抽中的各个群中所包含的所有个体单位进行调查或观察。 (5)多阶段抽样:先抽取群,但并不就是调查群内的所有单位,而就是再进行一步抽样,从选中的群中抽取出若干个单位进行调查。群就是初级抽样单位,第二阶段抽取的就是最终抽样单位。将该方法推广,使抽样的段数增多,就称为多阶段抽样。 7、什么就是抽样分布？就就是由样本n个观察值计算的统计量的概率分布。 8、什么就是匹配样本？一个样本中的数据与另一个样本中的数据相对应,这样的样本称为匹配样本。 9、假设检验的思想以及假设检验中的两类错误就是什么？假设检验的基本思想就是小概率反证法思想。小概率思想就是指小概率事件(P<0、01或P<0、