第一章 概率统计基础知识(2)概率的古典定义与统计定义
- 格式:pdf
- 大小:510.54 KB
- 文档页数:7
概率与统计的基础知识统计学是一门研究如何收集、整理、分析、解释和呈现数据的学科。
概率是统计学的基础,它被用来描述和分析在不同情况下事件发生的可能性。
本文将介绍概率与统计的基础知识,包括概率的定义、概率的计算方法、统计的概念以及统计的应用。
一、概率的定义概率是描述事件发生可能性的数值,它介于0到1之间。
0表示事件不可能发生,1表示事件一定发生。
根据概率的定义,我们可以得出以下公式:P(A) = n(A) / n(S)其中,P(A)表示事件A发生的概率,n(A)表示事件A包含的有利结果的数量,n(S)表示样本空间中可能结果的总数。
二、概率的计算方法1. 经典概率经典概率又称为古典概率,适用于样本空间中所有可能结果都是等可能发生的情况。
在这种情况下,事件A发生的概率可以通过以下公式计算:P(A) = n(A) / n(S)2. 相对频率概率相对频率概率是通过实验的结果来估计概率的方法。
通过多次实验,统计事件A发生的次数,然后将次数除以总实验次数,即可得到相对频率概率。
3. 主观概率主观概率是个体主观判断下对事件发生概率的估计。
它是依据经验、直觉和专业知识来进行的估计。
三、统计的概念统计是利用数据进行推断、决策和预测的过程。
在统计学中,数据被分为两种类型:定性数据和定量数据。
1. 定性数据定性数据是用于描述某种特征或属性的数据。
它通常用文字或符号进行表示,如性别、颜色、态度等。
2. 定量数据定量数据是用于表示数量或度量的数据。
它通常用数字进行表示,如身高、体重、温度等。
统计中的两个重要概念是总体和样本。
总体是指研究对象的全体,而样本是指从总体中随机选取的一部分。
四、统计的应用统计学在各个领域都有广泛的应用,以下是几个常见的应用领域:1. 生物统计学生物统计学是将统计学应用于生物学研究的领域。
它可以帮助研究人员分析生物实验数据、评估药物疗效以及研究遗传变异等。
2. 经济统计学经济统计学是将统计学应用于经济学研究的领域。
概率与统计基础知识概率与统计是数学的一个分支,是研究不确定性的科学。
概率论主要研究随机现象,统计学则通过采样和分析数据来推断总体特征。
今天,我们将介绍一些概率与统计的基础知识,包括概率的定义、常见的概率分布以及统计学中的一些基本概念。
一、概率的定义概率是描述一个随机事件发生可能性的数值。
常用的概率定义有频率定义、古典概型以及主观概率等。
频率定义是指根据统计实验的结果来计算概率,即事件发生的次数与试验总次数的比值。
古典概型是指事件的每种可能结果发生的概率相等。
主观概率则是基于主观判断和经验估计得出的概率。
二、常见的概率分布1. 均匀分布:均匀分布是概率分布中最简单的一种形式。
在一个区间内,每个数值的概率都是相等的。
例如,掷骰子的结果就是均匀分布。
2. 正态分布:正态分布也被称为高斯分布,它是自然界中非常常见的一种分布形式。
正态分布的特点是对称,其密度曲线呈钟形。
许多自然现象和统计数据都符合正态分布,如身高和成绩分布等。
3. 二项分布:二项分布适用于只有两个可能结果的独立重复实验。
例如,抛硬币的结果只有正面和反面两种可能,这时可以用二项分布来描述硬币正反面的概率。
4. 泊松分布:泊松分布用来描述单位时间或单位空间内事件发生的次数,如一天内接到的电话数量、某个时间段内停车场停车次数等。
三、统计学的基本概念1. 总体与样本:总体是指我们研究的对象的全体,样本是从总体中选取的一部分。
通过对样本的研究,我们可以推断总体的特征。
2. 参数与统计量:总体的特征可以用参数来表示,样本的特征则可以用统计量来估计。
例如,总体均值用μ表示,样本均值用x表示。
3. 抽样:抽样是指从总体中选择一定数量的个体作为样本的过程。
抽样是统计学中非常重要的一环,对样本的选择要具有代表性和随机性。
4. 假设检验:假设检验是统计学中用来推断总体特征的一种方法。
通过建立假设和进行显著性检验,我们可以判断某个结论是否具有统计学意义。
总结起来,概率与统计是研究随机现象的一门学科,它可以帮助我们了解事件发生的概率和推断总体特征。
概率与统计的基本概念和计算方法概率与统计是一门研究随机现象规律的数学学科,它在科学研究、工程技术和社会经济等领域起到重要的作用。
本文将介绍概率与统计的基本概念和计算方法,帮助读者更好地理解和应用这门学科。
一、概率的基本概念及其计算方法概率是描述随机事件发生可能性的数值,一般用百分比、分数或小数表示。
在概率理论中,有三种常见的概率计算方法:古典概率、几何概率和统计概率。
1. 古典概率古典概率又称为理论概率,是基于等可能性假设进行计算的概率。
当随机事件的样本空间中的所有基本事件等可能发生时,可以使用古典概率进行计算。
计算公式为:事件A发生的概率P(A) = A的基本事件数/样本空间中的基本事件总数。
2. 几何概率几何概率是根据几何形状和空间位置关系计算的概率。
它常用于描述连续随机变量的概率。
几何概率的计算方法是通过计算事件A在样本空间中的面积或体积与样本空间总面积或总体积之比得到。
计算公式为:事件A发生的概率P(A) = A的几何形状的面积或体积/样本空间的几何形状的面积或体积。
3. 统计概率统计概率是根据实际观察到的频率计算的概率。
当无法直接使用古典概率或几何概率进行计算时,可以通过实际观测数据进行统计概率的计算。
统计概率的计算方法是事件A的发生频数除以样本空间试验次数的比值。
计算公式为:事件A发生的概率P(A) = 频数A/n。
二、统计的基本概念及其计算方法统计是通过收集、整理、分析数据并进行推断和预测的一门学科。
在统计学中,有两种常见的统计算法:描述统计和推断统计。
1. 描述统计描述统计是通过对已有数据进行总结和描述来了解数据分布和变化规律的统计方法。
常用的描述统计指标包括均值、中位数、众数、标准差等。
计算描述统计指标时,需要先收集数据,然后对数据进行计算和分析。
2. 推断统计推断统计是通过对样本数据进行推断和预测来做出总体特征的统计方法。
推断统计的核心思想是基于样本数据对总体进行推断。
常用的推断统计方法包括假设检验、置信区间估计和回归分析等。
第一章随机事件及其概率§1.1 随机事件概率论与数理统计是一门研究随机现象量的规律性的数学学科,是近代数学的重要组成部分,同时也是近代经济理论的应用与研究的重要数学工具。
(一)随机试验的概念为了研究随机现象,就要对客观事物进行观察。
观察的过程称为试验。
概率论里所研究的试验成为随机试验,随机试验具有下列特点:(1)在相同的条件下试验可以重复进行;(2)每次试验的结果具有多种可能性,而且在试验之前可以明确试验的所有可能结果;(3)在每次试验之前不能准确地预言该次试验将出现哪一种结果。
(二)随机事件的概念在概率论中,将试验的结果称为事件。
每次试验中,可能发生也可能不发生,而在大量试验中具有某种规律性的事件称为随机事件(或偶然事件),简称为事件。
通常用大写拉丁字母、、等表示。
在随机事件中,有些可以看成是由某些事件复合而成的,而有些事件则不能分解为其它事件的组合。
这种不能分解成其它事件组合的最简单的随机事件称为基本事件。
例如,掷一颗骰子的试验中,其出现的点数,“1点”、“2点”、……、“6点”都是基本事件。
“奇数点”也是随机事件,但它不是基本事件。
它是由“1点”、“3点”、“5点”这三个基本事件组成的,只要这三个基本事件中的一个发生,“奇数点”这个事件就发生。
每次试验中一定发生的事件称为必然事件,用符号表示,每次试验中一定不发生的事件称为不可能事件,用符号表示。
例如,在上面提到的掷骰子试验中,“点数小于7”是必然事件。
“点数不小于7”是不可能事件。
(二)事件的集合与图示研究事件间的关系和运算,应用点集的概念和图示方法比较容易理解,也比较直观。
对于试验的每一个基本事件,用只包含一个元素的单点集合表示;由若干个基本事件复合而成的事件,用包含若干个相应元素的集合表示;由所有基本事件对应的全部元素组成的集体集合称为样本空间。
由于任何一次试验的结果必然出现全部基本事件之一,这样,样本空间作为一个事件是必然事件,仍以表示。
统计和概率的基础知识统计学和概率论是现代数学中的重要分支,它们不仅在学术研究中有着广泛的应用,也在实际生活中起着重要的作用。
统计学涉及数据的收集、整理、分析和解释,而概率论则研究随机事件的规律性和概率分布。
本文将介绍统计学和概率论的基础知识,包括概率的定义、统计推断、假设检验以及抽样等相关概念。
一、概率的定义与计算方法概率是描述随机事件发生可能性的数值,通常用0到1之间的数表示。
在概率论中,事件发生的概率被定义为事件发生的次数与试验总次数之比。
例如,将一枚硬币抛掷10次,正面朝上的次数为6次,则正面朝上的概率为6/10=0.6。
计算概率的方法主要有频率法和古典概型法。
频率法是基于大量实验数据的统计计算,通过实验的频率来估计事件发生的概率。
古典概型法则是根据事件的可能性来计算概率,例如一个公平的骰子投掷,每个面的概率都是1/6。
二、统计推断与参数估计统计推断是通过已知样本数据来对总体特征进行推断和估计。
在实际问题中,我们往往无法直接获得总体的所有数据,只能通过样本来进行分析。
统计推断分为参数估计和假设检验两个主要部分。
参数估计是通过样本数据对总体的未知参数进行估计。
常见的点估计方法有最大似然估计和矩估计。
最大似然估计通过寻找参数值,使得样本出现的概率最大化。
矩估计则是基于样本矩和总体矩的对应关系进行估计。
三、假设检验与显著性水平假设检验是用来检验对总体或总体参数的某一假设是否成立的统计方法。
在进行假设检验时,我们需要提出原假设和备择假设。
原假设是对总体参数的某种假设,备择假设则是原假设的对立假设。
显著性水平是进行假设检验时使用的重要参数,通常用α表示。
显著性水平是我们允许犯错误的程度,例如α=0.05表示我们允许犯错的概率为5%。
在假设检验中,当计算得到的p值小于显著性水平时,我们拒绝原假设,否则则接受原假设。
四、抽样与抽样分布抽样是统计学中重要的概念,它是指从总体中选择一部分个体进行观察和研究。
二、概率的古典定义与统计定义二、概率的古典定义与统计定义(p5-11)确定一个事件的概率有几种方法,这里介绍其中两种最主要的方法,在历史上,这两种方法分别被称为概率的两种定义,即概率的古典定义及统计定义。
(一) 概率的古典定义用概率的古典定义确定概率的方法的要点如下:(1)所涉及的随机现象只有有限个样本点,设共有n个样本点;(2)每个样本点出现的可能性相同(等可能性);若事件含有k个样本点,则事件的概率为:(1.1-1)[例1.1-3][例1.1-3]掷两颗骰子,其样本点可用数组(x , y)表示,其中,x与y分别表示第一与第二颗骰子出现的点数。
这一随机现象的样本空间为:它共含36个样本点,并且每个样本点出现的可能性都相同。
参见教材6页图。
这个图很多同学看不懂!其实就是x+y=?在坐标系反映出来的问题。
(二)排列与组合(二)排列与组合用古典方法求概率,经常需要用到排列与组合的公式。
现简要介绍如下: 排列与组合是两类计数公式,它们的获得都基于如下两条计数原理。
(1)乘法原理: 如果做某件事需经k步才能完成,其中做第一步有m1种方法,做第二步m2种方法,做第k步有m k种方法,那么完成这件事共有m1×m2×…×m k种方法。
例如, 甲城到乙城有3条旅游线路,由乙城到丙城有2条旅游线路,那么从甲城经乙城去丙城共有3×2=6 条旅游线路。
(2) 加法原理: 如果做某件事可由k类不同方法之一去完成,其中在第一类方法中又有m1种完成方法, 在第二类方法中又有m2种完成方法,在第k类方法中又有m k种完成方法, 那么完成这件事共有m1+m2+…+m k种方法。
例如,由甲城到乙城去旅游有三类交通工具: 汽车、火车和飞机,而汽车有5个班次,火车有3个班次,飞机有2个班次,那么从甲城到乙城共有5+3+2=10 个班次供旅游选择。
排列与组合排列与组合的定义及其计算公式如下:①排列:从n个不同元素中任取)个元素排成一列称为一个排列。
按乘法原理,此种排列共有n×(n1) ×…×(n-r+1) 个,记为。
若r=n, 称为全排列,全排列数共有n!个,记为,即:=n×(n-1) ×…×(n-r+1), = n!②重复排列:从n个不同元素中每次取出一个作记录后放回,再取下一个,如此连续取r次所得的排列称为重复排列。
按乘法原理,此种重复排列共有个。
注意,这里的r允许大于n。
例如,从10个产品中每次取一个做检验,放回后再取下一个,如此连续抽取4次,所得重复排列数为。
假如上述抽取不允许放回,则所得排列数为10×9×8×7=5040 。
③组合: 从n个不同元素中任取x个元素并成一组 (不考虑他们之间的排列顺序)称为一个组合,此种组合数为: .特别的规定0!=1,因而。
另外,在组合中,r个元素"一个接一个取出"与"同时取出"是等同的。
例如,从10个产品中任取4个做检验,所有可能取法是从10个中任取4个的组合数,则不同取法的种数为:这是因为取出的任意一组中的4个产品的全排列有4!=24 种。
而这24种排列在组合中只算一种。
所以。
注意:排列与组合都是计算"从n个不同元素中任取r个元素"的取法总数公式,他们的主要差别在于: 如果讲究取出元素间的次序,则用排列公式;如果不讲究取出元素间的次序,则用组合公式。
至于是否讲究次序,应从具体问题背景加以辨别。
[例1.1-4][例1.1-4] 一批产品共有个,其中不合格品有个,现从中随机取出n个,问:事件= " 恰好有m个不合格品"的概率是多少?从个产品中随机抽取n个共有个不同的样本点,它们组成这个问题的样本空间。
其中“随机抽取”必导致这个样本点是等可能的。
以后对“随机抽取”一词都可以作同样理解。
下面我们先计算事件的概率,然后计算一般事件的概率。
事件="恰好有0个不合格品"="全是合格品",要使取出的n个产品全是合格品,那么必须从该批中个合格品中抽取,这有种取法。
故事件的概率为:/ .事件="恰好有1个不合格品",要使取出的n个产品只有一个不合格品,其他n-1个是合格品,可分二步来实现。
第一步从m 个不合格品中随机取出1个,共有种取法;第二步从个合格品中随机取出n-1 个,共有种取法。
依据乘法原则,事件共含有 个样本点。
故事件的概率为: /最后,事件发生,必须从个不合格品中随机抽取m个,而从个合格品中随机抽取n-m 个,依据乘法原则,事件共含有个样本点,故事件的概率是:其中为n, 中的较小的一个数,它是m的最大取值,这是因为m既不可能超过取出的产品数n, 也不可能超过不合格品总数因此,假如,下面来计算诸事件的概率:而等都是不可能事件,因为10个产品中只有2个不合格品,而要从中抽出3个或4个不合格品是不可能。
[例1.1-5][例1.1-5](放回抽样)抽样有两种形式:不放回抽样与放回抽样。
上例讨论的是不放回抽样,每次抽取一个,不放回,再抽取下一个,这相当于n个同时取出,因此可不论其次序。
放回抽样是每次抽一个,将其放回,均匀混合后再抽下一个。
这时要讲究先后次序,现对上例采取放回抽样方式讨论事件=“恰好有m个不合格品”的概率。
从n个产品中每次随机抽取一个,检查后放回抽第二个,这样直到抽出第n个产品为止。
由于每次都有n种可能,故在放回抽样的问题中共有个可能的样本点。
事件b0=“全是合格品”发生必须从n-m个合格品中用放回抽样的方式随机抽取n次,它共含有种取法,故事件b0的概率为:事件=“恰好有一件不合格品”发生,必须从个合格品中用放回抽样抽取n-1次,而从个不合格品中抽一次,这样就有种取法,再考虑不合格品出现的顺序,故事件的概率为 同样的可求的概率。
(二)概率的统计定义(二)概率的统计定义要点如下:(1) 与事件a有关的随机现象是可以大量重复试验的;(2) 若在n次重复试验中,事件a发生次,则事件a发生的频率为:(1.1-2)频率能反映事件a发生的可能性大小;(3) 频率将会随着重复试验次数不断增加而趋于稳定,这个频率的稳定值就是事件a的概率。
在实际中人们无法把一个试验无限次地重复下去,只能用重复试验次数n较大时的频率去近似表示概率。
[例1.1-6][例1.1-6 ]说明频率稳定的例子(1) 为了验证掷一枚均匀硬币出现正面的概率为0.5 ,许多人做了大量的重复试验,图1.1-10 记录了前400 次掷硬币试验中频率的变化情况。
在重复次数n较小时波动剧烈,随着n的增大,波动的幅度在逐渐变小。
历史上有不少人做过更多次重复试验。
其结果(见表1.1-1) 表明,正面出现的频率逐渐稳定在0.5。
这个0.5 就是频率的稳定值,也是正面出现的概率,这与用古典方法计算的概率是相同的。
图1.1-10(教材10页),表1.1-1(教材10页)。
(2) 在英语中(2) 在英语中某些字母出现的频率远高于另外一些字母。
人们对各类的英语书刊中字母出现的频率进行了统计。
发现各个字母的使用频率相当稳定,其使用频率见表1.1-2。
这项研究在计算机键盘设计(在方便的地方安排使用频率较高的字母键)、印刷铅字的铸造 (使用频率高的字母应多铸一些)、信息的编码 (使用频率高的字母用较短的码)、密码的破译等等方面都是有用的。
表1.1-2(教材10页)三、概率的性质及其运算法则三、概率的性质及其运算法则(p11-14)(一) 概率的基本性质及加法法则根据概率的上述定义,可以看出它具有以下基本性质:性质l:概率是非负的,其数值介于0与1之间,即对任意事件a,有:特别,不可能事件的概率为0,必然事件的概率为1,即:,[例1.1-7][例1.1-7] 抛三枚硬币,至少一个正面出现 (记为事件)的概率是多少?解:在抛三枚硬币的随机试验中,样本空间共有8个样本点:(正、正、正)、(反、反、反)、(正、反、反)、(反、正、反)、(反、反、正)、(正、正、反)、(正、反、正)、(反、正、正)。
中所含的样本点较多,但其对立事件="抛三枚硬币,全是反面"={( 反,反,反)},只含一个样本点,从等可能性可知再由性质2,可得:[例1.1-8][例1.1-8]一批产品共100 件,其中5件不合格品,现从中随机抽出10件,其中最多有两件不合格品的概率是多少?解:设ai 表示事件“抽出10件中恰好有i件不合格品”,于是所求事件上=“最多有2件不合格品可表示为:并且为三个互不相容事件,由性质5可知:余下就是用古典方法算得ai的概率。
据a0的定义,从100 件产品随机抽出10件的所有样本点共有个。
要使抽出的10件产品中有0件不合格品,即全是合格品,则10件必须从95件合格品中抽取,所以:=0.0702 于是所求的概率为:=0.5837+0.3394+00.0702=0.9933 可见事件a发生的概率很接近于1,说明发生的可能性大;而它的对立事件=“抽10件产品中至少有3件不合格品”的概率 ,发生的可能性很小。
[例1.1-9][例1.1-9]某足球队在未来一周中有两场比赛,在第一场比赛中获胜的概率为1/2 ,在第二场比赛中获胜的概率是1/3,如果在两场比赛中都获胜概率是1/6,那么在两场比赛中至少有一场获胜的概率是多少?解:设事件=“第i场比赛获胜”,i=1,2。
于是有:。
由于事件“两场比赛中至少有一场获胜”可用事件表示,所求概率为。
另外由于事件与是可能同时发生的,故与不是互不相容事件,应用性质4来求,即:这表明在未来两场比赛中至少有一场获胜的概率为2/3 。
(二)条件概率及概率的乘法法则(二)条件概率及概率的乘法法则在事件发生的条件下,事件发生的概率称为的条件概率,记为。
可导出乘法公式(三) 独立性和独立事件的概率(三) 独立性和独立事件的概率设有两个事件假如其中一个事件的发生不影响另一个事件的发生与否,则称事件相互独立。
性质7:假如两个事件相互独立,则同时发生的概率为: (1.1-5)性质8:假如两个事件相互独立,则的条件概率等于的无条件概率。
两个事件的相互独立性可以推广到三个或更多个事件的相互独立性。
此时性质7可以推广到更多个事件上。
[例1 .1-13][例1 .1-13] 用晶体管装配某仪表要用到128 个元器件,改用集成电路元件后,只要用12只就够了,如果每个仪表才能正常工作,试分别求出上述两种场合下能正常工作2000 小时的概率。