概率基础学习
- 格式:doc
- 大小:3.15 MB
- 文档页数:56
数学概率论基础知识整理与应用数学概率论是许多学科中的基础,它广泛应用于统计学、经济学、物理学、生物学等领域。
本文将对数学概率论的基础知识进行整理,并介绍其在实际问题中的应用。
一、概率的基本概念概率是指某个事件发生的可能性。
概率的数学定义是在一定条件下,事件发生的次数与试验总次数之比。
常见的概率表示方法包括分数、小数以及百分比形式。
二、概率的计算方法1. 古典概型:当样本空间S中的每个样本发生的可能性相等时,即古典概型的情况。
例如投掷一枚均匀的骰子,其样本空间为{1, 2, 3, 4, 5, 6},每个样本发生的可能性相等,概率为1/6。
2. 几何概型:当事件发生的可能性相等时,但样本空间S中的样本发生的可能性不等。
例如从一个有序集合中取出一个元素的概率,取每个元素的概率为1/n。
3. 组合概型:当事件发生的可能性不等时,需要利用组合数进行计算。
例如从一副扑克牌中摸取一张黑色的牌的概率,可以计算黑色牌的数量与总牌数的比值。
三、事件的关系与概率计算公式1. 互斥事件:两个事件A和B互斥,指的是两个事件不能同时发生。
互斥事件的概率计算方法是将两个事件的概率相加。
2. 对立事件:两个事件A和B对立,指的是两个事件中只能有一个事件发生。
对立事件的概率计算方法是用1减去另一个事件的概率。
3. 事件的并:事件A和事件B的并指的是事件A或者事件B发生的情况。
事件的并的概率计算方法是将事件A和事件B的概率相加,并减去它们的交集的概率。
4. 事件的交:事件A和事件B的交指的是事件A和事件B同时发生的情况。
事件的交的概率计算方法是将事件A和事件B的概率相乘。
四、条件概率与独立事件1. 条件概率:当某个事件已经发生时,另一个事件发生的概率称为条件概率。
条件概率的计算方法是将事件A和事件B的交的概率除以事件A的概率。
2. 独立事件:两个事件A和B是独立的,指的是事件B的发生与事件A的发生没有关系。
独立事件的概率计算方法是将事件A的概率乘以事件B的概率。
概率论的基础1 预备知识在开始介绍概率论之前,我们需要先了解一些预备知识。
1.1 集合运算概率论中经常会涉及到集合运算,因此我们需要先了解集合运算的基本概念。
集合是由一些确定的对象组成的整体。
我们用大写字母表示集合,用小写字母表示集合中的元素。
常见的集合运算有:- 并集:将两个集合的元素合起来,得到包含这两个集合所有元素的新集合。
记作A∪B。
- 交集:只将两个集合中都有的元素取出来,得到一个新的集合。
记作A∩B。
- 补集:集合A的补集是指集合U中所有不在A中的元素的集合。
记作A'或者A^c。
- 差集:从集合A中减去集合B中的元素,得到一个新的集合。
记作A-B。
1.2 条件概率在概率论中,条件概率是指在已知一种事件发生的前提下,另一种事件发生的概率。
记作P(B|A),表示在事件A发生的情况下,事件B发生的概率。
条件概率的计算公式为:$$P(B|A) = \frac{P(A\cap B)}{P(A)}$$其中,P(A∩B)表示事件A和事件B同时发生的概率。
1.3 独立性在概率论中,独立性是指两个事件的发生不会互相影响。
也就是说,当事件A发生与否对事件B发生的概率没有任何影响时,我们称事件A和事件B是独立的。
如果事件A和事件B是独立的,那么有以下公式成立:$$P(A\cap B) = P(A) \cdot P(B)$$反之,如果有以上公式成立,那么我们可以认为事件A和事件B是独立的。
2 概率的定义概率是描述随机事件发生可能性的数值。
在概率论中,我们用P(E)表示事件E发生的概率。
2.1 古典概型如果所有的结果都是等可能的,那么我们可以使用古典概型来计算概率。
例如,掷硬币和掷骰子都是古典概型,因为每一个结果都是等可能的。
在古典概型中,如果一个事件E可以由n个元素构成,且所有的元素等可能,那么事件E发生的概率就是:$$P(E) = \frac{\text{符合事件E的结果个数}}{\text{总结果个数}} = \frac{n_E}{n}$$2.2 条件概率法则如果我们已知事件B发生,在B的基础上怎么计算事件A发生的概率呢?根据条件概率公式,我们有:$$P(A|B) = \frac{P(A\cap B)}{P(B)}$$这个公式被称为条件概率法则。
高三数学知识点归纳概率概率是数学中一个非常重要的分支,它可以帮助我们理解事件发生的可能性。
在高三数学中,概率是一个必学的知识点。
本文将对高三数学概率知识点进行归纳总结,旨在帮助高三学生加深对概率的理解和掌握。
一、基础概念概率是指事件发生的可能性,用来表征事件的随机性。
它的取值范围是0到1之间,其中0表示不可能事件,1表示必然事件。
常用的求概率的方法有频率法、几何法和古典概型法等。
二、事件的概率计算1.频率法频率法是通过实验的次数和结果的出现次数来计算概率的方法。
当实验的次数足够多时,事件发生的频率将逼近其概率。
2.几何法几何法是通过对样本空间的几何图形进行面积比较来计算概率。
对于连续型随机事件,可以使用几何法计算概率。
3.古典概型法古典概型法适用于样本空间元素个数有限且等可能的随机事件。
通过计算事件的有利结果个数与总结果个数之比来计算概率。
三、概率的性质与公式1.加法公式对于两个互斥事件A和B,其概率之和等于两个事件分别发生的概率之和。
2.乘法公式对于两个独立事件A和B,其同时发生的概率等于两个事件分别发生的概率之积。
3.全概率公式全概率公式是在事件A的基础上,将样本空间划分为若干互斥事件,并计算这些事件的概率之和等于事件A的概率。
4.条件概率条件概率是指在已知某一事件发生的条件下,另一事件发生的概率。
通过条件概率,我们可以计算两个事件的相关性。
四、排列与组合排列与组合是概率中常见的计数方法。
排列是指从n个不同元素中选取m个元素按照一定顺序排列的方法数,计算公式为P(n,m)=n!/(n-m)!。
组合是指从n个不同元素中选取m个元素并不考虑顺序的方法数,计算公式为C(n,m)=n!/[(n-m)!m!]。
五、常见的概率模型1.简单随机抽样简单随机抽样是指从总体中随机选择样本的抽样方法,其样本容量n较小时,可以近似认为是简单随机抽样,使用古典概型法计算概率。
2.二项分布二项分布是一种离散型概率分布,适用于只有两种可能结果的重复试验。
概率基础知识点总结一、概率的定义概率是描述事件发生可能性的一种数值,它通常用0到1之间的实数表示。
概率的定义可以从频率的角度和古典概率的角度来理解。
频率的定义:在实际实验中,事件A出现的次数除以实验总次数,称为事件A的频率。
当实验次数足够大的时候,事件A的频率会趋向于一个固定值,这个固定值就是事件A的概率。
古典概率的定义:在一个等可能的实验中,事件A发生的可能性等于事件A包含的基本事件数与所有基本事件数的比值。
二、概率的性质概率具有一些基本的性质,包括非负性、规范性、可列可加性等。
1. 非负性:对于任意事件A,它的概率满足0 <= P(A) <= 1。
2. 规范性:整个样本空间的概率为1,即P(S) = 1。
3. 可列可加性:如果事件A1, A2, A3, ...两两互不相容(互斥),那么它们的并事件的概率等于它们的概率之和,即P(A1 ∪ A2 ∪ A3 ∪ ...) = P(A1) + P(A2) + P(A3) + ...三、概率分布在概率论中,概率分布是描述随机变量取值的概率情况的一种数学函数。
常见的概率分布包括离散型概率分布和连续型概率分布。
1. 离散型概率分布:在一组有限或可数的取值中,每个取值对应一个概率。
常见的离散型概率分布包括二项分布、泊松分布、几何分布等。
2. 连续型概率分布:在一个区间内,概率分布是连续变化的。
常见的连续型概率分布包括正态分布、指数分布、均匀分布等。
概率分布函数有许多应用,例如在金融领域中用以描述股票价格的波动、在物理学中用以描述微观粒子的运动等。
四、条件概率条件概率是指在已知某一事件发生的条件下,另一个事件发生的概率。
条件概率通常用P(A|B)表示,读作“在B条件下A的概率”。
条件概率的计算公式为:P(A|B) = P(A ∩ B) / P(B)。
条件概率在许多实际问题中都有重要应用,例如在医学诊断中用以计算某种疾病的发病率、在金融领域中用以计算风险事件发生的概率等。
高中概率基础知识归纳总结在高中数学学习的过程中,概率是一个重要的概念。
它不仅在数学中有着广泛的应用,而且在我们日常生活中也随处可见。
本文将对高中概率基础知识进行归纳总结,帮助高中生更好地理解和运用概率。
一、基本概念概率是用来描述事件发生的可能性大小的一个数值。
在概率的计算中,我们经常使用事件、样本空间和随机试验等概念。
1. 事件:事件是指在随机试验中可能发生的某个结果或者一组结果。
可以是简单事件(即只包含一个结果)或者复合事件(即包含多个结果)2. 样本空间:样本空间是指一个随机试验所有可能结果的集合。
用S表示。
3. 随机试验:随机试验是指具有以下特点的试验:在相同条件下可以重复进行,并且每次实验结果的不确定性。
二、概率计算概率计算是概率理论的核心内容,也是我们运用概率进行问题求解的基础。
概率计算有以下几种常见的方法:1. 频率法:频率法是通过大量的实验或观察,从中统计出某一事件发生的频率来估计概率。
频率越高,概率越大。
例如,抛硬币时正面朝上的频率接近0.5。
2. 古典概型:古典概型是指各个基本事件发生的可能性相等的情况,通过数学计算来求解概率。
常见的例子包括扑克牌问题和骰子问题。
3. 相对频率:相对频率是指在大量实验中某一事件发生的实际频率,用来估计真实概率。
例如,在掷骰子的实验中,我们可以通过实际掷骰子的次数来估计每个点数出现的概率。
三、基本概率公式基本概率公式是我们计算概率的重要工具之一。
在概率计算中,常见的基本概率公式有以下几个:1. 加法公式:加法公式用来计算两个事件中至少有一个发生的概率。
如果事件A和事件B互斥(即事件A和事件B不可能同时发生),则加法公式可以简化为P(A或B) = P(A) + P(B)。
2. 乘法公式:乘法公式用来计算两个事件同时发生的概率。
如果事件A和事件B是独立事件(即事件A的发生不受事件B的影响),则乘法公式可以简化为P(A和B) = P(A) × P(B)。
概率论基础知识点概率论作为一门重要的数学分支,被广泛应用于统计、金融、生物学等领域。
了解概率论的基础知识点是理解这门学科的关键。
本文将介绍概率论中的一些基础知识点,包括概率的定义、概率的性质、随机变量、概率分布等内容。
概率的定义概率是描述事件发生可能性大小的数值。
一般来说,概率的取值范围在0到1之间,0表示事件不可能发生,1表示事件一定会发生。
概率的定义可以用数学公式表示为:$$ P(A) = \\frac{n(A)}{n(S)} $$其中,P(A)表示事件A发生的概率,n(A)表示事件A发生的次数,n(S)表示样本空间S中的总次数。
概率的性质概率具有一些重要的性质,包括加法法则、乘法法则和互斥事件的概率计算等。
•加法法则:对于两个事件A和B,它们的并事件的概率可以用加法法则表示为$P(A \\cup B) = P(A) + P(B) - P(A \\cap B)$。
•乘法法则:对于两个事件A和B,它们同时发生的概率可以用乘法法则表示为$P(A \\cap B) = P(A) \\times P(B|A)$。
•互斥事件:如果事件A和B互斥(即不能同时发生),则它们的联合概率为0,即$P(A \\cap B) = 0$。
随机变量随机变量是描述随机实验结果的变量。
它可以是离散型随机变量或连续型随机变量。
离散型随机变量的取值为有限或无限个,连续型随机变量的取值为某个区间内的所有数值。
随机变量的概率分布描述了随机事件发生的可能性分布情况。
常见的概率分布包括二项分布、正态分布、泊松分布等。
概率分布概率分布是描述随机变量可能取值及其对应概率的函数。
常见的概率分布有:•二项分布:描述n次独立重复实验中成功次数的概率分布。
•正态分布:又称高斯分布,是自然界中最常见的分布,具有钟形曲线。
•泊松分布:描述单位时间(或单位空间)内随机事件发生次数的概率分布。
小结本文介绍了概率论中的一些基础知识点,包括概率的定义、概率的性质、随机变量和概率分布等内容。
概率基础知识一、事件与概率(一)随机现象在一定条件下,并不总是出现相同结果的现象称为随机现象。
从这个定义中可看出,随机现象有两个特点:(1)随机现象的结果至少有两个;(2)至于哪一个出现,人们事先并不知道。
抛硬币、掷骰子是两个最简单的随机现象。
抛一枚硬币,可能出现正面,也可能出现反面,至于哪一面出现,事先并不知道。
又如掷一颗骰子,可能出现1点到6点中某一个,至于哪一点出现,事先也并不知道。
〔例1.2-1]随机现象的例子:(1)一天内进入某超市的顾客数;(2)一顾客在超市中购买的商品数;(3)一顾客在超市排队等候付款的时间;(4)一颗麦穗上长着的麦粒个数;(5)新产品在未来市场的占有率;(6)一台电视机从开始使用到发生第一次故障的时间;(7)加工机械轴的直径尺寸;(8)一罐午餐肉的重量。
随机现象在质量管理中到处可见。
认识一个随机现象首要的是能罗列出它的一切可能发生的基本结果。
这里的基本结果是指今后的抽样单元,故又称样本点,随机现象一切可能样本点的全体称为这个随机现象的样本空间,常记为Ω。
“抛一枚硬币”的样本空间Ω={正面,反面};“掷一颗骰子”的样本空间Ω={1,2,3,4,5,6};“一顾客在超市中购买商品件数”的样本空间Ω={0,1,2,…};“一台电视机从开始使用到发生第一次故障的时间”的样本空间Ω={t:t≥0};“测量某物理量的误差”的样本空间Ω={x:-∞<x<∞}。
(二)随机事件随机现象的某些样本点组成的集合称为随机事件,简称事件,常用大写字母A、B、C等表示,如在掷一颗骰子时,“出现奇数点”是一个事件,它由1点、3点、5点共三个样本点组成,若记这个事件为A,则有A={1,3,5}。
1.随机事件的特征从随机事件的定义可见,事件有如下几个特征:(1)任一事件A是相应样本空间Ω中的一个子集。
在概率论中常用一个长方形示意样本空间Ω,用其中一个圆(或其他几何图形)示意事件A,见1.2-1,这类图形称为维恩(Venn)图。
基础知识要点一、概率.1. 概率:随机事件A 的概率是频率的稳定值,反之,频率是概率的近似值.2. 等可能事件的概率:如果一次试验中可能出现的结果有年n 个,且所有结果出现的可能性都相等,那么,每一个基本事件的概率都是n 1,如果某个事件A包含的结果有m 个,那么事件A 的概率nm P(A)=.3. ①互斥事件:不可能同时发生的两个事件叫互斥事件. 如果事件A 、B 互斥,那么事件A+B 发生(即A 、B 中有一个发生)的概率,等于事件A 、B 分别发生的概率和,即P(A+B)=P(A)+P(B),推广:)P(A)P(A)P(A )A A P(An21n 21+++=+++ .②对立事件:两个事件必有一个发生的互斥事件...............叫对立事件. 例如:从1~52张扑克牌中任取一张抽到“红桃”与抽到“黑桃”互为互斥事件,因为其中一个不可能同时发生,但又不能保证其中一个必然发生,故不是对立事件.而抽到“红色牌”与抽到黑色牌“互为对立事件,因为其中一个必发生. 注意:i.对立事件的概率和等于1:1)A P(A )A P(P(A)=+=+.ii.互为对立的两个事件一定互斥,但互斥不一定是对立事件.③相互独立事件:事件A(或B)是否发生对事件B(或A)发生的概率没有影响.这样的两个事件叫做相互独立事件. 如果两个相互独立事件同时发生的概率,等于每个事件发生的概率的积,即P(A·B)=P(A)·P(B). 由此,当两个事件同时发生的概率P (AB )等于这两个事件发生概率之和,这时我们也可称这两个事件为独立事件.例如:从一副扑克牌(52张)中任抽一张设A :“抽到老K”;B :“抽到红牌”则 A 应与B 互为独立事件[看上去A 与B 有关系很有可能不是独立事件,但261P(B)P(A),215226P(B),131524P(A)=⋅====.又事件AB 表示“既抽到老K 对抽到红牌”即“抽到红桃老K 或方块老K”有261522B)P(A ==⋅,因此有)B P(A P(B)P(A)⋅=⋅.推广:若事件n 21,A ,,A A 相互独立,则)P(A)P(A)P(A )A A P(A n21n 21 ⋅=⋅.注意:i. 一般地,如果事件A 与B 相互独立,那么A 与A B ,与B ,A 与B 也都相互独立.ii. 必然事件与任何事件都是相互独立的. iii. 独立事件是对任意多个事件来讲,而互斥事件是对同一实验来讲的多个事件,且这多个事件不能同时发生,故这些事件相互之间必然影响,因此互斥事件一定不是独立事件. ④独立重复试验:若n 次重复试验中,每次试验结果的概率都不依赖于其他各次试验的结果,则称这n 次试验是独立的. 如果在一次试验中某事件发生的概率为互斥对立P ,那么在n 次独立重复试验中这个事件恰好发生k 次的概率:kn k k n nP)(1P C (k)P --=.4. 对任何两个事件都有)()()()(B A P B P A P B A P ⋅-+=+二、随机变量.1. 随机试验的结构应该是不确定的.试验如果满足下述条件:①试验可以在相同的情形下重复进行;②试验的所有可能结果是明确可知的,并且不止一个;③每次试验总是恰好出现这些结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果. 它就被称为一个随机试验.2. 离散型随机变量:如果对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.若ξ是一个随机变量,a ,b 是常数.则ba +=ξη也是一个随机变量.一般地,若ξ是随机变量,)(x f 是连续函数或单调函数,则)(ξf 也是随机变量.也就是说,随机变量的某些函数也是随机变量.设离散型随机变量ξ可能取的值为: ,,,,21i x x x ξ取每一个值),2,1(1 =i x 的概率ii p x P ==)(ξ,则表称为随机变量ξ的概率分布,有性质① ,2,1,01=≥i p ; ②121=++++ i p p p .注意:若随机变量可以取某一区间内的一切值,这样的变量叫做连续型随机变量.例如:]5,0[∈ξ即ξ可以取0~5之间的一切数,包括整数、小数、无理数. 3. ⑴二项分布:如果在一次试验中某事件发生的概率是P ,那么在n 次独立重复试验中这个事件恰好发生k 次的概率是:k n k k n qp C k)P(ξ-==[其中pq n k -==1,,,1,0 ]于是得到随机变量ξ的概率分布如下:我们称这样的随机变量ξ服从二项分布,记作ξ~B (n·p ),其中n ,p 为参数,并记p)n b(k;qp Ckn k kn⋅=-.⑵二项分布的判断与应用.①二项分布,实际是对n 次独立重复试验.关键是看某一事件是否是进行n 次独立重复,且每次试验只有两种结果,如果不满足此两条件,随机变量就不服从二项分布.②当随机变量的总体很大且抽取的样本容量相对于总体来说又比较小,而每次抽取时又只有两种试验结果,此时可以把它看作独立重复试验,利用二项分布求其分布列. 4. 几何分布:“k=ξ”表示在第k 次独立重复试验时,事件第一次发生,如果把k次试验时事件A 发生记为kA ,事A 不发生记为q)P(A,A kk =,那么)A A A A P(k)P(ξk 1k 21-== .根据相互独立事件的概率乘法分式:))P(A A P()A )P(A P(k)P(ξk 1k 21-== ),3,2,1(1==-k p qk 于是得到随机变量ξ的概率分布列.我们称ξ服从几何分布,并记p q p)g(k,1k -=,其中3,2,1.1=-=k p q5. ⑴超几何分布:一批产品共有N 件,其中有M (M <N )件次品,今抽取)N n n(1≤≤件,则其中的次品数ξ是一离散型随机变量,分布列为)M N k n M,0k (0C C C k)P(ξn Nkn MN kM -≤-≤≤≤⋅⋅==--.〔分子是从M 件次品中取k 件,从N-M件正品中取n-k 件的取法数,如果规定m <r 时0C r m =,则k 的范围可以写为k=0,1,…,n.〕⑵超几何分布的另一种形式:一批产品由 a 件次品、b 件正品组成,今抽取n 件(1≤n≤a+b ),则次品数ξ的分布列为n.,0,1,k C CC k)P(ξnba kn b ka =⋅==+-.⑶超几何分布与二项分布的关系.设一批产品由a 件次品、b 件正品组成,不放回抽取n 件时,其中次品数ξ服从超几何分布.若放回式抽取,则其中次品数η的分布列可如下求得:把b a +个产品编号,则抽取n 次共有n b a )(+个可能结果,等可能:k)(η=含kn k k nb a C -个结果,故n,0,1,2,k ,)ba a (1)ba a (C b)(a ba C k)P(ηkn kkn nk n k k n =+-+=+==--,即η~)(ba a n B +⋅.[我们先为k 个次品选定位置,共k n C 种选法;然后每个次品位置有a 种选法,每个正品位置有b 种选法] 可以证明:当产品总数很大而抽取个数不多时,k)P(ηk)P(ξ=≈=,因此二项分布可作为超几何分布的近似,无放回抽样可近似看作放回抽样. 三、数学期望与方差.则称++++=n n p x p x p x E 2211ξ为ξ的数学期望或平均数、均值.数学期望又简称期望.数学期望反映了离散型随机变量取值的平均水平. 2. ⑴随机变量ba +=ξη的数学期望:b aE b a E E +=+=ξξη)(①当0=a 时,b b E =)(,即常数的数学期望就是这个常数本身.②当1=a 时,b E b E +=+ξξ)(,即随机变量ξ与常数之和的期望等于ξ的期望与这个常数的和.③当0=b 时,ξξaE a E =)(,即常数与随机变量乘积的期望等于这个常数与随机变量期望的乘积. ⑵单点分布:c c E =⨯=1ξ其分布列为:cP ==)1(ξ.⑶两点分布:p p q E =⨯+⨯=10ξ,其分布列为:(p + q = 1) ⑷二项分布:∑=⋅-⋅=-npqp k n k n k E knk )!(!!ξ 其分布列为ξ~),(p n B .(P 为发生ξ的概率) ⑸几何分布:pE 1=ξ其分布列为ξ~),(p k q .(P 为发生ξ的概率)3.方差、标准差的定义:当已知随机变量ξ的分布列为),2,1()( ===k p x P k k ξ时,则称+-++-+-=n n p E x p E x p E xD 2222121)()()(ξξξξ为ξ的方差. 显然0≥ξD ,故σξξσξ.D =为ξ的根方差或标准差.随机变量ξ的方差与标准差都反映了随机变量ξ取值的稳定与波动,集中与离散的程度.ξD 越小,稳定性越高,波动越小............... 4.方差的性质. ⑴随机变量ba +=ξη的方差ξξηD a b a D D 2)()(=+=.(a 、b 均为常数) ⑵单点分布:0=ξD 其分布列为pP ==)1(ξ⑶两点分布:pqD =ξ 其分布列为:(p + q =1)⑷二项分布:npqD =ξ ⑸几何分布:2pq D =ξ5. 期望与方差的关系.⑴如果ξE 和ηE 都存在,则ηξηξE E E ±=±)(⑵设ξ和η是互相独立的两个随机变量,则ηξηξηξξηD D D E E E +=+⋅=)(,)( ⑶期望与方差的转化:22)(ξξξE E D -= ⑷)()()(ξξξξE E E E E -=-(因为ξE 为一常数)0=-=ξξE E .四、正态分布.(基本不列入考试范围)1.密度曲线与密度函数:对于连续型随机变量ξ,位于x 轴上方,ξ落在任一区间),[b a 内的概率等于它与x 轴.直线a x =与直线x(如图阴影部分)的曲线叫ξ图像的函数)(x f 叫做ξ的密度函数,由于“(-∞∈x 是必然事件,故密度曲线与x 2. ⑴正态分布与正态曲线:如果随机变量ξ的概率密度为:222)(21)(σμσπ--=x ex f .(σμ,,R x ∈为常数,且0 σ),称ξ服从参数为σμ,的正态分布,用ξ~),(2σμN 表示.)(x f 的表达式可简记为),(2σμN ,它的密度曲线简称为正态曲线.⑵正态分布的期望与方差:若ξ~),(2σμN ,则ξ的期望与方差分别为:2,σξμξ==D E .⑶正态曲线的性质.①曲线在x 轴上方,与x 轴不相交. ②曲线关于直线μ=x 对称.③当μ=x 时曲线处于最高点,当x 向左、向右远离时,曲线不断地降低,呈现出“中间高、两边低”的钟形曲线.④当x <μ时,曲线上升;当x >μ时,曲线下降,并且当曲线向左、向右两边无限延伸时,以x 轴为渐近线,向x 轴无限的靠近.⑤当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”.表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中. 3. ⑴标准正态分布:如果随机变量ξ的概率函数为)(21)(22+∞-∞=- x ex xπϕ,则称ξ服从标准正态分布. 即ξ~)1,0(N 有)()(x P x ≤=ξϕ,)(1)(x x --=ϕϕ求出,而P(a <ξ≤b )的计算则是)()()(a b b a P ϕϕξ-=≤ .注意:当标准正态分布的)(x Φ的X 取0时,有5.0)(=Φx 当)(x Φ的X 取大于0的数时,有5.0)( x Φ.比如5.00793.0)5.0(=-Φσμ则σμ-5.0S 阴=0.5S a =0.5+S⑵正态分布与标准正态分布间的关系:若ξ~),(2σμN 则ξ的分布函数通 常用)(x F 表示,且有)σμx (F(x )x )P(ξ-==≤ϕ.4.⑴“3σ”原则.假设检验是就正态总体而言的,进行假设检验可归结为如下三步:①提出统计假设,统计假设里的变量服从正态分布),(2σμN .②确定一次试验中的取值a 是否落入范围)3,3(σμσμ+-.③做出判断:如果)3,3(σμσμ+-∈a ,接受统计假设. 如果)3,3(σμσμ+-∉a ,由于这是小概率事件,就拒绝统计假设.⑵“3σ”原则的应用:若随机变量ξ服从正态分布),(2σμN 则 ξ落在)3,3(σμσμ+-内的概率为99.7% 亦即落在)3,3(σμσμ+-之外的概率为0.3%,此为小概率事件,如果此事件发生了,就说明此种产品不合格(即ξ不服从正态分布).。
1.第一节、介绍微积分中极限、导数,微分、积分等相关概念;2.第二节、介绍随机变量及其分布;3.第三节、介绍数学期望.方差.协方差.相关系数.中心极限定理等概念;4.第四节、依据数理统计学简史介绍正态分布的前后由来;5.第五节、论道正态,介绍正态分布的4大数学推导。
5部分起承转合,彼此依托,层层递进。
且在本文中,会出现诸多并不友好的大量各种公式,但基本的概念.定理是任何复杂问题的根基,所以,你我都有必要硬着头皮好好细细阅读。
最后,本文若有任何问题或错误,恳请广大读者朋友们不吝批评指正,谢谢。
第一节、微积分的基本概念开头前言说,微积分是概数统计基础,概数统计则是DM&ML之必修课”,是有一定根据的,包括后续数理统计当中,如正态分布的概率密度函数中用到了相关定积分的知识,包括最小二乘法问题的相关探讨求证都用到了求偏导数的等概念,这些都是跟微积分相关的知识。
故咱们第一节先复习下微积分的相关基本概念。
事实上,古代数学中,单单无穷小、无穷大的概念就讨论了近200年,而后才由无限发展到极限的概念。
1.1、极限极限又分为两部分:数列的极限和函数的极限。
1.1.1、数列的极限定义如果数列{xn}与常a 有下列关系:对于任意给定的正数e (不论它多么小 , 总存在正整数N , 使得对于n >N 时的一切xn, 不等式 |xn-a |<e都成立, 则称常数a 是数列{xn}的极限, 或者称数列{xn}收敛于a , 记为或也就是说,1.1.2、函数的极限设函数f(x)在点x0的某一去心邻域内有定义. 如果存在常数A, 对于任意给定的正数e (不论它多么小), 总存在正数d, 使得当x满足不等式0<|x-x0|<d 时, 对应的函数值f(x)都满足不等式|f(x)-A|<e , 那么常数A就叫做函数f(x)时的极限, 记为也就是说,几乎没有一门新的数学分支是某个人单独的成果,如笛卡儿和费马的解析几何不仅仅是他们两人研究的成果,而是若干数学思潮在16世纪和17世纪汇合的产物,是由许许多多的学者共同努力而成。
甚至微积分的发展也不是牛顿与莱布尼茨两人之功。
在17世纪下半叶,数学史上出现了无穷小的概念,而后才发展到极限,到后来的微积分的提出。
然就算牛顿和莱布尼茨提出了微积分,但微积分的概念尚模糊不清,在牛顿和莱布尼茨之后,后续经过一个多世纪的发展,诸多学者的努力,才真正清晰了微积分的概念。
也就是说,从无穷小到极限,再到微积分定义的真正确立,经历了几代人几个世纪的努力,而课本上所呈现的永远只是冰山一角。
1.2、导数设有定义域和取值都在实数域中的函数。
若在点的某个邻域内有定义,则当自变量在处取得增量(点仍在该邻域内)时,相应地函数取得增量;如果与之比当时的极限存在,则称函数在点处可导,并称这个极限为函数在点处的导数,记为。
即:也可记为:,或。
1.3、微分设函数在某区间内有定义。
对于内一点,当变动到附近的(也在此区间内)时。
如果函数的增量可表示为(其中是不依赖于的常数),而是比高阶的无穷小,那么称函数在点是可微的,且称作函数在点相应于自变量增量的微分,记作,即,是的线性主部。
通常把自变量的增量称为自变量的微分,记作,即。
实际上,前面讲了导数,而微积分则是在导数的基础上加个后缀,即为:。
1.4、积分积分是微积分学与数学分析里的一个核心概念。
通常分为定积分和不定积分两种。
不定积分的定义一个函数的不定积分,也称为原函数或反导数,是一个导数等于的函数,即不定积分的有换元积分法,分部积分法等求法。
定积分的定义直观地说,对于一个给定的正实值函数,在一个实数区间上的定积分:定积分与不定积分区别在于不定积分便是不给定区间,也就是说,上式子中,积分符号没有a、b。
下面,介绍定积分中值定理。
如果函数f(x)在闭区间[a,b]上连续, 则在积分区间[a,b]上至少存在一个点,使下式成立:这个公式便叫积分中值公式。
牛顿-莱布尼茨公式接下来,咱们讲介绍微积分学中最重要的一个公式:牛顿-莱布尼茨公式。
如果函数F (x)是连续函数f(x)在区间[a, b]上的一个原函数, 则此公式称为牛顿-莱布尼茨公式, 也称为微积分基本公式。
这个公式由此便打通了原函数与定积分之间的联系,它表明:一个连续函数在区间[a, b]上的定积分等于它的任一个原函数在区间[a, b]上的增量,如此,便给定积分提供了一个有效而极为简单的计算方法,大大简化了定积分的计算手续。
下面,举个例子说明如何通过原函数求取定积分。
如要计算,由于是的一个原函数,所以。
1.5、偏导数对于二元函数z = f(x,y) 如果只有自变量x 变化,而自变量y固定这时它就是x的一元函数,这函数对x的导数,就称为二元函数z = f(x,y)对于x的偏导数。
定义设函数z = f(x,y)在点(x0,y0)的某一邻域内有定义,当y固定在y0而x在x0处有增量时,相应地函数有增量,如果极限存在,则称此极限为函数z = f(x,y)在点(x0,y0)处对x 的偏导数,记作:例如。
类似的,二元函数对y求偏导,则把x 当做常量。
此外,上述内容只讲了一阶偏导,而有一阶偏导就有二阶偏导,这里只做个简要介绍,具体应用具体分析,或参看高等数学上下册相关内容。
接下来,进入本文的主题,从第二节开始。
第二节、离散.连续.多维随机变量及其分布2.1、几个基本概念点(一)样本空间定义:随机试验E的所有结果构成的集合称为E的样本空间,记为S={e},称S中的元素e为样本点,一个元素的单点集称为基本事件.(二)条件概率1.条件概率就是事件A在另外一个事件B已经发生条件下的发生概率。
条件概率表示为P(A|B),读作“在B条件下A的概率”。
2.联合概率表示两个事件共同发生的概率。
A与B的联合概率表示为或者。
3.边缘概率是某个事件发生的概率。
边缘概率是这样得到的:在联合概率中,把最终结果中不需要的那些事件合并成其事件的全概率而消失(对离散随机变量用求和得全概率,对连续随机变量用积分得全概率)。
这称为边缘化(marginalization)。
A 的边缘概率表示为P(A),B的边缘概率表示为P(B)。
在同一个样本空间Ω中的事件或者子集A与B,如果随机从Ω中选出的一个元素属于B,那么这个随机选择的元素还属于A的概率就定义为在B的前提下A的条件概率。
从这个定义中,我们可以得出P(A|B) = |A∩B|/|B|分子、分母都除以|Ω|得到有时候也称为后验概率。
同时,P(A|B)与P(B|A)的关系如下所示:。
(三)全概率公式和贝叶斯公式1、全概率公式假设{ Bn : n = 1, 2, 3, ... } 是一个概率空间的有限或者可数无限的分割,且每个集合Bn 是一个可测集合,则对任意事件A有全概率公式:又因为所以,此处Pr(A | B)是B发生后A的条件概率,所以全概率公式又可写作:在离散情况下,上述公式等于下面这个公式:。
但后者在连续情况下仍然成立:此处N是任意随机变量。
这个公式还可以表达为:"A的先验概率等于A的后验概率的先验期望值。
2、贝叶斯公式贝叶斯定理(Bayes' theorem),是概率论中的一个结果,它跟随机变量的条件概率以及边缘概率分布有关。
在有些关于概率的解说中,贝叶斯定理(贝叶斯更新)能够告知我们如何利用新证据修改已有的看法。
通常,事件A在事件B(发生)的条件下的概率,与事件B在事件A的条件下的概率是不一样的;然而,这两者是有确定的关系,贝叶斯定理就是这种关系的陈述。
如此篇blog第二部分所述“据维基百科上的介绍,贝叶斯定理实际上是关于随机事件A和B的条件概率和边缘概率的一则定理。
如上所示,其中P(A|B)是在B发生的情况下A发生的可能性。
在贝叶斯定理中,每个名词都有约定俗成的名称:∙P(A)是A的先验概率或边缘概率。
之所以称为"先验"是因為它不考虑任何B方面的因素。
∙P(A|B)是已知B发生后A的条件概率(直白来讲,就是先有B而后=>才有A),也由于得自B的取值而被称作A的后验概率。
∙P(B|A)是已知A发生后B的条件概率(直白来讲,就是先有A而后=>才有B),也由于得自A的取值而被称作B的后验概率。
∙P(B)是B的先验概率或边缘概率,也作标准化常量(normalized constant)。
按这些术语,Bayes定理可表述为:后验概率 = (相似度*先验概率)/标准化常量,也就是說,后验概率与先验概率和相似度的乘积成正比。
另外,比例P(B|A)/P(B)也有时被称作标准相似度(standardised likelihood),Bayes定理可表述为:后验概率 = 标准相似度*先验概率。
”综上,自此便有了一个问题,如何从从条件概率推导贝叶斯定理呢?根据条件概率的定义,在事件B发生的条件下事件A发生的概率是同样地,在事件A发生的条件下事件B发生的概率整理与合并这两个方程式,我们可以找到这个引理有时称作概率乘法规则。
上式两边同除以P(B),若P(B)是非零的,我们可以得到贝叶斯定理:2.2、随机变量及其分布2.2.1、何谓随机变量何谓随机变量?即给定样本空间,其上的实值函数称为(实值)随机变量。
如果随机变量的取值是有限的或者是可数无穷尽的值,则称为离散随机变量(用白话说,此类随机变量是间断的)。
如果由全部实数或者由一部分区间组成,则称为连续随机变量,连续随机变量的值是不可数及无穷尽的(用白话说,此类随机变量是连续的,不间断的):也就是说,随机变量分为离散型随机变量,和连续型随机变量,当要求随机变量的概率分布的时候,要分别处理之,如:针对离散型随机变量而言,一般以加法的形式处理其概率和;而针对连续型随机变量而言,一般以积分形式求其概率和。
再换言之,对离散随机变量用求和得全概率,对连续随机变量用积分得全概率。
这点包括在第4节中相关期望.方差.协方差等概念会反复用到,望读者注意之。
2.2.2、离散型随机变量的定义定义:取值至多可数的随机变量为离散型的随机变量。
概率分布(分布律)为且(一)(0-1)分布若X的分布律为:同时,p+q=1,p>0,q>0,则则称X服从参数为p的0-1分布,或两点分布。
此外,(0-1)分布的分布律还可表示为:或我们常说的抛硬币实验便符合此(0-1)分布。
(二)、二项分布二项分布是n个独立的是/非试验中成功的次数的离散概率分布,其中每次试验的成功概率为p。
这样的单次成功/失败试验又称为伯努利试验。
举个例子就是,独立重复地抛n次硬币,每次只有两个可能的结果:正面,反面,概率各占1/2。
设A在n重贝努利试验中发生X次,则并称X服从参数为p的二项分布,记为:与此同时,(三)、泊松分布(Poisson分布)Poisson分布(法语:loi de Poisson,英语:Poisson distribution),即泊松分布,是一种统计与概率学里常见到的离散概率分布,由法国数学家西莫恩·德尼·泊松(Siméon-Denis Poisson)在1838年时发表。