概率论与数理统计
- 格式:doc
- 大小:286.95 KB
- 文档页数:9
第一章 概率论第一节 随机事件和概率一、排列组合初步(1)排列组合公式)!(!n m m P n m -= 从m 个人中挑出n 个人进行排列的可能数。
)!(!!n m n m C n m -=从m 个人中挑出n 个人进行组合的可能数。
(2)加法原理(两种方法均能完成此事):n m +某件事由两种方法来完成,第一种方法可由m 种方法完成,第二种方法可由n 种方法来完成,则这件事可由m+n 种方法来完成。
(3)乘法原理(两个步骤分别不能完成这件事):n m ⨯某件事由两个步骤来完成,第一个步骤可由m 种方法完成,第二个步骤可由n 种方法来完成,则这件事可由n m ⨯种方法来完成。
(4)一些常见排列① 特殊排列② 相邻③ 彼此隔开④ 顺序一定和不可分辨【例1】 袋中有N 个球,其中M 个为白色,从中有放回地取出n 个:①N =10,M =2, n =3;②N =10,M =4,n =3.考虑以下各事件的排列数: (Ⅰ)全不是白色的球. (Ⅱ)恰有两个白色的球. (Ⅲ)至少有两个白色的球. (Ⅳ)至多有两个白色的球. (Ⅴ)颜色相同. (Ⅵ)不考虑球的颜色.解:①当M =2时,(Ⅰ)83. (Ⅱ)3³22³8. (Ⅲ)3³22³8+23.(Ⅳ)3³22³8+3³2³83+83(或103-23). (Ⅴ)23+83. (Ⅵ)103. ②当M =4时,将上面的2→4,8→6即可.二、随机试验、随机事件及其运算(1)随机试验和随机事件如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。
试验的可能结果称为随机事件。
例如:掷一枚硬币,出现正面及出现反面;掷一颗骰子,出现“1”点、“5”点和出现偶数点都是随机事件;电话接线员在上午9时到10时接到的电话呼唤次数(泊松分布);对某一目标发射一发炮弹,弹着点到目标的距离为0.1米、0.5米及1米到3米之间都是随机事件(正态分布)。
2.和(并):
3.互斥(互不相容):对立:
事件的运算:
伯努利大数定律:当试验次数n足够大时,事件发生的频率就约等于事件发生的概率。
全概率公式、贝叶斯公式
定义:
引入随机变量后,可用随机变量的
等式或不等式来表达随机事件;
随机变量的函数一般也是随机变量
0-1分布是n=1时的二项分布
定义:性质:
定义:
F(x)是X的分布函数,X是连续型随机变量,f(x)是它的概率密度函数,简称概率密度
性质:
均匀分布:
标准正态分布N(0,1)
标准正态分布的分位数
举例:
期望反映了随机变量取值的平均,又称均值。
概率论与数理统计概率论与数理统计是现代数学中非常重要的分支之一,它们在自然科学、社会科学,以及工程技术等领域都有广泛的应用。
在生物学,物理学,化学等领域,常常需要采用概率论和数理统计的方法,来研究和分析现象。
这篇文章将要探讨概率论和数理统计的一些基本概念和方法,并介绍它们在现实生活中的应用。
一、概率论概率论是一门研究随机现象及其规律的数学学科。
它的基本思想是通过建立数学模型,来描述随机事件的概率分布及其规律。
随机事件指某一次试验中可能发生或不发生的事情,例如掷骰子、抛硬币、抽扑克牌等,这些事件的结果是随机的,因此需要采用概率论的方法来研究。
1.概率和概率分布概率是指某一事件发生的可能性,用一个数值来表示。
在概率论中,对于某一特定随机事件,概率的大小常常用P(A)来表示,其中A是这个事件。
例如,抛一枚硬币,正面朝上的概率是0.5,用数学语言可以表示为P(正面)=0.5,反面朝上的概率也是0.5,即P(反面)=0.5。
概率分布是指某个随机事件的各种结果的概率分布情况。
在一次试验中,随机事件可能会有多个结果,即样本空间。
概率分布用来描述每个结果的概率大小。
例如,抛一枚硬币的样本空间是{正面,反面},正面和反面各占1/2的概率。
2.条件概率和独立事件条件概率是指在已知某个事件发生的情况下,某个随机事件会发生的概率。
条件概率的计算方法一般采用贝叶斯公式,例如给定事件A,以及事件B,P(A|B)表示在B发生的情况下,A 发生的概率,则条件概率可以表示为:P(A|B) = P(AB)/P(B)其中AB表示事件A和事件B同时发生的概率,P(B)表示事件B发生的概率。
独立事件是指某个随机事件的发生不会对另一个随机事件的发生产生影响。
如果事件A、B是独立事件,则可以表示为P(A|B) = P(A),P(B|A) = P(B),即A和B的概率相互独立,并不受对方的影响。
3.期望值和方差期望值是统计学中一个非常重要的概念,用来描述一个随机变量的总体平均数。
3、分布函数与概率的关系 ∞<<∞-≤=x x X P x F ),()()()()()()(a F b F a X P b X P b X a P -=≤-≤=≤<4、离散型随机变量的分布函数 (1) 0 – 1 分布 1,0,)1()(1=-==-k p p k X P kk(2) 二项分布 ),(p n B n k p p C k X P k n kk n ,,1,0,)1()( =-==-泊松定理 0lim >=∞→λn n np 有,2,1,0!)1(lim ==---∞→k k ep p C kkn n k nkn n λλ(3) 泊松分布 )(λP = ,2,1,0,!)(===-k k e k X P kλλ〔5〕几何分布 p q k p qk X P k -====-1,2,1}{1dt t f x F x ⎰∞-=)()(则称X 为连续型随机变量,其中函数f(x)称为随机变量X 的概率密度函数, 2、分布函数的性质:〔1〕连续型随机变量的分布函数F(x )是连续函数。
〔2〕对于连续型随机变量X 来说,它取任一指定实数a 的概率均为零,即P{X=a }=0。
3、常见随机变量的分布函数 (1) 均匀分布 ),(b a U⎪⎩⎪⎨⎧<<-=其他,0,1)(b x a ab x f ⎪⎪⎩⎪⎪⎨⎧--=1,,0)(a b a x x F (2) 指数分布 )(λE⎪⎩⎪⎨⎧>=-其他,00,)(x e x f x λλ ⎩⎨⎧≥-<=-0,10,0)(x e x x F xλ (3) 正态分布 N (μ , σ 2 )+∞<<∞-=--x e x f x 222)(21)(σμσπ ⎰∞---=xt t ex F d 21)(222)(σμσπN (0,1) — 标准正态分布+∞<<∞-=-x e x x 2221)(πϕ +∞<<∞-=Φ⎰∞--x t ex x t d 21)(22π2、连续型随机变量函数的分布: 〔1〕分布函数法;(){}⎰⎰<==∈=yx g X l X y Y dx x f dx x f l X P y F y)()()(〔2〕设随机变量X 具有概率密度f X (x ),又设函数g(x )处处可导且恒有g '(x )>0 (或恒有g '(x )<0) ,则Y=g(X )的概率密度为()()[]()⎩⎨⎧<<'=其他βαy y h y h f y f X Y 其中x =h(y )为y =g(x )的反函数,()()()()()()∞+∞-=∞+∞-=g g g g ,max ,,min βα 3、 二维连续型随机变量 〔1〕联合分布函数为dudv v u f y x F y x ⎰⎰∞-∞-=),(),(函数 f (x ,y )称为二维向量(X ,Y )的(联合)概率密度. 其中: 0),(≥y x f ,⎰⎰∞∞-∞∞-=1),(dxdy y x f〔2〕基本二维连续型随机向量分布均匀分布:⎪⎩⎪⎨⎧∈=其他),(1),(G y x Ay x f二维正态分布:+∞<<-∞+∞<<∞--=-+------y x ey x f y y x x ,121),(])())((2)([)1(212212222212121212σμσσμμρσμρρσπσ3、离散型边缘分布律:4、 连续型边缘概率密度,),()(dy y x f x f X ⎰∞+∞-= dx y x f y f Y ⎰∞+∞-=),()(F (x ,y )=F x (x )F Y (y ) 则称随机变量X 和Y 是相互独立的3、连续型随机变量独立的等价条件 设(X ,Y )是连续型随机变量,f (x ,y ),f x (x ),f Y (y )分别为(X ,Y )的概率密度和边缘概率密度,则X 和Y 相互独立的充要条件是等式 f (x ,y ) = f x (x )f Y (y ) 对f (x ,y ),f x (x ),f Y (y )的所有连续点成立. 五、条件分布1、离散型随机变量的条件分布律: 〔3〕条件分布函数:2、连续型随机变量的条件分布 〔1〕条件分布函数⎰⎰∞-∞-==x Y Y X Y x Y X du y f y u f y x F y f du y u f y x F )(),()|()(),()|(||或写成, 〔2〕条件概率密度在Y=y 条件下X 的条件概率密度)(),()|(|y f y x f y x f Y Y X =同理 X=x 条件下X 的条件概率密度)(),()|(|x f y x f x y f X X Y =六、多维随机函数的分布1、离散型随机变量函数分布:二项分布:设X 和Y 独立,分别服从二项分布b (n 1,p ), 和b (n 2,p ),则 Z=X+Y 的分布律:Z ~b (n 1+n 2,p ).泊松分布:假设X 和Y 相互独立,它们分别服从参数为21,λλ的泊松分布,则Z=X+Y 服从参数为21λλ+的泊松分布。
概率论与数理统计首先,概率论是研究随机事件发生的可能性的数学理论。
概率论的基本概念包括样本空间、事件、概率等。
样本空间是指所有可能结果的集合,事件是样本空间的子集,概率是用来描述事件发生可能性的大小。
概率论主要研究的是随机事件的规律性和性质,通过概率论的基本概念和理论,可以对随机事件进行合理的量化和分析。
数理统计是根据概率论的基本原理,通过对样本观测数据的分析来对总体的性质进行推断和估计的一门学科。
数理统计主要包括描述统计和推断统计两个部分。
描述统计是通过对样本数据进行整理、分析和表示,来描述总体数据的特征和分布情况。
推断统计是根据样本统计量,对总体参数进行推断和估计。
数理统计在许多领域中都有广泛的应用,如社会科学、自然科学、医学、工程等。
相关分析是数理统计中的一个重要方法,它研究两个变量之间的相关性。
相关性指的是两个变量之间的关系,既可以是正相关,也可以是负相关,还可以是没有相关性。
通过相关分析,可以帮助我们了解两个变量之间的关系及其强度,从而可以进行进一步的预测和分析。
在相关分析中,常用的统计量包括相关系数和相关显著性检验。
相关系数是衡量两个变量之间相关性强度的指标,其取值范围在-1到1之间。
当相关系数接近1时,表示两个变量正相关,相关系数接近-1时,表示两个变量负相关,相关系数接近0时,表示两个变量没有相关性。
相关显著性检验可以用来检验相关系数是否显著不等于0,从而判断两个变量之间是否存在相关性。
相关分析在实际应用中具有广泛的应用价值。
例如,在金融领域中,可以利用相关分析来研究不同股票之间的相关性,从而帮助投资者进行风险分散和资产配置。
在医学研究中,可以利用相关分析来研究因变量和自变量之间的关系,从而帮助医生和研究人员了解疾病的发展和治疗效果。
在市场调查中,可以利用相关分析来研究不同因素之间的相关性,从而帮助企业做出有效的营销策略。
综上所述,概率论与数理统计及其相关分析是一门重要的学科,它在现实生活和科学研究中具有广泛的应用价值。
概率论和数理统计的关系概率论和数理统计是数学的两个重要分支,它们之间存在密切的关系。
概率论是研究随机事件发生的规律性的数学理论,而数理统计则是通过概率论的方法,对收集到的数据进行分析和推断的工具。
概率论为数理统计提供了基础理论和方法,而数理统计则是概率论在实际问题中的应用。
概率论是数理统计的基础。
概率论研究的是随机事件的发生概率以及事件之间的关系,为数理统计提供了严密的数学基础。
在数理统计中,我们通常需要对一组数据进行分析和推断,而这些数据往往受到各种随机因素的影响,因此需要用概率论的方法来描述和处理。
例如,在研究一种新药物的疗效时,我们需要收集患者的数据并进行统计分析,而这些数据往往受到患者个体差异、药物剂量等随机因素的影响,因此需要运用概率论的知识对数据进行建模和分析。
数理统计是概率论的应用。
概率论研究的是随机事件的规律性,而数理统计则是通过概率论的方法对实际问题进行统计分析和推断。
数理统计可以通过收集一组样本数据来推断总体的特征和规律。
例如,在市场调研中,我们通常只能对一部分人进行调查,通过对这部分人的数据进行分析和推断,从而得出对整个市场的结论。
这种推断是基于概率论的方法,通过对样本数据的统计分析,来推断总体的特征和规律。
概率论和数理统计的关系可以用一个简单的例子来说明。
假设我们有一个罐子,里面装有黑色和白色两种颜色的球,我们想知道黑色球和白色球的比例。
我们可以通过从罐子中随机抽取一些球,然后统计黑色球和白色球的数量,进而推断总体比例。
在这个例子中,概率论研究的是在给定条件下随机事件的发生概率,而数理统计则是通过对样本数据的统计分析,推断总体的特征和规律。
在实际应用中,概率论和数理统计经常是相辅相成的。
概率论提供了概率分布、随机变量、期望和方差等概念和工具,为数理统计的推断和分析提供了理论基础。
而数理统计则通过采样、估计和假设检验等方法,将概率论的理论转化为实际问题的解决方案。
概率论和数理统计的结合使得我们能够从收集到的数据中获取更多的信息,并做出合理的推断和决策。
一.填空题2. 设A 、B 为不相容的两个随机事件,且P (A )=0.2, P (B )=0.5,则P (AB )= ,()P A B = .答 案:0, 0.74. 设A 、B 为互相独立的随机事件,P (A )=0.4, P (B )=0.7,则P (AB )= ,()P A B = .答 案:0.28, 0.825. 已知()()4070.B A P ,.A P =-=,则()=AB P 。
答 案:0.37. 若X 是连续型随机变量,则对任常数C 有()==C X P 。
答 案: 09. 设连续型随机变量X 的分布函数为()2,1;,12;1,2.x F x Ax x x <⎧⎪=≤<⎨⎪≥⎩则常数=A 。
答 案:41 10. 已知随机变量X 服从正态分布()110,N ,若()50.a X P =≤,则=a 。
答 案:1013. 设二维离散型随机变量(X ,Y )的联合分布律为:1010.120.40.2XYa -, 则a = . 答 案: 0.315. 设随机变量X 与Y 相互独立,其概率分布律分别为:406010..PX ,703032..PY , 则()Y ,X 的联合分布律为 . 答 案:28.042.012.018.01032XY17. 设随机变量X 服从参数为4的泊松分布,且Y =2X +1,则EY = ,DY = .答 案:9, 1618.随机变量X 与Y 相关,则X 与Y (填一定或可能)独立.答案:可能20. 如果随机变量X 与Y 有线性关系b aX Y +=,其中b ,a 0≠为常数,则相关系数XY ρ的绝对值=XY ρ 。
答 案: 122. 总体X 服从参数为()10<<p p 的(0—1)分布,从中抽取容量为10的样本值 ()1011011010,,,,,,,,,,则样本均值=X 。
答案:60106.= 24. 已知一批零件的长度X (单位:cm)服从正态分布N (μ,1), 从中随机的取出16个零件,得到长度的平均值为40cm ,则μ的置信水平为95%的置信区间是___________.答 案:(39.51,40.49)25.假设检验中犯两类错误的概率的和 (填一定或不一定)等于1.答案:不一定 二.选择题2. 设连续型随机变量X ~N (2,16),则2~4X -( ) B 、N (0,1) 答 案:B5. 设X 与Y 相互独立,且知X ~N (20,4),Y ~N (8,2),则Z =2X -Y 服从的分布是( )。
B 、N (32,18) 答 案:B7. 总体X 服从正态分布2(,8)N μ,μ未知,n X ,,X ,X 21是取自该总体的样本。
下列函数中是统计量的是( )。
A :()211∑-nK X X n ,9.设总体X 服从正态分布()2σμ,N ,参数02>σμ,都未知。
从中抽取一组容量25=n 的样本观测值2521x ,,x ,x ,经计算得到样本均值40=x ,样本方差92=S 。
可知均值μ的置信度为9501.=-α的置信区间为( )。
(附表:()()()()062247112497509619506510250050.t ,.t ,..,....====ΦΦ)D :⎥⎦⎤⎢⎣⎡⨯+⨯-53062405306240.,.答 案:D三. 计算题1. 有甲、乙、丙三个盒子,其中分别有3个白球和2个黑球、3个黑球和2个白球、3个白球和3个黑球。
掷一枚骰子,若出现1,2,3点则选甲盒,若出现4点则选乙盒,否则选丙盒。
然后从所选中的盒子中任取一球。
求:(1)取出的球是白球的概率;(2)当取出的球为白球时,此球来自甲盒的概率。
答案: 0.5333 0.56252. 某仓库有同样规格的产品100箱,其中50箱是甲厂生产的,30箱是乙厂生产的,20箱是丙厂生产的,而甲厂、乙厂、丙厂产品的次品率分别为110,115,120. 现从随机抽取的一箱中随机地取出一件产品. (1)求取出的产品是次品的概率;(2)若已知取出的产品是次品,求它是甲厂生产的概率.答 案:设B 表示所取的产品是次品;A i 表示所取的产品分别是甲厂、乙厂、丙厂生产的0.08 5/83. 有三个口袋,在甲袋中装有6只白球和4只红球;乙袋中装有12只白球和8只红球;丙袋中装有6只白球和14只红球. 随机地选取一个口袋并从中随机地取出一只球.(1)求取出的球是白球的概率;(2)若已知取出的球是白球,求它是来自甲袋的概率.答案:1/2 2/54. 口袋中有1个白球、1个黑球。
从中任取1个,若取出白球,则试验停止;若取出黑球,则把取出的黑球放回的同时,再加入1个黑球,如此下去,直到取出的是白球为止,试求下列事件的概率:(1). 取到第n 次,试验没有结束;(2). 取到第n 次,试验恰好结束. 答 案: ()121212311n n P A A A n n =⋅=++ ()()12121112311n n P A A A n n n n -=⋅⋅=++ 5. 袋中有12个球,其中2个白球,10个红球。
从袋中任取2个球,则取到白球的个数是随机变量X 。
写出X 的分布律。
答 案: X 的分布律为X 0 1 2 P 15/22 10/33 1/66 6. 设连续型随机变量X 的概率密度函数为,0()0,0xAe x f x x -⎧>=⎨≤⎩其中A >0为常数.(1)求常数A 的值;(2)求X 的分布函数F (x ); 答案:A =11,0()0,0x e x F x x -⎧->=⎨≤⎩7. 设随机变量X 的分布律为X −2 0 2 4 P 0.1 0.2 b 0.3 其中b >0为未知常数,并令Y =X 2.求(1)常数b 的值; (2) P (−1≤ X ≤ 2);(3) Y 的分布律. 答案:(1)b =0.4 (2)P (−1≤ X ≤ 2) =0.6(3) Y 0 4 16 P 0.2 0.5 0.3知 识 点:离散型随机变量的性质及其函数的分布律的求法 难度系数:28. 设连续型随机变量X 的概率密度函数为,01()2,120,ax x f x x x ≤<⎧⎪=-≤<⎨⎪⎩其它其中a 为常数. 求(1)常数a 的值;(2) 13()22P X <<.答 案:(1)α=1. (2) 3/49. 设随机变量X 的概率密度函数为2,01()0,x x f x ≤≤⎧=⎨⎩其他令Y =2X +4.求Y 的概率密度函数. 答 案:414(),06,06()2220,0,Y y y f y y f y --⎧⎧≤≤≤≤⎪⎪==⎨⎨⎪⎪⎩⎩其他其他 10. 已知二维离散型随机变量(X ,Y )的联合分布律为试求:(1答 案: k =0.2X 的边缘分布律为Y 的边缘分布律为11. 设连续型随机变量X 的概率密度函数为,0()0,0xe xf x x -⎧>=⎨≤⎩(1)求E (X ) ,D (X ) ;(2)令Y =e −2X ,求E (Y ).答 案:(1)122()1DX EX EX =-= (2)1/312. 设二维随机变量(X ,Y )的联合分布律为:(1)确定常数a 的值;(2)求YZ =的分布律;(3) 判断X 与Y 是否独立?要说明理由。
答 案:a =0.2(2) Z 的边缘分布律为(3) 因为 P (X =-1,Y =1)=0.1≠P (X =-1)P (Y =1)=0.3×0.4=0.12, 所以,X 与Y 不独立 13. 已知随机变量X 与Y 互相独立,且知X 与Y 的分布列分别为X -1 0 3 Y 2 4 P k 0.1 0.4 0.5 P k 0.4 0.6 (1)求二维随机变量(X ,Y )的联合分布;(2)判断X 与Y 是否相关? 其理由是什么? 答 案:(1)由独立性可知,联合分布为 (214. 设连续型随机变量X 的分布函数为,0,()00x A Be x F x ,x -⎧+≥=⎨<⎩求(1)常数A ,B 的值;(2)P {X ≤2},P {X >3};(3)X 的概率密度函数f (x ).答 案:(1)11A B =⎧⎨=-⎩(2) 2(2)(2)1e P X F -≤==-33(3)1(3)1(1e )e P X F -->=-=--=(3) e ,0()()0,0x x f x F x x -⎧≥'==⎨<⎩15. 设随机变量X 服从数学期望为1/3的指数分布. (1)写出X 的概率密度函数;(3)令31XY e -=-,求Y 的概率密度函数.答 案:(1)易知X 的概率密度函数为:33,0()0,0x e x f x x -⎧>=⎨≤⎩(2)Y 的概率密度函数为:1,01()0,Y y f y <<⎧=⎨⎩其他16.设总体X ~b (1, p ), X 1, X 2, …, X n 是取自X 的一个样本,求参数p 的最大似然估计量. 答 案:解方程得p 的最大似然估计值为11ˆni i px x n ===∑ 18. 设总体X 的概率密度函数为1(2),01()0,x x f x αα+⎧+≤≤=⎨⎩其他,其中参数α>0未知. X 1, X 2, ..., X n 是来自该总体的样本,x 1, x 2, ..., x n 为对应的样本值. 试求:参数α的最大似然估计. 答 案:似然函数为:1ˆ2ln nii nxθ==--∑19. 设总体X 的概率密度函数为(1),01()0,x x f x θθ⎧+≤≤=⎨⎩其他,其中参数θ>0未知. X 1, X 2, ..., X n 是来自该总体的样本,x 1, x 2, ..., x n 为对应的样本值. 试求:参数θ的矩估计.答 案:θ的矩估计为 21ˆ1X Xθ-=- 20. 某种零件的长度服从正态分布),(2σμN , 按规定其方差不得超过20.016σ=. 现从一批零件中随机抽取25件测量其长度,得其样本方差为0.025. 问在显著性水平0.05α=下,能否推断这批零件合格? 答 案:拒绝20:0.016σ≤H .21. 假设成年男性的身高(单位:厘米)服从正态分布N (μ, σ2),但参数μ和σ2均未知。
今从一批成年男性中随机抽取16名测量他们的身高数据,计算得样本均值为174x =厘米,样本标准差为s =10厘米. 问在显著性水平α=0.05下能否认为“这批成年男性的平均身高是175厘米”. (要写出检验步骤) 答 案:,计算得:0.4 2.1315=< 所以:不拒绝原假设,认为“这批成年男性的平均身高是175厘米”. 知 识 点: 单个正态总体的方差未知时关于均值的假设检验 难度系数:222. 某小学一年级学生的体重(单位:公斤)服从正态分布。