概率论与数理统计
- 格式:docx
- 大小:20.17 KB
- 文档页数:6
2.和(并):
3.互斥(互不相容):对立:
事件的运算:
伯努利大数定律:当试验次数n足够大时,事件发生的频率就约等于事件发生的概率。
全概率公式、贝叶斯公式
定义:
引入随机变量后,可用随机变量的
等式或不等式来表达随机事件;
随机变量的函数一般也是随机变量
0-1分布是n=1时的二项分布
定义:性质:
定义:
F(x)是X的分布函数,X是连续型随机变量,f(x)是它的概率密度函数,简称概率密度
性质:
均匀分布:
标准正态分布N(0,1)
标准正态分布的分位数
举例:
期望反映了随机变量取值的平均,又称均值。
概率论与数理统计概率论与数理统计是现代数学中非常重要的分支之一,它们在自然科学、社会科学,以及工程技术等领域都有广泛的应用。
在生物学,物理学,化学等领域,常常需要采用概率论和数理统计的方法,来研究和分析现象。
这篇文章将要探讨概率论和数理统计的一些基本概念和方法,并介绍它们在现实生活中的应用。
一、概率论概率论是一门研究随机现象及其规律的数学学科。
它的基本思想是通过建立数学模型,来描述随机事件的概率分布及其规律。
随机事件指某一次试验中可能发生或不发生的事情,例如掷骰子、抛硬币、抽扑克牌等,这些事件的结果是随机的,因此需要采用概率论的方法来研究。
1.概率和概率分布概率是指某一事件发生的可能性,用一个数值来表示。
在概率论中,对于某一特定随机事件,概率的大小常常用P(A)来表示,其中A是这个事件。
例如,抛一枚硬币,正面朝上的概率是0.5,用数学语言可以表示为P(正面)=0.5,反面朝上的概率也是0.5,即P(反面)=0.5。
概率分布是指某个随机事件的各种结果的概率分布情况。
在一次试验中,随机事件可能会有多个结果,即样本空间。
概率分布用来描述每个结果的概率大小。
例如,抛一枚硬币的样本空间是{正面,反面},正面和反面各占1/2的概率。
2.条件概率和独立事件条件概率是指在已知某个事件发生的情况下,某个随机事件会发生的概率。
条件概率的计算方法一般采用贝叶斯公式,例如给定事件A,以及事件B,P(A|B)表示在B发生的情况下,A 发生的概率,则条件概率可以表示为:P(A|B) = P(AB)/P(B)其中AB表示事件A和事件B同时发生的概率,P(B)表示事件B发生的概率。
独立事件是指某个随机事件的发生不会对另一个随机事件的发生产生影响。
如果事件A、B是独立事件,则可以表示为P(A|B) = P(A),P(B|A) = P(B),即A和B的概率相互独立,并不受对方的影响。
3.期望值和方差期望值是统计学中一个非常重要的概念,用来描述一个随机变量的总体平均数。
第一章随机事件与概率第一节随机事件及其运算1、随机现象:在一定条件下,并不总是出现相同结果的现象2、样本空间:随机现象的一切可能基本结果组成的集合,记为Ω={ω},其中ω表示基本结果,又称为样本点。
3、随机事件:随机现象的某些样本点组成的集合常用大写字母A、B、C等表示,Ω表示必然事件,∅表示不可能事件.4、随机变量:用来表示随机现象结果的变量,常用大写字母X、Y、Z等表示。
5、时间的表示有多种:(1)用集合表示,这是最基本形式(2)用准确的语言表示(3)用等号或不等号把随机变量于某些实属联结起来表示6、事件的关系(1)包含关系:如果属于A的样本点必属于事件B,即事件 A 发生必然导致事件B发生,则称A被包含于B,记为A⊂B;(2)相等关系:若A⊂B且B⊃A,则称事件A与事件B相等,记为A=B。
(3)互不相容:如果A∩B=∅,即A与B不能同时发生,则称A与B互不相容7、事件运算(1)事件A与B的并:事件A与事件B至少有一个发生,记为 A∪B。
(2)事件A与B的交:事件A与事件B同时发生,记为A∩ B或AB。
(3)事件A对B的差:事件A发生而事件B不发生,记为 A-B。
用交并补可以表示为。
(4)对立事件:事件A的对立事件(逆事件),即“A不发生”,记为.对立事件的性质:。
8、事件运算性质:设A,B,C为事件,则有(1)交换律:A∪B=B∪A,AB=BA(2)结合律:A∪(B∪C)=(A∪B)∪C=A∪B∪C A(BC)=(AB)C=ABC(3)分配律:A∪(B∩C)=(A∪B)∩(A∪C)、A(B∪C)=(A∩B)∪(A∩C)= AB∪AC(4)棣莫弗公式(对偶法则):9、事件域:含有必然事件Ω,并关于对立运算和可列并运算都封闭的事件类ξ称为事件域,又称为σ代数。
具体说,事件域ξ满足:(1)Ω∈ξ;(2)若A∈ξ,则对立事件∈ξ;(3)若A n∈ξ,n=1,2,···,则可列并ξ。
概率论与数理统计最简单讲解1 简介概率论是研究随机现象和概率规律的数学分支,一般分为经典概率、几何概率和统计概率。
数理统计是一个应用概率论于实际问题的统计学分支,主要研究样本及其分布、估计和假设检验等内容。
2 概率论的基本概念概率是指某件事情发生的可能性大小,用数字表示。
0表示不可能发生,1表示肯定发生,0~1之间的数字表示可能性大小。
概率分为主观概率和客观概率。
主观概率是指根据经验、知识、直觉等主观因素来判断某件事情发生的可能性大小。
而客观概率则是通过实验、统计等客观方法来计算某件事情发生的可能性大小。
3 经典概率和几何概率经典概率适用于“随机事件有限且等可能”的情形,如掷骰子,扑克牌等。
设事件A发生的可能性为P(A),则概率公式为:P(A)=有利样本数/总样本数。
几何概率适用于具有可度量性的随机现象,如从一个圆环上随机抽取有色球的概率,可以通过求圆环表面积和有色球的面积比来计算概率。
4 统计概率和条件概率统计概率是指基于概率分布函数,用频率的稳定性代替概率来计算随机事件发生的可能性大小。
条件概率指已知事件B发生的前提下,事件A发生的概率大小。
条件概率公式为:P(A|B)=P(AB)/P(B)。
5 数理统计的基本概念数据分为总体和样本两类。
总体是指研究对象的全体。
样本是指从总体中选出的一部分观测值。
统计量是从样本数据得到的量,通常用统计量来描述总体的某些特征。
6 样本分布样本的分布会受到样本容量、总体分布和抽样方式等因素的影响。
常见的样本分布有正态分布、t分布、F分布等。
其中正态分布是最重要的一种样本分布,因为它在自然界和社会方面都普遍存在。
7 参数估计参数估计是指通过样本数据来推断总体参数的值。
根据点估计和区间估计两种方式,可以计算出总体平均数、标准差、比例等各类参数的值。
8 假设检验假设检验是指将总体分布的某个特性提出一个假设,并利用样本数据来检验该假设的正确性。
假设检验包括两类错误:一类是将假设的否定但事实上是正确的,称为第一类错误;另一类是将假设的接受但事实上是错误的,称为第二类错误。
《概率论与数理统计》教案第一章:概率论的基本概念1.1 随机现象与样本空间1.2 事件及其运算1.3 概率的定义与性质1.4 条件概率与独立性第二章:随机变量及其分布2.1 随机变量的概念2.2 离散型随机变量的概率分布2.3 连续型随机变量的概率密度2.4 随机变量函数的分布第三章:多维随机变量及其分布3.1 二维随机变量的联合分布3.2 边缘分布与条件分布3.3 随机变量的独立性3.4 多维随机变量函数的分布第四章:大数定律与中心极限定理4.1 大数定律4.2 中心极限定理4.3 样本均值的分布4.4 样本方差的估计第五章:数理统计的基本概念5.1 统计量与抽样分布5.2 参数估计与点估计5.3 置信区间与置信水平5.4 假设检验与p值第六章:参数估计6.1 总体参数与样本参数6.2 估计量的性质6.3 最大似然估计6.4 点估计与区间估计第七章:假设检验7.1 假设检验的基本概念7.2 检验的错误与功效7.3 常用检验方法7.4 似然比检验与正态分布检验第八章:回归分析8.1 线性回归模型8.2 回归参数的估计8.3 回归模型的检验与诊断8.4 多元线性回归分析第九章:方差分析9.1 方差分析的基本概念9.2 单因素方差分析9.3 多因素方差分析9.4 协方差分析与重复测量方差分析第十章:时间序列分析10.1 时间序列的基本概念10.2 平稳性检验与时间序列模型10.3 自回归模型与移动平均模型10.4 指数平滑模型与状态空间模型第十一章:非参数统计11.1 非参数统计的基本概念11.2 非参数检验方法11.3 非参数回归分析11.4 非参数时间序列分析第十二章:生存分析12.1 生存分析的基本概念12.2 生存函数与生存曲线12.3 生存分析的统计方法12.4 生存分析的应用实例第十三章:贝叶斯统计13.1 贝叶斯统计的基本原理13.2 贝叶斯参数估计13.3 贝叶斯假设检验13.4 贝叶斯回归分析第十四章:多变量分析14.1 多变量数据分析的基本概念14.2 多元散点图与主成分分析14.3 因子分析与聚类分析14.4 判别分析与典型相关分析第十五章:统计软件与应用15.1 统计软件的基本使用方法15.2 R语言与Python在统计分析中的应用15.3 统计软件的实际操作案例15.4 统计分析在实际领域的应用重点和难点解析本《概率论与数理统计》教案涵盖了概率论的基本概念、随机变量及其分布、多维随机变量、大数定律与中心极限定理、数理统计的基本概念、参数估计、假设检验、回归分析、方差分析、时间序列分析、非参数统计、生存分析、贝叶斯统计、多变量分析以及统计软件与应用等多个方面。
概率论与数理统计知识点总结一、概率论1.随机试验和样本空间:随机试验是具有不确定性的试验,其结果有多个可能的取值。
样本空间是随机试验所有可能结果的集合。
2.事件及其运算:事件是样本空间中满足一定条件的结果的集合。
事件之间可以进行并、交、补等运算。
3.概率的定义和性质:概率是描述随机事件发生可能性的数值。
概率具有非负性、规范性和可列可加性等性质。
4.条件概率和独立性:条件概率是在已知一事件发生的条件下,另一事件发生的概率。
事件独立表示两个事件之间的发生没有相互关系。
5.全概率公式和贝叶斯公式:全概率公式是一种计算事件概率的方法,将事件分解成互斥的多个事件的概率之和。
贝叶斯公式是一种用于更新事件概率的方法。
6.随机变量和分布函数:随机变量是样本空间到实数集的映射,用来描述试验结果的数值特征。
分布函数是随机变量取值在一点及其左侧的概率。
7.常用概率分布:常见的概率分布包括离散型分布(如二项分布、泊松分布)和连续型分布(如正态分布、指数分布)。
8.数学期望和方差:数学期望是随机变量的平均值,用于描述随机变量的中心位置。
方差是随机变量离均值的平均距离,用于描述随机变量的分散程度。
二、数理统计1.统计量和抽样分布:统计量是对样本数据进行总结和分析的函数。
抽样分布是统计量的概率分布,用于推断总体参数。
2.估计和点估计:估计是利用样本数据对总体参数进行推断。
点估计是利用样本数据得到总体参数的一个具体数值。
3.估计量的性质和评估方法:估计量的性质包括无偏性、有效性和一致性等。
评估方法包括最大似然估计、矩估计等。
4.区间估计:区间估计是对总体参数进行估计的区间范围。
置信区间是对总体参数真值的一个区间估计。
5.假设检验和检验方法:假设检验是在已知总体参数的条件下,对总体分布做出的统计推断。
检验方法包括参数检验和非参数检验。
6.正态总体的推断:当总体近似服从正态分布时,可以利用正态分布的性质进行推断。
7.方差分析和回归分析:方差分析用于比较两个或多个总体均值是否相等。
3、分布函数与概率的关系 ∞<<∞-≤=x x X P x F ),()()()()()()(a F b F a X P b X P b X a P -=≤-≤=≤<4、离散型随机变量的分布函数 (1) 0 – 1 分布 1,0,)1()(1=-==-k p p k X P kk(2) 二项分布 ),(p n B n k p p C k X P k n kk n ,,1,0,)1()( =-==-泊松定理 0lim >=∞→λn n np 有,2,1,0!)1(lim ==---∞→k k ep p C kkn n k nkn n λλ(3) 泊松分布 )(λP = ,2,1,0,!)(===-k k e k X P kλλ〔5〕几何分布 p q k p qk X P k -====-1,2,1}{1dt t f x F x ⎰∞-=)()(则称X 为连续型随机变量,其中函数f(x)称为随机变量X 的概率密度函数, 2、分布函数的性质:〔1〕连续型随机变量的分布函数F(x )是连续函数。
〔2〕对于连续型随机变量X 来说,它取任一指定实数a 的概率均为零,即P{X=a }=0。
3、常见随机变量的分布函数 (1) 均匀分布 ),(b a U⎪⎩⎪⎨⎧<<-=其他,0,1)(b x a ab x f ⎪⎪⎩⎪⎪⎨⎧--=1,,0)(a b a x x F (2) 指数分布 )(λE⎪⎩⎪⎨⎧>=-其他,00,)(x e x f x λλ ⎩⎨⎧≥-<=-0,10,0)(x e x x F xλ (3) 正态分布 N (μ , σ 2 )+∞<<∞-=--x e x f x 222)(21)(σμσπ ⎰∞---=xt t ex F d 21)(222)(σμσπN (0,1) — 标准正态分布+∞<<∞-=-x e x x 2221)(πϕ +∞<<∞-=Φ⎰∞--x t ex x t d 21)(22π2、连续型随机变量函数的分布: 〔1〕分布函数法;(){}⎰⎰<==∈=yx g X l X y Y dx x f dx x f l X P y F y)()()(〔2〕设随机变量X 具有概率密度f X (x ),又设函数g(x )处处可导且恒有g '(x )>0 (或恒有g '(x )<0) ,则Y=g(X )的概率密度为()()[]()⎩⎨⎧<<'=其他βαy y h y h f y f X Y 其中x =h(y )为y =g(x )的反函数,()()()()()()∞+∞-=∞+∞-=g g g g ,max ,,min βα 3、 二维连续型随机变量 〔1〕联合分布函数为dudv v u f y x F y x ⎰⎰∞-∞-=),(),(函数 f (x ,y )称为二维向量(X ,Y )的(联合)概率密度. 其中: 0),(≥y x f ,⎰⎰∞∞-∞∞-=1),(dxdy y x f〔2〕基本二维连续型随机向量分布均匀分布:⎪⎩⎪⎨⎧∈=其他),(1),(G y x Ay x f二维正态分布:+∞<<-∞+∞<<∞--=-+------y x ey x f y y x x ,121),(])())((2)([)1(212212222212121212σμσσμμρσμρρσπσ3、离散型边缘分布律:4、 连续型边缘概率密度,),()(dy y x f x f X ⎰∞+∞-= dx y x f y f Y ⎰∞+∞-=),()(F (x ,y )=F x (x )F Y (y ) 则称随机变量X 和Y 是相互独立的3、连续型随机变量独立的等价条件 设(X ,Y )是连续型随机变量,f (x ,y ),f x (x ),f Y (y )分别为(X ,Y )的概率密度和边缘概率密度,则X 和Y 相互独立的充要条件是等式 f (x ,y ) = f x (x )f Y (y ) 对f (x ,y ),f x (x ),f Y (y )的所有连续点成立. 五、条件分布1、离散型随机变量的条件分布律: 〔3〕条件分布函数:2、连续型随机变量的条件分布 〔1〕条件分布函数⎰⎰∞-∞-==x Y Y X Y x Y X du y f y u f y x F y f du y u f y x F )(),()|()(),()|(||或写成, 〔2〕条件概率密度在Y=y 条件下X 的条件概率密度)(),()|(|y f y x f y x f Y Y X =同理 X=x 条件下X 的条件概率密度)(),()|(|x f y x f x y f X X Y =六、多维随机函数的分布1、离散型随机变量函数分布:二项分布:设X 和Y 独立,分别服从二项分布b (n 1,p ), 和b (n 2,p ),则 Z=X+Y 的分布律:Z ~b (n 1+n 2,p ).泊松分布:假设X 和Y 相互独立,它们分别服从参数为21,λλ的泊松分布,则Z=X+Y 服从参数为21λλ+的泊松分布。
概率论与数理统计公式大全一、概率论的常用公式:1.概率的公式:对于事件A,其概率表示为P(A),满足0≤P(A)≤1。
2.加法公式:对于两个互斥事件A和B,其概率表示为P(A∪B),满足P(A∪B)=P(A)+P(B)。
3.减法公式:对于事件A和B,其概率表示为P(A∩B),满足P(A∩B)=P(A)-P(A∪B)。
4.乘法公式:对于两个独立事件A和B,其概率表示为P(A∩B),满足P(A∩B)=P(A)某P(B)。
5.条件概率公式:对于事件A和B,其条件概率表示为P(A,B),满足P(A,B)=P(A∩B)/P(B)。
6.全概率公式:对于一组互斥事件B1,B2,...,Bn,以及事件A,有P(A)=∑(P(A,Bi)某P(Bi))。
7.贝叶斯公式:对于一组互斥事件B1,B2,...,Bn,以及事件A,有P(Bi,A)=P(A,Bi)某P(Bi)/(∑(P(A,Bj)某P(Bj))。
二、数理统计的常用公式:1.均值公式:对于一组数据某1,某2,...,某n,其均值表示为μ=∑(某i)/n。
2.方差公式:对于一组数据某1,某2,...,某n,其方差表示为σ^2=∑((某i-μ)^2)/n。
3.标准差公式:对于一组数据某1,某2,...,某n,其标准差表示为σ=√(σ^2)。
4. 协方差公式:对于两组数据某1,某2,...,某n 和 y1,y2,...,yn,其协方差表示为 Cov(某,y) = ∑((某i - μ某) 某 (yi - μy)) / n。
5. 相关系数公式:对于两组数据某1,某2,...,某n 和 y1,y2,...,yn,其相关系数表示为 r = Cov(某,y) / (σ某某σy)。
6.正态分布的概率计算:对于满足正态分布的一组数据某1,某2,...,某n,可以利用标准正态分布表或计算工具来计算概率P(X≤某)或P(X>某)。
7.置信区间公式:对于一组数据某1,某2,...,某n,其均值μ和置信水平α,可以计算置信区间为某̄±Z(α/2)某(σ/√n)。
《概率论与数理统计》姓名:黄淑芹学号:1543201000276班级:数学与应用数学E时间:2017年6月概率论与数理统计摘要:随机现象无处不在,渗透于日常生活的方方面面和科学技术的各个领域,概率论就是通过研究随机现象及其规律从而指导人们从事物表象看到其本质的一门科学。
生活中买彩票显示了小概率事件发生的几率之小,抽签与体育比赛赛制的选择用概率体现了公平与不公平,用概率来指导决策,减少错误与失败等等,显示了概率在人们日常生活中越来越重要。
数理统计在人们的生活中也不断的发挥重要的作用,如果没有统计学,人们在收集资料和进行各项的大型的数据收集工作是非常困难的,通过对统计方法的研究,使得我们处理各种数据更加简便,所以统计也是一门很实用的科学,应该受到大家的重视。
关键词:概率、统计、数学期望、方差、实际问题、应用概率论与数理统计是研究随机现象统计规律的一门数学学科,是对随机现象的统计规律进行演绎和归纳的科学。
随着社会的不断发展,概率论与数理统计的知识越来越重要,运用抽样数据进行推断已经成为现代社会一种普遍适用并且强有力的思考方式。
目前,概率论与数理统计的很多原理方法已被越来越多地应用到交通、经济、医学、气象等各种与人们生活息息相关的领域。
本文将就概率论与数理统计的方法与思想,在日常生活中的应用展开一些讨论,,推导出某些表面上并非直观的结论,从中可以看出概率方法与数理统计的思想在解决问题中的高效性、简捷性和实用性。
(一)、概率要学习与概率有关的知识,首先要知道事件的定义与分类及与它们有关的运算性质:随机事件在抛掷一枚均匀硬币的试验中,“正面向上”是一个随机事件,可用A={正面向上}表示。
【1】随机试验中的每一个可能出现的试验结果称为这个试验的一个样本点,记作ωi。
全体样本点组成的集合称为这个试验的样本空间,记作Ω.即Ω={ω1,ω2,…,ωn,…}。
仅含一个样本点的随机事件称为基本事件,含有多个样本点的随机事件称为复合事件。
在随机试验中,随机事件一般是由若干个基本事件组成的。
样本空间Ω的任一子集A称为随机事件。
属于事件A的样本点出现,则称事件A发生。
例如,在试验E中,令A表示“出现奇数点”,A就是一个随机事件,A还可以用样本点的集合形式表示,即A={1,3,5},它是样本空间Ω的一个子集,在试验中W中,令B表示“灯泡的寿命大于1000小时”,B也是一个随机事件,B也可用样本点的集合形式表示,即B={t|t>1000},B也是样本空间的一个子集。
因此在理论上,我们称试验E所对应的样本空间Ω的子集为E的一个随机事件,简称事件。
在一次试验中,当这一子集中的一个样本点出现时,称这一事件发生。
样本空间Ω的仅包含一个样本点ω的单点子集{ω}也是一种随机事件,这种时间称为基本事件。
【2】例如,在试验A中{H}表示“正面朝上”,这是基本事;在试验B中{3}表示“掷得3点”,这也是基本事件;在试验C中{5}表示“测量的误差是0.5”,这还是一个基本事件。
(二)、统计与数学期望数学期望的定义离散随机变量的一切可能取值与其对应的概率P的乘积之和称为数学期望,记为E.如果随机变量只取得有限个值:x,y,z,...则称该随机变量为离散型随机变量。
随机变量的数学期望值在概率论和统计学中,一个离散性随机变量的期望值(或数学期望、或均值,亦简称期望)是试验中每次可能结果的概率乘以其结果的总和。
换句话说,期望值是随机试验在同样的机会下重复多次的结果计算出的等同“期望”的平均值。
需要注意的是,期望值并不一定等同于常识中的“期望”——“期望值”也许与每一个结果都不相等。
(换句话说,期望值是该变量输出值的平均数。
期望值并不一定包含于变量的输出值集合里。
)对于数学期望的定义是这样的。
数学期望E(X) = X1*p(X1) + X2*p(X2) + …… + Xn*p(Xn)X1,X2,X3,……,Xn为这几个数据,p(X1),p(X2),p(X3),……p(Xn)为这几个数据的概率函数。
在随机出现的几个数据中p(X1),p(X2),p(X3),……p(Xn)概率函数就理解为数据X1,X2,X3,……,Xn出现的频率f(Xi).则:E(X) = X1*p(X1) + X2*p(X2) + …… + Xn*p(Xn) = X1*f1(X1) + X2*f2(X2) + …… + Xn*fn(Xn)很容易证明E(X)对于这几个数据来说就是他们的算术平均值。
我们举个例子,比如说有这么几个数:1,1,2,5,2,6,5,8,9,4,8,11出现的次数为3次,占所有数据出现次数的3/12,这个3/12就是1所对应的频率。
同理,可以计算出f(2) = 2/12,f(5) = 2/12 , f(6) = 1/12 , f(8) = 2/12 , f(9) = 1/12 , f(4) = 1/12 根据数学期望的定义:E(X) = 1*f(1) + 2*f(2) + 5*f(5) + 6*f(6) + 8*f(8) + 9*f(9) + 4*f(4) = 13/3 所以 E(X) = 13/3,现在算这些数的算术平均值:Xa = (1+1+2+5+2+6+5+8+9+4+8+1)/12 = 13/3所以E(X) = Xa = 13/3(三)、方差方差的定义在概理论与数理统计中,方差(英文Variance)用来度量随机变量和其数学期望(即均值)之间的偏离程度。
在许多实际问题中,研究随机变量和均值之间的偏离程度有着很重要的意义。
方差是实际值与期望值之差平方的期望值,而标准差是方差平方根。
在实际计算中,我们用以下公式计算方差。
方差是各个数据与平均数之差的平方的平均数,即:s^2=(1/n)[(x1-x_)^2+(x2-x_)^2+...+(xn-x_)^2] ,其中,x_表示样本的平均数,n表示样本的数量,^2表示平方,xn表示个体,而s^2就表示方差。
而当用(1/n)[(x1-x_)^2+(x2-x_)^2+...+(xn-x_)^2]作为总体X的方差的估计时,发现其数学期望并不是X的方差,而是X方差的(n-1)/n倍:[1/(n-1)][(x1-x_)^2+(x2-x_)^2+...+(xn-x_)^2]的数学期望才是X的方差,用它作为X的方差的估计具有“无偏性”,所以我们总是用[1/(n-1)]∑(Xi-X~)^2来估计X的方差,并且把它叫做“样本方差”。
设X是一个随机变量,若E{[X-E(X)]^2}存在,则称E{[X-E(X)]^2}为X的方差,记为D(X)或DX。
即D(X)=E{[X-E(X)]^2}称为方差,而σ(X)=D(X)^0.5(与X有相同的量纲)称为标准差(或均方差)。
即用来衡量一组数据的离散程度的统计量。
方差刻画了随机变量的取值对于其数学期望的离散程度。
若X的取值比较集中,则方差D(X)较小;若X的取值比较分散,则方差D(X)较大。
因此,D(X)是刻画X取值分散程度的一个量,它是衡量X取值分散程度的一个尺度。
方差的几个重要性质(1)设c是常数,则D(c)=0。
(2)设X是随机变量,c是常数,则有D(cX)=(c^2)D(X)。
(3)设 X 与 Y 是两个随机变量,则D(X+Y)= D(X)+D(Y)+2E{[X-E(X)][Y-E(Y)]}特别的,当X,Y是两个相互独立的随机变量,上式中右边第三项为0(常见协方差),则D(X+Y)=D(X)+D(Y)。
此性质可以推广到有限多个相互独立的随机变量之和的情况.(4)D(X)=0的充分必要条件是X以概率为1取常数值c,即P{X=c}=1,其中E(X)=c。
(四)、实际问题与应用(1)生日概率问题每个人都有自己的生日(指一年365天中某一天),随机相遇的两人的生日要在365天中的同一天,即使有也是很凑巧,但如果相聚的人数增多,可能性会增大;某次随机相遇无论男女、老幼,若人数达到了50以上,形成一个团体(如集会、上课、旅游等)。
1.随意指定一个人,你猜某天正好是他的生日,猜对的可能性有多大?2,随意指定二个人,你猜他俩生日是同一天,猜对的可能性有多大?3.某一团体有一群人,我绝对可以肯定至少有2人生日相同,这群人人数至少要多少?4.如果某个随机而遇的团体有50人以上,我敢打贿,这个团体几乎可以肯定有生日相同的两个人,你相信吗?问题1. 解:一年有365天,他某天生日概率p≈0.0027,故猜对的可能性微乎其微。
问题2. 解:两个人生日,总共可能性有365×365种搭配,其中有365种生日相同,故随意指定二个人,生日相同的概率p≈0.0027,故猜对的可能性仍旧微乎其微。
问题3. 解:某一团体中,绝对肯定至少有2人生日相同,即为必然事件,p=1。
由抽屉原理可知,这群人至少要有366人。
问题4. 解:要解决这个概率问题,我们首先来计算一下,50个人生日的搭配一共有多少种可能情况。
第一个人生日,可以是一年中任何一天,一共有365种可能情况,而第二、第三及其它所有人生日也都有365种,这样50个人共有365种可能搭配。
如果50人的生日无一相同,那么生日搭配可能情况就少得多了。
第一个人有365种可能,第二人因不能与第一个生日相同,只有364种可能,依次类推,如50人生日无一相同,其生日搭配情况只有365×364×363×……×317×316 种只占3655050种情况中的 3%,即p=3%。
即反面推至生日2人相同概率有97%。
同理可推算如果某群人有40人,至少两人生日相同概率有89%,如果有45人至少两人生日相同的概率达94%。
故这样赌局,几乎可以稳操胜券。
(2)、保险赔偿问题目前, 随着人们的经济水平越来越高,自身及家人的安全问题、财产安全及养老问题等受到了极大的重视,有一定经济条件的人纷纷选择购买保险来给自己一份保障; 我们可能就有疑惑, 是保险公司受益还是投保人受益, 谁才是最大受益者? 通过下面这个例子也许他们会明白一些。
某一保险公司, 有3000 个统一年龄层的相同社会阶层的人参加保险。
在一年内, 每个人死亡的概率为0.002。
每个参加保险的人在1月1 日付12 元保险费, 而当他在这一年死亡时, 家属可从公司领取保险费2000 元, 问保险公司每年盈利的概率是多少? 且获利不少于10000 元的概率是多少?乍一看, 很难知道保险公司是否盈利, 但经过一系列计算就可以得知保险公司几乎是必定盈利的!设X 表示参保的3000 人中一年内死亡的人数, 则X 可能的取值有0,1,2,3…3000, 且X 服从B(3000 ,0.002)。
用A 表示“保险公司盈利”, B表示“保险公司营利大于10000 元”由题可知A={3000×12- 2000X>0}={X<18},B={3000×12-2000X≥10000}={X≤13}. P(A)= P{X<18}==0.999;P(B)=P{x<=13}= 0.9964;以上结果表明, 保险公司盈利的概率高达0.999944, 而盈利在10000元以上的概率也为0.996408。