概率论与数理统计(回归分析)
- 格式:ppt
- 大小:860.50 KB
- 文档页数:5
高等教育自学考试《概率论与数理统计》重难点笔记资料 课程代码:04183第一章 随机事件与概率一.随机事件关系与运算1!0,)!(!!!,)!(!0===-==-=C C C A A n n n r n nn rn r n r n :,n r n n 组合排列二.概率P(A) 1.P(A)概率特征)()31)(,0)()21)(0)111∑∞=∞===Ω=≤≤K KK kA A P ,P(P P A P 事件互不相容时φ2. 古典概型3.概率加法公式P(A+B)=P(A)+P(B)- P(AB)当A 、B 互斥时, P(A+B)=P(A)+P(B) 事件的独立性:定义:P(AB)=P(A)P(B)性质:.P(A)>0,,则P(B)=P(B/A); P(B)>0则P(A)=P(A/B) P(B —A)=P(B)--P(AB)P (A--B )==P (AB )=P (A--AB )=P (A )--P (AB )基本事件总数所包含的基本事件数A A P =)(P(A+B+C)=1--P(A+B+C)=1--P(A)P(B)P(C) P(AB)=P(AUB)=1-P(AUB)=1-(P(A)+P(B)) P(A)=1-P(A4.条件概率公式5.概率的乘法公式6.全概率公式:从原因计算结果7.Bayes 公式:从结果找原因)()()|(B P AB P B A P =)|()()(B A P B P AB P =)|()(A B P A P =∑==nk k k B A P B P A P 1)|()()(∑==nk kki i k B A P B P B A P B P A B P 1)|()()|()()|()()()|(A P AB P A B P =)/()/()()(AB C P A B P A P ABC P =第二章随机变量及其概率分布4/ 13分布函数对离散型随机变量对连续型随机变量分布函数与密度函数的重要关系:“一般正态分布函数F(x)”转换为“标准正态分布函数)(x Φ”的关系 设X~N (δμ2,)则1.2.3.连续型随机变量函数的概率分布定理:记x=h(y)为y=g(x)的反函数,则Y=g(X)的概率密度:⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<<'=其他y y h y h y f f X Y ,0),())(()(βα1) 设X~U(-2,2ππ),令Y=tanX,求Y 的概率密度柯西分布:+∞<<-∞+='=y y h y h y y f f X Y ,111)())(()(2π 2)设X~N(σμ2,),求eX的概率密度对数正态分布:⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤>-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤>•=-0,00,2)(ln 210,0,0,1)(ln )(,22y y y y y y y y y e f fX Yσμσπ ∑≤==≤=xk k X P x X P x F )()()(⎰∞-=≤=x dtt f x X P x F )()()(⎰∞-=≤=xdt t f x X P x F )()()()()('x f x F =3直接变换法:[])()(21)()(y y yy y ff F fXXY Y-+='=e e yx x 的的反函数为y y 的反函数为反y 2ln 2,,,,,ln -=-===第三章多维随机变量及其概率分布 二元随机变量及其边缘分布 分布规律的描述方法联合密度函数联合分布函数离散联合分布函数的概率:{}0),(),(),(),(,112112222121≥+--=≤<≤<y x y x y x y x y y x x F F F F Y X P性质1),(,0),(),(),(=+∞+∞=-∞-∞=-∞=-∞F F x F y F 离散边缘分布律:{}{}∑∑===⋅===⋅ijji pijY P j p pij X P pi y x1...2,1,,0,0=⋅=⋅=≥⋅≥⋅∑∑jij p pi j i j p pi联合密度二维边缘密度二维连续随机变量的分布 1.均匀分布(X,Y)~U D1)设D 为平面上的有界区域,S 表面积⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤+−−→−⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤≤≤--−−→−⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧∈=其他,其他o d x c b x a c d a b 其他D y x S y x f R yx R 圆形矩形,01,,,))((1,0),(,1),(2222π),(y x f ),(y x F 0),(≥y x f 1),(=⎰⎰+∞∞-+∞∞-dxdy y x f 1),(0≤≤y x F },{),(y Y x X P y x F ≤≤=+∞<<∞-=⎰+∞∞-x ,,dy y x f x f ),()(+∞<<-∞=⎰+∞∞-y dx y x f y f Y ,,),()(}{}{},{j Y P i X P j Y i X P =====2.正态分布),,,,(~),(222121ρσσμμN Y Xey y x f y x x ⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧+--------=σμσσσρρσπσμμρμ222212121212)2(121),())((2)()1(21221离散型随机变量的独立性)()(),(y FY x Fx y x F =连续型随机变量的独立性第四章 随机变量的数字特征数学期望离散型随机变量,数学期望定义连续型随机变量,数学期望定义期望性质:● E(a)=a ,其中a 为常数● E(a+bX)=a+bE(X),其中a 、b 为常数 , ● E(CX)=CE(X),其中C 为常数● E(X+Y)=E(X)+E(Y),X 、Y 为任意随机变量 ● E(XY)=E(X)E(Y),X,Y 相互独立 方差的性质D(a)=0,其中a 为常数D(a+bX)=b 2(X),其中a 、b 为常数D(X+Y)=D(X)+D(Y) 当X 、Y 相互独立时随机变量g(X)的数学期望常用公式:二维随机变量的期望 离散)()(),(y f x f y x f Y X =∑+∞-∞=⋅=k kkP xX E )(⎰+∞∞-⋅=dxx f x X E )()(⎰∑+∞∞-=⇔=dx x fx x g X g E p x g X g E k k k )()()]([)())((ijji Jii i j ij i i i py j p y Y E p x pi x X E ∑∑∑∑∑∑=⋅==⋅=)()()()()(Y E X E Y X E +=+∑∑=i j ij j i p y x XY E )()()()(,Y E X E XY E Y X =独立时与当连续 g(X)∑⎰⎰∑=⇔=jij jiidxdy y x f y x g Y X G E p yx g Y X g E ,),(),()],([),()],([方差 定义式 离散:⋅-=∑=Pi X E xX D ni i21))(()(连续常用计算式常用公式协方差与相关系数⎰⎰--=dxdy y x f Y E Y X E x Y X Cov ),())())(((),(协方差Cov(X,Y)的性质当X 与Y 相互独立时,则Cov(X,Y)=0相关系数XY ρ的性质⎰⎰⎰⎰==dxdyy x yf Y E dxdy y x xf X E ),()(),()(dxdyy x xyf XY E ⎰⎰=),()(()⎰+∞∞-⋅-=dx x f X E x X D )()()(2[]22)()()(X E X E X D -=))}())(({(2)()()(Y E Y X E X E Y D X D Y X D --++=+)()()(Y D X D Y X D +=+)()()(),(Y E X E XY E Y X Cov -=)()(),(Y D X D Y X Cov XY=ρ[][]{})()()()()(Y E X E XY E Y E Y X E X E -=--())()()(),(22X D X E X E X X Cov =-=),(),(Y X abCov bY aX Cov =),(),(),(Z Y Cov Z X Cov Z Y X Cov +=+独立与相关独立必定不相关 相关必定不独立 不相关不一定独立标准正态分布的概率计算公式)()()(a a Z P a Z P Φ=<=≤)(1)()(a a Z P a Z P Φ-=>=≥)()()(a b b Z a P Φ-Φ=≤≤1)(2)()()(-Φ=-Φ-Φ=≤≤-a a a a Z a P一般正态分布的概率计算一般正态分布的概率计算公式第五章 大数定律及中心极限定理1.切比雪夫不等式:设随机变量X 的期望E(X)及方差D (X )存在,则对任意小正数a>0,{}{}22)(1)()()(aX D a X E X P a X D a X E X P -≥<-↔≤≥- 2.独立同分布序列的中心极限定理{})(21)(212lim lim lim x dt x n n X P x Y P x xt n i i n n n n n eF Φ==⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-=≤=⎰∑∞---∞→∞→∞→πσμ3.棣莫费-拉普拉斯中心极限定理)1,0(~),(~2N X Z N X σμσμ-=⇔()()(σμ-Φ=<=≤a a X P a X P )(1)()(σμ-Φ-=>=≥a a X P a X P )()()(σμσμ-Φ--Φ=≤≤a b b X a P)(2122lim x dt x mpq np Z p e t x n n Φ==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤--∞-∞→⎰ 第六章 统计量及其抽样分布 样本方差,)(11212∑=--=ni i x x n s样本标准差2s s = 统计量样本K样本K卡方分布t 分布F 分布正态总体条件下样本均值的分布:样本方差的分布:两个正态总体的方差之比)(~)1,0(~212n X N X ni i χ∑=,则若())(~1),,(~21222n Y N Y ni iχμσσμ∑=-则若),(~//),(~),(~21212212n n F n V n U n V n U 则若χχ),(~2n N X σμ)1,0(~/N nX σμ-)1(~)1(222--n S n χσ)1(~/--n t ns X μ则若),(~),1,0(~2n Y N X χ)(~/n t nY X第七章 参数估计点估计:参数的估计值为一个常数最大似然估计P147似然函数单个正态总体参数的置信区间第八章 假设检验假设检验的步骤① 根据具体问题提出原假设H0和备择假设H1② 根据假设选择检验统计量,并计算检验统计值③ 看检验统计值是否落在拒绝域,若落在拒绝域则拒绝原假设,否则就不拒绝原假设。
第8章 方差分析与回归分析一、方差分析1.在一个单因子试验中,因子A有三个水平,每个水平下各重复4次,具体数据如下:表8-1试计算误差平方和s e、因子A的平方和S A与总平方和S T,并指出它们各自的自由度.解:此处因子水平数r=3,每个水平下的重复次数m=4,总试验次数为n=mr=12.首先,算出每个水平下的数据和以及总数据和:T1=8+5+7+4=24.T2=6+10+12+9=37.T3=0+1+5+2=8.T=T l+T2+T3=24+37+8=69.误差平方和S e由三个平方和组成:于是而2.在一个单因子试验中,因子A有4个水平,每个水平下重复次数分别为5,7,6,8.那么误差平方和、A的平方和及总平方和的自由度各是多少?解:此处因子水平数r=4,总试验的次数n=5+7+6+8=26,因而有误差平方和的自由度因子A的平方和的自由度总平方和的自由度3.在单因子试验中,因子A有4个水平,每个水平下各重复3次试验,现已求得每个水平下试验结果的样本标准差分别为1.5,2.0,1.6,1.2,则其误差平方和为多少?误差的方差σ2的估计值是多少?解:此处因子水平数r=4,每个水平下的试验次数m=3,误差平方和S e由四个平方组成,它们分别为于是其自由度为,误差方差σ2的估计值为4.在单因子方差分析中,因子A有三个水平,每个水平各做4次重复试验.请完成下列方差分析表,并在显著性水平α=0.05下对因子A是否显著作出检验.表8-2 方差分析表解:补充的方差分析表如下所示:表8-3 方差分析表对于给定的显著性水平,查表知,故拒绝域为,由于,因而认为因子A是显著的.此处检验的p值为5.用4种安眠药在兔子身上进行试验,特选24只健康的兔子,随机把它们均分为4组,每组各服一种安眠药,安眠时间如下所示.表8-4 安眠药试验数据在显著性水平下对其进行方差分析,可以得到什么结果?解:这是一个单因子方差分析的问题,根据样本数据计算,列表如下:表8-5于是根据以上结果进行方差分析,并继续计算得到各均方以及F 比,列于下表:表8-6在显著性水平下,查表得,拒绝域为,由于故认为因子A (安眠药)是显著的,即四种安眠药对兔子的安眠作用有明显的差别.此处检验的p 值为6.为研究咖啡因对人体功能的影响,特选30名体质大致相同的健康男大学生进行手指叩击训练,此外咖啡因选三个水平:每个水平下冲泡l0杯水,外观无差别,并加以编号,然后让30位大学生每人从中任选一杯服下,2h后,请每人做手指叩击,统计员记录其每分钟叩击次数,试验结果统计如下表:表8-7请对上述数据进行方差分析,从中可得到什么结论?解:我们知道,对数据作线性变换不会影响方差分析的结果,这里将原始数据同时减去240,并作相应的计算,计算结果列入下表:表8-8于是可计算得到三个平方和把上述诸平方和及其自由度填入方差分析表,并继续计算得到各均方以及F比:表8-9若取查表知,从而拒绝域为,由于.故认为因子A(咖啡因剂量)是显著的,即三种不同剂量对人的作用有明显的差别.此处检验的p值为7.某粮食加工厂试验三种储藏方法对粮食含水率有无显著影响.现取一批粮食分成若干份,分别用三种不同的方法储藏,过一段时间后测得的含水率如下表:表8-10(1)假定各种方法储藏的粮食的含水率服从正态分布,且方差相等,试在下检验这三种方法对含水率有无显著影响;(2)对每种方法的平均含水率给出置信水平为0.95的置信区间.解:(1)这是一个单因子方差分析的问题,由所给数据计算如下表:表8-11三个平方和分别为。
概率论与数理统计概率论与数理统计是现代数学中非常重要的分支之一,它们在自然科学、社会科学,以及工程技术等领域都有广泛的应用。
在生物学,物理学,化学等领域,常常需要采用概率论和数理统计的方法,来研究和分析现象。
这篇文章将要探讨概率论和数理统计的一些基本概念和方法,并介绍它们在现实生活中的应用。
一、概率论概率论是一门研究随机现象及其规律的数学学科。
它的基本思想是通过建立数学模型,来描述随机事件的概率分布及其规律。
随机事件指某一次试验中可能发生或不发生的事情,例如掷骰子、抛硬币、抽扑克牌等,这些事件的结果是随机的,因此需要采用概率论的方法来研究。
1.概率和概率分布概率是指某一事件发生的可能性,用一个数值来表示。
在概率论中,对于某一特定随机事件,概率的大小常常用P(A)来表示,其中A是这个事件。
例如,抛一枚硬币,正面朝上的概率是0.5,用数学语言可以表示为P(正面)=0.5,反面朝上的概率也是0.5,即P(反面)=0.5。
概率分布是指某个随机事件的各种结果的概率分布情况。
在一次试验中,随机事件可能会有多个结果,即样本空间。
概率分布用来描述每个结果的概率大小。
例如,抛一枚硬币的样本空间是{正面,反面},正面和反面各占1/2的概率。
2.条件概率和独立事件条件概率是指在已知某个事件发生的情况下,某个随机事件会发生的概率。
条件概率的计算方法一般采用贝叶斯公式,例如给定事件A,以及事件B,P(A|B)表示在B发生的情况下,A 发生的概率,则条件概率可以表示为:P(A|B) = P(AB)/P(B)其中AB表示事件A和事件B同时发生的概率,P(B)表示事件B发生的概率。
独立事件是指某个随机事件的发生不会对另一个随机事件的发生产生影响。
如果事件A、B是独立事件,则可以表示为P(A|B) = P(A),P(B|A) = P(B),即A和B的概率相互独立,并不受对方的影响。
3.期望值和方差期望值是统计学中一个非常重要的概念,用来描述一个随机变量的总体平均数。
《概率论与数理统计(经管类)》柳金甫、王义东主编,武汉大学出版社新版第一章随机事件与概率第二章随机变量及其概率分布第三章多维随机变量及其概率分布第四章随机变量的数字特征第五章大数定律及中心极限定理第六章统计量及其抽样分布第七章参数估计第八章假设检验第九章回归分析前言本课程包括两大部分:第一部分为概率论部分:第一章至第五章,第五章为承前启后章,第二部分为数理统计部分:第六章至第九章。
第一章随机事件与概率本章概述.内容简介本章是概率论的基础部分,所有内容围绕随机事件和概率展开,重点内容包括:随机事件的概念、关系及运算,概率的性质,条件概率与乘法公式,事件的独立性。
本章内容§1.1 随机事件1.随机现象:确定现象:太阳从东方升起,重感冒会发烧等;不确定现象:随机现象:相同条件下掷骰子出现的点数:在装有红、白球的口袋里摸某种球出现的可能性等;其他不确定现象:在某人群中找到的一个人是否漂亮等。
结论:随机现象是不确定现象之一。
2.随机试验和样本空间随机试验举例:E1:抛一枚硬币,观察正面H、反面T出现的情况。
E2:掷一枚骰子,观察出现的点数。
E3:记录110报警台一天接到的报警次数。
E4:在一批灯泡中任意抽取一个,测试它的寿命。
E5:记录某物理量(长度、直径等)的测量误差。
E6:在区间[0,1]上任取一点,记录它的坐标。
随机试验的特点:①试验的可重复性;②全部结果的可知性;③一次试验结果的随机性,满足这些条件的试验称为随机试验,简称试验。
样本空间:试验中出现的每一个不可分的结果,称为一个样本点,记作。
所有样本点的集合称为样本空间,记作。
举例:掷骰子:={1,2,3,4,5,6},=1,2,3,4,5,6;非样本点:“大于2点”,“小于4点”等。
3.随机事件:样本空间的子集,称为随机事件,简称事件,用A,B,C,…表示。
只包含一个样本点的单点子集{}称为基本事件。
必然事件:一定发生的事件,记作不可能事件:永远不能发生的事件,记作4.随机事件的关系和运算由于随机事件是样本空间的子集,所以,随机事件及其运算自然可以用集合的有关运算来处理,并且可以用表示集合的文氏图来直观描述。
概率论与数理统计_回归分析第11章回归分析设x 为普通变量,Y 为随机变量。
如果当x 变化时,Y 随着x 的变化⼤体上按某种趋势变化,则称x 与Y 之间存在相关关系,即),0(~,)(2σεεN x f Y +=例如,某地⼈均收⼊x 与某种商品的消费量Y 之间的关系;森林中树⽊的断⾯直径x 与⾼度Y 之间的关系;某种商品的价格x与销售量Y 之间的关系;施⽤氮肥、磷肥、钾肥数量1x ,2x ,3x 与某种农作物产量Y 之间的关系。
在⽣产实践和科学研究中,常常有这样的问题:由实验或测量得到变量间的⼀批离散样点,要求由此建⽴变量之间的近似函数关系或得到样点之外的数据。
我们确定的函数要求在某种距离意义下的误差达到最⼩(通常⽤最⼩⼆乘法,即考虑使各数据点误差平⽅和最⼩)。
由⼀个(或⼏个)普通变量来估计或预测某个随机变量的取值时,所建⽴的数学模型及所进⾏的统计分析称为回归分析。
§11.1 ⼀元线性回归假设有⼀批关于x 与Y 的离散样点),(,),,(),,(2211n n y x y x y x集中在⼀条直线附近,说明x 与Y 之间呈线性相关关系,即),0(~,2σεεN bx a Y ++=称为⼀元线性回归模型。
⼀、模型中的参数估计 1、b a ,的估计⾸先引进记号∑∑∑∑∑=====-=-=-===ni i i xy ni i yy ni i xx ni ini iyx n y x S y n y S x n x S y n y x n x 11221221111按最⼩⼆乘法可得到xxxy S S b =? x b y a ??-= 称x b a y+=为Y 关于x 的⼀元线性回归⽅程。
2、2σ的估计)?(21?22xxyy S b S n --=σ求出关于的⼀元线性回归⽅程。
解:先画出散点图如下计算出 3985193282503.6714510======xy yy xx S S S y x n483.0?==xxxy S S b 735.2??-=-=x b y a 所求的回归⽅程是x y483.0735.2?+-=。