数理统计(小抄版)
- 格式:doc
- 大小:908.50 KB
- 文档页数:15
数理统计复习参考资料判断题1. 研究人员测量了100例患者外周血的红细胞数,所得资料为计数资料。
X2. 统计分析包括统计描述和统计推断。
3. 计量资料、计数资料和等级资料可根据分析需要相互转化。
4. 均数总是大于中位数。
X5. 均数总是比标准差大。
X6. 变异系数的量纲和原量纲相同。
X7. 样本均数大时,标准差也一定会大。
X8. 样本量增大时,极差会增大。
9. 若两样本均数比较的假设检验结果P 值远远小于0.01,则说明差异非常大。
X 10. 对同一参数的估计,99%可信区间比90%可信区间好。
X 11. 均数的标准误越小,则对总体均数的估计越精密。
12. 四个样本率做比较,2)3(05.02χχ>,可认为各总体率均不相等。
X13. 统计资料符合参数检验应用条件,但数据量很大,可以采用非参数方法进行初步分析。
14. 对同一资料和同一研究目的,应用参数检验方法,所得出的结论更为可靠。
X15. 等级资料差别的假设检验只能采用秩和检验,而不能采用列联表χ2检验等检验方法X 。
16. 非参数统计方法是用于检验总体中位数、极差等总体参数的方法。
X 17. 剩余平方和SS 剩1=SS 剩2,则r 1必然等于r 2。
X18. 直线回归反映两变量间的依存关系,而直线相关反映两变量间的相互直线关系。
19. 两变量关系越密切r 值越大。
X20. 一个绘制合理的统计图可直观的反映事物间的正确数量关系。
21. 在一个统计表中,如果某处数字为“0”,就填“0”,如果数字暂缺则填“…”,如果该处没有数字,则不填。
X 22. 备注不是统计表的必要组成部分,不必设专栏,必要时,可在表的下方加以说明。
23. 散点图是描写原始观察值在各个对比组分布情况的图形,常用于例数不是很多的间断性分组资料的比较。
24. 百分条图表示事物各组成部分在总体中所占比重,以长条的全长为100%,按资料的原始顺序依次进行绘制,其他置于最后。
概率论与数理统计知识点总结免费超详细版概率论与数理统计是一门研究随机现象数量规律的学科,它在众多领域都有着广泛的应用,如统计学、物理学、工程学、经济学等。
以下是对概率论与数理统计知识点的超详细总结。
一、随机事件与概率(一)随机事件随机事件是指在一定条件下,可能出现也可能不出现的事件。
随机事件通常用大写字母 A、B、C 等来表示。
(二)样本空间样本空间是指随机试验的所有可能结果组成的集合,通常用Ω表示。
(三)事件的关系与运算1、包含关系:若事件 A 发生必然导致事件 B 发生,则称事件 B 包含事件 A,记作 A⊂B。
2、相等关系:若 A⊂B 且 B⊂A,则称事件 A 与事件 B 相等,记作A = B。
3、并事件:事件 A 与事件 B 至少有一个发生的事件称为 A 与 B的并事件,记作 A∪B。
4、交事件:事件 A 与事件 B 同时发生的事件称为 A 与 B 的交事件,记作A∩B 或 AB。
5、互斥事件:若事件 A 与事件 B 不能同时发生,则称 A 与 B 为互斥事件,即 AB =∅。
6、对立事件:若事件 A 与事件 B 满足 A∪B =Ω 且 AB =∅,则称 A 与 B 为对立事件,记作 B =A。
(四)概率的定义与性质1、概率的古典定义:若随机试验的样本空间Ω只包含有限个基本事件,且每个基本事件发生的可能性相等,则事件 A 的概率为 P(A) =n(A) /n(Ω) ,其中 n(A) 为事件 A 包含的基本事件个数,n(Ω) 为样本空间Ω包含的基本事件个数。
2、概率的统计定义:在大量重复试验中,事件 A 发生的频率稳定在某个常数 p 附近,则称 p 为事件 A 的概率,即 P(A) = p 。
3、概率的公理化定义:设随机试验的样本空间为Ω,对于Ω中的每一个事件 A,都赋予一个实数 P(A),如果满足以下三个条件:(1)非负性:0 ≤ P(A) ≤ 1 ;(2)规范性:P(Ω) = 1 ;(3)可列可加性:对于两两互斥的事件 A1,A2,,有P(A1∪A2∪)= P(A1) + P(A2) +,则称 P(A) 为事件 A 的概率。
数理统计常用公式整理一、概率公式1. 概率的加法公式:P(A∪B) = P(A) + P(B) - P(A∩B)2. 条件概率公式:P(A|B) = P(A∩B) / P(B)3. 乘法公式:P(A∩B) = P(B) × P(A|B) = P(A) × P(B|A)4. 全概率公式:P(B) = ΣP(Ai) × P(B|Ai),其中Ai为样本空间的划分。
5. 贝叶斯公式:P(Ai|B) = P(Ai) × P(B|Ai) / ΣP(Aj) × P(B|Aj),其中Ai为样本空间的划分。
二、随机变量公式1. 期望:E(X) = Σx×P(X=x),其中x为随机变量X的取值,P(X=x)为其概率。
2. 方差:Var(X) = E((X-E(X))^2) = E(X^2) - [E(X)]^23. 协方差:Cov(X,Y) = E((X-E(X))(Y-E(Y)))4. 两个随机变量X和Y的相关系数:ρ(X,Y) = Cov(X,Y) / (σ(X) × σ(Y)),其中σ(X)和σ(Y)分别为X和Y的标准差。
三、常见分布公式1. 二项分布:P(X=k) = C(n,k) × p^k × (1-p)^(n-k),其中n为试验次数,k为成功次数,p为单次试验成功的概率。
2. 泊松分布:P(X=k) = (λ^k × e^(-λ)) / k!,其中λ为单位时间(或单位面积)内随机事件发生的平均次数。
3. 正态分布:f(x) = (1 / (σ×√(2π))) × e^(-(x-μ)^2 / (2σ^2)),其中μ为均值,σ为标准差。
4. t分布:f(t) = (Γ((v+1)/2) / (√(vπ) × Γ(v/2))) × (1 + t^2/v)^(-((v+1)/2)),其中v为自由度。
数理统计中的重要公式整理正文:数理统计是一门研究统计学原理和方法的学科,其重要性不可忽视。
在数理统计中,有一些重要的公式被广泛应用于各类统计问题的求解和分析。
本文将对数理统计中的重要公式进行整理,以帮助读者更好地掌握和应用这些公式。
1. 概率论与数理统计基本公式1.1 概率论基本公式:(1) 加法法则:P(A ∪ B) = P(A) + P(B) − P(A ∩ B)(2) 乘法法则:P(A ∩ B) = P(A)P(B|A) = P(B)P(A|B)(3) 全概率公式:P(A) = ∑ P(A ∩ Bᵢ) = ∑ P(Bᵢ)P(A|Bᵢ)(4) 贝叶斯公式:P(A|B) = P(B|A)P(A) / P(B)1.2 数理统计基本公式:(1) 期望值公式:E(X) = ∑ XᵢP(Xᵢ)(2) 方差公式:Var(X) = E[(X - E(X))²] = E(X²) - [E(X)]²(3) 协方差公式:Cov(X, Y) = E[(X - E(X))(Y - E(Y))] = E(XY) -E(X)E(Y)(4) 相关系数公式:ρ(X, Y) = Cov(X, Y) / σ(X)σ(Y)2. 统计推断中的重要公式2.1 参数估计公式:(1) 矩估计:θ̂= ḡ(m₁, m₂, ..., mₖ)(2) 最大似然估计:θ̂= argmax[∏ f(x; θ)](3) 最小二乘估计:θ̂= argmin[∑ (yᵢ - g(xᵢ; θ))²]2.2 假设检验公式:(1) z检验:z = (x - μ) / (σ/√n)(2) t检验:t = (x - μ) / (s/√n)(3) 卡方检验:χ² = ∑ (Oᵢ - Eᵢ)² / Eᵢ3. 抽样理论中的重要公式3.1 随机变量公式:(1) 期望值公式:E(X) = μ(2) 方差公式:Var(X) = σ²/n(3) 中心极限定理:Z = (X - μ) / (σ/√n) 服从标准正态分布3.2 总体参数估计公式:(1) 基本抽样分布(z分布):z = (X - μ) / (σ/√n)(2) t分布:t = (X - μ) / (s/√n)(3) X²分布:χ² = ∑ (Xᵢ - Eᵢ)² / Eᵢ4. 方差分析中的重要公式4.1 单因素方差分析公式:(1) 总平方和公式:SST = ∑ (xᵢj - x)²(2) 因素平方和公式:SFA = n ∑ (xₖ - x)²(3) 误差平方和公式:SSE = ∑ (xᵢj - xₖ)²4.2 F检验公式:F = (SFA / (k - 1)) / (SSE / (n - k))5. 相关分析中的重要公式5.1 简单线性回归公式:(1) 回归模型:Y = β₀ + β₁X + ε(2) 最小二乘估计公式:β̂₁ = ∑((Xᵢ - X)(Yᵢ - Ȳ)) / ∑((Xᵢ - X)²)β̂₀ = Ȳ - β̂₁X(3) 相关系数公式:r = Cov(X, Y) / (σ(X)σ(Y))6. 抽样调查中的重要公式6.1 简单随机抽样公式:(1) 抽样率:p = n / N(2) 估计总量公式:T = N * (X / n)(3) 估计方差公式:Var(T) = N² * ((1 - p/n) / n) * σ²7. 时间序列分析中的重要公式7.1 平稳时间序列公式:(1) 自协方差公式:γ(h) = Cov(Xₖ, Xₖ₋ₖ) = γ(-h)(2) 自相关系数公式:ρ(h) = Cov(Xₖ, Xₖ₋ₖ) / (σ(Xₖ)σ(Xₖ₋ₖ))通过对这些数理统计中的重要公式的整理,我们可以更加方便地在实际问题中应用这些公式,进行数据分析、参数估计、假设检验等统计推断工作。
《概率论与数理统计》第一章概率论的基本概念§ 2 •样本空间、随机事件1•事件间的关系A B 则称事件B包含事件A,指事件A发生必然导致事件B发生A」B ={x x^A或X E B}称为事件A与事件B的和事件,指当且仅当A , B中至少有一个发生时,事件A B发生A cB ={x X W A且X E B}称为事件A与事件B的积事件,指当A , B 同时发生时,事件AB发生A —B ={x x乏A且x世B}称为事件A与事件B的差事件,指当且仅当A发生、B不发生时,事件A —B发生A' B =:,则称事件A与B是互不相容的,或互斥的,指事件A与事件B不能同时发生,基本事件是两两互不相容的A B = S且A・B二•,则称事件A与事件B互为逆事件,又称事件A与事件B互为对立事件2•运算规则交换律A B = B A A - B = B * A结合律(A B) 一C = A 一(B 一C) (A - B)C = A(B - C)分配律A _( B ' C)二(A 一B厂(A 一C)A 一(B C) =(A 一B)(A 一C)徳摩根律A = A - B A - B = A B§ 3 .频率与概率定义在相同的条件下,进行了n次试验,在这n次试验中,事件A发生的次数n A称为事件A发生的频数,比值n A:n称为事件A发生的频率概率:设E是随机试验,S是它的样本空间,对于E的每一事件A赋予一个实数,记为P( A), 称为事件的概率1 •概率P(A)满足下列条件:(1)非负性:对于每一个事件 A 0乞P(A)乞1(2)规范性:对于必然事件S P(S) =1n n(3)可列可加性:设A I,A2,…,A n是两两互不相容的事件,有P( A k)八• P(A k )(n可k」k二以取::)2.概率的一些重要性质:(i) P( ) =0n nP( A k)二二P(A k) ( n可以取::) (ii )若A, A?,…,A n是两两互不相容的事件,则有k 4 k 4(iii )设A, B 是两个事件若A B,贝U P(B _ A) =P(B) _ P(A) , P(B) _ P(A)(iv)对于任意事件A, P(A) <1(v)P(A j=1—P(A) (逆事件的概率)(vi)对于任意事件A, B 有P(A 一B)二P(A) P(B) - P(AB)§ 4等可能概型(古典概型)等可能概型:试验的样本空间只包含有限个元素,试验中每个事件发生的可能性相同若事件A包含k 个基本事件,即AhgjUgziU-Ugk},里i i, i2,…,i k是1,2,…n中某k个不同的数,则有/ f \ k A包含的基本事件数P(A) = 卫「二$中基本事件的总数§ 5.条件概率(1)定义:设A,B是两个事件,且P(A) 0,称P(B|A)二为事件A发生的条P(A)件下事件B发生的条件概率(2)条件概率符合概率定义中的三个条件1。
第一章 抽样和抽样分布3. 子样平均数和子样方差的简化计算如下:设子样值x1,x2,…,xn 的平均数为x 和方差为2x ε作变换ca x y i i -=,得到y1,y2,…,yn,它的平均数为y 和方差为2y s 。
试证:222,y x s c s y c a x =+=。
解:因为i i x ay c-=所以 i i x a cy =+11ni i x x n ==∑()1111ni i ni i a cy n na cy n ===+⎛⎫=+ ⎪⎝⎭∑∑1nii c a y n a cy==+=+∑ 所以 x a cy =+ 成立()2211nxi i s x x n ==-∑()()()22122111ni i ini i nii a cy a c y n cy c yn c y y n====+--=-=-∑∑∑因为 ()2211n y i i s y yn ==-∑ 所以222x ys c s = 成立 ()()()()()172181203.2147.211.2e n n e nM X X R X X M X X +⎛⎫ ⎪⎝⎭⎛⎫+ ⎪⎝⎭====-=--====8.若从某母体中抽取容量为13的子样:-2.1,3.2,0,-0.1,1.2,-4,2.22,2.01,1.2,-0.1,3.21,-2.1,0.试写出这个子样的顺序统计量、子样中位数和极差。
如果再抽取一个样品为2.7构成一个容量为14的子样,求子样中位数。
解:将子样值重新排列(由小到大)-4,-2.1,-2.1,-0.1,-0.1,0,0,1.2,1.2,2.01,2.22,3.2,3.21()()()()()172181203.2147.211.2e n n e nM X X R X X M X X +⎛⎫ ⎪⎝⎭⎛⎫+ ⎪⎝⎭====-=--====9.从同一母体抽得的两个子样,其容量为n1和n2,已经分别算出这两个子样的平均数1X 和2X ,子样方差21s 和22s 。
现将两个子样合并在一起,问容量为n1+n2的联合子样的平均数与方差是什么?解: 121211121211n n i ji j n x n x n n x n n ==+=+∑∑112212n x n xn n +=+()12221121n n ii s x x n n +==-+∑()()()1212221122111122121222222111222112212122222211221122112212121222211211122121n n i i n n i ji j x xn n x x n x n x n n n n n s x n sx n x n xn n n n n s n s n x n x n x n x n n n n n n n n n x n n s n s n n +====-++⎛⎫+=- ⎪++⎝⎭+++⎛⎫+=-⎪++⎝⎭⎛⎫+++=+- ⎪+++⎝⎭+++=++∑∑∑()()()()()()22212211222122222112212112212122121222212121122212122n n x n x n x n n n s n s n n x n n x n n x x n n n n n n x x n s n s n n n n +-++++-=+++-+=+++12. 设X1,X2,…,Xn 是参数为λ的泊松分布的母体的一个子样,X 是子样平均数,试求X E 和X D 。
解:()i x P λ i Ex λ= i Dx λ= 1,2,,i n =⋅⋅⋅1122111111n n i i i i n n i i i i n E X E x Ex n n nn DX D x Dx n n n nλλλλ============∑∑∑∑14.设X1,X2,…,Xn 是分布为()2,σμN的正态母体的一个子样,求()2121∑=-=ni iXY μσ的概率分布。
解:因为()2,i X N μσ 0i X Eμσ-= 1i X Dμσ-=所以()0,1i X N μσ- 1,2,,i n =⋅⋅⋅由2χ分布定义可知()222111nni ii i X Y Xμμσσ==-⎛⎫=-= ⎪⎝⎭∑∑服从2χ分布 所以 ()2Y n χ15. 设母体X 具有正态分布N(0,1),从此母体中取一容量为6的子样(x1,x2,x3,x4,x5,x6)。
又设()()26542321X X X X X X Y +++++=。
试决定常数C,使得随机变量CY 服从2χ分布。
解:因为 ()0,1i X N 1,2,,i n =⋅⋅⋅ ()1230,3X X X N ++0E=1=所以()0,1N()221χ同理()221χ由于2χ分布的可加性,故()222123Yχ=+可知13C=()21,F nχ18.设X1,X2,……,Xn,Xn+1,……,Xn+m是分布为()2,0σN的正态母体容量n+m的子样,试求下列统计量的概率分布:(1)(2)解:(1)因为()20,iX Nσ1,2,,i n=⋅⋅⋅()10,1niN=()221n mii nXmχσ+=+⎛⎫⎪⎝⎭∑所以()1n niXY t m==(2)因为()0,1iXNσ1,2,,i n m=⋅⋅⋅+()()221221niin mii nXnXmχσχσ=+=+⎛⎫⎪⎝⎭⎛⎫⎪⎝⎭∑∑所以()221122211,niniiin m n miii n i nXm XnY F n mXn Xmσσ==++=+=+⎛⎫⎪⎝⎭==⎛⎫⎪⎝⎭∑∑∑∑第 二 章 参数估计4.设母体X 的分布密度为f(x)= 其中0>θ (1) 求θ的最大似然估计量; (2)用矩法求θ的估计量.解:(1)设12,,n x x x 为样本观察值则似然函数为:111()(),01,1,2,,ln ()ln ln ln ln 0nni i i nii inii L x x i nL n x d L n xd θθθθθθθθ-====<<==+=+=∏∑∑ (-1)解之得:11ln ln nii nii nxnxθθ=∧==-==∑∑(2)母体X 的期望1()()1E x xf x dx x dx θθθθ+∞-∞===+⎰⎰而样本均值为:11()1nii X x n E x X X Xθ=∧===-∑令得7.设母体X 具有均匀分布密度()β1=x f ,β≤≤x 0,从中抽得容量为6的子样数值1.3,0.6,1.7,2.2,0.3,1.1,试求母体平均数和方差的最大似然估计量的值.解:由题意知:均匀分布的母体平均数22ββμ=-=,方差1212)0(222ββλ=-= 用极大似然估计法求β得极大似然估计量似然函数:∏==ni nL 11)(θββ≤≤≤≤≤ni i i i x x 1)(max min 0选取β使L 达到最大取ni ix ≤≤∧=1max β由以上结论当抽得容量为6的子样数值1.3,0.6,1.7,2.2,0.3,1.1,时1,010,x x θθ-<<其他2.2=∧β即,1.12==∧∧βμ 4033.0122.22.21222≈⨯==∧βσ8. 设母体X 的分布密度为f(x)= 。
试求θ的最大似然估计。
解:取子样值为)(),,,(21θ≥i n x x x x则似然函数为:∏=--=ni x i e L 1)()(θθθ≥i x∑∑==+-=--=ni ni i i n x x L 11)()(ln θθθ要使似然函数最大,则需θ取),,,min(21n x x x即∧θ=),,min(21n x x x14.设X1,X2,…,Xn 为母体()2,σμN的一个子样。
试选择适当常数C,使 为2σ的无偏估计。
解:由题意:),(~2σμN X 因为])(()([)()(21111212i i n i i i i i X X E X X D C X X E C E -+-=-=+-=++∧∑∑λ2112111)1(22]0)()([λλ-==++=∑∑-=-=+n C C X D X D C n i n i i i要使22)(λλ=∧E 只需)1(21+=n C 所以当)1(21-=n C 时2∧λ为2λ的无偏估计。
21.假定每次试验时,出现事件A 的概率p 相同但未知。
如果在60次独立试验中,事件A 出现15次,试求概率p 的置信区间(给定置信概率为0.95)。
解:因n=60属于大样本且是来自(0—1)分布的总体,故由中心极限定理知 )1()1(1p np np X n p np npXni i--=--∑=近似服从)1,0(N即αα-=<--1})1()({2u p np P X n p解得置信区间为2)1((αu n p p X --))1(2αu n p p X -+本题中将n U n 代替上式中的X 由题设条件知25.0=n U n055.0)()1(2=-=-n U n U n p p n n 查表知96.1025.0==U U n代入计算的所求置信区间为(0.1404 0.3596)(),0,0x e x x θθ--≥<1211()n i ii CX X -+=-∑29.随机地从A 批导线中抽取4根,从B 批导线中抽取5根,测得其电阻(单位:欧姆)并计算得:设测试数据分别具有分布()21,σμN和()22,σμN 。
试求21μμ-的置信概率为95%的置信区间。
解: 因22221σσσ==故用T 统计量)2(~11)(21-++---=m n t mn s Y X T wB A μμ其中2)1()1(22212-+-+-=m n S m S n S Wαα-=⎭⎬⎫⎩⎨⎧<12t T P计算得置信区间为mn m n t S X X W B A 11)2((2+-+--α)11)2(2mn m n t S X X W B A +-++-α把2W S=0.000006571 )7(2αt =2.364代入可得所求置信区间为(-0.002016 0.008616)。
31.两台机床加工同一种零件,分别抽取6个和9个零件,测得其长度计算得 假定各台机床零件长度服从正态分布.试求两个母体方差之比2221σσ的置信区间(给定置信概率为95%).解:由题意,21,u u 未知,则)1,1(~12212*1222*2--=n n F S S F σσ则ααα-=⎭⎬⎫⎩⎨⎧--<<---1)1,1()1,1(1221221n n F F n n F P经计算得ασσαα-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧--<<---1)1,1()1,1(2*22*112222212*22*11221S S n n F S S n n F P解得2221σσ的置信区间为⎪⎪⎭⎫⎝⎛-----2*22*11222*22*11221)1,1(,)1,1(S S n n F S S n n F αα61=n 92=n 245.02*1=S357.02*2=S 05.0=α 查表:82.4)8,5(025.0=F207.082.41)8,5(1)5,8(025.0975.0===∴F F带入计算得2221σσ的置信区间为:)639.4,142.0(。