均匀分布U[0, 1] - 描述统计
- 格式:pdf
- 大小:360.29 KB
- 文档页数:4
《概率论与数理统计》第4-7章自测题讲评第四章﹑数字特征1. 设随机变量X 的密度函数f(x)= ⎩⎨⎧5x 4 0≤x ≤10 其他 , 求数学期望EX 。
【讲评】考点:连续型随机变量数学期望的定义为EX= ∫-∞+∞xf(x)dx 。
[解]:EX= ∫-∞+∞xf(x)dx = 5∫01x 5dx = 5[x 56]01= 562.设随机变量X ~N (-1,3),Y ~N (0,5),Cov(X ,Y )=0.4,求D (X +Y )的值。
【讲评】考点:正态分布N(μ, σ2)的数字特征,EX=μ,DX=σ2。
和的方差公式:D(X+Y)=DX+DY+2Cov(X, Y)。
[解]:D(X+Y)=DX+DY+2Cov(X, Y)= 3+5+2×0.4 = 8.83. 设随机变量X 和Y 的密度函数分别为f X (x)= ⎩⎨⎧0.5, 1≤x ≤30, 其它 ,f Y (y)= ⎩⎨⎧3e -3y , y>00, y ≤0 ,若X ,Y 相互独立,求: E(XY)【讲评】考点:均匀分布与指数分布的数学期望,X~U[a,b] ⇒ EX=a+b 2 。
X~exp(λ) ⇒ EX=1λ 。
若X 与Y 相互独立,则 E(XY)=EXEY 。
本题:注意:X~U[1,3], Y~Exp(3) ⇒ EX=1+32 =1, EY=1/3,因为X, Y 相互独立,则 E(XY)=E(X)E(Y)=1×(1/3) =1/34. 设 X 服从参数为 λ 的普阿松分布(λ>0),则下列6个等式中那几个是错误的。
DX=1λ , E(X)D(X) =1 , E(X 2)=E(X)[E(X)+1] , E(X) = λ , E (X - λ)2 = 0, EX=λ2+λ【讲评】考点:普阿松分布X~P(λ)的数字特征:EX=λ, DX=λ 。
及DX = E(X-EX)2 = EX 2 – (EX)2 , EX 2 =DX+(EX)2本题:X~P(λ) ⇒ EX=λ, DX=λ, EX 2=λ+λ2 .所以E(X)D(X) =1,E(X 2)=λ2+λ=E(X)[E(X)+1],E(X) = λ,但是 DX=1λ , E (X - λ)2 = 0, 这两个是错误等式。
中级质量专业技术人员职业资格模拟考试(4)一、单选[共40题,每题1分,总计40分]1.找出关于组距的正确描述()。
A.组距必定相等B.组距可以相等,也可以不相等C.组距不相等的情况用的比较多D.对应于数据最大及最小的一个或两个组,使用与其他组不相等的组距,这样的情况不可能存在2.以下不是用来描述样本分散程度的统计量的是()。
A.样本极差B.样本方差C.样本均值D.样本标准差3.某溶液中的乙醇浓度服从正态分布,从中抽取一个样本量为4的样本,求得X=8.5%样本标准差为S=0.04%。
分别求出正态均值μ与σ的95%的置信区间()。
A.[8.292,8.388] [0.017,0.112]B.[8.440,8.560] [0.017,0.112]C.[8.440,8.560] [0.182,0.123]D.[8.430,8.550] [0.182,0.112]4.设X1,X2,…,X25是从均匀分布U(0,5)抽取的一个样本,则∑==251251iiX X近似服从的分布是()。
A.N(5,1/12)B.N(5,1/10)C.N(2.5,1/12)D.N(2.5,1/10)5.有人研究了汽车速度与每升汽油行驶里程之间的关系,得到相关系数为0.27,但是他们发现速度表出了故障因而不太精确,每小时快了3公里,于是对速度表进行了修正,重新求得的相关系数是()。
A.0.35B.0.27C.0.30D.06.为提高某产品的产量,考虑三个三水平因子反应温度(A),反应压力(B),溶液浓度(C)。
当用正交表L9(34)安排实验,因子ABC依次放在123列上,并A.B,A,CB.C,A,BC.C,B,AD.A,B,C7.()检验是根据被检样本中的不合格产品数,推断整批产品的接收与否。
A.计件抽样B.计点抽样C.计数抽样D.计量抽样8.不属于接收概率的计算方法的有()。
A.超几何分布计算法B.几何分布计算法C.二项分布计算法D.泊松分布计算法9.检验水平反映了批量(N)与样品量(n)之间的关系,GB/T2828.1中,将一般检验分为()三个检验水平。
各型分布随机数的产生算法随机序列主要用概率密度函数(PDF〃Probability Density Function)来描述。
一、均匀分布U(a,b)⎧1x∈[a,b]⎪ PDF为f(x)=⎨b−a⎪0〃其他⎩生成算法:x=a+(b−a)u〃式中u为[0,1]区间均匀分布的随机数(下同)。
二、指数分布e(β)x⎧1⎪exp(−x∈[0,∞)βPDF为f(x)=⎨β⎪0〃其他⎩生成算法:x=−βln(1−u)或x=−βln(u)。
由于(1−u)与u同为[0,1]均匀分布〃所以可用u 替换(1−u)。
下面凡涉及到(1−u)的地方均可用u替换。
三、瑞利分布R(µ)⎧xx2exp[−x≥0⎪回波振幅的PDF为f(x)=⎨µ2 2µ2⎪0〃其他⎩生成算法:x=−2µ2ln(1−u)。
四、韦布尔分布Weibull(α,β)xα⎧−αα−1⎪αβxexp[−(]x∈(0,∞)βPDF为f(x)=⎨⎪0〃其他⎩生成算法:x=β[−ln(1−u)]1/α五、高斯(正态)分布N(µ,σ2)⎧1(x−µ)2exp[−]x∈ℜ2PDF为f(x)=⎨2πσ 2σ⎪0〃其他⎩生成算法:1〄y=−2lnu1sin(2πu2)生成标准正态分布N(0,1)〃式中u1和u2是相互独立的[0,1]区间均匀分布的随机序列。
2〄x=µ+σy产生N(µ,σ2)分布随机序列。
六、对数正态分布Ln(µ,σ2)⎧1(lnx−µ)2exp[−x>0PDF为f(x)=⎨2πσx 2σ2⎪0〃其他⎩生成算法:1〄产生高斯随机序列y=N(µ,σ2)。
2〄由于y=g(x)=lnx〃所以x=g−1(y)=exp(y)。
七、斯威林(Swerling)分布7.1 SwerlingⅠ、Ⅱ型7.1.1 截面积起伏σ⎧1−exp[σ≥0⎪σ0截面积的PDF为f(σ)=⎨σ0〃【指数分布e(σ0)】⎪0〃其他⎩生成算法:σ=−σ0ln(1−u)。
一维均匀分布随机数序列的产生方法【摘要】利用混沌的随机数产生算法和线性同余发生器以及MATLAB产生一维均匀分布随机数序列.经过检验,随机数列的统计性质有了很大提高,【关键词】混沌;线性同余发生器;MATLAB;随机数1 引言随机数在信息加密、数值运算及医学中基因序列分析等研究中有着广泛的应用。
比如数值运算中,Monte Carlo方法占有重要的地位,随机数是该方法的基础.随机数的质量影响了信息的安全和计算结果的精度。
特别是一些安全级别比较高的应用,对随机数提出了很高的要求。
随机数可由硬件和软件两种方式产生。
在计算机中广泛使用的是软件方式,通过计算机利用数学模拟随机过程产生随机数。
此方法有着自身的不足,数据之间有着关联性,存在周期,并非真正的随机数,因此被成为伪随机数。
生成随机数的方法繁多,从产生机理来说,可分为数学方法和物理方法两种,其所产生的随机数分别被称之为伪随机数和真随机数,前者易被破解,后者取自物理世界的真实随机源,难以破解,但这并不代表基于真随机源产生的随机数质量就很高,要取决于产生算法如何利用这个真随机源,相反的,许多用数学方法产生的随机数质量比较好。
因此,若能将数学方法和物理方法结合起来,则可能产生高质量的真随机数。
常见的产生随机数的方法有【1】线性同余法(LCG,Linear Congruent Generators)、Tarsworthe位移计数器法、Fibonacci延迟产生器法等。
为了克服以上方法的缺陷,人们还发展了许多新的方法。
组合发生器就是著名的一种。
它是将两个随机数发生器进行组合,以一种发生器产生一个随机数列,再用另一个随机数发生器对随机数列进行重修排列,得到一个更为独立,周期更长的随机数列。
已有一些利用混沌序列转换伪随机数列的报道【2】,文献【3】虽然提出了一种由logistic映射构造具有均匀性数列的好方法,但数据之间的独立性较差。
本研究中提出了一种新的方法,利用混沌算法【4】和线性同余发生器相组合得到随机数列,并就数据的均匀性和独立性进行了检验。
【附录一】常见分布汇总一、二项分布二项分布(Binomial Distribution),即重复n次的伯努利试验(Bernoulli Experiment),用ξ表示随机试验的结果, 如果事件发生的概率是P,则不发生的概率q=1-p,N次独立重复试验中发生K次的概率是。
二、泊松poisson分布1、概念当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其中λ为np。
通常当n≧10,p≦0.1时,就可以用泊松公式近似得计算。
2、特点——期望和方差均为λ。
3、应用(固定速率出现的事物。
)——在实际事例中,当一个随机事件,例如某电话交换台收到的呼叫、来到某公共汽车站的乘客,以固定的平均瞬时速率λ(或称密度)随机且独立地出现时,那么这个事件在单位时间(面积或体积)内出现的次数或个数就近似地服从泊松分布三、均匀分布uniform设连续型随机变量X的分布函数F(x)=(x-a)/(b-a),a≤x≤b则称随机变量X服从[a,b]上的均匀分布,记为X~U[a,b]。
四、指数分布Exponential Distribution1、概念2、特点——无记忆性(1)这种分布表现为均值越小,分布偏斜的越厉害。
(2)无记忆性当s,t≥0时有P(T>s+t|T>t)=P(T>s) 即,如果T是某一元件的寿命,已知元件使用了t 小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s小时的概率相等。
3、应用在电子元器件的可靠性研究中,通常用于描述对发生的缺陷数或系统故障数的测量结果五、正态分布Normal distribution1、概念2、中心极限定理与正态分布(说明了正态分布的广泛存在,是统计分析的基础)中心极限定理:设从均值为μ、方差为σ^2;(有限)的任意一个总体中抽取样本量为n 的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n 的正态分布。
3、特点——在总体的随机抽样中广泛存在。
概率论分布函数概率论分布函数是概率论中的重要概念,它描述了一个随机变量取不同值的概率。
通过分布函数,我们可以了解随机变量的分布情况,从而进行概率计算和数据分析。
本文将介绍概率论分布函数的定义、性质以及常见的分布函数类型。
一、定义概率论分布函数,也称累积分布函数(Cumulative Distribution Function,简称CDF),是描述一个随机变量取不同值的概率的函数,通常用F(x)表示。
对于任意实数x,F(x)定义为:F(x) = P(X≤x)其中,X表示随机变量。
概率论分布函数的定义可以从两个角度理解:1.几何角度:概率论分布函数描述了随机变量取值小于等于某个x 的概率,即在数轴上,小于等于x的区间的长度与整个概率空间的比例。
2.概率角度:概率论分布函数定义了对于任意取值小于等于x的情况下,随机变量取该值的概率。
二、性质概率论分布函数具有以下性质:1.非减性:对于任意的x1<x2,有F(x1)≤F(x2)。
这是因为随机变量在小于等于x1的区间上取值的概率一定小于等于小于等于x2的区间上取值的概率。
2.有界性:对于任意的x,有0≤F(x)≤1。
概率的范围是从0到1,因此概率论分布函数的取值也在这个范围内。
3.右连续性:对于任意的x0,有lim(x→x0+)F(x)=F(x0)。
这表示当x无限接近x0时,概率论分布函数的值会无限接近于F(x0)。
4.左极限性:对于任意的x0,有lim(x→x0-)F(x)=F(x0-1)。
这表示当x无限接近x0时,概率论分布函数的值会无限接近于F(x0-1)。
以上性质是概率论分布函数的基本特征,它们保证了分布函数的合理性和准确性。
三、常见的分布函数类型在概率论中,常见的分布函数类型有很多,下面介绍其中几个常见的分布函数:1.均匀分布函数(Uniform Distribution Function):均匀分布函数是最简单的分布函数之一,它表示随机变量的取值在一个区间上均匀分布。
常⽤的采样⽅法在复杂函数求期望、⾮线性函数近似等问题中,需要从⼀些特定的函数中采样。
⽽不同于⾼斯分布、均匀分布和Gamma分布等较为简单的分布,这些分布往往难以直接采样,因此需要从其他⾓度设计采样⽅法。
这⾥介绍⼏种常⽤的⽅法。
⼀、接收-拒绝采样(acceptance-rejection method)假设p(x) 难以直接采样,q(x)是⼀个⽐较容易采样的分布,如⾼斯、均匀分布,且正整数M使得p(x)/(Mq(x))<1。
则接收-拒绝采样的流程:1. 从q(x)采样得到⼀个粒⼦,从均匀分布U(0,1)中采样得到µ.2. 检验µ<p(x)/(Mq(x))。
成⽴,接受该粒⼦是从p(x)中采样的粒⼦;否则,拒绝。
(从上步骤可以看出,得到⼀个有效粒⼦需要平均M次采样)可以理解为,p(x)表⽰⼀个超多⾯体包围的区域(如圆形⾯积),Mq(x)为另⼀个完全包含p(x)的超多⾯体区域(如⼀个包含圆形的正⽅形),则当随机粒⼦µ<p(x)/(Mq(x)),则该粒⼦位于p(x)所包围区域中。
为了使得接受率尽可能⾼,M应该在满⾜p(x)/(Mq(x))<1的条件下尽量⼩。
该⽅法的缺点是:找到合适的q(x)很难;且接受概率可能很低,使得采样效率低下。
⼆、重要性采样(Importance Sampling)假设p(x)难以直接采样,q(x)是⼀个⽐较容易采样的分布(称为proposal function),则对p(x)的采样可以转换成从q(x)中采样的粒⼦x i的权重和,p(x)=q(x)p(x)q(x)≈∑i w iδ(x i)其中w i=p(x i)q(x i)为重要性权重(Importance Weight)。
重要性采样的关键在于寻找合适的proposal function,通常q(x)与p(x)越相似越好。
在贝叶斯估计中,⼀般可以将预测分布作为proposal function。
数学应用软件大型实验实验报告实验序号:日期:2012 年 6 月 20日班级信计100班姓名学号201020310216中心极限定理的理论证明实验名称问题背景描述:图中每一个黑点表示钉在板上的一颗钉子.每排钉子等距排列,下一排的每个钉子恰在上一排两相邻钉子之间.假设有排钉子,从入口中处放入小圆珠.由于钉板斜放,珠子在下落过程中碰到钉子后以的概率滚向左边,也以的概率滚向右边.如果较大,可以看到许多珠子从处滚到钉板底端的格子的情形如图所示,堆成的曲线近似于正态分布.如果定义:当第次碰到钉子后滚向右边,令;当第次碰到钉子后滚向左边,令.则是独立的,且那么由图形知小珠最后的位置的分布接近正态.可以想象,当越来越大时接近程度越好.由于时,.因此,显然应考虑的是的极限分布.历史上德莫佛第一个证明了二项分布的极限是正态分布.研究极限分布为正态分布的极限定理称为中心极限定理.图一:中心极限定律揭示了正态分布的意义:在实际问题中,常常需要考虑许多随机因素所产生的总的影响,如测量误差、炮弹射击的落点与目标的偏差等。
同时许多观察表明,若一个随机变量是由大量相关独立的随机因素的综合影响所构成的,而其中每一个随机因素的单独作用是微小的,则这样的随机变量通常服从或近似服从正态分布。
这种现象就是中心极限定理产生的客观背景。
实验目的:中心极限定理的核心内容是只要n 足够大,便可以把独立同分布的随机变量和的标准化当作正态变量,所以可以利用它解决很多实际问题,同时这还有助于解释为什么很多自然群体的经验频率呈现出钟形曲线这一值得注意的事实,从而正态分布成为概率论中最重要的分布,这就奠定了中心极限定理的首要功绩。
本次试验就是用具体的实验来进行验证大量随机变量的和近似服从正态分布,用100个(0,1)上的独立均匀分布的和的分布与它近似的正态分布进行比较,作图来验证中心极限定理。
又再1000个数来比较两个图来验证中心极限定理。
实验原理与数学模型:实验原理:中心极限定律,其内容是:当N 足够大的时候,N 个具有方差和均值的独立随机变量的代数和服从正态分布率。
“r分布”和“均匀分布”的概念
R分布和均匀分布是两种不同的概率分布。
均匀分布是一种在一定范围内的随机分布,其特点是每个点在事件发生的概率是相等的。
在R语言中,可以使用runif()函数来产生服从均匀分布的随机数,其调用格式为:runif(n, min = 0, max = 1),其中n表示随机数的个数,min表示均匀分布的下限,默认值为0,max 表示均匀分布的上限,默认值为1。
例如,runif(5)会生成5个在[0,1]区间内的均匀分布的随机数。
R分布,全称为Rayleigh分布,是一种连续概率分布,通常用于描述电磁波的强度。
Rayleigh分布在物理、工程和其他科学领域中都有广泛的应用。
在R语言中,可以使用rayleigh()函数来产生服从Rayleigh分布的随机数。
总之,R分布和均匀分布是两种不同的概率分布,各有其特点和用途。