概率论与数理统计小报告 正态随机数的产生方法
- 格式:doc
- 大小:158.00 KB
- 文档页数:6
正态分布的性质及实际应用举例正态分布定义:定义1:设连续型随机变量的密度函数(也叫概率密度函数)为:式中,μ 为正态总体的平均值;σ 为正态总体的标准差; x 为正态总体中随机抽样的样本值。
其中μ 、σ 是常数且σ > 0,则称随机变量ξ 服从参数为μ 、σ 的正态分布,记作ξ ~ N(μ,σ).定义2:在(1)式中,如果μ = 0,且σ =1,这个分布被称为标准正态分布,这时分布简化为:(2)正态分布的分布函数定义3:分布函数是指随机变量X 小于或等于x 的概率,用密度函数表示为:标准正态分布的分布函数习惯上记为φ ,它仅仅是指μ = 0,σ =1时的值,表示为:正态分布的性质:正态分布的变量的频数分布由μ、σ完全决定。
集中性:正态曲线的高峰位于正中央,即均数所在的位置。
对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。
均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。
正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。
σ越小,曲线越陡峭;σ越大,曲线越扁平。
u变换:为了便于描述和应用,常将正态变量作数据转换。
μ是正态分布的位置参数,描述正态分布的集中趋势位置。
正态分布以X=μ为对称轴,左右完全对称。
正态分布的均数、中位数、众数相同,均等于μ。
σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。
也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。
应用综述 :1. 估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。
2. 制定参考值范围(1)正态分布法 适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。
(2)百分位数法 常用于偏态分布的指标。
表3-1中两种方法的单双侧界值都应熟练掌握。
一维正态分布随机数生成算法班级:###班姓名:### 学号:##########一、介绍:正态分布在数理统计中具有基础性的作用,因此产生高质量的正态分布有重要的意义。
本报告中通过利用MATLAB工具,来编译并且运行算法,通过本算法可以产生符合一维正态分布的随机数,从而达到本报告的作用,通过绘制正态分布的图形,说明算法的正确性。
正态分布的定义:若连续随机变量§的概率密度为然而,得到服从正态分布的随机数的基本思想是先得到服从均匀分布的随机数,再将服从均匀分布的随机数转变为服从正态分布。
二、算法过程:1.利用中心极限定理2、产生服从N(μ,σ2)的算法步骤:(1) 产生n 个RND 随机数:r 1,r 2,…,r n ;(2) (3) 计算 y =σx +μ ,y 是服从 N(μ,σ2) 分布的随机数。
3、原理分析:设ζ1,ζ2,…,ζn 是n 个相互独立的随机变量,且ζi ~U(0,1),i = 1,2, …,n, 由中心极限定理知 : ,渐近服从正态分布N(0, l )。
注意:我们现在已经能产生[0,1]均匀分布的随机数了,那么我们可以利用这个定理来产生标准正态分布的随机数。
现在我们产生n 个[0,1]均匀分布随机数, 我们有:为方便起见,我们特别选 n = 12,则 :这样我们很方便地就把标准正态分布随机数计算出来了。
;/)(1122∑=-=ni n ni r x 计算,121)()(21==i i D E ζζ,有∑=-=n i nn i 1122/)(ζηn r r r ,,,21 ⎪⎪⎭⎫⎝⎛-=∑=211121n i i r n n u ∑=-=1216i i r u三、算法代码及生成随机数表格及解释function m = zhengtaifenbu(miu,sigma)%UNTITLED2 Summary of this function goes here %Detailed explanation goes heren=zeros(1,1200);m=n;figure(1)for i=1:1200r=rand(1,12);n(i)= (sum(r)-6);endm=sigma*n+miu;subplot(1,2,1)cdfplot(m) ;subplot(1,2,2)ksdensity(m);End随机数表格:(*选取数据中的一部分加以说明)(利用产生的随机数绘制出来的平滑曲线)中心极限定理说明,无穷多个具有相同分布的随机变量之和是服从标准正态分布的。
1. 编制两种方法产生正态分布随机数的程序并进行验证分析; 编程思路:产生正态分布随机数的两种方法:(1) 统计近似抽样法:a.设{i y }是(0,1)均匀分布的随机数序列,则{}1()0.5y i i i i E y y p y dy μ===⎰1220()()1/12y i y i i y p y dy σμ=-=⎰b.根据中心极限定理,当N →∞时,112()2()~(0,1)/12NNi yi i i yNy k N y x k N N N μσ==--==∑∑c.如需产生均值为x μ,方差为2x σ的正态分布随机变量x ,只需如下计算:212~(,)/12Ni i x x x x N y x N N μσμσ=-=+∑,试验证明12N =时,x 的统计性质就比较理想了。
(2) 变换抽样法:设12,y y 是两个相互独立的(0,1)均匀分布的随机变量,则新变量1/21121/2212(2log )cos(2)(2log )sin(2)x y y x y y ππ⎧=-⎨=-⎩ 是相互独立的,服从(0,1)N 分布的随机变量。
利用统计近似抽样法和变换抽样法的定义及之前产生(0,1)均匀分布的随机数的基本方法如乘同余法、混合同余法等产生正态分布随机数。
调试过程遇到的问题:(1)在用统计近似抽样法产生正态分布随机数时,给定,μσ,然后用Matlab 自带函数检验结果,感觉数据老对不上?解决方法:自己设定的,μσ分别是均值,标准差,利用Matlab 自带函数mean(),var()计算出来的分别是均值,方差,总觉得方差老对不上,其实是自己理解问题,var()计算出来的方差数值肯定是自己设定的标准差的平方大小左右。
(2)Matlab 下标从1开始;做运算两个矩阵的尺寸大小得对应上,还有调用的值一定得有值。
程序运行结果分析得到的结论:(1)统计近似抽样法:50010001500200025003000350040004500-50510统计近似抽样法(1)-4-202468050100150200 050100150200250300350-4-20246统计近似抽样法(2)-3-2-101234567010203040统计近似抽样法中要用产生的(0,1)序列的12个数的和,但具体哪12个,不太清楚,图(1)是:z(1)用的是x(1)~x(12),z(2)用的是x(2)~x(13),以此类推。
概率论与数理统计小报告(二)_________正态随机数的产生方法学院数理学院专业信息与计算科学班级姓名学号依据中心极限定理产生正态分布随机数摘要:由中心极限定理可知,当n很大时,具有期望μ,方差σ2的分布近似为标准正态分布,故可据此产生标准正态分布。
并利用Matlab自带的函数对结果进行检验。
关键字:正态分布中心极限定理随机数正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
若随机变量服从一个位置参数为、尺度参数为的概率分布,记为:则其概率密度函数为正态分布的数学期望值或期望值等于位置参数,决定了分布的位置;其方差的开平方或标准差等于clc,clearfor i=1:1000R=rand(1,12);X(i)=sum(R)-6;endX=X';m=mean(X)v=var(X)subplot(1,2,1),cdfplot(X) %绘制经验累计分布函数图,显示了一维向量X的累计概率分布F(x)的图形subplot(1,2,2),histfit(X) %绘制分组数据的柱状分布函数图,即频数图h=kstest(X, [X normcdf(X, 0,1)])% H = kstest(X)执行Kolmogorov-Smirnov检验标准正态分布比较数据向量x的值。
零假设是x为标准的正态分布;另一种假设是x不是标准正态分布。
在5%显著水平进行检验,若结果h为1,则说明零假设不成立,拒绝零假设。
否则,结果为0,零假设成立,即原分布为标准正态分布运行结果如下:h =0 (检验表明分布为标准正态分布)R = (产生的一组12个【0,1】上均匀分布的随机数)Columns 1 through 40.5700 0.4027 0.3702 0.0801Columns 5 through 80.3389 0.2411 0.8556 0.7063Columns 9 through 120.5685 0.0696 0.0455 0.3958下图为i=1000,即进行1000次抽样分布的结果。
《蒙特卡罗法生成服从正态分布的随机数》一、引言“蒙特卡罗法”这一词汇,源自于蒙特卡罗赌场,是一种通过随机抽样和统计模拟来解决问题的方法。
而生成服从正态分布的随机数,是在数理统计、金融工程、风险管理等领域中常常遇到的问题。
在本文中,我们将探讨如何利用蒙特卡罗法生成服从正态分布的随机数,从而可以更深入地理解这一方法并应用于实际问题中。
二、蒙特卡罗法的基本原理蒙特卡罗法是一种基于随机抽样的方法,通过对概率模型进行模拟实验来获取近似解。
对于生成服从正态分布的随机数,我们可以利用蒙特卡罗法来模拟正态分布的概率密度函数,从而得到符合正态分布的随机数。
在生成正态分布的随机数时,我们可以采用以下步骤:1. 生成服从均匀分布的随机数2. 利用反函数法将均匀分布的随机数转化为正态分布的随机数3. 进行模拟实验,不断调整参数,直至生成的随机数符合所需的正态分布三、蒙特卡罗法生成正态分布的随机数的具体步骤1. 生成服从均匀分布的随机数我们可以利用随机数发生器生成服从均匀分布的随机数。
均匀分布的概率密度函数为f(x) = 1,x∈[0,1]。
我们可以生成若干个0到1之间的随机数作为初始值。
2. 利用反函数法将均匀分布的随机数转化为正态分布的随机数利用反函数法,我们可以将服从均匀分布的随机数转化为服从正态分布的随机数。
正态分布的累积分布函数为Φ(x) = ∫(-∞,x) (1/√(2π) * exp(-t^2/2)dt,而其反函数可以通过查表或近似计算得到。
利用反函数法,我们可以将生成的均匀分布的随机数通过正态分布的反函数转化为符合正态分布的随机数。
3. 进行模拟实验,不断调整参数,直至生成的随机数符合所需的正态分布在生成的随机数不符合所需的正态分布时,我们可以不断地调整参数、增加模拟实验的次数,直至得到符合所需的正态分布的随机数。
四、总结与回顾通过蒙特卡罗法生成服从正态分布的随机数,我们可以发现这一方法的灵活性和强大性。
正态分布随机数的⽣成正态分布随机数的⽣成与π的估计学院:数学学院专业:统计学班级: 06班姓名:⽩杨学号:10130605赵俊鹏 10130607尹鹏 101306101⽬录:(⼀)正态分布随机数的⽣成⽅法: (2)(1)逆变换法 (2)(2)筛选法 (2)(3)极坐标法 (4)(4)中⼼极限定理逼近法 (5)(⼆)圆周率π值的估计: (8)(1)蒙特卡洛⽅法 (8)(2)蒲丰投针法 (11)(3)积分法 (13)(4)条件期望法 (13)(5)对偶变量法 (14)(6)控制变量法 (15)(7)分层抽样法 (16)(⼀)正态分布随机数的⽣成⽅法:(1)逆变换法:function binonorm1() ticU=unifrnd(0,1); X=norminv(U); toc end>>binonorm1()时间已过 0.008417 秒。
-3-2-10123-3-2-1123Standard Normal QuantilesQ u a n t i l e s o f I n p u t S a m p l e100次模拟下的QQ 图(2)筛选法为⽣成标准正态随机变量Z ,注意到其绝对值Z 的概率密度函数为∞<<=-x e x f x 0,22)(2/2π⾸先利⽤筛选法⽣成具有上述密度函数的随机变量,密度g(x)采⽤均值为1的指数密度,即 ∞<<=-x e x g x 0,)(此时2/2/2)()(x x e x g x f -=π且其最⼤值在使得2/x 2x -达到最⼤值处取得。
由微分法可知最⼤值点为x=1.于是,取π/2)1()1()()(maxe gf xg x f c === 由于, }2)1(exp{}212exp{)()(22--=--=x x x x cg x f故⽣成Z 的算法如下:步骤1:⽣成参数为1的指数随机变量Y; 步骤2:⽣成⼀个(0,1)上的均匀分布随机数U ;步骤3:如果U<=exp{-(Y-1)^2/2},则令X=Y.否则转⾄步骤1.function binonorm2()ticY = exprnd(1); U = unifrnd(0,1);while (U>exp(-(Y-1)^2/2)) Y = exprnd(1); U = unifrnd(0,1); end X = Y; toc end>>binonorm2()时间已过 0.007354 秒。
一维正态分布随机数序列产生的几种方法介绍【摘要】正态分布在数理统计中具有基础性的作用,因此产生高质量的正态分布有重要的意义。
我们将介绍几种数值方法求正态分布:中心极限定理,Hasiting 有理逼近法,统计工具箱,反函数法,舍选法,R 软件及一维正态随机数的检验。
【关键词】正态分布;一维;随机数。
一.利用中心极限定理中心极限定理:(一般 n≥10),产生服从N(μ,σ2)的算法步骤:(1)产生n 个RND 随机数:r 1,r 2,…,r n ;(2) (3) 计算 y =σx +μ ,y 是服从 N(μ,σ2) 分布的随机数。
原理分析:设ζ1,ζ2,…,ζn 是n 个相互独立的随机变量,且ζi ~U(0,1), i = 1,2, …,n, 由中心极限定理知 : ,渐近服从正态分布N(0, l )。
注意:我们现在已经能产生[0,1]均匀分布的随机数了,那么我们可以利用这个定理来产生标准正态分布的随机数。
现在我们产生n 个[0,1]均匀分布随机数,我们有: 为方便起见,我们特别选 n = 12,则 : 这样我们很方便地就把标准正态分布随机数计算出来了。
在C 语言中表示为:例1:利用中心极限定理产生标准正态分布随机数并检验% example 1n r r r ,,,21 ⎪⎪⎭⎫ ⎝⎛-=∑=211121n i i r n n u ∑=-=1216i i r u ;/)(1122∑=-=n i n n i r x 计算,121)()(21==i i D E ζζ,有∑=-=ni n n i 1122/)(ζηclc,clearfor i=1:1000R=rand(1,12);X(i)=sum(R)-6;endX=X';m=mean(X)v=var(X)subplot(1,2,1),cdfplot(X)subplot(1,2,2),histfit(X)h=kstest(X, [X normcdf(X, 0,1)])结果为:H=0, 接受原假设,变换后的确为标准正态分布。
一种正态分布随机数的生成方法正态分布(Normal Distribution)是概率论和统计学中常见的一种连续型概率分布。
生成正态分布随机数的方法有很多,下面介绍几种常用的方法。
1.使用中心极限定理中心极限定理告诉我们,当随机变量的样本量足够多时,其均值的分布会趋近于正态分布。
因此,我们可以使用均匀分布的随机数来模拟正态分布。
具体方法如下:(2)计算这些随机数的平均值;(3)重复上述步骤多次,得到一组均值;(4)对这组均值进行标准化处理,即减去平均值再除以标准差,即可获得标准正态分布随机数。
这种方法的缺点是需要较多的随机数进行平均,因此生成较多的随机数时,效率较低。
2. 使用Box-Muller变换Box-Muller变换是一种经典的生成标准正态分布随机数的方法。
具体步骤如下:(1)生成两个服从均匀分布的独立随机数U1,U2(0~1之间);(2)计算变量Z1 = sqrt(-2 * log(U1)) * cos(2 * pi * U2) 和Z2 = sqrt(-2 * log(U1)) * sin(2 * pi * U2);(3)Z1和Z2分别服从标准正态分布。
这种方法的优点在于生成两个正态分布随机数,因此效率较高。
3.使用反函数法反函数法是一种基于累积分布函数(CDF)的方法。
正态分布的累积分布函数(CDF)是一个数学上比较复杂的函数,但可通过其他数学方法进行近似计算。
(1)计算累积分布函数的逆函数,即给定一个概率的值p(0~1之间),可以计算出对应的随机变量X;(2)使用均匀分布的随机数U(0~1之间),通过逆函数计算出对应的X;(3)得到一组服从正态分布的随机数。
这种方法需要事先计算好逆函数的值,并且逆函数的计算通常是比较复杂的。
4. 使用Ziggurat算法Ziggurat算法是一种高效生成正态分布随机数的方法。
它结合了Box-Muller变换和反函数法,并利用了一种特殊的分层结构,使得生成正态分布随机数的效率更高。
随机数的产生随机数的产生1.随机数的概念随机数是在一定范围内随机产生的数,并且得到这个范围内任何一个数的机会是均等的.它可以帮助我们模拟随机试验,特别是一些成本高、时间长的试验,用随机模拟的方法可以起到降低成本,缩短时间的作用.2.随机数的产生方法:一般用试验的方法,如把数字标在小球上,搅拌均匀,用统计中的抽签法等抽样方法,可以产生某个范围内的随机数.在计算器或计算机中可以应用随机函数产生某个范围的伪随机数,当作随机数来应用.3.随机模拟法(蒙特卡罗法):用计算机或计算器模拟试验的方法,具体步骤如下:(1)用计算器或计算机产生某个范围内的随机数,并赋予每个随机数一定的意义;(2)统计代表某意义的随机数的个数M和总的随机数个数N;(3)计算频率()n Mf AN作为所求概率的近似值.要点诠释:1.对于抽签法等抽样方法试验,如果亲手做大量重复试验的话,花费的时间太多,因此利用计算机或计算器做随机模拟试验可以大大节省时间.2.随机函数RANDBETWEEN(a,b)产生从整数a到整数b的取整数值的随机数.3. 随机数具有广泛的应用,可以帮助我们安排和模拟一些试验,这样可以代替我们自己做大量重复试验,比如现在很多城市的重要考试采用产生随机数的方法把考生分配到各个考场中.4.在区间[a,b]上的均匀随机数与整数值随机数的共同点都是等可能取值,不同点是均匀随机数可以取区间内的任意一个实数,整数值随机数只取区间内的整数.5.利用几何概型的概率公式,结合随机模拟试验,可以解决求概率、面积、参数值等一系列问题,体现了数学知识的应用价值.6.用随机模拟试验不规则图形的面积的基本思想是,构造一个包含这个图形的规则图形作为参照,通过计算机产生某区间内的均匀随机数,再利用两个图形的面积之比近似等于分别落在这两个图形区域内的均匀随机点的个数之比来解决.7.利用计算机和线性变换Y=X*(b-a)+a,可以产生任意区间[a,b]上的均匀随机数.。
编制变换抽样法产生正态分布随机数的程序并进行验证分析;设y1,y2是相互独立的均匀分布的随机变量,则新变量x1=(−2log y1)12cos(2πy2)x2=(−2log y1)12sin(2πy2)也是相互独立的,而且服从正态分布。
程序及结果如下:N=5000;%初始化数据长度for i=1:Ny1=rand;%生成均匀分布的随机数y2=rand;%生成均匀分布的随机数x1(i)=sqrt((-2)*log(y1))*cos(2*pi*y2);%用变换抽样法产生正态分布随机数x2(i)=sqrt((-2)*log(y1))*sin(2*pi*y2);%用变换抽样法产生正态分布随机数endu1=mean(x1);%计算出x1的平均值v1=std(x1);%计算出x1的标准差u2=mean(x1);%计算出x2的平均值v2=std(x1);%计算出x2的标准差subplot(1,2,1);histfit(x1);%绘制带有正态密度曲线的直方图hold onxlabel('随机数');ylabel('x1');title('均值为u1,标准差为v1');subplot(1,2,2);histfit(x2);%绘制带有正态密度曲线的直方图hold onxlabel('随机数');ylabel('x2');title('均值为u2,标准差为v2');>> u1u1 =0.0167 >> v1v1 =1.0020 >> u2u2 =0.0167 >> v2v2 =1.0020。
概率论与数理统计课程设计题目:正态分布随机数生成算法要编程得到服从均匀分布的伪随机数是容易的。
C语言、Java语言等都提供了相应的函数。
但是要想生成服从正态分布的随机数就没那么容易了。
得到服从正态分布的随机数的基本思想是先得到服从均匀分布的随机数,再将服从均匀分布的随机数转变为服从正态分布。
接下来就先分析三个从均匀分布到正态分布转变的方法。
然后编程实现其中的两个方法并对程序实现运作的效果进行统计分析。
1、 方法分析(1) 利用分布函数的反函数若要得到分布函数为F(x)的随机变量Y 。
可令1()Y F u -=, 其中u 是服从均匀分布的随机变量,有1()(())()P Y y P U F y F y -≤=≤=因而,对于任意的分布函数,只要求出它的反函数,就可以由服从均匀分布的随机变量实例来生成服从该分布函数的随机变量实例。
现在来看正态分布的分布函数,对于2~(,)X N μσ,其分布函数为:22()21()t x F x e μσ---∞=显然,要想求其反函数是相当困难的,同时要想编程实现也很复杂。
可见,用此种方法来生成服从正态分布的随机变量实例并不可取。
(2) 利用中心极限定理第二种方法利用林德伯格—莱维(Lindeberg —Levi)中心极限定理:如果随机变量序列12,,,,n X X X 独立同分布,并且具有有限的数学期望和方差()()2,0(1,2,),i i E X D X i μσ==>= 则对一切x R ∈有221lim tnx i n i P X n x dt μ--∞→∞=⎛⎫⎫-≤=⎪⎪⎭⎝⎭∑⎰因此,对于服从均匀分布的随机变量i X ,只要n 充分大,1n i i X n μ=⎫-⎪⎭∑就服从()0,1N 。
我们将实现这一方法。
(3) 使用Box Muller 方法 先证明222xedx π-∞-∞=⎰:令22xI edx -∞-∞=⎰,则22222222xyx y I edx edy edxdy --+∞∞∞--∞-∞-∞==⎰⎰⎰令cos ,sin x r y r θθ==,则有22222222rrI erdrd erdr πθππ∞∞--===⎰⎰⎰。
概率论课程设计随机数的产生摘要:随机数是概率论与数理统计中一个重要的概念。
本文研究了随机数的产生,先给出了均匀分布的随机数的产生算法,再通过均匀分布的随机数变换得到其他连续型随机数的产生算法.利用编程给出了产生均匀分布随机数的算法,探讨了同余法的理论原理.通过均匀随机数产生其他分布的随机数,我们列举了几种通用算法,并讨论各个算法的优缺点,最后以正态分布为例验证高效舍选法的优势.关键词:随机数;概率论;均匀分布;算法;目录:一 随机数与伪随机数二 均匀分布随机数的产生三 非均匀分布随机数的产生正文一、 随机数与伪随机数随机变量η的抽样序列12,,n ηηηL ,…称为随机数列.如果随机变量η是均匀分布的,则η的抽样序列12,,n ηηηL ,…称为均匀随机数列;如果随机变量η是正态分布的随机变量则称其抽样序列为正态随机数列.比如在掷一枚骰子的随机试验中出现的点数x 是一个随机变量,该随机变量就服从离散型均匀分布,x 取值为1,2,3,4,5,6,取每个数的概率相等均为1/6.如何得到x 的随机数?通过重复进行掷骰子的试验得到的一组观测结果12,,,n x x x L L 就是x 的随机数.要产生取值为0,1,2,…,9的离散型均匀分布的随机数,通常的操作方法是把10个完全相同的乒乓球分别标上0,1,2,…,9,然后放在一个不透明的袋中,搅拦均匀后从中摸出一球记号码1x 后放回袋中,接着仍将袋中的球搅拌均匀后从袋中再摸出一球记下号码2x 后再放回袋中,依次下去,就得到随机序列12,,,n x x x L L .通常称类似这种摸球的方法产生的随机数为真正的随机数.但是,当我们需要大量的随机数时,这种实际操作方法需要花费大量的时间,通常不能满足模拟试验的需要,比如教师不可能在课堂上做10000次掷硬币的试验,来观察出现正面的频率.计算机可以帮助人们在很短时间产生大量的随机数以满足模拟的需要,那么计算机产生的随机数是用类似摸球方法产生的吗?不是.计算机是用某种数学方法产生的随机数,实际上是按照一定的计算方法得到的一串数,它们具有类似随机数的性质,但是它们是依照确定算法产生的,便不可能是真正的随机数,所以称计算机产生的随机数为伪随机数.在模拟计算中通常使用伪随机数.对这些伪随机数,只要通过统计检验符合一些统计要求,如均匀性、随机性等,就可以作为真正的随机数来使用,我们将称这样产生的伪随机数为随机数.在计算机上用数学方法产生随机数的一般要求如下:1)产生的随机数列要有均匀性、抽样的随机性、试验的独立性和前后的一致性.2)产生的随机数列要有足够长的周期,以满足模拟实际问题的要求.3)产生随机数的速度要快,占用的内存少.计算机产生随机数的方法内容是丰富的,在这里我们介绍几种方法,计算机通常是先产生[0,1]区间上均匀分布的随机数,然后再产生其他分布的随机数.二、均匀分布随机数的产生2.1 算法1在vc的环境下,为我们提供了库函数rand()来产生一个随机的整数.该随机数是平均在0~RAND_MAX之间平均分布的,RAND_MAX是一个常量,在VC6.0环境下是这样定义的:#define RAND_MAX 0x7fff它是一个short 型数据的最大值,如果要产生一个浮点型的随机数,可以将rand()/1000.0这样就得到一个0~32.767之间平均分布的随机浮点数.如果要使得范围大一点,那么可以通过产生几个随机数的线性组合来实现任意范围内的平均分布的随机数.例如要产生-1000~1000之间的精度为四位小数的平均分布的随机数可以这样来实现.先产生一个0到10000之间的随机整数.方法如下:int a = rand()%10000;然后保留四位小数产生0~1之间的随机小数:double b = (double)a/10000.0;然后通过线性组合就可以实现任意范围内的随机数的产生,要实现-1000~1000内的平均分布的随机数可以这样做:double dValue =(rand()%10000)/10000.0*1000-(rand()%10000)/10000.0*1000;则dValue就是所要的值.但是,上面的式子化简后就变为:double dValue = (rand()%10000)/10.0-(rand()%10000)/10.0;这样一来,产生的随机数范围是正确的,但是精度不正确了,变成了只有一位正确的小数的随机数了,后面三位的小数都是零,显然不是我们要求的,什么原因呢,又怎么办呢.先找原因,rand()产生的随机数分辨率为32767,两个就是65534,而经过求余后分辨度还要减小为10000,两个就是20000而要求的分辨率为1000*10000*2=20000000,显然远远不够.下面提供的方法可以实现正确的结果:double a = (rand()%10000) * (rand()%1000)/10000.0;double b = (rand()%10000) * (rand()%1000)/10000.0;double dValue = a-b;则dValue就是所要求的结果.在下面的函数中可以实现产生一个在一个区间之内的平均分布的随机数,精度是4位小数.double AverageRandom(double min,double max){int minInteger = (int)(min*10000);int maxInteger = (int)(max*10000);int randInteger = rand()*rand();int diffInteger = maxInteger - minInteger;int resultInteger = randInteger % diffInteger + minInteger;return resultInteger/10000.0;}但是有一个值得注意的问题,随机数的产生需要有一个随机的种子,因为用计算机产生的随机数是通过递推的方法得来的,必须有一个初始值,也就是通常所说的随机种子,如果不对随机种子进行初始化,那么计算机有一个缺省的随机种子,这样每次递推的结果就完全相同了,因此需要在每次程序运行时对随机种子进行初始化,在vc 中的方法是调用srand (int )这个函数,其参数就是随机种子,但是如果给一个常量,则得到的随机序列就完全相同了,因此可以使用系统的时间来作为随机种子,因为系统时间可以保证它的随机性.2.2 算法2:用同余法产生随机数同余法简称为LCG(Linear Congruence Gener-ator),它是Lehmer 于1951年提出来的.同余法利用数论中的同余运算原理产生随机数.同余法是目前发展迅速且使用普遍的方法之一.同余法(LCG)递推公式为1()(mod )n n x ax c m -=+ (n=1,2,…), (1) 其中n x ,a ,c 均为正整数.只需给定初值x.,就可以由式(1)得到整数序列{n x },对每一n x ,作变换n u =n x /m ,则{n u }(n=1,2,…)就是[0,1)上的一个序列.如果{n u }通过了统计检验,那么就可以将n u 作为[0,1)上的均匀分布随机数.在式(1)中,若c=0,则称相应的算法为乘同余法,并称口为乘子;若c ≠0,则称相应的算法为混合同余法.同余法也称为同余发生器,其中0x 称为种子.由式(1)可以看出,对于十进制数,当取模m=10k(k 为正整数)时,求其同余式运算较简便.例如36=31236(mod102),只要对21236从右截取k=2位数,即得余数36.同理,对于二进制数,取模m=2k 时,求其同余式运算更简便了.电子计算机通常是以二进制形式表示数的.在整数尾部字长为L 位的二进制计算机上,按式(1)求以m 为模的同余式时,可以利用计算机具有的整数溢出功能.设L 为计算机的整数尾部字长,取模m=2L ,若按式(1)求同余式时,显然有 11111;[()/].n n n n n n n ax c m x ax c ax c m x ax c m ax c m -----+<=++≥=+-+当时,则当时,则这里[x]是取x 的整数部分.在电子计算机上由1n x -求n x 时,可利用整数溢出原理.不进行上面的除法运算.实际上,由于计算机的整数尾部字长为L ,机器中可存放的最大整数为2L -1,而此时a 1n x -+c ≥m ≥2L -1,因此a 1n x -+c 在机器里存放时占的位数多于L 位,于是发生溢出,只能存放n x 的右后L 位.这个数值恰是模m=2L 的剩余,即n x .这就减少了除法运算,而实现了求同余式.经常取模m=2L (L 为计算机尾部字长),正是利用了溢出原理来减少除法运算.由式(1)产生的n x (n=1,2,……),到一定长度后,会出现周而复始的周期现象,即{n x }可以由其某一子列的重复出现而构成,这种重复出现的子列的最短长度称为序列n x 的周期.由式(1)不难看出,{n x }中两个重复数之间的最短距离长度就是它的周期,用T 代表周期.周期性表示一种规律性,它与随机性是矛盾的.因此,通常只能取{n x }的一个周期作为可用的随机序列.这样一来,为了产生足够多的随机数,就必须{n x }的周期尽可能地大.由前所述,一般取m=2L,这就是说模m 已取到计算机能表示的数的最大数值,意即使产生的随机数列{n x }的周期达到可能的最大数值,如适当地选取参数0x ,a ,c 等,还可能使随机数列{n x }达到满周期. 三、非均匀分布随机数的产生3.1 一般通用方法3.1.1组合法组合法的基本思想是把预定概率密度函数f ( x ) 表为其它一些概率密度的线性组合.而这些概率密度的随机抽样容易产生.通过这种避难就易的手段我们也许可以达到较高的输出速度和较好的性能.若分布密度函数f ( x ) 能表为如下式(2)所示的函数项级数的和,1()()i i i f x p f x ∞==∑ (2)其 中1ii p ∞=∑,诸f( x )皆为概率密度函数.则依如下步骤可产生分布为f ( x )一次抽样. ( 1 ) 产生一个随机自然数I , 使I 服从如下分布律:P ( I = i ) = p i i = 1 , 2 , 3……( 2 ) 产生服从f I ( x )的随机数0X证明利用全概率公式,有:11()()()()()i i i i P x X x dx P I i P x X x dx I i p f x dxf x dx∞=∞=<≤+==<≤+|===∑∑故X 服从f ( x ) 分布.我们以产生双指数(或拉普拉斯)分布的随机数为例来简单说明这种方法.双指数分布具有 概率密度函数f ( x ) = 0 . 5x e- f ( x ) 可表为:()0.5()0.5()l r f x f x f x =+ (3)其中()r f x 是指数分布,()l f x 是指数分布的对称分布.故产生双指数分布的抽样可按如下方法: 产生U 1 , U 2~U ( 0 , 1 ) ;若U 1 > 0 . 5 , 则令X = I n U 2,否则X = - I n U 2. 在式(2) 中, 若i →∞, 有p i → 0 ,则可用函数列{()}i i p f x 的前有限项和逼近f ( x ).这是一种近似的方法,与通常的函数逼近原理相同.只要近似的精度 ( 在某种“精度”的意义之下) 达到要求,我们就可以采用近似的方法 .使用组合法时,各f i ( x ) 的抽样应该容易产生,故选用合适的概率密度函数族{ f i ( x )}把任意连续分布表为式(2) ,乃是使用组合法的关键.3.3.2 概率密度变换法这是一种比较新的通用随机数产生方法.其主要的目的是对一般的f(x)找出较好的覆盖函数以达到较高的效率.我们知道,对某一特定的概率密度f(x),我们可以使用最优化技术找到好的覆盖函数.但对于一般情况,我们只能期望产生效率尚可的覆盖函数. H O R M A N N用概率密度变换的方法生成一曲边梯形作为覆盖函数.其原理如下:使用一个变换函数T (x)把预定密度函数f ( x ) 变换为h ( x ) = T ( f ( x ) ) ,用一个分段线性函数l ( x )覆盖h ( x ),如图2 - 4 左图; h ( x ) 若是上凸的,则T1 ( l ( x ) )将是f ( x ) 的一个较好的覆盖函数这个方法在选择合适的T ( x ) ( l o g ( x ) 或1 / x a等) 后,能产生随机数包括了较多的分布类型.这个方法有较短的预处理时间,但需要较多的函数计算,不太适合硬件实现.此外,A h r e n s l用每段为常数的分段函数作为覆盖函数.L e y d o l d基于r a t i o - o f - u n i f o r m s 的方法也是一个通用算法.还有一种近似的方法,其产生的随机数与指定分布的随机数具有相同的前四阶矩,但概率分布不一定相同.这里就不详细介绍了.3.2 我们的方法当前的通用算法的问题是效率不能任意提高,不够灵活. 通常产生每个所需随机数X需以较大的概率计算f ( x )等函数.我们认为在速度要求非常高的场合,计算f ( x )是不利的,尤其以硬件进行函数计算是十分不利的.针对己有通用算法的不足,我们提出了基于组合法的通用算法.主要目的是尽可能地减少三角、指数、对数等超越函数的计算,以便硬件实现.产生任意连续分布随机数的高效舍选算法本文提出一种通用算法,可视需要使效率接近1 , 而且f ( x ) 的计算概率可任意小. 这些优点的取得是以长的预处理时间为代价的.在需要产生大量随机样本的场合( 例如通信系统的误码率测试,可能需要数小时乃至数天的仿真时间) ,本算法将有很大的优势,尽管有看法认为只有能用简单代码实现的算法才会被经常使用.3.2.1 算法原理假定预定的连续概率密度函数f ( x ) 为单峰的( 这是实际的大多数情况) ,已知其峰值点为m .一般f ( x ) 不关于x =m 对称,如图2 -5 .我们假定f ( x ) 定义在有界的区间[ a , b ] 上( 上文说过,对正态分布这类定义区间无限的情况,我们把这个区间取得足够大就可以了) . 直线X=m把f ( x ) 曲线与X轴所围面积分为左右两部分,我们把左右两部分各等分为K份,一共得到2 K个曲边梯形.并用2 K个矩形各自覆盖相应的曲边梯形.我们的想法是利用舍选法的几何意义,分别在上述2 K个曲边梯形内均匀投点,从而使随机点在f ( x ) 曲线与x 轴所围的整个区域中均匀分布,这样即可产生f ( x ) 的抽样X . 而在曲边梯形内均匀投点可使用简单舍选法:先在各个矩形内均匀投点,再选出落于相应曲边梯形内的点. 这种投点法浪费的点只位于各个矩形的一角,显然效率大大高于简单舍选法.最为重要的是:随着K的增大,效率会不断提高.另外,只有当投点位于曲边梯形的曲边之下时,才需计算f ( x ) ,而且计算f ( x ) 概率是随着K的增加而减小的.我们每次“按概率”随机选中一个曲边梯形进行投点. 这需要两步完成:先选择左边还是右边,再于此边的K个曲边梯形中选择一个.这里的概率显然就是面积,这可以从以下的推导中看出来.为清晰起见,我们先阐述随机数的产生法,而把面积的均分这个预处理过程置于随后.3.2.2 算法推导令()mP f x dx -∞=⎰为左边面积.则左边各曲边梯形面积皆为 P / K ,右边各曲边梯形面积皆为( ( I -P ) / K . f ( x ) 可表为: 12111()()()K Ki i i i P P f x f x f x K K ==-=+∑∑ (4) 诸ji f ( x ) ( j = 1 , 2 ; i = 1 , 2 . . . k ) 皆为一腰为曲边的梯形形状的概率密度函数.依如下步骤可产生分布为f ( x ) 的一次抽样:S t e p l :产生一个随机自然数J ,使J 服从如下两点分布: P ( J = 1 ) = P , P ( J = 2 ) = 1 - P : S t e p 2 :产生一个随机自然数I , 使I 服从如下均匀分布律:P ( I = i ) = 1 / K , i = 1 , 2 . . . . K ;S t e p 3 : 用基本舍选法产生概率密度为f ( x ) 的随机数X .证明利用全概率公式,有: 2111211()()()(,)1(()())()Kj i K Ki i i i P x X x dx P J j P I i P x X x dx J j I i P P f x f x dx K K f x dx ====<≤+===<≤+∣==-=+=∑∑∑∑故x 服从 f ( x ) 分布.下面完整地描述这个方法:S t e p l( 产生J ) :S t e p l . l 产生[ 0 , 1 ] 上的均匀随机数U 1 ;S t e p 1 . 2若U 1 < P ,则返回J = 1 , 否则返回J = 2 ;S t e p 2( 产生I ) :S t e p 2 . l 产生 [ 0 , I ] 上的均匀随机数U 2 ;S t e p 2 . 2 21;I kU x =+⎢⎥⎢⎥⎣⎦⎣⎦表示不大于x 的最大整数.产生 ji f ( x ) 的样本需区别j = 1 与j = 2 两种情况. 图2 - 6 示出j = 2 时一 典型的ji f ( x ) , 用简单舍选法产生其抽样,覆盖函数为矩形. 首先产生一个[ 0 , R i ] 的均匀数, 如它属于[ 0 , R 1i -] 小无需再产生y 轴方向的均匀随机数,接受此均匀数即可;否则还需产生一个Y 轴方向的均匀随机数进行投点,那些落在曲边下方的点被接受,投在矩形右上角的点被舍弃.同理易得j = 1 时的产生法.整个S t e p 3 如下:S t e p 3( 产生X ) :i f J = =1{ l o o p :产生[ 0 , 1 ] 上的均匀随机数U 3 , W = ( L 0 - L 1 ) U 3 + L 1 : i f W> L 1i -,返回 X = W;e l s e { 产生[ O , l ] 上的均匀随机数V ;i f f ( W) - f ( L 1) < ( f ( L 1j - ) - f ( L 1 ) ) V 返回X = W; e l s e 舍弃W ,重复l o o p ;} }e l s e{ l o o p : 产生[ 0 , 1 ] 上的 均匀随机数U 3 , W = ( R 1 - R o ) U 3 + R o ; i f W< R 1i -,返回 X = W;e l s e {产生[ 0 , 1 ] 上的均匀随机数V ;i f f ( W) - f ( R 1) C ( f ( R 1I - ) - f ( R 1) ) V , 返回X = W; e l s e 舍弃W ,重复l o o p ;} }均匀随机数U 2 实际上可由U 1 变换得到, U 3 可由均匀数U2变换得到. 例如从U1 产生U 2 的方法是:当J = l 时, U 1 在[ 0 , P ] 上均匀分布, 故可令U 2 = U l / P ;当J = 2 时, U 1在[ P , 1] 上均匀分布, 故可令U 2 = ( U 1 - P ) / ( 1 - P ) . 从U 2 产生U 3 的方法是:当I = i 时, U 2 在 [ i / K , ( i + l ) / K ]上均匀分布, 故可令U 3 = K ( U 2 - i / K ) . 这样的做法节省了均匀随机数,增加了一些乘法和除法运算.对F P G A 等并行处理的硬件来说,产生均匀随机数是便宜的,除法运算是耗费的,所以我们不提倡减少均匀数的做法. 而对有C P U 的硬件来说, 减少均匀随机数意味着减少了过程调用,也许是值得的. 再介绍预处理过程.各分点需解下列递推方程求得:从i=1开始求解,直至i = K - 1 .这些方程可事先利用软件求解.3.2.3 算法性能分析影响随机数产生速度的主要因素之一是f ( x ) 的计算,故把产生每个抽样平均计算f ( x )的次数 ( 计算概率)做为一个性能指标.另外舍选法的平均效率也作为一个性能指标,这个指标反映了每产生一个随机数所需的均匀数个数.产生每个样点X 需计算f ( x ) 的平均概率P f 可利用全概率公式计算:其中10i i iL L L L ---的分母是左边第i 个曲边梯形的下底长,分子是下底与上底的差,这个比值就是在此曲边梯形内投点时计算f ( x ) 的概率.10i i i R R R R ---的意义相仿. 舍选法的平均效率” 可利用全概率公式计算:11()()11(1)()()L R KK i i L R A i A i P P K B i K B i η===+-∑∑ 诸(),(),(),()L L R R A i B i A i B i 分别表示左边各曲边梯形面积、左边各矩形面积、右边各曲边梯形面积和右边各矩形面积.在不同的K 值下,计算了算法用于产生正态分布、 指数分布、 瑞利分布三种标准分布时的上述两个性能参数.各个概率密度函数如下:正态分布:2())2x f x =- 指数分布:()x f x e -= 瑞利分布: 2()exp()48x x f x =- 结果如下图6 :左图反映出概率密度函 数的计算概率P f 随K 的增大而减小, 最终趋于零,例如当K = 1 0 2 4 时, P f 已 非常小;右图反映出 舍选法的平均效率随K 的 增加而提高, 最终趋于 1 , 也就是三个均匀随机数产生一个预期的随机数.我们可根据实际情况选择合适的K 值.3.3 正态分布的随机数的产生下面提出了一种已知概率密度函数的分布的随机数的产生方法,以典型的正态分布为例来说名任意分布的随机数的产生方法.如果一个随机数序列服从一维正态分布,那么它有有如下的概率密度函数:22()2()x f x μσ--=参考文献:[1] 肖云茹.概率统计计算方法[M].天津:南开大学出版社,1994.[2]程兴新.曹敏.统计计算方法EM3.北京:北京大学出版社,1989.[3]王永德等.随机信号分析基础.北京:电子工业出版社,2 0 0 3.[4]皇甫堪等. 现代数字信号处理. 国防科技大学电子科学与工程学院内部印刷,2 0 0 2.。
1. 编制两种方法产生正态分布随机数的程序并进行验证分析; 编程思路:产生正态分布随机数的两种方法:(1) 统计近似抽样法:a.设{i y }是(0,1)均匀分布的随机数序列,则{}1()0.5y i i i i E y y p y dy μ===⎰1220()()1/12y i y i i y p y dy σμ=-=⎰b.根据中心极限定理,当N →∞时,()()~(0,1)NNi yi Ny k N y x k N μ--==∑∑c.如需产生均值为x μ,方差为2x σ的正态分布随机变量x ,只需如下计算:2~(,)Ni x xx x Ny x N μσμσ-=+∑,试验证明12N =时,x 的统计性质就比较理想了。
(2) 变换抽样法:设12,y y 是两个相互独立的(0,1)均匀分布的随机变量,则新变量1/21121/2212(2log )cos(2)(2log )sin(2)x y y x y y ππ⎧=-⎨=-⎩ 是相互独立的,服从(0,1)N 分布的随机变量。
利用统计近似抽样法和变换抽样法的定义及之前产生(0,1)均匀分布的随机数的基本方法如乘同余法、混合同余法等产生正态分布随机数。
调试过程遇到的问题:(1)在用统计近似抽样法产生正态分布随机数时,给定,μσ,然后用Matlab 自带函数检验结果,感觉数据老对不上?解决方法:自己设定的,μσ分别是均值,标准差,利用Matlab 自带函数mean(),var()计算出来的分别是均值,方差,总觉得方差老对不上,其实是自己理解问题,var()计算出来的方差数值肯定是自己设定的标准差的平方大小左右。
(2)Matlab 下标从1开始;做运算两个矩阵的尺寸大小得对应上,还有调用的值一定得有值。
程序运行结果分析得到的结论:(1)统计近似抽样法:统计近似抽样法(1)统计近似抽样法(2)统计近似抽样法中要用产生的(0,1)序列的12个数的和,但具体哪12个,不太清楚,图(1)是:z(1)用的是x(1)~x(12),z(2)用的是x(2)~x(13),以此类推。
概率论与数理统计小报告(二)_________正态随机数的产生方法
学院数理学院
专业信息与计算科学
班级
姓名
学号
依据中心极限定理产生正态分布随机数
摘要:由中心极限定理可知,当n很大时,具有期望μ,方差σ2的分布近似为标准正态分布,故可据此产生标准正态分布。
并利用Matlab自带的函数对结果进行检验。
关键字:正态分布中心极限定理随机数
正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
若随机变量服从一个位置参数为、尺度参数为的概率分布,记为:
则其概率密度函数为
正态分布的数学期望值或期望值等于位置参数,决定了分布的位置;其方差的开平方或标准差等于
clc,clear
for i=1:1000
R=rand(1,12);
X(i)=sum(R)-6;
end
X=X';
m=mean(X)
v=var(X)
subplot(1,2,1),cdfplot(X) %绘制经验累计分布函数图,显示了一维向量X的累计概率分布F(x)的图形subplot(1,2,2),histfit(X) %绘制分组数据的柱状分布函数图,即频数图
h=kstest(X, [X normcdf(X, 0,1)])% H = kstest(X)执行Kolmogorov-Smirnov检验标准正态分布比较数据向量x的值。
零假设是x为标准的正态分布;另一种假设是x不是标准正态分布。
在5%显著水平进行检验,若结果h为1,则说明零假设不成立,拒绝零假设。
否则,结果为0,零假设成立,即原分布为标准正态分布
运行结果如下:
h =
0 (检验表明分布为标准正态分布)
R = (产生的一组12个【0,1】上均匀分布的随机数)
Columns 1 through 4
0.5700 0.4027 0.3702 0.0801
Columns 5 through 8
0.3389 0.2411 0.8556 0.7063
Columns 9 through 12
0.5685 0.0696 0.0455 0.3958
下图为i=1000,即进行1000次抽样分布的结果。
根据中心极限定理,【0,1】分布的极限分布为正态分布,下面做下检验:当i=10时,图像如下:
当i=100时,图像如下:
与正态分布有相似处,但差别还是比较大的。
当i=1000时,如下图,与正态分布就已经很接近了。
特别地,当i=10000时,如下图,与正态分布曲线已经很吻合了。
但是需注意:
这个问题中我们使用的函数为rand随机数发生器,其实matlab中的随机函数并不是真正意义上的随机函数,而是按照一定的递推规则产生的伪随机数。
但是在一定的可信度范围内,可以认为是真正的随机数。
参考文献:
[1] 范玉妹汪飞星王萍李娜编《概率论与数理统计》机械工业出版社2011年版
[2] 王青霞编著《概率论与随机过程:理论、历史及应用》清华大学出版社2012.03
[3] 张帼奋主编《概率论、数理统计与随机过程》浙江大学出版社2011.07
[4] 王正盛编著《Matlab与科学计算》国防工业出版社2011
[5] 李刚编著《Matlab函数速查手册》清华大学出版社2011
[6] Matlab帮助文档;
[7] 百度文库。
感想:
与上次写偏应用性的球队胜率计算类似,这次的论文是要求写随机数的产生方法。
通过多方查找资料以及对课本中关于中心极限定理的深入学习和理解,我终于完成了这篇论文。
这两次报告的写作,加深了我对书本知识的理解,而且在查找资料的过程中,我又不断学习着新知识,并且,知道了怎么去运用已学
知识。
掌握了一种理论,但要把它运用到实践中还需要相当多的尝试,并且,实现的方法不唯一。