当前位置:文档之家› 概率统计实验

概率统计实验

概率统计实验
概率统计实验

§ 13.6 概率统计实验

[学习目标]

1. 会用Mathematica 求概率、均值与方差;

2. 能进行常用分布的计算;

3. 会用Mathematica 进行期望和方差的区间估计;

4. 会用Mathematica 进行回归分析。

概率统计是最需要使用计算机的领域,过去依靠计算器进行统计计算,由于计算机的普 及得以升级换代。本节介绍 Mathematica 自带的统计程序包,其中有实现常用统计计算的各 种外部函数。

一、样本的数字特征

1. 一元的情况

Mathematica 的内部没有数理统计方面的功能,但是带有功能强大的数理统计外部程序, 由

多个程序文件组成。它们在标准扩展程序包集的 Statistic 程序包子集中,位于目录

D : \Mathematica\4.0\AddOns\StandardPackages'Statistics

下。通过查看Help ,可以找到包含所需外部函数的程序文件名。

在程序文件DescriptiveStatistics.m 中,含有实现一元数理统计基本计算的函数,常用的 有: 实际上程序文件中的函数很多,这里只列出了最常用的函数,其它计算函数可以通过Help 浏览。

例1 给出一组样本值:6.5,3.8,6.6,5.7, 6.0, 6.4,5.3,计算样本个数、最大值、

最小值、均值、方差、标准差等。

解:In[1]: = << Statistics 'DescriptiveStatistics'

SampleRa nge[data]

Media n[ data]

Mea n[data] Varia nce[data] Sta ndardDeviatio n[data] Varia nceMLE[data]

Sta ndardDeviatio nMLE[data] 求表data 中数据的极差(最大数减最小数) 求中值。 1 n

求平均值-X i 。

n i 1

求方差(无偏估计)

求标准差(无偏估计)

求方差-° (X i X)2。

n i 1 求标准差J 1 (X i X)2 n i 1

概率统计实验

In[2]: =data = {6.5, 3.8, 6.6, 5.7, 6.0, 6.4, 5.3}; In[3]: =Length[data]

Out[3]=7 In[4]: =Mi n[data]

Out[4]= In[5]: =3.8

=Max[data]

Out[5]= In[6]: Out[6]

=6.6

=SampleRa nge[data]

=2.8

In[7]: =Media n[ data]

Out[7]=

In[8]: =6. =Mea n[data] Out[8]=

=5.75714

In[9]: =Varia nce[data]

Out[9]= =0.962857 In[10]: =StandardDeviation[data]

Out[10]= 0.981253

In[11]: =VarianceMLE[data]

Out[11]= 0.825306

In[12]: = StandardDeviationMLE[data]

Out[12]= 0.908464

说明:在上例中,In [1]首先调入程序文件,求数据个数、最大值和最小值使用内部函数。

2. 多元的情况

在程序文件 MultiDescriptiveStatistics.m 中,含有实现多元数理统计基本计算的函数,常 用的有:

求表data 中数据的极差。 求中值。 求平均值。 求方差(无偏估计)。 求标准差(无偏估计)。 求方差。 求标准差。 求x ,y 的协方差(无偏估计)

(X i x)(y i y)。SampleRa nge[data]

Media n[ data]

Mea n[data]

Varia nce[data]

Sta ndardDeviatio n[data]

Varia nceMLE[data]

Sta ndardDeviatio

nMLE[data]

Covariance[xlist ,ylist]

CovarianceMLE[xlist , ylist]

Correlation[xlist , ylist]

求 x , y 的相关系数

n n 2 " 2

(X i x)(y i y)/ (X i x)

(y i y)。 i 1 i 1 i 1

实际上程序文件中的函数很多,这里只列出了最常用的函数,其它计算函数可以通过Help 浏览。

例2 给出 4 个样本值:{1.1,2.0,3.2},{1.3,2.2, 3.1},{1.15,2.05, 3.35},{1.22,

2.31,

3.33},计算样本个数、均值、方差、标准差等。

解:In[1]: = << Statistics 'MultiDescriptiveStatistics '

In[2]: = data = {{1.1,2.0,3.2},{1.3,2.2,3.1},

{1.15,2.05,3.35},{1.22,2.31,3.33}};

Len gth[data]

Out[3]=4

ln[4]: =SampleRange[data]

Out[4]= {0.2,0.31,0.25}

ln[5]: =Median[data]

Out[5]= {1.185,2.125,3.265}

ln[6]: =Mean[data]

Out[6]= {1.1925,2.14,3.245}

ln[7]: =Variance[data]

Out[7]= {0.00755833,0.0200667, 0.}

In[8]: =VarianceMLE[data]

Out[8]= {0.00566875,0.01505, 0.010325}

ln[9]: =CentralMoment[data , 2]

Out[9]= {0.00566875 , 0.01505, 0.010325}

ln[10]: =x=data[[All , 1]] ; y=data[[All , 2]];

z=data[[AII , 3]];

ln[11]: =Covariance[x , y]

求x , y 的协方差 (X i

i 1 X)(y i y)

Out[11]=0.0093

ln[12]: =Covariance[z, z]

Out[12]=0.

ln[13]: =CovarianceMLE[y , y]

们使用以上的分布表达式作为一个参数

常用的求值函数有: Domain[dist]

PDF[dist ,x]

CDF[dist ,x]

Quantile[dist , q]

Mean[dist]

Variance[dist]

StandardDeviation[dist]

ExpectedValue[f , dist , x]

CharacteristicFunction[dist ,t]

Random[dist]

RandomArray[dist ,dims] 例3 求 dist 的定义域。 求点 x 处的分布 dist 的密度值。 求点 x 处的分布函数值。 求 x ,使 CDF[dist , x]达到 q 。 求分布dist 的期望。 求方差。 求标准差。 求 Ef ( x )。 求特征函数? (t )。 求具有分布dist 的伪随机数。 求维数为 dims 的伪随机数的数组 In[1]: =<< Statistics 'DiscreteDistributio ns'

In[2]: = b=BinomialDistribution[n , p] In[14] :=Correlation[y ,z]

Out[14]=0.

In[15] :=Correlation[x ,x]

Out[15]=1.

二、 常用分布的计算

在计算机出现以前, 统计计算总是依赖一堆函数表。 使用本节介绍的函数可以取代查表, 为实现各种统计计算的自动化做好了底层准备工作。

1. 离散分布

程序文件 DiscreteDistributions.m 中,含有用于离散分布计算的函数。其中常用的离散分 布有:

BernoulliDistribution[p]

BinomialDistribution[n , p]

GeometricDistribution[p]

HypergeometricDistribution[n , M , N]

PoissonDistribution[入] 贝努利分布。 二项分布。 几何分布。 超几何分布。 泊松分布。

DiscreteUniformDistribution[n] NegativeBinomialDistribution[n , p] 离散的均匀分布。 负二项分布。

以上函数中的参数,既可以是数值的,也可以是符号的。使用这些函数只能按用户给出 观察下面二项分布的各种基本计算

相关主题
文本预览
相关文档 最新文档