伯努利分布参数p 的区间估计_F 分布法
本文基于Wolfram Mathematica 9,在证明伯努利分布与二项分布的关系、
二项分布与F 分布关系的基础上,给出了伯努得分布参数p 的经典等尾置信区间和区间长度,以及最短置信区间和区间长度的求法,并通过程序实现。
定理一:n 个独立同伯努利分布B p 的和服从二项分布B n,p :
CharacteristicFunction BinomialDistribution n,p ,t
CharacteristicFunction BernoulliDistribution p ,t n
1 p t p
n 1 p t p
n
0定理二:二项分布B n,p 与F 分布F n 1,m 的分布函数分别记为F B n,p k 和F F n 1,m x ,则有F B n,p k F F 2 n k ,2 k 1
。
In[101]:=Assuming n 0&&0 p 1&&k Integers &&0 k n,CDF BinomialDistribution n,p ,k
Assuming n 0&&0 p 1&&k Integers &&0 k n,
CDF FRatioDistribution 2 n k ,2 k 1 ,k 1n k 1 p
p FullSimplify FullSimplify ,k Integers &&0 k n &&0 p 1
Out[101]=BetaRegularized 1 p,n Floor k ,1 Floor k 0 k n 1k n
0True
Out[102]=
BetaRegularized 1 p, k n,1 k 1 k k n 1 p p 00True Out[103]=0
推论:由F 分布的性质知F F Α,Β p 1
F Β,Α
,
从而得F B n,p k F F
2 n k ,2 k 1
1 F F
2 k 1 ,2 n k 。伯努利分布B p 参数p 的经典置信区间:
设X 1,X 2, ,X n 为伯努利分布B p 总体的一个i.i.d.n 为样本容量,
k i 1n
X i 为成功数,根据定理一,知k B n,p 。
参数p 的置信水平为1 Α的经典等尾置信区间的下限和上限由F B n,p k 1
1 Α Β和F B n,p k Β决定,其中0 Β Α。根据定理二及其推论,得到
F B n,p k 1
1 第一章 多元正态分布的参数估计 一、填空题 1.设X 、Y 为两个随机向量,对一切的u 、v ,有 ,则称X 与Y 相互独立。 2.多元分析处理的数据一般都属于 数据。 3.多元正态向量()' =p X X X ,,1 的协方差阵∑是 ,则X 的各分量是相互独立的随机变量。 4.一个p 元函数() p x x x f ,,,21 能作为p R 中某个随机向量的密度函数的主要条件是 和 。 5.若p 个随机变量1X ,2X , ,p X 的联合分布等于 ,则称1X , 2X , ,p X 是相互独立的。 6.多元正态分布的任何边缘分布为 。 7.若()∑,~μp N X ,A 为p s ?阶常数阵,d 为s 维常数向量,则~d AX + 。 8.多元正态向量X 的任何一个分量子集的分布称为X 的 。 9.多元样本中,不同样品的观测值之间一定是 。 10.多元正态总体均值向量和协差阵的极大似然估计量分别是 。 11.多元正态总体均值向量μ和协差阵∑的估计量X 、 S n 1 1-具有 、 和 。 12.设X 和S 分别是多元正态总体()∑,μp N 的样本均值向量和离差阵,则 ~X ,X 和S 。 13.若()()∑,~μαp N X ,n ,,2,1 =α且相互独立,则样本离差阵 ()()()()∑='--=n X X X X S 1~ααα 。 14.若()∑,~i p i n W S ,k i ,,1 =,且相互独立,则~21k S S S S +++= 。 二、判断题 1.多元分布函数()x F 是单调不减函数,而且是右连续的。 2.设X 是p 维随机向量,则X 服从多元正态分布的充要条件是:它的任何组合()p R X ∈'αα都是一元正态分布。 3.μ是一个P 维的均值向量,当A 、B 为常数矩阵时,具有如下性质: (1)E (AX )=AE (X ) (2)E (AXB )=AE (X )B 4.若P 个随机变量X 1,…X P 的联合分布等于各自边缘分布的乘积,则称X 1,… X P 是相互独立的。 5.一般情况下,对任何随机向量()'=X X X p ,,1 ,协差阵∑是对称阵,也 是正定阵。 6.多元正态向量()'=X X X p ,,1 的任意线性变换仍然服从多元正态分布。 7.多元正态分布的任何边缘分布为正态分布,反之一样。 8.多元样本中,不同样品之间的观测值一定是相互独立的。 9.多元正态总体参数均值μ的估计量X 具有无偏性、有效性和一致性。 10. S n 1是∑的无偏估计。
思考与练习 2.1 试述多元联合分布和边缘分布之间的关系。 2.2 设随机向量12(,)X X ′=X 服从二元正态分布,写出其联合分布密度函数和1X 、2X 各自的边缘密度函数。 2.3 已知随机向量12(,)X X ′=X 的联合分布密度函数为: ()()()()()()()()() 121122 2 22,d c x a b a x c x a x c f x x b a d c ??+?????2???? = ?? 其中,。求: 12,a x b c x d ≤≤≤≤⑴ 随机变量1X 和2X 各自的边缘密度函数、均值与方差。 ⑵ 随机变量1X 和2X 的协方差和相关系数。 ⑶ 判断1X 和2X 是否相互独立。 2.4 设随机向量12(,,,)p X X X ′=X L 服从正态分布,已知其协差阵为对角阵,证明ΣX 的分量是相互独立的随机变量。 2.5 从某企业全部职工中随机抽取一个容量为6的样本,该样本中各职工的目前工资、受教育年限、初始工资和工作经验资料如下表所示: 职工编号 目前工资 (美元) 受教育年限(年) 初始工资 (美元) 工作经验(月) 1
1 2 3 4 5 6 57,000 40,200 21,450 21,900 45,000 28,350 15 16 12 8 15 8 27,000 18,750 12,000 13,200 21,000 12,000 144 36 381 190 138 26 设职工总体的以上变量服从多元正态分布,根据样本资料求出均值向量和协差阵的最大似然估计。 2.6 均值向量和协差阵的最大似然估计量具有哪些优良性质? 2.7 试证多元正态总体的样本均值向量(,)p N μΣ1 ~(, p N n X μΣ)。 2.8 试证多元正态总体的样本协差阵S 为(,)p N μΣΣ的无偏估计。 2.9 设()1x 、()2x 、…、()n x 是从多元正态总体中独立抽取的一个随机样本,试求样本协差阵的分布。 (,)p N μΣS 2.10 设()i i X n p ×是来自(),p i i N μΣ的数据阵,1,,i k =L , ⑴ 已知1k ===μμμL 且1k ===ΣΣL Σ,求μ和的估计。 Σ⑵ 已知1k ===ΣΣL Σ,求1,,k μμL 和Σ的估计。 2
货币效用函数辨析 内容摘要:货币的边际效用递减理论源自于著名数学家Daniel Bernoulli(1738)为解决“圣彼得堡悖论”而提出的效用函数解决方案。然而,王文辉在《圣彼得堡悖论新解与不确定性估值》中证明了Bernoulli的效用函数解决方案是不成立的,因此,货币的边际效用递减是颇值得怀疑的。本文对传统效用理论进行了更深入的分析和阐述,得到了一个效用函数族,并且首次提出了“效用阈限漂移”现象。进而通过理论和实验两方面证明了货币的边际效用并非是单调递减的,而且效用函数与人们的风险偏好没有任何关系,从而纠正了微观金融经济学基础理论中长期存在的误区,为新的研究开辟了方向。 关键词:边际效用,效用函数,风险偏好,风险厌恶 1.传统效用及效用函数理论回顾 1.1贝努利与圣彼得堡悖论――最初的肇始 著名数学家丹尼尔.贝努利(Bernoulli, D. 1738)于1738年提出了货币的边际效用递减理论,其目的在于解决“圣彼得堡悖论”。“圣彼得堡悖论”来自于一种掷币游戏,即圣彼得堡游戏。设定掷币掷出正面为成功,游戏者如果第一次投掷成功,得奖金2元,游戏结束;第一次若不成功,继续投掷,第二次成功得奖金4元,游戏结束;这样,游戏者如果投掷不成功就反复继续投掷,直到成功,游戏结束。如果第n次投掷成功,得奖金2n元,游戏结束。由于各个结果之间是相互独立的,因此游戏的期望收益为所有可能结果的得奖期望值之和: 1111 ()2482 2482n n E=?+?+?++?+ 这是无数个1求和,等于无穷大。由于游戏的次数没有限制,该游戏的数学期望值是无限的。问题是人们对于参加这样一个理论上收益的数学期望无穷大的‘游戏’会支付多少费用呢?试验表明,大多数人只准备支付几元参加这一游戏。人们对参与这种游戏所愿支付的有限费用与其无穷数学期望之间的矛盾就构成了所谓的“圣彼得堡悖论”。 贝努利对于这个问题给出一种解决办法,他认为人们真正关心的是货币的效用而非它的价值量;而且额外货币增加提供的额外效用,会随着奖励的价值量的增加而减少,即后来广为流传的“货币边际效用递减律”。 贝努利将货币的效用测度函数用货币值的对数来表示,从而所有结果的效用
伯努利分布参数p 的区间估计_F 分布法 本文基于Wolfram Mathematica 9,在证明伯努利分布与二项分布的关系、 二项分布与F 分布关系的基础上,给出了伯努得分布参数p 的经典等尾置信区间和区间长度,以及最短置信区间和区间长度的求法,并通过程序实现。 定理一:n 个独立同伯努利分布B p 的和服从二项分布B n,p : CharacteristicFunction BinomialDistribution n,p ,t CharacteristicFunction BernoulliDistribution p ,t n 1 p t p n 1 p t p n 0定理二:二项分布B n,p 与F 分布F n 1,m 的分布函数分别记为F B n,p k 和F F n 1,m x ,则有F B n,p k F F 2 n k ,2 k 1 。 In[101]:=Assuming n 0&&0 p 1&&k Integers &&0 k n,CDF BinomialDistribution n,p ,k Assuming n 0&&0 p 1&&k Integers &&0 k n, CDF FRatioDistribution 2 n k ,2 k 1 ,k 1n k 1 p p FullSimplify FullSimplify ,k Integers &&0 k n &&0 p 1 Out[101]=BetaRegularized 1 p,n Floor k ,1 Floor k 0 k n 1k n 0True Out[102]= BetaRegularized 1 p, k n,1 k 1 k k n 1 p p 00True Out[103]=0 推论:由F 分布的性质知F F Α,Β p 1 F Β,Α , 从而得F B n,p k F F 2 n k ,2 k 1 1 F F 2 k 1 ,2 n k 。伯努利分布B p 参数p 的经典置信区间: 设X 1,X 2, ,X n 为伯努利分布B p 总体的一个i.i.d.n 为样本容量, k i 1n X i 为成功数,根据定理一,知k B n,p 。 参数p 的置信水平为1 Α的经典等尾置信区间的下限和上限由F B n,p k 1 1 Α Β和F B n,p k Β决定,其中0 Β Α。根据定理二及其推论,得到 F B n,p k 1
练习一 多元正态分布的参数估计 1.试叙述多元联合分布和边际分布之间的关系。 2.设二维随机向量12()X X '服从二元正态分布,写出其联合分布。 3.已知随机向量1 2()X X '的联合密度函数为 12121222 2[()()()()2()()] (,)()()d c x a b a x c x a x c f x x b a d c --+-----= -- 其中1a x b ≤≤,2c x d ≤≤。求 (1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数; (3)判断1X 和2X 是否相互独立。 4.设12(,,)p X X X X '= 服从正态分布,已知其协方差矩阵∑为对角阵,证明其分量是相互独立的随机变量。 5. 影响粮食产量的因素很多, 大致可分为三个层次:第一层次是宏观因素。主要有三种,一是制度创新, 如20世纪50年代初的土地改革、60年代初的“ 三自一包”和 80年代初的联产承包责任制和现行的粮食直补及税费改革等。二是政策导向, 如收购政策及价格、市场政策结构调整、储备政策、财政投人、政府抓粮食生产的力度等。三是科技进步,如良种的培育、播种技术的改进、机械化程度的提高等等, 特别是杂交水稻的发明, 是粮食生产的一次绿色革命, 大大地提高了粮食单位面积产量。第二层次是中观因素。主要有粮食播种面积、单位面积产量、受灾面积等等, 这些因素是影响粮食产量的直接因素。第三层次是微观因素, 主要有有效灌溉面积、化肥施用量、农业机械化程度、财政三项投入等。为了分析粮食产量的影响因素及其影响程度,将用1978一2007年的统计数据进行分析。其中:Y 是粮食产量(万吨),X1是农业化肥试用量(万吨),X2是粮食播种面积(千公顷),X3是成灾面积(千公顷),X4是农业劳动力(万人),X5是农业机械总动力(万千瓦)。
第七章参数估计练习题 一.选择题 1. 估计量的含义是指() A. 用来估计总体参数的统计量的名称 B. 用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体取值 2.一个95%的置信区间是指() A. 总体参数有95%的概率落在这一区间内 B. 总体参数有5%的概率未落在这一区间内 C. 在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数。 D. 在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数。 %的置信水平是指() A. 总体参数落在一个特定的样本所构造的区间内的概率是95% B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95% C.总体参数落在一个特定的样本所构造的区间内的概率是5% D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5% 4. 根据一个具体的样本求出的总体均值的95%的置信区间() A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C. 一定包含总体均值 D.要么包含总体均值,要么不包含总体均值 5. 当样本量一定时,置信区间的宽度() A.随着置信水平的增大而减小 B. .随着置信水平的增大而增大 C.与置信水平的大小无关D。与置信水平的平方成反比 6. 当置信水平一定时,置信区间的宽度() A.随着样本量的增大而减小 B. .随着样本量的增大而增大 C.与样本量的大小无关D。与样本量的平方根成正比 7. 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与 总体参数的离差越小越好。这种评价标准称为() A.无偏性 B. 有效性 C. 一致性 D. 充分性 8. 置信水平(1-α)表达了置信区间的() A.准确性 B. 精确性 C. 显着性 D. 可靠性 9. 在总体均值和总体比例的区间估计中,边际误差由()A.置信水平决定 B. 统计量的抽样标准差确定 C. 置信水平和统计量的抽样标准差 D. 统计量的抽样方差确定 10. 当正态总体的方差未知,且为小样本条件下,估计总体均值使用的分布是() A.正态分布 B. t 分布 C.χ2分布 D. F分布
一、常见数据类型 在正式的解释分布之前,我们先来看一看平时遇到的数据。数据可大致分为离散型数据和连续型数据。 离散型数据 离散型数据顾名思义就是只取几个特定的值。例如:当你掷骰子的时候,结果只有1,2,3,4,5,6,不会出现类似1.5,2.5。 连续型数据 在一个给定的范围内,连续型数据可以取任意值。这个范围可以是有限的或者是无穷的。例如:一个人的体重或者身高,可以取值54kg,54.4kg,54.33333kg等等都没有问题。 下面就开始介绍分布的类型。 二、分布类型 伯努利分布(Bernoulli Distribution) 首先从最简单的分布开始,伯努利分布实际上是一个听起来最容易理解的分布。伯努利分布一次实验有两个可能的结果,比如1代表success及0代表failure。随机变量X X一个取值为1并代表成功,成功概率为p p,一个取值为0表示失败,失败概率为q q或者说1?p1?p。 这里,概率分布函数为p x(1?p)1?x px(1?p)1?x,其中x∈(0,1)x∈(0,1),我们也可以写成如下形式: P(x)={1?p,p,x=0x=1P(x)={1?p,x=0p,x=1 成功和失败的概率没必要相同,也就是没必要都是0.5,但是这俩概率加和应该为1,比如可以是下面的图: