当前位置:文档之家› 随机变量模型的确定

随机变量模型的确定

随机变量模型的确定
随机变量模型的确定

第十一章 随机变量模型的确定

11.1 随机变量模型的确定

三种情形:①. 随机变量分布的类型已知, 需要由观测数据确定该分布的参数 ②. 由观测数据确定随机变量概率分布类型, 并在此基础上确定其参数

③. 由已有的观测数据难以确定该随机变量的理论分布形式, 则定义一个实验分布 1 分布参数的确定 分布参数的类型 (1) 位置参数(记为γ)

确定分布函数取值范围的横坐标。当γ改变时, 相应的分布函数仅仅向左或

向右移动而不发生其它变化, 因而又称为位移参数。

例如, 均匀分布函数U(a,,b ), 其密度函数为:

图11.1 均匀分布U(a, b )

的密度函数

1/ (

f x b a a x b

()=-≤≤

?????1

0其它

其中参数a定义为位置参数, 当a改变时(保持b a

-不变), f x()向

左或向右移动。

(2) 比例参数(记为β):决定分布函数在其取值范围内取值的比例尺。

β的改变只压缩或扩张分布函数, 而不会改变其基本形状。

例如, 指数分布函数EXPO(β), 其密度函数为:

f x e x

x

()

/

=

≥?

?

?

??

-

1

β

β

其它

(3) 形状参数(记为α):确定分布函数的形状, 从而改变分布函数的性质,

例如, 韦伯分布Weibull(αβ,), 其密度函数为: f x x e x

x

()

(/)

=

>

?

?

?

??

--

αβααβα

110

0其它

图11.2 指数分布EXPO(β)

的密度函数

当α改变时, 其形状发生很大的变化。

随机变量X Y ,, 如果存在一个实数γ, 使X 与Y 具有相同的分布,

则称

X

与Y 仅仅是位置上不同变量; 如果对于某个正实数β, 使得

βX 与Y 具有相同的分布, 则称X 与Y 仅仅是比例尺不同的随机变量;

如果γβ+X 与Y 具有相同的分布, 则称X 与Y 仅在位置与比例上不

同。

2. 分布参数的估计 最大似然估计: 设参数θ, 观测数据为x x x n 12,,,

在离散分布情形, 可令P x θ

()为该分布的概率质量函数, 定义似然函数L ()θ为:

L P x P x P x n ()()()...()θθθθ=12

则L ()θ是联合质量函数, θ的最大似然估计值

θ是使L ()θ取最大值的θ, 即对于所有可能的θ值,

图11.3 韦伯分布Wilbull(αβ,)

)()((θθL L ≥

在连续分布情形, 令)(x f θ为该分布的概率密度函数, 其似然函数定义为)(θL :

)()...()()(21n x f x f x f L θθθθ=

例:指数分布, 被估计的参数θββ=>()0, 其分布密度函数为f x e x βχ

β

()/=-1

L e e e x x x x n

i n

i n ()exp ///ββββββ

βββ=?? ????? ????? ???=-?? ?

?

??----=∑

1111121

为求使L ()β取最大值的

β, 先对

L ()β取自然对数:

R L n x i n

i ()ln ()ln βχββ==--

=∑

1

1

由于R L ()ln ()ββ=是严格递增的,

L ()β取最大值等价于R ()β取最大值, 为此, 对R ()β求极值:

dR d n x i n

i βββ

=-+==∑

1021

可得

β=

==∑

i n

i x n x n 1

/()

又由

d R

d n

x i n

i 22

2

3

1

2

β

β

β

=

-

=∑

当β=x n ()时, 由于x i 为正, 可见

d R d 22

<, 因而β

=x n ()为最大值, 从而得到参数β的最大似然估计值为

β^

()/===∑x n x n i n

i 1

11.2 分布类型的假设

由观测数据来确定随机变量的分布类型----对观测数据进行适当的预处理, 然后根据预处理的结果对分布

类型进行假设。 1. 连续分布类型的假设

预处理方法有三种, 即点统计法、直方图法及概率图法。

(1) 点统计法: 基于连续分布的变异系数特征来进行分布类型的假设。变异系数的定义是:

δ=Var x E x ()/() 其中Var ()x 与E ()x 分别为分布的方差与均值。

点统计法对观测数据进行如下预处理: x n x n i n

i ()/=

=∑

1

[]S n x

x n n i n

i

21

2

1()()/()=

--=∑

则δ的似然估计为:

δ=S n x n 2

()/()

然后根据

δ值并参照各类分布的变异数据δ来假设观测数据的分布类型------粗

(2) 直方图法

将观测数据x x x n 12,,, 的取值范围分成k 个断开的相邻区间[)[)b b b b 0112,,, , [) ,, b b k k -1, 每个区

间宽度相等, 记为?b b b j j =--1 (,,,)j k =12 。

对任意j ,设n i 为第j 个区间上观测点的个数, 记g n n i j =/ (,,,)j k =12

定义函数 h x x b g b x b x x

i j i

k ()=<≤<≤???

??

-0001

做出h x ()的直方图, 再将该图与基本理论分布的密度

函数图形进行比较(先忽略位置及比例尺的差别), 观察何种分布与h x ()的图形类似, 则可假设观测数据

x x x n 12,,, 服从该类型分布,然后再采用前面介绍的

方法确定其参数。

在实际使用时, 可能需要增加一些其值特别大或特别

小的观测数据,以便与理论分布进行比较。

使用直方图法的困难在于如何确定区间长度?b 。?b 太大, 将丢失信息, ?b 太小, 则观测数据中的噪声

滤除得不够(一般观测数据中总是存在一定的噪声)。

0.20

0.15

0.10

0.05

(3) 概率图法

直方图法:将观测数据的直方图与理论分布的密度函数进行比较

概率图法:将观测数据定义成一个实验分布函数, 然后将它与理论分布函数进行比较后再进行假设

设观测数据x x x n 12,,, 共有m 个取值(m n ≤, 因为可能存在取值相同的观测点), 分别记为

x (1),

x (2), …,

x m (), 实验分布函定义为:

[]n

n i x F i /)(=(,,,)i m =12

其中n i 表示小于或等于

x i ()的观测数据的个数, 且n n m =。

为了避免由有限个观测数据得到的实验分布函数值等于1, 对上式可略加修正, 可采用下式来定义:

[]~

()(.)/F x i n n n i =-05

概率图法采用所谓“分位点”比较法:

定义:分布函数的分位点为: 设01<

=-1()称为F x ()的分位点。

如果F x ()与G y ()都是分布函数, 分别取不同的g 值, 相应得到不同的(x y g g ,), 若F x ()与G y ()

是相同的分布函数, 则由(x y g g ,)形成的轨迹是斜率为45?的直线。

反过来说,如果由两个分布函数F x ()与G y ()按相同的一组g 值求得各自的分位点x y g g ,, 在

xoy 平

面上确定(,)x y g g 的轨迹, 若该轨迹是一条斜率为45?的直线, 则可以确认F x ()与G y ()的分布是相同的。

为了假设[]~()(.)/F x i n n g i i =-=05

的分布类型, 可取[]~

()F x i 的分位点为x i (), 分别对应[]~()F x i 的值为g i , 然后从基本理论分布中选择一种, 按g i 分别求得其分位点y i , 然后在xoy 平面上画出()x i y i (), 的轨迹, 观察是否是斜率为45?的直线, 若比较接近, 则可假设观测数据的分布类型与所选分布的类型相同。

有时, ()x i y i (), 的轨迹虽然呈直线形状, 但斜率却不是45?, 这说明这两个分布的类型是相同的, 只是位置参数和(或)比例参数不同, 那么可对x i ()进行如下下变换:

)('i x y i β+γ=

得到的()

i y i x '),(的轨迹必然是斜率为45?的直线。这就说明, 只要分位点()x i y i (), 的轨迹接近直线, 不管其斜率如何, 观测数据的分布与所选分布的类型是相同的。

概率图法只需要判断分位点轨迹偏离线性度的程度, 不会对观测数据造成信息丢失。

3 实验分布------难以由观测数据确定一个理论分布

原始观测数据为单个数据:x x x n 12,,, ,先将该n 个数据按递增顺序排列。由于可能有相同值的数据,

经排序后得到x (1),

x (2), …, x m (), (m n ≤),该观测数据的实验分布可由下式来定义:

F x x x i n n x x j x j x j x j x x j j m x x n

()()

()()()()()(,,,)

=<--+

--+-≤<+=>?

????

??011

11111121

观测数据是分组数据:即不知道观测数据的数值, 而仅知道该n 个数据分布在m 个相邻区间[)a a 01,,

[)a a 12,, …, [)a a m m -1,上及每个区间上数据的个数。记第

j 个区间上的个数为n j m j (,,..)=12, 则

n n n n m 12+++=..., 实验分布函数的表达式为:

F x x a n n n n x a a a a x a j m

x a i k i

j j j j j j

m

(),,,=<+

--≤<=≥?

?????

???

=----∑

012101

111

1

11.3 拟合优良度检验

由观测数据假设了其分布的类型并估计出其参数以后, 一般需要检验该分布与这些观测数据吻合的程度,

即进行拟合优良度检验。 1 χ2检验

将该拟合分布的取值范围分为K 个相等子区间[)a a 01,, [)a a 12,, …, [)a a k k -1,, 其中可能a 0=-∞, 或/

a k =+∞, 然后计算:

P f x dx j a a j j

=

-?

1

() (,,,)j K =12 ,其中 ()f x 是拟合的分布密度函数。

对离散情形, )(?}

:{1i a x a I j x P P j i j ∑

<≤-= (,,,)j K =12 ,其中 ()P x j

是拟合分布的质量函数。 χ2检验的步骤可概括如下:

(1) 分别计算每个区间上观测数据的个数j N (,,,)j K =12 , 记i K

j N n =∑=1

(2) 计算按拟合分布得到的期望个数, 即nP j (,,,)j K =12 (3) 计算χ

2

检验的统计值:

χ21

2

=-=∑

j K

j j j

N nP nP ()

(4) 结果判断 首先要规定检验水平a , 如果拟合分布中有m 个参数是从观测数据按最大似然估计得到

的, 则可以证明, 当n →∞时, χχχK m a a K a ------≤≤11212112,,

进行χ2

检验时, 区间的确定将影响检验的效能。为了使检验无偏, 要求按P j 基本相等来确定区间, 即所

选区间[)

a a j j -1, (,,,)j K =12 , 使P P P K 12=== 。另外, 根据经验, 区间的个数宜在30~40以下, 并能使

nP j ≥5, 以提高检验的有效性。在离散分布的情形下, 不可能保证P j 完全相等, 但应使P j 的值尽可能接近。

2 柯尔莫哥洛夫-斯米尔洛夫(K-S 检验)

χ2检验的困难: 按P j 相等来确定[)a a j j -1,时要对 ()F

x 进行逆运算, 而在某些情况下, 求 ()F x 的逆运算比较困难, 或者 ()F

x 无封闭形式无法求 ()F x 的逆运算; 当n 较小时, P n j ≥5/的值较大, 从而得到的区间过大, 结果造成观测数据的信息丢失。 K-S 检验:将拟合的分布函数 ()F x 与由观测数据定义的实验分布函数)x (F ~进行比较。 设观测数据为x x x n 12,,, , 观测数据的实验分布函数)x (F ~

采用如下定义:

()()F x x x n

n i =≤数据的个数 (对所有x )

这样, )x (F ~

是右连续的阶跃函数。

K-S 检验规则:根据)x (F ~与 ()F x 的接近程度来决定是否拒绝原假设H 0。评价接近程度的指标是采

用)x (F ~与 ()F x 之间的最大距离D n :{}D F x F x n x

n =-sup ~()~()

若D n 超过规定的常数α-1,n d (其中α是要求的检验水平),则拒绝H 0, 否则不拒绝H 0。

问题:对于不同的分布, d n 的值是不同的; 即使是同一分布, 不同的α下α-1,n d 也不相同, 而且尚无通用的表

可查。

1. 指数分布EXPO ( )β: ε->??? ??++??? ?

?-15.026.02.0d n n n D n

若成立, 则拒绝H 0, 其中α-1d 的值为;

2. 正态分布N ( , )μσ 2

α->??? ?

?

+-185.001.0d D n n n 若成立, 则拒绝H 0, 其中α-1d 的值为:

习题

(1)利用K-S检验法检验下列样本是否符合均值为0.0、方差为2.5的正态分布。检验水平为α=0.05。

1.549422

2.444344 -1.356287 -1.158468 1.986288

-1.317650 1.203433 -2.405187 -0.983101 -0.942457

2.627202 2.295194 0.253501 0.256372 -1.221426

-2.819277 2.729291 1.374238 -0.028606 0.940219

-1.100076 -2.032944 -1.105679 1.694956 0.019935

(2)若有一批样本数为50的三极管,其放大倍数β值分别为:

34.7 56.2 38.4 54.1 57.4 51.7 60.6 67.7 78.1 38.2

49.2 42.8 45.2 53.4 80.4 97.4 84.5 65.3 66.4 73.4

61.1 68.4 69.4 81.3 74.4 36.3 47.2 52.4 69.2 89.7

76.6 67.3 66.2 59.8 59.2 63.2 38.4 44.6 70.1 28.1

52.3 44.5 46.4 64.4 66.4 54.2 78.8 62.0 32.4 48.5

设β为随机变量X,X的取值范围为(0,100),试计算其均值和方差,且用直方图法确定该随机变量的分布类型,并对其进行α=0.10水平的χ2检验。

随机变量及其分布列概念公式总结

随机变量及其分布总结 1、定义:随着试验结果变化而变化的变量称为随机变量 .随机变量常用字母 X , Y ,ξ,η,… 表示. 2、定义:所有取值可以一一列出的随机变量,称为离散型随机变量 3、分布列:设离散型随机变量ξ可能取得值为 x 1,x 2,…,x 3,…, ξ取每一个值x i (i =1,2,…)的概率为()i i P x p ξ==,则称表 为随机变量ξ的概率分布,简称ξ的分布列 4. 分布列的两个性质: (1)P i ≥0,i =1,2,…; (2)P 1+P 2+…=1. 5.求离散型随机变量ξ的概率分布的步骤: (1)确定随机变量的所有可能的值x i (2)求出各取值的概率p(ξ=x i )=p i (3)画出表格 6.两点分布列: 7超几何分布列: 一般地,在含有M 件次品的 N 件产品中,任取 n 件,其中恰有X 件次品 数,则事件 {X=k }发生的概率为(),0,1,2,,k n k M N M n N C C P X k k m C --=== ,其中mi n {,} m M n =,且,,,,n N M N n M N N *≤≤∈.称分布列 为超几何分布列.如果随机变量 X 的分布列为超几何分布列,则称随机变量 X

服从超几何分布 8.离散型随机变量的二项分布:在一次随机试验中,某事件可能发生也可能不发生,在n 次独立重复试验中这个事件发生的次数ξ是一个随机变量.如果在一次试验中某事件发生的概率是P ,那么在n 次独立重复试验中这个事件恰好发生k 次的概率是 k n k k n n q p C k P -==)(ξ,(k =0,1,2,…,n ,p q -=1). 于是得到随机变量ξ的概率分布如下: ξ 1 … k … n P n n q p C 00 111-n n q p C … k n k k n q p C - … q p C n n n 称这样的随机变量ξ服从二项分布,记作ξ~B (n ,p ),其中n ,p 为参数。 9.离散型随机变量的均值或数学期望: 一般地,若离散型随机变量ξ的概率分布为 则称 =ξE +11p x +22p x …++n n p x … 为ξ的均值或数学期望,简称期望. 10.离散型随机变量的均值或数学期望的性质: (1)若ξ服从两点分布,则=ξE p . (2)若ξ~B (n ,p ),则=ξE np . (3)()c c E =,c 为常数 (4)ξ~N (μ,2σ),则=ξE μ (5)b aE b a E +=+ξξ)( 11.方差: 对于离散型随机变量ξ,如果它所有可能取的值是1x ,2x ,…,n x ,…, 且取这些值的概率分别是1p ,2p ,…,n p ,…,那么, ξD =121)(p E x ?-ξ+222)(p E x ?-ξ+…+n n p E x ?-2)(ξ+…

随机变量及其分布小结与复习

复习课: 随机变量及其分布列 教学目标 重点:理解随机变量及其分布的概念,期望与方差等的概念;超几何分布,二项分布,正态分布等的特点;会求条件概率,相互独立事件的概率,独立重复试验的概率等. 难点:理清事件之间的关系,并用其解决一些具体的实际问题. 能力点:分类整合的能力,运算求解能力,分析问题解决问题的能力. 教育点:提高学生的认知水平,为学生塑造良好的数学认识结构. 自主探究点:例题及变式的解题思路的探寻. 易错点:容易出现事件之间的关系混乱,没能理解问题的实际意义. 学法与教具 1.学法:讲授法、讨论法. 2.教具:投影仪. 一、【知识结构】 二、【知识梳理】 1.随机变量 ⑴随机变量定义:在随机试验中,使得每一个试验结果都用一个确定的数字表示.在这个对应关系下,数字随着试验结果的变化而变化.像这种随着试验结果变化而变化的变量称为随机变量.简单说,随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量.常用希腊字母x、y、ξ、η等表示. ⑵如果随机变量可能取的值可以按次序一一列出(可以是无限个)这样的随机变量叫做离散型随机变量.

⑶如果随机变量可能取的值是某个区间的一切值,这样的随机变量叫做连续型随机变量. 2.概率分布定义(分布列) 设离散型随机变量ξ可能取的值为123,,,,i x x x x L L ,ξ取每一个值(1,2,)i x i =L 的概率 ()i i P x p ξ==,则称表 ξ 1x 2x L i x L P 1P 2P L i P L 称为随机变量ξ的概率分布列,简称ξ的分布列. 注:1.离散型随机变量的分布列具有下述两个性质: (1)0,123≥,,,i p i =L ;123(2)1p p p +++=L 3.常见的分布列 ⑴二项分布:在一次试验中某事件发生的概率是p ,那么在n 次独立重复试验中这个事件恰发生k 次的概 率为()(1)k k n k n p X k C p p -==-,显然x 是一个随机变量.随机变量x 的概率分布如下: x 1 L k L n P 00n n C p q 111 n n C p q - L k k n k n C p q - L n n n C p q 我们称这样的随机变量x 服从二项分布,记作~(,)X B n p ⑵两点分布列:如果随机变量ξ的分布列为: ξ 0 1 P 1P - P 这样的分布列称为两点分布列,称随机变量服从两点分布,而称(1)p P ξ==为成功概率.两点分布是特殊的二项分布(1)p ξ~B , ⑶超几何分布:一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有x 件次品数,则事件{} x k =发生的概率为(),0,1,2,3,,k N k M N M n N C C P X k k m C --===L .其中{}min ,m M n =,且*,,,,n N M N n M N N ≤≤∈,则称分布列

第八讲 概率与统计模型

第八讲 概率与统计模型 一、 曲线拟合 所谓曲线拟合是指从自变量和因变量的实现点列中得到反映自变量和因变量的函数关系。如下图蓝色点表明的是某个函数关系式,现需要知道有如此曲线表现的函数。 曲线拟合可以视为函数求值的逆运算,函数求值在已知函数关系式时带入自变量的值就可以得到对应的因变量,而曲线拟合恰好相反。要注意的是曲线拟合在大多数情况下只能得到反映大致的函数关系的表达式,而不能得到精确的关系式。如已知某个地区的温度C 与一种植物的生长速度V 之间有线性的关系(设为b aC V +=),为了确定两者之间的确切关系时,需要知道两组实际数据2,1),,(=i v c i i ,这样通过求解线性方程组 ?? ?+=+=b ac v b ac v 22 11 可以求出),(b a 的值。但是在实际问题中,由于测量的误差或者计算过程中的问题,给出来的数据可能不止两对,n i v c i i ,,2,1),,( =,这样如果还是将给出的数据带入方程中得到的是一个超定方程组,该方程组未必有解!从而就产生了如何确定系数的问题,曲线拟合方法就是解决这种问题的方法。 与曲线拟合相平行的另一个问题是插值问题,插值就是利用给出的一些数据作为提示,要得到一些未知点处的函数值。在这里我们将两个问题整合起来,因为在通过曲线拟合得到反映规律的曲线后将需要求值的点带入即可以得到函数值。 曲线拟合的基本方法如下: (1) 确定自变量与因变量, (2) 确定自变量与因变量之间的函数关系类型(即自变量与因变量之间的粗略关系式, 含有参数) (3) 选择合适的曲线拟合方法(其中使用最多的是最小二乘法) (4) 使用MATLAB 后者其他计算软件求解

随机变量及其分布函数

随机变量及其分布函数 将随机事件以数量来标识,即用随机变量描述随机现象的研究方法,它是定义在样本空间上具有某种可预测性的实值函数。 分布函数则完整的表述了随机变量。 一、 随机变量与分布函数 (1) 随机变量: 取值依赖于某个随机试验的结果(样本空间),并随着试验结果不同而变化的变量,称之为随机变量。 分布函数: [1] 定义: 设X 是一个随机变量,对任意实数x ,记作 (){}F x P X x ≤=,称()F x 为随机变量X 的分 布函数,又称随机变量X 服从分布()F x ,显然,函数 ()F x 的定义域为(),-∞+∞,值域为[0,1]。 [2] 性质: ?()F x 单调非降。 ?()0F -∞=、()1F +∞=。 ?()(0)F x F x =+,即()F x 一定是右连续的。 ?对于任意两个实数a b <, {}()()P a X b F b F a <≤=- ?对于任意实数0x ,

00 0{}()()P X x F x F x ==-- ?000{}1{}1()P X x P X x F x >=-≤=- ?000{}{)lim }(x x P X x P X x x F →- =≤<=- ?000{}1{}1()P X x P X x F x ≥=-<=-- 二、 离散型随机变量与连续型随机变量 (1) 离散型随机变量 [1] 概念:设X 是一个随机变量,如果X 的取值是有限个或者 无穷可列个,则称X 为离散型随机变量。其相应的概率()i i P X x p ==(12)i =、……称为X 的概率分布或分布律,表格表示形式如下: [2] 性质: ?0i p ≥ ? 1 1n i i p ==∑ ?分布函数()i i x x F x p ==∑ ?1{}()()i i i P X x F x F x -==- (2) 连续型随机变量 [1] 概念:如果对于随机变量的分布函数()F x ,存在非 负的函数 ()f x ,使得对于任意实数x ,均有:

随机变量及其分布公式

随机变量及其分布 一,离散型随机变量 1,试验:凡是对现象的观察或为此而进行的实验,都称之为试验。 2,随机试验:一个试验如果满足(1)试验可以在相同的情形下重复进行;(2)试验的所有可能结果是明确可知的,并且不止一个;(3)每次试验总是恰好出现这些结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果,那么,这个试验就叫做随机试验。 3,随机变量:随着试验结果变化而变化的变量称为随机变量,随机变量常用字母ηξ,,,Y X 表示。例如抛筛子、掷硬币 4,离散型随机变量:如果随机变量X 的所有可能的取值都能一一列举出来,则称X 为离散型随机变量 二,离散型随机变量的分布列 要掌握一个离散型随机变量X 的取值规律,必须知道: 1,X 所有可能取的值n x x x ,,,21 ; 2,X 取每一个值i x 的概率n p p p ,,,21 分布列 : 我们称这个表为离散型随机变量X 的概率分布,或称为离散型随机变量X 的分布列。 3,离散型随机变量的分布列性质: (1)*,0N i p i ∈≥;(2)1321=++++n p p p p 三,两点分布与超几何分布 1,两点分布 若随机变量X 的分布列为 则称X 的分布列为两点分布列。 如果随机变量X 的分布列为 两点分布列,就称X 服从两点分布,并称)1(==x P p 为成功概率 2,超几何分布: 一般的,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则事件{}k X =发生的概率为 n N k n M N k M C C C k x P --==)((m k ,2,1,0=),其中{}*,,,,,,m in N N M n N M N n n M m ∈≤≤=且,称 为超几何分布列,如果随机变量X 的分布列为超几何分布列,则称随机变量X 服从超几何分布 四,独立重复试验与二项分布 1,独立重复试验:一般的,在相同条件下重复做的n 次试验称为n 次独立重复试验。 2,独立重复试验事件A 恰有k 次发生的概率: 一般的,如果在1次实验中某事件发生的概率是p ,那么在n 次独立重复试验中这个事件恰好发生k 次的概率 =)(k P n k n k k n p p C --)1(,(n k ,2,1,0=)

《计量经济学》第一、二章精选题答案解析.doc

计量一二章练习答案 一、单项选择题 1.C 2.B 3.D 4.A 5.C 6.B 7.A 8.C 9.D 10.A 11.D 12.B 13.B 14.A 15.A 16.D 17.A 18.C 19.B 20.B 21.D 22.D 23.D 24.B 25.C 26.D 27.D 28.D 29.A 30.D 三、名词解释 1.经济变量:经济变量是用来描述经济因素数量水平的指标。 2.解释变量:是用来解释作为研究对象的变量(即因变量)为什么变动、如何变动的变量。它对因变量的变动做出解释,表现为方程所描述的因果关系中的“因”。 3.被解释变量:是作为研究对象的变量。它的变动是由解释变量做出解释的,表现为方程所描述的因果关系的果。 4.内生变量:是由模型系统内部因素所决定的变量,表现为具有一定概率分布的随机变量,是模型求解的结果。 5.外生变量:是由模型系统之外的因素决定的变量,表现为非随机变量。它影响模型中的内生变量,其数值在模型求解之前就已经确定。 6.滞后变量:是滞后内生变量和滞后外生变量的合称,前期的内生变量称为滞后内生变量;前期的外生变量称为滞后外生变量。 7.前定变量:通常将外生变量和滞后变量合称为前定变量,即是在模型求解以前已经确定或需要确定的变量。 8.控制变量:在计量经济模型中人为设置的反映政策要求、决策者意愿、经济系统运行条件和状态等方面的变量,它一般属于外生变量。 9.计量经济模型:为了研究分析某个系统中经济变量之间的数量关系而采用的随机代数模型,是以数学形式对客观经济现象所作的描述和概括。 10.函数关系:如果一个变量y的取值可以通过另一个变量或另一组变量以某种形式惟一地、精确地确定,则y与这个变量或这组变量之间的关系就是函数关系。 11.相关关系:如果一个变量y的取值受另一个变量或另一组变量的影响,但并不由它们惟一确定,则y与这个变量或这组变量之间的关系就是相关关系。 12.最小二乘法:用使估计的剩余平方和最小的原则确定样本回归函数的方法,称为最小二乘法。 13.高斯-马尔可夫定理:在古典假定条件下,OLS估计量是模型参数的最佳线性无偏估计量,这一结论即是高斯-马尔可夫定理。 14.总变差(总离差平方和):在回归模型中,被解释变量的观测值与其均值的离差平方和。15.回归变差(回归平方和):在回归模型中,因变量的估计值与其均值的离差平方和,也就是由解释变量解释的变差。 16.剩余变差(残差平方和):在回归模型中,因变量的观测值与估计值之差的平方和,是不能由解释变量所解释的部分变差。 四、简答题

计量经济学题库带答案

计量经济学总复习题库 一、单项选择题 1.计量经济学成为一门独立学科的标志是(B )。 A .1930年世界计量经济学会成立 B .1933年《计量经济学》会刊出版 C .1969年诺贝尔经济学奖设立 D .1926年计量经济学(Economics )一词构造出来 2.在计量经济模型中,由模型系统内部因素决定,表现为具有一定的概率分布的随机变量,其数值受模型中其他变量影响的变量是( B )。 A .内生变量 B .外生变量 C .滞后变量 D .前定变量 3.下面属于横截面数据的是( D )。 A .1991-2003年各年某地区20个乡镇企业的平均工业产值 B .1991-2003年各年某地区20个乡镇企业各镇的工业产值 C .某年某地区20个乡镇工业产值的合计数 D .某年某地区20个乡镇各镇的工业产值 4.经济计量分析工作的基本步骤是( A )。 A .设定理论模型→收集样本资料→估计模型参数→检验模型 B .设定模型→估计参数→检验模型→应用模型 C .个体设计→总体估计→估计模型→应用模型 D .确定模型导向→确定变量及方程式→估计模型→应用模型 5.将内生变量的前期值作解释变量,这样的变量称为( D )。 A .虚拟变量 B .控制变量 C .政策变量 D .滞后变量 6.同一统计指标按时间顺序记录的数据列称为( B )。 A .横截面数据 B .时间序列数据 C .修匀数据 D .原始数据 7.进行相关分析时的两个变量( A )。 A .都是随机变量 B .都不是随机变量 C .一个是随机变量,一个不是随机变量 D .随机的或非随机都可以 8.表示x 和y 之间真实线性关系的是( C )。 A .01???t t Y X ββ=+ B .01()t t E Y X ββ=+ C . 01t t t Y X u ββ=++ D .01t t Y X ββ=+ 9.参数β的估计量? β具备有效性是指( B )。 A .?var ()=0β B .? var ()β为最小 C .?()0ββ-= D .? ()ββ-为最小 10.对于01??i i i Y X e ββ=++,以σ?表示估计标准误差,Y ?表示回归值,则( B )。 A .i i ??0Y Y 0 σ∑=时,(-)= B . 2i i ??0Y Y σ∑=时,(-)=0 C . i i ??0Y Y σ∑=时,(-)为最小 D . 2i i ??0Y Y σ∑=时,(-)为最小

随机变量模型的确定

第十一章 随机变量模型的确定 11.1 随机变量模型的确定 三种情形:①. 随机变量分布的类型已知, 需要由观测数据确定该分布的参数 ②. 由观测数据确定随机变量概率分布类型, 并在此基础上确定其参数 ③. 由已有的观测数据难以确定该随机变量的理论分布形式, 则定义一个实验分布 1 分布参数的确定 分布参数的类型 (1) 位置参数(记为γ) 确定分布函数取值范围的横坐标。当γ改变时, 相应的分布函数仅仅向左或 向右移动而不发生其它变化, 因而又称为位移参数。 例如, 均匀分布函数U(a,,b ), 其密度函数为: 图11.1 均匀分布U(a, b ) 1/ (

f x b a a x b ()=-≤≤ ?????1 0其它 其中参数a定义为位置参数, 当a改变时(保持b a -不变), f x()向 左或向右移动。 (2) 比例参数(记为β):决定分布函数在其取值范围内取值的比例尺。 β的改变只压缩或扩张分布函数, 而不会改变其基本形状。 例如, 指数分布函数EXPO(β), 其密度函数为: f x e x x () / = ≥? ? ? ?? - 1 β β 其它 (3) 形状参数(记为α):确定分布函数的形状, 从而改变分布函数的性质, 例如, 韦伯分布Weibull(αβ,), 其密度函数为: f x x e x x () (/) = > ? ? ? ?? -- αβααβα 110 0其它 图11.2 指数分布EXPO(β)

当α改变时, 其形状发生很大的变化。 随机变量X Y ,, 如果存在一个实数γ, 使X 与Y 具有相同的分布, 则称 X 与Y 仅仅是位置上不同变量; 如果对于某个正实数β, 使得 βX 与Y 具有相同的分布, 则称X 与Y 仅仅是比例尺不同的随机变量; 如果γβ+X 与Y 具有相同的分布, 则称X 与Y 仅在位置与比例上不 同。 2. 分布参数的估计 最大似然估计: 设参数θ, 观测数据为x x x n 12,,, 在离散分布情形, 可令P x θ ()为该分布的概率质量函数, 定义似然函数L ()θ为: L P x P x P x n ()()()...()θθθθ=12 则L ()θ是联合质量函数, θ的最大似然估计值 θ是使L ()θ取最大值的θ, 即对于所有可能的θ值, 图11.3 韦伯分布Wilbull(αβ,)

计量经济学第二三章习题

1.回归分析中定义的() A.解释变量和被解释变量都是随机变量 B.解释变量为非随机变量,被解释变量为随机变量 C.解释变量和被解释变量都为非随机变量 D.解释变量为随机变量,被解释变量为非随机变量 2.最小二乘准则是指使()达到最小值的原则确定样本回归方程。 A. B. C. D. 3.下图中“{”所指的距离是() A. 残差 C. 的离差 D. 的离差 4.最大似然准则是从模型总体抽取该n组样本观测值的()最大的准则 确定样本回归方程。 A.离差平方和 B.均值 C.概率 D.方差 5.参数估计量是的线性函数称为参数估计量具有( )的性质。 A.线性 B.无偏性 C.有效性 D.一致性 6.参数的估计量具备有效性是指() A. B.为最小 C. D.为最小

7.要使模型能够得出参数估计量,所要求的最小样本容量为() ≥k+1 ≤k+1 ≥30 ≥3(k+1) 8.已知含有截距项的三元线性回归模型估计的残差平方和为,估计用样本容量为,则随机误差项的方差估计量为( )。 最常用的统计检验准则包括拟合优度检验、变量的显著性检验和()。 A.方程的显著性检验 B.多重共线性检验 C.异方差性检验 D.预测检验 10.反映由模型中解释变量所解释的那部分离差大小的是( )。 A.总体平方和 B.回归平方和 C.残差平方和 11.总体平方和TSS、残差平方和RSS与回归平方和ESS三者的关系是()。 =TSS+ESS =RSS+ESS =RSS-TSS =TSS+RSS 12.下面哪一个必定是错误的()。 A. B. C. D. 13.产量(X,台)与单位产品成本(Y,元/台)之间的回归方程为,这说明()。 A.产量每增加一台,单位产品成本增加356元 B.产量每增加一台,单位产品成本减少元 C.产量每增加一台,单位产品成本平均增加356元 D.产量每增加一台,单位产品成本平均减少元 14.回归模型,i = 1,…,25中,总体方差未知, 检验时,所用的检验统计量服从()。 A. B.

有关数学模型-数学建模

1.数学模型:对于一个现实对象,为了一个特定的目的,根据其内在规律,作出必要的简化假设,运用适当的数学工具,得到的一个数学结构。 2.选煤数学模型:是将选煤实际应用问题转化为数学问题的形式,并利用计算机求解,给出其近似最优的解法,然后对结果加以分析、检验、讨论和推广 3.物理模型主要指科技工作者根据与原型相似的原理构造的模型。思维模型指人们通过对原型的反复认识,获得的知识以经验的形式直接储存于大脑中,并根据思维或直觉做出相应的决策。 4.数学模型的分类: ①根据来源分类:a.理论模型:根据实体的物理和化学性质,通过分析推导出来的模型b.经验模型:指不考虑实际内部的变化,只着重于外部的关系,把收集到的输入和输出观测值,用数理统计的方法,导出输入、输出变量之间的关系,建立数学模型c.综合模型:模型结构来自理论分析,但其中的某些参数未确定,需要收集现场生产数据或通过试验用数学方法来确定 ②根据模型中变量和时间的关系分类:a.稳态模型:单纯反应生产过程变量之间的因果关系,不考虑时间影响。b.动态模型:生产过程中各变量的状态是随时间而变化的,此时各输入输出量之间的数学关系可以用微分方程或积分方程进行描述。 ③根据模型中变量的的性质分类:a.确定性模型:自变量与因变量自身之间的关系都是确定的。b.随机模型。全部或部分变量是随机变量,变量之间的关系不是确定性的函数关系,而是随机变化的相关关系。 ④根据模型的基本关系:分线性模型和非线性模型 ⑤根据变量的连续性,分成离散模型和连续模型。 5.建立数学模型方法:①机理分析方法:根据对客观事物特性的认识,找出反映内部机理的数量规律②测试分析:将对象看作“黑箱”通过对测量数据的统计分析,找出与数据拟合最好的模型③二者结合:用机理分析建立模型结构,用测试分析确定模型参数 6.数学建模一般步骤:①模型准备:了解实际背景,明确目的,搜集信息;②模型假设:针对问题特点和目的,作出合理的、简化的假设;③模型构成:用数学的语言、符号描述问题;④模型求解;⑤模型分析:误差分析、统计分析等;⑥模型检验:检验模型的合理性、适用性;⑦模型应用 7.经验模型的建立:①试验数据的整理:在建模前需要进行检查和取舍;②模型形式的确定:应该切合实际,可以根据专业知识,实际经验和试验所取得的数据来决定;③模型参数的估计:公式中的常数和系数还需要确定,最小二乘法、回归分析或最优化方法;④模型的检验:以模型的计算值与实测值相差多少为标准。多次试验,反复修改。 8.随机变量:设随机试验空间是S={e}.如果对于每一个e∈S,有一个实数X(e),与之对应,这样就得到一个定义在S上的实值单值函数X(e),称为随机变量 9.离散型随机变量:随机变量所取的可能值是有限多个或无限可列个连续型随机变量:随机变量所取的可能值可以连续地充满某个区间 10.众数:指使得频率函数或密度函数达到极大值的点。具体说,当X为离散型随机变量时,若Pi>Pj对于一切i≠j成立,则称xj为X的众数。当X为连续型随机变量时,若f(x0)=maxf(x)则称x0为X的众数。

相关主题
文本预览
相关文档 最新文档