当前位置：文档之家› 分形统计模型的理论研究及其在地质学中的应用

分形统计模型的理论研究及其在地质学中的应用

第33卷　第2期1998年4月

SC IEN T I A GEOLO G I CA S I N I CA

V o l .33N o.2

A p r .,1998

3地矿部“九五”基础研究重点项目《矿产定量预测的勘查评价新理论研究》和中国博士后科学基金项目资助。申　维,男,1957年2月生,博士后,数学地质专业。

1997210207收稿,1997209209改回,王桂凤编辑。

分形统计模型的理论研究及其在

地质学中的应用

申　维　赵鹏大

(中国地质大学数学地质研究所　武汉　430074)

摘　要　本文提出了一般分形模型和一般分维数的概念,认为许多地质模型是一般分形模型的特例,指出幂函数分布和帕累托分布是分形统计模型的数学基础,论证了幂函数分布在高端截尾条件下具有尺度不变的分形性质,根据非线性回归模型参数估计的方法,提出了求分维数的新方法,该方法具有许多优点。通过在计算机上产生随机数对分形统计模型进行模拟研究,以及通过实例说明分形统计模型应用的方法及步骤,并解释了分维数的实际意义。

关键词　分形统计模型　分维数　模拟研究　成矿预测

由于人类社会和自然界中广泛地存在无序、混乱、不规则和不光滑的复杂现象,传统的理论只能是简化或定性地刻画它们。分形理论的提出为揭示隐藏于混乱复杂现象中的精细结构和定量地刻画描述它们提供了理论基础。

分形理论创立于70年代中期,其研究对象为自然界和社会活动中广泛存在的无序(无规则)而具有自相似性的系统。分形论借助于自相似性原理洞察隐藏于混乱现象中的精细结构;为人们从局部认识整体,从有限认识无限提供新的方法论;为不同学科发现规律性提供崭新的语言和定量的描述;为现代科学技术提供新思想新方法。分形理论不但为复杂的现象提供了一种简便的定量描述工具,而且它是一种辩证的思想方法和认识方法:部分与整体有相似性是整个的相对缩影,含有整体的信息,因而人们可以通过认识部分来认识整体。

1　一般分形模型

设非线性模型

y =f (x ,Η

)+Ε(1)

式中:x 为可观测的已知变量,可以是向量;y 为可观测的随机变量;Ε为不可观测具有零

均值和有限方差Ρ2>0独立同分布F 的随机误差项(Ρ2未知);Η=(Η1,Η2,…,Ηp )′为未知参数,定义域为欧氏空间R p 上的一个子空间(;f 称为模型函数,它的函数形式已知,但含有未知参数Η。如果f 是Η的线性函数,则(1)式化为线性模型,否则就称为非线性模型。

设一般分形模型

Y ∝X

F (D )

(2)

其中X 和Y 为变量,根据具体问题可以代表不同的意义;F (D )称为分维数函数,也可称为一般分维数,F (D )选取什么函数形式,依具体研究问题而定。

模型(2)可以推出许多具体模型。

(1)取Y =A (面积),X =P (周长),F (D )=2 D ,得到面积与周长关系:

A ∝P

2 D

(2)取Y =N (覆盖的盒子数目),X =b (盒子的大小或尺寸),F (D )=-D ,得到盒子数目与盒子的大小或尺寸关系:

N ∝b

-D

(3)取Y =L (Σ)(轨迹的长度length of trail ),X =Σ(步长大小),F (D )=1-D ,得到划分关系:

L (Σ)∝Σ

1-D

(4)取Y =N (A >a )(大于a 的面积或区域数目),X =a (尺寸大小),F (D )=-(D 2),得到Ko rcak’s 关系:

N (A >a )∝a

-(D 2)

(5)取Y =P (w )(功率pow er ),X =w (频率),F (D )=-(5-2D ),得到功率谱与频

率关系:

P (w )∝w

-(5-2D )

(6)取Y =< z p -z q 2>,X =d p q (p 与q 之间距离),F (D )=4-2D ,z p 和z q 代表在点p 和q 处的高程,<　>代表统计上的数学期望,得到变差图关系:

〈 (z p -z q ) 2〉∝(d p q )(4-2D )

(7)取Y =N (R )(像元数目),X =R (回转半径),F (D )=D ,得到扩散限制凝聚(DL A 模

型):

N (R )∝R

模型(2)可改写为下面模型:

Y =CX

F (D )

(3)

此模型即是非线性回归模型(1)的特例,Η=(C ,F (D )),F (D )可视为参数函数。对分维数

D 的研究可转为对分维数函数的研究,其效果是一致的。

因为F (D )是D 的一个一对一变换。

2　分形统计模型

设分形统计模型:

N (r )=C r +D

-　r >0

(4)

其中,r 表示特征尺度;C >0称为比例常数;D >0称为分维数;N (r )表示尺度大于等于r 的数目(当分维数D 前面的符号取负号,记为N (≥r ))或尺度小于等于r 的数目(当分维数D 前面的符号取正号,记为N (≤r ))。

为了研究方便,(4)式可分解为下面2式:

32　2期申　维等:分形统计模型的理论研究及其在地质学中的应用

N(≤r)=C r D r>0 N(≥r)=C r-D r>0(4’) (4”)

许多地质现象具有标度不变的特征,如岩石碎片、断层、地震、火山喷发、矿藏和油井等,这些现象的频度和大小之间的分布具有尺度不变性。分形分布的特点要求大于等于或小于等于某一尺度的数目,与物体大小之间存在幂指数关系,即(4)式的关系。例如r可表示金品位;N(≥r)表示金品位大于r的样品数目;r也可表示圆的半径;N(≤r)表示落入半径为r圆中矿体的个数。

分形分布的特点要求大于某一尺度物体的数目,与物体大小之间存在着幂函数关系,地质现象的统计分布中,幂函数分形分布(即幂函数分布、帕累托分布和齐波夫)不是唯一的一类,还有如对数分布等其它类型。但是幂函数分形分布是其中唯一的一类不含特征尺度的分布。因此,这些分布可以应用于那些具有标度不变特征的地质现象。而标度不变性则提供了应用幂函数分形分布的基础。首先引入幂函数分布(John et al.,1970)函数。如果随机变量X密度函数:

f(x)=ak-a X a-1 a>0 0

由(5)式可求得随机变量X的分布函数,数学期望和方差,即

F(x)=P(X≤x)=(x k)a a>0 0

E(X)=ak(a+1)-1a>0

V(X)=ak2(a+2)-1(a+1)-2a>0

在高端截尾条件下,0

P(X≤x X≤k′)=(x K)a(K′ K)-a=(x K′)a 0

上式表明幂函数分布在高端截尾条件下具有分形性质。

P(X≤x X≤k′)=P(X≤cx X≤ck′) 0

上式表明幂函数分布具有尺度不变的特征。其中k′为尺度参数;c为任意正的常数。

综上所述,幂函数分布是具有尺度不变的概率分布(在高截尾条件下),幂函数分布是(4’)式的数学基础。

M andbelb ro t(1982)认为帕累托分布(John et al.,1970)在低端截尾条件下具有尺度不变的分形性质。帕累托分布具有尺度不变的概率分布(在低截尾条件下),帕累托分布是(4”)式的数学基础。

分形统计模型(4)式是(1)式的特殊情形,此时Y=N(r),Η=(C,D),f(X,Η)=C r±D。为了求出分维数D,将观测数据(N(r1),N(r2),…,N(r n))和(r1,r2,…,r n),绘在双对数坐标纸上,如果其点大致分布在一条直线上的话,分维数D可以利用直线的斜率求出,也就是说,将观测数据(N(r1),N(r2),…,N(r n))和(r1,r2,…,r n),代入(4)式,然后两边取对数,(4)式化为一元线性回归模型,

log N(r)=±D log r+log C(6)用最小二乘法求出斜率D的估计量,即为分维数。目前几乎都用此方法(传统方法)求解分维数D。虽然用该方法求出D较简单,但结果可能不正确(B ethea et al.,1985),应该用非线性回归模型的方法去估计参数C和D。

632地　质　科　学1998年

事实上,(4)式是非线性回归模型,其中C 、D 为未知参数,用非线性回归模型中的最小二乘法直接求出(4)式中参数D 的估计量也是分维数。用这种新方法求出的分维数D ,比上面传统方法(即(4)式转化为一元线性回归模型(6))求出的分维数更精确,误差更小。

新方法有以下优点:

(1)使用传统方法求分维数D ,要对原始数据(N (r 1),N (r 2),…,N (r n ))和(r 1,r 2,…,r n ),同时作对数变换,但是在大多数情况下,原始数据特别是(r 1,r 2,…,r n ),不适合作对数变换。新方法直接用原始数据求分维数D ,避免了以上情况的发生。

(2)使用新方法可以求出分维数估计量D δ的近似偏差和方差,同时也能求出近似预测偏差和预测方差。使用传统方法不能得到上述结果。

(3)使用新方法求出参数估计量比使用传统方法求出参数估计量在拟合分形模型时更好,即剩余平方和更小(剩余平方和是衡量拟合的优良程度的定量指标),并且参数估计量　[Q (D δ,C

δ)=

∑

k =1

(N (r k )-C δr D δ

)2]更稳定。3　分形统计模型模拟研究

我们在计算机上产生了[0,1]区间上的均匀分布,标准正态分布和对数态分布的随机

数各100000个,将每种分布的随机数分布10组(即每组1000个随机数,共有30组),用于分形统计模型的模拟研究。

将每组1000个随机数,按从小到大的次序排列,并把随机数分布的总区间分成k 个子区间,计算进入第i 个子区间内的随机数的频数N F i (i =1,2,…,k ),令N (r )=

∑i ≥r

N F i

,其中r 为正整数。

这样得到了数据(N (r 1),N (r 2),…,N (r n ))和(r 1,r 2,…,r n ),

将这些数据代入分形统计模型(4”),应用最小二乘法,可求出分维数估计量D δ。具体计算

结果见表1-3。

需要说明的是:

(1)对于均匀分布的随机数,取K =150,n =26,r i =2i (i =1,2,…,26);

表1　均匀分布分维数估计量D δ

Table 1　fractal di m ensi on D

δof U nifo r m distributi on

组　号12345678910平均数标准数

传统方法011490.1350.1420.1510.1420.1440.1350.1420.1510.1420.14330.0057新方法

0.132

0.122

0.127

0.136

0.128

0.129

0.122

0.127

0.136

0.128

0.12870.0049

表2　正态分布分维数估计量D δ

Table 2　fractal di m ensi on D

δof N o r m al distributi on 组　号12345678910平均数标准数

传统方法1.0571.1031.1011.0781.0291.1210.9960.9190.9460.9561.03060.0728新方法

0.686

0.722

0.707

0.703

0.679

0.727

0.680

0.643

0.634

0.672

0.68530.0308

32　2期申　维等:分形统计模型的理论研究及其在地质学中的应用

832地　质　科　学1998年

表3　对数正态分布分维数估计量D

δof Logno r m al distributi on

Table3　fractal di m ensi on D

组　号12345678910平均数标准数传统方法1.6291.4361.8761.6711.7231.8461.3501.3321.7301.2101.58030.2319新方法1.0260.9591.0911.0191.0201.0930.8720.8701.0020.8100.97620.0965

(2)对于正态分布的随机数,取K=80,n=21,r i=2i+10(i=1,2,…,21);

(3)对于对数正态分布的随机数,取K=100,n=21,r i=2i(i=1,2,…,21);

(4)对于不同分布的随机数据,k和r的取值范围也不相同,主要依据数据(N(r1),N (r2),…,N(r n))和(r1,r2…,r n),在此范围内,存在无标度区和统计上的要求;

(5)随机数抽取样本1000个,符合统计推断的要求条件。

由表1、表2和表3中的数据可得出:①用新方法求出分维数估计量比使用传统方法求出的分维数估计量更趋于稳定,因为标准差是数据分散程度的定量描述,标准差越小,数据越集中于平均数附近。②分维数D值可以表征随机数或样本之间的结构性。根据分形统计模型(4”)可看出,D值越小表示随机数或样本之间的差异越小,均匀程度越好;反之, D值越大表示随机数或样本之间的差异越大,均匀程度越差。均匀分布(均匀程度好)的随机数分维数(平均值011287)<正态分布(均匀程度居中)的随机数分维数(平均值016853)<对数正态分布(均匀程度差)的随机数分维数(平均值019762)。以上结论与实际情况符合。

4　应用实例

80年代末,分形理论开始引入地质学研究中。T u rco tte(1986,1989)对矿石平均品位和矿床累计储量的研究表明,二者之间存在幂函数关系,即分形结构,在给出有经济价值矿物形成模型的基础上,建立了矿石平均品位和累计储量的分形关系模型。秦长兴(1989)对华南金属矿产储量和品位的分形模型研究指出了分形模型的理论意义及其在矿产资源预测评价中的作用。分形理论的创始人M andelb ro t对铜的研究认为,高品位铜矿的分布是不均匀的,在每一储铜区中,无论区域大小,其高品位铜矿的相对分布是相同的,高品位铜矿可看作是由低分维相似性分形集合“集中”或“支持”的,品位较低的铜矿,可视为受到一个高维分形集合的支持,从而得出铜矿的分布存在多重分形结构。秦长兴等(1992)认为金属矿床的空间位置、矿化的空间分布、矿田构造形迹(矿脉)具有自相似性。沈步明等(1993)、程小久等(1994)认为矿石品位的分维数D值可以确定矿化类型,确定勘探网度和矿床经济评价的参数。孟宪国等(1991)的研究表明,地质数据中广泛存在分形结构;孟宪国(1993)认为分维和多标度分形谱是表示分形结构复杂性的定量指标,对研究地质结构的异常特征有特殊意义,在云南腾冲地区地质异常及矿产预测研究中将熵、变差函数与分形相结合,取得了很好的效果;该文进而提出,在矿产预测数学模型中,通过分维和多标度分形谱,建立相似——类比的分形模型。诸如此类的研究,分形理论正日益渗透到成矿规律与成矿预测、矿床勘查与评价中。

西藏罗布莎铬铁成矿预测。西藏罗布莎铬铁矿矿床,是我国目前已知最大的铬铁矿矿床,已探明的铬铁矿石储量近500万吨,占全国探明储量的三分之一以上,因此,对西藏罗布莎铬铁矿矿床进行成矿预测具有非常重要的意义。

罗布莎蛇绿岩体地处著名的雅鲁藏布江蛇绿岩带的东段,位于冈底斯火山2岩浆弧的南侧,岩体呈向北凸出的弧形展布于上三叠统一套巨厚的浅变质砂板岩夹少量结晶灰岩和细碧用斑岩的复理石建造与上白垩统海相火山岩、放射虫硅质岩以及第三系山间磨拉石建造之间,岩体平面形态似透镜状,局部被断层错开,主体呈东西向延伸,长约30km ,最宽处约3km (李紫金等,1993)。

通过对该矿床的研究,认为地表矿体、矿群、矿床储量的空间分布具有较好的分形结构特征即自相似性,可用分形统计(4’)模型作为第四系覆盖区找矿远景地段矿体、矿群及其资源量的预测模型。411　地质条件

研究表明,尽管罗布莎矿段与香嗄山矿段矿体出露的标高及在地幔橄榄岩中的位置略有不同,岩石矿石化学成分及物性表现上有所差异,但它们均处于同一地幔橄榄岩内,属于同一成岩成矿作用的产物,原始的构造含矿杂岩带统一,经构造解析,认为全区的矿体均在同一构造含矿杂岩带内。因而,将模型区扩大到两矿段地区时,在地质上是可行的。412　数学条件

罗布莎铬铁矿床自相似性体系的矿床诸参数表现出自相似性,将观测数据(N (r 1),N (r 2),…,N (r n ))和(r 1,r 2…,r n )绘在双对数坐标系统中(即log N (r )2logr ),连接各点,曲线存在明显的直线段,即存在无标度区。自相似性是事物在一定尺度范围(无标度区)内不随观察尺度变化的性质,部分无标度区得到的结论可以外推到整个无标度区。模型区地表矿体、矿群及其储量的空间分布在[5,40c m ]的范围(无标度区)内具较好的分形结构即自相似性。因此,在矿床自相似性体系内,可以将该无标度区的上限外推至55c m ,此时分形结构不发生改变或改变不大。413　模型区与预测区的相似类比

预测的矿体及矿群是第四系覆盖区下基岩表层的矿体及矿群,预测的资源量是与模型区C +D 级储量对应的矿量。第四系的研究表明,预测区的第四系为残坡积物及少量的冰碛物,所以认为模型区与预测区地表风化剥蚀状况及矿体的保存条件相似,模型可以外推。

414　资料来源及参数估计41411　地表矿体

模型区内,在1 10000地形地质图上标出的分布于构造含矿杂岩带内的地表矿体共152个,把每个矿体看成是以其中心为代表的一个点。以矿体分布的重心或中心为圆心,圆心不动,以不同的半径r 画圆,计算每次落入圆中矿体的个数,记为N (r )(表4)。使用新方

32　2期申　维等:分形统计模型的理论研究及其在地质学中的应用

法求得分形统计模型(4’)式中最小二乘估计量D δ=0.7568(分维数),量C δ=9.4039。可

得地表矿体预测的数学模型,即:

N (r )=9.4039r 0.7568

5≤r ≤55

(7)表4　地表矿体数据

Table 4　Surface o rebody data

r c m 510152025303540N (r )(个)

105

127

136

152

41412　地表矿群

在1 10000地形地质图上,标出了模型区构造含矿杂岩带中的矿群14个。每个矿群可

看成是以其中心为代表的一个点。圆心及半径的定义与地表矿体的相似,r 的取值仍与地表矿体的相同。圆心不动,以不同的半径r 画圆,计算每次落入圆内的矿群个数,记为N (r )表(5)。使用新方法求得分形统计模型(4’)式中最小二乘估计量D δ=0.9298(分维数),量C δ=0.4384。可得地表矿群预测的数学模型,即:

N (r )=0.4384r 0.9298

5≤r ≤55

(8)表5　地表矿群数据

Table 5　Surface o re cluster data

r c m 510152025303540N (r )(个)

41413　矿床储量

在1 10000地形地质图上,还包含了模型区内构造含矿杂岩带中的C +D 级铬铁矿

石储量为4211418吨的分布资料。圆心及半径的定义与地表矿体的相似,圆心不动,计算在不同的r 测度下落入球(实际为圆,因为将储量的分布投影到1 10000地形地质图上)内的C +D 级矿石储量,记为m (r )(表6),使用新方法求得分形统计模型(4’)式中最小二

乘估计量D δ=0.6654(分维数),C δ=36716619。可得矿床储量预测的数学模型,即:

m (r )=367166.9r 0.6654

5≤r ≤55

(9)表6　矿床储量数据

Table 6　Surface o re reserves data

r c m

510152025303540m (r ) t 924548

17354662548579268165728147353391417

4206516

4211418

415　预测结果及参数意义的解释

以矿群上最大的矿体为圆心r =5,10,15,…,50,55c m (1 10000地形地质图上),将r

042地　质　科　学1998年

图1

　矿体原始数据曲线拟合图

F ig .1　The p lo t of the fitted curve fo r the surface

o rebody o riginal data

图2　地表矿群原始数据曲线拟合图

F ig .2　The p lo t of the fitted curve fo r the surface o re

cluster o riginal data

图3　矿床储量原始数据曲线拟合图

F ig .3　The p lo t of the fitted curve fo r the surface o re reserves

o riginal data

回代入(7),(8)和(9)式中,得出r =55c m 时的总数量,减去已知数量即为香嗄山矿段第四系的预测资源量。结果为:“地表”矿体43个,“地表”矿群4个(取整),资源量(含铬铁矿石):10718151342t 。矿石质量以致密块状

为主,少量的稠密浸染状矿石,C r 2O 3(含量)平均为5217%;铂族元素总量平均品位为01497g t ,总资源量为5321692kg 。预测结果较符合实际情况(图1-3)。

密度定义为　Θ=N (r ) (Πr 2)=

(C Π)r D -2当D =2.0时,密度Θ=C Π。表明密度均匀。

当D >2.0时,密度Θ随着r 的增大而增大。当D <2.0时,密度Θ随着r 的增大而减少。当

r =1.0时,C =ΠΘ

=N (1)。016654(矿床储量分维数)<017568(地表矿体分维数)<019298(地表矿群分维数)<2,表明,随着r 的增大,矿床储量,地表矿体和地表矿群的密度逐步减少。

因此分维数D 定量表达矿体分布的密度变化趋势,C 表示矿体分布的初始值,它们对矿产资源勘查、预测与评价具有重要的指导意义。

42　2期申　维等:分形统计模型的理论研究及其在地质学中的应用

242地　质　科　学1998年

参考文献

程小久,卢建杭,宋亮明.1994.铜锌品位分维D值的意义和计算程序.地质与勘探,30(5):26-30.

李紫金,张时健.1993.西藏自治区曲松县罗布莎铬铁矿成矿预测(1 25000)、武汉:中国地质大学出版社,1-123.

孟宪国.1993.R S分析和地球化学数据的分形处理.地球科学,16(3):281-287.

孟宪国,赵鹏大.1991.地质数据的分形结构.地球科学,16(2):207-211.

秦长兴.1989.矿床学中若干问题的分形几何学研究.中国地质大学博士论文.中国地质大学(武汉).1-80.

秦长兴,翟裕生.1992.矿床学中若干自相似性现象及其意义.矿床地质,11(3):259-265.

沈步明,沈远超.1993.新疆某金矿的分数维特征及其地质意义.中国科学(B辑),23(3):297-302.

沈步明,王思敬.1993.一个新的频率分布的特征参数:分形结构因子.科学通报(B辑),38(8):725-727.

韦博成.1989.近代非线性回归分析.南京:东南大学出版社.1-258.

Bethea R M,D uran B S,Boulli on T L.1985.Statistical M ethods fo r Engineer and Scientists.M arcl D ekker,Inc,N ew Yo rk.351-363.

John N L,Ko tz S.1970.Continuous U nivariate D istributi ons2I.John W iley&Sons.Inc.N ew Yo rk.1-300.

M andelbro t B B.1982.The fractal geom etry of nature.W.H.F reem an.San F rancisco.1-468.

Turco tte D L(美).1989.分形与混沌:在地质学和地球物理学中的应用.陈喁等译.北京:地震出版社.1-227.

THE THEOR Y STUDY OF FRACTAL STAT IST I CAL MOD EL

AND ITS APPL I CAT I ON IN GEOLOG Y

Shen W ei　Zhao Pengda

(Ch ina U niversity of Geosciences,W uhan430074)

Abstract

T he fractal w as founded by M athem atician B.B.M andelbro t.A fractal is an object m ade of parts si m ilar to the w ho le in som e w ay,either exactly the sam e excep t fo r scale o r statisti2 cally the sam e.T he fractal geom etry deals w ith irregular phenom ena o r objects in nature, such as topograph ic relief,fracture strength of rock s,earthquake m agnitude etc..It is diffi2 cult to describe them by classic m athem atical m ethods.But there is a common characteristic among these phenom ena o r objects-self-si m ilar.F ractal di m ensi on m easures the degree of irregularity based on self-si m ilarity,and is also a num erical index that quantifies the self-si m ilarity of comp lex phenom ena.

T he fractal theo ry w as app lied to the m inerogenetic p redicti on in the1980’s.D.L.T ur2 co tte p ropo sed that there exists a fractal relati on betw een average grade and cum ulative o re reserves.B.B.M andelbro t considers that h igh2grade copper w ith non-unifo rm distributi on m ay have the m ultifractal structure.M eng X ianguo and Zhao Pengda suggest that the fractal structures exist in the geo logical data.F ractal di m ensi on and m ultifractal spectrum character2 ize the comp lex fractal structures quantitatively.

In the current paper w e advance the concep ti ons of the general fractal models and fractal di m ensi on and consider that m any geo logical models are the special cases of the general fractal models ,po inting out that the Pow er -functi on distributi on and the Pareto -functi on are the m athem atical base of the statistical model and p roofing that the Pow er -functi on distributi on po ssesses the fractal p roperty of scaling under upper truncati on .A new m ethod is developed on the basis of nonlinear regressi on to esti m ate the fractal param eters D .T he new m ethod of getting param eter C and D is mo re p recise than traditi onal m ethod and has m any advantages .T he fractal di m ensi on D can indicate the structure of random num ber o r samp le by si m ulated study .W e have established the surface o re body p redictive model (7),the surface o re cluster p redictive model (8)and o re reserves p redictive model (9).T ho se p redictive results fit the actual situati on .T he fractal di m ensi on D describes quantitatively the change o r trend of the density on the o re body distributi on .T he p refacto r param eter C is the initial value of the o re -body distributi on .T hey have i m po rtant significance in m ineral resources exp lo rati on ,p re 2dicti on and evaluati on .

Key words F ractal statistical model ,F ractal di m ensi on ,Si m ulated study ,M inero 2genetic p redicti on

42　2期申　维等:分形统计模型的理论研究及其在地质学中的应用

现代计量经济学模型体系解析

#学术探讨# 现代计量经济学模型体系解析* 李子奈刘亚清内容提要:本文对现代计量经济学模型体系进行了系统的解析,指出了现代计量经济学的各个分支是以问题为导向,在经典计量经济学模型理论的基础上,发展成为相对独立的模型理论体系,包括基于研究对象和数据特征而发展的微观计量经济学、基于充分利用数据信息而发展的面板数据计量经济学、基于计量经济学模型的数学基础而发展的现代时间序列计量经济学、基于非设定的模型结构而发展的非参数计量经济学,并对每个分支进行了扼要的描述。最后在/交叉与综合0的方向上提出了现代计量经济学模型理论的研究前沿领域。关键词:经典计量经济学时间序列计量经济学微观计量经济学一、引言计量经济学自20世纪20年代末30年代初诞生以来,已经形成了十分丰富的内容体系。一般认为,可以以20世纪70年代为界将计量经济学分为经典计量经济学(Classical Econometrics)和现代计量经济学(Mo dern Eco no metr ics),而现代计量经济学又可以分为四个分支:时间序列计量经济学(Tim e Ser ies Econo metrics)、微观计量经济学(M-i cro-econometrics)、非参数计量经济学(Nonpara-m etric Econometrics)以及面板数据计量经济学(Panel Data Eco nom etrics)。这些分支作为独立的课程已经被列入经济学研究生的课程表,独立的教科书也已陆续出版,应用研究已十分广泛,标志着它们作为计量经济学的分支学科已经成熟。据此提出三个问题:一是经典计量经济学的地位问题。既然现代计量经济学模型体系已经成熟,而且它们都是在经典模型理论的基础上发展的,那么经典模型还有应用价值吗?是不是凡是采用经典模型的研究都是低水平和落后的?二是现代计量经济学的各个分支的发展导向问题。即它们是如何发展起来的?三是现代计量经济学进一步创新和发展的基点在哪里?回答这些问题,对于正确理解计量经济学的学科体系,对于计量经济学的课程设计和教学内容安排,对于正确评价计量经济学理论和应用研究的水平,对于进一步推动中国的计量经济学理论研究,都是十分有益的。现代计量经济学的各个分支是以问题为导向,以经典计量经济学模型理论为基础而发展起来的。所谓/问题0,包括研究对象和表征研究对象状态和变化的数据。研究对象不同,表征研究对象状态和变化的数据具有不同的特征,用以进行经验实证研究的计量经济学模型既然不同,已有的模型理论方法不适用了,就需要发展新的模型理论方法。按照这个思路,就可以用图1简单地描述经典计量经济学模型与现代计量经济学模型各个分支之间的关系。本文试图从方法论的角度对现代计量经济学模型的发展,特别是现代计量经济学模型与经典计量经济学模型之间的关系进行较为系统的讨论,以期对未来我国计量经济学的发展研究提供借鉴和启示。本文的内容安排如下:首先分析经典计量经济学模型的基础地位,明确它在现代的应用价值,同时对发生于20世纪70年代的/卢卡斯批判0的实质进行讨论;然后依次讨论时间序列计量经济学、微观计量经济学、非参数计量经济学以及面板数据计量经济学的发展,回答它们是以什么问题为导向,以什么为目的而发展的;最后以/现代计量经济学模型体系的分解与综合0为题,讨论现代计量经济学的前沿研究领域以及从对我国计量经济学理论的创新和发展 ) 22 ) *本文受国家社会科学基金重点项目(08AJY001,计量经济学模型方法论基础研究)的资助。

经典单方程计量经济学模型多元线性回归模型

第三章、经典单方程计量经济学模型：多元线性回归模型一、内容提要本章将一元回归模型拓展到了多元回归模型，其基本的建模思想与建模方法与一元的情形相同。主要内容仍然包括模型的基本假定、模型的估计、模型的检验以及模型在预测方面的应用等方面。只不过为了多元建模的需要，在基本假设方面以及检验方面有所扩充。本章仍重点介绍了多元线性回归模型的基本假设、估计方法以及检验程序。与一元回归分析相比，多元回归分析的基本假设中引入了多个解释变量间不存在（完全）多重共线性这一假设；在检验部分，一方面引入了修正的可决系数，另一方面引入了对多个解释变量是否对被解释变量有显著线性影响关系的联合性F检验，并讨论了F检验与拟合优度检验的内在联系。本章的另一个重点是将线性回归模型拓展到非线性回归模型，主要学习非线性模型如何转化为线性回归模型的常见类型与方法。这里需要注意各回归参数的具体经济含义。本章第三个学习重点是关于模型的约束性检验问题，包括参数的线性约束与非线性约束检验。参数的线性约束检验包括对参数线性约束的检验、对模型增加或减少解释变量的检验以及参数的稳定性检验三方面的内容，其中参数稳定性检验又包括邹氏参数稳定性检验与邹氏预测检验两种类型的检验。检验都是以F检验为主要检验工具，以受约束模型与无约束模型是否有显著差异为检验基点。参数的非线性约束检验主要包括最大似然比检验、沃尔德检验与拉格朗日乘数检验。它们仍以估计无约束模型与受约束模型为基础，但以最大似然 χ分布为检验统计原理进行估计，且都适用于大样本情形，都以约束条件个数为自由度的2 量的分布特征。非线性约束检验中的拉格朗日乘数检验在后面的章节中多次使用。二、典型例题分析例1．某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为36 .0 . + = - 10+ 094 medu fedu .0 sibs edu210 131 .0 R2=0.214 式中，edu为劳动力受教育年数，sibs为该劳动力家庭中兄弟姐妹的个数，medu与fedu分别为母亲与父亲受到教育的年数。问

经典计量经济学应用模型

经典计量经济学应用模型一、单选题 1. 生产函数的要素边际替代率表示的是（）。 A ．维持产出不变，增加一单位的某一要素投入，需增加另一要素投入数量； B. 维持产出不变，减少一单位的某一要素投入，需增加另一要素投入数量； C ．要素K 对要素L 的边际替代率等于ln()/ln()L K MP K d d L MK ； D ．要素的边际替代率是要素的替代弹性。 2. 两种生产要素的比例的变化率与边际技术替代率的变化率之比叫做（）。 A ．要素的替代弹性 B. 要素的产出弹性 C ．边际技术替代率 D ．技术进步率 3. 下列生产函数中，要素的替代弹性为变量的是（） A ．线性生产函数 B. VES 生产函数 C ．C D -生产函数 D ．CES 生产函数 4. 下列生产函数中，要素的替代弹性为∞的是（） A ．线性生产函数 B. 投入产出生产函数 C ．C D -生产函数 D ．CES 生产函数 5. 下列生产函数中，要素的替代弹性分别为0和1的是（） A ．线性生产函数和C D -生产函数 B. 投入产出生产函数和C D -生产函数 C ．C D -生产函数和线性生产函数 D ．CES 生产函数和投入产出生产函数 6. 狭义技术进步是指（）。 A ．生产水平的提高 B. 产品价格的提高 C ．要素质量的提高 D ．管理水平的提高 7. 在C D -生产函数Y AL K αβ=中（）。 A ．α和β是产出弹性 B. α和β是边际产出 C ．α和β是替代弹性 D ．A 是要素替代弹性

8. CES 生产函数/12()m Y A K L ρρρδδ---=+中，01ρ<<，1δ越接近于1，表示（）。 A ．资本密集度越高 B. 资本密集度越低 C ．技术进步程度越高 D ．技术进步程度越高 9. 中性技术进步中，希克斯中性进步指的是（）。 A ．要素之比/K L 不随时间变化 B. 劳动产出率/Y L 不随时间变化 C ．自资本产出率/Y K 不随时间变化 D ．资本密集度/L K E E ω=随技术进步变大 10.当需求完全无弹性时，表示（） A ．价格与需求量之间存在完全线性关系 B.价格上升速度与需求量下降速度相等 C ．无论价格如何变动，需求量都不变 D ．价格上升，需求量也上升 11. 关于扩展的线性支出系统需求函数模型： (),1,2,,i i i j j j i b q r I p r i n p =+-=∑L 下列说法不正确的是（） A ．j γ是第j 种商品的基本需求量 B.i b 是第i 种商品的边际消费向 C ．()j j j I p r -∑是剩余收入用于购买第j 种商品的支出 D ．1i i b ≤∑ 12. 直接效用函数蒋孝勇表示为下列哪一项的函数（）。 A ．商品供应量 B. 商品需求量 C ．商品价格 D ．收入 13. 消费函数模型的一般形式为（）。 A ．t t t C Y αβμ=++ B. 011t t t C Y C ββμ-=++ C ．1(,)t t t t C f Y C μ-=+ D ．1(,)t t t t C f Y Y μ-=+ 14.下面四种单方程需求模型中，不能用于分析价格队需求量影响的模型时（）。 A ．线性需求函数模型 B. 对数线性需求函数模型 C ．耐用品消费调整模型 D ．状态调整模型

股票市场的分形特征和股票价格的FIGARCH模型研究

股票市场的分形特征和股票价格的FIGARCH模型研究股票市场投资的目的是获取最大投资收益，然而收益与风险相伴，在收益与风险之间决策常常是不容易的。传统的股票投资理论认为股票市场是有效的，均衡的，收益是风险的线性函数，收益的波动符合布朗运动，收益的分布是独立同分布的，方差和均值是稳定的。实际情况却是股票市场影响因素以及各因素之间相互作用关系复杂，受投资者个人及群体心理因素影响明显，股票的波动以及收益与风险的关系常常是非线性的，非均衡的，收益的方差和均值是自相关的、不稳定的，收益的波动符合分形布朗运动，表现出分形和混沌的特征。本文分析了股票市场的波动的非线性、非均衡、分形和混沌特征，建立并检验了几种股票的分形差分异方差时间序列模型。第一章回顾了股票定价理论的发展过程，介绍了九种在不同阶段具有代表性的股票定价理论，为把握股票定价理论的发展趋势，为以后各章的研究奠定基础。第二章分析了股票市场波动的一般特征和非线性非均衡特征，分析了股票投资收益和风险的影响因素，提出“虚拟性”、“风险性”、“流动性”和“投机性”是股票市场的核心特征。提出股票市场是远离平衡的、具有分形特征的非线性系统。投机是股票市场存在的前提和股票市场的天性。第二章分析了有效市场理论产生的背景，就有效市场理论成立的基本假设进行了检验，提出股票价格收益是不稳定的随机序列，收益分布不是正态分布，股票价格收益表现出非性，序列自相关性，异方差性。提出有效市场理论失灵的主要原因是投资者的非理性行为，信息反映的羊群效应，投资者存在反应过度和反应不足现象，股票市场的非均衡特征和股票市场的非线性特征。第四章分析并检验了股票市场的分形混沌特征，推导了投资函数，计算了表征股票市场分形特征的Hurst指数，关联维和最大Lyapunov指数，分析了股票价格的自相似性、长期记忆和循环周期，分析了股票价格的波动对初始条件的敏感性，提出中国股票市场具有混沌分形的特性，用传统的方差法度量股票风险是无效的，必须使用混沌分析能够理论来刻画股票收益的风险，建立收益模型。第五章介绍了股票价格的分形时间序列模型，介绍了检验时间序列平稳性的方差分析和单位根检验方法以及非平稳的处理方法，ARFIMA，GARCH和FIGARCH模型的建模方法和股票市场的分形特征和股票价格的FIGARCll模型叭

数学建模方法模型

数学建模方法模型一、统计学方法 1 多元回归 1、方法概述: 在研究变量之间的相互影响关系模型时候用到。具体地说:其可以定量地描述某一现象和某些因素之间的函数关系，将各变量的已知值带入回归方程可以求出因变量的估计值，从而可以进行预测等相关研究。 2、分类分为两类:多元线性回归和非线性线性回归;其中非线性回归可以通过一定的变化转化为线性回归，比如:y=lnx 可以转化为 y=u u=lnx 来解决;所以这里主要说明多元线性回归应该注意的问题。 3、注意事项在做回归的时候，一定要注意两件事: (1) 回归方程的显著性检验(可以通过 sas 和 spss 来解决) (2) 回归系数的显著性检验(可以通过 sas 和 spss 来解决) 检验是很多学生在建模中不注意的地方，好的检验结果可以体现出你模型的优劣，是完整论文的体现，所以这点大家一定要注意。 4、使用步骤: (1)根据已知条件的数据，通过预处理得出图像的大致趋势或者数据之间的大致关系; (2)选取适当的回归方程; (3)拟合回归参数; (4)回归方程显著性检验及回归系数显著性检验 (5)进行后继研究(如:预测等)

2 聚类分析 1、方法概述该方法说的通俗一点就是，将 n个样本，通过适当的方法(选取方法很多，大家可以自行查找，可以在数据挖掘类的书籍中查找到，这里不再阐述)选取 m 聚类中心，通过研究各样本和各个聚类中心的距离 Xij，选择适当的聚类标准，通常利用最小距离法(一个样本归于一个类也就意味着，该样本距离该类对应的中心距离最近)来聚类，从而可以得到聚类结果，如果利用sas 软件或者 spss 软件来做聚类分析，就可以得到相应的动态聚类图。这种模型的的特点是直观，容易理解。 2、分类聚类有两种类型: (1) Q型聚类:即对样本聚类; (2) R型聚类:即对变量聚类; 通常聚类中衡量标准的选取有两种: (1) 相似系数法 (2) 距离法聚类方法: (1) 最短距离法 (2) 最长距离法 (3) 中间距离法 (4) 重心法 (5) 类平均法 (6) 可变类平均法 (7) 可变法

建立计量经济学模型的步骤和要点1

阅读使人充实，会谈使人敏捷，写作使人精确。——培根建立计量经济学模型的步骤和要点一、理论模型的设计对所要研究的经济现象进行深入的分析，根据研究的目的，选择模型中将包含的因素，根据数据的可得性选择适当的变量来表征这些因素，并根据经济行为理论和样本数据显示出的变量间的关系，设定描述这些变量之间关系的数学表达式，即理论模型。生产函数就是一个理论模型。理论模型的设计主要包含三部分工作，即选择变量、确定变量之间的数学关系、拟定模型中待估计参数的数值范围。 1、确定模型所包含的变量在单方程模型中，变量分为两类。作为研究对象的变量，也就是因果关系中的“果”，例如生产函数中的产出量，是模型中的被解释变量；而作为“原因”的变量，例如生产函数中的资本、劳动、技术，是模型中的解释变量。确定模型所包含的变量，主要是指确定解释变量。可以作为解释变量的有下列几类变量：外生经济变量、外生条件变量、外生政策变量和滞后被解释变量。其中有些变量，如政策变量、条件变量经常以虚变量的形式出现。严格他说，上述生产函数中的产出量、资本、劳动、技术等，只能称为“因素”，这些因素间存在着因果关系。为了建立起计量经济学模型，必须选择适当的变量来表征这些因素，这些变量必须具有数据可得性。于是，我们可以用总产值来表征产出量，用固走资产原值来表征资本，用职工人数来表征劳动，用时间作为一个变量来表征技术。这样，最后建立的模型是关于总产值、固定资产原值、职工人数和时间变量之间关系的数学表达式。下面，为了叙述方便，我们将“因素”与“变量”间的区别暂时略去，都以“变量”来表示。关键在于，在确定了被解释变量之后，怎样才能正确地选择解释变量。首先，需要正确理解和把握所研究的经济现象中暗含的经济学理论和经济行为规律。这是正确选择解释变量的基础。例如，在上述生产问题中，已经明确指出属于供给不足的情况，那么，影响产出量的因素就应该在投入要素方面，而在当前，一般的投入要素主要是技术、资本与劳动。如果属于需求不足的情况，那么影响产出量的因素就应该在需求方面，而不在投入要素方面。这时，如果研究的对象是消费品生产，应该选择居民收入等变量作为解释变量；如果研究的对象是生产资料生产，应该选择固定资产投资总额等变量作为解释变量。由此可见，同样是建立生产模型，所处的经济环境不同、研究的行业不同，变量选择是不同的。法拉兹·日·阿卜——学问是异常珍贵的东西，从任何源泉吸收都不可耻。．阅读使人充实，会谈使人敏捷，写作使人精确。——培根其次，选择变量要考虑数据的可得性。这就要求对经济统计学有透彻的了解。计量经济学模型是要在样本数据，即变量的样本观测值的支持下，采用一定的数学方法估计参数，以揭示变量之间的定量关系。所以所选择的变量必须是统计指标体系中存在的、有可靠的数据来源的。如果必须引入个别对被解释变量有重要影响的政策变量、条件变量，则采用虚变量的样本观测值的选取方法。

基于分形模型的分布式虚拟现实系统的应用研究

※编程技术应用实践应用实践※※ 基于分形模型的分布式虚拟现实系统的应用研究刘鹏（太原工业学院）【摘要】比较深入地分析和说明了开发基于分形模型的分布式虚拟现实系统的可行性及其应用价值，并给出了详细的设计方案。【关键词】分形模型；分布式虚拟现实系统；设计方案 1引言在分布式虚拟现实系统的分析和设计中，特别关注交互性，这就要求开发出的系统必须具有较快的响应速度和较大的吞吐量【1】。而且，VR系统要求很强的实时性，图形更新速率至少要求16桢/s，图形客体行为反映的滞后要低于0.1s。随着技术的发展，对象的细节层次越来越复杂，就目前计算机图形学的水平而言，只要有足够的时间，就能生成准确度相当高的像照片一样的逼真图像。然而这种提高真实感的方法是采用增加物体多边形来获得，从而使计算复杂，绘图速度大大降低，无法满足DVR系统的需要【2】。 2DVR系统及其特点简介 DVR是指基于网络的虚拟环境，在这个环境中，位于不同物理位置的多个用户和多个虚拟环境通过网络相连接，并共享信息。它是网络和虚拟现实结合的产物，是一个支持多人通过网络实时进行交互的软件系统，每个用户在一个VR环境中通过计算机与其他用户进行交互。DVR系统一般由显示器，通信和控制设备，处理系统，数据网络四个基本部件组成【3】。 DVR追求良好的交互性，这就使得其对系统的响应速度和吞吐量有较高的要求。为了获得较好的交互反应时间，系统必须由相当少的软件层组成，在客户和服务器之间传递的数据量必须足够小。吞吐量受客户和服务器的处理速度，数据传输率的影响。在远程服务器上的数据必须从服务器进程传递到客户进程，经过两个计算机上若干个软件层。软件层的吞吐量与网络的吞吐量一样重要【1】。与此同时，DVR还要求系统具有良好的实时性，保持较高的图形刷新速率等。 3分形模型及其在DVR系统设计中的应用价值 3.1分形模型概述正如分形之父Mandelbrot所说的那样，分形是大自然的几何学。分形几何学是描述复杂自然形状及其形成机制的有力手段，为人类构建自然图形提供了一种新的科学基础，形成了一种全新的自然图像——生成论的自然图像。分形几何学能够借助迭代模拟自然界的复杂形状，这正是分形模型的独特魅力所在【4】。目前，发展较为成熟的分形几何模型有L-System（L-系统）与IFS（Iterated Function System，迭代函数系统）。它们都能以极少的存储数据来生成逼真度相当高的复杂自然形状。而且，对于任何自然物形态，都可以通过计算机把它们转换成IFS编码，即数据模型【4】。因此，分形模型具有极其广阔的应用前景。 3.2分形模型在DVR系统设计中的应用价值传统DVR系统中的几何模型一般用多边形来表示，通常具有两个信息：一个包含点的位置信息，另一个是点的拓扑结构信息，用来说明这些点之间的连接【2】。因此，在生成实体时通常要求较大的数据量，对网络的带宽要求很高。而且，在生成较为复杂的实体模型时，限于大量的数据传输和计算，使得图形的 1

第七章单方程计量经济学应用模型

第七章单方程计量经济学应用模型一、内容题要本章主要介绍了若干种单方程计量经济学模型的应用模型。包括生产函数模型、需求函数模型、消费函数模型以及投资函数模型、货币需求函数模型等经济学领域常见的函数模型。本章所列举的内容更多得关注了相关函数模型自身的发展状况，而不是计量模型估计本身。其目的，是使学习者了解各函数模型是如何发展而来的，即掌握建立与发展计量经济学应用模型的方法论。生产函数模型，首先介绍生产函数的几个基本问题，包括它的定义、特征、发展历程等，并对要素的替代弹性、技术进步的相概念进行了归纳。然后分别以要素之间替代性质的描述为线索与以技术要素的描述这线索介绍了生产函数模型的发展，前者包括从线性生产函数、C-D生产函数、不变替代弹性（CES）生产函数、变替代弹性（VES ）生产函数、多要素生产函数到超越对数生产函数的介绍；后者包括对技术要素作为一个不变参数的生产函数模型、改进的C-D、CES 生产函数模型、含体现型技术进步的生产函数模型、边界生产函数模型的介绍。最后对各种类型的生产函数的估计以及在技术进步分析中的应用进行了了讨论。与生产函数模型相仿，需求函数模型仍是从基本概念、基本特性、各种需求函数的类型及其估计方法等方面进行讨论，尤其是对线性支出系统需求函数模型的发展及其估计问题进行了较详细的讨论。消费函数模型部分，主要介绍了几个重要的消费函数模型及其参数估计问题，包括绝对收入假设消费函数模型、相对收入假设消费函数模型、生命周期假设消费函数模型、持久收入假设消费函数模型、合理预期的消费函数模型适应预期的消费函数模型。并对消费函数的一般形式进行了讨论。在其他常用的单方程应用模型中主要介绍了投资函数模型与货币需求函数模型，前者主要讨论了加速模型、利润决定的投资函数模型、新古典投资函数模型；后者主要讨论了古典货币学说需求函数模型、Keynes 货币学说需求函数模型、现代货币主义的货币需求函数模型、后Keynes 货币学说需求函数模型等。

计量经济学模型

多元线性回归模型一、建立模型社会物流总费用受多种综合因素的影响，如运输费用、仓储费用、包装费用、装卸搬运费用、流通加工费用、信息处理费用等，而其中最重要的因素就是运输费用和仓储费用，即运输费用和仓储费用与社会物流总费用之间存在单方向的因果关系；由此，我们可设以下回归模型：Yi=b0+b1*x1i+b2*x2i+ ui 现在以中国1995年至2004年物流总费用占GDP比例（%）的资料进行回归分析，并对估计模型进行检验。 1995年至2004年物流总费用占GDP比例（%）在Eviews中新建工作簿，定义变量“商品价格”（x1）、“消费者人均月收入”（x2）及“商品需求量”（y），并输入相关数据，得出相应散点图如下： ①x1 与y 的散点图为：

②x2与y 的散点图为：由两张散点图不能明确的看出x1、x2与y之间存在线性关系，故通过Eviews 软件计算，得出估计模型的参数结果如下：

由以上数据可知回归方程为： Y=11.57032+0.405599*x1 +0.794365*x2 （5.07）（2.67）（7.69） 1499.02=R 8909.02=R 37.62689=F 二、模型检验 1、经济意义检验： ①b0=11.57032，在运输费用与仓储费用接近于零时，仍存在其他物流费用；②b1=0.405599，说明运输费用与社会物流总费用之间存在正的线性关系，运输费用每增加1%，社会物流总费用增加0.405599% ③b2= 0.794365，说明仓储费用与社会物流总费用之间存在正的线性关系，仓储费用每增加1%，社会物流总费用增加0.794365% 2、计量经济学检验： ①拟合优度检验：本模型的拟合优度系数为0.914898，表明本模型具有较高的拟合优度，x1、x2对y 的解释能力较好； ②变量的显著性检验（t 检验）：方程的截距项和斜率项的t 检验值分别为5.07、2.67、7.69，均大于5%显著性水平下自由度为n-2=8的临界值t0.025(8)=1.860，模型参数估计显著，拒绝原假设H0； ③方程的显著性检验（F 检验）：有上图可知，F-statistic =37.62689；Prob(F-statistic)

第五章-单方程计量经济学应用模型试题及答案

第五章单方程计量经济学应用模型一、填空题： 1．当所有商品的价格不变时，收入变化1%所引起的第i 种商品需求量的变化百分比叫做需求的。 2．对于生活必需品，需求的收入弹性i E 的取值区间为，需求的自价格弹性的取值区间为。 3．当收入和其他商品的价格不变时，第j 种商品价格变化1%所引起的第i 种商品需求量的变化百分比，叫做需求的。 4．替代品的需求互价格弹性ij E 0；互补品的需求互价格弹性 ij E 0；无关商品的需求互价格弹性 ij E 0。 5．吉芬商品的需求自价格弹性 0。 6．西方国家发展的需求函数模型的理论模型，是由函数在最大化下导出的。而对数线性需求函数模型和线性需求函数模型则是由拟合得到的。 7．在线性支出系统需求函数模型 )(∑-+ =j j j i i i i r p V p b r q 中，V 表示总，i r 表示第i 种商品的需求量，i b 表示第i 种商品的边际份额。 8．在扩展的线性支出系统需求函数模型 )(∑-+ =j j j i i i i r p I p b r q 中，I 表示，i r 表示第i 种商品的需求量，i b 表示第i 种商品的消费倾向。 9．在绝对收入假设消费函数模型C Y Y t t t t =+++αββμ012 （t T =12,,,Λ）中，参数a 表示，且a 0； t t Y C 10ββ+=，参数b 1＜0，表示递减的边际消费倾向。 10．在绝对收入假设消费函数模型 C Y Y t t t t =+++αββμ012 （t T =12,,,Λ）中，参数b 1 0，以反映边际消费倾向规律。

数学建模统计模型

数学建模

论文题目：一个医药公司的新药研究部门为了掌握一种新止痛剂的疗效，设计了一个药物试验，给患有同种疾病的病人使用这种新止痛剂的以下4个剂量中的某一个：2 g，5 g，7 g和10 g，并记录每个病人病痛明显减轻的时间（以分钟计）. 为了解新药的疗效与病人性别和血压有什么关系，试验过程中研究人员把病人按性别及血压的低、中、高三档平均分配来进行测试. 通过比较每个病人血压的历史数据，从低到高分成3组，分别记作，和. 实验结束后，公司的记录结果见下表（性别以0表示女，1表示男）. 请你为该公司建立一个数学模型，根据病人用药的剂量、性别和血压组别，预测出服药后病痛明显减轻的时间.

一、摘要在农某医药公司为了掌握一种新止痛药的疗效，设计了一个药物实验，通过观测病人性别、血压和用药剂量与病痛时间的关系，预测服药后病痛明显减轻的时间。我们运用数学统计工具m i n i t a b软件，对用药剂量，性别和血压组别与病痛减轻

时间之间的数据进行深层次地处理并加以讨论概率值P （是否<）和拟合度R-S q的值是否更大（越大，说明模型越好）。首先，假设用药剂量、性别和血压组别与病痛减轻时间之间具有线性关系，我们建立了模型Ⅰ。对模型Ⅰ用m i n i t a b 软件进行回归分析，结果偏差较大，说明不是单纯的线性关系，然后对不同性别分开讨论，增加血压和用药剂量的交叉项，我们在模型Ⅰ的基础上建立了模型Ⅱ，用m i n i t a b软件进行回归分析后，用药剂量对病痛减轻时间不显着，于是我们有引进了用药剂量的平方项，改进模型Ⅱ建立了模型Ⅲ，用m i n i t a b 软件进行回归分析后，结果合理。最终确定了女性病人服药后病痛减轻时间与用药剂量、性别和血压组别的关系模型： Y=1x 3x 1x 3x 2 1 x 对模型Ⅱ和模型Ⅲ关于男性病人用m i n i t a b软件进行回归分析，结果偏差依然较大，于是改进模型Ⅲ建立了模型Ⅳ，用m i n i t a b软件进行回归分析后，结果合理。最终确定了男性病人服药后病痛减轻时间与用药剂量、性别和血压组别的关系模型：Y=1x1x 3x 2 1 x关键词止痛剂药剂量性别病痛减轻时间

计量经济学名词解释

1、计量经济学计量经济学是一门从数量上研究物质资料的生产、交换、分配、消费等经济关系和经济活动规律及其应用的科学。 2、数据质量数据满足明确或隐含需求程度的指标 3、相关分析主要研究变量之间的相互关联程度，用相关系数表示。包括简单相关和多重相关（复相关）。 4、回归分析（Regression Analysis）研究一个变量（因变量）对于一个或多个其他变量（解释变量）的数量依存关系。其目的在于根据已知的解释变量的数值来估计或预测因变量的总体平均值。 5.内生变量指由模型系统内决定的变量，取值在系统内决定 6、面板数据时间序列数据和截面数据的混合 7.异方差: 总体回归函数中的随机误差项满足同方差性，即它们都有相同的方差。如果这一假定不满足，则称线性回归模型存在异方差性。 8.自相关自相关是在时间序列资料中按时间顺序排列的观测值之间的相关或在横截面资料中按空间顺序排列的观测值之间的相关 9.多重共线性解释变量之间存在完全的线性关系或近似的线性关系。解释变量存在完全的线性关系叫完全多重共线；解释变量之间存在近似的线性关系叫不完全多重共线。 10.虚拟变量虚拟变量：在建立模型时，有一些影响经济变量的因素无法定量描述构造只取“0”或“1”的人工变量，通常称为虚拟变量，记为D 11.平稳序列是指时间序列的统计规律不会随着时间的推移而发生变化。

12.伪回归所谓“伪回归”，是指变量间本来不存在相依关系，但回归结果却得出存在相依关系的错误结论。 13.协整所谓协整，是指多个非平稳变量的某种线性组合是平稳的 14.前定变量所有的外生变量和滞后的内生变量。前定变量=外生变量＋滞后内生变量＋滞后外生变量 15.恰好识别恰好识别：能够唯一地估计出结构参数值。 16.结构式模型体现经济理论中经济变量之间的关系结构的联立方程模型，称为结构式模型17.过度识别过度识别：结构参数的估计值具有多个确定值 18.自回归模型自回归模型：指模型中的解释变量仅是X 的当期值与被解释变量Y 的若干期滞后值，它由于被解释变量的滞后期值对被解释变量现期做了回归，故叫做自回归模型。利用前期若干时刻的随机变量的线性组合来描述以后某时刻随机变量的线性回归模型。 19.拟合优度2R:拟合优度检验：指检验模型对样本观测值的拟合程度 20.修正的拟合优度2R 二、.

数学建模各种分析报告方法

现代统计学 1.因子分析(Factor Analysis) 因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系，即将相关比较密切的几个变量归在同一类中，每一类变量就成为一个因子（之所以称其为因子，是因为它是不可观测的，即不是具体的变量），以较少的几个因子反映原资料的大部分信息。运用这种研究技术，我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些，以及它们的影响力（权重）运用这种研究技术，我们还可以为市场细分做前期分析。 2.主成分分析主成分分析主要是作为一种探索性的技术，在分析者进行多元数据分析之前，用主成分分析来分析数据，让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用：a，了解数据。(screening the data),b,和cluster analysis一起使用，c，和判别分析一起使用，比如当变量很多，个案数不多，直接使用判别分析可能无解，这时候可以使用主成份发对变量简化。（reduce dimensionality）d,在多元回归中，主成分分析可以帮助判断是否存在共线性（条件指数），还可以用来处理共线性。主成分分析和因子分析的区别 1、因子分析中是把变量表示成各因子的线性组合，而主成分分析中则是把主成分表示成个变量的线性组合。 2、主成分分析的重点在于解释个变量的总方差，而因子分析则把重点放在解释各变量之间的协方差。 3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设包括：各个共同因子之间不相关，特殊因子（specific factor）之间也不相关，共同因子和特殊因子之间也不相关。 4、主成分分析中，当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候，的主成分一般是独特的；而因子分析中因子不是独特的，可以旋转得到不同的因子。 5、在因子分析中，因子个数需要分析者指定（spss根据一定的条件自动设定，只要是特征值大于1的因子进入分析），而指定的因子数量不同而结果不同。在主成分分析中，成分的数量是一定的，一般有几个变量就有几个主成分。和主成分分析相比，由于因子分析可以使用旋转技术帮助解释因子，在解释方面更加有优势。大致说来，当需要寻找潜在的因子，并对这些因子进行解释的时候，更加倾向于使用因子分析，并且借助旋转技术帮助更好解释。而如果想把现有的变量变成少数几个新的变量（新的变量几乎带有原来所有变量的信息）来进入后续的分析，则可以使用主成分分析。当然，这中情况也可以使用因子得分做到。所以这中区分不是绝对的。总得来说，主成分分析主要是作为一种探索性的技术，在分析者进行多元数据分析之前，用主成分分析来分析数据，让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用：a，了解数据。(screening the data),b,

(完整版)计量经济学知识点(超全版)

1．经济变量：经济变量是用来描述经济因素数量水平的指标。（3分） 2．解释变量：是用来解释作为研究对象的变量（即因变量）为什么变动、如何变动的变量。（2分）它对因变量的变动做出解释，表现为方程所描述的因果关系中的“因”。（1分）3．被解释变量：是作为研究对象的变量。（1分）它的变动是由解释变量做出解释的，表现为方程所描述的因果关系的果。（2分） 4．内生变量：是由模型系统内部因素所决定的变量，（2分）表现为具有一定概率分布的随机变量，是模型求解的结果。（1分） 5．外生变量：是由模型系统之外的因素决定的变量，表现为非随机变量。（2分）它影响模型中的内生变量，其数值在模型求解之前就已经确定。（1分） 6．滞后变量：是滞后内生变量和滞后外生变量的合称，（1分）前期的内生变量称为滞后内生变量；（1分）前期的外生变量称为滞后外生变量。（1分） 7．前定变量：通常将外生变量和滞后变量合称为前定变量，（1分）即是在模型求解以前已经确定或需要确定的变量。（2分） 8．控制变量：在计量经济模型中人为设置的反映政策要求、决策者意愿、经济系统运行条件和状态等方面的变量，（2分）它一般属于外生变量。（1分） 9．计量经济模型：为了研究分析某个系统中经济变量之间的数量关系而采用的随机代数模型，（2分）是以数学形式对客观经济现象所作的描述和概括。（1分） 10．函数关系：如果一个变量y的取值可以通过另一个变量或另一组变量以某种形式惟一地、精确地确定，则y与这个变量或这组变量之间的关系就是函数关系。（3分） 11．相关关系：如果一个变量y的取值受另一个变量或另一组变量的影响，但并不由它们惟一确定，则y与这个变量或这组变量之间的关系就是相关关系。（3分） 12．最小二乘法：用使估计的剩余平方和最小的原则确定样本回归函数的方法，称为最小二乘法。（3分） 13．高斯－马尔可夫定理：在古典假定条件下，OLS估计量是模型参数的最佳线性无偏估计量，这一结论即是高斯－马尔可夫定理。（3分） 14．总变差（总离差平方和）：在回归模型中，被解释变量的观测值与其均值的离差平方和。（3分） 15．回归变差（回归平方和）：在回归模型中，因变量的估计值与其均值的离差平方和，（2分）也就是由解释变量解释的变差。（1分） 16．剩余变差（残差平方和）：在回归模型中，因变量的观测值与估计值之差的平方和，（2分）是不能由解释变量所解释的部分变差。（1分） 17．估计标准误差：在回归模型中，随机误差项方差的估计量的平方根。（3分） 18．样本决定系数：回归平方和在总变差中所占的比重。（3分） 19．点预测：给定自变量的某一个值时，利用样本回归方程求出相应的样本拟合值，以此作为因变量实际值和其均值的估计值。（3分） 20．拟合优度：样本回归直线与样本观测数据之间的拟合程度。（3分） 21．残差：样本回归方程的拟合值与观测值的误差称为回归残差。（3分） 22．显著性检验：利用样本结果，来证实一个虚拟假设的真伪的一种检验程序。（3分）23．回归变差：简称ESS,表示由回归直线（即解释变量）所解释的部分（2分），表示x对y的线性影响（1分）。 24．剩余变差：简称RSS，是未被回归直线解释的部分（2分），是由解释变量以外的因素造成的影响（1分）。 25．多重决定系数：在多元线性回归模型中，回归平方和与总离差平方和的比值（1分），

分形统计模型的理论研究及其在地质学中的应用

第33卷　第2期1998年4月 SC IEN T I A GEOLO G I CA S I N I CA V o l .33N o.2 A p r .,1998 3地矿部“九五”基础研究重点项目《矿产定量预测的勘查评价新理论研究》和中国博士后科学基金项目资助。申　维,男,1957年2月生,博士后,数学地质专业。 1997210207收稿,1997209209改回,王桂凤编辑。分形统计模型的理论研究及其在地质学中的应用 3 申　维　赵鹏大 (中国地质大学数学地质研究所　武汉　430074) 摘　要　本文提出了一般分形模型和一般分维数的概念,认为许多地质模型是一般分形模型的特例,指出幂函数分布和帕累托分布是分形统计模型的数学基础,论证了幂函数分布在高端截尾条件下具有尺度不变的分形性质,根据非线性回归模型参数估计的方法,提出了求分维数的新方法,该方法具有许多优点。通过在计算机上产生随机数对分形统计模型进行模拟研究,以及通过实例说明分形统计模型应用的方法及步骤,并解释了分维数的实际意义。关键词　分形统计模型　分维数　模拟研究　成矿预测由于人类社会和自然界中广泛地存在无序、混乱、不规则和不光滑的复杂现象,传统的理论只能是简化或定性地刻画它们。分形理论的提出为揭示隐藏于混乱复杂现象中的精细结构和定量地刻画描述它们提供了理论基础。分形理论创立于70年代中期,其研究对象为自然界和社会活动中广泛存在的无序(无规则)而具有自相似性的系统。分形论借助于自相似性原理洞察隐藏于混乱现象中的精细结构;为人们从局部认识整体,从有限认识无限提供新的方法论;为不同学科发现规律性提供崭新的语言和定量的描述;为现代科学技术提供新思想新方法。分形理论不但为复杂的现象提供了一种简便的定量描述工具,而且它是一种辩证的思想方法和认识方法:部分与整体有相似性是整个的相对缩影,含有整体的信息,因而人们可以通过认识部分来认识整体。 1　一般分形模型设非线性模型 y =f (x ,Η )+Ε(1) 式中:x 为可观测的已知变量,可以是向量;y 为可观测的随机变量;Ε为不可观测具有零均值和有限方差Ρ2>0独立同分布F 的随机误差项(Ρ2未知);Η=(Η1,Η2,…,Ηp )′为未知参数,定义域为欧氏空间R p 上的一个子空间(;f 称为模型函数,它的函数形式已知,但含有未知参数Η。如果f 是Η的线性函数,则(1)式化为线性模型,否则就称为非线性模型。

计量经济学习题及答案

第一章绪论一、填空题： 1．计量经济学是以揭示经济活动中客观存在的__________为内容的分支学科，挪威经济学家弗里希，将计量经济学定义为__________、__________、__________三者的结合。 2．数理经济模型揭示经济活动中各个因素之间的__________关系，用__________性的数学方程加以描述，计量经济模型揭示经济活动中各因素之间__________的关系，用__________性的数学方程加以描述。 3．经济数学模型是用__________描述经济活动。 4．计量经济学根据研究对象和内容侧重面不同，可以分为__________计量经济学和__________计量经济学。 5．计量经济学模型包括__________和__________两大类。 6．建模过程中理论模型的设计主要包括三部分工作，即__________、____________________、____________________。 7．确定理论模型中所包含的变量，主要指确定__________。 8．可以作为解释变量的几类变量有__________变量、__________变量、__________变量和__________变量。 9．选择模型数学形式的主要依据是__________。 10．研究经济问题时，一般要处理三种类型的数据：__________数据、__________数据和__________数据。 11．样本数据的质量包括四个方面__________、__________、__________、__________。 12．模型参数的估计包括__________、__________和软件的应用等内容。 13．计量经济学模型用于预测前必须通过的检验分别是__________检验、__________检验、__________检验和__________检验。 14．计量经济模型的计量经济检验通常包括随机误差项的__________检验、__________检验、解释变量的__________检验。 15．计量经济学模型的应用可以概括为四个方面，即__________、__________、__________、__________。 16．结构分析所采用的主要方法是__________、__________和__________。二、单选题： 1．计量经济学是一门（）学科。 A.数学 B.经济 C.统计 D.测量

计量经济学简答题(经典)

1 ?什么是计量经济学？它与经济学、统计学和数学的关系怎样？答:1、计量经济学是一门运用经济理论和统计技术来分析经济数据的科学和艺术，它以经济理论为指导，以客观事实为依据，运用数学、统计学的方法和计算机技术，研究带有随机影响的经济变量之间的数量关系和规律。2、经济理论、数学和统计学知识是在计量经济学这一领域进行研究的必要前提，这三者中的每一个对于真正理解现代经济生活中的数量关系是必要的，但不充分，只有结合在一起才行。 2计量经济学三个要素是什么？经济理论、经济数据和统计方法。 3. 计量经济学模型的检验包括哪几个方面？其具体含义是什么？答：（1）经济意义检验，即根据拟定的符号、大小、关系，对参数估计结果的可靠性进行判断（2）统计检验，由数理统计理论决定。包括：拟合优度检验、总体显着性检验。（3）计量经济学检验，由计量经济学理论决定。包括:异方差性检验、序列相关性检验、多重共线性检验。（4）模型预测检验，由模型应用要求决定。包括:稳定性检验：扩大样本重新估计；预测性能检验:对样本外一点进行实际预测。 4. 计量经济学方法与一般经济数学方法有什么区别？答:计量经济学揭示经济活动中各因素之间的定量关系，用随机性的数学方程加以描述；一般经济数学方法揭示经济活动中各因素之间的理论关系，用确定性的数学方程加以描述。 5. 计量经济学模型研究的经济关系有那两个基本特征？答：一是随机关系，二是因果关系J - . ' /■ 6. 计量经济学研究的对象和核心内容是什么？答：计量经济学的研究对象是经济现象，是研究经济现象中的具体数量规律。计量经济学的核心内容包括两个方面：一是方法论，即计量经济学方法或者理论计量经济学。二是应用，即应用计量经济学。无论是理论计量经济学还是应用计量经济学，都包括理论、方法和数据三种要素。 7. 计量经济学中应用的数据类型怎样？举例解释其中三种数据类型的结构。答：计量经济模型：WAGE二f（EDU,EXP,GEND,山 1）时间序列数据是按时间周期收集的数据，如年度或季度的国民生产总值。 2）横截面数据是在同一时间点手机的不同个体的数据。如世界各国某年国民生产总值。 3）混合数据是兼有时间序列和横截面成分的数据，女口 1985 —2010世界各国GDP数据。 8. 建立与应用计量经济学模型的主要步骤有哪些？（1）理论模型的设计（2）样本数据的收集（3）模型参数的估计（4）模型的检验 9. 用OLS建立多元线性回归模型，有哪些基本假设？ 1、回归模型是线性的，模型设定无误且含有误差项 2、误差项总体均值为零 3、所有解释变量与误差项都不相关4、误差项互不相关（不存在序列相关性）5、误差项具有同方差6、任何一个解释变量都不是其他解释变量的完全线性函数7、误差项服从正态分布。 10. 随机误差项包含哪些因素影响？在解释变量中被忽略的因素的影响（影响不显着的因素、未知的影响因素、无法获得数据的因素）；变量观测值的观测误差的影响；模型关系的设定误差的影响；其它随机因素的影响。 11. 为什么要计算调整后的可决系数？在应用过程中发现，如果在模型中增加一个解释变量，？往往增大。这是因为残差平方和往往随着解释变量的增加而减少，至少不会增加。这就给人一个错觉：要使得模型拟合得好，只要增加解释变量即可。但是，现实情况往往是，由增加解释变量个数引起的的增大与拟合好坏无关，需调整。 =0.89表示被解释变量Y的变异性的89%能用估计的回归方程解释。 12. 叙述多重共线性的概念、后果和补救措施。概念:如果两个或多于两个解释变量之间出现了相关性，则称模型存在多重共线性。后果：1、估计量仍然是无偏的2、参数估计量的方差和标准差增大3、置信区间变宽4、t统计量会变小5、估计量对模型设定的变化及其敏感6、对方程的整体拟合程度几乎没有影响7、回归系数符号