当前位置:文档之家› 矿床统计预测期末考试重点内容

矿床统计预测期末考试重点内容

矿床统计预测期末考试重点内容
矿床统计预测期末考试重点内容

矿床统计预测是数学地质最活跃的一个分支,是数学地质在矿床预测中的应用。。

数学地质应用数学作为工具,并且运用现代电子计算技术自动处理地质数据,显示地质成果,并解决各类复杂的理论和实际问题。

数学地质解决问题的一般模式是:地质问题(模型)→数学问题(模型)→地质解释

数学地质必须以地质为基础和出发点。

矿床统计预测: 是运用数学地质的理论和方法进行矿产预测的科学和技术。研究对象为矿床/矿化体/成矿远景区。

成矿预测:圈定不同类别的远景区,预测不同级别的资源量。

经成矿预测工作所圈定的找矿有利地段称找矿远景区(可分为A、B、C三类)。

矿床统计预测以圈定出矿化体可能产出的空间位置(找矿远景区)、规模(资源量)和概率为目的。

矿产资源有地质与技术经济的两重性。

地壳中矿产分布的不均匀性:空间分布的不均匀为不同尺度的成矿区带的存在,时间分布的不均匀性为与构造运动有关的成矿期。

地质-成矿作用过程成矿规律是存在的,成矿过程由于种种因素是接近随机的。

概率论和数理统计是矿床统计预测的重要基础和手段。

相似类比是过去和目前成矿预测的最基本思路和方法。

地质环境相似类比, 是矿床模型法,“建模—外推”的方法。建立矿床模型的工作十分重要。

矿床模型可以分为:矿床成因模型,描述性模型,找矿模型。

矿床统计预测中常用多变量统计分析方法(各种信息关联及解释)。

研究区内的地质资料、对研究区内矿床的地质认识,是矿产预测的最主要依据。

矿床统计预测的基本原则:1.以地质和成矿规律研究为基础的原则

2.尺度水平对等原则:预测结果精度与所用资料的精度相适应。

3.循序渐进原则:比例尺由小到大、研究范围及预测远景区逐步缩小的顺序。

4.综合信息原则

5.矿床值分布律准则

6.发现率分析准则。单元(基本单元):将整个研究区划分为许多一定面积的小地段或小单位。

几何单元:等面积的正方形或长方形网格。

地质单元:以地质体为单元。

网格单元与地质体和矿化体没有很好的对应关系,因此不利于综合找矿信息的提取和关联。

控制单元(模型单元)可以是含矿单元,也可以是无矿单元。

控制区要对整个研究区在地质、矿产方面有代表性。控制区的研究程度较高。

地质数据:是对地质体、地质现象或地质作用观测研究而得到的数据。可分为:定量数据,逻辑数据,文本数据,图形数据,图像数据。地质数据预处理可提高地质数据的可利用程度,不可以起到减少变量,简化数学模型的作用。

地质变量中所谓的伪变量是为了计算方便而人为附加的一种变量。

数据的统计分布:计算统计特征值,作频率分布直方图和/或累计频率分布直方图,分布类型检验。

混合分布:两个或多个不同的随机变量的加权和的概率分布。密度函数(或频率分布)常呈现多峰状;也可能呈偏倚的单峰状,正偏(左)和负偏(右)。

混合总体的筛分:解析法,数值法,图解法。

地质变量是一种随机函数,地质变量的值可以是定量数据或定性数据。例如:矿床值是一个地质变量、各种控矿因素找矿标志。

地质变量分类,取值方法:观测变量(直接),综合变量(计算结果)。

通过规格化、标准化、均匀化变换,可以消除变量的量纲。

布尔转换:定量变量(0,1)

线性化: 非线性到线型。

找矿信息量计算法、特征分析法进行成矿远景区预测中,需要地质变量的取值都是逻辑型数据

熵H=-∑p*logp Hr=H/Hm Hm=LnN

单元岩性组合熵Hr为综合变量:表示一个单元内岩性的变异度或不确定性程度,也间接表示了局部地质作用的复杂程度。当单元内岩性单一,则Hr为0。Hr是将参加计算的组分同等看待,而不分重要成分和次要成分

H r值大(接近1):表示单元内出现多组分且分布均匀;

H r值小(接近0):表示单元内出现少组分且分布不均匀。

提取变量(变量构置):确定哪些地质现象或概念为地质变量的过程。注意事项:提取尽可能多的变量,一个变量在研究范围内不同位置上(单元)可能得到不同的值,尽量提取定量变量,与矿化无任何关系的因素或标志,不应提取。

秩相关系数:秩相关系数的取值范围(-1,1)。将两组数据中的数值用各自的秩来代替,得到两个序号序列。两序号序列相减,得到一个“序差”序列,其中元素记为 di 。

秩相关系数p的应用:1.确定有利找矿标志2.进行找矿远景区预测。

秩相关分析进行找矿远景区预测的实施过程为:(1)准备工作选择控制单元数目较多,并且包含有不同矿化程度的单元(2)形成矿床值序列将一种矿床值分为若干级别按照顺序排列。(3)对变量进行划分是通过对值域的划分,将一个变量变成多个不同的其它变量,以便于研究的深入。(4)频率统计(5)计算秩相关系数频率序列是指对频率的排序,应与矿床值序列的排列方式一致,因此,出现频率与矿床值之间的秩相关系数较大。(6)筛选有利标志找出秩相关系数最大的新变量,即为有利标志。(7)计算单元统计标志数对于每个单元,包括控制单元和未知单元,统计其中有利标志出现个数,称为单元有利标志数。(8)检验、预测

回归分析法预测:从不存在确定性关系的大量观测数据中,建立一个地质变量与另一个或其它几个地质变量之间统计关系的数学表达式。

一元线性回归分析中,F检验和t检验可以只进行两个检验中的一个,回归直线不一定通过观测数据的重心(X的均值,Y的均值),回归直线不一定通过坐标原点。

在多元线性回归分析中,检验回归系数的评价指标为:t统计量。

假设在回归分析中建立的回归模型很显著。由此可知,复相关系数接近于1。

标准回归方程各个自变量系数的绝对值不可能大于1。

在回归分析中,检验回归函数的整体评价为:拟合优度系数R2、F统计量。

多元线性回归分析方法,要求因变量服从正态分布。

回归模型 y = b0+ b1x1 + ei, 其中误差项ei不可观测。

SSR变差来源回归。 SSE 剩余 SST=SSR+SSE

拟合度R^2=SSR/SST R为复相关系数。

通过进行回归分析判断矿床的经济价值,确定临界值,进行成矿远景区预测。

判别分析法预测:是一种类比法,它是从定量角度,综合考虑多种地质变量或标志,按照某种最优化判别准则作为分类基础进行分析。可以分为费歇尔和贝叶斯判别法。

费歇判别思想是投影,使多维问题简化为一维问题来处理。

判别分析中,已知样品需标记成某个组别,不能同时属于多个组别。

判别分析中,变量无需转换为逻辑变量。

费歇准则建立的判别函数,能够使组内离差平方和达到最小,组间离差平方和达到最大。

判别分析:有导师(监督)

聚类分析:无导师(无监督)

原则:同一类相似,不同类差异。

Q型聚类分析是对样品(样品的相似程度)进行分类,而R型聚类分析是对变量进行分类。

R型聚类分析、R型因子分析都是立足于变量之间关系的多元统计分析方法。

k-均值聚类法是一种动态聚类方法,其中参数k的含义是预先指定的类别数。

聚类分析常用的聚类统计量有:距离系数、相似系数、相关系数。

一般来说,两个样品的相似系数较大,可能说明这两个样品在多变量空间上接近从原点出发的某一条直线。

特征分析法:研究模型单元控矿地质变量的特征,查明变量之间的内在联系,确定各个地质变量的找矿意义,建立起类比模式。

步骤:1. 建立地质概念模型,2. 选择控制区 3.计算乘积矩阵 4.确定变量的权系数 5.筛选标志,建立矿床模型 6. 评价研究区的含矿远景,圈定远景区

(1)将研究区未知单元各特征标志xi代入预测模型,求得关联度y值。y值越大,说明该单元的地质条件越接近,因而找矿远景越好。

(2)确定找矿远景单元y临界值(参照回归分析中回归估值临界值的确定)。将大于y临界值单元圈定为远景区。

(3)再据评价区与模型区的相似程度,分级表示远景大小 (I级,П级,Ш级远景区 )

Y临界值:1.类比法2.作y的单元频数曲线,找出拐点 3.等值线法 4.综合法;

未知单元求得到关联度越大,说明该单元的地质条件与矿床模型单元的地质条件越接近,因而找矿远景越好。

用特征分析法进行找矿远景区预测时,控制单元应属于同一类别

证据权法所使用的地质变量应为逻辑变量,控制单元要有含矿单元和无矿单元两类。

在证据权法中对每个单元,所有变量证据权总和F的值域是[0,1]。

在证据权法中先验概率和后验概率的值域都是在[0,1]。

使用证据权法进行找矿远景区预测,要求各证据图层尽量相互独立。

证据权法中后验概率不确定性的主要来源W+权重的不确定性W-权重的不确定性缺失数据的不确定性.

因子分析:研究矿物共生组合、成矿阶段划分问题,可以使用R型因子分析;研究重矿物组合并推断可能的蚀源区,可以使用Q型因子分析。

在主成分分析中,公共因子数等于变量数,而在因子分析中,公共因子数一般少于变量数。

在R型因子分析中,主因子所代表的物理(地质)意义是需要结合专业知识进行解释的。

假设R型因子分析中使用了p个变量,N个样品。由此可知,全部因子的数目是p个,主因子数目小于p,主因子模型有p个方程组,因子载荷小于N个。

数学地质的任务可概括为如下几个方面: [A]查明地质体的数学特征,建立地质体的数学模型[B]研究地质过程中的各种因素及其相互关系,建立地质过程的数学模型[C]研究适合地质任务和地质数据特点的数学分析方法,建立地质工作方法的数学模型

下面_等领域是属于现阶段数学地质学科的主要研究内容。[A]应用多元统计分析及类似方法对地质对象进行定量描述、分类、识别、预测、成因研究[B]地质作用过程的数值模拟 [C]地学(空间)数据库及信息系统[D]地质统计学

地质数据可以是[A]连续的[B]离散的[C]定性的[D]有空间坐标的

大多数地质数据具有如下特点:[A]多元性[B]坐标性[C]混合性[D]噪音强

对地质变量进行变换的目的主要是: [A]统一数据水平[B]消除量纲影响[C]增加变量个数

地质变量按其应用时的取值方式的不同,可以分为:[A]伪变量[B]乘积变量[C]观测变量[D]综合变量

地质变量的选择有助于[B]变量结构最优化[C]筛选出最重要的变量[D]减少空间维数简化系统

地质数据可以是[A]定量的[B]定性的[C]文字[D]图件

哪些变换方式可以统一地质变量的数据水平 [A]标准化变换[B]极差变换

地质变量的统计方法或数学方法很多,下面哪些方法是可行的[A]秩相关系数法[B]找矿信息量计算法[C]地质向量长度分析法[D]逐步回归分析法

地质变量研究的任务有[A]地质数据的预处理[B]地质变量的选择[C]地质变量的取值和综合变量的构置 [D]地质变量的变换

研究数据的统计分布特征,其主要意义有[A]分布函数是地质体的重要数学特征[B]查明分布函数有助于进行成因研究[C]查明分布律是进一步统计分析工作的基础[D]选择恰当的分布模型,进行各种必要的概率估计

14.对探索性数据分析技术,下面说明正确的有 [A]对数据来源的总体不作假设[B]常使用统计图表、图形和统计概括方法对数据的特征进行分析和描述。[D]对特异值数据同样可采用

15.对于正态分布的数据,下面说法正确的是 [C]偏度系数为0[D]落在(μ, μ+σ)的概率约为34%。

16.成矿远景区定量预测方法中 [B]定性数据和定量数据可以在同一模型中同时使用[C]定性数据可以转换为定量变量参与建模

17.成矿远景区定量预测提供的成果形式包括[A]定资源空间位置[B]定资源个数[C]定找矿概率[D]定控矿因素定量组合

18控制单元可以是_的单元。 [A]研究、了解程度较高[B]不含矿[C]形状不规则[D]含矿

19.矿产资源评价的基本形式有[C]总合式估计[D]非总合式估计

20.资源总量估计的不确定性或误差与下列因素有关[A]方法的适用性B]类比中的不确定性[C]新的或非常规矿床[D]矿石工艺方面的突破

21.费歇判别准则要求 [A]组间离差平方和尽可能大[B]组内离差平方和尽可能小22.国际地质对比计划98号专题推广的方法有 [A]矿床模型法[B]体积估计法[C]地壳丰度法[D]德尔菲法

23.下面关于回归分析中拟合优度系数(或称决定系数)的说法,正确的有 [B]多元线性回归中,拟合优度系数的大小受回归自变量个数的影响。[C]用于估计回归关系的最小二乘法等用于最大化拟合优度系数。[D]拟合优度系数越大,说明回归效果越好。

23.在回归分析中,检验回归函数的整体评价为[A]拟合优度系数R2[B]F统计量24.在趋势面分析中[B]化探中可利用趋势面来确定化探背景值[D]低次趋势面可以适当外推到观测值范围之外

25.在逐步回归法中, [A]能够获得最优回归方程[B]能够筛选变量,获得最优的变量组合[C]已引入方程中的变量可能又被剔除出回归方程

26.证据权法中后验概率不确定性的主要来源有[A]W+权重的不确定性[B]W-权重的不确定性[C]缺失数据的不确定性

27.在判别分析中,为了检验判别函数,下面说法正确的有 [B]计算比值组间离差平方和/组内离差平方和,结果越大越好。[C]将已知样本进行回判,判错率较小认为判别函数有效。 [D]采用以马氏距离D2为基础的F统计量进行检验

27.在证据权法计算中,下面说明正确的是[B]负权W-也可能为正[C]对比度系数C可以综合评价某个证据层的重要性

28.聚类分析常用的聚类统计量有 [A]距离系数[B]相似系数 [D]相关系数

矿床统计预测的一般程序:1.明确任务,工作设计;

2.收集资料;

3.划分基本单元;

4.选择控制区;5 研究地质变量;6建立预测模型; 7模型检验、外推预测,成果表达、解释. 8 提出地勘工作部署建议.

【矿床统计预测 实习指导】实习3c-聚类分析法

1 实习3c 用聚类分析法进行矿床统计预测 目的 通过实习,学会使用聚类分析法进行矿床统计预测,加深对该方法原理的理解。 要求 (1)根据所提供资料,自己动手完成预测计算的各个环节,按时提交实习报告。 (2)复习课程“聚类分析”有关内容。 资料 研究区是湖北省某地区一个铁矿成矿带。为在该区进行矿床统计预测,已将研究区划 分为500m ×500m 基本单元408个,并提取了多个地质变量。本次实习为简便只使用其中两个变量:1x 为单元磁异常值,2x 为单元中心距断裂喷发带的距离。表4-1(单元数据表)列出了实习所用数据。 表4-1单元数据表(表中?表示“未知”) 单元号 1 2 3 4 5 6 7 8 9 10 11 1x 1.86 3.0 1.3 2.45 1.28 2.5 2.0 0.78 1.09 1.5 2.4 2x 0.5 2.0 2.1 1.0 2.5 0.8 0.9 2.4 2.2 0.8 1.5 含矿情况 ? ? 无矿 有矿 无矿 ? ? ? ? 有矿 ? 方法步骤 第一步:分析研究区内铁矿特征及控矿地质条件和找矿标志,划分基本单元,提取地质变量、为各变量赋值。这些工作已经完成(不必重新做)。所用数据见表4-1。 第二步:数据预处理。主要是通过规格化或标准化变换,使数据统一量纲,从而使各变量的数据具有可比性,避免因有的变量数值大而得到突出、有的变量因数值小而受到压制、

2 从而各变量在分类中作用程度不同的情况。本次实习所用数据可以不做这种预处理。 第三步:选择相似性指标。本次实习中,选择距离系数ik d 。其定义为: ∑=-= p j kj ij ik x x d 1 2)( (Eq 4-1) 上式中 p 为变量数;ij x 表示第j 变量在第i 样品(单元)中的值;ik d 表示在多维变量空 间(本次实习是2维)内第i 和第k 两样品间的欧氏距离。两样品距离越近(小)越相似。 第四步:计算所有样品(单元)两两之间的距离,得到距离矩阵。尚未完成的距离矩阵如表4-2所示。请完成该表(还有39个距离需计算)。计算过程举1例说明如下: 22222 12121 ()(1.86 3.0)(0.5 2.0) 1.14 1.5 1.884p j j j d x x == -=-+-=+=∑ 余类推。注意可以将表4-1拷贝到Excel 工作表中,输入合适的公式,快速计算。 第五步:以距离矩阵为基础,用一次计算法画出聚类谱系图。方法: (1)画坐标轴。以距离为横坐标轴。它的刻度从0开始,最大刻度相当于所有距离中最大者。以样品(单元)为纵坐标轴,刻度单位1(即1个单元一行)。 表4-2距离矩阵 单元 1 2 3 4 5 6 7 8 9 10 11 1 0 2 1.884 0 3 1.695 1.703 0 4 0 5 1.902 0 6 0.206 2.095 0 7 0 8

多元统计分析期末试题

一、填空题(20分) 1、若),2,1(),,(~)(n N X p 且相互独立,则样本均值向量X 服从的分布 为 2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。 3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。 4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。 5、设样品),2,1(,),,(' 21n i X X X X ip i i i ,总体),(~ p N X ,对样品进行分类常用的距离 2 ()ij d M )()(1j i j i x x x x ,兰氏距离()ij d L 6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。 7、一元回归的数学模型是: x y 10,多元回归的数学模型是: p p x x x y 22110。 8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。 9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。 二、计算题(60分) 1、设三维随机向量),(~3 N X ,其中 200031014,问1X 与2X 是否独立?),(21 X X 和3X 是否独立?为什么? 解: 因为1),cov(21 X X ,所以1X 与2X 不独立。 把协差矩阵写成分块矩阵 22211211,),(21 X X 的协差矩阵为11 因为12321),),cov(( X X X ,而012 ,所以),(21 X X 和3X 是不相关的,而正态分布不相关与相互

多元统计分析期末复习试题

第一章: 多元统计分析研究的内容(5点) 1、简化数据结构(主成分分析) 2、分类与判别(聚类分析、判别分析) 3、变量间的相互关系(典型相关分析、多元回归分析) 4、多维数据的统计推断 5、多元统计分析的理论基础 第二三章:

二、多维随机变量的数字特征 1、随机向量的数字特征 随机向量X 均值向量: 随机向量X 与Y 的协方差矩阵: 当X=Y 时Cov (X ,Y )=D (X );当Cov (X ,Y )=0 ,称X ,Y 不相关。 随机向量X 与Y 的相关系数矩阵: 2、均值向量协方差矩阵的性质 (1).设X ,Y 为随机向量,A ,B 为常数矩阵 E (AX )=AE (X ); E (AXB )=AE (X )B; D(AX)=AD(X)A ’; Cov(AX,BY)=ACov(X,Y)B ’; (2).若X ,Y 独立,则Cov(X,Y)=0,反之不成立. (3).X 的协方差阵D(X)是对称非负定矩阵。例2.见黑板 三、多元正态分布的参数估计 2、多元正态分布的性质 (1).若 ,则E(X)= ,D(X)= . )' ,...,,(),,,(2121P p EX EX EX EX μμμ='= )' )((),cov(EY Y EX X E Y X --=q p ij r Y X ?=)(),(ρ) ,(~∑μP N X μ ∑ p X X X ,,,21

特别地,当 为对角阵时, 相互独立。 (2).若 ,A为sxp 阶常数矩阵,d 为s 阶向量, AX+d ~ . 即正态分布的线性函数仍是正态分布. (3).多元正态分布的边缘分布是正态分布,反之不成立. (4).多元正态分布的不相关与独立等价. 例3.见黑板. 三、多元正态分布的参数估计 (1)“ 为来自p 元总体X 的(简单)样本”的理解---独立同截面. (2)多元分布样本的数字特征---常见多元统计量 样本均值向量 = 样本离差阵S= 样本协方差阵V= S ;样本相关阵R (3) ,V分别是 和 的最大似然估计; (4)估计的性质 是 的无偏估计; ,V分别是 和 的有效和一致估计; ; S~ , 与S相互独立; 第五章 聚类分析: 一、什么是聚类分析 :聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。用于对事物类别不清楚,甚至事物总共可能有几类都不能确定的情况下进行事物分类的场合。聚类方法:系统聚类法(直观易懂)、动态聚类法(快)、有序聚类法(保序)...... Q-型聚类分析(样品)R-型聚类分析(变量) 变量按照测量它们的尺度不同,可以分为三类:间隔尺度、有序尺度、名义尺度。 μ ) ,(~∑μP N X ) ,('A A d A N s ∑+μ) () 1(,,n X X X )' ,,,(21p X X X )' )(() () (1 X X X X i i n i --∑=n 1 X μ∑μ X ) 1 , (~∑n N X P μ) ,1(∑-n W p X X

期末成绩分析表

期末考试质量分析报告 以质量求生存以反思促进步 2013——2014年第一学期的学生期末监测已经落下帷幕,我校比较圆满地完成了此次任 务。区教研室对三年级语文、数学学科进行了调考,相对以往各自为阵的学校自主考试,这种形式能站在一个宏观的角度对全区的教育质量作更全面的监测,提高了考试的信度和效度。这种“纸笔测试”能更好的发挥“指挥棒”的作用,使之真正体现新课程理念,与课程改革相适应,达到以测导教、以测促教的功能。测试后的质量分析如同一面明镜,不仅显示了测试中学生知识掌握应用的情况,还反射出教师在教学中的得与失,更让我们更为清醒地认识到——一份耕耘,换来一份欣喜的收获;一份付出,换来一份真诚的回报。 现对我校的各科成绩做如下分析汇报: 一、试卷来源及试卷评价: 本次考试的试卷由区教研室统一命题,经教导处征求意见,至此时没有学科教师反映对试卷的意见。纵观整个试卷,本期末测查试卷是一份精心设计有价值的试卷,内容覆盖面广,重点突出,有一定的代表性,试卷题量适中,难易适度,有一定的层次性,分值分配合理,既 注重对基础知识的考察,又注重对学生能力的培养、归纳,能较全面的检查学生对本学期所学基础知识的掌握情况。 以语文、数学两个学科为例: 【语文】: 较好体现了《新课程标准》的新理念和目标体系。具有以下特点: 1、内容丰富,结构宽阔。 试卷是以《标准》所规定的教学内容为依据,注意题型的多样性,能够对学生的素质进行全面评价。同时根据整套语文教材的知识、能力和情感发展总体结构进行设计的,比较全面地考查了学生的学习情况,在注重考查学生的基础知识和基本能力的同时,适当考查了教学过程,能较好地反映出学生的实际知识的掌握情况。 2、重视积累,提高素质 语文知识讲究的是积累,从试卷的编制上看,细节多,基础知识面广,试题所包含的知识点比较全面,题中涵盖了拼音、汉字、词语、句子、段落、篇章等多方面的考察。并且题目多样,评分项目详细、合理。 【数学】: 1、突出基础性与全面性 试卷能对1——6年级上学期所学知识的主要内容进行较为系统、全面的考核,数与代数、 空间与图形、统计与概率、实践与综合应用等方面的考查知识均能有机地涵盖在其中,突出了基础性与全面性。

多元统计分析模拟试题教学提纲

多元统计分析模拟试 题

多元统计分析模拟试题(两套:每套含填空、判断各二十道) A卷 1)判别分析常用的判别方法有距离判别法、贝叶斯判别法、费歇判别法、逐 步判别法。 2)Q型聚类分析是对样品的分类,R型聚类分析是对变量_的分类。 3)主成分分析中可以利用协方差矩阵和相关矩阵求解主成分。 4)因子分析中对于因子载荷的求解最常用的方法是主成分法、主轴因子法、 极大似然法 5)聚类分析包括系统聚类法、模糊聚类分析、K-均值聚类分析 6)分组数据的Logistic回归存在异方差性,需要采用加权最小二乘估计 7)误差项的路径系数可由多元回归的决定系数算出,他们之间的关系为 = 8)最短距离法适用于条形的类,最长距离法适用于椭圆形的类。 9)主成分分析是利用降维的思想,在损失很少的信息前提下,把多个指标转 化为几个综合指标的多元统计方法。 10)在进行主成分分析时,我们认为所取的m(m

多元统计分析模拟考题及答案

一、判断题 ( 对 )112(,,,)p X X X X '=L 的协差阵一定是对称的半正定阵 ( 对 )2标准化随机向量的协差阵与原变量的相关系数阵相同。 ( 对)3典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系 的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。 ( 对 )4多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据分析方法。 ( 错)5),(~),,,(21∑'=μp p N X X X X Λ,,X S 分别是样本均值和样本离差阵,则, S X n 分别是,μ∑的无偏估计。 ( 对)6),(~),,,(21∑'=μp p N X X X X Λ,X 作为样本均值μ的估计,是 无偏的、有效的、一致的。 ( 错)7 因子载荷经正交旋转后,各变量的共性方差和各因子的贡献都发生了变化 ( 对)8因子载荷阵()ij A a =中的ij a 表示第i 个变量在第j 个公因子上的相对重要性。 ( 对 )9 判别分析中,若两个总体的协差阵相等,则Fisher 判别与距离判别等 价。 (对)10距离判别法要求两总体分布的协差阵相等,Fisher 判别法对总体的分布无特定的要求。 二、填空题 1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、样本相关系数矩阵. 2、设∑是总体1(,,)m X X X =L 的协方差阵,∑的特征根(1,,)i i m λ=L 与相应的单 位正交化特征向量 12(,,,)i i i im a a a α=L ,则第一主成分的表达式是 11111221m m y a X a X a X =+++L ,方差为 1λ。 3设∑是总体1234(,,,)X X X X X =的协方差阵,∑的特征根和标准正交特征向量分别 为:' 112.920(0.1485,0.5735,0.5577,0.5814)U λ==--- ' 221.024(0.9544,0.0984,0.2695,0.0824)U λ==- '330.049(0.2516,0.7733,0.5589,0.1624)U λ==--

矿床统计预测基本理论与准则

矿床统计预测基本理论与准则 一、矿床统计预测基本特点 矿床统计预测以多元统计分析或其他数学方法为基本工具,以矿床/矿化体/成矿远景区及相关地质体和地质过程为研究对象,以电子计算机为手段,以查明各种控矿因素和找矿标志组合对成矿和找矿的作用(定量),以最终圈定出矿化体可能产出的空间位置、规模和概率为目的。 1、概率论和数理统计是矿床统计预测的重要基础和手段。矿床统计预测从研究矿床值的统计分布特征和各种地质因素及其组合的控矿概率等入手,利用多元统计分析方法进行矿产资源定量预测。 2、相似-类比原则是矿床统计预测工作的基本思路和原则。模型单元和未知单元的定量类比。 3、矿床统计预测是一项在不确定条件下的统计决策工作,预测结果是具有一定成功概率的随机事件(不确定性),在预测结果基础上的进一步勘查工作具有较大的风险性(不确定性)。 二、矿床统计预测的基本思路和任务 以控矿地质条件为重点的矿床成因研究、建立矿床地质概念模型矿床统计预测基本思路矿床统计预测基本任务: 1、圈定成矿远景区,预测出矿床可能产出的位置; 2、预测成矿远景区中某种矿床可能存在的概率大小; 3、预测矿床值的可能大小; 4、定量评价各种控矿因素和找矿标志及其不同状态和组合对成矿的作用。

三、矿床统计预测基本理论 1、相似-类比理论(Analogue) (1)在相似的成矿地质条件下,应该有相似的矿床或成矿系列产出。或者说,矿床类型相似,成矿条件和控矿地质标志组合相似。 (2)在相同的、足够大的区域内,应该有相似的矿产资源量。 (3)相似类型的矿床及其最佳控矿地质标志组合,具有相似的数学特征。 (4)矿床模型 对某类矿床成矿条件、成矿环境、矿化特征、控矿因素和找矿标志等要素的高度综合。描述性模型(提供找矿标志)VS 成因模型(提供找矿有利地区)矿床成因模型 VS 找矿模型 (对各种成矿条件、控矿因素、矿床地质特征、矿化特征和找矿信息的综合)矿床模型可能随人们对矿床了解的深入而改变。 (5)矿床模式→找矿模型→成矿地质构造背景 陆缘、岛弧、造山带、裂谷?主要控矿地质条件:地层、构造、岩浆岩矿体特征:几何特征、空间特征、结构特征矿化特征:矿物和地球化学组成、蚀变组合等矿化标志:地质、地球化学、地球物理、遥感 (6)相似类比理论对矿床统计预测的指导作用 根据相似-类比理论,我们可以从已知矿床(单元)出发,建立矿床的成矿和找矿模型,筛选出有效、重要的控矿因素和找矿标志,进而选择合适的数学模型对未知矿床(单元)进行预测,圈定出有找矿远景的区域。 基于相似类比理论成矿预测的不足,根据已知的矿床模型不能预测迄今未曾发现过的新类型矿床。根据已知矿床模型不能预测比已知矿床规模更大的超大型

多元统计分析期末试题及答案.doc

22121212121 ~(,),(,),(,),, 1X N X x x x x x x ρμμμμσρ ?? ∑==∑= ??? +-1、设其中则Cov(,)=____. 10 31 2~(,),1,,10,()()_________i i i i X N i W X X μμμ=' ∑=--∑L 、设则=服从。 ()1 2 34 433,4 92,32 16___________________ X x x x R -?? ?'==-- ? ?-? ? =∑、设随机向量且协方差矩阵则它的相关矩阵 4、 __________, __________, ________________。 215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--L 、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。 12332313116421(,,)~(,),(1,0,2),441, 2142X x x x N x x x x x μμ-?? ?'=∑=-∑=-- ? ?-?? -?? + ??? 、设其中试判断与是否独立? (), 1 2 3设X=x x x 的相关系数矩阵通过因子分析分解为 211X h = 的共性方差111X σ= 的方差21X g = 1公因子f 对的贡献1213 30.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.10320 13 R ? ? - ????? ? -?? ? ? ?=-=-+ ? ? ? ??? ? ? ????? ? ???

【矿床统计预测 实习指导】实习2-聚类分析法

1 实习2 用聚类分析法进行矿床统计预测 姓名_________ 班级_________ 学号___________ 成绩_________ 目的 通过实习,学会使用聚类分析法进行矿床统计预测,加深对该方法原理的理解。 要求 (1)根据所提供资料,自己动手完成预测计算的各个环节,按时提交实习报告。 (2)复习课程“聚类分析”有关内容。 资料 研究区是湖北省某地区一个铁矿成矿带。为在该区进行矿床统计预测,已将研究区划 分为500m ×500m 基本单元408个,并提取了多个地质变量。本次实习为简便只使用其中两个变量:1x 为单元磁异常值,2x 为单元中心距断裂喷发带的距离。表4-1(单元数据表)列出了实习所用数据。 表4-1单元数据表(表中?表示“未知”) 单元号 1 2 3 4 5 6 7 8 9 10 11 1x 1.86 3.0 1.3 2.45 1.28 2.5 2.0 0.78 1.09 1.5 2.4 2x 0.5 2.0 2.1 1.0 2.5 0.8 0.9 2.4 2.2 0.8 1.5 含矿情况 ? ? 无矿 有矿 无矿 ? ? ? ? 有矿 ? 方法步骤 第一步:分析研究区内铁矿特征及控矿地质条件和找矿标志,划分基本单元,提取地质变量、为各变量赋值。这些工作已经完成(不必重新做)。所用数据见表4-1。 第二步:数据预处理。主要是通过规格化或标准化变换,使数据统一量纲,从而使各

2 变量的数据具有可比性,避免因有的变量数值大而得到突出、有的变量因数值小而受到压制、从而各变量在分类中作用程度不同的情况。本次实习所用数据可以不做这种预处理。 第三步:选择相似性指标。本次实习中,选择距离系数ik d 。其定义为: ∑=-= p j kj ij ik x x d 1 2)( (Eq 4-1) 上式中 p 为变量数;ij x 表示第j 变量在第i 样品(单元)中的值;ik d 表示在多维变量空 间(本次实习是2维)内第i 和第k 两样品间的欧氏距离。两样品距离越近(小)越相似。 第四步:计算所有样品(单元)两两之间的距离,得到距离矩阵。尚未完成的距离矩阵如表4-2所示。请完成该表(还有39个距离需计算)。计算过程举1例说明如下: 22222 12121 ()(1.86 3.0)(0.5 2.0) 1.14 1.5 1.884p j j j d x x == -=-+-=+=∑ 余类推。注意可以将表4-1拷贝到Excel 工作表中,输入合适的公式,快速计算。 第五步:以距离矩阵为基础,用一次计算法画出聚类谱系图。方法: (1)画坐标轴。以距离为横坐标轴。它的刻度从0开始,最大刻度相当于所有距离中最大者。以样品(单元)为纵坐标轴,刻度单位1(即1个单元一行)。 表4-2距离矩阵 单元 1 2 3 4 5 6 7 8 9 10 11 1 0 2 1.884 0 3 1.695 1.703 0 4 0 5 1.902 0 6 0.206 2.095 0 7

矿床统计预测题库

Tag A 绪论 B 变量 C 原理 D 方法 说明 学科介绍 地质勘探数据统计分布特征;地质变量研究研究 基本理论、准则;潜力评价概论;成矿远景区预测概论;比例尺、单元划分及控制区确定 资源总量估计和潜力评价方法 秩相关系数法预测、找矿信息量计算法预测、证据权法预测、特征分析法预测 多元统计方法:回归分析、判别分析、聚类分析、主成分分析及因子分析、趋势面分析 地质统计学,是地质学中使用的统计分析理论方法的统称。 建立地质体、地质过程的数学模型,常是数学地质研究的重要任务。 矿产资源的形成和分布,常既有一定程度的确定性,也有一定程度的随机性。 矿床统计预测,就是用地质统计学的方法进行矿产预测。 数学地质必须以数学为基础和岀发点。 数学地质的主要对象是地质体、地质过程及地质工作方法。 数学地质是矿床统计预测的一个组成部分。 数学地质是以解决地质问题为目标和岀发点,以数学为工具,以计算机为手段,研究客观世界规律性 的科学。 数学地质是用数学方法和计算机手段,研究解决地质问题的科学技术。 在矿床统计预测中,研究定性数据的统计分析方法是不可忽视的。 从数量众多的地质变量中筛选最重要的变量,其目的是要达到变量数目最优化。 地质变量中所谓的伪变量是为了计算方便而人为附加的一种变量。 地质数据预处理可提高地质数据的可利用程度。 地质数据预处理可以起到减少变量,简化数学模型的作用。 规格化变换并不能消除地质变量的量纲。 矿产预测的综合信息原则,要求矿产预测工作中尽量同时使用不同比例尺的资料。 矿床值不是地质变量。 矿体的厚度,钻孔的 GPS 坐标,矿石的品位化验值都是比例型数据。 两个变量之间的秩相关系数,不可能是负数。 随着空间位置不同,表示某一地质现象可取不同数值的量叫做地质变量。 所谓矿床值,是一种直接反映矿产资源数量、质量或空间分布等属性的地质变量。 所谓网格化,是指通过插值将空间上不规则分布的数据变为按规则网格分布的数据。 通过布尔转换,可以将定量变量变为逻辑变量。 通过规格化变换,可以消除变量的量纲。 通过均匀化变换可以将地质变量变成符合均匀分布的变量。 相关系数和秩相关系数的值域都是 [-1,1]。 选择地质变量应以数学方法为基础,以地质方法为辅。 一个服从对数正态分布的变量,取对数后将会服从正态分布。 一个服从正态分布的变量,取对数后将会服从对数正态分布。 在综合预测中所谓“地物化遥”,是指地质、物探、化探、遥感。 当采用多个地质变量进行矿床统计预测时,一般最好选择那些互相密切相关的变量。 矿产预测中的循序渐进原则,要求矿产预测工作尽量按照比例尺由大到小的顺序有系统地进行。 矿产预测中的循序渐进原则,要求矿产预测工作尽量按照比例尺由小到大、靶区逐步缩小的顺序有系 统地进行。 矿产资源既有地质属性,也有技术经济属性。 矿产资源是地质作用的自然产物,因此与技术经济条件没有关系。 矿床统计预测的尺度一致原则的基本要求是,所划分的网格单元大小和形状保持一致。 矿床统计预测应当遵循以地质成矿规律研究为基础的原则。 矿床统计预测中,一般来说工作比例尺越小,划分单元大小也相应地越小。 所谓未知单元,是指各地质变量的取值都未知的单元。 通过矿床统计预测估计的资源量级别一般都有较高的经济可行性和地质可靠度。 为了建立较好的预测模型,一般应尽可能选择、使用互相独立的预测标志。 一般来说,根据预测结果提出研究区内进一步地勘工作部署建议,是矿床统计预测中可有可无的一个 环节。 一般来说,矿床统计预测方法不能预测矿床的类型或质量。 一般来说,矿床统计预测遵循了相似类比的基本思路。 一般来说,在矿床统计预测中,地质成矿规律研究并不是一项重要的工作。 一般来说,在矿床统计预测中应当对预测模型和预测结果进行地质解释。 一般来说,找矿远景区内不应当有已知矿床。 已知矿床不应出现在模型单位之外的区域。 应用矿床统计预测方法,既可以预测矿床产岀的位置,也可以预测其类型或质量。 找矿远景区都是已知有矿床存在的地段。 判断题 Tag 答案 A 绪论 X A 绪论 V A 绪论 V A 绪论 X A 绪论 X A 绪论 V A 绪论 X A 绪论 V A 绪论 V A 绪论 V B 变量 X B 变量 V B 变量 V B 变量 X B 变量 X B 变量 X B 变量 X B 变量 X B 变量 X B 变量 V B 变量 V B 变量 V B 变量 V B 变量 V B 变量 X B 变量 V B 变量 X B 变量 V B 变量 X B 变量 V C 原理 X C 原理 X C 原理 V C 原理 V C 原理 X C 原理 X C 原理 V C 原理 X C 原理 X C 原理 X C 原理 V C 原理 X C 原理 X C 原理 V C 原理 X C 原理 V C 原理 X C 原理 X C 原理 V C 原理 X D 方法 V D 方法 X

多元统计分析期末复习试题

第一章: 多元统计分析研究的容(5点) 1、简化数据结构(主成分分析) 2、分类与判别(聚类分析、判别分析) 3、变量间的相互关系(典型相关分析、多元回归分析) 4、多维数据的统计推断 5、多元统计分析的理论基础 第二三章: 二、多维随机变量的数字特征 1、随机向量的数字特征 随机向量X均值向量: 随机向量X与Y的协方差矩阵: 当X=Y时Cov(X,Y)=D(X);当Cov(X,Y)=0 ,称X,Y不相关。 随机向量X与Y的相关系数矩阵: 2、均值向量协方差矩阵的性质 (1).设X,Y为随机向量,A,B 为常数矩阵 E(AX)=AE(X); E(AXB)=AE(X)B; D(AX)=AD(X)A’; )' ,..., , ( ) , , , ( 2 1 2 1P p EX EX EX EXμ μ μ = ' = )' )( ( ) , cov(EY Y EX X E Y X- - = q p ij r Y X ? =) ( ) , (ρ

Cov(AX,BY)=ACov(X,Y)B ’; (2).若X ,Y 独立,则Cov(X,Y)=0,反之不成立. (3).X 的协方差阵D(X)是对称非负定矩阵。例2.见黑板 三、多元正态分布的参数估计 2、多元正态分布的性质 (1).若 ,则E(X)= ,D(X)= . 特别地,当 为对角阵时, 相互独立。 (2).若 ,A为sxp 阶常数矩阵,d 为s 阶向量, AX+d ~ . 即正态分布的线性函数仍是正态分布. (3).多元正态分布的边缘分布是正态分布,反之不成立. (4).多元正态分布的不相关与独立等价. 例3.见黑板. 三、多元正态分布的参数估计 (1)“ 为来自p 元总体X 的(简单)样本”的理解---独立同截面. (2)多元分布样本的数字特征---常见多元统计量 样本均值向量 = 样本离差阵S= 样本协方差阵V= S ;样本相关阵R (3) ,V分别是 和 的最大似然估计; (4)估计的性质 是 的无偏估计; ,V分别是 和 的有效和一致估计; ; S~ , 与S相互独立; 第五章 聚类分析: 一、什么是聚类分析 :聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。用于对事物类别不清楚,甚至事物总共可能有几类都不能确定的情况下进行事物分类的场合。聚类方法:系统聚类法(直观易懂)、动态聚类法(快)、有序聚类法(保序)...... Q-型聚类分析(样品)R-型聚类分析(变量) 变量按照测量它们的尺度不同,可以分为三类:间隔尺度、有序尺度、名义尺度。 二、常用数据的变换方法:中心化变换、标准化变换、极差正规化变换、对数变换(优缺点) 1、中心化变换(平移变换):中心化变换是一种坐标轴平移处理方法,它是先求出每个变量的样本平均值,再从原始数据中减去该变量的均值,就得到中心化变换后的数据。不改变样本间的相互位置,也不改变变量间的相关性。 2、标准化变换:首先对每个变量进行中心化变换,然后用该变量的标准差进行标准化。 经过标准化变换处理后,每个变量即数据矩阵中每列数据的平均值为0,方差为1,且也不再具有量纲,同样也便于不同变量之间的比较。 3、极差正规化变换(规格化变换):规格化变换是从数据矩阵的每一个变量中找出其最大值和最小值,这两者之差称为极差,然后从每个变量的每个原始数据中减去该变量中的最小值,再除以极差。经过规格化变换后,数据矩阵中每列即每个变量的最大数值为1,最小数值为0,其余数据取值均在0-1之间;且变换后的数据都不再具有量纲,便于不同的变量之间的比较。 4、对数变换:对数变换是将各个原始数据取对数,将原始数据的对数值作为变换后的新值。它将具有指数特征的数据结构变换为线性数据结构。 三、样品间相近性的度量 研究样品或变量的亲疏程度的数量指标有两种:距离,它是将每一个样品看作p 维空),(~∑μP N X μ∑μp X X X ,,,21 ),(~∑μP N X ),('A A d A N s ∑+μ)()1(,,n X X X )',,,(21p X X X )')(()()(1X X X X i i n i --∑=n 1X μ ∑μX )1,(~∑n N X P μ),1(∑-n W p X X

成矿规律与成矿预测-总结

成矿规律与成矿预测总结 1.成矿规律与成矿预测概论 1.成矿规律学: 是应用地学理论来研究矿床的形成、时空分布及其演化规律的学科,是指导矿床勘查,进行成矿预测的基础. 2.成矿预测 是根据成矿规律或矿化信息,按一定的方法和程序对不同规模的矿化单元(矿带\矿田\矿体)的产出位置、矿化类型、资源量等的预测。 成矿预测通常包括 (1)定性预测:概念预测:利用矿床分布的概念模式预测矿床。 (2)定量预测:矿床统计预测:根据矿床分布的统计规律预测矿床。 前者是后者的基础,后者是对前者的定量化表达。以成矿规律为基础的成矿预测工作,是矿床勘查工作创新的基本途径。 2.成矿地质背景和控矿地质因素分析 1.成矿地质背景 形成矿床的各种地质作用(事件)、成矿条件和控矿因素的总和。最基本的控矿因素(1)地层(岩性) (2)构造:褶皱:背斜和向斜 断裂:压\张\扭性断裂 (3)岩浆岩: (a)超基性(科马提岩/橄榄岩):Ni\Cu\Cr\PGE (b)基性岩(玄武岩/辉长岩):Fe\V\Ti (c)中性岩(安山岩/闪长岩):Fe、Cu、Pb、Zn、Au (d)酸性岩(流纹岩/花岗岩):W、Sn、Bi、Mo、Li、Be、Nb、Ta (e)碱性岩(正长岩):Au、Cu、Mo 不同类型的矿床具有不同的成矿地质背景和控矿因素组合。 2.地质异常 (1)由地质异常事件形成的物质组成、结构构造、成因序次与围岩具有显著差别的地质体;(2)小概率事件形成的稀有地质体,服从统计规律; (3)矿床是典型的地质异常体。 3.控矿因素 (1)地层(岩性)控矿 (2)构造(褶皱+断裂)控矿 (3)岩浆岩控矿:成矿专属性 (4)地球化学(元素丰度+挥发分) 3.成矿时空分布规律 1.成矿期\成矿域 一定的成矿物质在一定地质时期的某些地区或一定地区的某些地质时期内的富集规律。 (1)这种有利于某种矿产或多种矿产富集的地质时间区间称为成矿期。 (2)有利于成矿的区域成为成矿省(带\矿集区) . 2.研究意义 在研究成矿规律时,采用成矿期、成矿省、矿化分带性等概念。能够针对性地查明矿化在时间上和空间上的分布规律,认识地质发展历史中成矿作用在区域(全球性和地域性)和局部范

地质资源信息处理技术与方法复习题

地质资源信息处理技术与方法复习题 1地质信息、地质数据、地质变量 地质信息:人们通过各种手段对地质现象进行研究所获得的认识。 地质数据:指地质学研究中所需的地质信息,包括数字、文字、图件、表格等。 地质变量:随着空间位置不同,可以取得不同数值的地质现象称为地质变量。也是参与建立地质中所应用的数学模型的成分和参数。 地质信息/数据两个概念可以等同使用地质数据/信息是地质变量构置的基础。 2 总体、样本、个体总体:一组样品中一切测定值的集合称为总体(population); 样本:某个样品上所得到的测定值为样本(Group)。 个体:样本中的单个测定值称为个体(individuals), 一个总体中所含个体的数目称为总体大小(总体定量),样本中所包含个体的总数为样本大小/容量。 3现代成矿预测的四定要求 :定位置,定数量,定概率,定区间。 1)给出成矿远景区的空间位置,包括有利成矿地段,有利成矿标志的空间分布。 2)给出可能矿床的规模大小,包括多种矿床值(品位,矿石量,金属量,矿床数,矿床价值)的估计值。 3)给出可能产出矿床的概率。 4)给出找矿有利标志的数值区间。 4地质变量类型 按其取值方法:1)观测变量 2)乘积变量 3)综合变量 4)伪变量 5 选取地质变量时应遵循以下基本原则: (1)先多后少。一开始应尽可能地多选,避免漏掉有用信息,然后再进行变量的筛选、组合。 (2)选取与研究对象(矿床)或与地质问题(成矿作用)或研究目的(矿床预测)的密切相关的变量。例如,当我们对某地区的斑岩铜矿进行预测时,首先应把选取变量的空间范围限定在斑岩体及附近,选取有关的岩浆岩标志、矿化分带标志、断裂裂隙系统标志、蚀变岩标志、矿物组合标志、地球化学标志、地球物理标志等。 (3)注意横向可比性(comparability)和纵向推断性(inference)。前者是指在已知区(模型区)选取的地质变量可以外推扩展到未知区(预测区)。后者是指某些能反映深部地质和隐优矿化特征的变量应设法加以提取,如隐伏断裂、隐伏岩体。 (4)尺度对等(scale consistency)原则,变量选取的尺度要与预测比例尺相当。(5)地质研究与数学分析相结合。对于由数学分析选出但地质意义不明确的变量,应进一步研究及地质意义,看是否隐含着某些地质信息;如果其地质意义仍不清楚,则应检查变量的取值,变换及计算,看是否是数学处理过程中发生了错误。 6 地质变量选择的方法

多元统计分析模拟考题及答案

、判断题 (对)1X (兀公2丄,X p)的协差阵一定是对称的半正定阵 (对)2标准化随机向量的协差阵与原变量的相关系数阵相同。 (对)3典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。 (对)4多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据分析方法。(错)5X (X-X2,,X p) ~ N p( , ),X,S分别是样本均值和样本离 S 差阵,则X,—分别是,的无偏估计。 n (对)6X (X「X2, ,X p) ~ N p( , ),X作为样本均值的估计,是无偏的、有效的、一致的。 (错)7因子载荷经正交旋转后,各变量的共性方差和各因子的贡献都发生了变化 (对)8因子载荷阵A (a j)中的a ij表示第i个变量在第j个公因子上的相对重要性。 (对)9判别分析中,若两个总体的协差阵相等,则Fisher判别与距离判别等价。(对)10距离判别法要求两总体分布的协差阵相等,Fisher判别法对总体的分布无特 定的要求。 二、填空题 1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、样本相关系数矩阵. 2、设是总体X (X」,X m)的协方差阵,的特征根i(i 1,L ,m)与相应的单 位正交化特征向量i (盼无丄,a m),则第一主成分的表达式是 y1 Q1X1 812X2 L QmX m 方差为1。 3设是总体X (X1,X2,X3, X4)的协方差阵,的特征根和标准正交特征向量分别为: 1 2.920 U;(0.1485, 0.5735, 0.5577, 0.5814) 2 1.024 U2(0.9544, 0.0984,0.2695,0.0824) 3 0.049 U3(0.2516,0.7733, 0.5589, 0.1624) 0.007U4 ( 0.0612,0.2519,0.5513, 0.7930),则其第二个主成分的表达式是 4

数学地质,创新地质找矿思路

数学地质,创新地质找矿思路 ——访中国科学院院士赵鹏大 数学地质是新中国成立以来迅速形成的一门边缘学科。它是地质学与数学及电子计算机相结合的产物,目的是从量的方面研究和解决地质科学问题。它的出现反映了地质学从定性的描述阶段向定量研究发展的新趋势,为地质学开辟了新的发展途径。 几十年来,中国学者应用这一新的科学理论,在矿产资源定量预测与评价、非线性地质学等领域取得了大量研究成果,并在矿产勘查、环境和地质灾害预报中得到广泛应用。日前,我国数学地质学科创始人、中国科学院院士赵鹏大向记者讲述了60年来我国的数学地质学科从无到有、从建立到发展的历程。 数学地质方法成功解决地质勘探中的实际问题,并得到快速发展 记者:您最早接触数学地质这个概念是什么时候? 赵鹏大:我1954年在苏联莫斯科地质勘探学院攻读研究生,选择“矿产普查与勘探”作为专业方向,并以我国富有但在当时还属于新类型的网脉状钨锡矿床作为论文研究对象。在研究中我发现,要求有定量结果的矿产普查勘探工作缺乏定量的研究过程,大大降低了矿产普查勘探作为一门现代学科的科学性及作为实践性最强的应用学科和实际工作的可操作性。因此,我的研究生论文就把地质勘探工作和矿床地质研究定量化作为首取方向。从此,定量地学及后来的数学地质特别是定量勘查就成为我终生的研究方向。 记者:您还记得最初使用数学方法成功解决了哪些实际问题?

赵鹏大:1963年~1966年,我带领学生到云南个旧锡矿区进行教学实习和科研生产,首次提出利用数学模型模拟矿床勘探过程。 当时,我们集中力量帮助解决碰到的大量生产实际问题。1963年,我们针对卡房条状矿体平面呈“U”字、“Z”字、“T”字形等多种形态,层间滑动与构造断裂交错控矿,矿体宽度小、延伸大等特殊情况,着力解决矿体的连接、追索、圈定等实际问题,从中提炼出适合复杂形态矿体的数学模拟理论和方法,并提出应用数理统计研究矿床合理勘探手段及工程间距的途径和方法。1964年,在老厂矿区进行研究时,提出了细脉带型矿体的定量研究方法。1965年,在松树角矿区着重研究了接触带型锡铜矿床的勘探、评价方法和手段。实践证明,我们将概率模型应用于个旧锡矿复杂矿体勘探过程的模拟,为选择合理勘探手段、提高钻孔见矿率提供了科学依据,取得了良好的经济效益和社会效益。 记者:后来的运用情况如何? 赵鹏大:自1975年起,我们先后在江苏、安徽、湖北、内蒙古、云南、新疆等省区的一些矿区或成矿远景区开展了不同比例尺成矿定量预测工作。 1989年,我们承担了新疆305科技攻关课题。1990年夏天,我带队深入罗布泊地区进行实地考察。课题组运用地质异常理论和矿床统计预测方法,在新疆北山地区发现两条铜镍硫化物远景成矿带,在东准噶尔地区发现一条金矿带,其中清河金矿已开始小规模堆浸开采。 直至现在,成矿区划、矿产资源总量预测已成为我国地质勘查工作中必不可少的组成部分。 记者:该领域如何发展成一门学科的?

统计学期末考试题含答案

统计学试题 1、一个统计总体( ) A 、只能有一个标志 B 、只能有一个指标 C 、可以有多个标志 D 、可以有多个指标 2、调查某大学 2000 名学生学习情况,则总体单位是( ) A 、 2000 名学生 B 、 2000 名学生 的学习成绩 C 、每一名学生 D 、 每一名学生的学习成绩 3、某地进行国有商业企业经营情况调查,则调查对象是 ( ) 。 A 、该地所有商业企业 B 、该地所有国有商业企业 C 、该地每一国有商业企业 D 、该地每一商业企业 4、以下哪种调查的报告单位与调查单位是一致的 ( ) 。 A 、工业普查 B 、工业设备调查 C 、职工调查 D 、未安装设备调查 5、某市进行工业企业生产设备普查,要求在 7 月 1 日至 7 月 10 日全部调查完毕,则这一时间规定是 ( ) 。 A 、调查时间 B 、调查期限 C 、标准时间 D 、登记期限 6、某连续变量分为 5 组:第一组为 40—— 50,第二组为 50—— 60,第三组为 60—— 70,第四组为 70— —80,第五组为 80 以上,则( A 、 50在第一组, 70 在第四组 B C 、 70在第四组, 80 在第五组 D 7、已知某局所属 12 个工业企业的职工人数和工资总额, 要求计算 该局职工的平均工资, 应该采用 ( ) A 、简单算术平均法 B 、加权算术平均法 C 、加权调和平均法 D 、几何平均法 8、用水平法检查长期计划完成程度,应规定 ( ) A 、计划期初应达到的水平 B 、计划期末应达到的水平 C 、计划期中应达到的水平 D 、整个计划期应达到的水平 9、某地区有 10 万人,共有 80个医院。平均每个医院要服务 1250 人,这个指标是( )。 A 、 平均指标 B 、强度相对指标 C 、总量指标 D 、发展水平指标 10、时间序列中,每个指标数值可以相加的是( )。 A 、相对数时间序列 B 、时期数列 C 、间断时点数列 D 、平均数时间序列 11、根据时间序列用最小平方法配合二次曲线,所依据的样本资料的特点是( )。 A 、时间序列中各期的逐期增长量大体相等 B 、各期的二级增长量大体相等 C 、各期的环比发展速度大体相等 D 、各期同比增长量的大体相 12、红星机械厂计划规定,今年甲产品的单位产品成本比去年降低 产品单位成本降低计划完成程度的算式为( )。 5% 105% 95% A 、 4% B 、 104% C 、 96% D 15、若某总体次数分布呈左偏分布,则成立的有( )。 A 、 x> M e >M o B 、 xM o >M e D 、以上都不对 二、多项选择题(每题 2 分,共 20 分) 1、下列各项中属于品质标志的有 ( ) 。 A 、性别 B 、年龄 C 、职务 D 、民族 E 、工资 2、从表式上看,统计表由哪些部分构成 ( ) 3、在相对数中,子项和母项可以互换位置的有( )。 ) 、60 在第三组, 80在第五组 、80 在第四组, 50 在第二组 4%,实际执行的结果降低了 5%,则该 5% 4% 13、某企业报告期产量比基期产量增长了 10%,生产费用增长了 8%,则其产品单位成本降低了( A 、1.8% B 、2% C 、20% D 、18% 5%增加到 25%,抽样平均误差( )。 14、在不重复抽样中,抽样单位数从 A 、增加 39.7% B 、增加约 3/5 C 、减少约 3/5 D )。 A 、总标题 B 主词 C 、纵栏标题 D 、横行标题 E 、指标数值 A .结构相对数 B C .比较相对数 D .比例相对数

相关主题
文本预览
相关文档 最新文档