当前位置:文档之家› 矿床统计预测第11讲_判别分析法预测_v1.1

矿床统计预测第11讲_判别分析法预测_v1.1

【矿床统计预测 实习指导】实习3c-聚类分析法

1 实习3c 用聚类分析法进行矿床统计预测 目的 通过实习,学会使用聚类分析法进行矿床统计预测,加深对该方法原理的理解。 要求 (1)根据所提供资料,自己动手完成预测计算的各个环节,按时提交实习报告。 (2)复习课程“聚类分析”有关内容。 资料 研究区是湖北省某地区一个铁矿成矿带。为在该区进行矿床统计预测,已将研究区划 分为500m ×500m 基本单元408个,并提取了多个地质变量。本次实习为简便只使用其中两个变量:1x 为单元磁异常值,2x 为单元中心距断裂喷发带的距离。表4-1(单元数据表)列出了实习所用数据。 表4-1单元数据表(表中?表示“未知”) 单元号 1 2 3 4 5 6 7 8 9 10 11 1x 1.86 3.0 1.3 2.45 1.28 2.5 2.0 0.78 1.09 1.5 2.4 2x 0.5 2.0 2.1 1.0 2.5 0.8 0.9 2.4 2.2 0.8 1.5 含矿情况 ? ? 无矿 有矿 无矿 ? ? ? ? 有矿 ? 方法步骤 第一步:分析研究区内铁矿特征及控矿地质条件和找矿标志,划分基本单元,提取地质变量、为各变量赋值。这些工作已经完成(不必重新做)。所用数据见表4-1。 第二步:数据预处理。主要是通过规格化或标准化变换,使数据统一量纲,从而使各变量的数据具有可比性,避免因有的变量数值大而得到突出、有的变量因数值小而受到压制、

2 从而各变量在分类中作用程度不同的情况。本次实习所用数据可以不做这种预处理。 第三步:选择相似性指标。本次实习中,选择距离系数ik d 。其定义为: ∑=-= p j kj ij ik x x d 1 2)( (Eq 4-1) 上式中 p 为变量数;ij x 表示第j 变量在第i 样品(单元)中的值;ik d 表示在多维变量空 间(本次实习是2维)内第i 和第k 两样品间的欧氏距离。两样品距离越近(小)越相似。 第四步:计算所有样品(单元)两两之间的距离,得到距离矩阵。尚未完成的距离矩阵如表4-2所示。请完成该表(还有39个距离需计算)。计算过程举1例说明如下: 22222 12121 ()(1.86 3.0)(0.5 2.0) 1.14 1.5 1.884p j j j d x x == -=-+-=+=∑ 余类推。注意可以将表4-1拷贝到Excel 工作表中,输入合适的公式,快速计算。 第五步:以距离矩阵为基础,用一次计算法画出聚类谱系图。方法: (1)画坐标轴。以距离为横坐标轴。它的刻度从0开始,最大刻度相当于所有距离中最大者。以样品(单元)为纵坐标轴,刻度单位1(即1个单元一行)。 表4-2距离矩阵 单元 1 2 3 4 5 6 7 8 9 10 11 1 0 2 1.884 0 3 1.695 1.703 0 4 0 5 1.902 0 6 0.206 2.095 0 7 0 8

SPSS操作方法:判别分析例题

为研究1991年中国城镇居民月平均收入状况,按标准化欧氏平方距离、离差平方和聚类方法将30个省、市、自治区.分为三种类型。试建立判别函数,判定广东、西藏分别属于哪个收入类型。判别指标及原始数据见表9-4。 1991年30个省、市、自治区城镇居民月平均收人数据表 单位:元/人 x1:人均生活费收入 x6:人均各种奖金、超额工资(国有+集体) x2:人均国有经济单位职工工资 x7:人均各种津贴(国有+集体) x3:人均来源于国有经济单位标准工资 x8:人均从工作单位得到的其他收入 x4:人均集体所有制工资收入 x9:个体劳动者收入 5

贝叶斯判别的SPSS操作方法: 1. 建立数据文件 2.单击Analyze→ Classify→ Discriminant,打开Discriminant Analysis 判别分析对话框如图1所示: 图1 Discriminant Analysis判别分析对话框 3.从对话框左侧的变量列表中选中进行判别分析的有关变量x1~x9进入Independents 框,作为判别分析的基础数据变量。 从对话框左侧的变量列表中选分组变量Group进入Grouping Variable 框,并点击Define Range...钮,在打开的Discriminant Analysis: Define Range对话框中,定义判别原始数据的类别数,由于原始数据分为3类,则在Minimum(最小值)处输入1,在Maximum(最大值)处输入3(见图2)。。 选择后点击Continue按钮返回Discriminant Analysis主对话框。 图2 Define Range对话框 4、选择分析方法 Enter independent together 所有变量全部参与判别分析(系统默 认)。本例选择此项。 Use stepwise method 采用逐步判别法自动筛选变量。

应用多元统计分析习题解答_因子分析

第七章 因子分析 7.1 试述因子分析与主成分分析的联系与区别。 答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、简化数据的技术。②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。 因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。而因子分析是从显在变量去提炼潜在因子的过程。此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。 7.2 因子分析主要可应用于哪些方面? 答:因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。具体来说,①因子分析可以用于分类。如用考试分数将学生的学习状况予以分类;用空气中各种成分的比例对空气的优劣予以分类等等②因子分析可以用于探索潜在因素。即是探索未能观察的或不能观测的的潜在因素是什么,起的作用如何等。对我们进一步研究与探讨指示方向。在社会调查分析中十分常用。③因子分析的另一个作用是用于时空分解。如研究几个不同地点的不同日期的气象状况,就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判断各自的影响和变化规律。 7.3 简述因子模型中载荷矩阵A 的统计意义。 答:对于因子模型 1122i i i ij j im m i X a F a F a F a F ε=++++ ++ 1,2, ,i p = 因子载荷阵为11 12121 22212 1 2 (,, ,)m m m p p pm a a a a a a A A A a a a ????? ?==???????? A i X 与j F 的协方差为: 1Cov(,)Cov(,)m i j ik k i j k X F a F F ε==+∑ =1 Cov( ,)Cov(,)m ik k j i j k a F F F ε=+∑ =ij a

判别分析-四种方法

第六章 判别分析 §6.1 什么是判别分析 判别分析是判别样品所属类型的一种统计方法,其应用之广可与回归分析媲美。 在生产、科研和日常生活中经常需要根据观测到的数据资料,对所研究的对象进行分类。例如在经济学中,根据人均国民收入、人均工农业产值、人均消费水平等多种指标来判定一个国家的经济发展程度所属类型;在市场预测中,根据以往调查所得的种种指标,判别下季度产品是畅销、平常或滞销;在地质勘探中,根据岩石标本的多种特性来判别地层的地质年代,由采样分析出的多种成份来判别此地是有矿或无矿,是铜矿或铁矿等;在油田开发中,根据钻井的电测或化验数据,判别是否遇到油层、水层、干层或油水混合层;在农林害虫预报中,根据以往的虫情、多种气象因子来判别一个月后的虫情是大发生、中发生或正常; 在体育运动中,判别某游泳运动员的“苗子”是适合练蛙泳、仰泳、还是自由泳等;在医疗诊断中,根据某人多种体验指标(如体温、血压、白血球等)来判别此人是有病还是无病。总之,在实际问题中需要判别的问题几乎到处可见。 判别分析与聚类分析不同。判别分析是在已知研究对象分成若干类型(或组别)并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分类。对于聚类分析来说,一批给定样品要划分的类型事先并不知道,正需要通过聚类分析来给以确定类型的。 正因为如此,判别分析和聚类分析往往联合起来使用,例如判别分析是要求先知道各类总体情况才能判断新样品的归类,当总体分类不清楚时,可先用聚类分析对原来的一批样品进行分类,然后再用判别分析建立判别式以对新样品进行判别。 判别分析内容很丰富,方法很多。判别分析按判别的组数来区分,有两组判别分析和多组判别分析;按区分不同总体的所用的数学模型来分,有线性判别和非线性判别;按判别时所处理的变量方法不同,有逐步判别和序贯判别等。判别分析可以从不同角度提出的问题,因此有不同的判别准则,如马氏距离最小准则、Fisher 准则、平均损失最小准则、最小平方准则、最大似然准则、最大概率准则等等,按判别准则的不同又提出多种判别方法。本章仅介绍四种常用的判别方法即距离判别法、Fisher 判别法、Bayes 判别法和逐步判别法。 §6.2 距离判别法 基本思想:首先根据已知分类的数据,分别计算各类的重心即分组(类)的均值,判别准则是对任给的一次观测,若它与第i 类的重心距离最近,就认为它来自第i 类。 距离判别法,对各类(或总体)的分布,并无特定的要求。 1 两个总体的距离判别法 设有两个总体(或称两类)G 1、G 2,从第一个总体中抽取n 1个样品,从第二个总体中抽取n 2个样品,每个样品测量p 个指标如下页表。 今任取一个样品,实测指标值为),,(1'=p x x X ,问X 应判归为哪一类? 首先计算X 到G 1、G 2总体的距离,分别记为),(1G X D 和),(2G X D ,按距离最近准则

SPSS操作方法:判别分析例题

实验指导之二 判别分析的SPSS软件的基本操作 [实验例题]为研究1991年中国城镇居民月平均收入状况,按标准化欧氏平方距离、离差平方和聚类方法将30个省、市、自治区.分为三种类型。试建立判别函数,判定广东、西藏分别属于哪个收入类型。判别指标及原始数据见表9-4。 1991年30个省、市、自治区城镇居民月平均收人数据表 单位:元/人 x1:人均生活费收入 x6:人均各种奖金、超额工资(国有+集体) x2:人均国有经济单位职工工资 x7:人均各种津贴(国有+集体) x3:人均来源于国有经济单位标准工资 x8:人均从工作单位得到的其他收入 x4:人均集体所有制工资收入 x9:个体劳动者收入 x5:人均集体所有制职工标准工资

贝叶斯判别的SPSS操作方法: 1. 建立数据文件 2.单击Analyze→Classify→Discriminant,打开Discriminant Analysis判别分析对话框如图1所示: 图1 Discriminant Analysis判别分析对话框 3.从对话框左侧的变量列表中选中进行判别分析的有关变量x1~x9进入Independents 框,作为判别分析的基础数据变量。 从对话框左侧的变量列表中选分组变量Group进入Grouping Variable 框,并点击Define Range...钮,在打开的Discriminant Analysis: Define Range 对话框中,定义判别原始数据的类别数,由于原始数据分为3类,则在Minimum(最小值)处输入1,在Maximum(最大值)处输入3(见图2)。。 选择后点击Continue按钮返回Discriminant Analysis主对话框。 图2 Define Range对话框 4、选择分析方法

矿床统计预测基本理论与准则

矿床统计预测基本理论与准则 一、矿床统计预测基本特点 矿床统计预测以多元统计分析或其他数学方法为基本工具,以矿床/矿化体/成矿远景区及相关地质体和地质过程为研究对象,以电子计算机为手段,以查明各种控矿因素和找矿标志组合对成矿和找矿的作用(定量),以最终圈定出矿化体可能产出的空间位置、规模和概率为目的。 1、概率论和数理统计是矿床统计预测的重要基础和手段。矿床统计预测从研究矿床值的统计分布特征和各种地质因素及其组合的控矿概率等入手,利用多元统计分析方法进行矿产资源定量预测。 2、相似-类比原则是矿床统计预测工作的基本思路和原则。模型单元和未知单元的定量类比。 3、矿床统计预测是一项在不确定条件下的统计决策工作,预测结果是具有一定成功概率的随机事件(不确定性),在预测结果基础上的进一步勘查工作具有较大的风险性(不确定性)。 二、矿床统计预测的基本思路和任务 以控矿地质条件为重点的矿床成因研究、建立矿床地质概念模型矿床统计预测基本思路矿床统计预测基本任务: 1、圈定成矿远景区,预测出矿床可能产出的位置; 2、预测成矿远景区中某种矿床可能存在的概率大小; 3、预测矿床值的可能大小; 4、定量评价各种控矿因素和找矿标志及其不同状态和组合对成矿的作用。

三、矿床统计预测基本理论 1、相似-类比理论(Analogue) (1)在相似的成矿地质条件下,应该有相似的矿床或成矿系列产出。或者说,矿床类型相似,成矿条件和控矿地质标志组合相似。 (2)在相同的、足够大的区域内,应该有相似的矿产资源量。 (3)相似类型的矿床及其最佳控矿地质标志组合,具有相似的数学特征。 (4)矿床模型 对某类矿床成矿条件、成矿环境、矿化特征、控矿因素和找矿标志等要素的高度综合。描述性模型(提供找矿标志)VS 成因模型(提供找矿有利地区)矿床成因模型 VS 找矿模型 (对各种成矿条件、控矿因素、矿床地质特征、矿化特征和找矿信息的综合)矿床模型可能随人们对矿床了解的深入而改变。 (5)矿床模式→找矿模型→成矿地质构造背景 陆缘、岛弧、造山带、裂谷?主要控矿地质条件:地层、构造、岩浆岩矿体特征:几何特征、空间特征、结构特征矿化特征:矿物和地球化学组成、蚀变组合等矿化标志:地质、地球化学、地球物理、遥感 (6)相似类比理论对矿床统计预测的指导作用 根据相似-类比理论,我们可以从已知矿床(单元)出发,建立矿床的成矿和找矿模型,筛选出有效、重要的控矿因素和找矿标志,进而选择合适的数学模型对未知矿床(单元)进行预测,圈定出有找矿远景的区域。 基于相似类比理论成矿预测的不足,根据已知的矿床模型不能预测迄今未曾发现过的新类型矿床。根据已知矿床模型不能预测比已知矿床规模更大的超大型

(完整版)SPSS因子分析法-例子解释

因子分析的基本概念和步骤 一、因子分析的意义 在研究实际问题时往往希望尽可能多地收集相关变量,以期望能对问题有比较全面、完整的把握和认识。例如,对高等学校科研状况的评价研究,可能会搜集诸如投入科研活动的人数、立项课题数、项目经费、经费支出、结项课题数、发表论文数、发表专著数、获得奖励数等多项指标;再例如,学生综合评价研究中,可能会搜集诸如基础课成绩、专业基础课成绩、专业课成绩、体育等各类课程的成绩以及累计获得各项奖学金的次数等。虽然收集这些数据需要投入许多精力,虽然它们能够较为全面精确地描述事物,但在实际数据建模时,这些变量未必能真正发挥预期的作用,“投入”和“产出”并非呈合理的正比,反而会给统计分析带来很多问题,可以表现在: 计算量的问题 由于收集的变量较多,如果这些变量都参与数据建模,无疑会增加分析过程中的计算工作量。虽然,现在的计算技术已得到了迅猛发展,但高维变量和海量数据仍是不容忽视的。 变量间的相关性问题 收集到的诸多变量之间通常都会存在或多或少的相关性。例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。例如,多元线性回归分析中,如果众多解释变量之间存在较强的相关性,即存在高度的多重共线性,那么会给回归方程的参数估计带来许多麻烦,致使回归方程参数不准确甚至模型不可用等。类似的问题还有很多。 为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生。为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。因子分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。 因子分析的概念起源于20世纪初Karl Pearson和Charles Spearmen等人关于智力测验的统计分析。目前,因子分析已成功应用于心理学、医学、气象、地址、经济学等领域,并因此促进了理论的不断丰富和完善。 因子分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,名为因子。通常,因子有以下几个特点: ↓因子个数远远少于原有变量的个数 原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模,这将大大减少分析过程中的计算工作量。 ↓因子能够反映原有变量的绝大部分信息 因子并不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息。 ↓因子之间的线性关系并不显著 由原有变量重组出来的因子之间的线性关系较弱,因子参与数据建模能够有效地解决变量多重共线性等给分析应用带来的诸多问题。 ↓因子具有命名解释性 通常,因子分析产生的因子能够通过各种方式最终获得命名解释性。因子的命名解

判别分析的基本原理讲课稿

判别分析的基本原理

判别分析的基本原理和模型 一、判别分析概述 (一)什么是判别分析 判别分析是多元统计中用于判别样品所属类型的一种统计分析方法,是一种在已知研究对象用某种方法已经分成若干类的情况下,确定新的样品属于哪一类的多元统计分析方法。 判别分析方法处理问题时,通常要给出用来衡量新样品与各已知组别的接近程度的指标,即判别函数,同时也指定一种判别准则,借以判定新样品的归属。所谓判别准则是用于衡量新样品与各已知组别接近程度的理论依据和方法准则。常用的有,距离准则、Fisher 准则、贝叶斯准则等。判别准则可以是统计性的,如决定新样品所属类别时用到数理统计的显著性检验,也可以是确定性的,如决定样品归属时,只考虑判别函数值的大小。判别函数是指基于一定的判别准则计算出的用于衡量新样品与各已知组别接近程度的函数式或描述指标。 (二)判别分析的种类 按照判别组数划分有两组判别分析和多组判别分析;按照区分不同总体的所用数学模型来分有线性判别分析和非线性判别分析;按照处理变量的方法不同有逐步判别、序贯判别等;按照判别准则来分有距离准则、费舍准则与贝叶斯判别准则。 二、判别分析方法 (一)距离判别法 1.基本思想:首先根据已知分类的数据,分别计算各类的重心,即分组(类)均值,距离判别准则是对于任给一新样品的观测值,若它与第i 类的重心距离最近,就认为它来自第i 类。因此,距离判别法又称为最邻近方法(nearest neighbor method )。距离判别法对各类总体的分布没有特定的要求,适用于任意分布的资料。 2.两组距离判别 两组距离判别的基本原理。设有两组总体B A G G 和,相应抽出样品个数为21,n n , n n n =+)(21,每个样品观测p 个指标得观测数据如下,

高考数学一轮复习 第十一章概率与统计11.8用样本估计总体收尾精炼 理 新人教A版

高考数学一轮复习 第十一章概率与统计11.8用样本估计总体 收尾精炼 理 新人教A 版 一、选择题 1.已知一组数据:a 1,a 2,a 3,a 4,a 5,a 6,a 7构成公差为d 的等差数列,且这组数据的方差等于1,则公差d 等于( ). A .±14 B .±12 C .±128 D .无法求解 2.一组数据的平均数是4.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( ). A .55.2,3.6 B .55.2,56.4 C .64.8,63.6 D .64.8,3.6 3.为了了解某地区10 000名高三男生的身体发育情况,抽查了该地区100名年龄为17~18岁的高三男生体重(kg),得到频率分布直方图如图.根据图示,请你估计该地区高三男生中体重在[56.5,64.5] kg 的学生人数是( ). A .40 B .400 C .4 000 D .4 400 4.某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,纤维的长度小于20 mm 的棉花根数为( ).

A.20 B.30 C.40 D.50 5.(2012山东高考)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是( ). A.众数 B.平均数 C.中位数 D.标准差 6.从甲、乙两种树苗中各抽测了10株树苗的高度,其茎叶图如图.根据茎叶图,下列描述正确的是( ). A.甲种树苗的平均高度大于乙种树苗的平均高度,且甲种树苗比乙种树苗长得整齐B.甲种树苗的平均高度大于乙种树苗的平均高度,但乙种树苗比甲种树苗长得整齐C.乙种树苗的平均高度大于甲种树苗的平均高度,且乙种树苗比甲种树苗长得整齐D.乙种树苗的平均高度大于甲种树苗的平均高度,但甲种树苗比乙种树苗长得整齐 7.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本标准差分别为s A和s B,则( ).

【矿床统计预测 实习指导】实习2-聚类分析法

1 实习2 用聚类分析法进行矿床统计预测 姓名_________ 班级_________ 学号___________ 成绩_________ 目的 通过实习,学会使用聚类分析法进行矿床统计预测,加深对该方法原理的理解。 要求 (1)根据所提供资料,自己动手完成预测计算的各个环节,按时提交实习报告。 (2)复习课程“聚类分析”有关内容。 资料 研究区是湖北省某地区一个铁矿成矿带。为在该区进行矿床统计预测,已将研究区划 分为500m ×500m 基本单元408个,并提取了多个地质变量。本次实习为简便只使用其中两个变量:1x 为单元磁异常值,2x 为单元中心距断裂喷发带的距离。表4-1(单元数据表)列出了实习所用数据。 表4-1单元数据表(表中?表示“未知”) 单元号 1 2 3 4 5 6 7 8 9 10 11 1x 1.86 3.0 1.3 2.45 1.28 2.5 2.0 0.78 1.09 1.5 2.4 2x 0.5 2.0 2.1 1.0 2.5 0.8 0.9 2.4 2.2 0.8 1.5 含矿情况 ? ? 无矿 有矿 无矿 ? ? ? ? 有矿 ? 方法步骤 第一步:分析研究区内铁矿特征及控矿地质条件和找矿标志,划分基本单元,提取地质变量、为各变量赋值。这些工作已经完成(不必重新做)。所用数据见表4-1。 第二步:数据预处理。主要是通过规格化或标准化变换,使数据统一量纲,从而使各

2 变量的数据具有可比性,避免因有的变量数值大而得到突出、有的变量因数值小而受到压制、从而各变量在分类中作用程度不同的情况。本次实习所用数据可以不做这种预处理。 第三步:选择相似性指标。本次实习中,选择距离系数ik d 。其定义为: ∑=-= p j kj ij ik x x d 1 2)( (Eq 4-1) 上式中 p 为变量数;ij x 表示第j 变量在第i 样品(单元)中的值;ik d 表示在多维变量空 间(本次实习是2维)内第i 和第k 两样品间的欧氏距离。两样品距离越近(小)越相似。 第四步:计算所有样品(单元)两两之间的距离,得到距离矩阵。尚未完成的距离矩阵如表4-2所示。请完成该表(还有39个距离需计算)。计算过程举1例说明如下: 22222 12121 ()(1.86 3.0)(0.5 2.0) 1.14 1.5 1.884p j j j d x x == -=-+-=+=∑ 余类推。注意可以将表4-1拷贝到Excel 工作表中,输入合适的公式,快速计算。 第五步:以距离矩阵为基础,用一次计算法画出聚类谱系图。方法: (1)画坐标轴。以距离为横坐标轴。它的刻度从0开始,最大刻度相当于所有距离中最大者。以样品(单元)为纵坐标轴,刻度单位1(即1个单元一行)。 表4-2距离矩阵 单元 1 2 3 4 5 6 7 8 9 10 11 1 0 2 1.884 0 3 1.695 1.703 0 4 0 5 1.902 0 6 0.206 2.095 0 7

1-概率与统计

2006年普通高等学校招生全国统一考试数学分类汇编 第十一章《概率统计》 一、选择题(共11题) 1.(安徽卷)在正方体上任选 概率为 A .- 7 3 24 个顶点上可得三个(即正方体的一边与过此点的一条面对角线 ),共有24个, 得,故G 2.(福建卷)在一个口袋中装有 5个白球和3个黑球,这些球除颜色外完全相同, 从中摸出 3个球,至少摸到 2个黑球的概率等于 A.2 B.3 C? 7 8 7 解析:在一个口袋中装有 5个白球和3个黑球,这些球除颜色外完全相同。 至少摸到2个黑球的概率等于 P = C 3C 5 3 C 3 =-,选A 。 C 83 7 3. (湖北卷)甲:A 1、A 2是互斥事件;乙:A 2是对立事件,那么 解:两个事件是对立事件,则它们一定互斥,反之不成立。故选 B 4. (江苏卷)某人5次上班途中所花的时间(单位:分钟)分别为 x , y , 10, 11, 9?已知这 组数据的平均数为10,方差为2,则| x -y 丨的值为 (A ) 1 ( B ) 2 ( C ) 3 (D ) 4 【思路】本题考查统计的基本知识,样本平均数与样本方差的概念以及求解方程组的方法 【正确解答】由题意可得:x+y=20,(x-10) 2 +(y-10) 2 =8,解这个方程组需要用一些技巧, 因为 不要直接求出x 、y ,只要求出 x - y ,设x=10+t, y=10-t, x-y=2t=4,选D 5. (江苏卷)右图中有一个信号源和五个接收器。 接收器与信 号源在同一个串联线路中时, 就能接收到信号,否则就不能接 收到信号。若将图中左端的六个接线点随机地平均分成三组, 将右端的六个接线点也随机地平均分成三组, 再把所有六组中 每组的两个接线点用导线连接, 则这五个接收器能同时接收到 信号的概率是 3个顶点连成三角形,则所得的三角形是直角非等腰三角形的 解:在正方体上任选 3个顶点连成三角形可得 C 8个三角形,要得直角非等腰 三角形,则每 C 8 D.— 28 从中摸出3个球, A.甲是乙的充分但不必要条件 B.甲是乙的必要但不充分条件 C.甲是乙的充要条件 D.甲既不是乙的充分条件, 也不是乙的必要条件 信号源 ' ---------------O ------------------- *

矿床统计预测题库

Tag A 绪论 B 变量 C 原理 D 方法 说明 学科介绍 地质勘探数据统计分布特征;地质变量研究研究 基本理论、准则;潜力评价概论;成矿远景区预测概论;比例尺、单元划分及控制区确定 资源总量估计和潜力评价方法 秩相关系数法预测、找矿信息量计算法预测、证据权法预测、特征分析法预测 多元统计方法:回归分析、判别分析、聚类分析、主成分分析及因子分析、趋势面分析 地质统计学,是地质学中使用的统计分析理论方法的统称。 建立地质体、地质过程的数学模型,常是数学地质研究的重要任务。 矿产资源的形成和分布,常既有一定程度的确定性,也有一定程度的随机性。 矿床统计预测,就是用地质统计学的方法进行矿产预测。 数学地质必须以数学为基础和岀发点。 数学地质的主要对象是地质体、地质过程及地质工作方法。 数学地质是矿床统计预测的一个组成部分。 数学地质是以解决地质问题为目标和岀发点,以数学为工具,以计算机为手段,研究客观世界规律性 的科学。 数学地质是用数学方法和计算机手段,研究解决地质问题的科学技术。 在矿床统计预测中,研究定性数据的统计分析方法是不可忽视的。 从数量众多的地质变量中筛选最重要的变量,其目的是要达到变量数目最优化。 地质变量中所谓的伪变量是为了计算方便而人为附加的一种变量。 地质数据预处理可提高地质数据的可利用程度。 地质数据预处理可以起到减少变量,简化数学模型的作用。 规格化变换并不能消除地质变量的量纲。 矿产预测的综合信息原则,要求矿产预测工作中尽量同时使用不同比例尺的资料。 矿床值不是地质变量。 矿体的厚度,钻孔的 GPS 坐标,矿石的品位化验值都是比例型数据。 两个变量之间的秩相关系数,不可能是负数。 随着空间位置不同,表示某一地质现象可取不同数值的量叫做地质变量。 所谓矿床值,是一种直接反映矿产资源数量、质量或空间分布等属性的地质变量。 所谓网格化,是指通过插值将空间上不规则分布的数据变为按规则网格分布的数据。 通过布尔转换,可以将定量变量变为逻辑变量。 通过规格化变换,可以消除变量的量纲。 通过均匀化变换可以将地质变量变成符合均匀分布的变量。 相关系数和秩相关系数的值域都是 [-1,1]。 选择地质变量应以数学方法为基础,以地质方法为辅。 一个服从对数正态分布的变量,取对数后将会服从正态分布。 一个服从正态分布的变量,取对数后将会服从对数正态分布。 在综合预测中所谓“地物化遥”,是指地质、物探、化探、遥感。 当采用多个地质变量进行矿床统计预测时,一般最好选择那些互相密切相关的变量。 矿产预测中的循序渐进原则,要求矿产预测工作尽量按照比例尺由大到小的顺序有系统地进行。 矿产预测中的循序渐进原则,要求矿产预测工作尽量按照比例尺由小到大、靶区逐步缩小的顺序有系 统地进行。 矿产资源既有地质属性,也有技术经济属性。 矿产资源是地质作用的自然产物,因此与技术经济条件没有关系。 矿床统计预测的尺度一致原则的基本要求是,所划分的网格单元大小和形状保持一致。 矿床统计预测应当遵循以地质成矿规律研究为基础的原则。 矿床统计预测中,一般来说工作比例尺越小,划分单元大小也相应地越小。 所谓未知单元,是指各地质变量的取值都未知的单元。 通过矿床统计预测估计的资源量级别一般都有较高的经济可行性和地质可靠度。 为了建立较好的预测模型,一般应尽可能选择、使用互相独立的预测标志。 一般来说,根据预测结果提出研究区内进一步地勘工作部署建议,是矿床统计预测中可有可无的一个 环节。 一般来说,矿床统计预测方法不能预测矿床的类型或质量。 一般来说,矿床统计预测遵循了相似类比的基本思路。 一般来说,在矿床统计预测中,地质成矿规律研究并不是一项重要的工作。 一般来说,在矿床统计预测中应当对预测模型和预测结果进行地质解释。 一般来说,找矿远景区内不应当有已知矿床。 已知矿床不应出现在模型单位之外的区域。 应用矿床统计预测方法,既可以预测矿床产岀的位置,也可以预测其类型或质量。 找矿远景区都是已知有矿床存在的地段。 判断题 Tag 答案 A 绪论 X A 绪论 V A 绪论 V A 绪论 X A 绪论 X A 绪论 V A 绪论 X A 绪论 V A 绪论 V A 绪论 V B 变量 X B 变量 V B 变量 V B 变量 X B 变量 X B 变量 X B 变量 X B 变量 X B 变量 X B 变量 V B 变量 V B 变量 V B 变量 V B 变量 V B 变量 X B 变量 V B 变量 X B 变量 V B 变量 X B 变量 V C 原理 X C 原理 X C 原理 V C 原理 V C 原理 X C 原理 X C 原理 V C 原理 X C 原理 X C 原理 X C 原理 V C 原理 X C 原理 X C 原理 V C 原理 X C 原理 V C 原理 X C 原理 X C 原理 V C 原理 X D 方法 V D 方法 X

杜邦分析法例题

杜邦财务分析案例 案例问题及资料 A公司为了确保在未来市场逐渐扩展的同时,使经济效益稳步上升,维持行业排头兵的位置,拟对公司近两年的财务状况和经济效益情况,运用杜邦财务分析方法进行全面分析,以便找出公司在这方面取得的成绩和存在的问题,并针对问题提出改进措施,扬长避短,以利再战,实现公司的自我完善。 A公司近三年的资产负债表和损益表资料如下: 资产负债表 金额单位:千元

损益表金额单位:千元

三、案例分析要求(资产类用平均值计算) 1.计算该公司上年和本年的权益净利润,并确定本年较上年的总差异 2.对权益净利率的总差异进行总资产净利率和权益乘数的两因素分析,并确定各因素变动对总差异影响的份额。 3.对总资产净利率的总差异进行销售净利率和总资产周转率的两因素分析,确定各因素变动对总资产净利率的总差异影响的份额。 4.运用上述分析的结果,归纳影响该公司权益净利率变动的有利因素和不利因素,找出产生不利因素的主要问题和原因,并针对问题提出相应的改进意见,使这些改进建议付诸实施,能促使该公司的生产经营管理更加完善,竞争力更加提高。 杜邦财务分析案例参考答案 (一)计算该公司上年和本年的权益净利率并确定本年较上年的总差异1.上年权益净利率 = 206430 / [(320910 + 1629100)/ 2 ]= 206430 / 975005 = 21.17% 2.本年权益净利率 = 224700 / [(1629100 + 1843200 )/ 2 ]= 224700 / 1736150= 12.94% 3.权益净利率本年较上年总差异 = 12.94% — 21.17% = -8.23% 计算结果表明本年较上年权益净利率下降了8.23%

成矿规律与成矿预测-总结

成矿规律与成矿预测总结 1.成矿规律与成矿预测概论 1.成矿规律学: 是应用地学理论来研究矿床的形成、时空分布及其演化规律的学科,是指导矿床勘查,进行成矿预测的基础. 2.成矿预测 是根据成矿规律或矿化信息,按一定的方法和程序对不同规模的矿化单元(矿带\矿田\矿体)的产出位置、矿化类型、资源量等的预测。 成矿预测通常包括 (1)定性预测:概念预测:利用矿床分布的概念模式预测矿床。 (2)定量预测:矿床统计预测:根据矿床分布的统计规律预测矿床。 前者是后者的基础,后者是对前者的定量化表达。以成矿规律为基础的成矿预测工作,是矿床勘查工作创新的基本途径。 2.成矿地质背景和控矿地质因素分析 1.成矿地质背景 形成矿床的各种地质作用(事件)、成矿条件和控矿因素的总和。最基本的控矿因素(1)地层(岩性) (2)构造:褶皱:背斜和向斜 断裂:压\张\扭性断裂 (3)岩浆岩: (a)超基性(科马提岩/橄榄岩):Ni\Cu\Cr\PGE (b)基性岩(玄武岩/辉长岩):Fe\V\Ti (c)中性岩(安山岩/闪长岩):Fe、Cu、Pb、Zn、Au (d)酸性岩(流纹岩/花岗岩):W、Sn、Bi、Mo、Li、Be、Nb、Ta (e)碱性岩(正长岩):Au、Cu、Mo 不同类型的矿床具有不同的成矿地质背景和控矿因素组合。 2.地质异常 (1)由地质异常事件形成的物质组成、结构构造、成因序次与围岩具有显著差别的地质体;(2)小概率事件形成的稀有地质体,服从统计规律; (3)矿床是典型的地质异常体。 3.控矿因素 (1)地层(岩性)控矿 (2)构造(褶皱+断裂)控矿 (3)岩浆岩控矿:成矿专属性 (4)地球化学(元素丰度+挥发分) 3.成矿时空分布规律 1.成矿期\成矿域 一定的成矿物质在一定地质时期的某些地区或一定地区的某些地质时期内的富集规律。 (1)这种有利于某种矿产或多种矿产富集的地质时间区间称为成矿期。 (2)有利于成矿的区域成为成矿省(带\矿集区) . 2.研究意义 在研究成矿规律时,采用成矿期、成矿省、矿化分带性等概念。能够针对性地查明矿化在时间上和空间上的分布规律,认识地质发展历史中成矿作用在区域(全球性和地域性)和局部范

2019-2020年高考数学复习 第91课时 第十一章 概率与统计率-抽样方法、总体分布的估计名师精品教案

2019-2020年高考数学复习 第91课时 第十一章 概率与统计率-抽样方 法、总体分布的估计名师精品教案 课题:抽样方法、总体分布的估计 一.复习目标:抽样方法、总体分布的估计 1.会用简单随机抽样法、系统抽样法、分层抽样法等常用方法从总体中抽取样本; 2.了解统计的基本思想,会用样本频率估计总体分布. 二.知识要点: 1.(1)统计的基本思想是 . (2)平均数的概念 . (3)方差公式为 . 2.常用的抽样方法是 . 三.课前预习: 1.某公司甲、乙、丙、丁四个地区分别有150 个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其收入和售后服务等情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是( B ) 分层抽样法,系统抽样法 分层抽样法,简单随机抽样法 系统抽样法,分层抽样法 简单随机抽样法,分层抽样法 2.已知样本方差由,求得,则. 3.设有个样本,其标准差为,另有个样本,且 ,其标准差为,则下列关系正确的是 ( B ) 4.某校为了了解学生的课外阅读情况,随机调 查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用右侧的条形图表示. 根据条形图可得这50名学生这一天平均每人的 课外阅读时间为 ( B ) 0.6小时 0.9小时 1.0小时 1.5小时 5.是的平均数,是的平均数,是的平均数,则,,之间的关系为. 6.某校有老师200人,男学生1200人,女学生1000人.现用分层抽样的方法从所有师生中抽取一个容量为的样本;已知从女学生中抽取的人数为80人,则. 7.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小组, 时间(小时)

地质资源信息处理技术与方法复习题

地质资源信息处理技术与方法复习题 1地质信息、地质数据、地质变量 地质信息:人们通过各种手段对地质现象进行研究所获得的认识。 地质数据:指地质学研究中所需的地质信息,包括数字、文字、图件、表格等。 地质变量:随着空间位置不同,可以取得不同数值的地质现象称为地质变量。也是参与建立地质中所应用的数学模型的成分和参数。 地质信息/数据两个概念可以等同使用地质数据/信息是地质变量构置的基础。 2 总体、样本、个体总体:一组样品中一切测定值的集合称为总体(population); 样本:某个样品上所得到的测定值为样本(Group)。 个体:样本中的单个测定值称为个体(individuals), 一个总体中所含个体的数目称为总体大小(总体定量),样本中所包含个体的总数为样本大小/容量。 3现代成矿预测的四定要求 :定位置,定数量,定概率,定区间。 1)给出成矿远景区的空间位置,包括有利成矿地段,有利成矿标志的空间分布。 2)给出可能矿床的规模大小,包括多种矿床值(品位,矿石量,金属量,矿床数,矿床价值)的估计值。 3)给出可能产出矿床的概率。 4)给出找矿有利标志的数值区间。 4地质变量类型 按其取值方法:1)观测变量 2)乘积变量 3)综合变量 4)伪变量 5 选取地质变量时应遵循以下基本原则: (1)先多后少。一开始应尽可能地多选,避免漏掉有用信息,然后再进行变量的筛选、组合。 (2)选取与研究对象(矿床)或与地质问题(成矿作用)或研究目的(矿床预测)的密切相关的变量。例如,当我们对某地区的斑岩铜矿进行预测时,首先应把选取变量的空间范围限定在斑岩体及附近,选取有关的岩浆岩标志、矿化分带标志、断裂裂隙系统标志、蚀变岩标志、矿物组合标志、地球化学标志、地球物理标志等。 (3)注意横向可比性(comparability)和纵向推断性(inference)。前者是指在已知区(模型区)选取的地质变量可以外推扩展到未知区(预测区)。后者是指某些能反映深部地质和隐优矿化特征的变量应设法加以提取,如隐伏断裂、隐伏岩体。 (4)尺度对等(scale consistency)原则,变量选取的尺度要与预测比例尺相当。(5)地质研究与数学分析相结合。对于由数学分析选出但地质意义不明确的变量,应进一步研究及地质意义,看是否隐含着某些地质信息;如果其地质意义仍不清楚,则应检查变量的取值,变换及计算,看是否是数学处理过程中发生了错误。 6 地质变量选择的方法

概率论与数理统计第十一章 数理统计实验精品教案

第十一章数理统计实验 11.1 Excel基本操作 11.1.1 单元格操作 1. 单元格的选取 Excel启动后首先将自动选取第A列第1行的单元格即A1(或a1)作为活动格,我们可以用键盘或鼠标来选取其它单元格.用鼠标选取时,只需将鼠标移至希望选取的单元格上并单击即可.被选取的单元格将以反色显示. 2. 选取单元格范围(矩形区域) 可以按如下两种方式选取单元格范围. (1) 先选取范围的起始点(左上角),即用鼠标单击所需位置使其反色显示.然后按住鼠标左键不放,拖动鼠标指针至终点(右下角)位置,然后放开鼠标即可. (2) 先选取范围的起始点(左上角),即用鼠标单击所需位置使其反色显示.然后将鼠标指针移到终点(右下角)位置,先按下Shift键不放,而后点击鼠标左键. 3. 选取特殊单元格 - 240 -

在实际中,有时要选取的单元格由若干不相连的单元格范围组成的.此类有两种情况. 第一种情况是间断的单元格选取.选取方法是先选取第一个单元格,然后按住[Ctrl]键,再依次选取其它单元格即可. 第二种情况是间断的单元格范围选取.选取方法是先选取第一个单元格范围,然后按住[Ctrl]键,用鼠标拖拉的方式选取第二个单元格范围即可. 4. 公式中的数值计算 要输入计算公式,可先单击待输入公式的单元格,而后键入=(等号),并接着键入公式,公式输入完毕后按Enter键即可确认..如果单击了“编辑公式”按钮或“粘贴函数”按钮,Excel将自动插入一个等号. 提示:(1) 通过先选定一个区域,再键入公式,然后按CTRL+ENTER 组合键,可以在区域内的所有单元格中输入同一公式. (2) 可以通过另一单元格复制公式,然后在目标区域内输入同一公式. 公式是在工作表中对数据进行分析的等式.它可以对工作表数值进行加法、减法和乘法等运算.公式可以引用同一工作表中的其它单元格、同一工作簿不同工作表中的单元格,或者其它工作簿的工作表中的单元格.下面的示例中将单元格B4 中的数值加上25,再除以单元格D5、E5 和F5 中数值的和. - 241 -

判别分析三种方法

作业一: 为研究1991年中国城镇居民月平均收入状况,按标准化欧氏平方距离、离差平方和聚类方法将30个省、市、自治区.分为两种类型。试建立判别函数,判定广东、西藏分别属于哪个收入类型。判别指标及原始数据见表9-4。 1991年30个省、市、自治区城镇居民月平均收人数据表 单位:元/人 x1:人均生活费收入 x6:人均各种奖金、超额工资(国有+集体) x2:人均国有经济单位职工工资 x7:人均各种津贴(国有+集体) x3:人均来源于国有经济单位标准工资 x8:人均从工作单位得到的其他收入 x4:人均集体所有制工资收入 x9:个体劳动者收入 x5:人均集体所有制职工标准工资

一、距离判别法 解:变量个数p=9,两类总体各有11个样品,即n1=n2=11 ,有2个待判样品,假定两总体协差阵相等。由spss可计算出:协方差和平均值

合计x1 123.2881 23.27817 22 22.000 x2 80.4895 22.04796 22 22.000 x3 50.8709 6.14867 22 22.000 x4 10.1450 3.11887 22 22.000 x5 6.0659 2.72297 22 22.000 x6 14.6060 6.73264 22 22.000 x7 15.7215 6.64603 22 22.000 x8 8.7895 3.02700 22 22.000 x9 1.5291 1.31496 22 22.000 知道了均值和协方差可利用matlab计算线性判别函数W(x)的判别系数a和判别常数。程序如下: v=[1.000,0.217,0.299,0.045,-0.054,0.688,0.212,0.121,-0.245;.217,1,.102,-.234,-.211,. 136,-.052,.116,.154;.299,.102,1,-.296,-.062,.091,-.017,-.607,-.034;.045,-.234,-.296,1,. 762,-.172,-.297,.103,-.554;-.054,-.211,-.062,.762,1,-.156,-.342,.022,-.654;.688,.136,.0 91,-.172,-.156,1,.235,.384,-.098;.212,-.052,-.017,-.297,-.342,.235,1,-.040,.424;.121,.1 16,-.607,.103,.022,.384,-.040,1,-.071;-.245,.154,-.034,-.554,-.654,-.098,.424,-.071,1]; >> m1=[139.2664;93.0918;53.9882;11.2073;6.7645;17.9345;17,8327;11.0018;1.6736];m 2=[107.3099;67.8873;47.7536;9.0827;5.3673;11.2775;13.6102;6.5773;1.3845]; >> m=(m1+m2)/2; >> arfa=inv(v)*(m1-m2);

相关主题
文本预览
相关文档 最新文档