11752 管理数量方法与分析
- 格式:doc
- 大小:383.50 KB
- 文档页数:32
第1章数据分析的基础1.1 数据分组与变量数列1.数据分组数据分组就是对某一变量的不同取值,按照其自身变动特点和研究需要划分成不同的组别,以便更好地研究该变量分布特征及变动规律.由于变量有离散变量与连续变量的区别,因而对其进行分组可分为单项分组与组距分组两种不同的分组方法.若变量是离散型变量,且取值只有不多的几个时,则采用单项分组.这种分组的做法是:将变量的不同取值作为一组的组别,变量有多少个不同取值就划分成多少组.若变量是连续型变量,或者是取值较多的离散型变量,则需采用组距分组.这种分组的做法是:将变量的全部职值按照其大小顺序划分成若干个不同数值的区间.2.变量数列(1)变量数列的概念在对变量取值进行分组的基础上,将各组不同的变量值与其变量值出现的次数排列成的数列,称为变量数列.由于对变量分组有单项分组和组距分组两种不同的方法,因而分组后所形成的变量数列也有单项数列和组距数列两种.(2)累计频数和累计频率向上累计频数(或频率)的具体做法是;由变量值低的组向变量值高的组依次累计频数(或频率).向上累计频数的结果表明某组上限以下的各组次数(或频数)之和是多少;向上累计频率的结果表明某组上限以下的各组次数(或频数)之和占总次数(或总频数)的比重是多少.向下累计频数(或频率)的具体做法是:由变量值高的组向变量值低的组依次累计频数(或频率).向下累计频数的结果表明某组下限及以上各组次数(或频数)之和是多少;向下累计频率的结果表明某组下限及以上各组次数(或频数)之和占总次数(或总频数)的比重.(3)变量数列分布图常用的次数分布图主要有柱状图、直方图和折线图等几种.1.2 分布中心的测度1.分布中心的概念及意义分布中心是指距离一个变量的所有取值最近的位置.揭示变量的分布中心有着十分重要的意义:(1)变量的分布中心是变量取值的一个代表,可以用来反映其取值的一般水平.(2)变量的分布中心可以揭示其取值的次数分布在直角坐标系上的集中位置,可以用来反映变量分布密度曲线的中心位置,即对称中心或尖峰位置.2.分布中心的测度指标及其计算方法(1)算术平均数①简单算术平均数:如果所掌握的资料是未经分组整理的一组变量值,就需要采用简单算术平均的方法计算其算术平均数.设某一变量x的不同取值为X1,X2,...Xn,则计算其算术平均数的公式为:②加权算术平均数:如果所掌握的资料是已经经过分组整理的变量数列资料,包括单项分组的单项数列和组距分组的组距数列.要计算其变量值的算术平均数都需要采用加权算术平均的方法.设X1,X2,…,Xn代表各组的变量值,f1,f2,…,fn代表各组变量值出现的次数,也称权数.则加权算术平均数的计算公式为:(2)中位数中位数是指将某一变量的变量值按照从小到太的顺序排成一列,位于这列数中心位置上的那个变量值.由于所掌握的资料不同,确定中位数的方法也有所区别:①来分组资科中住散的确定.②单项数列中位数的确定.③组距数列中位数的确定.(3)众数众数是指某一变量的全部取值中出现次数最多的那十变量值.由于掌握资料不同,众数的确定方法也有所不同若掌握某一变量的一组末分组的变量值,则只需要绕计出现次数最多的那个变量值即可;若掌握的资料是单项数列,则频数(或频率)最大组的变量值就是众数.若掌握的资料是组距数列,耍确定众数,首先依据各组变量值出现次数多少确定众数所在的组,然后采用上限公或者下限公式确定众数即可.1.3离散程度的测度1. 离散程度测度的意义(1)通过对变量取值之间离散程度的测定,可以反映各个变量值之间的差异大小,从而也就可以反映分布中心指标对各个变盘值代表性的高低.(2)通过对变量取值之间离散程度的测定,可以大致反映变量次数分布密度曲线的形状.2.离散程度的测度指标(1)极差极差又称全距,是指一组变量值中最大变量值与最小变量值之差,用来表示变量的变动范围.通常用R代表全距. R=max(xi)一min(xi)(2)四分位全距四分位全距是指将一组由小到大排列的变量数列分成四等分,可得到三个分割点Ql、Q2、Q3,,分别称为第一个、第二个、第三十四分位数;然后用第一十四分位数Ql减去第三个四分位靛Q3所得差的绝对值,即为四分位全距.(3)平均差平均差是变量各个取值偏差绝对值的算术平均数由于变量的各个取值与其算术平均数的偏差有正有负,直接相加会使其正负抵消而为O.所以可将每个偏差取绝对值后再相加求平均.如此便得到了平均差.实际上,平均差反映了变量的各个取值离其算术平均数的平均距离.(4)标准差标准差是变量的各个取值偏差平方的平均数的平方根,又称为根方差.(5)方差标准差的平方称为方差.它与标准差的作用相同,也可用来描述变量分布的离散程度.方差的数学性质如下:①变最的方差等于变量平方的平均数减平均数的平方.②变量与算术平均数离差平方和具有最小的性质,即变量与算术平均数计算的方差小于变量与任何其他常数计算的方差.③变量线性变换的方差等于变量的方差乘以变量系数的平方.④n个独立变置代数和的方差,等于各变盘方差的代数和.⑤n个独立变量代数和的标准差不大于各变量标准差的代数和.(6)变异系数各个衡量变量取值之间绝对差异的指标与算术平均数的比率,通称为变异系数,具体来说有极差系数、平均差系数和标准差系数等,各变异系数的计算公式分别为:1.4 偏度与峰度1.偏度与峰度的概念变量分布的偏斜程度是指其取值分布的非对称程度;变量分布的峰度是指其取值分布密度曲线顶部的平坦程度或尖峭程度.2.偏度的测度(1)直观偏度系数直观偏度系数是利用描述变量分布中心的不同指标之间的直观关系而确定的测度变量分布偏斜程度的指标.主要有皮尔逊偏度系数和鲍莱偏度系数两种.皮尔逊偏度系数的数值在—3~十3的范围之内.皮尔逊偏度系数的绝对值越接近于3,变量分布的偏斜程度越大;皮尔逊偏度系数的绝对值越接近于O,变量分布的偏斜程度就越小.鲍莱偏度系数的数值在一1~十l之阿.其绝对值越接近于1,变量分布的偏斜程度越大;其绝对值越接近于0,变量分布的偏斜程度越小.(2)矩偏度系数矩偏度系数就是利用变量的矩来确定的变量分布偏斜程度的指标.变量分布的矩有两种,一种称为原点矩,即变量所有取值的某次方的算术平均数;另一种称为中心矩,即变量所有取值与其算术平均数离差的某次方的算术平均数.其中乘方的次数称为阶数.对于变量x,其m阶原点矩用表示,其m阶中心矩用Sm表示.3.峰度的测度对观测变量分布密度曲线顶峰的尖峭程度的测定,通常主要用峰度系数指标.峰度系数的构造,需要利用观测变量取值的四阶中心距来进行.将变量的四阶中心矩与其标准差的四次方相除,所得比率就称为峰度系数,其计算公式为:1.5 两个变变量的相关关系1.协方差协方差是两个变量的所有取值与其算术平均数离差乘积的算术平均数,它可以用来测定两变量之间相关关系的方向和密切程度.若对两个变量x和Y同时进行了n次观测.所获得x和y的成对观测数据为:(x1,y1),(x2,y2),…,(Xn,Yn),则两变量X和Y的协方差的计算需采用简单算术平均法,其计算公式为:2.相关系数若是根据总体数据计算,相关系数通常用Pxy表示.其计算公式为:式中:表示总体的协方差;表示总体变量X的标准差;表示总体变量y的标准差.若是根据样本数据计算,相关系数通常用表示,其计算公式为:式中:Sxy 表示样本的协方差;Sx 表示样本变量x的标准差;Sy 表示样本变量y的标准差.第2章概率与概率分布2.1 随机事律与概率1.事件的关系与运算(1)若事件A发生必然导致事件B发生,则称事件B包含事件A,或称事件A包含于事件B,即事件A是事件B的子集.若事件A包含事件B.事件B也包含事件A,则称事件A与B相等.(2)若事件A与事件B至少有一个发生,则记为A∪ B(或A+B),并且称为事件A与B的并(和).(3)若事件A与事件B同时发生,则记为A∩ B(或AB).并且称为事件A与B的交(积).(4)若事件A发生而事件B不发生,则记为A一B,并且称为事件A与B的差.(5)若事件A与B不可能同时发生,也就是说,AB是不可能事件,即AB=,则称事件A与B是互不相容事件,或者称A与B是互斥事件.(6)若事件A与事件满足:则称是A的对立事件,或者称A是的对立事件.(7)设A1,A2,…,An 是有限或可数个事件,若其满足:则称由A1,A2,…,An 所组成的事件组为一个完备事件组.2.随机事件的概率概率的性质:(1)O≤P(A)≤1(2)P(Ω)=l,P =0(3)若A与B互不相容(也称互斥),则有:P(A ∪ B)=P(A)+P(B)(4)若A与是对立事件,则有:(5)若A与B是任意两事件,则有:P(A U B)=P(A)+P(B)-P(AB)此式称为概率的加法公式.3.古典概率若一个随机试验的样本空同是由有限个样本点构成,且每个样本点在实验中是等可能地出现,那么,事件A发生的概率就可用下列公式来计算:4.条件概率与事件的独立性(1)条件概率的定义在随机试验中,有时除了需要知道事件B发生的概率P(B)外,还需要知道在事件A已经发生的条件下事件B的概率,我们把这个概率记柞P(B ▏A)·其公式如下:(2)条件概率的计算方法①利用条件概率的定义公式计算.②采用缩减样本空间方法,即根据事件已经发生的信息缩减样本空间,再在此基础上计算B的概率.(3)乘法公式P(AB)=P(A)P(B ▏A) (P(A)>0) 此式称为概率的乘法公式,简称乘法公式.(4)全概率公式与贝叶斯公式若设随机试验E的样本空间为是一个完备事件组,且则对E的任一事件A,都有:上式称为全概率公式.上式称为逆概率公式,或称为贝叶斯公式.在全概率公式和贝叶新公式中的是导致事件A发生的各种原因、情况或途径及其可能性.是各种原因发生的概率,称为先验概率,一般由实际经验给出.贝叶斯公式中的称为后验概率,它反映了事件A发生后各种原因造成的可能性的大小.(5)事件的独立性若事件A和B满足等式P(AB)=P(A)P(B)则称事件A、B是相互独立的.两事件相互独立的概念可以推广到有限多个事件的情形.2.2 随机变量及其分布l.随机变量的概念设随机试验E的样本空间为Ω={e}.若对于每一个e∈Ω.都对应唯一实数X(e),则称变量X(e)为随机变量,记作X.以后用字母X,Y,…表示随机变量.2.随机变量的概率分布(1)离散型随机变量的概率分布①两点分布.两点分布的应用条件是:若互相独立的重复试验只有“成功”和”失败”两种结果,这种试验称为贝努里试验.其分布律为:②超几何分布.若要确定n次实验中恰好出现次成功的概率,则需采用下列概率模型:③二项分布.若要确定其恰好有次成功的概率,其中随机变量X表示实验次数,则所需概率模型为:式中:0<p<1;n为正整数;n和p为二项分布的两个重要的参数.④泊松分布.泊松分布的分布律为:记作为参数.(2)连续型随机变量的概率分布对于随机变量X的分布函数F(x),如果存在非负函数f(x),使对任意实数x有:则称x为连续型随机变量,f(x)为x的概率分布密度,简称分布密度或概率密度,分布密度的图形叫做分布密度曲线.下面介绍几种常用的连续型随机变量的概率分布:①均匀分布,若连续型随机变量X的概率密度为刚称随机变量X在[a,b]上服从均匀分布.②正态分布.若随机变量X的概率密度为其中,为常数,则称x服从参数为的正态分布.记作.③指数分布.指数分布的概率密度函数为其中,为参数.2.3 随机变量的数字特征与独立性l.随机变量的数字特征(1)数学期望随机变量的期望值也称为平均值,它是随机变量取值的一种加权平均数,是随机变量分布的中心.①离散型随机变量X的数学期望定义为:②连续型随机变量X的数学期望的定义为:(2)方差①离散型随机变量的方差定义为:②连续型随机变量的方差定义为:为了便于计算方差,下面引入一个计算方差的简捷公式:③方差的性质:设c为常数,则D(c)=O.设X为随机变量,c为常数,则有.设X、Y 是两个相互独立的随机变量,则有D(X+Y)=D(X)+D(Y).(3)一些常用随机变量的期望和方差①(O-1)分布.设X服从(0-1)分布,则E(X)=p,D(X)=(1一p)p.②二项分布.设X~B(n,p),则X的分布律为:③泊松分布.设,即X的分布律为:则其数学期望和方差分别为:.④均匀分布设随机变量X在[a,b]上服从均匀分布,则其概率密度为:其教学期望自方差分别为:.⑥指数分布.设X服从指数分布,则其分布密度为:其数学期望和方差分别为:.2.二维随机向量与随机变量的独立性(1)二维随机向量及其分布①离散型随机向量的概率分布.称为随机向量(X,Y)的联合概率分布,简称概率分布,也称联合分布律.称为X的边缘概率分布;为Y的边缘概率分布.②连续型随机向量的概率分布:对于二维随机向量(X,Y)的分布函数F(X,Y),如果存在非负函数f(X,Y),使对任意实数X,Y有:则称(X.Y)为二维连续型随机向量,f(X,Y)称为(X,Y)的联合概率分布密度,简称概率密度.(2)随机变量的独立性设X,Y为两个随机变量,若对任意实数x,y有则称X,Y相互独立.2.4 大皴定律与中心极限定理1.大数定律(1)贝努里大数定理设事件A在一次试验中发生的概率为p,在n次独立重复试验中,A发生m次,那么对任意给定的正数,有(2)辛钦大数定律设随机变量Xl,X2,…,Xn,…相互独立,服从同一分布,且,则对任意正数,恒有2.中心投限定理定理1:设随机变量Xl,X2,…,Xn,…相互独立,服从同一分布,且具有数学期望和方差:则恒有此定理称为林德贝格一勒维中心极限定理,也称为独立同分布的中心极限定理.定理2:设Xn~B(n,p),0<p<1,则此定理称为德莫佛一拉普拉斯中心极限定理.第3章时间序列分析3.1 时间序列概述1.时间序列的概念和种类(l)时间序列的概念时间序列就是按照时间顺序将观察取得的某个统计指标(变量)的一组观察值进行排列而成的序列.(2)时间序列的分类①按指标性质分类.时间序列按照所排列指标的性质不同,可以分为以下三种:时点序列是指由某一时点指标的不同时点上的指标值按照时间先后顺序排列而成的时间序列.时期序列是指某一时期指标的不同时期上的指标值按时间先后顺序排列而成的时间序列.特征序列是指由某一相对指标或者平均指标的不同时间上的指标值按照时间先后顺序排列而成的时间序列.②按指标数值变化特征分类.时间序列按指标数值变化特征不同,可以分为以下两种:如果一十时间序列中的指标数值不存在持续增长或下降的趋势,并且其波动的幅度在不同的时间也没有显著差异,那么该时间序列就是一个平稳序列.如果一个时间序列中的指标数值存在着持续增长或下降的趋势,或者其波动的幅度在不同的时间有明显的差异,那么该时间序列就是一个非平稳序列.2.时间序列的影响因素和模型(1)时间序列的影响因素任何客观现象所构成的时间序列随着时间的推移都会发生各种各样的变化,而这种变化又是受到各种影响因素共同作用的结果.这些影响因素归纳起来主要包括长期趋势(T)、季节变化(S)、循环变动(C)和不规则变动(I).(2)时间序列的变动模型时间序列可分解为多种模型,其中最常见的有乘法模型和加法模型.乘法模型:Y=T·s·c·I加法模型:Y=T+s+c+I3.2 时间序列特征指标l.时间序列水平指标(1)平均发展水平平均发展亦平,又称序时平均数,它是将一个时间序列中各个时间上的指标值加以平均而得到的平均数,用以反映所研究现象在一段时间内的一般水平或者代表水平.(2)增长量增长量是报告期水平与基期水平之差,它反映报告期较基期增长(或减少)的绝对数量.用公式表示为:增长量=报告期水平一基期水平(3)平均增长置平均增长量是逐期增长量的序数平均数.2.时间序列速度指标(1)发展速度发展速度是报告期水平和基期水平之比,又称动态相对数,它反映报告期较基期发展变动的相对程度.(2)增长速度增长速度,也称增长率,它是增长量除以基期水平或者发展速度减l的结果,说明研究现象逐期增长或在较长时期内总的增长速度.(3)平均发展速度和平均增长速度①平均发展速度是各个时期环比发展速度的序时平均数,反映研究现象在较长时期内发展速度变化的平均程度.在实际工作中,平均发展进度的计算方法有两种,即几何平均法和方程式法.②平均增长速度,又称平均增长率,它是增长速度的序时平均数.3.3 长期趋势的测定及预测1.时距扩大法时距扩大法是测定长期趋势最原始、最简单的方法.它是将原有时间序列中较小时距单位的若干个数据加以合并,得出扩大了时距单位的数据,形成新的时间序列,通过这种方法求得的新的时间序列可以消除较小时距单位所受到的偶然因素的影响,使研究现象发展变化的基本趋势显示得更为明显.2.移动平均法移动平均法是对时距扩大法的一种改良.它是采用遥期递推移动的方法计算一系列扩大时距的序时平均数,并以这一系列移动平均数作为其对应时期的趋势值.3.数学模型怯时间序列中长期趋势的表现形式是多种多样的,常用的趋势线数学模型主要有以下几种:直线、指数曲线、二次曲线、修正指数曲线、逻辑曲钱、龚珀茨曲线种双指数曲线.常用的判别方法有:(1)图形法.若以横轴表示原时间序列中的时间(变量)t,以纵轴表示原时间序列中的指标y,将原时间序列中的时间与对应的指标值(ti,yi)作为坐标点描在直角坐标系中便形成散点图.然后根据散点图的走势,就可以大致判断出原时间序列的趋势线模型.(2)指标法.即通蛙计算出一系列指标来判别原时间序列的趋势线类型.3. 4 季节变动的测定和预测1.按月(季)平均法接月(季)平均法是测定被研究现象季节变动的最简单方法.用符号袭示如下:式中:SI代表季节比率;代表各年同月(季)的平均数;代表各年总的月(季)平均数.2.趋势剔除法(1)移动平均趋势剔除法移动平均趋势剔除法是首先将移动平均数作为长期趋势值加以别除,再测定季节变动的方法.(2)配合趋势线趋势剔除法这种方法的具体做法是:①配合趋势方程.②将以年为单位的趋势方程变换为以月(季)为单位,并将原点移动至第一年第一个月(或第一季度).③根据所确立的趋势方程确定每年各月的月趋势值(或各季度的季趋势值).④求修匀比率,即将每月(季)的实际观测值除以每月(季)趋势值.⑤求季节比率,即根据每月(季)的修匀比率计算各月(季)的平均比率.3.季节变动的预测(1)简单季节模型预测方法如果已知下一年的全年预测值,则各月(季)的预测值等于月(季)平均预测值乘以该月(季)的季节比率.用公式表示为:式中:代表月(季)的预测值;代表测算的预测年度各月(季)平均值;代表月(季)季节比率.(2)移动平均季节模型预测方法简单季节模型未考虑到时间序列中的长期趋势变动因素.事实上,时间序列往往同时存在长期趋势变动、季节变动和随机变动,这就需要将三种变动因素加以分解,首先用移动平均消除时间序列中随机因素变动,并在趋势变动的基础上再根据季节变动对预测值加以调整,这样可以达到更切合实际的效果.3.5 循环变动和不规则变动的测定1.循环变动的测定(1)直接测定法计算步骤如下:①计算各期的年距环比发展速度.②计算各期的循环指数.(2)剩余测定法剩余测定法也称分解法.选种方法基本思路是:假定时间序列各影响因素对现象发展影响的模型为乘法模型:y=t·s·c·t,利用分解分析原理,首先在时间序到中剔除长期趋势和季节变动,然后再消除随机变动因素.从而揭示循环变动的特性.2.随机变动的测定随机变动的计算公式为:第4章统计指数4.1 统计指数的概念和种粪1.统计指数的概念从广义上讲,一切说明社会现象数量对比关系的相对数都是指数.从狭义上讲,指数是一种特殊的相对数,它是反映不能直接相加的多种事物数量综合变动情祝的相对数.2.统计指数的作用一般来说,统计指数有以下三个方面的作用:(1)综合反映事物的变动方向和程度.(2)分析受多因素影响的现象总变动中各个因素的影响方向和程度应该明确两点,首先现象总量是由若干个困素的乘积组成.其次,现象总量变动是各因素变动的结果.统计指数第二个作用就是用来分析上述这种受多因素影响的现象总变动中受各个因素的影响方向和程度(3)研究事物在长时间内的变动趋势.3.坑计指数的种类根据研究的目的和任务不同,统计指数可以划分为不同的种类:(1)个体指数和总指数(2)数量指标指数和质量指标指数(3)综合指数和平均指数(4)时间指数和空间指数4.2 综合指数1.综台指数的概念综合指数是总指数的基率形式,它是由两个总量指标对比形成的指数.设qo、q1、po、p1分别代表基期、报告期的销售量和价格,分别代表销售量总指数和价格总指数,则综合指数的公式如下:2.编制综合指数应解决舶问题从上连综合指数的概念中知道,综合指数是研究社会经济现象总体总量的变动情况.3.综合指数公式的编制(1)拉氏指数用来表示物量总指数,用表示物价总指数,拉氏综合指。
管理数量⽅法与分析复习资料《管理数量⽅法与分析》复习资料第1章数据分析的基础本章重点难点1.数据分组与变量数列2.分布中⼼与离散程度的测定3.偏度与峰度4.两个变量的相关关系学习⽬标重点掌握:1.数据分组与变量数列编制的⽅法及其应⽤;2.分布中⼼与离散程度指标的种类、测定⽅法及其应⽤;3.偏度、峰度以及相关系数的作⽤以及计算⽅法。
能够理解:本章学习内容中的基本概念。
⼀、选择题1.随机抽取某班级的10名男同学,测得其体重(单位Kg ,从⼩到⼤排列)分别为56.0,59.2,61.4,63.1,63.7,67.5,73.5,78.6,80.0,86.5,则其中位数为()A.63.7B.67.5C.65.6D.65.12.下列说法正确的是()A.四分位全距和极差⼀样容易受极端变量值的影响B.四分位全距充分利⽤了所有数据的信息C.标准差的平⽅称为⽅差,⽤来描述变量分布的离散程度D.⽅差的平⽅称为标准差3.在对某项数据进⾏分析之前,我们应该做的前提⼯作是()A.数据的整理B.数据的检查C.数据的分组D.数据的搜集与加⼯处理4.在正态分布的情况下,算术平均数X 中位数e m 众数0m 之间的⼤⼩关系是() A.0m m X e >> B.0m m X e << C.0m m X e == D.e m m X >>05.下列不属于离散程度的测量指标的是()A.极差D.四分位全距6.关于算术平均数的性质,下列说法正确的是()A.各变量值与算术平均数离差平⽅和最⼤B.各变量值与算术平均数离差的总和不等于零C.变量线性变换的平均数等于变量平均数的线性变换D.n 个相互独⽴的变量的代数和的平均数⼤于其平均数的代数和7.已知某班级⾼等数学期末考试成绩中位数为72分,算术平均数为69分,则该班级学⽣⾼等数学成绩的众数的近似值为()A.78分B.63分C.75分D.70.5分8.()指的是变量的取值分布密度曲线顶部的平坦程度或尖峭程度。
1.在测量了变量的分布特征之后,测度变量之间的相关程度有何意义?测量指标有哪些?答:有时候掌握了变量的分布特征之后还不够,还需要了解变量之间相互影响的变动规律,以便对变量之间的相对关系进行深入研究。
测度指标有协方差和相关系数。
2.简述数学期望和方差各描述的是随机变量的什么特征。
答:随机变量的期望值也称为平均值,它是随机变量取值的一种加权平均数,是随机变量分布的中心,它描述了随机变量取值的平均水平,而方差是各个数据与平均值之差的平方的平均数,方差用来衡量随机变量对其数学期望的偏离程度。
3.在数据分布中离散程度测度的引入有何意义?答:研究变量的次数分布特征出来考察其取值的一般水平的高低外,还需要进一步考察其各个取值的离散程度。
它是变量次数分布的另外一个重要特征。
对其进行测定在实际研究中十分重要的意义:首先通过对变量取值之间离散程度的测定可以反映各个变量值之间的差异大小,从而也就可以反映分布中心指标对各个变量值代表性的高低。
其次,通过对变量取值之间离散程度的测定,可以大致反映变量次数分布密度曲线的形状。
4.在变量数列中引入偏度与峰度的概念有何意义?答:对变量次数分布的偏斜程度和峰尖程度进行测度,一方面可以加深人们对变量取值的分布情况的认识;另一方面人们可以将所关心的变量的偏度标值和峰度指标值与某种理论分布的偏度标值和峰度指标值进行比较,以判断所关心的变量与某种理论分布的近似程度,为进一步的推断分析奠定基础。
5.什么是变量数列?答:在对变量取值进行分组的基础上,将各组不同变量值与其变量值出现的次数排列成的数列,就称为变量数列。
1.(1)运用算术平均数应注意什么问题?在实际应用中如何有效地避免(1)中的问题。
答:(1)运用算术平均数应注意:①算术平均数容易受到极端变量的影响。
这是由于算术平均数是根据一个变量的全部变量值计算的,当一个变量的取值出现极小或者极大值,都将影响其计算结果的代表性。
②权数对平均数大小起着权衡轻重的作用,但不取决于它的绝对值的大小,而是取决于它的比重。
第一章数据分析得基础1、【选择】数据分析得前提就就是数据得搜集与加工处理。
在数据资料进行加工处理时,通常采用对数据进行分组得方法。
2、【选择】数据分组就就是对某一变量得不同取值,按照其自身变动特点与研究需要划分成不同得组别,以便更好地研究该变量分布特征及变动规律。
3、【选择】变量数列两要素:①组别——由不同变量值所划分得组;②频数——各组变量值出现得次数。
各组次数与总次数之比叫做比率,又称频率。
4、【选择】在变量数列中,由不同变量值组成得组别表示变量得变动幅度,而频数与频率则表示相对应得变量值对其平均水平得作用程度。
频数(频率)愈大得组所对应得变量值对其平均水平得作用越大;反之,频数(频率)愈小得组所对应得变量值对其平均水平得作用也愈小。
5、【案例分析】变量数列得编制(将结合变量数量分布图进行考查)①确定组数;对于等距分组,斯特吉斯给出一个大致得计算组数得公式:m=1+3、322lgN(变量个数N,组数为m)。
②确定组距;在组距分组中,每组得上限与下限之间得距离称为组距等距分组得组距为d:③确定组限;当相邻两组中数值较小得一组得上限与数值较大得一组得下限只能用同一数值表示时,为了不违反分组得互斥性原则,一般规定上限不包含在本组之内,称为上限不在内原则。
④计算各组得次数(频数);⑤编制变量数列;将各组变量值按从小到大得顺序排列,并列出相对应得次数,形成变量数列。
6、【选择】累计频数与累计频率可概括地反映变量取值得分布特征。
向上累计分布曲线呈上升状,向下累计分布曲线呈下降状。
组得次数(或频数)较少,曲线显得平缓;组得次数(或频数)较密集,曲线显得较陡峭。
7、【选答】洛伦茨曲线及其绘制方法(1)累计频数(或频率)分布曲线可用来研究财富、土地与工资收入得分配就就是否公平,这种累计分布曲线图最早就就是由美国洛伦茨博士提出,故又称洛伦茨曲线图。
洛伦茨曲线,对角线为绝对平等线。
根据实际收入分配线与绝对平等线或绝对不平等进行对比可衡量其不平等程度。
管理数量⽅法与分析标杆分析《孙⼦兵法》"知⼰知彼,百战不殆"指都是标杆分析。
离散程度的指标:极差,四分位全距,平均差,⽅差,变异系数。
时间序列特征指标时间序列⽔平指标:⽤来反映研究现象的绝对变动量或平均变动量,包括,发展⽔平,增长量和平均增长量。
时间序列速度指标:⽤来反映研究现象在动态上发展变动的相对程度或平均程度,包括发展速度,增长速度,平均发展速度和平均增长速度。
偏度与峰度偏度:指取值分布的⾮对称程度。
峰度:指取值分布密度曲线顶部的平坦程度或尖峭程度。
偏度和峰度的意义1.加深对变量取值的分布状况的认识2.对值进⾏⽐较,以判断所关⼼的变量与理论分布的近似程度,为进⼀步推断分析奠定基础。
正态分布的特征:集中性,对称性,均匀变动性,统计决策的步骤:1.确定决策⽬标2.拟定各种可⾏的⾏动⽅案3.通过⽐较分析选出最佳的⾏动⽅案4.决策的执⾏沉没成本:过去已经发⽣的,现在或将来的任何决策都⽆法改变的成本。
数据分组:1.单项分组(某⼩区居民家庭按⼈数分组,1,2,3,4)2.组距分组(某班级学⽣成绩分组60以下,70-80,80-90,90-100)变量数列:在对变量取值分组的基础上,将各组不同的变量值与其变量取值出现的次数排列成的数列,成为变量数列。
组别:由不同变量值所划分的组频数:各组变量值出现的次数频率:各组次数与总次数之⽐(⽐率)当对变量值求算数平均数,频数看作绝对数权数当对变量值求算数平均数,频率看作相对数权数。
因素分析法:根据指标体系中多种因素影响的社会经济现象的总变动情况,分析其受各因素的影响⽅向和影响程度的⼀种⽅法。
步骤与⽅法:1.在定性分析的基础上,确定要分析的对象及影响的因素。
2.根据指标间数量对等关系的基本要求,确定分析所采⽤的对象指标和因素指标,并列出其关系式。
3.根据指标关系式建⽴分析指数体系及相应的绝对增减量关系式。
4.应⽤实际资料,根据指数体系及绝对量关系式,依次分析每⼀个因素变动对对象变动影响的相对程度及绝对数量。
《管理数量方法与分析》简答题第一章数量分析基础1,对数据进行分析的前提是什么?数据分析的前提是数据的搜集与加工整理。
2,什么是变量数列?变量数列是,在对变量的取值进行分组的基础上,将各组不同的变量值与其变量值出现的次数排列成的数列。
3*,变量数列的两个组成要素及其作用。
变量数列由两个要素组成:一个是由不同变量值划分的组,称为组别;另一个是各组变量值出现的次数,称为频数;各组频数与总次数之比,称为频率。
组别表示变量的变动幅度;频数、频率表示对应的变量值对其平均水平的作用程度。
频数、频率越大的组所对应的变量值对其平均水平的作用也越大。
4,什么是洛伦茨曲线?它的主要用途是?洛伦茨曲线就是累计频数(或频率)分布曲线,主要用途是研究社会财富、土地和工资收入的分配是否公平。
5*,简述分布中心的概念和意义。
分布中心,是指距离一个变量的所有取值最近的位置。
变量的分布中心有重要的意义,①可以反映变量取值的一般水平。
②可以揭示其取值的次数分布在直角坐标系中的集中位置,可以用来反映变量分布密度曲线的中心位置。
6,应用算数平均数应该注意哪些问题?怎么避免?略。
7,算数平均数有哪些性质?略。
8*,在数据分析中引入离散程度测度有什么意义?变量各取值之间的离散程度是变量次数分布的一个重要特征,测定它对实际研究有重要意义:①可以反映各变量取值之间的差异大小,也就是反映分布中心指标对各个变量值代表性的高低。
差异越大,代表性越低。
②可以大致反映变量次数分布密度曲线的形状。
9*,测度离散程度的指标有哪些?分别的特点是什么?①极差。
(也称全距,指最大值与最小值的差值。
)特点:计算简单,意义明了,是离散程度测度指标中最粗略、最简单的一种。
②四分位全距。
特点:不像极差那么容易受极端变量值的影响,但是依然存在没有充分利用所有数据信息的缺点。
③平均差。
(变量各取值与平均数偏差的绝对值的算数平均数)特点:平均意义明确,计算不复杂,但是计算公式中带有绝对值符号,在运算上不方便,所以在实际中不常用。
数量管理方法与分析数量管理方法和分析是指根据企业的需求和目标以及市场环境的变化,对产品或服务的数量进行有效的控制和分析,从而实现企业的生产、销售和运营的高效性和盈利性。
数量管理方法和分析的主要目标是合理分配资源、提高效率、降低成本、增加利润,并满足客户需求。
数量管理方法主要包括需求管理、库存管理和生产管理等。
首先是需求管理。
需求管理是指通过市场调研和客户反馈等手段,预测和分析客户对产品或服务的需求,以便合理制定生产和销售计划,避免过剩或不足的情况发生。
在需求管理中,可以运用预测方法和订单管理等工具,分析历史数据和趋势,预测出未来的需求量,并根据需求量的变化调整生产和采购计划,以便在满足需求的同时,减少库存和成本的占用。
其次是库存管理。
库存管理是指对产品或原材料的数量进行控制和优化,减少库存存储和运作的成本。
库存管理的核心是掌握合适的库存水平,通过设定安全库存和经济批量等指标,平衡生产和销售之间的关系,避免库存过剩或不足。
在库存管理中,可以借助ERP系统和供应链管理等工具,监控库存情况,实时掌握库存数量和周转速度,及时采取调整措施,提高库存周转率和资金利用率。
最后是生产管理。
生产管理是指对生产过程中的数量进行有效控制和优化,提高生产效率和产品质量。
生产管理需要根据需求和资源情况,合理安排生产计划,确保生产和供应的顺畅进行,避免资源和能力的浪费。
在生产管理中,可以运用物料需求计划和生产调度等工具,分析生产能力和资源配置情况,制定合理的生产计划和调度安排,提高生产效率和产品质量,并减少生产成本和库存占用。
数量管理方法和分析的重要性体现在以下几个方面:首先,数量管理能够提高资源的合理利用和分配效率。
通过对产品或服务数量的精确控制和分析,可以避免资源的浪费和闲置,提高资源利用率和效益。
其次,数量管理可以降低成本,提高企业盈利能力。
通过合理控制库存量和生产量,避免库存积压和生产过剩,可以降低库存和生产成本,提高产品利润率和销售毛利率。
《管理数量方法与分析》考试大纲考核目标本课程的考核目标是按照识记、理解、应用三个层次规定其应达到的能力层次要求,三个能力层次是递进等级关系。
各层次的涵义如下:识记:能知道有关的概念、原理、方法等知识的涵义,并能正确认识和表述。
这是低层次的要求。
理解:在识记的基础上,能全面把握基本概念、基本原理、基本方法,并能掌握有关概念、原理、方法的区别与联系以及有关的各种分类。
这是高层次的要求。
应用:在识记和理解的基础上,能够较熟练地运用基本原理、基本方法对实际当中所遇到的问题进行具体分析和研究。
这是最高层次的要求。
下表列出了三个考核目标层次的权重比:识记 理解 应用30% 40% 30%考核形式本课程将通过一次性笔试进行考核,考核时间为2小时45分钟,题型包括选择题、简答题、计算题等常见题型。
考核内容第1章 数据分析的基础分组数据分析,包括变量数列和累积频数中心趋势分析,包括分析数据的平均数、中位数和众数离散程度分析,包括全距、四分数、平均差、标准差、方差和偏度与峰度相关系数的测度与分析第2章 概率与概率分布概率的定义与计算随机变量及其概率分布随机变量的数字特征与独立性概率抽样的理论基础第3章 时间序列分析时间序列及其分析指标长期趋势的测定及预测季节变动的测定和预测循环变动和不规则变动的测定第4章 统计指数统计指数的有关概念总指数的编制方法及其应用,包括综合指数和平均指数指数体系与因素分析法第5章 线性规划介绍线性规划问题的数学模型使用线性规划的基本技巧线性规划的应用第6章 统计决策分析统计决策的要素和程序非概率型决策概率型决策,包括先验概率型决策和后验概率型决策第7章 与决策相关的成本、风险和不确定性相关性与滞留成本的相关概念决策风险与不确定性介绍风险与不确定条件下的决策方法及其应用第8章 模拟决策技巧和排队理论排队论的有关概念排队论的理论模型与应用,包括M/M/1排队模型和M/M/C排队模型 第9章 成本、产出和效益分析成本/产出/效益分析概述损益平衡分析损益平衡分析与决策第10章 标杆分析标杆分析的相关理论标杆分析的方法及其应用第11章 章商业信息的电子表格程序和计算机分析电子表格基本操作有关概念电子表格功能及其应用案例电子表格高级功能简介。
第一章数据分析的基础第一节数据分组与变量数列【★★★单选、简答】一、●数据分组1.数据分组:就是对某一变量的不同取值,按照其自身变动特点和研究需要划分成不同的组别,以便更好地研究该变量分布特征及变动规律.由于变量有离散变量与连续变量的区别,因而对其进行分组可分为单项分组与组距分组两种不同的分组方法。
2.若变量是离散型变量,且取值只有不多的几个时,则采用单项分组,单项分组的做法是:将变量的不同取值作为一组的组别,变量有多少个不同取值就划分成多少组。
3.若变量是连续型变量,或者是取值较多的离散型变量,则需采用组距分组.组距分组的做法是:将变量的全部取值按照其大小顺序划分成若干个不同数值的区间。
二、●变量数列1.▲变量数列的概念:在对变量取值进行分组的基础上,将各组不同的变量值与其变量值出现的次数排列成的数列,称为变量数列,由于对变量分组有单项分组和组距分组两种不同的方法,因而分组后所形成的变量数列也有单项数列和组距数列两种。
2.▲变量数列组成要素:组别:由不同变量值所划分的组;频数:各组变量值出现的次数;频率:各组次数与总次数之比。
3.编制组距数列的步骤:1)确定组数:组距大、组数就少;组距小、组数就多。
2)确定组距:上下限之间的距离,开口组参照相邻组;开口组组中值参照相邻组3)确定组限:每组的最大值称为该组的上限,最小值是下限;组中值=(上限+下限)/2上限不在内,下限一定在内。
【2013.11案例分析一小题】4)计算各组的次数(频数):5)编制变量数列:4.向上累计频数(或频率)的具体做法是:由变量值低的组向变量值高的组依次累计频数(或频率),向上累计频数的结果表明某组上限以下的各组次数(或频数)之和是多少;向上累计频率的结果表明某组上限以下的各组次数(或频数)之和占总次数(或总频数)的比重是多少。
【例题:P7】5.向下累计频数(或频率)的具体做法是:由变量值高的组向变量值低的组依次累计频数(或频率),向下累计频数的结果表明某组下限及以上各组次数(或频数)之和是多少;向下累计频率的结果表明某组下限及以上各组次数(或频数)之和占总次数(或总频数)的比重。
管理数量方法与分析第十一章 商业信息的电子表格程序和计算机分析电子表格是一类表格型程序计算机软件,提供电子化的数据管理功能,但更强大的是数据分析功能。
微软的EXCEL和Loutusl-2-3是电子表格程序的典型代表,前者为我国大多数用户所熟悉.电子表格程序以可视化的数据管理和便利实用的功能为大多数商务管理人员所采用。
1.Excel的基本概念(选择)Excel中最基本的文件是所谓的工作簿(book)。
另外几个重要元素如下:(1)单元格和活动单元格:工作表中行和列相交的小方格称为单元格。
单元格是工作表储存数据的最小单元,每个单元格最多可以容纳32000个字符。
每一张工作表同时只能有一个单元格是活动的,称为活动单元格。
用户只能向活动单元格中输入数据。
活动单元格在工作表中以加粗的边框表示。
(2)列标和行标:工作表上部和左侧分别标有字母和数字的灰色格子,用于对工作表中单元格定位和引用。
行号从1到65536,列标从A到Z、AA到AZ、IA到IV共256列。
单元格可以用列标加行标表示。
如:B9、$B9,其中加上$符号,表示固定引用,不加的表示相对引用。
(3)编辑栏:编辑栏用于对单元格的数据输入和编辑操作。
编辑栏最左边有一空白方格用于显示活动单元格地址。
2.Excel表的数据输入操作(选择)(1)往工作表内输入数据有两种方式:第一种是逐个向单元格内手工输入;第二种是将现有的其他格式数据文件导入到工作表中.第二种方法比较快捷,Excel支持导入几十种其他格式类型的数据文件,例如文本文件、Lotus数据文件等。
(2)Excel单元格能够输入的基本数据包括文字、数字,以及能够实现运算功能的函数或者公式。
基本数据可分为常数和公式两大类。
常数包括文字、日期、时间、货币、百分比、分数或科学计数等。
公式是由运算符号、单元格地址所组成的,用以完成计算功能。
将外部数据导入到Excel表格中也很方便。
Excel也提供了支持直接通过网络获取数据的功能,可以实现从网络实时导入各种数据。
数据分组:就是对某一变量的不同取值,按照其自身变动特点和研究需要划分成不同的组别,以便更好地研究该变量分布特征与变动规律。
变量:离散变量和连续变量分组:单项分组和组距分组。
变量数列的概念:在对变量取值进行分组的基础上,将各组不同的变量值与其变量值浮现的次数罗列成的数列,成为变量数列两因素组成:一个是由不同变量值所划分的组,称为组别。
各组变量浮现的次数,称为频数。
各组次数与总次数之比,成为频率。
1.确定组数2.确定组距3.确定组限4.计算各组的次数〔频数〕5.编制变量数列向上累计频数具体做法是:由变量值低的组向变量值高的组挨次累计频数。
向下:相反分布中心:是指距离一个变量的所有取值最近的位置揭。
示变量的分布中心有着十分重要的意义。
首先,变量的分布中心是变量取值的一个代表,可以用来反映其取值的普通水平。
一个变量往往有许多个不同的取值,假若要用一个数值作为他们的代表,反映其普通水平,分布中心值无疑是一个最合适的数值。
其次,变量的分布中心可以揭示其取值的次数分布在直角坐标系上的集中位置,可以用来反映变量分布密度曲线的中心位置即,对称中心或者尖峰位置。
分布中心指标:1 算数平均数,2 中位数,3 众数:1.算数平均数容易受到极端变量值的影响 2.权数对平均数大小起着权衡轻重的作用 3.根据组距数列求加权算术平均时,需用组中值作为各组变量值的代表1.算数平均又称均值,它是一组变量值的总和与其变量值的个数总和的比值。
2.是指将某一变量的变量值按照从小到大的顺序排成一列。
位于这列数中心位置上的那个变量值。
3.是指某一变量的全部取值中浮现次数最多的那个变量值。
离散程度:还需要进一步考察其各个取值的离散程度即差异程度的大小首。
先,通过对变量取值之间离散程度的测定可以反映各个变量值之间的差异大。
次,通过对变量取值之间离散程度的测定可以反映变量次数分布密度曲线的形状。
离散程度测定指标:1 极差,2 四分位全距,3 平均差, 5 极差,1.极差又称全距,是指一组变量值中最大变量值与最小变量值之.是。
黑体字为组数,y i为第i组的组中值,v i为第i组频数.;它不偏不倚地对待每一个数据;是数据集的“重心”.10,20,30和x,若平均数是30,那么x应为B.50 C.60 D.80C.80%,月平均工资为500元,技术工占20%,月平均工资为700元,该企业全部职工的月平均工资为【】 B.540元 C.550元 D.600元B【】A.360 B.380 C.400 D.420【答案】B,按从小到大排列后,第4位数360与第5位数400求平均为380..,对分类型有众数,也可能众数不唯一。
【例题】对于一列数据来说,其众数( )A。
一定存在B。
可能不存在 C.是唯一的D。
是不唯一的【答案】B【例题】数列2、3、3、4、1、5、3、2、4、3、6的众数是__________.=众数<众数。
Y轴的直线横坐标。
=Q3—Q1.第2四分位点Q2=全体数据的中位数;第1四分位点Q1=数据中所有≤Q2的那些数据的中位数;Q2的那些数据的中位数。
R那样容易受极端值的影响i同上, n是数据的个数,是分组数据的加权平均数。
(方差的算术平方根,与原来数据的单位相同) %) (反映数据相对于其平均数的分散程度)则得分的变异系数是( ) A.0。
05 B.0。
2C 。
5D 。
20v ,得出4/80=0。
05不完全正线性相关 不完全线性相关不完全负线性相关完全正线性相关完全线性相关完全负线性相关 变量的关系近似非线性函数;(x 1,y 1),…,(x n ,y n )是总体(X ,Y )的n 对观察值 |r |≤1。
17.若变量Y 与变量X 有关系式Y=3X+2,则Y 与X 的相关系数等于( )A .一1B .0C .1D .310.当所有观察点都落在回归直线y=a+bx 上,则x 与y 之间的相关系数为( ) A .r=0B .r 2=1C .-1〈r 〈1D .0<r<11.可以在相同的条件下重复进行;2。
试验的结果不止一个,但所有可能的结果在试验之前都知道;,称为一个基本事件(或样本点);2。
基本事件的全体所组成的集合称为样本空间(是必然事件);3.若干个样本点组成的集合(即样本空间的子集),称为随机事件(简称事件);事件A发生⇔A中一个样本点出现;∅。
, 描述法。
A发生或B发生(或A,B至少有一个发生)的事件,常记作A+B.同时发生的事件,常记作AB.B不发生的事件。
A,B中若有一个发生,另一个一定不发生(即AB=∅),则称事件A,B互斥,否则称A,B相容。
A,B互斥,且A∪B是样本空间(即AB=∅,A+B=Ω),则称事件A,B对立(或互逆)。
∅, A+=Ω).);A.ABB.B C。
A D.A+B【答案】C【解析】可画事件图或根据A =A+AB,又AB=∅推出A =A【例题】设A、B为两个事件,则A—B表示( )A.“A发生且B不发生”B。
“A、B都不发生" C。
“A、B都发生”D。
“A不发生或者B发生”A的概率,记作 P(A)(0≤P(A)≤1)。
≤P (A)≤1, P(∅)=0, P(Ω)=1。
【例题】设A、B为两个事件,P(A)=0。
5,P(A—B)=0.2,则P(AB)为( )A.0.2B.0.3C.0。
7D.0。
8P(A)=。
n个不同元素中任取r n个不同元素中任取r个的一个排列.所有排列的个数,称为从n,记作。
n个不同元素中任取r个,n个不同元素中任取r个的一个组合。
所有组合的个数,称为从n个不同元素中任取r个的组合数,记作。
显然,。
【例题】袋中有红、黄、蓝球各一个,每一次从袋中任取一球,看过颜色后再放回袋中,共取球三次,颜色全相同的概率为( )A.1/9 B.1/3 C.5/9 D.8/9【答案】选择A.共336种掷法;和为4,共3种可能。
故答案为3/36.A, P()=1— P(A);A+B)=P(A)+P(B)-P(AB)(AC)—P(BC)+P(ABC)A、B互斥,则,P (A-B)=P(A)-P(AB)时, P(A—B)=P(A)-P(B);P(A|B)= (P(B)〉0))=P(A)P(B|A),P(A)≠0;A1, A2,…, A n两两互斥, A1+…+A n=Ω,且P(A1)>0,…, P(A n)>0, 则P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)+…+P(A n)P(B|A n);B (P(B)>0),有A i|B)=, i=1,2,…,n,(分母中的 P(B)用全概公式求)。
【例题】北方大学统计系06级3班共有60名同学,至少有2名同学生日相同的概率为(一年按365天计算)( )A. B。
C. D.【答案】D},=1-P(A)=【例题】如果事件A的概率为,事件B的概率为,下列陈述中一定正确的是【答案】B【解析】利用概率的加法公式因为,,故,选B.【例题】如果事件A发生的概率,事件B发生的概率,并且已知,则()0.6 B.0。
4 C. 1 D.0【答案】C【解析】,所以AB=B,利用条件概率公式,【例题】天地公司下属3家工厂生产同一种产品,3家公司的次品率分别为0。
01,0.02,0.015,而3家工厂的日产量分别为2000,1000,2000,则天地公司该产品的总次品率是()A.0。
015 B.0.014 C.0。
01 D.0。
02【答案】B【解析】全概率公式。
设3家公司分别为={任取一产品为第i家公司产品},i=1,2,3B={产品为次品}则P(B)=P(A1)P(B|A1)+P(A2)P(B|A2) +P(A3)P(B|A3)六、事件的独立性●若A,B两事件中不论哪一个事件发生与否并不影响另一个事件发生的概率,则称两个事件相互独立.P(AB)=P(A)P(B)i iX x1x2…p p1p2…,则a等于()A。
B. C。
D。
1【答案】C.Σx i p i (以概率为权数的加权平均数);(常数期望是本身)常数因子提出来)E(aX+b) =aEX+b (一项一项分开算)DX=E(X—EX)2=Σ(x i—EX)2p i=E(X2)-(EX)2;(方差=平方的期望—期望的平方)(常数方差等于0)2DX (常数因子平方提)2DX (一项一项分开算)X的分布律为X 1 2 3p 0.1 0.3 0.6则E(X)=0.1+0。
6+1。
8=2.5D(X)= E(X2)—(EX)2=0。
1+1.2+5。
4—(2。
5)2=6。
7—6.25=0.45【例题】若某学校有两个分校,一个分校的学生占该校学生总数的60%,期末考试的平均成绩为75分,另一个分校的学生占学生总数的40%,期末考试的平均成绩为77分,则该校学生期末考试的总平均成绩为()分。
A.76 B.75。
8 C。
75.5 D。
76。
5【答案】B【解析】该校学生期末考试的总平均成绩为75*0.6+77*0.4=75.8【例题】若随机变量Y与X的关系为Y=3X-2,并且随机变量X的方差为2,则Y的方差D(Y)为( )A.6 B.12 C.18 D.36【答案】C名称记法EX DX(0-1)分布X~B(1,p) P(X=1)=p, P(X=0)=1—pp 1—p二项分布X~B(n,p)P(X=k)=k=0,1,2,…,n np np(1—p)泊松分布X~P(λ) P(X=k)=,k=0,1,2,…,λ〉0λλ【例题】一个二项分布随机变量的方差与数学期望之比为,则该分布的参数应为( )【答案】D【解析】考察二项分布数学期望与方差。
EX=np, DX=np(1—p),【例题】某保险业务员每六次访问有一次成功地获得签单(即签单成功的概率是),在一个正常的工作周内,他分别与36个客户进行了联系,则该周签单数的数学期望是A. 3B. 4C. 5D.6【答案】D【解析】考察二项分布的数学期望.X,X服从二项分布B(36,),则EX=。
.≥0;, P(a〈X≤b)是密度曲线y=f(x)下方,[a,b] 区间上方图形的面积。
大量重复试验结果的算术平均数的稳定值 (常记作μ);DX= E(X-EX)2= E(X2)—(EX)2 (方差=平方的期望-期望的平方);名称记法EX DX均匀分布X~U[a,b]指数分布X~E(λ),λ〉0正态分布X~N(μ,σ2)μσ2标准正态分布X~N(0,1)0 1●正态分布的密度曲线y=p(x)是一条关于直线x=μ的对称的钟形曲线,在x=μ处最高,两侧迅速下降,无限接近x轴;σ越小(大),曲线越尖(扁)。
●标准正态分布的密度曲线 y=φ(x)是关于y轴对称的钟形曲线。
)时,对给定的,有,称为上分为点。
设X~N(μ,σ2), 则 Z=N(0,1)。
如X~N(μ,σ2),Y=aX+b~N(aμ+b,a2σ2)【例题】数学期望和方差相等的分布是()A.二项分布B.泊松分布C.正态分布D.指数分布【答案】B【解析】若X服从参数为泊松分布,E(X)=D(X)=【例题】如果X 服从标准正态分布,已知则 A . B . C . D . 【答案】A【解析】【例题】若随机变量X 服从正态分布N (0,4),则随机变量Y=X —2的分布为( ) A .N (—2,4) B 。
N (2,4) C.N (0,2) D 。
N(—2,2) 【答案】A—2=-2,DY=DX=4cov (X,Y)=E [(X-EX)(Y-EY )]=E (XY )—(EX )(EY ) r XY = (-1≤r XY ≤1)XY X,Y r XY 越接近1, 表明X,Y; r XY 越接近—1,表明X ,Y ;r XY =0,X 与Y 不相关。
【例题】若两个随机变量X 与Y 的简单相关系数r=0,则表明这两个变量之间( ) A .存在非线性相关关系 B 。
相关关系很低 C .不存在线性相关关系 D 。
不存在任何关系 【答案】C【解析】rXY=0,X 与Y 不相关,即不线性相关.2。
D(aX+bY )=a 2DX+2abcov (X ,Y )+b 2DY(X,Y)=0,D(aX+bY )=a 2DX+b 2DY,这个过程称为决策; (极小收益)进行比较,选择极小收益最大的方案; 选择期望收益最大的方案。
. ;小圆圈○表示各种状况可能发生的地方,需要计算期望收益或期望机会损失。
【例题】康美化妆品公司计划开发一种新的化妆品,研发费用约为30万人民币。
研发成功与失败的概率约各占一半。
如果研发成功,康美公司2。
假设研发成功并自行生产,计算期望利润(3分)3。
请你帮助康美公司做出决策,并在决策树上画出决策过程(6分) 4.当研发成功的概率低于多少时,康美公司应当改变其决策?(6分) . 设研发成功的概率为p,则研发失败的概率为1-p 。
若研发,期望收益为59p+(1—p)(-30)=89p —30〉0时,即时,就研发新产品。