(完整版)研究生数理统计问答题答案2013
- 格式:doc
- 大小:30.01 KB
- 文档页数:2
1.检验的显著性水平:在假设检验中,若小概率事件的概率不超过α,则称α为检验水平或显著性水平。检验的P值:拒绝原假设的最小显著水平称为假设检验中的P值。
2.参数估计的类型:①点估计;
②区间估计;参数的点估计的方法:①矩估计法基本思想:由于样本来源于总体,样本矩在一定程度上反映了总体矩,而且由大数定律可知,样本矩依概率收敛于总体矩。因此,只要总体X的k阶原点矩存在,就可以用样本矩作为相应总体矩的估计量,用样本矩的函数作为总体矩的函数的估计量。②极大似然估计法基本思想:设总体分布的函数形式已知,但有未知参数θ,θ可以取很多值,有θ的一切可能取值中选一个使样本观察值出现的概率为最大的值作为θ的估计值,记作∧θ,并称为θ的极大似然估计值。这种求估计值的方法称为极大似然估计法。参数的点估计的评价方法:○1无偏性;○2有效性;○3一致性。
3.假设检验的思想:先假设总体具有某种特征,然后再通过对样本的加工,即构造统计量推断出假设的结论是否合理。假设检验是带有概率性质的反证法。
推理依据:第一,假设检验所采用的逻辑推理方法是反证法。第二,合理与否,所依据的是“小概率事件实际不可能发生的原理”。参数假设检验步骤:○1提出原假设和备择假设;○2选择适当的统计量,并确定其分布形式;○3选择显著性水平α ,确定临界值;○4作出结论。
5.正交试验数据分析方法:○1直接对比法就是对试验结果进行简单的直接对比。○2直观分析法是通过对每一因素的平均极差来分析问题。所谓极差就是平均效果中最大值和最小值的差。有了极差,就可以找到影响指标的主要因素,并可以帮助我们找到最佳
因素水平组合。
4.方差分析的目的:方差分析的
目的是通过分析,判定某一因子
是否显著,当因子显著时,我们
还可以给出每一水平下指标均值
的估计,以便找出最好的水平。
方差分析是对多个总体均值是否
相等这一假设进行检验。思想:
检验μ1=μ2=……μγ是通过
方差的比较来确定的,即:要考
虑均值(观测值)之间的差异,
差异的产生来自两个方面,一方
面是由因素中的不同水平造成
的,称为系统性差异;另一方面
是由随机性而产生的差异。两方
面的差异用两个方差来计量,一
个称为水平之间的方差(既包括
系统性因素,也包括随机性因
素);一个称为水平内部的方差
(仅包括随机性因素)。如果不同
的水平对结果没有影响,两个方
差的比值会接近于1(即H0为
真);反之,如果不同水平对结果
产生影响,两个方差的比值会显
著地大于1许多,认为H0不真,
可作出判断,说明不同水平之间
存在着显著性差异。如果方差分
析只对一个因素进行称为单因素
方差分析。单因素方差分析所讨
论的是在个总体标准差皆相等的
条件下,解决个总体平均数是否
相等的问题。
6.主成分分析答:主成分分析法
是一种数学变换的方法, 它把给
定的一组相关变量通过线性变换
转成另一组不相关的变量,这些
新的变量按照方差依次递减的顺
序排列。在数学变换中保持变量
的总方差不变,使第一变量具有
最大的方差,称为第一主成分,
第二变量的方差次大,并且和第
一变量不相关,称为第二主成分。
依次类推,I个变量就有I个主
成分。
7.典型相关分析:的基本思想
典型相关分析是主成分分析和因
子分析的进一步发展,是研究两
组变量间的相互依赖关系,把两
组变量之间的相互关系变为研究
两个新的变量之间的相关,而且
又不抛弃原来变量的信息,这两
个新的变量分别由第一组变量和
第二组变量的线性组合构成,并
且两组变量的个数可以是不同的,
两组变量所代表的内容也可以是
不同的。
8.贝叶斯判别法:如果对多个总
体的判别考虑的不是建立判别
式,而是计算新给样品属于各总
体的条件概率()l
x
P
,l=1,……k。
比较这k个概率的大小,然后将
新样品判归为来自各概率最大的
总体,这种判别法称为Bayes判
别法。Bayes判别法的基本思想
总是假定对所研究的对象已有一
定的认识,常用先验概率来描述
这种认识。
9. 聚类:聚类分析的职能是建
立一种分类方法,它是将一批样
品或变量,按照它们在性质上的
亲疏程度进行分类。距离的种类
很多,其中欧式距离在聚类分析
中用得最广,它的表达式中X ik
表示第i个样品的第k个指标的
观测值,Xjk表示第j个样品的
第k个指标的观测值,d ij为第i
个样品与第j个样品之间的欧氏
距离。若d ij越小,那么第i与j
两个样品之间的性质就越接近。
性质接近的样品就可以划为一
类。分类:的方法很多,系统聚
类法是聚类分析中应用最广泛的
一种方法。首先将n个样品每个
自成一类,然后每次将具有最小
距离的两类合并成一类,合并后
重新计算类与类之间的距离,这
个过程一直持续到所有样品归为
一类为止。分类结果可以画成一
张直观的聚类谱系图。
10.线性回归分析的主要内容及
应用中注意的问题。答:回归分
析主要用于回答一些定义明确的
度量单位的数值变量之间的关系
问题。回归分析通过一个变量或
一些变量的变化解释另一变量的
变化。其主要内容和步骤是:首
先根据理论和对问题的分析判
断,将变量分为自变量和因变量;
其次,设法找出合适的数学方程
式(即回归模型)描述变量间的
关系;由于涉及到的变量具有不
确定性,接着还要对回归模型进
行统计检验;统计检验通过后,
最后是利用回归模型,根据自变
量去估计、预测因变量。回归有
不同种类,按照自变量的个数分,
有一元回归和多元回归。只有一
个自变量的叫一元回归,有两个
或两个以上自变量的叫多元回
归;按照回归曲线的形态分,有
线性(直线)回归和非线性(曲
线)回归。实际分析时应根据客
观现象的性质、特点、研究目的
和任务选取回归分析的方法。
11.系统聚类法的基本思想是:
首先是n个样本各自成一类,然
后规定类与类之间的距离,选择
距离最小的两类合并成一个新
类,计算新类与其它类的距离,
再将距离最小的两类进行合并,
这样每次减少一类,直到达到所
需的分类数或所有的样本都归为
一类为止。系统聚类法的步骤如
下:①用数字描述样本的特征。
②规定样本之间的相似系数
r ij(0≤r ij≤1;i,j=1,…,n)。
③运用合成运算R2=R⋅R(或R4
=R2⋅R2等)求出最接近相似关系
R的模糊等价关系S=R2(或R4
等)。④选取适当水平α(0≤α
≤1),得到X 的一种聚类。
12. 如何看待多元统计方法在
实际数据处理中的作用与地位。
答:多元统计方法起源于20世纪
20年代,50年代后随着计算机和
统计分析软件的发展,得到广泛
应用,逐步渗透到自然科学和社
会科学的各个领域。多元统计是
研究多个变量之间相互依赖关系
以及内在统计规律性的一门统计
学科,其技术可以分为非对称性
技术和对称性技术。利用多元分
析中不同的方法可以对研究对象