应用统计硕士《432统计学》专用教材(统计量及其抽样分布)【圣才出品】
- 格式:pdf
- 大小:725.74 KB
- 文档页数:19
2017年首都经济贸易大学统计学院432统计学[专业硕士]考研真题及详解一、名词解释(每题4分,共20分)1.重点调查答:重点调查是在调查对象中选择一部分重点单位进行的一种非全面调查。
重点单位,是指在所要观察的数量方面,其数值在所有单位中具有举足轻重的地位。
因此,当调查的任务只要求掌握事物的基本状况与基本的发展趋势,而不要求掌握全面的准确资料,而且在总体中确实存在着重点单位时,进行重点调查较好。
2.参数答:参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。
由于总体数据通常是未知的,所以参数是一个未知的常数。
3.统计假设检验中的拒绝域答:根据事先给定的显著性水平ɑ,可以在统计量的分布上找到相应的临界值,由显著性水平和相应的临界值围成的一个区域称为拒绝域,由样本计算的统计量的值落入拒绝域的概率不超过显著性水平ɑ。
如果统计量的值落在这拒绝域内就拒绝原假设,否则就不能拒绝原假设。
4.多重判定系数答:多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y的取值的变差中能被估计的多元线性回归方程所解释的比例。
5.Q型聚类答:Q型聚类是指根据变量对所观察的样本进行分类的聚类方法。
Q型聚类分析的优点是:①可以综合利用多个变量的信息对样本进行分类;②分类结果是直观的,聚类谱系图非常清楚地表现其数值分类结果;③聚类分析所得到的结果比传统分类方法更细致、全面、合理。
二、简答题(每题20分,共40分)1.某行业30家企业的人均年销售收入(万元/人)数据如下:要求:(1)将上述数据按照100以下,100~200,200~300,300~400,400以上分组,并绘制直方图;(2)根据直方图说明上述数据的分布状况;(3)根据表中数据计算这30家企业人均年销售收入的中位数,比较中位数与均值(192.4)的差异,并说明差异产生的原因;(4)若要分析上述数据的集中趋势,用中位数和均值哪个代表性更强,理由是什么?答:(1)根据“上组限不在内”原则,数据的分组结果如下表:直方图如下:(2)根据直方图可知,人均年销售收入在100~200(万元/人)的企业数最多,人均年销售收入在300~400之间的企业数最少。
第6章 统计量及其抽样分布一、思考题1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 答:(1)设是从总体中抽取的容量为的一个样本,如果由此样本构造一个函数,不依赖于任何未知参数,则称函数是一个统计量。
(2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。
为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。
(3)统计量是样本的一个函数。
由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。
2.判断下列样本函数哪些是统计量?哪些不是统计量?12n X X X ,,…,X n 12()n T X X X ,,…,12()n T X X X ,,…,1121021210310410()/10min()T X X X T X X X T X T X μμσ=+++==-=-…,,…,()/答:统计量中不能含有未知参数,故、是统计量,、不是统计量。
3.什么是次序统计量?答:设是从总体中抽取的一个样本,称为第个次序统计量,它是样本满足如下条件的函数:每当样本得到一组观测值…,时,其由小到大的排序中,第个值就作为次序统计量的观测值,而称为次序统计量,其中和分别为最小和最大次序统计量。
4.什么是充分统计量?答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。
统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。
5.什么是自由度?答:统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数。
第二章 随机变量及其分布第一节 随机变量的概念及其分布函数一、随机变量的概念随机变量是指定义在样本空间Ω上的实值函数X =X (ω),常用大写字母X ,Y ,Z 等表示随机变量,其取值用小写字母x ,y ,z 等表示。
随机变量包括离散型随机变量、连续型随机变量和其他随机变量。
1.离散型随机变量的概念假如一个随机变量全部可能取到的值是有限个或可列无限多个,则称其为离散型随机变量。
2.连续性随机变量的概念如果对于随机变量X 的分布函数F (x ),存在非负可积函数f (x ),使对于任意实数x 有则称X 为连续型随机变量,f (x )称为X 的概率密度函数,简称概率密度。
二、随机变量的分布函数 设X 是一个随机变量,对任意实数x ,称()()x F x f t dt -∞=⎰F (x )=P (X ≤x )为随机变量X 的分布函数,且X 服从F (x ),记为X ~F (x )。
分布函数F (x )具有以下的基本性质:1.单调性F (x )是定义在整个实数轴(-∞,+∞)上的单调非减函数,即对任意的x 1<x 2,有F (x 1)≤F (x 2)。
2.有界性对任意的x ,有0≤F (x )≤1,且3.右连续性F (x )是x 的右连续函数,即对任意的x 0,有即 F (x 0+0)=F (x 0)第二节 离散型随机变量及其分布()lim ()0()lim ()1x x F F x F F x →-∞→+∞-∞==+∞==00lim ()()x x F x F x +→=一、离散型随机变量的分布列1.分布列的定义和表示 设X 是一个离散随机变量,如果X 的所有可能取值是x 1,x 2,…,x n ,…,则称X 取x i 的概率p i =p (x i )=P (X =x i ),i =1,2,…,n ,…为X 的概率分布列或简称为分布列,记为X ~{p i }。
分布列可用如下列表方式来表示:2.分布列的基本性质(1)非负性:p (x i )≥0,i =1,2,…;(2)正则性:。
2017年安徽大学432统计学[专业硕士]考研真题(回忆版)及详解一、选择题涵盖内容:1.推断统计2.集中趋势3.概率的统计定义4.方差分析(检验对象)5.离散趋势6.变量类型7.统计量的分布(抽样分布)8.平均数(中、众、平)9.回归方差分析那块考了几个小知识点二、简答题1.统计数据按计量尺度可分为哪几种类型?不同类型的数据各有什么特点?答:(1)统计数据按计量尺度的分类按照所采用的计量尺度的不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
①分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。
②顺序数据是只能归于某一有序类别的非数字型数据。
顺序数据虽然也是类别,但这些类别是有序的。
③数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。
现实中所处理的大多数数据都是数值型数据。
(2)不同类型的数据的特点分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因而也可统称为定性数据或称品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据。
2.比较概率抽样与非概率抽样。
答:(1)概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式主观地从总体中抽出部分单位对其实施调查。
(2)概率抽样与非概率抽样的区别:概率抽样是依据随机原则抽选样本,样本统计量的理论分布是存在的,因此可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,并且在进行抽样设计时,对估计的精度提出要求,计算为满足特定精度要求所要的样本量。
而非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。
第6章 统计量及其抽样分布一、思考题1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数?答:(1)设12n X X X ,,…,是从总体X 中抽取的容量为n 的一个样本,如果由此样本构造一个函数12()n T X X X ,,…,,不依赖于任何未知参数,则称函数12()n T X X X ,,…,是一个统计量。
(2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。
为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。
(3)统计量是样本的一个函数。
由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。
2.判断下列样本函数哪些是统计量?哪些不是统计量?1121021210310410()/10min()T X X X T X X X T X T X μμσ=+++==-=-…,,…,()/答:统计量中不能含有未知参数,故1T 、2T 是统计量,3T 、4T 不是统计量。
3.什么是次序统计量?答:设12n X X X ,,…,是从总体X 中抽取的一个样本,()i X 称为第i 个次序统计量,它是样本12()n X X X ,,…,满足如下条件的函数:每当样本得到一组观测值12X X ,,…,n X 时,其由小到大的排序(1)(2)()()i n X X X X ≤≤≤≤≤……中,第i 个值()i X 就作为次序统计量()i X 的观测值,而(1)(2)()n X X X ,,…,称为次序统计量,其中(1)X 和()n X 分别为最小和最大次序统计量。
4.什么是充分统计量?答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。
2015年江西财经大学统计学院432统计学[专业硕士]考研真题及详解一、简答题(10分×5=50分)1.简述抽样调查的概念、特点和应用?答:(1)抽样调查的概念抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象做出估计和推断的一种调查方法。
根据抽选样本的方法,抽样调查可以分为概率抽样和非概率抽样两类。
概率抽样是按照概率论和数理统计的原理从调查研究的总体中,根据随机原则来抽选样本,并从数量上对总体的某些特征作出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。
非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
(2)抽样调查的特点①样本单位按随机原则抽取,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强;②抽样调查将抽取的全部样本单位作为一个“代表团”,用整个“代表团”来代表总体,而不是用随意挑选的个别单位代表总体;③抽样调查抽选的调查样本数量,是根据调查误差的要求,经过科学的计算确定的,在调查样本的数量上有可靠的保证;④抽样误差是在调查前就可以根据调查样本数量和总体中各单位之间的差异程度进行计算,并控制在允许范围以内,调查结果的准确程度较高。
(3)抽样调查的应用场合①有些事物在测量或试验时有破坏性,不可能进行全面调查。
如,电视的抗震能力试验,灯泡的耐用时间试验等;②有些总体从理论上讲可以进行全面调查,但实际上不能进行全面调查的事物。
如,了解某个森林有多少棵树,职工家庭生活状况如何等;③工业生产过程中的质量控制;④对于某种总体的假设进行检验,来判断某种假设的真伪,以决定取舍。
2.居民消费价格指数(CPI)的含义是什么?有何作用?答:(1)CPI的含义CPI是居民消费价格指数的简称,是一个反映居民家庭一般所购买的消费商品和服务价格水平变动情况的宏观经济指标。
2017年对外经济贸易大学432统计学[专业硕士]考研真题及详解一、单项选择题(每小题2分,共20分)1.下列适合描述分类型数据的图形是()。
A.条形图B.线形图C.茎叶图D.直方图【答案】A【解析】分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别。
分类数据的图示方法包括条形图、帕累托图、饼图、环形图等。
线形图、茎叶图和直方图适合描述数值型数据。
2.为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列,每隔50名学生抽取一名学生进行调查,这种调查方法属于()。
A.简单随机抽样B.整群抽样C.系统抽样D.分层抽样【答案】C【解析】系统抽样是将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位的方法。
典型的系统抽样是先从数字1~k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k,…。
3.某城市为了控制汽车数量,实施申领车牌资格的摇号政策,假设每人每次中签的概率均为p。
现有一家三口,则三人中至少有一人在某次摇号中中签的概率为()。
A.3pB.p-p2+p3C.3p-3p2+p3D.3p-2p2+3p3【答案】C【解析】用X表示3个人中中签的人数,则X~B(3,p)。
用A表示事件“3人没有一个人中签”,B表示事件“3人至少有一人中签”,则P(A)=C30p0(1-p)3,P(B)=1-P(A)=3p-3p2+p3。
4.设随机变量X~N(﹣1,2),Y~N(1,4),且X与Y不相关,令U=aX+Y,V =X+bY,若U与V也不相关,则有()。
A.a+b=0B.2a+b=0C.a-b=0D.a+2b=0【答案】D【解析】根据正态分布的性质可知DX =2,DY =4。
因为X 、Y 不相关,所以cov (X ,Y )=0。
若U 、V 不相关,则有:cov (U ,V )=cov (aX +Y ,X +bY )=aDX +(ab +1)cov (X ,Y )+bDY =2a +4b =0,所以a +2b =0。