2017年浙江工商大学432统计学[专业硕士]考研真题及详解【圣才出品】
- 格式:pdf
- 大小:752.65 KB
- 文档页数:18
第6章假设检验一、单项选择题1.在假设检验时,若增大样本容量,则犯两类错误的概率为()。
[浙江工商大学2017研]A.都增大B.都减小C.都不变D.一个增大一个减小【答案】B【解析】当样本量一定时,犯两类错误的概率呈现出此消彼长的关系。
当样本容量增大时,抽样误差减小,样本越来越接近总体,犯两类错误的概率均会减小。
2.如果原假设为真,所得到的样本结果会像实际观测结果那么极端或者更极端的概率称为()。
[山东大学2016研]A.临界值B.统计量C.P值D.实际显著性水平【答案】C【解析】如果原假设0H为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值,也称为观察到的显著性水平。
3.在假设检验中,如果我们相信原假设是真的,而犯第二类错误又不会造成太大的影响,此时,检验的显著性水平应该取( )。
[中央财经大学2015研]A .大些B .小些C .无法确定D .等于0.05【答案】B【解析】由于犯一类错误的概率和犯第二类错误的概率是此消彼长的关系,题中我们相信原假设为真,并且第二类错误的并不会造成较大影响,因此如果要拒绝原假设应该提高更显著的证据,所以犯第一类错误的概率应取小些。
而在假设检验中检验的显著性水平即为犯第一类错误的概率,故显著性水平应该取小些。
4.甲、乙两人服从标准正态分布的随机数发生器分别产出30个随机数字作为样本,求得平均数1x ,2x 样本方差S 21,S 22,则( )。
[中山大学2014研]A .12=x x ,S 21=S 22B .作两样本t 检验,必然接受零假设,得出两总体均值无差别的结论C .由甲、乙两样本求出的两总体方差比值()2212/σσ的95%置信区间,必然包含0D .分别由甲、乙两样本求出的各自总体均数的95%置信区间,可能没有交集【答案】D【解析】A 项,由于样本是随机的,抽出不同的样本得到的均值与方差往往是不同的。
B 项,同样由于样本的随机性,根据样本得到的估计值很可能不同于总体真值,因而两样本的t检验不一定接受零假设。
第二章 随机变量及其分布第一节 随机变量的概念及其分布函数一、随机变量的概念随机变量是指定义在样本空间Ω上的实值函数X =X (ω),常用大写字母X ,Y ,Z 等表示随机变量,其取值用小写字母x ,y ,z 等表示。
随机变量包括离散型随机变量、连续型随机变量和其他随机变量。
1.离散型随机变量的概念假如一个随机变量全部可能取到的值是有限个或可列无限多个,则称其为离散型随机变量。
2.连续性随机变量的概念如果对于随机变量X 的分布函数F (x ),存在非负可积函数f (x ),使对于任意实数x 有则称X 为连续型随机变量,f (x )称为X 的概率密度函数,简称概率密度。
二、随机变量的分布函数 设X 是一个随机变量,对任意实数x ,称()()x F x f t dt -∞=⎰F (x )=P (X ≤x )为随机变量X 的分布函数,且X 服从F (x ),记为X ~F (x )。
分布函数F (x )具有以下的基本性质:1.单调性F (x )是定义在整个实数轴(-∞,+∞)上的单调非减函数,即对任意的x 1<x 2,有F (x 1)≤F (x 2)。
2.有界性对任意的x ,有0≤F (x )≤1,且3.右连续性F (x )是x 的右连续函数,即对任意的x 0,有即 F (x 0+0)=F (x 0)第二节 离散型随机变量及其分布()lim ()0()lim ()1x x F F x F F x →-∞→+∞-∞==+∞==00lim ()()x x F x F x +→=一、离散型随机变量的分布列1.分布列的定义和表示 设X 是一个离散随机变量,如果X 的所有可能取值是x 1,x 2,…,x n ,…,则称X 取x i 的概率p i =p (x i )=P (X =x i ),i =1,2,…,n ,…为X 的概率分布列或简称为分布列,记为X ~{p i }。
分布列可用如下列表方式来表示:2.分布列的基本性质(1)非负性:p (x i )≥0,i =1,2,…;(2)正则性:。
2011年浙江工商大学432统计学[专业硕士]考研真题及详解一、单项选择题(本题包括1~30题共30个小题,每小题2分,共60分。
在每小题给出的四个选项中,只有一个符合题目要求,把所选项前的字母填在答题纸上)。
1.为了调查某校学生的购书费用支出,从各年级的学生中分别抽取100名学生,组成样本进行调查,这种抽样方法属于()。
A.简单随机抽样B.分层抽样C.系统抽样D.整群抽样【答案】B【解析】简单随机抽样就是从包括N个单位的抽样框中随机地、一个个地抽取n个单位作为样本,每个单位的入样概率是相等的。
分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计。
系统随机抽样也称为机械随机抽样或等距离随机抽样。
它是先将总体中各单位按一定的顺序排列,然后每隔一定的距离抽取一个单位构成样本。
整群抽样又称聚类抽样,是将总体中若干个单位合并为组,这样的组称为群,抽样时直接抽取群,然后对选中群中的所有单位全部实施调查。
2.已知某工厂生产的某零件的平均厚度是2厘米,标准差是0.25厘米。
如果已知该厂生产的零件厚度为正态分布,可以判断厚度在1.5厘米到2.5厘米之间的零件大约占()。
A.95%B.89%C.68%D.99%【答案】A【解析】根据3σ原则,当一组数据对称分布时,经验法则表明:有68.27%的数据在平均数±1个标准差的范围之内;有95.45%的数据在平均数±2个标准差的范围之内;有99.73%的数据在平均数±3个标准差的范围之内。
根据题干中的已知条件可以判断厚度在1.5厘米到2.5厘米之间的零件大约占95%。
3.某校大二学生统计学考试的平均成绩是70分,标准差是10分,从该校大二学生中随机抽取100个同学作为样本,则样本均值的数学期望和抽样分布的标准误差分别为()。
A.70,10B.70,1C.70,4D.10,10【答案】B【解析】中心极限定理:设服从均值为μ方差为σ2(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值X的抽样分布近似服从均值为μ方差为σ2/n 的正态分布。
第九章 多元线性回归第一节 多元线性回归模型一、多元回归模型与回归方程(1)设因变量为y ,k 个自变量分别为x 1,x 2,…,x k ,描述因变量y 如何依赖于自变量x 1,x 2,…,x k 和误差项ε的方程称为多元回归模型。
其一般形式可表示为:y =β0+β1x 1+β2x 2+…+βk x k +ε式中,β0,β1,β2,…,βk 是k +1个未知参数,β0称为回归常数,β1,…,βk 称为回归系数,ε为误差项。
(2)对于一个实际问题,如果获得n 组观测数据(x i1,x i2,…,x ik ;y i )(i =1,2,…,n ),则线性回归模型可表示为写成矩阵形式为y =X β+ε其中1011121211201212222201122k k k k n n n k nk ny x x x y x x x y x x x ββββεββββεββββε=+++++⎧⎪=+++++⎪⎨⎪⎪=+++++⎩…………12 n y y y y ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦01k ββββ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦12n εεεε⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦矩阵X 是n ×(k +1)型矩阵,称X 为回归设计矩阵或资料矩阵。
在实验设计中,X 的元素是预先设定并可以控制的,人的主观因素可作用于其中,因而称X 为设计矩阵。
(3)在多元线性回归模型中,对误差项ε有三个基本的假定:①误差项ε是一个期望值为0的随机变量,即E (ε)=0。
②对于自变量x 1,x 2,…,x k 的所有值,ε的方差σ2都相同。
③误差项ε是一个服从正态分布的随机变量,且相互独立,即ε~N (0,σ2)。
E (y )=β0+β1x 1+β2x 2+…+βk x k为理论回归方程,它描述了因变量y 的期望值与自变量x 1,x 2,…,x k 之间的关系。
二、估计的多元回归方程 当用样本统计量去估计回归方程中的未知参β0,β1,β2,…,βk 时,就得到了估计的多元回归方程,其一般形式为:式中,称为偏回归系数。
第2章数据的搜集一、单项选择题1.为了解大学生的消费状况,一学生社团通过微信朋友圈投放调查问卷,并邀请收到问卷的同学在自己的朋友圈内分享问卷。
关于这种调查方式,以下说法正确的是()。
[中央财经大学2018研]A.使用的抽样方式是简单随机抽样B.使用的抽样方式是配额抽样C.使用的抽样方式是非概率抽样D.这种调查不是抽样调查【答案】C【解析】非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
题中的调查方式属于非概率抽样中的滚雪球抽样。
2.为了快速了解北京居民对空气污染问题的态度,最适合的数据收集方式是()。
[中央财经大学2018研]A.面访B.电话调查C.邮寄问卷D.座谈会【答案】B【解析】电话调查是指调查人员通过打电话的方式向被调查者实施调查。
电话调查的最大特点是速度快,能够在很短的时间内完成调查。
而面访、邮寄问卷、座谈会的调查周期都比较长。
3.某居民小区为了解住户对物业服务的看法,准备采取抽样调查方式搜集数据。
物业管理部门利用最初的居民户登记名单进行抽样,但现在的小区中,原有的一些居民户已经搬走,同时有些是新入住的居民户。
由此造成的误差属于()。
[中央财经大学2018研] A.随机误差B.抽样框误差C.计量误差D.无回答误差【答案】B【解析】抽样框误差是指由于抽样框的不完善性造成的统计推断错误。
在概率抽样中需要根据抽样框抽取样本。
一个好的抽样框应该是:抽样框中的单位和研究总体中的单位有一一对应的关系。
现在的小区中,原有的一些居民户已经搬走,同时有些是新入住的居民户,这时,抽样框中的单位与研究总体的单位就不存在一一对应的关系,使用这样的抽样框抽取样本就会出现抽样框误差。
4.为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名学生进行调查,这种调查方法是()。
[山东大学2017研;对外经济贸易大学2017研]A.简单随机抽样B.整群抽样C.系统抽样D.分层抽样【答案】C【解析】系统抽样是将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。
第1章导论一、单项选择题1.在抽样推断中,总体参数是一个()。
[中央财经大学2018研]A.随机变量B.已知的量C.统计量D.确定的量【答案】D【解析】参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。
由于总体数据通常是不知道的,所以参数是一个未知的确定的常数。
2.统计年鉴中2016年全国各大城市的人均家庭收入数据属于()。
[中央财经大学2018研]A.定类数据B.定序数据C.截面数据D.时间序列数据【答案】C【解析】按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。
截面数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间获得的,用于描述现象在某一时刻的变化情况。
比如,2010年我国各地区的国内生产总值就是截面数据。
时间序列数据是在不同时间收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。
比如2010~2012年我国的国内生产总值就是时间序列数据。
3.在教学评估中,某省三所高校的等级分别是优秀、良好、及格,则“等级”是()。
[浙江工商大学2017研]A.品质标志B.数量标志C.标志值D.数量指标【答案】A【解析】“等级”属于顺序数据,只能用文字来描述,因此是品质标志,其标志值为“优秀”“良好”“及格”。
4.下面不属于描述统计问题的是()。
[山东大学2015研]A.根据样本信息对总体进行的推断B.了解数据分布的特征顺序数据C.分析感兴趣的总体特征D.利用图、表或其他数据汇总工具分析数据【答案】A【解析】描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
BCD三项都是描述统计问题。
A项中根据样本信息对总体进行推断则是推断统计内容。
5.一项民意调查的目的是想确定年轻人愿意与其父母讨论的话题。
调查结果表明:45%的年轻人愿意与其父母讨论家庭财务状况,38%的年轻人愿意与其父母讨论有关教育的话题,15%的年轻人愿意与其父母讨论爱情问题。
浙江工商大学2011年硕士研究生入学考试试卷(B)卷
招生专业:应用统计硕士
考试科目:432统计学总分:(150分)考试时间:3小时
一.单项选择题(本题包括1—
30题共30个小题,每小题2分,共60分。
在每小题给出的四个选项中,只有一个符合题目要求,把所选项前的字母填在答题纸上)。
1.为了调查某校学生的购书费用支出,从各年级的学生中分别抽取100名学生
,组成样本进行调查,这种抽样方法属于()。
A.简单随机抽样
B.分层抽样
C.系统抽样
D.整群抽样
2.已知某工厂生产的某零件的平均厚度是2厘米,标准差是0.25厘米。
如果已知
该厂生产的零件厚度为正态分布,可以判断厚度在1.5厘米到2.5厘米之间的零件大约占()。
A.95%
B.89%
C.68%
D.99%
3.某校大二学生统计学考试的平均成绩是70分,标准差是10分,从该校大二学
生中随机抽取100个同学作为样本,则样本均值的数学期望和抽样分布的标准误差分别为()。
A.70,10
B.70,1
C.70,4
D.10,10
答案写在答题纸上,写在试卷上无效第 1 页共 9 页。
第2章数据的搜集一、单项选择题1.为了调查某校学生的购书费用支出,从各年级的学生中分别抽取100名学生,组成样本进行调查,这种抽样方法属于()。
[浙江工商大学2011研]A.简单随机抽样B.分层抽样C.系统抽样D.整群抽样【答案】B【解析】简单随机抽样就是即使从包括N个单位的抽样框中随机地、一个个地抽取n个单位作为样本,每个单位的入样概率是相等的;分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计;系统随机抽样也称为机械随机抽样或等距离随机抽样。
它是先将总体中各单位按一定的顺序排列,然后每隔一定的距离抽取一个单位构成样本;整群抽样又称聚类抽样,是将总体中若干个单位合并为组,这样的组称为群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。
2.为调查在中国的省会城市和4个直辖市的居民年收入,需要从这些城市的居民中抽取一个样本,你认为以下四种抽样方式哪一种会得到更有代表性的样本?( )。
[中山大学2011研]A.简单随机抽样B.整群抽样C.系统随机抽样D.分层随机抽样【答案】D【解析】在规模较大的调查中,很少直接采用简单随机抽样,一般是把这种方法和其他抽样方法结合在一起使用;整群抽样又称聚类抽样,是将总体中若干个单位合并为组,这样的组称为群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查;系统随机抽样也称为机械随机抽样或等距离随机抽样。
它是先将总体中各单位按一定的顺序排列,然后每隔一定的距离抽取一个单位构成样本;分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,分层抽样在实践中得到了广泛的应用。
3.某政府机构想尽快了解社会公众对其出台的一项政策的态度,最恰当的数据搜集方式是( )。
[中央财经大学2011研]A.面访B.深度访谈C.计算机辅助电话调查D.邮寄调查【答案】C【解析】面访即调查者直接走访被调查者,当面听取被调查者的意见。
2017年浙江工商大学432统计学[专业硕士]考研真题及详解
一、单项选择题(本题包括1~25题共25个小题,每小题2分,共50分。
在每小题给出的四个选项中,只有一个符合题目要求,把所选项前的字母填在答题纸上)。
1.在教学评估中,某省三所高校的等级分别是优秀、良好、及格,则“等级”是()。
A.品质标志
B.数量标志
C.标志值
D.数量指标
【答案】A
【解析】“等级”属于分类型数据,只能用文字来描述,因此是品质标志,其标志值为“优秀”“良好”“及格”。
2.某城市进行私营企业消防设备安全检查,个体是()。
A.每一个私营企业
B.每个私营企业的消防设备
C.私营企业的每一个消防设备
D.私营企业的全部消防设备
【答案】C
【解析】总体是统计所需要研究的客观事物的全体,个体是组成总体的各个单位,是某种事物。
对某城市进行私营企业消防设备安全检查的对象是消防设备,因此个体为私营企业
的每个消防设备。
3.对教师按学历进行分组,则适合采用的测定尺度是()。
A.定序尺度
B.定距尺度
C.定比尺度
D.定类尺度
【答案】A
【解析】定序尺度又称顺序尺度,它是对事物之间等级差距或顺序差距的一种测度;定距尺度也称等距尺度或区间尺度,是一种不仅能将变量(社会现象)区分类别和等级,而且可以确定变量之间的数量差别和间隔距离的方法;定类尺度也称类别尺度或名义尺度,是将调查对象分类,标以各种名称,并确定其类别的方法。
它实质上是一种分类体系;定比尺度也称比例尺度或等比尺度,是一种除有上述三种尺度的全部性质之外,还有测量不同变量(社会现象)之间的比例或比率关系的方法。
教师学历属于顺序数据,应采用定序尺度。
4.按照随机性原则,从研究现象的总体中抽取出一部分单位进行调查,从数量上对总体进行推断,这种调查方式是()。
A.重点调查
B.典型调查
C.统计报表
D.抽样调查
【答案】D
【解析】重点调查和典型调查属于非概率调查,不需要注重随机性;抽样调查是按照随机原则,从调查总体中抽取部分调查单位进行观察,并根据这一部分调查单位的观察结果,从数量方面推断总体指标的一种非全面调查。
5.已知某公司近5年经营收入的增长速度分别为6%,8.2%,9.3%,8%和10.5%,则该公司近5年的年平均增长速度为( )。
A .(6%×8.2%×9.3%×8%×10.5%)/5
B .(106%×108.2%×109.3%×108%×110.5%)/5-1
C .(6%×8.2%×9.3%×8%×10.5%)1/5
D .(106%×108.2%×109.3%×108%×110.5%)
1/5-1
【答案】D
【解析】平均增长速度也称平均增长率,它是时间序列中逐期环比值(也称环比发展速度)的几何平均数减1后的结果,其计算公式为:
11n
G =⨯⨯-=- 所以该商品价格的年平均增长率为: 1v =-
6.某地区居民的人均月消费最高为426元,最低为270元。
据此分为六个组,形成闭口式等距数列,则各组组距为( )。
A .26
B .71
C.156
D.78
【答案】A
【解析】组距=(最大值-最小值)÷组数=全距/组数=(426-270)÷6=26。
7.现有一数列:3,9,27,81,243,729,2,187,反映其平均水平最好用()。
A.算术平均数
B.调和平均数
C.几何平均数
D.众数
【答案】C
【解析】由于这组数是3的幂次方从小到大排列,所以反映其平均水平用几何平均值最好。
8.某企业第一批产品的单位产品成本为100元,产量比重为10%;第二批产品的单位产品成本为110元,产量比重为20%;第三批产品的单位产品成本120元,产量比重为70%。
则平均单位产品成本为()。
A.(100+110+120)/3
B.(100×10%+110×20%+120×70%)/3
C.100×10%+110×20%+120×70%
D.(100/10%+110/20%+120/70%)/(10+20+70)
【答案】C
【解析】第一、二、三批产品所占的比重分别为10%、20%和30%,根据加权平均法计算公式可知C项正确。
9.如果时间数列逐期增长量大体相等,则宜拟合()。
A.直线模型
B.抛物线模型
C.曲线模型
D.众数指数曲线模型
【答案】A
【解析】A项,逐期增长量大体相等,说明关于时间t的曲线的斜率大体相等,应拟合直线模型;B项,抛物线模型适合于变化率逐渐减小再逐渐增大的时间序列;C项,指数曲线模型适合于呈指数增长的时间序列;D项,除直线模型意外的其他模型都属于曲线模型,包括抛物线模型和指数曲线模型。
10.不重复抽样的抽样标准误公式比重复抽样多了一个系数()。
A
B
C
D
【答案】A
【解析】重复抽样下的抽样标准误差为
σ,不重复抽样下的标准误差为
11.定基发展速度和环比发展速度的关系是( )。
A .相邻两个定基发展速度之商=其相应的环比发展速度
B .相邻两个定基发展速度之积=其相应的环比发展速度
C .相邻两个定基发展速度之差=其相应的环比发展速度
D .相邻两个定基发展速度之和=其相应的环比发展速度
【答案】A
【解析】定基发展速度是以固定一个时期为基点计算发展速度,环比增长速度是以上一个时期为基点计算发展速度,因此A 项正确。
12.已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为1000时,其生产成本为30000元,其中不随产量变化的成本为6000元,则成本总额对产量的回归方程是( )。
A .y c =6+0.24x
B .y c =6000+24x
C .y c =24000+6x
D .y c =24+6000x
【答案】B
【解析】设成本总额对产量的回归方程为y =ax +b ,由题意知a =6000,当x =1000。