当前位置:文档之家› 中国人民大学805统计学历年真题

中国人民大学805统计学历年真题

中国人民大学805统计学历年真题
中国人民大学805统计学历年真题

中国人民大学805统计学历年真题(2013-2000)

2013年人大805统计学真题

一、证明题:(20分)每题10分

1.袋子里有两种颜色的球红球a个白球b个

第一步从袋子里取出一个球观察其颜色然后丢掉

第二步从袋子里再取出一个球,若和上一次取出的球颜色不同,则放回,回到第一步;若和上一次取出的球颜色相同,则丢掉,重复第二步。

证明取出的最后一个球是红球的概率是1/2。

2.证明n维正态随机向量的各分量相互独立的充要条件是互不相关。

二、简述:(30分)每题10分

的泊松分布,

昆虫。在又设观察到的虫卵数Y,P(Y=i)=P(X+i|X>0),求P(Y为偶数)和E(Y)。

2. 2n+1个独立同分布样本,分布函数是F(x) 求中位数x(n+1)的分布

3.设走进某商店的顾客数是均值为50的随机变量。又设这些顾客所花的钱数是相互独立、均值为100元的随机变量。再设任一顾客所花的钱数和进入该商店的总人数相互独立。试问该商店一天的平均营业额是多少?

的矩估计和最

四、X和Y是两个相关的随机变量:

求证var(Y) = E(var(Y|X)) + var(E(Y|X)) 并谈谈你对它的理解和应用。(25分)

五、谈谈你对双因素方差分析的理解和认识。(25分)

六、一元线性回归中有三个检验:线性相关检验,回归方程显著性检验以及X的回归系数的检验,谈谈你对它们的理解和它们之间的关系。(25分)

2012年人大805统计学真题

一、为研究不同地区与购买汽车的消费价格之间的相关关系,调查得到如下的数据:

对于以上的数据可以用什么统计图表分析,并说明这些图表的用途。

对于以上的数据可以用什么统计方法分析,并说明这些方法的用途。

二、为检验一厂家生产的产品,提出如下的假设检验:H0:u=500,H1: u=! 500 现在抽取了部分的样品进行检验。若检验结果拒绝H0,则意味着什么?若检验结果没有拒绝H0,则又意味着什么?能否恰好取到一组样本证明H0:u=500成立?为什么?若检验的P=0.03,则意味着什么?P值的真实含义是什么?

三、现研究某地区平均GDP与居民消费总额、固定投资、进出口额、年末总人口之间的关系,进行了多元回归分析。题目分别给出了三个表:

表1:整体拟合程度:R,R方,调整的可绝系数。

表2:整体线性关系的F检验

表3:系数的显著性t检验,方差扩大因子VIF(存在多重共线性)

请对上述回归模型进行综合评价。

四、题目中给出了从99年1月到2004年3月某地区各月的销售额的一个时间序列图,该序列图中包含哪些成分?可以用什么方法来分析此模型,并简要叙述可种方法的基本原理。

五、说明距离判别法与贝叶斯判别法的联系。

六、说明大数定律与中心极限定理的内容和应用?

七、在敏感性问题的调查中,为了保证回答者尽量真实回答,采用如下方法:以比例p的人回答敏感性问题

(1):你具有特征A吗?回答结果为是或不是。另外1-p的比例人回答问题

(2):比如你的手机号尾数是奇数吗?回答是的比例为t。

假设总体具有特征A的人数比例为q,样本中回答是的比例为R。

1.试提出q的一个估计。

2.证明该估计是q的一个无偏估计。

求出q的方差的表达式。

2011年人大805统计学真题

一、简答题(50分)

1.简述加权最小二乘估计的基本思想。

2.进行主成分分析需是否要知道数据的具体分布,请说明原因。

3.k-均值聚类对比分层聚类,优点在哪里。

4.题目给出了一个回归分析残差的散点图,有点线性趋势的那种,问据图分析可能出现了什么问题。

5.简述方差分析和回归分析的异同。

二、已知X与W相互独立(30分)。

1.X与W都服从正态分布,且W的期望为零,Y=a+bX+W,求X与Y的联合分布。

2.W服从正态分布,其期望为零,方差为?2(是表示平方),Y=b0+b1X+b2X2(是表示平方)+W,当X=x时求Y的条件期望。

三、CPI是衡量经济发展的重要指标,CPI的计算包括收集数据的四个阶段和确定权数的两个阶段,(他这里描述了这六个阶段的具体操作方法)。(30分)

1.结合调查知识和统计理论说明CPI所属类别(这个有待考证,希望大家来修正~)。

2.指出CPI的调查过程中误差的可能来源。

3.指出这个过程中涉及的调查总体、随机变量及待估总体的特征。

4.如果每个阶段的调查都严格按照1—a的置信水平,那么总的置信水平是多少。

四、假设女性和男性读书的语速都服从正态分布。研究者认为女性读书的语速比男性快,为证明这一点抽取了n1名女性和n2名男性,分别测得他们读书的语速,发现n1名女性的平均语速比n2名男性快,研究者由此得出女性读书的语速比男性快的结论。请问研究者的方法对吗?为什么?应该怎样验证?(20分)

五、题目给出了从2006年1月到2010年6月的商品销售额的时间序列图(有明显线性趋势的),现在想预测2010年下半年的商品销售额,请问用什么应该模型,写出模型的具体形式和模型的建立过程。(20分)

2010年人大805统计学真题

一)五道问答题(50分)

1.两地区的什么比例,运用均值的t检验,得出这两个地区的均值相等,是否正确,为啥子呢?

2.卡方统计运用在哪方面

3.贝叶斯统计与经典统计的区别

4.时间序列的弱平稳的含义

5.评述多重共线性的解决方法

(二)给出三个运动员10次射击的数据,问用什么图可以表示这些数据?用哪些统计量可以分析这些数据

(三)R型聚类与Q型聚类含义?聚类分析与判别分析区别?层次聚类的步骤?

(四)该题中的第一类错误是什么?第二类错误是什么?顾客认为哪类错误比较重要?厂家认为哪类错误比较重要?

(五)给出x1,x2,...,x7个自变量,要求找出各县区经济发展的内在原因。用什么模型?这种模型对数据有什么要求?模型有哪些假设?如何得到参数估计值?如何分析该模型?(六)如何验证正态分布?能不能说这个区间包含均值的真值?p=一个很小的数,能不能说银行的认识正确?

2009年人大805统计学真题

1.有两个正态总体,均值和方差未知。但已知方差相等,从第一个总体中抽取n=16的随机样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49.如何检验第一个总体的均值是否大于第二个总体的均值。

2.在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。

3.周期过程X t=Acos(ωt+ψ),其中频率ω和振幅A都是常数,而相位ψ是一个在区间[-π,π]上服从均匀分布的随机变量,问{ X t}是否平稳?说明原因。

4.把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总体比例,如采用内曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随机抽样有相同的估计量方差。(假设各层总体单位数量N h都充分大,忽略“有限总体校正系数”)

5.与人大出出版社的21世纪统计学系列教材的《统计学(第二版)》的第四章习题中的第十题是一样的。

6.若有线性回归模型y t=β1+β2X t+εt ,(t=1,2,…,n),其中E(εt)=0;E(εt2)=δ2X t2,E(εtεs)=0(t≠s),问:

(1)该模型是否违背古典线性回归模型的假定,请简要说明。

(2)如果对该模型进行估计,你会采用什么方法?请说明理由。

7.测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。第一组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,药后一小时记录,药后两小时记录。对于不吃药的白鼠,记录时间与统一对中另外一只白鼠的记录时间相同。假定40只白鼠的初始活动状态相同。请详细阐述你用何种方法分析安眠药的效果?

8.某大学从教师中抽取一个随机样本进行满意度调查。1分表示非常不满意,100分表示非常满意。数据汇总如下表,欲分析教师职称和性别对满意度有无显著性影响。

(1)你会选择什么分析方法?简述你的分析思路(可用公式说明,不需计算结果)。

(2)要采用改分析方法,数据必须满足哪些几本假定?请加以说明。

2008年人大805统计学真题

一、07年香港一则报道说:“随着经济的增长,香港低收入家庭的比例在增长,其中低收入的家庭是指低于中位数的家庭。”请你从统计的角度对该报道做简要评论。(10分)

二、经常有人说方差分析是比较多个总体的均值是否相同,但为什么叫方差分析呢?请谈谈你对方差分析的理解,并说明方差分析解决问题的基本思路。(10分)

三、如果时间序列在随时间变化的过程中既有趋势又有季节变动,你认为可以建立什么样的预测模型。请你写出模型形式并加以简要说明(10分)

四、食品厂家说:净含量是每袋不低于250g 。但有消费者向消协反映不是250g ,消协据此要求厂家自检,同时消协也从中随机抽取20袋检验(30分)

(1)如果厂家自己检验,你认为提出什么样的原假设和备则假设?并说明理由。

(2)如果从消费者利益出发,你认为应该提出什么样的原假设和备则假设?并说明理由。

(3)消协抽取20袋,如下数据(略了 没抄),得p 值为0.4297,在5.0=α的显著水平下,

检验假设意味着什么?p 值的含义是什么?

(4)据样本数据得该食品每袋平均重量95%置信区间(241.1,257.5),你认为这种食品实际

平均重量是否在该区间?为什么?

五、在经典的多元线性回归模型里,针对自变量事实上是有许多假设的。(15分)(1)请具体指明这些假设有哪些?

(2)说明这些假设所发挥的主要作用。

(3)请讨论这些假设最终产生的影响。

六、在有关统计知识方面内容的中学课本里编者认为基本的抽样方式只有三种,并不包括整群抽样,请说明你赞同与否并详列理由。(15分)

七、叙述贝叶斯判别分析的原理(包括完整的假设)并说明:(30分)

(1)与聚类分析相比,贝叶斯判别分析赖以进行的数据结构有何特点?

(2)与其他判别分析相比,贝叶斯判别分析结果的表现形式有何不同?

八、在诸如大坝、码头等工程设计中,坝高和码头高度的确定十分关键,要考虑许多因素,(1)以大坝为例,概略说明需考虑的主要因素

(2)大坝高度通常利用长期洪水历史记录数据,依据几十年一遇的标准确定,请写出计算坝高详细的具体步骤(画出框图,并尽量避免过多使用文字)(30分)

2007年人大805统计学真题

一、(20分)下面是一种零件误差的数据(单位:克):

6.1 4.7 6.5 6.2

7.7

6.4 5.5

7.1 6.1 5.3

5.7

6.1 5.3 4.0 4.8

3.2 3.9 1.9

4.9 3.8

5.3 2.6 5.3 5.5 5.8

2.7 6.8 7.4 5.6

3.3

(1)根据涉及t分布的计算,该数据所代表的总体均值的95%置信区间为(4.637785,5.728882)。请问,若使该置信区间有意义,需要对总体进行何等假定?这种假定能不能用数据证明?是不是该区间以0.95的概率覆盖真实总体均值?如果不是,说出理由及合适的说法;

(2)对于该数据所代表的总体的均值进行检验:零假设为总体均值等于4.8克,备选假

设为总体均值大于4.8克。如果进行t检验,需要假定哪些条件?t检验结果为p值等于0.0807。能不能说“在显著性水平为0.05时,接受零假设”?为什么?你的结论是什么?

二、(20分)一家研究机构想估计在30个网络公司工作的员工每周加班的平均时间,为此进行抽样调查。请回答以下问题:

(1)如果对这些员工进行随机电子邮件调查,由答复的邮件所得到的数据是不是简单随机样本?为什么?

(2)抽样调查中,说“响应误差总是人们不说实话导致的”对不对?为什么?随机误差是不是可以避免的?

(3)这些员工的加班时间是否独立?如果不是,原因可能是什么?

三、(20分)某城市交通管理部门的一项调查表明,该城市中驾车上班的人数超过30%。但一家研究机构则认为自驾车上班的人数比例达不到这一水平。为证明自己的这一看法,该研究机构准备抽取一个简单的随机样本进行检验。

(1)请写出检验的原假设和备择假设;

(2)请对小样本情况写出计算p值的公式,并论述你所依赖的分布。对大样本情况,写出检验统计量的公式以及使该统计量有意义所需要的假定的条件;

(3)对于一般检验来说,如果结果表明“统计上显著”,是不是实际上也显著?

四、(10分)在对某项产品的认可的抽样调查报告中,如果报告仅仅说,“对该产品认可的有90%”,那么该报告是否负责?一个负责任的调查报告应该给什么有关信息?

五、(10分)对于主成分分析,有人在进行了主成分分析之后,对得到的主成分又进行了第二次主成分分析,以得到更加精确的结果。请问,这样做是否有道理?请加以说明。什么样的数据不适宜于主成分分析?选择那些主成分累计方差贡献率为70-80%之类的准则是不是总是适用?为什么?

六、(20分)回归模型y=β0+β1x1+β2x2+…+βpxp+ε中的ε一定是随机误差吗?如果回答是否定的,讨论在何种情况下,答案是肯定的?此外,最小二乘回归是不是需要对误差项作出假定?如果不是,那么在什么情况下需要对误差项作出假定?作什么假定?

七、(25分)对于聚类分析,请回答以下问题:

(1)分层聚类前,需要对什么进行选择?

(2)描述分层聚类分析的详细步骤;

(3)描述K均值(快速)聚类分析的详细步骤。

八、(25分)应用多元线性回归模型y=β0+β1x1+β2x2+…+βpxp+ε,如果一个SPSS回归分析的结果如下表所示:

ANOV A

a. Predictors:(Constant),Beginning Salary

b. Predictors:(Constant),Beginning Salary,Employment Category

则:

(1)表中所用选择自变量的方法可能是什么?

(2)表中的最后一个Sig.如何求得?意义是什么?

(3)请给出该表最后一个F所表示的统计量服从F分布所需要的假定条件,并对该统计量服从F分布予以证明。

2006年人大805统计学真题

一、(20分)某银行为缩短到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。为比较那种排列方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:

5.5

6.6 6.7 6.8

7.1 7.3 7.4 7.8 7.8

(1)画出第二种排队方式等待时间的茎叶图;

(2)比较两种排队方式等待时间的离散程度;

(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。

二、(20分)某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从某天生产的一批产品中按重量重复抽样方式随机抽取50包进行检查,测得每包重量(单位:克)如下:

已知食品包重量服从正态分布,要求:

(1)确定该种食品平均重量95%的置信区间;

(2)如果厂家认为每袋食品重量不低于100克,请写出检验的原假设和备择假设;

(3)利用P值进行检验和利用统计量进行检验有什么不同?

(z0.05=1.645,z0.025=1.96,t0.05=1.69,t0.025=2.03)

三、(20分)一家汽车制造商准备购进一批轮胎,考虑的因素主要有轮胎供应商牌和耐磨程度。为了对耐磨程度进行测试,分别在低速(40公里/小时),中速(80公里/小时),高速(120公里/小时)下进行测试。根据对5家供应商抽取的轮胎随机样本对轮胎在行驶1000公里后磨损程度进行试验,在显著水平α=0.01下得到的有关结果如下:

差异源SS df MS F P-value F crit

行列误差总计1.55

3.48

0.14

5.17

4

2

8

14

0.39

1.74

0.02

21.72

97.68

0.000236

0.000002

7.01

8.65

(1)不同的车速对磨损程度是否有显著影响?

(2)不同供应商的轮胎之间磨损程度是否显著差异?

(3)在上面的分析中,你都做了哪些假设?

四、(15分)说明什么条件下适合采取简单随机抽样?

五、(25分)说明回归模型的假设以及当这些假设不成立时的应对方法。

六、(20分)解释因子模型

X=AF+ε的意义并写出模型的假设。

七、(15分)以下是从《中国统计年鉴-2005》摘引的资料,要求:

单位:元/人

(1)根据国民经济收入分配核算原理,说明居民人均收入低于人均GDP水平的原因;(2)计算各指标的动态变动率(不考虑价格变化),对其结果予以简要分析。

八、(15分)下表是中国全部国有及规模以上非国有供企业统计的主要指标,要求:(1)设计并计算反映企业经济效益的指标;

(2)对经济效益指标的动态变化状况做简要分析。

2005年人大805统计学真题

一、(15分)一家网吧想了解上网人员的年龄分布状况,随机抽取25人,得到他们的年龄数据如下:

15 19 22 24 30

16 19 22 24 31

17 20 23 25 34

18 20 23 27 38

19 21 23 29 41

(1)画出该组数据的茎叶图;

(2)画出该组数据的箱线图;

(3)根据茎叶图和箱线图说明上网者年龄分布的特征。

二、(15分)设有三个总体的均值分别为:μ1,μ2,μ3。要检验三个总体的均值是否相等(α=0.05),我们为什么不先将它们简单地配对,即H0:μ1=μ2,H0:μ1=μ3,H0:μ2=μ3,,然后分别进行检验,而是采用方差分析的方法?

三、(20分)某城市的餐饮管理协会估计,餐馆的月平均用水量为100吨,一家研究机构认为实际用水量要高于这个数字,该研究机构随机抽取了36家餐馆,记录了每个餐馆的月用水量(单位:吨),经过初步计算得到样本数据的部分描述统计量如下:

平均107

标准误差 4.99

样本标准差29.96

样本方差897.77

(1)确定餐馆月平均用水量95%的置信区间;

(2)餐馆实际月平均用水量在你所建立的置信区间里吗?请说明原因;

(3)如果要检验研究机构的看法是否正确,应该如何建立原假设和备择假设?请谈谈拒绝和不拒绝原假设的含义;

(4)在上面的估计和检验中,你使用了统计中的哪一个重要定理?请简要解释这一定理。

(z0.05=1.645,z0.025=1.96,t0.05=1.69,t0.025=2.03)

1、(20分)一家房地产评估公司想对某城市的房地产销售价格(y)与地产评估价值(x1)、房产评估价值(x2)和使用面积(x3)建立一个模型,以便对销售价格做合理预测。为此,收集了15栋住宅的房地产评估数据,经回归得到下面的有关结果(α=0.05):

(1)写出销售价格对地产评估价值、房产评估价值、使用面积的多元线性回归方程,并解释各回归系数的意义;

(2)检验回归方程的线性关系是否显著;

(3)检验各回归系是否显著;

(4)计算多重判定系数R2,并说明它的实际意义;

(5)计算估计标准误差sy,并说明它的实际意义;

(6)你认为使用面积(x3)在预测销售价格时是否有用?试说明理由。

五、(42分)假设一个已知简单总体的全部真实数据列于下表:

(1)绘出散点图;

(2)如果根据Y的数值将总体分成两个子总体,最好的分发是什么?

(3)举例说明上表数据所反映的现象可能是什么?

(4)计算出Y的总体均值Y和总体方差S2;

(5)四种基本抽样方式中最不适合上述总体情形的是哪一种?并说明理由;

(6)对其余三种基本抽样方式,假定n=2,分别列出每一种方式所对应的全部可能样本,并计算样本均值的数学期望和方差;

(7)计算每一种方式在此情形下的设计效应,并说明其意义。

六、(8分)说明抽样里的回归估计与一般回归分析方法的联系与区别。

七、(6分)请解释下面的说法:“生产核算的范围决定了收入分配和收入使用核算的范围”。

八、(9分)A、B两个地区的贫困线均为年收入1000元。A地区有11%的人年收入900元,9%的人年收入200元;B地区有1%的人年收入900元,9%的人年收入500元。

(1)根据上述数据,计算两地区的贫困者比重和贫困深度;(2分)

(2)请根据贫困者比重和贫困深度对两地区贫困状况进行简要的比较分析;(4分)(3)你觉得这两个指标能够准确反映两地区贫困状况的差异吗?如果不能,应当如何改进?(3分)

九、(15分)下面是某国某核算年度的国际收支平衡表(单位:亿元):

(1)在表中括号内填上适当的数字;(3分)

(2)请解释储备资产所对应的-125亿元的含义;(3分)

(3)请根据表中数字分析该国国内生产总值、国民总收入和国民可支配收入三者之间的关系;(6分)

(4)根据表中数字,对于该国当年国内的投融资状况你能得出何种结论?(3分)

2004年人大805统计学真题

本试卷分为两部分,一部分为必答题,计105分,一部分为选答题,计45分。

第一部分必答题

1.(25分)下面是A、B两个班学生的数学考试成绩数据:

A班:

55 76 66 85 75 62 79 73 93 76

67 85 74 61 78 71 92 79 65 83

73 57 77 70 90 75 63 81 73 96

B班:

34 71 56 90 66 48 81 58 96 71

55 85 62 44 79 57 95 68 54 84

61 39 73 57 94 68 51 82 61 100

(1)将两个班的考试成绩用一个公共的茎制成茎叶图,比较两个班考试成绩分布的特点;(2)两个班考试成绩的描述统计量如下,试进行比较分析:

(3)要判断考试成绩是否有离群点,可使用哪些方法?

(4)要判断考试成绩是否服从正态分布,可使用那些描述性方法?

2.(25分)某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每人使用其中的一种方法。通过Excel进行方差分析得到下面的部分结果:

(1)完成上面的方差分析表;

(2)若显著性水平α=0.05,检验三种方法组装的产品数量之间是否有显著性差异;(3)在上面的方差分析中包含了哪些基本假定?

(4)简述多重比较的前提和作用。

3.(20分)一袋中有黑、白两种球,p表示白球所占的比例,待检验假设为

H0:p=1/2;H1:p=1/5。

从袋中任取4个球(放回抽样),当白球数小于2时,拒绝原假设。试给出以下内容:(1)总体及其分布;

(2)样本量n;

(3)拒绝域;

(4)第一类错误的概率。

4.(15分)试举例说明方差分析中效应的意义和用效应如何表达它的数学模型。

5.(20分)试证明正态线性回归模型其回归系数的最大似然估计与最小二乘估计相同。

第二部分选答题(在下面五道题中任选三道题)

6.(15分)下表是中国1992和2002两个年份国民经济核算的部分资料。要求:

(1)根据资料,计算反映经济发展状况的基本总量指标和结构比例指标;

(2)根据计算结果,对10年间中国经济发展特征及其变化予以简要说明。

中国国民经济核算有关资料单位:亿元

7.(15分)2003年7月,中央政府和香港特区政府签定了简称CEPA的《内地与香港关于建立更紧密经贸关系的安排》。其中内容之一是自2004年起,273种香港原产货物进入内地市场实行零关税;内容之二是放宽香港企业对内地投资的限制,包括投资的行业、注册资本数额和资质条件等。可以预见,由此将大大促进香港对内地的贸易和投资活动。

要求:根据上述贸易和投资两方面的内容,应用国际收支平衡表原理,说明中国未来国际收支所产生的影响。(说明:根据目前中国国民经济核算,仍将香港作为“非常住单位”,即作为“境外”看待。)

8.(15分)假定某地区人口和劳动力就业统计数据如下表所示,要求:

(1)计算有关指标,描述该地区人口基本结构状况;

(2)计算有关指标,描述该地区人口变动状况;

(3)计算有关指标,描述该地区劳动就业状况。

单位:万人

9.(15分)对(30)的1000元3年定期寿险,死亡年末给付,保费在两年内每年缴一次。已知预定利率为5%,q30=0.02,q31=0.03,q32=0.04,,假设费用发生在保年初,各年费用为:

年份每份保单每1000元保额占总保费的比例

1 10 2.5 0.10

2 5 1.0 0.05

3 5 1.0 —

赔付处理费发生在死亡年末,每1000保额为10元,假设有退保。计算:

(1)每年总保费;

(2)第一年在总保费下的责任准备金。

10.(15分)某人在25岁时计划每年初存入200元建立个人账户,如果他在60岁退休,存款利率假设恒定为4%。

(1)求退休时个人账户的累计额;

(2)如果个人账户累计额在退休后以固定年金方式在30年内每月领取一次,求每月可以领取的数额。

2003年人大805统计学真题

一、(15分)考虑两个国家之间按GDP进行经济比较。假定在既定汇率水平上,甲国GDP 与乙国GDP之间的比例为1:20。一场金融危机放生之后,如果甲国货币相对乙国货币贬值了50%,那么,在新的汇率水平上,两国GDP之间的比例将变化为1:40。请问:我们能否根据比较结果说甲国的经济发展水平下降了50%?这种比较所包含的统计方法问题是什么?

二、(15分)假定一时期国际收支平衡表上“储备资产变动”一项为正差额100亿元,据此,应用国际收支平衡表原理判断当期国际收支的顺、逆差状况。

三、(30分)以下是某经济总体1985和2001两年份城镇居民住户部门的调查资料。要求:

(1)列表计算各年城镇住户部门的原始收入、可支配收入和最终消费支出;(15分)(2)计算有关指标,比较说明城镇居民住户部门经济活动特征的变化。(15分)

四、(30分)一家种业开发股份公司研究出三个新的小麦品种:品种一、品种二、品种三。公司为研究不同品种对产量的影响,选择了四个面积相同的地块进行试验,分别为:地块一、地块二、地块三、地块四。经过试验获得产量数据,经分析得到下面的方差分析表(α=0.05):

(1)将方差分析表中划线部分的数值补齐;(6分)

(2)分析小麦品种对产量的影响是否显著;(4分)

(3)分析不同地块对产量的影响是否显著;(4分)

(4)在产量变动的差异中,被品种所解释的百分比是多少?(3分)

(5)在产量变动的差异中,被地块所解释的百分比是多少?(3分)

(6)上面的分析包含哪些假定?(10分)

五、(30分)统计资料表明,某地区职工年人均病假天数为5.1天。某公司从本公司职工中随机抽取了46名职工作为样本,测得其平均病假天数为7天,样本标准差为2.5天。公司领导想知道本公司职工是否比其他单位的职工更容易生病。

(1)公司领导感兴趣的原假设和替换假设是什么?(3分)

(2)若令α=0.05,请用假设检验的方法帮助公司领导作出判断(写清检验步骤,并作示意图)。(10分)

(zα/2=1.96,zα=1.645,tα/2(45)=2.0141,tα(45)=1.6794)

(3)在假设检验中,P值代表什么含义?(6分)

(4)在本例中,P=0.001说明了什么?(3分)

(5)用区间估计的方法找出该公司职工病假天数与其他职工病假天数显著不同的临界

点。(8分)

六、(30分)关于回归分析讨论下列问题:

(1)画出回归建模步骤的流程图;(7分)

(2)简要描述各个步骤的内容;(8分)

(3)设1?()X X X y β-''=是多元回归方程参数的最小二乘估计,证明

21?()()D X X βσ-'=;(8分)

(4)根据21?()()D X X βσ-'=,结合一元线性回归,你能看出对建模有指导意义的什么

信息(7分)

统计学课后练习题答案人大第四版

第三章节:数据的图表展示 (1) 第四章节:数据的概括性度量 (15) 第六章节:统计量及其抽样分布 (26) 第七章节:参数估计....................................................... (28) 第八章节:假设检验........................................................ (38) 第九章节:列联分析........................................................ (41) 第十章节:方差分析........................................................ (43) 3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求: (1)指出上面的数据属于什么类型。 顺序数据 (2)用Excel制作一张频数分布表。 用数据分析——直方图制作: 接收频率 E16 D17 C32 B21 A14 (3)绘制一张条形图,反映评价等级的分布。 用数据分析——直方图制作: (4)绘制评价等级的帕累托图。 逆序排序后,制作累计频数分布表:

人大统计学考研真题

人大统计学考研历年真题精华版(03-09) https://www.doczj.com/doc/638834456.html,

https://www.doczj.com/doc/638834456.html, 2009年人大统计学专业课初试题 一、有两个正态总体,均值和方差未知,但已知方差相等。从第一个总体中抽取n=16的随机 样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。如何检验第一个总体的均值是否大于第二个总体的均值? 二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。 三、周期过程cos()t t X A ω?=+,其中频率ω和振幅A 都是常数,而相位?是一个在区间 [-π,π]上服从均匀分布的随机变量。问{t X }是否平稳?说明原因。 四、把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总体比例。如 采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随 机抽样有相同的估计量方差。(假设各层总体单位数量h N 都充分大,忽略“有限总体校正系数”) 五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第10题是一样 的。 六、若有线性回归模型01 (1,2,,)t t t y x t n ββε=++= ,其中()0t E ε=,222()t t E x εδ=, ()0 ()t s E t s εε=≠,则 (1)该模型是否违背古典线性回归模型的假定?请简要说明。 (2)如果对该模型进行估计,你会采用什么方法?请说明理由。 七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。第一 组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记

2003-2016年中国人民大学统计学805考研真题集

人大统计学考研历年真题精华版(03- 16)

2016年人大学统计学考研真题(完整版) 1,构造几何分布,标准化的样本空间,取值空间,事件空间。 2,X、Y为随机变量,给出条件分布,对于任意y,E(X|Y<=y) = E(X|Y>y),那么X与Y是否独立?写出详细论证过程。 3,给出联合分布,求条件分布,和条件概率。 4,X与Y是相互独立的随机变量,请给出一个充分条件,当X和Y各自服从什么分布时X-Y与X+Y相互独立,如果不存在请说明理由。写出详细论证过程。 5,求一个密度函数的方差的极大似然估计,并求它的Fisher信息量。6,异方差性和自相关是什么,检测方法,加权最小二乘法原理与实际步骤。 7,证明多元回归系数的估计量是无偏估计,是最小方差线性无偏估计。8,多元线性回归,因变量均值与每个自变量间为二次函数关系,根据相互独立的n个样本预测因变量值。

2013年人大805统计学真题 一、证明题:(20分)每题10分 1.袋子里有两种颜色的球红球a个白球b个 第一步从袋子里取出一个球观察其颜色然后丢掉 第二步从袋子里再取出一个球,若和上一次取出的球颜色不同,则放回,回到第一步;若和上一次取出的球颜色相同,则丢掉,重复第二步。 证明取出的最后一个球是红球的概率是1/2。 2.证明n维正态随机向量的各分量相互独立的充要条件是互不相关。 二、简述:(30分)每题10分 1.设昆虫在树叶上产卵数X服从参数为的泊松分布,而只有树叶上有卵时才能判断是否有昆虫。在又设观察到的虫卵数Y,P(Y=i)=P(X+i|X>0),求P(Y为偶数)和E(Y)。 2. 2n+1个独立同分布样本,分布函数是F(x) 求中位数x(n+1)的分布 3.设走进某商店的顾客数是均值为50的随机变量。又设这些顾客所花的钱数是相互独立、均值为100元的随机变量。再设任一顾客所花的钱数和进入该商店的总人数相互独立。试问该商店一天的平均营业额是多少? 三、已知Y1,……,Y n是相互独立的随机变量,且均服从。求的矩估计和最大似然估计,并求他们的均方误差。(25分) 四、X和Y是两个相关的随机变量: 求证var(Y) = E(var(Y|X)) + var(E(Y|X)) 并谈谈你对它的理解和应用。(25分) 五、谈谈你对双因素方差分析的理解和认识。(25分) 六、一元线性回归中有三个检验:线性相关检验,回归方程显著性检验以及X的回归系数的检验,谈谈你对它们的理解和它们之间的关系。(25分)

社会统计学复习题(有答案)复习课程

社会统计学复习题(有 答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产 品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。

人大统计学真题

人大统计学考研历年真题精华版 (03-09) —By fan (声明:这是由fan整理编辑,仅供参考。) https://www.doczj.com/doc/638834456.html,

https://www.doczj.com/doc/638834456.html, 2009年人大统计学专业课初试题 一、有两个正态总体,均值和方差未知,但已知方差相等。从第一个总体中抽取n=16的随机 样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。如何检验第一个总体的均值是否大于第二个总体的均值? 二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。 三、周期过程cos()t t X A ω?=+,其中频率ω和振幅A 都是常数,而相位?是一个在区间 [-π,π]上服从均匀分布的随机变量。问{t X }是否平稳?说明原因。 四、把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总体比例。如 采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随 机抽样有相同的估计量方差。(假设各层总体单位数量h N 都充分大,忽略“有限总体校正系数”) 五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第10题是一样 的。 六、若有线性回归模型01 (1,2, ,)t t t y x t n ββε=++=,其中()0t E ε=,222()t t E x εδ=, ()0 ()t s E t s εε=≠,则 (1)该模型是否违背古典线性回归模型的假定?请简要说明。 (2)如果对该模型进行估计,你会采用什么方法?请说明理由。 七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。第一 组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记

统计学_ 贾俊平 -中国人民大学出版社_第五版

3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求: (1)指出上面的数据属于什么类型。 顺序数据 (2)用Excel制作一张频数分布表。 用数据分析——直方图制作: 接收频率 E16 D17 C32 B21 A14 (3)绘制一张条形图,反映评价等级的分布。 用数据分析——直方图制作: (4)绘制评价等级的帕累托图。 逆序排序后,制作累计频数分布表: 接收频数频率(%)累计频率(%) C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A 14 14 100

5101520253035C D B A E 20406080100120 3.2 某行业管理局所属40个企业2002年的产品销售收入数据如下: 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求: (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。 1、确定组数: ()lg 40lg() 1.60206111 6.32lg(2)lg 20.30103 n K =+ =+=+=,取k=6 2、确定组距: 组距=( 最大值 - 最小值)÷ 组数=(152-87)÷6=10.83,取10 3 (2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。

社会统计学自考真题

浙江省2006年4月高等教育自学考试 社会统计学试题 课程代码:00278 一、填空题(本大题共8小题,每空1分,共10分) 请在每小题的空格中填上正确答案。错填、不填均无分。 1.统计资料整理阶段的基本方法是________。 2.调查人员从记录社会现象的各种载体中获取所需信息的调查方法,称为________。 3.若采用异距分组,________用来反映单位组距内分布的频数。 4.将所有变量值按大小顺序排列,中位数就是________的变量值。 5.已知各期的环比发展速度,应采用________法计算平均发展速度。 6.时间数列的两个基本构成要素是________和________。 7.推论统计的两个基本内容是________和________。 8.在数据的各种测量尺度中,既可进行加减运算,也可进行乘除运算的测量尺度是________。 二、单项选择题(本大题共30小题,每小题1分,共30分) 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。 1.一个总体单位( ) A.只能有一个标志 B.只能有一个指标 C.可以有多个标志 D.可以有多个指标 2.政治算术学派的代表人物是( ) A.康令 B.格朗特 C.凯特勒 D.恩格尔 3.要了解某企业员工的收入,则总体单位是( ) A.该企业的全部员工 B.该企业每个员工的收入水平 C.该企业的每一个员工 D.该企业全部员工的平均收入水平 4.下列属于品质标志的是( ) A.工人年龄 B.工人性别 C.工人体重 D.工人工资等级 5.实际工作中,最常用的分类抽样是( ) A.定额分配 B.等额分配 C.定比分配 D.异比分配 6.抽样调查应遵循的原则是( ) A.灵活性 B.准确性 C.可靠性 D.随机性

人民大学统计学在职题库统计综述答案

1中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学 考试科目:统计思想综述 课程代码:123201 考题卷号:1

除不能导致SSE显著减小为止。 逐步回归:结合向前选择和向后剔除,从没有自变量开始,不停向模型中增加自变量,每增加一个自变量就对所有现有的自变量进行考察,若某个自变量对模型的贡献变得不显著就剔除。如此反复, 直到增加变量不能导致SSE显著减少为止。 五、(20分)如果一个时间序列包含趋势、季节成分、随机波动, 适用的预测方法有哪些?对这些方法做检验说明。 可以使用Winter指数平滑模型、引入季节哑变量的多元回归和分解 法等进行预测。 (1)Winter指数平滑模型 包含三个平滑参数,即(取值均在0~1),以及平滑值、趋势项更新、季节项更新、未来第k期的预测值。 L为季节周期的长度,对于季度数据,L=4,对于月份数据,L=12;I为季节调节因子。平滑值消除季节变动,趋势项更新是对趋势值得修正,季节项更新是t期的季节调整因子, 是用于预测的模型。 使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,而且需要有四个以上的季节周期(4年以上的数据)。 使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,

而且需要有四个以上的季节周期(4年以上的数据)。 (2)引入季节哑变量的多元回归 对于以季度记录的数据,引入3个哑变量 ,其中=1(第1季度)或0(其他季度),以此类推,则季节性多元回归模型表示为: 其中b0是常数项,b1是趋势成分的系数,表示趋势给时间序列带来的影响,b2、b3、b4表示每一季度与参照的第1季度的平均差值。(3)分解预测 第1步,确定并分离季节成分。计算季节指数,然后将季节成分从 时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数以消除季节性。 第2步,建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测。 第3步,计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的预测值。

统计学-基于R第3版习题答案(第二章)

习题 2.1 (1)简单频数分布表: > load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_1.RData") > summary(exercise2_1) 行业性别满意度 电信业:38 男:58 不满意:75 航空业:19 女:62 满意 :45 金融业:26 旅游业:37 二维列联表: > mytable1<-table(exercise2_1$行业,exercise2_1$满意度) > addmargins(mytable1) # 增加边界和 不满意满意 Sum 电信业 25 13 38 航空业 12 7 19 金融业 11 15 26 旅游业 27 10 37 Sum 75 45 120 三维列联表: > mytable1<-ftable(exercise2_1, row.vars = c("性别","满意度"), col.var="行业");mytable1 行业电信业航空业金融业旅游业 性别满意度 男不满意 11 7 7 11 满意 6 3 7 6 女不满意 14 5 4 16 满意 7 4 8 4 (2) 条形图: > count1<-table(exercise2_1$行业) > count2<-table(exercise2_1$性别) > count3<-table(exercise2_1$满意度) > par(mfrow=c(1,3),mai=c(0.7,0.7,0.6,0.1),cex=0.7,cex.main=0.8) > barplot(count1,xlab="行业",ylab="频数") > barplot(count2,xlab="性别",ylab="频数") > barplot(count3,xlab="满意度",ylab="频数")

人大版_贾俊平_统计学_第三版_课后习题答案

第3章 概率与概率分布——练习题(全免) 1 .解:设A =女性,B =工程师,AB =女工程师,A+B =女性或工程师 (1)P(A)=4/12=1/3 (2)P(B)=4/12=1/3 (3)P(AB)=2/12=1/6 (4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2 4. 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。某射击选手第一发命中的可能性是80%,第二发命中的可能性为50%。求该选手两发都脱靶的概率。 解:设A =第1发命中。B =命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。 )|()()|()()(A B P A P A B P A P B P += =0.8×1+0.2×0.5=0.9 脱靶的概率=1-0.9=0.1 或(解法二):P (脱靶)=P (第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1 8.已知某地区男子寿命超过55岁的概率为84%,超过70岁以上的概率为63%。试求任一刚过55岁生日的男子将会活到70岁以上的概率为多少? 解: 设A =活到55岁,B =活到70岁。所求概率为: ()()0.63(|)0.75()()0.84 P AB P B P B A P A P A ==== 9.某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调查得知,采用新生产管理流程后产品优质率达95%的占四成,优质率维持在原来水平(即80%)的占六成。该企业利用新的生产管理流程进行一次试验,所生产5件产品全部达到优质。问该企业决策者会倾向于如何决策? 解:这是一个计算后验概率的问题。 设A =优质率达95%,A =优质率为80%,B =试验所生产的5件全部优质。 P(A)=0.4,P (A )=0.6,P (B|A )=0.955, P(B |A )=0.85,所求概率为: 6115.050612 .030951.0)|()()|()()|()()|(===A B P A P A B P A P A B P A P B A P + 决策者会倾向于采用新的生产管理流程。 10. 某公司从甲、乙、丙三个企业采购了同一种产品,采购数量分别占总采购量的25%、30%和45%。这三个企业产品的次品率分别为4%、5%、3%。如果从这些产品中随机抽出一件,试问:(1)抽出次品的概率是多少?(2)若发现抽出的产品是次品,问该产品来自丙厂的概率是多少? 解:令A 1、A 2、A 3分别代表从甲、乙、丙企业采购产品,B 表示次品。由题意得:P (A 1)=0.25,P (A 2)=0.30, P (A 3)=0.45;P (B |A 1)=0.04,P (B |A 2)=0.05,P (B |A 3)=0.03;因此,所求概率分别为:

统计学考试题及答案(中国人民大学第六版)

统计学 一、单选 1、从某高校随机抽出100名学生,调查他们每月的生活费支出,这研究的统计 量是 A 该校学生的总人数 B 该校学生的月月平均生活费支出 C 该校学生的生活费总支出 D 100名学生的月平均生活费支出 2、下列变量中,顺序变量是 A职工人数 B产量 C产品等级 D利润总额 3、将总体中所有单位按某种变量划分为若干层,再从各层中随机抽出一些单位 组成一个样本。这种抽样方式是 A 简单随机抽样 B 分层抽样 C 整群抽样 D 系统抽样 4、指出下面陈述中错误的是 A 抽样误差只存在于概率抽样中 B 非抽样误差只存在于非概率抽样中。 C概率抽样和非概率抽样都存在非抽样误差。 D在普查中存在非抽样误差。 5、展示广告费支出与商品销售量之间是否有某种数量关系,最适合的图形是 A柱形图 B饼图 C线图 D散点图 6、当样本量一定时,置信区间的宽度 A 随置信水平的增大而减小 B随置信水平的增大而增大 C与置信水平的大小无关 D与置信水平的平方根成反比 7、在检验一个正态总体方差时,使用的分布是 A z分布 B t分布 C X 分布 D F分布 8、指出下面陈述中的错误的是 A 抽样误差可以避免 B 抽样误差不可避免 C 非抽样误差可以避免 D 抽样误差可以控制 9、假设检验中,如果计算出的P值越小,说明检验的结果越 A 真实 B 不真实 C 显著 D 不真实 10、双因素方差分析涉及 自变量 A 一个分类型 B 一个数值型 C 两个分类型 D 两个数值型 二、填空题 1、当一组数据对称分布时,经验法则表明,大约有68%的数据分析在( 平均数±一个标准差 )的范围之内 2、对于一组具有单峰分布的数据而言,当数据的m m > 时,可判断数据是 (左偏)分布

人大统计学专业课初试题

2003年人大统计学专业课初试题 一、(15分)考虑两个国家之间按GDP进行经济比较。假定在既定汇率水平上,甲国GDP与乙 国GDP之间的比例为1:20。一场金融危机放生之后,如果甲国货币相对乙国货币贬值了50%,那么,在新的汇率水平上,两国GDP之间的比例将变化为1:40。请问:我们能否根据比较结果说甲国的经济发展水平下降了50%?这种比较所包含的统计方法问题是什么? 二、(15分)假定一时期国际收支平衡表上“储备资产变动”一项为正差额100亿元,据此,应 用国际收支平衡表原理判断当期国际收支的顺、逆差状况。 三、(30分)以下是某经济总体1985和2001两年份城镇居民住户部门的调查资料。要求: (1)列表计算各年城镇住户部门的原始收入、可支配收入和最终消费支出;(15分) (2)计算有关指标,比较说明城镇居民住户部门经济活动特征的变化。(15分) 四、(30分)一家种业开发股份公司研究出三个新的小麦品种:品种一、品种二、品种三。公司 为研究不同品种对产量的影响,选择了四个面积相同的地块进行试验,分别为:地块一、地

块二、地块三、地块四。经过试验获得产量数据,经分析得到下面的方差分析表(α=0.05): (1)将方差分析表中划线部分的数值补齐;(6) (2)分析小麦品种对产量的影响是否显著;(4) (3)分析不同地块对产量的影响是否显著;(4) (4)在产量变动的差异中,被品种所解释的百分比是多少?(3) (5)在产量变动的差异中,被地块所解释的百分比是多少?(3) (6)上面的分析包含哪些假定?(10) 五、(30分)统计资料表明,某地区职工年人均病假天数为5.1天。某公司从本公司职工中随机 抽取了46名职工作为样本,测得其平均病假天数为7天,样本标准差为2.5天。公司领导想知道本公司职工是否比其他单位的职工更容易生病。 (1)公司领导感兴趣的原假设和替换假设是什么?(3) (2)若令α=0.05,请用假设检验的方法帮助公司领导作出判断(写清检验步骤,并作示意图)。(10)(zα/2=1.96,zα=1.645,tα/2(45)=2.0141,tα(45)=1.6794)(3)在假设检验中,P值代表什么含义?(6) (4)在本例中,P=0.001说明了什么?(3) (5)用区间估计的方法找出该公司职工病假天数与其他职工病假天数显著不同的临界点。(8) 六、(30分)关于回归分析讨论下列问题: (1)画出回归建模步骤的流程图;(7) (2)简要描述各个步骤的内容;(8) (3)设 1 ?() X X X y β- '' =是多元回归方程参数的最小二乘估计,证明21 ?()() D X X βσ- ' =;(8) (4)由 21 ?()() D X X βσ- ' =,结合一元线性回归,你能看出对建模有指导意义的什么信息(7)

2011年人大考研统计学真题

2011年人大考研统计学真题 感觉很注重统计思想和方法的考察,题目很不错! 一、简答题(50分) 1.简述加权最小二乘估计的基本思想。 2.进行主成分分析需是否要知道数据的具体分布,请说明原因。 3.k-均值聚类对比分层聚类,优点在哪里。 4.题目给出了一个回归分析残差的散点图,有点线性趋势的那种,问据图分析可能出现了什么问题。 5.简述方差分析和回归分析的异同。 二、已知X与W相互独立(30分)。 1.X与W都服从正态分布,且W的期望为零,Y=a+bX+W,求X与Y的联合分布。 2.W服从正态分布,其期望为零,方差为?2(是表示平方),Y=b0+b1X+b2X2(是表示平方) +W,当X=x时求Y的条件期望。 三、CPI是衡量经济发展的重要指标,CPI的计算包括收集数据的四个阶段和确定权数的两个阶段,(他这里描述了这六个阶段的具体操作方法)。(30分) 1.结合调查知识和统计理论说明CPI所属类别(这个有待考证,希望大家来修正~)。 2.指出CPI的调查过程中误差的可能来源。 3.指出这个过程中涉及的调查总体、随机变量及待估总体的特征。 4.如果每个阶段的调查都严格按照1—a的置信水平,那么总的置信水平是多少。 四、假设女性和男性读书的语速都服从正态分布。研究者认为女性读书的语速比男性快,为证明这一点抽取了n1名女性和n2名男性,分别测得他们读书的语速,发现n1名女性的平均语速比n2名男性快,研究者由此得出女性读书的语速比男性快的结论。请问研究者的方法对吗?为什么?应该怎样验证?(20分) 五、题目给出了从2006年1月到2010年6月的商品销售额的时间序列图(有明显线性趋势的),现在想预测2010年下半年的商品销售额,请问用什么应该模型,写出模型的具体形式和模型的建立过程。(20分)

人大统计学真题07-09

2009年人大统计学专业课初试题 一、有两个正态总体,均值和方差未知,但已知方差相等。从第一个总体中抽取 n=16的随机样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。如何检验第一个总体的均值是否大于第二个总体的均值? 二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。 三、周期过程cos()t t X A ω?=+,其中频率ω和振幅A 都是常数,而相位?是一 个在区间[-π,π]上服从均匀分布的随机变量。问{t X }是否平稳?说明原因。 四、把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总 体比例。如采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随机抽样有相同的估计量方差。(假设各层总体单位数 量h N 都充分大,忽略“有限总体校正系数”) 五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第 10题是一样的。 六、若有线性回归模型01 (1,2, ,)t t t y x t n ββε=++=,其中()0t E ε=, 222()t t E x εδ=,()0 ()t s E t s εε=≠,则 (1)该模型是否违背古典线性回归模型的假定?请简要说明。 (2)如果对该模型进行估计,你会采用什么方法?请说明理由。 七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为 两组。第一组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只

喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记录。对于不吃药的白鼠,记录时间与同一对中另外一只白鼠的记录时间相同。假定40只白鼠的初始活动状态相同。请详细阐述你用何种方法分析安眠药的效果? 八、某大学从教师中抽取一个随机样本进行满意度调查。1分表示非常不满意, 100分表示非常满意。数据汇总如下表,欲分析教师职称和性别对满意度有无显著性影响,则 (1)你会选择什么分析方法?简述你的分析思路(可用公式说明,不需计算结果)。 (2)要采用该分析方法,数据必须满足哪些几本假定?请加以说明。

2014年中国人民大学应用统计初试复试真题及答案解析

2014年中国人民大学应用统计初试复试真题及答案 解析 1.地区对消费者购买汽车价格的影响,使用什么方法,简要说明。 2.时间序列的指数平滑预测法有哪些?分别适用于哪些场合? 3.(1)置信区间和假设检验之间的关系 (2)用文字表述无偏性 (3)无偏估计的样本均值和相应的置信区间的中点的关系。 4.方差分析 (1)计算F值 (2)根据表格做出统计决策 (3)方差分析的假设 5.多元回归分析(有五问,记不清了) (1)t值如何计算 (2)本例的模型拟合优度如何,如何度量 (3)R2和adjustedR2各是什么? (4)P值的含义 中国人民大学招收硕士研究生复试工作管理办法 复试工作是进一步考察考生专业能力和综合素质是否符合硕士研究生(以下简称硕士生)培养要求的重要环节,是选拔优秀人才的重要依据之一,在研究生人才选拔中具有重要作用。各学院应切实重视这项工作,积极探索和完善复试办法。为做好此项工作,特制定本办法。 一、复试原则 复试工作要自始至终贯彻科学选拔、公平公正、全面考察、客观评价、公开透明、严谨严密的原则,坚决抵制各种不正之风。 各学院对拟录取的硕士生必须进行复试,复试合格方可录取。

我校实行差额复试,差额复试比例在120%以上。生源充足的学院可进一步扩大差额复试比例。 二、复试工作管理 我校硕士生入学考试复试工作实行二级管理。学校研究生招生委员会负责制定我校硕士生复试规则和各学科的复试基本要求;各学院依据学校复试要求,负责确定本学院复试名单,制定本学院的复试办法并报学校研究生招生办公室(以下简称研招办)备案。 学院须成立硕士生复试工作领导小组,组长由主管研究生工作的院长担任,成员包括相关专业的学科带头人、学术骨干、硕士生导师。 学院硕士生复试工作领导小组负责组织对本学院拟接收的校内和校外推荐免试生以及统考硕士生的复试工作,具体职责如下职责: 1、根据教育部规定和我校硕士生复试工作管理办法,负责制定本学院具体的硕士生复试办法。 2、严格复试工作人员管理,遴选责任心强、学术水平高、品行端正的人员参与复试工作。 3、负责按专业成立硕士生复试小组,复试小组成员应是我校在职的硕士生导师,人数应不少于五人,组长一人,组员四人或四人以上,按小组另安排记录员一名。 4、负责组织召开所有复试教师工作会议,进行复试工作培训,使复试教师了解复试办法、明确复试要求和工作责任、掌握复试方法,保证质量。 5、负责对所有复试工作人员进行保密工作教育。复试工作人员须对试题、答案及评分标准、复试小组名单、考生分组情况、考生成绩、考生个人信息等保密。 6、负责组织本学院的专业综合课和外语笔试试题的命制、专业课和综合素质面试试题的命制、外语口语听力试题的命制、对同等学力加试科目试题的命制。 7、负责制定本学院的综合素质面试和外语面试的实施方案,认真制定面试评分标准、考核指标。 8、负责审核各专业复试小组的复试记录和复试结果,复试记录和复试结果须妥存备查。 9、负责对参加复试而未录取考生的必要解释和遗留问题的处理。

中国人民大学432-统计学考研参考书目、考研真题、复试分数线新

中国人民大学432-统计学考研参考书目、考研真题、复试分 数线 432-统计学课程介绍

中国人民大学考研复试分数线 学术学位: 学科门类政治、外语、专一(数学)、专二、总分 01哲学50509090330↓ 02经济学55559090360 03法学50↓50↓9090350 04教育学5050180330↓ 05文学55559090350 06历史学5050180335↑ 07理学45459090300 08工学45459090300 09医学5050180↑300 12管理学50↓50↓9090350↓ 13艺术学45459090330 专业学位: 专业学位政治、外语、专一、专二、总分备注

02经济类专业学位 (金融、应用统计、税务、国际商 务、保险、资产评估) 50509090340 035101法律(非法学)50509090340↓ 035102法律(法学)50509090330 0352社会工作50509090330 0453汉语国际教育50509090315↓ 0552新闻与传播55559090355↓ 0651文物与博物馆4545180↑320 0852软件工程45458080300 0951农村与区域发展50509090300 1251工商管理 100↓50170↓未通过提前面试 同教育部A类分数线通过提前面试1252公共管理115↑50180↑ 1253会计 12060225↑全日制 120↑50205↑非全日制 1255图书情报12055↓195↓ 1351艺术 40↓40↓9090325↑ 注: 1、各学院可根据生源情况上调复试基本要求。差额复试比例120%以上。 2、不符合教育部复试基本要求者不予录取。 3、向外校调剂工作待教育部公布全国硕士研究生复试分数线后进行。 4、“援藏计划”、“少数民族高层次骨干人才计划”、“单独考试”考生复试基本要求根据教育部相 关政策另行确定,考生可向相关院系或研招办咨询。 5、参加“大学生志愿服务西部计划”、“三支一扶计划”(支农、支教、支医和扶贫)、选聘高校毕业 生到村任职”和“农村义务教育阶段学校教师特设岗位计划”等项目服务期满的考生和普通高等学校应届毕业生应征入伍服务义务兵役退役后的考生,三年内参加全国硕士研究生招生考试,享受初试总分加分并在同等条件下优先录取的政策。请符合政策的考生于3月12日前直接联系我校研招办并出具相关证明材料,我校根据教育部最新文件及名单审核考生资格。

统计学第六版 人大版 复习笔记

一、统计学原理期末考试试题类型及结构 1、单项选择题:30分。考核对基本概念的理解和计算方法的应用。 2、判断题:10分。考核对基本理论、基本概念的记忆和理解。 3、简答题:30分。考核对基本概念、基本理论、基本方法的理解和掌握情况。 4、计算题:30分。考核对基本计算方法的理解、掌握程度及综合应用能力。 二、期末考试形式及答题时限 期末考试形式为闭卷笔试;答题时限为90分钟;可以携带计算器。 三、各章复习内容 期末复习资料:教材、学习指导书习题、作业 第一章统计总论 1.理解统计学的含义 答:收集、处理、分析、解释数据并从数据中得出结论的科学(收集数据:取得数据;处理数据:整理与图表展示;分析数据:利用统计方法分析数据;数据解释:结果的说明;得到结论:从数据分析中得出客观结论) 第二章数据的搜集 1.数据的来源 答:(1)数据的间接来源:系统外部的数据(统计部门和政府部门公布的有关资料,如各类统计年鉴、各类经济信息中心、信息咨询机构、专业调查机构等提供的数据、各类专业期刊、报纸、书籍所提供的资料、各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料、从互联网或图书馆查阅到的相关资料)系统内部的数据(业务资料,如与业务经营活动有关的各种单据,记录、经营活动过程中的各种统计报表、各种财务,会计核算和分析资料等)(2)数据的直接来源(原始数据)调查数据实验数据 2.收集数据的基本方法:调查的数据(自填式、面访式、电话式);实验的数据 3.抽样误差:由于抽样的随机性所带来的误差;所有样本可能的结果与总体真值之间的平均性差异;影响抽样误差的大小的因素(样本量的大小、总体的变异性) 重点:数据来源、数据搜集方法、抽样误差 第三章数据的图表展示 重点:熟悉条形图、直方图、饼图、环形图、箱线图、线图等

中国人民大学805统计学历年真题

中国人民大学805统计学历年真题(2013-2000) 2013年人大805统计学真题 一、证明题:(20分)每题10分 1.袋子里有两种颜色的球红球a个白球b个 第一步从袋子里取出一个球观察其颜色然后丢掉 第二步从袋子里再取出一个球,若和上一次取出的球颜色不同,则放回,回到第一步;若和上一次取出的球颜色相同,则丢掉,重复第二步。 证明取出的最后一个球是红球的概率是1/2。 2.证明n维正态随机向量的各分量相互独立的充要条件是互不相关。 二、简述:(30分)每题10分 的泊松分布, 昆虫。在又设观察到的虫卵数Y,P(Y=i)=P(X+i|X>0),求P(Y为偶数)和E(Y)。 2. 2n+1个独立同分布样本,分布函数是F(x) 求中位数x(n+1)的分布 3.设走进某商店的顾客数是均值为50的随机变量。又设这些顾客所花的钱数是相互独立、均值为100元的随机变量。再设任一顾客所花的钱数和进入该商店的总人数相互独立。试问该商店一天的平均营业额是多少? 的矩估计和最 四、X和Y是两个相关的随机变量: 求证var(Y) = E(var(Y|X)) + var(E(Y|X)) 并谈谈你对它的理解和应用。(25分) 五、谈谈你对双因素方差分析的理解和认识。(25分) 六、一元线性回归中有三个检验:线性相关检验,回归方程显著性检验以及X的回归系数的检验,谈谈你对它们的理解和它们之间的关系。(25分)

2012年人大805统计学真题 一、为研究不同地区与购买汽车的消费价格之间的相关关系,调查得到如下的数据: 对于以上的数据可以用什么统计图表分析,并说明这些图表的用途。 对于以上的数据可以用什么统计方法分析,并说明这些方法的用途。 二、为检验一厂家生产的产品,提出如下的假设检验:H0:u=500,H1: u=! 500 现在抽取了部分的样品进行检验。若检验结果拒绝H0,则意味着什么?若检验结果没有拒绝H0,则又意味着什么?能否恰好取到一组样本证明H0:u=500成立?为什么?若检验的P=0.03,则意味着什么?P值的真实含义是什么? 三、现研究某地区平均GDP与居民消费总额、固定投资、进出口额、年末总人口之间的关系,进行了多元回归分析。题目分别给出了三个表: 表1:整体拟合程度:R,R方,调整的可绝系数。 表2:整体线性关系的F检验 表3:系数的显著性t检验,方差扩大因子VIF(存在多重共线性) 请对上述回归模型进行综合评价。 四、题目中给出了从99年1月到2004年3月某地区各月的销售额的一个时间序列图,该序列图中包含哪些成分?可以用什么方法来分析此模型,并简要叙述可种方法的基本原理。 五、说明距离判别法与贝叶斯判别法的联系。 六、说明大数定律与中心极限定理的内容和应用? 七、在敏感性问题的调查中,为了保证回答者尽量真实回答,采用如下方法:以比例p的人回答敏感性问题 (1):你具有特征A吗?回答结果为是或不是。另外1-p的比例人回答问题 (2):比如你的手机号尾数是奇数吗?回答是的比例为t。 假设总体具有特征A的人数比例为q,样本中回答是的比例为R。 1.试提出q的一个估计。 2.证明该估计是q的一个无偏估计。

人大统计学作业答案

79、【104308】(单项选择题)设连续型随机变量X 的分布函数是)(X F ,密度函数是)(x p , 则对于任意实数α,有= =)(αX P ()。 A.)(X F B.)(x p C.0 D.以上都不对 【答案】C 80、【150761】(单项选择题)设6.0,1,4===XY DY DX ρ,则)23(Y X D -为()。 A.40 B.9.10 C.25.6 D.17.6 【答案】B 81、【104317】(简答题)正态分布概率密度函数的图形有何特点? 【答案】 正态分布概率密度函数()x f 的图形有以下特点: ①()0≥x f ,即整个概率密度曲线都在x 轴上方。 ②曲线()x f 关于μ=x 对称,并在μ=x 处达到最大值 ()σπμ21 = f 。 ③曲线的随缓程度由σ决定,σ越大,曲线越平缓;σ越小,曲线越陡峭。 ④当x 趋于无穷时,曲线以x 轴为其渐近线。 由以上特性可见,正态分布的概率密度曲线()x f 是一条对称的钟形曲线。 82、【104318】(简答题)一事件A 的概率0)(=A P ,能否肯定事件A 是不可能事件?为什 么? 【答案】不能肯定A 是不可能事件。 不可能事件是指在同一组条件下每次试验都一定不出现的事件。而0)(=A P ,并不能肯定A 就是不可能事件。例如在闭区间[]1,0上随意投掷一点,显然该区间上任一点都可能被碰上,但每一点发生的概率都为0,因此概率为0的事件不一定都是不可能事件。 83、【104319】(简答题)常见的随机变量分为哪两种类型?各自都包含哪些常见的分布? 【答案】常见的随机变量分为离散型随机变量和连续型随机变量。 离散型随机变量包括均匀分布、0-1分布、二项分布、泊松分布。 连续型随机变量包括均匀分布、正态分布。正态分布衍生卡方分布、t 分布、F 分布。 84、【104313】(填空题)甲、乙、丙三人参加同一项考试,及格的概率分别为%70,%60, %90,则三人均及格的概率为_____;三个人都不及格的概率为_____;至少有一个人及格的概 率为_____;至少有一个人不及格的概率为_____。 【答案】0.378;0.012;0.988;0.622,(37.8%)( 1.2%)(98.8%)( 62.2%) 85、【104314】(填空题)正态分布的概率密度函数曲线为一对称钟形曲线,曲线的中心 由_____决定,曲线的陡峭程度由_____决定。

相关主题
文本预览
相关文档 最新文档