当前位置:文档之家› 2007年中国人民大学805统计学考研真题

2007年中国人民大学805统计学考研真题

2007年人大统计学专业课初试题参考

解答

一、(1)①需假定总体是正态总体。

②不能用数据证明。数据至多只能检验该数据的分布是否接近正态分

布,而不能从理论上证明或肯定它一定就来自正态分布总体,即正态

性检验不能提供不拒绝正态性原假设的结论。

③不是。该区间是确定的区间,要么覆盖真实总体均值,要么不覆盖,

没有概率可言。它是置信度为95%的随机置信区间的一个样本实现,

后者才是以95%的概率覆盖真实总体均值。

(2)①需假定:总体服从正态分布;总体方差未知;样本量较小(一般 30)。

②不能。“接受零假设”的说法是不妥的,否则就得负责任的给出犯第

二类错误的概率,而该检验的备选假设是“总体均值>4.8克”,据此

是无法算出此概率的。所以只能说,在显著水平为0.05时利用该数

据进行检验不足以拒绝零假设,不拒绝不等同于接受。

二、(1)不是。因为只有员工看到并愿意答复电子邮件时才有机会进入样本,所

以每个员工入样的概率并不一样,这其实是一种非概率抽样。

(2)①不对。不说实话只是产生响应误差的原因之一,而被调查者与调查者两方面的因素,都有可能导致响应误差。调查者不当的引导或者问卷

设计不科学或者被调查者知识的局限性,都可能使被调查者对要回答

的问题的理解产生偏差,这时候即使他(她)说了“实话”,也会产

生响应误差,因为这不是我们想要的“实话”。另外,拒绝回答也是

一种重要原因。

②随机误差是不可以避免的,因为它是由抽样的随机性造成的,是客观

的。

(3)整体来说是不独立的。因为同一个网络公司员工加班时间一般是不独立的,而不同网络公司员工加班时间一般是独立的。

三、(1)令自驾车上班人数比例为π,由于不能轻易否定原结论,则检验假设为:

01

:30%

:30%H H ππ≥??

(,0.3)B n ,X 的样本值为0x ,则

00{}{0}{1}{}p P X x P X P X P X x =≤==+=++=L 值

②检验统计量0

~(0,1)H Z N =。

假定:大样本(5, 5X n X >->);每人驾车上班与否相互独立且服

从同参数0-1分布。

(3)统计上显著并不意味着实际上显著,要具体问题具体分析。比如,某箱

牛奶经统计检验,含三聚氰胺的概率显著低于5%,但人们未必敢要这箱牛奶;统计上0.1与0.01有显著差异的时候,实际中未必有多大意义。不过统计显著与实际显著很多时候是一致的。

四、不负责。一个负责任的调查报告应该给出较详尽的内容,主要如下: ①主题; ②调查时间与地点; ③调查主题、客体、对象; ④数据搜集方法、抽样框、抽样单元、样本量、抽样方法、估计方法; ⑤结论描述; ⑥精度、质量评估; ⑦责任; ⑧参考文献。

五、①无道理。如果进行第二次主成分分析,那么它处理的变量是第一次主成分

分析得到的互不相关的主成分,这样得到的“新”的主成分其实跟第一次得到的主成分是完全一样的,这可以通过矩阵运算进行验证,所以做的是无用功。

②变量之间相关系数多数较小(一般指<0.3)的数据不宜进行主成分分析。 ③不总是适用。要具体问题具体分析,不能拘泥于某些固有的准则,有时候还要根据问题的实际意义或专业理论知识来分析。

六、①不一定。只有当所有对因变量产生影响的自变量都考虑进来了而且不存在

自相关、异方差等情况时,ε才是随机误差。

②不需要。如果要研究最小二乘估计量性质的话,就得假定ε满足Guass-Markov 条件;若还要进行回归系数区间估计和有关假设检验,则要进一步假定2~(0,)n N I εσ。

七、(1)需要选择度量样品或指标相似性的统计量,通常是距离(欧式距离、马

氏距离等)或相似系数(夹角余弦、相关系数等)。然后还要定义样品间、类与类间的距离或相似系数。

(2)①计算n 个样品两两间的距离;

②构造n 个类,每个类只包含1个样品; ③合并距离最近的两类为1新类; ④计算新类与其它类之间的距离;

⑤判断类的个数是否为1,是则进入第⑥步,否则返回第③步; ⑥画谱系聚类图;

⑦决定分类个数和各类成员。

(3)①把样品粗略分成K 类;

②以上述K 类的均值为种子,按照到它们距离的远近把所有点分成新的

K 类;

③反复进行第②步,直至收敛,得到最终的K 类。

八、(1)可能是前进法或逐步回归法。由表可知,选元进行了两步,第一步选了

自变量Beginning Salary ,第二步增加了另一自变量Employment Category 。前进法显然解释得通。至于逐步回归法,因为只进行了两步,而它的第二步不考虑剔除,故可以得到与前进法完全一样的结果。 (2).Sig 就是通常所说的p 值,其计算公式为

0.{}Sig P F F =≥

这里的F 是原假设成立时服从F 分布的检验统计量,0F 是F 的样本值,

即表中的1622.118和997.312。

.Sig 的意义就是,原假设为真时,F 统计量取其样本实现值以及更极端

值的概率,是检验的真实显著性水平。

(3)假定:①2~(0,)n N I εσ;②原假设012:0H ββ==成立。 证

/ ()/(1)

SSR p

F SSR SSE SSE n p =

--指回归平方和,指残差平方和。

由数理统计知识,在假定①成立时,有

22/~(1)SSE n p σχ--

在假定①②成立时,有

22/~()SSR p σχ

且SSE 与SSR 是相互独立的,故

/~(,1)/(1)

SSR p

F F p n p SSE n p =

----

证毕。

2006年人大统计专业课初试题及答案

试题

一、(20分)某银行为缩短到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。为比较那种排列方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:

5.5

6.6 6.7 6.8

7.1 7.3 7.4 7.8 7.8 (1)画出第二种排队方式等待时间的茎叶图;

(2)比较两种排队方式等待时间的离散程度;

(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。

二、(20分)某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从某天生产的一批产品中按重量重复抽样方式随机抽取50包进行检查,测得每包重量(单位:克)如下:

已知食品包重量服从正态分布,要求:

(1)确定该种食品平均重量95%的置信区间;

(2)如果厂家认为每袋食品重量不低于100克,请写出检验的原假设和备择假设;

(3)利用P值进行检验和利用统计量进行检验有什么不同?

(z0.05=1.645,z0.025=1.96,t0.05=1.69,t0.025=2.03)

三、(20分)一家汽车制造商准备购进一批轮胎,考虑的因素主要有轮胎供应商牌和耐磨程度。为了对耐磨程度进行测试,分别在低速(40公里/小时),中速(80公里/小时),高速(120公里/小时)下进行测试。根据对5家供应商抽取的轮胎随机样本对轮胎在行驶1000公里后磨损程度进行试验,在显著水平α=0.01下得到的有关结果如下:

差异源SS df MS F P-value F crit

行列误差总计1.55

3.48

0.14

5.17

4

2

8

14

0.39

1.74

0.02

21.72

97.68

0.000

236

0.000

002

7.01

8.65

(1)不同的车速对磨损程度是否有显著影响?

(2)不同供应商的轮胎之间磨损程度是否显著差异?

(3)在上面的分析中,你都做了哪些假设?

四、(15分)说明什么条件下适合采取简单随机抽样?

五、(25分)说明回归模型的假设以及当这些假设不成立时的应对方法。

六、(20分)解释因子模型

X=AF+ε

的意义并写出模型的假设。

七、(15分)以下是从《中国统计年鉴-2005》摘引的资料,要求:

单位:元/人

(1)根据国民经济收入分配核算原理,说明居民人均收入低于人均GDP水平的原因;(2)计算各指标的动态变动率(不考虑价格变化),对其结果予以简要分析。

八、(15分)下表是中国全部国有及规模以上非国有供企业统计的主要指标,要求:(1)设计并计算反映企业经济效益的指标;

(2)对经济效益指标的动态变化状况做简要分析。

2006年人大统计学专业课初试题参考

解答

一、(1)图略。

(2)第二种排队方式平均等待时间

9221111

(5.5 6.67.8)7.07.299

i i x x x ===+++=<=∑L

其中1x 为第一种排队方式平均等待时间。 第二种排队方式的方差

922

2222

22

122111()[(5.57)(6.67)(7.87)]9191

0.51 1.97 3.88

i i s x x s ==-=-+-++---=<==∑L

其中21s 为第一种排队方式的方差。

可知第二种排队方式比第一种排队方式离散程度小。

(3)我会选择第二种排队方式。以为它的平均等待时间较短,等待时间也较稳定。

二、(1)样本量为50,可认为是大样本,由中心极限定理知

~(0,1)x N &

其中x 为样本均值,μ为总体均值,?σ为样本标准差。 由

0.025}0.95P z <=

得到95%的置信区间

0.0250.025??(//x z x z σ

σ-+ 代入样本数据计算得

5111

(9729931013410371054)1015050

i i i x M f ===?+?+?+?+?≈∑

? 1.67σ==

= 所求置信区间为

(101 1.96 1.67/ 1.96 1.67/-?+?

(100.54,101.46)

(2)由表可知样品中超过100g 的食品包数占大多数,厂家的观点似乎有一

定的可信度,故令检验假设为

01

:100:100H g

H g ≥??

的真实显著性水平,可利用P 值直接决策或将P 值与显著性水平α进行比较,不需要查表,具有可比性;统计量检验是先确定一个显著性水平

α从而获得一个否定域,进行决策的界限清晰但面临的风险是笼统的,确定临界值要查表,检验统计量一般与自由度有关因而可比性较差。

三、(1)这是无交互作用双因素方差分析问题,由行、列自由度可知行因素是供

应商,列因素是车速。

列的F 检验值97.68>F 临界值8.65,P 值0.000002<<显著性水平

α=0.01,故拒绝原假设,即认为车速对磨损程度有显著影响。

(2)同(1)之理,可知不同供应商的轮胎之间的磨损程度有显著差异。 (3)假设:①车速与供应商对轮胎的磨损程度无交互作用;

②车速与供应商不同水平组合形成的总体都是正态总体; ③上述总体方差都相同; ④各观测数据相互独立;

⑤行因素原假设015: ()i H μμμ==L 是总体均值,下同; ⑥列因素原假设0123:=H μμμ=。

四、简单随机抽样是从单元数为N 的总体中逐个不放回等概率抽取n 个单元或者

一次性随机抽出n 个单元,得到简单随机样本。它是最简单的概率抽样方法。适用于总体总量较小或总体方差与任意局部方差基本相当的场合。如果总体总量较大或总体各单元差异较大,就不宜单独使用,因为此时拥有完整的抽样框是困难的,抽样单元也比较分散,会增加调查费用,而且会使总体目标

量的估计产生较大误差。所以一般是与其他方法结合使用,比如分层抽样各层内科采用简单随机抽样,整群抽样抽取群、多阶段抽样各阶的抽样也都可采用它。

五、回归模型:y X βε=+。

假设:①解释变量为非随机变量;

②解释变量不存在多重共线性(即要求设计矩阵X 列满秩,样本量大于自变量个数);

③Guass-Markov 假定:2()0, ()n E Var I εεσ==; ④正态假定:2~(0,)n N I εσ。

假设不成立之应对:

假设①是回归分析基本要求,否则就不是回归分析;

假设②若不满足,就是多重共线性现象。有多种克服方法,比如剔除不重要自变量,增大样本量,对回归系数进行有偏估计(主成分法、岭回归法、偏最小二乘法等)等等。

假设③若不满足,随机误差ε有可能出现异方差现象或自相关现象。若是前者,可通过加权最小二乘法、Box-Cox 变换法、方差稳定性变换等方法来克服;若是后者,可通过修改模型、增加自变量、迭代法等方法来克服。

假设④若不满足,则无法进行参数区间估计和假设检验。可以重新观测数据或对数据进行正态性变换。

六、①意义:该模型表示原始变量被表示为公共因子和特殊因子的线性组合,展

现了原始变量与公共因子之间的相关关系,多数的原始变量(p 个)被综合少数的新变量(m 个,m p <)——公共因子,起到了降维的效果,简化了问题的复杂性又抓住了问题的主要矛盾。 ②假设:

a.X 是可观测的随机向量,()0E X =;

b.F 是不可观测的随机向量,()0E F =,() ()m D F I m p =<;

c. ()0E ε=,22

1()(,,)p D diag εσσ=K ;

d. (,)0Cov F ε=。

七、(1)若不考虑国外部门的影响,GDP 被分配于政府、企业、居民三个部门。

(可以对原始收入形成、初次分配、再分配过程进行一定的阐述) (2)略。

八、(1)参看高敏雪,李静萍.经济社会统计[M].北京:中国人民大学出版社, 2003

之P75-P76财务统计分析,P78经济效益考核体系。 (2)略。

2005年人大统计专业课初试题及答案

试题

一、(15分)一家网吧想了解上网人员的年龄分布状况,随机抽取25人,得到他们的年龄数据如下:

15 19 22 24 30 16 19 22 24 31 17 20 23 25 34 18 20 23 27 38 19 21 23 29 41

(1)画出该组数据的茎叶图; (2)画出该组数据的箱线图;

(3)根据茎叶图和箱线图说明上网者年龄分布的特征。

二、(15分)设有三个总体的均值分别为:μ1,μ2,μ3。要检验三个总体的均值是否相等(α=0.05),我们为什么不先将它们简单地配对,即H0:μ1=μ2,H0:μ1=μ3,H0:μ2=μ3,,然后分别进行检验,而是采用方差分析的方法?

三、(20分)某城市的餐饮管理协会估计,餐馆的月平均用水量为100吨,一家研究机构认为实际用水量要高于这个数字,该研究机构随机抽取了36家餐馆,记录了每个餐馆的月用水量(单位:吨),经过初步计算得到样本数据的部分描述统计量如下:

平均107

标准误差 4.99

样本标准差29.96

样本方差897.77

(1)确定餐馆月平均用水量95%的置信区间;

(2)餐馆实际月平均用水量在你所建立的置信区间里吗?请说明原因;

(3)如果要检验研究机构的看法是否正确,应该如何建立原假设和备择假设?请谈谈拒绝和不拒绝原假设的含义;

(4)在上面的估计和检验中,你使用了统计中的哪一个重要定理?请简要解释这一定理。

(z0.05=1.645,z0.025=1.96,t0.05=1.69,t0.025=2.03)

四、(20分)一家房地产评估公司想对某城市的房地产销售价格(y)与地产评估价值(x1)、房产评估价值(x2)和使用面积(x3)建立一个模型,以便对销售价格做合理预测。为此,收集了15栋住宅的房地产评估数据,经回归得到下面的有关结果(α=0.05):

方差分析

(1)写出销售价格对地产评估价值、房产评估价值、使用面积的多元线性回归方程,并解释各回归系数的意义;

(2)检验回归方程的线性关系是否显著; (3)检验各回归系是否显著;

(4)计算多重判定系数R2,并说明它的实际意义; (5)计算估计标准误差sy ,并说明它的实际意义;

(6)你认为使用面积(x3)在预测销售价格时是否有用?试说明理由。

五、(42分)假设一个已知简单总体的全部真实数据列于下表:

(1)绘出散点图;

(2)如果根据的数值将总体分成两个子总体,最好的分发是什么?

Y

(3)举例说明上表数据所反映的现象可能是什么?

Y Y

(4)计算出的总体均值和总体方差S2;

(5)四种基本抽样方式中最不适合上述总体情形的是哪一种?并说明理由;

(6)对其余三种基本抽样方式,假定n=2,分别列出每一种方式所对应的全部可能样本,并计算样本均值的数学期望和方差;

(7)计算每一种方式在此情形下的设计效应,并说明其意义。

六、(8分)说明抽样里的回归估计与一般回归分析方法的联系与区别。

七、(6分)请解释下面的说法:“生产核算的范围决定了收入分配和收入使用核算的范围”。

八、(9分)A、B两个地区的贫困线均为年收入1000元。A地区有11%的人年收入900元,9%的人年收入200元;B地区有1%的人年收入900元,9%的人年收入500元。

(1)根据上述数据,计算两地区的贫困者比重和贫困深度;(2分)

(2)请根据贫困者比重和贫困深度对两地区贫困状况进行简要的比较分析;(4分)(3)你觉得这两个指标能够准确反映两地区贫困状况的差异吗?如果不能,应当如何改进?(3分)

九、(15分)下面是某国某核算年度的国际收支平衡表(单位:亿元):

(1)在表中括号内填上适当的数字;(3分)

(2)请解释储备资产所对应的-125亿元的含义;(3分)

(3)请根据表中数字分析该国国内生产总值、国民总收入和国民可支配收入三者之间的关系;(6分)

(4)根据表中数字,对于该国当年国内的投融资状况你能得出何种结论?(3分)

支出;(15分)

(2)计算有关指标,比较说明城镇居民住户部门经济活动特征的变化。(15分)

统计学课后练习题答案人大第四版

第三章节:数据的图表展示 (1) 第四章节:数据的概括性度量 (15) 第六章节:统计量及其抽样分布 (26) 第七章节:参数估计....................................................... (28) 第八章节:假设检验........................................................ (38) 第九章节:列联分析........................................................ (41) 第十章节:方差分析........................................................ (43) 3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求: (1)指出上面的数据属于什么类型。 顺序数据 (2)用Excel制作一张频数分布表。 用数据分析——直方图制作: 接收频率 E16 D17 C32 B21 A14 (3)绘制一张条形图,反映评价等级的分布。 用数据分析——直方图制作: (4)绘制评价等级的帕累托图。 逆序排序后,制作累计频数分布表:

人大统计学考研真题

人大统计学考研历年真题精华版(03-09) https://www.doczj.com/doc/6d18730893.html,

https://www.doczj.com/doc/6d18730893.html, 2009年人大统计学专业课初试题 一、有两个正态总体,均值和方差未知,但已知方差相等。从第一个总体中抽取n=16的随机 样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。如何检验第一个总体的均值是否大于第二个总体的均值? 二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。 三、周期过程cos()t t X A ω?=+,其中频率ω和振幅A 都是常数,而相位?是一个在区间 [-π,π]上服从均匀分布的随机变量。问{t X }是否平稳?说明原因。 四、把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总体比例。如 采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随 机抽样有相同的估计量方差。(假设各层总体单位数量h N 都充分大,忽略“有限总体校正系数”) 五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第10题是一样 的。 六、若有线性回归模型01 (1,2,,)t t t y x t n ββε=++= ,其中()0t E ε=,222()t t E x εδ=, ()0 ()t s E t s εε=≠,则 (1)该模型是否违背古典线性回归模型的假定?请简要说明。 (2)如果对该模型进行估计,你会采用什么方法?请说明理由。 七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。第一 组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记

2003-2016年中国人民大学统计学805考研真题集

人大统计学考研历年真题精华版(03- 16)

2016年人大学统计学考研真题(完整版) 1,构造几何分布,标准化的样本空间,取值空间,事件空间。 2,X、Y为随机变量,给出条件分布,对于任意y,E(X|Y<=y) = E(X|Y>y),那么X与Y是否独立?写出详细论证过程。 3,给出联合分布,求条件分布,和条件概率。 4,X与Y是相互独立的随机变量,请给出一个充分条件,当X和Y各自服从什么分布时X-Y与X+Y相互独立,如果不存在请说明理由。写出详细论证过程。 5,求一个密度函数的方差的极大似然估计,并求它的Fisher信息量。6,异方差性和自相关是什么,检测方法,加权最小二乘法原理与实际步骤。 7,证明多元回归系数的估计量是无偏估计,是最小方差线性无偏估计。8,多元线性回归,因变量均值与每个自变量间为二次函数关系,根据相互独立的n个样本预测因变量值。

2013年人大805统计学真题 一、证明题:(20分)每题10分 1.袋子里有两种颜色的球红球a个白球b个 第一步从袋子里取出一个球观察其颜色然后丢掉 第二步从袋子里再取出一个球,若和上一次取出的球颜色不同,则放回,回到第一步;若和上一次取出的球颜色相同,则丢掉,重复第二步。 证明取出的最后一个球是红球的概率是1/2。 2.证明n维正态随机向量的各分量相互独立的充要条件是互不相关。 二、简述:(30分)每题10分 1.设昆虫在树叶上产卵数X服从参数为的泊松分布,而只有树叶上有卵时才能判断是否有昆虫。在又设观察到的虫卵数Y,P(Y=i)=P(X+i|X>0),求P(Y为偶数)和E(Y)。 2. 2n+1个独立同分布样本,分布函数是F(x) 求中位数x(n+1)的分布 3.设走进某商店的顾客数是均值为50的随机变量。又设这些顾客所花的钱数是相互独立、均值为100元的随机变量。再设任一顾客所花的钱数和进入该商店的总人数相互独立。试问该商店一天的平均营业额是多少? 三、已知Y1,……,Y n是相互独立的随机变量,且均服从。求的矩估计和最大似然估计,并求他们的均方误差。(25分) 四、X和Y是两个相关的随机变量: 求证var(Y) = E(var(Y|X)) + var(E(Y|X)) 并谈谈你对它的理解和应用。(25分) 五、谈谈你对双因素方差分析的理解和认识。(25分) 六、一元线性回归中有三个检验:线性相关检验,回归方程显著性检验以及X的回归系数的检验,谈谈你对它们的理解和它们之间的关系。(25分)

社会统计学复习题(有答案)复习课程

社会统计学复习题(有 答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产 品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。

人大统计学真题

人大统计学考研历年真题精华版 (03-09) —By fan (声明:这是由fan整理编辑,仅供参考。) https://www.doczj.com/doc/6d18730893.html,

https://www.doczj.com/doc/6d18730893.html, 2009年人大统计学专业课初试题 一、有两个正态总体,均值和方差未知,但已知方差相等。从第一个总体中抽取n=16的随机 样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。如何检验第一个总体的均值是否大于第二个总体的均值? 二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。 三、周期过程cos()t t X A ω?=+,其中频率ω和振幅A 都是常数,而相位?是一个在区间 [-π,π]上服从均匀分布的随机变量。问{t X }是否平稳?说明原因。 四、把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总体比例。如 采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随 机抽样有相同的估计量方差。(假设各层总体单位数量h N 都充分大,忽略“有限总体校正系数”) 五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第10题是一样 的。 六、若有线性回归模型01 (1,2, ,)t t t y x t n ββε=++=,其中()0t E ε=,222()t t E x εδ=, ()0 ()t s E t s εε=≠,则 (1)该模型是否违背古典线性回归模型的假定?请简要说明。 (2)如果对该模型进行估计,你会采用什么方法?请说明理由。 七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。第一 组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记

统计学_ 贾俊平 -中国人民大学出版社_第五版

3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求: (1)指出上面的数据属于什么类型。 顺序数据 (2)用Excel制作一张频数分布表。 用数据分析——直方图制作: 接收频率 E16 D17 C32 B21 A14 (3)绘制一张条形图,反映评价等级的分布。 用数据分析——直方图制作: (4)绘制评价等级的帕累托图。 逆序排序后,制作累计频数分布表: 接收频数频率(%)累计频率(%) C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A 14 14 100

5101520253035C D B A E 20406080100120 3.2 某行业管理局所属40个企业2002年的产品销售收入数据如下: 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求: (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。 1、确定组数: ()lg 40lg() 1.60206111 6.32lg(2)lg 20.30103 n K =+ =+=+=,取k=6 2、确定组距: 组距=( 最大值 - 最小值)÷ 组数=(152-87)÷6=10.83,取10 3 (2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。

社会统计学自考真题

浙江省2006年4月高等教育自学考试 社会统计学试题 课程代码:00278 一、填空题(本大题共8小题,每空1分,共10分) 请在每小题的空格中填上正确答案。错填、不填均无分。 1.统计资料整理阶段的基本方法是________。 2.调查人员从记录社会现象的各种载体中获取所需信息的调查方法,称为________。 3.若采用异距分组,________用来反映单位组距内分布的频数。 4.将所有变量值按大小顺序排列,中位数就是________的变量值。 5.已知各期的环比发展速度,应采用________法计算平均发展速度。 6.时间数列的两个基本构成要素是________和________。 7.推论统计的两个基本内容是________和________。 8.在数据的各种测量尺度中,既可进行加减运算,也可进行乘除运算的测量尺度是________。 二、单项选择题(本大题共30小题,每小题1分,共30分) 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。 1.一个总体单位( ) A.只能有一个标志 B.只能有一个指标 C.可以有多个标志 D.可以有多个指标 2.政治算术学派的代表人物是( ) A.康令 B.格朗特 C.凯特勒 D.恩格尔 3.要了解某企业员工的收入,则总体单位是( ) A.该企业的全部员工 B.该企业每个员工的收入水平 C.该企业的每一个员工 D.该企业全部员工的平均收入水平 4.下列属于品质标志的是( ) A.工人年龄 B.工人性别 C.工人体重 D.工人工资等级 5.实际工作中,最常用的分类抽样是( ) A.定额分配 B.等额分配 C.定比分配 D.异比分配 6.抽样调查应遵循的原则是( ) A.灵活性 B.准确性 C.可靠性 D.随机性

人民大学统计学在职题库统计综述答案

1中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学 考试科目:统计思想综述 课程代码:123201 考题卷号:1

除不能导致SSE显著减小为止。 逐步回归:结合向前选择和向后剔除,从没有自变量开始,不停向模型中增加自变量,每增加一个自变量就对所有现有的自变量进行考察,若某个自变量对模型的贡献变得不显著就剔除。如此反复, 直到增加变量不能导致SSE显著减少为止。 五、(20分)如果一个时间序列包含趋势、季节成分、随机波动, 适用的预测方法有哪些?对这些方法做检验说明。 可以使用Winter指数平滑模型、引入季节哑变量的多元回归和分解 法等进行预测。 (1)Winter指数平滑模型 包含三个平滑参数,即(取值均在0~1),以及平滑值、趋势项更新、季节项更新、未来第k期的预测值。 L为季节周期的长度,对于季度数据,L=4,对于月份数据,L=12;I为季节调节因子。平滑值消除季节变动,趋势项更新是对趋势值得修正,季节项更新是t期的季节调整因子, 是用于预测的模型。 使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,而且需要有四个以上的季节周期(4年以上的数据)。 使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,

而且需要有四个以上的季节周期(4年以上的数据)。 (2)引入季节哑变量的多元回归 对于以季度记录的数据,引入3个哑变量 ,其中=1(第1季度)或0(其他季度),以此类推,则季节性多元回归模型表示为: 其中b0是常数项,b1是趋势成分的系数,表示趋势给时间序列带来的影响,b2、b3、b4表示每一季度与参照的第1季度的平均差值。(3)分解预测 第1步,确定并分离季节成分。计算季节指数,然后将季节成分从 时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数以消除季节性。 第2步,建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测。 第3步,计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的预测值。

统计学-基于R第3版习题答案(第二章)

习题 2.1 (1)简单频数分布表: > load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_1.RData") > summary(exercise2_1) 行业性别满意度 电信业:38 男:58 不满意:75 航空业:19 女:62 满意 :45 金融业:26 旅游业:37 二维列联表: > mytable1<-table(exercise2_1$行业,exercise2_1$满意度) > addmargins(mytable1) # 增加边界和 不满意满意 Sum 电信业 25 13 38 航空业 12 7 19 金融业 11 15 26 旅游业 27 10 37 Sum 75 45 120 三维列联表: > mytable1<-ftable(exercise2_1, row.vars = c("性别","满意度"), col.var="行业");mytable1 行业电信业航空业金融业旅游业 性别满意度 男不满意 11 7 7 11 满意 6 3 7 6 女不满意 14 5 4 16 满意 7 4 8 4 (2) 条形图: > count1<-table(exercise2_1$行业) > count2<-table(exercise2_1$性别) > count3<-table(exercise2_1$满意度) > par(mfrow=c(1,3),mai=c(0.7,0.7,0.6,0.1),cex=0.7,cex.main=0.8) > barplot(count1,xlab="行业",ylab="频数") > barplot(count2,xlab="性别",ylab="频数") > barplot(count3,xlab="满意度",ylab="频数")

人大版_贾俊平_统计学_第三版_课后习题答案

第3章 概率与概率分布——练习题(全免) 1 .解:设A =女性,B =工程师,AB =女工程师,A+B =女性或工程师 (1)P(A)=4/12=1/3 (2)P(B)=4/12=1/3 (3)P(AB)=2/12=1/6 (4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2 4. 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。某射击选手第一发命中的可能性是80%,第二发命中的可能性为50%。求该选手两发都脱靶的概率。 解:设A =第1发命中。B =命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。 )|()()|()()(A B P A P A B P A P B P += =0.8×1+0.2×0.5=0.9 脱靶的概率=1-0.9=0.1 或(解法二):P (脱靶)=P (第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1 8.已知某地区男子寿命超过55岁的概率为84%,超过70岁以上的概率为63%。试求任一刚过55岁生日的男子将会活到70岁以上的概率为多少? 解: 设A =活到55岁,B =活到70岁。所求概率为: ()()0.63(|)0.75()()0.84 P AB P B P B A P A P A ==== 9.某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调查得知,采用新生产管理流程后产品优质率达95%的占四成,优质率维持在原来水平(即80%)的占六成。该企业利用新的生产管理流程进行一次试验,所生产5件产品全部达到优质。问该企业决策者会倾向于如何决策? 解:这是一个计算后验概率的问题。 设A =优质率达95%,A =优质率为80%,B =试验所生产的5件全部优质。 P(A)=0.4,P (A )=0.6,P (B|A )=0.955, P(B |A )=0.85,所求概率为: 6115.050612 .030951.0)|()()|()()|()()|(===A B P A P A B P A P A B P A P B A P + 决策者会倾向于采用新的生产管理流程。 10. 某公司从甲、乙、丙三个企业采购了同一种产品,采购数量分别占总采购量的25%、30%和45%。这三个企业产品的次品率分别为4%、5%、3%。如果从这些产品中随机抽出一件,试问:(1)抽出次品的概率是多少?(2)若发现抽出的产品是次品,问该产品来自丙厂的概率是多少? 解:令A 1、A 2、A 3分别代表从甲、乙、丙企业采购产品,B 表示次品。由题意得:P (A 1)=0.25,P (A 2)=0.30, P (A 3)=0.45;P (B |A 1)=0.04,P (B |A 2)=0.05,P (B |A 3)=0.03;因此,所求概率分别为:

统计学考试题及答案(中国人民大学第六版)

统计学 一、单选 1、从某高校随机抽出100名学生,调查他们每月的生活费支出,这研究的统计 量是 A 该校学生的总人数 B 该校学生的月月平均生活费支出 C 该校学生的生活费总支出 D 100名学生的月平均生活费支出 2、下列变量中,顺序变量是 A职工人数 B产量 C产品等级 D利润总额 3、将总体中所有单位按某种变量划分为若干层,再从各层中随机抽出一些单位 组成一个样本。这种抽样方式是 A 简单随机抽样 B 分层抽样 C 整群抽样 D 系统抽样 4、指出下面陈述中错误的是 A 抽样误差只存在于概率抽样中 B 非抽样误差只存在于非概率抽样中。 C概率抽样和非概率抽样都存在非抽样误差。 D在普查中存在非抽样误差。 5、展示广告费支出与商品销售量之间是否有某种数量关系,最适合的图形是 A柱形图 B饼图 C线图 D散点图 6、当样本量一定时,置信区间的宽度 A 随置信水平的增大而减小 B随置信水平的增大而增大 C与置信水平的大小无关 D与置信水平的平方根成反比 7、在检验一个正态总体方差时,使用的分布是 A z分布 B t分布 C X 分布 D F分布 8、指出下面陈述中的错误的是 A 抽样误差可以避免 B 抽样误差不可避免 C 非抽样误差可以避免 D 抽样误差可以控制 9、假设检验中,如果计算出的P值越小,说明检验的结果越 A 真实 B 不真实 C 显著 D 不真实 10、双因素方差分析涉及 自变量 A 一个分类型 B 一个数值型 C 两个分类型 D 两个数值型 二、填空题 1、当一组数据对称分布时,经验法则表明,大约有68%的数据分析在( 平均数±一个标准差 )的范围之内 2、对于一组具有单峰分布的数据而言,当数据的m m > 时,可判断数据是 (左偏)分布

人大统计学专业课初试题

2003年人大统计学专业课初试题 一、(15分)考虑两个国家之间按GDP进行经济比较。假定在既定汇率水平上,甲国GDP与乙 国GDP之间的比例为1:20。一场金融危机放生之后,如果甲国货币相对乙国货币贬值了50%,那么,在新的汇率水平上,两国GDP之间的比例将变化为1:40。请问:我们能否根据比较结果说甲国的经济发展水平下降了50%?这种比较所包含的统计方法问题是什么? 二、(15分)假定一时期国际收支平衡表上“储备资产变动”一项为正差额100亿元,据此,应 用国际收支平衡表原理判断当期国际收支的顺、逆差状况。 三、(30分)以下是某经济总体1985和2001两年份城镇居民住户部门的调查资料。要求: (1)列表计算各年城镇住户部门的原始收入、可支配收入和最终消费支出;(15分) (2)计算有关指标,比较说明城镇居民住户部门经济活动特征的变化。(15分) 四、(30分)一家种业开发股份公司研究出三个新的小麦品种:品种一、品种二、品种三。公司 为研究不同品种对产量的影响,选择了四个面积相同的地块进行试验,分别为:地块一、地

块二、地块三、地块四。经过试验获得产量数据,经分析得到下面的方差分析表(α=0.05): (1)将方差分析表中划线部分的数值补齐;(6) (2)分析小麦品种对产量的影响是否显著;(4) (3)分析不同地块对产量的影响是否显著;(4) (4)在产量变动的差异中,被品种所解释的百分比是多少?(3) (5)在产量变动的差异中,被地块所解释的百分比是多少?(3) (6)上面的分析包含哪些假定?(10) 五、(30分)统计资料表明,某地区职工年人均病假天数为5.1天。某公司从本公司职工中随机 抽取了46名职工作为样本,测得其平均病假天数为7天,样本标准差为2.5天。公司领导想知道本公司职工是否比其他单位的职工更容易生病。 (1)公司领导感兴趣的原假设和替换假设是什么?(3) (2)若令α=0.05,请用假设检验的方法帮助公司领导作出判断(写清检验步骤,并作示意图)。(10)(zα/2=1.96,zα=1.645,tα/2(45)=2.0141,tα(45)=1.6794)(3)在假设检验中,P值代表什么含义?(6) (4)在本例中,P=0.001说明了什么?(3) (5)用区间估计的方法找出该公司职工病假天数与其他职工病假天数显著不同的临界点。(8) 六、(30分)关于回归分析讨论下列问题: (1)画出回归建模步骤的流程图;(7) (2)简要描述各个步骤的内容;(8) (3)设 1 ?() X X X y β- '' =是多元回归方程参数的最小二乘估计,证明21 ?()() D X X βσ- ' =;(8) (4)由 21 ?()() D X X βσ- ' =,结合一元线性回归,你能看出对建模有指导意义的什么信息(7)

2011年人大考研统计学真题

2011年人大考研统计学真题 感觉很注重统计思想和方法的考察,题目很不错! 一、简答题(50分) 1.简述加权最小二乘估计的基本思想。 2.进行主成分分析需是否要知道数据的具体分布,请说明原因。 3.k-均值聚类对比分层聚类,优点在哪里。 4.题目给出了一个回归分析残差的散点图,有点线性趋势的那种,问据图分析可能出现了什么问题。 5.简述方差分析和回归分析的异同。 二、已知X与W相互独立(30分)。 1.X与W都服从正态分布,且W的期望为零,Y=a+bX+W,求X与Y的联合分布。 2.W服从正态分布,其期望为零,方差为?2(是表示平方),Y=b0+b1X+b2X2(是表示平方) +W,当X=x时求Y的条件期望。 三、CPI是衡量经济发展的重要指标,CPI的计算包括收集数据的四个阶段和确定权数的两个阶段,(他这里描述了这六个阶段的具体操作方法)。(30分) 1.结合调查知识和统计理论说明CPI所属类别(这个有待考证,希望大家来修正~)。 2.指出CPI的调查过程中误差的可能来源。 3.指出这个过程中涉及的调查总体、随机变量及待估总体的特征。 4.如果每个阶段的调查都严格按照1—a的置信水平,那么总的置信水平是多少。 四、假设女性和男性读书的语速都服从正态分布。研究者认为女性读书的语速比男性快,为证明这一点抽取了n1名女性和n2名男性,分别测得他们读书的语速,发现n1名女性的平均语速比n2名男性快,研究者由此得出女性读书的语速比男性快的结论。请问研究者的方法对吗?为什么?应该怎样验证?(20分) 五、题目给出了从2006年1月到2010年6月的商品销售额的时间序列图(有明显线性趋势的),现在想预测2010年下半年的商品销售额,请问用什么应该模型,写出模型的具体形式和模型的建立过程。(20分)

人大统计学真题07-09

2009年人大统计学专业课初试题 一、有两个正态总体,均值和方差未知,但已知方差相等。从第一个总体中抽取 n=16的随机样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。如何检验第一个总体的均值是否大于第二个总体的均值? 二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。 三、周期过程cos()t t X A ω?=+,其中频率ω和振幅A 都是常数,而相位?是一 个在区间[-π,π]上服从均匀分布的随机变量。问{t X }是否平稳?说明原因。 四、把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总 体比例。如采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随机抽样有相同的估计量方差。(假设各层总体单位数 量h N 都充分大,忽略“有限总体校正系数”) 五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第 10题是一样的。 六、若有线性回归模型01 (1,2, ,)t t t y x t n ββε=++=,其中()0t E ε=, 222()t t E x εδ=,()0 ()t s E t s εε=≠,则 (1)该模型是否违背古典线性回归模型的假定?请简要说明。 (2)如果对该模型进行估计,你会采用什么方法?请说明理由。 七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为 两组。第一组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只

喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记录。对于不吃药的白鼠,记录时间与同一对中另外一只白鼠的记录时间相同。假定40只白鼠的初始活动状态相同。请详细阐述你用何种方法分析安眠药的效果? 八、某大学从教师中抽取一个随机样本进行满意度调查。1分表示非常不满意, 100分表示非常满意。数据汇总如下表,欲分析教师职称和性别对满意度有无显著性影响,则 (1)你会选择什么分析方法?简述你的分析思路(可用公式说明,不需计算结果)。 (2)要采用该分析方法,数据必须满足哪些几本假定?请加以说明。

2014年中国人民大学应用统计初试复试真题及答案解析

2014年中国人民大学应用统计初试复试真题及答案 解析 1.地区对消费者购买汽车价格的影响,使用什么方法,简要说明。 2.时间序列的指数平滑预测法有哪些?分别适用于哪些场合? 3.(1)置信区间和假设检验之间的关系 (2)用文字表述无偏性 (3)无偏估计的样本均值和相应的置信区间的中点的关系。 4.方差分析 (1)计算F值 (2)根据表格做出统计决策 (3)方差分析的假设 5.多元回归分析(有五问,记不清了) (1)t值如何计算 (2)本例的模型拟合优度如何,如何度量 (3)R2和adjustedR2各是什么? (4)P值的含义 中国人民大学招收硕士研究生复试工作管理办法 复试工作是进一步考察考生专业能力和综合素质是否符合硕士研究生(以下简称硕士生)培养要求的重要环节,是选拔优秀人才的重要依据之一,在研究生人才选拔中具有重要作用。各学院应切实重视这项工作,积极探索和完善复试办法。为做好此项工作,特制定本办法。 一、复试原则 复试工作要自始至终贯彻科学选拔、公平公正、全面考察、客观评价、公开透明、严谨严密的原则,坚决抵制各种不正之风。 各学院对拟录取的硕士生必须进行复试,复试合格方可录取。

我校实行差额复试,差额复试比例在120%以上。生源充足的学院可进一步扩大差额复试比例。 二、复试工作管理 我校硕士生入学考试复试工作实行二级管理。学校研究生招生委员会负责制定我校硕士生复试规则和各学科的复试基本要求;各学院依据学校复试要求,负责确定本学院复试名单,制定本学院的复试办法并报学校研究生招生办公室(以下简称研招办)备案。 学院须成立硕士生复试工作领导小组,组长由主管研究生工作的院长担任,成员包括相关专业的学科带头人、学术骨干、硕士生导师。 学院硕士生复试工作领导小组负责组织对本学院拟接收的校内和校外推荐免试生以及统考硕士生的复试工作,具体职责如下职责: 1、根据教育部规定和我校硕士生复试工作管理办法,负责制定本学院具体的硕士生复试办法。 2、严格复试工作人员管理,遴选责任心强、学术水平高、品行端正的人员参与复试工作。 3、负责按专业成立硕士生复试小组,复试小组成员应是我校在职的硕士生导师,人数应不少于五人,组长一人,组员四人或四人以上,按小组另安排记录员一名。 4、负责组织召开所有复试教师工作会议,进行复试工作培训,使复试教师了解复试办法、明确复试要求和工作责任、掌握复试方法,保证质量。 5、负责对所有复试工作人员进行保密工作教育。复试工作人员须对试题、答案及评分标准、复试小组名单、考生分组情况、考生成绩、考生个人信息等保密。 6、负责组织本学院的专业综合课和外语笔试试题的命制、专业课和综合素质面试试题的命制、外语口语听力试题的命制、对同等学力加试科目试题的命制。 7、负责制定本学院的综合素质面试和外语面试的实施方案,认真制定面试评分标准、考核指标。 8、负责审核各专业复试小组的复试记录和复试结果,复试记录和复试结果须妥存备查。 9、负责对参加复试而未录取考生的必要解释和遗留问题的处理。

中国人民大学432-统计学考研参考书目、考研真题、复试分数线新

中国人民大学432-统计学考研参考书目、考研真题、复试分 数线 432-统计学课程介绍

中国人民大学考研复试分数线 学术学位: 学科门类政治、外语、专一(数学)、专二、总分 01哲学50509090330↓ 02经济学55559090360 03法学50↓50↓9090350 04教育学5050180330↓ 05文学55559090350 06历史学5050180335↑ 07理学45459090300 08工学45459090300 09医学5050180↑300 12管理学50↓50↓9090350↓ 13艺术学45459090330 专业学位: 专业学位政治、外语、专一、专二、总分备注

02经济类专业学位 (金融、应用统计、税务、国际商 务、保险、资产评估) 50509090340 035101法律(非法学)50509090340↓ 035102法律(法学)50509090330 0352社会工作50509090330 0453汉语国际教育50509090315↓ 0552新闻与传播55559090355↓ 0651文物与博物馆4545180↑320 0852软件工程45458080300 0951农村与区域发展50509090300 1251工商管理 100↓50170↓未通过提前面试 同教育部A类分数线通过提前面试1252公共管理115↑50180↑ 1253会计 12060225↑全日制 120↑50205↑非全日制 1255图书情报12055↓195↓ 1351艺术 40↓40↓9090325↑ 注: 1、各学院可根据生源情况上调复试基本要求。差额复试比例120%以上。 2、不符合教育部复试基本要求者不予录取。 3、向外校调剂工作待教育部公布全国硕士研究生复试分数线后进行。 4、“援藏计划”、“少数民族高层次骨干人才计划”、“单独考试”考生复试基本要求根据教育部相 关政策另行确定,考生可向相关院系或研招办咨询。 5、参加“大学生志愿服务西部计划”、“三支一扶计划”(支农、支教、支医和扶贫)、选聘高校毕业 生到村任职”和“农村义务教育阶段学校教师特设岗位计划”等项目服务期满的考生和普通高等学校应届毕业生应征入伍服务义务兵役退役后的考生,三年内参加全国硕士研究生招生考试,享受初试总分加分并在同等条件下优先录取的政策。请符合政策的考生于3月12日前直接联系我校研招办并出具相关证明材料,我校根据教育部最新文件及名单审核考生资格。

统计学第六版 人大版 复习笔记

一、统计学原理期末考试试题类型及结构 1、单项选择题:30分。考核对基本概念的理解和计算方法的应用。 2、判断题:10分。考核对基本理论、基本概念的记忆和理解。 3、简答题:30分。考核对基本概念、基本理论、基本方法的理解和掌握情况。 4、计算题:30分。考核对基本计算方法的理解、掌握程度及综合应用能力。 二、期末考试形式及答题时限 期末考试形式为闭卷笔试;答题时限为90分钟;可以携带计算器。 三、各章复习内容 期末复习资料:教材、学习指导书习题、作业 第一章统计总论 1.理解统计学的含义 答:收集、处理、分析、解释数据并从数据中得出结论的科学(收集数据:取得数据;处理数据:整理与图表展示;分析数据:利用统计方法分析数据;数据解释:结果的说明;得到结论:从数据分析中得出客观结论) 第二章数据的搜集 1.数据的来源 答:(1)数据的间接来源:系统外部的数据(统计部门和政府部门公布的有关资料,如各类统计年鉴、各类经济信息中心、信息咨询机构、专业调查机构等提供的数据、各类专业期刊、报纸、书籍所提供的资料、各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料、从互联网或图书馆查阅到的相关资料)系统内部的数据(业务资料,如与业务经营活动有关的各种单据,记录、经营活动过程中的各种统计报表、各种财务,会计核算和分析资料等)(2)数据的直接来源(原始数据)调查数据实验数据 2.收集数据的基本方法:调查的数据(自填式、面访式、电话式);实验的数据 3.抽样误差:由于抽样的随机性所带来的误差;所有样本可能的结果与总体真值之间的平均性差异;影响抽样误差的大小的因素(样本量的大小、总体的变异性) 重点:数据来源、数据搜集方法、抽样误差 第三章数据的图表展示 重点:熟悉条形图、直方图、饼图、环形图、箱线图、线图等

中国人民大学805统计学历年真题

中国人民大学805统计学历年真题(2013-2000) 2013年人大805统计学真题 一、证明题:(20分)每题10分 1.袋子里有两种颜色的球红球a个白球b个 第一步从袋子里取出一个球观察其颜色然后丢掉 第二步从袋子里再取出一个球,若和上一次取出的球颜色不同,则放回,回到第一步;若和上一次取出的球颜色相同,则丢掉,重复第二步。 证明取出的最后一个球是红球的概率是1/2。 2.证明n维正态随机向量的各分量相互独立的充要条件是互不相关。 二、简述:(30分)每题10分 的泊松分布, 昆虫。在又设观察到的虫卵数Y,P(Y=i)=P(X+i|X>0),求P(Y为偶数)和E(Y)。 2. 2n+1个独立同分布样本,分布函数是F(x) 求中位数x(n+1)的分布 3.设走进某商店的顾客数是均值为50的随机变量。又设这些顾客所花的钱数是相互独立、均值为100元的随机变量。再设任一顾客所花的钱数和进入该商店的总人数相互独立。试问该商店一天的平均营业额是多少? 的矩估计和最 四、X和Y是两个相关的随机变量: 求证var(Y) = E(var(Y|X)) + var(E(Y|X)) 并谈谈你对它的理解和应用。(25分) 五、谈谈你对双因素方差分析的理解和认识。(25分) 六、一元线性回归中有三个检验:线性相关检验,回归方程显著性检验以及X的回归系数的检验,谈谈你对它们的理解和它们之间的关系。(25分)

2012年人大805统计学真题 一、为研究不同地区与购买汽车的消费价格之间的相关关系,调查得到如下的数据: 对于以上的数据可以用什么统计图表分析,并说明这些图表的用途。 对于以上的数据可以用什么统计方法分析,并说明这些方法的用途。 二、为检验一厂家生产的产品,提出如下的假设检验:H0:u=500,H1: u=! 500 现在抽取了部分的样品进行检验。若检验结果拒绝H0,则意味着什么?若检验结果没有拒绝H0,则又意味着什么?能否恰好取到一组样本证明H0:u=500成立?为什么?若检验的P=0.03,则意味着什么?P值的真实含义是什么? 三、现研究某地区平均GDP与居民消费总额、固定投资、进出口额、年末总人口之间的关系,进行了多元回归分析。题目分别给出了三个表: 表1:整体拟合程度:R,R方,调整的可绝系数。 表2:整体线性关系的F检验 表3:系数的显著性t检验,方差扩大因子VIF(存在多重共线性) 请对上述回归模型进行综合评价。 四、题目中给出了从99年1月到2004年3月某地区各月的销售额的一个时间序列图,该序列图中包含哪些成分?可以用什么方法来分析此模型,并简要叙述可种方法的基本原理。 五、说明距离判别法与贝叶斯判别法的联系。 六、说明大数定律与中心极限定理的内容和应用? 七、在敏感性问题的调查中,为了保证回答者尽量真实回答,采用如下方法:以比例p的人回答敏感性问题 (1):你具有特征A吗?回答结果为是或不是。另外1-p的比例人回答问题 (2):比如你的手机号尾数是奇数吗?回答是的比例为t。 假设总体具有特征A的人数比例为q,样本中回答是的比例为R。 1.试提出q的一个估计。 2.证明该估计是q的一个无偏估计。

人大统计学作业答案

79、【104308】(单项选择题)设连续型随机变量X 的分布函数是)(X F ,密度函数是)(x p , 则对于任意实数α,有= =)(αX P ()。 A.)(X F B.)(x p C.0 D.以上都不对 【答案】C 80、【150761】(单项选择题)设6.0,1,4===XY DY DX ρ,则)23(Y X D -为()。 A.40 B.9.10 C.25.6 D.17.6 【答案】B 81、【104317】(简答题)正态分布概率密度函数的图形有何特点? 【答案】 正态分布概率密度函数()x f 的图形有以下特点: ①()0≥x f ,即整个概率密度曲线都在x 轴上方。 ②曲线()x f 关于μ=x 对称,并在μ=x 处达到最大值 ()σπμ21 = f 。 ③曲线的随缓程度由σ决定,σ越大,曲线越平缓;σ越小,曲线越陡峭。 ④当x 趋于无穷时,曲线以x 轴为其渐近线。 由以上特性可见,正态分布的概率密度曲线()x f 是一条对称的钟形曲线。 82、【104318】(简答题)一事件A 的概率0)(=A P ,能否肯定事件A 是不可能事件?为什 么? 【答案】不能肯定A 是不可能事件。 不可能事件是指在同一组条件下每次试验都一定不出现的事件。而0)(=A P ,并不能肯定A 就是不可能事件。例如在闭区间[]1,0上随意投掷一点,显然该区间上任一点都可能被碰上,但每一点发生的概率都为0,因此概率为0的事件不一定都是不可能事件。 83、【104319】(简答题)常见的随机变量分为哪两种类型?各自都包含哪些常见的分布? 【答案】常见的随机变量分为离散型随机变量和连续型随机变量。 离散型随机变量包括均匀分布、0-1分布、二项分布、泊松分布。 连续型随机变量包括均匀分布、正态分布。正态分布衍生卡方分布、t 分布、F 分布。 84、【104313】(填空题)甲、乙、丙三人参加同一项考试,及格的概率分别为%70,%60, %90,则三人均及格的概率为_____;三个人都不及格的概率为_____;至少有一个人及格的概 率为_____;至少有一个人不及格的概率为_____。 【答案】0.378;0.012;0.988;0.622,(37.8%)( 1.2%)(98.8%)( 62.2%) 85、【104314】(填空题)正态分布的概率密度函数曲线为一对称钟形曲线,曲线的中心 由_____决定,曲线的陡峭程度由_____决定。

相关主题
文本预览
相关文档 最新文档