2016级研究生实用多因素统计分析试卷

格式：pdf
大小：171.91 KB
文档页数：4

下载文档原格式

/ 4

统计学研究生数据分析单选题100道及答案解析

统计学研究生数据分析单选题100道及答案解析1. 数据的收集、整理、分析和解释的过程被称为（）A. 统计学B. 数据分析C. 数据挖掘D. 机器学习答案：A解析：统计学是研究数据的收集、整理、分析和解释的一门学科。

2. 以下哪种数据收集方法属于观察法？（）A. 问卷调查B. 实验C. 直接观察D. 电话访谈答案：C解析：直接观察是观察法的一种，通过直接观察对象来收集数据。

3. 对于定类数据，最适合的描述统计量是（）A. 均值B. 中位数C. 众数D. 标准差答案：C解析：众数适用于定类数据，用来表示出现频率最高的类别。

4. 一组数据中最大值与最小值之差称为（）A. 极差B. 方差C. 标准差D. 平均差答案：A解析：极差是最大值减去最小值。

5. 若一组数据呈右偏分布，则其众数、中位数和均值的关系为（）A. 众数< 中位数< 均值B. 众数= 中位数= 均值C. 众数> 中位数> 均值D. 中位数< 众数< 均值答案：A解析：右偏分布时，均值大于中位数，中位数大于众数。

6. 抽样误差是指（）A. 调查中所产生的登记性误差B. 调查中所产生的系统性误差C. 随机抽样而产生的代表性误差D. 由于违反随机原则而产生的误差答案：C解析：抽样误差是由于随机抽样的随机性导致的样本统计量与总体参数之间的差异。

7. 简单随机抽样中，抽样平均误差与样本容量的关系是（）A. 样本容量越大，抽样平均误差越大B. 样本容量越大，抽样平均误差越小C. 两者无关D. 不确定答案：B解析：样本容量越大，抽样平均误差越小，抽样精度越高。

8. 在其他条件不变的情况下，置信水平越高，置信区间（）A. 越窄B. 越宽C. 不变D. 不确定答案：B解析：置信水平越高，需要包含更多的可能性，所以置信区间越宽。

9. 假设检验中，第一类错误是指（）A. 原假设为真时拒绝原假设B. 原假设为假时接受原假设C. 原假设为真时接受原假设D. 原假设为假时拒绝原假设答案：A解析：第一类错误又称拒真错误，即原假设为真时拒绝原假设。

青岛大学2016年硕士研究生入学考试初试试题考试科目：432统计学

青岛大学2016年硕士研究生入学考试试题科目代码：432 科目名称：统计学（共 4 页）请考生写明题号，将答案全部答在答题纸上，答在试卷上无效(本试卷适用于报考经济学院的考生)一、名词解释（每个3分，共15分）1、偏度；2、集中趋势；3、品质型数据；4 、第一类错误；5、假设检验二、填空题（每题3分，共15分）1、测度数据离散趋势分布特征的统计量主要有、、。

2、设总体X服从标准正态分布N(0,1),是来自该总体的样本，令，且服从分布，则c=3、100台机器彼此独立地工作，每台机床的实际工作时间占全部工作时间的60%，则任一时刻有60台以上车床在工作的概率是。

4、某厂有A、B、C、D四个车间生产同种产品，且产量分别占全厂的30%，25%，25%和20%。

这四个车间产品的次品率分别为0.10，0.05，0.15和0.2，从该厂任意抽取一件产品，发现为次品的概率是。

5、在单边假设检验中，p值显著性水平拒绝原假设。

三、选择题（每题3分，共15分）1、一组数据的箱线图不可以给出这组数据的（）A、极小值B、均值C、中位数D、3/4分位数2、如果两个变量之间的关系近似的表现为一条直线，则称两个变量之间为（）A、正线性相关关系B、负线性相关关系C、线性相关关系D、非线性相关关系3、在出租车等候去等候出租车的时间是左偏的，均值为10分钟，标准差为5分钟，如果从等候区随机抽取100名顾客并记录他们等待出租车的时间，则该样本均值的分布服从（）A、正态分布，均值为10分钟，标准差为5分钟B、正态分布，均值为10分钟，标准差为0.5分钟C、左偏分布，均值为10分钟，标准差为5分钟D、左偏分布，均值为10分钟，标准差为0.5分钟4、研究表明，司机因为驾车分心而发生事故的比例超过30%，用来检验这一结论的原假设和备择假设为（）A、B、C、D、5、从总体中抽取一个元素后不再放回总体，然后再从其余元素中抽取第二个元素，直至抽取n个元素为止，这样的抽样方法称为（）A、重复抽样B、不重复抽样C、分层抽样D、整群抽样四、简答题（每题10分，共30分）1、简述中心极限定理的基本条件和结果。

中国矿业大学2016级硕士研究生课程考试试卷

中国矿业大学硕士16级统考试卷数理统计时间：120分钟 2016-12-4一、简答题（每题5分，共30分）：1. 设n X X X ,,,21 是),(~2σμN X 的样本，（μ已知），记∑=-=n i i X n S 1221)(1μ， ∑=--=n i i X X n S 1222)(11。

(1) 证明2221,S S 都是2σ的无偏估计量；（2）判断2221,S S 中哪一个更有效。

2. 设129,,,X X X 是来自正态总体2(,)N μσ的样本，记1161()6Y X X =++ ，27891()3Y X X X =++，922271()2i i S X Y ==-∑，求12)Y Y Z S-=的分布？3. 设()2~0,,X N σ12,,,n X X X 为X 的样本，求统计量3212413ii nii X n X==⎛⎫-⎪⎝⎭∑∑的分布。

4. 设X 服从泊松分布~(,),01,2,!x e X p x x x λλλ-== ，,12,,,n X X X 为X 的样本, 样本均值X 是否是参数λ的优效估计量。

5. 设(,)~(1,2;4,9;0.5)X Y N ，求(2,2)X Y X Y +-的协方差矩阵。

6. 试验设计的目的什么？使用正交表安排试验时，各个因素的各种水平搭配是均衡的，这种均衡性在正交表中有何体现？正交表的记号：()k n L m 中各字母分别表示什么？二、（12分）.设n X X X ,,,21 是总体X 的样本, X 的概率密度为⎪⎩⎪⎨⎧<≥=--.,0,,1),;(μμθμθθμx x ex f x 其中0>θ.求θ和μ的最大似然估计量。

三（18分）、假设两个城市的居民户的年消费额分别为Y X ,,且服从正态分布，),(~211σμN X , ),(~222σμN Y ,分别对这两个城市的21个居民户和16个居民户的年消费额进行抽样调查, 测得其平均年消费额分别为26000x =元和27000y =元. 样本标准差分别为1810s =元和21050s =元.（1）. 试比较这两个城市居民户的平均消费额有无显著差异. （取显著性水平10.0=α）（2）. 求21μμ－的置信区间（取显著性水平10.0=α）四（10分）．将一颗骰子连续抛掷1000次，得到如下数据在显著性水平下，检验这颗骰子的6个面是否均匀。

2016年山东大学硕士研究生入学考试《统计学》真题及详解

2016年山东大学硕士研究生入学考试《统计学》真题及详解2016年山东大学硕士研究生入学考试《统计学》真题(总分：150.00，做题时间：180分钟)一、单项选择题(总题数：30，分数：60.00)1.下面哪种调查方式的样本不是随机选取的（）。

（分数：2.00）A.分层抽样B.系统抽样C.整群抽样D.判断抽样√【解析】分层抽样、系统抽样、整群抽样均属于概率抽样，也称随机抽样，是指遵循随机原则进行的抽样，总体中每个单位都有一定的机会被选入样本。

而判断抽样属于非概率抽样，是指研究人员根据经验、判断和对研究对象的了解，有目的地选择一些单位作为样本，而不是随机抽取的。

2.为了解小区居民对物业服务的意见和看法，管理人员随机抽取了50户居民，上门通过问卷进行调查。

这种数据收集方法是（）。

（分数：2.00）A.面访式问卷调查√B.实验调查C.观察式调查D.自填式问卷调查【解析】面访式问卷调查是指现场调查中调查员与被调查者面对面，调查员提问、被调查者回答的调查方式。

3.为了研究多个不同变量在不同样本间的相似性，适合采用的图形是（）。

（分数：2.00）A.环形图B.茎叶图C.雷达图√D.箱线图【解析】C项，雷达图是显示多个变量的常用图示方法，它也可以研究多个样本之间的相似程度。

A 项，环形图可以显示多个样本各部分所占的相应比例，从而可对多个样本的构成进行比较研究；B项，茎叶图用于反映原始数据分布；D项，箱线图主要用于反映数据分布的特征，还可以对多组数据的分布特征进行比较。

4.经验法则表明，当一组数据对称分布时，在平均数加减1个标准差的范围之内大约有（）。

（分数：2.00）A.68%的数据√B.95%的数据C.99%的数据D.100%的数据【解析】当一组数据对称分布时，经验法则表明：①约有68%的数据落在平均数±1个标准差的范围之内；②约有95%的数据落在平均数±2个标准差的范围之内；③约有99%的数据落在平均数±3个标准差的范围之内。

2016年全国硕士研究生入学统一考试心理学专业基础综合真题

2016年全国硕士研究生入学统一考试心理学专业基础综合真题(总分：300.00，做题时间：180分钟)一、单项选择题(总题数：61，分数：130.00)1.张明在实验室考察不同颜色对人的视敏度的影响，李亮在日常的教学环境条件下考察不同教学方法对学生学习成绩的影响。

两人研究方法的不同在于（）。

（分数：2.00）A.有无自变量B.有无因变量C.控制额外变量的程度√D.有无研究假设解析：本题旨在考查考生对心理学实验类型的掌握，根据实验过程中被试分配和额外变量的控制情况，将实验分为非实验设计、准试验设计和真实验设计，张明是在实验室条件下进行的实验，整个实验过程严格额外变量，而李亮是在日常的教学环境条件下进行的实验，结果会受到额外变量的影响，因此两人的研究方法的不同在于控制额外变量的程度。

2.1967 年《认知心理学》一书的出版，标志着现代认知心理学的诞生。

该书的作者是（）。

（分数：2.00）A.斯腾伯格（R. Sternbeng）B.布鲁纳（J. Bruner）C.奈塞尔（U. Neisser）√D.西蒙（H. simon）解析：认知心理学起始于本世纪 50 年代末， 1967 年美国心理学家奈塞尔《认知心理学》一书的出版，标志着认知心理学已成为一个独立的流派立足于心理学界了。

3.病人因颞叶受伤而导致受损的功能主要是（）。

（分数：2.00）A.听觉√B.视觉C.嗅觉D.味觉解析：本题为本部分高频考点颞叶位于外侧裂下方，负责处理听觉信息，也与记忆和情感有关。

4.在裂脑人实验中，假如给被试左视野呈现“苹果” 图片，右视野呈现单词“杯子” ，他能顺利完成的任务是（）。

（分数：2.00）A.用左手选出屏幕后摆放的苹果√B.用右手选出屏幕后摆放的苹果C.用左手选出屏幕后摆放的杯子D.口头报告看到了“苹果”解析：每个半球只对来自身体对侧的刺激做出反应，并调节对侧身体的运动。

题目中左视野呈现“苹果” 图片，投射在脑的右侧，被试用左手很容易从屏幕后选出苹果。

2016年考研专业课考试《心理学专业基础综合心理测量与统计》真题及详解

2016年考研专业课考试《心理学专业基础综合心理测量与统计》真题(总分：100.00，做题时间：90分钟)一、单项选择题(总题数：21，分数：63.00)1.信度系数的定义公式是______[解析]信度即测量结果的一致性和稳定性程度，等于一组测量分数中真分数的变异与总变异之比。

故本题选A。

2.某个测验由于条件限制，只得到了一次施测数据。

此时计算该测验的信度应该使用______（分数：3.00）A.多质多法B.复本法C.分半法√D.重测法[解析]只有一次数据可以用分半法。

A：BD均需要多次数据。

故本题选C。

3.某研究中共有3组被试，每组12人，进行方差分析时，误差自由度为______（分数：3.00）A.2B.11C.33√D.35[解析]总自由度为12×3-1=35，自变量自由度为3-1=2，故误差自由度为35-2=33。

故本题选C。

4.关于陆军甲种测验和陆军乙种测验的表述，错误的是______（分数：3.00）A.均可用于大规模的团体施测B.可用于官兵选拔和职位配置C.可用于企事业领域人员选拔D.前者为非文字测验，后者为文字测验√[解析]陆军甲种测验和陆军乙种测验均属于团体测验，可用于团体施测，最初是用来选拔官兵并剔除不合格对象的，后来也可用于企事业领域人员选拔；陆军甲种测验是文字型测验，乙种测验属于非文字测验，用于非英语母语和文盲者。

故本题选D。

5.根据因素分析的结果，韦克斯勒儿童智力测验(第四版)测查的能力因素主要包括______（分数：3.00）A.言语理解、知觉组织、工作记忆、加工速度√B.分析能力、人际关系、图形分析、类比推理C.语词关系、认知风格、工作记忆、空间推理D.词汇能力、知觉组织、创造能力、抽象推理[解析]韦氏智力量表(第四版)结构变为"四指数"结构，即言语理解指数、知觉推理指数、工作记忆指数和加工速度指数，这也是继承了第三版韦氏智力测验经过因素分析得出的结果，即言语理解因素、知觉组织因素、集中注意力或克服分心因素以及加工速度因素。

(完整版)研究生医学统计试题

研究生《卫生统计学》课程理论考试卷（A卷）（试卷总分：55分，考试时间：45分钟，试题内容9页，空白纸3页）姓名：学号：电脑号：　试题号：一、单选题: 每题1分，55题，共计55分1. 描述一组偏态分布资料的集中趋势时，最适宜选择的指标是A.几何均数B.算术均数C.中位数D.众数E.标准误2. 测量体重、转氨酶等指标所得的资料叫做：（）A、计数资料B、计量资料C、等级资料D、间断性资料E、分类资料3.统计中所说的总体是指：( )A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体4.抽样的目的是：( )A、研究样本统计量B、研究总体参数C、研究典型案例D、研究误差E、样本推断总体参数5. 下面哪个不是样本的指标（）A、 xB 、pC、rD、E、s6. 均数与标准差适用于A、正偏态分布资料B、负偏态分布资料C、正态分布资料D、频数分布类型不明的资料E．不对称分布的资料7．两样本均数的t检验中，检验假设（H0）是A μ1≠μ2B μ1=μ2C X1≠X2D X1=X2E X1=X28. 作单侧检验的前提是：A、已知新药优于旧药B、已知新药差于旧药C、不知新药好还是旧药好D、已知新药不比旧药差E、已知新旧药差不多好9. 在假设检验时，本应是双侧检验的问题而误用了单侧检验水准，当拒绝H0时，则（）A. 增大了第一类错误B. 减小了第一类错误C. 增大了第二类错误D. 减小了第二类错误E. 以上都不正确10. 两样本均数比较的t检验，差别有统计学意义时，P越小，说明（）A．两样本均数差别越大B．两总体差别越大C．越有理由认为两总体均数不同D．越有理由认为两样本均数不同E．越有理由认为两总体均数相同11. 两个样本含量分别为20和30的样本作t检验, 自由度为: （）A.50 B.49C.25 D.24 E.4812．某医院某日门诊病人数1000人，其中内科病人400人，求得40%，这40%是( )A率B构成比C相对比D绝对数E标化率13．卡方检验中自由度的计算公式是( )A行数×列数 B n-1 C N-k D（行数-1）（列数-1）E行数×列数-1 14．反映某一事件发生强度的指标应选用( )A 构成比B 相对比C 绝对数D 率E变异系数15．欲比较两地死亡率，计算标准化率可以（）。

考研专业课考试心理学专业基础综合心理测量与统计真题2016年

考研专业课考试心理学专业基础综合心理测量与统计真题2016年(总分：100.00，做题时间：90分钟)一、单项选择题(总题数：21，分数：63.00)1.信度系数的定义公式是______A．B．C．D．（分数：3.00）A. √B.C.D.解析：[解析] 信度即测量结果的一致性和稳定性程度，等于一组测量分数中真分数的变异与总变异之比。

故本题选A。

2.某个测验由于条件限制，只得到了一次施测数据。

此时计算该测验的信度应该使用______（分数：3.00）A.多质多法B.复本法C.分半法√D.重测法解析：[解析] 只有一次数据可以用分半法。

A：BD均需要多次数据。

故本题选C。

3.某研究中共有3组被试，每组12人，进行方差分析时，误差自由度为______（分数：3.00）A.2B.11C.33 √D.35解析：[解析] 总自由度为12×3-1=35，自变量自由度为3-1=2，故误差自由度为35-2=33。

故本题选C。

4.关于陆军甲种测验和陆军乙种测验的表述，错误的是______（分数：3.00）A.均可用于大规模的团体施测B.可用于官兵选拔和职位配置C.可用于企事业领域人员选拔D.前者为非文字测验，后者为文字测验√解析：[解析] 陆军甲种测验和陆军乙种测验均属于团体测验，可用于团体施测，最初是用来选拔官兵并剔除不合格对象的，后来也可用于企事业领域人员选拔；陆军甲种测验是文字型测验，乙种测验属于非文字测验，用于非英语母语和文盲者。

故本题选D。

5.根据因素分析的结果，韦克斯勒儿童智力测验(第四版)测查的能力因素主要包括______（分数：3.00）A.言语理解、知觉组织、工作记忆、加工速度√B.分析能力、人际关系、图形分析、类比推理C.语词关系、认知风格、工作记忆、空间推理D.词汇能力、知觉组织、创造能力、抽象推理解析：[解析] 韦氏智力量表(第四版)结构变为“四指数”结构，即言语理解指数、知觉推理指数、工作记忆指数和加工速度指数，这也是继承了第三版韦氏智力测验经过因素分析得出的结果，即言语理解因素、知觉组织因素、集中注意力或克服分心因素以及加工速度因素。

研究生多元统计分析试题(A卷)(答案)

内蒙古农业大学2009—2010学年第一学期一、判断题（每小题2分，共10分） 1.多元正态分布的任何边缘分布为正态分布；（对） 2.正态总体),(∑μp N 的样本均值X 是μ的无偏，有效，一致估计；（对） 3.Wilks 统计量可以化成2T 统计量但是化不成F 统计量；（错） 4.Fisher 判别法对总体的分布有特定的要求；（错）5.. （对）二、填空题（每小题3分，共15分）1. 设X 和S 分别是正态总体),(∑μp N 的样本均值和离差阵，则X 和S 的关系为相互独立；2.若X ～),0(∑p N ，S ～),(∑n W p 且X 与S 相互独立，则X S X pp n 1'1-+-～(,1)F p n p -+；3.若1A ～),(1∑n W p ,p n ≥1，2A ～),(2∑n W p ，∑>0,且1A 和2A 相互独立，则211A A A +～12(,,)p n n ∧；4.设资料阵X=()pn ijx ⨯，则样品()i X 与()j X 的切比雪夫距离)(∞ij d =1max ||i j px x ααα≤≤-；5．设S 是正态总体),(∑μp N 的离差阵，则∑的相合估计为11()1s s n n - . 三、选择题（每小题3分，共15分）1.设S 是正态总体),(∑μp N 的离差阵，样本容量为n ，则S 为正定矩阵的充要．．条件．．是（A ） A .n >p B. n <p C. n ≥p D. n ≤p2.下列不．是．系统聚类法是（） A. 对应分析法 B.重心法 C. 可变法 D. 类平均法3. 以下关于聚类分析的说法不正确．．．的是(A ) A.聚类分析与群分析是不同的统计分析方法 B. 聚类分析属于多元统计分析方法 C. 系统聚类法是一种常用的聚类分析法 D. 模糊聚类法是一种常用的聚类分析法4. 判别分析是种常用的商情分析工具，下列关于判别分析的说法正确的是( D ) A. 判别分析是属于一元统计方法 B. 判别函数只有线性判别一种类型C. 无论判别标准是否相同，所得到的结论是相同的D. 判别分析是判别样本所属类型的统计方法5．“用一条直线代表散点图上的分布趋势，使各点与该纵向距离的平方和最小”是( A )方法B. 判别分析C. 聚类分析D. 相关分析四、计算题（每小题10分，共 30分）1.设抽取五个样品，每个样品只测一个指标，它们是2，3，4.5，8，10，试用最短距离法对五个样品进行分类. (请用绝对距离)解：设样品为： x1,x2,x3,x4,x5 则他们的距离（绝对值距离）为(0)D =12345123450102.5 1.5065 3.5087 5.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪ ⎪⎪ ⎪ ⎪⎝⎭ (1)D =1234512345,,01.505 3.507 5.52x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪⎪ ⎪ ⎪ ⎪ ⎪⎝⎭(2)D =1234512345,,,,03.505.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪⎝⎭ (3)D =1234512345,,,,,0, 3.50x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪ ⎪⎝⎭2．设三元总体X 的协方差阵为200050009⎛⎫ ⎪∑= ⎪ ⎪⎝⎭，从∑出发，求总体主成分123,,F F F ，并求前两个主成分的累积贡献率。

应用多元统计分析试题及答案

一、填空题：1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.3、聚类分析就是分析如何对样品（或变量）进行量化分类的问题。

通常聚类分析分为 Q型聚类和 R型聚类。

4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。

5、因子分析把每个原始变量分解为两部分因素：一部分为公共因子，另一部分为特殊因子。

6、若()(,), Px N αμα∑=1,2,3….n且相互独立，则样本均值向量x服从的分布为_x~N(μ，Σ/n)_。

二、简答1、简述典型变量与典型相关系数的概念，并说明典型相关分析的基本思想。

在每组变量中找出变量的线性组合，使得两组的线性组合之间具有最大的相关系数。

选取和最初挑选的这对线性组合不相关的线性组合，使其配对，并选取相关系数最大的一对，如此下去直到两组之间的相关性被提取完毕为止。

被选出的线性组合配对称为典型变量，它们的相关系数称为典型相关系数。

2、简述相应分析的基本思想。

相应分析，是指对两个定性变量的多种水平进行分析。

设有两组因素A和B，其中因素A包含r个水平，因素B包含c个水平。

对这两组因素作随机抽样调查，得到一个rc的二维列联表，记为。

要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。

相应分析即是通过列联表的转换，使得因素 A 和因素B具有对等性，从而用相同的因子轴同时描述两个因素各个水平的情况。

把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上，从而得到因素A、B的联系。

3、简述费希尔判别法的基本思想。

从k个总体中抽取具有p个指标的样品观测数据，借助方差分析的思想构造一个线性判别函数系数：确定的原则是使得总体之间区别最大，而使每个总体内部的离差最小。

将新样品的p 个指标值代入线性判别函数式中求出值，然后根据判别一定的规则，就可以判别新的样品属于哪个总体。

多元统计分析及R语言建模考试试卷

多元统计分析及R 语言建模考试试卷一、简答题（共5小题，每小题6分，共30分）1. 常用的多元统计分析方法有哪些？（1）多元正态分布检验（2）多元方差-协方差分析（3）聚类分析（4）判别分析（5）主成分分析（6）因子分析（7）对应分析（8）典型相关性分析（ 9）定性数据建模分析（10）路径分析（又称多重回归、联立方程）（11）结构方程模型（12）联合分析（13）多变量图表示法（14）多维标度法 2. 简单相关分析、复相关分析和典型相关分析有何不同？并举例说明之。

简单相关分析：简单相关分析是研究现象之间是否存在某种依存关系，并对具体有依存关系的现象探讨其相关方向以及相关程度，是研究随机变量之间的相关关系的一种统计方法。

例如，以X、Y分别记小学生的数学与语文成绩，感兴趣的是二者的关系如何，而不在于由X去预测Y。

复相关分析；研究一个变量 x0与另一组变量 (x1,x2,…，xn)之间的相关程度。

例如,职业声望同时受到一系列因素（收入、文化、权力……）的影响，那么这一系列因素的总和与职业声望之间的关系，就是复相关。

复相关系数R0.12…n的测定，可先求出 x0对一组变量x1，x2，…，xn的回归直线，再计算x0与用回归直线估计值悯之间的简单直线回归。

复相关系数为R0.12…n的取值范围为0≤R0.12…n≤1。

复相关系数值愈大，变量间的关系愈密切。

典型相关分析就是利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。

它的基本原理是：为了从总体上把握两组指标之间的相关关系，分别在两组变量中提取有代表性的两个综合变量U1和V1（分别为两个变量组中各变量的线性组合），利用这两个综合变量之间的相关关系来反映两组指标之间的整体相关性。

3. 试说明主成分分析和因子分析不同点和相同之处。

主成分分析和因子分析的相同之处1.都可以降维、分析多个变量的基本结构2.因子分析是主成分分析的进一步推广。

2016年人大应用统计考研,真题解析,复试笔记,考研真题,心得分享,考研笔记,考研经验

人大考研详解与指导经济学联考136这个是我考完自我感觉最良好的一门，大家考得都很好，逻辑和数学都不难，我记得我当时写完作文涂完卡时候离考试结束还有一个小时（o(╯□╰)o），当然了不是因为我水平高写得快，而是因为题比较简单，而且重要的是…我记错下考场时间了，以为十一点结束就拼命写拼命写…so..亲们，考前模拟很重要。

用到的书大概有这些玩意【数学】高数课本及习题答案（一遍）、线性代数课本及习题答案（一遍）、概率论与数理统计课本及答案（一遍）、复习全书（一遍）、数学分册（两遍左右，错误真心多啊，不过最后模拟题还是不错的）、跨考出的660题（三遍，题挺多的也挺好的，不过有一些题我现在依然不会做，很是惭愧啊）当时考试做数学部分的时候感觉就是，这尼玛也太简单了….大家完全不用担心，个人感觉以以往难度课本+660题就无敌了。

当然以后趋势可能会变难，细致掌握知识点，多看看有难度的题也是必要的。

【逻辑】逻辑经典（两遍，很不错的书，开始看不大懂后来还好）、逻辑分册（三遍，也挺不错，就是题目太多….刚开始错的很惨）、周建武老师的逻辑真题还是叫什么来着（点三十二个赞！）、周建武老师的逻辑模拟题6套题（点六十四个赞！，感觉这个系列的都不错）、跨考出的660题（记性真心不大好不记得确切叫什么了，这个出得不太好感觉，没有前几个好）刚开始做逻辑的时候一头雾水，错得都要跪了。

不过逻辑这个东西做多了，掌握了方法就会好很多，各个选项的错误还是很容易抓的。

题海战术很有效！【写作】又是一个木有怎么准备的东西，就看了看写作分册，小作文照着里面的模板写了一篇（对没错就是一篇），大作文就看了看写作分册里面的范文，然后..就没有然后了。

经济学联考比起数三来说还是好准备一些的，熟练+细心，再考前模拟几次，大致掌握一下时间，就没什么问题了吧。

三、专业课120绝对绝对的重头戏，精力和时间都花的最多，虽然成绩也不高，我对分数和复习状态还是很满意的。

用到的书有（我用的都是人大出版社的，也有亲们用的上财或者其他学校的书，应该也挺好）《统计学》我用的是第五版，后来复试的时候发现第五版跟第四版比较起来删掉了很多东西，什么实验设计和非参数检验都木有了！！而复试好多人都抽到了实验设计的题目。

实用多因素统计分析考试试卷(doc 7页)

实用多因素统计分析考试试卷(doc7页)部门： xxx时间： xxx整理范文，仅供参考，可下载自行编辑实用多因素统计分析试卷姓名学号成绩计算分析题（每题选择正确统计方法，并用SPSS处理，并解读结果得出结论，结果解读和结论用手写，前四题每题15分，后两题每题20分共100分）1、为研究不孕症，研究者甲乙两地区收集了10名男子的精子数（106/ml），收缩压（mmHg）和年龄（岁），资料见表1，试分析甲乙两地区男子的平均精子数之间有无显著性差异？方差表1 两个地区男子精子数2、某研究者为研究不同的照射方法（因子A）、不同的照射剂量（因子B）和不同的照射时间（因子C）对NFS—60细胞凋亡的影响，设计了有重复测量的三因子模型，其中，照射方法分两种：单独照射、照射+过钒酸钠；照射剂量为三水平：0、3、10gy；照射时间分为五种：12、24、36、48、60小时。

共有30个不同处理组。

研究员将90个样本随机地分在这30个实验组里进行实验，每个样本观察200个细胞，数出凋亡个数，实验结果见表2。

方差表2 不同照射方法、剂量和时间上NFS－６０细胞凋零死亡的观察数3、某医院为合理地评价该医院各月的医疗工作质量，搜集了三年有关门诊人次、出院人数、病床利用率、病床周转次数、平均住院天数、治愈好转率、病死率、诊断符合率、抢救成功率等9个指标数据见表：试采用因子分析方法，探讨其综合评价指标体系。

主成分表３某医院三年各有有关指标4、某研究人员在探讨肾细胞癌转移的有关临床病理因素研究中，收集了一批根治性肾切除术患者的肾癌标本资料，现从中抽取26例资料结果见表4，试作LOGISTIC回归分析。

表4有关符号说明：I：标本序号；x1：确诊时患者年龄（岁）；x2：肾细胞癌血管内皮生长因子（VEGF），其阳性表述由低到高共3个等级；x3：肾细胞癌组织内微血管数（MVC）；x4：肾癌细胞核组织学分级，由低到高共4级；x5：肾细胞癌分期，由低到高共4期；y：肾细胞癌转移情况（有转移为1；无转移为0）。

研究生多元统计试题

2001级多元期末试题一、简答题 (共40分)1. 以实例说明多元线性回归在医疗卫生领域的应用。

(6分)因素分析：在众多因素中筛选主要的影响因素，并可控制混杂因素和分析交互作用。

预测预报：例如根据血液流变学指标，建立心肌梗塞或脑卒中的预测方程，根据流脑流行与历年的气温、湿度、降水量、日照时间、平均风速等建立预测方程。

各自变量x i 取不同值时y 值的参考值范围：男孩肺活量的正常值与身高、体重等因素有关，可建立多元线性回归方程，分别求出当身高、体重取不同值的组合时，男孩肺活量的参考值范围，即 y 的容许区间。

根据较易测得的自变量推算不易测得的应变量：如根据身高和体重推算体表面积等。

自变量作用的分解2. 多元线性回归，复相关系数和剩余标准差在衡量回归方程拟效果时意义是否一致？(6)不一致，复相关系数随着方程中变量的增加复相关系数总是增加的，即使增加的变量无统计学意义；而剩余标准差一般是随回归方程中自变量的增加而减少，但当增加一些无统计意义的自变量后，剩余标准差反而会增大，这一性质与校正复相关系数相似。

3. 聚类分析的实质是什么？它与判别分析有什么区别？(6分) 4. 简述主成分分析的基本思想。

(6分)5. 多水平统计模型区别于传统多元线性回归模型的最主要特征是什么？(6分)6. 某人测量了174名15－16岁男青年的体重X 1(Kg)、身高X 2(cm)、胸围X 3(cm)与肺活量(100cm 3)，据此数据拟合了由体重、身高和胸围推算肺活量的多元回归方程如下：(10)Y ˆ＝－76.67－0.2268X 1+0.3067X 2+0.9162X 3（1）请问参数－0.2268的含义是什么？（2）身高系数比体重系数的绝对值较大，能否说明身高对肺活量的作用比体重对肺活量的作用为大？（3）如果要比较体重与身高对肺活量的作用大小，应采用什么指标？二、分析题(共35分)1. 现有A 、B 、C 三组贫血患者的血红蛋白浓度(%，X 1)及红细胞计数(1012/L ，X 2)如下表。

2016级统计学试卷A

徐州工程学院试卷2015 — 2016 学年第二学期课程名称统计学试卷类型 A 考试形式闭卷考试时间 100 分钟命题人宋效红 2016 年 5 月 20 日使用班级 14信管,14旅馆,13会计,14财管1、2班教研室主任年月日教学院长年月日姓名班级学号一、单向选择题(共20 小题,每题 1 分,共计 20 分)1、茎叶图适合于描述( )A、大批量数值型未分组数据B、小批量数值型未分组数据C、大批量数值型分组数据D、小批量数值型分组数据2、为了估计某城市中拥有汽车的家庭比例。

抽取1000个家庭的一个样本,得到拥有汽车的家庭比例为70%。

则1000个家庭中“拥有汽车的家庭比例”为( )。

A、参数B、样本C、数值型数据D、统计量3、某调研机构准备在全市500万个企业职工中随机抽取2000个职工,推断该城市所有职工的年人均收入,这项研究的总体就是( )A、500万个职工B、2000个职工C、500万个职工的人居收入D、2000个职工的人均收入4、频数就是指( )A、落在某一特定类别或组中的数据个数B、一个样本或总体中各个部分的数据与全部数据之比C、样本或总体中各不同类别数值之间的比值D、将比例乘以100得到的数值5、如果一组数据为尖峰分布,则峰态系数为( )。

A、0<>kk D、1k C、1<k B、0>6、若一组数据的平均数>中位数>众数,则该数据的分布为( )A、右偏分布B、左偏分布C、对称分布D、不确定7、对离散系数的描述正确的就是( )A、测度数据离散程度的相对统计量B、在离散程度的测度中,最易受极端值的影响C、各变量值与其平均数离差绝对值的平均数D 、离散系数越大,说数据的离散程度越小8、在置信水平不变的情况下,要缩小置信区间,则( )A 、需要减少样本容量B 、需要增大样本容量C 、需要保持样本容量不变D 、需要增大统计量的抽样标准差9.根据两个独立的小样本估计两个总体均值之差时,当两个总体的方差未知但相等时,使用的分布就是( )A 、 t 分布B 、2x 分布C 、 F 分布D 、正态分布 10、样本均值的抽样标准差x σ ( )A 、随样本容量的增大而减小B 、随样本容量的增大而变大C 、与样本量的大小无关D 、大于总体标准差11、当原假设0H 为真时,所得到样本观察结果或更极端结果出现的概率成为( ) A 、临界值 B 、统计量 C 、 P 值 D 、事先给定的显著水平 12、容量为3升的橙汁容器上的标签标明,该种橙汁的脂肪含量的均值不超过0.5克,在对标签上的说明进行检验时,建立的原假设与备择假设为5.0:,5.0:10>≤u H u H ,该检验所犯的第二类错误就是( )A 、实际情况就是5.0≥u ,检验认为5.0>uB 、实际情况就是5.0≥u ,检验认为5.0<u C 、实际情况就是5.0≤u ,检验认为5.0<u D 、实际情况就是5.0≤u ,检验认为5.0>u13、各实际观测值与回归值的离差平方与称为( )A 、判断系数B 、回归平方与C 、残差平方与D 、总变差平方与 14、由最小二乘法得到的回归直线,要求满足因变量的( )A 、平均值与其估计值的离差平方与最小B 、实际值与平均值的离差平方与最小C 、实际值与其估计值的离差平方与为0D 、实际值与其估计值的离差平方与最小 15、指数平滑法得到的1+t 的预测值等于( )A 、 1+t 期的实际观测值与t 期的指数平滑值的加权平均值B 、 t 期的实际观测值与1+t 期的指数平滑值的加权平均值C 、 t 期的实际观测值与t 期的指数平滑值的加权平均值D 、t 期的实际观测值与1+t 期的实际观测值的加权平均值16、对某时间序列建立的趋势方程t tY)85.0(500ˆ⨯=,这表明该序列( ) A 、没有趋势 B 、呈现指数上升趋势 C 、呈现指数下降趋势 D 、呈现线性上升趋势17、环比增长率就是时间序列中( ) A 、报告期观测值与前一期观测值之比减1 B 、报告期观测值与前一期观测值之比加1C、报告期观测值与某一固定时期观测值之比减1D、报告期观测值与某一固定时期观测值之比加1表中所缺的数值为销售量指数与销售额指数为( )A、116、7与123、6B、94、5与123.6C、94、5与116、5D、116、7与123、619、按照所反映指标的性质不同,指数分为( )A、简单指数与加权指数B、数量指标指数与质量指标指数C、个体指数与总指数D、拉氏指数与帕氏指数20、下列描述不正确的就是( )A、增长1%的绝对值=前期水平/100B、时间序列中出现负数时,不宜计算增长率C、增长率也称增长速度D、定基增长率就是报告期观测值与某一固定时期观测值之比二、判断题 (共 10 小题,每题 1 分,共计 10 分)1、考察总体中个别现象或个别项目数量变动的相对数称为简单指数。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

X3
7.0 6.4
X4
14.7 17.8
Y1
137 162
Y2
62 43
3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 131 158 158 132 162 144 162 169 129 166 185 155 175 136 153 110 160 112 147 204 131 170 173 132
3、某研究者分别用免疫疗法、药物与免疫结合疗法治疗黑色素瘤患者，经随访得到各患者的生存时间（月）见下表。（1）试采用乘积极限法计算其生存率及其标准误。（2）对两组的生存率进行 log-rank 可检验。
（3）绘制生存曲线。（15 分）
BCG 治疗组药物和 BCG 结合治疗组 33.7 4.3 2.8
81 39 51 65 40 42 56 37 70 41 56 58 47 49 69 57 74 39 65 40 57 34 54 72 51 62 85 38
用 SPSS 统计软件完成： (1)试分别求 Y1 ，Y2 对 X1 ，X2，X3，X4 的线性回归方程，并作分析。 (2)用向前法、向后法和逐步回归法选择自变量，看结果是否一致。 (3)作 Y2 /Y1 对 X1 ，X2，X3，X4 的逐步回归分析，并与前面的分析结果进行比较。 (4)进一步作残差分析，看是否满足回归分析的条件和有无离群
112 138 94 160 154 141 137 151 110 113 137 129 138 148 118 121 111 110 133 149 86 123 110 122 102 127 123 131
6.9 7.1 8.6 12.1 11.2 9.7 7.4 7.5 6.0 10.1 7.2 8.5 6.3 11.5 6.0 6.1 4.1 9.4 8.5 9.5 5.3 8.0 8.5 6.1 6.6 8.4 8.7 13.8
2016-2017 学年第二学期 2016 级研究生多元统计学考试试卷
线
专业
班级
姓名
学号
日期
一、简答题：（每题 10，共 40 分）
1、简述因子分析的基本思想？ 2、线性回归、Logistic 回归、COX 模型有何异同？ 3、举例说明生存分析方法在临床疗效评价、疾病发生和预后分析中的应用？其结果变量各是什么？
+
3.8 26.9 9.2
+
6.3 21.4 15.9
+
2.3 18.1 4.5
+
6.4 5.8 9.2
23.8 3.0 8.2
+
1.8 11.0
+
5.5 22.1 7.8
+ +
16.6 23.0
+
33.7 6.8
+
17.1 10.8
+
+
+
+
8.2
4、外源性 NO 供体硝普钠（SNP）对培养心肌细胞 DNA 有损伤作用，某研究者欲实验超氧化物歧化酶（SOD）和过氧化氢酶（CAT）对心肌细胞的保护作用，实验材料用 Wistar 大鼠心肌细胞。将相同条件的 20 个盛有细胞悬液培养皿随机分为 4 组，每组 5 个培养皿。四组培养皿均加入 40 mol/L SNP。另外，第二组培养皿中加入 50 U/ml SOD，第三组培养皿中加入 50 U/ml CAT，第四组培养皿中加入 50 U/ml SOD 和 50 U/ml CAT。5 小时避光培养后电泳分析，结果下（迁移改变 50 个细胞位置）。请分析实验结果。（15 分）
装
30 名就诊患者血清中低、高密度脂蛋白中的胆固醇含量及载脂蛋白的测量结果
载脂蛋白 AⅠ 序号 i （mg/dl）载脂蛋白 B 载脂蛋白 E 载脂蛋白 C (mg/dl) (mg/dl) (mg/dl) 低密度脂蛋白 (mg/dl) 高密度脂蛋白 (mg/dl)
X1
1 2 173 139
X2
106 132
医师作了抑郁症发生和3个因素的logistic回归分析，结果见别表1。
表1 变量常数成年人抑郁症危险因素分析
b
0.405 7 2.068 3 -1.389 0 1.379 1
SE
0.125 5 0.447 5 0.326 4 0.273 6
2
10.450 21.362 18.109 25.407
订
4、配对病例-对照研究资料若采用非条件 logistic 回归进行分析，对结果有何影响？二、计算分析题（共 60 分） 1、有学者认为，血清中低密度脂蛋白增高和高密度脂蛋白降低是引起动脉硬化的一个重要原因。现测量了 30 名被怀疑患有动脉硬化的就诊患者的载脂蛋白 AⅠ、载脂蛋白 B、载脂蛋白 E、载脂蛋白 C、低密度脂蛋白中的胆固醇、高密度脂蛋白中的胆固醇含量，资料如下表所示：
P
＜0.001 ＜0.001 ＜0.001 ＜0.001
OR *
1.500 4 7.911 4 0.249 3 3.971 3
标准化 b － 1.045 7 -1.720 0 1.463 4
X1 X2
X3
* OR =exp(b)。
请问：（1）该医师认为抑郁症的发生与性别、年龄和健康状况有关，其中女性、低年龄和健康状况差为抑郁症发生的危险因素，由 OR 可知，性别对抑郁症发生的作用最大，健康状况的作用次之，年龄的作用最小。该结论是否正确？为什么？（10 分）
值。 (5)根据上面的分析，从专业上用文字扼要地叙述最后的分析结果。（20 分） 2、某医师研究某市成年人（≥18岁）抑郁症发生的危险因素。从该市成年人随机抽取294人的一个样本，其中有抑郁症50人，无抑郁症244人。3个可疑影响因素分别为性别 X 1 （0为男，1为女）、年龄
X 2 （年龄/10）、健康状况 X 3 （1为很好，2为好，3为良，4为差）。该
表
第1组 50 60 34 68 46
四组培养皿 DNA 迁移度（50 个细胞）
第2组 37 48 54 31 28 第3组 47 63 32 27 28 第4组 19 24 36 27 18
16.7 15.7 13.6 20.3 21.5 29.6 18.2 17.2 15.9 42.8 20.7 16.7 10.1 33.4 17.5 20.4 27.2 26.0 16.9 24.7 10.8 16.6 18.4 21.0 13.4 24.7 19.0 29.2
134 188 138 215 171 148 197 113 145 81 185 157 197 156 156 154 144 90 215 184 118 127 137 126 130 135 188 122

2016级研究生实用多因素统计分析试卷

合集下载

统计学研究生数据分析单选题100道及答案解析

青岛大学2016年硕士研究生入学考试初试试题考试科目：432统计学

中国矿业大学2016级硕士研究生课程考试试卷

2016年山东大学硕士研究生入学考试《统计学》真题及详解

2016年全国硕士研究生入学统一考试心理学专业基础综合真题

2016年考研专业课考试《心理学专业基础综合心理测量与统计》真题及详解

(完整版)研究生医学统计试题

考研专业课考试心理学专业基础综合心理测量与统计真题2016年

研究生多元统计分析试题(A卷)(答案)

应用多元统计分析试题及答案

多元统计分析及R语言建模考试试卷

2016年人大应用统计考研,真题解析,复试笔记,考研真题,心得分享,考研笔记,考研经验

实用多因素统计分析考试试卷(doc 7页)

研究生多元统计试题

2016级统计学试卷A

文档推荐

最新文档