2016级研究生实用多因素统计分析试卷
- 格式:pdf
- 大小:171.91 KB
- 文档页数:4
统计学研究生数据分析单选题100道及答案解析1. 数据的收集、整理、分析和解释的过程被称为()A. 统计学B. 数据分析C. 数据挖掘D. 机器学习答案:A解析:统计学是研究数据的收集、整理、分析和解释的一门学科。
2. 以下哪种数据收集方法属于观察法?()A. 问卷调查B. 实验C. 直接观察D. 电话访谈答案:C解析:直接观察是观察法的一种,通过直接观察对象来收集数据。
3. 对于定类数据,最适合的描述统计量是()A. 均值B. 中位数C. 众数D. 标准差答案:C解析:众数适用于定类数据,用来表示出现频率最高的类别。
4. 一组数据中最大值与最小值之差称为()A. 极差B. 方差C. 标准差D. 平均差答案:A解析:极差是最大值减去最小值。
5. 若一组数据呈右偏分布,则其众数、中位数和均值的关系为()A. 众数< 中位数< 均值B. 众数= 中位数= 均值C. 众数> 中位数> 均值D. 中位数< 众数< 均值答案:A解析:右偏分布时,均值大于中位数,中位数大于众数。
6. 抽样误差是指()A. 调查中所产生的登记性误差B. 调查中所产生的系统性误差C. 随机抽样而产生的代表性误差D. 由于违反随机原则而产生的误差答案:C解析:抽样误差是由于随机抽样的随机性导致的样本统计量与总体参数之间的差异。
7. 简单随机抽样中,抽样平均误差与样本容量的关系是()A. 样本容量越大,抽样平均误差越大B. 样本容量越大,抽样平均误差越小C. 两者无关D. 不确定答案:B解析:样本容量越大,抽样平均误差越小,抽样精度越高。
8. 在其他条件不变的情况下,置信水平越高,置信区间()A. 越窄B. 越宽C. 不变D. 不确定答案:B解析:置信水平越高,需要包含更多的可能性,所以置信区间越宽。
9. 假设检验中,第一类错误是指()A. 原假设为真时拒绝原假设B. 原假设为假时接受原假设C. 原假设为真时接受原假设D. 原假设为假时拒绝原假设答案:A解析:第一类错误又称拒真错误,即原假设为真时拒绝原假设。
青岛大学2016年硕士研究生入学考试试题科目代码:432 科目名称:统计学(共 4 页)请考生写明题号,将答案全部答在答题纸上,答在试卷上无效(本试卷适用于报考经济学院的考生)一、名词解释(每个3分,共15分)1、偏度;2、集中趋势;3、品质型数据;4 、第一类错误;5、假设检验二、填空题(每题3分,共15分)1、测度数据离散趋势分布特征的统计量主要有、、。
2、设总体X服从标准正态分布N(0,1),是来自该总体的样本,令,且服从分布,则c=3、100台机器彼此独立地工作,每台机床的实际工作时间占全部工作时间的60%,则任一时刻有60台以上车床在工作的概率是。
4、某厂有A、B、C、D四个车间生产同种产品,且产量分别占全厂的30%,25%,25%和20%。
这四个车间产品的次品率分别为0.10,0.05,0.15和0.2,从该厂任意抽取一件产品,发现为次品的概率是。
5、在单边假设检验中,p值显著性水平拒绝原假设。
三、选择题(每题3分,共15分)1、一组数据的箱线图不可以给出这组数据的()A、极小值B、均值C、中位数D、3/4分位数2、如果两个变量之间的关系近似的表现为一条直线,则称两个变量之间为()A、正线性相关关系B、负线性相关关系C、线性相关关系D、非线性相关关系3、在出租车等候去等候出租车的时间是左偏的,均值为10分钟,标准差为5分钟,如果从等候区随机抽取100名顾客并记录他们等待出租车的时间,则该样本均值的分布服从()A、正态分布,均值为10分钟,标准差为5分钟B、正态分布,均值为10分钟,标准差为0.5分钟C、左偏分布,均值为10分钟,标准差为5分钟D、左偏分布,均值为10分钟,标准差为0.5分钟4、研究表明,司机因为驾车分心而发生事故的比例超过30%,用来检验这一结论的原假设和备择假设为()A、B、C、D、5、从总体中抽取一个元素后不再放回总体,然后再从其余元素中抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为()A、重复抽样B、不重复抽样C、分层抽样D、整群抽样四、简答题(每题10分,共30分)1、简述中心极限定理的基本条件和结果。
中国矿业大学硕士16级统考试卷数 理 统 计时间:120分钟 2016-12-4一、简答题(每题5分,共30分):1. 设n X X X ,,,21 是),(~2σμN X 的样本,(μ已知),记∑=-=n i i X n S 1221)(1μ, ∑=--=n i i X X n S 1222)(11。
(1) 证明2221,S S 都是2σ的无偏估计量;(2)判断2221,S S 中哪一个更有效。
2. 设129,,,X X X 是来自正态总体2(,)N μσ的样本,记1161()6Y X X =++ ,27891()3Y X X X =++,922271()2i i S X Y ==-∑,求12)Y Y Z S-=的分布?3. 设()2~0,,X N σ12,,,n X X X 为X 的样本,求统计量3212413ii nii X n X==⎛⎫-⎪⎝⎭∑∑的分布。
4. 设X 服从泊松分布~(,),01,2,!x e X p x x x λλλ-== ,,12,,,n X X X 为X 的样本, 样本均值X 是否是参数λ的优效估计量。
5. 设(,)~(1,2;4,9;0.5)X Y N ,求(2,2)X Y X Y +-的协方差矩阵。
6. 试验设计的目的什么?使用正交表安排试验时,各个因素的各种水平搭配是均衡的,这种均衡性在正交表中有何体现?正交表的记号:()k n L m 中各字母分别表示什么?二、(12分).设n X X X ,,,21 是总体X 的样本, X 的概率密度为⎪⎩⎪⎨⎧<≥=--.,0,,1),;(μμθμθθμx x ex f x 其中0>θ.求θ和μ的最大似然估计量。
三(18分)、假设两个城市的居民户的年消费额分别为Y X ,,且服从正态分布,),(~211σμN X , ),(~222σμN Y ,分别对这两个城市的21个居民户和16个居民户的年消费额进行抽样调查, 测得其平均年消费额分别为26000x =元和27000y =元. 样本标准差分别为1810s =元和21050s =元.(1). 试比较这两个城市居民户的平均消费额有无显著差异. (取显著性水平10.0=α)(2). 求21μμ-的置信区间(取显著性水平10.0=α)四(10分).将一颗骰子连续抛掷1000次,得到如下数据在显著性水平下,检验这颗骰子的6个面是否均匀。
2016年山东大学硕士研究生入学考试《统计学》真题及详解2016年山东大学硕士研究生入学考试《统计学》真题(总分:150.00,做题时间:180分钟)一、单项选择题(总题数:30,分数:60.00)1.下面哪种调查方式的样本不是随机选取的()。
(分数:2.00)A.分层抽样B.系统抽样C.整群抽样D.判断抽样√【解析】分层抽样、系统抽样、整群抽样均属于概率抽样,也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
而判断抽样属于非概率抽样,是指研究人员根据经验、判断和对研究对象的了解,有目的地选择一些单位作为样本,而不是随机抽取的。
2.为了解小区居民对物业服务的意见和看法,管理人员随机抽取了50户居民,上门通过问卷进行调查。
这种数据收集方法是()。
(分数:2.00)A.面访式问卷调查√B.实验调查C.观察式调查D.自填式问卷调查【解析】面访式问卷调查是指现场调查中调查员与被调查者面对面,调查员提问、被调查者回答的调查方式。
3.为了研究多个不同变量在不同样本间的相似性,适合采用的图形是()。
(分数:2.00)A.环形图B.茎叶图C.雷达图√D.箱线图【解析】C项,雷达图是显示多个变量的常用图示方法,它也可以研究多个样本之间的相似程度。
A 项,环形图可以显示多个样本各部分所占的相应比例,从而可对多个样本的构成进行比较研究;B项,茎叶图用于反映原始数据分布;D项,箱线图主要用于反映数据分布的特征,还可以对多组数据的分布特征进行比较。
4.经验法则表明,当一组数据对称分布时,在平均数加减1个标准差的范围之内大约有()。
(分数:2.00)A.68%的数据√B.95%的数据C.99%的数据D.100%的数据【解析】当一组数据对称分布时,经验法则表明:①约有68%的数据落在平均数±1个标准差的范围之内;②约有95%的数据落在平均数±2个标准差的范围之内;③约有99%的数据落在平均数±3个标准差的范围之内。
2016年全国硕士研究生入学统一考试心理学专业基础综合真题(总分:300.00,做题时间:180分钟)一、单项选择题(总题数:61,分数:130.00)1.张明在实验室考察不同颜色对人的视敏度的影响,李亮在日常的教学环境条件下考察不同教学方法对学生学习成绩的影响。
两人研究方法的不同在于()。
(分数:2.00)A.有无自变量B.有无因变量C.控制额外变量的程度√D.有无研究假设解析:本题旨在考查考生对心理学实验类型的掌握,根据实验过程中被试分配和额外变量的控制情况,将实验分为非实验设计、准试验设计和真实验设计,张明是在实验室条件下进行的实验,整个实验过程严格额外变量,而李亮是在日常的教学环境条件下进行的实验,结果会受到额外变量的影响,因此两人的研究方法的不同在于控制额外变量的程度。
2.1967 年《认知心理学》一书的出版,标志着现代认知心理学的诞生。
该书的作者是()。
(分数:2.00)A.斯腾伯格(R. Sternbeng)B.布鲁纳(J. Bruner)C.奈塞尔(U. Neisser)√D.西蒙(H. simon)解析:认知心理学起始于本世纪 50 年代末, 1967 年美国心理学家奈塞尔《认知心理学》一书的出版,标志着认知心理学已成为一个独立的流派立足于心理学界了。
3.病人因颞叶受伤而导致受损的功能主要是()。
(分数:2.00)A.听觉√B.视觉C.嗅觉D.味觉解析:本题为本部分高频考点颞叶位于外侧裂下方,负责处理听觉信息,也与记忆和情感有关。
4.在裂脑人实验中,假如给被试左视野呈现“苹果” 图片,右视野呈现单词“杯子” ,他能顺利完成的任务是()。
(分数:2.00)A.用左手选出屏幕后摆放的苹果√B.用右手选出屏幕后摆放的苹果C.用左手选出屏幕后摆放的杯子D.口头报告看到了“苹果”解析:每个半球只对来自身体对侧的刺激做出反应,并调节对侧身体的运动。
题目中左视野呈现“苹果” 图片,投射在脑的右侧,被试用左手很容易从屏幕后选出苹果。
2016年考研专业课考试《心理学专业基础综合心理测量与统计》真题(总分:100.00,做题时间:90分钟)一、单项选择题(总题数:21,分数:63.00)1.信度系数的定义公式是______[解析]信度即测量结果的一致性和稳定性程度,等于一组测量分数中真分数的变异与总变异之比。
故本题选A。
2.某个测验由于条件限制,只得到了一次施测数据。
此时计算该测验的信度应该使用______(分数:3.00)A.多质多法B.复本法C.分半法√D.重测法[解析]只有一次数据可以用分半法。
A:BD均需要多次数据。
故本题选C。
3.某研究中共有3组被试,每组12人,进行方差分析时,误差自由度为______(分数:3.00)A.2B.11C.33√D.35[解析]总自由度为12×3-1=35,自变量自由度为3-1=2,故误差自由度为35-2=33。
故本题选C。
4.关于陆军甲种测验和陆军乙种测验的表述,错误的是______(分数:3.00)A.均可用于大规模的团体施测B.可用于官兵选拔和职位配置C.可用于企事业领域人员选拔D.前者为非文字测验,后者为文字测验√[解析]陆军甲种测验和陆军乙种测验均属于团体测验,可用于团体施测,最初是用来选拔官兵并剔除不合格对象的,后来也可用于企事业领域人员选拔;陆军甲种测验是文字型测验,乙种测验属于非文字测验,用于非英语母语和文盲者。
故本题选D。
5.根据因素分析的结果,韦克斯勒儿童智力测验(第四版)测查的能力因素主要包括______(分数:3.00)A.言语理解、知觉组织、工作记忆、加工速度√B.分析能力、人际关系、图形分析、类比推理C.语词关系、认知风格、工作记忆、空间推理D.词汇能力、知觉组织、创造能力、抽象推理[解析]韦氏智力量表(第四版)结构变为"四指数"结构,即言语理解指数、知觉推理指数、工作记忆指数和加工速度指数,这也是继承了第三版韦氏智力测验经过因素分析得出的结果,即言语理解因素、知觉组织因素、集中注意力或克服分心因素以及加工速度因素。
研究生《卫生统计学》课程理论考试卷(A卷)(试卷总分:55分,考试时间:45分钟,试题内容9页,空白纸3页)姓名: 学号: 电脑号: 试题号:一、单选题: 每题1分,55题,共计55分1. 描述一组偏态分布资料的集中趋势时,最适宜选择的指标是A.几何均数B.算术均数C.中位数D.众数E.标准误2. 测量体重、转氨酶等指标所得的资料叫做:()A、计数资料B、计量资料C、等级资料D、间断性资料E、分类资料3.统计中所说的总体是指:( )A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体4.抽样的目的是:( )A、研究样本统计量B、研究总体参数C、研究典型案例D、研究误差E、样本推断总体参数5. 下面哪个不是样本的指标()A、 xB 、pC、rD、E、s6. 均数与标准差适用于A、正偏态分布资料B、负偏态分布资料C、正态分布资料D、频数分布类型不明的资料E.不对称分布的资料7.两样本均数的t检验中,检验假设(H0)是A μ1≠μ2B μ1=μ2C X1≠X2D X1=X2E X1=X28. 作单侧检验的前提是:A、已知新药优于旧药B、已知新药差于旧药C、不知新药好还是旧药好D、已知新药不比旧药差E、已知新旧药差不多好9. 在假设检验时,本应是双侧检验的问题而误用了单侧检验水准,当拒绝H0时,则()A. 增大了第一类错误B. 减小了第一类错误C. 增大了第二类错误D. 减小了第二类错误E. 以上都不正确10. 两样本均数比较的t检验,差别有统计学意义时,P越小,说明()A.两样本均数差别越大B.两总体差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同11. 两个样本含量分别为20和30的样本作t检验, 自由度为: ()A.50 B.49C.25 D.24 E.4812.某医院某日门诊病人数1000人,其中内科病人400人,求得40%,这40%是( )A率B构成比C相对比D绝对数E标化率13.卡方检验中自由度的计算公式是( )A行数×列数 B n-1 C N-k D(行数-1)(列数-1)E行数×列数-1 14.反映某一事件发生强度的指标应选用( )A 构成比B 相对比C 绝对数D 率E变异系数15.欲比较两地死亡率,计算标准化率可以()。
考研专业课考试心理学专业基础综合心理测量与统计真题2016年(总分:100.00,做题时间:90分钟)一、单项选择题(总题数:21,分数:63.00)1.信度系数的定义公式是______A.B.C.D.(分数:3.00)A. √B.C.D.解析:[解析] 信度即测量结果的一致性和稳定性程度,等于一组测量分数中真分数的变异与总变异之比。
故本题选A。
2.某个测验由于条件限制,只得到了一次施测数据。
此时计算该测验的信度应该使用______(分数:3.00)A.多质多法B.复本法C.分半法√D.重测法解析:[解析] 只有一次数据可以用分半法。
A:BD均需要多次数据。
故本题选C。
3.某研究中共有3组被试,每组12人,进行方差分析时,误差自由度为______(分数:3.00)A.2B.11C.33 √D.35解析:[解析] 总自由度为12×3-1=35,自变量自由度为3-1=2,故误差自由度为35-2=33。
故本题选C。
4.关于陆军甲种测验和陆军乙种测验的表述,错误的是______(分数:3.00)A.均可用于大规模的团体施测B.可用于官兵选拔和职位配置C.可用于企事业领域人员选拔D.前者为非文字测验,后者为文字测验√解析:[解析] 陆军甲种测验和陆军乙种测验均属于团体测验,可用于团体施测,最初是用来选拔官兵并剔除不合格对象的,后来也可用于企事业领域人员选拔;陆军甲种测验是文字型测验,乙种测验属于非文字测验,用于非英语母语和文盲者。
故本题选D。
5.根据因素分析的结果,韦克斯勒儿童智力测验(第四版)测查的能力因素主要包括______(分数:3.00)A.言语理解、知觉组织、工作记忆、加工速度√B.分析能力、人际关系、图形分析、类比推理C.语词关系、认知风格、工作记忆、空间推理D.词汇能力、知觉组织、创造能力、抽象推理解析:[解析] 韦氏智力量表(第四版)结构变为“四指数”结构,即言语理解指数、知觉推理指数、工作记忆指数和加工速度指数,这也是继承了第三版韦氏智力测验经过因素分析得出的结果,即言语理解因素、知觉组织因素、集中注意力或克服分心因素以及加工速度因素。
内蒙古农业大学2009—2010学年第一学期一、判断题(每小题2分,共10分) 1.多元正态分布的任何边缘分布为正态分布; ( 对 ) 2.正态总体),(∑μp N 的样本均值X 是μ的无偏,有效,一致估计; ( 对 ) 3.Wilks 统计量可以化成2T 统计量但是化不成F 统计量; ( 错 ) 4.Fisher 判别法对总体的分布有特定的要求; ( 错 )5.. ( 对 )二、填空题(每小题3分,共15分)1. 设X 和S 分别是正态总体),(∑μp N 的样本均值和离差阵,则X 和S 的关系为相互独立;2.若X ~),0(∑p N ,S ~),(∑n W p 且X 与S 相互独立,则X S X pp n 1'1-+-~(,1)F p n p -+;3.若1A ~),(1∑n W p ,p n ≥1,2A ~),(2∑n W p ,∑>0,且1A 和2A 相互独立, 则211A A A +~12(,,)p n n ∧;4.设资料阵X=()pn ijx ⨯,则样品()i X 与()j X 的切比雪夫距离)(∞ij d =1max ||i j px x ααα≤≤-;5.设S 是正态总体),(∑μp N 的离差阵,则∑的相合估计为11()1s s n n - . 三、选择题(每小题3分,共15分)1.设S 是正态总体),(∑μp N 的离差阵,样本容量为n ,则S 为正定矩阵的充要..条件..是(A ) A .n >p B. n <p C. n ≥p D. n ≤p2.下列不.是.系统聚类法是( ) A. 对应分析法 B.重心法 C. 可变法 D. 类平均法3. 以下关于聚类分析的说法不正确...的是(A ) A.聚类分析与群分析是不同的统计分析方法 B. 聚类分析属于多元统计分析方法 C. 系统聚类法是一种常用的聚类分析法 D. 模糊聚类法是一种常用的聚类分析法4. 判别分析是种常用的商情分析工具,下列关于判别分析的说法正确的是( D ) A. 判别分析是属于一元统计方法 B. 判别函数只有线性判别一种类型C. 无论判别标准是否相同,所得到的结论是相同的D. 判别分析是判别样本所属类型的统计方法5.“用一条直线代表散点图上的分布趋势,使各点与该纵向距离的平方和最小”是( A )方法B. 判别分析C. 聚类分析D. 相关分析四、计算题(每小题10分,共 30分)1.设抽取五个样品,每个样品只测一个指标,它们是2,3,4.5,8,10,试用最短距离法对五个样品进行分类. (请用绝对距离)解: 设样品为: x1,x2,x3,x4,x5 则他们的距离(绝对值距离)为(0)D =12345123450102.5 1.5065 3.5087 5.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪ ⎪⎪ ⎪ ⎪⎝⎭ (1)D =1234512345,,01.505 3.507 5.52x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪⎪ ⎪ ⎪ ⎪ ⎪⎝⎭(2)D =1234512345,,,,03.505.520x x x x x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪⎝⎭ (3)D =1234512345,,,,,0, 3.50x x x x x x x x x x ⎛⎫⎪ ⎪ ⎪ ⎪⎝⎭2.设三元总体X 的协方差阵为200050009⎛⎫ ⎪∑= ⎪ ⎪⎝⎭,从∑出发,求总体主成分123,,F F F ,并求前两个主成分的累积贡献率。
一、填空题:1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。
通常聚类分析分为 Q型聚类和 R型聚类。
4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。
5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。
6、若()(,), Px N αμα∑=1,2,3….n且相互独立,则样本均值向量x服从的分布为_x~N(μ,Σ/n)_。
二、简答1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。
在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。
选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。
被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。
2、简述相应分析的基本思想。
相应分析,是指对两个定性变量的多种水平进行分析。
设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。
对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。
要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。
相应分析即是通过列联表的转换,使得因素 A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。
把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。
3、简述费希尔判别法的基本思想。
从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数系数:确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。
将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。