非参数统计——期末试卷
- 格式:doc
- 大小:69.00 KB
- 文档页数:2
统计学期末考试试题及答案一、单项选择题(共40题,每题2分,共80分)1. 统计学是一门研究____________________。
A. 数学方法B. 概率论C. 社会现象D. 统计方法答案:D2. 如果一组数据服从正态分布,那么它的偏度应该是___________。
A. 0B. 1C. -1D. 2答案:A3. 在描述数据离散程度的指标中,____________用于衡量数据集中趋势。
A. 方差B. 标准差C. 中位数D. 众数答案:B......二、填空题(共10题,每题4分,共40分)1. 样本均值的计算公式是____________。
答案:样本总和/样本容量2. 当两个事件相互独立时,它们的联合概率为____________。
答案:各自概率的乘积三、简答题(共4题,每题20分,共80分)1. 请简要解释什么是样本调查,列举一些常见的样本调查方法。
答案:样本调查是通过采集和分析一部分受试者或对象的数据来推断总体特征的方法。
常见的样本调查方法包括随机抽样、系统抽样、分层抽样等等。
2. 请说明在统计学中什么是“假设检验”,并简要介绍其基本步骤。
答案:假设检验是用来判断总体参数是否满足给定假设的统计方法。
基本步骤包括设定原假设和备择假设、选择合适的统计量、计算统计量的观察值、确定显著水平、进行假设检验、得出结论。
......四、计算题(共3题,每题20分,共60分)1. 已知某班级学生的体重数据如下(单位:kg):50, 55, 60, 65, 70, 75求这组数据的标准差。
答案:计算过程省略,标准差为9.432. 某商品在1月、2月、3月的销售额分别为1000元、1200元和1500元,求这三个月的平均销售额和销售额的方差。
答案:平均销售额为1233.33元,销售额的方差为13133.33五、分析题(共2题,每题30分,共60分)1. 研究人员想要通过一份问卷调查了解某公司员工的满意度,问卷包括多个问题,如“您对公司的福利待遇满意程度如何?”和“您对公司的发展前景满意程度如何?”等等。
统计期末考试题及答案一、选择题(每题2分,共20分)1. 在统计学中,哪个术语描述了数据集中的数值变化?A. 方差B. 均值C. 标准差D. 中位数答案:A2. 以下哪个不是描述性统计的用途?A. 描述数据集的中心趋势B. 描述数据集的分散程度C. 预测未来数据D. 描述数据集的形状答案:C3. 以下哪个是参数统计分析中的一个基本假设?A. 正态分布B. 随机抽样C. 独立性D. 所有选项都是答案:D4. 假设检验中的零假设(Null Hypothesis)通常表示什么?A. 研究者想要证明的假设B. 研究者想要拒绝的假设C. 研究者认为没有效应的假设D. 研究者认为有效应的假设答案:C5. 以下哪个统计图最适合展示时间序列数据?A. 条形图B. 散点图C. 折线图D. 饼图答案:C6. 以下哪个统计量用于衡量数据集中的偏斜程度?A. 方差B. 标准差C. 偏度D. 峰度答案:C7. 以下哪个不是统计学中的抽样方法?A. 简单随机抽样B. 分层抽样C. 系统抽样D. 随机抽样答案:D8. 以下哪个统计量用于衡量两个变量之间的线性关系?A. 相关系数B. 回归系数C. 协方差D. 标准差答案:A9. 以下哪个是多元回归分析中的一个重要概念?A. 因变量B. 自变量C. 交互作用D. 所有选项都是答案:D10. 以下哪个不是非参数统计方法?A. 卡方检验B. 曼-惠特尼U检验C. 斯皮尔曼等级相关D. 方差分析答案:D二、简答题(每题10分,共30分)1. 请简述什么是标准正态分布,并说明其特征。
答案:标准正态分布是一种特殊的正态分布,其均值为0,标准差为1。
它是一个对称分布,以均值为中心,数据点在均值两侧对称分布。
标准正态分布是许多统计分析的基础,常用于转换原始数据,使其适用于正态分布的假设。
2. 解释什么是置信区间,并说明其在统计推断中的作用。
答案:置信区间是一个范围,用于估计总体参数的值。
它基于样本统计量和抽样分布,提供了一个估计值的可信度。
湖北科技学院数学与统计学院 2013年秋季学期2011级统计本科《非参数统计》期末考查试卷(A 卷、开卷)一.某批发商从厂家购置一批灯泡,根据合同的规定,灯泡的使用寿命平均不低于1000h,已知灯泡的使用寿命服从正态分布,标准差是20h. 从总体中随机抽取了100只灯泡,得知样本均值为996h. 问题是:批发商是否应该购买该批灯泡? (1) 零假设和备择假设应该如何设置?为什么?(2) 在零假设1000<μ下,给出检验的过程并做出决策。
(15分)二.下表中的数据是两个篮球联赛中三分球的进球次数,该数据的目的是考察两个联赛中三分球的得分次数是否存在显著性差异。
(1)符号检验;(2)配对Wilcoxon 符号秩检验;(3)该问题中哪个检验更好?( 25分)三分球的进球次数 队伍序号 联赛1 联赛2 1 91 81 2 46 51 3 108 63 4 99 51 5 110 46 6 105 45 7 191 66 8 57 64 9 34 90 10 81 28三.在一项研究毒品对增强人体攻击性影响的实验中,组A 使用毒品,组B 使用安慰剂。
试验后进行攻击性测试,测量得分如下表(得分越高表示攻击性越强)。
组A 组B10 12 8 15 12 20 16 18 5 13 9 14 7 9 11 16 6(1) 给出这个实验的零假设;(2)对数据进行统计分析。
(20分)四.下表是美国三大汽车公司(A, B, C三种处理)的五种不同的车型某年产品的油耗,试分析不同公司的油耗是否存在差异。
(20分)1 2 3 4 5A 20.3 21.2 18.2 18.6 18.5B 25.6 24.7 19.3 19.3 20.7C 24.0 23.1 20.6 19.8 21.4五.美国某年总统选举前,由社会调查总部抽查黑白种族与支持不同政党是否有关,数据如下表种族民主党共和党无党白人黑人3411034051110515问:不同种族与所支持的政党之间是否存在独立性?(20分)。
第7章非参数检验试题选择题:1、4组学生成绩(优、良、中、差)比较,宜用(B)。
A 方差分析B 秩和检验C 卡方检验D 四格表直接计算概率法2、两样本秩和检验的无效假设是(B)。
A 两样本秩和相等B 两总体分布相同C 两样本分布相同D 两总体秩和相等3、(C),应该用非参数统计方法。
A 正态分布资料n不相等时两样本均数比较B 正态分布资料两样本方差都比较大时两样本均数的比较C 两组等级资料的比较D 两组百分比资料的平均数比较4、在统计检验中是否选择用非参数统计方法,(A)。
A 要根据研究目的和数据特征作决定B 可在算出几个统计量和得出初步结论后进行选择C要看哪个统计结论符合专业理论实验组对照组实测值甲的编秩乙的编秩实测值甲的编秩乙的编秩10 7.5 7.5 10 7.5 7.512 9 9 8 4 515 10 10.5 8 5 515 11 10.5 6 1 217 12 13 6 2 217 13 13 6 3 217 14 13 8 6 519 17 17 19 17 1719 17 17 20 20 20.519 17 17 20 21 20.519 17 17 21 22 22D 要看哪个P值更小5、下表列出了成组设计的两样本资料及甲乙两个研究者的编秩结果,下面哪一个说法是对的?(C)A 甲的编秩方法是错的B 乙的编秩方法是错的C 甲乙两人方法均对D 甲乙两人的编秩方法均错6、以下检验方法中,(A)不属于非参数统计方法。
A.t检验B.H检验C.T检验D.χ2检验7、为判断各总体均数是否相等,对于来自方差齐性及正态分布总体的多个样本比较,可以作秩和(H)检验,通过判断各总体分布的位置是否相同而判断各总体均数是否相等,与作方差分析相比( C )。
A.应该把α定得小一点B.将增大犯I类错误的概率C.将增大犯II类错误的概率D.将同时增大犯两类错误的概率8、通过随机抽样分析两种对象头发中某种金属元素含量是否有高低,若不符合t检验的条件,并无法通过数据转换改善正态性和方差齐性,则(B)。
统计学期末考试题库及答案一、单项选择题(每题2分,共20分)1. 统计学中,数据的收集方法不包括以下哪一项?A. 观察法B. 实验法C. 调查法D. 推理法答案:D2. 以下哪一项不是统计数据的类型?A. 定量数据B. 定性数据C. 时间序列数据D. 空间数据答案:D3. 在统计分析中,以下哪一项不是描述性统计的内容?A. 数据的集中趋势B. 数据的离散程度C. 数据的分布形态D. 数据的预测分析答案:D4. 以下哪个统计量用于描述数据的离散程度?A. 平均数B. 中位数C. 众数D. 标准差答案:D5. 相关系数的取值范围是?A. -1到1之间B. 0到1之间C. -1到0之间D. 0到正无穷答案:A6. 以下哪一项是统计推断的主要内容?A. 描述性统计B. 概率论C. 假设检验D. 数据收集答案:C7. 以下哪一项不是非参数统计分析的方法?A. 卡方检验B. 秩和检验C. 符号检验D. t检验答案:D8. 在回归分析中,以下哪一项不是回归模型的基本组成部分?A. 因变量B. 自变量C. 误差项D. 常数项答案:D9. 以下哪一项不是时间序列分析的主要方法?A. 移动平均法B. 指数平滑法C. 回归分析D. 聚类分析答案:D10. 以下哪一项不是多元统计分析的内容?A. 聚类分析B. 判别分析C. 因子分析D. 描述性统计答案:D二、多项选择题(每题3分,共30分)11. 以下哪些是统计学的主要分支?A. 描述性统计B. 推断性统计C. 应用统计学D. 理论统计学答案:A, B, C, D12. 在统计学中,以下哪些是常见的概率分布?A. 正态分布B. 二项分布C. 泊松分布D. 均匀分布答案:A, B, C, D13. 以下哪些是统计学中用于描述数据集中趋势的统计量?A. 平均数B. 中位数C. 众数D. 方差答案:A, B, C14. 以下哪些是统计学中用于描述数据离散程度的统计量?A. 极差B. 标准差C. 方差D. 变异系数答案:A, B, C, D15. 以下哪些是统计学中用于描述数据分布形态的统计量?A. 偏度B. 峰度C. 标准差D. 四分位数间距答案:A, B, D16. 在统计推断中,以下哪些是常见的假设检验方法?A. Z检验B. t检验C. F检验D. 卡方检验答案:A, B, C, D17. 以下哪些是时间序列分析中常用的方法?A. 移动平均法B. 指数平滑法C. 自回归模型D. 季节性分解答案:A, B, C, D18. 在多元统计分析中,以下哪些是常用的方法?A. 聚类分析B. 判别分析C. 主成分分析D. 因子分析答案:A, B, C, D19. 以下哪些是统计学中用于数据可视化的方法?A. 条形图B. 折线图C. 散点图D. 饼图答案:A, B, C, D20. 以下哪些是统计学中用于数据预处理的方法?A. 数据清洗B. 数据转换C. 数据归一化D. 数据降维答案:A, B, C, D三、判断题(每题2分,共20分)21. 统计学中的样本量越大,估计的准确性就越高。
《非参数统计》试卷注意事项:1.本试卷适用于经济统计专业学生使用。
2.本试卷共6 页,满分100分,答题时间120分钟。
题号 一 二 三 四 总分 得分一、 选择题(本大题共10小题,每小题1分,共10分)1、以下对非参数检验的描述,哪一项是错误的( )。
A.非参数检验方法不依赖于总体的分布类型 B.应用非参数检验时不考虑被研究对象的分布类型 C.非参数检验的假定条件比较宽松D.非参数检验比较简便2、秩和检验又叫做( )A 、参数检验B 、Wilcoxon 检验C 、非参数检验D 、近似正态检验 3、( )同分校正后,统计量会变小。
A. Kruskal-Wallis 检验B.弗里德曼(Friedman )检验C. Mann-Whitney 检验D. Spearman 等级相关检验 4、配对比较的秩和检验的基本意思是:如果检验假设成立,则对样本来说( )。
A.正秩和的绝对值小于负秩和的绝对值 B.正秩和的绝对值大于负秩和的绝对值C.正秩和的绝对值与负秩和的绝对值不会相差很大D.正秩和的绝对值与负秩和的绝对值相等5、成组设计多个样本比较的秩和检验,当组数大于3时,统计量H 近似( )分布A 、正态B 、2C 、FD 、二项 6、Wilcoxon 符号秩检验不适用于( )。
A 位置的检验 B 连续总体 C 随机性的检验 D 配对样本的检验7、成组设计两样本比较的秩和检验中,描述不正确的是( )。
A .遇有相同数据,若在同一组,取平均秩次 B .遇有相同数据,若在同一组,按顺序编秩2.本评卷人C .遇有相同数据,若不在同一组,按顺序编秩D .遇有相同数据,若不在同一组,取其秩次平均值8、m=4,n=7,Tx=14的双侧检验,则( ) A. Ty=41,在显著性水平0.05时接受原假设 B. Ty=41,在显著性水平0.05时拒绝原假设 C. Ty=42,在显著性水平0.05时拒绝原假设 D. Ty=42,在显著性水平0.05时接受原假设 9、序列3 5 2 7 9 8 6的一致对数目为( )。
第一章1、指出下面的变量那一个属于分类变量( D)A.年龄B.工资C.汽车产量D.购买商品时的支付方式(现金、信用卡、支票)2指出下面的变量那一个属于顺序变量(D )A.年龄B.工资C.汽车产量D.员工对企业某项改革措施的态度(赞成、中立、反对)3、指出下面的变量那一的属于数值型变量(A )A.年龄B.性别C.企业类型D。
员工对企业某项改革措施的态度(赞成、中立、反对)4.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的总体是(B )A 2000个家庭B 200万个家庭C 2000个家庭的人均收入D 200万个家庭的总收入5.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的样本是(A )A2000个家庭B200万个家庭C2000个家庭的总收入D200万个家庭的人均收入6.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的参数是(D )A2000个家庭B200万个家庭C2000个家庭的人均收入D200万个家庭的人均收入7.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的统计量是(C )A2000个家庭B200万个家庭C2000个家庭的人均收入D200万个家庭的人均收入8一项研究机构从IT从业者中抽取500人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%回答他们的消费支付方式是用信用卡。
这里的总体是(A )AIT业的全部从业者B500个IT从业者CIT从业者的总收入DIT从业者的消费支付方式9下列不属于描述统计问题的是(A )A根据样本信息对总体进行的推断B了解数据分布的特征C分析感兴趣的总体特征D利用图、表或其他数据汇总工具分析数据10某大学的一位研究人员希望估计该大学本科生平均每月的生活费支出,为此,他调查了200名学生,发现他们平均每月生活费支出是500元。
统计期末考试试题及答案一、选择题(每题2分,共20分)1. 以下哪个是描述性统计中的集中趋势度量?A. 方差B. 标准差C. 平均数D. 极差2. 总体参数和样本统计量的区别在于:A. 总体参数是固定的,样本统计量是变化的B. 总体参数是变化的,样本统计量是固定的C. 两者都是固定的D. 两者都是变化的3. 假设检验中的零假设(H0)通常表示:A. 两组数据有显著差异B. 两组数据没有显著差异C. 数据服从正态分布D. 数据不服从正态分布4. 以下哪个是统计学中用来衡量变量之间线性关系强度的度量?A. 相关系数B. 方差C. 标准差D. 中位数5. 以下哪个是时间序列分析中常用的方法?A. 回归分析B. 方差分析C. 因子分析D. 移动平均6. 在统计推断中,P值的含义是:A. 观测到的样本统计量与零假设一致的概率B. 观测到的样本统计量与零假设不一致的概率C. 零假设为真时,观测到的样本统计量或更极端情况出现的概率D. 零假设为假时,观测到的样本统计量或更极端情况出现的概率7. 以下哪个是统计学中用来衡量数据分布形态的指标?A. 偏度B. 方差C. 标准差D. 相关系数8. 以下哪个是统计学中用来衡量数据分布集中程度的指标?A. 偏度B. 方差C. 标准差D. 峰度9. 在统计学中,样本容量增加时,样本均值的抽样分布将:A. 变得更加分散B. 变得更加集中C. 保持不变D. 无法确定10. 以下哪个是统计学中用来衡量数据变异程度的指标?A. 平均数B. 中位数C. 方差D. 极差二、简答题(每题10分,共30分)1. 解释什么是中心极限定理,并说明其在实际应用中的重要性。
2. 描述什么是回归分析,并解释其在预测和决策中的作用。
3. 简述什么是假设检验,并举例说明其在数据分析中的应用。
三、计算题(每题25分,共50分)1. 给定一组数据:10, 12, 14, 16, 18, 20, 22, 24, 26, 28。
非参数统计试题
一、试比较参数统计与非参数统计的区别和联系。
(15)
二、请你结合实际谈谈非参数统计的应用。
(15)
三、试验者把一只老鼠放入一个有两扇门的笼子里,并且把门都关上,一扇涂红色一扇涂
蓝
色,然后给老鼠播放一段音乐,再同时打开两扇门,记录老鼠逃出选择的门的颜色,重复了10次,发现有7次从红色门中出来,他的结论是:此时老鼠更喜欢红色。
他同时做另一个试验向10只老鼠注射某种药物,5分钟后有7只死亡,他断定这个结果具有偶然性,即药物不具有危险性。
试分析他的结论的合理性,如果是你,你怎样分析这一问题?可以通过适当计算来说明你的结论。
(20)
四、下列数据是从某个总体中,随机抽取的,数据如下:
34 38 56 23 41 52 37 53 46 37 29 48 35 43试问利用这一组数据我们能分析什么?(不需要计算,只说明怎样分析);若还有一组数据,如:38 45 27 34 46 63 34 48 30 43,我们又如何分析他们?写出你的分析思路。
(20)
五、下面是关于非参数统计的一段文献,试叙述其主要意思(30)。
统计心理学期末考试试题及答案一、选择题(每题2分,共20分)1. 统计心理学中,描述数据集中趋势的量度是:A. 方差B. 标准差C. 平均数D. 众数2. 下列哪项不是描述数据离散程度的统计量?A. 极差B. 标准差C. 均值D. 四分位数间距3. 假设检验中,我们通常使用的显著性水平是:A. 0.01B. 0.05C. 0.10D. 0.504. 相关系数的取值范围是:A. -1到1B. 0到1C. -∞到∞D. 1到∞5. 以下哪个选项是统计心理学中的非参数检验?A. t检验B. 方差分析C. 卡方检验D. 曼-惠特尼U检验二、判断题(每题1分,共10分)6. 标准差总是正值。
7. 相关系数的绝对值越接近1,表示变量间的线性关系越强。
8. 统计心理学中的样本量越大,估计的总体参数越准确。
9. 正态分布是统计心理学中唯一重要的分布。
10. 统计心理学中的回归分析只能用于线性关系。
三、简答题(每题5分,共20分)11. 简述统计心理学中样本和总体的区别。
12. 解释什么是统计显著性,并举例说明其在心理学研究中的应用。
13. 描述回归分析在心理学研究中的作用。
14. 什么是效应量,它在心理学研究中的重要性是什么?四、计算题(每题10分,共30分)15. 给定一组数据:2, 4, 6, 8, 10,计算其平均数、标准差和方差。
16. 如果一个心理学实验的样本大小为30,平均数为50,标准差为10,计算其95%置信区间。
17. 假设有两组数据,A组的均值为20,标准差为5,B组的均值为25,标准差为7,计算两组数据的t值,并且判断是否有统计学上的显著差异。
五、论述题(每题15分,共15分)18. 论述统计心理学在现代心理学研究中的重要性,并举例说明其在实际研究中的应用。
六、案例分析题(每题15分,共10分)19. 假设你是一名心理学研究者,你正在研究不同教育背景对个体心理健康的影响。
请设计一个实验方案,并使用适当的统计方法来分析数据。
每小题20分
1. 下面是DMBA 公司为了研究某一种癌症所做的试验。
Group 1和2分别代表试验的控制组和对照组。
下面是所得的试验老鼠的生存数据,*代表数据被右删失。
请回答下面问题:
Group 1: 164 188 190 192 206 209 213 216 220 230 234 246
265 304 216* 244*
Group 2: 156 163 198 205 232 233 239 240 261 280 296 323
204* 344*
1)请给出非参数的Kaplan-Meier 估计的公式,并计算在时间点t=156,164这两点的具体估计值,若假设在t=164处被删失,计算此处的估计值。
2)如果协变量分别取为1和0,请用Cox 模型模拟上述数据,给出计算协变量的系数的相关公式;
3)给出Kaplan-Meier 估计的Matlab 程序。
2. 下面是16个学生的体能测试数据: P81例3.14
82 53 70 73 103 71 69 80 54 38 87 91 62 75 65 77。
1) 请用顺序统计量方法构造置信度为95%的中位数的置信区间;
2) 编写上述计算的Matlab 程序
3. 下面是申请进入法学院学习的学生的LSAT 测试成绩和GPA 成绩。
LSAT: 576 635 558 578 666 580 555 661 651 605 653 575 545 572 594
GPA: 3.39 3.30 2.81 3.03 3.44 3.07 3.00 3.43 3.36 3.13 3.12 2.74
2.76 2.88
3.96
每个数据点用(,),i i i X Y Z 其中i Y 表示LSAT 成绩,i Z 表示GPA 成绩
1) 计算i Y 和i Z 的Pearson 相关系数 (只写出公式); (5分)
2) 使用Boostrap 方法估计相关系数的标准误差(只写出算法步骤);(5分)
3) 编写相应的Matlab 程序。
(10分)
4. 假设数据12(,,)n X X X 是来自真实密度为()f x 的简单随机字样,
1) 请给出该密度函数的直方图密度估计;
2) 求直方图密度估计的期望和方差;
3) 给出在平方损失下的最优窗宽公式,并证明此结论
5. 已知 随机变量i Y =()i i m x ξ+,设计变量i x 来自均匀分布[0,1]U ,i ξ是服从均值和方
差分别为0和2的正态分布,请回答下列问题(每问各5分)
1) 假设函数()m x 完全未知,请用局部回归给出它的一个估计(取p=1,只写出公式);
2) 写出最优窗宽选择公式;
3) 请用Matlab 实现上述计算(编写程序)[选Epanechikov 核,假设2()sin()m x x x =+]
4) 并作图比较()m x 和它的估计(并做出散点图);。