2015年《统计学》第八章相关与回归分析习题及满分答案
一、单选题
1.相关分析研究的是( A )
A、变量间相互关系的密切程度
B、变量之间因果关系
C、变量之间严格的相依关系
D、变量之间的线性关系
2.若变量X的值增加时,变量Y的值也增加,那么变量X和变量Y之间存在着(A)。
A、正相关关系
B、负相关关系
C、直线相关关系
D、曲线相关关系3.若变量X的值增加时,变量Y的值随之下降,那么变量X和变量Y之间存在着(B)。
A、正相关关系
B、负相关关系
C、直线相关关系
D、曲线相关关系 4.相关系数等于零表明两变量(B)。
A.是严格的函数关系
B.不存在相关关系
C.不存在线性相关关系
D.存在曲线线性相关关系
5.相关关系的主要特征是(B)。
A、某一现象的标志与另外的标志之间的关系是不确定的
B、某一现象的标志与另外的标志之间存在着一定的依存关系,但它们不是确定的关系
C、某一现象的标志与另外的标志之间存在着严格的依存关系
D、某一现象的标志与另外的标志之间存在着不确定的直线关系
6.时间数列自身相关是指( C )。
A、两变量在不同时间上的依存关系
B、两变量静态的依存关系
C、一个变量随时间不同其前后期变量值之间的依存关系
D、一个变量的数值与时间之间的依存关系
7.如果变量X和变量Y之间的相关系数为负1,说明两个变量之间
(D)。
A、不存在相关关系
B、相关程度很低
C、相关程度很高
D、完全负相关
8.若物价上涨,商品的需求量愈小,则物价与商品需求量之间(C)。
A、无相关
B、存在正相关
C、存在负相关
D、无法判断是否相关
9.相关分析对资料的要求是(A)。
A.两变量均为随机的
B.两变量均不是随机的 C、自变量是随机的,因变量不是随机的 D、自变量不是随机的,因变量是随机的
10.回归分析中简单回归是指(D)。 A.时间数列自身回归 B.两个变量之间的回归 C.变量之间的线性回归 D.两个变量之间的线性回归
11.已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为1000时,其生产成本为30000元,其中不随产量变化的成本为6000元,则成本总额对产量的回归方程为( A )
A. y=6000+24x
B. y=6+0.24x
C. y=24000+6x
D. y=24+6000x
12.直线回归方程中,若回归系数为负,则(B) A.表明现象正相关 B.表明现象负相关
中级经济师基础知识 第 1题:单选题(本题1分) 某公司产品当产量为1000单位时,其总成本为4000元;当产量为2000单位时,其总成本为5000,则设产量为x,总成本为y,正确的一元回归方程表达式应该是( )。 A、y = 3000 + x B、y = 4000 + 4x C、y = 4000 + x D、y = 3000 + 4x 【正确答案】:A 【答案解析】: 本题可列方程组:设该方程为y = a + bx,则由题意可得:4000 = a + 1000b5000 = a + 2000b 解该方程,得b=1,a=3000,所以方程为y = 3000 + x 第 2题:单选题(本题1分) 在回归分析中,估计回归系数的最小二乘法的原理是( )。 A、使得因变量观测值与均值之间的离差平方和最小 B、使得因变量估计值与均值之间的离差平方和最小 C、使得观测值与估计值之间的乘积和最小 D、使得因变量观测值与估计值之间的离差平方和最小 【正确答案】:D 【答案解析】: 较偏较难的一道题目。最小二乘法就是使得因变量的观测值与估计值之间的离差平方和最小来估计参数的一种方法 第 3题:多选题(本题2分) 关于相关分析和回归分析的说法,正确的的有() A、相关分析可以从一个变量的变化来推测另一个变量的变化 B、相关分析研究变量间相关的方向和相关的程度 C、相关分析中需要明确自变量和因变量 D、回归分析研究变量间相互关系的具体形式 E、相关分析和回归分析在研究方法和研究目的有明显区别 【正确答案】:BDE 【答案解析】: 相关分析与回归分析在研究目的和方法上具有明显的区别。 (1)、相关分析研究变量之间相关的方向和相关的程度,无法从一个变量的变化来推测另一变量的变化情况。 (2)、回归分析是研究变量之间相关关系的具体形式
统计学试题库含答案 Modified by JEEP on December 26th, 2020.
《统计学》试题库 第一章:统计基本理论和基本概念 一、填空题 1、统计是统计工作、统计学和统计资料的统一体,统计资料 是统计工作的成果,统计学是统计工作的经验总结和理论概括。 2、统计研究的具体方法主要有大量观察法、统计分组法、统计推断法和综合指标法。 3、统计工作可划分为设计、调查、整理和分析四个阶段。 4、随着研究目的的改变,总体和个体是可以相互转化的。 5、标志是说明个体特征的名称,指标是说明总体数量特征的概念及其数值。 6、可变的数量标志和所有的统计指标称为变量,变量的具体数值称为变量值。 7、变量按其数值变化是否连续分,可分为连续变量和离散变量,职工人 数、企业数属于离散变量;变量按所受影响因素不同分,可分为确定性变量和随机变量。 8、社会经济统计具有数量性、总体性、社会性、具体性等特点。 9、一个完整的统计指标应包括指标名称和指标数值两个基本部分。 10、统计标志按是否可用数值表示分为品质标志和数量标志;按在 各个单位上的具体表现是否相同分为可变标志和不变标志。 11、说明个体特征的名称叫标志,说明总体特征的名称叫指标。 12、数量指标用绝对数表示,质量指标用相对数或平均数表示。 13、在统计中,把可变的数量标志和统计指标统称为变量。 14、由于统计研究目的和任务的变更,原来的总体变成总体单位, 那么原来的指标就相应地变成标志,两者变动方向相同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。(×) 2、运用大量观察法,必须对研究对象的所有或足够多的单位进行观察调查。(√) 3、统计学是对统计实践活动的经验总结和理论概括。(√)
统计学论文(回归分析)
◆统计小论文11财一金一凡 11060513 指数回归分析 ●摘要:指数,根据某些采样股票或债券的价格所设计并计算出来的统计数 据,用来衡量股票市场或债券市场的价格波动情形。 ●经济学概念:从指数的定义上看,广义地讲,任何两个数值对 指数函数图像 比形成的相对数都可以称为指数;狭义地讲,指数是用于测定多个项目在不同场合下综合变动的一种特殊相对数。 指数的应用和理论不断发展,逐步扩展到工业生产、进出口贸易、铁路运输、工资、成本、生活费用、股票证券等各个方面。其中,有些指数,如零售商品价格指数、生活消费价格指数,同人们的日常生活休戚相关;有些指数,如生产资料价格指数、股票价格指数等,则直接影响人们的投资活动,成为社会经济的晴雨表。至今,指数不仅是分析社会经济的景气预测的
重要工具,而且被应用于经济效益、生活质量、综合国力和社会发展水平的综合评价研究。 引言:在这个市场经济发达的年代,企业的发展尤为突出,针对年度销售额进行的指数回归分析,能够有效的对企业进行监管和提高发展水平。通过对标准误差、残差、观测值等的回归分析,减少决策失误,使企业更好的发展。销售额是企业的命脉,也是企业在经营过程中的最重要的参考指标,针对年度销售额的指数回归分析,切实保障了企业在当今竞争中的地位与经济形势。 一、一元线性回归模型的基本理论 首先是对线性回归模型基本指数介绍:随机变量y与一般变量x的理一元线性回归模型表示如下: yt = b0 + b1 xt +ut(1)上式表示变量yt 和xt之间的真实关系。其中yt 称作被解释变量(或相依变量、因变量),xt称作解释变量(或独立变量、自变量),ut称作随机误差项,b0称作常数项(截距项),b1称作回归系数。 在模型 (1) 中,xt是影响yt变化的重要解释变量。b0和b1也称作回归参数。这两个量通常是未知的,需要估计。t表示序数。当t表示时间序数时,xt和yt称为时间序列数据。当t表示非时间序数时,xt和yt称为截面数据。ut则包括了除xt以外的影响yt变化的众多微小因素。ut的变化是不可控的。上述模型可以分为两部分。(1)b0 +b1 xt是非随机部分;(2)ut是随机部分。 二、回归模型初步建立与检验
单选 问题:下列不属于相关关系的现象是( 3 )。 选项一:企业的投资与产出 选项二:居民的收入与存款 选项三:电视机产量与西红柿产量 选项四:商品销售额与商品销售价格 问题:抽样调查中的抽样误差是指(3 ) 选项一:在调查过程中由于观察、测量等差错所引起的误差 选项二:在调查中违反随机原则出现的系统误差 选项三:随机抽样而产生的代表性误差 选项四:人为原因所造成的误差 问题:企业职工工资水平比上年提高5%,职工人数增加2%,则企业工资总额增长( 2 )。 选项一:10.0% 选项二:7.1% 选项三:7.0% 选项四:7.2% 问题:在假设检验中,原假设与备择假设( 3 ) 选项一:都有可能被接受 选项二:都有可能不被接受 选项三:只有一个被接受而且必有一个被接受 选项四:原假设一定被接受,备择假设不一定被接受 问题:小王收集了1978年以来历年我国人均GDP与人均消费额的资料,如果要反映这一时期我国生产与消费的关系,用什么图形最为合适?(2 ) 选项一:直方图
选项二:散点图 选项三:饼图 选项四:折线图 问题:若回归直线方程中的回归系数为0,则直线相关系数( 3 )。 选项一:r=1 选项二:r=-1 选项三:r=0 选项四:r 无法确定 问题:若消费者价格指数为95%,则表示( 4 )。 选项一:所有商品的价格都上涨了 选项二:所有商品的价格都下跌了 选项三:商品价格有涨有落,总体来说是上涨了 选项四:商品价格有涨有落,总体来说是下跌了 问题:某连续变量数列末位组为开口组,下限为200,相邻组组中值为170,则末位组中值为( 1 )。选项一:230 选项二:200 选项三:210 选项四:180 问题:若两变量的r=0.4,且知检验相关系数的临界值为,则下面说法正确的是( 3 )。 选项一:40%的点都密集分布在一条直线的周围 选项二:40%的点低度相关 选项三:两变量之间是正相关 选项四:两变量之间没有线性关系 问题:下列指标中包含有系统性误差的是(1 ) 选项一:SSA 选项二:SSE
第8章 非线性回归 思考与练习参考答案 8.1 在非线性回归线性化时,对因变量作变换应注意什么问题? 答:在对非线性回归模型线性化时,对因变量作变换时不仅要注意回归函数的形式, 还要注意误差项的形式。如: (1) 乘性误差项,模型形式为 e y AK L αβε =, (2) 加性误差项,模型形式为y AK L αβ ε = + 对乘法误差项模型(1)可通过两边取对数转化成线性模型,(2)不能线性化。 一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式,为了方便通常省去误差项,仅考虑回归函数的形式。 8.2为了研究生产率与废料率之间的关系,记录了如表8.15所示的数据,请画出散点图,根据散点图的趋势拟合适当的回归模型。 表8.15 生产率x (单位/周) 1000 2000 3000 3500 4000 4500 5000 废品率y (%) 5.2 6.5 6.8 8.1 10.2 10.3 13.0 解:先画出散点图如下图: 5000.00 4000.003000.002000.001000.00x 12.00 10.00 8.006.00 y
从散点图大致可以判断出x 和y 之间呈抛物线或指数曲线,由此采用二次方程式和指数函数进行曲线回归。 (1)二次曲线 SPSS 输出结果如下: Model Summ ary .981 .962 .942 .651 R R Square Adjusted R Square Std. E rror of the Estimate The independent variable is x. ANOVA 42.571221.28650.160.001 1.6974.424 44.269 6 Regression Residual Total Sum of Squares df Mean Square F Sig.The independent variable is x. Coe fficients -.001.001-.449-.891.4234.47E -007.000 1.417 2.812.0485.843 1.324 4.414.012 x x ** 2 (Constant) B Std. E rror Unstandardized Coefficients Beta Standardized Coefficients t Sig. 从上表可以得到回归方程为:72? 5.8430.087 4.4710y x x -=-+? 由x 的系数检验P 值大于0.05,得到x 的系数未通过显著性检验。 由x 2的系数检验P 值小于0.05,得到x 2的系数通过了显著性检验。 (2)指数曲线 Model Summ ary .970 .941 .929 .085 R R Square Adjusted R Square Std. E rror of the Estimate The independent variable is x.
统计学试题库及答案 Document serial number【KKGB-LBS98YT-BS8CB-BSUT-BST108】
《统计学》试题库 知识点一:统计基本理论和基本概念 一、填空题 1、统计是、和的统一体,是统计工作的成果,是统计工作的经验总结和 理论概括。 2、统计研究的具体方法主要有、、和。 3、统计工作可划分为、、和四个阶段。 4、随着的改变,总体和是可以相互转化的。 5、标志是说明,指标是说明。 6、可变的数量标志和所有的统计指标称为,变量的具体数值称为。 7、变量按分,可分为连续变量和离散变量,职工人数、企业数属于变量;变量按分,可 分为确定性变量和随机变量。 8、社会经济统计具有、、、等特点。 9、一个完整的统计指标应包括和两个基本部分。 10、统计标志按是否可用数值表示分为和;按在各个单位上的具体表现是否相同分为 和。 11、说明特征的名称叫标志,说明特征的名称叫指标。 12、数量指标用表示,质量指标用或平均数表示。 13、在统计中,把可变的和统称为变量。 14、由于统计研究目的和任务的变更,原来的变成,那么原来的指标就相应地变成标志,两者 变动方向相同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。 3、统计学是对统计实践活动的经验总结和理论概括。 4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。 5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。 6、某同学计算机考试成绩80分,这是统计指标值。 7、统计资料就是统计调查中获得的各种数据。 8、指标都是用数值表示的,而标志则不能用数值表示。 9、质量指标是反映工作质量等内容的,所以一般不能用数值来表示。 10、总体和总体单位可能随着研究目的的变化而相互转化。 11、女性是品质标志。
1、统计学与统计工作的研究对象就是完全一致的。F 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。T 3、统计学就是对统计实践活动的经验总结与理论概括。T 4、一般而言,指标总就是依附在总体上,而总体单位则就是标志的直接承担者。T 5、数量指标就是由数量标志汇总来的,质量指标就是由品质标志汇总来的。F 6、某同学计算机考试成绩80分,这就是统计指标值。F 7、统计资料就就是统计调查中获得的各种数据。F 8、指标都就是用数值表示的,而标志则不能用数值表示。F 9、质量指标就是反映工作质量等内容的,所以一般不能用数值来表示F。 10、总体与总体单位可能随着研究目的的变化而相互转化。T11、女性就是品质标志。T 12、以绝对数形式表示的指标都就是数量指标以相对数或平均数表示的指标都就是质量指标 T 13、构成统计总体的条件就是各单位的差异性。F 14、变异就是指各种标志或各种指标之间的名称的差异。F 9、调查某校学生,学生“一天中用于学习的时间”就是(A)A、标志 13、研究某企业职工文化程度时,职工总人数就是(B) B数量指标 14、某银行的某年末的储蓄存款余额(C)C、可能就是统计指标,也可能就是数量标志 15、年龄就是(B)B、离散型变量 四、多项选择题 1、全国第四次人口普查中(BCE)A、全国人口数就是统计总体B、总体单位就是每一个人 C、全部男性人口数就是统计指标 D、男女性别比就是总体的品质标志 E、人的年龄就是变量 2、统计总体的特征表现为(ACD)A、大量性B、数量性C、同质D、差异性E、客观性 3、下列指标中属于质量指标的有(ABCDE)A、劳动生产率B、产品合格率C、人口密度 D、产品单位成本 E、经济增长速度 4、下列指标中属于数量指标的有(ABC) A、国民生产总值B、国内生产总值C、固定资产净值D、劳动生产率E、平均工资 5、下列标志中属于数量标志的有(BD)A、性别B、出勤人数C、产品等级D、产品产量E 文化程度 6、下列标志中属于品质标志的有(ABE)A、人口性别B、工资级别C、考试分数D、商品使用寿命E、企业所有制性质 7、下列变量中属于离散型变量的有(BE)A、粮食产量B、人口年龄C、职工工资 D、人体身高 E、设备台数 8、研究某企业职工的工资水平,“工资”对于各个职工而言就是(ABE)A、标志B、数量标
1 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据: 求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。 α=)。 (5)检验回归方程线性关系的显著性(0.05 (6)如果某地区的人均GDP为5000元,预测其人均消费水平。 (7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 解:(1)
可能存在线性关系。 (2)相关系数: 系数a 模型非标准化系数标准系数 t Sig. 相关性 B标准误差试用版零阶偏部分 1(常量).003 人均GDP.309.008.998.000.998.998.998 a. 因变量: 人均消费水平 有很强的线性关系。 (3)回归方程:734.6930.309 y x =+ 系数a 模型非标准化系数标准系数t Sig.相关性
回归系数的含义:人均GDP没增加1元,人均消费增加元。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。 系数(a) 模型非标准化系数标准化系数 t显著性B标准误Beta 1(常量) 人均GDP(元) %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(4) 模型汇总 模型R R 方调整 R 方标准估计的误 差 1.998a.996.996 a. 预测变量: (常量), 人均GDP。 人均GDP对人均消费的影响达到%。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。 模型摘要 模型R R 方调整的 R 方估计的标准差
2. 数据筛选的主要目的是( A 、发现数据的错误 C 、找出所需要的某类数据 3. 为了调查某校学生的购书费用支出, B 、对数据进行排序 D 纠正数据中的错误 将全校学生的名单按拼音顺序排列后,每 ) A H 0:二=0.15;二-0.15 B H o :二二 0.15;二=0.15 C H 0: 一 - 0.15;二:: 0.15 D H 0:二乞 0.15;二 0.15 9. 若甲单位的平均数比乙单位的平均数小, 大,则( )。 A 、甲单位的平均数代表性比较大 C 甲单位的平均数代表性比较小 10. 某组的向上累计次数表明( A 、 大于该组上限的次数是多少 B 、 小于该组下限的次数是多少 但甲单位的标准差比乙单位的标准差 B 、两单位的平均数一样大 D 、无法判断 1.当正态总体方差未知时,在大样本条件下,估计总体均值使用的分布是 ( A )。 z 分布 B 、t 分布 F 分布 D 、 2 分布 A 、比平均数高出2个标准差 C 等于2倍的平均数 D 5.峰态通常是与标准正态分布相比较而言的。 则峰态系数的值( )。 B 比平均数低2个标准差 等于2倍的标准差 如果一组数据服从标准正态分布, A =3 C 、v 3 6. 若相关系数r=0,则表明两个变量之间( A 、相关程度很低 C 不存在任何关系 7. 如果所有变量值的频数都减少为原来的 1/3, 均数( )。 A 、不变 B C 减少为原来的1/3 D > 3, =0 )。 不存在线性相关关系 存在非线性相关关系 而变量值仍然不变,那么算术平 扩大到原来的3倍 不能预测其变化 8. 某贫困地区所估计营养不良的人高达 15%然而有人认为这个比例实际上还要 高,要检验该说法是否正确,则假设形式为( )。 隔50名学生抽取一名进行调查,这种调查方式是( A 、简单随机抽样 B 、分层抽样 C 、系统抽样 D 、整群抽样 4. 如果一组数据标准分数是(-2 ),表明该数据( )。
统计学题库及题库答案 ) B 、进行调查的时间 D 、调查资料报送的时间 2、对某城市工业企业未安装设备进行普查,总体单位是( ) A 、工业企业全部未安装设备 B 、企业每一台未安装设备 C 、每个工业企业的未安装设备 D 、每一个工业企业 3、 对比分析不同性质的变量数列之间的变异程度时 ,应使用( )。 A 、全距 B 、平均差 C 、标准差 D 、变异系数 4、 在简单随机重复抽样条件下,若要求允许误差为原来的 2/3,则样本容量( ) A 、扩大为原来的 3倍 B 、扩大为原来的 2/3倍 C 、扩大为原来的 4/9倍 D 、扩大为原来的 2.25倍 5、 某地区组织职工家庭生活抽样调查 ,已知职工家庭平均每月每人生活费收入的标准差为 可靠程度为0.9545,极限误差为1元,在简单重复抽样条件下,应抽选( )。 A 、576 户 B 、144 户 C 、100 户 D 、288 户 6、当一组数据属于左偏分布时,则( ) A 、 平均数、中位数与众数是合而为一的 B 、 众数在左边、平均数在右边 C 、 众数的数值较小,平均数的数值较大 D 、众数在右边、平均数在左边 7、 某连续变量数列,其末组组限为 500以上,又知其邻组组中值为 480,则末组的组中值为( ) A 、 520 B 、 510 C 、 500 D 、 490 8、 用组中值代表组内变量值的一般水平有一定的假定性,即( ) A 、 各组的次数必须相等 B 、 变量值在本组内的分布是均匀的 C 、 组中值能取整数 D 、 各组必须是封闭组 9、 XjX 2’…,X n 是来自总体的样本,样本均值 X 服从( )分布 A 、N(F 2) B.、N(0,1) C 、 N(n 巴nb 2 ) N(=) D 、 n 10、测定变量之间相关密切程度的指标是( ) A 、估计标准误 B 、两个变量的协方差 C 、相关系数 D 、两个变量的标准差 二、多项选择题(每题 2分,共10分) 1、抽样推断中,样本容量的多少取决于( )。 A 、总体标准差的大小 B 、 允许误差的大小 c 、抽样估计的把握程度 D 、总体参 题库1 、单项选择题(每题 2分,共20分) 1、调查时间是指( A 、调查资料所属的时间 C 、调查工作的期限 12元,要求抽样调查的
多元线性回归模型 一、单项选择题 1.在由30n =的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定 系数为,则调整后的多重决定系数为( D ) A. B. C. 下列样本模型中,哪一个模型通常是无效 的(B ) A. i C (消费)=500+i I (收入) B. d i Q (商品需求)=10+i I (收入)+i P (价格) C. s i Q (商品供给)=20+i P (价格) D. i Y (产出量)=0.6i L (劳动)0.4i K (资本) 3.用一组有30个观测值的样本估计模型01122t t t t y b b x b x u =+++后,在的显著性水平上对 1b 的显著性作t 检验,则1b 显著地不等于零的条件是其统计量t 大于等于( C ) A. )30(05.0t B. )28(025.0t C. )27(025.0t D. )28,1(025.0F 4.模型 t t t u x b b y ++=ln ln ln 10中,1b 的实际含义是( B ) A.x 关于y 的弹性 B. y 关于x 的弹性 C. x 关于y 的边际倾向 D. y 关于x 的边际倾向 5、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明 模型中存在( C ) A.异方差性 B.序列相关 C.多重共线性 D.高拟合优度 6.线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中,检验0:0(0,1,2,...) t H b i k ==时,所用的统计量 服从( C ) (n-k+1) (n-k-2) (n-k-1) (n-k+2) 7. 调整的判定系数 与多重判定系数 之间有如下关系( D ) A.2 211n R R n k -=-- B. 22111 n R R n k -=--- C. 2211(1)1n R R n k -=-+-- D. 2211(1)1n R R n k -=---- 8.关于经济计量模型进行预测出现误差的原因,正确的说法是( C )。 A.只有随机因素 B.只有系统因素 C.既有随机因素,又有系统因素 、B 、C 都不对 9.在多元线性回归模型中对样本容量的基本要求是(k 为解释变量个数):( C ) A n ≥k+1 B n 统计学题库及题库详细答案 ————————————————————————————————作者:————————————————————————————————日期: 统计学题库及题库答案 题库1 一、单项选择题(每题2分,共20分) 1、调查时间是指( ) A 、调查资料所属的时间 B 、进行调查的时间 C 、调查工作的期限 D 、调查资料报送的时间 2、对某城市工业企业未安装设备进行普查,总体单位是( )。 A 、工业企业全部未安装设备 B 、企业每一台未安装设备 C 、每个工业企业的未安装设备 D 、每一个工业企业 3、对比分析不同性质的变量数列之间的变异程度时,应使用( )。 A 、全距 B 、平均差 C 、标准差 D 、变异系数 4、在简单随机重复抽样条件下,若要求允许误差为原来的2/3,则样本容量( ) A 、扩大为原来的3倍 B 、扩大为原来的2/3倍 C 、扩大为原来的4/9倍 D 、扩大为原来的2.25倍 5、某地区组织职工家庭生活抽样调查,已知职工家庭平均每月每人生活费收入的标准差为12元,要求抽样调查的可靠程度为0.9545,极限误差为1元,在简单重复抽样条件下,应抽选( )。 A 、576户 B 、144户 C 、100户 D 、288户 6、当一组数据属于左偏分布时,则( ) A 、平均数、中位数与众数是合而为一的 B 、众数在左边、平均数在右边 C 、众数的数值较小,平均数的数值较大 D 、众数在右边、平均数在左边 7、某连续变量数列,其末组组限为500以上,又知其邻组组中值为480,则末组的组中值为( )。 A 、520 B 、 510 C 、 500 D 、490 8、用组中值代表组内变量值的一般水平有一定的假定性,即( ) A 、各组的次数必须相等 B 、变量值在本组内的分布是均匀的 C 、组中值能取整数 D 、各组必须是封闭组 9、 n X X X ,,,21 是来自总体 ),(2 N 的样本,样本均值X 服从( )分布 A 、),(2 N B.、)1,0(N C.、 ),(2 n n N D 、) , (2 n N 10、测定变量之间相关密切程度的指标是( ) A 、估计标准误 B 、两个变量的协方差 C 、相关系数 D 、两个变量的标准差 二、多项选择题(每题2分,共10分) 统计学题库及题库答案 题库1 一、单项选择题(每题2分,共20分) 1、调查时间就是指( ) A 、调查资料所属的时间 B 、进行调查的时间 C 、调查工作的期限 D 、调查资料报送的时间 2、对某城市工业企业未安装设备进行普查,总体单位就是( )。 A 、工业企业全部未安装设备 B 、企业每一台未安装设备 C 、每个工业企业的未安装设备 D 、每一个工业企业 3、对比分析不同性质的变量数列之间的变异程度时,应使用( )。 A 、全距 B 、平均差 C 、标准差 D 、变异系数 4、在简单随机重复抽样条件下,若要求允许误差为原来的2/3,则样本容量( ) A 、扩大为原来的3倍 B 、扩大为原来的2/3倍 C 、扩大为原来的4/9倍 D 、扩大为原来的2、25倍 5、某地区组织职工家庭生活抽样调查,已知职工家庭平均每月每人生活费收入的标准差为12元,要求抽样调查的可靠程度为0、9545,极限误差为1元,在简单重复抽样条件下,应抽选 ( )。 A 、576户 B 、144户 C 、100户 D 、288户 6、当一组数据属于左偏分布时,则( ) A 、平均数、中位数与众数就是合而为一的 B 、众数在左边、平均数在右边 C 、众数的数值较小,平均数的数值较大 D 、众数在右边、平均数在左边 7、某连续变量数列,其末组组限为500以上,又知其邻组组中值为480,则末组的组中值为 ( )。 A 、520 B 、 510 C 、 500 D 、490 8、用组中值代表组内变量值的一般水平有一定的假定性,即( ) A 、各组的次数必须相等 B 、变量值在本组内的分布就是均匀的 C 、组中值能取整数 D 、各组必须就是封闭组 9、n X X X ,,,21 就是来自总体 ),(2 N 的样本,样本均值X 服从( )分布 A 、),(2 N B 、、)1,0(N C 、、),(2 n n N D 、) ,(2n N 10、测定变量之间相关密切程度的指标就是( ) A 、估计标准误 B 、两个变量的协方差 C 、相关系数 D 、两个变量的标准差 二、多项选择题(每题2分,共10分) 1.1回归分析的基本思想及其初步应用 一、选择题 1. 某同学由x 与y 之间的一组数据求得两个变量间的线性回归方程为y bx a =+,已知:数据x 的平 均值为2,数据 y 的平均值为3,则 ( ) A .回归直线必过点(2,3) B .回归直线一定不过点(2,3) C .点(2,3)在回归直线上方 D .点(2,3)在回归直线下方 2. 在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则Y 与X 之间的回归直线方程为( )A . y x 1=+ B . y x 2=+ C . y 2x 1=+ D. y x 1=-3. 在对两个变量x ,y 进行线性回归分析时,有下列步骤: ①对所求出的回归直线方程作出解释; ②收集数据(i x 、i y ) ,1,2i =,…,n ; ③求线性回归方程; ④求未知参数; ⑤根据所搜集的数据绘制散点图 如果根据可行性要求能够作出变量,x y 具有线性相关结论,则在下列操作中正确的是( ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③① 4. 下列说法中正确的是( ) A .任何两个变量都具有相关关系 B .人的知识与其年龄具有相关关系 C .散点图中的各点是分散的没有规律 D .根据散点图求得的回归直线方程都是有意义的 5. 给出下列结论: (1)在回归分析中,可用指数系数2 R 的值判断模型的拟合效果,2 R 越大,模型的拟合效果越好; (2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好; (3)在回归分析中,可用相关系数r 的值判断模型的拟合效果,r 越小,模型的拟合效果越好; (4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 以上结论中,正确的有( )个. A .1 B .2 C .3 D .4 6. 已知直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A.y 平均增加1.5个单位 B.y 平均增加2个单位 C.y 平均减少1.5个单位 D. y 平均减少2个单位 7. 下面的各图中,散点图与相关系数r 不符合的是( ) 第一章导论 一、填空题 1.统计一词有三种涵义,即______、________和_________,其中________是基础。 2.经济统计学的特点可概括为_______、_______和_________。 3.经济统计的职能有________、_________和_________三个方面。 4.总体是_________。按总体单位是否可以计数,总体分为___________和 ___________。 5.标志是总体单位所具有的________和_______,按表现是否相同分为_____和______两种。 6.统计指标由___________和___________两部分构成。 7.变量根据其取值是否连续分为_____________和______________。 8.统计总体具有五个基本特点,即 _______、______、_______、______ 和______ 。 9.按说明现象的性质不同,标志可以分为_______和_________两种。 10.统计指标按反映的数量特征不同,可分为________ 和________。 11.一个完整的统计工作过程可以划分为________、_______、_________和______四个阶段。 二、单项选择题 1.统计一词的三种涵义是() A.统计活动、统计资料、统计学 B.统计调查、统计整理、统计分析 C.统计设计、统计分组、统计预测 D.统计方法、统计分析、统计预测 2. 统计一词有三种涵义,其中()是基础。 A.统计活动 B.统计学 C.统计方法 D.统计资料 3.统计工作的成果是( ) A统计学 B统计工作 C统计资料 D统计分析和预测 4.()是统计的基础职能。 A.管理功能 B.咨询功能 C.信息功能 D.监督功能 5.一个统计总体()。 A.只能有一个标志 B.只能有一个指标 C.可以有多个标志 D.可以有多个指标 6. 属于连续变量的是()。 A. 职工人数 B.机器台数 C.企业数 D.利润额 7. 下列各项中属于时点指标的是()。 《统计学》试题库 知识点一:统计基本理论和基本概念 一、填空题 1、统计是、和的统一体,是统计工作的成果,是统计工作的经验总结和理论概括。 2、统计研究的具体方法主要有、、和。 3、统计工作可划分为、、和四个阶段。 4、随着的改变,总体和是可以相互转化的。 5、标志是说明,指标是说明。 6、可变的数量标志和所有的统计指标称为,变量的具体数值称为。 7、变量按分,可分为连续变量和离散变量,职工人数、企业数属于变量;变量按分,可分为确定性变 量和随机变量。 8、社会经济统计具有、、、等特点。 9、一个完整的统计指标应包括和两个基本部分。 10、统计标志按是否可用数值表示分为和;按在各个单位上的具体表现是否相同分为 和。 11、说明特征的名称叫标志,说明特征的名称叫指标。 12、数量指标用表示,质量指标用或平均数表示。 13、在统计中,把可变的和统称为变量。 14、由于统计研究目的和任务的变更,原来的变成,那么原来的指标就相应地变成标志,两者变动方向相 同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。 3、统计学是对统计实践活动的经验总结和理论概括。 4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。 5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。 6、某同学计算机考试成绩80分,这是统计指标值。 7、统计资料就是统计调查中获得的各种数据。 8、指标都是用数值表示的,而标志则不能用数值表示。 9、质量指标是反映工作质量等内容的,所以一般不能用数值来表示。 10、总体和总体单位可能随着研究目的的变化而相互转化。 11、女性是品质标志。 12、以绝对数形式表示的指标都是数量指标,以相对数或平均数表示的指标都是质量指标。 13、构成统计总体的条件是各单位的差异性。 14、变异是指各种标志或各种指标之间的名称的差异。 1 下面是7个地区2000年的人均国生产总值(GDP)和人均消费水平的统计数据:地区人均GDP/元人均消费水平/元 北京上海 22460 11226 34547 4851 5444 2662 4549 7326 4490 11546 2396 2208 1608 2035 求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。 (5)检验回归方程线性关系的显著性(0.05 α=)。 (6)如果某地区的人均GDP为5000元,预测其人均消费水平。 (7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 解:(1) 可能存在线性关系。 (2)相关系数: (3)回归方程:734.6930.309 y x =+ 回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规排版。 系数(a) 模型非标准化系数标准化系数 t 显著性B 标准误Beta 1 (常量)734.693 .540 5.265 0.003 人均GDP(元)0.309 0.008 0.998 36.492 0.000 a. 因变量: 人均消费水平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% (4) 模型汇总 模型R R 方调整 R 方标准估计的误 差 1 .998a.996 .996 247.303 a. 预测变量: (常量), 人均GDP。 人均GDP对人均消费的影响达到99.6%。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规排版。 模型摘要 模型R R 方调整的 R 方估计的标准差 1 .998(a) 0.996 0.996 247.303 a. 预测变量:(常量), 人均GDP(元)。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 第九章 相关与回归分析 1.从某一行业中随机抽取12家企业,所得产量与其单位成本数据如下: 企业编号 产量(台) 单位成本(台/元) 企业编号 产量(台) 单位成本(台/元) 1 40 185 7 84 156 2 42 175 8 100 142 3 50 172 9 116 140 4 5 5 170 10 125 135 5 65 169 11 130 130 6 78 164 12 140 124 (1)绘制产量与单位成本的散点图,判断二者之间的关系形态。 关系形态:线性负相关 (2)计算产量与单位成本之间的线性相关系数,并对相关系数的显著性进行检验(05.0=α),说明二者之间的关系强度。 设产量为x 台,单位成本y 台/元,由Excel 的回归分析工具计算得 线性相关系数R=0.987244 检验统计量t=19.608669 t α/2(n-2)= 2.228138852 t> t α/2(n-2),说明相关系数是显著的。关系强度为高度线性相关。 (3)以产量为自变量,单位成本为因变量,拟合直线回归方程,并对方程和系数进行显著性检验。 由Excel 的回归分析工具计算得 y = -0.5524x + 202.35 R2 = 0.9747 检验统计量t=19.608669 t α/2(n-2)= 2.228138852 t> t α/2(n-2),说明回归方程和相关系数是显著的。 2.下面是某年7个地区的人均GDP 和人均消费水平的统计数据: 地区 人均GDP (元)X 人均消费水平(元) Y 1 22460 7326 2 11226 4490 3 34547 11546 4 4851 2396 5 5444 2208 6 2662 1608 7 4549 2035 (1)画出相关图,并判断人均GDP 与人均消费水平之间对相关方向; 线性正相关 (2)计算相关系数,指出人均GDP 与人均消费水平之间的相关方向和相关程度; (3)以人均GDP 为自变量,人均消费水平作因变量,拟合直线回归方程; (4)计算估计标准误差 yx S ; (5)对回归系数进行检验(显著性水平取0.05); (6)在95%的概率保证下,求当人均GDP 为5000元时,人均消费水平的置信区间。 第三章数据分布特征的描述 1.下面就是我国人口与国土面积资料: ────────┬─────────────── │根据第四人次人口普查调整数 指标├──────┬──────── │1982年│1990年 ────────┼──────┼──────── 人口总数│ 101654 │ 114333 男│ 52352 │ 58904 女│ 49302 │ 55429 ────────┴──────┴──────── 国土面积960万平方公里。 试计算所能计算的全部相对指标。 2.某企业2014年某产品单位成本520元,2015年计划规定在上年的基础上单位成本降低5%,实际降低6%,试确定2015年单位成本的计划数与实际数,并计算2015年单位成本比计划降低多少? 3.某市共有50万人,其市区人口占85%,郊区人口占15%,为了解该市居民的 收入水平,在市区抽查了1500户居民,每人平均收入为1400元;在郊区抽查了1000 户居民,每人年平均收入为1380元,若这两个抽样数字具有代表性,则计算该市居 民年平均收入应采用哪一种形式的平均数方法进行计算? 根据上表资料计算:(1)哪个班级统计学成绩好?(2)哪个班级的成绩分布差异大?哪个班级的成绩更稳定? 5.2014年8月份甲、乙两农贸市场资料如下: ────┬──────┬─────────┬───────── 品种│价格(元/斤)│甲市场成交额(万元)│乙市场成交量(万斤) ────┼──────┼─────────┼─────────甲│ 1、2 │ 1、2 │ 2 乙│ 1、4 │ 2、8 │ 1 丙│ 1、5 │ 1、5 │ 1 ────┼──────┼─────────┼───────── 合计│──│ 5、5 │ 4 ────┴──────┴─────────┴───────── 试问哪一个市场农产品的平均价格较高?并说明原因。 6.某车间有甲、乙两个生产组,甲组平均每个工人的日产量36件,标准差9、6件。乙组 要求:(1)计算乙组平均每个工人的日产量与标准差。 (2)比较甲、乙两个生产小组哪个组的平均日产量更有代表性?比较哪组的产量更稳定?比较哪组的产量差异大? 第四章抽样调查 ,检验结果如下: 1.某进出口公司出口茶叶,为检查其每包规格的重量,抽取样本100包 (2)估计这批茶叶每包平均重量的范围,确定就是否达到规格要求。 2.在某储蓄所随机抽查484户,得到如下资料: 试以 (1)平均每张存单的活期存款额; (2)活期存款额60000元以上的户数所占的比例。 3.一个电视台的节目主持人欲了解观众对其主持节目的收视情况,随机抽取500名观众统计学题库及题库详细答案
统计学试题库及试题库答案解析
回归分析练习题(有答案)
统计学练习题及答案
《统计学》最新考试题库及答案
回归分析练习题及参考答案
《统计学》相关与回归分析
统计学练习题及答案