当前位置:文档之家› 统计学第十一章课后习题答案

统计学第十一章课后习题答案

统计学第十一章课后习题答案
统计学第十一章课后习题答案

11.1

(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。

散点图如下:

从上图,可以看出产量与生产费用的关系为正的线性相关关系。

(2)计算产量与生产费用之间的线性相关系数。

r=0.920232

(3)对相关系数的显著性进行检验(a=0.05),并说明二者之间的关系系数。 假设:H o :ρ=0,H 1:ρ≠0 计算检验的统计量:t=|r|√

n?21?r2

=|0.92-232|√

12?2

1?0.9202322

=7.435

当a=0。05时,t 0.052?(12-2)=2.228。由于检验统计量t=7.435>t a 2?=2.228,拒绝原假设。表明产量与生产费用之间的线性关系显著。

11.2

(1)散点图如下:

(2)r=0.8621,正相关

11.3

(1)0

?β=10表示当X=0时Y 的期望值为10 (2)1

?β=-0.5表示X 每增加1个单位,Y 平均下降0.5个单位。 (3)X=6时,E (Y )=10-0.5x6=7

11.4.

(1)%904

3636

2=+=+==

SSE SSR SSR SST SSR R ,%902=R 表示,在因变量y 取值的变差中,有90%可以由x 与y 之间的线性关系来解释。 (2)5.02

184

2n =--=

SSE S e 。5.0=e S 表示,当用x 来预测y 时,平均的预测

误差为0.5.

11.5

(1)散点图如下:

(2)r=0.9489,因为

r>0.8,所以运送时间与运送距离有较强的正线性关系。

(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

得到的回归方程为x 003585.0118129.0y

?+=,回归系数003585.0?=β表示运送距离每增加1公里,运送时间平均增加0.003585天。

11.6

(1)散点图如下:

从上图可知,人均gdp 和人均消费水平为正相关关系

(2)

r=0.998128,具有非常强的正线性关系。

(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

得到的回归方程为:x y 308683.06928.734?+=。回归系数308683.0?1=β表示人均GDP 每增加1元,人均消费水平平均增加0.308683元。

(4)判定系数996259.02=R ,表明在人均消费水平的变差中,有99.6259%是由人均GDP 决定的。

(5)首先提出如下假设:00:10≠=ρρ:,H H

由于significant F<05.0=?,拒绝原假设,表明人均GDP 与人均消费水平之间的线性关系显著。

(6)(元)108.22785000308683.06928.734?5000=?+=y

(7)当3035.247,571.2)27(05.02/05.0==-=?e s t 时,。 置信区间:

4.2871078.22787

.854750849)42857.122485000(713035.247571.21078.2278)()-(1

y

?2

1

2

202/0±=-+

??±=-+±∑=n i i e a x x x x n

s t 即(1990.7,2565.5)。 预测区间为:

8.6971078.22787

.854750849)42857.122485000(7113035.247571.21078.2278)()-(11y

?2

1

2

202/0±=-+

+??±=-++±∑=n i i e a x x x x n

s t 即(1580.3,2975.9)。

11.7

(1)散点图如下:

(2)用航班正点率作自变量,顾客投诉次数作因变量,建立估计的回归方程,并解释回归系数的意义。

得到的回归方程为:x y 7.41892.430?-=。回归系数7.4-?1=β表示航班正点率每增加1%,顾客投诉次数平均下降4.7次。

(3)回归系数检验的P-value=0.001108<05.0=?,拒绝原假设,表明回归系数显著。

(4)次)(1892.54807.41892.430?80=?-=y

(5)当8822.18,306.2)210(05.02/05.0==-=?e s t 时,。 置信区间为:

48

.161892.54024

.39786.75-8010188722.18306.21892.54)()-(1

y

?2

1

2

202/0±=+

??±=-+±∑=)

(n

i i e a x x x x n s t 即(37.7,70.7) 预测区间:

57

.461892.54024

.39786.75-80101188722.18306.21892.54)()-(1

1y

?2

1

2

202/0±=+

+??±=-++±∑=)

(n i i e a x x x x n

s t 即(7.6,100.8)

11.8

解释和分析如图下:

由上表结果可知,出租率和月租金之间的线性回归方程为:x y

2492.03177.49?+=。回归系数2492.0?1

=β表示:月租金每增加1元,出租率平均增加0.2492%。 %22.632=R ,表明在出租率的变差中被出租率与租金之间的线性关系所解释的

比例为63.22%,回归方程的拟合程度一般。

估计标准误差6858.2e =s 表示,当用月租金来预测出租率时,平均的预测误差为2.6858%,表明预测误差并不大。

由方差分析表可知,significant F=2.79889E-0.5<05.0=?,表明回归方程的线性关系显著。回归系数检验的P-value=0.0000<05.0=?,表明回归系数显著,即月租金是影响出租率的显著性因素。 11.9

(1)完成上面的方差分析表。 答: 变差来源 df SS

MS

F

significant 回归 1 1602708.6 1602708.6 399.1 2.17E-09 残差 10 40158.07 40158.07 —— —— 总计 11

1642866.67

——

——

——

(2)R2=0.9756,汽车销售量的变差中有97.56%是由于广告费用的变动引起的。

(3)r=0.9877。

(4)回归系数的意义:广告费用每增加一个单位,汽车销量就增加1.42个单位。

(5)回归系数的检验:

p=2.17E —09<α,回归系数不等于0 ,显著。

回归直线的检验:

p=2.17E —09<α,回归直线显著

11.11

(1)SSR 的自由度为k=1;SSE 的自由度为n-k-1=18;

因此:F=1SSRk=60

SSEnk14018=27 0.051,18F=4.41

(2)SSRSSRSSE=0.6=0.7746,由于是负相关,因此r=-0.7746

(3)拒绝原假设,线性关系显著。

(4)r=1,18F

(5)从F 检验看线性关系显著。

11.12

从n=20的样本中得到的有关回归结果是: 要求:

(1)当x=4时,构建y 的平均值的95%的置信区间。

当x=4时,Y 的平均值的95%的置信区间为:即(15.95,18.05)。 (2)当x=4时,构建y 的个别值的95%的预测区间。

预测区间为:即(14.65,19.35)

11.13

建立线性回归模型,当x=40万元时,构建销售收入95%的置信区间。 答

x 23977.152918.46y

?+-=,

销售收入95%的置信区间为:

447.2)28(05.0.299.5634023977.152918.46)(,40x 2/05.0=-=?=?+--==t y E 时,当时当

即(441.55,685.04)

04.685)E(y 441.5540≤≤

11.14.残差图如下:

回归1的残差图表明,两个变量之间没有线性关系。回归2的残差图表明,两个变量之间为非线性关系。

11.15(1)用广告费支出作自变量

x ,销售量作因变量y ,建立估计的回归方

程。

第四章统计学综合指标课后习题

二、单项选择题 1.加权算术平均数的大小( ) A受各组次数f的影响最大B受各组标志值X的影响最大 C只受各组标志值X的影响D受各组次数f和各组标志值X的共同影响 2,平均数反映了( ) A总体分布的集中趋势B总体中总体单位分布的集中趋势 C总体分布的离散趋势D总体变动的趋势 3.在变量数列中,如果标志值较小的一组权数较大,则计算出来的算术平均数( ) A接近于标志值大的一方B接近于标志值小的一方C不受权数的影响D无法判断4.根据变量数列计算平均数时,在下列哪种情况下,加权算术平均数等于简单算术平均数( ) A各组次数递增B各组次数大致相等C各组次数相等D各组次数不相等 5.已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用( ) A简单算术平均法B加权算术平均法C加权调和平均法D几何平均法 6.已知5个水果商店苹果的单价和销售额,要求计算5个商店苹果的平均单价,应该采用( ) A简单算术平均法B加权算术平均法C加权调和平均法D几何平均法 7.计算平均数的基本要求是所要计算的平均数的总体单位应是( ) A大量的B同质的C差异的D少量的 8,某公司下属5个企业,已知每个企业某月产值计划完成百分比和实际产值,要求计算该公司平均计划完成程度,应采用加权调和平均数的方法计算,其权数是( ) A计划产值B实际产值C工人数D企业数 9.中位数和众数是一种( ) A代表值B常见值C典型值D实际值 10.由组距变量数列计算算术平均数时,用组中值代表组内标志值的一般水平,有一个假定条件,即( ) A各组的次数必须相等B各组标志值必须相等 C各组标志值在本组内呈均匀分布D各组必须是封闭组 11.四分位数实际上是一种( ) A算术平均数B几何平均数C位置平均数D数值平均数 12.离散趋势指标中,最容易受极端值影响的是( ) A极差B平均差C标准差D标准差系数 13.平均差与标准差的主要区别在于( ) A指标意义不同B计算条件不同C计算结果不同D数学处理方法不同 A 7万元 B 1万元 C 12 万元 D 3万元 15.已知某班40名学生,其中男、女学生各占一半,则该班学生性别成数方差为( ) A25% B 30% C 40% D 50% 17.方差是数据中各变量值与其算术平均数的( ) A离差绝对值的平均数B离差平方的平均数 C离差平均数的平方D离差平均数的绝对值 18.一组数据的偏态系数为1.3,表明该组数据的分布是( ) AlE态分布B平顶分布C左偏分布D右偏分布 19.当一组数据属于左偏分布时,则( )

【免费下载】统计学答案第十章

三、选择题 1 方差分析的主要目的是判断()。 A.各总体是否存在方差 B.各样本数据之间是否有显著差异 C.分类型自变量对数值型因变量的影响是否显著 D.分类型因变量对数值型自变量的影响是否显著 2 在方差分析中,检验统计量F是()。 A.组间平方和除以组内平方和 B.组间均方除以组内均方 C.组间平方除以总平方和 D.组间均方除以总均方 3 在方差分析中,某一水平下样本数据之间的误差称为()。 A.随机误差 B.非随机误差 C.系统误差 D.非系统误差 4 在方差分析中,不同水平下样本数据之间的误差称为()。 A.组内误差 B.组间误差 C.组内平方 D.组间平方 5 组间误差是衡量不同水平下各样本数据之间的误差,它()。 A.只包括随机误差 B.只包括系统误差 C.既包括随机误差,也包括系统误差 D.有时包括随机误差,有时包括系统误差 6 组内误差是衡量某一水平下样本数据之间的误差,它()。 A.只包括随机误差 B.只包括系统误差 C.既包括随机误差,也包括系统误差 D.有时包括随机误差,有时包括系统误差 7 在下面的假定中,哪一个不属于方差分析中的假定()。 A.每个总体都服从正态分布 B.各总体的方差相等 C.观测值是独立的 D.各总体的方差等于0 8 在方差分析中,所提出的原假设是H0:μ1=μ2=…=μk,备择假设是()。 A.H1:μ1≠μ2≠…≠μk B.H1:μ1>μ2>…>μk C.H1:μ1<μ2<…<μk D.H1:μ1,μ2,…,μk不全相等 9 单因素方差分析是指只涉及()。 A.一个分类型自变量 B.一个数值型自变量 C.两个分类型自变量 D.两个数值型因变量 10 双因素方差分析涉及()。 A.两个分类型自变量 B.两个数值型自变量

(完整版)医学统计学第六版课后答案

第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2

统计学课后第四章习题答案

第4章练习题 1、一组数据中岀现频数最多的变量值称为() A. 众数 B.中位数 C.四分位数 D.平均数 2、下列关于众数的叙述,不正确的是() A. —组数据可能存在多个众数 B.众数主要适用于分类数据 C. 一组数据的众数是唯一的 D. 众数不受极端值的影响 3、一组数据排序后处于中间位置上的变量值称为() A.众数 B.,中位数 C.四分位数 D.平均数 4、一组数据排序后处于25%和75%位置上的值称为() A.众数 B.中位数 C.四分位数 D.平均数 5、非众数组的频数占总频数的比例称为() A.异众比率 B.离散系数 C.平均差 D.标准差 6、四分位差是() A. 上四分位数减下四分位数的结果| B. 下四分位数减上四分位数的结果 C.下四分位数加上四分位数 D. 下四分位数与上四分位数的中间值 7、一组数据的最大值与最小值之差称为() A.平均差 B.标准差 C.极差 D.四分位差 8、各变量值与其平均数离差平方的平均数称为() A.极差 B. 平均差 C.,方差 D.标准差 9、变量值与其平均数的离差除以标准差后的值称为() A.标准分数 B.离散系数 C.方差 D.标准差 10、如果一个数据的标准分数-2,表明该数据() A.比平均数高出2个标准差 B. ■比平均数低2个标准差 C.等于2倍的平均数 D. 等于2倍的标准差 11、经验法则表明,当一组数据对称分布时,在平均数加减2个标准差的范围之内大约有() A.68%的数据 B.95% 的数据 C.99% 的数据 D.100%勺数据 12、如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=4,其意义是() A. 至少有75%勺数据落在平均数加减4个标准差的范围之内 B. 至少有89%的数据落在平均数加减4个标准差的范围之内 C. 至少有94%的数据落在平均数加减4个标准差的范围之内 D. 至少有99%的数据落在平均数加减4个标准差的范围之内 13、离散系数的主要用途是() A.反映一组数据的离散程度 B.反映一组数据的平均水平 C.比较多组数据的离散程度 D.比较多组数据的平均水平 14、比较两组数据离散程度最适合的统计量是() A.极差 B.平均差 C.标准差 D.离散系数 15、偏态系数测度了数据分布的非对称性程度。如果一组数据的分布是对称的,则偏态系数() A.等于0 B.等于1 C.大于0 D. 大于1 16、如果一组数据分布的偏态系数在0.5~1或-1?-0.5之间,则表明该组数据属于() A.对称分布 B.中等偏态分布 C.高度偏态分布 D.轻微偏态分布 17、峰态通常是与标准正态分布相比较而言的。如果一组数据服从标准正态分布,则峰态系数的值是() A.等于0 B. 大于0 C. 小于0 D. 等于1 18、如果峰态系数k>0,表明该组数据是() A.尖峰分布 B.扁平分布 C.左偏分布 D.右偏分布

贾俊平第四版统计学-第十一章一元线性回归练习答案

第十一章一元线性回归练习题答案 二.填空题 1. 不能;因为该相关系数为样本计算出的相关系数,它的大小受样本数据波动的影响,它是否显著尚需 检验;t 检验; 2. 图1;不能;因为图1反映的是线性相关关系,图2反映的是非线性性相关关系,相关系数只能反映 线性相关变量间的相关性的强弱,不能反映非线性相关性的强弱。 三.计算题 1.(1) SSR 的自由度是1,SSE 的自由度是18。 (2)2418 /6080220/1/==-= SSE SSR F (3)判定系数%14.57140 802 === SST SSR R 在y 的总变差中,由57.14%的变差是由于x 的变动说引起的。 (4)7559.05714.02-=-=-=R r 相关系数为-0.7559。 (5)线性关系显著和:线性关系不显著 和y x y x H 10H : 因为414.424=>=αF F ,所以拒绝原假设,x 与y 之间的线性关系显著。 2.(1) 方差分析表 df SS MS F Significance F 回归分析 1 425 425 85 0.017 残差 15 75 5 - - 总计 16 500 - - - (2)判定系数%8585.0500 425 2 ==== SST SSR R 表明在维护费用的变差中,有85%的变差可由使用年限来解释。 (3)9220.085.02===R r 二者相关系数为0.9220,属于高度相关 (4) x y 248.1388.6?+= 分布;显著。 的自由度为t n r n r t 2);12 ||2 ---=

回归系数为1.248,表示每增加一个单位的产量,该行业的生产费用将平均增长1.248个单位。 (5)线性关系显著性检验: 线性关系显著 :生产费用和产量之间性关系不显著生产费用和产量之间线10:H H 因为Significance F=0.017<05.0=α,所以线性关系显著。 (6) 348.3120248.1388.6248.1388.6?==?++=x y 当产量为10时,生产费用为31.348万元。

贾俊平统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(围、数目判定) 样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

统计学课后习题答案第四章动态数列

第四章动态数列 一﹑单项选择题 1.下列动态数列中属于时点数列的是 A.历年在校学生数动态数列 B.历年毕业生人数动态数列 C.某厂各年工业总产值数列 D.某厂各年劳动生产率数列 2.构成动态数列的两个基本要素是 A.主词和宾词 B.变量和次数 C.分组和次数 D.现象所属的时间及其指标值 3.动态数列中各项指标数值可以相加的是 A.相对数动态数列 B.平均数动态数列 C.时期数列 D.时点数列 4.最基本的动态数列是 A.指数数列 B.相对数动态数列 C.平均数动态数列 D.绝对数动态数列 5.动态数列中,指标数值的大小与其时间长短没有直接关系的是 A.时期数列 B.时点数列 C.相对数动态数列 D.平均数动态数列 6.动态数列中,指标数值是经过连续不断登记取得的数列是 A.时期数列 B.时点数列 C.相对数动态数列 D.平均数动态数列 7.下列动态数列中属于时期数列的是 A.企业历年职工人数数列 B.企业历年劳动生产率数列 C.企业历年利税额数列 D.企业历年单位产品成本数列 8.动态数列中,各项指标数值不可以相加的是 A.相对数动态数列 B.绝对数动态数列 C.时期数列 D.时点数列 9.动态数列中,指标数值大小与其时间长短有关的是 A.相对数动态数列 B.绝对数动态数列 C.时期数列 D.时点数列 10.动态数列中,指标数值是通过一次登记取得的数列是 A.相对数动态数列 B.绝对数动态数列 C.时期数列 D.时点数列 11.编制动态数列的最基本原则是保证数列中各项指标必须具有 A.可加性 B.可比性 C.连续性 D.一致性 12.基期为某一固定时期水平的增长量是 A.累计增长量 B.逐期增长量 C.平均增长量 D.年距增长量 13.基期为前期水平的增长量是 A.累计增长量 B.逐期增长量 C.平均增长量 D.年距增长量 14.累计增长量与逐期增长量之间的关系是 A.累计增长量等于相应的各个逐期增长量之和

第十一章双变量统计分析

第十一章双变量统计分析 在社会学研究中,不但要了解一个变量的情况,更要进一步了解一个变量与另一个变量之间的关系。在这一讲中我们介绍几种双变量的统计分析方法。 一、交互分类表 交互分类表又称列联表,是指同时依据两个变量的值,将所研究的个案分类。交互分类的目的是将两变量分组,然后比较各组的分布状况,以寻找变量间的关系。 1、条件次数表:表10-1是交互分类表的一个例子: 表10-1 500名工人的文化水平与工资收入交互分类表(人) (1)表中的次数分布是同时根据文化水平和工资收入而定,如大专以上高收入的有26人。从表中可以清楚地知道每种文化水平的工资收入的次数分布,因此这样的表又称为条件次数表。在表的最下一行和最右一列分别是不同文化水平和不同收入的总次数,称为边缘次数,它们的分布情况称为边缘分布;表中的其它次数,称为条件次数,每一条件下的分布称为条件分布。 (2)条件次数表有大小之分,计算的方法,通常是将因变量的数目乘上自变量的数目。如果我们将因变量放在表的旁边,将自变量放于表的上端,则表的大小就是横行数目(rows简写r)乘上纵行数目(columns简写c),即表的大小=r ×c。这个先后次序的用意是表示前者(因变量)是受后者(自变量)影响的。要注意的是,3×2表不同于2×3表,因为前后两个数值代表不同的变量,包含

不同类别数。 2、条件百分表: 条件次数表中的数字是绝对数字,由于各个类别的基数不同,相互之间无法进行比较,因而不能看出两变量之间的关系。为克服条件次数表的这一缺点,使各个类别之间可以比较,应将表中的绝对数字转变成相对数字——百分数,这样制成的表称为条件百分表。如上表可改成百分表为: 表10-2 500名工人文化水平与工资收入的交互百分表(%) 在计算条件百分表时,最好能依据下列准则: (1)每个表的顶端要有表号和标题。加上表号,可以方便讨论和减少混乱。简明标题,能使读者容易领会表内统计数值的意义。 (2)绘表时所用的线条,要尽可能简短。舍去不必要的线条,可以节省绘制的功夫,也会令人对表中的数值一目了然。 (3)在表上层的自变量每个值之下的%号,表示下列的数值是百分率。如果表内每个数值都附有%符号,就太繁复了。 (4)计算百分比表通常是按照自变量的方向,因为研究的目的是要了解自变量对因变量的影响,理应计算在不同的自变量情况下,因变量的变化如何。如上表是要分析教育水平对工资收入的影响,各个百分率所表示的,是在不同的教育水平中的工资收入情况。如果教育水平不同,工资收入也不同,就表示教育对工资是有影响的了。 (5)表下层括弧内的数值,表示在计算百分率时所依据的个案总数。写出这些

2015年《统计学》第十章 时间序列分析习题及满分答案

2015年《统计学》第十章时间序列分析习题及满分答案 一、单项选择: 1.时间数列中,每项指标数值可以相加的是(B ) A.绝对数时间数列 B. 时期数列 C. 时点数列 D.相对数或平均数时间数列 2. 下列属于时点数列的是(D) A. 某厂各年工业产值 B.某厂各年劳动生产率 C.某厂各年生产工人占全部职工的比重 D.某厂各年年初职工人数 3.发展速度与增长速度的关系是( B ) A. 环比增长速度等于定基发展速度-1 B. 环比增长速度等于环比发展速度-1 C. 定基增长速度的连乘积等于定基发展速度 D. 环比增长速度的连乘积等于环比发展速度 4.年距增长速度是(C) A. 报告期水平/基期水平 B. (报告期水平— 基期水平)/基期水平 C. 年距增长量/去年同期发展水平 D. 环比增长量/前一时期水平 5.几何平均法平均发展速度数值的大小(C)

A. 不受最初水平和最末水平的影响 B. 只受中间各期发展水平的影响 C. 只受最初水平和最末水平的影响,不受中间各期发展水平的影响 D. 既受最初水平和最末水平的影响,也受中间各期发展水平的影响 6.某厂第一季度三个月某种产品的实际产量分别为500件、612件、832件、分别超计划0%、2%和4%,则该厂第一季度平均超额完成计划的百分数为( C )A. 102% B. 2% C. 2.3% D. 102.3% 7.时期数列中的每个指标数值是(B)。 A、每隔一定时间统计一次 B、连续不断统计而取得 C、间隔一月统计一次 D、定期统计一次 8.一般平均数与序时平均数的共同之处是(A)。 A、两者都是反映现象的一般水平 B、都是反映同一总体的一般水平 C、共同反映同质总体在不同时间上的一般水平 D、都可以消除现象波动的影响 9.某企业1997年产值比1990年增长了1倍,比1995年增长了0.5倍,则1995年比1990年增长了( A )。 A、0.33 B、0.5 C、0.75 D、1 10.假设有如下资料:则该企业一季度平均完成计划为(B)。 一月二月三月某产品实际完成数 500 612

_统计学概论第六版习题集总答案

第一章总论 一、填空题 1.威廉·配弟、约翰·格朗特 2.统计工作、统计资料、统计学、统计工作、统计资料、统计学3.数量对比分析 4.大量社会经济现象总体的数量方面 5.大量观察法、统计分组法、综合指标法、统计推断法 6.统计设计、统计调查、统计整理、统计分析 7.信息、咨询、监督 8.同质性 9.大量性、同质性、差异性 10.研究目的、总体单位 11.这些单位必须是同质的 12.属性、特征 13.变量、变量值 14.总体单位、总体 15.是否连续、离散、性质 二、是非题 1.非2.非3.是4.非5.是6.非7.是8.是9.是10.非11.非12.非13.非14.是15.非 三、单项选择题 1.C 2.B 3.C 4.A 5.C 6.C 7.A 8.A 9.C 10.B 11.A 12.B 13.C 14.A 15.A 四、多项选择题 1.BC 2.ABC 3.ABE 4.ABCD 5.BCDE 6.AC 7.ABCDE 8.BD 9.AB 10.ABCD 11.BD 12.ABCD 13.BD 14.ABD 15.ABC 五、简答题 略 第二章统计调查

一、填空题 1.统计报表普查重点调查抽样调查典型调查 2.直接观察法报告法采访法 3. 统计报表专门调查 4. 经常性一次性 5. 调查任务和目的调查项目组织实施计划 6. 单一表一览表 7. 基层填报单位综合填报单位 8. 原始记录统计台帐 9. 单一一览 二、是非题 1.是 2.是 3.非 4.是 5.非 6.是 7.是 8.非 9.是 10.是 三、单项选择题 1. D 2. A 3. C 4. A 5. B 6. C 7. B 8. D 9. C 10. B 四、多项选择题 1. BCE 2. ABCDE 3. ADE 4. ADE 5.ACDE 6. ABD 7. BCDE 8. ABE 9.ACD 五、简答题 略 第三章统计整理 一、填空题 1.统计汇总选择分组标志 2.资料审核统计分组统计汇总编制统计表 3.不同相同 4.频率比率(或频率) 5.全距组距 6.上限以下 7.组中值均匀 8.离散连续重叠分组 9.手工汇总电子计算机汇总 10.平行分组体系复合分组体系 11.主词宾词

统计学第十一章 统计决策

第十一章统计决策 Ⅰ. 学习目的 本章对统计决策的基本理论、方法及其应用,作扼要的介绍。通过学习,要求:1.理解有关统计决策的基本概念与基本步骤,能够运用收益矩阵表与决策树形图表述所要研究的决策问题;2. 了解各种决策准则的特点与适用的场合,能够运用这些准则,进行完全不确定性决策与一般风险型决策;3. 了解贝叶斯决策的基本思想,掌握后验概率的计算方法,并在此基础上进行决策分析。 Ⅱ. 课程内容要点 第一节统计决策的基本概念 一、什么是统计决策 所谓决策,就是在占有一定信息的基础上,利用各种方法,对影响特定目标的各种因素进行计算和分析,从而选择关于未来行动的“最佳方案”或“满意方案”的过程。狭义的统计决策方法是一种研究非对抗型和非确定型决策问题的科学的定量分析方法。开展统计决策研究,有助于避免决策的盲目性,提高决策的科学性。 二、统计决策的基本步骤 (一)确定决策目标;反映决策目标的变量,称为目标变量。当决策所 145

要求达到的目标只有一个时,称为单目标决策。当决策所要求达到的目标不止一个时,称为多目标决策。 (二)拟定备选方案 备选方案是决策者可以调控的因素,备选方案中所调控的变量称为行动变量。所有备选方案的集合称为行动空间。 (三)列出自然状态 所谓自然状态,是指实施行动方案时,可能面临的客观条件和外部环境。所有可能出现的状态的集合称为状态空间,而相应的各种状态可能出现的概率的集合称为状态空间的概率分布。 (四)测算结果 (五)选择“最佳”或“满意”的方案 (六)实施方案 三、收益矩阵表 第二节完全不确定型决策 一、完全不确定型决策的准则 (一)最大的最大收益值准则 该准则又称乐观准则或“好中求好”准则。在决策时,先选出各种状态下每个方案的最大收益值,然后再从中选择最大者,并以其相对应的方案作为所要选择的方案。 (二)最大的最小收益值准则 146

统计学(贾俊平版)第十章答案

第十章习题 10.1 H0:三个总体均值之间没有显著差异。 H1: 三个总体均值之间有显著差异。 方差分析:单因素方差分析 SUMMARY 组观测数求和平均方差 1579015861.5 2460015036.66667 33497165.6667154.3333 方差分析 差异源SS df MS F P-value F crit 组间425.58332212.7917 2.8813310.1078578.021517 组内664.6667973.85185 总计1090.2511 答:方差分析可以看到,由于P=0.1078>0.01,所以接受原假设H0。说明了三个总体均值之间没有显著差异。 10.2 H0:五个个总体均值之间相等。 H1: 五个总体均值之间不相等。 方差分析:单因素方差分析 SUMMARY 组观测数求和平均方差 133712.33333 4.333333 255010 1.5 3448120.666667 458016 1.5 5678130.8 方差分析 差异源SS df MS F P-value F crit 组间93.76812423.4420315.82337 1.02E-05 4.579036 组内26.6666718 1.481481 总计120.434822 答:方差分析可以看到,由于P=1.02E-05<0.01,所以拒接原假设H0。说明了五个总体均值之间不相等。 10.3 H0:四台机器的装填量相等。 H1: 四台机器的装填量不相等

答:方差分析可以看到,由于P=0.00068<0.01,所以拒接原假设H0。说明了四台机器装填量不相同。 10.4 H0:不同层次管理者的满意度没有差异。 H1: 不同层次管理者的满意度有差异. 答:方差分析可以看到,由于P=0.000849<0.05,所以拒接原假设H0。说明了不同层次管理者的满意度有差异。 10.5 H0:3个企业生产的电池平均寿命之间没有显著差异。 H1: 3个企业生产的电池平均寿命之间有显著差异 单因素方差分析 VAR00002 平方和df 均方 F 显著 性 方差分析:单因素方差分析 SUMMARY 组观测数求和平均方差 1416.12 4.030.000333 2624.01 4.0016670.000137 3519.87 3.9740.00033 4416.02 4.0050.000167 方差分析 差异源SS df MS F P-value F crit 组间0.00707630.00235910.09840.000685 5.416965组内0.003503150.000234 总计0.01057918 方差分析:单因素方差分析 SUMMARY 组观测数求和平均方差 列 15387.60.8 列 27628.8571430.809524 列 36355.833333 2.166667 方差分析 差异源SS df MS F P-value F crit 组间29.60952214.8047611.755730.000849 3.68232组内18.89048151.259365 总计48.517

统计学第十一章课后习题答案

11.1 (1)绘制产量与生产费用的散点图,判断二者之间的关系形态。 散点图如下: 从上图,可以看出产量与生产费用的关系为正的线性相关关系。 (2)计算产量与生产费用之间的线性相关系数。 r=0.920232 (3)对相关系数的显著性进行检验(a=0.05),并说明二者之间的关系系数。 假设:H o :ρ=0,H 1:ρ≠0 计算检验的统计量:t=|r| 2=|0.92-232| 2=7.435 当a=0。05时,t (12-2)=2.228。由于检验统计量t=7.435>t =2.228,拒绝原假设。表明产量与生产费用之间的线性关系显著。

11.2 (1)散点图如下: (2)r=0.8621,正相关 11.3 ?β=10表示当X=0时Y的期望值为10 (1) ?β=-0.5表示X每增加1个单位,Y平均下降0.5个单位。(2) 1 (3)X=6时,E(Y)=10-0.5x6=7

11.4. (1)%904 36362=+=+==SSE SSR SSR SST SSR R ,%902=R 表示,在因变量y 取值的变差中,有90%可以由x 与y 之间的线性关系来解释。 (2)5.02 1842n =--= SSE S e 。5.0=e S 表示,当用x 来预测y 时,平均的预测误差为0.5. 11.5 (1)散点图如下: (2)r=0.9489,因为r>0.8,所以运送时间与运送距离有较强的正线性关系。 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

得到的回归方程为x 003585.0118129.0y ?+=,回归系数003585.0?=β表示运送距离每增加1公里,运送时间平均增加0.003585天。 11.6 (1)散点图如下: 从上图可知,人均gdp 和人均消费水平为正相关关系

统计学第十章课后习题

二、单项选择 1.统计指数按其反映的对象范围不同分为( C)。 A 简单指数和加权指数 B 综合指数和平均指数 C 个体指数和总指数 D 数量指标指数和质量指标指数 2.总指数编制的两种形式是( C )。 A 算术平均指数和调和平均指数 B 个体指数和综合指数 C 综合指数和平均指数 D 定基指数和环比指数 4.某市居民以相同的人民币在物价上涨后少购商品15%,则物价指数为( )D 。 A 17.6% B 85% C 115% D 117.6% 5.在掌握基期产值和各种产品产量个体指数资料的条件下,计算产量总指数要采用(C )。 A 综合指数 B 可变构成指数 C 加权算术平均数指数 D 加权调和平均数指数 6.在由三个指数组成的指数体系中,两个因素指数的同度量因素通常( C)。 A 都固定在基期 B 都固定在报告期 C 一个固定在基期,另一个固定在报告期 D 采用基期和报告期的平均数 7.某商店报告期与基期相比,商品销售额增长6.5%,商品销售量增长6.5%,则商品价格( D )。 A 增长13% B 增长6.5% C 增长1% D 不增不减 8.单位产品成本报告期比基期下降6%,产量增长6%,则生产总费用(B )。 A 增加 B 减少 C 没有变化 D 无法判断 10.某商店2001年1月份微波炉的销售价格是350元,6月份的价格是342元,指数为97。71%,该指数是( D )。 A 综合指数 B 平均指数 C 总指数 D 个体指数 11。编制数量指标指数一般是采用( A )作同度量因素。 A 基期质量指标 B 报告期质量指标 C 基期数量指标 D 报告期数量指标 12.编制质量指标指数一般是采用( D )作同度量因素。 A 基期质量指标 B 报告期质量指标 C 基期数量指标 D 报告期数量指标 三、多项选择题 1.指数的作用包括(ABCD ) A 综合反映事物的变动方向 B 综合反映事物的变动程度 C 利用指数可以进行因素分析 D 研究事物在长时间内的变动趋势 、 E 反映社会经济现象的一般水平 2.拉斯贝尔综合指数的基本公式有( BC ) A ∑∑1 011q p q p B ∑∑0 01p q p q C ∑∑0 1q p q p D ∑∑1 11p q p q E ∑∑0 11q p q p 3.派许综合指数的基本公式(AE ) A ∑∑1 011q p q p B ∑∑0 1q p q p C ∑∑0 11q p q p D ∑∑0 10q p q p E ∑∑0 11 1q p q p 4.某企业为了分析本厂生产的两种产品产量的变动情况,已计算出产量指数为112.5%,这一指数是(AB D )

统计学第四章课后题及答案解析

第四章 一、单项选择题 1.由反映总体单位某一数量特征的标志值汇总得到的指标是() A.总体单位总量 B.质量指标 C.总体标志总量 D.相对指标 2.各部分所占比重之和等于1或100%的相对数() A.比例相对数B.比较相对数C.结构相对数D.动态相对数 3.某企业工人劳动生产率计划提高5%,实际提高了10%,则提高劳动生产率的计划完成程度为() A.104.76% B.95.45% C.200% D.4.76% 4.某企业计划规定产品成本比上年度降低10%实际产品成本比上年降低了14.5%,则产品成本计划完成程度() A.14.5% B.95% C.5% D.114.5% 5.在一个特定总体内,下列说法正确的是( ) A.只存在一个单位总量,但可以同时存在多个标志总量 B.可以存在多个单位总量,但必须只有一个标志总量 C.只能存在一个单位总量和一个标志总量 D.可以存在多个单位总量和多个标志总量 6.计算平均指标的基本要求是所要计算的平均指标的总体单位应是() A.大量的 B.同质的 C.有差异的 D.不同总体的

7.几何平均数的计算适用于求() A.平均速度和平均比率 B.平均增长水平 C.平均发展水平 D.序时平均数 8.一组样本数据为3、3、1、5、13、12、11、9、7这组数据的中位数是() A.3 B.13 C.7.1 D.7 9.某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的测度离散程度的统计量是() A.方差 B.极差 C.标准差 D.变异系数 10.用标准差比较分析两个同类总体平均指标的代表性大小时,其基本的前提条件是( ) A.两个总体的标准差应相等 B.两个总体的平均数应相等 C.两个总体的单位数应相等 D.两个总体的离差之和应相等 11.已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应采用() A.简单算术平均数 B.加权算术平均数 C.加权调和平均数 D.几何平均数 12.算术平均数、众数和中位数之间的数量关系决定于总体次数的分布状况。在对称的钟形分布中() A.算术平均数=中位数=众数 B.算术平均数>中位数>众数 C.算术平均数<中位数<众数 D.中位数>算术平均数>众数 二、多项选择题 1.下列属于时点指标的有() A.某地区人口数B.某地区死亡人口数C.某地区出生人口数

(完整word版)职高数学第十章概率与统计初步习题及答案.doc

第 10 章概率与统计初步习题 练习 10.1.1 1、一个三层书架里,依次放置语文书 12 本,数学书 14 本,英语书 11 本,从中取出 1 本,共有多少种不同的取法? 2、高一电子班有男生28 人,女生19 人,从中派 1 人参加学校卫生检查,有多少种选法? 3、某超市有4 个出口,小明约好和朋友在出口处见面,请问他们见面的地方有多少种选择? 答案: 1、 37 2、 47 3、4 练习 10.1.2 1、一个三层书架里,依次放置语文书12 本,数学书14 本,英语书 11 本,从中取出语文,数学和英语各 1 本,共有多少种不同的取法? 2、将 5 封信投入 3 个邮筒,不同的投法有多少种? 3、某小组有8 名男生, 6 名女生,从中任选男生和女生各一人去参加座谈会,有多少种不 同的选法? 答案: 1、 12× 14× 11=1848(种) 2、 3×3× 3× 3× 3=3 5 (种) 3、 8× 6=48(种) 练习 10.2.1 1、掷一颗骰子,观察点数,这一试验的基本事件数为--------------- () A、 1 B 、 3 C 、 6D 、 12 2、下列语句中,表示随机事件的是-------------------------- () A、掷三颗骰子出现点数之和为19 B 、从 54 张扑克牌中任意抽取 5 张 C、型号完全相同的红、白球各 3 个,从中任取一个是红球 D 、异性电荷互相吸引 3、下列语句中,不表示复合事件的是-------------------------- () A、掷三颗骰子出现点数之和为8 B 、掷三颗骰子出现点数之和为奇数 C、掷三颗骰子出现点数之和为 3 D 、掷三颗骰子出现点数之和大于13 答案: 1、 C 2、B 3、 C 练习 10.2.2 1、某学校要了解学生对自己专业的满意程度,进行了 5 次“问卷”,结果如表2-1 所示: 表 2-1 被调查500 502 504 496 505 人数 n 满意人404 476 478 472 464 数 m 满意频 m 率 n (1)计算表中的各个频率;

统计学第六版部分课后题答案

第四章 数据分布特征的测度 4.6 解:先计算出各组组中值如下: 4.8 解: ⑴ ⑵体重的平均数 体重的标准差 ⑶ 55—65kg 相当于μ-1σ到μ+1σ 根据经验法则:大约有68%的人体重在此范围内。 ⑷ 40—60kg 相当于μ-2σ到μ+2σ 2501935030450425501865011426.7120116.5 i M f x f s ?+?+?+?+?=====∑∑ 大。所以,女生的体重差异===离散系数===离散系数女 男10 .010 1 505v 08.012 1 605v =μσ=μσσσ) (1102.250)(1322.260磅=磅=女男=?μ=?μ) (112.25磅==?σ

根据经验法则:大约有95%的人体重在此范围内。 4.9 解: 在A 项测试中得115分,其标准分数为: 在B 项测试中得425分,其标准分数为: 所以,在A 项中的成绩理想。 4.11 解: 成年组的标准差为: 幼儿组的标准差为: 所以,幼儿组身高差异大。 115 100 115X Z =-=σμ-=5.050 400425X Z =-=σμ-= 172.1 4.24.2 2.4%172.1s x x n s s V x = == ====∑ 71.3 2.52.5 3.5% 71.3s x x n s s V x = =====∑

第七章 参数估计 7.7 根据题意:N=7500,n=36(大样本) 总体标准差σ未知,可以用样本标准差s 代替 32 .336 4.119n x x ===∑样本均值 2 1.61 s z α= =样本标准差: 边际误差为:22222 90 1.645 1.6451.61 1.6450.446 3.320.44 (2.883.76)95 1.9699 2.58(2.803.84)(2.634.01) z z x z z z ααααα==?=±=±置信水平%时,=平均上网时间的置信区间为: ,同理,置信水平%时,=;置信水平%时,=平均上网时间的置信区间分别为:,;,

统计学第五版课后练答案(4-6章)

第四章统计数据的概括性度量 4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15 要求: (1)计算汽车销售量的众数、中位数和平均数。 (2)根据定义公式计算四分位数。 (3)计算销售量的标准差。 (4)说明汽车销售量分布的特征。 解: Statistics 10 Missing 0 Mean 9.60 Median 10.00 Mode 10 Std. Deviation 4.169 Percentiles 25 6.25 50 10.00 75 单位:周岁 19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 41 20 31 17 23 要求; (1)计算众数、中位数: 排序形成单变量分值的频数分布和累计频数分布: 网络用户的年龄

(2)根据定义公式计算四分位数。 Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。 (3)计算平均数和标准差; Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773 (5)对网民年龄的分布特征进行综合分析: 分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。

1、确定组数: ()l g 25l g () 1.398 1115.64l g (2)l g 2 0.30103 n K =+ =+=+ =,取 k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取5 3、分组频数表 网络用户的年龄 (Binned) 分组后的直方图:

统计学(第六版)贾俊平课后习题集规范标准答案

第一章导论 1.1.1 (1)数值型变量。 (2)分类变量。 (3)离散型变量。 (4)顺序变量。 (5)分类变量。 1.2 (1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。 (2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。 1.3 (1)总体是所有IT从业者的集合。 (2)数值型变量。 (3)分类变量。 (4)截面数据。 1.4 (1)总体是所有在网上购物的消费者的集合。 (2)分类变量。 (3)参数是所有在网上购物者的月平均花费。 (4)参数 (5)推断统计方法。

第二章数据的搜集 1.什么是二手资料?使用二手资料需要注意些什么? 与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。在引用二手资料时,要注明数据来源。 2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样是指抽样时按一定概率以随机原则抽取样本。每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。 非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试。 3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法? 实验式、观察式等。 4. 自填式、面方式、电话式调查个有什么利弊? 自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查,对被调查者可以刻选择方便时间答卷,减少回答敏感问题的压力。缺点:返回率低,调查时间长,在数据搜

相关主题
文本预览
相关文档 最新文档