中国石油大学-应用统计方法作业2
- 格式:xlsx
- 大小:77.58 KB
- 文档页数:5
1.在某新产品开发试验中需要考虑四个因素A 、B 、C 、D 对产品质量的影响。
根据专业知识和实践经验知道,A 与C 之间存在着交互作用,D 与A 、B 及C 之间的交互作用可以忽略不计。
(1)假设每个因子只取两个水平,试选择适当的正交表安排该实验; (2)指出第2号及第5号试验的实验条件。
解:(1)根据题意,A 与B 、B 与C 之间的交互作用还不能肯定,需要通过试验考察。
这样,需要考察的因子及交互作用为A ,B ,C ,D ,A ×B ,A ×C ,B ×C 。
因此可以选用78(2)L 正交表。
表头设计列入表1-1。
(2)第2号试验的试验条件为1122A B C D ,第5号试验的试验条件为2112A B C D 。
2.设'1(0,1,1)X =,'2(2,0,1)X =,'3(1,2,4)X =,为来自总体X 的一个样本,求X 的协方差矩阵∑、相关矩阵R 的矩估计。
解:333'''123111111111(,,)((021),(102),(114))(1,1,2)333333i i i i i i X x x x =====++++++=∑∑∑µ'311 1011()()( 0(1,0,1)1(1,1,1)1(0,1,2))312112i i i X X X X =-⎛⎫⎛⎫⎛⎫⎪ ⎪ ⎪∑=--=--+---+ ⎪ ⎪ ⎪- ⎪ ⎪ ⎪--⎝⎭⎝⎭⎝⎭∑1 102101 111000113(0001 1 1012) 12221011 1 10243 0 32⎛⎫-⎪--⎛⎫⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪⎪=+-+=-⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪-⎪⎝⎭⎝⎭⎝⎭ ⎪ ⎪⎝⎭µ1 1-021- 122 012R ⎛⎫ ⎪ ⎪ ⎪= ⎪ ⎪ ⎪ ⎪⎝⎭(1)操作工之间的差异是否显著; (2)机器之间的差异是否显著; (3)交互影响是否显著(0.05α=)。
《应用统计学》2022年春季学期在线作业(四)-实践教学-000011.借助Excel数据分析工具中的方差分析功能,可以对定性原因对定量结果的影响展开检验。
选项A:对选项B:错参考答案:A2.在Excel中,输入公式以“=”开始。
选项A:对选项B:错参考答案:A3.对统计数据的分布特征进行分析,可以借助Excel数据分析工具中的直方图功能完成相应的指标计算。
选项A:对选项B:错参考答案:B4.分析分类型自变量对数值型因变量的影响,可以借助Excel数据分析工具中的回归功能完成。
选项A:对选项B:错参考答案:B5.在Excel进行数据的统计描述,只能针对行数据或是列数据进行。
选项A:对选项B:错参考答案:A6.在Excel描述统计的菜单下,标志位于第一行是必须要勾选的。
选项A:对选项B:错参考答案:B7.借助Excel进行统计回归,可以采用P值法和t检验直接进行检验决策。
选项A:对选项B:错参考答案:B8.Excel的绘图功能可以根据选定的统计数据绘制统计图。
选项A:对选项B:错参考答案:A9.在Excel中表示汇总的函数时SUM。
选项A:对选项B:错参考答案:A10.在Excel进行时间序列的移动平均时,得到的引动平均结果与时间是准确对应的。
选项A:对选项B:错参考答案:B11.借助Excel数据分析工具下的回归功能,建立变量间的回归模型,其结果包括回归统计、方差分析与回归检验三大部分。
选项A:对选项B:错参考答案:A12.在Excel描述统计的菜单下,汇总统计是任何情况下都必须要勾选的。
选项A:对选项B:错参考答案:A13.构建回归模型,只要Excel回归结果中回归系数的P-value小于显著性水平即可。
选项B:错参考答案:B14.计算两个随机变量的相关系数,可以借助Excel数据分析工具下的相关系数或者回归进行。
选项A:对选项B:错参考答案:A15.使用Excel自带的数据分析工具可以完成很多专业统计软件才有的数据统计、分析的功能。
《应用统计学》2021年春季学期在线作业(二)
指出下面的数据哪一个属于分类数据()。
A:年龄
B:工资
C:汽车产量
D:购买商品的支付方式(现金、信用卡、支票)
答案:D
下面的哪一个图形最适合描述结构性问题()。
A:条形图
B:饼图
C:雷达图
D:直方图
答案:B
假定被研究现象基本上按不变的速度发展,为描述现象变动的趋势,应拟合()趋势方程。
A:线性
B:二次曲线
C:指数曲线
D:对数曲线
答案:C
下面的哪一个图形适合比较研究两个或多个总体或结构性问题()。
A:环形图
B:饼图
C:直方图
D:茎叶图
答案:A
某商品销售量的前三个季度的季节指数分别为:112%,88%,90%,则第四个季度的季节指数为()。
A:102%
B:110%
C:98%
D:100%
答案:B
同时抛3枚质地均匀的硬币,巧合有2枚正面向上的概率为()。
A:0.125
B:0.25
C:0.375
D:0.5。
《应用统计学》在线作业(一)总指数的计算形式分为()A:数量指标指数和质量指标指数B:综合指数和平均指数C:加权算术平均数指数和加权调和平均数D:固定构成指数和结构影响指数参考选项:B说明现象在较长时期内发展的总速度的指标是( )。
A:环比发展速度B:平均发展速度C:定基发展速度D:定基增长速度参考选项:C如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称这两个变量之间为()。
A:完全相关关系B:正线性相关关系C:非线性相关关系D:负线性相关关系参考选项:A人口普查规定标准时间是为了( )。
A:避免登记的重复和遗漏B:确定调查对象的范围C:确定调查单位D:确定调查时限参考选项:A标志是说明总体单位特征的名称,标志有数量标志和品质标志,因此()。
A:标志值有两大类:品质标志值和数量标志值B:品质标志才有标志值C:数量标志才有标志值D:品质标志和数量标志都具有标志值参考选项:C每一吨铸铁成本(元)倚铸件废品率(%)变动的回归方程为:yc=56+8x, 这意味着( )。
A:废品率每增加1%,成本每吨增加64元B:废品率每增加1%,成本每吨增加8%C:废品率每增加1%,成本每吨增加8元D:废品率每增加1%,则每吨成本为56元参考选项:C题目和选项如下:A:AB:BC:CD:D参考选项:C假设检验中,如果原假设为假,而根据样本所得到的检验结论是不拒绝原假设,则可认为()。
A:抽样是不科学的B:检验结论是正确的C:犯了第一类错误D:犯了第二类错误参考选项:D社会经济统计的研究对象是()。
A:抽象的数量关系B:社会经济现象的规律性C:社会经济现象的数量特征和数量关系D:社会经济统计认识过程的规律和方法参考选项:C平均发展速度是( )。
A:定基发展速度的算术平均数B:环比发展速度的算术平均数C:环比发展速度的几何平均数D:增长速度加上100%参考选项:C统计一词包含统计工作、统计资料和统计学三种含义。
年第一学期考试《应用统计方法》试题答案与评分标准一、(任选一题,共10分,若全做,按1题给分) 1.简述费歇判别的思想,以及两总体费歇判别的步骤。
2.简述逐个修改法的步骤,并指出它与按批修改法的主要区别及它的优缺点。
1. 答:费歇判别的基本思想,是利用方差分析的思想选出一个最优的投影方向,将高维数据点投影到低维空间上,再进行判别分析。
严格说,费歇判别不是一种判别方法,而是一种降维的数据预处理方法。
………………3分 两总体费歇判别的主要步骤包括: (1) 根据样本计算………………5分 (2) 求0=-C B λ的最大特征根1λ及相应的特征向量1ξ;(3) 将观测数据在1ξ方向投影,计算投影后的观测值以及相应的均值和方差,将投影后的两个总体记为;**12,ππ; ………………7分 (4) 对于样品X ,将其在1ξ方向投影后,计算'1X ξ到**12,ππ的马氏距离; (5) 进行距离判别。
⎩⎨⎧'>'∈'≤'∈),(),(,),(),(,*21*112*21*111πξπξππξπξπX X X X X X d d d d 如果如果 ………………10分2. 答:逐个修改法,主要步骤为:a. 人为给定3个数,k,C,R ; ………………1分b. 取前k 个样品为凝聚点。
若两个凝聚点之间距离小于C ,则合并,以两 者的重心作为新凝聚点。
重复这一步,知道所有凝聚点不可合并;……………3分 c .将剩余N-k 个样品逐个引入,每引入一个,计算该样品到所有凝聚点的 距离,若其中最短距离大于R ,则该样品作为一个新的凝聚点,否则该样品归入最 近凝聚点的类,随即重新计算该类的重心,作为新的凝聚点。
重复b 步中检验凝聚点∑==11)1(1)1(1n i i X n X,∑==21)2(2)2(1n i i X n X))(()2()1()2()1(2121'--+=X X X X n n n n B))(()1()1()1()1(11'--=∑=X X X X i i n i C))(()2()2()2()2(12'--+∑=X X X X i i n i有无可合并者,直到都不可合并; ……………6分 d .将N 个样品从头到尾输入一遍,按c 中办法归类,直到新类与旧类完全 相同,则停止;否则重复步骤d 。
中国石油大学北京网络学院
经济统计学原理-第二次在线作业
参考答案
1.(
2.5分)在出生婴儿中,男性占53%,女性占47%,这是一个()。
A、结构相对指标
B、强度相对指标
C、比较相对指标
D、比例相对指标
我的答案:A 此题得分:2.5分
2.(2.5分)权数对算术平均数的影响作用,实质上取决于:()
A、作为权数的各组单位数占总体单位数比重的大小
B、各组标志值占总体标志总量比重的大小
C、标志值本身的大小
D、标志值数量的多少
我的答案:A 此题得分:2.5分
3.(2.5分)某企业某重产品上年实际成本为450元,本年计划降低4%,实际降低了5%,则成本降低计划超额完成程度为()。
A、95%
B、98.96%
C、1%
D、1.04%
我的答案:D 此题得分:2.5分
4.(2.5分)当变量数列中各变量值的频数相等时:()
A、该数列众数等于中位数
B、该数列众数等于均值
C、该数列无众数
D、该众数等于最大的数值
我的答案:C 此题得分:2.5分
5.(2.5分)受极大值影响较大的平均数是()。
A、位置平均数。
《统计学》2016年春学期在线作业(二)试卷总分:100 测试时间:--一、单选题(共15 道试题,共60 分。
)1.如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称这两个变量之间为(A )。
A、完全相关关系B、正线性相关关系C、非线性相关关系D、负线性相关关系满分:4 分2.假设检验中,如果原假设为真,而根据样本所得到的检验结论就是否定原假设,则可认为( C)。
A、抽样就是不科学的B、检验结论就是正确的C、犯了第一类错误D、犯了第二类错误满分:4 分3.若物价上涨,商品的需求量相应减少,则物价与商品需求量之间的关系为(B )。
A、不相关B、负相关C、正相关D、复相关满分:4 分4.进行假设检验时,在其它条件不变的情况下,增加样本量,检验结论犯两类错误的概率会( A)。
A、都减少B、都增大C、都不变D、一个增大一个减小满分:4 分5.下面的假定中,哪个属于相关分析中的假定(B )。
A、两个变量之间就是非线性关系B、两个变量都就是随机变量C、自变量就是随机变量,因变量不就是随机变量D、一个变量的数值增大,另一个变量的数值也应增大满分:4 分6.反映样本指标与总体指标之间的平均误差程度的指标就是( C)。
A、抽样误差系数B、概率度C、抽样平均误差D、抽样极限误差满分:4 分7.当样本统计量的观察值未落入原假设的拒绝域时,表示( B)。
A、可以放心地接受原假设B、没有充足的理由否定与原假设C、没有充足的理由否定备择假设D、备择假设就是错误的满分:4 分8.下列事件中不属于严格意义上的随机事件的就是(D )。
A、从一大批合格率为90%的产品中任意抽出的一件产品就是不合格B、从一大批合格率为90%的产品中任意抽出的20件产品都就是不合格品C、从一大批优质品率为15%的产品中任意抽出的20件产品都就是优质品D、从一大批合格率为100%的产品中任意抽出的一件产品就是合格品满分:4 分9.同时抛3枚质地均匀的硬币,巧合有2枚正面向上的概率为(C )。
应用统计方法作业一、在某项实验中,测得变量y 与因素x 数据如表1所示。
试建立适当的y 与因素x 的回归方程(0.01α= )。
表1 实测数据x 2 3 4 5 7 8 10 11 14 15 16 18 19 y106.42108.20109.58109.50110.00109.93110.49110.59110.60110.90110.76110.00111.20解:绘制散点图,如图1所示:图1从图1中可看出,以下三种曲线方程的曲线图都与散点图接近,因此都可以作为曲线回归的选择对象。
(1)0y x ββ=+. (2)01lg y x ββ=+.(3)01/y xββ=+.为了更好的拟合给定数据,确定最优的回归方程,需对以上3式分别进行检验,求取2S 残并比较其大小,将最小者作为因素y 与x 的最优回归方程。
1.方案1选取曲线回归(1)进行求解。
令'x x =EXCEL 进行相应处理算得数据,列入表2。
表2 方案1数据处理计算由表2得:''13''2111.6670()i x x i l x x ==-=∑1321()21.2105yy i i l y y ==-=∑'13''1()()13.9389i i x y i l x x y y ==--=∑由此得: µ'''113.938911.667194701.x y x x l l β===¶µ'011.1947109.9362 3.0424=106.3014y x ββ=-=⨯- 故所求的回归方程为:$'106.3014 1.1947y x =+进行变量还原得回归方程:$106.3014y =+检验假设H 01:10β=.'21= 1.194713.938916.6528x y S l β=⨯=回2221.210516.6528 4.5577yy S l S =-=-=回残2216.652840.1915/11 4.5577/11S F S ===回残对给定的0.01α=,查F(1,11)表(附表5)得临界值9.65λ=。
由散点图看出,以下四种曲线方程的曲线图都与散点图接近,因此都可以作为曲线回归的选择对象。
(1)(2)(3)(4)
lyy=21.21051lx'y=13.93894
b=1.194729
a=106.3013故所求回归方程为——
y=106.3013+1.1947
检验假设H 01:β1=0
S回^2=16.65325
S总^2=21.21051
106
107
108109
1101111120
5
10
15
20
x
图3-1 散点图
x
b a y +=x
b a y lg +=x b a y /+=x
2
bx a y +=
S残^2=4.557255
F=40.19652
对于给定的α=0.01,查F(1,11)表得临界值lambda=9.64603由于F>λ,检验效果显著,所以拒绝H 01,即回归方程有意义。
2.选取曲线回归(2)求解。
令 ,应用EXCEL可算得数据,列入表3-2中:
lyy=21.21051lx'y=
4.715045b= 3.946578a=
106.3147
故所求回归方程为——
y=106.3147+3.9466lg x
检验假设H 01:β1=0
S回^2=18.6083S总^2=21.21051
S残^2= 2.602211
F=78.66052
对于给定的α=0.01,查F(1,11)表得临界值lambda=9.64603由于F>λ,检验效果显著,所以拒绝H 01,即回归方程有意义。
3.选取曲线回归(3)求解。
令 ,应用EXCEL可算得数据,列入表3-3中:
x x lg '=x x /1'=
lyy=21.21051
lxy=-2.1011b=-9.83337a=111.4875
故所求回归方程为——
y=111.4875-9.8333/x
检验假设H 01:β1=0
S回^2=20.66092S总^2=21.21051
S残^2=0.549586
F=413.5295
对于给定的α=0.01,查F(1,11)表得临界值lambda=9.64603由于F>λ,检验效果显著,所以拒绝H 01,即回归方程有意义。
4.选取曲线回归(4)求解。
令 ,应用EXCEL可算得数据,列入表3-1中:
lyy=21.21051lx'y=1449.761
b=0.007777
a=108.8892故所求回归方程为——
y=108.8892+0.0078检验假设H 01:β1=0
S回^2=11.27499S总^2=21.21051
S残^2=9.935514
2'x x =2
x
F=12.48299
对于给定的α=0.01,查F(1,11)表得临界值lambda=9.64603
由于F>λ,检验效果显著,所以拒绝H01,即回归方程有意义。
结论:
通过对这一问题用以上四种曲线作回归,我们发现S残^2最小者为(3),即方案(3)回归方程较优
a lg
b
x。