当前位置:文档之家› 数理统计作业答案

数理统计作业答案

数理统计作业答案
数理统计作业答案

1、设总体X 服从正态分布),(2σμN ,其中μ已知,2σ未知,n X X X ,,,21Λ为其样本,2≥n ,则下列说法中正确的是( D )。

(A )

∑=-n

i i X n

12

2

)(μσ是统计量 (B )

∑=n

i i X n

1

2

2

σ是统计量

(C )

∑=--n

i i

X n 1

2

2

)(1

μσ是统计量 (D )

∑=n

i i

X n

1

是统计量

2、设两独立随机变量)1,0(~N X ,)9(~2

χY ,则

Y

X 3服从( C )。

3、设两独立随机变量)1,0(~N X ,2

~(16)Y χ

服从( C )。 4、设n X X ,,1Λ是来自总体X 的样本,且μ=EX ,则下列是μ的无偏估计的是( A ).

5、设4321,,,X X X X 是总体2

(0,)N σ的样本,2

σ未知,则下列随机变量是统计量的是( B ).

(A )3/X σ; (B )

4

1

4i

i X

=∑; (C )σ-1X ; (D )

4

2

21

/i

i X

σ=∑

6、设总体),(~2

σμN X ,1,,n X X L 为样本,S X ,分别为样本均值和标准差,则下列正确的是( C ).

7、设总体X 服从两点分布B (1,p ),其中p 是未知参数,15,,X X ???是来自总体的简单随机样本,

则下列随机变量不是统计量为( C ) ( A ) . 12X X +

( B )

{}max ,15i X i ≤≤

( C ) 52X p + ( D ) ()2

51X X -

8、设1,,n X X ???为来自正态总体2

(,)N μσ的一个样本,μ,2σ未知。则2

σ的最大似然估计量为

( B )。

(A )∑=-n i i X n 12)(1μ (B )()2

1

1∑=-n i i X X n (C )∑=--n i i X n 12

)(11μ(D )()∑=--n i i

X X n 1211 9、设总体),(~2

σμN X ,1,,n X X ???为样本,S X ,

服从

( D )分布.

10、设1,,n X X ???为来自正态总体2

(,)N μσ的一个样本,μ,2σ未知。则2

σ的置信度为1α-的区

间估计的枢轴量为( C )。

(A)

()

2

1

2

n

i i X μσ

=-∑ (B)

()

2

1

2

n

i i X μσ

=-∑ (C)

()∑=-n

i i

X X

1

2

2

1

σ

(D)

()

2

1

2

0n

i i X

X σ=-∑

11、在假设检验中,下列说法正确的是( A )。

(A) 如果原假设是正确的,但作出的决策是接受备择假设,则犯了第一类错误; (B) 如果备择假设是正确的,但作出的决策是拒绝备择假设,则犯了第一类错误; (C) 第一类错误和第二类错误同时都要犯;

(D) 如果原假设是错误的,但作出的决策是接受备择假设,则犯了第二类错误。

12、对总体

2

~(,)X N μσ的均值μ和作区间估计,得到置信度为95%的置信区间,意义 是指这个区间( D )。

(A)平均含总体95%的值 (B)平均含样本95%的值

(C)有95%的机会含样本的值 (D)有95%的机会的机会含μ的值 13、设?θ是未知参数θ的一个估计量,若?E θθ≠,则?

θ是θ的( B )。 (A)极大似然估计 (B) 有偏估计 (C)相合估计 (D) 矩法估计 14、设总体X 的数学期望为12,,,,n X X X μL 为来自X 的样本,则下列结论中 正确的是( A ).

(A )1X 是μ的无偏估计量. (B )1X 是μ的极大似然估计量. (C )1X 是μ的相合(一致)估计量. (D )1X 不是μ的估计量.

15、设总体2~(,)X N μσ,2σ未知,12,,,n X X X L 为样本,2

S 为修正样本方差,则检验问题:

00:H μμ=,10:H μμ≠(0μ已知)的检验统计量为( D ).

(A

)

0X S μ-(B

)

0X μσ- (C

)

0X μσ-(D

)

0X S

μ-.

16、设总体X 服从参数为λ的泊松分布()P λ,n X X X ,,,21Λ是来自总体X 的简单随机样本, 则=X D /n λ.

17、设321,,X X X 为来自正态总体),(~2

σμN X 的样本,若321cX bX aX ++为μ的一个

无偏估计,则=++c b a ___1__。

18、设),(~2

σμN X ,而1.70,1.75,1.70,1.65,1.75是从总体X 中抽取的样本,则μ的矩 估计值为 1.71 。

19、设总体X 服从正态分布),(2σμN ,μ未知。n X X X ,,,

21Λ为来自总体的样本,则对

假设2

02

0σσ

=:H ;2021σσ≠:H 进行假设检验时,通常采用的统计量是

220

(1)n S

σ

-%,它

服从2

χ分布, 自由度为1n -。

20、设总体)4,1(~N X ,1210, , , X X X L 为来自该总体的样本,10

1

110i i X X ==∑,则()D X =2/5

21、我们通常所说的样本称为简单随机样本,它具有的特点是独立性,代表性 . 22、已知0.9(8,20)2F =,则0.1(20,8)F = 1/2 .

23、设]1,[~a U X ,n X X ,,1Λ是从总体X 中抽取的样本,求a 的矩估计为 21X - . 24、检验问题:()()00:H F x F x =,()()00:H F x F x ≠(()0F x 含有l 个未知参数)的

皮尔逊2

χ检验拒绝域为 ()()2

211?1?r i i i i n np n l np αχ-=??-??>--??????

∑ . 25、设621,,,X X X Λ为来自正态总体)1,0(N 的简单随机样本,设

若使随机变量CY 服从2χ分布,则常数=C 1/3 .

26、设由来自总体2

(,0.9)N μ的容量为9的简单随机样本其样本均值为5x =,则μ的置信度 为0.95的置信区间是 (4.412, 5.588)(0.975 1.96μ=).

27、若线性模型为()2

0,,n

Y X E Cov I βε

εεεσ=+?

?

==?,则最小二乘估计量为 ()1?X X X Y β

-''= . 28、若样本观察值1,,m x x L 的频数分别为1,,m n n L ,则样本平均值为 1

1m

j j j x n x n ==∑ .

29、若样本观察值1,,m x x L 的频数分别为1,,m n n L ,则样本方差为 2

2

n 1

1()m j i j s n x x n ==-∑ .

30、设f (t )为总体X 的特征函数,()1,,n X X L 为总体X 的样本,则样本均值X 的特征函数

为 n

t f

n ?

?

?? ???????

. 31、设X 服从自由度为n 的2

χ-分布,则其数学期望和方差分别是 n 、2n .

32、设()2

i i X n χ:,i=1,…,k ,且相互独立。则1k

i i X =∑服从分布 2

1k i i n χ=??

???

∑ .

33、设总体X 服从均匀分布[0,]U θ,从中获得容量为n 的样本1,,n X X L ,其观测值为1,,n x x L , 则θ的最大似然估计量为 ()n X .

34、根据样本量的大小可把假设检验分为 大样本检验与小样本检验. 35、设样本1,,n X X L 来自正态总体()2

,N

μσ,μ未知,样本的无偏方差为2

S

,则检验

问题22

22001

:,:H H σσσσ≤>的检验统计量为 ()2

22

01n S χσ-=.

36、对试验(或观察)结果的数据作分析的一种常用的统计方法称为 方差分析法.

37、设1217,,,X X X L 是总体(,4)N μ的样本,2

S 是样本方差,若2()0.01P S a >=,

则a =___8__.(2

0.99(16)32.0χ=)

38、设总体X 的密度函数为 ()36(),0;

0,

.x

x x p x θθθ?-<

θ的矩估计量为___?2X θ

=__. 39、设总体X 的概率密度为(),

01,

1,

12,0,.

x p x x θθ<

=-≤

其他,其中θ是未知参数(0<θ<1),X 1,X 2,…,X n

为来自总体X 的简单随机样本,则θ的矩估计量为_3

2

X -__. 40、设总体X 的分布函数为

F (x ,β)=11,1,0,

1.x x

x β

?->???≤?

其中未知参数β>1,设X 1,X 2,…,X n 为来自总体X 的样本,则β的最大似然估计量__1

?ln n

i

i n

X

β

==∑___.

41、设测量零件的长度产生的误差X 服从正态分布2

(,)N μσ,今随机地测量16个零件,得

16

1

8i

i X

==∑,16

21

34i i X ==∑. 在置信度0.95下,μ的置信区间为_(0.2535,1.2535-)_.

42、设由来自总体2

(,0.9)N μ的容量为9的简单随机样本其样本均值为5x =,则μ的置信度为0.95的置信区间是 (4.412,

5.588)(0.975 1.96μ=).

43、设总体X 服从两点分布B (1,p ),其中p 是未知参数,15,,X X L 是来自总体的简单随机样本。指出{}()2

12551,max ,15,2,i X X X i X p X X +≤≤+-之中哪些是统计量,哪些不是统计量,为什么?

解:{}()2

1251,max ,15,i X X X i X X +≤≤-都是统计量,52X p +不是统计量,因p 是未知参数。 44、设总体X 服从参数为(N ,p )的二项分布,其中(N ,p )为未知参数,12,,,n X X X L 为来自总体X 的一个样本,求(N ,p )的矩法估计。

解答:因为()()()

2

2

2

,1EX Np EX DX EX Np p Np ==+=-+,只需以2

1

1,n i i X X n =∑分别代

2

,EX EX 解方程组得22

2

??,1n n S X N p X S X

==--。 45、设12,,,n X X X L 是取自正态总体()2,N μσ的一个样本,试问()22

1

11n i

i S X X n ==--∑是2

σ的相合估计吗? 解:由于

()2

2

1n S σ

- 服从自由度为

n-1的2

χ-分布,故

()

()()4

4

2

2

2

2

2,2111ES DS n n n σσσ==?-=--, 从而根据车贝晓夫不等式有

(

)

()2

422

2

2

2001n DS P S n σσεεε

→∞

≤-≥≤

=???→-,所以()22111n i i S X X n ==--∑是2σ的相合估计。

46、设连续型总体X 的概率密度为()()2

2,0

,00, 0x

x e x p x x θθθθ-??>=>??≤?

, 12,,,n X X X L 来自总体X 的

一个样本,求未知参数θ的极大似然估计量?θ

,并讨论?θ的无偏性。

解:似然函数为

()()2

21

2

1

1

221

1

,ln ln ln ,2n

i i i n

n

x x i

i

n

n

i

i i i n

i i x

x

x L e

e

L n x θ

θ

θθθθ

θθ=--

====∑==

=-+-∏∑∏

∏()2

12ln 2n

i

i x

d L n

d θθθθ==-+∑,

()ln 0d L d θθ

=,得21

?2n i

i X

n

θ==∑.由于

()22

22

2221

220011?222222n

x x i

i EX

x x x E EX x e dx e d n

θθ

θ

θθθθθθ

--∞∞======Γ=∑??,

因此θ的极大似然估计量?θ

是θ的无偏估计量。 47、随机地从一批钉子中抽取16枚,测得其长度(以厘米计)为 2.14 2.10 2.13 2.15 2.13 2.12 2.13 2.10 2.15 2.12 2.14 2.10 2.13 2.11 2.14 2.11设钉长服从正态分布。 若已知σ=0.01(厘米),试求总体均值μ的0.9的置信区间。(0.95 1.65u =)

解:()2

2

1

0.01, 2.14 2.10 2.11 2.12516

x σ==

+++=L ,置信度0.9,即α=0.1,查正态分布数值表,知()()1/21.650.95u α-Φ=Φ=, 即()

1.6510.90P U α≤=-=,从而

1/20.95 1.65u u α-==

1/2 1.650.004α-=

=,所以总体均值μ的0.9的置信区间为 48、甲、乙两台机床分别加工某种轴,轴的直径分别服从正态分布()21

1

,N

μσ与()22

2

,N μσ,为比

较两台机床的加工精度有无显着差异。从各自加工的轴中分别抽取若干根轴测其直径,结果如下:

试问在α=0.05水平上可否认为两台机床加工精度一致?(0.9750.9756,7 5.12,7,6 5.70.F F ==) 解:首先建立假设:

在n=8,m=7, α=0.05时,

故拒绝域为{}0.195, 5.70F or F <>, 现由样本求得2

1s =0.2164,2

2s =0.2729,从而F=0.793,未落入

拒绝域,因而在α=0.05水平上可认为两台机床加工精度一致。

49、为了检验某药物是否

会改变人的血压,挑选10名试验者,测量他们服药前后的血压,如下表所列:

假设服药后与服药前血压差值服从正态分布,取检验水平为0.05,从这些资料中是否能得出该药物会改变血压的结论?

解:以X 记服药后与服药前血压的差值,则X 服从()2

,N

μσ,其中2

,μσ

均未知,这些资料中可以

得出X 的一个样本观察值:6 8 3 -4 6 -2 6 -1 7 2

待检验的假设为

01:0,:0H H μμ=≠ 这是一个方差未知时,对正态总体的均值作检验的问题,因此用t 检验法

()1/21T t n α-=

≤-时,接受原假设,反之,拒绝原假设。依次计算有

()()()()

22

2116872 3.1,6 3.12 3.117.6556

101x s =

++++==-++-=-L L , 2.3228t ==,

由于()()1/20.97519 2.2622t n t α--==, T 的观察值的绝对值 2.3228 2.2622t =>. 所以拒绝原假

设,即认为服药前后人的血压有显着变化。

50、为了研究患慢性支气管炎与吸烟量的关系,调查了272个人,结果如下表:

试问患慢性支气管炎是否与吸烟量相互独立(显着水平α=0.05)?

解:令X=1表示被调查者患慢性气管炎,X=2表示被调查者不患慢性气管炎,Y 表示 被调查者每日的吸烟支数。

原假设H 0:X 与Y 相互独立。根据所给数据有: 51、设某商店100天销售电视机的情况有如下统计资料:

求样本容量n ,样本均值和样本方差。

解:样本容量为n=100,样本均值,样本方差,样本修正方差分别为 52、设总体服从泊松分布P (λ),1,,n X X L 是一样本: (1)写出1,,n X X L 的概率分布; (2)计算2

,n EX DX ES 和;

(3)设总体容量为10的一组样本观察值为(1,2,4,3,3,4,5,6,4,8)试计算样本均值, 样本方差和次序统计量的观察值。 (1)写出1,,n X X L 的概率分布;

解:

Λ

ΛΛφΛ,2,1,0,!

!

)(,2,1,0,,2,1,0,!

)(1

1

1

n 11

==

=======

=-=∑-==-∏∏

∏=i n n

i i x x

i i x

i i n

i i i i i x

i i x e x e x x X p n i x X P X X x e x x x P i

n

i i

i

λλλλ

λλλ)(的概率分布为

所以因为:

(2)计算2

,n EX DX ES 和;

解:λλλλn

n DX n n ES n n DX X D EX X E DX EX n 11,,,2

-=-===

====所以因为 (3)设总体容量为10的一组样本观察值为(1,2,4,3,3,4,5,6,4,8)试计算样本 均值, 样本方差和次序统计量的观察值。 解:

53、设17,,X X L 为总体X 服从()0,0.25N 的一个样本,求7214i i P X =??> ???

∑.(()2

0.975716.0128χ=)

解: 因每个i X 与总体X 有相同分布,故020.5i i X X -=服从()0,1N ,则2

77

211

040.5i i i i X X ==-??

= ???∑∑服从自由度n=7的2

χ-分布。因为77722211144161416i i i i i i P X P X P X ===??????

>=>=-≤ ? ? ???????∑∑∑,查表可

知()2

0.975716.0128χ=, 故72140.025.i i P X =?

?>= ???

54、设总体X 具有分布律

其中θ(0<θ<1)为未知参数。已知取得了样本值x 1=1,x 2=2,x 3=1,试求θ的最大似然估计值。 解:似然函数}1{}2{}1{}{)(3213

1

======

∏=X P X P X P x X

P θL i i i

ln L (θ )=ln2+5ln θ+ln(1-θ) 求导

011

65)(ln =--=θ

θd θL d

得到唯一解为6

5

?=θ

55、求均匀分布],[21θθU 中参数21,θθ的极大似然估计. 解:由X 服从[a ,b]上的均匀分布,易知

()()2

22

2,2122b a a b a b EX EX DX EX -++??==+=+ ?

??

求a ,b 的矩法估计量只需解方程

()

2

2????,212

n b a a

b X S -+==

,

得??,n n

a X

b X == 56、为比较两个学校同一年级学生数学课程的成绩,随机地抽取学校A 的9个学生,得分数的平均值为31.81=A x ,方差为76.602

=A s ;随机地抽取学校B 的15个学生,得分数的平均值为61.78=B x ,方差为24.482

=B s 。设样本均来自正态总体且方差相等,参数均未知,两样本独立。求均值差B A μμ-的置信水平为0.95的置信区间。(()0.975227.266t =) 解:根据两个正态总体均值差的区间估计的标准结论,均值差B A μμ-的置信水平为0.95的置信区

间为

57、设A ,B 二化验员独立地对某种聚合物的含氯量用相同的方法各作了10次测定,其测量值的修

正方差分别为220.5419,0.6065A B s s ==,设2A σ和2

B σ分别为所测量的数据总体(设为正态总体)的方差,求方差比22

/A B σσ的0.95的置信区间。

解:n=m=10, 1-α=0.95,α=0.05,

()()()()

1/20.975/21/21

1,19,9 4.03,1,10.24181,1F n m F F n m F m n ααα----==--=

=--,

从而

()()22221/2/211

0.541910.54191,,1,11,10.60654.030.60650.241[0.2223.601]8A A B B S S S F n m S F n m αα-????==????

----??

??,故方差比22

/A B σσ的0.95的置信区间为[0.222,3.601]。

58、某种标准类型电池的容量(以安-时计)的标准差66.1=σ,随机地取10只新类型的电池测得它们的容量如下:146,141,135,142,140,143,138,137,142,136

设样本来自正态总体),(2

σμN ,2

,σμ均未知,问标准差是否有变动,即需检验假设(取05.0=α):

22122066.1:,66.1:≠=σσH H 。

解答:这是一个正态总体的方差检验问题,属于双边检验问题。 检验统计量为

2

2

2

66

.1)1(S n -=χ。 代入本题中的具体数据得到2

2

(101)12

39.1931.66-?χ=

=。

检验的临界值为022.19)9(2

975.0=χ。

因为2

39.19319.022χ=>,所以样本值落入拒绝域,因此拒绝原假设0H ,即认为电池容量的

标准差发生了显着的变化,不再为1.66。

59

试在α=0.05水平上检验失业人员的性别与文化程度是否有关。(()2

0.9537.815χ=)

解:这是列联表的独立性检验问题。在本题中r=2,c=4,在α=0.05下,

()()()()22

0.950.95

1137.815r c χχ--==, 因而拒绝域为:{}2

7.815W χ=≥. 为了计算统计量(3.4),可列成如下表格计算../i j n n n ?:

()()()2

2

2

2

4036.82023.2625644.47.23636.8

23.2

644.4

χ---=

+

++

=L

,

由于2

χ=7.326<7.815,样本落入接受域,从而在α=0.05水平上可认为失业人员的性别与文化程度无

关。

60、设总体X 具有贝努里分布b (1,p ),p ∈Θ=(0,1),1,,n X X L 是一样本,试求p 的无偏估计的方差下界。

解: 由于(), 1

,,1, 0

p x f x p p x =?=?

-=?容易验证定理2.2.2的条件满足,且

()()()()2

1

0ln ,1

,1i i x f x p I p f x p p p p =???==

??-??

∑, 所以方差下限是()()11

p p nI p n

-=

. 大家知道11n i i v

X X n n ===∑ (ν表示“1”发生的频率)是p 的无偏估计,而()

1p p p D X n

-=达到罗-克拉美不等式的

应用数理统计大作业1——逐步回归法分析终教学提纲

应用数理统计大作业1——逐步回归法分析 终

应用数理统计多元线性回归分析 (第一次作业) 学院:机械工程及自动化学院 姓名: 学号: 2014年12月

逐步回归法在AMHS物流仿真结果中的应 用 摘要:本文针对自动化物料搬运系统 (Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS 数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响 年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。 关键词:逐步回归;残差;SPSS;AMHS;物流仿真

目录 1、引言 (1) 2、逐步回归法原理 (4) 3、模型建立 (6) 3.1确定自变量和因变量 (6) 3.2分析数据准备 (6) 3.3逐步回归分析 (7) 4、结果输出及分析 (9) 4.1输入/移去的变量 (9) 4.2模型汇总 (10) 4.3方差分析 (10) 4.4回归系数 (11) 4.5已排除的变量 (12) 4.6残差统计量 (13) 4.7残差分布直方图和观测量累计概率P-P图 (14) 5、异常情况说明 (15) 5.1异方差检验 (15) 5.2残差的独立性检验 (17) 5.3多重共线性检验 (17) 6、结论 (18) 参考文献 (20)

1、引言 回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。 SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。SPSS软件不仅具有包括数据管理、统计分析、图表分析、输出管理等在内的基本统计功能,而且用它处理正交试验设计中的数据程序简单,分析结果明了。基于以上优点,SPSS已经广泛应用于自然科学、社会科学中,其中涉及的领域包括工程技术、应用数学、经济学、商业、金融等等。 本文研究内容主要来源于“庆安集团基于物联网技术的航空柔性精益制造系统”,在庆安集团新建的320厂房建立自动化物料搬运系统(AMHS),使用生产仿真软件EM-Plant对该系统建模并仿真,设计实验因子及各水平如表1-1,则共有3*4*6=72组实验结果,如表所示。为方便描述,将各因子定义为:X1表示AGC物料交换服务水平,X2表示周转箱交换周期,X3表示EMS数量,Y表示因变量年产量箱数。本文目的就是建立年产量箱数与AGC物料交换服务水平、周转箱交换周期和EMS数量之间的关系。

【免费下载】概率论与数理统计案例

实例1 发行彩票的创收利润某一彩票中心发行彩票 10万张, 每张2元. 设头等奖1个, 奖金 1万元, 二等奖2个,奖金各 5 千元;三等奖 10个, 奖金各1千元; 四等奖100个, 奖金各100元; 五等奖1000个, 奖金各10 元.每张彩票的成本费为 0.3 元, 请计算彩票发行单位的创收利润.解:设每张彩票中奖的数额为随机变量X , 则X 10000 5000 1000 100 10 0p 51/1052/10510/105100/1051000/100p 每张彩票平均能得到奖金 05512()10000500001010E X p =? +?++? 0.5(),=元每张彩票平均可赚20.50.3 1.2(), --=元因此彩票发行单位发行 10 万张彩票的创收利润为:100000 1.2120000().?=元实例2 如何确定投资决策方向?某人有10万元现金,想投资于某项目,预估成功的机会为 30%,可得利润8万元 , 失败的机会为70%,将损失 2 万元.若存入银行,同期间的利率为5% ,问是否作此项投资?解:设 X 为投资利润,则 X 8 -2p 0.3 0.7()80.320.71(),E X =?-?=万元存入银行的利息:故应选择投资.1050.5(),%?=万元实例3 商店的销售策略某商店对某种家用电器的销售采用先使用后付款的方式,记使用寿命为X (以年计),规定1,1500;12,2000;23,2500; 3,3000.X X X X ≤<≤<≤>一台付款元一台付款元一台付款元一台付款元10,1e ,0,()100, 0.x X x f x x Y -?>?=??≤? 设寿命服从指数分布概率密度为试求该商店一台家用电器收费的数学期望定盒位置保护层防腐跨接地线弯曲半径标高等,要求技术交底。管线敷设技术、电气课校对图纸,编写复杂设备与装置高中资料试卷调试方案,编写重要设备高中资料、电气设备调试高中中资料试卷工况进行自动处理,尤其要避免错误高中资料试卷保护装置动作,并

应用数理统计大作业1——逐步回归法分析终

应用数理统计多元线性回归分析 (第一次作业) 学院:机械工程及自动化学院 姓名: 学号: 2014年12月

逐步回归法在AMHS物流仿真结果中的应 用 摘要:本文针对自动化物料搬运系统(Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。 关键词:逐步回归;残差;SPSS;AMHS;物流仿真

目录 1、引言 (1) 2、逐步回归法原理 (4) 3、模型建立 (5) 3.1确定自变量和因变量 (5) 3.2分析数据准备 (6) 3.3逐步回归分析 (7) 4、结果输出及分析 (8) 4.1输入/移去的变量 (8) 4.2模型汇总 (9) 4.3方差分析 (9) 4.4回归系数 (10) 4.5已排除的变量 (11) 4.6残差统计量 (11) 4.7残差分布直方图和观测量累计概率P-P图 (12) 5、异常情况说明 (13) 5.1异方差检验 (13) 5.2残差的独立性检验 (14) 5.3多重共线性检验 (15) 6、结论 (15) 参考文献 (17)

1、引言 回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。 SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。SPSS软件不仅具有包括数据管理、统计分析、图表分析、输出管理等在内的基本统计功能,而且用它处理正交试验设计中的数据程序简单,分析结果明了。基于以上优点,SPSS已经广泛应用于自然科学、社会科学中,其中涉及的领域包括工程技术、应用数学、经济学、商业、金融等等。 本文研究内容主要来源于“庆安集团基于物联网技术的航空柔性精益制造系统”,在庆安集团新建的320厂房建立自动化物料搬运系统(AMHS),使用生产仿真软件EM-Plant对该系统建模并仿真,设计实验因子及各水平如表1-1,则共有3*4*6=72组实验结果,如表所示。为方便描述,将各因子定义为:X1表示AGC物料交换服务水平,X2表示周转箱交换周期,X3表示EMS数量,Y表示因变量年产量箱数。本文目的就是建立年产量箱数与AGC物料交换服务水平、周转箱交换周期和EMS数量之间的关系。 表1-1三因子多水平实验方案

最新北航数理统计大作业-多元线性回归

北航数理统计大作业-多元线性回归

应用数理统计多元线性回归分析 (第一次作业) 学院: 姓名: 学号: 2013年12月

交通运输业产值的多元线性回归分析 摘要:本文基于《中国统计年鉴》(2012年版)统计数据,寻找影响交通运输业发展的因素,包括工农业发展水平、能源生产水平、进出口贸易交流以及居民消费水平等,利用统计软件SPSS对各因素进行了筛选分析,采用逐步回归法得到最优多元线性回归模型,并对模型的回归显著性、拟合度以及随机误差的正态性进行了检验,最后可以利用有效的最优回归模型对将来进行预测。 关键字:多元线性回归,逐步回归,交通运输产值,工业产值,进出口总额1,引言 交通运输业指国民经济中专门从事运送货物和旅客的社会生产部门,包括铁路、公路、水运、航空等运输部门。它是国民经济的重要组成部分,是保证人们在政治、经济、文化、军事等方面联系交往的手段,也是衔接生产和消费的一个重要环节。交通运输业在现代社会的各个方面起着十分重要的作用,因此研究交通运输业发展水平与各个影响因素间的关系显得十分重要,建立有效的数学相关模型对于预测交通运输业的发展,制定相关政策方案提供依据。根据经验交通运输业的发展受到工农业发展、能源生产、进出口贸易以及居民消费水平等众因素的影响,故建立一个完整精确的数学模型在理论上基本无法实现,并且在实际运用中也没有必要,一种简单有效的方式就是寻找主要影响因素,分析其与指标变量的相关性,建立多元线性回归模型就是一种有效的方式。 变量与变量之间的关系分为确定性关系和非确定性关系,函数表达确定性关系。研究变量间的非确定性关系,构造变量间经验公式的数理统计方法称为

重庆大学研究生数理统计大作业

NBA球员科比单场总得分与上场时间的线性回归分析 摘要 篮球运动中,球员的上场时间与球员的场上得分的数学关系将影响到教练对每位球员上场时间的把握,若能得到某位球员的上场时间与场上得分的数据关系,将能更好的把握该名球员的场上时间分配。本次作业将针对现役NBA球员中影响力最大的球员科比布莱恩特进行研究,对其2012-2013年赛季常规赛的每场得分与出场时间进行线性回归,得到得分与出场时间的一元线性回归直线,并对显著性进行评估和进行区间预测。 正文 一、问题描述 随着2002年姚明加入NBA,越来越多的中国人开始关注篮球这一项体育运动,并使得篮球运动大范围的普及开来,尤其是青年学生。本着学以致用的原则,希望将所学理论知识与现实生活与个人兴趣相结合,若能通过建立相应的数理统计模型来做相应的分析,并且从另外一个角度解析篮球,并用以指导篮球这一项运动的更好发展,这也将是一项不同寻常的探索。篮球运动中,得分是取胜的决定因素,若要赢得比赛,必须将得分超出对手,而影响一位球员的得分的因素是多样的,例如:情绪,状态,体力,伤病,上场时间,防守队员等诸多因素,而上场时间作为最直接最关键的因素,其对球员总得分的影响方式有着重要的研究意义。 倘若知道了其分布规律,则可从数量上掌握得分与上场时间复杂关系的大趋势,就可以利用这种趋势研究球员效率最优化与上场时间的控制问题。 因此,本文针对湖人当家球星科比布莱恩特在2012-2013年赛季常规赛的每场得分与上场时间进行线性回归分析,并对显著性进行评估,以巩固所学知识,并发现自己的不足。 二、数据描述 抽出科比布莱恩特2012-2013年常规赛所有82场的数据记录(原始数据见附录),剔除掉其中没有上场的部分数据,得到有参考实用价值的数据如表2.1所示:

应用数理统计大作业1——逐步回归法分析终

应用数理统计大作业1——逐步回归法分析终 -标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

应用数理统计多元线性回归分析 (第一次作业) 学院:机械工程及自动化学院 姓名: 学号: 2014年12月

逐步回归法在AMHS物流仿真结果中的应 用 摘要:本文针对自动化物料搬运系统 (Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。 关键词:逐步回归;残差;SPSS;AMHS;物流仿真

目录 1、引言 (1) 2、逐步回归法原理 (4) 3、模型建立 (6) 3.1确定自变量和因变量 (6) 3.2分析数据准备 (6) 3.3逐步回归分析 (7) 4、结果输出及分析 (9) 4.1输入/移去的变量 (9) 4.2模型汇总 (10) 4.3方差分析 (10) 4.4回归系数 (11) 4.5已排除的变量 (12) 4.6残差统计量 (13) 4.7残差分布直方图和观测量累计概率P-P图 (14) 5、异常情况说明 (15) 5.1异方差检验 (15) 5.2残差的独立性检验 (17) 5.3多重共线性检验 (17) 6、结论 (18) 参考文献 (20)

1、引言 回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。 SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。SPSS软件不仅具有包括数据管理、统计分析、图表分析、输出管理等在内的基本统计功能,而且用它处理正交试验设计中的数据程序简单,分析结果明了。基于以上优点,SPSS已经广泛应用于自然科学、社会科学中,其中涉及的领域包括工程技术、应用数学、经济学、商业、金融等等。 本文研究内容主要来源于“庆安集团基于物联网技术的航空柔性精益制造系统”,在庆安集团新建的320厂房建立自动化物料搬运系统(AMHS),使用生产仿真软件EM-Plant对该系统建模并仿真,设计实验因子及各水平如表1-1,则共有3*4*6=72组实验结果,如表所示。为方便描述,将各因子定义为:X1表示AGC物料交换服务水平,X2表示周转箱交换周期,X3表示EMS数量,Y表示因变量年产量箱数。本文目的就是建立年产量箱数与AGC物料交换服务水平、周转箱交换周期和EMS数量之间的关系。

华科数理统计作业答案

● 1.某百货公司连续40天的商品销售额如下(单位:万元): 41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35 根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。(数据见练 解:打开Excel 练习1数据.xls ,再查如函数栏输入=MAX(A2:A41),=MIN(A2:A41)得数据的最大值为49,最小值为25。 数据全为49-25=24,为便于计算和分析,将数据分为5组,各组组距为5。 用Excel 统计各组内数据的个数,点击“插入函数”,选择FREQUENCY ,确定FREQUENCY 函数的两个参数的值,其中:?Data-array :原始数据或其所在单元格区域(A2:A41)?Bins-array :分组各组的上限值或其所在单元格区域(C6:C9)?。 将各组天数除以总天数40,得到各组频率。作出如下频数分布表: 2.为了确定灯泡 的使用寿命(小时),在一批灯泡中随 机抽取100只进行测试,所得结果如 下: 700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688 (1)利用计算机对上面的数据进行排序; (2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图; (3)绘制茎叶图,并与直方图作比较. (数据见练习1数据.xls-练习1.2) 解:(1) 频数分布表 销售收入(万元) 频数 频率% 25-30 6 0.15 30-35 6 0.15 53-40 14 0.35 40-45 10 0.25 45-50 4 0.1

2018年数理统计大作业题目和答案--0348

2018年数理统计大作业题目和答案--0348

1、设总体X 服从正态分布),(2 σμN ,其中μ已知,2 σ 未知,n X X X ,,,2 1 为其样本,2≥n ,则下列说法中正 确的是( )。 (A )∑=-n i i X n 1 2 2 ) (μσ是统计量 (B )∑=n i i X n 1 22 σ是统计量 (C )∑=--n i i X n 1 2 2 ) (1μσ是统计量 (D )∑=n i i X n 1 2μ 是统计量 2、设两独立随机变量)1,0(~N X ,) 9(~2 χY ,则Y X 3服从 ( )。 )(A ) 1,0(N )(B ) 3(t )(C ) 9(t )(D ) 9,1(F 3、设两独立随机变量)1,0(~N X ,2 ~(16) Y χ,则Y 服 从( )。 )(A )1,0(N )(B (4) t )(C (16) t )(D (1,4) F 4、设n X X ,,1 是来自总体X 的样本,且μ=EX ,则下 列是μ的无偏估计的是( ). ) (A ∑-=-1 1 1 1 n i i X n )(B ∑=-n i i X n 1 11 )(C ∑=n i i X n 2 1 )(D ∑-=1 1 1n i i X n 5、设4 3 2 1 ,,,X X X X 是总体2 (0,)N σ的样本,2 σ未知,则下列随机变量是统计量的是( ).

() (1) D t n- 10、设 1,, n X X ???为来自正态总体2 (,) Nμσ的一个样本,μ,2σ未知。则2σ的置信度为1α-的区间估计的枢轴量为()。 (A) ()2 1 2 n i i Xμ σ = - ∑ (B) ()2 1 2 n i i Xμ σ = - ∑ (C) () ∑ = - n i i X X 1 2 2 1 σ (D) ()2 1 2 n i i X X σ = -∑ 11、在假设检验中,下列说法正确的是()。 (A) 如果原假设是正确的,但作出的决策是接受备择假设,则犯了第一类错误; (B) 如果备择假设是正确的,但作出的决策是拒绝备择假设,则犯了第一类错误; (C) 第一类错误和第二类错误同时都要犯; (D) 如果原假设是错误的,但作出的决策是接受备择假设,则犯了第二类错误。 12、对总体2 ~(,) X Nμσ的均值μ和作区间估计,得到置信度为95%的置信区 间,意义是指这个区间()。 (A)平均含总体95%的值(B)平 均含样本95%的值

西南大学数理统计作业答案

由累积资料知道甲、乙两煤矿的含灰率分别服从。现从两矿各抽n个试件,分析其含灰率为 问甲、乙两矿所采煤的含灰率的数学期望有无显著差异(显著水平α=0.05)? 答:1分别以甲乙两矿所采煤的含灰率作为总体和总体,问题归结为根据所给的样本观 察值对方差已知的两个正态总体检验,可采用U-检验法。 原假设,由所给样本观察值算得,于是 对于α=0.10,查标准正态分布表得,因为,所以拒绝, 即可以认为有显著差异。 2某种羊毛在处理前后,各抽取样本测得含脂率如下(%): 羊毛含脂率按正态分布,问处理后含脂率有无显著差异(α=0.05)? 答:2已知n=10,m=8,α=0.05,假设,自由度为n+m-2=16,查表 选取统计量

因为 ,所以否定 ,即可以认为处理后含脂率有显著变化。 3 使用A 与B 两种方法来研究冰的潜热,样本都是 的冰。下列数据是每克冰从 变为 的水的过程中的热量变化(Cal/g ): 假定用每种方法测得的数据都具有正态分布,并且它们的方差相等,试在α=0.05下可否认为两种方法测得的结果一致? 答:3两个总体,且 ,用t 检验法: 检验假设 计算统计量的值 α=0.05,自由度为n+m-2=19,方差未知,查表得 ,因 ,故否定 ,即在检验水平α=0.05下可以认为两种方法测得值(均值) 不等。

1为了检验某药物是否会改变人的血压,挑选10名试验者,测量他们服药前后的血压,如下表所列: 假设服药前后血压差值服从正态分布,取检验水平为0.05,从这些资料中是否能得出该药物会改变血压的结论? 答:1以记服药前后血压的差值,则服从,其中均未知,这些资 料中可以得出的一个样本观察值:6 8 3 -4 6 -2 6 -1 7 2 待检验的假设为 这是一个方差未知时,对正态总体的均值作检验的问题,因此用t检验法当 时,接受原假设,反之,拒绝原假设。依次计算有 由于T的观察值的绝对值。所以拒绝原假设,即认为服药前后人的血压有显著变化。 2某厂用自动包装机装箱,在正常情况下,每箱重量服从正态分布,某日开工后,随机抽查10箱,重量如下(单位:斤):99.3,98.9,100.5,100.1,99.9,99.7,100.0,100.2,99.5,100.9,问包装机工作是否正常,即该日每箱重量的数学期望与100有 显著差异(给定水平α=0.05,并认为该日的仍为1.15)? 答:2以该日每箱重量作为总体,它服从,问题就归结为根据所给的样本 观察值对方差已知的正态总体检验,可采用U-检验法。 原假设,由所给样本观察值算得,于是

数理统计的起源

课程文化2-数理统计的起源 数理统计是伴随着概率论的发展而发展起来的一个数学分支,研究如何有效 的收集、整理和分析受随机因素影响的数据,并对所考虑的问题作出推断或预测,为采取某种决策和行动提供依据或建议. 数理统计的发展大致可分为古典时期、近代时期和现代时期三个阶段. 古典时期(19世纪以前).这是描述性的统计学形成和发展阶段,是数理统计的萌芽时期.在这一时期里,瑞土数学家雅各布·伯努利(Jakob Bernoulli?,1654-1705)较早地系统论证了大数定律.1763年,英国数学家贝叶斯(Thomas Bayes,1701-1761)提出了一种归纳推理的理论,后被发展为一种统计推断方法― 贝叶斯方法,开创了数理统计的先河.法国数学家棣莫佛(de Moivre,1667-1754)于1733年首次发现了正态分布的密度函数并计算出该曲线在各种不同区间内的概率,为整个大样本理论奠定了基础.1809年,德国数学家高斯(Gauss.Garl Friedrich,1777-1855,德国)和法国数学家勒让德(Adrien Marie Legendre1752-1833)各自独立地发现了最小二乘法,并应用于观测数据的误差分析.在数理统计的理 论与应用方面都作出了重要贡献,他不仅将数理统计应用到生物学,而且还应用到教育学和心理学的研究.并且详细地论证了数理统计应用的广泛性,高斯曾预言:"统计方法,可应用于各种学科的各个部门." 近代时期(19世纪末至1845年).数理统计的主要分支建立,是数理统计的形成时期.上一世纪初,由于概率论的发展从理论上接近完备,加之工农业生产迫切需要,推动着这门学科的蓬勃发展. 1889年,英国数学家皮尔逊(Karl Pearson,1857-1936)提出了矩阵估计法,次年 又提出了频率曲线的理论,并于1900年在德国大地测量学者赫尔梅特(F.Helmert)1876年研究正态总体的样本方差时发现的一个十分重要的分布的基础上提出了 检验,这是数理统计发展史上出现的第一个小样本分布. 1908年,英国的统计学家戈塞特(W.S.Gosset,1876-1937)创立了小样本检验代替了大样本检验的理论和方法(即t分布和t检验法),这为数理统计的另一分支---多元分析奠定了理论基础. 1912年,英国统计学家费歇(R.A.Fisher,1890-1962)推广了t检验法,同时发展了显著性检验及估计、方差分析等数理统计新分支. 这样,数理统计的一些重要分支如假设检验、回归分析、方差分析、正交设 计等都有了决定其基本面貌的内容和理论框架.数理统计成为应用广泛、方法独特的一门数学学科. 现代时期(1945年以后).美籍数理统计学家瓦尔德(A.Wald,1902-1950)致力于用数学方法使统计学精确化、严密化,取得了很多重要成果.他发展了决策理论,提出了一般的判别问题,创立了序贯分析理论,提出了著名的序贯概率比检验 法(比如,用于贵重产品的抽样检查与验收).瓦尔德的两本著作《序贯分析》和《统计决策函数论》,被认为是数理发展史上的经典之作.统计决策理论从人与大自 然进行博弈的观点出发,把形形色色的统计问题纳入一个统一的模式之下,对战后数理统计许多分支的发展产生了很大的影响,特别是参数估计这个分支.

北航数理统计第二次大作业-数据分析模板

数理统计第二次大作业材料行业股票的聚类分析与判别分析 2015年12月26日

材料行业股票的聚类分析与判别分析摘要

1 引言 2 数据采集及标准化处理 2.1 数据采集 本文选取的数据来自大智慧软件的股票基本资料分析数据,从材料行业的股票中选取了30支股票2015年1月至9月的7项财务指标作为分类的自变量,分别是每股收益(单位:元)、净资产收益率(单位:%)、每股经营现金流(单位:元)、主营业务收入同比增长率(单位:%)、净利润同比增长率(单位:%)、流通股本(单位:万股)、每股净资产(单位:元)。各变量的符号说明见表2.1,整理后的数据如表2.2。 表2.1 各变量的符号说明 自变量符号 每股收益(单位:元)X1 净资产收益率(单位:%)X2 每股经营现金流(单位:元)X3 主营业务收入同比增长率(单位:%)X4 净利润同比增长率(单位:%)X5 流通股本(单位:万股)X6 每股净资产(单位:元)X7 表2.2 30支股票的财务指标 股票代码X1 X2 X3 X4 X5 X6 X7 武钢股份600005-0.0990-2.81-0.0237-35.21-200.231009377.98 3.4444宝钢股份6000190.1400 1.980.9351-14.90-55.011642427.88 6.9197山东钢铁600022-0.11650.060.0938-20.5421.76643629.58 1.8734北方稀土6001110.0830 3.640.652218.33-24.02221920.48 2.2856

杭钢股份600126-0.4900-13.190.4184-36.59-8191.0283893.88 3.4497抚顺特钢6003990.219310.080.1703-14.26714.18112962.28 1.4667盛和资源6003920.0247 1.84-0.2141-5.96-19.3739150.00 1.2796宁夏建材6004490.04000.510.3795-22.15-92.3447818.108.7321宝钛股份600456-0.2090-2.53-0.3313-14.81-6070.2043026.578.1497山东药玻6005290.4404 5.26 1.2013 6.5016.7825738.018.5230国睿科技6005620.410011.53-0.2949 3.3018.9416817.86 3.6765海螺水泥600585 1.15169.05 1.1960-13.06-25.33399970.2612.9100华建集团6006290.224012.75-0.57877.90-6.4034799.98 1.8421福耀玻璃6006600.790014.250.9015 3.6017.27200298.63 6.2419宁波富邦600768-0.2200-35.02-0.5129 3.1217.8813374.720.5188马钢股份600808-0.3344-11.710.3939-21.85-689.22596775.12 2.6854亚泰集团6008810.02000.600.1400-23.63-68.16189473.21 4.5127博闻科技6008830.503516.71-0.1010-10.992612.8023608.80 3.0126新疆众和6008880.0523 1.04-0.910662.64162.0464122.59 5.0385西部黄金6010690.0969 3.940.115115.5125.5712600.00 2.4965中国铝业601600-0.0700-2.920.2066-9.0882.79958052.19 2.3811明泰铝业6016770.2688 4.66-1.09040.8227.8640770.247.4850金隅股份6019920.1989 3.390.3310-10.05-39.01311140.26 6.7772松发股份6032680.35007.00-0.3195-4.43-9.622200.00 6.0244方大集团0000550.0950 5.66-0.480939.2920.6742017.94 1.6961铜陵有色0006300.0200 1.220.6132 3.23-30.74956045.21 1.5443鞍钢股份000898-0.1230-1.870.7067-27.32-196.21614893.17 6.4932中钢国际0009280.572714.45-0.4048-14.33410.2441286.57 4.2449中材科技0020800.684610.27 1.219547.69282.1740000.00 6.8936中南重工0024450.1100 4.300.340518.8445.0950155.00 2.7030 2.2 数据的标准化处理 由于不同的变量之间存在着较大的数量级的差别,因此要对数据变量进行标准化处理。本文采用Z得分值法标准化的方法进行标准化,用x的值减去x的均值再除以样本的方差。也就是把个案转换为样本均值为0、标准差为1的样本。如果不同变量的变量值数值相差太大,会导致计算个案间距离时,由于绝对值较小的数值权数较小,个案距离的大小几乎由大数值决定,标准化过程可以解决此类问题,使不同变量的数值具有同等的重要性。经Z标准化输出结果见表 2.2。 表2.2 经Z标准化后的数据 ZX1ZX2ZX3ZX4ZX5ZX6ZX7

北航数理统计期末考试题

材料学院研究生会 学术部 2011年12月 2007-2008学年第一学期期末试卷 一、(6分,A 班不做)设x 1,x 2,…,x n 是来自正态总体2(,)N μσ的样本,令 )x x T -= , 试证明T 服从t -分布t (2) 二、(6分,B 班不做)统计量F-F(n,m)分布,证明 111(,)F F n m αααα-的(0<<1)的分位点x 是。 三、(8分)设总体X 的密度函数为 其中1α>-,是位置参数。x 1,x 2,…,x n 是来自总体X 的简单样本,试求参数α的矩估计和极大似然估计。 四、(12分)设总体X 的密度函数为 1x exp x (;) 0 , p x μμσσσ??-? -≥??? =????? ,其它, 其中,0,μμσσ-∞<<+∞>已知,是未知参数。x 1,x 2,…,x n 是来自总体X 的简单样本。 (1)试求参数σ的一致最小方差无偏估计σ∧ ; (2)σ∧ 是否为σ的有效估计?证明你的结论。

五、(6分,A 班不做)设x 1,x 2,…,x n 是来自正态总体211(,)N μσ的简单样本,y 1,y 2,…,y n 是来自正态总体222(,)N μσ的简单样本,且两样本相互独立,其中221122,,,μσμσ是未知参数,2212σσ≠。为检验假设012112:, :,H H μμμμ=≠可令12, 1,2,..., , ,i i i z x y i n μμμ=-==-则上述假设检验问题等价于0111:0, :0,H H μμ=≠这样双样本检验问题就变为单检验问题。基于变换后样本z 1,z 2,…,z n ,在显著性水平α下,试构造检验上述问题的t-检验统计量及相应的拒绝域。 六、(6分,B 班不做)设x 1,x 2,…,x n 是来自正态总体20(,)N μσ的简单样本,0μ已知,2σ未知,试求假设检验问题 22220010:, :H H σσσσ≥<的水平为α 的UMPT 。 七、(6分)根据大作业情况,试简述你在应用线性回归分析解决实际问题时应该注意哪些方面? 八、(6分)设方差分析模型为 总离差平方和 试求A E(S ),并根据直观分析给出检验假设012:...0P H ααα====的拒绝域形式。 九、(8分)某个四因素二水平试验,除考察因子A 、B 、C 、D 外,还需考察A B ?,B C ?。今选用表78(2)L ,表头设计及试验数据如表所示。试用极差分析指出因子的主次顺序和较优工艺条件。

华中科技大学数理统计第二次作业

学院:机械工程学院 1、收集到26家保险公司人员构成的数据,现希望对目前保险公司从业人员受高等教育的程度和年轻化的程度进行推断,具体来说就是推断具有高等教育水平的员工平均比例是否低于80%,35岁以下的年轻人的平均比例是否为0.5。(数据见练习2数据.xls —练习2.1) 解:希望通过分析这26家保险公司人员构成的数据,研究目前保险公司从业人员受高等教育的程度和年轻化的程度。 (1)推断高等教育水平的员工平均比例是否低于80% 设原假设:保险公司具有高等教育水平的员工比例平均值不低于0.8,即H 0: μ=μ0≥0.8 备择假设:H 1:μ<0.8 n=26,属于小样本,由于σ2 未知,选用t 检验,检验统计量 T = ,取α=0.05 计算的x =0.729273 ,s 2=0.039274 (1) t n ?≤--, 1.784t = =- 查t 检验分布表知临界值t α(26-1)=-1.7081 显然,t=-1.784<-t α(25)=-1.7081,因此在α=0.05 的水平上拒绝原假设,选择备择假设 结论:保险公司具有高等教育水平的员工比例平均值低于0.8 (2)推断35 岁以下的年轻人的平均比例是否为0.5 设原假设:年轻人比例的平均值与0.5 无显著性差异,即H 0: μ=μ0=0.5 备择假设H 1:μ≠0.5. n=26,属于小样本,由于σ2 未知,选用t 检验,检验统计量 T = ,取α=0.05 计算的x =0.713875 ,s 2=0.022705 /2(1)t n ?≥- , 7.097t = = 查表知α=0.05 的双尾t 检验临界值t α/2(25)=2.0595。故超出[-2.0595,2.0595]的值均在拒 绝域内 由于t=7.097不在拒绝域[-2.0595,2.0595]范围内,因此在α=0.05 的水平上拒绝原假设,选择备择假设 结论:保险公司35 岁以下年轻人比例平均值不等于0.5 2、练习1中保险公司的类别分为:1. 全国性公司;2. 区域性公司;3. 外资和中外合资公司。试分析公司类别1与3的人员构成中,具有高等教育水平的员工比例的均值是否存在显著性的差异。(数据见练习2数据.xls —练习2.1) 解:设原假设H 0:μ1-μ2=0,即公司类别1 与3 具有高等教育水平的员工比例均值无显著

概率论与数理统计MOOC课程中的案例设计

概率论与数理统计MOOC课程中的案例设计 发表时间:2018-07-06T10:44:29.247Z 来源:《防护工程》2018年第5期作者:郭珂琪 [导读] 概率论与数理统计是工程数学非常重要的组成部分,甚至有西方学者提出:在大数据时代,统计比微积分更基础。 北京计算机技术及应用研究所北京 100854 摘要:概率论与数理统计是工程数学非常重要的组成部分,甚至有西方学者提出:在大数据时代,统计比微积分更基础。在西方,这门课是几乎所有大学生都要学习的必修课程,在我国,概率论与数理统计也是理工,农林,经管,医药卫生等各领域学生的必修课程,如何让学生学好这门课程一直是很多教师关注的热点。这门课程成为MOOC 课程,可以面向更多的学生,整合并充分利用优质教育资源,方便不同专业的交流;但同时也面临了学生专业跨度大,数学基础差别大的困难。针对这样的学生群体,该课程的MOOC 课程制作面临更大的挑战,必须深入浅出,形象生动,难度层次递进,且有连贯性,才能达到更好的教学效果,并有效降低学生辍学率。 关键词:MOOC 课程;概率论与数理统计;案例教学;概率统计 随着各种MOOC资源平台的涌现和推广,新的在线教学模式—MOOC已经成为大学教育中不可忽视的一种教育模式。MOOC对学校而言,能更好地整合教育资源;对学生而言,能更好地锻炼自学、思考和反思的能力。但MOOC也存在一些较难克服的障碍,对于内容抽象、学习难度大的课程,基础有欠缺、自制力缺乏的学生的辍学率始终居高不下,故可以预见,在较长时期内,部分学生还是会选择以传统课堂教学课程为主的学习方式。对于这门内容抽象、学习难度大的课程,如何保证学生课下自学的效果,不影响课程内容的进度,成为翻转课堂实施的一个关键问题,MOOC相关课程的资源便成为学生课下自学中最好的辅助;同时在课上讨论中,为了更好地提高学生的兴趣,锻炼学生的思考能力,也可以适当结合和借鉴MOOC灵活开放的教学方式。 一、案例教学对概率论与数理统计课堂教学的意义 在概率论与数理统计课堂教学中积极提倡案例教学是十分必要的,并具有其独特的意义。 1、概率论与数理统计的教学目标,既有学习理论方面的目标,又有实践层面的目标,既培养学生具有扎实的概率统计基础理论,又能将该理论和实践结合起来。而案例教学能将理论和实践很好地结合起来,可以使两个目标得以同时实现,且在两者结合方面拉近了距离,使得理论不再是空中楼阁,而是活生生的理论,实践也不是盲目的实践,而是有指导、有方向、有目的的实践。概率论与数理统计是一门应用性很强的学科,很适合用案例教学方法来组织课堂教学。 2、概率论与数理统计是一门研究随机现象的学科,在学习中有许多难点,需辅以案例教学才能理解概率论与数理统计的思想方法、基本原理和统计工具。概率论与数理统计这门课程不同于以往学习的确定性数学,其中随机变量、分布函数、大数定理、中心极限定理、极大似然估计方法以及假设检验的思想方法等都是该课程中难以理解的内容,如果教师在课堂教学上照本宣科,只强调教学过程的理论性、严谨性和逻辑性而脱离实际应用,学生要真正掌握和理解概率统计思想方法和概率统计模型是很困难的,必须从案例出发,才能清晰地阐明其概念和统计思想,必须通过案例的描述、假设、建模与求解,演示理论与方法的应用过程。 3、在概率论与数理统计课堂教学中实施案例教学也是教学改革的必然要求。案例教学法是把案例作为一种教学工具,把学生引导到实际问题中去,通过分析与相互讨论,调动学生的主动性和积极性,并提出解决问题的基本方法和途径的一种教学方法,它是连接理论和实践的桥梁。将理论教学与实际案例有机地结合起来,使得课堂讲解生动而清晰,可收到良好的教学效果。同时案例教学可以促进学生全面地看问题,从数量的角度分析事物的变化规律,使概率与数理统计的思想和方法在现实生活中得到更好的应用,从而提高学生分析问题和解决问题的能力。 二、案例教学在概率论与数理统计课堂教学中的运用 案例教学一般适合于既要注重理论教学,又注重实际操作的课程,而概率论与数理统计作为一门应用性很强的随机学科,在课堂上很适合采用案例教学方法,根据该学科的特点,在案例教学时应按照以下步骤组织实施: 1、案例的选择。选择合适的案例是整个案例教学的核心,同时也是一项十分复杂的工作,这主要是由于大学各理工科的专业性质不同,对案例的选择也不同,一般来说,所选择的案例要与相应专业比较接近,这样才能调动学生学习的积极性,以达到好的教学效果。因而在选择案例时需把握以下几点:一要考虑案例的实用性;二要考虑案例的典型性;三要考虑案例的针对性。根据案例的选择原则,这就要求我们在选择案例时要深入各个相关专业进行调研,与专业教师交流探讨,对专业教材阅读分析,收集专业课程中使用概率论与数理统计知识的案例和学生感兴趣的案例,安排教研活动组织专题讨论,进行分类汇总,编写《概率论与数理统计案例选编》,对于来自各个学科专业的数学应用案例,要有问题的提出和分析,有模型的建立与求解,有应用的讨论和评注。 2、明确案例教学思路,做好案例教学设计。根据教学内容,结合学生的专业特点,从概率论与数理统计案例选编中选取合适案例,选取好案例后,要合理分配好课堂上案例讨论与分析的时间,选择好教学方法和教学手段,并以多媒体的形式在课堂上呈现。概率论与数理统计从内容到方法与以往的数学课程有本质的不同,因此其基本概念的引入就显得更为重要。在教学中,应首先从案例出发引入概率统计的相关概念、概率统计的基本原理、统计方法,然后再选择合适案例来说明概率统计原理与方法的应用。当然,在课堂上不是要一味地讲解案例,也不是案例越多越好,而是要把握好案例与课堂知识点的结合,不能公式化,在教学过程中要充分体现“实践—理论—实践”的认识过程,做到理论与实际的有机结合。 3、有效组织案例教学,做好案例的讨论、分析。案例的讨论与分析是案例教学的中心环节,对案例进行讨论的目的是提出解决问题的途径与方法,可以从自身角度出发来剖析案例,说明自己的观点和看法,教师要掌握讨论的进程,让学生成为案例讨论的主体,同时把握好案例讨论的重点和方向,进行必要的引导。同时在组织案例教学时要辅以各种有效的教学方法,如启发式教学、讨论式教学,让学生积极参与,大胆发表意见,提出观点,深入思考,激发学生的学习热情及科研兴趣,使案例教学效果达到最佳,培养学生运用概率统计原理解决实际问题的能力。 4、案例的总结。案例总结是保证和提高案例教学质量的必备环节。对案例的总结一般要包括以下内容:一是对讨论过程进行总结,对于一个案例,让学生提出各种观点及其案例所包含的概率统计原理,让学生通过分析和评价案例,掌握正确处理和解决复杂多变的现实

相关主题
文本预览
相关文档 最新文档