当前位置:文档之家› 清华大学 杨虎 应用数理统计课后习题参考答案2

清华大学 杨虎 应用数理统计课后习题参考答案2

清华大学 杨虎 应用数理统计课后习题参考答案2
清华大学 杨虎 应用数理统计课后习题参考答案2

习题三

1 正常情况下,某炼铁炉的铁水含碳量2

(4.55,0.108)X N .现在测试了5炉铁水,其含碳量分别为4.28,4.40,4.42,4.35,4.37. 如果方差没有改变,问总体的均值有无显著变化?如果总体均值没有改变,问总体方差是否有显著变化(0.05α=)?

解 由题意知 2

~(4.55,0.108),5,0.05X N n α==,1/20.975 1.96u u α-==,设立统计原假设 0010:,:H H μμμμ=≠ 拒

{}

00K x c μ=->,临界值

1/2

1.960.108/0.0947c u α-==?=,

由于 0 4.364 4.550.186x c μ-=-=>,所以拒绝0H ,总体的均值有显著性

变化.

设立统计原假设 2

2

2

2

0010:,:H H σσσσ=≠ 由于0μμ=,所以当0.05α=时

22220.0250.975

1

1()0.03694,(5)0.83,(5)12.83,n

i i S X n μχχ==-===∑ 22

10.025

20.975(5)/50.166,(5)/5 2.567c c χχ==== 拒绝域为 {}

2222

00201//K s

c s c σσ=>< 或 由于2

2

0/ 3.167 2.567S σ=> ,所以拒绝0

H ,总体的方差有显著性变化. 2 一种电子元件,要求其寿命不得低于1000h .现抽测25件,得其均值为

x =950h .已知该种元件寿命2(100,)X N σ ,问这批元件是否合格(0.05α=)?

解 由题意知 2

(100,)X N σ ,设立统计原假设

0010:,:,100.0.05.H H μμμμσα≥<==

拒绝域为 {}

00K x c μ=-> 临界值为

0.050.0532.9c u u =?=?=-

由于 050x c μ-=-<,所以拒绝0H ,元件不合格.

3 某食品厂用自动装罐机装罐头食品,每罐标准重量为500g ,现从某天生产的

罐头中随机抽测9罐,其重量分别为510,505,498,503,492,502,497,506,495(g ),假定罐头重量服从正态分布. 问 (1)机器工作是否正常(0.05α=)? 2)能

否认为这批罐头重量的方差为5.52(0.05α=)?

解 (1)设X 表示罐头的重量(单位:g). 由题意知2

(,)X N μσ ,μ已知 设立统计原假设 0010:500,:H H μμμμ==≠,拒绝域 {}

00K x c μ=-> 当0.05α=时,2

500.89,34.5, 5.8737x s s ===

临界值 12(1) 4.5149c t n α-=-?=,由于00.8889x c μ-=<,

所以接受0H ,机器工作正常.

(2)设X 表示罐头的重量(单位:g). 由题意知2

(,)X N μσ ,σ已知

设立统计原假设 22222

0010

: 5.5,:H H σσσσ==≠ 拒绝域为 {}{}

2222

00102K s

c s c σσ=<> 当α=0.05时,可得 2220.0250.97512500.89,34.5,(5) 2.7,(5)19.02,0.3, 2.11x s c c χχ======

由于22

001.0138s K σ=∈ ,所以接受0H ,可以认为方差为25.5.

4 某部门对当前市场的鸡蛋价格情况进行调查,抽查某市20个集市上鸡蛋的平均售价为3.399(元/500克),标准差为0.269(元/500克).已知往年的平均售价一直稳定在 3.25(元/500克)左右, 问该市当前的鸡蛋售价是否明显高于往年?(0.05α=)

解 设X 表示市场鸡蛋的价格(单位:元/克),由题意知2

(,)X N μσ 设立统计原假设 0010: 3.25,:H H μμμμ==>, 拒绝域为 {}00K x c μ=->

当α=0.05时,13.399,0.269,20,0.0992x n c ασμ-====?=临界值

由于0 3.399 3.250.149.x c μ-=-=>所以拒绝0H ,当前的鸡蛋售价明显高于

往年.

5 已知某厂生产的维尼纶纤度2

(,0.048)X N μ ,某日抽测8根纤维,其纤度分别为1.32,1.41,1.55,1.36,1.40,1.50,1.44,1.39,问这天生产的维尼纶纤度的方差2σ是否明显变大了(0.05α=)?

解 由题意知 2

(,0.048)X N μ ,0.05α=

设立统计原假设 2222220010:0.048,:0.048H H σσσσ==>=

拒绝域为{}

22

00K s c σ=>, 当0.05α=时,

222

0.950.951.4213,0.0055,(7)14.07,(7)7 2.0096x s c χχ=====

由于22

0 2.3988s c σ=>,所以拒绝0H ,认为强度的方差明显变大.

6 某种电子元件,要求平均寿命不得低于2000h ,标准差不得超过130h .现从一批该种元件中抽取25只,测得寿命均值1950h ,标准差148h s =.设元件寿命服从正态分布,试在显著水平 α=0.05下, 确定这批元件是否合格.

解 设X 表示电子元件的平均寿命(单位:h ),由题意知2

(,)X N μσ 设立统计原假设 0010:=2000H

当0.05α=

时,1950,148,(1)50.64x s c t n α===-=-临界值

由于 050x c μ-=->,所以接受0H ,即这批电子元件的寿命是合格的. 7 设n X X X ,...,,21为来自总体(,4)X N μ 的样本,已知对统计假01:1;: 2.5H H μμ== 的拒绝域为0K {}2>=X .1)当9=n 时,求犯两类错的概率α

与β;2)证明:当n →∞时,α→0,β→0.

解 (1)由题意知 {}

010~(,4),:1;: 2.5,2,9.X N H H K X n μμμ===>= 犯第一类错误的概率为

(

)21 1.51(1.5)0.0668.X P X P αμ?=>==>==-Φ=??

犯第二类错误的概率为

(

)2 2.50.75(0.75)1(0.75)0.2266.

X P X P βμ?=≤==≤=-?

?=Φ-=-Φ=

(2)若0:1H μ=成立,则(1,4)X N

}{}{00000()=11)

n P H H P X c P X c nc αμμσ=≥+=-<+=-Φ否定成立

当n →∞时,0)1nc σΦ→,所以0()n n α→→∞

同理 }

{

0010=<+=+c )/)()=0()n P X c n βμμμσΦ-→Φ-∞→∞ 8 设需要对某一正态总体,4()N μ的均值进行假设检验H 0:μ= 15,H 1:μ< 15 取检验水平α=0.05,试写出检验H 0的统计量和拒绝域.若要求当H 1中的μ=13时犯第二类错误的概率不超过β=0.05,估计所需的样本容量n .

解 由题意知 (,4)X N μ ,σ已知, 设立统计原假设 01:15,:15H H μμ=< 则拒绝域为}

{

015K X c =-<

,其中临界值0.05c μ=?=-

犯第二类错误的概率

1513130.05

P X P X

β

?

??

=->==->≤

?

?

??

1.65)0.95

Φ≥, 化简得2

3.311

n≥≈.

9 设

n

X

X

X,...,

,

2

1

为来自总体X~2

(,)

Nμσ的样本,2

σ为已知, 对假设:0011

:;:

H H

μμμμ

==其中

01

μμ

≠,试证明:

2

20

112

12

()

()

n

αβ

σ

μμ

μμ

--

=+?

-

解(1)

10

>

μμ

当时,由题意知

00110

:;:;

H H

μμμμμ

==>

犯第一,二类错误分别为,

αβ

,则有

001

(|)

P X c c u

α

αμμμ

-

=>+=?=

0111

00

(|)|)

P X c P u

α

βμμμμμ

-

=≤+==≤-=

?

()

()

2

2

0 1111112

0010 u u u u n u u ββααβαβ

σμ

μμ------=-=+==+

-

(2)

10

μμ

当时

由题意知

00110

:,:

H H

μμμμμ

==≤,犯第一,二类错误分别为,αβ,则有

00

(|)

P X c c u

α

αμμμ

=<+=?=

()

()

011

00

2

2

0 111112

0010 (|))

P X c P u

u u u u n u u

α

βααβαβ

βμμμμμ

σ

μμ-----

=≥+==+=?

=?+==+

-

10设

17

1

,...,X

X为总体2

(0,)

X Nσ

样本,对假设:

22

01

:9,: 2.905

H H

σσ

==的

拒绝域为}

{2

4.93

K s

=<. 求犯第Ⅰ类错误的概率α和犯第Ⅱ类错的概率β.

解由题意知2

(0,)

X Nσ

,

2

2

2

~().

ns

n

χ

σ

统计假设为22

01

:9,: 2.905

H H

σσ

==. 拒绝域为}

{2

4.93

K s

=<

则犯第一,二类错误的概率,

αβ分别是

(

)

()

2222

2

221717417174497.3040.025

999917174

4 3.319120.48810.750.25

3.319 3.319s s P s P P s P s

P ασβσ????

??=<==<=<== ? ?????

???=<==-<==-= ???

11 设总体是密度函数是

1,01

(;)0,x x f x θθθ-<<=???其他

统计假设 01:1,:2H H θθ==.现从总体中抽取样本21,X X ,拒绝域

2134ΚX X =≤??

?

???,求:两类错误的概率,αβ 解 由题意知

010213:1;:2,, 2.4H H K X n X θθ??

===≤=????

当12121,0,1

1(;1) 1.~(0,1),(,)0,x x f x X U f x x θ<

此时 21

212123

1431(,)0.250.75ln 0.75.4x x P X f x x dx dx X αθ≤??

=≤===+

???

??

当1212122,014,0,1

2(;2).(,)0,0,x x x x x x f x f x x θ<<<

时,其他其他

此时 21

212123

14399

2(,)ln 0.75.4168

x x P X f x x dx dx X βθ>??=>===

+

???

??

12 设总体2

(,)X N μσ ,根据假设检验的基本原理,对统计假设:

00110:,:()()H H μμμμμσ==>已知;0010:,:H H μμμμσ≥<(未知),试分

析其拒绝域.

解 由题意知 2

(,)X N μσ ,当00110:,:()H H μμμμμ==>成立时

(

)01X P X c P αμμμ=->==>

=-Φ

{}1100,u c u K X c ααμ--===->

所以拒绝域为 }

{

00K X c μ=->

当0010:,:H H μμμμ≥<成立时

00()()X P X c P X c P αμμμμ???

?=-<≥≥-<=<=Φ

}{

00,c K X c αα

μμμ===-<

所以拒绝域为}

{

00K X c μ=-<

13 设总体2

(,)X N μσ 根据假设检验的基本原理,对统计假设: (

1

2222

0010:,:()

H H σσσσμ=>已知;(2)

2222

0010:,:()H H σσσσμ≤>未知

试分析其拒绝域.

解 由题意知 2

~(,)X N μσ

(1)假设统计假设为 2222

0010

:=,:>H H σσσσ 其中μ已知 当0H 成立时,拒绝域形式为 2

020=>s

K c σ????????

2

2

2

2

2

0=

(n)ns ns χσ

σ ,可得220=>ns

P nc ασ????????

所以 2

1-=()nc n α

χ

,由此可得拒绝域形式为2

201-20

1=>()s

K n n α

χσ???????? (2)假设统计假设为 2222

0010:<,:>H H σσσσ 其中μ未知

当0H 成立时,选择拒绝域为 2

020=>s K c σ????????

,由22

2

(-1)(1)n s n χσ- 得 ()()()()22

22

01111n s n s P n c P n c ασσ????--????

=>-≤>-????????????

所以2

1(1)(1)n c n αχ--=-,由此可得拒绝域形式为

22

01-20

1=>(1)1s K n n α

χσ???-??-???

14 从甲、乙两煤矿各取若干样品,得其含灰率(%)为,甲:24.3, 20.8, 23.7, 21.3,

17.4, 乙:18.2, 16.9, 20.2, 16.7 .假定含灰率均服从正态分布且22

12=σσ,问甲、乙两煤矿

的含灰率有无显著差异 (=0.05α)? 解 由题意知 2212(,),Y (,)X N N μσμσ

设统计假设为 012112:=;:H H μμμμ≠ 其中12=5,=4n n 当=0.05α时

1/2122.3238,(2) 2.3646w s t n n α-==+-=

临界值

1-212=(+2) 3.6861w c t n n s α-?= 拒绝域为}

{

0 3.6861K x y c =->= 而 03.5,,.x y c H -=<接受认为没有差别

15 设甲、乙两种零件彼此可以代替,但乙零件比甲零件制造简单,造价也低.经过试验获得它们的抗拉强度分别为(单位:kg/cm 2

):

甲:88,87,92,90,91 乙:89,89,90,84,88

假定两种零件的抗拉强度都服从正态分布,且21σ =22σ.问甲种零件的抗拉强度是否比乙种的高(=0.05α)?

解 由题意知 2212(,),Y (,)X N N μσμσ

设统计假设为 012112:=;:H H μμμμ≠,其中12=5,=5n n 当=0.05α时

122.2136,(2) 1.86,w s t n n α==+-=-

临界值

1-212=(+2) 2.2136w c t n n s α-?= 拒绝域为}

{

0 2.2136K x y c =->=

而 1.6x y c -=<,所以接受0H ,认为甲的抗拉强度比乙的要高.

16 甲、乙两车床生产同一种零件.现从这两车床产生的产品中分别抽取8个和9个,测得其外径(单位:mm )为:

甲:15.0,14.5,15.2,15.5,14.8,15.1,15.2,14.8

乙:15.2,15.0,14.8,15.2,15.0,15.0,14.8,15.1,14.8

假定其外径都服从正态分布,问乙车床的加工精度是否比甲车床的高(=0.05α)?

解 由题意知 2212(,),Y (,)X N N μσμσ

设统计假设为 2222

012112

:;:H H σσσσ≥<,其中12=8,=9n n 当=0.05α时 22

0.0955,0.0261x y s s ==,临界值 12(1,1)0.2684c F n n α=--=

拒绝域为202x y

s K c s ????

=,接受0H ,认为乙的精度高.

17 要比较甲、乙两种轮胎的耐磨性,现从甲、乙两种轮胎中各取8个,各取一个组成一对,再随机选取8架飞机,将8对轮胎磨损量(单位:mg )数据列表如下:

试问这两种轮胎的耐磨性有无显著差异?(=0.05α). 假定甲、乙两种轮胎的磨损量分别满足2212(,),Y (,)X N N μσμσ 且两个样本相互独立. 解 由题意知 2212(,),Y (,)X N N μσμσ

设统计假设为 012112:=;:H H μμμμ≠,其中12===8n n n 当=0.05α时,令

()2

2

1/21

1,320,102200,319.69,(1) 2.36461n Z

Z i Z X Y z s z z s t n n α-==-==-==-=-∑ 拒绝域为}

{

0K z c =>,临界值

1-2=(1)2138Z c t n s α-?= 而320z c =<,所以接受0H ,认为两种轮胎耐磨性无显著差异.

18 设总体2212(,),Y (,)X N N μσμσ , 由两总体分别抽取样本 X :4.4,4.0,2.0,4.8 Y :6.0,1.0,3.2,0.4

1)能否认为12μμ= (=0.05α)? 2)能否认为22

12σσ= (=0.05α)?

解 (1) 由题意知 2212(,),Y (,)X N N μσμσ 设统计假设为 012112:=;:H H μμμμ≠,其中12==4=n n n

令Z X Y =-,则有2

2

1

11.15,()9.02331n z i z s z z n ===-=-∑,

当=0.05α时,1-2=(1) 3.1824c t n α-=

,1-2=(1)/ 4.78Z c t n s α-?= 拒绝域为}

{

0K z c =>,而 1.15z c =<,所以012,.H μμ=接受认为 (2) 由题意知 2212(,),Y (,)X N N μσμσ

设统计假设为 222

2

2

2

0111:=;:H H σσσσ≠,其中12==4=n n n 其中2

21.5467, 6.4367x y s s ==,拒绝域为

2201222>x x y

y s s K c c s s ????

=

临界值 1/2122112(1,1)0.0648,(1,1)15.4392c F n n c F n n αα-=--==--=

而2

22

01220.2403,,.X Y

s F H s σσ===接受认为

19 从过去几年收集的大量记录发现,某种癌症用外科方法治疗只有2%的治愈率.一个主张化学疗法的医生认为他的非外科方法比外科方法更有效.为了用实验数据证 实他的看法,他用他的方法治疗200个癌症病人,其中有6个治好了.这个医生断 言这种样本中的3%治愈率足够证实他的看法.(1)试用假设检验方法检验这个医生的看法;(2)如果该医生实际得到了4.5%治愈率,问检验将证实化学疗法比外科方法更有效的概率是多少?

解 (1) 记每个病人的治愈情况为X ,则有(1,) X B p

设统计假设为 0010:=0.02;:0.02H p p H p p >≤=,其中200,0.05n α==

拒绝域为}{00K x p c =-<,临界值

10.0163c αμ-== 而 000.01,,0.02.x p c H p -=<>拒绝不能认为

(2) 不犯第二类错误的概率

101 4.5%P X u p p α

β-???

?

-=>=?????

?

由(1,) X B p ,可得 (1),p p EX p DX n

-== 由中心极限定理得

1 4.5%10.72

X P p β??

?

-=>

=?

??

=-Φ=

20 在某公路上,50min 之间,观察每15s 内通过的汽车数,得下表

通过的汽车数量

0 1 2 3 4 ≥5 次数f

92 68 28 11 1 0

问能否认为通过的汽车辆数服从泊松分布(=0.10α)?

解 设统计假设为 0010:()(),()(),200.0.10H F x F x H F x F x n α

====

400

1?,0.805.j j H X j n λν====∑若成立 记 ?1,2,3,4

?(),!j j j p P x j e j λλ-==-=则有

?

0.805010214

324350

0.805

0.4471,0.805*0.3599,*0.14492

0.8050.805*0.0389,*0.0078,10.0014,

34j j p e e p p p p p p p p p p λ--=======

======-=∑

检验统计量的值为

()2

5

2

22

10.9500 2.1596(1)(4)9.848

,~(),0.805.

j

j n j j

np m r np H X P αν

χχχλλ-=-==<--===∑不拒绝认为且

21 对某厂生产的汽缸螺栓口径进行100次抽样检验,测得100数据分组列表如

下:

组限

10.93~10.95

10.95~10.97

10.97~10.99

10.99~

11.01

频数 5

8

20

34 组限 11.01~11.03

11.03~11.05

11.05~11.07

11.07~11.09 频数

17

6

6 4

试对螺栓的口径X 的分布做假设检验(=0.05α).

解 设X 表示螺栓的口径,2(,)X N μσ ,分布函数为()F x ,统计假设为

0010:()(),:()()H F x F x H F x F x =≠,其中100,0.05,2n r α===

在0H 成立的情况下,计算得

882

211

11??11.0024,()0.00101888j j j j i i X x v x v μ

σμ====?==-?=∑∑ 由?11.0024(0,1)?0.00319

X X N μσ--= 得

0810.9311.002411.0911.0024

2.2689,, 2.74520.003190.00319

x x --=

=-==

所以

110887()()0.0386,,()()0.0140p x x p x x =Φ-Φ==Φ-Φ=

检验统计量的值为

2

8

2

22

10.951

()13.825(1)(5)11.07j j n

j j

v np m r np αχχχ-=-==>--==∑

由此应该20,~(,).H X N μσ拒绝不能认为

22 检查产品质量时,每次抽取10个产品检验,共抽取100次,得下表: 次品数

0 1 2 3 4 5 6 7 8 9 10 频数 35 40 18 5 1 1 0 0 0 0 0 问次品数是否服从二项分布(=0.05α)?

解 设X 表示抽取的次品数,2(,)X N μσ ,分布函数为()F x ,统计假设为

0010:()(),:()()H F x F x H F x F x =≠,其中10,0.05n α==

在0H 成立的情况下,0

1?N

j

j X p

jv

N N

===∑

计算得

001011922

801011021033710100103101010(1),0,1,,10;

???(1)0.3487,(1)0.3874,(1)0.1937??(1)0.0574,(1)10,j

j N j j N p C p p j p C p p p C p p p C p p p C p p p C p p

--=-==-==-==-==-==-= 检验统计量的值为0020

()

2

10

222

10.950

5.1295(1)(9)1

6.92j j n j j

np m r np ανχχχ-=-==<--==∑

因此0,~(10,0.1).H X B 不拒绝认为

23 请71人比较A 、B 两种型号电视机的画面好坏,认为A 好的有23人,认为B 好的有45人,拿不定主意的有3人,是否可以认为B 的画面比A 的好(=0.10α)?

解 设X 表示A 种型号电视机的画面要好些,Y 表示B 中型号电视机画面要好

分布函数分别为()X F x ,()Y F x ,统计假设为

01:()(),:()(),10,100.0.05X Y X Y H F x F x H F x F x N n α=≠===

由题意知++=23=45,=+n n n n n --, 检验统计量 ,min()s n n +-=

而23(68)25s s α=<=,所以0,.H B 拒绝认为的画面好

24 为比较两车间(生产同一种产品)的产品某项指标的波动情况,各依次抽取12个产品进行测量,得下表

甲 1.13 1.26 1.16 1.41 0.86 1.39 1.21 1.22 1.20 0.62 1.18 1.34 乙 1.21 1.31 0.99 1.59 1.41 1.48 1.31 1.12 1.60 1.38 1.60 1.84 问这两车间所生产的产品的该项指标分布是否相同(=0.05α)?

解 设,X Y 分别表示甲乙两车间所生产产品的指标分布,分布函数分别

()X F x ()Y F x ,统计假设为

01:()(),:()(),.0.05,12,X Y X Y H F x F x H F x F x n m α=≠===

检验统计量为秩和T ,易知T 的样本值为112T =且(150,300)T N 拒绝域为

012K u u α-

???

=>?????

而0.9752.194 1.96u u =>=,所以0,.H 拒绝认为指标分布不相同

25 观察两班组的劳动生产率(件/h),得下表:

问两班组的劳动生产率是否相同(α=0.05)?

解 设,X Y 分别表示两个组的劳动生产率,分布函数分别为(),X F x ()Y F x ,统计假设为

01:()(),:()(),.0.05,9,9X Y X Y H F x F x H F x F x n m α=≠===

检验统计量为秩和T ,易知T 的样本值为73T = 拒绝域形式为

}{01212, 其中

12(9,9)=66,(9,9)105

t t =,因此

T K ∈, 所以

0,.H 接受认为劳动生产率相同

26 观观察得两样本值如下:

Ⅰ 2.36 3.14 7.52 3.48 2.76 5.43 6.54 7.41 Ⅱ 4.38 4.25 6.54 3.28 7.21 6.54 问这两样本是否来自同一总体(α=0.05)?

解 设,X Y 分别表示Ⅰ,Ⅱ两个样本,分布函数分别是(),X F x ()Y F x ,统计假设为

01:()(),:()(),.0.05,6,8,X Y X Y H F x F x H F x F x n m α=≠===

检验统计量为秩和T ,易知T 的样本值为49T = 拒绝域形式为

}{01212, 其中

而12(6,8)=32,(6,8)58t t =,因此0T K ∈, 所以0,.H 接受认为来自同一总体 27 某种动物配偶的后代按体格的属性分为三类,各类的数目是:10,53,46,按照某种遗传模型其比率之比应为:2

2

)1(:)1(2:p p p p --,问数据与模型是否相符(05.0=α)?

解 设体格的属性为样本X ,由题意知(2,1)X B p - 其密度函数为()f x ,其中22(,)(1)0,1,2

x

x

x f x p C p p x -=-=

统计假设为

0010:()(),:()()H F x F x H F x F x =≠

似然函数为

222

2

1

1

(1)(1)

i i

i

i n

n

x x x x n nx

nx

i i L C p

p p

p C

--===-=-∏∏

解得最大似然统计量为 ?12

x

p

=- 则 220?? 1.330.1121p

p === 1???2(1)0.4454p p p =-= 22??(1)0.4424p p =-= 拒绝域为

}{

2201(1)K m r αχχ-=>--

而 ()2

10

2

22

10.950

?0.9134(1)(9) 3.8414?j j n j j np m r np

ανχχχ-=-=

=<--==∑

所以0,.H 不拒绝认为与模型相符

28 在某地区的人口调查中发现:15729245个男人中有3497个是聋哑人.16799031个女人中有3072个是聋哑人.试检验“聋哑人与性别无关”的假设(05.0=α).

解 设X 表示男人中聋哑人的个数,Y 表示女人中聋哑人的个数,其分布函数分别表示为()X F x ,()Y F x . 统计假设为

01:(,)()(),:(,)()()X Y X Y H F x y F x F x H F x y F x F x =≠

拒绝域为

}{

2201(1)K m r αχχ-=>--

而210

2

22

10.950

?()62.64(1)(1) 3.84?j j n

j j v np m r np

αχχχ-=-=

=>--==∑

所以0,.H 拒绝认为聋哑与性别相关 29 下表为某药治疗感冒效果的联列表:

试问该药疗效是否与年龄有关(α=0.05)?

解 设X 表示该药的疗效与年龄有关,Y 表示该药的疗效与年龄无关,其分布函数分别表示为(),X F x ()Y F x . 统计假设为

01:(,)()(),:(,)()(),3,3,0.05,X Y X Y H F x y F x F x H F x y F x F x r s α=≠===

拒绝域为

}{

2201(1)K m r αχχ-=>--

而 ()2

10

2

22

10.950

?13.59(1)(4)9.488?j j n j j np m r np

ανχχχ-=-=

=>--==∑

所以0,.H 拒绝认为疗效与年龄相关

30 某电子仪器厂与协作的电容器厂商定,当电容器厂提供的产品批的不合格率不超过3%时以高于95%的概率接受,当不合格率超过12%时,将以低于10%的概率

接受.试为验收者制订验收抽样方案.

解 由题意知,010.03,0.12,0.05,0.1p p αβ====

代入式子 01

()1()L p L p α

β=-??=?

()L p

选用式子()(L P X d P U φ=≤=≤

计算求得 66,4n d ==,于是抽查方案是:抽查66件产品,如果抽得的不合格产品4X ≤,则接受这批产品,否则拒绝这批产品.

31 假设一批产品的质量指标2(,)X N μσ (2σ已知),要求质量指标值越小越好.试给出检验抽样方案(,n c )的计算公式.若2σ未知,又如何确定检验抽样方案(,n c )?若质量高时指质量指标在一个区间时,又如何确定检验抽样方案(,n c )?

解 (1) 解方程组

01

()1()L L μα

μβ=-??

=? 得 ()2

01u u n αβσ

μμ??+

?= ?-?

?

10u u c u u αβαβμμ+=+ (2) 若2σ未知,用*

2M 估计2σ,从而得出公式

()2

*

201u u M n αβμμ??+

?= ?-??

10u u c u u αβ

αβμμ+=+

习题四

1 下表数据是退火温度x (C 0)对黄铜延性η效应的试验结果,η是以延伸率计算的,且设为正态变量,求η对x 的样本线性回归方程.

x (C 0)

300 400 500 600 700 800 y (%)

40 50 55 60 67 70

解 利用回归系数的最小二估计:

101???

xy

xx l l y x

βββ?=??

?=-?其中22

11,n n

xy i i xx i i i l x y nxy l x nx ===-=-∑∑ 代入样本数据得到:10

??0.0589,24.6286ββ==

样本线性回归方程为:?24.62860.0589y

x =+ 2 证明线性回归函数中

(1)回归系数1β的置信水平为α-1

的置信区间为2

1

1??(2)n αβ-±-;

(2)回归系数0β的置信水平为α-1

的置信区间为2

?(2)n αβ-±-.

证 (1) 由于211?,xx N l σββ?? ???

()0,1N 2

2

2(2)E S n χσ

- 又因为:,()2

22

?2(2)n n σχσ-- 故

所以

()2t n - 易知

{

}

11

?1p c ββα-<=-

,1P α<=-??

?

其中()12

?2n α

-

-

所以1β的置信水平为α-1

的置信区间为2

1

1??(2)n αβ--

(2) 由0?β~22

01(,())xx

n

x N l βσ+,得

()0,1N ,()222

?2(2)n n σχσ

-- ,0?β与2?σ相互独立, 所以:

()2T t n =

=-

根据11221(2)(2)P T t n P t n ααα-

-?????

-=<-=<- ?????

??

(

)()0001122

??22P n n ααβββ--?? ? ?=-<<- ? ? ???

得到0β的置信度为1α-

的置信区间()0

12

?2n αβ-

-.

3 某河流溶解氧浓度(以百万分之一计)随着水向下游流动时间加长而下降.现测得8组数据如下表所示.求溶解氧浓度对流动时间的样本线性回归方程,并以

α=0.05对回归显著性作检验.

流动时间t (天)

0.5 1.0 1.6 1.8 2.6 3.2 3.8 4.7 溶解氧浓度(百万分之

一)

0.28 0.29 0.29 0.18 0.17 0.18 0.10 0.12

解 利用101???

ty

tt

l l y t

βββ?=???=-?其中2211,n n ty i i tt i i i l t y nty l t nt ===-=-∑∑ 代入样本数据得到: 10

??0.0472,0.3145ββ=-= 所以,样本线性回归方程为:?0.31450.0472y

t =- 拒绝域形式为:{}

21

?c β> ()20.95?1,6,

0.0058tt

F c c l σ

=

=>而21

?0.0022β=,所以回归模型不显著. 4 假设X 是一可控制变量,Y 是一随机变量,服从正态分布.现在不同的X 值下

分别对Y 进行观测,得如下数据

i x

0.25 0.37 0.44 0.55 0.60 0.62 0.68 0.70 0.73 i y

2.57 2.31 2.12 1.92 1.75 1.71 1.60 1.51 1.50 i x 0.75 0.82 0.84 0.87 0.88 0.90 0.95 1.00 i y

1.41 1.33 1.31 1.25 1.20 1.19 1.15 1.00

(1)假设X 与Y 有线性相关关系,求Y 对X 样本回归直线方程,并求2σ=DY 的无偏估计;

(2)求回归系数210σββ、、的置信度为95%的置信区间; (3)检验Y 和X 之间的线性关系是否显著(=0.05α); (4)求Y 置信度为95%的预测区间;

(5)为了把Y 的观测值限制在)68.1,08.1(,需把x 的值限制在什么范围?(=0.05α)

解 (1) 利用101???

xy

xx l l y x

βββ?=???=-?其中22

11,n n

xy i i xx i i i l x y nxy l x nx ===-=-∑∑计算得

10

??2.0698, 3.0332ββ=-= 所以,样本线性回归方程为:? 3.0332 2.0698y

x =-,2

2

?0.002015

E

S σ== (2) 根据第二题,1β

的置信区间为()112

??2n αβ-±

-,代入值计算得到: ()1 2.1825, 1.9571β∈--,

的置信区间为()0

2

?2n αβσ-±-,代入数值计算得到:

()0 2.95069,3.1160β∈.

(3) 根据F 检验法,其拒绝域形式为 }

{

201

?K c β=

> 而 12

?(2),xx

c t

n l α

σ-

=

- 显然10K β∈,所以Y 和X 之间具有显著的线性关系.

(4)

()2

21(0,(

1))

xx

x x y N l n

σ-++ ,

(

)2

1()1(0,1)xx

x x s x N l n -=

++ 令

222

?(2)((2)n n t n σ

χσ---

则有

112

2

??((2),(2))y y

t n y

t n α

α

-

-

∈--

(5) 根据(4)的结论,令

2

2

??1.68 1.08y

y

α

α

-

-

+=-=,

解得 (0.7802,0.8172)x ∈

5 证明对一元线性回归系数0?β,1

?β相互独立的充分必要条件是0=x . 证 ""?

()()()()()0100

1

1

1

1

1

??????cov ,E y x ββββββββββ=--=---

2110111101????()E y x y x βββββββββ=---++

2211011101

?y xE y x ββββββββ=---++ ()

2211

?x E ββ=-- 2

22221111

???()xx E D E l σββββ=+=+ 若要()

01

??cov ,0ββ=,那么0x =.

反之显然也成立,命题的证.

6 设n 组观测值),...,2,1)(,(n i y x i i =之间有关系式:

i i i i x x y εεββ,+-+=)(10~),...,2,1)(,0(2

n i N =σ(其中∑==n

i i x n x 1

1),且

n εεε,...,,21相互独立.

(1) 求系数10,ββ的最小二乘估计量1

0?,?ββ; (2) 证明∑∑∑===-+-=-n

i i n i i i n i i y y y y y y 1

2

12

12

)?()?()(,其中∑==n

i i y n y 11

(3) 求1

0?,?ββ的分布. 解 (1) 最小化残差平方和:2

201[()]E

i i S y x x ββ=---∑

01ββ求,的偏导数

[][]22

010101

2()02()()0E E

i i i i i S S y x x y x x x x ββββββ??=----==-----=??∑∑, 01

??,xy xx

l y l ββ==得到:

(2) 易知

()()()2

2

2

2

1

1

1

1

??????()()2()n

n

n

n

i

i

i

i

i

i

i i i i i i i i y y y y

y y y y y

y y y y y ====-=-+-=-+-+--∑∑∑∑ 其中01???()()xy

i i i xx l y x x y x x l ββ=+-=+

-,将其代入上式可得 1??()()0n

i

i

i

i y y

y y =--=∑ 所以,

∑∑∑===-+-=-n

i i n i i i n

i i

y y y

y y y

1

21

2

1

2

)?()?()( (3) 2

?~(0,),i N y εσβ= ,2

00

?~(,

)N n

σββ∴

同理,易得2

11?~(,)xx

N l σββ∴ 7 某矿脉中13个相邻样本点处某种金属的含量Y 与样本点对原点的距离X 有如下观测值 i

x 2 3 4 5 7 8 10 i y 106.42 108.20 109.58 109.50 110.00 109.93 110.49 i

x 11 14 15 16 18 19 i y 110.59 110.60 110.90 110.76 111.00 111.20

分别按(1)x b a y +=;(2)x b a y ln +=;(3)x

b

a y +

=. 建立Y

对X 的回归方程,并用相关系数221T

E

S S R -=指出其中哪一种相关最大.

解 (1)

令v y a bv ==+,根据最小二乘法得到,正规方程:

101???vy vv l l y v

βββ?=???=-?,最后得到10??1.1947,106.3013ββ==

所以:样本线性回归方程为:?106.3013y

=+,10.8861R = (2) 令ln ,v x y a bv ==+

101???vy

vv l l y v

βββ?=???=-?,得到10??1.714,106.3147ββ==

相关主题
文本预览
相关文档 最新文档