当前位置：文档之家› 试验设计与建模第一章课后习题答案分析

试验设计与建模第一章课后习题答案分析

习题第一章

1.1 孟德尔豌豆试验

孟德尔做过这样一个实验：把一种开紫花的豌豆种和一种开白花的豌豆种结合在一起，第一次结出来的豌豆开紫花，第二次紫白相间，第三次全白。对此孟德尔没有充分的理由作出解释。后来，孟德尔从豌豆杂交实验结果，得出了相对性状中存在着显性和隐性的原理。虽然还有不少例外，但它仍然是一个原理。孟德尔根据自己在实验中发现的原理，进一步做了推想。他认为决定豌豆花色的物质一定是存在于细胞里的颗粒性的遗传单位，也就是具有稳定性的遗传因子。他设想在身体细胞里，遗传因子是成双存在的；在生殖细胞里，遗传因子是成单存在的。例如，豌豆的花粉是一种雄性生殖细胞，遗传因子是成单存在的。在豌豆的根、茎、叶等身体细胞里，遗传因子是成双存在的。这就是说，孟德尔认为可以观察到的花的颜色是由有关的遗传因子决定的。

如果用D代表红花的遗传因子，它是显性；用d代表白花的遗传因子，它是隐性。这样，豌豆花色的杂交实验，就可以这样解释：

红花×白花

（纯种）DD dd（身体细胞，遗传因子成双存在）

↓↓（杂交）

D d（生殖细胞，遗传因子成单存在）

Dd（杂交）自交Dd

DD Dd dD dd

红花因为杂种的遗传基础物质是由D和d组成的，因此，它的后代（子2）就可能出现白花(dd）了。

这就是说，隐性的遗传因子在从亲代到后代的传递中，它可以不表现。但是它是稳定的，并没有消失。

遗传单位，叫做基因。研究基因的科学就是遗传学。基因学说就是现代遗传学的中心理论。很清楚，基因概念是孟德尔在推想中提出来的，虽然当时他并没有提出“基因”这个科学名词。

孟德尔认为遗传单位（基因）具有高度的稳定性。一个显性基因和它相对的隐性基因在一起的时候，彼此都具有稳定性，不会改变性质。例如，豌豆的红花基因R和白花基因r在一起，彼此不会因为相对基因在一起而发生变化，在一代一代的传递中，D和d都能长期保持自己的颜色特征。孟德尔的结论正好跟长期流传的融合遗传理论相对立。

融合遗传理论是怎么回事儿呢？它的基本论点是：遗传因子或遗传物质相遇的时候，彼此会相互混合，相互融化，而成为中间类型的东西。根据融合理论来推理，甲和乙杂交，就会产生出混血儿，甲的遗传因子和乙的遗传因子，都变成了中间类型的东西。好比两种液体混合在一起似的，亲代的遗传因子都因为融合而消失了。根据融合理论来推理，豌豆的红花遗传因子D跟白花遗传因子d在一起的时候也就会融合成为新的东西，D和d都不再存在了。显然，融合理论是错误的，因为它没有科学事实的支持。它只是一种推测和猜想，不能解释所有的表现不同的遗传现象。然而中间类型是有的。这是相对的基因相互作用而产生的性状，基因本身并没有改变。例如，红花的紫茉莉和白花的紫茉莉杂交，子一代的花是粉红色的。可是子二代，这些粉红色茉莉的后代，却有三种不同的性状：粉红花、红花和白花。

从这里也可以看到，现象和本质虽然有着密切的关系，但是它们之间是有区别的，不能简单地把现象和本质等同起来。豌豆是自花传粉植物，而且还是闭花受粉，也是豌豆花在未开放时，就已经完成了受粉，避免了外来花粉的干扰。所以豌豆在自然状态下一般都是纯种，用豌豆做人工杂交实验，结果既可靠，又容易分析。

1.2比较植物在不同生长条件下生长速度

1、试验的目标植物的生长速度的快慢

2、因素及其试验范围不同的生长条件为因素，如，阳光、水分、空气、土壤……

3、响应结果为试验的生长速度

4、试验误差如，温度的细小误差，土壤中微量元素的干扰，空气湿度……

5、区组设立多的区组，可以使试验更加精确

6、随机化随机化试验顺序

7、重复重复多次试验，减小误差

8、统计模型建立统计模型，估计实验结果

9、追加试验追加试验，减小误差

10、试验的组织和管理

1.6 为研究纸张的抗张强度与纸浆中硬木的比例的相关性，现根据十次试验得

到如下数据：

抗张强度

160 172

176 182 184 183 188 193 195 200 硬木比例

15 15 20 20 20 25

（a ）用一阶线性模型拟合x 与y 的数据；（b ）检验（a ）中线性模型的显著性；（c ）画出残点图。

解：

（a ）

1?β=38785/4684=8.28 0

?β=11.07 得一阶线性模型为：y=8.28x+11.07

(b) )

1()

1(F 2

---=

s n R s

S S T

S S R

=2R =0.964

F=214.961

=-)81()1(，αF ），（）（81

95.0F =11.26 由于11.26<214.961 拒绝原假设产生显著性影响

102110???3.1838.20??βββββ-=∑∑===+=Y x y x Y X x y i

i i i

(c)

1.7 加权最小二乘误差平方和 Q=210)(i i i x y ββω--∑

ωωββx y 10??-= 2

i 1)

())((?ωωωωωωβx x y y x x i i i i -∑--∑= 即可得出为如题方程组的解

1.8 数据如下：

y X1 X2 26 1 1 25 1 1 175 1.5 4 160 1.5 4 164 1.5 4 55 0.5 3 62 1.5 2 102 0.5 3 26 1 1.5 32 0.5 1.5 70 1 2.5 72

0.5

2.5

（a ）计算其ANOVA 表，并判断模型的显著性，显著性水平α=0.01

解： (a)

P<0.01 检验显著

1.9 （a ）考虑中心化线性模型，写出矩阵形式的y ，β，G ； (b)计算其ANOVA 表。

解：

(a)????? ???=n y y y 1 , ????? ??=321ββββ , ??

?????=)()()(.........)()()(838281131211x g x g x g x g x g x g G

(b)

P<0.01 检验显著

第一章试验设计与建模习题

1.5 、基于线性回归模型（1.14），令随机误差ε～Nn （0，σ2）

。

令预测误差r=y-^y ,其中^

y 是预测值。证明：

（a ）E(r)=0且r 和^

y 的协方差矩阵为零矩阵，即r 和^

y 相互独立；（b ）r ～Nn (0,σ2(I-H)),其中I 为n ×n 的单位矩阵，

（b ）H=G 1)'(-GG G ′. 解：

（a ）E(r )=E(y-^

y )=E(G β+ε-G ^

β) =G β+E(ε)-G E(^

β)

=G β-G β+0（^

β是β的无偏估计) =0

y H I y G G G G y G y y y r )()('1'^

-=-=-=-=-β '1')(G G G G H -= 所以),)((),(^

Hy y H I Cov y r Cov -= H y y Cov H I ),()('-=

22'2)()(σσσ=-=-=H H H H I 0 故r 和^

y 相互独立

（b ）因ε、^

β服从正态分布，而r 是ε和^

β的线性组合，

故而r 也服从正态分布，由（1）知，E （r ）=0 Var(r )=Var(y -^

y )=Var(y -G ^

β)

=Var(y -G 1)'(-GG G ′y )

=(I -G 1)'(-GG G ′Var(y ) =(I -H )σ2(H =G 1)'(-GG G ′ 所以，r ～Nn (0,σ2(I -H ))

1.10、设A=)

ij a （为n 阶方阵，X=

)

ij x （为n ×n 的矩阵，向量

1),...,n x x （，证明

（a)设Ax

x y '=，则x

A A x y

)('+=??；

（b)设

)

('AX X tr y =，其中tr （B ）表示方阵B 的迹，即矩阵B

的对角元素之和，则X

A A X y

)('+=??。

解：

（a)由Ax x y '

=知，()??

????????????

??=n nn n n n n n x x x a a a a a a a a a x x x y .........................

.......,...,,212

2222111211

即

??????????

????? ??=∑∑∑===n n i n i n

i i in i i i x x x x a x a x a y ....

,...,,21111221=

∑∑∑===+++n

i n

i i

in n i i n

i i i x a x x a x x a x 1

221

11...，

所以

?????????

??++++++++++++++=

??n nn n n n n n n n n n n x a x a a x a a x a a x a x a a x a a x a a x a x y 2...)()(..

.)(...2))(...)(222211122222112211121221111（= ??

????????????

??+?????????? ???????????? ??n nn n n

n n n nn n n n n x x x a a a a a a a a a x x x a a a a a a a a a ..............

......

(21212221212111)

212

2222111211

A A x A Ax )(''+=+，得证

（b ）易知

∑∑∑===+++==n

i n

i in

i n i i n

i i i a x x a x x a x x AX X tr y 1

11212111111'

...)( ∑∑∑===++++n

i n

i in

i n n

i i i i i a x x a x x a x x 1

221

22221212...

...

∑∑∑===++++n

i n i n

i in

in nn i in n i in n a x x a x x a x x 1

2211...，

则????

???

??+++++++++=??∑∑∑∑∑∑∑∑∑=========n

i ni in in n

i ni in i n

i ni in

i n

i i i in n

i i i i n

i i i in n

i i i i n

i i i i a a x a a x

a a x a a x a a x

a a x a a x a a x a a x X y 11

221222

22111111121111)(.

..)()

(..

...

.....

......)(...)()()(...)()(

第二章习题

2.1、为了提高合成纤维的抗拉强度，根据以前的经验，工程师知道在合成纤维中棉花所占的比例可能会影响到抗拉强度，而且棉花所占比例的范围应该在10%到40%之间，为此，他选定棉花所占比例的五个水平：15%，20%，25%，30%，35%，并在每个水平下试验四个样品，其数据如表所示。

棉花比

例%

15 20 25 30 35

抗拉强度7 12 14 20 8 15 18 19 25 10 11 17 18 24 14 9 13 19 22 11

（a）考虑线性可加模型分解（2.1），并按该模型分解表2.23中数据，同时估计其主效应及误差方差的大小；

（b）计算ANOVE表，并分析在合成纤维中棉花所占比例是否对抗拉强度有影响（ =0.05）

解：

（a）水平个数k=5，n=4，总均值y=15.3，

平均强度分别为10.5、15、17.5、22.75、10.75

分解数据如下：7=10.5-3.5=15.3-4.8-3.5 得以下表格：

所以， y =εβ+G

3.15..y ?==μ

i α

=-4.8、-0.3、2.2、7.45、-4.55

（b ）

由上表格可知，0.727>0.05 即无显著性影响，得结论在合成纤维中棉花所占比例对抗拉强度有没有影响。

2.3 对于上表中的数据，应用Bonferroni 法和Tukey 法进行多重比较，

15% 7=10.5-3.5 15=10.5+4.5 11=10.5+0.5 9=10.5-1.5 10.5=15.3-4.8 20% 12=15-3 18=15+3 17=15+2 13=15-2 15=15.3-0.3 25% 14=17.5-3.5 19=17.5+1.5 18=17.5+0.5 19=17.5+1.5 17.5=15.3+2.2 30% 20=22.75+2.7

25=22.75+2.25

24=22.75 22=22.75+0.75

22.75=15.3+7.45

35%

8=10.75-1.25

10=10.75-0.75

14=10.75+3.25

11=10.75+0.25

10.75=15.3-4.55

并给出相应的结论。

解：用spss得出单因素方差和多重比较结果如下表格：