当前位置:文档之家› 生物统计学(第3版)杜荣骞 课后习题答案 第七章 拟合优度检验

生物统计学(第3版)杜荣骞 课后习题答案 第七章 拟合优度检验

生物统计学(第3版)杜荣骞 课后习题答案 第七章  拟合优度检验
生物统计学(第3版)杜荣骞 课后习题答案 第七章  拟合优度检验

第七章拟合优度检验

7.12000年在5 760 295名成年人群中和1 596 734名儿童群体中严重CDH(先天性心脏病)和其他程度CDH的流行病学患者数如下表[36]:

尚存活的成年人 2 205 21 358 23 563

尚存活的儿童 2 316 16 663 18 979 合计 4 521 38 021 42 542

检验在尚存活的成年人和儿童中受损害的程度,差异是否显著?

答:这是2×2列联表χ2检验,使用程序如下:

options linesize=76 nodate;

data;

do a=1 to 2;

do b=1 to 2;

input case @@;

output;

end;

end;

cards;

2205 21358

2316 16663

;

proc freq formchar(1,2,7)='|-+';

weight case;

tables a*b/cellchi2 expected nocol norow nopercent chisq;

title '2*2 Contingency Table Test';

run;

程序运行结果见下表:

2*2 Contingency Table Test

TABLE OF A BY B

A B

Frequency |

Expected |

Cell Chi-Square| 1| 2| Total

---------------+--------+--------+

1 | 2205 | 21358 | 23563

| 2504.1 | 21059 |

| 35.72 | 4.2474 |

---------------+--------+--------+

2 | 2316 | 1666

3 | 18979

| 2016.9 | 16962 |

| 44.347 | 5.2733 |

---------------+--------+--------+

Total 4521 38021 42542

STATISTICS FOR TABLE OF A BY B

Statistic DF Value Prob

------------------------------------------------------

Chi-Square 1 89.588 0.001

Likelihood Ratio Chi-Square 1 89.070 0.001

Continuity Adj. Chi-Square 1 89.289 0.001

Mantel-Haenszel Chi-Square 1 89.586 0.001

Fisher's Exact Test (Left) 2.21E-21

(Right) 1.000

(2-Tail) 4.20E-21

Phi Coefficient -0.046

Contingency Coefficient 0.046

Cramer's V -0.046

Sample Size = 42542

从“A×B列联表的统计量”部分可以得出,连续性矫正的χ2显著性概率P=0.001,P <0.01,故拒绝H0,在尚存活的成年人和儿童中受损害的程度差异极显著。

7.22000年在成年人和儿童中CDH(先天性心脏病)的发病患者数如下表[36]:

先天心脏病患者数无先天心脏病患者数合计

成年人26 563 5 733 732 5 760 295

儿童18 979 1 577 755 1 596 734

合计45 542 7 311 487 7 357 029

问:在成年人和在儿童中先天心脏病的发病率差异是否显著?

答:本题为2×2列联表X 2检验,需做连续性矫正。结果如下表:

2*2 Contingency Table Test

TABLE OF A BY B

A B

Frequency |

Expected |

Cell Chi-Square| 1| 2| Total

---------------+--------+--------+

1 | 26563 |573373

2 |5760295

| 35658 |5724637 |

| 2319.7 | 14.449 |

---------------+--------+--------+

2 | 18979 |1577755 |1596734

| 9884.2 |1586850 |

| 8368.4 | 52.125 |

---------------+--------+--------+

Total 45542 7311487 7357029

STATISTICS FOR TABLE OF A BY B

Statistic DF Value Prob

------------------------------------------------------ Chi-Square 1 10754.671 0.001

Likelihood Ratio Chi-Square 1 9187.383 0.001

Continuity Adj. Chi-Square 1 10753.488 0.001

Mantel-Haenszel Chi-Square 1 10754.669 0.001

Fisher's Exact Test (Left) 0.00E+00

(Right) 1.000

(2-Tail) 0.00E+00

Phi Coefficient -0.038

Contingency Coefficient 0.038

Cramer's V -0.038

Sample Size = 7357029

连续性矫正的χ2显著性概率P=0.001,P <0.01,故拒绝H0,在成年人和在儿童中先天心脏病的发病率差异极显著。

7.3在关于II型糖尿病与患帕金森氏病风险的研究中,共有50 454名非糖尿病患者和1 098名糖尿病患者参与实验,在无糖尿病的参与者中有609名患帕金森氏病,在糖尿病患者中有24名还患有帕金森氏病[37]。请推断患帕金森氏病的风险是否与患糖尿病有关?

答:本题为2×2列联表χ2检验,需做连续性矫正。结果如下表:

2*2 Contingency Table Test

TABLE OF A BY B

A B

Frequency |

Expected |

Cell Chi-Square| 1| 2| Total

---------------+--------+--------+

1 | 609 | 50454 | 51063

| 619.39 | 50444 |

| 0.1743 | 0.0021 |

---------------+--------+--------+

2 | 24 | 1098 | 1122

| 13.61 | 1108.4 |

| 7.9323 | 0.0974 |

---------------+--------+--------+

Total 633 51552 52185

STATISTICS FOR TABLE OF A BY B

Statistic DF Value Prob

------------------------------------------------------

Chi-Square 1 8.206 0.004

Likelihood Ratio Chi-Square 1 6.723 0.010

Continuity Adj. Chi-Square 1 7.435 0.006

Mantel-Haenszel Chi-Square 1 8.206 0.004

Fisher's Exact Test (Left) 5.92E-03

(Right) 0.997

(2-Tail) 8.05E-03

Phi Coefficient -0.013

Contingency Coefficient 0.013

Cramer's V -0.013

Sample Size = 52185

连续性矫正的χ2显著性概率P=0.006,P <0.01,故拒绝H0。在糖尿病患者和非糖尿病患者中,帕金森氏病的发病率有极显著不同。由此推断患帕金森氏病的风险可能与糖尿病有关。

7.4将患有慢性心力衰竭的门诊患者随机分为两组,采用两种方法护理。一种是用通常的护理方法护理,共758名患者;另一种是用电话参与护理,心内科医生经常打电话访问、指导,共760名患者。在该研究项目结束时,前一组有235名患者病情恶化甚至死亡,而后一组出现这种情况的是200名患者[38]。问:用电话参与的护理方法与通常的护理方法,护理的效果有无显著不同?

答:本题为2×2列联表χ2检验,需做连续性矫正。结果如下表:

2*2 Contingency Table Test

TABLE OF A BY B

A B

Frequency |

Expected |

Cell Chi-Square| 1| 2| Total

---------------+--------+--------+

1 | 235 | 523 | 758

| 217.21 | 540.79 |

| 1.4565 | 0.585 |

---------------+--------+--------+

2 | 200 | 560 | 760

| 217.79 | 542.21 |

| 1.4526 | 0.5835 |

---------------+--------+--------+

Total 435 1083 1518

STATISTICS FOR TABLE OF A BY B

Statistic DF Value Prob

------------------------------------------------------

Chi-Square 1 4.078 0.043

Likelihood Ratio Chi-Square 1 4.081 0.043

Continuity Adj. Chi-Square 1 3.852 0.050

Mantel-Haenszel Chi-Square 1 4.075 0.044

Fisher's Exact Test (Left) 0.981

(Right) 0.025

(2-Tail) 0.047

Phi Coefficient 0.052

Contingency Coefficient 0.052

Cramer's V 0.052

Sample Size = 1518

表中的χ2的显著性概率刚好为0.050,依据χ2=3.852,从χ2分布的分布函数可以计算出P=0.049 686 709 2,P <0.05。结论是,用电话参与的护理方法与通常的护理方法,护理的效果有显著不同。

7.5人类面型大致可以分为5类,将186名男性和185名女性的面型进行了分类,所得数据见下表[21]:

超狭面型狭面型中面型扩面型超扩面型合计

男性人数26 52 54 42 12 186

女性人数 3 43 64 56 19 185

请推断面型的分布在两性之间差异是否显著?

答:这是2×5列联表χ2检验,所用的程序与2×2列联表的程序没有很大的不同,只要把循环语句的“do b=1 to 2;”改为“do b=1 to 5;”便可以了。程序运行的结果如下表。

2*5 Contingency Table Test

TABLE OF A BY B

A B

Frequency |

Expected |

Cell Chi-Square| 1| 2| 3| 4| 5| Total

---------------+--------+--------+--------+--------+--------+

1 | 26 | 5

2 | 54 | 42 | 12 | 186

| 14.539 | 47.628 | 59.159 | 49.132 | 15.542 |

| 9.0344 | 0.4013 | 0.4499 | 1.0353 | 0.8071 |

---------------+--------+--------+--------+--------+--------+

2 |

3 | 43 | 6

4 | 56 | 19 | 185

| 14.461 | 47.372 | 58.841 | 48.868 | 15.458 |

| 9.0833 | 0.4035 | 0.4523 | 1.0409 | 0.8115 |

---------------+--------+--------+--------+--------+--------+

Total 29 95 118 98 31 371

STATISTICS FOR TABLE OF A BY B

Statistic DF Value Prob

------------------------------------------------------

Chi-Square 4 23.520 0.001

Likelihood Ratio Chi-Square 4 26.213 0.001

Mantel-Haenszel Chi-Square 1 15.879 0.001

Phi Coefficient 0.252

Contingency Coefficient 0.244

Cramer's V 0.252

Sample Size = 371

χ2的显著性概率P=0.006,P <0.01,故拒绝H0。不同面型在两性间的分布差异极显著。

7.6马边河贝氏高原鳅繁殖群体的体长组成数据见下表[5]:

体长分布

>102.5 >97.5 >92.5 >87.5 >82.5 >77.5 >72.5 >67.7 雌鱼尾数16 32 23 17 33 17 12 7

雄鱼尾数30 25 26 21 12 8 4 6

检验马边河贝氏高原鳅在繁殖期,雌、雄鱼体体长分布差异是否显著?

答:程序与上题类似,只是下标变量由5改为8。结果如下:

2*8 Contingency Table Test

TABLE OF A BY B

A B

Frequency |

Expected |

Cell Chi-Square| 1| 2| 3| 4| Total

---------------+--------+--------+--------+--------+

1 | 16 | 3

2 | 2

3 | 17 | 157

| 24.99 | 30.965 | 26.619 | 20.644 |

| 3.2339 | 0.0346 | 0.4921 | 0.6431 |

---------------+--------+--------+--------+--------+

2 | 30 | 25 | 26 | 21 | 132

| 21.01 | 26.035 | 22.381 | 17.356 |

| 3.8463 | 0.0411 | 0.5853 | 0.7649 |

---------------+--------+--------+--------+--------+

Total 46 57 49 38 289

(Continued)

TABLE OF A BY B

A B

Frequency |

Cell Chi-Square| 5| 6| 7| 8| Total

---------------+--------+--------+--------+--------+

1 | 33 | 17 | 1

2 | 7 | 157

| 24.446 | 13.581 | 8.692 | 7.0623 |

| 2.9929 | 0.8606 | 1.2589 | 0.0005 |

---------------+--------+--------+--------+--------+

2 | 12 | 8 | 4 | 6 | 132

| 20.554 | 11.419 | 7.308 | 5.9377 |

| 3.5597 | 1.0235 | 1.4974 | 0.0007 |

---------------+--------+--------+--------+--------+

Total 45 25 16 13 289

2*8 Contingency Table Test

STATISTICS FOR TABLE OF A BY B

Statistic DF Value Prob

------------------------------------------------------

Chi-Square 7 20.835 0.004

Likelihood Ratio Chi-Square 7 21.399 0.003

Mantel-Haenszel Chi-Square 1 10.035 0.002

Phi Coefficient 0.269

Contingency Coefficient 0.259

Cramer's V 0.269

Sample Size = 289

χ2的显著性概率P=0.004,P <0.01,故拒绝H0。马边河贝氏高原鳅在繁殖期,雌、雄鱼体体长分布差异极显著。

7.7将由白芥子、细辛、甘遂、延胡索和生姜制成的药膏在每年的头伏、中伏和末伏贴敷在风门穴和肺俞穴,进行三伏灸(sanfujiu)治疗。三伏灸治疗结束后,一些过敏症状的疗效(节选4项)见下表[39]:

症状

与治疗前比较症状改变程度

总人数改善人数无改善人数加重人数

气喘19 15 4 39

流涕39 40 3 82

鼻塞39 41 3 83

咳嗽25 20 3 48

检验三伏灸对不同过敏症状的效果是否相同?在这个表中出现了很多小于5的数据,考虑应如何处理。

答:这是一个4×3列联表χ2检验,由于有些格的理论数小于5,需要做精确χ2检验。结果如下表:

4*3 Contingency Table Test

TABLE OF A BY B

A B

Frequency |

Expected |

Cell Chi-Square| 1| 2| 3| Total

---------------+--------+--------+--------+

1 | 19 | 15 | 4 | 38

| 18.47 | 17.562 | 1.9681 |

| 0.0152 | 0.3737 | 2.0977 |

---------------+--------+--------+--------+

2 | 39 | 40 |

3 | 82

| 39.857 | 37.896 | 4.247 |

| 0.0184 | 0.1168 | 0.3661 |

---------------+--------+--------+--------+

3 | 39 | 41 | 3 | 83

| 40.343 | 38.359 | 4.2988 |

| 0.0447 | 0.1819 | 0.3924 |

---------------+--------+--------+--------+

4 | 2

5 | 20 | 3 | 48

| 23.331 | 22.183 | 2.4861 |

| 0.1194 | 0.2149 | 0.1062 |

---------------+--------+--------+--------+

Total 122 116 13 251

STATISTICS FOR TABLE OF A BY B

Statistic DF Value Prob

------------------------------------------------------

Chi-Square 6 4.047 0.670

Likelihood Ratio Chi-Square 6 3.661 0.722

Mantel-Haenszel Chi-Square 1 0.173 0.677

Fisher's Exact Test (2-Tail) 0.684

Phi Coefficient 0.127

Contingency Coefficient 0.126

Cramer's V 0.090

Sample Size = 251

WARNING: 33% of the cells have expected counts less

than 5. Chi-Square may not be a valid test.

表中有4个格的理论数小于5,对于4×3列联表的精确χ2检验,只要在TABLES语句的“/”后加上EXACT选项即可。双尾精确检验的P=0.684,P >0.05,尚无足够的理由拒绝H0。结论是,表中的4个过敏症状改善的程度是一致的。

7.83种方法治疗慢性鼻炎的疗效比较如下表[40]:

人数

治愈显效有效无效

微波治疗组13 6 2 3

激光治疗组10 5 1 4

下鼻甲部分切除组 4 1 1 2

检验3种治疗方法的疗效差异是否显著?

答:结果见下表:

3*4 Contingency Table Exact Test

TABLE OF A BY B

A B

Frequency |

Expected |

Cell Chi-Square| 1| 2| 3| 4| Total

---------------+--------+--------+--------+--------+

1 | 13 | 6 |

2 |

3 | 24

| 12.462 | 5.5385 | 1.8462 | 4.1538 |

| 0.0233 | 0.0385 | 0.0128 | 0.3205 |

---------------+--------+--------+--------+--------+

2 | 10 | 5 | 1 | 4 | 20

| 10.385 | 4.6154 | 1.5385 | 3.4615 |

| 0.0142 | 0.0321 | 0.1885 | 0.0838 |

---------------+--------+--------+--------+--------+

3 |

4 | 1 | 1 | 2 | 8

| 4.1538 | 1.8462 | 0.6154 | 1.3846 |

| 0.0057 | 0.3878 | 0.2404 | 0.2735 |

---------------+--------+--------+--------+--------+

Total 27 12 4 9 52

STATISTICS FOR TABLE OF A BY B

Statistic DF Value Prob

------------------------------------------------------

Chi-Square 6 1.621 0.951

Likelihood Ratio Chi-Square 6 1.682 0.946

Mantel-Haenszel Chi-Square 1 0.564 0.453

Fisher's Exact Test (2-Tail) 0.945

Phi Coefficient 0.177

Contingency Coefficient 0.174

Cramer's V 0.125

Sample Size = 52

WARNING: 75% of the cells have expected counts less

than 5. Chi-Square may not be a valid test.

精确χ2检验的结果,P=0.945,P >0.05。结论是,三种治疗方法的疗效差异不显著。

7.9用齿科充填材料氢氧化钙及樟脑酚根管内封药治疗急性牙髓炎,治疗后0.5年,1年和3年成功率(成功人数/总人数)如下表[41]:

0.5年1年3年

氢氧化钙组71/75 68/75 67/75

樟脑酚组70/75 69/75 67/75

分别检验0.5年、1年和3年两组的治疗成功率差异是否显著?

答:(1) 0.5年:

Fisher's Exact Test (2-Tail) P=1.000

(2) 1年:

Statistic DF Value Prob

Continuity Adj. Chi-Square 1 0.000 1.000

(3) 3年:

Statistic DF Value Prob

Continuity Adj. Chi-Square 1 0.000 1.000

从以上结果可知,两个治疗组在治疗后0.5年,1年和3年后的治疗成功率差异不显著。

7.10用近视灵保健液和离子眼药水治疗学生近视眼,得到以下结果:用近视灵保健液治疗的,共60只眼睛,其中51只眼睛有效;用离子眼药水治疗的,共66只眼睛,其中44只有效[42],问两种药物对治疗近视眼的效果差异是否显著?

答:结果如下:

STATISTICS FOR TABLE OF A BY B

Statistic DF Value Prob

------------------------------------------------------

Chi-Square 1 5.695 0.017

Likelihood Ratio Chi-Square 1 5.854 0.016

Continuity Adj. Chi-Square 1 4.749 0.029

Mantel-Haenszel Chi-Square 1 5.649 0.017

Fisher's Exact Test (Left) 0.014

(Right) 0.996

(2-Tail) 0.022

Phi Coefficient -0.213

Contingency Coefficient 0.208

Cramer's V -0.213

Sample Size = 126

连续性矫正的χ2显著性概率P=0.029,P <0.05。因此,两种药物治疗近视眼的效果差异显著。

7.11拉菲和舒巴酮是两种治疗呼吸系统和泌尿系统感染的药物,下表给出了这两种药物治疗淋菌性尿道炎的结果[43]:

药物

人数

痊愈显效无效

拉菲8 3 0

舒巴酮13 8 3

推断这两种药物治疗淋菌性尿道炎的疗效差异是否显著?

答:结果见下表:

STATISTICS FOR TABLE OF A BY B

Statistic DF Value Prob

------------------------------------------------------

Chi-Square 2 1.896 0.387

Likelihood Ratio Chi-Square 2 2.773 0.250

Mantel-Haenszel Chi-Square 1 1.678 0.195

Fisher's Exact Test (2-Tail) 0.641

Phi Coefficient 0.233

Contingency Coefficient 0.227

Cramer's V 0.233

Sample Size = 35

WARNING: 50% of the cells have expected counts less

than 5. Chi-Square may not be a valid test.

Fisher's Exact Test (2-Tail)的显著性概率P=0.641,P >0.05。因此,两种药物治疗淋菌性尿道炎的效果差异不显著。

7.12人类指尖的皮纹(由皮肤纹嵴所构成的纹嵴花纹),粗略分型可分为弓(arch)、箕(loop)和斗(whorl)。在一般人群中弓形纹频率较低,主要为箕和斗,但在染色体异常的病人中弓形纹出现的频率较高。下表中给出了闽南人男女两性的不同皮纹类型[44]:

性别

皮纹类型(手指数)

弓型箕型斗型

男16 502 482

检验两性不同皮纹类型差异是否显著?

答:结果如下:

STATISTICS FOR TABLE OF A BY B

Statistic DF Value Prob

------------------------------------------------------

Chi-Square 2 3.908 0.142

Likelihood Ratio Chi-Square 2 3.962 0.138

Mantel-Haenszel Chi-Square 1 1.067 0.302

Fisher's Exact Test (2-Tail) 0.145

Phi Coefficient 0.044

Contingency Coefficient 0.044

Cramer's V 0.044

Sample Size = 2000

χ2显著性概率P=0.142,P >0.05。因此,尚无足够的理由拒绝H0,男女两性的皮纹类型差异不显著。

7.13由于社会竞争加剧,就业困难,贫富差距加大等社会因素,造成心理疾病患者明显加多。很多心理疾病患者往往表现为躯体上的一些症状,下表给出了在不同科室就医的患者中有心理障碍患者的人数[45]:

检测例数心理障碍者数

内外科门诊416 140

妇产科门诊326 132

中医科门诊258 140

检验心理疾患与躯体症状表现类型之间是否存在关联?

答:结果如下:

3*2 Contingency Table Test

TABLE OF A BY B

A B

Frequency |

Expected |

Cell Chi-Square| 1| 2| Total

---------------+--------+--------+

1 | 140 | 276 | 416

| 171.39 | 244.61 |

| 5.7497 | 4.0287 |

---------------+--------+--------+

2 | 132 | 194 | 326

| 134.31 | 191.69 |

| 0.0398 | 0.0279 |

---------------+--------+--------+

3 | 140 | 118 | 258

| 106.3 | 151.7 |

| 10.687 | 7.488 |

---------------+--------+--------+

Total 412 588 1000

STATISTICS FOR TABLE OF A BY B

Statistic DF Value Prob

------------------------------------------------------

Chi-Square 2 28.021 0.001

Likelihood Ratio Chi-Square 2 27.893 0.001

Mantel-Haenszel Chi-Square 1 26.923 0.001

Fisher's Exact Test (2-Tail) 9.14E-07

Phi Coefficient 0.167

Contingency Coefficient 0.165

Cramer's V 0.167

Sample Size = 1000

χ2显著性概率P=0.001,P <0.01。因此,拒绝H0,心理疾患与躯体症状表现类型之间存在关联。

7.14海南粗榧叶长度的频数分布[4]:

叶长度/mm 频数

2.0~2.2 390

2.2~2.4 1 434

2.4~2.6 2 643

2.6~2.8 3 546

2.8~

3.0 5 692

3.0~3.2 5 187

3.2~3.4 4 333

3.4~3.6 2 767

3.6~3.8 1 677

3.8~

4.0 1 137

4.0~4.2 667

4.2~4.4 346

4.4~4.6 181

用正态分布拟合,检验海南粗榧叶长度是否服从正态分布?

答:所用程序见“SAS实用程序”子目录中的“7.3 例7.3e正态性的拟合优度检验”。将该程序的相关语句做相应修改,便成为下述程序。其中红字标出的地方是修改部分。

options nodate;

data norm;

infile 'e:\data\exr7-14e.dat';

do y=0 to 12;

input f y @@;

fy=f*y; fsqy=f*y*y; sumf+f; sumfy+fy; sumfsqy+fsqy;

m=sumfy/sumf; vace=(sumfsqy-m*sumfy)/sumf;

std=sqrt(vace);

do j=0.5 to 11.5; if y=12 then output; end;

end; run;

data x; set norm;

u=(j-m)/std; p=probnorm(u); t0=sumf*p; run;

data b; set x; keep t0; run;

data a; input t0;

cards;

30000

;

data a1; set b a; run;

data a2; set a1; rename t0=fir; run;

data c; input t0;

cards;

;

data c1; set c b; run;

data c2; set c1; rename t0=las; run;

data freq;

infile 'e:\data\exr7-14e.dat';

input f y @@; run;

data comb;

merge freq a2 c2;

t=fir-las; chi=(f-t)*(f-t)/t; chisq+chi; num+1; df=num-3;

p=1-probchi(chisq,df); if num=13 then output;

keep chisq df p;

proc print;

id df; var chisq p;

title1 'Goodness of Fit Test';

title2 'For the Normality';

run;

计算结果见下表:

Goodness of Fit Test

For the Normality

DF CHISQ P

10 1168.86 0

χ2显著性概率P=0,P <0.01。因此,拒绝H0,海南粗榧叶长度的分布不服从正态分布。

7.15姊妹染色单体交换(SCE)可以“自发”产生,也可以由诱变因素诱导产生。下表给出了在单个细胞内“自发”和诱发产生的SCE数(略作调整)[46]:

“自发的”诱发的

单个细胞内的SCE数频数

单个细胞内

的SCE数

频数

6 14

7 5

7 8 8 6

8 10 9 10

9 12 10 15

10 14 11 11

11 5 12 14

12 7 13 6

13 8 14 7

15 7

总数78 16 8

总数89 利用拟合优度检验“自发”和诱发产生的SCE数是否服从正态分布?

答:

“自发的”:

Goodness of Fit Test

For the Normality

DF CHISQ P

5 7.02983 0.21843

诱发的:

Goodness of Fit Test

For the Normality

DF CHISQ P

7 6.71377 0.45928

从以上结果可知,“自发”和诱发产生的SCE数都是服从正态分布的。

7.16检验例3.2的实验结果是否符合二项分布。

正常直毛后代数(y)观察频数(f)

0 0

1 1

2 2

3 4

4 12

5 6

6 5

7 2

8 0

总数N =32

答:所用的程序与“SAS实用程序”子目录中的“7.2 例7.2e理论数小于5的拟合优度检验”程序基本一致。下述程序中红字的部分是结合本题所做的修改。因为本题的参数φ是已知的,所以df=k-1,与“SAS实用程序”中的7.2节不同,在那里df=k-1-1。

options nodate;

data a bc;

n=8; phi=0.5; sumo=32;

do i=1 to 15 until(sumt>5);

sumi+1; input y o @@;

p2=probbnml(phi,n,y);

p1=probbnml(phi,n,y-1);

if y=0 then pr=p2; else pr=p2-p1;

t=pr*sumo; sumt+t;

if i=sumi then output a; else output bc;

end;

cards;

0 0 1 1 2 2 3 4 4 12 5 6 6 5 7 2 8 0

;

run;

data b c; set bc;

index_t=sumo-sumt;

if t>=5 and index_t>=5 then output b; else output c;

data d ; set a; t0+t; drop t; o0+o; drop o;

if sumt>=5 then output d;

data e; set b; o0=o;t0=t; output e;

data f; set c; t0+t; drop t; o0+o; drop o;

if n=sumi-1 then output f;

data combin; set d e f;

chi=(o0-t0)**2/t0; chisq+chi; j+1; df=j-1;

if n=sumi-1 then output;

data end; set combin; p=1-probchi(chisq,df);

proc print data=end;

id chisq; var df p;

title1 'Goodness of Fit Test';

title2 'For Table 3-2';

run;

计算结果见下表:

Goodness of Fit Test

For Table 3-2

CHISQ DF P

3.20983 2 0.20091

χ2=3.209 83,χ2显著性概率P=0.200 91,P >0.05。尚无足够理由拒绝H0,正常直毛后代数服从二项分布。

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

生物统计学试题及答案

生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() x N(0,1)B.11 - x ~N(0,1)C.91 - x ~N(0,1)D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为 ( )。 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 12. 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F 14. 15.已知随机变量x服从N (8,4),P(x < 4.71)(填数字) 四.综合分析题(共60分)

生物统计学复习题及答案

《生物统计学》复习题 一、填空题(每空1分,共10分) 1 ?变量之间的相关关系主要有两大类: (因果关系),(平行关系) 2 ?在统计学中,常见平均数主要有( 算术平均数)、(几何平均数)、(调和平均数) S 、:'(X 迁 3 ?样本标准差的计算公式( 1 n 1 ) 4 ?小概率事件原理是指( 某事件发生的概率很小,人为的认为不会发生 ) 5. 在标准正态分布中, P (- K u w 1) = (0。6826 ) (已知随机变量1的临界值为0. 1587) 6. 在分析变量之间的关系时, 一个变量X 确定,Y 是随着X 变化而变化,两变量呈因果关系, 则X 称为(自 变量),Y 称为(依变量) 二、单项选择题(每小题 1分,共20分) 1、 ________________________________ 下列数值属于参数的是: A 、总体平均数 B 、自变量 C 依变量 D 、样本平均数 2、 下面一组数据中属于计量资料的是 _____________ A 、产品合格数 B 、抽样的样品数 C 病人的治愈数 D 、产品的合格率 3、 在一组数据中,如果一个变数 10的离均差是2,那么该组数据的平均数是 _________ 4、 变异系数是衡量样本资料 _________ 程度的一个统计量。 ___________ A 、变异 B 、同一 C 集中 D 、分布 5、 方差分析适合于, ____________ 数据资料的均数假设检验。 A 、两组以上 B 、两组 C 一组 D 、任何 8、平均数是反映数据资料 _________ 性的代表值。 A 、变异性 B 、集中性 C 差异性 D 、独立性 9、在假设检验中,是以 ___________ 为前提。 A 肯定假设 B 、备择假设 C 原假设 10、抽取样本的基本首要原则是 A 12 B 、10 D 、2 6、 在t 检验时,如果t = t o 、01,此差异是: A 、显著水平 B 、极显著水平 7、 生物统计中t 检验常用来检验 __________ A 、两均数差异比较 B 、两个数差异比较 C 无显著差异 D 、没法判断 C 两总体差异比较 D 、多组数据差异比 较 D 、有效假设

李春喜《生物统计学》第三版 课后作业答案知识分享

李春喜《生物统计学》第三版课后作 业答案

《生物统计学》第三版课后作业答案 (李春喜、姜丽娜、邵云、王文林编著) 第一章概论(P7) 习题1.1 什么是生物统计学?生物统计学的主要内容和作用是什么? 答:(1)生物统计学(biostatistics)是用数理统计的原理和方法来分析和解释生物界各种现象和实验调查资料,是研究生命过程中以样本来推断总体的一门学科。 (2)生物统计学主要包括实验设计和统计推断两大部分的内容。其基本作用 表现在以下四个方面:①提供整理和描述数据资料的科学方法;②确定某些性状和特性的数量特征;③判断实验结果的可靠性;④提供由样本推断总体的方法;⑤提供实验设计的一些重要原则。 习题1.2 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。 答:(1)总体(populatian)是具有相同性质的个体所组成的集合,是研究对象的全体。 (2)个体(individual)是组成总体的基本单元。 (3)样本(sample)是从总体中抽出的若干个个体所构成的集合。 (4)样本容量(sample size)是指样本个体的数目。 (5)变量(variable)是相同性质的事物间表现差异性的某种特征。 (6)参数(parameter)是描述总体特征的数量。

(7)统计数(statistic)是由样本计算所得的数值,是描述样本特征的数量。 (8)效应(effection)试验因素相对独立的作用称为该因素的主效应,简称效应。 (9)互作(interaction)是指两个或两个以上处理因素间的相互作用产生的效应。 (10)实验误差(experimental error)是指实验中不可控因素所引起的观测值偏 离真值的差异,可以分为随机误差和系统误差。 (11)随机误差(random)也称抽样误差或偶然误差,它是有实验中许多无法控 制的偶然因素所造成的实验结果与真实结果之间产生的差异,是不可避 免的。随机误差可以通过增加抽样或试验次数降低随机误差,但不能完 全消。 (12) 系统误差(systematic)也称为片面误差,是由于实验处理以外的其他 条件明显不一致所产生的倾向性的或定向性的偏差。系统误差主要由一 些相对固定的因素引起,在某种程度上是可控制的,只要试验工作做得 精细,在试验过程中是可以避免的。 (13) 准确性(accuracy)也称为准确度,指在调查或实验中某一实验指标或 性状的观测值与其真值接近的程度。 (14) 精确性(precision)也称精确度,指调查或实验中同一实验指标或性状 的重复观测值彼此接近程度的大小。 (15)准确性是说明测定值堆真值符合程度的大小,用统计数接近参数真值 的程度来衡量。精确性是反映多次测定值的变异程度,用样本间的各 个变量间变异程度的大小来衡量。

生物统计学答案 第一章 统计数据的收集与整理

第一章 统计数据的收集与整理 1.1 算术平均数是怎样计算的?为什么要计算平均数? 答:算数平均数由下式计算:,含义为将全部观测值相加再被观测值的个数 除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点, 或是说是样本数据的代表。 1.2 既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差? 答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。 1.3 标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同? 答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。 1.4 完整地描述一组数据需要哪几个特征数? 答:平均数、标准差、偏斜度和峭度。 1.5 下表是我国青年男子体重(kg )。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。 66 69 64 65 64 66 68 65 62 64 69 61 61 68 66 57 66 69 66 65 70 64 58 67 66 66 67 66 66 62 66 66 64 62 62 65 64 65 66 72 60 66 65 61 61 66 67 62 65 65 61 64 62 64 65 62 65 68 68 65 67 68 62 63 70 65 64 65 62 66 62 63 68 65 68 57 67 66 68 63 64 66 68 64 63 60 64 69 65 66 67 67 67 65 67 67 66 68 64 67 59 66 65 63 56 66 63 63 66 67 63 70 67 70 62 64 72 69 67 67 66 68 64 65 71 61 63 61 64 64 67 69 70 66 64 65 64 63 70 64 62 69 70 68 65 63 65 66 64 68 69 65 63 67 63 70 65 68 67 69 66 65 67 66 74 64 69 65 64 65 65 68 67 65 65 66 67 72 65 67 62 67 71 69 65 65 75 62 69 68 68 65 63 66 66 65 62 61 68 65 64 67 66 64 60 61 68 67 63 59 65 60 64 63 69 62 71 69 60 63 59 67 61 68 69 66 64 69 65 68 67 64 64 66 69 73 68 60 60 63 38 62 67 65 65 69 65 67 65 72 66 67 64 61 64 66 63 63 66 66 66 63 65 63 67 68 66 62 63 61 66 61 63 68 65 66 69 64 66 70 69 70 63 64 65 64 67 67 65 66 62 61 65 65 60 63 65 62 66 64 答:首先建立一个外部数据文件,名称和路径为:E:\data\exer1-5e.dat 。所用的SAS 程序和计算结果如下: proc format; value hfmt 56-57='56-57' 58-59='58-59' 60-61='60-61' 62-63='62-63' 64-65='64-65' 66-67='66-67' 68-69='68-69' 70-71='70-71' 72-73='72-73' 74-75='74-75'; run; n y y n i i ∑== 1

生物统计学(版)杜荣骞课后习题答案统计数据的收集与

第一章统计数据的收集与整理1.1 算术平均数是怎样计算的?为什么要计算平均数? 答:算数平均数由下式计算:n y y n i i ∑ = =1 ,含义为将全部观测值相加再被观测值的个数 除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点,或是说是样本数据的代表。 1.2 既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差? 答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。 1.3 标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同? 答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。 1.4 完整地描述一组数据需要哪几个特征数? 答:平均数、标准差、偏斜度和峭度。 1.5 下表是我国青年男子体重(kg)。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。 66 69 64 65 64 66 68 65 62 64 69 61 61 68 66 57 66 69 66 65 70 64 58 67 66 66 67 66 66 62 66 66 64 62 62 65 64 65 66 72 60 66 65 61 61 66 67 62 65 65 61 64 62 64 65 62 65 68 68 65 67 68 62 63 70 65 64 65 62 66 62 63 68 65 68 57 67 66 68 63 64 66 68 64 63 60 64 69 65 66 67 67 67 65 67 67 66 68 64 67 59 66 65 63 56 66 63 63 66 67 63 70 67 70 62 64 72 69 67 67 66 68 64 65 71 61 63 61 64 64 67 69 70 66 64 65 64 63 70 64 62 69 70 68 65 63 65 66 64 68 69 65 63 67 63 70 65 68 67 69 66 65 67 66 74 64 69 65 64 65 65 68 67 65 65 66 67 72 65 67 62 67 71 69 65 65 75 62 69 68 68 65 63 66 66 65 62 61 68 65 64 67 66 64 60 61 68 67 63 59 65 60 64 63 69 62 71 69 60 63 59 67 61 68 69 66 64 69 65 68 67 64 64 66 69 73 68 60 60 63 38 62 67 65 65 69 65 67 65 72 66 67 64 61 64 66 63 63 66 66 66 63 65 63 67 68 66 62 63 61 66 61 63 68 65 66 69 64 66 70 69 70 63 64 65 64 67 67 65 66 62 61 65 65 60 63 65 62 66 64 答:首先建立一个外部数据文件,名称和路径为:E:\data\exer1-5e.dat。所用的SAS程序和计算结果如下: proc format; value hfmt 56-57='56-57' 58-59='58-59' 60-61='60-61' 62-63='62-63' 64-65='64-65' 66-67='66-67'

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

2017福师《生物统计学》答案

一、单选题(共 32 道试题,共 64 分。) V 1. 最小二乘法是指各实测点到回归直线的 A. 垂直距离的平方和最小 B. 垂直距离最小 C. 纵向距离的平方和最小 D. 纵向距离最小 2. 被观察到对象中的()对象称为() A. 部分,总体 B. 所有,样本 C. 所有,总体 D. 部分,样本 3. 必须排除______因素导致“结果出现”的可能,才能确定“结果出现”是处理因素导致的。只有确定了______,才能确定吃药后出现的病愈是药导致的。 A. 非处理因素,不吃药就不可能出现病愈 B. 处理因素,不吃药就不可能出现病愈 C. 非处理因素,吃药后确实出现了病愈 D. 处理因素,吃药后确实出现了病愈 4. 张三观察到李四服药后病好了。由于张三的观察是“个案”,因此不能确定______。 A. 确实进行了观察 B. 李四病好了 C. 病好的原因 D. 观察结果是可靠的 5. 四个样本率作比较,χ2>χ20.05,ν可认为

A. 各总体率不同或不全相同 B. 各总体率均不相同 C. 各样本率均不相同 D. 各样本率不同或不全相同 6. 下列哪种说法是错误的 A. 计算相对数尤其是率时应有足够的观察单位或观察次数 B. 分析大样本数据时可以构成比代替率 C. 应分别将分子和分母合计求合计率或平均率 D. 样本率或构成比的比较应作假设检验 7. 总体指的是()的()对象 A. 要研究,部分 B. 观察到,所有 C. 观察到,部分 D. 要研究,所有 8. 以下叙述中,除了______外,其余都是正确的。 A. 在比较未知参数是否不等于已知参数时,若p(X>x)<α/2,则x为小概率事件。 B. 在比较未知参数是否等于已知参数时,若p(X=x)<α,则x为小概率事件。 C. 在比较未知参数是否大于已知参数时,若p(X>x)<α,则x为小概率事件。 D. 在比较未知参数是否小于已知参数时,若p(X

生物统计学课后习题解答-李春喜汇总

生物统计学课后习题解答-李春喜汇总

第一章概论 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。 第二章试验资料的整理与特征数的计算习题 2.1 某地 100 例 30 ~ 40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下: 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.85 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 计算平均数、标准差和变异系数。 【答案】=4.7398, s=0.866, CV =18.27 % 2.2 试计算下列两个玉米品种 10 个果穗长度 (cm) 的标准差和变异系数,并解释所得结果。 24 号: 19 , 21 , 20 , 20 , 18 , 19 , 22 , 21 , 21 , 19 ; 金皇后: 16 , 21 , 24 , 15 , 26 , 18 , 20 , 19 , 22 , 19 。 【答案】 1 =20, s 1 =1.247, CV 1 =6.235% ; 2 =20, s 2 =3.400, CV 2 =17.0% 。 2.3 某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取 50 绳测其毛重(kg) ,结果分别如下:

生物统计学(版)杜荣骞课后习题答案统计数据的收集与整理

第一章统计数据的收集与整理算术平均数是怎样计算的为什么要计算平均数 答:算数平均数由下式计算:n y y n i i ∑ = =1 ,含义为将全部观测值相加再被观测值的个数 除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点,或是说是样本数据的代表。 既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。 标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同 答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。 完整地描述一组数据需要哪几个特征数 答:平均数、标准差、偏斜度和峭度。 下表是我国青年男子体重(kg)。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。 6 66 9 6 4 6 5 6 4 6 6 6 8 6 5 6 2 6 4 6 9 6 1 6 1 6 8 6 657 6 6 6 9 6 6 6 5 7064586766666766666266666462626564656672 6 06 6 6 5 6 1 6 1 6 6 6 7 6 2 6 5 6 5 6 1 6 4 6 2 6 4 6 5 6 2 6 5 6 8 6 8 6 5 6768626370656465626662636865685767666863 6 46 6 6 8 6 4 6 3 6 6 4 6 9 6 5 6 6 6 7 6 7 6 7 6 5 6 7 6 7 6 6 6 8 6 4 6 7 5 96 6 6 5 6 3 5 6 6 6 6 3 6 3 6 6 6 7 6 370 6 770 6 2 6 472 6 9 6 7 6 7 6 66 8 6 4 6 5 7 1 6 1 6 3 6 1 6 4 6 4 6 7 6 970 6 6 6 4 6 5 6 4 6 370 6 4 6 26 970 6 8 6 5 6 3 6 5 6 6 6 4 6 8 6 9 6 5 6 3 6 7 6 370 6 5 6 8 6 7 6 9 6 66 5 6 7 6 674 6 4 6 9 6 5 6 4 6 5 6 5 6 8 6 7 6 5 6 5 6 6 6 772 6 5 6 7 6 2677 1 6 9 6 5 6 5 7 5 6 2 6 9 6 8 6 8 6 5 6 3 6 6 6 6 6 5 6 2 6 1 6 8 6 5 6 4676 6 6 4 6 6 1 6 8 6 7 6 3 5 9 6 5 6 6 4 6 3 6 9 6 2 7 1 6 9 6 6 3 5 9676 1 6 8 6 9 6 6 6 4 6 9 6 5 6 8 6 7 6 4 6 4 6 6 6 9 7 3 6 8 6 6 6 3 366666666726666666666

生物统计学各章题目(含答案)

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现 代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变 量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). 12 2--∑∑n n x x )(

生物统计学(第四版)答案 1—6章

2.2试计算下列两个玉米品种10个果穗长度(cm)的标准差和变异系数,并解释所得结果。24号:19,21,20,20,18,19,22,21,21,19; 金皇后:16,21,24,15,26,18,20,19,22,19。 【答案】1=20,s1=1.247,CV1=6.235%;2=20,s2=3.400,CV2=17.0%。 2.3某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取50绳测其毛重(kg),结果分别如下: 单养50绳重量数据:45,45,33,53,36,45,42,43,29,25,47,50,43,49,36,30,39,44,35,38,46,51,42,38,51,45,41,51,50,47,44,43,46,55,42,27,42,35,46,53,32,41,4,50,51,46,41,34,44,46; 第三章概率与概率分布 3.3已知u服从标准正态分布N(0,1),试查表计算下列各小题的概率值: (1)P(0.3<u≤1.8);(2)P(-1<u≤1);(3)P(-2<u≤2);(4)P(-1.96<u≤1.96; (5)P(-2.58<u≤2.58)。 【答案】(1)0.34617;(2)0.6826;(3)0.9545;(4)0.95;(5)0.9901。 3.4设x服从正态分布N(4,16),试通过标准化变换后查表计算下列各题的概率值: (1)P(-3<x≤4);(2)P(x<2.44);(3)P(x>-1.5);(4)P(x≥-1)。 【答案】(1)0.4599;(2)0.3483;(3)0.9162;(4)0.8944。 3.5水稻糯和非糯为一对等位基因控制,糯稻纯合体为ww,非糯纯合体为WW,两个纯合亲本杂交后,其F1为非糯杂合体Ww。 (1)现以F1回交于糯稻亲本,在后代200株中试问预期有多少株为糯稻,多少株为非糯稻?试列出糯稻和非糯稻的概率; (2)当F1代自交,F2代性状分离,其中3/4为非糯,1/4为糯稻。假定F2代播种了2000株,试问糯稻株有多少?非糯株有多少? 课后答案网https://www.doczj.com/doc/039359251.html,1=42.7,R=30,s1=7.078,CV1=16.58%;2=52.1,R=30,s2=6.335,CV2=12.16%。 第四章统计推断 课后答案网https://www.doczj.com/doc/039359251.html,=0=21g,4.5接受HA:≠0;95%置信区间:(19.7648,20.2352)。 4.6核桃树枝条的常规含氮量为2.40%,现对一桃树新品种枝条的含氮量进行了10次测定,其结果为:2.38%、2.38%、2.41%、2.50%、2.47%、2.41%、2.38%、2.26%、2.32%、2.41%,试问该测定结果与常规枝条含氮量有无差别。 【答案】t=-0.371,接受H0:=0=2.40%。 4.7检查三化螟各世代每卵块的卵数,检查第一代128个卵块,其平均数为47.3粒,标准差为2 5.4粒;检查第二代69个卵块,其平均数为74.9粒,标准差为4 6.8粒。试检验两代每卵块的卵数有无显著差异。 【答案】u=-4.551,否定H0:1=2,接受HA:1≠2。 4.8假说:“北方动物比南方动物具有较短的附肢。”为验证这一假说,调查了如下鸟翅长(mm)资料:北方的:120,113,125,118,116,114,119;南方的:116,117,121,114,116,118,123,120。试检验这一假说。 【答案】t=-0.147,接受H0:1=2。 4.9用中草药青木香治疗高血压,记录了13个病例,所测定的舒张压(mmHg)数据如下:序

《生物统计学》习题集答案

《生物统计学》习题集答案 一、填空题: 1.统计假设测验中犯第一类错误就是正确得假设被否定。(附统计 假设测验中犯第二类错误就是错误得假设被肯定。) 2.有共同性质得个体所组成得集团称为总体。从总体中抽取部分个体 进行观测,用以估计总体得一般特性,这部分被观测得个体总称为样本。 3.由总体中包含得全部个体求得得能够反映总体性质得特征数称为参 数 ;由样本得全部观察值求得得用以估计总体参数得特征数叫统计数。 4.试验误差可以分为系统(片面)误差与偶然(随机)误差两种类型。 5.一般而言,在一定范围内,增加试验小区得面积,试验误差将会降低。 6.在试验中重复得主要作用就是估计试验误差与降低试验误差。 7.田间试验设计得基本原则就是重复、随机排列、局部控制。 8.田间试验可按试验因素得多少分为单因素试验与多因素试验。 9.样本平均数显著性测验接受或者否定假设得根据就是“小概率事件实际上 不可能发生”原理。 10.从总体中抽取得样本要具有代表性,必须就是随机抽取得样本。 11.从一个正态总体中随机抽取得样本平均数,理论上服从正态分布。 12.数据1、3、2、4、5、6、3、3得算术平均数就是 3、375 ,众数就 是 3 。 13.常用得变异程度(变异)指标有极差、方差、标准差、变 异系数。 14.小麦品种A每穗小穗数得平均数与标准差值为18与3(厘米),品种B为 30与4、5(厘米),根据CV A _(或A品种得变异系数)_ 大于_CV B(或B品种得变异系数),品种__A_____ 得该性状变异大于品种B___。 15.要比较单位不同或者单位相同但平均数大小相差较大得两个样本资料得 变异度宜采用变异系数。 16.试验资料按所研究得性状、特性可以分为质量性状资料与数量性状资料。 17.样本根据样本容量得多少可以分为小样本与大样本。

生物统计学试题及答案

一、填空 变量按其性质可以分为连续变量和非连续变量。 样本统计数是总体参数的估计量。 生物统计学是研究生命过程中以样本来推断总体的一门学科。 生物统计学的基本内容包括试验设计、统计分析两大部分。 统计学的发展过程经历了古典记录统计学、近代描述统计学、现代推断统计学3 个阶段。 生物学研究中,一般将样本容量n >30称为大样本。 试验误差可以分为随机误差、系统误差两类。 资料按生物的性状特征可分为数量性状资料变量和质量性状资料变量。 直方图适合于表示连续变量资料的次数分布。 变量的分布具有两个明显基本特征,即集中性和离散性。 反映变量集中性的特征数是平均数,反映变量离散性的特征数是变异数。 林星s= 样本标准差的计算公式s= 如果事件A和事件B为独立事件,则事件A与事件B同时发生地概率P (AB) = P(A)*P(B)。 二项分布的形状是由n和p两个参数决定的。 正态分布曲线上,卩确定曲线在x轴上的中心位置,c确定曲线的展开程度。样本平均数的标准误等于c Wi。 t分布曲线和正态分布曲线相比,顶部偏低,尾部偏高。

统计推断主要包括假设检验和参数估计两个方面。

参数估计包括点估计和区间估计假设检验首先要对总体提出假设,一般应作两个假设,一个是无效假设,一个是备择假设。 对一个大样本的平均数来说,一般将接受区和否定区的两个临界值写作卩-U a^x_ 卩+U a c x 在频率的假设检验中,当np或nq v30时,需进行连续性矫正。 2检验主要有3种用途:一个样本方差的同质性检验、适应性检验和独立性检验。 2检验中,在自由度df = (1)时,需要进行连续性矫正,其矫正的2 = ( p85 )。 2分布是连续型资料的分布,其取值区间为[0.+ %)。 猪的毛色受一对等位基因控制,检验两个纯合亲本的F2代性状分离比是否符合 孟德尔第一遗传规律应采用适应性检验法。 独立性检验的形式有多种,常利用列联表进行检验。 根据对处理效应的不同假定,方差分析中的数学模型可以分为固定模型、随机模型和混合模型混合模型3类。 在进行两因素或多因素试验时,通常应该设置重复,以正确估计试验误差,研究因素间的交互作用。 在方差分析中,对缺失数据进行弥补时,应使补上来数据后,误差平方和最小。方差分析必须满足正态性、可加性、方差同质性3个基本假定。 如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有平方根转换、对数转换、正反弦转换等。 相关系数的取值范围是[-1,1]O

生物统计学课后习题解答 李春喜

第一章概论 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。 第二章试验资料的整理与特征数的计算习题 某地 100 例 30 ~ 40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下: 计算平均数、标准差和变异系数。 【答案】=, s=, CV = % 试计算下列两个玉米品种 10 个果穗长度 (cm) 的标准差和变异系数,并解释所得结果。 24 号: 19 , 21 , 20 , 20 , 18 , 19 , 22 , 21 , 21 , 19 ; 金皇后: 16 , 21 , 24 , 15 , 26 , 18 , 20 , 19 , 22 , 19 。 【答案】 1 =20, s 1 =, CV 1 =% ; 2 =20, s 2 =, CV 2 =% 。 某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取 50 绳测其毛重 (kg) ,结果分别如下:

单养 50 绳重量数据: 45 , 45 , 33 , 53 , 36 , 45 , 42 , 43 , 29 , 25 ,47 , 50 , 43 , 49 , 36 , 30 , 39 , 44 , 35 , 38 , 46 , 51 , 42 ,38 , 51 , 45 , 41 , 51 , 50 , 47 , 44 , 43 , 46 , 55 , 42 , 27 ,42 , 35 , 46 , 53 , 32 , 41 , 48 , 50 , 51 , 46 , 41 , 34 , 44 ,46 ; 混养 50 绳重量数据: 51 , 48 , 58 , 42 , 55 , 48 , 48 , 54 , 39 , 58 ,50 , 54 , 53 , 44 , 45 , 50 , 51 , 57 , 43 , 67 , 48 , 44 , 58 ,57 , 46 , 57 , 50 , 48 , 41 , 62 , 51 , 58 , 48 , 53 , 47 , 57 ,51 , 53 , 48 , 64 , 52 , 59 , 55 , 57 , 48 , 69 , 52 , 54 , 53 ,50 。 试从平均数、极差、标准差、变异系数几个指标来评估单养与混养的效果,并给出分析结论。【答案】 1 =42 . 7, R=30, s 1 =7 . 078, CV 1 =16 . 58% ; 2 =,R=30 ,s 2 =, CV 2 =% 。 第三章概率与概率分布 解释下列概念:互斥事件、对立事件、独立事件、频率、概率频率如何转化为概率 什么是正态分布什么是标准正态分布正态分布曲线有什么特点μ和σ对正态分布曲线有何影响 已知 u 服从标准正态分布 N(0 , 1) ,试查表计算下列各小题的概率值: (1)P <u ≤ ; (2)P (-1 <u ≤ 1) ; (3)P (-2 <u ≤ 2) ; (4)P <u ≤ ; (5)P <u ≤ 。 【答案】 (1) ; (2) ; (3) ; (4) ; (5) 。 设 x 服从正态分布 N(4 , 16) ,试通过标准化变换后查表计算下列各题的概率值: (1)P(-3 <x ≤ 4) ; (2)P(x <; (3)P(x >;

生物统计学(版)杜荣骞课后习题答案统计数据的收集与整理

第一章统计数据的收集与整理 1.1算术平均数是怎样计算的?为什么要计算平均数? n y i y — 答:算数平均数由下式计算:n ,含义为将全部观测值相加再被观测值的个数 除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点,或是说是样本数据的代表。 1.2既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差? 答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。 1.3标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同? 答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所 得结果更可靠。 1.4完整地描述一组数据需要哪几个特征数? 答:平均数、标准差、偏斜度和峭度。 1.5下表是我国青年男子体重(kg)。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。 66 69 64 65 64 66 68 65 62 64 69 61 61 68 66 57 66 69 66 65 7 67 66 66 62 66 66 64 62 62 65 64 65 66 72 6 67 62 65 65 61 64 62 64 65 62 65 68 68 65 67 68 62 63 7 62 63 68 65 68 57 67 66 68 63 64 66 68 64 63 6 67 67 65 67 67 66 68 64 67 59 66 65 63 56 66 63 63 66 67 63 7 69 67 67 66 68 64 65 71 61 63 61 64 64 67 69 7 70 64 62 69 7 64 68 69 65 63 67 63 70 65 68 67 69 66 65 67 66 74 64 69 65 64 65 65 68 67 65 65 66 67 72 65 67 62 67 71 69 65 65 75 62 69 68 68 65 63 66 66 65 62 61 68 65 64 67 66 64 6 65 6 69 60 63 59 67 61 68 69 66 64 69 65 68 67 64 64 66 69 73 68 60 60 63 38 62 67 65 65 69 65 67 65 72 66 67 64 61 64 66 63 63 66 66 66 63 65 63 67 68 66 62 63 61 66 61 63 68 65 66 69 64 66 70 69 7 67 65 66 62 61 65 65 6 答:首先建立一个外部数据文件,名称和路径为:E:\data\exer1-5e.dat。所用的SAS程 序和计算结果如下: proc format; value hfmt 56-57='56-57' 58-59='58-59' 60-6仁'60-61' 62-63='62-63' 64-65='64-65' 66-67='66-67' 68-69='68-69' 70-71=70-71' 72-73=72-73' 74-75=74-75: run;

拟合优度检验及其应用

拟合优度检验及其应用 辅修专业:经济学 12级法学1班 201210141419 刘金锋摘要:数理统计的两个主要形式就是参数估计和假设检验,在这里,我 们只介绍后者——假设检验,其中又只对假设检验中的拟合优度检验假设作介绍。假设检验根据样本分布族的数学形式已知与否,可分为参数假设检验和非参数假设检验,作为非参数假设检验之一的拟合优度检验,又是检验理论分布假设的重要方法。为了帮助我们更好了解拟合优度检验,本文将首先给我们介绍拟合优度检验的数学定义。其次,重点介绍时下讨论最多的两种 拟合优度方法——2 Pearsonχ检验和Kolmogorov Smirnov -检验,并穿插具体实例解答来给我们直观的印象,帮助理解。最后,考虑到检验过程会很复杂,本文在最后一节讲述了这两种检验的软件实现,结合实例,编写运行程序。关键词:假设检验;非参数假设检验;拟合优度;2 Pearsonχ检验; -检验 Kolmogorov Smirno 内容安排 1.拟合优度检验的提出 2.几种常用拟合优度检验介绍 2.1.2 Pearsonχ检验 2.1.1.理论分布完全已知情况 1.随机变量X是离散型 2.理论分布为确定分布 2.1.2.理论分布带有未知参数 2.2.Kolmogorov Smirnov -检验 2.3.2 Pearsonχ检验与Kolmogorov Smirnov -检验的比较 3.拟合优度检验实例分析 4.拟合优度检验的软件实现 4.1.2 Pearsonχ检验的软件实现 4.2.Kolmogorov Smirnov -检验的软件实现 5.参考文献

1.拟合优度检验的提出[1] 假设检验问题就是通过从有关总体中抽取一定容量的样本,利用样本去检验总体分布是否具有某种特性。假设检验问题大致分为两大类: (1)参数型假设检验:即总体的分布形式已知(如正态、指数、二项分布等),总体分布依赖于未知参数(或参数向量)θ,要检验的是有关未知参数的假设。例如,总体X ~N (α,2б), α未知,检验 0010::H a a H a a =?≠ 或 0010::H a a H a a ≤?>. (2)非参数型假设检验:如果总体分布形式未知,此时就需要有一种与总体分布族的具体数学形式无关的统计方法,称为非参数方法。例如,检验一批数据是否来自某个已知的总体,就属于这类问题。 正如摘要所说,我们在本节只讨论非参数型假设检验问题,常用的非参数假设检验方法有:符号检验、符号秩和检验、秩和检验及Fisher 臵换检验和拟合优度检验。本文又只对拟合优度检验做深入介绍。 拟合优度检验问题的提法如下:设有一个一维或多维随机变量X ,令 1,,n X X …为总体X 中抽取的简单样本,F 是一已知的分布函数。要利用样本1,,n X X …检验假设 0:..H r v X 的分布为F , (1.1.1) 其中F 常称为理论分布。 导出这种假设检验的想法大致如下:设法提出一个反映实际数据1,,n X X …与理论分布F 偏差的量1(,,;)n D D X X F =…。如果D 较大,如D C ≥,则认为理论分布F 与数据1,,n X X …不符,因而否定0H 。然而这种“非此即彼”的提法常显得有点牵强。因为一般来说,理论和实际没有截然的符合或不符合。更恰当的提法是实际数据与理论分布符合的程度如何?因此通常对0H 的检验不是以“是”或“否”来回答,而是提供一个介于0和1之间的数字作为回答,即用此数作为符合程度的度量刻画。就具体样本算出D 之值,记为0d 。称下列的条件概率: 000()()p d P D d H =≥| 为在选定的偏离指标D 之下,样本与理论分布的拟合优度。0()p d 越接近1,表示样本与理论分布拟合的越好,因而原假设越可信。反之,它越接近0,则原假设0H 越不可信。如果它低到指定的水平α之下,则就要否定0H 了。

相关主题
文本预览
相关文档 最新文档