当前位置:文档之家› 生物统计学习题集2

生物统计学习题集2

生物统计学习题集2
生物统计学习题集2

生物统计学

习题集

生物统计学课程组编写

第一章概论

1.什么是生物统计学?生物统计学的主要内容和作用是什么?

2.解释并举例说明以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。

3.误差与错误有何区别?

4.田间试验有哪些特点?保证田间试验质量的基本要求有哪些?

第二章试验资料的整理与特征数的计算

1.试验指标试验因素因素水平试验处理试验小区总体样本样本容量随机样本总体准确性精确性

2.什么是次数分布表?什么是次数分布图?制表和绘图的基本步骤有那些?制表和绘图时应注意什么?

3.标准误与标准差有何联系与区别?

4.算术平均数与加权平均数形式上有何不同?为什么说他们的实质是一致的?

5.平均数与标准差在统计分析中有什么用处?他们各有哪些特征?

6.试验资料分为哪几类?各有何特点?

7.简述计量资料整理的步骤。

8.常用的统计表和统计图有哪些?

9.算术平均数有哪些基本性质?

10.总体和样本差的平均数、标准差有什么共同点?又有什么联系和区别?

11.在对果树品种调查研究中,经观测所得的干周、冠高、冠幅、新梢生长量、萌芽率、花数、果数、座果率、单果重、产量等一系列数量资料,哪些是连续性数量,哪些是非连续性数量?

12.某地100例30~40岁健康男子血清总胆固醇(mol·L-1)测定结果如下:

试根据所给资料编制次数分布表。

13.根据习题12的次数分布表,绘制直方图和多边形图,并简述其分布特征。

14.根据习题12的资料,计算平均数、标准差和变异系数。

15.根据习题12的资料,计算中位数,并与平均数进行比较。

16.试计算下列两个玉米品种10个果穗长度(cm)的标准差和变异系数,并解释所得结果。

24号:19,21,20,20,18,19,22,21,21,19

金皇后:16,21,24,15,26,18,20,19,22,19

第三章概率与概率分布

1.试解释必然事件、不可能事件、随机事件。并举出几个随机事件的例子。

2.什么是互斥事件?什么是对立事件?什么是独立事件?试举例说明。

3.什么是频率?什么是概率?频率如何转化为概率?

4.什么是正态分布?什么是标准正态分布?正态分布曲线有什么特点?μ和σ对正态分布曲线有何影响?

5.事件的概率具有哪些基本性质?

6.已知μ服从正态分布N(0,1),试查表计算下列各小题的概率值:

(1)P(0.3<μ≤1.8)=

(2)P(-1<μ≤1)=

(3)P(-2<μ≤2)=

(4)P(-1.96<μ≤1.96)=

(5)P(-2.58<μ≤2.58)=

7.设x服从正态分布N(4,16),试通过标准化变换后查表计算下列各题的概率值。

(1)P(-3<μ≤4)=

(2)P(x<2.44)=

(3)P(x>-1.5)=

(4)P(x≥-1)=

8.水稻糯和非糯为一对等位基因控制,糯稻纯合体为ww,非糯纯合体为WW,两个纯合亲本杂交后,其F1为非糯杂合体Ww。现以F1回交于糯稻亲本,在后代200株中试问预期有多少株为糯稻,多少株为非糯稻?试列出糯稻和非糯稻的概率。当F1代自交,F2代性状分离,其中3/4为非糯稻,1/4为糯稻。假定F2代播种了2000株,试问糯稻有多少株,非糯稻有多少株?

9.假设一批茌梨平均单果重225g,标准差为24g,试求单果重在180-260g间的概率有多少?

10.大麦的矮生抗锈基因和抗叶锈基因连锁,以矮生基因与正常感锈基因杂交,在F2代出现纯合正常抗锈植株的概率仅0.0036。试计算:

(1)在F2代种植200株时,正常抗锈植株的概率;

(2)若希望有0.99的概率保证获得1株以上纯合正常抗锈植株,则F2代至少应种多少株?

10.设以同性别、同年龄、同月龄的小白鼠接种某种病菌,假定接种后经过一段时间生存的概率为0.425,若5只一组进行随机抽样,试问其中“四生一死”的概率有多大?

11.有一正态分布的平均数为16,方差为4,试计算:

(1)落于10到20之间的数据的百分数;

(2)小于12或大于20的数据的百分数。

12.查表计算:

(1)df=5时,P(t≤-2.571)=?P(t>4.032)=?

(2)df=2时,P(x2≤0.05)=?P(x2>5.99)=?P(0.05<x2<7.38=?

(3)df1=3,df2=10时,P(F>3.71)=?,P(F>6.55)=?

14. 已知随机变量x~B(100,0.1),求x的总体平均数和标准差。

15. 已知随机变量x~B(10,0.6),求(1)P(2≤x≤6);(2)P(x≥7);(3)P(x<3)。

16. 某种植物在某地区种植,染病的概率为0.3,现在该区种植30株该种植物,试求以下概率:

(1)恰有6株染病的概率;

(2)前24株未染病的概率;

(3)未染病株数超过8株的概率。

17.已知随机变量u~N(0,1),求:P(u<-1.41),P(u≥1.49),P(∣u∣≥2.58),P(-1.21≤u<0.45);并作图表示。

18.已知随机变量u服从N(0,1)。求下列各式的uα:(1)P(u<-uα)+ P(u≥uα)=0.1;0.52;(2)P(-uα≤u <uα)=0.42;0.95

19.设x~N(10,2σ),P(x≥12)=0.1056,试求x在区间[6,16]内取值的概率。

第四章统计推断

1.显著性检验的基本步骤是什么?根据什么确定显著水平?

2.何谓显著性检验?显著性检验时,提出无效假设的目的是什么?并说明差异显著性测验的基本方法。

3.什么是统计推断?为什么统计推断的结论有可能发生错误?有哪两类错误?如何降低犯两类错误的概率?

4.两尾检验、一尾检验各在什么条件下应用?二者有何关系?

5.进行显著性检验应注意什么问题?如何理解显著性检验结论中的“差异不显著”、“差异显著”、“差异极显著”?

6.什么是小概率原理?它在假设检验中有何作用?

7.什么叫区间估计?什么叫点估计?置信度与区间估计有什么关系?

8.桃树枝条的常规含氮量为2.40%,现对一桃树新品种枝条的含氮量进行了10次测定,其结果为:2.38%、2.38%、2.41%、2.50%、2.47%、2.41%、2.38%、2.26%、2.32%、2.41%,试问该测定结果与常规枝条含氮量有无差别。

9.检验三化螟各世代每卵块的卵数,检查第一代128个卵块,其平均数为47.3粒,标准差为25.4粒;检查第二代69个卵块,其平均数为74.9粒,标准差为46.8粒。试检验两代每卵块的卵数有无显著差异。

10. 测定A、B两种病毒对烟草的致病力,取8株烟草,每一株皆半叶接种A病毒,另半叶接种B病毒,以叶面出现枯斑病的多少作为致病力强弱的指标,得结果如下:

试检验两种病毒的致病力是否有显著差异。

11.有一批棉花种子,规定发芽率p>80%为合格,现随机抽取100粒进行发芽试验,有77粒发芽,试估计:(1)该批棉花种子是否合格?(2)该批棉花种子发芽率所属总体的95%置信区间。

12.工艺上要求棉纤维的断裂度为5.5g,现对一新品系的断裂强度测定8次,得结果为:5.5,4.4,4.9,5.4,5.3,5.3,5.6,5.1(g)。问此新品系的断裂度是否符合工艺要求?试用符号检验法进行检验。

13.测定两个马铃薯品种的淀粉含量(%)各5次,得A品种为:12.6,12.4,11.9,12.8,13.0;B品种为:13.4,13.1,13.5,12.7,13.6。试用秩和检验法检验两种淀粉含量的差异显著性。

x9.36 m,样本标准差S=1.36 m。以95%的置信度计

14.随机抽测5年生的杂交杨树50株,得平均树高=

算这批杨树高度的置信区间。

15.试验1000粒大豆种子,有620粒发芽,求发芽率在95%置信度下的置信区间。

16.下表为两个荔枝品种的平均果重,问此二品种单果平均重有无显著差异?

17. 下表为随机抽取的富士和红富士苹果果实各11个的果肉硬度(磅/ cm2),问两品种的果肉硬度有无显著差异?

18.下表是红星苹果树分别喷以B9和清水(对照)后各10株的新梢生长量(cm),问喷射B9对红星苹果新梢生长

有无显著的抑制作用?

19. 规定某种果汁中的V C 含量不得低于20g/L 。现对某批产品随机抽取10个样品进行检测,得VC 含量平均数

=x 19g/L ,样本标准差S =3.69 g/L ,问这批产品合格吗?

20. 现测得某品种玉米自交一代35穗每穗粒重的平均数=1x 356.8g ,样本标准差1S =19.3g ;自交二代30穗每穗

粒重的平均数=2

x 338.9g ,样本标准差2S =20.1g 。问该品种玉米自交一代与自交二代每穗粒重差异是否显著?

21. 在前茬作物喷洒过含有机砷杀虫剂的麦田中随机采取14株植株测定砷的残留量,得=1x 7.6mg ,21S =2.17;

又在前茬作物从未喷洒过含有机砷杀虫剂的麦田中随机采取13株植株测定砷的残留量,得=2x 5.3mg , 2

2S =2.26。

问在前茬作物喷洒过含有机砷杀虫剂后,是否会使后作植物体内的砷残留量显著提高?

22. 用两种电极测定同一土壤10个样品的pH 值,结果如下。试问两者有无差异?

A 电极

5

.78

5

.74

5

.84

5.80

5

.80

5

.79

5

.82

5.8

1

5.8

5

5.78 B 电极

5

.82

5

.87 5

.96 5.89 5

.90 5

.81 5

.83 5.8

6 5.9

0 5.8

23. 对小麦两品种作吸浆虫抗性试验,甲品种检查590粒,受害132粒;乙品种检查710粒,受害203粒。问这两个品种的抗性是否有显著差异?

第五章 x 2

检验 1. 什么是x 2检验?什么情况下使用x 2检验? 2. x 2检验的主要步骤有哪些?什么情况下需要矫正?

3.

有一大麦杂交组合,F2代的芒性状表现有钩芒、长芒和短芒三种,观察计得其株数依次为348,115,157。试

检验其比例是否符合9:3:4的理论计算。

4.

某仓库调查不同品种苹果的耐储情况,随机抽取“国光”苹果200个,腐烂14个,“红星”苹果178个,腐烂

16个,试测验这两种苹果耐储差异是否显著?

5.

5个小麦品种感染赤霉病的情况如下表。试分析不同品种是否与赤霉病的发生关系。

6. 调查了三种灌溉方式下水稻叶片衰老资料如下表。试检验灌溉方式与叶片衰老的关系。

7. 对紫茉莉花色进行遗传研究,以红花亲本(RR )和白花亲本(rr )杂交,F 1(Rr )的花色不是红色,而是粉红

色。F 2群体有3种表现型,共观察833株,其中红花196株,粉红花419株,白花218株。试检验其分离比例是否符合1:2:1的理论比例?

8.

在玉米杂交试验中,用种子紫色甜质与种子白色粉质进行杂交,在F 2得4种表现型:紫色粉质921粒,紫色

甜质312粒,白色粉质279粒,白色甜质104粒。试检验其分离比例是否符合9:3:3:1的理论比例(即这两对性状是否独立遗传)?

9.

某仓库调查不同品种苹果的耐贮情况,随机抽取国光苹果400个,其中完好372个,腐烂28个;随机抽取红

星苹果356个,其中完好324个,腐烂32个,试检验这两种苹果耐贮性差异是否显著?

10.

树冠开张度大的桃与直立性桃杂交,所得F 1进行自交,培育出F

2杂种实生苗128株。其中开张度大的36株,

直立的29株,半开张的63株,问桃树冠开张度遗传是否受一对不完全显性基因控制,符合1:2:1的分离规律?

11.

华南农学院1956年对该院树势不同的5年生暗柳橙的座果情况进行了调查,强、中、弱树各调查2株,结果如下,问树势强弱对座果有无影响?

12. 下表内数值为调查不同树龄、不同栽植密度的梨品种湘南的平均亩产量(kg ),问单位面积产量是否受栽植密度的显著影响?

13、研究1418个小麦品种的原产地和抗寒能力的关系,得结果于下表。试分析小麦品种抗寒性与原产地是否有关。 原产地 抗寒性 总和 极强 强 中和弱 河北 190 241 107 538 山东 37 213 239 489 山西 79 157 155 391 总和

306

611

501

1418

第六章 方差分析 1. 多个处理平均数间的相互比较为什么不宜用t 检验法?方差分析的基本假定是什么?

2.进行方差分析的基本步骤为何?

3.两因素系统分组资料的方差分析与交叉分组资料的方差分析有何区别?

4.为什么要作数据转换? 常用的数据转换方法有哪几种? 各在什么条件下应用?

5.(2检验与t检验、F检验在应用上有什么区别?

6.适合性检验和独立性检验有何区别?

7.什么是方差分析?方差分析的基本思想是什么?进行方差分析一般有哪些步骤?

8.什么是多重比较?多重比较有哪些方法?多重比较的结果如何表示?

9.为研究氟对种子发芽的影响,分别用0μg.g-1(对照)、10μg.g-1、50μg.g-1、100μg.g-14种浓度的氟化钠溶液处理种子(浸种),每浓度处理种子进行发芽试验(每盆50粒,每次处理重复三次),测得芽长如下。试作方差分析,并用LSD法和q法分别进行多重比较。

10. 用同一公猪对三头母猪进行配种试验,所产各头仔猪断奶时的体重(kg)资料如下:

No.1:24.0,22.5,24.0,20.0,22.0,23.0,22.0,22.5;

No.2:19.0,19.5,20.0,23.5,19.0,21.0,16.5;

No.3:16.0,16.0,15.5,20.5,14.0,17.5,14.5,15.5,19.0。

试分析母猪对仔猪体重效应的差异显著性。

11. 对A、B、C、D、E等5个杂优水稻品种的干物质积累过程进行了系统的测定,每次每品种随机取两个样点,结果如下表。试做方差分析,并用LSD法进行多重比较。

12. 4个品种的家兔,每一种用兔7只,测定其不同室温下血糖值,以每100mg血中含葡萄糖的毫克数表示,问各种家兔正常血糖值间有无差异?室温对家兔的血糖值有无影响?试验资料见下表。

13. 为了从三种不同发酵温度中选出最适宜的条件,设计了一个二因素试验,并得到结果如下表所示,请对该资料进行方差分析。

14. 在药物处理大豆种子试验中,使用了大、中、小粒三种类型种子,分别用五种浓度、两种处理时间进行试验处理,播种后45d对每种处理各取两个样本,每个样本取10株测定其干物重(g),求其平均数,结果如下表。试进行方差分析。

15. 下表为4个小麦品种的黑穗病率。试检验各品种黑穗病率差异是否显著。(提示:先作反正弦转换,然后进行方差分析)

黑穗病率(﹪)

A

.8

3.8

0.

6.

1

.7

B 4.0

1.9 0.7

3.

5

3.2 C 9.8

56.

2

66.0

10

.3 9.2 D

6.0

79.

8 7.0

84

.6 2

.8

16. 对5个杂交水稻品种的干物质累计过程进行系统测定,每次测定随机取2个样点,每个样点取5株。测定结果如下,试作方差分析。

各品种在各样点的干物质重量(g/株)

品种A

样点

B

干物质重量

ijl x

1A

1 7.8 8.9

9.

2

11

.4

10

.5

2 12.1

10.6 8.

7

9.

9

10.1

2

A

3 7.

4 8.8

8.

9

7.

8

9.

8

4 6.2 6.6

5.

3

7.

5

8.

1

3A

5

12.6

10

.2

11

.4

11

.8

12

.1

6 15.2

15

.1

12

.3

12

.5

12

.9

4

A

7 5.8 4.7

6.

6

7.

4

7.

9

8 6.4 6.8

8.

1

7.

2

7.

9

5A

9

13.8

15

.1

13

.4

12

.6

16

.6

10

11.7

17

.2 15

.6

15

.1

15

.8

17、有一青饲玉米比较试验,供试品种为A 、B 、C 、D 4个,重复3次、随机区组设计,小区计产面积为20m 2, 田间排列和小区生物学产量(kg )如下图,试作方差分析。

I II II

I

18、A 、B 、C 、D 、E 5个棉花品种比较试验,其中E 为对照,采用5 5的拉丁方设计,小区计产面积100m 2,其田间排列和皮棉产量(kg/100m 2)如下图,试作方差分析。

19、有一玉米种植密度和施肥量试验,裂区设计,以施肥量作主区因素A ,有A 1、A 2、A 3 3个水平,密度为副区因素B ,有B 1、B 2、B 3 3个水平。其田间排列图及小区产量(kg )如下图,试作方差分析。

Ⅱ A

A A A

A A

Ⅳ A A A

A A A

20.用三种方法贮藏种子,已知贮藏前该批种子的含水量无显著差异,经过贮藏一定时期后,由三种贮藏方法各抽出5份种子,求出含水率如下表,试进行方差分析。

第七章 抽样原理与方法 1. 什么是抽样调查?抽样调查有什么意义?

2. 抽样调查有哪些基本方法?试比较其优缺点及适用对象。

3.

在某地区进行仔猪断奶体重的调查,所得x =8.78kg ,s=3.3kg ,试问对这样一个性状制订抽样调查方案,它的

样本容量以多少头为宜(95%的允许误差L 不超过0.5kg )?

4.

为研究某地区鸡的球虫感染率,预测感病率为15%,希望调查的感染率与该地区普查的感染率相差不超过3%,

且置信概率为95%,问应调查多少只鸡才能达到目的?

5. 某单位进行增加人工光照提高母鸡产蛋量试验。根据以往试验知道,差数标准差sd 为3.65枚。希望本次试验

结果的平均差数d 在3枚以内,能有95%的可靠度测出差异显著性,问需要多少对试验鸡?

6.

比较两种饲料配方对鲤鱼增重的影响。根据以往试验增重的s 2为4kg 2,要求有95%的把握使两组增重差值在

1.5kg 内能测出差异显著性,问每组试验需要多少尾鱼?

7.

从一批平菇中随机抽出10株,其单株鲜重x =464.8g ,s=46.59g ,试在95%的置信概率下估计出这批平菇平均

单株鲜重的置信区间。

第八章 试验设计及其统计分析 1. 为何试验设计?生物学试验的基本要求是什么? 2. 试解释什么是处理、处理效应、主效应、互作? 3. 什么是试验误差?随机误差与系统误差有何区别? 4. 田间试验误差有哪些主要来源及相应的控制途径? 5. 控制土壤差异的小区技术包括哪些内容?各措施有何作用? 6. 试验设计的基本原理和作用是什么?

7. 本章讲述的常用试验设计有哪几种?这些方法各适宜在什么情况下使用? 8. 田间试验设计的基本原则及其作用为何?

9. 取样测定有何意义?如何决定样本的容量,才能使取样具有代表性?

10.

下表为某一大豆品种比较试验的产量结果(kg ),小区面积为100m 2,采用对比法设计,试作统计分析。

11. 下表为某养殖场使用四种不同饲料喂猪的增重结果(kg )。试作统计分析,比较饲料间的增重效果。

12. 为了研究湿度和温度对黏虫卵发育历期的影响,用3种湿度4种温度处理黏虫卵,采用随机区组设计,重复4次,结果如下表,试进行方差分析。

13. 有5个油菜品种A、B、C、D、E(其中E为对照)进行品种比较试验,重复3次,随机区组设计,试绘制田间排列图。

14. 拟对4个水稻品种(副区因素)进行3种密度(主区因素)的栽培试验,重复3次,裂区设计,试绘制田间排列图。

第九章直线回归与相关分析

1.回归截距、回归系数与回归估计值y?的统计意义是什么?

2.决定系数、相关系数的意义是什么?如何计算?

3.直线相关系数与回归系数的关系如何?直线相关系数与配合回归直线有何关系?

4.如何建立多元线性回归方程?偏回归系数有何意义?

5.多元线性回归的显著性检验包含哪些内容?如何进行?

6.在多元线性回归分析中,如何剔除不显著的自变量?怎样重新建立多元线性回归方程?

7.什么叫回归分析?回归截距和回归系数的统计意义是什么?

8.直线回归中总变异可分解为哪几部分?每一部分的平方和如何计算?

9.什么叫相关分析?相关系数和决定系数各具有什么意义?

10.下表是某地区4月下旬平均气温与5月上旬50株棉苗蚜虫头数的资料。

(1)建立直线回归方程;

(2)对回归系数作假设检验;

(3)该地区4月下旬均温180C 时,5月上旬50株棉苗蚜虫预期为多少头?若该地某年4月下旬均温为180C 时呢? 11.研究某种有机氯的用量(x ,kg .hm -2)和施用于小麦后在籽粒中的残留量(y ,mg .kg -1)的关系,每一用量测定三个样本,其结果列于下表。

(1)由15对(x ,y )求解直线回归方程和相关系数; (2)由5对(x ,y )求解直线回归方程和相关系数。

12. 在研究代乳粉营养价值时,用大白鼠作实验,得大白鼠进食量(x ,g )和体重增加量(y ,g )数据如下表。

(1)试用直线回归方程描述其关系;

(2)根据以上计算结果,求其回归系数的95%置信区间,绘制直线回归图形并图示回归系数的95%置信区间; (

3)试估计进食量为900g 时,大白鼠的体重平均增加多少,计算其95%置信区间,并说明含义; (4)求进食时为900g 时,单个y 的95%预测区间,并解释其意义。

13.用白菜16棵,将每棵纵剖两半,一半受冻,一半未受冻,测定其维生素C 含量(单位:mg.g -1)结果如下表。试计算相关系数和决定系数,检验相关显著性,并计算相关系数95%置信区间。

14、 研究某种有机氯农药的用量(x ,kg/666.7㎡)和施用于小麦后在籽粒中的残留量(y ,10-1mg/kg )的关系,

15、下表为测定得到的不同浓度鱼藤酮(x ,mg·L -1)对菊蚜死亡率(y ,%)影响的资料。试作回归分析。(提示:

先对

y 作反正弦转换,即y '=,再对y '与x 进行直线回归分析)

16、测得不同浓度的葡萄糖(x,单位:mg/L)在某光电比色计上的消光度(y)如下表,试计算:

(1)直线回归方程y?=a+bx,并作图;

(2)对该回归关系作假设测验;

(3)测得某样品的消光度为0.60,试计算该样品的葡萄糖浓度。

17.测定二年生苹果杂种实生苗12株的干径(x,单位:cm)和总生长量(y,单位:m)如下表,试计算

(1)干径和总生长量的相关系数;

(2)直线回归方程。

18.在苹果大树高产稳产指标的调查研究中,测定7个国光苹果园片的枝量(x,单位:万个/亩)和叶面积(y,单位:m2/亩)如下表,试计算:

(1)直线回归方程y?=a+bx;

(2)对该回归关系作假设测验;

(3)当枝量为25万个/亩时,叶面积的可取值范围?

19. 测定了8个茌梨成龄园地的枝量(x,单位:万个/亩)和产量(y,单位:500kg/亩)如下表,试计算其相关系数,并用查表法对相关系数进行显著性测验。

模拟试题一

一、名词解释(2×10=20分)

1、标准差

2、样本

3、置信区间

4、唯一差异原则

5、相关系数

6、单尾测验

7、接受区

8、无偏估值

9、乘积和

10、偏相关

二、是非题,请在下列正确的题目后面打“√”,错误的打“×”。(2×5)

1、描述总体的特征数叫统计数。()

2、假设测验中不是犯α错误就是犯β错误。()

3、调和平均数是变量倒数的算术平均数的反倒数。()

4、t分布和F分布均是左偏的。()

5、一个不显著的相关或回归不一定说明X和Y没有关系。()

三、单项选择题(2×10)

1、单个平均数的假设测验用[ ]测验。

A 、u

B 、t

C 、u 或t

D 、F

2、算术平均数的重要特性之一是离均差平方和[ ]。 A 、最小 B 、最大 C 、等于零 D 、接近零

3、在一个平均数和方差均为10的正态总体中以样本容量10进行抽样,其样本平均数服从[ ]分布。 A. N(10, 1) B. N(0, 10) C. N(0, 1) D. N(0, 20)

4、在一元线性回归分析中,

()()?X

x Y Y

?-=[ ]。 A 、0 B 、SP C 、U D 、Q

5、二项概率的正态近似应用连续性矫正常数“0.5”,其正态标准离差的表达式中,错误的是[ ] A 、0.5

c

Y u μσ

--=

B 、0.5c

Y u μ

σ

-=

±

C 、()0.5

c

Y u μσ

-=

D 、0.5

c

Y np u -=

6、F 测验保护的最小显著差数法又可记为[ ]。

A 、LSD 法

B 、PLSD 法

C 、SSR 法

D 、DLSD

7、正态分布不具有下列[ ]之特征。

A 、左右对称

B 、单峰分布

C 、中间高、两头低

D 、概率处处相等

8、测验偏回归系数的显著性时,()/i

i i b t

b s β=-遵循[ ]的学生氏分布。

A 、ν=n-1

B 、ν=n-2

C 、ν=n-m-1

D 、ν=n

9、对一批水稻种子做发芽试验,抽样100粒,得发芽种子87粒,若规定发芽率达90%为合格,这批种子是否合格?[ ]。

A 、不显著

B 、显著

C 、极显著

D 、不好确定

10、两个样本方差的差异显著性一般用[ ]测验。

A 、t

B 、F

C 、u

D 、2

测验

四、填空(2×5) 1、已知2~(,)Y

N m s ,则Y

在区间[ 1.96, 1.96m s m s

-+]的概率 。

2、田间试验设计的三大原则是 。

3、以7月5日为0,二代三化螟蛾日发生量遵循N(9, 25),则该螟蛾发生从始盛到盛末的时间区间为 。

4、 已知某一棉花品种的纤维长度(毫米)为一N (28.8,2.25)的总体。若以n=4抽样,要在a =0.05水平上否定若H0:μ≥28.8,则其否定区为 。

5、一批玉米种子的发芽率p =0.7,若希望有0.99的概率保证每穴至少出一苗,每穴至少应播 粒。 五、简答(5×2)

1、 根据所学内容简述统计方法的主要功用。

2、 什么是成对比较?简述其基本步骤。 六、计算

1、为了研究粒肥的增重效果,随机取6个样点喷施粒肥,得喷施后各样点小麦千粒重(克)为:37,47,50,49,49,48;另随机取同样条件下种植但未喷施粒肥的5个样点,得各样点小麦千粒重为:35,40,38,39,47。试测验粒肥效果的显著性。(8分)

2、有一密度(分A 1和A 2两个水平)和施肥时期(分B 1和B 2两个水平)的二因素试验,重复6次。 (1)试按随机区组设计画出田间设计图。 (2)已知554,20,504,384,96T R t A B SS SS SS SS SS =====,按随机区组设计列出方差分析表,并

解释所得结果。

(3)已知四个处理11A B 、12A B 、21A B 和22A B 的平均数依次为30、28、24、18,试用PLSD 法对不同处理进

行多重比较。(12分)

3、研究温度(X, ?C )与某一昆虫幼虫生长速率(Y )的关系,得6个一级统计数分别为:

77772

21

1

1

1

7,180,

4840,22,

85.12,i i

i i i i i i n X X Y Y =========邋邋

7

1

622.3i i i X Y ==?

试求:(1)bX a Y

+=?。

(2)Q 和U 。 (3)s Y/X 。 (4)r 和2

r 。

(5)测验该线性方程的显著性。(10分) 附注:

0.05,50.01,50.05,90.01,90.05,150.01,152.571, 4.032, 2.262,3.250, 2.131, 2.947,

t t t t t t ======

0.05,1,50.01,1,50.05,3,150.01,3,150.05,1,150.01,1,156.60,16.26, 3.29,5.42, 4.54,8.68

F F F F F F ======

模拟试题二

一、名词解释(10×2)。 1、参数

2、连续性变数

3、唯一差异原则

4、两尾测验

5、显著水平

6、互斥事件

7、无偏估值

8、相关系数

9、否定区

10、偏回归系数

二、是非题(以√表示正确,以×表示错误;5×1)。

1、二项分布的平均数为np ( )

2、在二因素完全随机化设计试验结果的方差分析中,误差项自由度为(1)(1)n ab --。( )

3、2

χ分布是随自由度变化的一簇曲线,任一曲线皆是间断的,可用于次数资料的假设测验。( )

4、一个显著的相关系数或回归系数说明X 和Y 变数的关系必为线性关系。( )

5、在一组变量中,出现频率最多的观察值,称为中位数。( )

三、选择题(10×2)

1、算术平均数的重要特征之一是离均差之和( )。 A 、最小 B 、最大 C 、等于零 D 、接近零

2、一批种子的发芽率为75%,每穴播5粒,出苗数为4的概率( )。 A 、0.3955 B 、0.0146 C 、0.3087 D 、0.1681

3、回归截距a 的标准误a s 等于( )。

A 、

X

SS n Q

)2(- B 、

X X

Y

SS x X n S 2)(1-+

C 、X

X

Y

SS x X n S 2)(11-++ D 、

X

X

Y

SS x n S 21+

4、从N(10, 80)总体中分别以1210n n ==进行随机抽样,得128y y ->的概率约为( )。

A. 0.10

B. 0.05

C. 0.025

D. 0.01

5、成对比较的特点不包括( )。

A 、加强了试验控制

B 、可减小误差

C 、不受总体方差是否相等的干扰

D 、误差方差自由度大

6、方差分析基本假定中除可加性、正态性外,尚有( )假定。 A 、无偏性 B 、无互作 C 、同质性 D 、重演性

《生物统计学》习题集答案

《生物统计学》习题集答案 一、填空题: 1.统计假设测验中犯第一类错误是正确的假设被否定。(附统计假设测验中犯第二类错误是 错误的假设被肯定。) 2.有共同性质的个体所组成的集团称为总体。从总体中抽取部分个体进行观测,用以估计 总体的一般特性,这部分被观测的个体总称为样本。 3.由总体中包含的全部个体求得的能够反映总体性质的特征数称为参数;由样本的全部观 察值求得的用以估计总体参数的特征数叫统计数。 4.试验误差可以分为系统(片面)误差和偶然(随机)误差两种类型。 5.一般而言,在一定范围内,增加试验小区的面积,试验误差将会降低。 6.在试验中重复的主要作用是估计试验误差和降低试验误差。 7.田间试验设计的基本原则是重复、随机排列、局部控制。 8.田间试验可按试验因素的多少分为单因素试验和多因素试验。 9.样本平均数显着性测验接受或者否定假设的根据是“小概率事件实际上不可能发生”原 理。 10.从总体中抽取的样本要具有代表性,必须是随机抽取的样本。 11.从一个正态总体中随机抽取的样本平均数,理论上服从正态分布。 12.数据1、3、2、4、5、6、3、3的算术平均数是3.375,众数是3。 13.常用的变异程度(变异)指标有极差、方差、标准差、变异系数。 14.小麦品种A每穗小穗数的平均数和标准差值为18和3(厘米),品种B为30和4.5 (厘米),根据CV A_(或A品种的变异系数)_大于_CV B(或B品种的变异系数),品种__A_____的该性状变异大于品种B___。 15.要比较单位不同或者单位相同但平均数大小相差较大的两个样本资料的变异度宜采用 变异系数。 16.试验资料按所研究的性状、特性可以分为质量性状资料和数量性状资料。 17.样本根据样本容量的多少可以分为小样本和大样本。 18.二项总体是非此即彼的两项构成的总体,此事件以变量“1”表示,彼事件以变量“0” 表示,也可以称为0,1总体。 19.标准正态分布是参数?=0__,_?2_=1_的一个特定正态分布,记作N(0,1)。

生物统计学 实验报告 大肠杆菌

A 题 细胞体内代谢物浓度预测 随着基因组、转录组、蛋白质组等各种“组学”研究计划的蓬勃开展,生命科学进入了“组学”时代。代谢组学作为系统生物学的重要分支,其研究的重点是细胞内代谢物种类与浓度的定性和定量分析以及代谢网络的构建和模拟。 对代谢物的检测及浓度测定主要采用实验方法,包括核磁共振、气相色谱-质谱联用和液相色谱-质谱联用等技术。但由于代谢物种类繁多,且大部分浓度较低(μM 数量级),尤其是胞内代谢物提取难度非常大,精确测定其浓度异常困难,而且实验测定需要消耗大量财力物力和人力,因此通过计算机方法对代谢物浓度预测和分析变得越来越重要。 活细胞的代谢物浓度由什么决定?除了一些特定的代谢和酶的作用以外,有没有那种能全局影响浓度值的性质? 试根据附件中的数据完成如下问题: 1 根据不同类型的数据,分析代谢物浓度与其物理化学性质之间的关系。 2 筛选合适的物理化学性质,建立预测代谢物浓度的预测模型,并对此模型进行评价; 1.线性插补法处理缺失数据 原理:用该列数据缺失值前一个数据和后一个数据建立线性插值,然后用缺失点在线性插值函数的函数值填充该缺失值,即: 在于消除不同变量的量纲的影响,而且标准化转化不会改变变量的相关系数。 代谢物浓度:取对数 代谢物理化性质:标准差标准化法 )1,1( m j n i S x x x j j ij ij ≤≤≤≤-=' 式中:.)(11,1121∑∑==--= =n i j ij j n i ij j x x n S x n x 3.SAS 软件建立多元线性回归方程 回归模型一般形式: u X b X b X b b Y k k +++++= (22110)

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

生物统计学试题及答案

生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() x N(0,1)B.11 - x ~N(0,1)C.91 - x ~N(0,1)D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为 ( )。 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 12. 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F 14. 15.已知随机变量x服从N (8,4),P(x < 4.71)(填数字) 四.综合分析题(共60分)

生物统计学实验指导

《生物统计学》实验教学教案 [实验项目] 实验一平均数标准差及有关概率的计算 [教学时数] 2课时。 [实验目的与要求] 1、通过对平均数、标准差、中位数、众数等数据的计算,掌握使用计算机计算统计量的方法。 2、通过对正态分布、标准正态分布、二项分布、波松分布的学习,掌握使用计算机计算有关概率和分位数的方法。为统计推断打下基础。 [实验材料与设备] 计算器、计算机;有关数据资料。 [实验内容] 1、平均数、标准差、中位数、众数等数据的计算。 2、正态分布、标准正态分布有关概率和分位数的计算。 3、二项分布有关概率和分位数的计算。 4、波松分布有关概率和分位数的计算。 [实验方法] 1、平均数、标准差、中位数、众数等数据的计算公式。 平均数=Average(x1x2…x n) 几何平均数=Geomean(x1x2…x n) 调和平均数=Harmean(x1x2…x n) 中位数=median(x1x2…x n) 众数=Mode(x1x2…x n) 最大值=Max(x1x2…x n) 最小值=Min(x1x2…x n) 平方和(Σ(x- )2)=Devsq(x1x2…x n) x 样本方差=Var (x1x2…x n) 样本标准差=Stdev(x1x2…x n) 总体方差=Varp(x1x2…x n) 总体标准差=Stdevp(x1x2…x n) 2、正态分布、标准正态分布有关概率和分位数的计算。 一般正态分布概率、分位数计算:

概率=Normdist(x,μ,σ,c) c 取1时计算 -∞-x 的概率 c 取0时计算 x 的概率 分位数=Norminv(p, μ, σ) p 取-∞到分位数的概率 练习: 猪血红蛋白含量x 服从正态分布N(12.86,1.332),(1) 求猪血红蛋白含量x 在11.53—14.19范围内的概率。(0.6826)(2) 若P(x <1l )=0.025,P(x >2l )=0.025,求1l ,2l 。 (10.25325) L1=10.25 L2=15.47 标准正态分布概率、分位数计算: 概率=Normsdist(x) c 取1时计算 -∞--x 的概率 c 取0时计算 x 的概率 分位数=Normsinv(p) p 取-∞到分位数的概率 练习: 1、已知随机变量u 服从N(0,1),求P(u <-1.4), P(u ≥1.49), P (|u |≥2.58), P(-1.21≤u <0.45),并作图示意。 参考答案: (0.080757,0.06811,0.00988,0.5605) 2、已知随机变量u 服从N(0,1),求下列各式的αu 。 (1) P(u <-αu )+P(u ≥αu )=0.1; 0.52 (2) P(-αu ≤u <αu )=0.42; 0.95 参考答案: [1.644854, 0.63345; 0.553385, 1.959964] 3、二项分布有关概率和分位数的计算。 概率=Binomdist(x,n,p,c) c 取1时计算 0-x 的概率 c 取0时计算 x 的概率 练习: 1、已知随机变量x 服从二项分布B (100,0.1),求μ及σ。 参考答案: 见P48,μ= np, σ=(npq)0.5 2、已知随机变量x 服从二项分布B(10,0.6),求P(2≤x ≤6),P(x ≥7),P(x<3)。 参考答案: 0.6054, 0.38228, 0.012295 4、波松分布有关概率和分位数的计算。 概率=Poisson(x,λ,c) c 取1时计算 0-x 的概率 c 取0时计算 x 的概率 练习: ),(m n Permut C m n =

生物统计学复习题及答案

《生物统计学》复习题 一、填空题(每空1分,共10分) 1 ?变量之间的相关关系主要有两大类: (因果关系),(平行关系) 2 ?在统计学中,常见平均数主要有( 算术平均数)、(几何平均数)、(调和平均数) S 、:'(X 迁 3 ?样本标准差的计算公式( 1 n 1 ) 4 ?小概率事件原理是指( 某事件发生的概率很小,人为的认为不会发生 ) 5. 在标准正态分布中, P (- K u w 1) = (0。6826 ) (已知随机变量1的临界值为0. 1587) 6. 在分析变量之间的关系时, 一个变量X 确定,Y 是随着X 变化而变化,两变量呈因果关系, 则X 称为(自 变量),Y 称为(依变量) 二、单项选择题(每小题 1分,共20分) 1、 ________________________________ 下列数值属于参数的是: A 、总体平均数 B 、自变量 C 依变量 D 、样本平均数 2、 下面一组数据中属于计量资料的是 _____________ A 、产品合格数 B 、抽样的样品数 C 病人的治愈数 D 、产品的合格率 3、 在一组数据中,如果一个变数 10的离均差是2,那么该组数据的平均数是 _________ 4、 变异系数是衡量样本资料 _________ 程度的一个统计量。 ___________ A 、变异 B 、同一 C 集中 D 、分布 5、 方差分析适合于, ____________ 数据资料的均数假设检验。 A 、两组以上 B 、两组 C 一组 D 、任何 8、平均数是反映数据资料 _________ 性的代表值。 A 、变异性 B 、集中性 C 差异性 D 、独立性 9、在假设检验中,是以 ___________ 为前提。 A 肯定假设 B 、备择假设 C 原假设 10、抽取样本的基本首要原则是 A 12 B 、10 D 、2 6、 在t 检验时,如果t = t o 、01,此差异是: A 、显著水平 B 、极显著水平 7、 生物统计中t 检验常用来检验 __________ A 、两均数差异比较 B 、两个数差异比较 C 无显著差异 D 、没法判断 C 两总体差异比较 D 、多组数据差异比 较 D 、有效假设

生物统计学习题集

生物统计学 姓名: 班级: 学号: 第一章概论 一、填空 1 变量按其性质可以分为_______变量与_______变量。 2 样本统计数就是总体_______得估计量。 3 生物统计学就是研究生命过程中以样本来推断_______得一门学科。 4 生物统计学得基本内容包括_______、_______两大部分。 5 统计学得发展过程经历了_______、_______、_______3个阶段。 6 生物学研究中,一般将样本容量_______称为大样本。 7 试验误差可以分为_______、_______两类。 二、判断 ( )1 对于有限总体不必用统计推断方法。 ( )2 资料得精确性高,其准确性也一定高。 ( ) 3 在试验设计中,随机误差只能减少,而不可能完全消除。 ( )4 统计学上得试验误差,通常指随机误差。 三、名词解释 样本 总体 连续变量 非连续变量 准确性 精确性 第二章试验资料得整理与特征数得计算

一、填空 1 资料按生物得性状特征可分为_______变量与_______变量。 2 直方图适合于表示_______资料得次数分布。 3 变量得分布具有两个明显基本特征,即_______与______。 4 反映变量集中性得特征数就是_______,反映变量离散性得特征数就是_______。 5 样本标准差得计算公式s=_______。 二、判断 ( ) 1 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。( ) 2 条形图与多边形图均适合于表示计数资料得次数分布。 ( )3 离均差平方与为最小。 ( )4 资料中出现最多得那个观测值或最多一组得中点值,称为众数。( )5 变异系数就是样本变量得绝对变异量。 三、名词解释 资料 数量性状资料 质量性状资料 计数资料 计量资料 普查 抽样调查 全距(极差) 组中值 算数平均数 中位数 众数 几何平均数 方差 标准差 变异系数 四、单项选择

生物统计学 (2)

生物统计学 名词解释: 1.生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理,运用 统计方法来认识、分析、推断和解释生命过程中的各种现象和试验调查资料的科学。 2.总体:具有相同性质或属性的个体所组成的集合称为总体,它是指研究对象的全 体; 3.个体:组成总体的基本单元称为个体; 4.样本:从总体中抽出若干个体所构成的集合称为样本; 5.样本容量:样本中所包含的个体数目称为样本容量。 6.集中性:资料中的观测值从某一数值为中心而分布的性质。 7.离散性:是变量有差离中心分散变异的性质。 8.变量(变数):指相同性质的事物间表现差异性或差异特征的数据。 9.常数:表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是 不变的。 10.参数:描述总体特征的数量称为参数,也称参量。常用希腊字母表示参数,例如用 μ表示总体平均数,用σ表示总体标准差; 11.统计数:描述样本特征的数量称为统计数,也称统计量。常用拉丁字母表示统计数, 例如用x表示样本平均数,用S表示样本标准差。 12.效应:通过施加试验处理,引起试验差异的作用称为效应。效应是一个相对量,而 非绝对量,表现为施加处理前后的差异。效应有正效应与负效应之分。 13.互作(连应):是指两个或两个以上处理因素间相互作用产生的效应。互作也有正效 应(协同作用)与负效应(拮抗作用)之分。 14.准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接 近的程度。 15.精确性:也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近 的程度。 16.随机误差(抽样误差):这是由于试验中无法控制的内在和外在的偶然因素所造成。 随机误差越小,试验精确性越高。 17.系统误差(片面误差):这是由于试验条件控制不一致、测量仪器不准、试剂配制 不当、试验人员粗心大意使称量、观测、记载、抄录、计算中出现错误等人为因素而引起的。系统误差影响试验的准确性。只要以认真负责的态度和细心的工作作风是完全可以避免的。 18.试验误差:在试验过程中,由于试验条件及人为的一些因素而造成的试验结果与真 实值之间的偏差,来源于试验材料固有的差异和外界因素(管理措施、试验条件等)。 19.数量性状:是指能够以计数和测量或度量的方式表示其特征的性状。 20.质量性状:是指能观察到而不能直接测量的性状 21.次数资料:由质量性状量化得来的资料叫做次数资料。 22.试验:是对已有的或没有的事物加以处理的方法。 23.大数定律:是概率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称。 主要内容:样本容量越大,样本统计数与总体参数之差越小。 24.泊松分布:是一种可以用来描述和分析随机地发生在单位空间或时间里的稀有事件 的概率分布,也是一种离散型随机变量的分布。 25.假设检验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完 全知道的总体提出两种彼此对立的假设,然后由样本的实际原理,经过一定的计算,

生物统计学答案 第一章 统计数据的收集与整理

第一章 统计数据的收集与整理 1.1 算术平均数是怎样计算的?为什么要计算平均数? 答:算数平均数由下式计算:,含义为将全部观测值相加再被观测值的个数 除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点, 或是说是样本数据的代表。 1.2 既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差? 答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。 1.3 标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同? 答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。 1.4 完整地描述一组数据需要哪几个特征数? 答:平均数、标准差、偏斜度和峭度。 1.5 下表是我国青年男子体重(kg )。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。 66 69 64 65 64 66 68 65 62 64 69 61 61 68 66 57 66 69 66 65 70 64 58 67 66 66 67 66 66 62 66 66 64 62 62 65 64 65 66 72 60 66 65 61 61 66 67 62 65 65 61 64 62 64 65 62 65 68 68 65 67 68 62 63 70 65 64 65 62 66 62 63 68 65 68 57 67 66 68 63 64 66 68 64 63 60 64 69 65 66 67 67 67 65 67 67 66 68 64 67 59 66 65 63 56 66 63 63 66 67 63 70 67 70 62 64 72 69 67 67 66 68 64 65 71 61 63 61 64 64 67 69 70 66 64 65 64 63 70 64 62 69 70 68 65 63 65 66 64 68 69 65 63 67 63 70 65 68 67 69 66 65 67 66 74 64 69 65 64 65 65 68 67 65 65 66 67 72 65 67 62 67 71 69 65 65 75 62 69 68 68 65 63 66 66 65 62 61 68 65 64 67 66 64 60 61 68 67 63 59 65 60 64 63 69 62 71 69 60 63 59 67 61 68 69 66 64 69 65 68 67 64 64 66 69 73 68 60 60 63 38 62 67 65 65 69 65 67 65 72 66 67 64 61 64 66 63 63 66 66 66 63 65 63 67 68 66 62 63 61 66 61 63 68 65 66 69 64 66 70 69 70 63 64 65 64 67 67 65 66 62 61 65 65 60 63 65 62 66 64 答:首先建立一个外部数据文件,名称和路径为:E:\data\exer1-5e.dat 。所用的SAS 程序和计算结果如下: proc format; value hfmt 56-57='56-57' 58-59='58-59' 60-61='60-61' 62-63='62-63' 64-65='64-65' 66-67='66-67' 68-69='68-69' 70-71='70-71' 72-73='72-73' 74-75='74-75'; run; n y y n i i ∑== 1

生物统计学习题

第一章绪论 一、名词解释 总体个体样本样本含量随机样本参数统计量准确性精确性 第二章资料的整理 一、名词解释 数量性状资料质量性状资料半定量(等级)资料计数资料计量资料 第三章平均数、标准差与变异系数 一、名词解释 算术平均数几何平均数中位数众数调和平均数标准差方差离均差的平方和(平方和)变异系数 二、简答题 1、生物统计中常用的平均数有几种?各在什么情况下应用? 2、算术平均数有哪些基本性质? 3、标准差有哪些特性? 三、应用题 计算下面两个玉米品种的10个果穗长度(cm)的平均数、标准差和变异系数,解释所得结果。 BS24:19 21 20 20 18 19 22 21 21 19 金皇后:16 21 24 15 26 18 20 19 22 19 四、计算题 1、10头母猪第一胎的产仔数分别为:9、8、7、10、1 2、10、11、14、8、9头。试计算这10头母猪第一胎产仔数的平均数、标准差和变异系数。 2、随机测量了某品种120头6月龄母猪的体长,经整理得到如下次数分布表。试利用加权法计算其平均数、标准差与变异系数。 组别组中值(x)次数(f) 80—84 2 88—92 10

96— 100 29 104— 108 28 112— 116 20 120— 124 15 128— 132 13 136— 140 3 3、某年某猪场发生猪瘟病,测得10头猪的潜伏期分别为2、2、3、3、 4、4、4、 5、9、12(天)。试求潜伏期的中位数。 4、某良种羊群1995—2000年六个年度分别为240、320、360、400、420、450只,试求该良种羊群的年平均增长率。 5、某保种牛场,由于各方面原因使得保种牛群世代规模发生波动,连续5个世代的规模分别为:120、130、140、120、110头。试计算平均世代规模。 6、调查甲、乙两地某品种成年母水牛的体高(cm )如下表,试比较两地成年母水牛体高的变异程度。 甲地 137 133 130 128 127 119 136 132 乙地 128 130 129 130 131 132 129 130 第四章 常用概率分布 一、名词解释 随机事件 概率的统计定义 小概率原理 正态分布 标准正态分布 双侧概率(两尾概率) 单侧概率(一尾概率) 二项分布 波松分布 标准误 二、简答题 1、事件的概率具有那些基本性质? 2、正态分布的密度曲线有何特点? 3、标准误与标准差有何联系与区别? 4、样本平均数抽样总体与原始总体的两个参数间有何联系? 三、计算题 1、 已知随机变量u 服从 N(0,1),求P(u <-1.4), P(u ≥1.49), P (|u |≥2.58), P(-1.21≤u <0.45),并作图示意。 2、已知随机变量u 服从N(0,1),求下列各式的αu 。 (1) P(u <-αu )+P(u ≥αu )=0.1;0.52 (2) P(-αu ≤u <αu )=0.42;0.95 3、猪血红蛋白含量x 服从正态分布N(12.86,1.332)

生物统计学(版)杜荣骞课后习题答案统计数据的收集与

第一章统计数据的收集与整理1.1 算术平均数是怎样计算的?为什么要计算平均数? 答:算数平均数由下式计算:n y y n i i ∑ = =1 ,含义为将全部观测值相加再被观测值的个数 除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点,或是说是样本数据的代表。 1.2 既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差? 答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。 1.3 标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同? 答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。 1.4 完整地描述一组数据需要哪几个特征数? 答:平均数、标准差、偏斜度和峭度。 1.5 下表是我国青年男子体重(kg)。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。 66 69 64 65 64 66 68 65 62 64 69 61 61 68 66 57 66 69 66 65 70 64 58 67 66 66 67 66 66 62 66 66 64 62 62 65 64 65 66 72 60 66 65 61 61 66 67 62 65 65 61 64 62 64 65 62 65 68 68 65 67 68 62 63 70 65 64 65 62 66 62 63 68 65 68 57 67 66 68 63 64 66 68 64 63 60 64 69 65 66 67 67 67 65 67 67 66 68 64 67 59 66 65 63 56 66 63 63 66 67 63 70 67 70 62 64 72 69 67 67 66 68 64 65 71 61 63 61 64 64 67 69 70 66 64 65 64 63 70 64 62 69 70 68 65 63 65 66 64 68 69 65 63 67 63 70 65 68 67 69 66 65 67 66 74 64 69 65 64 65 65 68 67 65 65 66 67 72 65 67 62 67 71 69 65 65 75 62 69 68 68 65 63 66 66 65 62 61 68 65 64 67 66 64 60 61 68 67 63 59 65 60 64 63 69 62 71 69 60 63 59 67 61 68 69 66 64 69 65 68 67 64 64 66 69 73 68 60 60 63 38 62 67 65 65 69 65 67 65 72 66 67 64 61 64 66 63 63 66 66 66 63 65 63 67 68 66 62 63 61 66 61 63 68 65 66 69 64 66 70 69 70 63 64 65 64 67 67 65 66 62 61 65 65 60 63 65 62 66 64 答:首先建立一个外部数据文件,名称和路径为:E:\data\exer1-5e.dat。所用的SAS程序和计算结果如下: proc format; value hfmt 56-57='56-57' 58-59='58-59' 60-61='60-61' 62-63='62-63' 64-65='64-65' 66-67='66-67'

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

2017福师《生物统计学》答案

一、单选题(共 32 道试题,共 64 分。) V 1. 最小二乘法是指各实测点到回归直线的 A. 垂直距离的平方和最小 B. 垂直距离最小 C. 纵向距离的平方和最小 D. 纵向距离最小 2. 被观察到对象中的()对象称为() A. 部分,总体 B. 所有,样本 C. 所有,总体 D. 部分,样本 3. 必须排除______因素导致“结果出现”的可能,才能确定“结果出现”是处理因素导致的。只有确定了______,才能确定吃药后出现的病愈是药导致的。 A. 非处理因素,不吃药就不可能出现病愈 B. 处理因素,不吃药就不可能出现病愈 C. 非处理因素,吃药后确实出现了病愈 D. 处理因素,吃药后确实出现了病愈 4. 张三观察到李四服药后病好了。由于张三的观察是“个案”,因此不能确定______。 A. 确实进行了观察 B. 李四病好了 C. 病好的原因 D. 观察结果是可靠的 5. 四个样本率作比较,χ2>χ20.05,ν可认为

A. 各总体率不同或不全相同 B. 各总体率均不相同 C. 各样本率均不相同 D. 各样本率不同或不全相同 6. 下列哪种说法是错误的 A. 计算相对数尤其是率时应有足够的观察单位或观察次数 B. 分析大样本数据时可以构成比代替率 C. 应分别将分子和分母合计求合计率或平均率 D. 样本率或构成比的比较应作假设检验 7. 总体指的是()的()对象 A. 要研究,部分 B. 观察到,所有 C. 观察到,部分 D. 要研究,所有 8. 以下叙述中,除了______外,其余都是正确的。 A. 在比较未知参数是否不等于已知参数时,若p(X>x)<α/2,则x为小概率事件。 B. 在比较未知参数是否等于已知参数时,若p(X=x)<α,则x为小概率事件。 C. 在比较未知参数是否大于已知参数时,若p(X>x)<α,则x为小概率事件。 D. 在比较未知参数是否小于已知参数时,若p(X

生物统计学习题集

生物统计学 姓名: 班级: 学号:

第一章概论 一、填空 1 变量按其性质可以分为_______变量和_______变量。 2 样本统计数是总体_______的估计量。 3 生物统计学是研究生命过程中以样本来推断_______的一门学科。 4 生物统计学的基本内容包括_______、_______两大部分。 5 统计学的发展过程经历了_______、_______、_______3个阶段。 6 生物学研究中,一般将样本容量_______称为大样本。 7 试验误差可以分为_______、_______两类。 二、判断 ()1 对于有限总体不必用统计推断方法。 ()2 资料的精确性高,其准确性也一定高。 ( ) 3 在试验设计中,随机误差只能减少,而不可能完全消除。()4 统计学上的试验误差,通常指随机误差。 三、名词解释 样本 总体 连续变量 非连续变量 准确性 精确性

第二章试验资料的整理与特征数的计算 一、填空 1 资料按生物的性状特征可分为_______变量和_______变量。 2 直方图适合于表示_______资料的次数分布。 3 变量的分布具有两个明显基本特征,即_______和______。 4 反映变量集中性的特征数是_______,反映变量离散性的特征数是_______。 5 样本标准差的计算公式s=_______。 二、判断 ( ) 1 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。( ) 2 条形图和多边形图均适合于表示计数资料的次数分布。 ()3 离均差平方和为最小。 ()4 资料中出现最多的那个观测值或最多一组的中点值,称为众数。()5 变异系数是样本变量的绝对变异量。 三、名词解释 资料 数量性状资料 质量性状资料 计数资料 计量资料 普查 抽样调查 全距(极差) 组中值 算数平均数 中位数 众数 几何平均数 方差 标准差 变异系数

生物统计学实验

渤海大学学生实验报告 课程名称:生物统计学实验任课教师:何余堂 实验室名称:计算机室房间号:理工Ⅱ--205 实验时间:2012-6-14 学院化学化工与食品安全学院专业食品质量与安 全 班级10-10 姓名宋帅婷学号10150142同组人其余19人 实验项目统计数据的整理及次数分布 表/图的制作 组 别第二组 实验成绩 一、实验目的 1、掌握Excel数据输入、输出与编辑方法; 2、掌握Excel用于描述性统计的基本菜单操作及命令; 3、掌握数据整理的基本方法; 4、熟练制作次数分布表/图。 二、实验原理 当观测值较多(n>30)时,宜将观测值分成若干组,以便统计分析。将观测值分组后,制成次数分布表,即可看到资料的集中和变异情况。 连续性资料的整理,需要先确定全距、组数、组距、组中值及组限,然后将全部观测值计数归组。分组结束后,将资料中的每一观测值逐一归组,统计每组内所包含的观测值个数,制作次数分布表。利用Excel的数据统计工具可以辅助完成上述工作。 三、实验步骤 1、加载分析工具库 单击Excel程序“工具”菜单中的“数据分析”命令可以浏览已有的分析工具。如果在“工具”菜单上没有“数据分析”命令,应在“工具”菜单上运行“加载宏”命令,在“加载宏”对话框中选择“分析工具库”。 2、练习 某地80例30~40岁健康男子血清总胆固醇(mol/L)测定结果如下: 4.77 4.56 5.18 4.38 4.03 5.16 4.88 4.52 4.47 5.38 3.37 4.37 5.77 4.89 5.85 5.10 5.55 4.38 3.40 3.89 6.14 5.39 4.79 4.09 5.85 3.04 4.31 3.91 4.60 3.95 6.30 5.12 5.32 3.35 4.79 4.55 4.58 2.70 4.47 3.56 4.77 4.56 5.18 4.38 4.03 5.16 4.88 4.52 4.47 5.38 3.37 4.37 5.77 4.89 5.85 5.10 5.55 4.38 3.40 3.89 6.14 5.39 4.79 4.09 5.85 3.04 4.31 3.91 4.60 3.95 6.30 5.12 5.32 3.35 4.79 4.55 4.58 2.70 4.47 3.56 5.21

生物统计学课后习题解答-李春喜汇总

生物统计学课后习题解答-李春喜汇总

第一章概论 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。 第二章试验资料的整理与特征数的计算习题 2.1 某地 100 例 30 ~ 40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下: 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.85 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 计算平均数、标准差和变异系数。 【答案】=4.7398, s=0.866, CV =18.27 % 2.2 试计算下列两个玉米品种 10 个果穗长度 (cm) 的标准差和变异系数,并解释所得结果。 24 号: 19 , 21 , 20 , 20 , 18 , 19 , 22 , 21 , 21 , 19 ; 金皇后: 16 , 21 , 24 , 15 , 26 , 18 , 20 , 19 , 22 , 19 。 【答案】 1 =20, s 1 =1.247, CV 1 =6.235% ; 2 =20, s 2 =3.400, CV 2 =17.0% 。 2.3 某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取 50 绳测其毛重(kg) ,结果分别如下:

生物统计练习题一

西北农林科技大学 畜牧兽医专业《生物统计学》试题(卷) 学生姓名:考试成绩: 一、名词解释(每小题2分,共10分)得分:分 1. 准确性 2. 数量性状 3. 因素水平 4. 试验处理 5. 试验单位 二、填空题(每空1分,共18分)得分:分 1. 平均数具有两个基本性质,即与离均差的平方和最小。 2. 在显著性检验时,两个样本平均数之差包括了两部分:一部分是两个总体平均数的差,即处理效应,另一部分是,即样本平均数的差受到试验误差的干扰。 3. 在进行次数资料的 2检验时,不需要进行连续性矫正的条件是自由度df需要大于。 4. 统计分析的一个基本特点是有很大的可靠性,但有一定的。 5. 标准正态分布的两个参数为μ=0和σ2= 。 6. 某班有30名同学,其学号分别为1、2、3、……、29、30,现从中随机抽 第 1 页共9 页

取1名同学,则抽得随机事件A=“学号是3的倍数的同学”的事件的概率等于 %(小数点后保留两位)。 7. 统计表是用形式表示数量关系,使数据条理化、系统化,便于理解、分析和比较。 8. 直方图是用表示各组频数的多少,其高度与宽度均有意义。 9. 准确性和精确性的含义不同。设某一试验指标的真值为μ,观测值为x,若任意两个观测值X i、X j差的绝对值|X i-X j|小,则观测值的高。 10. 平均数是一个资料的代表,其意义在于描述资料的。 11. 如果进行4种饲料和4个不同品种对鸡产蛋量影响的两因素试验,则整个试验共有个水平组合。 12. 经过测定表明,某品种仔猪初生重x的范围为[0.5~1.5)kg。如果取随机变量x为1 kg时,则其概率等于。 13. 某良种猪场长白成年母猪的平均体重为 190 Kg,标准差为10.5 Kg,则其变异系数为(小数点后保留两位)。 14. 统计学上采用研究呈因果关系的相关变量间的关系,表示原因的变量称为自变量,表示结果的变量称为依变量。 15. 方差分析的前提是分布的正态性、效应的可加性和。 16. 某试验测得秦川牛的某个性状的8个平均数分别39.4、38.8、35.2、31.5、29.0、26.0、24.7、22.2 Kg。在进行多重比较时,平均数38.8和22.2相比较时的秩次距K等于。 17. 对于服从二项分布的某试验而言,如果发生A结果的概率为0.6,则其对立结果发生的概率为。 18. 拉丁方设计的显著特点是试验处理数=横行单位组数=直列单位组数=。 三、单项选择题(每小题1分,共15分)得分:分 1. 抽样的目的是()。 A.研究样本统计量 B. 由样本统计量推断总体参数 第 2 页共9 页

生物统计学试题及答案

一、填空 变量按其性质可以分为连续变量和非连续变量。 样本统计数是总体参数的估计量。 生物统计学是研究生命过程中以样本来推断总体的一门学科。 生物统计学的基本内容包括试验设计、统计分析两大部分。 统计学的发展过程经历了古典记录统计学、近代描述统计学、现代推断统计学3个阶段。 生物学研究中,一般将样本容量n≥30称为大样本。 试验误差可以分为随机误差、系统误差两类。 资料按生物的性状特征可分为数量性状资料变量和质量性状资料变量。 直方图适合于表示连续变量资料的次数分布。 变量的分布具有两个明显基本特征,即集中性和离散性。 反映变量集中性的特征数是平均数,反映变量离散性的特征数是变异数。 样本标准差的计算公式s=。 如果事件A和事件B为独立事件,则事件A与事件B同时发生地概率P(AB)=P(A)*P(B)。 二项分布的形状是由n和p两个参数决定的。 正态分布曲线上,μ确定曲线在x轴上的中心位置,σ确定曲线的展开程度。 等于σ/√n。 样本平均数的标准误 x t分布曲线和正态分布曲线相比,顶部偏低,尾部偏高。 统计推断主要包括假设检验和参数估计两个方面。

参数估计包括点估计和区间估计。 假设检验首先要对总体提出假设,一般应作两个假设,一个是无效假设,一个是备择假设。 对一个大样本的平均数来说,一般将接受区和否定区的两个临界值写作μ-uασ?x_ μ+uασ?x 在频率的假设检验中,当np或nq<30时,需进行连续性矫正。 2 χ检验主要有3种用途:一个样本方差的同质性检验、适应性检验和独立性检验。 2 χ检验中,在自由度df=(1)时,需要进行连续性矫正,其矫正的2 χ=(p85)。 c 2 χ分布是连续型资料的分布,其取值区间为[0.+∞)。 猪的毛色受一对等位基因控制,检验两个纯合亲本的F2代性状分离比是否符合孟德尔第一遗传规律应采用适应性检验法。 独立性检验的形式有多种,常利用列联表进行检验。 根据对处理效应的不同假定,方差分析中的数学模型可以分为固定模型、随机模型和混合模型混合模型3类。 在进行两因素或多因素试验时,通常应该设置重复,以正确估计试验误差,研究因素间的交互作用。 在方差分析中,对缺失数据进行弥补时,应使补上来数据后,误差平方和最小。方差分析必须满足正态性、可加性、方差同质性3个基本假定。 如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有平方根转换、对数转换、正反弦转换等。 相关系数的取值范围是[-1,1]。

相关主题
文本预览
相关文档 最新文档