当前位置:文档之家› 生物统计学教案(12)

生物统计学教案(12)

生物统计学教案

第十二章实验设计

教学时间:2学时

教学方法:课堂板书讲授

教学目的:试验设计的原理、意义、原则;常用试验设计方法 .

讲授难点:正交实验设计、随机化完全区组设计

12。1实验设计的基本原则

实验设计的两个基本原则是重复(replication)和随机化(randomization)、局部控制.

12。1。1 重复

所谓重复就是将一基本实验重做一次或几次.例如,测定不同年龄组正常人血红蛋白含量实验,在每-年龄组内测一人,即为一基本实验。若将这一基本实验验重做5次,即每一年龄组,抽取5人测血红蛋白含量.则称该实验有5次重复.我们这里所讲的重复,是指将“基本实验"重做一次或几次,而不是指一次基本实验的结果重复测量多次。

例如,我们想分析大豆籽粒中VD的含量。这一基本实验包括以下过程:随机选取若干大豆,磨成豆粉,取一定数量的豆粉,乙醇回流抽提脂肪,提取液皂化,萃取,层析分离、纯化,在265nm下测吸光度,最后计算出VD的含量。重复实验必须是上述过程的完整重复。

设置重复的意义:①只有设置重复才能得到实验误差的估计。标准差是通过重复得到的,有了标准差才能得到标准误差.②只有设置重复才能推断出处理效应。如两种药物实验,A药物一人10天痊愈,B药物12天痊愈,并不能说明A比B就好。12。1。2 随机化

随机化是指实验材料的配置和实验处理的顺序都是随机确定的。

假设药效受年龄的影响,服用A药的年青,服用B药的年长,这时药效与年龄的效应混杂,即使两种药物不同,也不能判断是否是药物的差异。

12.1.3局部控制-—试验条件的局部一致性(增加)

局部控制是指在试验时采取一定的技术措施或方法来控制或降低非试验因素对试验结果的影响。在试验中,当试验环境或试验单位差异较大时,仅根据重复和随机化两原则进行设计不能将试验环境或试验单位差异所引起的变异从试验误差中分离出来,因而试验误差大,试验的精确性与检验的灵敏度低。为解决这一问题,在试验环境或试验单位差异大的情况下,根据局部控制的原则,可将整个试验环境或试验单位分成若干个小环境或小组,在小环境或小组内使非处理因素尽量一致。每个比较一致的小环境或小组,称为单位组(或区组)。因为单位组之间的差异可在方差分析时从试验误差中分离出来,所以局部控制原则能较好地降低试验误差。

以上所述重复、随机化、局部控制三个基本原则称为费雪(R。A.Fisher)三原则,是试验设计中必须遵循的原则,再采用相应的统计分析方法,就能够最大程度地降低并无偏估计试验误差,无偏估计处理的效应,从而对于各处理间的比较作出可靠的结论。试验设计三原则的关系和作用见图12—1所示。

12。2 实验计划书的编制(自习)

12.2.1 实验计划书的格式

一般来说,一个实验计划书应包括以下几部分:

(1)封面:写明实验名称,计划书编制者或编制小组名称以及设计时间等(2)国内外研究动态。

(3)实验目的.

(4)预期结果。

(5)实验设计的选择。

(6)实验方法的确定。

(7)田间规划。

(8)实验记录表。

12.2。2 国内外研究动态。

12.2.3 实验目的。

12。2。4 预期结果。

12.2.5 实验设计的选择.

因素和水平的选择;响应变量(实验所观察的指标)的选择;实验设计的选择.

12.2.6 实验方法的确定.

(1)实验材料的来源。列出实验材料的用量和备用量,对实验材料的要求。

(2)实验仪器和设备。种类、数量、规格、型号

(3)试剂。所需试剂的种类、数量、生产厂家、等级。试剂的配制方案.

(4)实验流程。参考文献资料或本实验室的前期工作,写出每一实验的流程。

(5)经费核算.核算开支,若经费不足,重新调整方案,以便实验顺利完成. 12。2。7 田间规划。

对于田间试验,除前而讲过的一些要点以外,还有以下一些应注意的问题.

(1)试验地的选择:应当选择地力均匀、地势平坦的地块作为试验地.应有方便的排灌条件,周围没有大树遮阴,远离人口聚集区,防止实验遭人为破坏。

(2)土壤肥力勘测:如果没有地力情况的记录,试验开始前,还需对地力进行勘测。最好采用生物勘测法。方法是,把全部试验地分成若干小区,均匀地播种纯度很高的某一作物,待作物长出后,按小区记录作物生长情况,结合收获后的考种记录,标记上土壤肥力分布情况。

(3)隔离区的设置:如果在试验地的周围还种有和试验材料相同的作物,特别是当研究材料为异花授粉和常异花授粉作物时,一定要设置隔离带,以防止生物混杂。

(4)保护行的设置:在试验地的周围至少应种植3—5行其他作物,把全部试验地围起来,保护试验材料不致受到外来因素的破坏。

(5)水源:根据试验的要求,可采用地表漫灌、喷灌、滴灌等灌溉方式,不论

采取哪种灌溉方式,都应配套相应的设施.

(6)小区规划:根据种植作物的不同和试验的要求,确定小区面积并划分小区,在适当的地方应留出通道,以便于进行田问调查。小区多规划为矩形,走向应视试验地的条件而定,以东西或南北走向为佳。

(7)小区编号:根据试验设计的方式,是随机区组设计还是裂区设计亦或对比设计等,来决定小区的编号。编号完成后,应在每个小区的一端钉上有标号的木牌或塑料牌作为标记。

(8)田间规划图:在以上工作都完成后,应绘制一份详细的田间规划图,标明试验地坐落位置,小区的划分,小区编号,以防田间小区标记丢失后,造成试验混乱。

(9)播种计划:在试验规模比较大.小区比较多时,播种前一定要周密计划。按小区编号分装种子,在种子袋上标上小区号,播种时对号入座。一旦发现错误,应及时纠正,实在无法纠正时,一定要做详细记录.

12。2。8 实验记录表.

(1)实验室日志

(2)仪器使用登记表

(3)借物登记表物品名称、借用日期、归还日期、借用人等。

(4)实验原始记录

(5)田间记录

12。3 简单实验设计

12。3.1成组比较实验设计

将实验材料随机分成两组,每组各接受一种处理,通过分析处理效应之差异是否由随机误差造成的,来判断是不是存在效应。

例1:动物药物实验,动物分两组,一组A药物,一组B药物,实验只有药物一个因素,类似这样的因素为类别因素。

例2:动物分两组,一组每天补加10mg复合维生素,一组每天补加20mg复合维生素,实验只有维生素一个因素,水平是用数量表示的,这类因素为数量因素。

成组比较实验设计应注意的几个问题:

(1)一定要用随机化方法划分两组实验材料. 抽签、随机数字、计算机随机数字分组

(2)在成组比较实验中,往往一组设计为实验组,一组为处理组。

N1=n2时,最小,这时最容易检出显著性。

(3)样本含量。样本含量即重复次数.有重复才能够得到标准差s,进而得到标准误差,样本含量越大,标准误差越小.

(4)对照的设置。原则是除去所要比较的因素之外其他各方面的因素都应与处理一致。

(5)实验误差。来源于各个观测值之间的变差。一是实验材料本身内在变差;二是实验重复之间所处的环境条件及实验操作的不均一性等原因造成的变差。

12。3。2成组比较实验设计所需的样本含量

最简单的一种情况:σi已知且相等(σ1=σ2=σ)及n1=n2=n。在这种情况下,以α和β的风险,分辨出零假设μl—μ2=μ和备择假设μl-μ2=Δμ,问需多大的样本?

Σi未知,可用si代替,并假设s1=s2=s及n1=n2=n.单侧检验

双侧检验:

12.3。3 配对比较实验设计

在成组比较实验设计中,动物个体间内在变差,或者说,由于遗传素质的差异所引起的变差很难消除,在这种情况下,可以采用配对比较法设计实验.

动物,为了比较两种不同的处理效应,选出n窝动物,每窝抽出两只条件一致的个体(如相同体重、相同性别等),分别接受不同的处理,从而构成样本含量为n的配对比较实验。使用范围很广。

医学中,检测受试者在接受处理前后某些生理指标的差异(自身对照设计);植物同一植株的不同部位做不同的处理,两片叶子、两个枝条、两个分蘖等。

在设计配对实验时,配对的双方一定要有内在的联系,否则不能配成对子。如从社会角度,一对夫妻是配成的一对,但从生物学角度看,他们是姻亲,不是血亲,没有任何血缘关系,因此不能配对。

12。3。4 配对设计与成组设计检验效率的比较

一般来说,配对设计比成组设计更容易检验出两组数据平均数之间的差异。由

的可能性越大。

5.1.4可知,在平均数和样本含量均相同的情况下,t值越大,拒绝H

影响t值的因素,除两个平均数之差以外,另一个重要因素是s,s越小则t越大。在做配对比较实验时,如果两组数据平均数之间存在显著差异,这两数据之间一般存在正相关,这时配对设计的方差要小于成组设计。

用配对设计可排除数据之间可能存在的相关,提高检验效率。

12。4 单因素实验设计

12.4。1 完全随机化设计

完全随机化设计实际上是成组比较实验设计的扩展。在成组比较实验中,实验因素只有两个水平,若水平增加到3个或3个以上,则成组比较实验设计即变为完全随机化设计。完全随机化的含义是,作为实验用的个体(或田间试验用的小区)被分配到处理的哪一个水平完全是用随机化方法确定的。这就要求实验个体(或试验小区)必须具备同质性。实验个体(试验小区)间虽不能做到完全同质,但个体间的变差也应控制到最小。

完全随机化设计是单因素的多个水平之间的比较。例如,研究服用4种不同化疗药物对动物白细胞含量的影响。该实验只有“化疗药物”1个因素,该因素的4种药物是实验的4个水平,4个水平也可以称为4个处理。实验可以如下设计:从具有同质性(如,同性别、同年龄、同体重、白细胞含量相同、身体健康等)的实验动物群体中,随机抽取20只(或其他数量)动物,用随机化的方法、将它们均等地分配到4个处理中.

随机化分配的方法很多,在这里重点介绍如何用随机数字表进行随机分配.首先将抽到的20只动物编号,从0l编到20,如下表的第一行。从随机数字表的任何一点开始,两位两位数字读下去,将读到的结果填到表的第二行。因为实验要求分为4组,则用4除各随机数字、并将余数填到表的第三行。与余数为1的随机数字相应的动物分到第一组,与余数为2的随机数字相应的动物分到第二组,…,与余数为0的随机数字相应的动物分到第四组。分配的结果为:

第一组和第四组每组只有4只,而第二组和第四组每组都有6只,所以需要调整。调整的力法是,接着上面的最后一个随机数字继续读下去,最先出现的是42,42除以4,余数为2,先从第二组调剂。如果余数是1或0,则继续读下去,直到余数最先出现2或3时为止。42再除以6(因为第二组有6个数),余数为0,则把与第二组的第6个随机数字54所相应的19号动物调出。把调出的19号动物放在哪-组呢?继续读随机数字,出现的是09,被4除,余数为l,于是将第19号动物放在第一组,如果余数是2或3,则继续读随机数字,直到余数最先出现1或0时为止。用类似的方法调剂第三组,继续读下去的随机数字是43,被6陈,余数是1,于是将与第二组的第1个随机数字91所相应的02号动物调剂到第四组。到此,随机分组的过程全部完成,分配的最终结果如下表.

下一步决定药物的分配。将4种药物编上号,并从随机数字表中连续读出4个两位数,根据随机数字从小到大的顺序,对应出相应的组别.

完全随机化设计设计特点:

完全随机设计应用了试验设计的重复和随机两个原则,其优点是设计容易,处理数与重复次数都不受限制,统计分析也比较简单。

完全随机设计的主要缺点是没有应用局部控制的原则,试验环境条件差异较大时试验误差较大,试验的精确度较低。

完全随机设计常用于土壤肥力均匀一致的田间试验和在实验室、温室、网室中进行的试验。

成组比较实验设计、配对比较实验设计和完全随机化设计的统计分析方法,已分别在5。2。3、5.2。5和第八章单因素方差分析中讲过,这里不再重复.

12。4.2 随机化完全区组设计

这种设计的特点是根据“局部控制”的原则,将试验地按肥力程度或将动物按窝划分为等于重复次数的区组,一区组亦即一重复,区组内各处理都独立地随机排列.这是随机排列设计中最常用而最基本的设计。

(1)随机化完全区组设计的原理

上例将20只动物放在一起进行随机化,对动物的同质性的要求是很严格的。但

一次抽到20只同质的实验动物是很困难的。在设计实验时,若不能得到20只同质的实验动物,可以选择前后出生的5窝动物,每窝选出4只条件相似的个体,如性别相同、出生重相同等,这4只动物称为一个区组,分别接受4种不同的药物,在区组内哪一只动物接受哪一种药物完全是随机的.共有5窝动物,所以区组数为5.这样的设计方法称为随机化完全区组设计。“完全"的含义是,在每一区组内都包含全部处理(4种药物)。

区组的含义很广泛,一般的提法是:将性质相似的实验材料或大致相同的环境条件安排在同一组群中,该组群称为区组。

在田间试验中,进行品种比较试验,品种是一个因素,不同品种是该因素的不同水平。设共有r个品种,每一品种重复n次。

可以用完全随机化设计构成本试验。按完全随机化设计要求,应该把全部试验地分成nr个小区、nr个小区必须具备同质性,哪一个品种放在哪一个小区完全是随机的.在r个品种之间比较并做n次重复,需要较多的试验地,试验地面积过大,则很难保证在各个小区间土壤肥力、含水量、日照、土质、小气候等条件的一致性.如果按完全随机化试验设计安排试验,由土壤之间差异所带来的效应,将与随机误差混杂,从而加大了试验误差。严重时,甚至于检验不出品种间本来存在的差异.为了解决试验地面积较大、地力等条件的不一致性,可以采用随机化完全区组设计。

做法是:将全部试验地分成n个相等的部分,要求每一部分内的条件,如土壤肥力、土质、含水量、田间小气候等必须是一致的。由于每一部分的土地面积小了,条件一致的要求容易满足。将每一部分等分为r个小区,每个小区种-个品种,从而构成一个区组,全部试验包括n个这样的区组。这就是品种比较试验的随机化完全区组设计。

构成区组的方式很多,下面再举一个以“天"为区组的例子。一个具有5个处理、3次重复的设计,完成全部工作需做l5次实验.但是一天内最多只能完成5次实验,考虑到气象条件对该实验的影响很大,同一天内的温度、湿度等气象条件比较一致,而不同“天"之间的环境条件可能存在较大的差异,如果采用完全随机化设计,在3天内完成全部实验,则不同“天”所带来的效应会扩大实验误差。于是,可以把“天”

设计为区组.每一天各完成5个处理,3天完成全部实验.

有时不同“人"也可以设计为区组。例如,为了检测用3种不同工艺生产的产品质量之间是否存在差异,需要设计—个实验,实验要求重复5次。如果用完全随机化设计,则需要15名实验员,出于不同实验员操作时,可能存在操作误差,该误差会加大实验误差,对检测是不利的。如果采用随机化完全区组设计,则可以避免这个问题的出现。选出5名实验员,同一名实验员的操作前后是一致的,所以每名实验员可作为一个区组.每人用3种工艺各生产一遍,从而构成随机化完全区组设计.

(2)随机化的方法

小区或试验动物的随机可借助于附表1随机数字表、抽签或计算机(器)随机数字发生法。

以品种比较试验的随机化完全区组设计为例,说明随机化的方法.设试验共有5个品种“a、b、c、d、e。根据试验地的条件,可以安排3个区组.每一区组内除5个品种不同外,其他条件都一致,包括自然条件及田间管理条件。如土壤肥力、含水量、土质、日照、试验地走向、播种行向、田间小气候等都是一致的,另外,田间管理措施,如耕耙、灌水、施肥、除草、除虫、中耕次数、收获等都应在同一时间内完成。每一区组的田间记录应由专人在一天内调查完,若一人不能完成则应规定严格的标准,由几人在尽量短的时间内完成。

在决定了处理数和划分好区组以后,就要决定每一小区接受哪一个品种.最简单的方法是由拈阄或抽签决定每一品种在每一区组中的位置。随机化过程最好用随机数字表来完成。

以12。4。1的动物实验为例,说明如果把该实验设计为随机化完全区组,应如何设计。在这个实验中实验动物共有20只,根据年龄可分为4个区组,每一区组内的5只动物年龄一致,分别接受5种处理.根据年龄的顺序,将动物从0l号编到20号。5个连续的序号作为一个年龄组,分在一个区组中。如区组I的动物号为1-5,区组II的动物号为6-10,…。下一步,从随机数字表中连续读出5个三位数,根据这5个随机数字的秩次,决定该年龄组的动物在区组内的排列顺序.

(3)数据处理

可以将随机化完全区组设计中的处理,作为一个因素A,区组作为另一个因素B,实验结果按两因素方差分析处理.处理一般都属固定型,区组为随机型或固定型。

(4)随机化完全区组设计的优缺点

随机化完全区组设计有以下优点:(1)设计简单,容易掌握;(2)富于伸缩性,单因素、多因素以及综合性的试验都可应用,结果的统计分析也简单易行;(3)把实验材料分成n个区组,从误差平方和中分解出区组平方和,比完全随机化设计的灵敏度高。(4)假若在一完整的实验中,需要取消某些处理时,并不影响对实验结果的分析。或者意外地丢失了一两个数据,也可以通过适当的方法来补救.(5)对试验地的地形要求不严,必要时,不同区组亦可分散设置在不同地段上。

缺点:必须保证区组内的条件一致。这种设计不允许处理数太多,一般不超过20个在田间试验中,最好为10个左右.因为处理多,区组必然增大,局部控制的效率降低,就会产生较大误差,试验精度低于拉丁方设计.

12.4。3 拉丁方设计

随机化完全区组设计比完全随机化设计精密,它可以从完全随机化设计的误差平方和中分离出区组平方和,提高了实验的灵敏度.但它要求区组内的条件必须完全一致,这个要求在有些实验中是很难满足的。为了解决这个问题,可以采用拉丁方设计(Latin square design)。拉丁方设计的原理与随机化完全区组类似,下面仍以设计一个品种比较试验为例,说明拉丁方设计的基本原理。

(1)设计方法

拉丁方设计是从横行和直列两个方向对试验环境条件进行局部控制,使每个横行和直列都成为一个区组,在每一区组内随机安排全部处理的试验设计。

在拉丁方设计中,同一处理在每一横行区组和每一直列区组出现且只出现一次,所以拉丁方设计的处理数、重复数、横行区组数和直列区组数均相同。

拉丁方是一个由n个拉丁字母构成的n×n阶方阵,各字母在每一横行和每一直列出现且只出现一次。

例:在田间试验开始之前,一般都需要对地力进行勘测,假设勘测的结果是,试验地的东部和北部肥沃,西部和南部贫瘠。若在这块试验地上采用随机化完全区组设

计,那么区组的划分不论是东西向还是南北向,都不能保证区组内各小区的肥力一致。为了消除两个方向上土壤差异给试验带来的干扰,应当设计成两个方向上的区组。

具体做法是:安排每一品种在每一行上出现一次,同时在每一列上也出现一次,而且每行和每列只能出现一次。于是,每行相当于一个区组,每列也相当于一个区组。这样安排的结果,行小区数与列小区数完全相等,全部试验小区构成一个方阵,由于构成上述方阵的各个小区,最初是用拉丁字母表示的,所以称为拉丁方(Latin square)。用来排拉丁方的字母的个数,称为拉丁方的阶数,以下为一个5阶拉丁方。一个p阶拉丁方的统计模型为:

拉丁方方差分析的基本做法仍然是将p2个观测值的总平方和分解为行、列、处理和误差平方和:

具以下自由度:

校正项

若一个拉丁方的第一行和第一列是按拉丁字母顺序排列的,则称为标准拉丁方(standard Latin square)。到目前为止,只知道p<8的标准拉丁方的数目,一个标准拉丁方通过变换可以产生更多的拉丁方,包括标准拉丁方本身在内的p阶拉丁方的总数为p!×(p—1)!(标准拉丁方数)。

进行拉丁方设计时,首先应根据处理数确定选取哪一个标准拉丁方,然后进行直列、横行和处理的随机排列。对于3×3和4×4标准拉丁方,随机所有直列和第二、第三、第四横行,再对处理进行随机;对于5×5及其以上标准拉丁方,随机所有直列和横行,再对处理进行随机。

拉丁方设计虽然比随机区组设计精密,但是由于行和列的小区数应该一样多,在田间试验时占用土地面积较大或因实验处理较多,负担过重。因此,拉丁方设计不宜过大,一般以5×5到9×9拉丁方为宜。

补充内容:

105

进行拉丁方设计时,首先应根据处理数k从拉丁方的标准方表中选定一个p×p 的标准方.但在实际应用上,为了获得所需的拉丁方,可简捷地在一些选择的标准方(表2.1)的基础上进行横行、直行及处理的随机。

表2.1(4×4)~(8×8)的选择标准方

4×4

1 2 3 4

A B C D

B A D C

C D B A

D C A B A B C D

B C D A

C D A B

D A B C

A B C D

B D A C

C A

D B

D C B A

A B C D

B A D C

C D A B

D C B A

5×5 6×6

A B C D E A B C D E F

B A E

C

D B F D C A E

C D A E B C D E F B A

D E B A C D A F E C B

E C D B A E C A B

F D

F E B A D C

7×7 8×8

A B C D E F G A B C D E F G H

B C D E F G A B C D E F G H A

C D E F G A B C D E F G H A B

D E F G A B C D E F G H A B C

E F G A B C D E F G H A B C D

F G A B C D E F G H A B C D E

G A B C D E F G H A B C D E F

H A B C D E F G

不同处理数的拉丁方的随机略有不同,一般按以下所示步骤进行:

(4×4)拉丁方:随机取4个标准方中的一个,随机所有直行及第2、3、4横行,也可以随机所有横行和直行,再随机处理.

(5×5)及更高级拉丁方:随机所有直行、横行和处理。

设有5个品种分别以1、2、3、4、5代表,拟用拉丁方排列进行比较试验。首先取上面所列的(5×5)选择标准方。再从随机数字表中,以铅笔尖任意落于一行,查随机数字,将0和大于5的数字去掉,得1、4、5、3、2,即为直行的随机.再点一行,

106

如得5、1、2、4、3,即为横行的随机.再点一行,得2、5、4、1、3,即为品种随机。将(5×5)选择标准方按上面三个随机步骤,就得到所需的拉丁方排列(图2.11)。

图2。11(5×5)拉丁方的随机

1。选择标准方2。按随机数字

1 4 5 3 2

调整直行3.按随机数字

5 1 2 4 3

调整横行

4.按随机数字

2=A,5=B,4=C

1=D,3=E,排列品种

A B C D E A D E C B E B A D C 3 5 2 1 4

B A E

C

D B C D

E A A D E C B 2 1 3 4 5

C D A E B C E B A D B C D E A 5 4 1 3 2

D E B A C D A C B E D A C B E 1 2 4 5 3

E C D B A E B A D C C E B A D 4 3 5 2 1

12.4.4 希腊—拉丁方设计

如果在一个用拉丁字母表示的p×p阶拉丁方上,再重上一个用希腊字母表示的p×p阶拉丁方.相重合的两个拉丁方中,每一个希腊字母与每一个拉丁字母共同出现一次,而且只出现一次,我们称这两个拉丁方是正交的(orthogonal),这样的设计称为希腊—拉丁方设计(Greco-Lation square).表12-7是一个4×4希腊-拉丁方的例子。

希腊—拉丁方设计,可系统控制3方面与实验无关的变异性,也就是存在3个方向的区组。该设计可容纳4个因素(行、列、拉丁字母和希腊字母),每一个因素都有p个水平,共做p2次实验。除p=6以外,所有p>3的拉丁方都有正交拉丁方.附表14列出一些正交拉丁方,可供参考。

希腊—拉丁方的统计模型为:

其中x

ijkl

是第i行,第l列,第j个拉丁字母和第k个希腊字母的观测值θi是第

i行效应,τ

i 是拉丁字母第j次处理效应,ω

k

是希腊字母第k次处理效应,ψ

l

是第l

列效应,ε

ijkl

是服从NID(0,σ2)的随机误差成分。正交拉丁方同样要求行、列、拉丁字母和希腊字母之间不存在交互作用。

希腊—拉丁方的方差分析与拉丁方的方差分析很相似。由于用希腊字母所表示的拉丁方与用拉丁字母所表示的拉丁方是正文的,所以由希腊字母所产生的平方和可以由每一希腊字母的总和计算出.因为第四个因素的引进,实验误差进一步缩小.具体计算方法归纳在表12—8中。表12—8中的。希腊—拉丁方方差分析的的零假

107

设为:Ho:τ

=0。处理均方是以误差均方做检验的.

i

12.5 两因素实验设计

12。5.1 两因素交叉分组实验设计

在9.1中已经涉及了两因素交叉分组设汁的大部分内容,在这里只补充另外一些应注意的问题。设有两个因素A和B,它们是培养基中的两种主要成分,为了优化培养基的构成,从成分A的a个浓度(水平)和成分B的b个浓度(水平)组合中,选出最优水平组合。显然,这是一个两因素固定模型实验.在设计和执行该方案时应注意以下几个问题.

(l)两个因素的水平组合共有“a×b种,所培养的纯系植株共有a×b株,至于哪一株用哪一种培养基培养,则完全是随机的.

(2)实验的安排完全是随机的,是以同样的精度考查这两个因素在培养基中的作用,没有哪一个精度高一些,哪一个低一些之分。

(3)在配制培养基时,如果将成分A只配a种浓度,然后从每一种浓度中取出a 份;成分B只配b种浓度,然后从每一种浓度中取出a份,A和B混合后,得到a×b个组合,这样做是错误的。

正确的做法是:成分A配a×b次,共配a种浓度,每一种浓度下共有b份,成分B配“a×b次.共配b种浓度,每一种浓度下共有a份,A、B混合后,得到a×b个组合.前一种处理方法不是真正的交叉分组,所得到的实验误差也不是真实的实验误差。

假设A因素有3个水平,B因素有4个水平,实验重复3次,全部实验共有36个处理。对于两因素交叉分组设计,36个同质性的材料中,哪一个实验材料接受哪一个处理,完全是随机的,下图是一种随机化的结果,直观地表达了实验安排方法。

12.5.2 两因素随机化区组实验设计

一个两因素交叉分组实验,若每一处理重复n次,全部实验共abn次(见9.1.1).这abn次实验的实验条件或实验材料必须具同质性。否则,由于实验材料或实验条件的差异所引起的误差会混杂在实验误差中,影响实验结果的可靠性.

为避免这种情况发生,与随机化完全区组的做法一样,将每一套水平组合安排

108

在一个区组中,也就是每一个区组是一个无重复的两因素交叉分组实验,n次重复构成了n个区组。由于每一个区组的规模变小了,同质性的要求容易得到满足。这样的一种设计称为两因素随机化区组设计。两因素随机化区组设计与随机化完全区组设计一样,随机化是受到限制的,需分两阶段进行,先在区组内的处理之间随机化,然后再在区组之间随机化.

例如,A因素有3个水平,B因素有4个水平,共设3个区组,下面举出一种随机化的结果,从图中可以明显看出与两因素交叉分组设计的不同,在这里随机化是分阶段进行的。

12。5.3 裂区实验设计

裂区设计(split-plot design)与两因素随机区组设计近似。不同点是后者在每一区组内A、B两因素的a×b次处理是完全随机化的。而裂区设计的每一区组内A 因素先分为a个处理,在每一处理内B因素再分为b个处理.随机化过程只能分别在A 因素的a个处理之间及B因素的b个处理之间进行。由A因素所划分的a个部分称为主区(main plot),每一主区再划分的b个部分称为次区(sub-plot)。

例如,用3种不同方法从植物中提取有效成分,按4种不同浓度添加到培养基中,观察对培养植株生长的促进作用,记录培养一个月后植株的重量。按两因素交叉分组设计安排实验,全部实验包话由A因素(提取方法)的3个水平和B因素(浓度)的4个水平所构成的12种处理。实验重复3次,完成全部实验共有36种处理。由于实验材料(培养的植株)的限制,一次无法得到36个同质植株,所以分为3个区组,每一区组内包括12种处理,每一区组内的12种处理是完全随机化的.这是一个两因素随机化完全区组设计,完成全部实验共需36批材料,经36次提取,得到36个方法×浓度组合,才能保证每一区组内的完全随机化。然而,根据实验的要求,需要更精密考虑的是不同浓度之间的差异,不同提取方法之间的比较要求不是非常严格.为此,可以把实验设计做如下的改进:

在每一区组内,每一提取方法只提取一次,把每一提取液稀释成4种不同的浓度,从而得到12个处理。这样的设计方式就是我们这一节所要讲的裂区设计。

每一区组内根据3种提取方法所划分的3个部分称为主区,提取方法称为主处

109

理(main treatment)。每一主区再划分的4个部分(4种浓度)称为次区,浓度称为次处理(subplot treatment)。裂区设计的随机化受到限制,不能在区组内进行完全随机化,只能分阶段进行。先在次区的4个水平间随机化,然后再在主区的3个水平间随机化,下面以图式方法说明该设计.

在裂区设计中,每一主区下各个次区的水平都是一样的。例如,次区的4个浓度是5%、l0%、15%和20%,那么在每一主区下的4个次区的浓度都是这4个水平。这一点与我们下面将要讲到的套设汁是不一样的。

用裂区设计可以减少一些实验工作量,但是假若在提取方法(主区)间存在某些不能控制的因素,而这些因素又随不同的提取方法而改变,这些不可控制因素的效应与提取方法的效应相混杂,降低了实验的准确性,但次区是不受影响的。因此,在裂区实验设计中,常常将要求精度低而且较次要的因素放在主区.而将要求精度较高而且较重要的因素放在次区.

如果实验因素多于两个,同样可以使用裂区设计,称为裂—裂区设计(split—split plot design).裂—裂区设计虽然比裂区设计复杂一些,但原理都是一样的。

12.5。4 套设计

如果在裂区设计中的实验不是3种提取方法,而是从3种不同药用植物中提取有效成分,然后加到培养基中,观测培养植株的生长量。因为不同植物有效成分的结构和含量不同,所以加到培养基中的浓度也不能一样.达时不再能使用裂区设计,因为在裂区设计中每一主区下的次区水平都是一样的,在这里每一药用植物下的浓度并不一样。在这种情况下,就要使用套设计(nested design)安排实验。以下图表示套设计的实验安排方法。

从图中可以看出,浓度1—4是嵌套在第一种植物下,浓度5-8是嵌套在第二种植物下,浓度9—12是嵌套在第三种植物下,由此得出套设计这一名称。在每一浓度下有n次重复。这个例子是一个因素嵌套在另一因素下,称为二级套设计。如果再嵌套一层,称为三级套设计.

12。6 正交设计

正交设计是多因素分析的有力工具,特别是要从许多因素中选出主要因素及其

110

111

最优水平时,使用正交设计是很方便的,可以用较少的实验次数得到较多的信息。 12.6.1 正交设计方法

用A 表示希腊—拉丁方的行,用B 表示列,用C 表示拉丁字母,用D 表示希腊字母,一个3×3希腊—拉丁方可以写为: 如果按因素和实验号编成表格,则如下表所示。

这张表有两个特点。第一个特点是:每一列中不同数字出现的数目相同,各出现3个1,3个2和3个3。第二个特点是:任取两列,同一行上的有序数对出现的次数相同。具有这种特征的表称为正交表(orthogonal array)。正交表是正交拉丁方的自然推广,但它并不同于正交拉丁方.例如,正交拉丁方的实验次数必须是除2和6以外的自然数的平方(2×2和6×6拉丁方不存在正交拉丁方)。另外,正交拉丁方不能考查因素之间的交互作用,但正交表不存在这样的问题.

正交表记为L N (m k ),N 表示实验次数,k 表示最多可容纳的因素数,m 为因素的水平数。L N (m 1k1×m 2k2)的含义与上述相同,表示可以安排k1个m1水平的因素和k2个m 2水平的因素,共做N 次实验。如L8(27)表示最多可以安排7个因素的2水平实验,实验共需做8次.L 16(42×29)表示做16次实验,最多容许安排2个4水平的因素和9个2水平的因素。表12—14是—个L 8(27)表。

表12-14的最上一行表示7个因素,最左边一列表示实验号,表体中的1和2表示各因素的水平数。如第1号实验是由各因素的第1水平构成。第2号实验是由l 、2、3因素的l 水平和4、5、6、7因素的2水平构成,依此类推。全部实验只需8次就够了.由此可见,用正文设计安排实验,可以大大减少实验次数。一个7因素2水平实验,若将各因素水平组合全部做一遍的话,需27=128次,而正交实验只需8次就可以了.虽然实验次数减少了,但因为各水平搭配得很均匀,8次实验基本上代表了全部实验的情况。

用正交表设计实验,个仅能分析出因素的作用,而且还能考虑因素之间的交互作用。L 8(27 )表的两列间交互作用可由表12-15给出.

如要查出列1和列2的交互作用列,查表12-15的第(1)行与第2列的交点得3,即列1和列2的交互作用列在第3列.又如,查列2和列4的交互作用列,查(2)

行与4列的交点得6,即列2和列4得交互作用列在第6列。附表15列出了一些常

用正交表,可供使用。

下面举一个用正交表安排实验的例子。设有3个因素A、B、C,每一因素取2水

平,利用L

8

(27 )安排实验。将因素A、B分别放在列1与列2上,然后从表12—15上查出A、B的交互作用,结果在第3列上.因此,因素C不能放在第3列,而应将它放在第4列上.A与C的交互作用在第5列,B与C的交互作用在第6列。BAC和ABC均在第7列,也就是ABC三者的交互作用列在第7列。一般情况下,三者的交互作用比较少,可以作为实验误差e。以上结果可以归纳成下表。

上表称为表头设计。它表示在L

8

(27 )表中的列1安排A因素,列2安排B因素,列4安排C因素。

在实验方案中不出现交互作用列,即在做实验时将交互作用列去掉,根据表头设计中A、B、C所在的列号(1、2、4)安排实验。由12-14中查出各因素的水平排列,制成下表(表12—16).

在对结果做分析时,应将交互作用列加上后再计算。

如果有4个因素A、B、C、D各有两个水平,用L

8

(27 )安排实验,仍像上面所讲的那样安排A、B、C,将D放在第7列,从表12—15查出A、D交互作用在第6列.B、D交互作用在第5列,C、D交互作用在第3列,所得表头设计如下:

12。6。2 正交设计的方差分祈

用L

8

(27 )表所设计的实验为例,说明正交设计的方差分析方法.

假设某个实验共有4个因素A、B、C、D都属于固定型,每一个因素取2个水平,根据专业知识和以往实验结果判断,只有因素A、B间存在交互作用。实验做如下安排:将实验做如下安排:将A、B、C、D分别放在1、2、4、7列,第3列是AB交互作用列,第5列和第6例是误差估计列,如下表所示(表12—17)。

方差分析的基本做法仍然是将总平方和分解

用A

1表示因素A所有1水平数据之和,A

2

表示因素A所有2水平数据之和,A表

示因素A所有数据之和,则:

例12.7 将细菌培养基中的3种成分A、B、C各改变2个水平,判断它们对细

112

菌生长的影响,其中A、B间和A、C间存在交互作用。

(27 )表,表头设计如下:解这是一个3因素2水平实验,可以采用L

8

因为B、C间不存在交互作用,因而第6列亦为误差估计列。实验结果列在表12-18中。Kl为对应于各因素1水平结果之和,K2为对应于各因素2水平结果之和,计算各平方和

将以上结果列成方差分析表(表12—19)。

从以上分析结果可以看出,各因素的主效应都不是主要影响因素,A×C交互作用为主要影响因素.B因素、C因素和AB交互作用均方都很小,可以看作误差的估计值。为了检验更可靠,将它们合并到误差项中,重新列出方差分析表(表12-20).

下一步从显著因素中选出最优水平。比较Al和A2,得A1高于A2,Al为最优水平。为了选出交互作用的最优水平,需列出两向表。将A因素和C因素各水平组合的结果填在下表中。例如,A1C1=38+34=72,A1C2=46+53=99

其中AlC2最好,所以A取Al,C取C2。若交互作用所取水平与主效应所取水平有矛盾的话,以交互作用为主。

从以上结果可以看出,正交设计不仅减少了实验次数,而且计算程序也简单得多。每一列的平方和就是该因素或交互作用的平方和,空白列平方和为误差平方和。对于因素数和水平数较多的实验,可参考书后给出的一些正交表。对于更复杂的实验请参阅有关书籍。

113

生物统计学第四版--教学大纲

课程简介 《生物统计学》是运用数理统计的原理和方法 来分析和解释生物界各种现象和试验调查资料的一 门学科,是生物学各专业的专业基础课。本门课程在第七学期进行,是在学生已学习了《高等数学》 课程和《植物学》、《动物学》、《生理学》、《遗传学》等生物学各学科的基础知识的基础上开设本门课 程。 本课程系统地介绍了生物统计学的基本原理和 方法,在简要叙述了生物统计学的概念、产生、发展和作用、生物学研究中试验资料的整理、特征数的 计算、概率和概率分布、抽样分布基础上,着重介 绍了平均数和频率的假设检验、X 2检验、方差分析、直线回归与相关分析、可直线化的非线性回归 分析、协方差分析、试验设计的原理和常用试验设 计及其统计分析、多元回归与相关分析和多项式回 归分析,同时简要介绍聚类分析、判别分析、主成 分分析、因子分析、典型相关、时间序列分析等多 元分析。 本课程的主要目的是培养学生具有生物学试验 设计的能力和对试验资料进行统计分析处理的能力. 一、教学环节和教学方法 1教学环节 本门课程为生物学的专业基础课,在第七学 期进行。学生已学习了《高等数学》课程和《植物学》、《动物学》、《生理学》、《遗传学》等生物学各 学科的基础知识,在此基础上开设本门课程。主要 教学形式为课堂讲授,主要教学环节包括课堂讲 授、辅导答疑、课外作业、习题讲解等。 2教学方法 以课堂讲授为主,研制电子教案和多媒体幻灯 片以及C A I课件,在教学方法和手段上采用现代

教育技术. 二、本课程的性质和任务 《生物统计学》是运用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的 一门学科,是生物学各专业的专业基础课.随着生物学的不断发展,对生物体的研究和观察已不再局限于定性的描述,而是需要从大量调查和测定数据中,应用统计学方法,分析和解释其数量上的变化,以正确制定试验计划,科学地对试验结果进行分析,从而作出符合科学实际的推断。《生物统计学》不仅提供如何正确地设计科学试验和收集数据的方法,而且也提供如何正确地整理、分析数据,得出客观、科学的结论的方法。其主要目的是培养学生具有生物学试验设计的能力和对试验资料进行统 计分析处理的能力。 主要任务是: 1、培养学生掌握正确收集、整理试验资料的方法。 2、培养学生掌握数据资料的基本统计分析方法。 3、培养学生掌握生物统计基本理论、基本技术和常用方法. 4、培养学生掌握常用的生物学试验设计方法并能对试验资料进行正确的统计分析. 5、培养学生掌握必要的计算技术,包括现行统计软件的使用方法。 三、本课程内容的基本要求 总体要求:熟练掌握所介绍的几种基本的生物统计方法;熟练掌握资料的统计分析;熟练掌握所介绍的几种基本的试验设计方法,能独立、正确进行试验设计。

《生物统计学与田间试验设计》教案

湖北省高等教育自学考试大纲 课程名称:生物统计学课程代码: 第一部分课程性质与目标 一、课程性质与特点 生物统计学是运用数理统计的原理和方法,来分析和解释生物科学实验中各种现象和实验调查资料的一门科学,它涉及生物科学实验的设计、实验方案的实施、数据的收集、整理和统计分析等;是生物科学专业必修的一门专业基础课。 二、课程目标与基本要求 通过本课程的学习,使学生了解生物科学实验的任务、要求,掌握生物科学实验设计的原则和技术,能熟练制定实验方案,进行生物科学实验的设计,并能根据生物统计学原理正确选用统计分析模型,进行数据的处理与分析,作出科学的结论。 三、与本专业其他课程的关系 生物统计学以数学的概率论和数理统计为基础,涉及到数列、排列、组合、矩阵、微积分等知识,但本课程并不将这些知识作为重点进行过多的讨论,而主要偏重于统计原理的介绍和具体分析方法的应用,培养学生运用统计学原理分析和解决实验资料所提供信息的能力。 第二部分考核内容与考核目标 第一章概论 一、学习目的与要求 通过本章的学习,了解课程的性质、地位和任务;生物统计学的发展史、现状及发展趋势;生物统计学在生物科学研究中的应用;深刻理解统计学术语的含义。 二、考核知识点与考核目标 (一)概论(重点) 识记:常用统计学术语 理解:生物统计学的基本概念 应用:理解几组常用统计学术语及各组概念的含义,并根据概念回答一些基本问题。(二)概论(次重点) 识记:生物统计学的内容 理解:生物统计学的作用 (三)概论(一般) 识记:生物统计学的发展简况及发展趋势 理解:近代描述统计学、现代推断统计学 第二章实验资料的整理与特征数的计算 一、学习目的与要求 实验资料的搜集和整理是对数据资料进行统计分析的首要环节。通过本章学习,了解实验资料的类型,掌握实验资料的收集与整理、次数分布表的制作方法,重点掌握资料的分组方法、特征数的计算(平均数、变异数等)方法,深刻理解相关概念的含义。 二、考核知识点与考核目标

生物统计学

1.总体:我们研究的全部对象 2.样本:从总体中抽出的一个部分 3.方差: 4.对立事件:如果事件A1和A2必发生其一,但不能同时发生,我们称事件A1和A2为对 立事件。 5.小概率事件:若随机事件的概率很小,例如小于、、,称之小概率事件。 6.小概率事件:原理小概率事件在一次试验中几乎是不会发生的。若根据一定的假设条件 计算出来该事件发生的概率很小,而在一次试验中竟然发生了,则可以认为假设的条件不正 确,从而否定假设。 7.抽样分布:从一个已知的总体中,独立随机地抽取含量为 n 的样本,研究所得样本的各 种统计量的概率分布。 8.标准正态分布:期望值μ=0,即曲线图象对称轴为Y 轴,标准差σ=1条件下的正态分布, 记为N(0,1)。 9.统计推断:根据抽样分布律和概率理论,由样本结果(统计数)来推论总体特征(参数)。 10.单尾测验:否定区位于分布的一尾的测验。 11.备择假设:与零假设相对立的假设称为备择假设。 12.接受区:接受无效假设的区间。 13.数学期望:随机变量Y 或者Y 的函数的理论平均数。 14.点估计:用样本数据所计算出来的单个数值,对总体参数所做的估计称为点估计 1.算术平均数的重要特征之一是离均差之和 ( C ) A 最小 B 最大 C 等于零 D 接近零 2.统计推断过程中,若我们拒绝H0,则 ( C ) A 犯错误 B 犯错误 C 犯错误或不犯错误 D 犯错误或不犯错误 变数变异程度的度量,对于总体()22i Y N μσ-=∑, 对于样本22()1Y y s n -=-∑。

3.两个平均数的假设测验用测验。( C ) A u B t C u或t D F 4.总体参数在区间[L1,L2]内的概率为1-,其中L1和L2在统计上称为( D )A 置信区间 B 区间估计 C 置信距 D 置信限 5.下列不是方差分析基本假定的是假定。( C ) A 可加性 B 正态性 C 无偏性 D 同质性 6.人口调查中,以人口性别所组成的总体是( C )总体 A 正态分布 B 对数正态 C 二项分布 D 指数分布 7.下列有关标准正态分布概率公式的计算中错误的是( D )A P(0u)=f (-u) C P(| U| > u)= 2 f (-u) D P (u1

生物统计学各章题目(含答案)

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现 代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变 量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). 12 2--∑∑n n x x )(

生物统计学课后习题解答李春喜

第一章概论 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。 第二章试验资料的整理与特征数的计算习题 某地 100 例 30 ~ 40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下: 计算平均数、标准差和变异系数。 【答案】=, s=, CV = % 试计算下列两个玉米品种 10 个果穗长度 (cm) 的标准差和变异系数,并解释所得结果。 24 号: 19 , 21 , 20 , 20 , 18 , 19 , 22 , 21 , 21 , 19 ; 金皇后: 16 , 21 , 24 , 15 , 26 , 18 , 20 , 19 , 22 , 19 。 【答案】 1 =20, s 1 =, CV 1 =% ; 2 =20, s 2 =, CV 2 =% 。 某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取 50 绳测其毛重 (kg) ,结果分别如下:

单养 50 绳重量数据: 45 , 45 , 33 , 53 , 36 , 45 , 42 , 43 , 29 , 25 ,47 , 50 , 43 , 49 , 36 , 30 , 39 , 44 , 35 , 38 , 46 , 51 , 42 , 38 ,51 , 45 , 41 , 51 , 50 , 47 , 44 , 43 , 46 , 55 , 42 , 27 , 42 , 35 ,46 , 53 , 32 , 41 , 48 , 50 , 51 , 46 , 41 , 34 , 44 , 46 ; 混养 50 绳重量数据: 51 , 48 , 58 , 42 , 55 , 48 , 48 , 54 , 39 , 58 ,50 , 54 , 53 , 44 , 45 , 50 , 51 , 57 , 43 , 67 , 48 , 44 , 58 , 57 ,46 , 57 , 50 , 48 , 41 , 62 , 51 , 58 , 48 , 53 , 47 , 57 , 51 , 53 ,48 , 64 , 52 , 59 , 55 , 57 , 48 , 69 , 52 , 54 , 53 , 50 。 试从平均数、极差、标准差、变异系数几个指标来评估单养与混养的效果,并给出分析结论。【答案】 1 =42 . 7, R=30, s 1 =7 . 078, CV 1 =16 . 58% ; 2 =,R=30 ,s 2 =, CV 2 =% 。 第三章概率与概率分布 解释下列概念:互斥事件、对立事件、独立事件、频率、概率频率如何转化为概率 什么是正态分布什么是标准正态分布正态分布曲线有什么特点μ和σ对正态分布曲线有何影响 已知 u 服从标准正态分布 N(0 , 1) ,试查表计算下列各小题的概率值: (1)P <u ≤ ; (2)P (-1 <u ≤ 1) ; (3)P (-2 <u ≤ 2) ; (4)P <u ≤ ; (5)P <u ≤ 。 【答案】 (1) ; (2) ; (3) ; (4) ; (5) 。 设 x 服从正态分布 N(4 , 16) ,试通过标准化变换后查表计算下列各题的概率值: (1)P(-3 <x ≤ 4) ; (2)P(x <; (3)P(x >; (4)P(x ≥ -1) 。 【答案】 (1) ; (2) ; (3) ; (4) 。

统计学教案

统计学教案 第一部分课程综述 一、课程性质 统计学是一门研究客观现象总体数量特征的方法论科学,具有综合性、应用性和数量性的特征。它系统地介绍了统计理论与方法的历史发展过程及其经典理论、学派、代表人物;较全面地阐述了统计基本理论与基本方法;特别是对二十世纪后期出现的新的统计理论与方法作了重点介绍,以便让学生更好地了解和掌握统计学的发展趋势和发展规律。 二、教学目的 《统计学》是高等院校财经类专业的必修课、核心课之一。为了使学生掌握市场经济条件下,数据资料的搜集加工、分析及预测方法,本课程将从实际应用入手,即在统计理论基础上重点阐述统计工作各个阶段、不同实际应用方面的操作方法,力求体现统计学的社会性与科学性相结合的特点。通过本课程的教学,使学生能够在理论联系实际的基础上,比较系统地掌握统计学的基本思想、基本理论、基础知识和基本方法;理解并记忆统计学的有关基本概念和范畴;掌握并能运用统计基本方法和技术进行统计设计、统计调查、统计整理和一定的统计分析,使学生掌握并应用该工具为自己所学专业服务,以提高学生科学研究和实际工作能力。 三、教学内容 1、考虑到财经类各专业未设置《统计学原理》与各专业统计课程,因而《统计学》的内容既包括统计方法,也包括必要的社会经济指标核算知识,使一般的统计理论方法,落实到实际的指标体系的运用上。 2、考虑到财经类各专业都需要加强数量分析能力的培养,因此,不但介绍一般的统计方法,而且还介绍了常用的数理统计方法在社会经济领域中的应用。 3、考虑到《统计学》是一门方法论方面的应用科学,因而在《统计学》中,一方面对于描述统计内容保持一定比例,另一方面也应加强统计分析、统计推断和统计核算方面的内容。 四、教学时数 五、教学方法 板书、幻灯片、多媒体、统计调查实践、上机实验等配合使用。 六、面向专业 财经类各专业及其他相关专业。 第二部分课程教学内容 第一章绪论 (一)教学目的 通过本章的学习,要求对统计学的内容、研究对象、性质、应用范围及基本方法,尤其是统计学的基本概念有正确的理解和认识。 (二)基本要求 要求首先对统计学这门课程有一个整体上的认识,了解这门课程的产生和发展过程,并进一步掌握其主要内容和基本方法。 (三)教学要点 1、统计一词的涵义、相互关系; 2、统计学的研究对象、及其学科性质; 3、统计的应用与基本方法; 4、统计学的基本概念,主要包括:总体、单位、样本、指标、变量。 (四)教学时数

生物统计学

生物统计学习题集 生物统计学课程组编写

第一章概论 1.什么是生物统计学?生物统计学的主要内容和作用是什么? 2.解释并举例说明以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。 3.误差与错误有何区别? 4.田间试验有哪些特点?保证田间试验质量的基本要求有哪些?

第二章试验资料的整理与特征数的计算 1.试验指标试验因素因素水平试验处理试验小区总体样本样本容量随机样本总体准确性精确性 2.什么是次数分布表?什么是次数分布图?制表和绘图的基本步骤有那些?制表和绘图时应注意什么? 3.标准误与标准差有何联系与区别? 4.算术平均数与加权平均数形式上有何不同?为什么说他们的实质是一致的? 5.平均数与标准差在统计分析中有什么用处?他们各有哪些特征? 6.试验资料分为哪几类?各有何特点? 7.简述计量资料整理的步骤。 8.常用的统计表和统计图有哪些? 9.算术平均数有哪些基本性质? 10.总体和样本差的平均数、标准差有什么共同点?又有什么联系和区别? 11.在对果树品种调查研究中,经观测所得的干周、冠高、冠幅、新梢生长量、萌芽率、花数、果数、座果率、单果重、产量等一系列数量资料,哪些是连续性数量,哪些是非连续性数量? -1 试根据所给资料编制次数分布表。 13.根据习题12的次数分布表,绘制直方图和多边形图,并简述其分布特征。

14.根据习题12的资料,计算平均数、标准差和变异系数。 15.根据习题12的资料,计算中位数,并与平均数进行比较。 16.试计算下列两个玉米品种10个果穗长度(cm)的标准差和变异系数,并解释所得结果。 24号:19,21,20,20,18,19,22,21,21,19 金皇后:16,21,24,15,26,18,20,19,22,19

生物统计学(第3版)杜荣骞 课后习题答案 第十二章 实验设计

第十二章实验设计 12.1一项关于在干旱地区生长的一种杨树(Populus euphratica),在土壤中的水分逐渐丧失后,其基因表达、蛋白谱、生态生理学及生长性能等方面产生可逆性改变的研究。作者在本实验的5个时间点上(H5为对照),用qPCR方法度量了该杨树叶子中的三个基因的转录丰度比[83],表中给出的为阵列数据: GenBank ID 基因H1H2H3H4H5 AJ 780 423 半胱氨酸蛋白酶0.7 1.0 2.3 13.1 1.9 AJ 780 698 环核苷酸和钙调节的离子通道 1.5 1.2 3.0 4.3 1.5 AJ 777 362 核糖体蛋白 1.1 1.1 1.0 0.9 1.2 借用上述数据,以三个基因作为三个区组,计算在5个时间点上转录丰度比差异是否显著? 答:随机化完全区组实验设计方差分析的程序,类似于两因素交叉分组实验设计。以下是本题的程序和结果: options linesize=76 nodate; data poplar; do block=1 to 3; do time=1 to 5; input trans @@; output; end; end; cards; 0.7 1.0 2.3 13.1 1.9 1.5 1.2 3.0 4.3 1.5 1.1 1.1 1.0 0.9 1.2 ; proc anova; class block time; model trans=block time; run; The SAS System The ANOVA Procedure Class Level Information Class Levels Values block 3 1 2 3 time 5 1 2 3 4 5 Number of observations 15 The SAS System The ANOVA Procedure Dependent Variable: trans Sum of Source DF Squares Mean Square F Value Pr > F Model 6 72.5560000 12.0926667 1.53 0.2809

生物统计学概念及统计工作的流程教案

生物统计学概念及统计工作的流程教案 教案:生物统计学概念与统计工作流程 一、知识目标 1. 了解生物统计学的基本概念; 2. 掌握统计工作的流程; 3. 能够运用生物统计学方法进行数据分析。 二、教学重点 1. 生物统计学的基本概念; 2. 统计工作的流程; 3. 生物统计学方法在数据分析中的应用。 三、教学难点 1. 对生物学数据的处理和分析; 2. 生物统计学方法的应用。 四、教学内容及安排 一、生物统计学的基本概念 1. 概念 生物统计学是把统计学的原理和方法应用于生物科学中的一门科学。它不仅是生物学的基础,也是生物学的重要分支之一。其作用是基于对生物学数据的处理和分析,得出量化结论,并对生物学现象做出解释和预测。 2. 数据类型 生物学数据类型包括定量数据和定性数据两种。定量数据可进行数字化处理,如体重,身高等;定性数据是指不可量化数字的(如眼色,毛色等)。 3. 生物统计学中的数据描述方法 生物统计中常用的描述方法有:平均数(arithmetic mean)、标准差(standard deviation)、变异系数(coefficient of variation)。 二、统计工作的流程 进行生物统计学分析有以下步骤: 1. 问题的设定和数据的收集 首先需要明确问题,确定所需收集的数据。

2. 数据预处理 数据预处理主要是进行数据清洗,即去除异常值,缺失数据的处理。 3. 统计分析 首先需要对数据进行描述统计学分析;然后进行推断统计学分析,包括假设检验和置信区间估计等;最后需要进行数据可视化。 4. 结论 通过统计分析得到的结论需要根据实际场景进行解释,并提出建议。 三、生物统计学方法在数据分析中的应用 生物统计学方法在生物学中有广泛的应用,例如: 1. 方差分析; 2. 二项分布; 3. 相关分析; 4. 多元回归分析; 5. 生存分析等。 五、教学方法 讲授生物统计学的基本概念和统计工作的流程,对每个步骤进行解释和演示。通过实例讲解生物统计学方法在数据分析中的应用,引导学生自行完成实验数据的处理分析。 六、教学资源 统计软件,实验数据。 七、教学评估 通过课堂小测验、抽查、课堂讨论等方式对学生的掌握情况进行评估。 八、教学反思 通过不断完善教材、教学方法和评估方法,提高教学效果,使学生更好地理解和掌握生物统计学。同时,老师要不断自我学习,掌握新的数据分析方法,跟上学科发展的步伐。

生物统计附试验设计教学设计

生物统计附试验设计教学设计 一、教学目标 通过本课程的学习,学生应该具备以下能力: 1.掌握生物统计学的基础概念和理论知识; 2.能够运用常见的生物统计方法和技术分析实验数据; 3.能够设计和实施生物统计实验,并进行数据分析和解释; 4.能够使用统计软件进行数据处理和分析; 5.培养学生从数据分析、结果解释和提出结论等方面进行科学思维和分 析问题的能力。 二、教学内容 1. 生物统计学基础概念 本部分主要介绍生物统计学的基本概念和理论,包括统计学的定义、统计量、概率分布、假设检验和置信区间等。 2. 生物统计方法和技术 本部分主要介绍生物统计学中常用的方法和技术,包括t检验、方差分析、回归分析、相关分析和非参数检验等。 3. 生物统计实验设计 本部分主要介绍生物统计实验设计的基本步骤和方法,包括实验因素确定、实验设计、实验方案的制定和实验方案的评估等。

4. 数据处理和分析 本部分主要介绍数据处理和分析的方法和技术,包括数据清洗、描述统计、推 断统计和图形分析等。同时,还将介绍常用的统计软件和其使用方法。 5. 实验报告撰写 本部分主要是培养学生写实验报告的技巧和方法,包括实验设计、数据处理、 结果分析和结论提出等方面。 三、教学方法 本课程采用讲述、练习实践和实验设计等多种教学方法,重点注重实验设计和 实验报告写作,让学生在实践中掌握生物统计学的相关理论和技术。同时,课程中还将使用多种案例分析和应用实例,让学生对生物统计学的理论和工具有更深刻的理解和应用。 四、教学评估 本课程的教学评估主要包括平时成绩、期末考试和实验报告评分三部分。具体 分数占比如下: 1.平时成绩:20% 2.期末考试:50% 3.实验报告评分:30% 通过本课程的学习和评估,学生应该能够获得系统化的生物统计学知识和技能,为未来的学术和职业发展打下坚实的基础。

「《生物统计附试验设计》教案」

「《生物统计附试验设计》教案」 生物统计是生物学的一个重要分支,旨在帮助我们理解和分析生物实 验数据。试验设计是生物统计中的一个重要概念,它指的是和实验相关的 一系列决策,包括确定实验的目的、确定实验的因素和水平、随机分配实 验单位、以及确定实验的重复次数等等。本教案将介绍生物统计附试验设 计的一些基本概念和方法。 一、教学目标 1.了解生物统计在生物学研究中的重要性; 2.掌握生物统计附试验设计的基本概念和原则; 3.了解一些经典的生物统计附试验设计方法; 4.培养学生分析和解读生物实验数据的能力。 二、教学内容 1.生物统计的基本原理和方法(200字左右) -介绍生物统计的基本概念和原理,包括总体和样本、统计量和参数、零假设和备择假设等; -介绍生物统计的基本方法,包括描述统计和推断统计。 2.经典的生物统计附试验设计方法(400字左右) -简介完全随机设计、随机区组设计和阻止设计等经典的试验设计方法,包括设计原理和实际应用;

-分析和解读生物实验数据的方法,包括方差分析、t检验和卡方检验等。 3.实际案例分析(400字左右) -挑选一些生物学研究中常见的案例,例如药物疗效评价、生长速度比较等; -指导学生对实际数据进行分析和解读,包括数据处理、方差分析和统计推断等。 4.教学方法(100字左右) -以案例教学为主,引导学生主动思考和分析实际问题; -结合实际实验操作,让学生亲自体验生物统计附试验设计的过程; -利用互动教学和小组讨论的方式培养学生的合作和创新能力。 三、教学过程 1.生物统计的基本原理和方法(20分钟) -分配教材或电子资料供学生预习; -上课前检查学生对基本概念的理解,并解答疑问; -讲解生物统计的基本原理和方法,引导学生进行思考和讨论。 2.经典的生物统计附试验设计方法(40分钟) -介绍完全随机设计、随机区组设计和阻止设计的原理和应用; -示例实验:设计一个完全随机设计的生物实验,并指导学生进行实际操作;

2019-2020年高中数学 3.2 2“生物统计学”课程信息教案 新人教A版选修选修2-3

2019-2020年高中数学 3.2 2“生物统计学”课程信息教案新人教A版选修选 修2-3 1.课程名称 (1) 2.课程性质 (1) 3.课程学时 (1) 4.课程学分 (1) 5.课程简介..........................................................................................(1)6.教学大纲 (1) 7.教学日历 (7) 8.讲授提纲 (14) 9.思考题 (35) 10.参考文献及阅读书目 (35) 11.教师简介 (35) 课程名称: 生物统计学 课程性质:必修课 总学时:72学时 学分:4学分 课程简介: 生物统计学是生态专业和生物技术专业开设的一门专业必修课。本门课程是概率论与数理统计原理和方法在生物科学中的应用,它研究数据的搜集、整理和分析,在生物科学的很多领域以及农业科学和医学科学中发挥了重要作用,是一门重要的方法论科学。通过本课程的学习,可以学会如何合理地进行试验设计和野外调查,对所获取的数据资料如何进行科学地分析。掌握统计推断检验

等方法,并能够应用这些方法对研究对象的客观规律性做出种种合理的估计和判断。培养学生在实际工作中应用统计方法的基本能力,树立学生实事求是的科学态度。

生物统计学教学大纲 课程性质:必修课 课程教学目的:生物统计学是应用概率论和数理统计的基本原理和方法,研究生物科学领域数据的搜集、整理、分析的一门应用性学科,它在生物科学的很多领域以及农业科学和医学科学中发挥了重要作用,是一门重要的方法论科学。 通过本课程的教学,使学生掌握统计学的基本原理和方法知识,学会如何合理地进行试验设计和野外调查,对所获取的数据资料如何进行科学地分析。让学生掌握统计推断检验等方法,并能够应用这些方法对研究对象的客观规律性做出种种合理的估计和判断。培养学生在实际工作中应用统计方法的基本能力,树立学生实事求是的科学态度。 课程教学原则和教学方法 本门课程的教学重在培养学生的应用能力,所以在教学中不侧重于公式的数学推导过程,而着重于对基本概念、方法原理的正确理解。以教材为中心,适当补充相关知识,并学习有关的统计学软件,利用计算机来大大提高效率。 教学以讲授为主,突出重点、难点,多运用启发式语言,鼓励学生积极思考,引导并培养学生尽快适应概率统计特有的思维方式。有关概念的引入要侧重客观背景的阐述。各种统计推断方法的讲授要侧重统计思想的论述。通过运用多媒体中丰富的图片资料、各种实验的模拟演示,活跃课堂气氛,激发学生的求知欲。在学习完课程的全部内容后,引入一些研究实例,让学生进行课堂讨论,内容包括如何进行试验设计或确立调查方案,对所获取的数据资料应该用什么方法进行分析。通过讨论提高学生分析问题和解决问题的能力。运用多媒体介绍统计软件的使用,让学生进行分组操作练习,如果条件允许,可在计算机房进行这部分的学习。在每节的内容学习完后,留2-3个作业题。既可以使学生巩固所学的知识,也可使教师在批改作业时发现存在的问题,及时解决。作业成绩计入平时成绩。 总学时:72学时 教学内容要点及建议学时分配:

生物统计学教案

生物统计学教案(1)

《生物统计学》教案 第一章统计数据的收集和整理 教学时间:2学时 教学方法:课堂板书讲授 教学目的:重点掌握样本特征数平均数、样本方差、标准差的概念和计算方法,掌握数据类型及频数(率)分布,了解众数、中位数、变异系数。 讲授难点:样本方差、标准差的概念和计算方法 1.1 总体与样本 1.1.1 统计数据的不齐性 1、变异性是自然界存在的客观规律。 2、自然界如果没有变异,也就不需要统计学了。 3、生物学研究的对象都是很大的群体,不可能研究全部对象,只能通过研究其中的一部分,来推断全部对象,于是引出以下概念。 1.1.2 总体与样本 总体:研究的全部对象。 个体:总体中的每个成员。 样本:总体的一部分。 样本含量:样本所包含的个体数目。 1.1.3 抽样 抽样:从总体中获得样本的过程。 随机抽样:总体中的每一个个体被抽中的机会都相同的一种抽样方法。 放回式抽样:从总体中抽出一个个体,记下其特征后,放回原总体中,再做第二次抽样。 非放回式抽样:从总体中抽出个体后,不再放回,即做第二次抽样。 抽样的目的:从总体中获得一个有代表性的样本,以便通过样本推断总体。 应注意的问题:①样本必须有代表性。②样本含量与可实施性之间的平衡。 1.2 数据类型及频数(率)分布

1.2.1 连续型数据和离散型数据 连续型数据:与某种标准比较所得到的数据。又称为度量数据。 离散型数据:由记录不同类别个体的数目所得到的数据。又称为计数数据。 1.2.2 频数(率)分布表和频数(率)分布图的编绘 例1.1 调查每天出生的10名新生儿中体重超过3公斤的人数, 共调查120天,结果如下: 表 1-1 每10名新生儿中体重超过3Kg的人数的 频数(率)分布表 频数(率)分布:把频数(率)按组值的顺序排列起来,便得到离散型数据的频数(率)分布。 频数(率)分布还可以用图形表示,见图1-1。 图1-1 每10名新生儿中体重超过3Kg的人数的频数分布图 下面介绍连续型数据的频数(率)分布表和分布图的编绘方法。

生物统计学教案设计

合用 授课日历(学期授课计划)周次起讫时间课次日 / 月节次学时内容纲领(章、节) 1 第 1章统计数据的收集与整理 第 1 周8月 22日至 8月23日3~ 4 2 第一节整体与样本 8月26日第二节数据种类及频数分布 第三节样本的几特色数 2 第 2章概率和概率分布 第 1 周8月 22日至 8月26日3~ 4 2 第一节概率的基本看法 8月26日第二节概率分布 第三节整体特色数 3 第 3章几种常有的概率分布律 第 2 周8月 29日至 8月30日3~ 4 2 第一节二项分布 9月2日第二节波松分布 第三节别的几种失散型概率分布 4 第 3章几种常有的概率分布律 第 3 周9月5日至 9月6日3~ 4 2 第四节正态分布 9月9日第五节别的几种连续型概率分布 第六节中心极限制理 9月5日至 5 第 4章抽样分布 第 3 周9月9日3~ 4 2 第一节从一个正态整体中抽取的样9月9日 本统计量的分布 9月 13日至6 第 4章抽样分布 第 4 周9月14日3~ 4 2 第二节从两个正态整体中抽取的样9月16日 本统计量的分布 第 5 周9月 19日至7 9月20日3~ 4 2 第 5 章统计推断 9月23日第一节单个样本的统计假设检验 第 5 周9月 19日至8 9月23日3~ 4 2 第 5 章统计推断 9月23日第二节两个样本的差异显然性检验 第 6 周9月 26日至9 9月27日3~ 4 2 第 6章参数估计9月30日第一节点估计 第 7 周10月10日至10 10月11日3~ 4 2 第 6章参数估计 10月14日第二节区间估计10月10日至 11 第 7章拟合优度检验 第 7 周10月14日3~ 4 2 第一节拟合优度检验的一般原理10月14日 第二节拟合优度检验 第 8 周10月17日至12 10月18日3~ 4 2 第 7章拟合优度检验10月21日第三节独立性检验10月24日至 13 第 8章单因素方差解析 第 9 周10月25日3~ 4 2 第一节方差解析的基根源理10月28日 第二节固定效应模型 第 9 周10月24日至14 10月28日3~ 4 2 第 8章单因素方差解析10月28日第三节随机效应模型

生物统计学教案:两因素及多因素方差分析及一元回归及简单相关分析

生物统计学教案 第九章 两因素及多因素方差分析 教学时间:5学时 教学方法:课堂板书讲授 教学目的:重点掌握固定模型、随机模型两因素方差分析的方法步骤,掌握混合模型 的方差分析,了解多因素的方差分析方法。。 讲授难点:固定模型、随机模型两因素方差分析的方法步骤 9.1 两因素方差分析中的一些基本概念 9.1.1 模型类型 交叉分组设计:A 因素的a 个水平和B 因素的b 个水平交叉配合,共构成ab 个组合,每一组合重复n 次,全部实验共有abn 次。 固定模型:A 、B 两因素均为固定因素。 随机模型:A 、B 两因素均为随机因素。 混合模型:A 、B 两因素中,一个是固定因素,一个是随机因素。 9.1.2 主效应和交互作用 主效应:由于因素水平的改变所造成的因素效应的改变。 A 1 A 2 A 1 A 2 B 1 18 24 B 1 18 28 B 2 38 44 B 2 30 22 先看左边的表。A 因素的主效应应为A 2水平的平均效应减A 1水平的平均效应,B 的主效应类似。 当A 1B 1+A 2B 2=A 1B 2+A 2B 1时,A 、B 间不存在交互作用。这里A 1B 1+A 2B 2=62,A 1B 2+A 2B 1=62,因此A 、B 间不存在交互作用。 交互作用:若一个因素在另一因素的不同水平上所产生的效应不同,则它们之间存在交互作用。 20 2 241824438226 2361824424221211222121112212=+-+=+-+==+-+=+-+=B A B A B A B A B B A B A B A B A A

现在看右边的表。 A(在B 1 水平上)=A2B1-A1B1=28-18=10 A(在B 2 水平上)=A2B2-A1B2=22-30=-8 显然A的效应依B的水平不同而不同,故A、B间存在交互作用。交互作用的大小为 AB=(A 1B 1 +A2B2)-(A1B2+A2B1) 9.1.3 两因素交叉分组实验设计的一般格式 假设A因素有a水平,B因素有b水平,则每一次重复包含ab次实验,实验重复n次,总的实验次数为abn次。以x ilk表示A因素第i水平,B因素第j水平和第k次重复的观测值。一般格式见下表。 因素 B j=1,2,…,b B 1B 2 …B b总计 A 1x 111 x 121 x 1b1 x 112 x 122 x 1b2 x 11n x 12n x 1b n x 1. . 因 素A2x211x221x2b1 A x 212x 222 x 2b2 x 21n x 22n x 2bn x 2. . A a x a11 x a21 x ab1 x a12 x a22 x ab2 x a1n x a2n x abn x a. . 总计x.1. x.2.x.b.x. . .

生物统计学教案(5)

生物统计学教案(5)

服从N (0,1)分布,可以从正态分布表中查出样本抽自平均数为μ的总体的概率,即 P (U >u ), P (U <-u ), 以及P (|U |>u )的概率。如果得到的值很小,则 x 抽自平均数 为μ0的总体的事件是一个小概率事件,它在一次试验中几乎是不会发生的,但实际上它发生了,说明假设的条件不正确,从而拒绝零假设,接受备择假设。 显著性检验:根据小概率原理建立起来的检验方法。 显著性水平:拒绝零假设时的概率值,记为α。通常采用α=0.05和α=0.01两个水平,当P < 0.05时称为差异显著,P < 0.01时称为差异极显著。 3、临界值 例 从上述动物群体中抽出含量n =10的样本,计算出 x =10.23g ,并已知 该批动物的总体平均数μ绝不会小于10.00g ,规定的显著水平α=0.05。根据以上条件进行统计推断。 H 0: μ=10.00 H A : μ>10.00 根据备择假设,为了得到x 落在上侧尾区的概率P (U > u ),将x 标准化,求 出u 值。 P (U >1.82)=0.03438,P < 0.05,拒绝H 0,接受 H A 。 在实际应用中,并不直接求出概率值,而是建立在α水平上H 0的拒绝域。从 正态分布上侧临界值表中查出P (U > u α)= α时的u α值,U > u α的区域称为在α水平上的H 0拒绝域,而U < u α的区域称为接受域。接受域的端点一般称为临界值。本例的u =1.82,从附表3可以查出u 0.05=1.645, u > u α,落在拒绝域内,拒绝H 0而接受H A 。 4、单侧检验和双侧检验 上尾单侧检验:上例中的H A :μ>μ0,相应的拒绝域为U > u α。对应于H A :μ>μ0时的检验称为上尾单侧检验。 下尾单侧检验:对应于H A :μ<μ0时的检验称为下尾单侧检验。 n x n x u 40 .000.100 -= -= σ μ82 .110 40 .000 .1023.100 =-= -= n x u σ μ

试验统计方法教案设计的

实验统计方法 第一章绪论 1、合理地进行调查或试验设计,科学地整理、分析所收集得来的资料是生物统计的根本任务。 2、生物统计在植物科学研究中的作用: (1)提供试验或调查设计的方法——合理地收集必要而有代表性资料。 (2)提供整理分析资料的方法。 ①整理资料的基本方法——绘制统计表、统计图; ②统计分析最重要的内容——差异显著性检验; ③统计分析的另一个重要内容——对试验指标或植物性状间的关系进行研究,即相关回归分析。 3、科学研究的一般流程: 4、常用分析资料的统计分析: 5、生物统计学:用数理统计学的原理来收集、分析、表达和解释生物现象的科学。 6、近代描述统计学。

英国人高尔登——生物统计学之父。 贡献:①首先在生物学研究中应用统计方法;②提出『变异』、『相关』、『回归』等概念和方法。 1886年,高尔登在论文中提出『在遗传中身长向中等身长回归』观点,正式提出『回归』概念。 7、现代推断统计学。由定性转为定量;变革在农业田间试验中完成。 (1)哥塞特的t检验与小样本思想;1908年提出『平均数的概率误差』概念。 (2)R·费雪(在统计学的地位非常显赫)提出『抽样分析』、『方差分析』、『随机化原则』等概念和方法。 第二章资料的整理 一、常用术语 1、总体:根据研究目的而确定的研究对象的全体。 2、样本:从总体中抽出的用于研究总体的部分个体称为样本。(n>30为大样本,n≤30为小样本)。 3、样本容量:样本中所包含的个体数目,记为n ,对应总体参数为N 。 4、随机样本:指总体中的每一个个体都有同等的机会被抽取组成样本。 5、参数(总体特征数):μ—总体平均数δ—总体标准差(希腊字母) 统计量(样本特征数):x—样本平均数S—样本标准差(拉丁字母) 二、资料的分类﹛数量性状资料、质量性状资料、半定量(等级)资料﹜ 1、数量性状:能够以测量或计数的方式表示其特征的性状。 2、数量性状资料:观察测定数量性状而获得的数据。 3、连续性变数:量、测手段得到的计量资料; 间断性变数:计数方式得到的计数资料。 4、质量性状:能观察到而不能直接测量的性状。 5、质量性状转化为数量性状的方法:(1)统计次数法;(2)分级法。

生物统计学教案(12)

生物统计学教案(12)

生物统计学教案 第十二章实验设计 教学时间:2学时 教学方法:课堂板书讲授 教学目的:试验设计的原理、意义、原则;常用试验设计方法。 讲授难点:正交实验设计、随机化完全区组设计 12.1实验设计的基本原则 实验设计的两个基本原则是重复(replication)和随机化(randomization)、局部控制。 12.1.1 重复 所谓重复就是将一基本实验重做一次或几次。例如,测定不同年龄组正常人血红蛋白含量实验,在每—年龄组内测一人,即为一基本实验。若将这一基本实验验重做5次,即每一年龄组,抽取5人测血红蛋白含量.则称该实验有5次重复。我们这里所讲的重复,是指将“基本实验”重做一次或几次,而不是指一次基本实验的结果重复测量多次。 例如,我们想分析大豆籽粒中VD的含量。这一基本实验包括以下过程:随机选取若干大豆,磨成豆粉,取一定数量的豆粉,乙醇回流抽提脂肪,提取液皂化,萃取,层析分离、纯化,在265nm下测吸光度,最后计算出VD的含量。重复实验必须是上述过程的完整重复。 设置重复的意义:①只有设置重复才能得到实验误差的估计。标准差是通过重复得到的,有了标准差才能得到标准误差。②只有设置重复才能推断出处理效应。如两种药物实验,A药物一人10天痊愈,B药物12天痊愈,并不能说明A比B就好。 12.1.2 随机化 随机化是指实验材料的配置和实验处理的顺序都是随机确定的。 假设药效受年龄的影响,服用A药的年青,服用B药的年长,这时药效与年龄

的效应混杂,即使两种药物不同,也不能判断是否是药物的差异。 12.1.3局部控制——试验条件的局部一致性 (增加) 局部控制是指在试验时采取一定的技术措施或方法来控制或降低非试验因素对试验结果的影响。在试验中,当试验环境或试验单位差异较大时,仅根据重复和随机化两原则进行设计不能将试验环境或试验单位差异所引起的变异从试验误差中分离出来,因而试验误差大,试验的精确性与检验的灵敏度低。为解决这一问题,在试验环境或试验单位差异大的情况下,根据局部控制的原则,可将整个试验环境或试验单位分成若干个小环境或小组,在小环境或小组内使非处理因素尽量一致。每个比较一致的小环境或小组,称为单位组(或区组)。因为单位组之间的差异可在方差分析时从试验误差中分离出来,所以局部控制原则能较好地降低试验误差。 以上所述重复、随机化、局部控制三个基本原则称为费雪(R.A.Fisher )三原则,是试验设计中必须遵循的原则,再采用相应的统计分析方法,就能够最大程度地降低并无偏估计试验误差,无偏估计处理的效应,从而对于各处理间的比较作出可靠的结论。试验设计三原则的关系和作用见图12-1所示。 图12-1 试验设计三原则的关系 12.2 实验计划书的编制(自习) 重 复 三 原 则 随机化 局部控制 无偏估计误差 降低误差 估计误差 作 用 统计推断 提高精确性

相关主题
文本预览
相关文档 最新文档