当前位置:文档之家› 田间试验与统计方法(独本农学自考资料)

田间试验与统计方法(独本农学自考资料)

田间试验与统计方法(独本农学自考资料)
田间试验与统计方法(独本农学自考资料)

第一章绪论

试验资料的收集、整理和分析的意义:1.研究任何事物或现象,不仅要有质的分析,而且还应有量的分析,要研究事物的量变和质变。2.要研究量的问题,必须考虑试验结果的准确性;3.控任何科学分析都不能离开观察数据的处理;4.农学和生物学试验所得的观察数据往往受多种因素的影响。

生理学家巴甫洛夫说过:“对自然科学来说,一切决定于方法。”

化学家门捷列夫指出:“只有当观察者,相信能获得尽可能的准确数字时,试验材料才可靠。”

生物统计学:就是应用数量统计原理和方法来分析和解释生物学上的数量变化的一门科学。

初创生物统计学的英国优生学的创始人高尔顿(1822—1911)曾指出,生物统计学是应用于生物学科中的现代统计方法。

生物统计的主要功用:1.利用生物统计方法收集、整理和分析试验数据,使大量的数字提炼成统计数、数学议程和统计图,以认识事物数量变异的规律;2.生物统计为试验设计规划提供理论依据,把生物统计应用到试验设计上去,可以提高试验的设计与分析的准确性、合理性;3.应用生物统计可以合理估计试验误差,判断试验的表面效应,为试验者提供预见性;4.生物统计可提供由样本推断总体的科学方法。

试验设计:研究安排试验并对结果进行统计分析的一门科学。

试验设计的步骤:首先要明确试验目的,需要回答那些问题,怎样搜集试验数据,估计什么效应,如何统计推断等问题都需要认真考虑、仔细研究。

生物统计与试验设计的关系:1.生物统计是试验设计的理论基础;2.田间试验的结果也要借助于生物统计方法进行分析,生物统计是随着田间试验要求精确度的提高而不断发展,试验的精确性与试验方法密切相关;综上表明,生物统计与试验设计联系紧密、不可分割。

生物统计学的主要内容:三大部分。1、资料整理及其特征数的估算;2、统计假设测验;3、相关与回归。

生物统计的基本特点:以样本推断总体。在大样本情况下,通过资料的初步整理后计算主要的统计数。以此样本的结果推断总体的特征,一是资料的集中性,以平均数来表示;二是资料的离散性,以标准差来表示;三是衡量平均数的可靠性,以标准误大小来表示。

统计假设测验:1、平均数假设测验。指两个样本平均数间的比较;2、卡方测验。就是计数资料的统计分析方法;

3、方差分析。是多个平均数间的比较。

相关:研究两个或两个以上变数之间相互关系的密切程度和性质,称为相关。常以相关系数来表示。

回归:是指两个或两个以上的变数存在着依存关系,即一个变数变化时,引起另一个变数的相应变化。

试验设计:是指试验工作应用生物统计原理,制订试验方案,选择试验对象,合理分组,使用较少人力、物力和时间获得较多而可靠的信息,得出科学的结论。

试验设计的主要任务:用最大的努力尽可能减少试验误差,增强检验的能力,主要通过重复和试验技术来实现,使试验能达到相当的准确性和可靠性。

田间试验设计的内容:根据试验目的选用一组试验处理进行比较,确定试验用的试验单位或小区,以便布置试验处理;决定布置试验处理的原则,确定每个试验单位或小区应测量或记录的项目。

生物统计和试验设计与其他学科的关系:生物统计学是建立在概率论与数理统计,以及生物科学的基础上的,但它又为试验设计、数量遗传学、育种学和其他学科的学习奠定了基础。

学习生物统计与试验设计的方法和要求:

1、方法。生物统计学是数学与生物学相结合的一门边缘学科,必然所包含的数学公式较多。在学习时,首先要懂得生物统计的概念、基本原理和统计方法,以及公式的基本意义,应用条件和范围。要学好生物统计学,必须认真地多做习题,加深对公式及其统计方法、步骤的理解。要达到熟练地应用统计方法,必须联系农业和生物科学的实际问题,深刻理解统计分析的意义,着重于统计方法与原理紧密结合起来,把抽象的概念与直观内容结合起来,把理论和实际结合起来,才能做到统计方法的灵活运用。

2、要求。通过学习生物统计和试验设计养成重视数据的习惯,做到写文章要有理有据,看书时注意其中统计表格、统计图与数字,以及它的分析和解释,以熟悉资料表达的方法,善于透过数学分析了解事物的本质和规律。

第二章田间试验概述

田间试验的意义:1.农业是国民经济的基础,农业的发展靠科技。2.田间试验是大面积生产的准备阶段,是农业科学试验的主要形式。3.田间试验对于研究农业生产的理论问题具有重大的意义。3.为了解决农业生产实际问题而进行农业科学研究时,田间试验应占重要的和不可代替的地位,它是农业科学理论与农业生产实践联系的桥梁。

田间试验的基本任务:是在自然或田间条件下研究新的品种和增产技术,客观地评定优良品种及其适应区域,正确地鉴定增产技术措施及其运用范围,使科研成果能够合理地应用和推广,尽快转化为生产力,发挥其在农业生产上的作用。

田间试验的具体任务:1推动农业生产和农业科学向前发展。2联系农业科学与生产实践的桥梁。3开展农业科学研究,改良品种和改进农业生产技术。

田间试验的特点:

(一)复杂性。田间试验研究的对象是农作物,在自然的条件下进行试验,不同作物有它自己的生长发育规律,各具有不同的遗传性,同一作物的不同品种也具有不同的特性。因此,它们对外界环境条件各有不同的反映,必须在不同环境条件下进行一系列的田间试验,才能确定各地区最能适应的作物品种和相应的栽培技术。

(二)地区性。农业生产的最大特点之一是地区性很强。任何优良品种,栽培技术,病虫防治及改土、施肥等措施都因时间、地点和条件的不同,而表现出不同的增产效果,这就说明农业田间试验也具有地区性。因此,在试验过程中必须慎重考虑供试品种及其种子来源;必须考虑供试植株的数目,使其有足够的代表性;还要注意取样的技术等问题,以增加试验的代表性和正确性,减少试验误差。

(三)季节性。由于农作物生长发育受着气候条件的限制和影响,所以农作物田间试验的季节性很强。田间试验的周期长,从试验开始到结束,常常需要农作物的整个生长季节,有的一年只进行一次,有的试验还要继续进行若干年,才能获得比较正确的结果。

(四)试验误差。田间试验因受外界环境条件的影响,特别是客观存在的土壤不一致性,使田间试验的结果都包含着试验误差。因此,在进行田间试验的过程中,既要讲求田间试验技术,尽量减少试验误差,又要应用生物统计方法来分析试验的结果,以达到合理估计误差和得到正确的比较。

田间试验的要求:1试验目的要明确:在大量阅读文献与社会调查的基础上,明确选题,制订合理的试验方案。对试验的预期结果及其在农业生产和科学实验中的作用要做到心中有数。2试验条件要有代表性:试验条件应能代表将来准备推广试验结果的地区的自然条件与农业条件。3试验结果要可靠:在田间试验中准确度是指试验中某一性状的观察值与其理论真值的接近程度;越是接近,则试验越准确。精确度是指试验中同一性状的重复观察值彼此接近的程度,即试验误差的大小,它是可以计算的。试验误差越小,则处理间的比较越为精确。4试验结果要能够重演:所谓重演性是指在相同条件下,再次进行试验或实验,应能获得与原试验相同的结果。

准确性与精确性:统计工作是用样本的统计数来推断总体参数的。我们用统计数接近参数真值的程度,来衡量统计数准确性的高低,用样本中的各个变量间变异程度的大小,来衡量该样本精确性的高低。因此,准确性不等于精确性。准确性是说明测定值对真值符合程度的大小,而精确性则是多次测定值的变异程度。

试验因素:在试验中某一被试验的项目称为因素或因子,它是指试验研究的对象。即在试验中使其他因素不变,有意识把某一因素作不同方式的改变,以考察其效果,这个因素就称为试验因素。

因素水平:因素水平简称水平,一个试验因素内不同状态或不同数量等级,称为水平。

试验处理:试验处理简称处理,在试验中具体比较的项目,也称为处理。在单因素中因素的每个水平就是一个处理。在多因素试验中不同因素的不同水平组合,也称为处理。在单因素试验中,实施在试验单位上的具体项目就是试验因素的某一水平,故对单因素试验时,试验因素的一个水平就是一个处理。在多因素试验中,实施在试验单位上的具体项目是各因素的某一水平组合,所以,在多因素试验时,试验因素的一个水平组合就是一个处理。

试验单位:试验单位简称单元,施加处理的材料单位,称为试验单位。

试验指标:衡量试验结果的标准,称为试验指标。它因试验目的不同而异,在农业试验上指标可以是产量或某一性状。参数:由总体的全部观察值计算得的总体特征为参数,它是该总体真正的值,是固定不变的,总体参数不易获得,通常用统计数来估计参数。

统计数:由标本观察值计算得到的样本特征数为统计数,它因样本不同常有变动。它是估计值,根据样本不同而不同。

田间试验的种类(一)按试验因素多少分:单因素试验、多因素试验、综合因素试验;(二)按试验研究内容分:品种试验、栽培试验(密度、播种期、播种量、播种方法等)、肥料试验、农药试验;(三)按试验规模分:单点试验、多点试验;(四)按试验期限分:单季试验、长期试验;(五)按试验小区大小分:大区试验、小区试验、微区试验。

单因素试验:在同一试验中只研究某一因素的不同水平的效果,称为单因素试验。这类试验方法简单、目的明确,对某一问题能够比较详细的分析,而且分析方法比较简单,但不能综合起来看问题,无法了解几个因素间的相互关系,常会得出不全面的结论。因为各项农业技术措施是相互制约、相互影响。因此,单因子的试验结果在不同条件下不能广泛应用。

多因素试验:在同一个试验中,同时研究两个或两个以上的因素时,除了所研究的因素外,其他条件完全一致,而各因素都分为不同水平,各因素不同水平的组合,即为试验的处理,这类试验称为多因素试验。其结果可以较全面的说明问题,在生产实践中应用价值较大,它是在单因素试验的基础上设置的,也能够分析计算出每个因素单独存在时的相对效果,以及它们相互配合的效果。从试验效率来看,多因素试验比单因素试验高。但是,在拟定多因素试验方案时,包括的因素和处理数目不宜过多,以免试验方案过于复杂、难于分析,而多因素相互作用的明显意义也较难说明。

综合试验:在多因素试验中,各因素的不同级别互相组成平衡的处理组合,但综合试验没有这种限制,可使处理数大大减少。这是按生产实践或科学实验中总结出来的许多因素结合在一起的栽培技术措施进行大面积的栽培试验,通过与一般大田生产技术进行比较,以得出较优的综合性栽培技术,在大面积上推广应用。实践证明,综合试验对发展农业生产有重要作用。选取适合当地条件的综合性丰产技术作为试验处理,与当地常规处理作比较,选出较优的综合性处理,对于推广丰产经验,总结增产规律,提高农业生产是一种迅速有效的途径。

效应:试验因素的相对独立作用,也就是因素对性状所起的增进或减少的作用,称为效应。分为简单效应、平均效应和互作效应。

简单效应:在某因素同一水平上,另一因素不同水平的产量差异,称为简单效应。

平均效应:一个因素内各简单效应的平均数,称为平均效应。也称主要效应,简称主效。

交互作用:某个因素内两个简单效应的差数平均称为交互作用,简称互作。

试验方案:是根据试验目的与要求所拟定的进行比较的一组试验处理的总称。

试验方案分类与优缺点:㈠完全方案:它是多因素试验的最简单的一种设计方案,也是一种全面试验。首先要确定试验的因素和水平,将所有的试验因素各个水平组合起来,每一组合就是一个处理,处理数等于每个试验因素水平数的乘积。这种设计方案的优点是完全、均衡,不仅可以分析每个因素的主效,还能获得两个、三个因素间的互作效应;缺点是处理数太多,试验方案过大时,则试验难以进行。这种设计最好在试验因素水平较少时应用。

㈡不均衡方案:它是一种不完全方案,将完全方案中一些次要的处理去掉,可构成不均衡方案。

㈢均衡不完全方案:它是部分试验代替全面试验,做到试验因素水平间的均衡搭配、整齐可比,又减少了试验处理数,正交设计就是一种均衡不完全方案设计。

试验方案的内容:(1)确定处理选用什么试验单位;(2)选取的处理样本容量,处理分配给试验单位的方法,田间试验指小区排列方法;(3)观察指标;(4)抽样方法;(5)实验数据处理方法。

确定试验方案的要点:(1)拟订方案应根据试验任务所提出问题的多少,而决定采用简单或复杂的试验方案,一般宜采用简单试验方案,以免对试验设计,统计分析和结果解释带来一定困难;(2)试验方案应包括有比较的因素;(3)处理间的比较应强调唯一差异原则;(4)试验方案内的处理级别必须明显,级别间的差异要适当,使其效应容易表现;(5)简化方案过程中应考虑统计分析的特点;(6)尽量排出非试验因素的限制。

唯一差异原则:为保证试验结果的严格可比性,在试验中进行处理间比较时,除了处理因素设置不同的水平外,其余因素或其他所有条件均应保持一致,以排除非试验因素对试验结果的干扰,才能使处理间的比较结果可靠。

试验误差:对田间试验的要求,必须有相当的准确性,由于田间试验受到非处理因素的影响,使得试验处理的真实效应不能正确地反映出来,常常使得观察值与处理真值发生差异,这种差异称为试验误差,简称误差。试验误差分为系统误差和随机误差,一般所指的试验误差为随机误差。

系统误差:又称为片面误差,是因为仪器不良或试验地肥力按一定方向变化,或观测人员的习惯与偏向。这种误差是在同一条件下产生的,误差值较接近,正负误差值的出现相同。如果认真选择试验地,合理规划试验区,校正仪器和个人偏向,这种误差可以避免或减小。

随机误差:随机误差又称为偶然误差,这种误差是由于偶然原因或难以控制的因素所引起的。

这种误差是随机产生的,数值大小和正负值的出现并不一定,只能通过试验设计使它减小,通过统计分析进行估计。随机误差是衡量试验精确度的依据,其值愈小表示试验的精确。

试验误差的来源:(一)试验材料固有的差异;(二)试验操作和管理技术的不一致所引起的差异;(三)环境条件的差异。

控制误差的途径:(一)选择同质一致的试验材料;(二)改进操作和管理技术做到标准化;(三)控制引起差异的外界主要因素。

控制土壤差异的措施:①选择合适的试验地;②采用适当的小区技术;③应用正确的试验设计和相应的统计分析。

试验设计的基本原则:费歇在1935年出版的《试验设计法》一书中,提出了试验设计应遵循的重复、随机和局部控制的三个基本原则。其作用是(1)降低试验误差;(2)获得无偏的、最小的试验误差估计;(3)准确地估计试验处理效应;(4)对各处理间的比较能作出可靠的结论。

重复:是指在同一个处理内设置两个以上的试验单元,田间试验的重复次数,是指同一处理种植的小区数。

重复的主要作用:是降低试验误差,多次重复的平均值比单一的观察值能更准确地反映处理的效果,使处理间的比较更为有效。

确定试验重复次数的多少应根据:(1)试验地的面积及小区的大小;(2)试验地土壤差异大小;(3)试验所要求的精确度;(4)试验材料种子的数量。

随机:费歇提出随机原则是为了保证各处理平均数是无偏估计值,误差的估计也是无偏的。简单地说,就是估计值不夸大、不偏低。随机就使得每个试验单元都有同等的机会被试验者从总体中抽取,每种处理都有同等机会分配给某个试验单元。在田间试验中可以使各处理在试验地中占居任何一个小区的机会均等。随机是正确估算试验误差的前提,也是应用生物统计方法分析试验结果的前提。随机必须在设置适当重复次数的基础上才能发挥其作用,随机方法可采用抽签或随机数字表等。

局部控制:就是分范围、分地段地控制非处理因素。田间试验就是将比较的试验处理设置在土壤较均匀的局部地段内,以便控制非处理因素和减少试验误差,使各处理所受的影响趋向于最大程度的一致,就叫做局部控制。

局部控制的方法:可将试验地按重复次数划分为相同数目的区组。如有较为明显的土壤差异,最好能按肥力划分区组,每一区组再按供试品种数或处理数划分小区,一个小区安排一个不同品种或处理。

无偏估计:当一个统计量的数学期望值等于所估计的总体参数时,则称该统计数为其总体参数的无偏估计。

试验地的选择:正确选择试验地对控制试验误差,提高试验正确性有很大作用。除试验地所在的自然条件和农业条件应具有代表性外,还应尽可能地符合下列要求:1.试验地要有代表性;2.试验地要平坦;3.试验地肥力要均匀一致;4.试验地的位置要适当.

空白试验的具体方法:是在选择的土地上用同一作物而质量相同的种子,在同一时间内采用相同的播种方法、耕作、施肥、管理等技术措施。播种的作物应采用植株比较矮小,宜于条播的禾谷类作物。一般来说中耕作物和豆科作物是不适宜的,因为中耕作物行距较大,难于正确反映出土壤差异情况,而豆科作物对土壤中的氮素反映不灵敏。在收获前划分成面积相等的小区,分别收割和计算产量,一般小区面积约为6.67m,也可根据土壤差异程度和试验地大小,灵活改变。分区收割计算的小区面积愈小,则所包含的地段复杂性愈完全,如此所得到的产量表,便可以对该试验地2

的土壤肥力的复杂性有一个概念,并可根据对试验精确度的要求,用产量表来确定小区的面积、形状和重复次数。

如何来消除土壤差异:(一)匀地播种:其目的是使土壤肥力均匀。播种用的种子质量要求纯净一致,耕作、播种和田间管理也要一致。(二)多施有机肥及深耕:可以减少土壤差异,如果结合匀地播种,效果更好,并为以后的试验地建立良好的肥力条件。(三)合理轮作:建立试验地的轮作制,若某一试验地在上季进行了对土壤均匀性影响较大的试验,则在下季就不宜在这块地上进行试验,而应作一般生产地,以恢复地力的均匀性;若土地少,不够轮换,也必须设法尽力消除土壤差异。(四)合理小区排列:在同一地区连续进行两次试验,小区的排列应采用相反的方向,以减少小区的土壤差异。

小区技术:是指田间试验中科学地设计和布置小区的方法。

试验小区:在田间试验中每个处理所占的小块土地,称为试验小区,简称小区。

小区合理设置包括:1.小区面积:试验小区面积的大小与减少土壤差异的影响和提高试验的精确度有相当关系。小区间变异系数随着小区面积的增加而下降,在确定一个试验的小区面积时,要从试验的性质、作物种类、试验地土壤差异的程度与形式、育种工作的不同阶段、试验地面积、试验过程中的取样需要、边际效应和生长竞争等方面考虑。间作、套作试验,机械化耕作试验,以及植株高大的作物,试验小区面积宜大;播种期、播种量等一般栽培试验,以及植株比较矮小的作物,小区面积宜小。在育种试验的初期阶段,小区面积宜小;在育种试验的高级阶段,必须采用较大面积, 2.小区形状:是指小区长度与宽度的比例,常有长方形和正方形两种。长方形小区易使同一重复内各小区肥力比较一致,便于观察、比较、记载和田间操作管理。而方形小区周长最短,计产面积占小区面积的比率最大。长方形小区的试验误差常比方形小区小。小区的长宽比例,可以根据试验地的形状、面积以及小区大小等决定。3.重复次数:重复次数的多少,对提高试验的精确性关系很大。因为一个品种或处理只种植一个小区,有时在同一试验内几个小区土壤肥瘦不均,而引起较大的误差。重复试验几个小区,并把这些小区各品种或处理可能处在相似的土壤条件下,试验结果更为精确。但重复超过一定次数,误差减少很小,精确度增加较小,而花费人力和物力较多。重复次数的多少,应根据试验精确度的要求,试验材料的变异性,土壤差异情况,试验地的面积,小区的大小,试验小区排列的方法,试验处理数目,以及种子数量多少等而具体决定。对试验的精确度要求高,重复次数宜多,反之宜少。4.对照区的设置:田间试验应设置对照区作为各个处理或品种比较的共同标准,这种对照处理或品种小区就称为对照区,又称为标准区,英文缩写“CK”或俄文缩写“К”表示。设置对照区的目的,是为了便于在田间观察,比较各个处理或品种的优劣时,作为比较的标准;还可以利用对照区估计和矫正试验地的土壤差异。

5.保护区的设置:在全试验区四周种植不计产的区域称为保护区或保护行,使供试处理(或品种)能在比较一致的条件下安全生长发育。保护区的作用是保护试验材料不受人、畜等的践踏和损害,防止靠近试验地周围的小区受到空

旷地的特殊环境影响,即边际效应。降低试验误差,提高试验精确度,使处理间能有正确的比较。如果各重复排列分散,则各重复的周围也应设置保护区。保护区种植行数,以试验中可能产生的边际效应而定。保护区种植的品种,可用对照种,最好用比对照种稍为早熟的品种,以便先收保护区,后收试验区,避免混杂。同时,可以减少雀鸟对试验作物的危害。6.区组和小区的排列:在田间排列重复时,应注意重复的形状以尽可能接近方形为好,有利于减少同一重复内小区间的土壤差异,至于重复间的排列可采用多种形式。原则是同一重复或区组内的土壤肥力应尽可能相似一致,而不同重复间可以存在尽可能大的差异。

田间试验程序:是指从制订试验计划起,经过田间区划,播种管理,观察记载,收获考种以及试验结果的整理分析与总结等步骤的全过程。1.试验计划的制订;2.试验地区划;3.种子准备;4.整地、播种或移栽;5.栽培管理;6.田间观察记载;7.田间评比与室内考种;8.收获与脱粒。

拟定试验计划的原则:目的性要明确,围绕中心问题进行设计,做到有的放矢。设计不能过于繁杂,否则会导致试验结果分析的困难;设计要根据选题的性质;设计要考虑到当地试验条件,特别是生产条件;设计要考虑技术力量和条件;设计要考虑继续性;设计要考虑方式。

处理效应:是处理因素作用于受试对象的反应,是研究结果的最终体现。

区组:将整个试验环境分成若干个最为一致的小环境,称为区组。

田间试验计划内容:

(1)试验名称;

(2)试验目的及其依据,包括现有的科研成果、发展趋势以及预期的试验效果;

(3)试验年限和地点;

(4)试验地的基本情况,包括土壤、地形、地势、位置、水利条件以及轮作方式等;

(5)试验处理方案,包括试验作物品种名称、处理名称、数量和试验方法等;

(6)试验设计,包括试验设计方法、小区面积、形状及重复次数,保护行、走道、排水沟的设置,试验地的总面积等;

(7)试验地耕作、播种和田间管理措施,及其质量要求;

(8)田间观察记载和室内考种,分析测定项目及方法;

(9)试验的取样和收获计产方法;

(10)试验资料的统计分析方法和要求;

(11)试验的土地面积,所需人工、经费及主要仪器设备;

(12)试验计划书应附有田间种植图、观察记载表等;

(13)计划书编制人及执行人。

种植计划书:包括试验名称、试验年份与地点、田间种植图、种植行号或区号、处理名称或代号、田间记载项目等。育种试验的种植计划书内容:一般包括品种或品系名称(或代号),种子来源(或原产地),去年种植区号(或行号),今年种植区号(或行号)和田间记载项目等。

试验地区划:试验地在规划前,必须做好充分的准备工作。试验地面积、地形以及土壤差异等情况先要进行详细测定,根据试验地实际情况,结合试验内容,进行周密而合理的田间设计,作出正确的田间布置图。要求图形的正确性要达到实际工作时,可完全按照它进行操作,在图中要规定小区面积、形状、各重复的位置及走道,保护行的设置等详细内容,注明标志和距离,以便按图进行试验地的具体规划。关于走道的设计,一般是重复间的走道要宽些,小区的走道要窄些,当小区面积很小时,则小区间往往不必设置走道,只在小区间空出一定距离便于区分。试验地周围的保护行,应在适当地点设出入走道,以便田间工作。为了使肥料质量一致,厩肥必须是充分腐熟,混合均匀,施用时最好采用分格分量的方法,以达到均匀施肥。当试验地的准备工作完成后,就可按照种植计划书进行实地规划。在规划试验区时,必须注意位置恰当,形状整齐,面积精确。一般田间区划时,先把整个试验区,包括各个重复区、保护行、走道等,总的长度和宽度计算外,根据地形及小区方向确定试验区的位置。在不规则的田地设置试验时,全试验地边界先要拉直,不能简单采用与田边或地边平行的方法,否则试验区可能变形。要使试验区形状规划整齐,可先在试验地一角用木桩定点,用绳索将试验区的一边固定下来,再在定点处划出一个直角,在此直角处另立一根绳,即为试验区的第一边,再在第二边的末端定点,用相同的办法划出直角,就可得第三边和第四边。在整个试验区划出后,再用直角尺、绳子、木桩等,按田间种植图划分重复、小区、走道、保护行等。小区划出后,插上编号木牌(或竹牌)等标志后,即可准备播种。

种子准备:按种植计划书的要求准备种子,试验用的种子质量要高,来源相同,播种前种子应经过精选去杂,并进行种子消毒。一般作物品种的种子大小差异很大,发芽率和混杂程度也各不相同,因而不能只按重量计算播种量,先要测定品种种子的千粒重和发芽率,以便计算播种量,使各小区或各行的苗数基本相等,以免造成植株营养面积与光照条件的差异。育种试验播种量常以粒数计算,初期阶段,材料较多,而每一材料的种子数量较少,不可能进行发牙试验时,

要求每行或每小区播种粒数基本相等。移栽作物,如水稻等的秧田播种量也应按照这一原则推算,并适当增加播种量。在育种试验后期要进行产量比较,其播种量依据试验作物在当地生产上所采用的播种量和品种的特性确定。但由于种子大小不同,故在品种试验或栽培试验(播种量试验除外),播种量应按所要求的播种密度(粒数)、种子净度、发芽率、千粒重和种子用价来校正,然后正确地算出各小区所需要的播种量。按照种植计划书的顺序准备种子,可避免错误。根据计算好的各行(或各小区)播种量,称量种子,每行(或每小区)的种子装袋后,在袋上写明试验名称,品种名称或代号和计划书上的编号(或行号),这些工作完毕后,应按计划书上各小区的排列顺序进行校对一遍,贮备播种。需要药剂拌种以防治苗期病虫害的,应在准备种子时,作好药剂拌种,以减少缺苗。

()0.001

/1000g kg =

???播种量每亩应播发芽种子粒数千粒重亩种子用价

种子用价=种子净度?种子发芽率

()0.001

/1000g kg =

???播种量每亩应播发芽种子粒数千粒重亩发芽率

()22666.67m

m =

??每行应播粒数每亩应播发芽种子粒数每行平均面积发芽率

整地、播种或移栽:在试验地的耕作技术上要求达到较高质量,宜采用当地的先进耕作技术,做到深耕细耙,平整细致,耕作深度要一致,并在1-2天内完成。而且耕作的方向必须和同一个重复的各小区的方向垂直,以免小区间的耕深不一致,以减少土壤差异等。犁耙等工作的范围应延伸到试验边界外1-1.5m,这样试验范围内的土层比较一致。播种前须按规格开行或打窝,并根据田间种植图的区划,插上行号(或区号)牌,经查对无误后才按行号(或区号)分发种子袋,经核实无误开始播种。播完一个重复再播另一个重复,如发现错误,立即纠正,并在记载本上相应地段改正注明,复查无误才进行盖种。当前,试验一般都是人工播种,要求开行伸直,行长整齐,播种均匀,深浅一致,避免漏播,播种时不要踏在厢上,以免踩坏小区,引起种子混杂。当小区较小时,播种材料很少,而要求较高,宜用播种板,以便精确地按密度播种。如用播种机播种,应注意小区形状,要符合播种机的要求。要按规定调整好播种量,播种机速度要均匀一致,不能行走偏斜,而且种子必须播在一条直线上。每小区播种机开始和结束工作的地段,由于播得不均匀,不能作产量计算部分,用机器播种应先将重复内相同小区播完后,再播其他小区,以免一再清洗播种机的麻烦,同时可以避免混杂。在播种以后,还须核定每区的实际播种量(放入箱中的种子量减去剩下的种子量),并记录下来。出苗后要及时观察所有小区的出苗情况,如发现小部分漏播或过密等缺点,必须及时补救。如果大量缺苗,则应测量面积,详细记载,以便在计算产量时除去不计,但还须及时补播,以免影响邻近植株,发生边际效应。对于幼苗移栽或块根、块茎作物的栽种,须先播种在秧田或苗床,应适当多播种子,保证供应试验区的秧苗。移栽要挑选大小均匀的秧苗或分等级按比例分配于各小区,以减少试验材料的差异,提高试验的精确性。在运秧中防止发生差错,最好用小竹牌或塑料牌等标明试验处理或品种代号,随着秧苗分送到各小区查对无误,再行栽植。移栽时,要按照预定的窝行距,利用绳索标号以控制植株行距,保证一定的密度,使其营养面积均匀。移栽后多余的秧苗可留在行(区)的一端,以备在必要时进行补栽。待整个试验区播种(或移栽)完毕后,接着播种或移栽保护行,并将实际播种情况在田间记载本上的前页绘制田间种植图,供今后查对。

栽培管理:试验地的栽培管理措施应达到当地的先进水平,又要做到及时,否则不能正确鉴定品种和新技术的增产效果。除了设计所规定的处理间差异外,其他栽培管理技术应力求一致,否则,也不能正确反映试验处理间的差异。为此,要求试验地的任何一项管理措施最好能在一天内完成,至少同一重复要在一天内完成。施肥水平最好能符合当地高产经验的施肥水平,施用的肥料质量要一致,并且要施得均匀,施用的深度和时间要适当,以使整个试验具有均匀一致的营养条件,以减少试验误差。施用有机肥料时,要预先拌合均匀,避免堆放在小区内,可以堆放在道路上,每个小区的施肥量要求相同。为了做到施肥均匀,可以将试验区划分成面积大小一定的若干部分,然后计划每部分应施入的肥料数量,并分别均匀撒开。施用矿质肥料需按肥料中的有效成分算出每一试验区的施用量。当在同一小区施用几种矿质肥料时,如何混合施用较好,需要充分搅拌。如肥料容易吹散或用量太少时,则可混合一定量的细土。由于无机肥料对植物生长发育的影响很显著,故应采用分格、分行、分量施用的方法或分次施用,当第二次施用留下的一半肥料时,就可以弥补前一半肥料施用不均的缺点。关于中耕、除草、灌溉、排水、病虫害防治等管理措施,各有它的技术操作特点,同样要求做到尽可能一致。总之,要认真仔细地做好各项田间作业,实施惟一差异原则,尽量避免或减少人为的差异,以减少试验误差,提高试验的精确度。

()

()2666.67kg m kg ?每小区施用量=

每亩施用有效成分的量小区面积肥料中有效成分的百分数

()666.67;a c kg b

a kg

b

c ??---每小区施用量=每亩施用某种有效成分的量肥料中有效成分的百分数;

每一试验小区的面积.

田间评比与室内考种:在田间试验过程,应对试验作物和各主要生育期进行田间评比,对各处理(或品种)的长势、长相、丰产性能和抗逆性等进行评比,以补观察记载的不足,田间评比应邀请有实践经验的农民、干部和技术人员共同参加,虚心听取他们的意见,作出客观评价。在田间不便或难于考查,而须在作物收获后才能观察记载和测定的一些项目,可以在室内测定和分析。当作物接近成熟,在收获前应及时按规定选取样株,捆扎后挂上有编号标记的纸牌或小竹牌,带回室内考种、测定分析。作考种用的样株须先悬在室内,让其自然干燥,防止鼠、雀、虫害,并及时进行考种。考种时要严格规定进行操作测量,才能取得正确数据,对试验作出正确结论。

收获与脱粒:田间试验必须细致地进行收获工作,做到及时、准确,以保证获得的各小区产量能够互相比较。如果收获时发生了错误,将会使整个试验受到影响,甚至前功尽弃。收获前须先准备好收获、脱粒用的材料和工具,如绳索、塑料牌、纸牌、布袋、纸袋、脱粒机械、翻晒工具等。

田间观察记载的项目:①气候条件的观察记载,对于特殊的气候,及所引起的作物生长发育的变化,试验人员应及时观察记载以供分析试验结果时参考②田间农事操作的记载,包括整地、施肥、播种、中耕、除草、等操作的日期、数量、方法等。③作物动态的记载和测定,要观察作物的各个生育期或称物侯期、形态特征、特性、生长动态、经济性状等。此外,发芽率、出苗率、病虫害、以及其他偶然因素所造成的缺苗、黄化、枯萎等现象也许记载,所有记载项目最好预先写在计划书上或另立记载表格,装订成册。

收获的技术原则:1.确定小区的实际计算面积;2.及时进行收获;3.仔细计算小区产量。田间的收获、运输脱粒、翻晒、贮藏等工作必须由专人负责,建立验收制度,随时查对。

缺区部分:是指小区中,除处理条件外的特殊情况所引起的显著差异部分。

计算产量有直接和间接两种方法:直接方法就是全部收获试验小区上的植株,脱粒称重;间接方法是当小区面积过大或收获季节阴雨连绵时应用,可分为两种。1.在收获时结合取样,称量样本的“湿重”及整个小区产量的湿重后,把样本带回风干后,称取各样本的干重和种子重来推算全区的产量。2.采用部分面积植株脱粒的方法,以推算全小区的产量。

第三章资料的整理

统计学的基本内容:统计资料的搜集,统计资料的整理和统计资料的分析。

总体:统计学研究的对象是具有相同性质个体所组成的群体,这个符合指定条件的研究对象的全体,称为总体或集团。其中的一个研究单位称为个体。总体所包含的个体数可以是无穷的,常常是指设想的或抽象的总体;而无时间、空间的限制,称为无限总体。总体包含的个体数也可能是有限的,是实存的总体,称为有限总体。

二项总体:在间断性的随机变数中,其总体包含两项,即非此即彼的两项,它们构成的总体称为二项总体。

样本:在统计学上常常从总体中抽取部分个体作为总体的代表来进行研究,被抽取的这部分个体组成为样本或称子样。样本中所包含的个体数,称为样本的容量,记为n 。在试验中样本容量n≥30的样本,称为大样本;n<30的样本,称为小样本。

随机样本的要求:①代表性,要求样本每个分量X i 与研究的总体X 具有相同的分布;②独立性,就是,,,11X X X n 为相互独立的随机变数,即每个观察结果既不影响其他的观察结果,也不受其他观察结果的影响。

观察值和变数:每一个体的某一性状的测定数值,称为观察值。同一性质的一群观察值总称为变数。

参数和统计数:从总体的全部观察值计算所得的数值是能够表达总体特征的真值,如总体平均数等称为参数。总体参数一般未知,常用希腊字母表示,如总体平均数μ,总体方差2

σ等。从样本中的各个观察值计算所得数值,反映样本的特征数,如样本平均数等称为统计数,它是总体参数的估计值。统计数常随样本不同而异,一般用拉丁字母表示,如

样本平均数x ,样本方差2s 等。

统计表:通过试验或调查得到很多说明各种现象的统计数字,将大量的统计数字资料经过汇总整理后,按一定顺序和格式列在表上,这个表就是统计表。简单地说,填有统计指标的表格就称为统计表。任何一种统计表都是统计表格与统计数字的结合体,没有统计数字的统计表只能视为统计表格。广义的统计表就是指统计工作者所用的各种表格,包括调查表、汇总表、计算表、分析表以及各种各样容纳统计资料的统计表。

统计表的作用:统计表是在统计调查中搜集和登记资料的重要工具,又是汇总和积累统计资料的必要手段,也是统计分析和运用统计资料的工具。统计表可以容纳很多统计资料,反映多方面的信息,用它表达统计资料,不仅条理清晰,简明扼要,而且便于比较和提高统计分析的效果。

统计表的优点:可以概括为能有条理地、系统地排列统计资料,使人在阅读时一目了然;能合理地、科学地组织统计资料,使人在阅读时便于对照比较。简单地说,只要看图表,就能比阅读长篇大论的文章更清楚。

统计表的构成:从统计表的外形结构来看,一般包括总标题、横行标题、纵栏标题和指标数值四个部分。1.总标题是表的名称,用以概括统计表中全部资料的内容。一般填写在表的上端中部。2.横行标题是横行的名称,在统计表中通常用来表示各组的名称。它代表统计数所要说明的对象,一般写在表的左边。3.纵栏标题是纵栏的名称,在统计表中通常用来表示统计指标的名称。一般写在表的上边。4.指标数值列在各横行标题与各纵栏标题的交叉处。

统计表的内容:包括主词和宾词两部分。表的主词是统计表所要说明的总体,它可以是各个总体单位的名称,总体的各个组,或者是总体单位的全部,通常列在横行标题的位置,如上表中试验地点。宾词是用来说明主词的各个指标,包括指标名称及指标数值。通常列在纵栏标题的位置,但有时,为了编排合理和阅读方便,也可以互换。

统计表的种类:统计表根据主词是否分组和分组的程度,分为简单表、分组表和复合表。1.简单表:是主词未经任何分组的统计表。它的主词可以按总体单位的名称、地区排列,或者是按时间顺序排列。2.分组表:是主词按某一标志进行分组的统计表,利用分组表可揭示现象不同类型的不同特征,研究总体的内部结构,分析现象之间的依存关系。3.复合表:是主词按两个或两个以上标志进行复合分组的统计表,它具有双重比较的作用,既可在每组各条形间比较,也可对各组同类条形间进行比较。

编制统计表的原则:要遵循科学、实用、简明、清晰、准确、醒目和美观等原则。

资料的分类:1.数量性状资料;2.质量性状资料。

数量性状:是指以量测或计数表示其特征的性状。可分为计量资料(是用度量衡等计量工具测量所得到的资料)和计数资料(是用计数方式所得到的资料)。

数量性状分类:1.计量资料:是用度量衡等计量工具测量所得到的资料,由于每次测得的结果随个体而异,因此,可用作区别和描述个体的特征。这种资料的各个观察值可以是整数,也可以是小数。在统计学中,把可取某一范围内的所有值的变数,称为连续性变数。2.计数资料:是用计数方式所得到的资料。因而这种资料的各个观察值必须用整数来表示。这种资料的各个观察值是不连续的,称为离散性变数,也称为间断性变数。

计数资料分类采用的尺度:(1)公称尺度;例如,对于省市的统计,可用不同的数字代表不同的省和直辖市。又如性别的统计,可令男性记为1,女性记为0。(2)等级尺度;如年龄、学生的成绩分组、作物抗病性的分级、茶叶品质的分级等,它们不是真实的距离,只是相对的位置。(3)间距尺度;温度计可以说明划分尺度时的人为习惯,0℃等于32℉,而0℃不是没有温度。其他如日历、智商等所用的尺度都属于这类。

质量性状:是指可以观察、描述和计数,而不能量测的性状。可采用统计次数、公称尺度或等级尺度的方法。 统计次数的方法:在一定总体内,统计其具有某种性状的个体数目与不具有某种性状的个体数目,按两种类别统计次数或相对次数。例如,在160株豌豆植株中有120株为红花,40株为白花。这类资料也称为次数资料。

分级的方法:根据性状的变异情况分级,给予每类性状相当数量的方法,统计样本中属于各个级别的个体数。例如,调查作物病害情况,将作物的抗病性分为高抗、抗、中抗、中感、感病5个级别,分别用1,2,3,4,5表示其数量,统计样本内各种级别的植株数。

公称尺度的方法:每类性状以相当数量代表。例如,小麦籽粒颜色有红、白,可用0代表白粒,1代表红粒;反之亦然,1代表白粒,0代表红粒。

连续性变数资料整理与分组:采用组距式分组法。1.求全距:将得到的原始数据,从小到大按顺序排列,从所有观察值中找出最大和最小的观察值,再求其差数,即得全距(R),也称为极差,它是整个样本的变异幅度。计算全距的公式:max min R X X =-。2.决定组数和组距:根据全距将资料的全部观察值按其大小分成若干组(也称组区间),而组距是指每一组内的范围,或者说是组与组之间的距离,也可以说成是每个组的上限和下限之差。如果每个组的距离相等,

称为等组距;每个组的距离不全等,称为非等组距。如果是等组距分组:()()()

R i k =全距组距组数。3.选定组限与组中值:组数和组距确定后,要进一步划分各组的组限,才能使各个观察值划入一定的组内。因此,必须选定适当的组限与组中值,分组之后每组内两个极端的数称为组限。组内最小值为组下限,组内最大值称为组上限。组限要明确,最好比原始数据的数字多一位小数,使观察值分组时不会含糊不清,组距确定后,首先要选定第一组的组中值。2

+=组上限组下限组中值。4.观察值按组限归组:按原始资料中各观察值的次序,把每个观察值归列在各组。 组数:是指资料的整个数量范围分成若干个区间。

确定组数和组距时应考虑:①资料包括的观察值个数的多少;②全距的大小;③便于计算;④要能反映出资料的真实面貌等方面。

间断性变数资料的整理与分组:根据资料性质可采用单项式分组法(是用样本的自然值进行分组,每个组都用一个观 察值来表示)或组距式分组法。

属性变数资料的管理与分组:可采用编制次数分布表的方法来处理。首先,将资料的各种质量性状进行分类,分类数与分组数相同;然后,根据各个体在质量属性上具体表现,分别归入相应的组中,即可得到属性分布的规律性。 次数分布的功用:整理资料化繁为简;初步了解变数的分布特点;便于进一步计算和分析。

连续性变数资料次数分布表的制表过程:(1)数据排序;(2)求极差;(3)确定组数和组距;(4)选定组限和中点值;(5)把原始资料的各观察值按分组数列的各组组限归组。

统计图:是用点、线、面、体绘出的图形,为了研究单个变数的变动,将几个相类似的或相关联的变数进行比较所作的图像,称为统计图。

统计图的作用:①易于理解,虽然不能比统计表所列的数字提供更多的信息,但一般能更清楚地、更有力地突出重要事实;②易于记忆,因图形比数字更直观、具体,更能显示客观事物的全貌,给人留下深刻的印象;③便于分析比较,因图形简单、形象,易于进行处理间的比较;④富于鼓动性,因统计图富有艺术性,它将客观事物表现得生动,容易起到宣传的作用。

统计图的种类:有直方图、多边形图、条形图、圆形图和线图等。

1.直方图:又称方柱形图或矩形图。用矩形的面积来表示次数分布表中各组数据出现的次数,适用于表示连续性变数的次数分布;

2.多边形图:又称折线图,也是表示连续性变数资料的一种图示法。在同一图上可以比较两组以上资料,制作方法与直方图相似,所不同的是在横轴(X 轴)上,每一等分标明各组组中值,对应的次数为纵轴(Y 轴),逐组描点,最后用短线将相邻两点依次连接起来,即制成多边形图。多边形图的折线在左边最小组的组中值外和右边最大组的组中值外,应各伸出一个组距的距离而交于横轴,以使多边形面积大致与直方图相同;

3.条形图:又称长条图或直条图,是以条形的长短来表示绝对数、相对数或平均数大小的图形。用平行长条作比较,各长条的宽度和距离应彼此均等,相邻两长条间的距离一般是条的宽度的1/2,适用于间断性变数和属性变数资料,主要用于比较统计指标,比较不同时间、地区、单位的同类现象,以及实际完成指标与计划指标等。根据要求可分为单式条图和复式条图;

4.圆形图:用圆面积的大小,说明同类指标数量大小的统计图,称为圆形图。它可以比较统计指标,说明总体内部结构的变化,还可以反映多因素所构成的复杂现象。常用的有圆形面积图和圆形结构图两种:(1)圆形面积图以圆形面积大小表明现象数量多少,称为圆形面积图。(2)圆形结构图以圆形及其内部各扇形面积的比例表明总体内部的构成,称为圆形结构图。

5.线图:线图适用于连续性变数资料,表示一种动态的数量资料,说明事物的发展过程。如果几种处理的比较,可以用粗实线或细实线、虚线、点线、点划线、双点划线等标志,分别表示不同的处理,以示区别,作图时应注意:横轴表示某一连续性变数,;图线应按实际数字绘制成折线,不能任意改为光滑曲线;同一图内不要有太多的折线,以免观察不清。

制作线图时应注意:横轴表示某一连续性变数,如产量、株高等;纵轴表示某种次数或频率,纵轴尺度必须等距,一般应以“0”开始;图线应按实际数字绘制成折线,不能任意改为光滑曲线;同一图内不要有太多的折线,以免观察不清。 制作统计图时应注意的问题:(1)图形不宜过大或过小,过大查阅不便,过小易丧失次数分布的意义。(2)绘图注字力求简明。(3)每图所画曲线不宜太多,通常以画4-5条曲线为宜,若诸线交叉时尤宜减少。(4)制图时对缩尺的标准须慎重决定,力求合适,以便看出资料的分布情况。(5)若有几种性质相同的资料,观察次数各不相同时,应先化为百分数,而后制图,便于比较。制作统计表和统计图,只是整理资料的第一步。为了简化资料,便于比较两组以上的资料,同时反映研究对象质的特点,必须进一步应用生物统计方法分析数据,从中找出样本的数量特征及其相关关系。

第四章平均数和变异数

平均数的意义:平均数是数量资料的代表值,表示资料中各观察值的中心位置或典型水平,常用作资料或样本的代表值,说明资料的一般水平,还可用以比较几个样本的特征及其差异情况。

平均数的种类:主要有算术平均数、中数、众数、调和平均数和几何平均数。

算术平均数:资料或样本所含观察值个数除各观察值的总和所得的商数,称为算术平均数,因其应用广泛,简称平均数或均数,用x 表示。平均数的大小决定于样本各观察值,特别是极大值和极小值对平均数有显著的影响。 中数:将资料所有观察值,从小到大依次排列,居中间位置的观察值称为中数或称中位数。用d M 表示。

众数:资料中出现次数最多的观察值,或次数最多的一组的组中值,称为众数,用o M

几何平均数:n 个非负数12,,,n X X X 的乘积的n 次方根称为几何平均数,用g M 表示。

调和平均数:设有几个观察值12,,,n X X X ,各观察值倒数的算术平均数的倒数就称为调和平均数,用h M 表示。在试验小区的株数不相等时,常用调和平均数表示小区的平均株数,对于极端右偏态的数据,用倒数表示它们的集中趋势最为理想。调和平均数也常用于求一个过程中各部分速率的平均速度。

算术平均数、中位数与众数的关系:(1)在完全对称分布的情况下,算术平均数、中位数与众数都相等。(2)在偏斜分布时,如果向左偏斜,则平均数大于中位数,而中位数又大于众数;若向右偏斜,恰相反,则中位数大于平均数,而众数大于中位数.

五种度量集中性的统计数的比较:作为反映资料集中性的统计数,最好满足下列几个要求:

(1)必须有严格的定义和计算方法,否则,难免有主观成分的影响;(2)利用全部观察值进行计算为好;(3)要简单明了,容易领会;(4)容易计算;(5)抽样误差要小;(6)能用代数方法运算。算术平均数能满足上述六点要求。但是,在样本中若有极端值出现时,即呈偏态,此时,算术平均数无法表示它的集中趋势;中位数能满足(2)、(3)、(4)的要求,因它在排序时利用了所有观察值。它在非参数测验时,是一个常用的统计数;众数仅满足(3)、(4)的要求,但它在日常生活中会经常遇到的;几何平均数与调和平均数能满足(1)、(2)、(6)的要求,两者都适用于右偏分布。对同一资料来说,x >Mg>Mh 。调和平均数具有最能减少极端大观察值的作用。

算术平均数的计算方法:1.直接法:设有一试验资料共有n 个观察值,i X 代表第i 个观察值,则第一个至第n 个观

察值可以用12,,,n X X X 表示,其算术平均数为x 。x =1n (12n X X X +++ )=1n i

X n ∑.2.加权法:当样本观察

值归组后,因每个组观察值出现的次数不同,对平均数的影响不等,故要考虑权的问题。样本内观察值个数较多的分组资料,用次数分布表计算加权平均数。计算公式:i

i i f X

x f =∑∑(i X 表示任一观察值,或各组观察值的组中值;i

f 表示观察值i X 出现的次数或次数分布表中各组的次数。

算术平均数的性质:1.离均差的和为零:样本中各观察值与其平均数的差数(简称离均差)的总和等于零。111()0n n n i i i i i X

x X x nx nx ===-=-=-=∑∑∑。因为1n i i X x n ==∑,所以1n i i X nx ==∑;1n

i i x =∑表示n 个相同的X 相加。2.离均差平方和为最小:样本中各个观察值与其平均数的差数平方的总和较各个观察值与任一数值的差数平方的总和为最小。()()22i i X x X a -<-∑∑()a x ≠。

变异数:是表示资料变异程度的统计数。一表示资料数据间的变异程度或离散程度或离均程度;二可以衡量平均值

的代表性。常用的变异数有极差、方差、标准差和变异系数等。

极差:极差又称全距,常用R 来表示,是资料中最大值与最小值的差。极差可以说明资料或样本内观察值的变动范围,又称为变异幅度。max min R X X =-

平方和:各个离均差平方的总和,所得数值简称为平方和,缩写为SS 。定义为:样本平方和()2i SS X x =

-∑;总体平方和()2

i SS X μ=-∑。 方差:均方与方差这两个名称经常通用,习惯上样本的2s 称均方,总体的2σ称为方差。方差也可以用Var 或V 表示。

平均平方和(均方):由于各个样本所包含的观察值数目不同,为便于比较,用观察值数目来除平方和,得到平均平方和,简称均方,记作MS 。样本均方用2s 表示,定义为:221()1

n i X x s n -=-∑,是总体方差的无偏估计值,式中的分子称为离均差平方和,分母在统计学上称为自由度。总体方差221()n i X N

μσ-=∑,μ为总体平均数,N 为总体所包含的个体数。 某样本的方差越大,则其观察值之间的变异就越大。

标准差:就是资料或样本内各观察值与其平均数的差数的平方和的平均数的平方根,又称为均方差。

样本标准差的定义:设一样本有n 个观察值12,,,n X X X ,其算术平均数为x ,则该样本的标准差为s

=s =

s =。

标准差的意义:用平均数作为样本的代表,其代表性的强弱受样本中各观测值变异程度的影响。如果各观测值变异小,则平均数的代表性强;如果各观测值变异大,则平均数代表性弱。标准差的大小,受多个观测值的影响,如果观测值与观测值间差异大,其离均差也大,因而标准差也大,反之则小。所以,样本标准差(S )是反映样本中各观测值12,,,n X X X 变异程度大小的一个指标,它的大小说明了平均数对该样本代表性的强弱。标准差小,说明观测值变异小,变量的分布比较密集在平均数附近,则平均数的代表性强;反之,标准差大,说明观测值变异大,变量的分布比较离散,则平均数的代表性弱。

自由度:指的是计算某一统计量时,取值不受限制的变量个数。

标准差的主要作用:是测定资料或样本内各观察值的变异程度或分布情况。 标准差的计算方法:1.未分组资料的计算方法:a 、普通计算法(直接法):先求出平均数(x )再计算各观察值与其平均数之差,即()i X x -,然后求各个()2i X x -及总和()2i X x -∑,代入即得标准差。b 、简捷法:()2i X x -∑=()2

2i i X X n -∑∑;2.

分组资料计算法采用加权法:次数分布表计算标准差的公式为s =i f 是第i 组的次数;i X 是第i 组的组中值,x 是样本平均数,i f ∑是样本容量。

变异系数:标准差是表示一个样本的离散度,是观察值的平均变异量,它和观察值的单位相同。如果性质、单位、平均数大小相同的两样本,比较其变异程度时,可直接用标准差。但是对性质不同,或单位不同,或平均数不同的两个样本,需要比较其变异程度或分布情况时,就不能直接利用标准差相比较,有必要采用相对变异量,最常用的是标准差

对平均数的百分数,称为变异系数,缩写为CV,它与资料的单位无关,以%表示。计算公式为:100%s CV x

=?,上式中s 表示样本标准差,x 表示平均数。其作用:消除了平均值大小及所带单位不同的影响,其可用以比较二个事物的变异度大小。当选择试验地进行试探播种时,可作为测定土壤差异性的指标,还可作为确定试验小区的面积、形状和重复次数的依据。

第五章、理论分布和抽样分布

事件:在试验结果中所发生的现象。

必然事件:在同一组条件实现之下,每次试验结果中某事件必然要发生则这一事件叫做必然事件。相反地,如果在同一组条件实现之下,某事件必然不发生,则叫做不可能事件。

随机事件:在同一组条件实现之下,可能发生,也可能不发生,而在大量重复试验中都具有某种规律性的现象,叫做随机事件或偶然事件,可用A,B,C,…,表示。

频率:假定在相同条件下重复进行同一类试验,调查事件A 发生在次数a 与试验总数n 的比数,称为频率,a n ?? ???。 概率的稳定性:在试验总次数n 逐渐增大,事件A 的频率愈来愈稳定地接近定值p 。

小概率实际不可能性原理:概率很小的事件,在一次试验中几乎不可能发生或可以认为不可能发生。事件的和是事件A 与事件B 至少有一个发生,记作A+B 或AUB 。事件的积是事件A 与事件B 同时发生。互斥事件是事件A 与事件B 不能同时发生,即AB=V 。对立事件是事件A 与事件B 必然有一个发生。对立事件一定是互斥事件,互斥事件不一定是对立事件。

事件的相互关系:1.事件的和:事件A 与事件B 至少有一个发生,这一事件称为事件A 与事件B 的和或并,记作A+B 或A ∪B 。两个事件的和可以推广到多个事件的情形。即A+B+C+…+N,表示这N 个事件中至少有一个发生。2.事件的积:事件A 与事件B 同时发生,这一事件称为事件A 与事件B 的积或交,记为A∩B 或A ?B 或AB,即“A 且B”。两个事件的积也可以推广到多个事件的情形。即A ?B ?C ?…?N,表示N 个事件同时发生。3.互斥事件:若事件A 与事件B 不能同时发生,也即AB=V ,则称A 与B 为互斥事件或不相容事件。一粒种子播种后不可能同时发生“发芽”和“不发芽”两种现象,所以称为互斥事件。4.对立事件:若在试验中事件A 与事件B 必然有一个发生,且仅有一个发生,而且事件A 和事件B 满足条件:A+B=U,A ?B=V ,则称事件A 与事件B 互逆,又称A 是B 的对立事件,记为A=B;或B 是A 的对立事件,记为B=A 。对立事件一定是互斥事件,互斥事件不一定是对立事件。5.完全事件系:两个事件如果满足以下条件,即A ?B=V 和A+B=U,则称这两个事件为完全事件系。在N 个事件中如果满足上述条件,则称这N 个事件为完全事件系。

完全事件系:既满足事件的和又满足互斥事件称之。

计算事件概率的法则:1.对立事件概率:若事件A 的概率是P (A )其对立事件概率为P(A )=1-P (A )。2.互斥事件概率的加法:若事件A 与事件B 是互斥的,概率各为P(A)和P(B),则“A+B ”事件的概率为P(A+B)=P(A)+P(B)。3.概率的乘法:①条件概率:如果A,B 是某条件组下的两个随机事件,P(A)≠0,则称在A 发生的前提下,B 发生的概率称为条件概率;②乘法公式事件A 和事件B 同时出现的概率,等于事件A 的概率乘以在A 发生下事件B 的概率;或事件事件B 的概率乘以在B 发生下事件A 的概率,即:P (AB )=P (A )P (B/A )=P (B )P (A/B );③独立性是事件A 发生的条件下,事件B 发生的条件概率P(B/A)就等于B 的原概率P(B),即:P(B/A)=P(B)。4.完全事件系概率:若有n 个事件12,,,n A A A 是试验的完全事件系,即这些事件之间是互斥的,12()n A A A ??? 为不可能事件,而且事件和12()n A A A +++ 为必然事件,则n 个事件概率和为1。即12()n A A A +++ =()()()121n P A P A P A +++= 。如果n 个事件出现的概率是相等的,则()1i P A n

=

二项分布:就是独立地重复进行n 次试验中事件A 发生次数的概率分布。二项分布的平均数μ=np 。二项分布的标

准差:σ=

二项概率函数或二项分布律:()k k n k n P X k C p q -==(k=0,1,2,…,n)(0

q p +展开式中的第k=1项k k n k n C p q -,故称随机变数X 服从参数为n ,p 的二项分布,记为(),X B n p 。这一分布律首先由瑞士学者贝努利推出,故又称贝努利分布。由于观察值X=0,1,2,…,n 为完全事件,故这个分布概率总和等于1,即:()01n n

K k n k n k C p q q p -==+=∑

二项分布的性质:如p=q ,则二项分布呈对称形状;如p q ≠,则表现偏斜形状。从理论和实践检验,当n 很大时即使p q ≠,它也接近对称形状,所以,这一理论分布是由n 和p 两个参数决定的。

泊松分布(Poisson ):S.D.Poisson 于1937年发表。凡在n 次观察中,某一事件出现的平均次数(m )很小,则这一事件出现的次数分布为泊松分布。

泊松分布的性质:泊松分布仅包括一个参数m,由m 的大小决定分布形状。在m<1时,P(X=0)为最大;在130可用正态分布。 正态分布:连续性变数的理论分布。

正态分布为什么最重要:一是因为有相当多的变数都服从正态分布;二是从任一总体中抽取样本,虽然有些总体并不呈正态分布,但从总体随机抽出的样本平均数及其他一些统计数的分布经常服从正态分布;三是其他各种分布,如二项分布、泊松(Poisson)分布,当其样本容量增大时,都近似正态分布。因此,可用它来研究这些统计数的抽样分布。 正态分布的性质:(1)正态分布只有一个峰,峰值在X=μ处,两侧对称平均数,呈钟形曲线。(2)正态分布曲线的总体平均数,中位数和众数相等重合在μ点上。(3)正态分布曲线均数μ决定了正态分布在横轴(X)上所处的位置,而标准差σ决定了曲线的形状或观察值的分散程度。(4)若X~N (μ,2σ),对X 作线性变换,即对任何一个正态分布的正态变数(X)加以标准化转换成u 。(5)正态曲线在X-μ=±σ或对标准正态分布u=±1处各有一个拐点。当X →±∞时,以横轴X 为正态曲线向左右延伸的渐近线。曲线全距从-∞到+∞。(6)正态曲线与横轴(X)间的总面积等于1,X 值出现在任两个定值(12,X X )间的概率,即为这两个定值间的面积占总面积的比例。

抽样分布:从总体中抽出若干个样本,由样本算出的一群统计数所形成的分布称为之。

中心极限定理:从正态总体抽取的样本,无论样本容量大或小,其样本平均数的抽样分布必成正态分布,具有平均数和方差,而且方差以样本容量增大而递降。

样本平均数分布的性质:1.样本平均数分布的平均数等于总体平均数,即μμ= 2.样本平均数分布的方差等于样本容量除总体方差,即22

x n σσ=所以x σ= 3.如果随机变数X 服从总体平均数为μ,方差为2σ的正态分布,()2~,X N μσ,12(,,,)n X X X 是X 的随机样本,则样本平均数,即:1i x X n =

∑ 4.任意样本平均数的极限分布,对任意随机变数X 的样本平均数的概率分布形式与随机变数X 的分布形式有关。

两样本平均数差数分布的基本性质:1、两样本平均数差数的平均数等于两总体平均数的差数,即:

1212x x μμμ-=-;2、两样本平均数差数的方差等于两样本平均数方差的和。3、若两个总体均为独立的正态分布,则其样本平均数差数也称正态分布并具平均数和方差。

第六章统计推断

统计推断:由样本以推知总体的过程。

统计推断的内容:1.参数估计是指由样本结果对总体参数作出点估计和区间估计,点估计是以样本的统计数直接当作总体参数估计值。参数的区间估计是以一定的可靠性来保证估计参数的可能取值范围的一种估计;①.参数的点

估计,就是以样本的统计数直接当作总体参数的估计值。这种方法简单,但它不能表明估计的可靠程度,点估计中的误差是用标准差来衡量。②.参数的区间估计,是以一定的可靠性来保证估计参数的可能取值范围的一种估计。这类问题称为区间估计,这种估计方法较为合理。2.统计假设测验是对有关总体提出一个假设,然后测验这种假设是否正确,根据样本的结果测定其总体,这种推断过程称为统计假设测验或显著性测验。

统计假设:是指对总体的某些参数所做的假设。统计假设分为无效假设和备择假设。

统计假设测验的几何学意义:统计假设测验是在生产和科研工作中,确定不同质的事物的数量界限的一种数理方法。从方法本质来讲,是将统计数的分布划分为接受区和否定区。前者为接受0H 的区间,后者为否定0H 而接受A H 的区间。若实得结果落在接受区,就接受0H ;反之,则否定0H ,而接受A H 。

无效假设:又称零值假设。是在相关分析中把总体参数作为0的假设,用0H 表示。常应用在1.对单数平均数的假设;2.对两个平均数相比较的假设;3.对二项总体中具有某项属性个体百分数的假设4对二项总体中具有某项属性个体的两个百分数相比较的假设。

设立无效假设的原则:(1)必须要有实际意义(2)据之可以算出抽样误差而或得结果的概率的。通常所做的无效假设常为所比较的两个总体间无差异。无效假设的意义在于一以无效假设为前提,试以计算试验结果出现的概率。 备择假设:是当无效假设(A H )被否定后,而被接受的另一个假设称之。用A H 或1H 表示。

接受区域:是指在一个假设总体的概率分布中,可能接受假设时所能取的一切可能值所在的范围。

否定区域:是处在接受区域以外的任何一个数值和假设数值的差异,不作为随机误差,而在本质上不同于假设的数值所在的区域。

显著水平:在统计假设试验中,用来判断无效假设是否成立的概率标准。

双尾测验:是指概率分布下,显著水平按左侧和右侧两尾的概率和进行测验。

单尾测验:是在概率分布下,显著水平按左侧或右侧的概率进行测验。

两类错误:第一类是否定真实假设的错误,也称α错误。第二类接受不正确假设的错误,也称β错误。降低错误方法:1取较小的α值;2增大样本容量;3适当减少总体方差;4改进试验技术,降低试验误差。

检验功效:当备择假设是正确的,它被否定的概率为β,而被接受的概率为1-β这就是检查出错误的无效假设的概率,称为检验功效,简称检验力,可用P 表示()1p β=-。

α和β间(两类错误)的关系:在统计推断的错误中,这两类错误都同时存在,而且彼此间是互相联系,一般来说这两类错误有一种此消彼长的关系。减少了第一类错误,就会增加第二类错误,或者相反。

统计假设测验的含义:根据“小概率事件实际上不可能发生”原理首先对样本所属的总体提出统计假设,然后计算样本在无效假设的总体中出现的概率,若概率大则接受该假设;若概率小则否定该假设,从而接受另一个相反的备择假设。

统计假设测验的步骤:(1)对样本所属的总体提出统计假设,包括无效假设和备择假设。(2)规定测验的显著水平a 值。(3)在H0为正确的假定下,根据平均数(或其他统计数的抽样分布,如为正态分布的则计算正态离差u 值。由u 值查附表3即可知道因随机抽样而获得实际差数(4)将规定的a 值和算得的u 值的概率相比较,或者将试验结果和否定区域相比较,从而作出接受或否定无效假设的推断。

统计假设的步骤:1.提出假设;2.确定显著水平尔发值;3.计算测验统计数;4.统计推断。

t 分布:随机变数的分布在正态总体中随机抽取一系列的小样本,将这些样本的平均数离差()x μ-变成标准化离差t,这一系列的t 值的分布形成了t 分布。是1908年由哥赛特(W.S.Gosset)以笔名“Student”首先提出,故又称为学生氏分布,它提供了小样本推断的依据,是连续性随机变数的分布。

t 分布数学定义:设X1,X2,…,Xn(n≥2)相互独立,且都服从N(μ,2σ),

则称随机变数t =df=(n-1)的t 分布,记作t~t(n-1)。

F

t 分布的概率分布密度:(

)()121!12122!2df df df f t t df +??- ???-?? ?+????=+-∞<<∞ ?-?????

t 分布的概率分布函数:()()(T)dT t df t F p T t f -∞=<=?

t 分布的平均数:0t μ=()1df >

t

分布的标准差:t σ=

()2df >

t 分布的性质:(1).t 分布曲线是以其平均数t μ=0为原点的对称曲线。(2).在x=0处纵轴高度值最大。(3).t 分布曲线随自由度而异,自由度愈大,曲线的峰度愈高,为单峰曲线。(4).当df>30时,则t 分布接近正态分布,而当df=∞时,则t 分布与正态分布两曲线合一。

t 测验:按t 分布进行概率计算的假设测验,称为t 测验。

成组数据平均数的比较:成组数据来自成组设计,成组设计就是将试验单位完全随机地分为两组,然后再随机地对两组分别实施不同处理,两组试验单位相互独立,所得观察值也相互独立,两处理的样本容量可以相等,也可以不相等,所得数据称为成组数据。这种设计适用于试验单位比较一致,或试验单位间的差异不会影响试验指标的情况下进行

比较,以处理(组)平均数作为相互比较的标准。成组数据平均数的比较根据样本所属总体方差21σ和22σ是否已知或样本的大小,可采用u 测验或t 测验。两个样本总体方差2

1σ和22σ为已知时,用u 测验。()()12

1212

x x x x u μμσ----= 正态近似法:将百分数资料当作正态分布处理,进行百分数的假设测验。

成对数据的比较:当土壤差异较大,试验材料不整齐时,用配对设计较好。配对设计是指性质相同的两个供试单位配成一对,并设有多个配对,在每一配对中的两个供试单位(或个体)分别随机给予不同处理,则所得观察值称为成对数据。

成对数据比较的优点:①加强了试验控制,成对观察值的可比性提高,因而随机误差将减少,可以发现较小的真实

误差;②成对比较两样本总体方差22221212

σσσσ=≠或的干扰,分析时不需要考虑2212σσ和是否相等。 单个样本百分数(成数)的假设测验:这是测验某一样本百分数?p

与某一理论值或期望值p 的差异显著性。若是大样本或?30np

≥估计值?p 接近正态分布,则二项总体平均数为:μ=p ,二项总体百分数的标准误为

p σ==,检验统计数为:?p

p p u σ-=。 两个样本百分数相比较的假设测验:这是测验两个样本百分数12??p

p 和的差异显著性。设111?,,p n X 为第一样本的样本容量,某性状出现次数和样本百分数111

?X p n =;用222?,,p n X 表示第二样本的样本容量,这一性状出现的次数和样本百分数222

?X p n =。这种比较是为了测验两个总体百分数的大小,如果第一总体的百分数为1p ,第二总体百分数为2012,:p H p p =,则12p p -服从正态分布,故可用u 测验。设两总体百分数12p p 和为已知,两样本百分数的差数标

准误为

:12??p p s -=,若上式中1212,p p p q q q ====

,则得:12??p p s -=分数12p p 和未知,两总体方差相等1222p p σσ=,对12p p 和的估计可用两样本百分数的加权平均数(合并百分数)为:

12121X X p n n q p +?=?+??=-?

而两样本百分数的差数标准误为:12??p p s -=1212????p p p p u s --= 二项分布样本假设测验的连续性矫正:将样本中某属性的个体数和假设间的差数取绝对值后再减去0.5,这就是连续性矫正。分为单个样本百分数假设测验的连续性矫正和两个样本百分数假设测验的连续性矫正。

单个样本百分数假设测验的连续性矫正:将连续性矫正后计算的u 或t 值,分别用c c u t 或表示。值为:

??

0.5??0.5c c p np p

p np np n u t s s ----==或1df n =-

。上式中?np s =

是np σ= 两个样本百分数假设测验的连续性矫正:在两个样本百分数中,取较大值为1?p

,具有样本容量1n ,具有某种属性个体数1X ;取较小值为2?p ,具有22X n 和,矫正后的c c u t 或值为:12

1212??0.50.5c c p p X X n n u t s -????--- ? ?????=或或121212

??0.50.5??c p p p

p n n t s ----=122df n n =+-。

参数估计问题:假定12,,,n X X X 来自正态总体()2,N μσ的一个样本,若要求2

μσ或的估计值,就是估计问题。由于2

,μσ是确定正态总体的参数,因此称为参数估计问题,而它又分为点估计和区间估计两种。1、点估计是以样本的统计数直接估计总体的相应参数,即参数的估计值是一个统计数。2、区间估计:是指在一定概率保证下,由样本的结果估计相应的总体参数可能取值的一个范围或区间。这个区间称为置信区间,区间的上、下限称为置信限。一般以12L L 和分别表示置信下限和上限。保证参数在该区间内的概率用()1p a =-表示,称为置信系数或置信度。

区间估计的优良性:一是肯定程度,用置信度p=1-α来表示,例如α=0.05时,置信度p=0.95,即从随机样本推得总体平均数μ的区间(12L L 和)内将含有总体平均数μ的概率为95%,还有5%的概率不含有μ。1-α值越大,肯定程度也越大;二是精确度,上限(L1与)下限(L2)的减值越小,精确度越高。

精确法:二项总体百分数(p)的置信区间,可按二项分布来估计,所得到的结果较为精确,称为精确法。

正态近似法:若按正态分布来估计所得到的结果只是一个近似值,称为正态近似法。

第七章卡方测验

次数资料(计数资料):凡是试验结果用出现次数表示的资料都叫做之。

卡方2x :英国卡尔.皮尔逊在1899年提出。样本观察次数与理论次数间存在一定的差异,为测验这种差异是否属

于随机误差,需要计算一个统计数,这个统计数就是卡方。

卡方2x 测验:在属性统计中它是表示实际数值与理论差异相对大小的统计数的统计数。根据卡方值的大小来检验差异显著性的方法称为卡方测验。

2x 分布的定义:设12,,,n X X X 独立同分布,且i X n -,它们的平方和记为卡方(2x )

,即:12222221n i n

i x X X X X ==+++=∑ 的分布,称为具有n 个自由度的2x 分布,记为()22x x n 。它的分布的密度函数为:()()212

2122222df x df

x f x e df --=??Γ ???

。上式中df 为自由度数,e=2.71828…,Γ为Γ函数。2x 分布的累积函数为:(){}()()2222220i x i i f x P x x x d x =≤=?,所以2x 分布右尾从2i x 到+∞的概率为:{}()()()2222221i i

i i x P x x F x f x d x +∞>=-=?。

2x 分布的性质:1.自由度为n 的卡方的平均数等于它的自由度而方差等于2倍的自由度。2.若()221x x n ,而()222x x n ,且相互独立,则(2x +2x )~2x ()12n n +,这个性质称为卡方分布的可加性。3.2x (n)分布的形状因自由度而异。4.2x (n)的众数是df-2,即当2x 的自由度df >2时,它的众数是df-2。

卡方2x 测验的步骤:1、提出无效假设0H 。2、确定显著水平。3、计算检验统计数2x 值。4、统计推断。

卡方2x 连续性矫正:卡方分布是连续性变数的分布,而次数资料属间断性变数资料。研究表明,当测验资料的自由度等于1时,算得的卡方值将有所偏大,因此应予以矫正,统计上称为连续性矫正。

适合性测验:比较观察次数与理论次数是否相符合的假设测验称为适合性测验或称吻合度测验。1.试验数据仅含两组的适合性测验;2.试验数据包含三组以上的适合性测验;3.分布的适合性测验。

分布的适合性测验:检验随机样本来源的总体究竟服从哪一种理论分布,叫做分布的适合性测验。

独立性测验:卡方2x 应用于独立性测验,其目地在于了解两类变数间是否相互独立。1、2×2列联表的独立性测验;2、2×C 列联表的独立性测验;3、R×C 列联表的独立性测验。

同质性测验:方差同质性是指各个总体的方差相等。方差同质性测验是指三个以上样本,每一样本估计一个方差,由2x 测验各样本方差是否来自相同方差的总体假设。于1937年由巴特莱特氏(Bartlett )提出,故又称巴特莱特测验。其实质是求出矫正的2x 值,再与2x 表上查得的2x 值进行比较后作出判断。公式为:222112.3026lg lg i

k k i i i i x df s df s C ===

-???

? ???????∑∑

第八章方差分析

方差分析法:1923年由英国统计学家费歇氏首创。方差分析的基本特点,是将所有k 个样本的观察值和平均数作 为一个整体加以考虑,方差分析就是将观察值总变异的自由度与平方和分解为不同变异来源的各种自由度与平方和,从而获得不同变异来源的方差估计值。进而计算F 值,从而评定不同变异来源的相对重要性,测验假设012:k H μμμ=== ,比较处理间的差异显著性的一种统计方法。

为什么多个平均数间的比较有用平均数两两比较的方法,而采应用方差分析法:(1)计算麻烦。(2)误差估计精确度减小。(3)扩大了a 错误。通过方差分析,可以找出变异究竟是由哪些因素引起,按变异原因逐步分出各项方差,从而可以了解各因素所起作用的大小,找出造成差异的真正原因。因而方差分析就成为试验结果统计分析的重要方法,特别是它能对试验误差所引起的变异作出合理估计,为统计推断提供了可靠根据。在k≥3时,不能采用两个平均数

相比较的假设测验方法,而应使用方差分析法。

方差分析基本内容:1.将总变异的平方和与自由度分解为不同变异来源的平方和与自由度;2.由平方和除以自由度得出各项变异来源的均方;3.根据研究目的和均方的理论组成,测验有关均方的显著性,以及平均数间的差异显著性,并作出相应的统计推断。各观察值与总平均数间的差异称为总变异,它们的大小可用离均差平方和来表示,这一平方和称为总平方和。一个观察值与所在组的组平均数的差异称为组内差异,各组的平均数与全试验总平均数的差异称为组间变异。

平方和与自由度的分解:方差分析就是要将一个试验资料的总变异分解为各种变异,首先必须将总平方和与总自由度分解为各个变异原因的相应部分。因此,平方和与自由度的分解是方差分析的第一步骤。设某一单因素试验有k 个处理,每个处理有n 个观察值,各个观察值用ij X 表示,右下角添标i 表示数据所属的组(i=1,2,…,k),j 表示所属组的观察值次数(j=1,2,…,n),观察值的总个数N=nk,观察值的总和数是T,平均数是x 。先对总变异进行分解,一个观察值与所在组的组(处理)平均数的差异称为组内变异,各组(处理)的平均数与全试验总平均数的差异称为组(处理)间变异。平方和的分解T t e SS SS SS =+;自由度的分解T t e df df df =+。

F 分布与F 测验:两个样本均方的比值叫做F 值。F 测验具备的两种条件:1.所研究的变数X 遵循正态分布N(μ,σ2);2.两均方彼此独立。

多重比较:就是对多个平均数进行相互比较,以确定它们的差异显著性。

多重比较的方法:1.最小显著差数法。简称LSD 法,这种方法裨上是将两组数据的t 测验直接用于多重比较,计算方便,在处理F 测验为显著前提下,根据显著水平a 值的不同计算出最小显著差数。2.最小显著极差法。简称LSR 法,这种方法的特点是不同平均数间的比较,采用不同的显著差数标准,克服了LSD 法只用共同的一个LSD 标准测验任意两个平均数间差异显著性的缺点。①新复极差测验法,由邓肯氏于1955年首创,又称SSR 测验。②复极差法(q 测验法),

LSR 值:采用两平均数的极差进行测验,计算平均数的极差达到显著时所要求的最小值,称为LSR 值。

范围:是指把平均数按其大小排序后,两个要比较的平均数之间所包含的平均数个数加2,若其间无平均数,范围为2,有一个平均数范围为3。

多重比较结果的表示方法:①标记字母法:将各处理平均数从大到小自上而下依次排列,在最大平均数上标字母a ,将它与其下方各平均数相比,凡差数不显著的,标记同一字母a,直至某一平均数与其差异显著的则标记的则标记字母b ,再将这一平均数与其上方各个比它大的平均数相比,凡差异不显著的都再标记字母b,直至某一个与其差异显著的平均数则标记字母c 。如此重复进行,直至最小的一个平均数有了标记字母为止。这样平均数间,凡标记有相同字母的为差异不显著,凡标有不同标记字母的为差异显著。②列三角形表法:列表时将全部平均数从大到小,由上至下顺次排列,然后计算各平均数间的差数。分别写在表的各行中。凡达到α=0.05水平的差数在右上角标记*,凡达到α=0.01水平的差数右上角标记**,凡未达到α=0.05水平的差数则不标记。③连线法:将全部平均数从大到小,从左到右顺次排列,凡差数不显著的两个处理平均数的下面划一相连的横线,差异显著的则不连线处理。 方差分析的基本步骤:1.计算各项变异因素的平方和与自由度2.建立方差分析表,计算各项变异因素的均方,并进行F 测验3.若F 测验显著,则进行多重比较。

模型:为了描述和预测自然界中有关现象,需要寻求系统现象及其要素的关系,可用字母、数字和符号,以公式或数学议程抽象表示出来,这种公式或方程在统计学常称为模型。

数学模型:是指试验中每一观察值的线性分解式。每一个观察值可以划分成若干个线性组成部分,它是分解平方和与自由度的理论依据。

线性模型:是指模型中的随机变数和参数对观察值是线性关系。

线性模型分类:1、按模型的功能分类:回归模型、方差分析模型、协方差分析模型和方差分量模型等。2、按参数的性质分类:固定型模型、随机模型与混合模型。

固定模型:是指各个处理效应i τ当成是固定的常数。当一个模型中所有效应都是固定效应时,则称这一模型为固定模型或模型Ⅰ,常用在农业上的一般栽培和饲养试验。例如,品种、密度、播种期、肥料和农药效果等等的比较试验都属于固定模型。

随机模型:是指各个处理的效应i τ不是一个常数,而是一个随机变数,这种处理效应称为随机效应。当一个模型中所有效应都是随机效应,则称为随机模型或模型Ⅱ,常用在遗传育种和生态的试验研究方面。

混合模型:当一个模型中除了总平均μ和随机误差ε外,还含有固定效应和随机效应,就称为混合模型或模型Ⅲ。 线性可加模型:是指每一个变量可以按其变异原因分解成若干个线性组成部分,它是方差分析的理论依据。

期望均方:无数次试验结果的平均数叫做期望值。试验重复无数次所得到的平均均方,称为期望均方。期望均方估计就是参数估计,由样本算得的实际均方(MS)来估计期望均方(EMS)。模型不同,期望均方也不同,F 测验的程序和统计推断也将不同,这就是说期望均方规定了F 值测验的标准,也规定了多重比较的误差标准。期望均方的组成随处理效应和模型而不同。

期望均方的填写法则:(1)顺序性:各项变异因素先写简单项后写复杂项,即由下至上,先写误差项,然后再写互作项、主效应、区组。(2)组成分:各项变异因素的EMS 组成分均包含有误差项,变异来源除误差项外,其他各项均应包括主效应,有时还有互作项。即:误差方差+互作方差+主效应方差。(3)互作项的去留:互作方差项的添标去掉所在项的字母外,剩余字母所代表的因素若是固定效应,则应去掉该项互作方差,若剩余的是随机效应的字母项的方差,则应保留该互作项。(4)系数的决定:各项变异因素的期望均方中的各个方差均有系数,除了误差项而外,其余各项系数均应是重复次数n 与该项方差添标上所缺字母的乘积,它应包括除该项变异来源所用的字母外的其他变异来源的字母。(5)符号选择:一般固定效应方差用(希腊字母)2κ表示,附加大写拉丁字母添标表示,随机效应方差用2

σ表

示,附加大写拉丁字母添标表示,混合模型互作效应方差用2AB σ表示,系数符号用拉丁字母小写体表示。符号的右下角添标用拉丁字母大写体符号或希腊字母符号表示。

数学模型与期望均方的应用:在估计期望均方的一些参数和F 测验方面,固定模型和随机模型是有明显不同。这些概念对于方差分析的应用,尤其对于遗传育种方面的研究特别重要,固定模型和随机模型的分析重点各不相同。固定模型着重于处理效应大小i τ的分析,而随机模型着重于处理效应i τ的变异,即2τσ的分析。在育种上的应用,可以从

试验数据估计出遗传型方差2?g σ,环境方差2?e σ,遗传力2B h 和遗传变异系数GCV 等遗传参数,以了解群体性状的遗传

变异,并可对选择的进度和效果作出预测。

单向分组资料:是指观察值仅按一个方向分组的资料。

两向分组资料:是指观察值按两个因素交叉分组的资料,又称交叉分组资料。

系统分组资料:试验资料先分成l 个组,每个组又分为m 个亚组,而每个亚组内具有n 个观察值,这就称为组内分亚组的二级系统分组资料,简称系统分组资料。但系统分组不限于组内仅分亚组,每个亚组还可以分成u 个小亚组,每个小亚组分成v 个小小亚组,每个小小亚组具有n 个观察值,这样一环套一环地分下去,这种试验设计称为巢式设计。 任一观察值的总变异(x-μ)可分解为:①组间(或处理间)变异;②同一组内亚组间变异;③同一亚组内各观察值的变异。

单一自由度独立比较的意义:在进行某项试验时,试验工作者有时需要解答一些特殊问题,可以通过有计划地安排一些处理,以便从中获得资料,常采用分组比较以解答各种特殊问题。通过单一自由度的独立比较,才能较好地回答试验所提出的特殊问题。这种单一自由度的独立比较既简便,又准确,处理自由度有多少,F 测验就可以解决多少个独立问题。

单一自由度的独立比较:在处理数k≥3的多重比较,如果先按照一定的原则设计好(k-1)个独立比较,使得方差分析中处理自由度有多少,处理平方和就分解为多少个部分,使每一种比较都具有一个自由度,因只有两个平均数相比较故t df =1,用F 测验代替多重比较,则F 测验与t 测验结果完全一致,这就称为单一自由度的独立比较。

正交系数i C 写出的规则:(1)若比较的两个组的处理数目相等,则给一个组的各处理系数为+1,另一个组的各处理系数都为-1,哪个组取+1,哪个组取-1,随便决定,但一般以在前面的组取+号。(2)若比较的两个组的处理数目不相等,则第一组的系数为第二组处理数,第二组的系数为第一组的处理数,但符号相反。(3)如果写出的i C 有公约数,则应将其约为最小的整数。(4)若一个比较分量是另2个比较互作的结果,则这一比较的系数可以用两个比较的相应系数的乘积来求得。

单一自由度独立比较的条件:(1)独立比较的数目为k-1,使得每一比较占有且仅占有一个自由度。(2)每一独立比较的正交系数i C 的和必须为0,使得每一比较都是均衡的。(3)任两个独立比较的相应正交系数乘积的和必须为0,

以保证t SS 恰好分解为k-1个D SS 。

数据转换:是将原来数据按分析需要,用一定函数关系变换为另一种数据。 函数关系是一种确定性的关系,统计关系是一种非确定性的关系。

方差分析基本假定:1处理效应与环境的“可加性”;2试验误差是随机的、彼此独立的,具有平均数为0且服从正态分布,即误差“正态性”;3所有的试验处理必须具有相同的误差方差,即误差“同质性”。

方差分析三个基本假定简单的归为三性:处理效应与环境效应可加性、误差的正态性和误差的同质性。

试验资料不符合方差分析三个基本假定时,可采取(剔除特殊值)、(分解为若干个同质误差的方差)、(进行数据转换)等方法补救。

常用的数据转换的方法:1、平方根转换:试验资料的各处理平均数与其均方成比例关系。因此,各个处理内的均方

的大小有显著的差异,或稀有现象的计数资料。一般将原观察值X X '=2、对数转化:如果观察值的均方是和处理平均数的平方成比例,或者已知处理效应是和处理水平的变化成比例,计数资料的各个处理变异范围相差很大。这时极差或标准差的大小与平均数成比例关系,即各个处理的变异系数彼此近似,则宜用对数转换,在方差分析前可将每一观察值转换成对数,即:X′=lgX;3、反正旋转换:如果试验资料是百分数或成数,容易偏离正态分布,而呈二项分布。二项成数的误差与成数的大小直接相关,成数与均方成比例需要转换。若大部分的观察界于0.3~0.7之内,就不用转换;当百分数取值范围很大时,大部分观察值是在0.3~0.7以外,即p<0.3或p>0.7。为了使处理的成数与其均方彼此独立,这种百分数或成数都需作反正弦转换或角度变换,即:百分率2sin p θ=。

第九章一元线性回归与相关

回归与相关:早在1870年英国遗传学家高尔顿在19世纪末叶应用统计方法研究人种特性,分析父母与子女的变异,探索其遗传规律,提出回归与相关的概念。高尔顿和他的继承人皮尔逊于1889年出版了《自然的遗传》一书,在该书中皮尔逊首先提出回归分析问题,并指出了计算简单相关系数和复相关系数的公式。

回归:由一个(或几个)变数的变异来估测另一变数的变异都称为回归。现在应用回归一词是指统计数a 和b 必须满足离回归平方和为最小。

相关变数:具有一定关系的两类以上的变数。

相关变数的估算:凡是研究两个或两个以上因素的相关关系都属于相关的研究,常用数学公式估计相关的紧密程度,这就是相关系数的估算。

在统计上,X 和Y 变数的关系有两种理论模型:1回归模型2相关模型。

回归模型:在回归模型中,X 是固定的(试验时确定的),没有误差或很小的误差;Y 则随X 的改变而变化,并且有随机误差。在回归模型中,有自变数和依变数之分,故X 和Y 具有依从关系。回归模型还具有预测的特征,即由X 的数量变化可以预测Y 的数量变化。

相关模型:在相关模型中,X 和Y 变数是平行变化关系,都具有随机误差,没有自变数和依变数之分,故X 和Y 没有依从关系,也不具有预测的性质。模型的特征仅表示X 和Y 变数的偕同变异。

因果关系:两个变数间的关系若具有原因和反应(结果)的性质。

相关关系:呈现一种共同变化的特点,则称这两个变数间存在。

回归分析:用X 变数来预测或控制Y 变数的数量变化。

相关分析:以计算相关系数为基础,要测定两个变数在数量关系上的密切程度和性质。x 和y 都受误差的影响,没有自变数和依变数的区别。

在回归和相关分析时要注意:1.要看研究对象是否存在相关关系及其存在的条件,决不能把根本不相关的问题当成相关来分析。2.由于自然界各种事物间的相互联系和相互制约,经常一事物现象的变化要受许多其它因素的影响。因此,在研究两种事物或两类以上变数的相关关系时,必须严格控制其他条件的一致性,否则,运用回归和相关分析,可能导致错误的结果。3.为了提高回归和相关分析的准确性,两类变数的测定值,一般应在5对以上,以较多为宜,并使X 变数的取值范围尽可能的大。

回归和相关研究的作用:1.在遗传育种上通过相关性研究帮助我们认识性状变异的规律及其相互联系的程度。2.在栽培上,如果知道产量和某些因素相关,可以从改善环境条件来提高产量。3.利用相关关系可以预测预报。 相关的分类:

农学专业《田间试验与统计分析》试题题库及答案

≠β农学《田间试验与统计分析》题库1 一、判断题:判断结果填入括弧,以√表示正确,以×表示错误。(每小题2分,共14分) 1 多数的系统误差是特定原因引起的,所以较难控制。( × ) 2 否定正确无效假设的错误为统计假设测验的第一类错误。( √ ) 3 A 群体标准差为5,B 群体的标准差为12, B 群体的变异一定大于A 群体。( × ) 4 “唯一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( √ ) 5 某班30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已知 84.32 1,05.0=χ) 。 ( √ ) 6 在简单线性回归中,若回归系数,则所拟合的回归方程可以用于由自变数X 可靠地预测依变数Y 。( × ) 7 由固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于 推断处理的总体。( √ ) 二、填空题:根据题意,在下列各题的横线处,填上正确的文字、符号或数值。(每个空1分,共16分 ) 1 对不满足方差分析基本假定的资料可以作适当尺度的转换后再分析,常用方法有 平方根转换 、 对数转换 、 反正旋转换 、 平均数转换 等。 2 拉丁方设计在 两个方向 设置区组,所以精确度高,但要求 重复数 等于 处理数 ,所以应用受到限制。 3 完全随机设计由于没有采用局部控制,所以为保证较低的试验误差,应尽可能使 试验的 环境因素相当均匀 。 4 在对单个方差的假设测验中:对于C H =20σ:,其否定区间为2,2 12 να χχ-<或 2 ,22ν αχχ>;对于C H ≥2 0σ:,其否定区间为2,12 ναχχ -<;而对于C H ≤2 0σ:,其 否定区间为2 ,2ναχχ>。 5 方差分析的基本假定是 处理效应与环境效应的可加性 、 误差的正态性 、 误差的同质性 。 6 一批玉米种子的发芽率为80%,若每穴播两粒种子,则每穴至少出一棵苗的概率为 0.96 。 7 当多个处理与共用对照进行显著性比较时,常用 最小显著差数法(LSD) 方法进行多重比较。 三、选择题:将正确选择项的代码填入题目中的括弧中。(每小题2分,共10分 ) 1 田间试验的顺序排列设计包括 ( C )。 A 、间比法 B 、对比法 C 、间比法、对比法 D 、阶梯排列 2 测定某总体的平均数是否显著大于某一定值时,用( C )。 A 、两尾测验 B 、左尾测验 C 、右尾测验 D 、无法确定 3分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( D )。

农学专业《田间试验与统计分析》试题题库及答案

0≠β农学《田间试验与统计分析》题库1 一、判断题:判断结果填入括弧,以√表示正确,以×表示错误。(每小题2分,共14分) 1 多数的系统误差是特定原因引起的,所以较难控制。( × ) 2 否定正确无效假设的错误为统计假设测验的第一类错误。( √ ) 3 A 群体标准差为5,B 群体的标准差为12, B 群体的变异一定大于A 群体。( × ) 4 “唯一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( √ ) 5 某班30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已知 84.32 1,05.0=χ) 。 ( √ ) 6 在简单线性回归中,若回归系 数,则所拟合的回归方程可以用于由自变数X 可靠地预测依变数Y 。( × ) 7 由固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于 推断处理的总体。( √ ) 二、填空题:根据题意,在下列各题的横线处,填上正确的文字、符号或数值。(每个空1分,共16分 ) 1 对不满足方差分析基本假定的资料可以作适当尺度的转换后再分析,常用方法有 平方根转换 、 对数转换 、 反正旋转换 、 平均数转换 等。 2 拉丁方设计在 两个方向 设置区组,所以精确度高,但要求 重复数 等于 处理数 ,所以应用受到限制。 3 完全随机设计由于没有采用局部控制,所以为保证较低的试验误差,应尽可能使 试验的 环境因素相当均匀 。 4 在对单个方差的假设测验中:对于C H =20σ:,其否定区间为2 ,2 12 ν α χχ-<或 2 ,22ν αχχ>;对于C H ≥2 0σ:,其否定区间为2,12 ναχχ -<;而对于C H ≤2 0σ:,其 否定区间为2 ,2ναχχ>。 5 方差分析的基本假定是 处理效应与环境效应的可加性 、 误差的正态性 、 误差的同质性 。

23301083 田间试验与统计方法答案

23301083 田间试验与统计方法答案 一、单项选择题 1. A 2. D 3. C 4. C 5. C 6. D 7. B 8. A 9. B 10. A 11. C 12. B 13. B 14. C 15. B 16. D 17. C 18. B 19. A 20. B 二、判断题 1. 对 2. 错 3. 对 4. 错 5. 对 6. 错 7. 对 8. 对 9. 对 10. 对 11. 错 12. 错 13. 错 14. 错 15. 错 16. 错 17. 错 18. 错 19. 错 20. 错

三、名词解释 1. 随机样本:指由总体中随机抽取的个体组成的样本。 2. 水平:试验因素通常是可以人为控制的,其数量的不同等级或质量的不同状态称为水平。 3. 小区:在田间试验中,小区指安排一个处理的小块地段。 4. 准确度:试验中某一性状的观察值与相应理论真值接近的程度称为试验的准确度。 5. 精确度:把试验中某一处理的重复观察值之间彼此接近的程度称为精确度。 6. 个体:是试验研究中的最基本的统计单位,可从中获得一个观察值。 7. 完全随机设计:每一个供试处理完全随机地分配给不同的试验单元的试验设计。 8. 处理效应:试验处理对试验指标所起的增加或减少的作用称为处理效应。 9. 区组:将一个重复的全部小区分配于具有相对同质的一小块土地上,称为一个区组。 10. 总体:由统计研究的目的而确定的同类事物或现象的全体。 11. 统计数:是由样本内所有个体的观察值计算而得的样本特征数。 12. 显著水平:显著水平(significance level)是统计假设测验中,用来测验假设正确与否的概率标准,一般选用5%或1%,记作 。 13. 总体:由统计研究的目的而确定的同类事物或现象的全体。 14. 水平:试验因素通常是可以人为控制的,其数量的不同等级或质量的不同状态称为水平。 15. 统计数:由样本全部观察值而算得的特征数。 16. 重复:是指在一个试验中同一处理设置两个以上的试验单位。 17. 积事件:若干个事件都发生某事件才发生,则称某事件为这若干个事件的积事件。 18. 完全随机设计:每一个供试处理完全随机地分配给不同的试验单元的试验设计。 19. 复合事件:由若干个基本事件组合而成的事件,称复合事件。 20. 二项资料百分数:由二项次数转换成的百分数,其总体服从二项分布,故称为二项资料百分数。 四、简答题 1. 定量资料指对数量性状进行测量或称量得出的数据,如重量、长度等(2分)。特点:定量资料一般呈连续的变异分布(1分)。 定性资料指对质量性状记数或分组记数得出的数据,如发芽和不发芽粒数、害虫头数等(2分)。特点:定性资料一般呈不连续的间断分布(1分)。 2. (1)试验目的的明确性(1分) (2)试验条件的代表性(1分) (3)试验结果的可靠性(1分) (4)试验结果的重演性(1分) 3. F值右上角的“*”或“* *”分别表示F值达到0.05水平和0.01水平显著,即F值达到显著或极显著(2分)。F值达到显著或极显著,我们就认为相对于误差变异而言,试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。因而有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。多个平均数两两间的相互比较即是多重比较(4分)。 4. 一种是肥力高低变化,较有规律,即其肥力从试验田的一边到另一边是逐渐改变的(1分);另一种是斑块差异,田间有明显的肥力差异斑块,面积的大小及肥力分布无一定规律(1分)。 5. 目测法(1分);“空白试验”法(1分)。 6. 常用的平均数有算术平均数、几何平均数、中数、众数及调和平均数。(各1分)

田间试验与统计分析报告报告材料

《田间试验与统计分析》是农学专业的主干课程,也是生物科学、生物技术、植物保护、动植物检疫、草业科学等相关专业的基础课。本课程群的教学理念是以应用为导向,以试验设计、统计分析原理和思路为重点,以灵活应用数据处理软件为支撑。通过本课程的学习,可以掌握试验设计的基本原理、基本设计方法及其数据分析方法,提高科学研究、逻辑推理、试验设计及数据处理的能力,特别是科学创新能力。使用优良的设计方法及分析技术可以更好地解决农业科学(或生物科学)研究中的实际问题。 本课程自2004年被列为河北省精品课程以来,从教学体系、教学内容、教学手段、教师队伍建设、实践教学、网络资源等方面进行了建设,已完成预期建设目标。分述如下: 1.课程建设目标 (1)在现代化教学理念指导下,制定适合与我校人才培养模式和植物生产类人才培养目标的教学大纲,构建适应于不同专业、不同学历层次的课程体系,体现教育教学的现代性、科学性和先进性。 (2)摸索能够培养学生的分析问题和解决问题能力、挖掘学生的创造能力和创新能力的课堂教学和实践教学的方法与手段。 (3)探索以科研带动教学,以教学推进科研,教学科研同步提高的途径。改善教师的知识结构,提升学术水平和素质。 (4)选用国内优秀的教材,并组织或参与《田间试验与统计分析》系列教材的编写,建设一套具有鲜明特色的教材体系。 (5)完善网络资源的建设,为学生课下学习提供丰富、多样化的资料和案例。

(6)建立适合于本课程特点的考试方式和评定标准,扩充试题库。 2.课程建设内容及进展情况 (1)理论课程体系建设的情况 按照我校植物生产类专业的人才培养模式和教学目标的要求,对原《田间试验与统计分析》课程体系进行整改,按照专业类别、学历层次组织教学,构建一个既能够体现植物生产类特色、又能传授试验设计与数据处理分析方法的课程群。田间试验与统计分析课程群中包括有《田间试验与统计分析》(专科)、《生物统计学》(本科)、《试验设计与分析》(本科)和《应用统计学》(本科)四门课程。 (2)教学手段、教学方法和教材建设的情况 ①将科学研究经验、教训、成果引入课堂教学,丰富教学内容、凸显课程特色。在课堂讲授的恰当时候向学生们阐释科研处理数据资料的经典实例,使学生们意识到只有灵活使用统计方法,才能发挥其最大的效益;把所承担的国家、省部级科研项目的内容从试验设计学和统计分析的侧面讲述给学生,激发学生的学习兴趣,潜移默化地培养学生的科学研究和创新的能力。 ②改变传统的灌输式教学法,对于教学中的重点、难点采取案例式教学、形象化教学、实践参与式教学等方式来组织教学。并利用本精品课程网上在线答疑、Bb (Blackboard Academic Suite?)网络教学平台讨论区、教师的BLOG网页等多种形式实现课下辅导。

尔雅网课田间试验与统计分析课后及考试习题答案.doc

1 【多选题】 田间试验任务的主要来源有()。 A、 农业生产实践中发现或提出了新的问题,需要通过田间试验进行解决。 B、 农业科学工作者经常需要通过田间试验开展有关作物生长发育和遗传规律以及作物与环境之间相互关系等研究。 C、 不同地区和不同单位之间经常有相同或类似的项目需要进行研究,受其它地区或单位的委托进行研究也是田间试验任务的一个重要来源。 D、 根据农业生产发展的需要,各级农业行政部门或科研主管部门经常会下达一些田间试验项目。 我的答案:ABCD 2 【判断题】 田间试验的任务就是在大田条件下评价农业生产新技术、新产品和新品种的实际效果,解决农业生产中需要解决的问题。 我的答案:√ 1 【单选题】 试验目的要明确就是()。 A、 要求田间试验的各项试验条件要接近试验结果欲推广地区的自然条件和生产条件 B、 对试验要解决的问题有充分的了解,对预期结果做到心中有数 C、 必须坚持唯一差异原则 D、 在相同或类似的条件下进行同样的试验或生产实践,能获得类似的结果 我的答案:B 2 【单选题】 试验条件要有代表性就是要求田间试验的各项试验条件要接近试验结果欲推广地区的(),只有这样才能使试验结果在欲推广地区的生产上发挥增产增效作用。 A、 自然条件、生产条件 B、 天气条件 C、 土壤条件 D、

市场条件 我的答案:A 3 【单选题】 为了保证试验结果的准确可靠,进行田间试验时,必须坚持(),随时随地注意试验的准确性,力求避免造成不应有的试验误差。 A、 重复原则 B 随机排列 C、 唯一差异原则 D、 一致原则 我的答案:C 4 【多选题】 田间试验的基本要求包括()。 A、 试验目的要明确 B、 试验条件要有代表性 C、 试验结果要准确可靠 D、 试验结果要有重演性 我的答案:ABCD 5 【多选题】 为了满足重演性的要求,有哪些要注意的环节 ( ) A 完全掌握试验所处的自然条件和生产条件 B、 有及时、准确、完整的田间观察记载,以便分析产生各种试验结果的原因,找出规律性的东西 C、 每一项试验最好在本地重复进行2~3年,以便弄清作物对不同年份气候条件的反应 D、 如果将试验结果推广到其他地区,还应进行多点试验。 我的答案:ABCD 6 【判断题】 为了保证试验结果的重演性,必须严格注意试验中的一系列环节,尤其应严格要求试验的正确执行和试验条件的代表性这两个前提。

田间试验与统计选择判断题

《田间试验与统计方法》试题库 二、填空题 1.为了保证田间试验的质量,做田间试验要有明确的目的性、试验条件要有-----------------性、试验结果要有---------------性和---------------性。(代表性、可靠性、重演性) 2.按试验因素的多少,田间试验可分为-------------、---------------和综合试验。(单因素试验复因试验) 3.按试验地点的多少,田间试验可分为--------------和---------------。(单点试验多点试验) 4.按试验研究的内容,田间试验可分为栽培试验、-----------试验、--------------试验等。(品种肥料农药等) 5.按试验地的规模大小,田间试验可分为-------------、--------------和微区试验。(大区试验小区试验) 6.复因素试验是指包含-----------个试验因素的试验。(2个或2个以上)7.为保证试验结果的严密可比性,在设计试验方案时必须遵循两条原则:即------------和-------------。(单一差异设置对照) 8.试验误差是指--------------和-------------之间的差异。(观测值处理真值) 9.田间试验多数为小区试验,其小区面积一般为------------m2。(10-60)10.在果树田间试验中,小区的面积一般以每小区所包含的---------------来决定。(株数) 11.在新品种选育的试验中,初期阶段的小区面积一般较-------------,而后期阶段的小区面积则较------------。(小大) 12.在一个包含8个大白菜品种的品种比较试验中,共有---------个处理,----------个水平。(8个 8个) 13.为探讨某一葡萄品种对不同修剪方法的反应,在试验中共采用了长、中、短和极短梢4种修剪方法,那么,此试验共有--------------个处理,-------------个水平。(4 4) 14.今在5个辣椒品种上进行3种肥料(每间种肥料只设一种用量)的试验,随机区组设计,重3次,那么,此试验共有-----------个处理,共需安排-------------个小区,若每小区的面积为30m2,则试验地面积至少应为------------------ m2。(15 45 1350) 15.在5个番茄品种上进行3个播种期的试验,此试验共有---------个处理,若重复4次,则共需安排-----------个小区。(15 60个) 16.在4个苹果品种的修剪试验中,共设定4套修剪方法,那么,此试验共有------------个处理,若以单株小区,试验重复5次,则此试验至少需--------------株试验树。(16 80) 17.今在一黄瓜品种上进行5种农药防治黄瓜霜霉病的药效试验(每种农药只设一种浓度),那么,此试验共需设定------------个处理(含CK),若试验要求重复3次,则共需-----------个小区。(6 18) 18.在某一苹果品种上进行5种果实袋的套袋试验,若以单株区组设计,重复10次,则此试验共有-----------个处理,至少需--------------株试验树。(5 10)

东北农业大学田间试验与统计方法试题2

田间试验与统计方法 试题2 一、名词解释(每题3分共15分) 1、空白试验法(﹡﹡) 2、准确度(﹡) 3、小区(﹡) 4、统计假设检验(﹡﹡﹡) 5、随机试验(﹡﹡﹡) 二、判断,请在括号内打√或×(每题1分共10分) 1、不论哪种类型的田间试验,所设的水平就是处理。(﹡) 2、在随机区组设计中,增加重复而扩大试验田面积,区组间土壤差异增大,这将导致因土壤差异而带来试验误差的增大。(﹡﹡) 3、试验设计三项原则,其中重复和局部控制的作用是无偏地估计试验误差。(﹡﹡) 4、随机区组设计试验中,区组数等于重复次数。(﹡) 5、若做100次随机试验,一个事件出现20次,则事件的近似概率是0.2。(﹡) 6、样本容量n 指一个总体中变量的个数。(﹡﹡) 7、变异系数能用来直接比较两个单位不同或平均数相距较远的样本。(﹡﹡﹡) 8、3个大豆品种产量比较试验中,得到2e s =75,2t s =12.5,则F 值为75/12.5=6。(﹡﹡﹡) 9、决定系数(2r )既可表示相关的程度,又可表示相关的性质。(﹡﹡) 10、番茄重量(x )和番茄直径(y)的相关系数r = 0.7495,表明番茄重量的变异平方和有74.95%是番茄直径的不同所造成。(﹡﹡) 三、填空(每题1分共10分) 1、试验设计因素的水平间距要适当,常用的确定水平间距的方法有( )、( )、( )和优选法等。(﹡) 2、进行小麦品种比较试验,6个品种,每品种得到4个产量观察值,则该试验具有品种间自由度为( ),误差自由度为( )。(﹡﹡) 3、算术平均数的计算方法有( )法和( )法。(﹡) 4、在0,1,2,3,4,5,6,7,8,9中随机抽取一个数字,设A 为抽取的数字≤5,则P (A )=( )。(﹡) 5、直线回归方程通式为bx a y +=? ,其中a 叫( ),b 叫( )。(﹡﹡) 四、单项选择(每题1分共10分) 1、用于反映资料离散性的特征数是( )(﹡) A .变异系数 B .变异数 C .方差 D .标准差 2、下列统计数不属于变异数的是( )(﹡) A .极差 B .变异系数 C .标准差 D .众数 3、进行田间试验时,作为试验地必须具备( )两个基本条件。(﹡﹡) A. 准确性和精确性 B. 均匀性和代表性 C. 精确性和均匀性 D. 准确性和均匀性 4、要正确地制定一个试验方案,必须作到研究目的明确,处理水平简明合理,并必须在所比较的处理之间应用( )原则。(﹡﹡) A. 设立对照 B. 全面实施 C. 唯一差异 D. 相差等距或等比例 5、进行玉米品种比较试验,7个品种,每品种得到3个产量观察值,则该试验误差自由度

东农17春《田间试验与统计方法(专)》离线作业

东北农业大学网络教育学院 田间试验与统计方法网上作业题 作业题一 一、名词解释 1、随机样本:指由总体中随机抽取的个体组成的样本。 2、水平:试验因素通常是可以人为控制的,其数量的不同等级或质量的不同状态称为水平。 3、随机试验:满足下述三个条件的试验称为随机试验,试验可在相同条件下重复进行;试验的所有可能结果是明确可知的,并且不止一个;每次试验总是恰好出现这些可能结果中的一个,但在试验之前却不能肯定会出现哪一个结果。 4、χ2适合性检验:即根据χ2分布的概率值来判断实际次数与预期理论次数是否符合的假设检验。 5、概率:用于度量事件发生可能性大小的数值称作事件的概率。 二、判断,请在括号内打√或× 1、两因素间互作称为二级互作,三因素间的互作为三级互作。× 2、由8个小麦新品系和2个对照品种组成3次重复的品比试验,属于单因素试验。√ 3、设一样本有7个观察值,6、10、9、6、12、7、13,则方差为2.828。× 4、实施一个试验在安排区组时原则上应尽可能保持区组内的最大一致性,区组间允许较大差异。√ 5、将一块环境条件相近的试验田划分成30个面积相同的小区,不再做其他处理,观测某品种小区产量是一个随机试验。√ 6、若无效假设为H0:μ1=μ2,那么备择假设为H A:μ1≠μ2。√ 7、进行小麦品种比较试验,6个品种,每品种得到4个产量观察值,则该试验具有品种间自由度为3,误差自由度为20。× 8、方差分析中,F检验后就进行平均数的多重比较。× 9、相关系数(r)和回归系数(b)都是带有单位的。× 10、某样本观察值为17,13,21,10,19,9,11,8,则该样本的中数为14.5。× 三、填空 1、农业科学试验的基本任务是研究各种农业科学理论和技术,考察研究结果的实际表现,客观地评价其推广价值和应用范围,主要包括(品种)试验、(丰产)试验、(耕作)试验、(植保)试验和(土肥)试验。 2、在田间试验过程引起差异的外界因素中,(土壤)差异是最主要的,必须加以适当的控制。 3、设一样本有5个观察值,6、8、9、12、13,则x=(9.6),s=(2.88 ),s x=(1.29 ),CV=(30% )。 4、已知甲,乙两批水稻品种种子的发芽率分别为0.9和0.8,甲,乙种子各取一粒,做发芽试验,试问有两粒发芽的概率为( 0.72 ),至少有一粒发芽的概率为( 0.98),两粒都不发芽的概率为( 0.02 ) 。 5、反映资料集中性的特征数是(平均数),反映资料离散性的特征数是(变异数)。 四、单项选择 1、根据研究目的拟定的进行比较的一组处理,在相同试验条件下试验,所得各处理平均数值与试验总平均值之差,称为(C )。

田间试验与生物统计试卷(B)

一.单项选择题(10分) 1、株高、粒重、穗长这一类数据属于 。 (1)离散性数据 (2)计数数据(3)连续性数据(4)属性数据 2、概率概念的正确表达是 。 (1)事物发生的可能性(2)事件在试验结果中出现可能性大小的定量计量 (3)某一事件占全部事件的百分比(4)样本中某一类型数据个数与样本含量比值的百分数 3、标准正态分布曲线的展开度是由 决定的。 (1)σ (2)μ (3)df (4) u 4、样本标准误差是 。 (1)用来度量样本平均数偏离总体平均数的程度 (2)度量样本内每个个体偏离样本平均数的程度 (3)度量样本内每个个体偏离总体平均数的程度 (4)度量样本标准差偏离总体标准差的程度 5、在一个成组数据t 测验中,把两个样本方差合并为一个公共方差,其理由是 。 (1)合并后才能检验(2)它们总体平均数相等(3)两总体方差相等(4)计算工作需要 6、在σ未知情况下,单个样本平均数显著性检验应使用以下 检验统计量。 (1) σ μ -x (2) n s x μ-- (3) s x μ-- (4) n s x μ- 7、对应于备择假设21μμ>,无效假设的否定区域应是 。 (1)t>t α (2) t<-t α (3) ︱t ︱>t α/2 (4)说不清 8、在一孟德尔实验中,F 2代两种表现型后代数目为398和129,为判断这一分离比例是否符合3:1分利弊,需使用以下 方法作检验。 (1)u 检验 (2)t 检验 (3)2χ适合性检验 (4)F 检验 9、SSe 是由计算 得到的。 (1)重复间平方和(2)各水平平均数的平方和 (3)各观察值平方和(4)累积各处理内重复间平方和 10、一尾检验和两尾检验比较 。 (1)两尾检验更容易检验出差异 (2)在同样的检验要求下一尾检验需更大样本 (3)一尾检验比两尾检验更易计算(4)在样本含量相同时一尾检验效率更高 二、名词解释题(5分) 1、参 数 2、自由度 3、显著性水平 4、参数估计 5、水 平 三、问答题(12分) 1、为什么要计算数据标准差?标准差含义是什么? 2、田间试验设计基本原则及相互关系

《生物统计与田间试验》考试题1231教学资料

《生物统计与田间试验》考试题 20151231

《生物统计与田间试验》2006-2007学年第1学期 A 卷参考答案 一、判断题:判断结果填入括弧,以√表示正确,以×表示错误。(每小题2分,共14分) 1 多数的系统误差是特定原因引起的,所以较难控制。( × ) 2 否定正确无效假设的错误为统计假设测验的第一类错误。( √ ) 3 A 群体标准差为5,B 群体的标准差为12, B 群体的变异一定大于A 群体。( × ) 4 “唯一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( √ ) 5 某班30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.32 1,05.0=χ)。 ( √ ) 6 在简单线性回归中,若回归系数0≠β,则所拟合的回归方程可以用于由自变 数X 可靠地预测依变数Y 。( × ) 7 由固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于 推断处理的总体。( √ ) 二、填空题:根据题意,在下列各题的横线处,填上正确的文字、符号或数值。(每个空1分,共16分 ) 1 对不满足方差分析基本假定的资料可以作适当尺度的转换后再分析,常用方法有 平方根转换 、 对数转换 、 反正旋转换 、 平均数转换 等。 2 拉丁方设计在 两个方向 设置区组,所以精确度高,但要求 重复数 等于 处理数 ,所以应用受到限制。 3 完全随机设计由于没有采用局部控制,所以为保证较低的试验误差,应尽可能 使 试验的环境因素相当均匀 。

4 在对单个方差的假设测验中:对于C H =20σ:,其否定区间为2 ,2 12ν α χχ-<或 2 ,22ν αχχ>;对于C H ≥2 0σ:,其否定区间为2 ,12ναχχ-<;而对于 C H ≤20σ:,其否定区间为2 ,2ναχχ>。 5 方差分析的基本假定是 处理效应与环境效应的可加性 、 误差的正态 性 、 误差的同质性 。 6 一批玉米种子的发芽率为80%,若每穴播两粒种子,则每穴至少出一棵苗的概率为 0.96 。 7 当多个处理与共用对照进行显著性比较时,常用 最小显著差数法(LSD) 方法进行多重比较。 三、选择题:将正确选择项的代码填入题目中的括弧中。(每小题2分,共10分 ) 1 田间试验的顺序排列设计包括 ( C )。 A 、间比法 B 、对比法 C 、间比法、对比法 D 、阶梯排列 2 测定某总体的平均数是否显著大于某一定值时,用( C )。 A 、两尾测验 B 、左尾测验 C 、右尾测验 D 、无法确定 3分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( D )。 A 、[-9.32,11.32] B 、[-4.16,6.16] C 、[-1.58,3.58] D 、都不是 4 正态分布不具有下列哪种特征( D )。 A 、左右对称 B 、单峰分布 C 、中间高、两头低 D 、概率处处相等 5 对一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显 著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( C )。 A 、2MSe/6, 3 B 、MSe/6 , 3 C 、2MSe/3, 12 D 、MSe/3, 12

《田间试验设计与统计分析》试卷C

植物科学与技术专业090122 田间试验与统计分析课程代码2677 试题C 一、单项选择题(每小题1分、共20分。在每小题列出的四个备选项中只有一个是符合题 目要求的,请将其代码涂在答题卡上。) 1. 因素的水平是指 A.因素量的级别 B.因素质的不同状态 C.研究的范围与内容 D.因素量的级别和质的不同状态 2. 误差根据形成的原因不同,可分为 A.随机误差、系统误差 B.随机误差、人为误差 C.系统误差 D.偶然误差 3.如果田间试验无法在一天内完成,以下那种做法是正确的 A.同一小区必须在一天完成 B.几个区组可以同时操作 C.同一区组必须在一天完成 D.灵活安排 4.局部控制的主要作用是 A.降低误差 B.无偏估计误差 C.控制误差 D.分析误差 5.随机区组设计在田间布置时可采用以下策略 A.同一区组内小区可以拆开 B.不同区组可以放在不同田块 C.所有区组必须放在同一田块 D.区组内的小区可以顺序排列 6.随机区组设计 A.只能用于单因素试验 B.既能用于单因素又可用于多因素试验 C.只能用于多因素试验 D.只能用于田间试验 7.进行叶面施肥的试验中,对照小区应设置为 A.喷等量清水B.不喷C.减量喷D.以上均不正确 8.标准差的数值越大,则表明一组数据的分布()。 A.越分散,平均数的代表性越低 B.越集中,平均数的代表性越高 C.越分散,平均数的代表性越高 D.越集中,平均数的代表性越低 9.在使用变异系数表示样本变异程度时,宜同时列出()。 A.方差、全距 B.平均数、方差 C.平均数、标准差 D. 平均数、标准误 10.二项概率的正态近似应用连续性矫正时,其正态标准离差的表达中,错误的是 A、 c ||0.5 Y u μ σ -- =B、 c 0.5 Y u μ σ - =± C、 ()0.5 c Y u μ σ - = D、 c u= 11.盒中有24个球,从中随机抽取3个球,其中有1个球是红球,则可以判断该盒中的红球数为()。 A.肯定是8个 B.8个以上 C.8个以下 D.8个上下 12.与样本均值的抽样分布的标准差成反比的是 A.样本容量 B.样本容量的平方 C.样本容量的平方根 D.样本容量的二分之一13.正态曲线的理论取值范围是 A.6个标准差 B.± 3 C.±∞ D.没有限制 14.算术平均数的重要特性之一是离均差之和

生物统计与田间试验总复习

生物统计与田间试验 第一章绪论—科学试验及其误差控制 1.科学研究的基本方法:选题、文献、假说、假说的检验、试验的规划与设计。 2.唯一差异性原则:除需要比较的因素以外,其余的因素必须保持在同一水平。 3.试验方案:指根据试验目的和要求所拟进行比较的一组试验处理(treatment)的总称。 4.处理因素必须是:①可控的;②在数量上或质量上具有不同等级或水平。 5.水平(level):因素内的不同状态或者数量等级称为水平。 6.处理(treatment) :试验中的具体比较项目叫做处理。在单因素试中,每一个水平就是一个处理;在多因素试验中,每一个水平组合是一个处理。 7.试验因素、水平、处理是三个密切联系的概念:①凡一个因素就有若干个水平,因素与水平是联系在一起的。②水平组合是针对多因素试验而言的;一个水平组合是每个因素各出一个水平构成,为一个处理。③一个多因素试验的所有不同的水平组合数是各因素水平数之积。 8.试验指标:衡量试验处理效果的标准,简称指标。包括试验单元、抽样单元、测量单元。 9.试验效应(experimental effect) :试验因素对试验指标所起的增加或减少的作用。简单效应(simple effect):在同一因素内两种水平间试验指标的相差。主要效应(main effect);简称主效:一个因素内各简单效应的平均数称平均效应;交互作用效应(interaction effect),简称互作:两个因素简单效应间的平均差异。 9.一级互作(first order interaction) :两个因素间的互作,A×B、B×C ……。易于理解,实际意义明确;二级互作(second order interaction) :三个因素间的互作。 10.应有对照水平或处理,简称对照(check,CK)。 11.观察值(observation):将每次所取样品测定的结果称为一个观察值,记为y i。 12.误差(error):观察值与真值之间的差异。 13.偶然性误差(spontaneous error)或随机误差(random error):这是由于许多无法控制的内在和外在的偶然因素所造成。随机误差影响试验的精确性。 14.系统误差(systematic error)也叫片面误差(lopsided error):是由于试验材料、管理指施相差较大,仪器不准、标准试剂未经校正,以及观测、记载、抄录、计算中的差异所引起。系统误差影响试验的准确性。 15.准确性(accuracy)也叫准确度:指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度,系统误差影响了数据的准确性。 16.精确性(precision)也叫精确度:指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度,偶然误差影响了数据的精确性。 17.统计(statistics):指对某一现象的有关的数据的收集、整理、计算和分析等。 第二章田间试验的设计与实施 1.田间试验的基本要求:(1) 试验目的要明确;(2)试验条件要有代表性; (3)试验结果要可靠;(4)试验结果要能够重演;(5)体现唯一差异原则。

田间试验与统计分析

田间试验与统计分析 概论: 1.生物统计的内容包括哪三个方面? ①统计原理②统计方法③试验设计 2.生物统计的作用是什么? ①提供试验或调查的方法②提供整理或分析资料的方法 3.通常把样本容量小于或等于30的样本称为小样本。样本容量大于30的样本称为大样本。 4.生物统计:应用概率论和数据统计原理方法来确定生物界数量变化的学科。 根据研究目的确定的研究对象的全体称为总体。 总体的一部分称为样本。 由总体计算的特征数称为参数。是真值,不受抽样变动的影响。 由样本计算的特征数称为统计量,是参数的估计值,受抽样变动的影响。 准确性:也叫准确度,指在试验或调查中某一试验指标或性状的观测值与其真值接近的程度。 精确性:也叫精确度,指在试验或调查中同一试验指标或性状的重复观测值彼此接近的程度。 随机误差也叫抽样误差,这是由于许多无法控制的内在和外在的偶然因素所造成。 系统误差也叫片面误差,这是由于试验的初始条件相差较大,其条件未控制相同,测量的仪器不准,操作错误等所引起。(影响准确性) 第一章 1.田间试验:指在田间土壤、自然气候等环境条件下栽培作物,并进行与作物有关的各种科学研究试验。 试验指标:在试验中具体测定的性状或观测项目称为试验指标。 试验因素:指试验中人为控制的、影响试验指标的原因。 因素水平:对试验因素所设定的量的不同级别或质的不同状态称为因素水平。 试验处理:事先设计好的实施在试验单位上的具体项目叫试验处理。 试验小区:安排一个试验处理的小块地段称为试验小区。 试验单位:指施加试验处理的材料单位,也称为试验单元。 2.田间试验的特点?要求? 特点:①田间试验研究的对象和材料是农作物,以农作物生长发育的反应作为试验指标研究其生长发育规律、各项栽培技术或条件的效果。 ②田间试验具有严格的地区性和季节性。 田间试验普遍存在试验误差。 要求:①试验目的要明确 ②试验要有代表性和先进性 ③试验结果要正确可靠 ④试验结果要具有重演性 3.土壤差异的表现形式:梯度变化斑块状变化 4.田间试验对照的设置形式:空白对照互为对照标准对照试验对照自身对

生物统计学与田间试验设计教案

湖北省高等教育自学考试大纲 课程名称:生物统计学课程代码:02078 第一部分课程性质与目标 一、课程性质与特点生物统计学是运用数理统计的原理和方法,来分析和解释生物科学试验中各种现象和试验调查资料的一门科学,它涉及生物科学试验的设计、试验方案的实施、数据的收集、整理和统计分析等;是生物科学专业必修的一门专业基础课。 二、课程目标与基本要求通过本课程的学习,使学生了解生物科学试验的任务、要求,掌握生物科学试验设计的原则和技术,能熟练制定试验方案,进行生物科学试验的设计,并能根据生物统计学原理正确选用统计分析模型,进行数据的处理与分析,作出科学的结论。 三、与本专业其他课程的关系生物统计学以数学的概率论和数理统计为基础,涉及到数列、排列、组合、矩阵、微积分等知识,但本课程并不将这些知识作为重点进行过多的讨论,而主要偏重于统计原理的介绍和具体分析方法的应用,培养学生运用统计学原理分析和解决试验资料所提供信息的能力。 第二部分考核内容与考核目标 第一章概论 一、学习目的与要求通过本章的学习,了解课程的性质、地位和任务;生物统计学的发展史、现状及发展趋势;生物统计学在生物科学研究中的应用;深刻理解统计学术语的含义。 二、考核知识点与考核目标 (一)概论(重点)识记:常用统计学术语理解:生物统计学的基本概念应用:理解几组常用统计学术语及各组概念的含义,并根据概念回答一些基本问题。 (二)概论(次重点)识记:生物统计学的内容理解:生物统计学的作用 (三)概论(一般)识记:生物统计学的发展概况及发展趋势理解:近代描述统计学、现代推断统计学 第二章试验资料的整理与特征数的计算 一、学习目的与要求试验资料的搜集和整理是对数据资料进行统计分析的首要环节。通过本章学习,了解试验资料的类型,掌握试验资料的收集与整理、次数分布表的制作方法,重点掌握资料的分组方法、特征数的计算(平均数、变异数等)方法,深刻理解相关概念的含义。 二、考核知识点与考核目标 (一)试验资料的搜集、平均数、变异数(重点)识记:调查、试验、平均数的种类、极差、方差、标准差理解:算数平均数的计算方法及应用、标准差的计算应用:对给出的试验资料进行具体分析,包括制备图表,计算平均数和变异数等,并要求能根据分析结果得出结论。 (二)试验资料的整理(次重点)识记:原始资料的检查与核对理解:计数资料的整理、计量资料的整理应用:试验资料的整理,次数分布表、次数分布图的制作 (三)试验资料的类型(一般)识记:数量性状、质量性状的资料理解:统计次数法、平分法应用:识别试验资料的类型 第三章概率与概率分布 一、学习目的与要求本章是统计推断的理论基础。通过本章的学习,了解概率的基础知识,掌握概率的计算方法,深刻理解几种常见的理论分布及抽样试验和统计数的分布意义。 二、考核知识点与考核目标

《田间试验与统计分析》复习资料

≠β 一、判断题:判断结果填入括弧,以√表示正确,以×表示错误。(每小题2分,共14分) 1 多数的系统误差是特定原因引起的,所以较难控制。( × ) 2 否定正确无效假设的错误为统计假设测验的第一类错误。( √ ) 3 A 群体标准差为5,B 群体的标准差为12, B 群体的变异一定大于A 群体。( × ) 4 “唯一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( √ ) 5 某班30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已知 84.32 1,05.0=χ) 。 ( √ ) 6 在简单线性回归中,若回归系数,则所拟合的回归方程可以用于由自变数X 可靠地预测依变 数Y 。( × ) 7 由固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于 推断处理的总体。( √ ) 二、填空题:根据题意,在下列各题的横线处,填上正确的文字、符号或数值。(每个空1分,共16分 ) 1 对不满足方差分析基本假定的资料可以作适当尺度的转换后再分析,常用方法有 平方根转换 、 对数转换 、 反正旋转换 、 平均数转换 等。 2 拉丁方设计在 两个方向 设置区组,所以精确度高,但要求 重复数 等于 处 理数 ,所以应用受到限制。 3 完全随机设计由于没有采用局部控制,所以为保证较低的试验误差,应尽可能使 试验的环境 因素相当均匀 。 4 在对单个方差的假设测验中:对于C H =20σ:,其否定区间为2 ,2 12 να χχ -<或2 ,2 2ν α χχ>; 对于C H ≥20σ:,其否定区间为2 ,12ναχχ-<;而对于C H ≤20σ:,其否定区间为2 ,2ναχχ>。 5 方差分析的基本假定是 处理效应与环境效应的可加性 、 误差的正态性 、 误差的同质性 。 6 一批玉米种子的发芽率为80%,若每穴播两粒种子,则每穴至少出一棵苗的概率为 0.96 。 7 当多个处理与共用对照进行显著性比较时,常用 最小显著差数法(LSD) 方法进行多重比较。 三、选择题:将正确选择项的代码填入题目中的括弧中。(每小题2分,共10分 ) 1 田间试验的顺序排列设计包括 ( C )。 A 、间比法 B 、对比法 C 、间比法、对比法 D 、阶梯排列 2 测定某总体的平均数是否显著大于某一定值时,用( C )。 A 、两尾测验 B 、左尾测验 C 、右尾测验 D 、无法确定 3分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( D )。 A 、[-9.32,11.32] B 、[-4.16,6.16] C 、[-1.58,3.58] D 、都不是

生物统计与田间试验实验课数据

14位妇女的年龄和身体脂肪百分数 23 28 39 31 41 26 49 25 50 31 53 35 53 42 54 29 56 33 57 30 58 33 58 34 60 41 61 34 张桂珍女 18 165 89 李小兵男 19 173 91 胡涂虫男 16 180 70 诸葛菲菲飞女 17 164 82 第三章例题数据 表3.1 100个麦穗的每穗小穗数 18 15 17 19 16 15 20 18 19 17 17 18 17 16 18 20 19 17 16 18 17 16 17 19 18 18 17 17 17 18 18 15 16 18 18 18 17 20 19 18 17 19 15 17 17 17 16 17 18 18 17 19 19 17 19 17 18 16 18 17 17 19 16 16 17 17 17 15 17 16 18 19 18 18 19 19 20 17 16 19 18 17 18 20 19 16 18 19 17 16 15 16 18 17 18 17 17 16 19 17 表3.4 140行水稻产量(单位:克) 177 215 197 97 123 159 245 119 119 131 149 152 167 104 161 214 125 175 219 118 192 176 175 95 136 199 116 165 214 95 158 83 137 80 138 151 187 126 196 134 206 137 98 97 129 143 179 174 159 165 136 108 101 141 148 168 163 176 102 194 145 173 75 130 149 150 161 155 111 158 131 189 91 142 140 154 152 163 123 205 149 155 131 209 183 97 119 181 149 187 131 215 111 186 118 150 155 197 116 254 239 160 172 179 151 198 124 179 135 184 168 169 173 181 188 211 197 175 122 151 171 166 175 143 190 213 192 231 163 159 158 159 177 147 194 227 141 169 124 159

相关主题
文本预览
相关文档 最新文档