生物统计名词解释
- 格式:pdf
- 大小:200.47 KB
- 文档页数:3
生物统计名词解释一、田间试验1.田间试验:是指在田间土壤、自然气候等环境条件下栽培作物,并进行与作物有关的各种科学研究的试验。
4.准确性:也称准确度,指某一试验指标或性状的观测值与该实验指标或性状观测值总体平均数接近的程度(实验的系统误差影响准确性大小)。
5.精确性:也称精确度,指同一试验指标或性状的重复观测值彼此接近程度(实验的随机误差影响精确性大小)。
6.试验指标:用来衡量实验结果好坏或处理效应高低、在试验中具有测定的性状或观测的项目称为试验指标。
7.试验因素:试验中人为控制的、影响试验指标的原因或条件称为试验因素。
8.试验水平:对试验因素所设定的质的不同状态或量的不同级别称为试验水平,简称水平。
9.试验处理:事先设计好的实施在试验单位上的具体项目称为实验处理简称处理。
10.实验小区:实施一个实验处理的一小块长方形土地称为实验小区,简称小区。
11.试验单位:实施试验处理的材料单位称为试验单位,亦称试验单元。
12.总体与个体:根据研究目的确定的研究对象的全体称为总体,其中的一个研究对象称为个体。
13.样本:从总体中抽取的一部分个体组成的集合。
14.样本容量:样本所包含的个体数目,常记为n。
15.试验误差:由于受到试验因素以外各种内在的、外在的非试验因素的影响使观测值与试验处理观测值总体平均数之间产生的差异,简称误差。
16.系统误差:在一定试验条件下,由某种原因所引起的使观测值发生方向性的误差,又称偏性。
17.随机误差:由多种偶然的、无法控制的因素引起的误差。
21.边际效应:指小区两边或两端植株的生长环境与小区中间植株的生长环境不一致而表现出的差异。
22.小区形状:指小区长宽比例。
(小区形状一般为长方形,狭长小区使各小区更紧密相邻,减少了小区之间的土壤差异)23.区组:将一个重复全部小区安排与土壤非礼等环境条件相对均匀一致的小块土地上,成为一个区组(田间试验一般设置3-4次重复,即设置3-4个区组。
样本: 样本从总体中抽出的若干个体所构成的集合称为样本。
总体: 总体指具有相同性质的个体所组成的集合称为总体。
连续变量:表示在不变量范围内可抽出某一范围的所有值。
非连续变量:也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。
准确性:指在调查或实验中某一试验指标或形状的观测值与真值接近的程度。
精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小。
资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体事务或现象观察的结果。
数量性状资料:指一般是由计数和测量或度量得到的。
质量性状资料:是指对某种现象只能观察而不能测量的资料,也称属性资料。
计数资料;指由计数得到的数据。
计量资料:有测量或度量得到的数据。
普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查。
抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到抽样调查的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。
全距(极差):是指样本数据资料中最大观测值与最小观测值的差值。
组中值:是指两个组限下线和上限的中间值。
算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。
中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值。
众数:资料中出现次数最多的那个观测值或次数最多一组的中点值。
几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值。
方差:指用样本容量 n 来除离均差平方和,得到平均的平方和。
标准差:指方差的平方根和。
变异系数:指将样本标准差除以样本平均数得出的百分比。
概率:指某事件 A 在 n 次重复试验中,发生了几次,当试验次数 n 不断增大时,事件 A 发生的频率 W(A)概率就越来越接近某一确定值 P,于是则定 P 为事件 A 发生的概率.和事件:指事件 A 和事件 B 至少有一件发生而构成的新事件称为事件 A 和事件B 的事件。
1.样本: 样本从总体中抽出的若干个体所构成的集合称为样本。
2.总体: 总体指具有相同性质的个体所组成的集合称为总体。
3.连续变量:表示在不变量范围内可抽出某一范围的所有值。
4.非连续变量:也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。
5.准确性:指在调查或实验中某一试验指标或形状的观测值与真值接近的程度。
6.精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小。
7.资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体事务或现象观察的结果。
8.数量性状资料:指一般是由计数和测量或度量得到的。
9.质量性状资料:是指对某种现象只能观察而不能测量的资料,也称属性资料。
10.计数资料;指由计数得到的数据。
11.计量资料:有测量或度量得到的数据。
12.普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查。
13.抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到抽样调查的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。
14.全距(极差):是指样本数据资料中最大观测值与最小观测值的差值。
组中值:是指两个组限下线和上限的中间值。
15.算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。
16.中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值。
17.众数:资料中出现次数最多的那个观测值或次数最多一组的中点值。
18.几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值。
19.方差:指用样本容量 n 来除离均差平方和,得到平均的平方和。
20.标准差:指方差的平方根和。
21.变异系数:指将样本标准差除以样本平均数得出的百分比。
22.概率:指某事件 A 在 n 次重复试验中,发生了几次,当试验次数 n不断增大时,事件 A 发生的频率 W(A)概率就越来越接近某一确定值 P,于是则定 P 为事件 A 发生的概率.23.和事件:指事件 A 和事件 B 至少有一件发生而构成的新事件称为事件 A 和事件 B 的事件。
名词解释1、总体:指我们研究的全部对象,指性质相同的所有个体的集合,包括有限总体和无限总体。
2、样本:总体的一部分,样本内包含的个体数目称为样本含量。
3、随机抽样:随机抽样要求总体中的任何个体都有同等机会被抽到和抽样时不受任何主观因素的影响。
4、随机变量:在随机试验中,被测定的量是可取不同值的变量,而且它究竟取何值具有随机性,这样的量为随机变量。
5、统计量:由样本计算的数,是总体参数的估计值,受抽样变动的影响。
6、参数:由总体计算的数。
是一个真值,没有抽样变动的影响。
7、数学期望:所谓X或X的函数的数学期望,即它们的理论平均值。
8、中心极限定理:假设被研究的随机变量X,可以表示为许多相互独立的随机变量Xi的和。
那么,如果Xi的数量很大,而且每一个别的Xi对于X所起的作用很小,则可以被认为X 服从或近似地服从正态分布。
9、统计假设检验:先对所估计的总体做一假设,然后通过样本数据推断这个假设是否接受,这种途径称为统计假设检验。
10、小概率原理:在一次试验中几乎是不会发生的。
若根据一定的假设条件计算出来的该事件发生的概率很小,而在一次试验中它竟然发生了,则可认为原假设条件不正确,给予否定。
11、点估计:用由样本数据所计算出来的单个数值,对总体参数所作的估计称为点估计。
12、区间估计:对总体平均数更合理的估计,是在一定概率保证下,给出总体平均数和标准差的可能范围,这种估计方法叫区间估计。
13、置信区间:区间估计中所给出的可能范围叫置信区间。
14、拟合优度检验:是用来检验实际观测数与依照某种假设或模型计算出来的理论数之间的一致性,以便判断该假设或模型是否与观测数相配合。
15、方差分析:是一类特定情况下的统计假设检验,是平均数差异显著性检验—成组数据t 检验的一种引伸。
t检验可以判断两组数据平均数间的差异显著性,而方差分析则可以同时判断多组数据平均数之间的差异显著性。
16、抽样分布:从一个已知的总体中,独立随机的抽取含量为n的样本,研究所得的样本的各种统计量的概率分布,称为抽样分布。
生物统计名词解释生物统计是一种应用数学于生物学研究的方法,通过收集,整理和分析生物学数据,来解释和揭示生物学现象和问题。
以下是一些常见的生物统计学名词和概念的解释:1. 总体(Population):指研究对象的全体个体。
2. 样本(Sample):指从总体中选出的部分个体。
3. 参数(Parameter):指总体的某一特征的度量。
4. 统计量(Statistic):指样本的某一特征的度量。
5. 随机变量(Random Variable):指用数字来表示随机试验的结果的变量。
6. 数据(Data):指研究中获得的实际观测结果或测量值。
7. 描述统计学(Descriptive Statistics):指对数据进行总结、描述和分析的方法。
8. 推论统计学(Inferential Statistics):指基于样本数据对总体进行推断和判断的方法。
9. 假设检验(Hypothesis Testing):指对某一假设进行验证的统计推断方法。
10. 显著性水平(Significance Level):指在假设检验中,拒绝零假设的标准。
11. P值(P-value):指在假设检验中,观察到的数据或更极端情况下出现的概率。
12. 置信区间(Confidence Interval):指对参数的估计范围。
13. 误差(Error):指由于采样误差、测量误差等原因造成的数据与真实值之间的差异。
14. 偏差(Bias):指由于研究设计或收集方法的不准确性引起的系统误差。
15. 方差(Variance):指数据的分散程度,反映了各个观测值与平均值之间的差异。
16. 标准差(Standard Deviation):指方差的平方根,用来描述数据的离散程度。
17. 正态分布(Normal Distribution):指符合正态分布模式的概率分布,常用于表示随机变量的分布。
18. T检验(Student's t-test):指用于比较两个样本均值是否有显著差异的假设检验方法。
样本: 从总体中抽出的若干个体所构成的集合称为样本。
总体: 指具有相同性质的个体所组成的集合称为总体。
连续变量:表示在不变量范围内可抽出某一范围的所有值。
非连续变量:也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。
准确性:指在调查或实验中某一试验指标或形状的观测值与真值接近的程度。
精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小。
资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体事务或现象观察的结果。
数量性状资料:指一般是由计数和测量或度量得到的。
质量性状资料:是指对某种现象只能观察而不能测量的资料,也称属性资料。
计数资料;指由计数得到的数据。
计量资料:有测量或度量得到的数据。
普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查。
抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。
全距(极差):是指样本数据资料中最大观测值与最小观测值的差值。
组中值:是指两个组限下线和上限的中间值。
算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。
中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值。
众数:资料中出现次数最多的那个观测值或次数最多一组的中点值。
几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值。
方差:指用样本容量n来除离均差平方和,得到平均的平方和。
标准差:指方差的平方根和。
变异系数:指将样本标准差除以样本平均数得出的百分比。
概率:指某事件A在n次重复试验中,发生了几次,当试验次数n不断增大时,事件A发生的频率W(A)就越来越接近某一确定值P,于是则定P为事件A发生的概率:P(A)=P和事件:指事件A和事件B至少有一件发生而构成的新事件称为事件A和事件B的事件。
积事件:指事件A和事件B同时发生而构成的新事件,称为事件A和事件B的积事件。
样本: 样本从总体中抽出的若干个体所构成的集合称为样本。
总体: 总体指具有相同性质的个体所组成的集合称为总体。
连续变量:表示在不变量范围内可抽出某一范围的所有值。
非连续变量:也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。
准确性:指在调查或实验中某一试验指标或形状的观测值与真值接近的程度。
精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小。
资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体事务或现象观察的结果。
数量性状资料:指一般是由计数和测量或度量得到的。
质量性状资料:是指对某种现象只能观察而不能测量的资料,也称属性资料。
计数资料;指由计数得到的数据。
计量资料:有测量或度量得到的数据。
普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查。
抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到抽样调查的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。
全距(极差):是指样本数据资料中最大观测值与最小观测值的差值。
组中值:是指两个组限下线和上限的中间值。
算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。
中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值。
众数:资料中出现次数最多的那个观测值或次数最多一组的中点值。
几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值。
方差:指用样本容量 n 来除离均差平方和,得到平均的平方和。
标准差:指方差的平方根和。
变异系数:指将样本标准差除以样本平均数得出的百分比。
概率:指某事件 A 在 n 次重复试验中,发生了几次,当试验次数 n 不断增大时,事件 A 发生的频率 W(A)概率就越来越接近某一确定值 P,于是则定 P 为事件 A 发生的概率.和事件:指事件 A 和事件 B 至少有一件发生而构成的新事件称为事件 A 和事件 B 的事件。
1.样本:样本从总体中抽出的若干个体所构成的集合称为样本;2.总体: 总体指具有相同性质的个体所组成的集合称为总体;3.连续变量:表示在不变量范围内可抽出某一范围的所有值;4.非连续变量:也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数;5.准确性:指在调查或实验中某一试验指标或形状的观测值与真值接近的程度;6.精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小;7.资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体事务或现象观察的结果;8.数量性状资料:指一般是由计数和测量或度量得到的;9.质量性状资料:是指对某种现象只能观察而不能测量的资料,也称属性资料;10.计数资料;指由计数得到的数据;11.计量资料:有测量或度量得到的数据;12.普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查;13.抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到抽样调查的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断;14.全距极差:是指样本数据资料中最大观测值与最小观测值的差值;组中值:是指两个组限下线和上限的中间值;15.算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商;16.中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值;17.众数:资料中出现次数最多的那个观测值或次数最多一组的中点值;18.几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值;19.方差:指用样本容量 n 来除离均差平方和,得到平均的平方和;20.标准差:指方差的平方根和;21.变异系数:指将样本标准差除以样本平均数得出的百分比;22.概率:指某事件 A 在 n 次重复试验中,发生了几次,当试验次数 n 不断增大时,事件 A 发生的频率 WA 概率就越来越接近某一确定值 P,于是则定P 为事件 A 发生的概率.23.和事件:指事件 A 和事件 B 至少有一件发生而构成的新事件称为事件 A和事件 B 的事件;24.积事件:指事件 A 和事件 B 同时发生而构成的新事件,称为事件 A 和事件 B 的积事件;25.互斥事件:指事件 A 和事件 B 不能同时发生,称为事件 A 和事件 B 互斥;26.对立事件:指事件 A 和事件 B 必有一个事件发生,但两者不能同时发生;27.独立事件:指事件 A 的发生与事件 B 的发生毫无关系;28.完全事件系:指如果多个事件 A1、A2、、、、、、An 两两相斥,且每次试验结果必然发生其一,则称事件 A1、完全事件系 A2、、、、、、An 为一个完全事件系;29.概率加法定理:指互斥事件 A 和 B 的和事件的概率等于事件 A 和事件B 的概率之和, PA+B=PA+PB;30.概率乘法定理:指事件 A 和事件 B 为独立事件,则事件 A 与 B 同时发生的概率等于事件 A 和事件 B 各自概率乘法定理的乘积,即:PAB=PAPB; 31.伯努利大数定律:设 M 是 n 次独立试验中事件 A 出现的次数,而不是事件 A 在每次试验中出现的概率,则对于任意小的正数ε ,有如下关系:limp{m/n-p< ε }=132.辛钦大数定律:是用来说明为什么可以用算术平均数来推断总体平均数 m的;33.统计推断:指从样本的统计数对总体参数做出的推断,包括参数估计和假设检验;34.假设检验:指根据总体理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后有样本的实际结果,经过一定的计算,做出在一定概率意义上应该接受的那种假设的推断;35.参数估计:指由样本结果对总体参数在一定概率水平下所作出的估计;点估计是用样本统计量直接给出总体相应参数的估计值,由于抽样误差存在,X拔不同的样本将会得到不同的点估计值,点估计缺乏明确的精度概念,而区间估计在一定程度上可以弥补这个不足36.小概率原理:指如果假设一些条件,并在假设的条件下能够准确地算出事件A 出现的概率 a 为很小,则在假设条件下的 n 次独立重复试验中时按预定的概率发生,而在有一次试验中则几乎不可能独立;37.显着水平:指在无效假设和备择假设后,要确定一个否定 H0 的概率标准,这个概率称为显着水平;38.方差同质性:就是指各个总体的方差是相同的;39.α 错误 :H0 是真实的,假设检验却否定了它,就烦了一个否定真实假设的错误,称为α 错误;40.β 错误:指如果H0 不是真实的,假设检验时却接受了 H0,否定了 HA 这样就犯了接受不真实假设的错误,称为β 错误;41.适合性检验:指比较观测值与理论值是否符合的假设检验交适合性检验;42.独立性检验:指研究两个或两个以上因子彼此之间是相互独立的还是相互影响的一类统计方法;43.相关分析:是研究现象之间是否存在某种依存关系, 并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量间的相关关系的一种统计方法;44.回归分析:是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法;45.回归系数:y^=a+bx,自变量 x 改变一个单位,依变量 y 平均增加或减少的单位数,即回归直线的斜率 b;46.回归截距:y^=a+bx,a 是当 x=0 时的 Y^值,即直线在 y 轴上的截距,称为回归截距;47.离回归平方和:它反映除去 x 与 y 相关程度和性质的统计数;48.回归平方和:它反映在 y 的总体变异种由于 x 与 y 的直线关系而产生 y变异减小的部分;49.相关系数:是指通过计算表示 x 和 y 相关程度和性质的统计数;50.决定系数:是变量 x 引起 y 变异的回归平方和与 y 变异总平方和的比率;51.转换:指估计总体相关系数 p 的置信区间时,需要将 r 转换成 z;52.试验设计:广义的指整个研究课题的设计,包括实验方案的拟订,试验方案的拟订,试验单位的选择,分组的排列,实验过程中试验指标的现象记载,试验资料的整理,分析等内容;53.试验结果重演:是指在相同的条件下,在进行实验或实践,应能重复获得与原试验结果相近的结果;54.处理因素:一般指对受试对象给予的某种外部干预;55.主效应:多因素中试验中引起实验结果发生变化的主要;56.互作:因素之间的交互作用;57.受试对象:是处理因素的客体,实际上就是根据研究目的而确立的观测总体;58.处理效应:是处理因素作用于受试对象的反应,是研究最终体现59.误差:在试验中受偶然影响或者说非处理因素影响使观测值偏离试验处理真值的差异;60.随机误差:由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间产生的误差;61.系统误差:由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差62.重复:在试验中,同一处理设置的试验单位数;63.随机:是指一个重复的某一处理或处理组合被安排在哪一个试验单位,不要有主观成见;64.均积:是 x 与 y 的平均的离均差的乘积和,简称均积;65.协方差:与均积相应的总体参数;66.协方差分析:把回归分析与方差分析结合;67.试验控制:要提高试验的精确度和灵敏度,必须严格控制试验条件的均匀性,使各处里处于尽可能一致的条件下;68.统计控制:是试验控制的一种辅助手段,是用统计方法来矫正因自变量的不同而对依变量所产生的影响;69.估计量:估计总体参数的统计量70.无偏估计量:如果一个统计量的理论平均数即数学期望等于总体参数,这个统计量就叫无偏估计量71.矩估计:用样本矩作为总体矩的估计值72.矩估计法数字特征法、矩法用样本矩作为相应总体矩的估计量,也可以用样本数字特征作为相应的总体数字特征的估计量;用矩法获得的估计值,叫据估计值;据发的思想实质是用样本去替换总体矩的原则,称之为替换原则73.有效估计量:设a1,a2是A的两个无偏估计量,若vara1<vara2,则a1为有效估计量74.抽样误差:由抽样引起的样本值与总体值之间的差异成为抽样误差,直接原因:总体中各个体之间存在差异,或重复试验中一些服从某种分布的偶然误差的存在75.标注误差标准误:描述样本平均数波动情况的统计量,就是X拔的方差或标准差,计均数抽样误差为西格玛X拔,=西格玛/根号n,西格玛X拔就是标准误差76.估计样本平均数方差:SX拔平方,=S平方/n77.估计标准误:SX拔,=S/根号n78.置信区间:达到某一置信度如95%时,预报量可能出现的范围如Ey±西格玛,这里西格玛是标准差置信区间的意义是:反复抽样多次,每次的样本容量相等,每次的样本值确定一个区间a1,a2,这个区间包含a的概率是1001-阿尔法%,不包含a的概率是100阿尔法%79.置信水平置信度,置信系数,可靠度是指总体参数值落在样本统计值某一区内的概率;而是指在某一置信水平下,样本统计值与总体参数值间误差范围;置信区间越大,置信水平越高;80.拟合优度检验:对总体分布类型的检验,包括检验观测数与理论书之间的一致性,通过检验观测数与理论书之间的一致性来判断事件之间的独立性81.皮尔逊定理:若n充分大,则不论总体服从什么分布,卡平方总是近似服从自由度为m-a-1的卡平方分布82.方差分析:能同时判断多组数据平均数之间的差异显着性,能把随机变异从混杂状态中分离开来,从而为判断因素对实验结果有无确实的影响提供依据83.方差分析的前提条件:等方差,正态性、独立性84.固定因素:若因素的a个水平是经过特意选择的,则该因素为固定因素;发差分析所得到的结论只适合于选定的几个水平,并不能将其结论扩展到未加考虑的水平上85.固定效应模型:处理固定因素所用的模型称为固定效应模型或固定模型86.随机因素:若因素的a个水平,是从该因素水平总体中随机抽出的样本,则该因素称为随机因素,从随机因素a个水平所得到的结论,可以推广到这个因素的所有水平上87.处理随机因素所用的模型称为随机效应模型88.多重比较:对各对均值之间的差异的显着性检验89.LSD法在统计推断时犯第一类错误的概率大,而Duncan法犯第一类错误的概率小;90.多个方差齐性检验bartlett检验,巴特氏卡平方检验:当a个随机样本是从独立正态总体中抽取时,可以计算出统计量K平方,当n=minnj充分大时,K 平方的抽样分布非常接近于a-1自由度的卡方分布;由此可对多个总体进行卡平方检验;91.两因素之间交互作用产生新效应的现象为交互作用92.由因素水平的改变而造成的因素效应的改变称为该因素的主效应93.交叉分组设计:假设A药物有a水平,B药物有b水平,共有ab个剂量组合,每一组重复n次;共有abn名病人参加实验,这样的实验设计称为交叉分组设计94.相关:设有两个随机变量X和Y,对于任一随机变量的每一个可能的值,另一个随机变量都有一个确定的分布与之相对应,则称这两个随机变量之间存在相关关系95.如果变量之间的关系可以用函数关系来表达,就称它们之间的关系为确定性关系96.回归关系、相关关系:统计学上把变量之间的非确定性关系称为相关关系,也成为回归关系97.如果对于一个普通变量x的每一个可能的值xj都有随机变量Y的一个分布与之对应,则称随见变量Y的一个分布与之对应,则称随机变量Y对x存在回归关系98.具有回归关系的两变量之间对于任一xi都不会有一个确切的yi与之对应,但为了描述两变量之间的数量关系,可选当x=xi时Y的平均数谬角标Y乘X=xi与之相对应,则称谬角标Y乘X是Y的条件平均数99.Y1,y2…yn这n个数据的离差平方和,记作SYY,称为总离差平方和,反映了n个yi折的离散程度100.回归平方和y折-y拔平方求和,几座SSR;是n个yi折的离差平方和,反映了n个yi折的离散程度101.剩余平方和残差平方和yi-yi拔平方求和,记作SSe,是除了x对Y的线性影响之外的其他剩余因素造成的平方和,这些因素中包括x对Y的非线性影响及试验误差,观察误差等随机因素102.相关分析是对两个或两个以上随见变量之间相互关联程度进行分析的统计学方法103.存在于两个随机变量之间的相关关系称为简单相关或单相关,存在于三个或三个以上变量之间的相关关系为多重相关或复相关在一元回归中,回归的显着程度,可以用相关系数来表示,同样,在多元回归问题中,回归的显着程度可以用复相关系数表示104.统计学上把衡量变量之间关系密切程度的统计量称为相关系数105.消除了其他变量的影响后两个变量之间的相关关系称为偏相关纯相关;为了反映两变量间的真正关系,就要保证在其他变量都保持不变的情况下,计算它们的相关系数,这时的相关系数称为偏相关系数或纯相关系数106.样本平均数作为总体平均数估计值的优良:无偏均值等于总体平均数、有效方差小雨其他估计值、一致性总体平均数为极限值107.概率论中有关论证随机变量的和的分布服从正态分布的一类定理称为中心极限定理108.若X为一随机变量,则Fx=PX<=x为X的分布函数数理统计上称统计量的分布为抽样分布第一个统计假设是μ =10,这个假设称为原假设零假设,零值假设,用符号H0表示;第二个统计假设μ ≠10 称为备择假设替代假设,用符号H1或HA表示;概率很小的事件在一次试验中实际上是不可能发生的;按小概率原理否定H0,不免要犯错误,我们知道,当H0为真时,小概率事件A也有可能发生,因此当我们拒绝H0时,我们可能会犯以真为假的错误,称之为Ⅰ型错误;原假设不真实,而我们却按小概率原理接受了它,这种以假为真的错误称为Ⅱ型错误;假设检验的步骤提出假设H0,即,假定试验结果与真值正常值,或要求值没有差异,现有差异是由抽样误差所引起的;确定检验方法,在H0为真的前提下,构造一个合适的统计量U、T、X2 、或 F;显着性水平a的确定,然后由a确定所选检验统计量的临界值;从而划定接受域和拒绝域;做出推断根据样本值计算所选统计量的具体值;然后做出推断:统计推断的主要内容分为两大类:总体参数估计和统计假设检验;通过样本确定分布函数中参数值的过程称为参数估计;随机变量的数字特征同它的概率分布中的参数之间通常有一定的关系,因而对数字特征的估计也被称为参数估计;由抽样引起的样本值与总体值之间的差异称为抽样误差;下面是几种常用的衡量估计量好坏的准则;无偏性有效性一致性标准误差,标准误描述样本平均数波动情况的统计量就是样本平均数这个随机变量的方差或标准差,配对实验是指这样的实验,来自两个总体的样本值是成对出现的,它的特点是n1=n2,一个样本中的某个数据必然对应于另一个样本中的相应数据;由于同一配对内两个供试材料的实验条件很接近,而且这一配对内的系统误差又可以通过这一对数据的差数来消除,从而使处理效果更加明显,因而可以减小实验误差,提高实验精度;对总体分布类型的检验通常称为分布函数的拟合优度检验goodness of fit test ;该检验包括两种类型:一是检验观测数与理论数之间的一致性;二通过检验观测数与理论数之间的一致性来判断事件之间的独立性;皮尔逊卡平方检验的第二个主要应用方面是通过检验观测数与理论数之间的一致性来判断事件之间的独立性;列联表的独立性检验就属于这种情况;列联表是样本观测数据按两个或两个以上标准分类所得的一种频数表;方差分析的前提条件等方差:a组数据可看作来自a个总体的a个样本,要求每个总体要有相同的方差s2;正态性:要求a个总体均服从正态分布独立性:要求a个总体之间相互独立;处理固定因素所用的模型称为固定效应模型fixed effect model或简单地称为固定模型fixed model;两因素之间相互作用而产生新效应的现象称为交互作用由因素水平的改变而造成的因素效应的改变称为该因素的主效应如果变量之间的关系不可以用函数关系来表达,则称它们之间的关系为非确定性关系;统计学上把变量之间的非确定性关系称为相关关系,有时也称为回归关系;若X也是一个随机变量,在Y对X存在回归关系的同时,X对Y也存在回归关系,这时称X和Y间存在相关correlation关系;相关分析是对两个或两个以上随机变量之间相互关联程度进行分析的统计学方法;存在于两个随机变量之间的相关关系称为简单相关,或单相关;存在于三个或三个以上变量之间的相关关系为多重相关,或复相关;统计学上把衡量变量之间关系密切程度的统计量称为相关系数;一个变量与两个或两个以上变量之间的相关关系称为复相关,而它们之间相关联密切程度的数量指标就称为复相关系数消除了其它变量的影响后两个变量之间的相关关系称为偏相关或纯相关,相应的相关系数称为偏相关系数partial correlation coefficient或纯相关系数。
样本: 从总体中抽出的若干个体所构成的集合称为样本。
总体: 指具有相同性质的个体所组成的集合称为总体。
连续变量:表示在不变量范围内可抽出某一范围的所有值。
非连续变量:也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。
准确性:指在调查或实验中某一试验指标或形状的观测值与真值接近的程度。
精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小。
资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体事务或现象观察的结果。
数量性状资料:指一般是由计数和测量或度量得到的。
质量性状资料:是指对某种现象只能观察而不能测量的资料,也称属性资料。
计数资料;指由计数得到的数据。
计量资料:有测量或度量得到的数据。
普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查。
抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。
全距(极差):是指样本数据资料中最大观测值与最小观测值的差值。
组中值:是指两个组限下线和上限的中间值。
算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。
中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值。
众数:资料中出现次数最多的那个观测值或次数最多一组的中点值。
几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值。
方差:指用样本容量n来除离均差平方和,得到平均的平方和。
标准差:指方差的平方根和。
变异系数:指将样本标准差除以样本平均数得出的百分比。
概率:指某事件A在n次重复试验中,发生了几次,当试验次数n不断增大时,事件A发生的频率W(A)就越来越接近某一确定值P,于是则定P为事件A发生的概率:P(A)=P和事件:指事件A和事件B至少有一件发生而构成的新事件称为事件A和事件B的事件。
积事件:指事件A和事件B同时发生而构成的新事件,称为事件A和事件B的积事件。
一、田间试验
1.田间试验:是指在田间土壤、自然气候等环境条件下栽培作物,并进行与作物有关的各种科学研究的试验。
4.准确性:也称准确度,指某一试验指标或性状的观测值与该实验指标或性状观测值总体平均数接近的程度(实验的系统误差影响准确性大小)。
5.精确性:也称精确度,指同一试验指标或性状的重复观测值彼此接近程度(实验的随机误差影响精确性大小)。
6.试验指标:用来衡量实验结果好坏或处理效应高低、在试验中具有测定的性状或观测的项目称为试验指标。
7.试验因素:试验中人为控制的、影响试验指标的原因或条件称为试验因素。
8.试验水平:对试验因素所设定的质的不同状态或量的不同级别称为试验水平,简称水平。
9.试验处理:事先设计好的实施在试验单位上的具体项目称为实验处理简称处理。
10.实验小区:实施一个实验处理的一小块长方形土地称为实验小区,简称小区。
11.试验单位:实施试验处理的材料单位称为试验单位,亦称试验单元。
12.总体与个体:根据研究目的确定的研究对象的全体称为总体,其中的一个研究对象称为个体。
13.样本:从总体中抽取的一部分个体组成的集合。
14.样本容量:样本所包含的个体数目,常记为n。
15.试验误差:由于受到试验因素以外各种内在的、外在的非试验因素的影响使观测值与试验处理观测值总体平均数之间产生的差异,简称误差。
16.系统误差:在一定试验条件下,由某种原因所引起的使观测值发生方向性的误差,又称偏性。
17.随机误差:由多种偶然的、无法控制的因素引起的误差。
21.边际效应:指小区两边或两端植株的生长环境与小区中间植株的生长环境不一致而表现出的差异。
22.小区形状:指小区长宽比例。
(小区形状一般为长方形,狭长小区使各小区更紧密相邻,减少了小区之间的土壤差异)
23.区组:将一个重复全部小区安排与土壤非礼等环境条件相对均匀一致的小块土地上,成为一个区组(田间试验一般设置3-4次重复,即设置3-4个区组。
每个区组阿奶全部处理的称为完全区组,当处理数较多时,每个区组安排部分处理的称为不完全区组)。
二、资料的整理与描述
1.数量性状资料
(1)数量性状:能够以量测或计数的方式表示其数量特征的性状。
(2)计量资料:也称连续性变量资料,用度、量、衡等计量工具以量测方式直接获得的数量性状资料。
(3)计数资料:也称不连续性变量资料或间断性变量资料,是指用计数方式获得的数量性状资料。
计数资料的观测值只能以整数表示。
2.质量性状资料
(1)质量性状:又称属性性状,指能观测到而不能直接测量的性状。
(2)统计次数资料:在一定的总体或样本内,根据某一质量性状类别统计其次数,以次数作为质量性状的数量。
(3)定级评分法:用不同数字表示某种现象在某种程度上的差别。
3.资料的检查与核对目的:确保原始资料的完整性和正确性
(1)完整性:是指原始资料无缺失或重复。
(2)正确性:是指原始资料的测量和记载无差错,或未进行不合理的归并。
5.资料的集中程度描述——平均数
(1)算术平均数:资料中各观测值的总和除以观测值的个数所得的商,简称平均数或均数,样本平均数记为
c.总体平均数包含N个个体的有限总体的平均数,用μ表示。
(4)几何平均数:n个观测值相乘之积开n次方所得的n次根,记为G。
(5)调和平均数:资料中n个观测值倒数的算术平均数的倒数,记为H,
自由度离均差平方和的自由度简称自由度记为df。
(3)变异系数样本标准差与样本平均数的比值,以百分数表示,记为CV,
三、常用概率分布
1.事件(1)基本事件:不能再分的事件
(2)复合事件:有若干个基本事件组合而成的事件
(3)必然事件:在一定条件下进行一项实验,必然会发生的事件,用Ω表示(4)不可能事件:在一定条件下进行一项实验,不可能发生的事件,用Φ表示2.小概率事件不可能性原理:小概率事件不是不可能事件,但在一次试验中发生的可能性很小,不发生的可能性很大,以至于实际上可以看成是不可能发生的。
3.随机变量
(1)离散型随机变量:如果表示实验结果的变量x的可能取值之多为可列个,且以各种确定的概率取这些不同的值,则称变量x为离散型随机变量。
(2)连续型随机变量:如果表示实验结果的变量x的可能取值为某范围内的数值,且变量x在其取值范围内的任一区间内取值的概率是确定的,则称变量x为连续型随机变量。
4.二项分布x~B(n,p)
(1)二项总体:非此即彼的两项构成的总体
(2)标准正态分布:平均数μ=0、方差σ2=1的正态分布,记为u~N(0,1)。
(3)中心极限定理若随机变量x服从平均数是μ、方差是σ2的分布(不是正态分布);x1,x2,…,x n是由此总体得来的随机样本,则当n相当大时,样本平均
数的概率分布逼近正态分布
7.标准误:平均数抽样总体的标准差的大小反映样本平均数抽样误差
的大小,即精确性的高低。
四、假设检验(又称显著性检验)
1.假设检验的目的:判断实验的表面差异除包含试验误差外是否还
包含实验的真实差异。
3.显著水平:用来推断无效假设否定与否的概率标准称为显著水平
(1)非配对设计:将试验单位完全随机地分为两组,然后再随机地对两组分别实施两个不同处理的实验设计。
(2)两个样本的总体方差未知,且为小样本,当两个方差相等时采用t检验,当两个方差不相等时采用近似t检验。
(1)配对设计:先根据配对的要求将实验单位两两配对,然后将配成对子的两个试验单位随机实施某一处理的实验设计。
(1)区间估计:在一定概率保证下给出总体参数的可能范围,所给出的可能范围称为置信区间,给出的概率保证称为置信度或置信概率。
五、方差分析的基本原理与步骤
1.方差分析法:一种在若干能相互比较的资料组中,把产生变异的原因加以区分开来的方法与技术。
多重比较:多个处理平均数的两两比较
(3)最小显著极差法(LSR法)根据极差范围内所包含的处理数(称为秩次距)k的不同采用检验尺度,以弥补LSD法的不足。
标记符号法也称三角形法,根据多重比较结果在平均数多重比较表中各个差数的右上方标记符号“ns”(或不标记符号)表示该差数不显著、标记“*”表示该差数显著、标记“**”表示该差数极显著。
优点是简便直观,缺点是占用篇幅较大。
8.简单效应:甲因素的某一水平与乙因素的某两个水平组成的两个水平组合平均数之差称为乙因素在甲因素某一水平上的简单效应。
9.主效应:某因素两个水平平均数之差称为该因素的主效应。
10.互作效应:指由于两个试验因素的交互作用产生的效应。
11.系统分组(多层分组):也称套设计、窝设计,将A因素分为a个水平,然后再A因素的每个水平下将B因素分为b个水平,再在B因素的每个水平下将C因素分为c个水平……这样得到各因素水平组合的方式称为系统分组或多层分组。
12.方差分量:方差分量是指方差的组成成分。
适合性检验:根据属性类别的次数资料判断属性类别分配是否符合已知属性类别分配理论或学说的假设检验。
独立性检验:根据某一质量性状的各个属性类别与某一因素的各个水平利用统计次数法得来的次数资料判断某一质量性状的各个属性类别的构成比与某一因素是否有关的假设检验。
(3)离回归标准误:离回归均方的平方根,记为S yx,
(2)相关系数表示相关变量x与y直线相关的程度和性质的统计数。