生物统计学1
- 格式:doc
- 大小:199.00 KB
- 文档页数:15
《生物统计学》教案授课教师:陈彦云宁夏大学生命科学学院教学内容与组织安排:第一章绪论讲述本章教学目标、概述本课时主要内容摘要:生物统计学是数理统计学的原理和方法在生命科学领域的具体应用,它是运用统计的原理和方法对生物有机体开展调查和试验,目的是以样本的特征来估计总体的特征,对所研究的总体进行合理的推论,得到对客观事物本质和规律性的认识。
生物统计学主要内容包括试验设计和统计分析两大部分,其作用主要有四个方面:提供整理、描述数据资料的可行方法并确定其数量特征;判断试验结果的可靠性;提供由样本推断总体的方法;提供试验设计的原则。
生物体计学的发展概况及六组统计学常用术语。
重点内容:生物统计学的概念、内容及作用,常用术语。
第一节、生物统计学的概念及其重要性统计学(Statistics)是把数学的语言引入具体的科学领域,把具体科学领域中要待研究的问题抽象为数学问题的过程,它是收集、分析、列示和解释数据的一门艺术和科学,目的是求得可靠的结果。
它有许多分支,如工业统计、农业统计、卫生统计等等。
生物统计学是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法,分析、推断和解释生命过程中的各种现象和试验调查资料的科学。
属于生物数学的范畴第二节生物统计学的主要内容及作用生物体计学主要内容包括试验设计和统计分析两大部分。
在试验设计中,主要介绍试验设计的有关概念、试验设计的基本原则,试验设计方案的制定,常用试验设计方法,其中主要有对比试验设计、随机区组设计、拉方设计,正交设计等;在统计分析中,主要包括数据资料的搜集与整理、数据特征数的计算、统计推断、方差分析、回归和相关分析等。
生物统计学的作用主要有四个方面:1提供整理、描述数据资料的可行方法并确定其数量特征;2判断试验结果的可靠性;3提供油样本推断总体的方法;4提供试验设计的一些重要原则。
第三节统计学的发展概况由于人类的统计实践是随着计数活动而产生的,因此,统计发展史可以追溯到远古的原始社会,也就是说距今足有五千多年的漫长岁月。
1. 什么是生物统计学?生物统计学的主要容和作用是什么?生物统计学是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料,是研究生命过程中以样本来推断总体的一门学科。
生物统计学主要包括试验设计和统计分析两大局部的容。
其根本作用表现在以下4个方面:1.提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。
2.判断试验结果的可靠性。
3.提供由样本推断总体的方法。
4.提供试验设计的一些重要原那么。
2. 随即误差与系统误差有何区别?随机误差也称为抽样误差或偶然误差,它是由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的误差,是不可防止的,随机误差可以通过试验设计和精心管理设法减小,而不能完全消除。
系统误差也称为片面误差,是由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差。
系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的。
3. 准确性与准确性有何区别?准确性指在调查和实验中某一实验指标或性状的观测值和真实值接近程度。
准确性指调查和实验中同一实验指标或性状的重复观察值彼此接近的程度。
准确性是说明测定值和真实值之间符合程度的大小;准确性是反映屡次测定值的变异程度。
4. 平均数与标准差在统计分析中有何用处?他们各有哪些特性?平均数的用处:①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平;②作为样本或资料的代表数据与其他资料进展比拟。
平均数的特征:①离均差之和为零;②离均差平方和为最小。
标准差的用处:①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;②在计算标准差是如果对观察值加上一个或减去一个a,标准差不变;如果给各观测值乘以或除以一个常数a,所得的标准差就扩大或缩小a倍;③在正态分布中,X+-S的观测值个数占总个数的68.26%,X-+2s的观测值个数占总个数的95.49%,x-+3s 的观测值个数占总个数的99.73%。
第一章绪论一、填空1 变量按其性质可以分为___变量和_____变量。
2 样本统计数是总体__估计量。
3 生物统计学是研究生命过程中以样本来推断__ __的一门学科。
4 生物统计学的基本内容包括_、----两大部分。
5 统计学的发展过程经历了_ _3个阶段。
6 生物学研究中,一般将样本容量_n大于等于30_称为大样本。
7 试验误差可以分为__ _两类。
二、判断(-)1 对于有限总体不必用统计推断方法。
( - )2 资料的精确性高,其准确性也一定高。
( + ) 3 在试验设计中,随机误差只能减少,而不可能完全消除。
( - )4 统计学上的试验误差,通常指随机误差。
第二章试验资料的整理与特征数的计算一、填空1 资料按生物的性状特征可分为_ _变量和__变量。
2 直方图适合于表示__ _资料的次数分布。
3 变量的分布具有两个明显基本特征,即_和__ _。
4 反映变量集中性的特征数是_____ __,反映变量离散性的特征数是__ _。
5 样本标准差的计算公式s=__√∑(x-x横杆)平方/(n-1)_____。
二、判断( - ) 1 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。
( - ) 2 条形图和多边形图均适合于表示计数资料的次数分布。
( +)3 离均差平方和为最小。
( + )4 资料中出现最多的那个观测值或最多一组的中点值,称为众数。
( - )5 变异系数是样本变量的绝对变异量。
四、单项选择1 下面变量中属于非连续性变量的是_____。
A 身高B 体重C 血型D 血压2 对某鱼塘不同年龄鱼的尾数进行统计分析时,可做成__ _图来表示。
A 条形图B 直方图C 多边形图D 折线图3 关于平均数,下列说法正确的是__ __。
A 正态分布的算术均数与几何平均数相等B 正态分布的算术平均数与中位数相等C 正态分布的中位数与几何平均数相等D 正态分布的算术平均数、中位数、几何平均数均相等4 如果对各观测值加上一个常数a,其标准差____。
LOGO收集资料,确定课题制订方案,可行性分析进行实验,得出结论数据分析1231. 本课程学习要求和安排规划1. 本课程学习要求和安排规划试验方案设计合理精心组织操作统计方法进行分析客观理想的结果本课程着重统计方法的学习!本课程着重统计方法的学习!生物统计学--本课程介绍本课程的特点a. 不过多讨论数学原理,强调学以致用b. 偏重于具体实例, 及各分析方法的应用c. 只要熟悉并透彻领悟了其中一种方法(如t检验),对其它方法将融汇贯通。
在这门课上所学的方法,适用于所有的统计学(包括经济、医学统计学), 对各行业都有益处.4第一章概论生物统计学的概念、发展概况、研究方法、研究内容及常用术语...生活和学习中,经常会遇到下列一些问题:(1)一种新的流感疫苗,如何判断它是否有效?(2)(被动)吸烟会不会使得肺癌的机会增加?(3)如何抽检几百或几千人来估计某种病的流行程度?(4)某批产品中合格品究竟有多少?(5)某种实验方法或配方,有没有明显改进效果?要从这类问题中得出科学可靠的结论,就必须依靠统计学。
通俗地讲,“统计学就是从不完全的信息里取得准确知识的一系列方法”。
6一、什么是统计学?(教材P1)(一)定义研究统计原理和方法的一门科学。
(二)分类1、数理统计学以概率论为基础,对统计原理、方法给予数学论证。
2、应用统计学将数理统计学的原理方法应用于各门学科中,如:生物、经济、医学等。
例子教育统计学——运用统计学原理方法收集、分析解释教育界数据的科学。
医学统计学--运用数理统计的原理和方法, 分析解释医学界数据。
以此类推:1. 气象统计学2. 科技统计学3. 经济统计学( 宏观经济统计学、企业经济统计学、金融统计学、保险统计学、价格统计学、对外贸易统计学…)89统计学药物学药物学教育学教育学医学医学经济学经济学社会学社会学……与其它学科的关系-生物统计学的重要性统计学已渗透到了各行业领域,并相互融汇贯通,学好本课具有重要意义统计学的发展古典记录统计学近代描述统计学现代推断统计学J.Bernoulli(贝努里,瑞士,1654~1705)P.S. Laplace(拉普拉斯,法国,1749~1827)Gauss(高斯,德国,1777~1855)Gauss分布R.A.Fisher(费歇尔,英国,1890~1962)F. Galton(高尔登,英国,1822~1911)14生物统计学:属于应用统计学的一个分支,属于生物数学(应用数学)领域。
第一章绪论与第二章概率论基础1总体:指研究对象的全体,它是由研究对象中的所有单元组成的。
总体中包含单元的数目称作总体容量(或大小)用N表示。
2个体:3样本:是指按照抽样规则所抽中的那部分单元所组成的集合。
4样本含量:样本所包含的单位数用 n表示,称为样本含量。
5随机样本:总体是唯一的、确定的,而样本是不确定的、可变的、随机的。
6参数:反映总体数量特征的综合指标称为总体参数。
常见的总体参数主要有:总体总和;总体均值;总体比率;总体比例等。
7统计量:反映样本数量特征的综合指标称之为统计量。
统计量是n元样本的一个实值函数,是一个随机变量,统计量的一个具体取值即为统计值。
主要样本统计量有:样本总和、样本均值、样本比率、样本比例等。
8准确性9精确性10必然现象11随机现象:带有随机性、偶然性的现象.12随机试验:如果每次试验的可能结果不止一个,且事先不能肯定会出现哪一个结果,这样的试验称为随机试验.13随机事件:在一次试验中可能发生也可能不发生的事件称为随机事件,简称事件.14概率的统计定义:验后概率,在相同条件下随机试验n次,某事件A出现m次(m<n),则比值称为事件A发生频率。
15小概率原理16随机变量:在随机试验中所得到的取值具有随机性的量,称为随机变量。
17 离散型随机变量:所有取值可以逐个一一列举18连续型随机变量:全部可能取值不仅无穷多,而且还不能一一列举,而是充满一个区间. 19标准正态分布: μ=0,σ=0的正态分布20标准正态变量21双侧概率(两尾概率):把随机变量X落在平均数μ加减不同倍数标准差σ区间之外的概率称为两尾概率,记做α。
22单侧概率(一尾概率):随机变量X小于μ-kσ或者大于μ+kσ的概率,称为一尾概率,记做α/2.23贝努利试验:二项试验,满足下列条件:一次试验只有两个可能结果,即“成功”和“失败”,“成功”是指我们感兴趣的某种特征;试验是相互独立的,并可以重复进行n次,在n 次试验中,“成功”的次数对应一个离散型随机变量X。
生物统计学答案第一章绪论一、名词解释1、总体:根据研究目的确认的研究对象的全体称作总体。
2、个体:总体中的一个研究单位称作个体。
3、样本:总体的一部分称为样本。
4、样本含量:样本中所涵盖的个体数目称作样本含量(容量)或大小。
5、随机样本:从总体中随机抽取的样本称为随机样本,而随机抽取是指总体中的每一个个体都有同等的机会被抽取组成样本。
6、参数:由总体计算的特征数叫参数。
7、统计量:由样本计算的特征数叫统计量。
8、随机误差:也叫做抽样误差,就是由于许多无法控制的内在和内在的偶然因素所导致,具有偶然性质,影响试验的精确性。
9、系统误差:也叫片面误差,是由于一些能控制但未加控制的因素造成的,其影响试验的准确性。
10、准确性:也叫做准确度,所指在调查或试验中某一试验指标或性状的观测值与真值吻合的程度。
11、精确性:也叫精确度,指调查或试验研究中同一试验指标或性状的重复观测值彼此接近的程度。
二、简答题1、什么是生物统计?它在畜牧、水产科学研究中有何作用?答:(1)生物统计是数理统计的原理和方法在生物科学研究中的应用,是一门应用数学。
(2)生物统计在畜牧、水产科学研究中的作用主要体现在两个方面:一是提供试验或调查设计的方法,二是提供整理、分析资料的方法。
2、统计分析的两个特点就是什么?答:统计分析的两个特点是:①通过样本来推断总体。
②有很大的可靠性但也有一定的错误率。
3、如何提升试验的准确性与精确性?答:在调查或试验中应严格按照调查或试验计划进行,准确地进行观察记载,力求避免认为差错,特别要注意试验条件的一致性,即除所研究的各个处理外,供试畜禽的初始条件如品种、性别、年龄、健康状况、饲养条件、管理措施等尽量控制一致,并通过合理的调查或试验设计,努力提高试验的准确性和精确性。
4、如何掌控、减少随机误差,防止系统误差?答:随机误差是由于一些无法控制的偶然因素造成的,难以消除,只能尽量控制和降低;主要是试验动物的初始条件、饲养条件、管理措施等在试验中要力求一致,尽量降低差异。
生物统计学生物统计学是一门应用数学,常用于研究生物学、医学和相关领域中的各种实验数据以及问题的分析和解决。
生物统计学的目的是在现实生态环境和实验中提高数据的可靠性和规律性,为未来的科学研究做出准确、可靠和有意义的预测。
本文将从生物统计学的定义、应用、方法和统计学模型等方面进行探究。
一. 生物统计学的定义生物统计学是一个应用数学的分支,它利用统计学原理和方法处理生物学和医学的实验数据。
生物统计学在研究数据的规律性、推导结论方面,发挥了重要作用。
生物统计学的应用范围非常广泛。
例如,它可以用于药效学研究、流行病学调查、基因组学研究、医学诊断等领域。
生物统计学可以帮助我们分析和解释数据,并向我们展示现象背后的统计学原理。
二. 生物统计学的应用生物统计学可以在生物学和医学的研究中使用。
它可以通过大数据分析预防和治疗疾病,将人们从疾病和健康问题中获益。
以下是生物统计学常见的应用。
1.实验研究生物统计学被广泛应用于实验研究中。
它可以帮助科学家们分析实验数据,找出数据之间的关系并判断研究结果的合理性。
生物统计学可以帮助科学家们减少误差,提高实验的可信度和准确性。
2.观测数据研究生物统计学在各种观测数据研究中也是必不可少的。
例如,在环境变量和生物群落之间的关系分析中,生物统计学可对观察到的关系进行量化,从而更好地理解环境变量对生物多样性和生态系统功能的影响。
3.流行病学研究流行病学研究通常在非实验性环境中进行,例如疾病、癌症、药物滥用、暴力和犯罪等。
生物统计学可以帮助科学家们对这些因素的作用进行量化和分析。
4.医学试验医学试验是生物统计学一个重要的应用领域。
生物统计学通过随机抽样的方法来对试验结果进行评估,并对结果产生的变化进行监测与统计,从而提高研究可靠性和分析结果的准确性和可信度。
5.基因组研究基因组是所有生命体的基础。
生物统计学可以运用到基因组组学中,例如基因组广义关联分析(GWAS)、基因组筛选和序列分析,以及定量遗传学等领域。
⽣物统计学第⼀章概论⼀、什么是⽣物统计学?⽣物统计学主要内容和作⽤?1、⽣物统计学是数理统计在⽣物学研究中的应⽤,它是应⽤数理统计的原理,运⽤统计⽅法来认识、分析、推断和解释⽣命过程中的各种现象和试验调查资料的科学。
属于⽣物数学的范畴2、主要内容基本原则对⽐设计试验设计⽅案制定随机区组设计常⽤试验设计⽅法裂区设计资料的搜集和整理拉丁⽅设计、正交设计统计分析数据特征数的计算统计推断、⽅差分析协⽅差分析、回归和相关分析3、⽣物统计学的基本作⽤:(1)提供整理和描述数据资料的科学⽅法,确定某些性状和特征的数量特征(2)运⽤显著检验,判断试验结果的可靠性或可⾏性(3)提供由样本推断总体的⽅法(4)提供试验设计的⼀些重要原则⼆、解释概念:总体、个体、样本、变量、参数、统计数、效应、试验误差总体:具有相同性质或属性的个体所组成的集合称为总体,它是指研究对象的全体;个体:组成总体的基本单元称为个体样本:从总体中抽出若⼲个体所构成的集合称为样本变量:变量,或变数,指相同性质的事物间表现差异性或差异特征的数据参数:描述总体特征的数量称为参数,也称参量统计数:描述样本特征的数量称为统计数,也称统计量效应:通过施加试验处理,引起试验差异的作⽤称为效应试验误差:误差也称为实验误差,是指观测值偏离真值的差异,可分为随机误差和系统误差三、准确性与精确性有何区别?准确性,也叫准确度,指在调查或试验中某⼀试验指标或性状的观测值与其真值接近的程度。
精确性,也叫精确度,指调查或试验中同⼀试验指标或性状的重复观测值彼此接近的程度。
准确性反应测量值与真值符合程度的⼤⼩,⽽精确性则是反映多次测定值的变异程度。
(具体在课本第7页)第⼆章样本统计量与次数分布⼀、算数平均数与加权平均数形式上有何不同?为什么说它们的实质是⼀致的?1. 算术平均数定义:总体或样本资料中所有观测数的总和除以观测数的个数所得的商,简称平均数、均数或均值直接计算法或减去(加上)常数法加权平均数2、实质是⼀样的,是因为它们都反映的⼀组数据的平均⽔平⼆、为了评价两种药物对于⼩⿏体重的影响,随机从两组各抽出20只测定其体重(g),结果如下:药物A处理组: 15, 15, 23, 24, 26, 25, 22, 19, 15, 17, 15, 20, 23, 21, 19, 22, 26, 21, 18, 23药物B处理组: 31, 28, 26, 31, 28, 34, 32, 29, 32, 35, 28, 29, 33, 30, 34, 32, 36, 38, 40, 38试从平均数、极差、标准差、变异系数⼏个指标评价两种药物对于⼩⿏体重的影响,并给出结论。
定量资料的统计描述在畜牧科学研究和生产中,对定量资料进行统计描述是一项经常性的工作。
我们从科学试验或生产实践中获得的数据往往是杂乱无章的,只有对数据资料进行相应的统计处理,如计算出某一样本的平均数、标准差、变异系数、以及最大、最小值等基本统计量,才能得出规律性的结论。
在SAS系统中,对定量资料进行统计描述,可以采用MEANS和UNIVARIATE 两个过程来完成。
2.1 MEANS过程MEANS过程可提供单个或多个变量的简单统计描述,当对多个变量进行统计描述时,其输出格式较为紧凑,便于阅读。
在畜牧试验数据的处理中,计算定量资料的描述性统计量以MEANS过程最为常用。
下面我们可以通过一些具体的例子来了解如何应用MEANS过程对定量资料进行描述性统计。
例2.1 某试验站香猪的6周饲养试验增重结果数据见下表,计算甲乙两种饲料每周各自的平均增重、最大值、最小值、方差、变异系数、标准差各统计量。
1周2周3周4周5周6周甲种饲料 6.65 6.35 7.05 7.90 8.04 4.45乙种饲料 5.34 7.00 7.89 7.05 6.74 7.28Data ok ;Input siliao $ weekage addweigh @@ ;cards ;a 1 6.65a 2 6.35 a 3 7.05 a 4 7.90 a 5 8.04 a 6 4.45b 1 5.34 b 2 7.00 b 3 7.89 b 4 7.05 b 5 6.74 b 6 7.28;Proc sort out=bigsort;by siliao ;run ;- 1 -proc means ;by siliao ;run ;2.2 UNIVARIATE过程UNIVARIATE过程又称为单变量分析过程,可提供单个变量的详细描述及其分布类型的检验。
与MEANS过程相比,该过程侧重于对单个变量进行分布类型的描述。
例2.2 12头奶牛的305天产奶量(kg),具体数据如下, 试用UNIVARIATE过程计算产奶量的描述性统计量,并进行正态性检验。
牛号 1 2 3 4 5 6 7 8 9 10 产奶5480 6370 6310 5180 5090 6390 5600 5380 5360 6420 量SAS程序为:Data ok;Input cownum $ yield@@;Cards;1 54802 63703 63104 51805 50906 63907 56008 53809 5360 10 6420;Proc univariate normal plot;Var yield;Run;两均数差异显著性检验——t检验t检验的SAS过程在SAS系统中,进行t检验主要有MEANS和TTEST两个过程。
3.2.1 MEANS过程MEANS过程可用于样本均数与总体(理论)均数的差异显著性检验,以及配- 2 -对试验设计资料的t检验。
利用该过程进行t检验时,它先计算出可比对的数值,然后对差值均数与0有无显著差异进行检验。
3.2.2 TTEST过程TTEST该过程可计算出两组变量的平均数和标准差,同时还可对两个样本方差齐性(或同质性)进行检验,并给出总体方差相等和不相等两种情况下的均数差异性检验结果供选择。
3.3 不同实验设计资料的t检验3.3.1 样本均数与总体均数间的差异显著性检验在SAS系统中,样本均数与总体均数间的差异显著性检验是通过MEANS过程来完成的。
例3.1 母猪的怀孕期为114天,今抽测10头母猪的怀孕期分别为116、115、113、112、114、117、115、116、114、113(天),试检验所得样本的平均数与总体平均数114天有无显著差异?SAS程序为:Data ok;Input x@@;Y=x-114;Cards;116 115 113 112 114 117 115 116 114 113;Proc means mean std stderr t prt;Var y;Run;3.3.2 配对实验设计资料的t检验在SAS系统中,配对设计资料的t检验是用MEANS过程来实现的。
根据配对实验设计分为自身配对和同源配对。
例3.2 用家兔10只试验某批注射液对体温的影响,测定每只家兔注射前后的体温。
设体温服从正态分布,问注射前后体温有无显著差异?- 3 -兔号 1 2 3 4 5 6 7 8 9 10 注射前体温37.8 38.2 38.0 37.6 37.9 38.1 38.2 37.5 38.5 37.9 注射后体温37.9 39.0 38.9 38.4 37.9 39.0 39.5 38.6 38.8 39.0 SAS程序如下:Data ok;Input x y@@;D=x-y;Cards;37.8 37.9 38.2 39 38 38.9 37.6 38.4 37.9 37.938.1 39 38.2 39.5 37.5 38.6 38.5 38.8 37.9 39;Proc means mean std stderr t prt;Var d;Run;例3.3 现从8窝仔猪中每窝选出性别相同、体重接近的仔猪两头进行饲料对比试验,将每窝两头仔猪随机分配到两个饲料组中,时间30天,试验结果见表5-7。
问两种饲料喂饲仔猪增重有无显著差异?1 2 3 4 5 6 7 8甲饲料10.0 11.2 11.0 12.1 10.5 9.8 11.5 10.8 乙饲料9.8 10.6 9.0 10.5 9.6 9.0 10.8 9.8Data ok;Input x y@@;D=x-y;Cards;10 9.8 11.2 10.6 11 9 12.1 10.510.5 9.6 9.8 9 11.5 10.8 10.8 9.8;Proc means mean std stderr t prt;Var D;Run;3.3.3 非配对实验设计资料的t检验非配对实验设计资料的t检验可用TTEST过程来完成。
例3.4 某种猪场分别测定长白后备种猪和蓝塘后备种猪90kg时的背膘厚度,测定结果- 4 -如下表所示。
设两品种后备种猪90kg时的背膘厚度值服从正态分布,问该两品种后备种猪90kg时的背膘厚度有无显著差异?品种背膘厚度(cm)长白 1.20 1.32 1.10 1.28 1.35 1.08 1.18 1.25 1.30 1.12 1.19 1.05蓝塘 2.00 1.85 1.60 1.78 1.96 1.88 1.82 1.70 1.68 1.92 1.80SAS程序如下:Data ok;Input group $ width@@;Cards;1 1.20 1 1.32 1 1.10 1 1.28 1 1.35 1 1.08 1 1.18 1 1.25 1 1.301 1.12 1 1.19 1 1.05 2 2.00 2 1.85 2 1.60 2 1.78 2 1.96 2 1.882 1.82 2 1.70 2 1.68 2 1.92 2 1.80;Proc ttest;Class group;Var width;Run;4.2 均衡数据的方差分析——普通方差分析所谓均衡数据(balanced data),就是在数据结构中对于每个分类因子各水平下或水平的组合下的观测数都相等,即数据均衡,且没有发生缺失。
4.2.1 用于均衡数据方差分析的SAS过程在SAS系统中,均衡数据的方差分析是采用ANOVA过程来完成的。
虽然均衡4.2.2.2 应用示例以下我们通过两个具体的例子来介绍如何应用ANOVA过程进行单因素方差分析。
例4.1 某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼20尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果列于下表。
饲料鱼的增重(x ij)- 5 -A131.9 27.9 31.8 28.4 35.9A224.8 25.7 26.8 27.9 26.2A322.1 23.6 27.3 24.9 25.8A427.0 30.8 29.0 24.5 28.5SAS程序:Data ok;Do a=1 to 4;Do i=1 to 5;Input y@@;output;End;end;Cards;31.9 27.9 31.8 28.4 35.924.8 25.7 26.8 27.9 26.222.1 23.6 27.3 24.9 25.827.0 30.8 29.0 24.5 28.5;Proc anova data=ok;Class a;Model y=a;Means a/t DUNCAN SNK;Run;4.2.3 交叉分组资料的多因素方差分析例4.2 为研究雌激素对子宫发育的影响,现有4窝不同品系未成年的大白鼠,每窝3只,随机分别注射不同剂量的雌激素,然后在相同条件下试验,并称得它们的子宫重量,见下表,试作方差分析。
品系(A)雌激素注射剂量(mg/100g)(B)B1(0.2) B2(0.4)B3(0.8)A1106 116 145A242 68 115A370 111 133A442 63 87SAS程序如下:Data ok;Do a=‘A1’, ‘A2’, ‘A3’;Do b=‘B1’, ‘B2’, ‘B3’;- 6 -Input y@@;output;End;end;Cards;106 116 14542 68 11570 111 13342 63 87;Proc anova data=ok;Class a b;Model y=a b;Means a b/t DUNCAN SNK;Run;4.2.3.2 多因素有互作的方差分析例4.3 为了研究饲料中钙磷含量对幼猪生长发育的影响,将钙(A)、磷(B)在饲料中的含量各分4个水平进行交叉分组试验。
先用品种、性别、日龄相同,初始体重基本一致的幼猪48头,随机分成16组,每组3头,用能量、蛋白质含量相同的饲料在不同钙磷用量搭配下各喂一组猪,经两月试验,幼猪增重结果(kg)列于下表,试分析钙磷对幼猪生长发育的影响。
B1(0.8) B2(0.6) B3(0.4) B4(0.2)A1(1.0) 22.0 30.0 32.4 30.5 26.5 27.5 26.5 27.0 24.4 26.0 27.0 25.1A2(0.8) 23.5 33.238.0 26.5 25.8 28.5 35.5 24.0 27.0 30.1 33.0 25.0A3(0.6) 30.5 36.5 28.0 20.5 26.8 34.0 30.5 22.5 25.5 33.5 24.6 19.5A4(0.4) 34.5 29.0 27.5 18.5 31.4 27.5 26.3 20.0 29.3 28.0 28.5 19.0SAS程序:Data CaP;- 7 -Do a=1 to 4;Do b=1 to 4;Do n=1 to 3;Input y@@;Output;End;End;End;Drop n;Cards;22.0 26.5 24.4 30.0 27.5 26.0 32.4 26.5 27.030.5 27.0 25.1 23.5 25.8 27.0 33.2 28.5 30.138.0 35.5 33.9 26.5 24.0 25.0 30.5 26.8 25.536.5 34.0 33.5 28.0 30.5 24.6 20.5 22.5 19.534.5 31.4 29.3 29.0 27.5 28.0 27.5 26.3 28.518.5 20.0 19.0;Proc anova;Class A B;Model y=A B A*B;Run;4.3 非均衡数据的方差分析——最小二乘分析与均衡数据资料相反,非均衡数据(unbalanced data)就是数据结构中每个分类因子个水平下(或各水平组合下)的观察值数目不相等。