2006-2007第1学期生物统计考试试卷(B 卷)答案
一、名词解释(10×2)
1、参数:描述总体的特征数。
2、连续性变数:指在任意两个变量之间都有可能存在只有微量差异的第三个变量存在,这样一类变数称为连续性变数
3、唯一差异原则:除了被研究的因素具有的不同水平外,其余各种环境因素均应保持在某一特定的水平上。
4、两尾测验:有两个否定区,分别位于分布的两尾。
5、显著水平:否定无效假设0H 的概率标准。
6、互斥事件:如果事件1A 和2A 不能同时发生,即12A A 为不可能事件,则称事件1A 和2A 互斥。
7、无偏估计:在统计上,如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的无偏估值。
8、相关系数:表示两组变数相关密切程度及性质的变数,r
*9、否定区:否定无效假设0H 的区间。
*10、偏回归系数:任一自变数(在其他自变数皆保持一定数量水平时)对依变数的效应。
二、是非题(5×1)
1、二项分布的平均数为np ( √ )
2、在二因素完全随机化设计试验结果的方差分析中,误差项自由度为(1)(1)n ab --。( × )
3、2χ分布是随自由度变化的一簇间断性曲线,可用于次数资料的假设测验。( × )
4、一个显著的相关系数或回归系数说明X 和Y 变数的关系必为线性关系。( × )
5、在一组变量中,出现频率最多的观察值,称为中位数。( × )
三、选择题(10×2)
1、算术平均数的重要特征之一是离均差的总和( C ) A 、最小 B 、最大 C 、等于零 D 、接近零
2、一批种子的发芽率为0.75p =,每穴播5粒,出苗数为4时的概率( A ) A 、 B 、0.0146 C 、 D 、
3、回归截距a 的标准误等于( D )
A 、X SS n Q )2(-
B 、 X
X Y
SS x X n S 2
)(1-+ C 、X X
Y
SS x X n S 2
)(11-++ D 、 X
X Y
SS x n S 2
1+ 4、Y~N(10, 80),当以1210n n ==进行抽样时,128y y ->的概率约为[ B ]。 A. 0.10 B. 0.05 C. D.
5、成对比较的特点不包括( D )
A 、加强了试验控制
B 、可减小误差
C 、不必考虑总体方差是否相等
D 、误差自由度大
6、方差分析基本假定中除可加性、正态性外,尚有[ C ]假定。 A 、无偏性 B 、无互作 C 、同质性 D 、重演性
7、若否定
H ,则( )
A 、必犯α错误
B 、必犯β错误
C 、犯α错误或不犯错误
D 、犯β错误或不犯错误
8、随机抽取200粒棉花种子做发芽试验,得发芽种子为150粒,其与00.8p =的差异显著性为( A )。
A 、不显著
B 、显著
C 、极显著
D 、不能确定
9、当30n ≤时,测验一个样本方差2
s 和某一指定值C 是否有显著差异的方法用( B ) A 、F 测验 B 、2
χ测验 C 、t 测验 D 、u 测验 *10、多元线性回归方程的假设测验可用( A )。
A 、F 测验
B 、F 或t 测验
C 、t 测验
D 、u 测验
四、填空(5×2)
1、有一双变数资料,Y依X的回归方程为
5
?7
4
Y X
=-,X依Y的回归方程为
1
?4
2
X Y
=-,则其相关系数r=0.625
-或0.791
-。
2、记8月10日为0,某水稻品种开花日发生量遵循N(5, 16),该水稻品种开花始盛到盛末的时期为 8/11——8/19 。
3、在参数的区间估计中,保证参数在一定区间内的概率1α
-称为置信度或置信概率。
4、测得某条田棉花单株结铃数的 4.5
s=,若在99%的置信度保证下,使得样本的平均结铃数y与整条田的平均结铃数μ的相差不超过1±个,需要调查 135 株。
5、PLSD法是 protected least significant difference 的缩写。
五、简答(8×3)
1、测验玉色和红色金鱼草杂交F2代的玉色株(O1)与粉色株(O2)及红色株(O3)的比例与期望比率1:2:1是否相符用什么方法如何进行
答:用2
χ分布进行测验;
H:相符,
A
H:不相符;…………2分
2
v=时,2
0.05
5.99
χ= 1分;
1
1
4
E n
=?,
2
1
2
E n
=?,
3
1
4
E n
=………2分()()()
222
112233
2
123
O E O E O E
E E E
χ
---
=++………………2分
若22
0.05
χχ
>,否定
H,若22
0.05
χχ
≤,则接受H0假设。………………2分
2、对于k()3
k≥个样本平均数,能否利用u和t测验进行两两独立比较为什么
答:①有k个y时,有()
1
1
2
k k-个差数,逐一作出测验,程序繁琐;②差数标准误的自由度应为()1
k n-,而不是两两独立比较的()
21
n-,故误差估计的精确度受到损失;③两两测验的方法会随k的增加而大大增加犯α错误的概率
1、简述田间试验设计的三大原则及其作用
答:
3、简述样本平均数分布的基本性质
答:①y μμ=;②2
2/y n σσ=;③如果变量Y 是一具有平均数μ、方差2σ的正态分布,
则样本平均数y 是一具有平均数μ,方差为2/n σ的正态分布,记作N (μ,2
/n σ);④如果变量Y 是一具有平均数μ、方差2
σ的分布,则随着样本容量n 的增大,样本平均数y 的分布亦必愈来愈趋近正态分布,且具有平均数μ和方差2
/n σ。
六、计算
1、调查相似生产条件下施用和不施用某种叶面肥的玉米果穗重量,得施用该叶面肥的果穗5个,重量分别为298、315、320、31
2、325(g );得未施用的果穗4个,其重量分别为284、292、302、306。问施用该叶面肥有无效果。(6分)
设:0H :12μμ=,对A H :12μμ≠………………………………………………1分 显著水平取0.05α=,7v =时,0.05,7 2.365t =……………………………………1分
1314y =,2296y = 1418SS =,2296SS =
241829610243
s +==+
12 6.775y y s -==
314296 2.6576.775
t -==………………………………………………………………3分
0.05t t >,故否定0H ,即施用叶面肥对玉米果穗的重量有显著影响。…………1分
2、有一水稻施肥量(具有A1、A2、A3三个水平)和品种(有B1、B2两个水平)的二因素试验(固定模型),重复4次,随机区组设计。得各处理的平均数如下表。(10分) (1)已知:400T SS =,20R SS =。试进行方差分析,并简要说明试验结果。
7442306424
T C abr ===
2222124148112230643204
AB t T SS C r +++=-=-=∑L
2222722402321128A SS C ++=-=;22
3483969612
B SS
C +=-=
112AB SS =、60e SS =………………………………………………………………………3分
变异来源 df SS MS F
区组间
3 20 A 2 112 56 14**
B 1 96 96 24**
A ×
B 2 112 56 14** 误差 15 60 4 总
23
400
……………………………2分
12 1.414y y s -=
= 15v =时,0.05 2.131t =,0.01 2.947t =,故: 0.05 2.131 1.414 3.01PLSD =?=
0.01 2.947 1.414 4.17PLSD =?=………………………………………………………2分
3、调查某地最近8年6月份的降雨量(X ,mm )与棉花产量(Y ,斤/亩)的关系,其一级数据分别为:
887X =∑,2840Y =∑,2
118199X
=∑,21076800Y =∑,
349970XY =∑。试:
(1)建立线性回归方程?Y
a bX =+。 (2)求离回归标准差/Y X s 。
(3)求相关系数r 。
(4)对线性方程进行显著性测验。
(1)
5个二级数据
110.875x =,355y =,19825.875X SS =,68600Y SS =,35085SP =
1.767X
SP
b SS =
=,159.056a y bx =-=…………………………………3分 (2)
2
6596.022Y X
SP Q SS SS =-=
/33.156Y X s =
=…………………………………………………3分 (3)
2
2
0.904X Y SP r SS SS ==g
0.951X Y
SP r SS SS ==g ………………………………………………………3分
(4)
2
62003.98X
SP U SS ==
方差分析表
线性回归 1 **
离回归 6 总
7
68600
或
/0.235b Y X s s ===
1.7677.5040.235
b b t s ===
0.01,6 3.707t t >=,所以线型回归达到了极显著水平。
或
0.01,60.834r r >=,所以线型回归达到了极显著水平。……………………………3分
生物统计 第一章绪论 1.什么是生物统计?它在动物科学研究中有何作用? 2.什么是总体、个体、样本、样本容量?统计分析的两个特点是什么? 3.什么是参数、统计数?二者有何关系? 4.什么是试验或调查的准确性与精确性?如何提高试验或调查的准确性与精确性? 5.什么是随机误差与系统误差?如何控制、降低随机误差,避免系统误差? 6.统计学发展的概貌可分为哪三种形态?拉普拉斯、高斯、高尔顿、皮尔森、哥塞特、费 舍尔对统计学有何重要贡献? 第二章资料的整理 1.资料可以分为哪几种类型?它们有何区别与联系? 2.为什么要对资料进行整理?对于计量资料,整理成次数分布表的基本步骤是什么? 3.统计表与统计图有何用途?常用统计表、统计图有哪些?编制统计表、绘制统计图有 何基本要求? 4.某品种100头猪的血红蛋白含量资料单位:g/100ml列于下表,将其整理成次数分布表, 并绘制次数分布直方图与折线图。 表格1 4某品种100头猪的血红蛋白含量(g/100ml) 13. 4 13. 8 14. 4 14. 7 14. 8 14. 4 13. 9 13. 13. 12. 8 12. 5 12. 3 12. 1 11. 8 11. 10. 1 11. 1 10. 1 11. 6 12. 12. 12. 7 12. 6 13. 4 13. 5 13. 5 14. 15. 15. 1 14. 1 13. 5 13. 5 13. 2 12. 7 12. 8 16. 3 12. 1 11. 7 11. 2 10. 5 10. 5 11. 3 11. 8 12. 2 12. 4 12. 8 12. 8 13. 3
本科《生物统计附试验设计》课程代码:02793 一,名词解释题 1.中位数:将资料所有观测值按从小到大的顺序排列,处于最中间的数. 2.I型错误:是拒绝H0时犯下的错误,其错误是把真实差异错叛为非真实差异. 3.总体:是由研究目的的确定的研究对象的个体总和. 4.参数:是指由总体计算的特征数. 5.相关分析:即两个以上的变量之间共同受到另外因素的影响. 6.回归分析:即一个变量的变化受到一个或几个变量的影响. 7.精确性:是重复观测值之间彼此接近的程度. 8.显著水平:是检验无效假设的水准.但另一方面它也是进行检验时犯错误概率大小. 9.随机单位组设计:它的原理与配对设计类似,抽每一头试验动物具有相等的机会,接受任一处理而不受人为影响. 10.统计量:由样本计算的特征数. 11.准确性:是观察值与真实值间的接近程度. 12.随机误差:是由试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间产生的误差,是不可避免的. 13.系统误差:是由于试验处理以外的其它条件明显不一致所产生的带有倾向性的偏差. 14.样本:是在总体中进行抽样,从中抽取的部分个体. 15.众数:资料中出现最多的观测值或次数最多的一组中值. 16.样本标准差:统计学中样本平方差S^2的平方根 17.试验处理:在一项试验中,同一条件下所做的试验称为一个处理.
18.几何平均数:几个观测值相乘之积开n次方所得的方根称为几何平均数. 19.顺序抽样法:是将有限总体内所有个体编号,然后按照一定顺序每隔一定的数目,均匀抽出一个个体,组成样本,对样本进行调查. 20.试验指标:用来平衡量试验效果的量. 21.随机抽样法:是将总体内所有的个体编号,然后采取抽签,拈阄或用随机数字表的方法将部分个体取出而做为样本进行调查. 22.小概率原理:小概率事件在一次试验中实际不可能发生的原理. 23.重复:在试验中,同一处理内设置的动物数量,称为重复. 24.局部控制:在试验设计时采用各种技术措施,控制和减少非试验因素对试验指标的影响. 25.算术平均数:资料中各观测值的总和除以观测个数所得的商. 26.变异系数:是标准差相对平均数的百分数,用CV表示. 27.II型错误:在接受H0时犯下的错误,其错误是把真实差异错判为非真实差异. 28.因素水平:每个试验因素的不同状态(处理的某种特定状态或数量上的差别)称为因素水平. 29.配对设计:是指将条件一致的两头动物酿成对子,然后采取随机的方法在同一对子内两头动物进行分配处理. 30.试验处理:指对受试对象给予的某种外部干预或措施,是试验中实施的因子水平的一个组合. 31.调和平均数:资料中各观测值倒数的算术平均数的倒数称调和平均数. 32.效应:是指因素对某试验指标所起的增进或减退的作用. 33.顺序抽样:它是按某种既定顺序从总体(有限总体)中抽取一定数量的个体构
《生物统计附试验设计》 习题集 (动物医学专业用) 第一章绪论 一、名词解释 总体个体样本样本含量随机样本参数统计量准确性精确性 二、简答题 1、什么是生物统计?它在畜牧、水产科学研究中有何作用? 2、统计分析的两个特点是什么? 3、如何提高试验的准确性与精确性? 4、如何控制、降低随机误差,避免系统误差? 第二章资料的整理 一、名词解释 数量性状资料质量性状资料半定量(等级)资料计数资料计量资料 二、简答题 1、资料可以分为哪几类?它们有何区别与联系? 2、为什么要对资料进行整理?对于计量资料,整理的基本步骤怎样? 3、在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好? 4、统计表与统计图有何用途?常用统计图、统计表有哪些? 第三章平均数、标准差与变异系数 一、名词解释 算术平均数几何平均数中位数众数调和平均数标准差方差离均差的平方和(平方和)变异系数 二、简答题
1、生物统计中常用的平均数有几种?各在什么情况下应用? 2、算术平均数有哪些基本性质? 3、标准差有哪些特性? 4、为什么变异系数要与平均数、标准差配合使用? 三、计算题 1、10头母猪第一胎的产仔数分别为:9、8、7、10、1 2、10、11、14、8、9头。试计算这10头母猪第一胎产仔数的平均数、标准差和变异系数。 2、随机测量了某品种120头6月龄母猪的体长,经整理得到如下次数分布表。试利用加权法计算其平均数、标准差与变异系数。 组别组中值(x)次数(f) 80—84 2 88—92 10 96—100 29 104—108 28 112—116 20 120—124 15 128—132 13 136—140 3 3、某年某猪场发生猪瘟病,测得10头猪的潜伏期分别为2、2、3、3、 4、4、4、 5、9、12(天)。试求潜伏期的中位数。 4、某良种羊群1995—2000年六个年度分别为240、320、360、400、420、450只,试求该良种羊群的年平均增长率。 5、某保种牛场,由于各方面原因使得保种牛群世代规模发生波动,连续5个世代的规模分别为:120、130、140、120、110头。试计算平均世代规模。 6、调查甲、乙两地某品种成年母水牛的体高(cm)如下表,试比较两地成年母水牛体高的变异程度。 甲地137 133 130 128 127 119 136 132 乙地128 130 129 130 131 132 129 130 第四章常用概率分布 一、名词解释 随机事件概率的统计定义小概率原理正态分布标准正态分布双侧概率(两尾概率)单侧概率(一尾概率)二项分布波松分布标准误t分布
广东药学院自编教材试验设计与统计分析 卫生统计学教研室 2014.8
第一章绪论 在医药卫生、食品等专业研究领域,常需要开展大量的试验来确定或验证研究者在科研过程中提出的科学假设,例如临床上研究某种新的降糖药的疗效时,研究者需要将研究对象(如糖尿病患者)随机地分组,使其中一组患者服用研究中的该降糖药,另一组患者服用传统的降糖药,进而比较两组药物的疗效。但在具体的试验实施之前,研究者需要面对很多问题,如试验中试验对象应如何选择和分组?如何在试验过程中避免服用不同试验药物对试验对象心理产生影响,继而影响到最终疗效的判断?选择什么样的指标可更好的反映药物疗效?样本量需要多少?试验数据应如何收集以及运用何种统计方法进行分析等等问题。因为研究过程中研究结果会受到诸多因素影响,如研究对象的年龄、性别和病情可能影响药物疗效,如果不采取科学的方法使这些因素在比较组间分布均衡,就不能得到令人信服的结论。因此为使科学研究在消耗最少人力和物力的情况下,最大限度地减少误差,获得科学可靠的结论,需要在研究开始之前对整个试验过程做出精心安排,制定详细具体的试验实施方案,即进行试验设计(experimental design)。一个科学合理的试验设计,可以达到事半功倍的效果,是试验获得成功的关键。 一、试验设计的基本要素 医学试验包括三个基本要素:即处理因素、试验对象和试验效应。如研究某降糖新药的疗效,处理因素为降糖新药及比较的传统降糖药;研究者需用糖尿病患者作为试验对象;试验效应是能反映药物疗效的指标,如患者空腹血糖或餐后血糖的下降。处理因素作用于试验对象后产生试验效应(图1),三个要素缺一不可,因此试验设计时要先明确三个基本要素,再制定详细的研究计划。 1. 处理因素 处理因素(treatment)是指研究者根据研究目的施加于试验对象,以考察其试验效应的因素。如临床上研究降糖药的疗效,降糖药即为处理因素。在试验过程中处理因素的状态称为水平(level),如比较降糖新药和传统降糖药的疗效,
《生物统计附试验设计》复习题 (考试共有五种题型:其中名称解释5道共10分,单选10道共10分,判断题10道共10分,计算题4道共60分,问答题2道共10分) 一、名词解释题 1.总体: 4.准确性: 7.系统误差: 8.样本: 11.随机样本: 12.样本容量: 13.假想总体:, 15.数量性状资料: 17.全距: 18.简单表: 20.众数: 21.样本标准差: 22.几何平均数: 23.算术平均数: 24.调和平均数: 26.离均差: 28.变异系数: 29.统计推断: 30.小概率事件实际不可能性原理: 31.显著水平: 32.I型错误: 34.非配对设计: 35.配对设计:, 37.试验处理: 38.试验指标: 39.重复: 40.试验单位:
41.因素水平: 42.多重比较。 44.独立性卡方检验: 46.相关分析: 47.回归分析: 51.相关系数: 52.试验设计(狭义): 53.试验方案: 56.局部控制: 57.完全随机设计: 59.多因素试验: 试验中只进行一种因素的测定 62.完全随机抽样: 二、单项选择题 1、单因素方差分析的数学模型是()。 ①x ij =μ+αi+εij ②x ij =μ+αi③x i =μ+αi+βj +εij ④x ij =αi +εij 2、.在单因素方差分析中一定有() ①SST=SSt+SSe②SSt〉SSe③SSt=SSe④SSt<SSe 3、一元线性回归的假设检验()。 ①只能用t检验②只能用F检验③两者均可④两者均不可 4、在单因素方差分析中一定有() ①dfT=dft+dfe②dfT≠dft+dfe ③dfT=dft ④dft=dfe 5、简单相关系数的取值范围是() ①-1
试验设计与统计分析 试题式样 一、名词解释 1、置信区间:在一定概率保证下,估计总体参数μ所在的区间或范围。 2、回归系数:x 每增加一个单位数时,平均地将要增加或减少的单位数。 3、相关系数:表示变数x 和y 相关密切及其性质的统计数称相关系数。 4、多重比较:方差分析中平均数间的比较,称多重比较。 5、置信系数:保证置信区间能覆盖参数的概率称置信系数。 二、填空 (每空1分,共10分) 1、多重比较结果常用的表示方法有 列梯形法 、 划线法 、 字母表示法 。 2、裂区试验主区如采用随机区组排列,总变异可分解为 A 因素 、 区组 、 主 区误差 、 B 因素 、 A×B 、 副区误差 。 3、当多个处理与共用对照进行显著性比较时,常用 最小显著差数法(LSD) 方法进行 多重比较。 三、选择题(每题1分,共5分) 1、田间试验的顺序排列设计包括 ( C )。 A 、间比法 B 、对比法 C 、间比法、对比法 D 、阶梯排列 2、对一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( C )。 A 、 , 3 B 、 , 3 C 、 , 12 D 、 , 12 3、下列哪种成对比较的无效假设的设立是正确的( B )。 A 、 H 0:d≤15 B 、 H 0:μd ≥12 C 、H 0:μ1-μ2≤10 D 、 H 0:d≠0 4、卡平方的连续性矫正的公式为( D )。 A 、Xc 2=∑(O i -E i )2/E i B 、Xc 2=∑(O i -E i -0.5)2/E i C 、 Xc 2=∑(|O i -E i |-0.5)2/O i D 、 Xc 2=∑(|O i - E i |-0.5)2/E i 5、回归系数b 的标准误等于( A ) 四、判断题(每小题1分,共5分) 1、否定正确无效假设的错误为统计假设测验的第一类错误。( √ ) 2、由固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处 理的总体。( √ ) 3、u 测验中,对 时,显著水平为5%,则测验的值 为 1.96。 ( × ) 4 “唯一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( √ ) 5、A 群体标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( × ) 五、简答题(每题5分,共15分) 1、方差分析中,常用的数据转换方法有哪些? (1)平方根转换 (2)对数转换 (3)反正弦转换 MSe/6MSe/62MSe/3MSe/3X SS n Q )2( A.-X X Y SS x X n s 2 /)(1 B.-+ X X Y SS x X n s 2 /)(11 .C -+ + X X Y SS x n s 2 /1 .D + H A :μμ<0αu
,生物统计 1,总体:根据研究目的确定的研究对象的全体 2、个体:总体中的一个研究单位 3、样本:实际研究中的一类假象总体 4、样本含量:样本中所包含的个体数目称为样本含量或大小 5、随机样本:一类从总体中随机抽得到的具有代表性的样本 6、统计量:由样本计算的特征数 7、参数:由总体计算的特征数 8、精确性:指在试验或调查中某一试验指标或性状的重复观察值彼此接近的程度9、系统误差:系统误差又叫做片面误差。它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差。 10、偶然误差:一类由于偶然的或不确定的因素所造成的每一次测量值的无规则变化(涨落),叫做偶然误差,或随机误差。 11、连续性变数资料:指用量测方式获得的数量性状资料 12、离散型变数资料:指用计数方式获得的数量性状资料 13、算术平均数:指资料中的各观测值的总和除以观测值个数所得的商,简称平均数或均数 14、平均数:资料或代表数,主要包括算术平均数,中位数,众数,几何平均数及调和平均数 15、标准差:是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。 16、方差:度量总体(或样本)各变量间变异程度的参数(总体)或统计量(样本)。 17、离均差平方和:样本各观测值变异程度大小的另一个统计数 18、试验:在一定条件下对自然现象所进行的观察或试验统称为试验 19、随机事件:随机试验的每一种可能结果 20、概率:事件本身所固有的数量指标,不随人的主观意志而改变,人们称之为概率 21、正态分布:若连续性随机变量X的概率分布密度函数,则X服 从正态分布 22、标准正态分布:我们把平均数u=0,σ2 =1时,称为标准正态分布,记为N(0, 1) 23、双侧概率:我们把随机变量X在平均 数u加减不同倍数标准差σ区间 (u-kσ,u+kσ)之外,取值的概率称为双 侧概率 24、单侧概率:对应于两尾概率可以求得 随机变量x小于小于u-kσ或大于u+kσ的 概率 标准误:反映样本平均数的抽样误差的大 小的一种指标 25、假设检验(显著性检验):假设检验是 数理统计学中根据一定假设条件由样本推 断总体的一种方法。 26、t检验:两总体方差未知但相同,用 以两平均数之间差异显著性的检验。 27、无效假设:被检验的假设,通过检验可 能被否定,也可能未被否定。 28、备择假设:是在无效假设被否定时准 备接受的假设。 29、显著水平:用来确定无效假设是否被 否定的概率标准。 30、Ⅰ型错误:把非真实差异错判为真实 差异。 31、Ⅱ型错误:把真实差异错判为非真实 差异。 32、双侧检验(双尾检验):利用两侧尾部 的概率进行的检验。 33、单侧检验(单尾检验):利用一侧尾部 的概率进行的检验。 34、分位数:又称百分位点。若概率 0
Za)=α的 实数 35、配对设计:是指先根据配对的要求将 试验单位两两配对,然后将配对成子的两 个实验单位随机分配到两个处理组中。 36、区间估计:是指在一定概率保证下指 出总体参数的可能范围。 置信区间:是指在进行区间估计时所给出 的可能范围。 37、置信度(置信概率):是指在进行区间 估计时所给出的概率保证。 38、方差分析:实质上是关于观测值变异 原因的数量分析。 39、试验指标:用来衡量试验结果的好坏 或处理效应的高低,在试验中具有测定的 性状或观测的项目。 40、试验因素:实验中所研究的影响试验 指标的因素。 41、因素水平:试验因素所处的某种特定 状态或数量等级。 42、试验处理:率先设计好的实施在试验 单位上的具体项目。 43、试验单位:在试验中能够接受不同试 验处理的独立的试验载体。 44、多重比较:统计学上指多个平均数两两 之间的相互比较称为多重比较。 45、主效应:由于因素水平的改变而引起 试验指标观测值平均数的改变量称为主效 应。 46、简单效应:在某因素同一水平上,另 一因素不同水平试验指标观测值之差称为 简单效应。 47、适合性检验:判断实际观察的属性类 别分配是否符合已知属性类别分配理论或 学说的假设检验。 48、独立性检验:根据次数资料判断两类 因子彼此相关或相互独立的假设检验。 49、相关变量:存在相关关系的变量叫做 相关变量。 50、回归分析:是确定两种或两种以上变 数间相互依赖的定量关系的一种统计分析 方法。 51、相关分析:研究随机变量之间相关性 的统计分析方法。 52、直线回归分析:如果在回归分析中, 只包括一个自变量和一个因变量,且二者 的关系可用一条直线近似表示,这种回归 分析称为直线回归分析 53、直线相关分析:对两个相关变量间的 直线关系进行相关分析称为直线相关分析 54、相关系数:统计学上把决定系数r2 的平方根称为x与y的相关系数 55、试验设计:以概率论和数理统计为理 论基础,经济地,科学地安排试验的一项 技术。 56、随机:使用随机方法对试验动物分组, 使参试动物分入各试验处理组的机会相 等,以避免试验动物分组事试验人员主观 倾向的影响 57、重复:试验的每一个处理都实施在两
2006-2007第1学期生物统计考试试卷(B 卷)答案 一、名词解释(10×2) 1、参数:描述总体的特征数。 2、连续性变数:指在任意两个变量之间都有可能存在只有微量差异的第三个变量存在,这样一类变数称为连续性变数 3、唯一差异原则:除了被研究的因素具有的不同水平外,其余各种环境因素均应保持在某一特定的水平上。 4、两尾测验:有两个否定区,分别位于分布的两尾。 5、显著水平:否定无效假设0H 的概率标准。 6、互斥事件:如果事件1A 和2A 不能同时发生,即12A A 为不可能事件,则称事件1A 和2A 互斥。 7、无偏估计:在统计上,如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的无偏估值。 8、相关系数:表示两组变数相关密切程度及性质的变数,r *9、否定区:否定无效假设0H 的区间。 *10、偏回归系数:任一自变数(在其他自变数皆保持一定数量水平时)对依变数的效应。 二、是非题(5×1) 1、二项分布的平均数为np ( √ ) 2、在二因素完全随机化设计试验结果的方差分析中,误差项自由度为(1)(1)n ab --。( × )
3、2χ分布是随自由度变化的一簇间断性曲线,可用于次数资料的假设测验。( × ) 4、一个显著的相关系数或回归系数说明X 和Y 变数的关系必为线性关系。( × ) 5、在一组变量中,出现频率最多的观察值,称为中位数。( × ) 三、选择题(10×2) 1、算术平均数的重要特征之一是离均差的总和( C ) A 、最小 B 、最大 C 、等于零 D 、接近零 2、一批种子的发芽率为0.75p =,每穴播5粒,出苗数为4时的概率( A ) A 、0.3955 B 、0.0146 C 、0.3087 D 、0.1681 3、回归截距a 的标准误等于( D ) A 、X SS n Q )2(- B 、 X X Y SS x X n S 2 )(1-+ C 、X X Y SS x X n S 2 )(11-++ D 、 X X Y SS x n S 2 1+ 4、Y~N(10, 80),当以1210n n ==进行抽样时,128y y ->的概率约为[ B ]。 A. 0.10 B. 0.05 C. 0.025 D. 0.01 5、成对比较的特点不包括( D ) A 、加强了试验控制 B 、可减小误差 C 、不必考虑总体方差是否相等 D 、误差自由度大 6、方差分析基本假定中除可加性、正态性外,尚有[ C ]假定。 A 、无偏性 B 、无互作 C 、同质性 D 、重演性 7、若否定 H ,则( ) A 、必犯α错误 B 、必犯β错误 C 、犯α错误或不犯错误 D 、犯β错误或不犯错误 8、随机抽取200粒棉花种子做发芽试验,得发芽种子为150粒,其与00.8p =的差异显著性为( A )。 A 、不显著 B 、显著 C 、极显著 D 、不能确定 9、当30n ≤时,测验一个样本方差2 s 和某一指定值C 是否有显著差异的方法用( B ) A 、F 测验 B 、2 χ测验 C 、t 测验 D 、u 测验 *10、多元线性回归方程的假设测验可用( A )。 A 、F 测验 B 、F 或t 测验 C 、t 测验 D 、u 测验
二、填空 1、生物统计分描述性统计和分析性统计。描述性统计是指运用分类、制表、图形以及计算概括性数据(平均数、标准差等)来描述数据特征的各项活动。分析性统计是进行数据观察、数据分析以及从中得出统计推断的各项活动。 2、统计分析的基本过程就是由样本推断总体的过程。该样本是该总体的一部分。 3、由样本获取总体的过程叫抽样。常用的抽样方法有随机抽样、顺序抽样、分等按比例抽样、整群抽样等。 4、样本平均数与总体平均数的差异叫抽样误差。常用 S/√N表示。 5、只有降低抽样误差才能提高试验结果的正确性。试验结果的正确性包括准确性和精确性。 6、试验误差按来源分为系统误差(条件误差)和随机误差(偶然误差)。系统误差(条件误差)影响试验结果的准确性,随机误差(偶然误差)影响试验结果的精确性。 7、系统误差(条件误差)可以控制,可通过合理的试验设计方法降低或消除。随机误差(偶然误差)不可控制,可通过理论分布来研究其变异规律,或相对比较其出现的概率的大小。 8、样本推断总体分假设检验和区间估计两大内容。常用的检验方法有t检验、F检验和卡方检验。 9、置信区间指在一定概率保证下总体平均数的可能范围。 10、t检验是通过样本平均数差值的大小来检验处理效应是否存在,两样本平均数的差值代表了试验的表观效应,它可能由处理效应(真实效应)和误差效应引起,要检验处理效应是否存在,常采用反证法。此法先建立无效假设:即假设处理效应不存在,样本平均数差值是由误差引起,根据差异在误差分布里出现的概率(即可能性大小的衡量)来判断无效假设是否成立。 11、判断无效假设是否成立的依据是小概率事件实际不可能原理,即假设检验的基本依据。用来肯定和否定无效假设的小概率,我们称之为显著水平,通常记为α。 12、t检验通常适合两样本连续性(非间断性)随机变量资料的假设检验,当二项分布逼近正态分布时,百分数资料也可用t检验。 13、F检验也叫方差分析。通常适合三个或三个以上样本连续性(非间断性)随机变量资料的假设检验。顾名思义,F检验是用方差的变异规律(即F分布)来检验处理效应是否存在。 14、F检验是从总离均差平方和与自由度的剖分开始,将总变异剖分为组间变异和组内变异。因为组间变异由处理效应和误差效应共同引起,组内变异由误差效应引起。因而,将计算出的组间方差和组内方差进行比较,就可判断处理效应是否存在。 15、F检验显著或极显著说明组间处理效应存在,但并不能说明每两组间都存在差异,要知道每两
填空题 1.数据资料按其性质不同各分为资料和资料两种。 2.有共同性质的个体所组成的集团称为。从总体中抽取部分个体进行观测,用以估计总 体的一般特性,这部分被观测的个体总称为。 3.由总体中包含的全部个体求得的能够反映总体性质的特征数称为;由样本的全部观察 值求得的用以估计总体参数的特征数叫。 4..试验误差可以分为误差和误差两种类型。 5.从总体中抽取的样本要具有代表性,必须是抽取的样本。 6.样本根据样本容量的多少可以分为和。 8.小麦品种A穗长的平均数和标准差值为12cm和3cm,品种B为18cm和3.5cm,根据__________,判断品种______的 该性状变异大。 9.某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取抽取50绳测其毛重,结果如下所示: 平均数X(kg)极差R(kg)标准差S(kg)变异系数CV% 贻贝单养42.70307.0816.58贻贝与海带混养52.1030 6.3412.16根据和,判断的效果好。 10.在统计学中,常见平均数主要有和。 11. 12. 13. 14. 15. 16. 17. 简答题 1.如何控制、降低随机误差,避免系统误差? 2.什么是准确性,精确性?如何提高试验的正确性? 3.统计表与统计图有何用途?常用统计图、统计表有哪些? 4.生物统计学中常用的平均数有几种?各在什么情况下应用? 5.为什么变异系数要与平均数、标准差配合使用? 多选题 1.下列总体中属于有限总体的是()。 A 保定地区棉田中棉铃虫的头数 B 20m2的试验小区中鲁玉4号玉米的株高 C 66.7万公顷鲁玉4号玉米的株高 D 320株水稻中糯稻的株数 2.下列数据资料中属于连续型变数资料。
总体:根据研究目的确定的研究对象的全体 个体:总体中的一个研究单位 样本:实际研究中的一类假象总体 样本含量:样本中所包含的个体数目称为样本含量或大小 随机样本:一类从总体中随机抽得到的具有代表性的样本 统计量:由样本计算的特征数 参数:由总体计算的特征数 精确性:指在试验或调查中某一试验指标或性状的重复观察值彼此接近的程度 系统误差:系统误差又叫做片面误差。它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差。 偶然误差:一类由于偶然的或不确定的因素所造成的每一次测量值的无规则变化(涨落),叫做偶然误差,或随机误差。 连续性变数资料:指用量测方式获得的数量性状资料 离散型变数资料:指用计数方式获得的数量性状资料 算术平均数:指资料中的各观测值的总和除以观测值个数所得的商,简称平均数或均数 平均数:资料或代表数,主要包括算术平均数,中位数,众数,几何平均数及调和平均数标准差:是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。 方差:度量总体(或样本)各变量间变异程度的参数(总体)或统计量(样本)。 离均差平方和:样本各观测值变异程度大小的另一个统计数 试验:在一定条件下对自然现象所进行的观察或试验统称为试验 随机事件:随机试验的每一种可能结果 概率:事件本身所固有的数量指标,不随人的主观意志而改变,人们称之为概率 小概率原理:小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能原理 正态分布:若连续性随机变量X的概率分布密度函数,则X服从正态分布 标准正态分布:我们把平均数u=0,σ2 =1时,称为标准正态分布,记为N(0,1) 双侧概率:我们把随机变量X在平均数u加减不同倍数标准差σ区间(u-kσ,u+kσ)之外,取值的概率称为双侧概率 单侧概率:对应于两尾概率可以求得随机变量x小于小于u-kσ或大于u+kσ的概率 二项分布:设随机变量x所有可能取得的值为0或正整数,且有P(ξ=K)=Cn(k)P(k)q(n-k),k=0,1,2….n,则称随机变量x服从n和p的二项分布 标准误:反映样本平均数的抽样误差的大小的一种指标 t分布:由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换t=,统计量t 值的分布称为t分布。 假设检验(显著性检验):假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。 t检验:两总体方差未知但相同,用以两平均数之间差异显著性的检验。 无效假设:被检验的假设,通过检验可能被否定,也可能未被否定。 备择假设:是在无效假设被否定时准备接受的假设。 显著水平:用来确定无效假设是否被否定的概率标准。 Ⅰ型错误:把非真实差异错判为真实差异。
第1章实验设计与统计分析基础授课时间 2学时 本章学习目的与要求 (1)明确食品试验研究的目的意义; (2)深刻理解试验设计有关基本概念; (3)掌握试验设计的基本原则和要求; (4)了解试验设计的常用方法;
第一节试验设计的目的意义 食品研究离不开实验,要想把实验做好仅靠专业知识是不够的,还需要能够事先把实验设计好,并且把实验数据分析好。 一、实验设计的意义 在食品生产和科学研究中,为了革新生产工艺,开发新产品,寻求优质、高产、低消耗的方法等,经常要进行各种试验研究。试验研究包括试验设计、试验的实施、收集资料、整理资料和分析资料等步骤。而试验设计是影响研究成功与否最关键的一环,是提高试验质量的重要保证。因此,如何安排试验,如何对试验结果进行科学的分析,既是食品生产、科研工作者经常遇到的现实问题,又是其必须具备的基本功。 实验设计(design of experiments, DOE),也称为试验设计,就是对实验进行科学合理的安排,以达到最好的实验效果。 实验设计是在实验开始之前,根据某项研究的目的和要求,制定是实验研究进程计划和具体的实验实施方案。其主要内容是研究如何合理地安排实验、取得数据,然后进行综合的科学分析,从而达到尽快获得最优方案的目的。 如果试验安排得合理,就能用较少的试验次数,在较短的时间内达到预期的试验目的;反之,实验次数既多,其结果还往往不能令人满意。试验次数过多,不仅浪费大量的人力和物力,有时还会由于时间拖得过长,使试验条件发生变化而导致实验失败。因此,如何合理地安排试验方案是值得研究的一个重要课题。试验设计的目的在于能用比较经济的人力、物力和时间,得到较为可靠的结果,准确地控制误差和估计误差的大小,还可使多种试验因素包括在很少的试验之中,达到高效的目的 实验的设计和实验结果的统计分析是密切相关的,只有按照科学的统计设计方法得到的实验数据才能进行科学的统计分析,得到客观有效地分析结论。反之,一大堆不符合统计学原理的数据可能是毫无作用的。因此对实验工作者而言,关键是对用科学的方法设计好实验,获得符合统计学原理的科学有效的数据。 试验设计应注意的问题: (1)试验目的是否明确:没有明确的目的,就谈不上科学周密的设计。未经设计的实验是无用的实验。对课题缺乏深刻的认识,就难以明确试验的目的。
请认真阅读完再下载:预览的题目顺序完全和您自己的试题顺序完全相同再下载! 试验设计与生物统计2-0001 浙江广播电视大学形成性测评系统课程代码:3305826 参考资料 试卷总分:100 单选题(共8题,共40分) 1.(5分) 下列不属于算术平均数的特征的是()。 A、平均数没有单位 B、平均数大小与每个样本值都有关 C、离均差的平方和最小 D、各观测值与平均数之差的总和等于0 参考答案:A 2.(5分) 某水稻试验中,从320株水稻杂交后代中随机抽样,全部样本中紫色株头有20株,黄色株头的有10株,该试验的样本容量是()。 A、320 B、30 C、20 D、10 参考答案:B 3.(5分) 一批数据中最大值与最小值之间的差距称为()。 A、极差 B、差值 C、区组 D、组距 参考答案:A 4.(5分) 标准差与平均数的比值称为()。 A、方差 B、标准差 C、变异系数 D、变数 参考答案:C 5.(5分) 对花的颜色、芒的有无、果实性状的圆扁等性状的观察记载数据,称为()。 A、质量变数 B、数量变数 C、连续性变数 D、间断性变数 参考答案:A 6.(5分) 在某冷藏库中,抽取红色切花的概率是40%,抽取玫瑰的概率是50%,那么抽取红色玫瑰切花的概率是()。
A、20% B、40% C、50% D、90% 参考答案:A 7.(5分) 某玉米品种成熟期测得5株的株高分别为240、243、245、250、257(单位:cm),那么该玉米品种的平均株高是()cm。 A、240 B、245 C、247 D、257 参考答案:C 8.(5分) 有100粒玉米种子,30粒为黄色、30粒为紫色、40粒为白色,采用复置抽样,连续两次抽到白色玉米的概率为()。 A、0.16 B、0.3 C、0.4 D、0.6 参考答案:A多选题(共5题,共30分) 9.(6分) 下列属于常用变异数的有()。 A、极差 B、方差 C、标准差 D、平均数 参考答案:ABC 10.(6分) 下列有关样本的表述正确的是()。 A、样本是总体中抽取的一部分 B、样本内个数为样本容量 C、随机样本能代表总体 D、样本和总体是具有相对性的 参考答案:ABCD 11.(6分) 下列有关频率和概率的表述正确的是()。 A、频率和概率是用于描述事件出现可能性的数量指标 B、事件A在n次试验中出现了a次,那么事件A出现的频率为a/n C、频率也可以称为概率 D、当次数n充分大时,能对随机事件出现的概率做出估计 参考答案:ABD 12.(6分) 正态分布在在理论和实践上所具有重要的意义在于()。
生物统计附试验设计自学考试大纲 一、本课程的性质与设置的目的 (一)、本课程的性质和特点 生物统计附试验设计是在生物学领域应用非常广泛的一门学科,是动物科学与动物医学的基础课。主要特点是:基本概念、基本知识较广、基本理论较强;设计基本统计方法较多,要求要明确每一种统计分析方法的应用条件才能正确地选择;一些教学内容涉及到专业知识,故要协调、衔接本课程教学内容与专业课教学内容。 (二〉、本课程在专业中的地位、任务与作用 生物统计附试验设计是应用概率论和数理统计原理来研究生物界数量变异规律的一门学科,是动物科学专业本科生必修的一门专业基础课,目的是培养学生收集、整理信息和资料的能力,处理信息和资料的能力以及解释统计结果的能力,由于动物试验受到各种条件限制,干扰的随机因素多,试验误差较大,因此对试验数据必须进行统计学处理。掌握试验设计方法和试验数据的统计分析方法,是学生将来从事生产、科研和管理工作所必需的。因此,本课程在国内外同类课程中更具有应用价值,在人才培养中占有重要的地位。 (三)、本课程的基本要求: 总的要求是掌握生物统计的基本概念和基本方法;培养针对具体的实际问题选择正确的统计分析方法的能力;利用掌握的统计学知识解决生物学领域科学研究和实际工作中的数据分析问题。 (四)、本课程与相关课程的联系 生物统计附试验设计是动物科学专业本科生必修的一门专业基础课。目的是为学习普通遗传学、数量遗传学、家畜育种学及饲养学奠定统计学知识基础,为开展动物科学试验提供统计分析工具。 学习本课程应具备的基础知识是:微积分、线性代数、概率论的初步知识。 二、课程内容与考核目标 第一章绪论 (一)自学目的与要求 1、一般了解:生物统计的发展概况。 2、一般掌握:生物统计的作用及其主要内容。 3、熟练掌握:总体与样本、样本含量、参数与统计量、变数与变量、错误与误差、准确性与精确性的概念。 (二)本章课程内容 第一节生物统计与试验设计的概念 第二节学习本课程应注意的几个问题 第三节本学科发展概况 第四节常用统计术语 (三)考核知识点
试验设计与统计分析课程实习论文 题目:不同栽培模式及施氮量对土壤水分含量、土壤硝态氮和铵态氮含量的影响
不同栽培模式及施氮量对土壤水分含量、土壤硝态氮和铵态氮含 量的影响 摘要:【目的】随着农业生产的发展,通过合理施肥提高肥料利用率已被认为是可持续农业发展的一条重要途径,推广小麦配方施肥,特别是研究氮、磷肥料对小麦的生长和产量的影响,已刻不容缓,高产品种必须有与之相适应的施肥方案,才能发挥其应有的价值。【实验设计】通过研究对比不同种植模和施氮量下耕层土壤矿化氮的含量及冬小麦的产量,找出最佳栽培模式和合理的施氮量,从而达到增产的目的.田间试验采取裂区设计,试验设栽培模式和施氮量2种因子。栽培模式设露地栽培(常规)、麦草覆盖(覆草)、垄上覆膜(覆膜)、垄上覆膜沟内覆草(垄沟)、冬季补灌(补灌)五种方式;施氮设不施氮、施120 kg/hm2N和240 kg/hm2N三个水平。【结果】试验结果表明,五种不同栽培模式中麦草覆盖、陇上覆膜和陇上覆膜沟内覆草能显著增加耕层土壤(0-20cm)的储水量;在水分充足的情况下不同栽培模式对耕层土壤(0-20cm)矿化氮含量及冬小麦产量没有显著影响;不同的施氮量对耕层土壤水分含量没有显著影响,但对小麦产量、生物量和耕层土壤矿化氮含量影响极为显著,施氮量为120kg/hm2N和240kg/hm2N处理的生物量比不施氮均能增加50%以上,但两者生物量之间差异很小;施氮量为120kg/hm2N和240kg/hm2N处比不施氮小麦产量均增加23%以上,土壤矿化氮含量均增加55%以上,但两者生物量之间差异很小。 关键词:不同的栽培模式;不同施氮量;水分含量;小麦产量;硝态氮氮含量;铵态氮含量 前言:不同氮、磷营养对小麦生长发育、养分吸收、产量及其构成和品质有明显的影响。适宜的氮、磷配比及用量可提高小麦干重、有效穗数、穗长、穗粒数、百粒重,提高小麦植株对氮、磷养分的吸收。氮是小麦营养中最为重要的元素之一,它影响小麦的生长发育和产量形成。由于土壤中有效氮素含量低,而小麦的需氮量有很多,施氮肥具有明显的增产作用。小麦吸收磷主要在拔节孕穗期,但早期的磷营养对于植株,尤其对根系极为重要。据Black的试验[1],磷肥可以显著增加分蘖与次生根数;在磷肥充足的条件下,氮肥促进分蘖与次生根数的作用
本科《生物统计附试验设计》复习思考题 一,名词解释题 1.中位数:将资料所有观测值按从小到大的顺序排列,处于最中间的数. 2.I型错误:是拒绝H0时犯下的错误,其错误是把真实差异错叛为非真实差异. 3.总体:是由研究目的的确定的研究对象的个体总和. 4.参数:是指由总体计算的特征数. 5.相关分析:即两个以上的变量之间共同受到另外因素的影响. 6.回归分析:即一个变量的变化受到一个或几个变量的影响. 7.精确性:是重复观测值之间彼此接近的程度. 8.显著水平:是检验无效假设的水准.但另一方面它也是进行检验时犯错误概率大小. 9.随机单位组设计:它的原理与配对设计类似,抽每一头试验动物具有相等的机会,接受任一处理而不受人为影响. 10.统计量:由样本计算的特征数. 11.准确性:是观察值与真实值间的接近程度. 12.随机误差:是由试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间产生的误差,是不可避免的. 13.系统误差:是由于试验处理以外的其它条件明显不一致所产生的带有倾向性的偏差. 14.样本:是在总体中进行抽样,从中抽取的部分个体. 15.众数:资料中出现最多的观测值或次数最多的一组中值. 16.样本标准差:统计学中样本平方差S^2的平方根 17.试验处理:在一项试验中,同一条件下所做的试验称为一个处理. 18.几何平均数:几个观测值相乘之积开n次方所得的方根称为几何平均数. 19.顺序抽样法:是将有限总体内所有个体编号,然后按照一定顺序每隔一定的数目,均匀抽出一个个体,组成样本,对样本进行调查. 20.试验指标:用来平衡量试验效果的量. 21.随机抽样法:是将总体内所有的个体编号,然后采取抽签,拈阄或用随机数字表的方法将部分个体取出而做为样本进行调查. 22.小概率原理:小概率事件在一次试验中实际不可能发生的原理. 23.重复:在试验中,同一处理内设置的动物数量,称为重复. 24.局部控制:在试验设计时采用各种技术措施,控制和减少非试验因素对试验指标的影响. 25.算术平均数:资料中各观测值的总和除以观测个数所得的商. 26.变异系数:是标准差相对平均数的百分数,用CV表示. 27.II型错误:在接受H0时犯下的错误,其错误是把真实差异错判为非真实差异. 28.因素水平:每个试验因素的不同状态(处理的某种特定状态或数量上的差别)称为因素水平. 29.配对设计:是指将条件一致的两头动物酿成对子,然后采取随机的方法在同一对子内两头动物进行分配处理. 30.试验处理:指对受试对象给予的某种外部干预或措施,是试验中实施的因子水平的一个组合. 31.调和平均数:资料中各观测值倒数的算术平均数的倒数称调和平均数. 32.效应:是指因素对某试验指标所起的增进或减退的作用. 33.顺序抽样:它是按某种既定顺序从总体(有限总体)中抽取一定数量的个体构成样本. 34.独立性检验:判断二项,多项分部计数资料两类因子相关性或独立性的显著性检验方法. 35.适合性检验:是判断实际观察的属性分配是否符合已知属性分配的理论或学说的一种检验方法. 36.单因素试验:在试验中所考虑的因素只有一个时,称为单因素试验. 37.局部控制:在试验时采取一定的技术,措施或方法来控制或降低试验因在各素对试验结果的影响. 38.分等按比例随机抽样:先按某些特征或变异原因将抽样总体分成基于等次在各等次内按其占总体的的比例随机投篮各等次的样本,然后将各等次抽取的样本合并在一起即为整个调查样本.
总体:根据研究目的确定的研究对象的全体个体:总体中的一个研究单位 样本:实际研究中的一类假象总体样本含量:样本中所包含的个体数目称为样本含量或大小 随机样本:一类从总体中随机抽得到的具有代表性的样本统计量:由样本计算的特征数 参数:由总体计算的特征数精确性:指在试验或调查中某一试验指标或性状的重复观察值彼此接近的程度 系统误差:系统误差又叫做片面误差。它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差。 偶然误差:一类由于偶然的或不确定的因素所造成的每一次测量值的无规则变化(涨落),叫做偶然误差,或随机误差。连续性变数资料:指用量测方式获得的数量性状资料 离散型变数资料:指用计数方式获得的数量性状资料 算术平均数:指资料中的各观测值的总和除以观测值个数所得的商,简称平均数或均数 平均数:资料或代表数,主要包括算术平均数,中位数,众数,几何平均数及调和平均数 标准差:是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。 方差:度量总体(或样本)各变量间变异程度的参数(总体)或统计量(样本)。 离均差平方和:样本各观测值变异程度大小的另一个统计数 试验:在一定条件下对自然现象所进行的观察或试验统称为试验 随机事件:随机试验的每一种可能结果 概率:事件本身所固有的数量指标,不随人的主观意志而改变,人们称之为概率 小概率原理:小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能原理 正态分布:若连续性随机变量X的概率分布密度函数,则X服从正态分布 标准正态分布:我们把平均数u=0,σ2 =1时,称为标准正态分布,记为N(0,1) 双侧概率:我们把随机变量X在平均数u加减不同倍数标准差σ区间(u-kσ,u+kσ)之外,取值的概率称为双侧概率 单侧概率:对应于两尾概率可以求得随机变量x小于小于u-kσ或大于u+kσ的概率 二项分布:设随机变量x所有可能取得的值为0或正整数,且有P(ξ=K)=Cn(k)P(k)q(n-k),k=0,1,2….n,则称随机变量x服从n和p的二项分布 标准误:反映样本平均数的抽样误差的大小的一种指标 t分布:由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换t=,统计量t 值的分布称为t 分布。 假设检验(显著性检验):假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。 t检验:两总体方差未知但相同,用以两平均数之间差异显著性的检验。 无效假设:被检验的假设,通过检验可能被否定,也可能未被否定。 备择假设:是在无效假设被否定时准备接受的假设。显著水平:用来确定无效假设是否被否定的概率标准。 Ⅰ型错误:把非真实差异错判为真实差异。Ⅱ型错误:把真实差异错判为非真实差异。 双侧检验(双尾检验):利用两侧尾部的概率进行的检验。 单侧检验(单尾检验):利用一侧尾部的概率进行的检验。 分位数:又称百分位点。若概率0
Za)=α的实数 配对设计:是指先根据配对的要求将试验单位两两配对,然后将配对成子的两个实验单位随机分配到两个处理组中。 区间估计:是指在一定概率保证下指出总体参数的可能范围。 置信区间:是指在进行区间估计时所给出的可能范围。 置信度(置信概率):是指在进行区间估计时所给出的概率保证。 方差分析:实质上是关于观测值变异原因的数量分析。 试验指标:用来衡量试验结果的好坏或处理效应的高低,在试验中具有测定的性状或观测的项目。 试验因素:实验中所研究的影响试验指标的因素。因素水平:试验因素所处的某种特定状态或数量等级。 试验处理:率先设计好的实施在试验单位上的具体项目。试验单位:在试验中能够接受不同试验处理的独立的试验载体。多重比较:统计学上指多