第12章实验设计
思考与练习参考答案
一、最佳选择题
1. 处理因素作用于受试对象的反映须通过观察指标来表达,则选择指标的依据具有( E )。
A.客观性
B. 特异性
C. 敏感性
D. 特异性和敏感性
E. A与D
2. 以前的许多研究表明,血清三酰甘油的含量与冠心病危险性有关,即三酰甘油的含量越高,患冠心病的危险性就越大,有的医生以此筛选危险人群。后来的研究表明,冠心病还与其他因素有关,特别是血清中高含量胆固醇和低含量的高密度脂蛋白,它们常与冠心病同时发生联系,采用严格的实验设计平衡了其他因素的作用后,发现三酰甘油的含量与冠心病发病的危险性之间的联系就不复存在了。这是以下选项中的(B)选项把握得较好所致。
A. 重复实验次数较多
B.均衡性原则考虑得周到
C.用多因素设计取代单因素设计
D.提高实验人员的技术水平
E.严格按随机化原则进行分组
3. 实验共设4个组,每组动物数均为4只,在4个不同的时间点上对每只犬都进行了观测,资料概要列于教材表12-7中,此资料取自(B)。(注:B100 mg代表用B药的剂量) 教材表12-7 Beagle犬受6.5 Gy不均匀γ射线照射再用B药后外周血白细胞总数的结果━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━时间白细胞总数(S
X ,×109/L)
───────────────────────────────────────
/天照射对照照射+B100 mg 照射+阳性对照药照射+B100 mg+阳性对照药────────────────────────────────────────────照射前 14.30±3.77 14.70±2.83 14.08±1.60 13.98±1.37
照射后: 6 3.68±0.82 4.26±1.40 5.28±1.52 6.90±0.97
12 7.23±0.83 7.44±1.10 8.75±1.02 10.53±1.57
18 6.87±1.50 9.26±1.36 9.87±1.23 12.78±1.83
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
A. 具有一个重复测量的两因素
B.具有一个重复测量的三因素设计
C.两因素析因设计
D. 三因素析因设计
E.交叉设计
4. 已知A、B、C都是三水平因素,且根据预试验结果得知,三个因素之间的各级交互作用都很重要,需要考察。好在这个实验作起来比较方便,需要的费用和时间都比较少。最好选用(A)。
A.析因设计B. 交叉设计C. 随机区组设计
D. 配对设计 E. 单因素三水平设计
二、思考题
1. 在行走速度和行程固定的前提下,负荷越重,体能消耗越多。为研究在4种不同的负荷量条件下,消耗的体能之间的差别是否有统计学意义,拟用4名战士,在4个不同日期进行实验,并且每人每天只接受1种负荷量实验1次。已知因素之间的交互作用可忽略不计,用energy代表体能消耗量,请选用合适的实验设计方法并以表格形式给出具体的安排。
答:本题中涉及一个实验因素(即负荷)、两个区组因素(即受试对象和试验日期),这三个因素间的交互作用可以忽略,可选用拉丁方设计。设计方案见练习表12-1。
练习表12-1 拉丁方设计的格式与实验结果
受试对象编号
负荷代号与energy
*: 1 2 3 4
1 A(1) B(2) C(3) D(4)
2 B(5) C(6) D(7) A(8)
3 C(9) D(10) A(11) B(12)
4 D(13) A(14) B(15) C(16)
注:A、B、C和D分别代表4种负荷,括号中的编号形式上代表观测的energy值;*代表“试验顺序”。
2. 如果某项实验研究中需要考察3个实验因素,各因素均取4个水平,拟用析因设计来安排此项实验,问至少要进行多少次实验才便于考察各级交互作用对观测结果的影响?请说出计算的依据。
答:至少要进行128次实验。计算方法为4?4?4?2=128。因为析因设计中不同的实验条件数为全部因素的水平数相乘,各实验条件下至少要作2次独立重复实验。
3.欲探讨用微型角膜刀行角膜深板层内皮移植术的适应证、临床疗效及并发症的预防及处理,用微型角膜刀对6例患者6只患有大疱性角膜病变眼行深板层角膜内皮移植术。术后随访6~9个月。结果表明,5例患者视力明显提高,患者术后平均角膜内皮细胞密度为(2 481±212) 个/ mm,角膜中央厚度平均为(549±61) μm ,散光为(2 104±1 119)D,未发生严重并发症。得如下结论:用微型角膜刀行角膜深板层内皮移植术是治疗大疱性角膜病变的可选术式。与传统的穿透性角膜移植相比,该术式有望成为角膜内皮移植的技术平台,但远期疗效尚需继续随访。请问该研究是否遵循了实验设计的基本原则?应如何设计该实验?
答:该实验仅凭选取了6例患者6只患有大疱性角膜病变眼行深板层角膜内皮移植术后5例患者视力明显提高,就得出“该方法是治疗大疱性角膜病变的可选术式”的结论,与传统的穿透性角膜移植相比,该术式有望成为角膜内皮移植的技术平台。首先该研究违反了对照的原则。没有设立对照组,仅凭6例中5例术后视力明显提高,但没有与传统的穿透性角膜移植相比,不具有说服力。正确的做法是:首先选取一定数量的患有大疱性角膜病变眼的患者,将患有大疱性角膜病变眼随机分成两组,接受两种手术方法的治疗。若病情、病程等非处理因素对预后有影响,则应尽量保证两组之间在重要的非处理因素上均衡。然后再对两
种手术方法术后的治疗效果进行比较。
4. 某人将教材表12-8资料所对应的实验设计看成了多个成组设计用t检验进行分析是不正确的,究其原因是没能正确判断该实验设计的类型,故不能选用正确的分析方法。请分析该实验所涉及的因素及其水平数,确定该实验设计类型。
教材表12-8 不同药物对小鼠迟发超敏反应的影响结果()S
X±
药物
剂量/(g·kg-1)
鼠数/只耳肿重量/mg
对照- 10 21.2±2.7
补肾药 5 10 22.3±3.5
补肾药10 10 18.8±3.1
补肾药20 10 16.5±2.4
Cy 0.025 10 11.2±1.5
Cy+补肾药0.025+5 10 14.3±2.9
Cy+补肾药0.025+10 10 18.6±3.6
Cy+补肾药0.025+20 10 19.2±3.4注:补肾药全称为补肾益寿胶囊。
答:采用t检验处理该资料是很不妥当的。因为它不是多个单因素2水平的设计定量资料。按教材表12-8的列表方式,使人不易看出实验设计的类型。像单因素8水平设计问题,又像是两个单因素4水平设计问题或是某种多因素设计问题。这是缺乏有关设计类型概念的人们习惯的列表方式,在选用统计分析方法时将起着严重的误导作用。
仔细看看教材表12-8中以“药物”和“剂量”为总称的这两列,似乎该实验涉及了“药物”和“剂量”这样两个因素,事情是否果真如此,不妨试列出由它们组合成的表格(练习表12-2)。
练习表12-2 教材表12-8资料的第一种变形结果(S
X±)
药物种类
耳肿重量/mg
#: 0 0.025 5 10 20
补肾药21.2±2.7 . 22.3±3.5 18.8±3.1 16.5±2.4 Cy药21.2±2.7 11.2±1.5 * * *
注:各组均有10只小鼠,“.”表示补肾药未用的剂量;“*”表示Cy药未用的剂量;“#”代表“补肾药的剂量”。
显然,练习表12-2未全面、正确地表达教材表12-8所包含的信息,又无法反映出两种药合用的结果,故从原表中抽象出“药物”和“剂量”这样两个因素是不够正确的转换方式。事实上,原表中所反映的是两种药具有各自的用药剂量,故将“补肾药的剂量”和“Cy药的剂量”视为两个实验因素,问题就迎刃而解了(练习表12-3)。
练习表12-3 教材表12-8资料的第二种变形结果(S
X )
Cy药剂量/(g·kg-1)
耳肿重量/mg
*: 0 5 10 20
0 21.2±2.7 22.3±3.5 18.8±3.1 16.5±2.4
0.025 11.2±1.5 14.3±2.9 18.6±3.6 19.2±3.4
注:*代表“补肾药的剂量”;各组均有10只小鼠。
由练习表12-3可以清楚地看出,原表中的8个组,其本质是分别具有2水平和4水平的两个因素的水平组合,即两因素(或称2×4)析因设计,而不是单因素8水平设计,也不是两个单因素4水平设计问题。
5. 请从公开发表的学术论文中去查找使用频率最高的三种实验设计类型,即单因素设计、析因设计和重复测量设计。如果论文中将这些实验设计类型表达得不够清楚,请采用“结构变形”或“拆分组别”等技巧重新表达,并清楚地指出其真正的实验设计类型。(答案略)
(胡良平李长平)
生物统计 第一章绪论 1.什么是生物统计?它在动物科学研究中有何作用? 2.什么是总体、个体、样本、样本容量?统计分析的两个特点是什么? 3.什么是参数、统计数?二者有何关系? 4.什么是试验或调查的准确性与精确性?如何提高试验或调查的准确性与精确性? 5.什么是随机误差与系统误差?如何控制、降低随机误差,避免系统误差? 6.统计学发展的概貌可分为哪三种形态?拉普拉斯、高斯、高尔顿、皮尔森、哥塞特、费 舍尔对统计学有何重要贡献? 第二章资料的整理 1.资料可以分为哪几种类型?它们有何区别与联系? 2.为什么要对资料进行整理?对于计量资料,整理成次数分布表的基本步骤是什么? 3.统计表与统计图有何用途?常用统计表、统计图有哪些?编制统计表、绘制统计图有 何基本要求? 4.某品种100头猪的血红蛋白含量资料单位:g/100ml列于下表,将其整理成次数分布表, 并绘制次数分布直方图与折线图。 表格1 4某品种100头猪的血红蛋白含量(g/100ml) 13. 4 13. 8 14. 4 14. 7 14. 8 14. 4 13. 9 13. 13. 12. 8 12. 5 12. 3 12. 1 11. 8 11. 10. 1 11. 1 10. 1 11. 6 12. 12. 12. 7 12. 6 13. 4 13. 5 13. 5 14. 15. 15. 1 14. 1 13. 5 13. 5 13. 2 12. 7 12. 8 16. 3 12. 1 11. 7 11. 2 10. 5 10. 5 11. 3 11. 8 12. 2 12. 4 12. 8 12. 8 13. 3
本科《生物统计附试验设计》课程代码:02793 一,名词解释题 1.中位数:将资料所有观测值按从小到大的顺序排列,处于最中间的数. 2.I型错误:是拒绝H0时犯下的错误,其错误是把真实差异错叛为非真实差异. 3.总体:是由研究目的的确定的研究对象的个体总和. 4.参数:是指由总体计算的特征数. 5.相关分析:即两个以上的变量之间共同受到另外因素的影响. 6.回归分析:即一个变量的变化受到一个或几个变量的影响. 7.精确性:是重复观测值之间彼此接近的程度. 8.显著水平:是检验无效假设的水准.但另一方面它也是进行检验时犯错误概率大小. 9.随机单位组设计:它的原理与配对设计类似,抽每一头试验动物具有相等的机会,接受任一处理而不受人为影响. 10.统计量:由样本计算的特征数. 11.准确性:是观察值与真实值间的接近程度. 12.随机误差:是由试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间产生的误差,是不可避免的. 13.系统误差:是由于试验处理以外的其它条件明显不一致所产生的带有倾向性的偏差. 14.样本:是在总体中进行抽样,从中抽取的部分个体. 15.众数:资料中出现最多的观测值或次数最多的一组中值. 16.样本标准差:统计学中样本平方差S^2的平方根 17.试验处理:在一项试验中,同一条件下所做的试验称为一个处理.
18.几何平均数:几个观测值相乘之积开n次方所得的方根称为几何平均数. 19.顺序抽样法:是将有限总体内所有个体编号,然后按照一定顺序每隔一定的数目,均匀抽出一个个体,组成样本,对样本进行调查. 20.试验指标:用来平衡量试验效果的量. 21.随机抽样法:是将总体内所有的个体编号,然后采取抽签,拈阄或用随机数字表的方法将部分个体取出而做为样本进行调查. 22.小概率原理:小概率事件在一次试验中实际不可能发生的原理. 23.重复:在试验中,同一处理内设置的动物数量,称为重复. 24.局部控制:在试验设计时采用各种技术措施,控制和减少非试验因素对试验指标的影响. 25.算术平均数:资料中各观测值的总和除以观测个数所得的商. 26.变异系数:是标准差相对平均数的百分数,用CV表示. 27.II型错误:在接受H0时犯下的错误,其错误是把真实差异错判为非真实差异. 28.因素水平:每个试验因素的不同状态(处理的某种特定状态或数量上的差别)称为因素水平. 29.配对设计:是指将条件一致的两头动物酿成对子,然后采取随机的方法在同一对子内两头动物进行分配处理. 30.试验处理:指对受试对象给予的某种外部干预或措施,是试验中实施的因子水平的一个组合. 31.调和平均数:资料中各观测值倒数的算术平均数的倒数称调和平均数. 32.效应:是指因素对某试验指标所起的增进或减退的作用. 33.顺序抽样:它是按某种既定顺序从总体(有限总体)中抽取一定数量的个体构
《生物统计附试验设计》 习题集 (动物医学专业用) 第一章绪论 一、名词解释 总体个体样本样本含量随机样本参数统计量准确性精确性 二、简答题 1、什么是生物统计?它在畜牧、水产科学研究中有何作用? 2、统计分析的两个特点是什么? 3、如何提高试验的准确性与精确性? 4、如何控制、降低随机误差,避免系统误差? 第二章资料的整理 一、名词解释 数量性状资料质量性状资料半定量(等级)资料计数资料计量资料 二、简答题 1、资料可以分为哪几类?它们有何区别与联系? 2、为什么要对资料进行整理?对于计量资料,整理的基本步骤怎样? 3、在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好? 4、统计表与统计图有何用途?常用统计图、统计表有哪些? 第三章平均数、标准差与变异系数 一、名词解释 算术平均数几何平均数中位数众数调和平均数标准差方差离均差的平方和(平方和)变异系数 二、简答题
1、生物统计中常用的平均数有几种?各在什么情况下应用? 2、算术平均数有哪些基本性质? 3、标准差有哪些特性? 4、为什么变异系数要与平均数、标准差配合使用? 三、计算题 1、10头母猪第一胎的产仔数分别为:9、8、7、10、1 2、10、11、14、8、9头。试计算这10头母猪第一胎产仔数的平均数、标准差和变异系数。 2、随机测量了某品种120头6月龄母猪的体长,经整理得到如下次数分布表。试利用加权法计算其平均数、标准差与变异系数。 组别组中值(x)次数(f) 80—84 2 88—92 10 96—100 29 104—108 28 112—116 20 120—124 15 128—132 13 136—140 3 3、某年某猪场发生猪瘟病,测得10头猪的潜伏期分别为2、2、3、3、 4、4、4、 5、9、12(天)。试求潜伏期的中位数。 4、某良种羊群1995—2000年六个年度分别为240、320、360、400、420、450只,试求该良种羊群的年平均增长率。 5、某保种牛场,由于各方面原因使得保种牛群世代规模发生波动,连续5个世代的规模分别为:120、130、140、120、110头。试计算平均世代规模。 6、调查甲、乙两地某品种成年母水牛的体高(cm)如下表,试比较两地成年母水牛体高的变异程度。 甲地137 133 130 128 127 119 136 132 乙地128 130 129 130 131 132 129 130 第四章常用概率分布 一、名词解释 随机事件概率的统计定义小概率原理正态分布标准正态分布双侧概率(两尾概率)单侧概率(一尾概率)二项分布波松分布标准误t分布
广东药学院自编教材试验设计与统计分析 卫生统计学教研室 2014.8
第一章绪论 在医药卫生、食品等专业研究领域,常需要开展大量的试验来确定或验证研究者在科研过程中提出的科学假设,例如临床上研究某种新的降糖药的疗效时,研究者需要将研究对象(如糖尿病患者)随机地分组,使其中一组患者服用研究中的该降糖药,另一组患者服用传统的降糖药,进而比较两组药物的疗效。但在具体的试验实施之前,研究者需要面对很多问题,如试验中试验对象应如何选择和分组?如何在试验过程中避免服用不同试验药物对试验对象心理产生影响,继而影响到最终疗效的判断?选择什么样的指标可更好的反映药物疗效?样本量需要多少?试验数据应如何收集以及运用何种统计方法进行分析等等问题。因为研究过程中研究结果会受到诸多因素影响,如研究对象的年龄、性别和病情可能影响药物疗效,如果不采取科学的方法使这些因素在比较组间分布均衡,就不能得到令人信服的结论。因此为使科学研究在消耗最少人力和物力的情况下,最大限度地减少误差,获得科学可靠的结论,需要在研究开始之前对整个试验过程做出精心安排,制定详细具体的试验实施方案,即进行试验设计(experimental design)。一个科学合理的试验设计,可以达到事半功倍的效果,是试验获得成功的关键。 一、试验设计的基本要素 医学试验包括三个基本要素:即处理因素、试验对象和试验效应。如研究某降糖新药的疗效,处理因素为降糖新药及比较的传统降糖药;研究者需用糖尿病患者作为试验对象;试验效应是能反映药物疗效的指标,如患者空腹血糖或餐后血糖的下降。处理因素作用于试验对象后产生试验效应(图1),三个要素缺一不可,因此试验设计时要先明确三个基本要素,再制定详细的研究计划。 1. 处理因素 处理因素(treatment)是指研究者根据研究目的施加于试验对象,以考察其试验效应的因素。如临床上研究降糖药的疗效,降糖药即为处理因素。在试验过程中处理因素的状态称为水平(level),如比较降糖新药和传统降糖药的疗效,
第一章绪论习题一、选择题 1.统计工作和统计研究的全过程可分为以下步骤: A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2. 在统计学中,习惯上把()的事件称为小概率事件。 A. P 0.10 D. P 0.05 B. P 0.05或P E. P 0.01 0.01 C.P 0.005 3?8 A. 计数资料 B.等级资料C?计量资料 D. 名义资料 E.角度资料 3. 某偏僻农村144 名妇女生育情况如下:0 胎5 人、1 胎25 人、2 胎70 人、3 胎30 人、4胎14 人。该资料的类型是()。 4. 分别用两种不同成分的培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录 48 小时各实验单元上生长的活菌数如下,A:48、84、90、123、171;B:90、116、124、225、84。该资料的类型是()。 5. 空腹血糖测量值,属于()资料。 6. 用某种新疗法治疗某病患者41 人,治疗结果如下:治愈8 人、显效23 人、好转6 人、恶 化 3 人、死亡 1 人。该资料的类型是()。 7. 某血库提供6094 例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是()。 8. 100 名18 岁男生的身高数据属于()。 二、问答题 1.举例说明总体与样本的概念 2.举例说明同质与变异的概念 3.简要阐述统计设计与统计分析的关系 一、选择题 1. D 2.B 3.A 4. C 5.C 6.B 7.D 8.C 二、问答题 1.统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951 年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。
,生物统计 1,总体:根据研究目的确定的研究对象的全体 2、个体:总体中的一个研究单位 3、样本:实际研究中的一类假象总体 4、样本含量:样本中所包含的个体数目称为样本含量或大小 5、随机样本:一类从总体中随机抽得到的具有代表性的样本 6、统计量:由样本计算的特征数 7、参数:由总体计算的特征数 8、精确性:指在试验或调查中某一试验指标或性状的重复观察值彼此接近的程度9、系统误差:系统误差又叫做片面误差。它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差。 10、偶然误差:一类由于偶然的或不确定的因素所造成的每一次测量值的无规则变化(涨落),叫做偶然误差,或随机误差。 11、连续性变数资料:指用量测方式获得的数量性状资料 12、离散型变数资料:指用计数方式获得的数量性状资料 13、算术平均数:指资料中的各观测值的总和除以观测值个数所得的商,简称平均数或均数 14、平均数:资料或代表数,主要包括算术平均数,中位数,众数,几何平均数及调和平均数 15、标准差:是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。 16、方差:度量总体(或样本)各变量间变异程度的参数(总体)或统计量(样本)。 17、离均差平方和:样本各观测值变异程度大小的另一个统计数 18、试验:在一定条件下对自然现象所进行的观察或试验统称为试验 19、随机事件:随机试验的每一种可能结果 20、概率:事件本身所固有的数量指标,不随人的主观意志而改变,人们称之为概率 21、正态分布:若连续性随机变量X的概率分布密度函数,则X服 从正态分布 22、标准正态分布:我们把平均数u=0,σ2 =1时,称为标准正态分布,记为N(0, 1) 23、双侧概率:我们把随机变量X在平均 数u加减不同倍数标准差σ区间 (u-kσ,u+kσ)之外,取值的概率称为双 侧概率 24、单侧概率:对应于两尾概率可以求得 随机变量x小于小于u-kσ或大于u+kσ的 概率 标准误:反映样本平均数的抽样误差的大 小的一种指标 25、假设检验(显著性检验):假设检验是 数理统计学中根据一定假设条件由样本推 断总体的一种方法。 26、t检验:两总体方差未知但相同,用 以两平均数之间差异显著性的检验。 27、无效假设:被检验的假设,通过检验可 能被否定,也可能未被否定。 28、备择假设:是在无效假设被否定时准 备接受的假设。 29、显著水平:用来确定无效假设是否被 否定的概率标准。 30、Ⅰ型错误:把非真实差异错判为真实 差异。 31、Ⅱ型错误:把真实差异错判为非真实 差异。 32、双侧检验(双尾检验):利用两侧尾部 的概率进行的检验。 33、单侧检验(单尾检验):利用一侧尾部 的概率进行的检验。 34、分位数:又称百分位点。若概率 0
Za)=α的 实数 35、配对设计:是指先根据配对的要求将 试验单位两两配对,然后将配对成子的两 个实验单位随机分配到两个处理组中。 36、区间估计:是指在一定概率保证下指 出总体参数的可能范围。 置信区间:是指在进行区间估计时所给出 的可能范围。 37、置信度(置信概率):是指在进行区间 估计时所给出的概率保证。 38、方差分析:实质上是关于观测值变异 原因的数量分析。 39、试验指标:用来衡量试验结果的好坏 或处理效应的高低,在试验中具有测定的 性状或观测的项目。 40、试验因素:实验中所研究的影响试验 指标的因素。 41、因素水平:试验因素所处的某种特定 状态或数量等级。 42、试验处理:率先设计好的实施在试验 单位上的具体项目。 43、试验单位:在试验中能够接受不同试 验处理的独立的试验载体。 44、多重比较:统计学上指多个平均数两两 之间的相互比较称为多重比较。 45、主效应:由于因素水平的改变而引起 试验指标观测值平均数的改变量称为主效 应。 46、简单效应:在某因素同一水平上,另 一因素不同水平试验指标观测值之差称为 简单效应。 47、适合性检验:判断实际观察的属性类 别分配是否符合已知属性类别分配理论或 学说的假设检验。 48、独立性检验:根据次数资料判断两类 因子彼此相关或相互独立的假设检验。 49、相关变量:存在相关关系的变量叫做 相关变量。 50、回归分析:是确定两种或两种以上变 数间相互依赖的定量关系的一种统计分析 方法。 51、相关分析:研究随机变量之间相关性 的统计分析方法。 52、直线回归分析:如果在回归分析中, 只包括一个自变量和一个因变量,且二者 的关系可用一条直线近似表示,这种回归 分析称为直线回归分析 53、直线相关分析:对两个相关变量间的 直线关系进行相关分析称为直线相关分析 54、相关系数:统计学上把决定系数r2 的平方根称为x与y的相关系数 55、试验设计:以概率论和数理统计为理 论基础,经济地,科学地安排试验的一项 技术。 56、随机:使用随机方法对试验动物分组, 使参试动物分入各试验处理组的机会相 等,以避免试验动物分组事试验人员主观 倾向的影响 57、重复:试验的每一个处理都实施在两
2006-2007第1学期生物统计考试试卷(B 卷)答案 一、名词解释(10×2) 1、参数:描述总体的特征数。 2、连续性变数:指在任意两个变量之间都有可能存在只有微量差异的第三个变量存在,这样一类变数称为连续性变数 3、唯一差异原则:除了被研究的因素具有的不同水平外,其余各种环境因素均应保持在某一特定的水平上。 4、两尾测验:有两个否定区,分别位于分布的两尾。 5、显著水平:否定无效假设0H 的概率标准。 6、互斥事件:如果事件1A 和2A 不能同时发生,即12A A 为不可能事件,则称事件1A 和2A 互斥。 7、无偏估计:在统计上,如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的无偏估值。 8、相关系数:表示两组变数相关密切程度及性质的变数,r *9、否定区:否定无效假设0H 的区间。 *10、偏回归系数:任一自变数(在其他自变数皆保持一定数量水平时)对依变数的效应。 二、是非题(5×1) 1、二项分布的平均数为np ( √ ) 2、在二因素完全随机化设计试验结果的方差分析中,误差项自由度为(1)(1)n ab --。( × )
3、2χ分布是随自由度变化的一簇间断性曲线,可用于次数资料的假设测验。( × ) 4、一个显著的相关系数或回归系数说明X 和Y 变数的关系必为线性关系。( × ) 5、在一组变量中,出现频率最多的观察值,称为中位数。( × ) 三、选择题(10×2) 1、算术平均数的重要特征之一是离均差的总和( C ) A 、最小 B 、最大 C 、等于零 D 、接近零 2、一批种子的发芽率为0.75p =,每穴播5粒,出苗数为4时的概率( A ) A 、0.3955 B 、0.0146 C 、0.3087 D 、0.1681 3、回归截距a 的标准误等于( D ) A 、X SS n Q )2(- B 、 X X Y SS x X n S 2 )(1-+ C 、X X Y SS x X n S 2 )(11-++ D 、 X X Y SS x n S 2 1+ 4、Y~N(10, 80),当以1210n n ==进行抽样时,128y y ->的概率约为[ B ]。 A. 0.10 B. 0.05 C. 0.025 D. 0.01 5、成对比较的特点不包括( D ) A 、加强了试验控制 B 、可减小误差 C 、不必考虑总体方差是否相等 D 、误差自由度大 6、方差分析基本假定中除可加性、正态性外,尚有[ C ]假定。 A 、无偏性 B 、无互作 C 、同质性 D 、重演性 7、若否定 H ,则( ) A 、必犯α错误 B 、必犯β错误 C 、犯α错误或不犯错误 D 、犯β错误或不犯错误 8、随机抽取200粒棉花种子做发芽试验,得发芽种子为150粒,其与00.8p =的差异显著性为( A )。 A 、不显著 B 、显著 C 、极显著 D 、不能确定 9、当30n ≤时,测验一个样本方差2 s 和某一指定值C 是否有显著差异的方法用( B ) A 、F 测验 B 、2 χ测验 C 、t 测验 D 、u 测验 *10、多元线性回归方程的假设测验可用( A )。 A 、F 测验 B 、F 或t 测验 C 、t 测验 D 、u 测验
《生物统计附试验设计》复习题 (考试共有五种题型:其中名称解释5道共10分,单选10道共10分,判断题10道共10分,计算题4道共60分,问答题2道共10分) 一、名词解释题 1.总体: 4.准确性: 7.系统误差: 8.样本: 11.随机样本: 12.样本容量: 13.假想总体:, 15.数量性状资料: 17.全距: 18.简单表: 20.众数: 21.样本标准差: 22.几何平均数: 23.算术平均数: 24.调和平均数: 26.离均差: 28.变异系数: 29.统计推断: 30.小概率事件实际不可能性原理: 31.显著水平: 32.I型错误: 34.非配对设计: 35.配对设计:, 37.试验处理: 38.试验指标: 39.重复: 40.试验单位:
41.因素水平: 42.多重比较。 44.独立性卡方检验: 46.相关分析: 47.回归分析: 51.相关系数: 52.试验设计(狭义): 53.试验方案: 56.局部控制: 57.完全随机设计: 59.多因素试验: 试验中只进行一种因素的测定 62.完全随机抽样: 二、单项选择题 1、单因素方差分析的数学模型是()。 ①x ij =μ+αi+εij ②x ij =μ+αi③x i =μ+αi+βj +εij ④x ij =αi +εij 2、.在单因素方差分析中一定有() ①SST=SSt+SSe②SSt〉SSe③SSt=SSe④SSt<SSe 3、一元线性回归的假设检验()。 ①只能用t检验②只能用F检验③两者均可④两者均不可 4、在单因素方差分析中一定有() ①dfT=dft+dfe②dfT≠dft+dfe ③dfT=dft ④dft=dfe 5、简单相关系数的取值范围是() ①-1
填空题 1.数据资料按其性质不同各分为资料和资料两种。 2.有共同性质的个体所组成的集团称为。从总体中抽取部分个体进行观测,用以估计总 体的一般特性,这部分被观测的个体总称为。 3.由总体中包含的全部个体求得的能够反映总体性质的特征数称为;由样本的全部观察 值求得的用以估计总体参数的特征数叫。 4..试验误差可以分为误差和误差两种类型。 5.从总体中抽取的样本要具有代表性,必须是抽取的样本。 6.样本根据样本容量的多少可以分为和。 8.小麦品种A穗长的平均数和标准差值为12cm和3cm,品种B为18cm和3.5cm,根据__________,判断品种______的 该性状变异大。 9.某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取抽取50绳测其毛重,结果如下所示: 平均数X(kg)极差R(kg)标准差S(kg)变异系数CV% 贻贝单养42.70307.0816.58贻贝与海带混养52.1030 6.3412.16根据和,判断的效果好。 10.在统计学中,常见平均数主要有和。 11. 12. 13. 14. 15. 16. 17. 简答题 1.如何控制、降低随机误差,避免系统误差? 2.什么是准确性,精确性?如何提高试验的正确性? 3.统计表与统计图有何用途?常用统计图、统计表有哪些? 4.生物统计学中常用的平均数有几种?各在什么情况下应用? 5.为什么变异系数要与平均数、标准差配合使用? 多选题 1.下列总体中属于有限总体的是()。 A 保定地区棉田中棉铃虫的头数 B 20m2的试验小区中鲁玉4号玉米的株高 C 66.7万公顷鲁玉4号玉米的株高 D 320株水稻中糯稻的株数 2.下列数据资料中属于连续型变数资料。
*医学统计工作的基本步骤 1设计主要指统计设计,是影响研究能否成功的最关键环节,是提高观察或实验质量的重要保证。内容包括对资料搜集,整顿和分析全过程的设想与安排。实验设计的三大原则:随机化,重复,对照。 2搜集资料:目的指应采取措施使能取得准确可靠的原始数据。来源:统计报表,工作记录,专题调查或实验研究,统计年鉴和统计数据专辑。要求:随机性和样本含量足够大 3整顿资料:将原始数据净化,系统化和条理化,为下一步计算和分析打好基础过程。 4分析资料:在表达数据特征的基础上,阐明事物的内在联系和规律性,包括两方面:统计描叙和统计推断 17均数的可信区间与参考值范围的区别?均数的可信区间与参考值范围的区别主要体现在含义,计算公式和用途三个方面的不同。(1)意义:均数的可信区间是按预先给定的概率,确定的未知参数的可能范围。实际上一次抽样算得的可信区间要么包含了总体均数,要么不包含。但可以说:该区间可多大(如当a=0.05时为95%)的可能包含了总体均数。而参考值范围是指‘正常人’的解剖,生理生化某项指标的波动范围。均数的可信区间计算公式(1)σ未知:X±指均数可信区间的用途:估计总体均数,参考值范围是指判断观察对象的某项指标是否正常。 7.假设检验与区间估计的关系:置信区间具有假设检验的主要功能;置信区间在回答差别有无统计学意义的同时,还可以提示差别是否具有实际意义;假设检验可以报告确切的P值,还可以对检验的功效做出估计。 1.标准差与标准误的区别:标准差是衡量观察值的离散趋势,描述正态分布资料的频数。标准误是样本均数的变异程度,表示抽样误差的大小,用于总体均数区间估计。两者联系:两者都是变异指标。在样本含量一定时,S越大标准误也越大,即在抽取相同例数的前提下,标准差越大,抽到的样本均数的抽样误差也越大。 2.P值和α:P值时从样本求得H0条件下随机抽样得到目前的统计量以及更极端统计量的概率,反映样本信息是否支持H0,也反映做出拒绝或不拒绝H0决定的理由充分程度。α时人为确定的小概率,容许犯第二类错误的概率,用作门槛,称检验水平。在假设检验中,通常时将P与α对比来得到结论,。 3.标准正态分布与t分布有何不同:t分布为抽样分布,标准正态分布为理论分布。t分布比标准正态分布的峰值低,且尾部瞧得更高。随着自由度的增大,t分布逐渐趋于标准正态分布。当自由度趋于无穷大时,t分布趋近于标准正态分布。 4.假设检验中,当P<0.05时,拒绝H0的理论依据。P值是指从H0规定的总体随机抽得等于及大于现有样本获得的检验统计量值的概率。当P<0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于通常确定的小怪绿时间标准的0.05。因小概率事件在一次试验中几乎不可能发生,现的确发生了,说明现在样本信息不支持H0,所以怀疑原假设H0不成立,拒绝H0。 5.t检验应用的条件:对单样本t检验要求资料服从正态分布;配对t检验要求差值服从正态分布;对两样本t检验则要求数据均服从正太分布,且两样本对应的两总体方差相等。 6.I型错误和Ⅱ型错误得区别与联系:I型错误是指拒绝了实际成立的H0所犯的弃真的错误,其概率大小用α表示,Ⅱ型错误是指接受了实际上不成立的H0所犯的取伪错误,其概率用β表示。当样本含量N确定时,α越小β越大,反之,α越大β越小。了解这两类错误的实际意义在于,若在应用中要重点减少α,则取α=0.05;若要在应用中要重点减少β,则取α=0.10或-。20甚至更高。 7.假设检验和区间估计有何联系:假设检验用于推断质的不同即判断两个或多个总体参数是否不等,而可信区间用于说明量的大小即推断总体参数的范围。两者有联系也有区别,假设检验与区间估计的联系在于可信区间也可以回答假设检验的问题,若算得的可信区间若包含了H0,则按α水准,不拒绝H0,若不包含H0,则按照α水准,拒绝H0,接受H1。也就是说在判断两个总体参数不等时,假设检验和可信区间时完全等价的。 1.方差分析的基本思想和应用条件是什么。方差分析的基本思想时根据试验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的编译可由某个因素的作用加以解释。通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论各种研究因素对试验结果有无影响。应用条件:各样本是互相独立的随机样本,均服从正态分布;相互比较的各样本的具有方差齐性。
医学统计学重点 第一章绪论 1.基本概念: 总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。 样本:从总体中随机抽取部分个体的某个变量值的集合。 总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。 统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。 抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。 频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。 概率:频率所稳定的常数称为概率。 统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。 统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。 2.样本特点:足够的样本含量、可靠性、代表性。 3.资料类型: (1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的数值,有度量衡单位。 (2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料) ①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由 各分组标志及其频数构成。包括二分类资料和多分类资料。 二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。 多分类:将观察对象按多种互斥的属性分类 ②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单 位的个数所得的资料。 4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。
第1章实验设计与统计分析基础授课时间 2学时 本章学习目的与要求 (1)明确食品试验研究的目的意义; (2)深刻理解试验设计有关基本概念; (3)掌握试验设计的基本原则和要求; (4)了解试验设计的常用方法;
第一节试验设计的目的意义 食品研究离不开实验,要想把实验做好仅靠专业知识是不够的,还需要能够事先把实验设计好,并且把实验数据分析好。 一、实验设计的意义 在食品生产和科学研究中,为了革新生产工艺,开发新产品,寻求优质、高产、低消耗的方法等,经常要进行各种试验研究。试验研究包括试验设计、试验的实施、收集资料、整理资料和分析资料等步骤。而试验设计是影响研究成功与否最关键的一环,是提高试验质量的重要保证。因此,如何安排试验,如何对试验结果进行科学的分析,既是食品生产、科研工作者经常遇到的现实问题,又是其必须具备的基本功。 实验设计(design of experiments, DOE),也称为试验设计,就是对实验进行科学合理的安排,以达到最好的实验效果。 实验设计是在实验开始之前,根据某项研究的目的和要求,制定是实验研究进程计划和具体的实验实施方案。其主要内容是研究如何合理地安排实验、取得数据,然后进行综合的科学分析,从而达到尽快获得最优方案的目的。 如果试验安排得合理,就能用较少的试验次数,在较短的时间内达到预期的试验目的;反之,实验次数既多,其结果还往往不能令人满意。试验次数过多,不仅浪费大量的人力和物力,有时还会由于时间拖得过长,使试验条件发生变化而导致实验失败。因此,如何合理地安排试验方案是值得研究的一个重要课题。试验设计的目的在于能用比较经济的人力、物力和时间,得到较为可靠的结果,准确地控制误差和估计误差的大小,还可使多种试验因素包括在很少的试验之中,达到高效的目的 实验的设计和实验结果的统计分析是密切相关的,只有按照科学的统计设计方法得到的实验数据才能进行科学的统计分析,得到客观有效地分析结论。反之,一大堆不符合统计学原理的数据可能是毫无作用的。因此对实验工作者而言,关键是对用科学的方法设计好实验,获得符合统计学原理的科学有效的数据。 试验设计应注意的问题: (1)试验目的是否明确:没有明确的目的,就谈不上科学周密的设计。未经设计的实验是无用的实验。对课题缺乏深刻的认识,就难以明确试验的目的。
总体:根据研究目的确定的研究对象的全体 个体:总体中的一个研究单位 样本:实际研究中的一类假象总体 样本含量:样本中所包含的个体数目称为样本含量或大小 随机样本:一类从总体中随机抽得到的具有代表性的样本 统计量:由样本计算的特征数 参数:由总体计算的特征数 精确性:指在试验或调查中某一试验指标或性状的重复观察值彼此接近的程度 系统误差:系统误差又叫做片面误差。它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差。 偶然误差:一类由于偶然的或不确定的因素所造成的每一次测量值的无规则变化(涨落),叫做偶然误差,或随机误差。 连续性变数资料:指用量测方式获得的数量性状资料 离散型变数资料:指用计数方式获得的数量性状资料 算术平均数:指资料中的各观测值的总和除以观测值个数所得的商,简称平均数或均数 平均数:资料或代表数,主要包括算术平均数,中位数,众数,几何平均数及调和平均数 标准差:是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。 方差:度量总体(或样本)各变量间变异程度的参数(总体)或统计量(样本)。
离均差平方和:样本各观测值变异程度大小的另一个统计数 试验:在一定条件下对自然现象所进行的观察或试验统称为试验 随机事件:随机试验的每一种可能结果 概率:事件本身所固有的数量指标,不随人的主观意志而改变,人们称之为概率小概率原理:小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能原理 正态分布:若连续性随机变量X的概率分布密度函数,则X服从正态分布 标准正态分布:我们把平均数u=0,σ2 =1时,称为标准正态分布,记为N(0,1) 双侧概率:我们把随机变量X在平均数u加减不同倍数标准差σ区间(u-kσ,u+k σ)之外,取值的概率称为双侧概率 单侧概率:对应于两尾概率可以求得随机变量x小于小于u-kσ或大于u+kσ的概率 二项分布:设随机变量x所有可能取得的值为0或正整数,且有P(ξ=K)=Cn(k)P(k)q(n-k),k=0,1,2….n,则称随机变量x服从n和p的二项分布标准误:反映样本平均数的抽样误差的大小的一种指标 t分布:由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换t=,统计量t 值的分布称为t分布。 假设检验(显著性检验):假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。
试验设计与统计分析课程实习论文 题目:不同栽培模式及施氮量对土壤水分含量、土壤硝态氮和铵态氮含量的影响
不同栽培模式及施氮量对土壤水分含量、土壤硝态氮和铵态氮含 量的影响 摘要:【目的】随着农业生产的发展,通过合理施肥提高肥料利用率已被认为是可持续农业发展的一条重要途径,推广小麦配方施肥,特别是研究氮、磷肥料对小麦的生长和产量的影响,已刻不容缓,高产品种必须有与之相适应的施肥方案,才能发挥其应有的价值。【实验设计】通过研究对比不同种植模和施氮量下耕层土壤矿化氮的含量及冬小麦的产量,找出最佳栽培模式和合理的施氮量,从而达到增产的目的.田间试验采取裂区设计,试验设栽培模式和施氮量2种因子。栽培模式设露地栽培(常规)、麦草覆盖(覆草)、垄上覆膜(覆膜)、垄上覆膜沟内覆草(垄沟)、冬季补灌(补灌)五种方式;施氮设不施氮、施120 kg/hm2N和240 kg/hm2N三个水平。【结果】试验结果表明,五种不同栽培模式中麦草覆盖、陇上覆膜和陇上覆膜沟内覆草能显著增加耕层土壤(0-20cm)的储水量;在水分充足的情况下不同栽培模式对耕层土壤(0-20cm)矿化氮含量及冬小麦产量没有显著影响;不同的施氮量对耕层土壤水分含量没有显著影响,但对小麦产量、生物量和耕层土壤矿化氮含量影响极为显著,施氮量为120kg/hm2N和240kg/hm2N处理的生物量比不施氮均能增加50%以上,但两者生物量之间差异很小;施氮量为120kg/hm2N和240kg/hm2N处比不施氮小麦产量均增加23%以上,土壤矿化氮含量均增加55%以上,但两者生物量之间差异很小。 关键词:不同的栽培模式;不同施氮量;水分含量;小麦产量;硝态氮氮含量;铵态氮含量 前言:不同氮、磷营养对小麦生长发育、养分吸收、产量及其构成和品质有明显的影响。适宜的氮、磷配比及用量可提高小麦干重、有效穗数、穗长、穗粒数、百粒重,提高小麦植株对氮、磷养分的吸收。氮是小麦营养中最为重要的元素之一,它影响小麦的生长发育和产量形成。由于土壤中有效氮素含量低,而小麦的需氮量有很多,施氮肥具有明显的增产作用。小麦吸收磷主要在拔节孕穗期,但早期的磷营养对于植株,尤其对根系极为重要。据Black的试验[1],磷肥可以显著增加分蘖与次生根数;在磷肥充足的条件下,氮肥促进分蘖与次生根数的作用
总体:根据研究目的确定的研究对象的全体个体:总体中的一个研究单位 样本:实际研究中的一类假象总体样本含量:样本中所包含的个体数目称为样本含量或大小 随机样本:一类从总体中随机抽得到的具有代表性的样本统计量:由样本计算的特征数 参数:由总体计算的特征数精确性:指在试验或调查中某一试验指标或性状的重复观察值彼此接近的程度 系统误差:系统误差又叫做片面误差。它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差。 偶然误差:一类由于偶然的或不确定的因素所造成的每一次测量值的无规则变化(涨落),叫做偶然误差,或随机误差。连续性变数资料:指用量测方式获得的数量性状资料 离散型变数资料:指用计数方式获得的数量性状资料 算术平均数:指资料中的各观测值的总和除以观测值个数所得的商,简称平均数或均数 平均数:资料或代表数,主要包括算术平均数,中位数,众数,几何平均数及调和平均数 标准差:是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。 方差:度量总体(或样本)各变量间变异程度的参数(总体)或统计量(样本)。 离均差平方和:样本各观测值变异程度大小的另一个统计数 试验:在一定条件下对自然现象所进行的观察或试验统称为试验 随机事件:随机试验的每一种可能结果 概率:事件本身所固有的数量指标,不随人的主观意志而改变,人们称之为概率 小概率原理:小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能原理 正态分布:若连续性随机变量X的概率分布密度函数,则X服从正态分布 标准正态分布:我们把平均数u=0,σ2 =1时,称为标准正态分布,记为N(0,1) 双侧概率:我们把随机变量X在平均数u加减不同倍数标准差σ区间(u-kσ,u+kσ)之外,取值的概率称为双侧概率 单侧概率:对应于两尾概率可以求得随机变量x小于小于u-kσ或大于u+kσ的概率 二项分布:设随机变量x所有可能取得的值为0或正整数,且有P(ξ=K)=Cn(k)P(k)q(n-k),k=0,1,2….n,则称随机变量x服从n和p的二项分布 标准误:反映样本平均数的抽样误差的大小的一种指标 t分布:由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换t=,统计量t 值的分布称为t 分布。 假设检验(显著性检验):假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。 t检验:两总体方差未知但相同,用以两平均数之间差异显著性的检验。 无效假设:被检验的假设,通过检验可能被否定,也可能未被否定。 备择假设:是在无效假设被否定时准备接受的假设。显著水平:用来确定无效假设是否被否定的概率标准。 Ⅰ型错误:把非真实差异错判为真实差异。Ⅱ型错误:把真实差异错判为非真实差异。 双侧检验(双尾检验):利用两侧尾部的概率进行的检验。 单侧检验(单尾检验):利用一侧尾部的概率进行的检验。 分位数:又称百分位点。若概率0
Za)=α的实数 配对设计:是指先根据配对的要求将试验单位两两配对,然后将配对成子的两个实验单位随机分配到两个处理组中。 区间估计:是指在一定概率保证下指出总体参数的可能范围。 置信区间:是指在进行区间估计时所给出的可能范围。 置信度(置信概率):是指在进行区间估计时所给出的概率保证。 方差分析:实质上是关于观测值变异原因的数量分析。 试验指标:用来衡量试验结果的好坏或处理效应的高低,在试验中具有测定的性状或观测的项目。 试验因素:实验中所研究的影响试验指标的因素。因素水平:试验因素所处的某种特定状态或数量等级。 试验处理:率先设计好的实施在试验单位上的具体项目。试验单位:在试验中能够接受不同试验处理的独立的试验载体。多重比较:统计学上指多
实验设计 名词解释 总体:具有共同性质的个体所组成的集合体 样本:从总体中抽出一部分个体进行研究,这部分个体的总合称为样本或抽样总体 极差:资料中最大观察值与最小观察值的差值称为极差 方差:离均差平方的平均数称为方差 标准差:方差的正平方根称为标准差 变异系数:该样本的标准差对均数的百分数 频率:在大量重复试验中某一事件已发生的次数占试验总次数的比率称为频率 概率:描述随机事件出现的可能性大小的一个概念 频数:总体或样本中某观察值或某区间的观察值所出现的次数 频数分布:总体或样本中不同观察值或不同区间的观察值出现的次数组成的分布 抽样分布:研究从总体中独立抽取随机样本的统计数的概率分布 置信限:区间的上下限 置信概率(置信系数):保证合理误差范围的概率 因素:对某些事物的存在状况能够产生影响的其他事物 试验因素:人为控制该影响因素的变化状态,使其影响程度可以得到准确的测量或判断 不同水平:一个试验因素不同质或不同量的存在状态,叫试验因素的不同水平 试验处理:人为地使试验因素处于不同水平或试验因素不同水平的组合,称为试验处理 试验方案:同一试验所处理的总和称为试验方案 试验效应:指因素的相对独立作用,也就是因素对性状所引起的增加或减少作用 简单效应:在一种情况下因素的相对独立作用 主效应:同一试验中同一因素的简单效应平均值称为主效应 重复:同一处理在试验中出现的次数(重复具有降低试验误差,扩大试验的代表性;估计试验误差大小,判断试验可靠程度) 个体试验:同一内容的试验只在一两个不同的地点设置 群体试验:同一内容试验在有许多代表性的地点统一布置、统一方法、同时进行,这样的试验叫做群体试验 参数:能说明不同总体集中性和变异性特征的数值称总体特征数 匀地播种:在即将进行试验的土地上连续几茬播种密生植物以便均衡土壤肥力差异的方法。相关系数:对于坐标散点,显线性相关的两个变量,如果不需要由x预测y,只需要了解x 与y是否确定有相关系数,相关关系的密切程度如何,以及相关性质,则只需计算出一个新的统计量 简答题 1、正态分布的特点 答:正态分布是一种常见也是最重要的连续性随机变量的理论分布。其特点①以算术平均数u为轴点,左右对称②在x=u处,值最大,其算术平均数、中位数、众数相等,合并为一③正态分布的多数次数集中于算术平均数u附近,离平均数越远,其相应的次数越少④正态分布曲线在∣x-u∣≧ō处有拐点,曲线左右延伸⑤正态分布曲线与x轴之间的总面积等于 1. 2、试验研究一般程序 答:㈠选题确定试验研究的具体目标和任务㈡作好试验计划设计和确定完成试验任务的方法步骤(①设计试验方案②确定试验方法③制定管理措施④确定观察测定项目及其方法与