试验统计方法总结及经典考试习题
- 格式:doc
- 大小:308.00 KB
- 文档页数:14
1 变量:数据所具有的变异特征或性。
2 观察值:变量所测得的具体观测数据,或每一个体的某一性状,特征的测定数据。
3 总体:具有共同性质的个体所组成的集体。
4 个体:总体中的一个成员。
5 样本:从总体中抽出的部分个体的总和。
即总体的一部分样本容量:样本中所包含的个体数目。
6 参数:由总体的全部观察值而算得的总体特征值。
7.统计数:由样本观察值而算得的样本特征数。
8. 算数平均数:指资料中各观察值总和除以观测值个数所得的商。
9. 中位数:将资料内所有观测值从小到大依次排列,位于中间的那个观测值。
10.众数:资料中出现次数最多的那个观测值或次数最多一组的组中值。
11.无偏估计量:当一个统计量的数学期望等于所估计的总体参数时则称此统计量为该总体参数的无偏估计量12.极差:指样本观察值中最大值与最小值之差,也称变异幅度或全距。
13.变异系数:标准差与平均数的百分率称为变异系数,记为C.V。
14.试验:通常我们把根据某一研究目的,在一定条件下对自然规律现象所进行的观察或试验统称为试验。
15.小概率原理:在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理16.试验指标:为衡量试验结果的好坏或处理效应的高低,在试验中具体测定额性状或观测的项目。
17.试验因素:试验中所研究的影响试验指标的因素。
18.试验水平:试验因素所处的某种特定状态或数目等级。
19.试验处理:每一试验因素不同或多因素间的水平组合构成了实验处理。
20.L8(27):L代表正交表的符号 L右下角的数字“8”代表8行,包含8个处理(水平组合);“2”表示因素水平数,“7“表示有7列,用这张正交表最多可以安排7个2水平因素。
22.单一差异原则;除需要比较的因素外,其他因素都必须保持的相同的水平上23.β-错误:无效假设是错误的,备择假设是正确的,可是测验结果却接受了无效假设,这种错误称为第二类错误,即参数见本来有差异,可是测验结果却认为参数见无差异。
第一章复习1.解释以下概念:总体、个体、样本、样本容量、变量、参数?1.总体是具有相同性质的个体所组成的集合,是指研究对象的全体。
2.个体是组成总体的根本单元。
3.样本是从总体中抽出的假设干个个体所构成的集合。
4.样本容量是指样本个体的数目。
5.变量是相同性质的事物间表现差异性的某种特征。
6.参数是描述总体特征的数量。
7.统计数是描述样本特征的数量。
8.因素是指试验中所研究的影响试验指标的原因或原因组合。
2.统计数、因素、水平、处理、重复、效应、互作、试验误差?1.水平是指每个试验因素的不同状态(处理的某种特定状态或数量上的差异)。
2.处理是指对受试对象给予的某种外部干预(或措施)。
3.重复是指在试验中,将一个处理实施在两个或两个以上的试验单位上。
4.效应是由处理因素作用于受试对象而引起试验差异的作用。
5.互作是指两个或两个以上处理因素间的相互作用产生的效应。
6.试验误差是指试验中不可控因素所引起的观测值偏离真值的差异,可以分为随机误差和系统误差。
3.随机误差与系统误差有何区别?随机误差也称为抽样误差或偶然误差,它是由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的差异,是不可防止的。
随机误差可以通过试验设计和精心管理设法减小,但不能完全消除。
系统误差也称为片面误差,是由于试验处理以外的其他条件明显不一致所产生的带有倾向性的或定向性的偏差。
系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的,在试验过程中是可以防止的。
4.准确性与精确性有何区别?准确性也称为准确度,是指在调查或试验中某一试验指标或性状的观测值与真值接近的程度。
精确性也称为精确度,是指调查或试验中同一试验指标或性状的重复观测值彼此的接近程度的大小。
准确性是说明测定值对真值符合程度的大小,用统计数接近参数真值的程度来衡量。
精确性是反映屡次测定值的变异程度,用样本中的各个变量问的变异程度的大小来衡量。
填空1.变量按其性质可以分为〔连续〕变量和〔非连续(离散型)〕变量。
自考《田间试验与统计方法》各章考题自考《田间试验与统计方法》各章考题目錄试验基础复习资料(第一、二章) (1)资料整理及特征数(第三、四章) (7)统计基础(第五章) (10)统计推断(第六章) (12)卡平方测验(第七章) (17)方差分析(第八、十二、十三、十四、十五章) (20)相关回归(第九、十、十一章) (30)其它(第十六、十七、十八章) (36)试验基础复习资料(第一、二章)一、单项选择题(每小题1分)1.田间试验设计中运用随机原则的作用是【】A.无偏估计试验误差B.降低试验误差C.消灭试验误差D.减少土壤差异2.想了解试验地土壤肥力的差异,通常采用【】A.合理轮作 B.空白试验 C.多施有机肥 D.匀地种植3.田间试验设计中运用随机排列原则的作用是【】A.无偏误差估计 B.降低试验误差 C.消灭试验误差 D.减少土壤差异二、多项选择题(每小题2分)4.田间试验设计的原则有【】A.土壤肥力均匀B.重复C.随机排列D.局部控制E.合理规划试验区5.农业和生物试验中常用的抽样方法有【】A.顺序抽样B.随机抽样C.典型抽样D.个体抽样E.成片抽样6.田间试验的代表性是指符合将来准备推广这项试验结果地区的【 BE 】A.栽培条件 B.农业条件C.地理条件 D.机械条件E.自然条件7.田间试验设置保护区的作用有【 BD 】A.防风B.防止人畜践踏和损害 C.防沙D.防止边际效应 E.防鸟害8.试验设计中控制土壤差异的主要技术有【】A.小区形状 B.小区面积 C.随机排列D.设置保护区 E.设置对照区9.控制土壤差异的小区技术主要包括【 ABCDE 】A.小区形状 B.小区面积 C.重复次数 D.设置对照区 E.设置保护区三、填空题(每小题1分)10.样本中所包含的个体数目称为样本容量。
11.设置保护区(行),除保护试验材料不受人、畜践踏和损害外,还可防止边际效应。
12.设置对照区目的之一,就是为了便于在田间观察,比较各个处理或品种的优劣时,作为比较的标准。
实验统计方法复习试题有部分答案第二章习题二、分析和计算题1.某农村地区1999年14岁女孩的身高资料如下,请编制频数表和观察频数分布情况,计算集中和离散趋势指标,并估计参考值范围。
表某农村地区1999年14岁女孩的身高资料(c m)142.3148.8142.7144.4144.7145.1143.3154.2152.3142.7156.6 137.9143.9141.2139.3145.8142.2137.9141.2150.6142.7151.3 142.4141.5141.9147.9125.9139.9148.9154.9145.7140.8139.6 148.8147.8146.7132.7149.7154.0158.2138.2149.8151.1140.1 140.5143.4152.9147.5147.7162.6141.6143.6144.0150.6138.9 150.8147.9136.9146.5130.6142.5149.0145.4139.5148.9144.5 141.8148.1145.4134.6130.5145.2146.2146.4142.4137.1141.4 144.0129.4142.8132.1141.8143.3143.8134.7147.1140.9137.4 142.5146.6135.5146.8156.3150.0147.3142.9141.4134.7138.5 146.6134.5135.1141.9142.1138.1134.9146.7138.5139.6139.2 148.8150.3140.7143.5140.2143.6138.7138.9143.5139.9134.4 133.1145.9139.2137.4142.3160.9137.7142.9126.8解(计算机直接法计算结果,可能与加权法计算结果有所出入)m e a n=143.217s=6.42969,m e d=142.75,m o d e=142.7m a x=162.6m i n=125.9r=36.7p75=147.1p25=139.3q=7.895%的参考值范围:(130.615,155.819)2.有60人的血清抗体效价,分别为:7人1:1,11人1:20,22人1:40,12人1:80,8人1:160,求平均抗体效价。
一、选择题1、算术平均数的重要特性之一是离均差的总和( C )。
A 、最小B 、最大C 、等于零D 、接近零2、对某鱼塘不同年龄鱼的尾数进行统计分析时,可做成( )图来表示。
A 、条形图B 、直方图C 、多边形图D 、折线图3、当p <q 时,二项式分布曲线应该是( B )。
A 、左偏B 、右偏C 、对称D 、不对称4、当总体方差未知,样本容量36n =时,样本平均数的分布趋于( A )。
A 、正态分布B 、t 分布C 、F 分布D 、2χ分布5、如测验k (k ≥3)个样本方差),,2,1(2k i s i Λ=是否来源于方差相等的总体,这种测验在统计上称为( A )。
A. 方差的同质性测验B. 独立性测验C. 适合性测验D. F 测验6、列联表的2χ测验的自由度为( )。
A 、B 、C 、D 、7、在简单线性回归分析中,剩余平方和反映了( )。
A 、应变量的变异度B 、自变量的变异度C 、扣除影响后的变异度D 、扣除影响后的变异8、对于常用次数分布图,下列说法正确的是( )A 、条形图只适用于计数资料B 、坐标轴都必须加箭头以示数值增大的方向C 、多边形图主要用于表示计量资料的次数分布D 、方形图可以将多组资料绘制在同一幅图上比较9、具有一定原因引起观察值与试验处理真值之间的偏差称为( C )。
A 、试验误差B 、随机误差C 、系统误差D 、混合误差10、从N(10, 10)的正态总体中以样本容量10抽取样本,其样本平均数差数服从( C )分布。
A 、N(10, 10)B 、 N(0, 10)C 、N(0, 2)D 、N(0, 20)11、A 、B 两个事件不可能同时发生,则称为A 和B 事件是( C )。
A 、和事件B 、积事件C 、互斥事件D 、对立事件12、当样本容量增加时,样本平均数的分布趋于( A )。
r c ⨯(1)(1)r c -+-(1)(1)r c --1rc -2rc -y x x y y xA 、正态分布B 、t 分布C 、u 分布D 、F 分布13、对比法和间比法试验结果的统计分析一般采用( D )。
已知某种鱼平均体重μ=300g ,标准差为σ=9.5g ,改良后,随机抽取9条鱼,重量分别为(g ):308,305,311,298,315,300,312,294,320,问改良后鱼体重是否有变化。
解:H 0:μ=300g, H A ≠300g, α=0.01 u= =2.113u 0.05=1.96, u 0.015=2.58 u 0.05<u<u 0.01差异显著,应拒绝H 0,接受H A ,认为鱼有品种改良。
已知某玉米单交种群的平均穗重为300g ,经喷药处理过得玉米种群随机抽取9个果穗,其穗重分别为308,305,311,298,315,300,321,294,320g ,问喷药与否的果穗重差异是否显著?解:1. 无效假设:备择假设:2.运用t 分布=2.473. 查t 临界值表得:DF=9-1=84. 比较:∴拒绝H0,接受,即 ≠u ,或者说样本平均数和总体平均数之间存在显著差异,故P<0.05。
5. 结论: 喷药后的果穗重与原果穗重差异显著。
某家禽研究所对粤黄鸡进行饲养对比试验,试验时间为60天,增重结果如表,问两种饲料对粤黄鸡的增重效果有无显著差异? 表 粤黄鸡饲养试验增重/307i y y N ==∑9.5/9/307i y y N ==∑03073002.83y y t S μ--==•解:题目没有明确告之配对方式,所以是非配对资料,也就是成组数据此例 ,经计算得1、 提出无效假设与备择假设, 2、计算t 值 因为于是3、查临界值,作出统计推断 当df=14时,查 临 界 值 得 : t 0.05(14) = 2.145 ,|t | < 2.145, P > 0.05,故不能否定无效假设 , 表明 两 种饲料饲喂粤黄鸡的增重效果差异不显著,可以认为两种饲料的质量是相同的。
用家兔10只试验某批注射液对体温的影响,测定每只家兔注射前后的体温,见表。
田间试验与统计方法一、单项选择题1. 在多因素试验中,每一个()是一个处理。
A. 水平组合B. 水平C. 处理D. 组合2. 对金鱼草花色进行遗传研究,以红花亲本和白花亲本杂交,F1为粉红色,F2群体有3种表现型:红花196株,粉红花419株,白花218株。
检验F2分离比例是否符合1:2:1的理论比例的分析方法是()。
A. 方差的同质性检验B. F检验C. 独立性检验D. 适合性检验3. 是( )。
A.相关系数B.回归系数C.决定系数D.回归平方和4. 相关系数r的取值范围为()。
A. [ 0,1 ]B.( 0,1 )C. [ -1,1 ]D. ( -15. 有一两因素试验,其中A有3个水平,B有5个水平,则该试验的处理数为()。
A. 125 B. 243 C. 15 D. 306. 关于试验误差的叙述,错误的是()。
A.试验误差客观存在的 B.试验误差方差是可以估计的C.试验误差是可以通过合理的试验设计来降低的 D.试验误差是人为可以克服的。
7. 若一资料相关系数r=0.9,则说明( )。
A. x和Y的变异可以相互以线性关系说明的部分占90%B. x和Y的变异可以相互以线性关系说明的部分占81%C. x和Y的变异可以相互以线性关系说明的部分占10%D. x和Y的变异可以相互以线性关系说明的部分占=19%8. 描述一个小麦品种穗长的分布特征时,适宜采用的统计图为()。
A.方柱形图 B.多边形图 C.条形图 D.饼图9. 样本容量为10的样本方差的自由度为()。
A.8 B.9 C.10 D.1110. 下列不能反映资料变异程度的统计数是()。
A.平均数 B.方差 C.标准差 D.变异系数11. 方差分析的基本假定中除可加性、正态性外,还有()假定。
A.无偏性 B.代表性 C.同质性 D.重演性12. 资料中最大观察值与最小观察值的差数称为()。
A.标准差 B.极差 C.方差 D.相差13. 样本容量为n的样本方差的自由度为()。
(四)部落抽样
随机查表:
例1:一项「体适能和课业成绩关系」的调查,选择研究的对象是自愿参加的1000名学生,将他们依测试结果分成体适能较佳与体适能较差两组,然后查阅并统计他们的课业成绩。
试问这是观测研究还是实验?
例2:以简单随机抽样法在全班50名同学中进行抽样 (1)母体是什么? (2)利用随机号码表抽出5个样本?
【练习题】欲从编号001~500的500名学生中随机抽样出5名,若以图2随机号码表的第11、12及第13行为一组三位数,从第一
列数字开始,由上而下读取(三位数字组依序为189, 554,
332,…),试列出抽到的学生代号。
例3:欲以分层抽样调查高二同学每周的平均Array补习时数,将全校高二同学依所读类
组分作三层,各层人数如下:若依序
从各层中抽出4人,2人及6人,并计
算各层样本的平均数分别为2, 3.5及
4.5小时,求此抽样调查所得的结果。
【练习题】某地区有高中生2400人,高中生9700人、小学生11000人,为了解此区学生近视状况,欲从中依比例抽取1%的学生进行调查,高中、初中与小学生应各抽几人?。
统计考纲要求1.理解总体、个体、样本等概念.2.会指出具体问题中的总体、个体、样本、样本容量.3.了解简单随机抽样、系统抽样、分层抽样等三种抽样方法.4.会根据特征选用合适的抽样方法抽取样本.5.理解用样本的频率分布估计总体.6.理解用样本均值、方差和标准差估计总体的均值、方差和标准差.知识点一:总体与样本1.定义:在统计中,所研究对象的全体叫做总体,组成总体的每个对象叫做个体.2.定义:被抽取出来的个体的集合叫做总体的样本,样本所含个体的数目叫做样本容量. 知识点二:抽样1.简单随机抽样定义:我们采用抽签的方法,将总体按照某种顺序编号,写在小纸片上.将小纸片揉成小团,放到一个不透明的袋子中,充分搅拌后,再从中逐个抽出10个小纸团.最后根据编号找到个体.这种抽样叫做简单随机抽样.注意:简单随机抽样必须保证总体的每个个体被抽到的机会是相同的.也就是说,简单随机抽样是等概率抽样.2.系统抽样定义:当总体所含的个体较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分中抽取一定数目的个体.这种抽样叫做系统抽样(或机械抽样).主要步骤:从容量为N的总体中,用系统抽样抽取容量为n的样本,按照下面的步骤进行:(1)编号:将总体的N个个体编号;(2)确定间隔:可以考虑用Nn(取整数)作间隔分段,将总体分成n段;(3)抽样:按照一定的规则抽取样本.如抽每段的第k个顺序号的个体(k为小于Nn的整数),得到容量为n的样本.3.分层抽样当总体是由有明显差异的几个部分组成时,可将总体按差异情况分成互不重叠的几个部分——层,然后按各层个体总数所占的比例来进行抽样,这种抽样叫做分层抽样. 对分层抽样的每一层进行抽样时,可采用简单随机抽样或系统抽样. 知识点三:用样本估计总体 1.用样本的频率分布估计总体频率频率的定义:各组内数据的个数,叫做该组的频数.每组的频数与全体数据的个数之比叫做该组的频率.频率分布直方图:根据频数分布表中各组的频率,得到频率分布表,由频率分布表画出频率分布直方图.用样本的频率分布估计总体的步骤为: (1)选择恰当的抽样方法得到样本数据;(2)计算数据最大值和最小值、确定组距和组数,确定分点并列出频率分布表; (3)绘制频率分布直方图;(4) 观察频率分布表与频率分布直方图,根据样本的频率分布,估计总体中某事件发生的概率.2.用样本均值、标准差估计总体 (1)平均数或均值定义:如果有n 个数1x ,2x ,…,n x ,那么121()n x x x x n=+++叫做这n 个数的平均数或均值,x 读作“x 拔”. 均值反映出这组数据的平均水平. (2)样本方差定义:如果样本由n 个数1x ,2x ,…,n x 组成,那么样本的方差为 2222121()()()1n s x x x x x x n ⎡⎤=-+-++-⎣⎦-. (3)样本标准差由于样本方差的单位是数据的单位的平方,使用起来不方便.因此,人们常使用它的算术平方根来表示个体与样本均值之间偏离程度,叫做样本标准差.即(+-n s x .题型一 总体、个体、样本、样本容量例1 某地区为了掌握7岁儿童身高状况,随机抽取200名儿童测试身高,请指出其中的总体、个体、样本与样本容量.解答:该地区所有7岁儿童的身高是总体,每一个7岁儿童的身高是个体,被抽取的200名7岁儿童的身高是样本,样本容量是200.题型二抽样例2某中职学校为了解2009级新生的身体发育情况,从1000名新生中,利用系统抽样,抽取一个容量为50的样本.请你来完成这个抽样.解答:将这1000名学生编号(也可以利用新生录取号),由于100020 50,所以取每段间隔为20,将编号分成50段,规定各段抽取第16个顺序号的学生,得到容量为50的样本.其学生号码依次为16,36,56,76, (996)题型三用样本均值、标准差估计总体例3 科研人员在研究地里的麦苗长势时,随机抽取20株,测得各株高为(单位:mm): 61675867656459625866645960635860 62606363求样本均值、样本方差、样本标准差.分析:应用公式解答:样本均值61.95,样本方差约为8.68,样本标准差约为2.95.一、选择题1.要能清楚的表示各部分在总体中所占的百分比,应选择().A 扇形统计图B 折线统计图C条形统计图 D 表框统计2.某社区有400个家庭,其中高等收入家庭120户,中等收入家庭180户,低收入家庭100户,为了调查社会购买力的某项指标,要从中抽取一个容量为100的样本记作①;某校高一年级有12名女排球运动员,要从中选出3人调查学习情况记作②.那么,完成上述2项调查应采用的抽样方法是( ).A. ①用随机抽样法,②用系统抽样法B.①用分层抽样法,②用随机抽样法C.①用系统抽样法,②用分层抽样法D.①用分层抽样法,②用系统抽样法3. 以下物征数中能反映一组数据波动大小的是().A极差B平均数C方差D以上都不是4.某同学参加跳远比赛前,若教练想对他10次的训练成绩进行了分析以判断他的成绩是否稳定,则教练需要知道该同学这10次成绩的( ).A平均数 B.方差 C.频数 D.频率5.数据5,7,7,8,10,11的平均值是( ).A.2B. 4C.8D. 16.一组数据:5,7,7,a,10,11,它们的平均值是8,则a的值是( ).A2 B.4 C.8 D.17.扇形统计图中,占圆面积40%的扇形的圆心角的度数是(B )A 162°B 144°C 150°D 120°8.用随机数表法从100名学生(男生25人)中抽选20人进行问卷调查,某男生被抽到的概率是( C ).A.1100B.125C.15D.149. 为了了解1200名学生对课改试验的意见,计划从中抽取一个容量为30的样本,若采用系统抽样的方法,则分段间隔为( ).A.40B.30C.20D.1210. 数据-1,-2,0,1,2的标准差是()A 1B 2 C、0 D二、判断题1.数据1,2,3,2 的众数是2, ( )2.为了了解某校学生早餐就餐情况,四位同学做了不同的调查:小华向初一年级的三个班级的全体同学做了调查;小明向初二年级的三个班级的全体同学做了调查;小华向初三年级的全体同学做了调查;小珍分别向初一(1)班、初二(1)、初三(1)班的全体同学做了调查,则小华同学的抽样调查较科学.()3.要了解一批灯泡的使用寿命,从中抽取60只灯泡进行试验,在这个问题中,样本是抽取的60只灯泡.()4.为了考查某地区初中毕业生的数学毕业会考情况,从中抽查了200名考生的数学成绩,在这个问题中总体是被抽查的200名考生.()5.某校一个年级有12个班,每个班有50名学生,每班的学号都是1~50,为了了解学生的课外兴趣爱好,要求对每班学号为20的学生进行问卷调查,那么这里采用的抽样方法是抽签法.()6.某职业学校高一年级有机电、财经、医护这三个专业,其学生人数之比是5∶3∶2,若用分层抽样的方法抽取容量为100的样本,则应从医护专业中抽取20个个体.()7. 为了知道一锅汤的味道,妈妈从锅里舀了一勺汤尝尝,这种调查方式是抽样调查.()8.若数据1,2,5,3,4的平均数为3.()9.青年歌手大奖赛共有10名选手参赛,并请了7名评委,下表是7名评委给参加最后决赛的两位选手甲评定的成绩,去掉一个最高分和一个最低分后,甲、乙选手剩余数据的平均成绩分别为84.()10. 有四位同学从编号为1-50的总体中抽取8个个体组成一个样本,他们选取的样本中个体编别为:①05,10,15,20,25,30,35,40;②43,44,45,46,47,48,49,50;③1,3,5,7,9,11,13,15,17;④43,25,2,17,35,9,24,19.认为样本④较具有随机性.()三、填空题1.从某工厂生产的某一批零件中,随机抽取10件,测得长度为(单位:cm):79、81、80、78、79、81、79、82、79、78,则总体是_______,个体是_______,样本是_______,样本容量是_______.2.0,-1,1,-2,1 的中位数是为________.3.数据2,4,6,8 的平均数是是________.4.小新家今年6月份头6天用米量如下表:请你运用统计知识,估计小新家6月份(30天)用米量为________千克。
《试验统计方法》课程习题集一、单选题1.∑(X-Y)=0, 则()A Y为任意数B Y为正数C Y=0D Y=⎺X2.用加权法计算平均数⎺X,其中的权是()。
A 组中值B 样本容量C 组次数D 平均数3. X落在正态分布(-∞,μ-2σ)内的概率为 ( )。
A 0.95B 0.9545C 0.02275D 0.0254.小样本要用t测验是因为 ( )。
A t分布不涉及参数B 小样本的标准离差服从t分布C t值使用了样本容量D 小样本趋于t分布5.己知变量X和Y之间存在相关关系,则X和Y的相关系数可能是( )A 0.05B -0.86C 1.04D 1.816.进行统计假设测验时,否定H0的依据是()。
A 经验判断B 抽样分布C 小概率原理D 统计数间的差异7.方差分析是一种( )的方法。
A 分解平方和B F测验C 多样本平均数测验D 假设测验8.实施品比试验时,同一重复()完成。
A 可以分期B 必须同时C 一天内 D不超出两天9.与两尾测验相比,一尾测验()。
A 犯α错误概率增大B 犯β错误概率增大C α、β错误增大D α、β错误不变10.r=0.5,表明x和y的变异可以相互以线性关系说明的部分占了( )。
A 50%B 25%C 75%D 45%11.田间试验设计中采用局部控制可以()。
A 降低误差B 估计误差C 便于试验操作D 消除误差12.组内又分亚组的单向分组资料的方差分析()。
A 处理效应可再分解B 误差效应可再分解C 平均数可再分解D 组内可再分解13. P (∣X-μ∣≥1σ)=( )。
A 0.6826B 0.9545C 0.3174D 0.997314.随机区组试验中,区组项平方和的大小反映了()。
A 土壤差异情况B 处理差异情况C 样本差异情况D 总体差异情况15.样本标准差S是( )。
A 相对变异量B 绝对变异量C 平均变异量D 总变异量16.二项分布的平均数μ=( )。
A pB 1-pC npD pq17.多重比较时犯α错误的概率依次为( )。
试验统计方法复习题一、名词(术语、符号)解释:1、总体:具有相同性质的个体所组成的集团特区为总体。
2、样本:从总体中抽出的一部分个体。
3、试验指标:用于衡量试验效果的指示性状称为试验指标。
4、试验因素:是人为控制并有待比较的一组处理因素,简称因素或因子。
5、试验水平:是在试验因素内所设定的量的不同级别或质的不同状态称为试验水平,简称水平。
5、处理:单因素试验是指水平,多因素试验是水平与水平的组合。
6、简单效应:一个因素的水平相同,另一个因素不同水平间的性状(产量)差异属于简单效应。
7、参数:由总体的全部观察值而算得的特征数称为参数。
8、统计数:由样本观察值计算的特征数。
9、统计假设:是根据试验目的对试验总体提出两种彼此对立的假设称为统计假设。
10、无效假设:是指处理效应与假设值之间没有真实差异的假设称为无效假设。
11、准确度:是指试验中某一性状的观察值与其相应理论真值的接近程度。
12、精确度:是指试验中同一性状的重复观察值彼此之间的接近程度。
13、复置抽样:指将抽出的个体放回到原总体后再继续抽样的方法叫复置抽样或有放回抽样。
14、无偏估计:一个样本统计数等于所估计的总体参数,则该统计数为总体相应参数的无偏估计值。
15、第一类错误:否定一个正确H0 时所犯的错误。
16、第二类错误:接受一个不真实假设时所犯的错误。
17、互斥事件:事件A与B不可能同时发生,即AB为不可能事件,则称事件A与B为互斥事件。
18、随机事件:在一定条件下,可能发生也可能不发生,可能这样发生,也可能那样发生的事件。
19、标准差:方差的正根值称为标准差。
20、处理效应:是指因素的相对独立作用,亦是因素对性状所起的增进或减少的作用称为处理效应。
21、概率分布:随机变数可能取得每一个实数值或某一范围的实数值是有一定概率的,这个概率称为随机变数的概率分布。
22、随机抽样:保证总体中的每一个体,在每一次抽样中都有同等的概率被取为样本。
23、两尾测验:有两个否定区,分别位于分布的两尾。
试验统计方法总结和经典试题试验统计方法复习总结统计学研究事物的数量特征及其数量规律的一门方法论学科** 1.何为实验因素,实验水平,实验处理何谓简单效应、主要效应和交互作用效应举例说明。
试验因素简称因素或因子factor被变动并设有待比较的一组处理的因子或试验研究的对象研究对象的效应。
水平level试验因素内不同的级别或状态。
试验处理treatment单因素试验中的每一个水平即为一个处理;多因素试验中是不同因素的水平结合在一起形成的处理组合,也简称为处理。
简单效应simple effect 在同一因素内两种水平间试验指标的差异。
主效main effect一个因素内各简单效应的平均数。
交互作用效应interaction effect,简称互作因素内简单效应间差异的平均。
互作的实质反映了一个因素的不同水平在另一个因素的不同水平上反应不一致的现象. 2.什么是实验方案,如何制定一个正确的实验方案试举例说明试验方案根据试验目的和要求所拟定的用来进行比较的一组试验处理的总称。
1.目的明确。
2. 选择适当的因素及其水平。
3. 设置对照水平或处理,简称对照check,符号CK。
4. 应用唯一差异原则。
3.什么是实验误差实验误差与实验的准确度,精确度以及实验处理间的可靠性有什么关系试验误差的概念试验结果与处理真值之间的差异试验误差的分类 1.系统误差systematic error 由于固定原因造成的试验结果与处理真值之间的差异. 系统误差影响了数据的准确性,准确性是指观测值与其理论真值间的符合程度; 2.随机误差random error 由于随机因素或偶然因素造成的试验结果与处理真值之间的差异. 随机误差影响了数据的精确性,精确性是指观测值间的符合程度。
4实验误差有哪些来源如何控制来源1试验材料固有的差异2试验时农事操作和管理技术的不一致所引起的差异3进行试验时外界条件的差异控制1选择同质一致的试验材料2 改进操作和管理技术,使之标准化 3 控制引起差异的外界主要因素选择条件均匀一致的试验环境;试验中采用适当的试验设计和科学的管理技术;应用相应的科学统计分析方法。
试验统计方法复习总结一、基本概念1.总体与样本:总体是指研究对象的全体,样本则是从总体中抽取出来的一部分个体;2.参数与统计量:参数是总体中的一些特征值,统计量是样本中的一些特征值;3.随机变量与观测值:随机变量是试验结果的数值表示,观测值是随机变量的具体取值。
二、假设检验1.假设检验的基本步骤:提出原假设和备择假设、选择检验统计量、确定显著性水平、计算p值、作出结论;2.第一类错误和第二类错误:第一类错误是拒绝了真实的原假设,第二类错误是接受了错误的原假设;3.经典假设检验和贝叶斯假设检验:经典假设检验基于频率学派的思想,贝叶斯假设检验基于概率论的思想。
三、参数估计1.点估计和区间估计:点估计是用一个数值估计参数的值,区间估计是用一个区间估计参数的值;2.置信水平和置信区间:置信水平是区间估计中包含真实参数的概率,置信区间是参数的估计区间。
四、方差分析1.单因素方差分析:研究一个自变量对因变量的影响;2.双因素方差分析:研究两个自变量对因变量的影响;3.方差分析的假设条件:各总体的分布形状相同、各总体的方差相等、各观测值是独立的。
五、相关分析1.相关系数的计算:皮尔逊相关系数、斯皮尔曼等级相关系数、判定系数;2.相关系数的解释:相关系数的绝对值越接近1,表示相关性越强;3.相关分析的假设检验:零假设为相关系数等于零。
六、回归分析1.简单线性回归与多元线性回归:简单线性回归只有一个自变量,多元线性回归有多个自变量;2.回归方程的估计和解释:通过最小二乘法估计回归方程的参数,并解释回归系数的意义;3.回归分析的假设检验:零假设为回归系数等于零。
1.方差分析和回归分析都是用于研究自变量对因变量的影响;2.方差分析是一种分类分析方法,回归分析是一种连续型变量分析方法;3.方差分析是比较均值之间的差异,回归分析是研究相关性和建立预测模型。
综上所述,试验统计方法是应用广泛的统计学方法之一,它涉及到假设检验、参数估计、方差分析、相关分析和回归分析等内容。
试验统计方法复习总结•统计学:研究事物的数量特征及其数量规律的一门方法论学科**1.何为实验因素,实验水平,实验处理?何谓简单效应、主要效应和交互作用效应?举例说明。
试验因素:简称因素或因子(factor):被变动并设有待比较的一组处理的因子或试验研究的对象(研究对象的效应)。
水平(level):试验因素内不同的级别或状态。
试验处理(treatment):单因素试验中的每一个水平即为一个处理;多因素试验中是不同因素的水平结合在一起形成的处理组合,也简称为处理。
简单效应(simple effect): 在同一因素内两种水平间试验指标的差异。
主效(main effect):一个因素内各简单效应的平均数。
交互作用效应(interaction effect),简称互作:因素内简单效应间差异的平均。
互作的实质:反映了一个因素的不同水平在另一个因素的不同水平上反应不一致的现象.2.什么是实验方案,如何制定一个正确的实验方案?试举例说明?试验方案:根据试验目的和要求所拟定的用来进行比较的一组试验处理的总称。
1.目的明确。
2. 选择适当的因素及其水平。
3. 设置对照水平或处理,简称对照(check,符号CK)。
4. 应用唯一差异原则。
3.什么是实验误差?实验误差与实验的准确度,精确度以及实验处理间的可靠性有什么关系?试验误差的概念:试验结果与处理真值之间的差异试验误差的分类:1.系统误差(systematic error) : 由于固定原因造成的试验结果与处理真值之间的差异.系统误差影响了数据的准确性,准确性是指观测值与其理论真值间的符合程度;2.随机误差(random error):由于随机因素或偶然因素造成的试验结果与处理真值之间的差异.随机误差影响了数据的精确性,精确性是指观测值间的符合程度。
4实验误差有哪些来源?如何控制?来源:(1)试验材料固有的差异(2)试验时农事操作和管理技术的不一致所引起的差异(3)进行试验时外界条件的差异控制:(1)选择同质一致的试验材料(2) 改进操作和管理技术,使之标准化(3) 控制引起差异的外界主要因素选择条件均匀一致的试验环境;试验中采用适当的试验设计和科学的管理技术;应用相应的科学统计分析方法。
**1、试验设计( experiment design)广义----是指整个试验研究课题的设计,包括确定试验处理的方案,小区技术,以及相应的资料搜集、整理和统计分析的方法等;狭义----专指小区技术,特别是抽样方法.重复区组和试验小区的排列方法。
主要通过抽样方法,重复区组和处理小区的不同排列方法,达到控制或减少试验误差的目的.处理小区----一个处理所占有的一小块试验空间或试验地.重复区组( block ) ----一个试验的全部处理小区相邻排列在一起即构成一个区组.2、田间试验设计的基本原则是什么?有何作用?试验设计的三个基本原则1.重复2.随机3.局部控制重复的作用: 估计试验误差 ;降低试验误差 。
随机的主要作用:无偏估计试验误差;研究随机事件----获得随机变量-----概率的性质------进行统计分析(统计推断)!局部控制就是分范围分地段或分空间地控制非处理因素,使之对各试验处理的影响在较小空间内达到最大程度的一致,从而有效地降低试验误差。
这是降低误差的重要手段之一**1总体,样本,参数,统计数的概念和关系?总体( population ):具有共同性质的个体所组成的集团.有限总体----由有限个个体构成的总体.无限总体----总体所包含的个体数目有无穷多个 .样本( sample ):从总体中抽取若干个个体的集合称为样本(sample)。
参数:由总体中全部个体观察值计算得总体特征值.统计数( statistic ):测定样本中的各个体而得的样本特征数,如平均数等,称为统计数关系:试验研究的目的是为了获得总体的信息或特征;试验研究的方法则是抽样研究;利用样本的结果(统计数)推断或估计总体特征 (参数).2算数平均数的意义和特性?算术平均数 一个数量资料中各个观察值的总和除以观察值个数所得的商数,称为算术平均数算术平均数的重要特性:(1)离均差之和为零(2)离均差平方的总和最小3变异数的意义、种类和计算?变异数的意义:一表示资料数据间的变异程度或离散程度或离均程度;二可以衡量平均值的代表性.变异数的种类: 一、极差 二、方差 三、标准差 四、变异系数 计算:样本标准差的公式为: 总体标准差用表示: 变异系数( coefficient of variation ) ----样本的标准差对均数的百分数: 变异系数是一个不带任何单位的平均一个单位纯数离均程度,其作用:消除了平均值大小及所带单位不同的影响,其可用以比较二个事物的变异度大小。
**1统计概率、正态离差含义?统计学上用n 较大时稳定的频率近似代表概率。
通过大量实验而估计的概率称为实验概率或统计概率,以p 表示。
正态离差:3小概率原理及其在统计假设测验中的应用?小概率原理----若事件A 发生的概率较小,如小于0.05或0.01,则认为事件A 在一次试1)(2-∑-=n y y s N y 2)(∑-=μσ%100⨯=y s CV验中不太可能发生,这称为小概率事件实际不可能性原理,简称小概率原理。
小概率事件实际不可能性原理在统计假设测验中的应用:如果事先假设了一些条件,在这些假设的条件下若计算出某一事件为一小概率事件,然而它在一次正常的试验中竟然发生了;反过来说明假设的条件不正确,从而否定该假设(接受另一个相反的假设)**1区间估计,置信区间,置信限,置信度的概念?区间估计:在一定的概率保证之下,由样本的统计数估计出总体参数可能位于的区间.置信区间( confidence interval ):在一定的概率保证之下,由样本的统计数估计出的总体参数可能位于的区间.区间的上、下限称为置信限( confidence limit )一般以L 1和L 2分别表示置信下限和上限。
置信系数或置信度:保证总体参数位于置信区间的概率以P =(1- )表示。
2什么是统计假设?统计假设有哪几种?各有何含义?假设测验时直接测验的统计假设是那一种为什么?统计假设(statistical hypothesis) :对样本所属的总体(特征值或参数)提出假设(包括无效假设和备择假设两个,在后面有说明)。
▪ 无效假设(null hypothesis):记作H0,假设样本所属总体效应或参数(平均数)与某一指定值相等或假设两个总体参数相等,即相对而言都不具有自己的独特效应.▪ 备择假设( alternative hypothesis ):记作 HA,假设样本所属总体效应或参数(平均数)与某一指定值不相等或假设两个总体参数不相等,或相对而言它们都有自己的独特效应.所以也可以称为有效假设.因为只有无效假设相当于总体已知,这样才能从已知的总体中进行抽样分布,才能进一步计算样本在无效假设中出现的概率。
3区间估计和假设测验的关系?区间估计与统计假设测验的关系为:1 如果无效假设位于置信区间内,就接受无效假设,称为差异不显著;2 如果无效假设位于置信区间外,就否定无效假设,接受备择假设,称为差异显著;4什么是显著水平?为什么要有一个显著水平?根据什么确定显著水平?它和统计推断有何关系?用来测验假设的小概率标准5%或1%等,称为显著水平由于显著水平不同可能直接影响到推断结果.本例题如果用0.01水平就要接受无效假设,所以必须事先确定显著水平.选用显著水平的原则:统计上达显著,实际上有应用价值.选用显著水平的原则:试验误差小的,选高水平0.01;试验误差大的,选低水平0.05.5什么叫统计推断?它包括哪些内容?什么是统计假设测验,它的原理和方法?统计推断:利用概率论和抽样分布的原理,由样本结果(统计数)推断或估计其总体特征(参数).它有两条路:一是统计假设测验,二是参数的区间估计.本教材主要是统计假设测验.统计假设测验的含义:首先对样本所属的总体提出统计假设(无效假设 ,备择假设 )然后计算样本在无效假设的总体中出现的概率,若概率大则接受该假设;若概率小则否定该假设,从而接受另一个相反的备择假设具体有以下三大步:(一)提出统计假设:对所研究的总体首先提出统计假设(二)计算概率: 在假定无效假设为正确的前提下,研究抽样分布,从而计算出样本在无效假设的总体中出现的概率0H A H(三) 推断: 根据“小概率事件实际上不可能发生”原理接受或否定无效假设**1方差分析的基本方法基本步骤?方差分析的步骤:1.平方和及自由度的分解:把试验资料总变异的平方和及自由度分解为各个因素的平方和及自由度,并计算出它们的方差.2.F 测验:利用f 分布测验各个因素的方差是否显著大于误差方差.以明确哪个因素的效应是显著的.3.多重比较:对方差显著的因素内水平间的平均数进行比较(差异显著性测验),以明确哪些平均数间差异显著,哪些平均数间差异不显著.2、F 测验的两个前提条件?F 测验需具备条件:(1)变数y 遵循正态分布N ( , ),(2) s 12 和 s 22 彼此独立 。
3、多重比较方法尺度大小和应用?多重比较方法尺度的大比较:1.P=2时:2.P>2时: (1)试验事先确定比较的标准,凡与对照相比较,或与预定要比较的对象比较,一般可选用最小显著差数法(LSD 法);(2)新复极差法(SSR 法)适用于试验精确度一般的所有均值间的相互 比较.(3)q 法测验适用于试验精确度较高的所有均值间的相互比较.4、方差分析的含义是什么?如何进行自由度和平方和的分解?如何进行F 测验和多重比较?所谓方差分析(analysis of variance) :是将总变异剖分为各个变异来源的相应部分,从而发现各变异原因在总变异中相对重要程度的一种统计分析方法。
是关于k (k ≥3)个样本平均数的假设测验方法.平方和及自由度的分解:把试验资料总变异的平方和及自由度分解为各个因素的平方和及自由度,并计算出它们的方差.F 测验:利用f 分布测验各个因素的方差是否显著大于误差方差.以明确哪个因素的效应是显著的. F 测验(方差差异的显著性测验或方差的同质性测验)的方法1.提出统计假设2.规定显著水平3.计算概率4.推断:如果 就否定无效假设,接受备择假设如果 接受无效假设多重比较的基本思路利用误差方差计算出最小显著差异标准,若任两个均值之差的绝对值标准, 则它们的总体均值 就差异显著; 反之就差异不显著多重比较:对方差显著的因素内水平间的平均数进行比较(差异显著性测验),以明确哪些平均数间差异显著,哪些平均数间差异不显著.5、方差分析有哪些基本假定?(1) 处理效应与环境效应等应该具有“可加性”(additivity) 以组合内只有单个观察值)()((法法法)q LSR SSR LSR LSD ααα==)()((法法法)q LSR SSR LSR LSD ααα<<μ2σ222122210:,:σσσσ>=A H H 222122210:,:σσσσ>=A H H ),(,21ννααF 2221s s F =αα≤≥p F F ,αα-=<1,p F F ≥-j i y y j i μμ与0≠β的两向分组资料的线性可加模型为例予以说明(2)试验误差 应该是随机的、彼此独立的,具有平均数为零而且作正态分布,即“正态性”(normality ) .(3)所有试验处理必须具有共同的误差方差,即误差同质性(homogeneity)**1适合性测验独立性测验的含义?适合性测验的概念:测验实际次数与理论次数是否相适合的卡平方测验独立性测验的概念:测验两个因素的列联次数是否相互独立的卡平方测验. 独立性测验的实质:测验实际次数与理论次数是否相适合的卡平方测验**1什么叫回归分析?直线回归方程和回归截距回归系数的统计意义是什么?如何计算?如何对直线回归进行假设测验和区间估计?回归分析:计算回归方程为基础的统计分析方法。