第一章田间试验的设计与实施
1.实验的设计要求:①实验目的明确;②实验要有代表性和先进性;③实验结果要正确可靠;
④实验结果要有重演性。
2.在进行试验的过程中,必须严格控制试验条件,尽可能减少试验误差,要努力提高试验的准确性和精确性,使试验结果正确、可靠。
⑴准确性(度):指同一处理的观测值与其真值接近的程度。
⑵精确性(度):指同一处理的重复观测值彼此接近的程度。
试验的准确性、精确性合称为正确性。
两者关系:
1.准确度高,精确度必高;精确度高,准确度不一定高。
2.由于处理的真值往往不知道,因而准确度不易确定;然而精确度在统计上是可以计算
的。
3.当试验没有系统误差时,精确度与准确度是一致的。
试验结果的重演性:指在相同的条件下再次进行同一试验,应能获得与原试验相同的结果。(只有试验结果符合客观规律、能够重演,才有推广应用价值)
3.(1)试验方案:根据试验目的和要求所拟进行比较的一组试验处理的总称。
(2)因素/子:试验中所要研究和比较的条件和措施。
(3)水平:试验因素内量的不同级别或质的不同状态。
定性水平:具有质的区别。如不同品种、果实颜色等。
定量水平:等间距如小麦田喷施N肥,分0、5、10g/小区三个水平。
不等间距如玉米田喷施钾肥,分0、10、20、40、80g/小区五个水平等。(4)处理:试验中的具体比较项目和指标。
①单因素试验中,每一水平就是一个处理。
②多因素试验中,每一水平组合是一个处理。
(5)试验单元:接受某种处理最小的试验材料的一个独立单位。(田间试验中称小区) 一个试验单元,只能接受一个处理,也只能有一个输出结果。
(6)唯一差异原则:试验中只允许供试因子有不同水平,而将非试验因子控制在相同水平。
4.试验种类(按供试因子数):
(1)单因素试验:指整个试验中只变更、比较一个试验因素的不同水平,其他作为试验条件的因素均严格控制一致的试验。
特点:试验简单,容易分析、但是不能了解各因素之间的关系。
(2)多因素试验:指在同一试验方案中包含两个或两个以上的试验因素,各个因素都分为不同水平,其他试验条件均应严格控制一致的试验。
特点:便于了解各因素之间的相互关系,试验复杂,设计不妥时不便于分析
(3)综合性试验:各因素的各水平不构成平衡的处理组合,而是将若干因素的某些水平结合在一起形成少数几个处理组合而设计的试验。
目的:探讨一系列供试因素某些处理组合的综合作用 (不是因素的单独效应和相互作用)。
注意:①单因素试验和多因素试验常是分析性的试验;
②综合性试验则是在对于起主导作用的那些因素及其相互关系已基本清楚的基础上
设置的试验。它的处理组合就是一系列经过实践初步证实的优良水平的配套。
5.试验指标:用于衡量试验效果的指示性状。
①定性指标:显示观察对象的属性。如施药后个体反映出有效与无效、受害与未受害、死亡与存活等。生成定性资料。
②定量指标:显示观察对象的量。如产量、株高、茎粗、含水量等。生成定量资料。 6.试验效应:试验因素对试验指标所起的增加或减少的作用称为试验效应。 简单效应:同一因素内两种水平间试验指标的差异。
主效:一个因素内各简单效应的平均数称为平均效应,称为主要效应,简称主效。 交互作用/互作:两个因素简单效应间的平均差异。 7.主效与互作的计算:
(1)A 因素的简单效应:
在B1水平时A2与A1的简单效应=24-18=6 在B2水平时A2与A1的简单效应=44-38=6 (2)A 因素的主要效应: A 因素的主效=(6+6)/2=6 (3)A 、B 因素的互作效应:
互作效应=(6-6)/2=0 =(20-20)/2=0
(4)当A1B1+A2B2=A1B2+A2B1时,A 、B 间不存在互作。 该例:A1B1+A2B2=62,
A1B2+A2B1=62,
所以A 、B 间不存在互作。
8.有时某一因素在另一因素水平上所产生的效应不同 。
A2与A1 (在B1水平上)=A2B1-A1B1=28-18=10
A2与A1 (在B2水平上)=A2B2-A1B2=22-30=-8
A 的效应因B的水平而不同,故:A和B因素间存在交互作用。
互作大小:[(A1B1+A2B2)-(A1B2+A2B1)]/2=[(18+22)-(30+28)]/2=-9 9.互作的判断:统计方法、专业知识,作图法。 两个因素间的互作称为一级互作,
三个因素间的互作称二级互作,余类推。
二级以上的高级互作较难理解,实际意义不大,一般不予考察。
10.制订试验方案的要点
(1)试验目的明确,能有效地解决实际问题。
(2)确定供试因素及水平:抓关键因素,设适当水平。
(3)设置对照。
(4)注意唯一差异原则,正确分析因素效应。
(5)正确处理试验因素及试验条件间的关系。
(6)尽量设计多因素试验,因素过多时可采用部分实施。
11.试验误差:由于非处理因素的干扰和影响而使观察值与试验处理真值之间出现的偏离。
误差的种类:
(1)系统误差:由于试验单元中的供试体在管理方法、测试仪器等方面有差异,从而使观察值与真值间发生有一定方向的系统偏离。
特点:能找出产生误差的原因,系统误差影响试验的准确性。
后果:偏离真值、影响准确度、影响正确结论的得出。
措施:不能用统计方法消除,只能用试验设计来避免,如选择同质一致的试验材料、标准化操作技术和对试验的外界条件的一致性控制(如试验地、测试仪器)等。
系统误差意味着有另外的因素在暗中起了作用,因此,试验前必须想办法知道单元间有无系统误差,如存在,必须用试验设计的各种方法(如增加区组因素和随机排列)将其排除。
(2)随机误差:由于试验单元、管理方法、测试仪器、操作方法等偶然因素所造成的观察值与真值间的偏离。
随机误差影响试验的准确性和精确性。
特点:影响数据的精确度和准确度;
具有层次性;
围绕着真值而出现;
具有随机性;
不可避免但可减小。
控制方法:改进试验设计;
进行统计分析。
(3)错失误差:试验中由于试验人员粗心大意所发生的差错。
如记录、测量错误等.这就要求试验人员要敬业,细心进行试验,以杜绝错失误差。
注:以后课程中所说的误差都是指随机误差。
12.误差来源:1、试验材料本身固有的差异。
2、试验操作和管理技术的不一致。
3、外界条件的差异(病虫害、土壤肥力、气候条件、人畜践踏等)。 13.控制途径:1、选同质的试验材料; 2、农事操作标准化;
3、控制引起差异的外界主要因素。
14.实验设计:是指试验研究工作进行前应用数理统计原理,制定试验方案,选择试验材料,合理分组,使我们可以利用较少的人力、物力和时间,获得多而可靠的信息资料,得出科学的结论。
统计分析与试验设计是不可分隔的两部分。试验设计需要以统计的原理和方法为基础,而正确设计又为统计分析提供了丰富可靠的信息,两者紧密结合推断出较为客观的结论,不断地推动农业科学研究的发展。
15.试验设计的基本原则:设置重复、随机化和局部控制(区组化)。
意义:避免系统误差、减小随机误差、正确估计试验误差、提高(精 )准确度。 (一)设置重复:试验中同一处理的试验单元数,即为重复数。
作用:1、估计随机误差:试验中没有系统误差存在时,可用多次重复观察间的参差不齐
程度来估计随机误差 ,如果只重复一次,就无法估计随机误差。 2.降低试验误差:随机误差有正有负,有高有低,无一定方向。多次重复平均后,正
负误差可抵消一部分。 (二) 随机排列:试验单元的分配和各个试验进行的次序都是随机的。 作用:获得无偏的误差估计
(三)局部控制:将整个试验空间分成若干个各自相对均匀的局部,每一个局部叫做一个区
组,所有局部构成整体。
作用:区组内增加试验的精确度.便于操作。
1、增加了一个区组因素,可以把区组因素的差异(系统误差)从观察值的误差中分离出来,降低试验误差,增加试验的准确度;
2、各区组内可以保证试验单元的 一致,增加试验的精确度.
3、便于操作管理。
16.常用的试验设计
根据试验单元的排列是否随机,试验设计分为两大类:顺序排列和非顺序排列。 一、顺序排列的试验设计
(一)对比法设计
◆ 特点:每一供试单元都直接排列于对照(check )旁边,使每一材料可与其邻近的对
照直接比较,所以称为对比法。
◆ 优点:
精确度较高。 ◆ 缺点:
对照过多,占1/3; 不能进行无偏估计; 适用于少量处理。 (二)间比法排列
n
x x /σσ=
◆特点:
一条地的第一个和最后一个小区一定是对照;
每两个对照间排列相同数目单元,一般为4个或9个;
各重复排成一排或多排式,多排式排列时一般用逆向式排列;
一条地排不下时,可在第二条地接排,但开始时仍设一对照,称为额外对照。
◆优点:
设计简单、不易发生差错;
可按品种熟期、株高等排列,减少生长竞争。
◆缺点:
误差有偏,不能进行显著性测验和方差分析;
地力不均时有系统误差。
二、随机排列的试验设计
在试验设计的实践中,根据Fisher三个基本原理的应用情况,试验可分为完全随机化试验、随机区组试验、拉丁方试验等。
(一)完全随机
根据重复和随机化两个基本原理设计。试验的每一个处理都有若干个重复的试验单元,而所有试验单元在试验中的排列是完全随机的。
◆优点:
设计方便,分析简易,精确度高。
◆缺点:
这类试验要求所有试验单元的各
种非试验因素都相当一致,否则就会
增大试验误差,甚至受到系统误差的
干扰。
完全随机化试验可适用于单因素试验和多因素试验。
◆随机的方法:
1)抽签
2)随机数字表(附表1)
3)计算机/器随机数字
(二)随机区组
◆应用重复、随机化和局部控制三个基本原理设计的试验,最常用。
◆试验单元出现系统误差时,必须采用局部控制原理,即进行区组化。
◆一个区组等价一个重复。
◆适用于单因素试验和多因素试验。
◆优点:
1)设计和分析简单,易于掌握。
2)富于弹性,单、多因素试验均可应用;
3)能提供无偏的试验误差估计,有效降低单向系统误差差异。
4)对试验条件的要求不严,必要时,不同区组可以安排在不同空间。
◆缺点:
1)处理数不允许过多,最好在10个左右,最多不超过20个,当处理数目太多时,区组内的试验单元数就增加,会降低局部控制的效率.
2)只能一个方向控制系统误差。
◆田间布置:
区组与系统误差方向垂直;
(三)拉丁方试验
拉丁方是较随机区组多一限制的随机排列设计,它是将试验处理从两个方向上排列成区组或重复。从两个方向控制土壤肥力差异,提高精确度。
1、拉丁方的特点:
1)重复数=处理数=直行数=横行数。
2)每个处理在横行或直行区组都出现一次,两个方向都可看成重复。
3)两个方向进行局部控制,试验精确度较高。
2、缺点:
1)处理多时重复次数随之增多,试验工作量增大。一般不宜超过8个处理。
2)处理数过少时误差自由度过小,影响分析结果的精确性。
3)操作较复杂,缺乏灵活性。
3、标准方:第一横行和第一直行均为顺序排列的拉丁方。
共轭方:一个标准方的直行为另一标准方的横行,则此两个标准方称互为共轭方。如:
4、自身共轭方:一个标准方的直行调成横行仍是原标准方即为自身共轭方。
5、拉丁方实验设计的步骤:
1)选择拉丁方:
根据处理数K随机地选择合适的标准方。
2)直行随机:
3)横行随机:
4)处理(品种)随机:
(四)裂区试验
随机区组试验的一个特殊形式:
◆先将第一个因素按随机区组设计划分成几个区组(重复),每一区组的小区数等于该
因素的水平数,这些小区称为主区。
◆再将第二因素随机排列在每一主区内,这些小区称为副(裂)区。
◆特点:
1)主、副处理分设在主、副区,可分别估计主、副区误差;
2)副区误差比主区误差小,即副区的比较比主区的比较更精确。
◆应用:
1)一个因素较另一因素需要更大的小区面积:需要较大面积的因素设在主区,较小面积的因素设在副区。
如中耕、肥料、灌溉等试验需要较大面积。
2)一个因素的主效比另一因素的主效更为重要或两个因素间的交互作用比其主效更重要:将要求更高精确度的因素作为副处理,另一因素作为主处理。
3)某一因素的效应较另一因素的效应更大时:将表现较大差异的因素作为主处理。
4)试验已经进行需临时加入1个或几个试验因素:把临时因素排列在原来的处理区内。如:在已经进行的品种试验中临时加入叶面喷P试验,可在原小区内设3个副区:喷p、喷清水和不喷。
五)再裂区设计
三因素裂区试验,需再裂区设计。
●在副区内划分更小的小区(再裂区),将第三个因素的各个处理(副副处理)随机排列
在再裂区内。
●优点:精确度高,再裂区设计可以研究因素间的高级互作,能估计3种误差:主区、
副区、副副区误差。
●缺点:设计及统计分析较麻烦。
(六)巢式设计
根据处理因素A的水平数分为不同的组,每组内又分为不同亚组,每个亚组内有不同的观察值。
◆应用
病害调查:随机选若干株果树,每株取不同部位枝条,每枝条选若干叶片查病斑数;
玉米遗传参数测定。
第二章资料的整理
1.资料:通过观察、记载得到的试验数据。
2.资料整理:对原始资料进行加工处理,使其条理化、系统化,形成能够反映总体特征的综合资料的过程。
目的:将原始资料进行系统整理,按一定的顺序排列,比较直观地了解资料的基本情况。资料整理的基本方法:次数分布(包括次数分布表和次数分布图)
一.次数分布表
根据资料内的变数多少把整个资料分成若干组,并把每个变数分别归组,统计各组变数的次数,制成次数分布表。
连续性资料次数分布表制作方法:
(1)、计算极差(range):
R=xmax-xmin
(2)、确定组数和组距(class interval)
组数K:公式或查表:
k=3.3×lgn+1 (n:样本容量)
观察值个数组数
50 5-10
100 8-16
200 10-20
300 12-24
500 15-30
1000 20-40
确定组数时应考虑:
1)样本大小
2)极差大小
3)便于计算
4)资料真实性
组距i=R/K
(3)、确定组中(点)值与组限
组中(点)值(class value):各组变数数值的中点,第一组中(点)值应以接近或等于最小观察值为好。
组限(class limit):每组数值的上下限(L,U)。
组限最好比观察值多一位小数,便于计算。
第一组: 下限=中值-1/2组距
上限=中值+1/2组距
第二组:下限=第一组的上限
上限=下限+组距
……
余类推
(4)、原始资料变数归组。
全部变数分别归组,完毕后累加每组内变数次数并列出,制成一个次数分布表。
二、次数分布图
用点、线、面的位置、升降或大小来表达统计资料数量关系的一种形式。或将次数分布作成图的形式。
主要种类:方柱形图曲线图条形图饼形图
(1).方柱形图
用于表示连续性变数的次数分布.
1)按次数分布表,以组限为横坐标,前一组的上限即为后一组的下限。
2)在纵坐标轴上标定次数
3)画出方柱形图
(2).多边形图
表示连续性变数资料。能在同一图上绘两组以上的资料,以作直观的分析比较。作法:
以每组的中点值为横坐标,以组次数为纵坐标,在对应的高度处作一点,最后用直线将各点依次连接。
(3).条形图
适用于间断性变数和属性变数资料,用以表示这些变数的次数分布情况。
条形图绘制较容易,x轴标出间断的中点值或分类性状,y轴标出次数。
(4)饼形图:以百分比表示
3.总体(population):具有共同性质的个体所组成的集团。
4.参数:由总体的全部观察值算得的描述总体的特征数。
总体参数用希腊字母表示,如:μ、σ等
5.样本:从总体中抽出的个体的集合。
6.样本容量:样本中所含有的个体数,以n表示。
大样本:样本容量较大的样本(n≥30)
小样本:样本容量较小的样本(n<30)
7.抽样:从总体中获得样本的过程.
抽样方式:复置抽样、非复置抽样
抽样方法:随机(概率)抽样、典型抽样、顺序(机械)抽样
8.统计数:测定样本中各个体而得到的特征数。如:样本平均数、标准差等。
统计数常用拉丁字母表示。
9.统计量:样本的统计指标,如样本均数,采用拉丁字母分别记为 。统计量是参数附近波动的随机变量 。
参数:总体的统计指标,如总体均数,采用希腊字母记为μ。固定的常数
10.参数和统计数的关系:统计数是相应总体参数的估计值。对一个总体而言,参数是一个固定值,但样本统计数并不是固定值,它随着取样的不同而不同。 11.资料的分类: 一.数量性状资料
由计数和量测两种方法获得。
计数——间断性变数——小麦基本苗数、菌落数、穗数、分孽数等等 量测——连续性变数——病斑长度、作物产量、株高、土壤水分含量等等 二.质量性状资料
质量性状又称属性性状,指只能观察而不能量测的性状。
如:遗传上符合独立分配、自由组合和连锁规律的性状-花色、粒色、芒的有无、果
实形状等 统计次数法:统计具有某个性状的个体数目及具有不同性状的个体数目,按类别计其次数或相对次数。
给分法:给予每类性状以相对数量的方法,如小麦籽粒有红白两种颜色,可用0表示白色,用1表示红色。
12.平均数的意义和种类:平均数是数量资料的代表值,表示整个资料内变数的中心位置,并且可以作为一组资料的代表,与另一组资料进行比较。 种类:算术平均数 中数 众数 几何平均数
(一)算术平均数(mean)
1、定义:一个数量资料中各个观察值的总和除以观察值个数所得的商,称为算术平均数。
? 有总体均数和样本均数之分,分别用μ和 表示。 应用最广。常简称为平均数
或均数。 2、算术平均数的重要性质
(1)样本中各观察值与其平均数的差数(简称离均差)的总和等于零。
(2)样本中各个值与其平均数差数平方的总和,较各个观察值与任何一数值的差数平方和为小,亦即离均差平方的总为最小。
(二)中数
将所有观察值从小到大依次排列,居中间位置的观察值称为中数,记作Md 。 (三)众数(mode)
资料中最常见的一数或次数出现最多的一组的中点值,称为众数,记作Mo.
注意:中数和众数作为资料的代表值, 其代表性较差,因为它不能利用资料的全部信息,仅能利用小部分信息,所以应用较少。 (四)几何平均数(geometric mean)
如有几个观察值,其相乘积开n 次方所得数值,即为几何平均数,记作G 。
13.变异数:变异数是描述资料变异程度的统计量.
常用的变异数主要有:极差、方差、标准差、变异系数等
X 0
)()(1
=-=
-∑∑=x x
x x
i
n
i
i
G =
一、极差(Range)
又称全距,记作R ,是资料中最大观察值与最小观察值的差数. 优点:简单易懂,使用方便。
缺点:由两个极端值决定,没有充分利用资料的全部信息,易受资料中不正常的极端值的影响,代表整个样本的变异度有缺陷。 应用:n ≤10
二、方差(Variance)
能正确反映资料变异度的方法,是用样本全部观察值来度量资料变异程度的变异数。选定一个共同比较的标准-平均数:用每一个变数与平均数相比,得到许多个离均差。 用离均差的平方和
优点:克服离均差之和为零的弊端、加重较大离均差的分量。 缺点:各资料n 值不同。 解决办法:ss/(n-1)
小样本
大样本
总体
三、标准差(Standard deviation )
标准差为方差的平方根值,以恢复原来的度量单位,并使其数值水平与平均数相适应,不致于过大或过小。
14.(1)自由度的意义:在用样本估计方差和标准差时,分母为n-1,而不是用观察值数目n ,在这里n-1称为自由度,记作υ或df ,υ=n-1。
因为,我们通常所掌握的样本资料,不知μ值,不得不用样本平均数 来代替μ,由
于其 与μ有一定的偏差,根据离均差平方和为最小,可以推知
总是小于 ∑(χ-μ)2 ,这时如果还用样本包含的个体数n 作为分母进行平均, 就会使样本的标准差
比群体参数偏小。为此,用n-1代替n ,则可免除偏小的弊病。
(2)自由度的另一含义:对于具有n 个观察值的样本,在每一个x 与 比较时,虽然具有n 个离均差,但因受离均差之和等于零这一条件的限制,所以只有n-1个是自由的。 标准差的计算方法
(一) 直接法 m ax m in
R x x =-2
()
ss x x =
-∑1
)(1
2
2
--=
∑
n x xi S
n
n
x xi S
n
∑
-=
1
2
2
)
(2
2
1
()N
x i N
μσ
-=
∑
1
)(2
--=
∑
n x x S N
x ∑
-=
2
)(μσ2
()ss x x =-
∑3))4))x x x x --∑2
2
求出(计算(
(二)
15.利用标准差比较的应用条件:
1.标准差带有单位,不同单位的标准差不能进行比较.
例: 小麦株高的标准差是4.0cm,穗粒数的标准差为2.5粒,这样4.0cm 与2.5粒不能直接比较.
2.标准差的可比性基于平均数相等这一条件,基础大小不同,就不能说明变异程度。 例:小麦株高 =94.7cm, s=4.0cm 穗长 =5.4cm, s=0.5cm
不能根据标准差的大小断言:株高的变异程度大于穗长的变异程度.
四、变异系数
定义:标准差与平均数的比率以百分数来表示,称为变异系数,记作CV( 或S%). 计算公式: CV(%)=S/ ×100%
CV 是一个不带单位的纯数,表示单位量的变异,故可用于比较。 例:
小麦株高 = 94.7cm, s=4.0cm CV(%)=4.22%
穗长 =5.4cm, s=0.5cm
CV(%)=9.26%
结论:小麦穗长的变异程度比株高的变异程度大。
? 变异系数在田间试验设计中有重要的用途。如在空白试验中,可作为测定土壤差异
的指标,而且可作为确定试验小区面积、形状和重复次数的依据。 ?
CV 既受 影响,也受S 的影响,因此在用cv 表示样本变异程度时,宜同时列举
S 和 ,以免引起误会。
第三章 统计推断
1.研究总体和样本的关系可从两个方向进行分析:
一是从总体到样本方向──抽样分布问题,可称为第Ⅰ方向;
二是从样本到总体方向──统计推断(statistical inference)问题,可称为第Ⅱ方向,两者互为逆命题.
本章主要讲述第Ⅱ方向。用样本平均数可以估计总体平均数,但样本平均数有误差,所以推断结论并非绝对正确。之间的差异来自两方面:真实差异和抽样误差。需要对其进行判断。
2.统计推断就是根据抽样分布律和概率理论,用样本统计数推断总体参数。 统计推断包括参数估计和统计假设测验两个方面的内容。
统计推断的前提条件:资料来自随机样本、统计数分布律已知。
x x x
3.二、参数估计
指用样本统计数对总体参数作点估计和区间估计。
1、点估计就是用样本统计数直接估计相应的总体参数,例如用x 估计μ;用s2估计σ2等。
2、根据抽样分布试验,样本统计数亦是一个随机变数,所以不同的样本会有不同的估计值,即点估计具有一定的偏差, 因此有必要估算一个取值范围,使总体参数能够以很高的置信度落在这个区间内,这种用样本统计数在一定的概率保证下估计总体参数所在范围的方法,称为参数的区间估计。
总体参数可能所在的区间称为置信区间。
置信区间的上下限称为置信限。
保证参数在该区间内的概率称为置信系数或置信度,以P=1-α表示。
其中α称为显著水平(significance level):是指用于测验假设的概率标准。农业试验中,一般取α=0.05和α=0.01,达到0.05显著水平称为检验对象间差异显著,用*表示;达到0.01显著水平称为检验对象间差异极显著,用**表示。
以式表示为:
P(L1≤θ≤L2)=1-α
式中θ指总体参数,如:μ、σ2、μ1-μ2等。L1和L2称为置信限,其中L1称为置信下限;L2称为置信上限。
三、假设测验
假设检验就是用样本统计数对总体假设的真伪做出检验的概率方法。
四、无效假设和备择假设
统计假设分为两类:
1、无效假设:指总体参数与其假设值之间无实质性差异,其差异由抽样误差造成。记作:H0 。用于检验的假设,以其为前提可以计算试验结果出现的概率。
无效假设的目的:
可以从假设的总体里推断其随机抽样平均数的分布,从而可以计算出某一样本平均数指定值出现的概率,即研究总体和样本的关系,进行假设检验。
2、备择假设:无效假设被否定后必须接受的后备假设。记作:HA
注:H0和HA为对立事件,即:P(H0 +HA)=1
五、小概率原理(小概率事件的实际不可能原理)
凡是概率很小的事件在一次试验中实际上是不可能出现的。
统计推断是以小概率原理为基础而进行的。
小概率的标准即为显著性水平。
六、接受区间与否定区间
在假设检验中,抽样分布曲线下接受Ho 的区域称为接受区域,等于总体参数的置信区间,其置信概率为1-α。
否定Ho 的区域称为否定区域,等于总体参数置信区间以外的区域;其概率为显著水平α
七、假设检验的基本步骤
(1) 对样本所属的总体参数提出假设,包括无效假设Ho 和备择假设HA 。 (2) 确定显著水平α.
(3) 计算。在Ho 正确的前提下,根据统计数的抽样分布计算出所得样本统计数的概率p 。 (4) 统计推断,将实得样本统计数的概率p 与确定的显著水平α相比较,依据概率大小作出应接受哪种参数假设的检验。 (5) 对结果进行解释。
例4.1:当地小麦品种亩产μ0=300公斤,多年种植的标准差75公斤;新引进品种经25个小区试验,亩产量330Kg ,问两者是否有显著差异? 解:1、Ho :μ=300Kg ; HA :μ≠300Kg ; 2、 α=0.05 3 、计算u 值
3、根据α.=0.05,查表得临界值
所以,|u |> u0.05, 330Kg 在抽样分布中的概率p<0.05,故否定Ho :μ=300Kg ;接受 HA :μ≠300Kg 。
4、差异显著,即330Kg 所属的总体平均数μ与μ0=300的总体均数间有显著差异,或者说330Kg 不属于μ0=300的总体。说明引进品种产量明显高于当地品种。
八、 两尾检验和一尾检验
如果否定区域位于抽样分布曲线的两尾,左尾的概率为α/2,右尾的概率亦为α/2,则称这种假设检验为两尾检验。
如果否定区域仅在抽样分布曲线的一尾,其概率为α,则称这种假设检验为一尾检验。 其中,
否定区域在左尾的称为左尾检验; 否定区域在右尾的称为右尾检验。
330300
2
x
x x u μ
σ
--=
=
-=
=
当显著性水平α相同时,一尾检验比两尾检验容易否定Ho,对鉴定差异的显著性较灵敏
实得u值与临界值uα直接比较否定Ho的标准
━━━━━━━━━━━━━━━━━━
检验方法显著水平显著水平
(α=0.05) (α=0.01)
──────────────────
两尾检验│u│>1.96 │u│>2.576
左尾检验 u<-1.645 u<-2.326
右尾检验 u>1.645 u>2.326
━━━━━━━━━━━━━━━━━━
两尾检验和一尾检验的
主要区别:
(1)两尾检验和一尾检验的假设不同。
(2)两尾检验和一尾检验用以划分两个总体的临界值不同。
(3)一尾检验比两尾检验容易否定Ho,鉴定差异显著性的灵敏度较高。
九、假设检验的两类错误
第一类错误:如果无效假设Ho为真,但通过检验却否定了它,这种错误称为弃真错误,又称统计错误的第Ⅰ类错误,其概率为显著水平α。
第二类错误:如果无效假设Ho为伪,但通过检验却接受了它,这种错误称为取伪错误,又称为统计推断的第二类错误,其概率以β记。
当用样本平均数总体均数作统计推断时,可能会发生第一类错误或第二类错误,但是两类错误不可能同时发生。
第一类错误α会对第二类错误β产生影响,当显著水平从α=0.05 减少到α=0.01时,则会增大第二类错误的概率。
在假设检验中犯第一类错误的概率,其概率为α。
在假设检验中犯第二类错误的概率,其最大值为β=1-α。
关于两类错误:
1、样本容量n固定的条件下,提高显著水平α(取较小的α值),将增大第二类错误的概率β值。
2、在n和α相同的条件下,真总体平均值μ与假设总体平均值μ0的相差(以标准差为单位)愈大,则犯第二类错误的概率越小。
3、为了降低犯两类错误的概率,需采用一个较低的显著水平,如α=0.05;同时适当增加样本容量,或适当减小总体方差σ2,或两者兼有之。
4、如果真总体的μ在接受区间外且α已固定,则改进试验技术和增加样本容量可有效降低犯第二类错误的概率。
第二节平均数的假设测验
一、单个样本平均数的统计推断
(一)单个样本平均数的假设检验
这是检验样本均数所属的总体均数μ与假设的总体均数μ0是否相等的假设检验。
无效假设Ho:μ=μ0,μ≠μ0(或者Ho:μ≥μ0,HA:μ<μ0 Ho:μ≤μ0,HA:μ>μ0)。
1、u测验
当总体方差σ2已知或σ2未知但n ≥30时,用u 检验。
例4.2:如引进品种与原地方品种比较,因σ2已知时,故用u 检验:
例4.3:抽检了80包方便面,计得净重平均数为65.05(g),s=2.54(g),试检验该方便面净重的总体均数μ是否显著高于标准μ0=65(g)? 假设 H0:μ≤65(g) 对HA:μ>65(g) 显著水平 α=0.05 检验计算 虽然总体方差σ2未知,但是n>30为大样本,故可用u 检验。
实得u65(g)
μ与标准重量μ0=65(g)之间无显著差异。
2 当总体方差σ2未知,且n<30为小样本时,用t 检验。
例4.4:随机抽样测定了某小麦品种的千粒重,n=8,观察值为32.7、36.8、35.9、34.6、
35.6、37.6、33.4
、35.1(g),试检验该小麦品种千粒重的总体均数μ与假设总体均数μ
0=34(g)之间的差异显著性?
参数假设 Ho:μ=34g;HA:μ≠34g
显著水平 α=0.05
检验计算 由于总体方差σ2未知,且n<30为小样本,故需用t 检验。
df=n-1=8-1=7
两尾临界值t0.05=2.3646
统计推断:因p(│t │>2.3646)=0.05,实得t 值的概率p >0.05,故接受Ho:μ=34(g),否定HA:μ≠34(g), 即该小麦品种千粒重总体均数μ与假设总体均数μ0=34(g)之间无显著差异。
(二)总体均数μ的区间估计
当总体方差σ2已知或σ2未知但n ≥30时,μ的1-α的置信区间为:
2x x u μσ-==
==0.18
x
x u s μ-=
=
=
=281.735.21()
8 1.64()
/
1.64/80.58
x x x g n s g s s ====
=
====∑35.2134 2.087
0.58
x
x t s μ--=
=
=(..)1.2.x x x x
x u x u L x u L x u αααασμσσσ-≤≤+=-=+
二、两个样本平均数差数的统计推断
(一)假设测验
1、成组数据的比较(两个独立总体均数差数(μ1-μ2)的假设检验)
两个处理完全随机设计,各供试单位彼此独立,不论两处理的样本容量是否相同,所得数据为成组数据
(1)u 测验:
当两个总体方差σ12和σ22已知时,用u 测验:
例4.5:某小麦平方米产量的σ2=0.4(Kg)2,在其地块内用A、B两法抽样:A 法12样点,( 1=1.2Kg ,B 法8样点,2=1.4Kg 。比较两法每平方米产量是否相等。 解:Ho:μ1=μ2, HA:μ1≠μ2, α=0.05
σ12=σ22=σ2=0.4,n1=12,n2=8
|u| 当两个总体方差σ12和σ22未知,但可假定σ12=σ22=σ,用t 检验 然后计算两样本平均数差数的标准误: 212 12 121 2 12()() (1)(1) e ss ss s x x x x n n νν+= +-+ -= -+-∑∑2 2 12121212()() x x x x x x u μμσσ-----= = 120.2887() x x K g σ-= = =121212 ( )() 1.2 1.4 0.69 0.2887x x x x u μμσ----= -= =-121212,x x x x s n n n s --= === 如果则: 最后计算t 值: df=(n1-1)+(n2-1) 例4.6 研究矮状素使玉米矮化的效果,测定使用矮壮素小区8株,对照区9株,试作假设测验。 解:由于用矮状素处理的玉米株高不可能大于对照的玉米株高,故作一尾检验。 Ho: μ1≥μ2 ,对HA:μ1<μ2 显著水平 α=0.01 检验计算: SS1=18400 SS2=3787.5 df=n1+n2-2=9+8-2=15 查t 分布表得一尾检验的临界值t0.05=1.753, t0.01=2.6025 统计推断:因为p(t >2.6025)=0.01,实得t 值的概率p(t<3.05)<0.01, 故否定Ho: μ1 ≥μ2,接受HA:μ1<μ2,即喷矮状素的玉米株高极显著地矮于对照。 121212 ()() x x x x t s μμ----= 212 12 184003787.5 78 1479.17 e s s s s s νν += ++= + =1218.688() x x s c m -== =121212 ()() 233.3176.3 3.05 18.688x x x x t s μμ----= -= = 2、成对数据的比较 将性质相同的两个供试单位配成一对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给与不同处理 ,所得的观察值为成对数据 设两个样本的观察值分别为: X1.1,x1.2,x1.3,……,x1.n x2.1,x2.2,x2.3,……,x2.n n 对观察值为:(x1.1,x2.1),(x1.2,x2.2),(x1.3,x2.3),…… ……,(x1.n,x2.n) 每对的差数:di=x2i-x1i 差数的平均数和方差为: 差数平均数的标准误: 所以: 具有 df=n-1 若H0:μd =0,则: 例4.7:同一番茄叶片分别接种A、B两种病毒,得病斑数如下。试测验两种处理方法的差异显著性。 2 2 2 2 () 1 ()/1 i d d d n d d s n d d n n =-=--= -∑∑∑ ∑d s = = = d d d t s μ-= d d t s = 解:Ho:μd =0,HA:μd ≠0 α=0.01 =[(-15)+1+……+(-12)]/7=-58/7=-8.3(个) =(-15)2+12+……+(-12)2=167.43 =-8.3/1.997=-4.16 df=n-1=7-1=6时,t0.01=3.707,|t|>t0.01,推断:否定Ho:μd =0,接受HA:μd ≠0,即: A 、 B 两法病毒斑数有极显著差异。 (二)区间估计 1、两个总体均数差数(μ1-μ2)的区间估计 (3)当两个总体方差σ12和σ22未知,且σ12≠σ22时 i d d n =∑222 ()()/d ss d d d d n =-=-∑∑∑ 1.997(d s = = = =个) d d t s = 生物统计 第一章绪论 1.什么是生物统计?它在动物科学研究中有何作用? 2.什么是总体、个体、样本、样本容量?统计分析的两个特点是什么? 3.什么是参数、统计数?二者有何关系? 4.什么是试验或调查的准确性与精确性?如何提高试验或调查的准确性与精确性? 5.什么是随机误差与系统误差?如何控制、降低随机误差,避免系统误差? 6.统计学发展的概貌可分为哪三种形态?拉普拉斯、高斯、高尔顿、皮尔森、哥塞特、费 舍尔对统计学有何重要贡献? 第二章资料的整理 1.资料可以分为哪几种类型?它们有何区别与联系? 2.为什么要对资料进行整理?对于计量资料,整理成次数分布表的基本步骤是什么? 3.统计表与统计图有何用途?常用统计表、统计图有哪些?编制统计表、绘制统计图有 何基本要求? 4.某品种100头猪的血红蛋白含量资料单位:g/100ml列于下表,将其整理成次数分布表, 并绘制次数分布直方图与折线图。 表格1 4某品种100头猪的血红蛋白含量(g/100ml) 13. 4 13. 8 14. 4 14. 7 14. 8 14. 4 13. 9 13. 13. 12. 8 12. 5 12. 3 12. 1 11. 8 11. 10. 1 11. 1 10. 1 11. 6 12. 12. 12. 7 12. 6 13. 4 13. 5 13. 5 14. 15. 15. 1 14. 1 13. 5 13. 5 13. 2 12. 7 12. 8 16. 3 12. 1 11. 7 11. 2 10. 5 10. 5 11. 3 11. 8 12. 2 12. 4 12. 8 12. 8 13. 3 实验心理学实验设计方 案 Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】 一、研究课题:考察“不同面部表情的识别速度与识别准确性存在差异”[预期可能结果:不同的面部表情,识别速度有差异;或者不同的面部表情,识别的准确率也有差异] 引言:速度—准确性权衡是关系到一切反应时实验信度的基本问题,下面我们将尝试通过一个简单的生活化的实验来展示任务速度和任务准确性之间普遍的权衡关系。在反应时实验中,当被试追求较快的速度时,必然要以牺牲准确性为代价。同样,当被试力求高的准确性时,也必然要以放慢速度为代价。在具体的实验中,被试究竟会如何权衡二者的关系,取决于很多因素。本实验主要探讨不同面部表情(痛苦、微笑、悲哀、快乐)识别速度与准确率是否存在显着差异。 假设:假设不同面部表情的识别速度与识别准确性存在差异 二、实验目的:通过实验证明不同面部表情(痛苦、微笑、悲哀、快乐)的识别速度与识别准确性存在差异,本实验旨在研究不同面部表情的识别速度与识别准确性存在差异,通过自编的e-prime实验程序对四十名被试进行施测。 三、实验材料:痛苦、微笑、悲哀、快乐的图片(均选自于标准的实验图片库)、电脑、e-prime程序 四、实验设计 采用单因素完全随机化设计 自变量为不同面部表情、区分为(痛苦、微笑、悲哀、快乐)四种。每个小组只接受一种实验处理,只对一种表情做出反应。 因变量为反应时、准确率,分别是识别的准确率、以及被试对不同面部表情识别的反应时。 五、实验程序: 被试构成: 采用简单随机抽样,在弘德楼随机选取了几个自习室,共选取了40个被试。男女各半,年龄为18-23岁,随机分为四个小组。 研究工具: 在计算机上自编好e-prime实验程序 研究过程 (1)正式实验前被试要先进行几次类似练习,以熟悉按键反应。 (2)被试坐在电脑前,接受相同的指导语。其指导语为:“在接下来的一段时间里你将继续进行此类题目的正式作答,请用心作答”。被试按键确认后即开始正式实验、期间不再中断休息。 (3)使用主试自编计算机视觉搜索程序,每帧呈现一副面部表情图片,每幅图片呈现的间隔时间一致,随机播放图片。每种表情的图片都有10张,每张呈现2次,共呈现20次,所有表情图片共呈现80次。痛苦按“1”键、微笑按“2”键、悲哀按“3”键、快乐按“4”键。其中第1小组只对痛苦做反应、2小组只对微笑做反应、3小组只对悲哀做反应、4小组只对快乐做反应。每出现一幅图要求被试按对应的反应键,计算机自动记录反应时间和正确率。 六、数据处理 采用进行统计分析。 以不同面部表情为自变量,反应时和准确率为因变量。 针对两个反应指标均可分别采用单因素完全随机化/独立样本的方差分析来进行差异检验。 本科《生物统计附试验设计》课程代码:02793 一,名词解释题 1.中位数:将资料所有观测值按从小到大的顺序排列,处于最中间的数. 2.I型错误:是拒绝H0时犯下的错误,其错误是把真实差异错叛为非真实差异. 3.总体:是由研究目的的确定的研究对象的个体总和. 4.参数:是指由总体计算的特征数. 5.相关分析:即两个以上的变量之间共同受到另外因素的影响. 6.回归分析:即一个变量的变化受到一个或几个变量的影响. 7.精确性:是重复观测值之间彼此接近的程度. 8.显著水平:是检验无效假设的水准.但另一方面它也是进行检验时犯错误概率大小. 9.随机单位组设计:它的原理与配对设计类似,抽每一头试验动物具有相等的机会,接受任一处理而不受人为影响. 10.统计量:由样本计算的特征数. 11.准确性:是观察值与真实值间的接近程度. 12.随机误差:是由试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间产生的误差,是不可避免的. 13.系统误差:是由于试验处理以外的其它条件明显不一致所产生的带有倾向性的偏差. 14.样本:是在总体中进行抽样,从中抽取的部分个体. 15.众数:资料中出现最多的观测值或次数最多的一组中值. 16.样本标准差:统计学中样本平方差S^2的平方根 17.试验处理:在一项试验中,同一条件下所做的试验称为一个处理. 18.几何平均数:几个观测值相乘之积开n次方所得的方根称为几何平均数. 19.顺序抽样法:是将有限总体内所有个体编号,然后按照一定顺序每隔一定的数目,均匀抽出一个个体,组成样本,对样本进行调查. 20.试验指标:用来平衡量试验效果的量. 21.随机抽样法:是将总体内所有的个体编号,然后采取抽签,拈阄或用随机数字表的方法将部分个体取出而做为样本进行调查. 22.小概率原理:小概率事件在一次试验中实际不可能发生的原理. 23.重复:在试验中,同一处理内设置的动物数量,称为重复. 24.局部控制:在试验设计时采用各种技术措施,控制和减少非试验因素对试验指标的影响. 25.算术平均数:资料中各观测值的总和除以观测个数所得的商. 26.变异系数:是标准差相对平均数的百分数,用CV表示. 27.II型错误:在接受H0时犯下的错误,其错误是把真实差异错判为非真实差异. 28.因素水平:每个试验因素的不同状态(处理的某种特定状态或数量上的差别)称为因素水平. 29.配对设计:是指将条件一致的两头动物酿成对子,然后采取随机的方法在同一对子内两头动物进行分配处理. 30.试验处理:指对受试对象给予的某种外部干预或措施,是试验中实施的因子水平的一个组合. 31.调和平均数:资料中各观测值倒数的算术平均数的倒数称调和平均数. 32.效应:是指因素对某试验指标所起的增进或减退的作用. 33.顺序抽样:它是按某种既定顺序从总体(有限总体)中抽取一定数量的个体构 《生物统计附试验设计》 习题集 (动物医学专业用) 第一章绪论 一、名词解释 总体个体样本样本含量随机样本参数统计量准确性精确性 二、简答题 1、什么是生物统计?它在畜牧、水产科学研究中有何作用? 2、统计分析的两个特点是什么? 3、如何提高试验的准确性与精确性? 4、如何控制、降低随机误差,避免系统误差? 第二章资料的整理 一、名词解释 数量性状资料质量性状资料半定量(等级)资料计数资料计量资料 二、简答题 1、资料可以分为哪几类?它们有何区别与联系? 2、为什么要对资料进行整理?对于计量资料,整理的基本步骤怎样? 3、在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好? 4、统计表与统计图有何用途?常用统计图、统计表有哪些? 第三章平均数、标准差与变异系数 一、名词解释 算术平均数几何平均数中位数众数调和平均数标准差方差离均差的平方和(平方和)变异系数 二、简答题 1、生物统计中常用的平均数有几种?各在什么情况下应用? 2、算术平均数有哪些基本性质? 3、标准差有哪些特性? 4、为什么变异系数要与平均数、标准差配合使用? 三、计算题 1、10头母猪第一胎的产仔数分别为:9、8、7、10、1 2、10、11、14、8、9头。试计算这10头母猪第一胎产仔数的平均数、标准差和变异系数。 2、随机测量了某品种120头6月龄母猪的体长,经整理得到如下次数分布表。试利用加权法计算其平均数、标准差与变异系数。 组别组中值(x)次数(f) 80—84 2 88—92 10 96—100 29 104—108 28 112—116 20 120—124 15 128—132 13 136—140 3 3、某年某猪场发生猪瘟病,测得10头猪的潜伏期分别为2、2、3、3、 4、4、4、 5、9、12(天)。试求潜伏期的中位数。 4、某良种羊群1995—2000年六个年度分别为240、320、360、400、420、450只,试求该良种羊群的年平均增长率。 5、某保种牛场,由于各方面原因使得保种牛群世代规模发生波动,连续5个世代的规模分别为:120、130、140、120、110头。试计算平均世代规模。 6、调查甲、乙两地某品种成年母水牛的体高(cm)如下表,试比较两地成年母水牛体高的变异程度。 甲地137 133 130 128 127 119 136 132 乙地128 130 129 130 131 132 129 130 第四章常用概率分布 一、名词解释 随机事件概率的统计定义小概率原理正态分布标准正态分布双侧概率(两尾概率)单侧概率(一尾概率)二项分布波松分布标准误t分布 心理学实验设计方案 一,实验题目:人类在背诵英语单词时,英语单词的长度和被试背诵的时间是否影响背诵者的记忆效果 1假设 1.1选用短的英语单词背诵时,背诵者的记忆效果比选用长的英语单词好; 1.2背诵英语单词的时间长的比背诵时间短的记忆效果好 2变量及额外变量的操纵方法 2.1自变量:单词的长度,背诵时间 2.2因变量:背诵者的记忆效果(在分析中,选取单词默写正确个数为 2.3额外变量:被试的性别、智商水平,疲劳效应等 2.3.1额外变量的操控方法: 2.3.1.1选择性别数量上相等的被试(男10女10) 2.3.1.2选择在同一智商水平(按韦克斯勒智力量表)的被试 2.3.1.3让被试在实验中休息 3被试的选择及分组 选取男女被试各10名,每位被试接受四种水平(长单词—长时间、长单词—短时间、短单词—长时间、短单词—短时间)的实验处理 4实验实施过程及方法 4.1选择100个英语单词(其中,长短单词各50个)作为实验材料,20名被试把他们随机分配到四个处理水平上,每个处理水平上分配5名被试。 4.2让每组被试记忆单词,短单词选取CET四级词汇中含5-6个字母的单词,长单词选取CET四级词汇中含9-11个字母的单词;记忆的短时间为5分钟,长时间为10分钟。 4.3记忆时间到时,让被试默写自己记忆的单词;批改被试默写的单词 二、计算机键盘与水平面可有三种倾斜度:0度、10度和15度,试设计一项实验来证明,哪一种倾斜度最有利于输入字符。 单因素被试间设计 1. 提出假设:在计算机和水平面之间的三种倾斜度中,0度,10度和15度中,打一段相同的材料(使用相同的语言),在完成任务以后,比较一下哪种任务完成的时间是最少的,假设倾斜10度所需要的时间是最少的。 2. 被试 筛选被试:筛选被试:在对被试进行选择的过程中,需要进行严格的筛选。在进行最后的测试之前,要对每个被试进行测试。让所有被试在同一个房间里进行,给他们500字的中文文字,在最后的结果中筛选出在3-4分钟内完成的被试,这样能够排除掉打字技术对成绩的干扰。其中选出被试45名。每个被试分别接受三个水平的实验处理(0度,10度和15度)。 单因素被试间设计 3. 实验材料 3台配置一样的电脑,分别是:0度,10度和15度。 分别给被试呈现不熟悉的材料,避免对材料有熟悉度,每段文字500字。 4. 实验程序 (1) 把被试统一安排在指定教室进行,事先不需要太多的交流。 (2) 指导语:大家好,今天我们要进行一项文字输入的测试。在屏幕中央将会出现一篇文字,请您以最快的速度输入文字。在我说开始后,大家可以开始了。 (3)电脑自动记录被试完成的时间。 (4)进行数据分析。 三、研究者要探讨灯光强度与颜色对反应时的影响,试设计一个2×2实验研究范式。(要求说明实验中自变量、因变量与控制变量,是组间设计还是组内设计,被试如何分组,实验结果如何整理等) 参考答案: 实验设计:采用2×2多因素实验设计。 该实验研究的自变量有两个:灯光强度:分为强、弱两个水平,灯光的颜色:可分为红、绿两种不同颜色的灯光。这样,共有四种实验处理:红色的强光、红色的弱光、绿色的强光、绿色的弱光。 因变量:记录每个被试在不同实验条件下的反应时间。 控制变量:所有被试的练习次数、准备状态、额外动机、年龄以及其他个别差异应保持相等。 ,生物统计 1,总体:根据研究目的确定的研究对象的全体 2、个体:总体中的一个研究单位 3、样本:实际研究中的一类假象总体 4、样本含量:样本中所包含的个体数目称为样本含量或大小 5、随机样本:一类从总体中随机抽得到的具有代表性的样本 6、统计量:由样本计算的特征数 7、参数:由总体计算的特征数 8、精确性:指在试验或调查中某一试验指标或性状的重复观察值彼此接近的程度9、系统误差:系统误差又叫做片面误差。它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差。 10、偶然误差:一类由于偶然的或不确定的因素所造成的每一次测量值的无规则变化(涨落),叫做偶然误差,或随机误差。 11、连续性变数资料:指用量测方式获得的数量性状资料 12、离散型变数资料:指用计数方式获得的数量性状资料 13、算术平均数:指资料中的各观测值的总和除以观测值个数所得的商,简称平均数或均数 14、平均数:资料或代表数,主要包括算术平均数,中位数,众数,几何平均数及调和平均数 15、标准差:是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。 16、方差:度量总体(或样本)各变量间变异程度的参数(总体)或统计量(样本)。 17、离均差平方和:样本各观测值变异程度大小的另一个统计数 18、试验:在一定条件下对自然现象所进行的观察或试验统称为试验 19、随机事件:随机试验的每一种可能结果 20、概率:事件本身所固有的数量指标,不随人的主观意志而改变,人们称之为概率 21、正态分布:若连续性随机变量X的概率分布密度函数,则X服 从正态分布 22、标准正态分布:我们把平均数u=0,σ2 =1时,称为标准正态分布,记为N(0, 1) 23、双侧概率:我们把随机变量X在平均 数u加减不同倍数标准差σ区间 (u-kσ,u+kσ)之外,取值的概率称为双 侧概率 24、单侧概率:对应于两尾概率可以求得 随机变量x小于小于u-kσ或大于u+kσ的 概率 标准误:反映样本平均数的抽样误差的大 小的一种指标 25、假设检验(显著性检验):假设检验是 数理统计学中根据一定假设条件由样本推 断总体的一种方法。 26、t检验:两总体方差未知但相同,用 以两平均数之间差异显著性的检验。 27、无效假设:被检验的假设,通过检验可 能被否定,也可能未被否定。 28、备择假设:是在无效假设被否定时准 备接受的假设。 29、显著水平:用来确定无效假设是否被 否定的概率标准。 30、Ⅰ型错误:把非真实差异错判为真实 差异。 31、Ⅱ型错误:把真实差异错判为非真实 差异。 32、双侧检验(双尾检验):利用两侧尾部 的概率进行的检验。 33、单侧检验(单尾检验):利用一侧尾部 的概率进行的检验。 34、分位数:又称百分位点。若概率 0 Za)=α的 实数 35、配对设计:是指先根据配对的要求将 试验单位两两配对,然后将配对成子的两 个实验单位随机分配到两个处理组中。 36、区间估计:是指在一定概率保证下指 出总体参数的可能范围。 置信区间:是指在进行区间估计时所给出 的可能范围。 37、置信度(置信概率):是指在进行区间 估计时所给出的概率保证。 38、方差分析:实质上是关于观测值变异 原因的数量分析。 39、试验指标:用来衡量试验结果的好坏 或处理效应的高低,在试验中具有测定的 性状或观测的项目。 40、试验因素:实验中所研究的影响试验 指标的因素。 41、因素水平:试验因素所处的某种特定 状态或数量等级。 42、试验处理:率先设计好的实施在试验 单位上的具体项目。 43、试验单位:在试验中能够接受不同试 验处理的独立的试验载体。 44、多重比较:统计学上指多个平均数两两 之间的相互比较称为多重比较。 45、主效应:由于因素水平的改变而引起 试验指标观测值平均数的改变量称为主效 应。 46、简单效应:在某因素同一水平上,另 一因素不同水平试验指标观测值之差称为 简单效应。 47、适合性检验:判断实际观察的属性类 别分配是否符合已知属性类别分配理论或 学说的假设检验。 48、独立性检验:根据次数资料判断两类 因子彼此相关或相互独立的假设检验。 49、相关变量:存在相关关系的变量叫做 相关变量。 50、回归分析:是确定两种或两种以上变 数间相互依赖的定量关系的一种统计分析 方法。 51、相关分析:研究随机变量之间相关性 的统计分析方法。 52、直线回归分析:如果在回归分析中, 只包括一个自变量和一个因变量,且二者 的关系可用一条直线近似表示,这种回归 分析称为直线回归分析 53、直线相关分析:对两个相关变量间的 直线关系进行相关分析称为直线相关分析 54、相关系数:统计学上把决定系数r2 的平方根称为x与y的相关系数 55、试验设计:以概率论和数理统计为理 论基础,经济地,科学地安排试验的一项 技术。 56、随机:使用随机方法对试验动物分组, 使参试动物分入各试验处理组的机会相 等,以避免试验动物分组事试验人员主观 倾向的影响 57、重复:试验的每一个处理都实施在两 《心理统计与实验设计》(2004博士生招生考卷) 一、某校对学生课外活动进行调查,调查有两个因素,一是性别,另一个为课外活动 内容(分体育、文娱和阅读三类),现己获得男女学生各自最喜欢的活动内容的人数,想了解男女学生在课外活动内容上是否有显著差异,该用什么统计方法?说明理由。 (10分) 二、在双组前后测实验设计中,一个为实验组,一个为控制组,前后测数据都是连续 数据,总体方差未知,请问这一实验该用哪些统计方法处理数据?请详细说明。(10分) 三、什么是相关系数?积差相关需要满足哪些条件?(10分) 四、下表是一张方差分析表,请根据这张表解释方差分析结果。(10分) Tests of Between-Subjects Effects Dependent Variable: x a R Squared = .873 (Adjusted R Squared = .757) 五、下面表格都是因素分析的结果,请对这些结果用文字加以说明。(15分) Factor Analysis 六、在一项儿童发展心理学的研究中,研究者收集到了400名7岁、9岁、11岁、13岁儿童(每一年龄100名儿童,男女各半)以下一些资料: 1.每一儿童父母教养方式的类型资料(分类数据) 2.每一儿童性格类型资料(分类数据) 3.每一儿童心理健康水平资料(连续数据,基本服从正态分布) 如果让你统计处理这些资料,你将运用哪些统计方法?每种方法想达到什么目的?(15分) 七、举例说明单因素拉丁方实验设计的特点。(10分) 八、请设计一个2*3混合设计的心理学实验。要求A因素为被试间设计,B因素为被试内设计。(20分) 2006-2007第1学期生物统计考试试卷(B 卷)答案 一、名词解释(10×2) 1、参数:描述总体的特征数。 2、连续性变数:指在任意两个变量之间都有可能存在只有微量差异的第三个变量存在,这样一类变数称为连续性变数 3、唯一差异原则:除了被研究的因素具有的不同水平外,其余各种环境因素均应保持在某一特定的水平上。 4、两尾测验:有两个否定区,分别位于分布的两尾。 5、显著水平:否定无效假设0H 的概率标准。 6、互斥事件:如果事件1A 和2A 不能同时发生,即12A A 为不可能事件,则称事件1A 和2A 互斥。 7、无偏估计:在统计上,如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的无偏估值。 8、相关系数:表示两组变数相关密切程度及性质的变数,r *9、否定区:否定无效假设0H 的区间。 *10、偏回归系数:任一自变数(在其他自变数皆保持一定数量水平时)对依变数的效应。 二、是非题(5×1) 1、二项分布的平均数为np ( √ ) 2、在二因素完全随机化设计试验结果的方差分析中,误差项自由度为(1)(1)n ab --。( × ) 3、2χ分布是随自由度变化的一簇间断性曲线,可用于次数资料的假设测验。( × ) 4、一个显著的相关系数或回归系数说明X 和Y 变数的关系必为线性关系。( × ) 5、在一组变量中,出现频率最多的观察值,称为中位数。( × ) 三、选择题(10×2) 1、算术平均数的重要特征之一是离均差的总和( C ) A 、最小 B 、最大 C 、等于零 D 、接近零 2、一批种子的发芽率为0.75p =,每穴播5粒,出苗数为4时的概率( A ) A 、0.3955 B 、0.0146 C 、0.3087 D 、0.1681 3、回归截距a 的标准误等于( D ) A 、X SS n Q )2(- B 、 X X Y SS x X n S 2 )(1-+ C 、X X Y SS x X n S 2 )(11-++ D 、 X X Y SS x n S 2 1+ 4、Y~N(10, 80),当以1210n n ==进行抽样时,128y y ->的概率约为[ B ]。 A. 0.10 B. 0.05 C. 0.025 D. 0.01 5、成对比较的特点不包括( D ) A 、加强了试验控制 B 、可减小误差 C 、不必考虑总体方差是否相等 D 、误差自由度大 6、方差分析基本假定中除可加性、正态性外,尚有[ C ]假定。 A 、无偏性 B 、无互作 C 、同质性 D 、重演性 7、若否定 H ,则( ) A 、必犯α错误 B 、必犯β错误 C 、犯α错误或不犯错误 D 、犯β错误或不犯错误 8、随机抽取200粒棉花种子做发芽试验,得发芽种子为150粒,其与00.8p =的差异显著性为( A )。 A 、不显著 B 、显著 C 、极显著 D 、不能确定 9、当30n ≤时,测验一个样本方差2 s 和某一指定值C 是否有显著差异的方法用( B ) A 、F 测验 B 、2 χ测验 C 、t 测验 D 、u 测验 *10、多元线性回归方程的假设测验可用( A )。 A 、F 测验 B 、F 或t 测验 C 、t 测验 D 、u 测验 《生物统计附试验设计》复习题 (考试共有五种题型:其中名称解释5道共10分,单选10道共10分,判断题10道共10分,计算题4道共60分,问答题2道共10分) 一、名词解释题 1.总体: 4.准确性: 7.系统误差: 8.样本: 11.随机样本: 12.样本容量: 13.假想总体:, 15.数量性状资料: 17.全距: 18.简单表: 20.众数: 21.样本标准差: 22.几何平均数: 23.算术平均数: 24.调和平均数: 26.离均差: 28.变异系数: 29.统计推断: 30.小概率事件实际不可能性原理: 31.显著水平: 32.I型错误: 34.非配对设计: 35.配对设计:, 37.试验处理: 38.试验指标: 39.重复: 40.试验单位: 41.因素水平: 42.多重比较。 44.独立性卡方检验: 46.相关分析: 47.回归分析: 51.相关系数: 52.试验设计(狭义): 53.试验方案: 56.局部控制: 57.完全随机设计: 59.多因素试验: 试验中只进行一种因素的测定 62.完全随机抽样: 二、单项选择题 1、单因素方差分析的数学模型是()。 ①x ij =μ+αi+εij ②x ij =μ+αi③x i =μ+αi+βj +εij ④x ij =αi +εij 2、.在单因素方差分析中一定有() ①SST=SSt+SSe②SSt〉SSe③SSt=SSe④SSt<SSe 3、一元线性回归的假设检验()。 ①只能用t检验②只能用F检验③两者均可④两者均不可 4、在单因素方差分析中一定有() ①dfT=dft+dfe②dfT≠dft+dfe ③dfT=dft ④dft=dfe 5、简单相关系数的取值范围是() ①-1 1.设计一个多因素实验,要求有一个自变量与语言有关,一个与自变量与语言无关,分别说明: (1)你研究的问题; (2)自变量; (3)因变量; (4)变量控制; (5)实验材料的处理; (6)实验过程; (7)数据的统计处理。 答:(1)我研究的问题是:年龄与文章主题熟悉度对小学儿童阅读理解的影响。 (2)自变量 ①年龄(被试间变量),分三个水平:8岁(小学一年级儿童)、10岁(小学三年级儿童)、12岁(小学五年级儿童); ②文章主题熟悉度(被试内变量),分两个水平:熟悉(和儿童生活紧密相关的文章,如描述游乐园的文章)、不熟悉(儿童很难接触领域的文章,如论述某个生僻物理原理)。 (3)因变量 因变量为阅读理解成绩,对被试回答文章后选择题的情况进行评分,每道题答对计1分,答错或未答计0分,共30 题,满分为30分。每位被试的得分即阅读理解成绩。 (4)变量控制 ①儿童性别,控制方法:在同一个年龄选择同样数量的男生、女生; ②儿童智力水平,控制方法:排除智力水平太高或太低的儿童(教师评定); ③文章字数,控制方法:全部选择字数在400左右的文章,字数变动在20字之内; ④生字水平,控制方法:将生字控制在5~10个,生字指超出小学语文大纲的汉字。 (5)实验材料 ①与儿童生活紧密相关的文章3篇,每篇400字左右,包含生字5~10个每 篇文章后有5道针对文章内容的选择题,四选一,由五位资深语文教师共同编制; ②儿童很难接触领域的文章3篇,每篇400字左右,包含生字5~10个每篇文章后有5道针对文章内容的选择题,四选一,由五位资深语文教师共同编制。 (6)被试选择、材料分配与实验过程 共60人。 每个被试均阅读全部的6篇文章,阅读完每篇文章都要完成文章后的选择题,共限时40分钟,文章呈现的顺序在被试间按照拉丁方进行平衡。 (7)数据的统计处理 ①数据整理:删除得分在平均数上下三个标准差之外的被试数据; ②描述统计分析:计算出6个处理水平结合下被试得分的平均数和标准差; ③方差分析:使用SPSS软件分析主效应和交互作用。 如果因素一(年龄)主效应显著,再进行事后检验,判断差异主要存在于哪两个或三个因素之间。然后结合描述统计分析,得出显著大于或显著小于的结论。 如果因素二(文章主题熟悉度)主效应显著,则可结合描述统计分析,得出显著大于或显著小于的结论。 如果两因素交互作用显著,则分两个方向进行简单效应检验:在年龄三个水平上,分别对熟悉度两个水平之间差异的显著性进行检验,考察在年龄的哪一个或哪几个水平上,熟悉度不同的文章差异显著;也可以在文章主题熟悉度的两个水平上,分别对年龄三个水平之间差异的显著性进行检验,考察在主题熟悉度的哪一个或两个水平上,不同年龄个体的阅读理解成绩差异显著。 2.设计实验,说明咖啡是否对人的集中注意有影响? 答:(1)被试:北大在校大学生16名,年龄18~24岁,男女各8名,视力正 一、准实验设计 准实验设计:未对自变量实施充分的控制,但使用真实实验的某些方法整理、搜集、统计分析数据的研究方法。 单组时间序列设计 1.设计方案:对一组被试先进行周期性测量,之后引入实验处理X,然后再进行一系列周期性的测量。比较插入实验处理前后测量的变化趋势,从而推断实验处理是否产生效果。 2.优点:1.可以较好的控制“成熟”因素对实验处理效果的影响。在O1~O8的系列测量过程中,相邻两次测量的时间间隔基本相同,可以认为在每个时间间隔内“成熟”的发展基本相同。2. 可以有效的控制测验因素的干扰。由于每个被试的成绩都是经过反复测验而得到的一系列结果,这样就能够降低由于只做一次测验而出现的有偏样本成绩的概率,可以有效地减少测量偏差。3.缺点:1、由于无对照组,因而不能有效地识别和控制伴随实验处理发生的偶发事件的影响,不能排除那些与实验处理同时出现的附加变量的影响。2、多次实施前测往往会降低或增加被试对实验处理的敏感性,从而在被试身上产生作用而影响其实验处理后的测量成绩。 4.注意事项:1、研究中要保持实验情境的相对稳定,减少不必要的条件变化对实验结果的干扰。 2、通过单组时间序列设计实验不能得到最后的、确定性的结论,如果想得到肯定的因果关系结论,应选用有控制组参加的实验设计。 3、由于研究中对实验条件控制不是很严格,因此研究者应充分考虑那些突发的或随意事件,详细记录研究中伴随的各种事件,这有利于对结果作出更符合实际的科学评估和解释。 单组相等时间样本设计 1.设计方案:对一组被试连续抽取多个相等的时间样本,即选择完全相等的多个时间段,在其中的一个时间样本中实施实验处理,而在后续的另一个时间样本中并不实施实验处理,并通过对两种时间样本的观测分数之间的差异分析来比较实验处理的准实验设计。 2.数据分析:可对结果做三方面的检验:1.处理条件与无处理条件间的比较,以考察存在处理效应的可能性;2.分别在有处理条件下和无处理条件下考察时间因素的简单效应,这主要是分析研究中的时间效应或顺序效应; 3.分析实验处理与处理顺序的交互效应,以考察在时间序列中不同处理的不同效应。 3.优点:在控制影响内部效度的因素方面是完全有效的,如能较好控制“历史”作用的影响。 4.缺点:1.采用单组设计,实验处理后再重复进行做过的测验可能会增加或降低实验处理实验安排中,实验处理的间断出现会使被试产生新异感,并暴露实验目的,由2.的敏感性。. 此产生实验的霍桑效应。3.实验的重复进行也会产生一系列的顺序效应。 多组不相等组前后测设计 1.设计方案:先将实验组和控制组接受前测,然后给实验组处理,再对这两组被试进行后测。 2.优点:首先,增添了控制组,从而控制了历史、成熟、测验等因素的干扰。其次,前测可以了解实验处理实施前的初始状态,从而也就对选择有了初步的控制。 3.缺点:1.实验组与控制组是不对等的,因而选择与成熟、选择与实验处理的交互作用可能会降低效度。2.不能证明实验处理的长期效应。 多组不等组前后测时间序列设计 1.数据分析:方法1.求出实验组和对照组的前测成绩的平均数,以及实验组和对照组的后测成绩的平均数;然后求出实验组前测成绩和后测成绩平均数的差异,以及对照组前测成绩和后测成绩平均数的差异。采用独立样本的t检验对实验组差值和对照组的差值进行比较。方法 2.回归直线方程。 2.优点:1.既能对一组的一系列的观测成绩的变化趋势进行了解,也能对两组的前测和后测的系列观测成绩的趋势进行比较,以估计实验处理的效果。2.实际使用较多的一种比较完善的准实 1.设计一个多因素实验,要求有一个自变量与语言有关,一个自变量与语言无关,分别说明: (1)你研究的问题; (2)自变量 (3)因变量 (4)变了控制 (5)实验材料的处理 (6)实验过程 (7)数据的统计处理 答:(1)我研究的问题是:年龄与文章主题熟悉度对小学儿童阅读理解的影响 (2)自变量 A.年龄(被试间变量),分3个水平:8岁(小学一年级儿童)、10岁(小学三年级儿童)、12岁(小学五年级儿童); B.文章主题熟悉程度(被试内变量),分2个水平:熟悉(和儿童生活紧密相关的文章,如描述游乐园的文章)、不熟悉(儿童很难接触领域的文章,如论述某个生僻物理原理)。(3)因变量 因变量为阅读理解成绩,对被试回答文章后选择题的情况进行评分,每道题答对计1分,答错或未答计0分,共30题,满分为30分。每位被试的得分即阅读理解成绩。 (4)变量控制 A.儿童性别,控制方法:在同一个年龄选择同样数量的男生、女生; B.儿童智力水平,控制方法:排除智力水平太高或太低的儿童(由教师评定);C.文章字数,控制方法:全部选择字数在400左右的文章,字数变动在20字之内;D.生字水平,控制方法:讲生字控制在5-10个,生字指超出小学语文大纲的汉字。(5)实验材料 A.与儿童生活紧密相关的文章3篇,每篇400字左右,包含生字5-10个,每篇文章后有5道针对内容的选择题,四选一,由5位资深语文教师共同编制; B.儿童很难接触领域的文章3篇,每篇400字左右,包含生字5-10个,每篇文章后有5道针对内容的选择题,四选一,由5位资深语文教师共同编制。 (6)被试选择、材料分配与实验过程 每个被试均阅读全部6篇文章,阅读完每篇文章都要完成文章后额选择题,共限时40分钟,文章呈现的顺序在被试间按照拉丁方进行平衡。 (7)数据的统计处理 A.数据处理:删除得分在平均数上下三个标准差之外的被试数据; B.描述统计分析:计算出6个处理水平结合下被试得分的平均数和标准差; C.方差分析:使用SPSS软件分析主效应和交互作用。 如果因素一(年龄)主效应显著,再进行事后检验,判断差异主要存在与哪两个或三个水平之间。然后结合描述统计分析,得出显著大于或小于的结论。 医学统计学重点 第一章绪论 1.基本概念: 总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。 样本:从总体中随机抽取部分个体的某个变量值的集合。 总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。 统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。 抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。 频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。 概率:频率所稳定的常数称为概率。 统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。 统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。 2.样本特点:足够的样本含量、可靠性、代表性。 3.资料类型: (1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的数值,有度量衡单位。 (2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料) ①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由 各分组标志及其频数构成。包括二分类资料和多分类资料。 二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。 多分类:将观察对象按多种互斥的属性分类 ②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单 位的个数所得的资料。 4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。 一、选择题 1.实验的研究方法:观察法、相关法、实验法 P22 2.自变量:在实验中实验者所操纵的,对被试的反应产生影响的变量 3.因变量:因自变量的变化而产生的现象变化或结果,是实验者要观察和记录的变量。 4.额外变量:除了自变量外其他可能会影响实验结果的其他变量随机的额外变量:偶然起 作用的额外变量。(如受到意外干扰、仪器性能不稳定等)系统的额外变量:经常地、稳定地起作用的变量。 5.操作性定义:根据可观察、可测量或可操作的特征来界定研究变量的定义。用于详细说 明研究者要观察、测量和操作研究变量的程序和活动。这指出研究者要测量一个变量必须做些什么,来界定或给予一个研究变量的含义。 例如:智力:在某个智力量表上测得的分数。身高:为受测者采立姿,由地面到头顶点的垂直距离。攻击性、抑郁、焦虑、饥饿 6.实验者效应:主试(实验者)在实验中可能以某种方式(表情、手势、语气)有意无意 地影响被试,使他们的反应附和主试的期望。 控制办法:指导语标准化、采用双盲实验设计 7.被试期望效应:由于受试者预期某些测试结果,于是无意识地以某种形式操纵了实验步 骤,或向实验人员报告他们希望得到的结果。受试者期望效应能严重歪曲实验结果,因此需利用双盲(double-blind)方式进行实验来消除这效应。 8.数据的统计方法: 1)集中趋势:指一个可以代表分布中所有分数的数值。包括平均数、中数和众数 研究问题:参加研究的女性的平均年龄是多少?参加研究的男性的平均年龄是多少? 2)差异量数:标准差(SD)是常用的描述分数离散程度的指标。 研究问题:男性每周学习小时数的标准差是多少? 3)相关量数:两个变量之间的关系程度,用相关系数表示。数据类型不同,计算相关的 公式不同。 斯皮尔曼等级相关研究问题:学生的出生顺序与第一年的绩点有什么关 系? 皮尔逊积差相关研究问题:学习小时数与第一年的绩点有什么关系? 4)卡方:用来确定观察次数与期望次数之间是否存在差异的非参数统计。 研究问题:男性和女性在研究水平上存在差异吗? 5)T检验:用于判断两组等距或等比变量在统计上是否存在显著差异,分为独立样本t 检验和相关样本t检验。 研究问题1(独立样本):研究水平高的学生和低的学生相比,第一年的绩 点更高吗? 研究问题2(相关样本):注:相关样本一般用于两种情况(1)同一个体的 成对数据(2)经过严格匹配的数据对研究水平高的学生来说,第一年和 第二年的绩点是否存在差异? 6)方差分析:自变量为分类变量,因变量为连续变量 研究问题:学习满意度三个水平之间的学习小时数有没有差异? 7)线性回归:与皮尔逊积差相关类似,都是表示变量之间的显著关系。 线性回归的优点是可以使用多个自变量,用公式,由已知自变量预测因变 量的值。 研究问题:如何根据学生的学习时间,预测他们的绩点? 二、简答题 a)三个研究方法(测验一)P22 b)第二章第二节实验研究的设计 《心理统计与实验设计》(2004博士生招生考卷) 一、某校对学生课外活动进行调查,调查有两个因素,一是性别,另一个为课外活动内容(分体育、文娱和阅 读三类),现己获得男女学生各自最喜欢的活动内容的人数, 想了解男女学生在课外活动内容上是否有显著差异,该用什么统计方法?说明理由。 (10 分) 二、在双组前后测实验设计中,一个为实验组,一个为控制组,前后测数据都是连续 数据,总体方差未知,请问这一实验该用哪些统计方法处理数据?请详细说明。 分) 三、什么是相关系数?积差相关需要满足哪些条件?(10分) 四、下表是一张方差分析表,请根据这张表解释方差分析结果。(10分) Tests of Between-Subjects Effects 五、下面表格都是因素分析的结果,请对这些结果用文字加以说明 Factor An alysis Com m unalitie s Extractio n Method: Prin cipal Comp onent An alysis. (10 (15 分) Total Varia nee Expla ine d Comp onent Tota Initial E igenvalues Ex tracti on Sums of Squared Loadi ngs % of Varianc e Cumulativ e % Total % of V aria nc e Cumulativ e % 1 5.: 8 2 52.824 52.824 5.282 52.824 52.824 2 1.1 19 11.185 64.010 1.119 11.185 64.010 3 1.( 06 10.05 5 74.065 1.006 10.055 74.065 4 >79 6.79 80.859 5 i19 5.18' 7 86.046 6 61 4.60! 90.655 7 199 3.98( 94.641 8 !82 2.82( ) 97.460 9 !43 2.42! ) 99.890 10 )11 .11 0 100.000 Extracti on Method: Prine ipal Comp onent An aly sis. Com ponent Matrix a a. 3 comp onents extracted. 一、研究课题:考察“不同面部表情的识别速度与识别准确性存在差异” [预期可能结果:不同的面部表情,识别速度有差异;或者不同的面部表情,识别的准确率也有差异] 引言:速度—准确性权衡是关系到一切反应时实验信度的基本问题,下面我们将尝试通过一个简单的生活化的实验来展示任务速度和任务准确性之间普遍的权衡关系。在反应时实验中,当被试追求较快的速度时,必然要以牺牲准确性为代价。同样,当被试力求高的准确性时,也必然要以放慢速度为代价。在具体的实验中,被试究竟会如何权衡二者的关系,取决于很多因素。本实验主要探讨不同面部表情(痛苦、微笑、悲哀、快乐)识别速度与准确率是否存在显著差异。 假设:假设不同面部表情的识别速度与识别准确性存在差异 二、实验目的:通过实验证明不同面部表情(痛苦、微笑、悲哀、快乐)的识别速度与识别准确性存在差异,本实验旨在研究不同面部表情的识别速度与识别准确性存在差异,通过自编的e-prime实验程序对四十名被试进行施测。 三、实验材料:痛苦、微笑、悲哀、快乐的图片(均选自于标 准的实验图片库)、电脑、e-prime程序 四、实验设计 采用单因素完全随机化设计 自变量为不同面部表情、区分为(痛苦、微笑、悲哀、快乐)四种。每个小组只接受一种实验处理,只对一种表情做出反应。 因变量为反应时、准确率,分别是识别的准确率、以及被试对不同面部表情识别的反应时。 五、实验程序: 5.1被试构成: 采用简单随机抽样,在弘德楼随机选取了几个自习室,共选取了40个被试。男女各半,年龄为18-23岁,随机分为四个小组。 5.2研究工具: 在计算机上自编好e-prime实验程序 5.3 研究过程 (1)正式实验前被试要先进行几次类似练习,以熟悉按键反应。(2)被试坐在电脑前,接受相同的指导语。其指导语为:“在接下来的一段时间里你将继续进行此类题目的正式作答,请用心作答”。被试按键确认后即开始正式实验、期间不再中断休息。 (3)使用主试自编计算机视觉搜索程序,每帧呈现一副面部表情图片,每幅图片呈现的间隔时间一致,随机播放图片。每种表情的图片《生物统计附试验设计》第五版-课后习题[前六章]
实验心理学实验设计方案
本科《生物统计附实验设计》2793
生物统计附试验设计
心理学实验设计方案
生物统计附实验设计(明道绪__第四版)题库及答案
上海师范大学2004年博士考试《心理统计与实验设计》
生物统计与试验设计试卷A
生物统计附试验设计题目
实验心理学的相关实验设计
实验心理学题库整理版
心理学实验设计
医学统计学重点
实验心理学心理统计期末复习知识点
最新上海师范大学年博士考试《心理统计与实验设计》资料
实验心理学实验设计方案