当前位置:文档之家› 田间试验统计学

田间试验统计学

田间试验统计学
田间试验统计学

三、填空题

1.(统计数)是总体相应参数的估计值。

2.χ2临界值由()和()决定。

3.F分布的平均数μF=( 1 )。

4.F临界值的取值由()、()和()决定。

5.SSR临界值的取值由()、()和()决定。

6.t分布的平均数=(0 ),标准差=()。

7.t临界值的取值由(自由度)和(概率?)

决定。

8.标准化正态分布方程的参数是μ=(0 )和σ2 =( 1 )。

9.泊松分布的参数是μ=(m )和σ=(√m )。

10.常用表示资料变异程度的方法有方差、标准差、(极差)和(变异系数)四种。

11.常用的多重比较结果的表示方法有(列梯形表法)、(划线法)和(标记字母法)。

12.常用的随机排列的田间试验设计有(完全随机)设计、随机区组设计、拉丁方设计、

裂区设计、再裂区设计和(条区)设计等。

13.二项分布的两个参数μ=(np),σ=(根号npq)。

14.二项总体的样本平均数分布的两个参数μ=(),σ=()。

P66

15.二项总体分布的两个参数μ=(p ),σ =(pq )。

16.方差分析的三个基本假定是(可加性)、(正态性)和(误差同质性)。

17.方差分析的三个基本假定是:(1)处理效应与环境效应应该是(可加的);(2)试验误

差应该是(随机的)、彼此独立的,而且作正态分布,具有平均数为零;(3)所有试验处理必须具有(共同的误差方差),即误差同质性假定。

18.方差分析中,常用的变数转换方法有(平方根转换)、(对数转换)、(反正弦转换)和

采用几个观察值的平均数作方差分析等四种。

19.根据处理排列方法,常用的田间试验设计可分为(顺序排列)和(随机排列)两类。

20.观察数据依研究形状、特性不同一般可分为(数量性状)资料和(质量性状)资料两大

类。

21.回归估计标准误S y /x与离回归平方和Q和数据对数n的关系是S y /x=

/y x

s==)。P161

22.回归估计标准误S y/x与回归平方和U以及数据对数n的关系是S y/x=(?)。

23.回归关系的假设测验可由(t测验)或(F测验)给出;还可通过测定同一资料相关系

数的显著性来明确回归关系的显著性。

24.回归平方和U与SP、SS X的关系是U=(P164 ),其自由度=(1)。

25.回归系数b的标准误与回归估计标准误S y/x、x变数平方和SSx的关系是S b=(P63)。

26.基本的抽样方法包括(顺序抽样)、(典型抽样)和(随机抽样)三类。

27.建立直线回归方程y

)

=a+bx时,a称为(回归截距),b称为(回归系数)。

28.建立直线回归方程?y=a+bx时,a与y、x和b的关系是a=(y-b x),b与x、x、y、

y的关系是b=()。

29.具有共同性质的个体所组成的集团称为(总体);从该集团中抽取若干个体来研究,

这些个体的集合称为(样本)。

30.决定系数r2一般只用于表示相关程度,而不表示(相关性质)。

31.决定系数r2与SP、SS X、SS y的关系是r2=()。P174

32.控制试验误差的三条途径是(选择同质一致的试验材料)、(改进操作和管理技术,使

之标准化)和(控制引起差异的外界主要因素)。

33.离回归平方和Q与SS y、SSx、SP的关系是Q=(

2

74.6670

SP

Q SSy

SSx

=-=(不要数字) )。

34.两个变数间的关系若具有原因和结果的性质,则定义原因变数为(自变数),定义

结果变数为(依变数)。

35.某样本的6个观察值分别为2,3,9,4,1,5;则其中数为( 3 ),变异系数

为(75.7% )。

36.某样本的样本容量为9,标准差为6,则样本平均数的标准误为( 2 )。

37.潘松分布的两个参数μ=(np ),σ=(√np )。

38.如X服从N(20,25),已知P (X<16)=0.21,则P(16

P(X>24)=(0.21 )。

-

-

-

2

)

(

)

)(

(

x

x

y

y

x

x

39.如X服从N(30,25),已知P(X<26)=0.2119,则P(26

40.如果由回归方程估计X为某一定值Y总体的平均数Y,则Y的95%置信限为

();估计X为某一定值时Y总体某一观察值y0,则y0的95%置信限为()。

41.设有A和B两个试验因素,各具有3和4个水平,随机区组设计,3次重复,则该试验

有(12 )个处理,(36 )个小区,(36 )个观察值。

42.设有K=10个样本,采用t测验两两比较共需测验(45 )次。

43.设有k=8个样本,采用t测验两两比较共需测验(28 )次。

44.设有k组数据,每组均有n个观察值,则方差分析中总变异自由度为(nk-1 ),矫

正项C与所有观察值总和T、n、k的关系是C=(

2 ()x

nk

)。

45.试验误差的三个主要来源是(实验材料固有的差异)、(实验室农事操作和管理技术

的不一致所引起的差异)和(进行试验是外界条件的差异)。

46.室内试验只是(辅助性)性试验方法;田间试验是农业科学试验的(主要形式)形

式,其(主要的)地位不可替代。

47.适用于间断性变数和属性变数资料的常用次数分布图有(条形图)和(饼图)。

48.随机变数的概率分布按其变异性质可分为(离散型)和(连续型)两类;按其数据

来源又可分为(样本分布)、(理论分布)和(抽样分布)。

49.随机变数的概率分布按其数据来源可分为(样本分布)、(理论分布)和(抽样分

布)。

50.随机变数分布的3种表示方法是()()( )。

51.田间实验根据实验因素的多少可分(单因素试验)、(多因素试验)和(综合性实验)

为三类。

52.田间实验设计的目的是(降低实验误差)和(提高试验的精确度)。?

53.田间试验的特点是既受(实验材料本身)的影响,又受(环境条件)的影响。

54.田间试验设计的三个基本原则是(重复)、(随机排列)和(局部控制)。

55.统计假设测验按其所考虑的概率可分为(两尾测验)和(一尾测验)两类。

56.统计假设的基本任务是由()分布经过()分

布的测验来估计()分布。

57. 统计假设可分为( 无效假设 )和( 备择假设 )两种。

58. 土壤肥力差异的两种主要表现形式是(肥力高低变化较有规则 )和( 斑块状差异 )。

59. 为了提高回归和相关分析的准确性,两个变数的成对观察值一般应有( 5 )对以

上。

60. 相关系数r 的绝对值越接近1,表示相关越( 密切 );越接近于0表示越可能( 无相

关 );至于r 的正或负,则是表示( 相关的性质 )。

61. 相关系数r 与SP 、SS x 、SS y 的关系是

r = (()()

x x y y r --==。 62. 样本平均数分布的方差x σ2 与总体方差σ2 、样本容量n 的关系是x σ2 =(σ2

/n )。

63. 样本中各观察值与其平均数的差数的平方的总和为( 最小 )。

64. 样本中各观察值与其平均数的差数的总和为( 0 );样本中各观察值与平

均数的差数的平方的总和为( 最小 )。

65. 一般而言,假设测验可能犯( 两 )类错误。

66. 一般正态分布的正态离差U=( );样本平均数分布的正态离差U=

( )。

67. 一个4因素3水平试验的所有可能处理组合数为( 81 )。

68. 由回归方程估计x 为某一定值时条件总体平均数的95%置信区间为

( );估计x 为某一定值时条件总体预 测值的95%置信区间为( )。

69. 有12个处理,要进行随机区组设计,可查得随机数字表中任一页的任一行,去掉

( 00 )、( 97 )、( 98 )和( 99 )四个数字后,凡大于12的数均被12除后得余数,将重复数字划去,即得12个处理的排列次序。

70. 有6个处理,每处理3次重复,用对比法设计,至少要安排( 18)个对照。

71. 有8个处理,每处理3次重复,用对比法设计,至少要安排( 24 )个对照。

72. 有一个总体共有4个个体,分别为2,4,6,8,从总体中进行复置随机抽样,每次抽2

个观察值,抽出所有样本,则共有(6)个可能样本;所有样本平均数分布的平均数为

(5),标准差为(√2 )。

73. 有一样本,其6个观察值分别为6,3,8,4,1,3;则其中数为( 6 ),均方为

( 1429/180 )。

74.有一样本,其6个观察值分别为7,3,8,4,2,3;则其中数为(6)。

75.有一样本,其6个观察值分别为7,4,8,5,2,3;则其中数为(6.5)。

76.有一样本的5个观察值为2,7,7,5,4;则其样本均方为(3.6 )。

77.有一正态分布N(16,4),已知U0.05=1.96,则其分布中间有95%观察值的全距为(3.92 )。

78.有一正态分布N(30,9),则落于24与36之间的观察值的百分数为(95.45%)。

79.有一正态分布N(36,9),已知U0.01=2.58,则其分布中间有99%观察值的全距为

(15.48 )。

80.有一组观察值为11,26,15,24,9,22;则其极差为(15 )。

81.在成组数据的平均数比较时,当两样本的总体方差已知时用(u )测验;当两样本的

总体方差未知,但可假定二者相等且为小样本时用(t )测验。

82.在对比法和间比法试验结果的统计分析中,凡相对生产力超过(对照10%以上)的品

种一般可以认为显著优于对照;相对生产力仅超过(对照5%左右)则宜继续观察。

83.在随机区组设计中,小区的随机可借助于随机数字表来进行。如有12个处理,可查得

表中任一页的任一行,去掉00、(97 )、(98 )和(99 )四个数字后,凡大于12的数均被12除后得余数,将重复数字划去,即得12个处理的排列次序。

84.在一定的概率保证之下,估计出一个能够覆盖参数μ的区间称为(置信区间),区间的

上下限称为(置信限),区间的长度称为(置信距),保证该区间能覆盖参数的概率(1-α)称为(置信系数或置信度)。

85.在正互作时,从各因素的最佳水平推论最优组合,估计值将偏(低)。

86.2χ值与观察次数O、理论次数E、分组数k的关系是2χ=(

2

2

1

()

k O E

E

χ

-

=∑),

2

χ分布是(连续性)变数的理论分布。

四、简答

1.请写出两因素随机区组试验方差分析的自由度和平方和分解的公式。

答:设有A和B两个试验因素,各具a和b个水平,随机区组设计,r次重复,则该试验有a×b个处理,abr个小区,abr个观察值。其自由度和平方和分解如下:

自由度分解:

注意Vt=V A + V B + V A×B,V T=Vr+Vt+ Ve

同样处理平方和SSt=SS A+SS B+SS A×B,总平方和SS T=SS r+SS t+SS e

2/如何确定试验小区的面积?1.简述田间试验的基本要求。

一般小区面积60~600尺2,示范性试验小区面积大于3000尺2,确定小区面积时需考虑:①试验种类:如耕作方式试验、灌溉试验、农药试验,小区面积宜大些;品种试验小区面积可小些。

②作物种类:种植密度大的作物如稻麦品比试验,小区面积一般5~15m2;种植密度小的作物如玉米品比试验,小区一般15~25 m2。

③试验地面积:地大小区大,地小小区小。

④土壤差异程度:差异大,小区面积应大。

⑤新品种选育时,对精确度要求从低到高,因此各阶段所采用的小区面积从小到大。

⑥考虑试验中取样需要:取样量大,且为无放回取样时,小区面积应大些。

⑦考虑作物边缘效应和生长竞争的影响,应适当增大小区面积。

边际效应(了解):小区两边或两端的植株占有较大空间而表现的差异。

生长竞争(了解):相邻小区种植不同品种或相邻小区施用不同肥料时,由于株高、分蘖力或生长期的不同,通常将有一行或多行受到影响。

1.试验目的明确。解决生产上问题,预期目标心中有数。2.试验结果可靠。准确度、精确度、系统误差、偶然误差3.试验条件有代表性不能特殊照顾。“一分试验田”4.试验结果能重复。品比,多年多点,小试,中试,大面积示范推广

1.方差分析中多重比较的LSD法和SSR法有何区别?

3/标准差s可以表示资料变异的大小,为什么还需要计算变异系数?它们之间有何关系?

若比较两个样本的变异度,则因单位不同或平均数不同,不能用标准差直接比较。

这时要构造一个不代单位,不受平均数大小影响的变异数,这就是变异系数(coefficient of variation),用CV 表示。 2. 简述拉丁方设计的特点和主要优缺点。

1、特点:将处理从纵横两个方向排列成区组,具有双向局部控制的能力,因而有较高的精确度。

2、优缺点:精度高,但缺乏伸缩性,因为在设计中,重复数必须等于处理数,两者相互制约。

3. 试述田间实验设计的三个基本原则及其作用。

1、重复:试验中同一处理的小区数即为重复次数,与习惯不同。

作用:①估计试验误差

②降低试验误差

③更准确地估计处理效应

2、随机:一个重复中的某一处理,究竟安排到哪一个小区中,不要有主观成见,要通过抽签法或利用随机数字表来安排,使试验中每一处理均有同等机会设置在任何一个试验小区上。

作用:与重复相结合,无偏地估计误差。

3、局部控制:分范围分地段地控制非处理因素,使之对各试验处理小区的影响趋向于最大程度的一致,以降低试验误差。

作用:有效降低试验误差,特别是土壤肥力不匀所造成的误差。

4. 试述方差分析的3个基本假定。

1、可加性(additivity) 处理效应与环境效应是可加的,如:

2、正态性(normality)试验误差 应该是随机的、彼此独立的,具有平均数为0而且作正态分布。

3、同质性(homogeneity)所有试验处理必须具有共同的误差方差

5. 有4?4标准方如下图,横行随机数字为3,1,4,2。直行随机数字为4,1,2,3。品

种随机数字为1,2,4,3。请分步骤写出所需拉丁方排列。

%100_

?=y

s CV

6.试验误差有哪些来源?如何控制?

1)试验材料固有的差异:包菜苗子大小、壮弱。

2)试验时农事操作和管理技术的不一致性所引起的差异:追肥不匀、浇水不均。

3)进行试验的外界条件的差异:如土壤肥力不均。

错误决不允许发生,误差不可避免,但可降低。

控制误差的途径:针对误差来源

1)选择同质一致的试验材料。挑壮苗或肥瘦搭配。

2)改进操作和管理技术,使之标准化。追肥先称,再用小酒杯量;浇水1瓢4蔸。

3)控制引起差异的外界主要因素。土壤差异是最主要又最难控制的。

①控制土壤差异的三种主要措施:选择试验地:种过多年,平整(灌水),肥力较匀(空白试验);采用适当的小区技术:小区大小,形状,安排(以后详论);应用良好的试验设计和相应的统计分析。

②土壤差异的主要表现形式:肥力梯度;斑块状差异。

③空白试验:为精细地测定土壤差异程度,在整个试验地上种植单一品种的作物并规范化管理,收获时将整个试验地划分为面积相等的若干单位分开收获,从各单位产量估计整个田块肥力差异程度及其分布状况。

7.写出单因素随机区组试验方差分析的自由度和平方和分解的公式。

8.确定试验方案的要点是什么?

①据试验提出的问题多少而决定用简单的或复杂的方案。不是越复杂越显得有水平!

②处理的水平应力求简明,水平间差异必须适当,使处理的效应容易表现。N肥5个水平:

50、51、52、53、54 kg/667m2。

③试验方案中应包括作为比较标准的处理,即对照。

④所比较的处理间要应用唯一差异的原则。如根外喷施液体P肥(设三水平),空白对照是不喷,清水对照是只喷清水,往往容易漏掉(水也可能有作用)。

⑤在某种程度上对预期的试验结果要有一些概念,使方案的一组处理更具科学性和必要性。N肥4个水平:50、100、150、200 kg/667m2。

9.在二项百分数资料的方差分析中,在何种情况下要进行反正弦转换?为什么要进行这种

转换?

如果资料系成数或百分数,则它将作二项分布,而已知这一分布的方差是决定于平均数p 的。所以,在理论上如果p<0.3和p>0.7则需要作反正弦转换,以获得一个比较一致的方差。

10.解释并举例说明单因素试验和多因素试验。

单因素试验(single-factor experiment):整个试验中只变更、比较一个试验因素的不同水平,其它作为试验条件的因素均严格控制一致的试验。例如:为了明确某一品种的耐肥程度,施肥量就是试验因素,试验中的处理水平就是几种不同的施肥量,品种及其他栽培管理措施都相同。

多因素试验(multiple-factor or factorial experiment):在同一试验方案中包含两个或两个以上的试验因素,各个因素都分为不同水平,其它试验条件严格控制一致的试验。例如:进行甲、乙、丙3个品种与高、低、中3种施肥量的二因素试验,共有甲高、甲中、甲低、乙高、乙中、乙低、丙高、丙中、丙低等3*3=9个处理组合。这样的试验除了可以明确两个试验因素分别的作用外,还可以检测出3个品种对各种施肥量是否有不同反应并从中选出最优处理组合。

11.试解释成对数据和成组数据。

若试验设计是将性质相同的两个供试单位配成对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为成对数据。

如果两个处理为完全随机设计,各供试单位彼此独立,不论两个处理的样本容量是否相同,所得数据皆称为成组数据,以组平均数作为相互比较的标准。

12.试举例解释必然事件、不可能事件和随机事件。

必然事件:在同一组条件的实现下必然要发生的一类事件。如人总是要死的,水在标准大气压下加热到100℃必然化为蒸汽。P(A)=1。

不可能事件:在同一组条件的实现下必然不发生的一类事件。如水在标准大气压下温度低于0℃不可能呈气态。P(A)=0。

随机事件(偶然事件):在同一组条件的实现下可能发生,也可能不发生的一类事件。如种子可能发芽,也可能不发芽;硬币抛上落下可能正面朝上,也可能反面朝上。P(A) [0,1]。

13.何为两尾测验和一尾测验?在假设测验中何时采用一尾测验,何时采用两尾测验?

两尾测验:当处理可能优于对照也可能劣于对照时,假设测验中所考虑的概率为正态曲线左边一尾概率和右边一尾概率之和,具两个否定区域。

一尾测验:当处理仅可能优于对照或仅可能劣于对照时,假设测验中所考虑的概率仅为正态曲线左边一尾概率或仅为右边一尾概率,仅具一个否定区域。

14. 简述正态分布曲线的特性。

(1) 以μ为原点,左右对称。

(2)在x=μ处,曲线有最大纵高,其算术平均数x ,中数(左右对称),众数(最大纵高)均等于μ。

(3)双参数分布: μ确定其在x 轴上的位置,σ确定其变异度(纵高)。因为曲线下面积是固定的, σ大,变异度大,大的数值愈大,小的数值愈小,两极分化,曲线趴下,纵高下降。

(4)多数次数集中在μ附近,离μ愈远,相应次数愈少,且在x u -相等处有相等次数(因为是对称分布),在x u -≥3σ以外次数极少。

(5)在x u -=1σ处有拐点,x 在μ-1σ处急转直上,在μ+1σ处下降减缓,并以x 轴为渐近线。

(6)正态分布曲线与x 轴之间的总面积=1(完全事件系概率之和为1).

(7)正态曲线任何两个x 定值之间面积或概率完全由μ和σ确定,

18.试述随机区组设计的特点和主要优缺点。

1、特点:使用了田间试验设计三个原则,并根据“局部控制”的原则,将试验地按肥力程度划分为等于重复数的区组,一区组安排一重复,区组内各处理独立地随机排列。是田间试验最常用的设计。

2、优缺点:

优点:(1)设计简单,容易掌握;(2)富于伸缩性,单因素、多因素以及综合性试验都能用;

(3)能提供无偏的误差估计,并有效减小单向的肥力差异,降低误差;

(4)对试验地要求不严,必要时,不同的区组可以分散设置在不同地段上。

缺点:(1)设计不允许处理数太多,一般不超过20个;(2)只能在一个方向上控制土壤差异。

19.为什么建立直线回归方程后,必须对其回归关系进行假设测验?有哪几种测验方法?一、直线回归的假设测验

若x 和y 的总体并不存在直线回归关系,则由其中的一个样本亦可算得一个 y a bx =+),显然这样的回归方程是靠不住的。因此对由样本算得的回归方程必

须进行假设测验,以测定其来自无直线回归关系的总体的概率大小,只有当这种概率小于0.05或小于0.01时,才能冒较小风险或者说有较大把握确认其所代表的总体存在直线回归关系。具体有3种方法,即t 测验,F 测验和将回归模型当成相关模型测验相关系数的显著性(在相关模型中讲)。

总体回归方程:?Y

X αβ=+ 样本回归方程:?y

a bx =+ 20.三个或三个以上的样本平均数的假设测验为什么必须采用方差分析而不用t 测验? k(k ≥3)个样本平均数的假设测验方法,即方差分析(analysis of variance)。这种方法的基本特点是:将所有k 个样本的观察值和平均数作为一个整体加以考虑,把观察值总变异的自由度和平方和分解为不同变异来源的自由度和平方和,进而获得不同变异来源的总体方差估计值。

21.什么叫置信区间、置信限、置信距和置信度?

置信区间(置信距):在一定的概率保证之下,估计出参数 可能在内的一个范围或区间即接受区域。

置信限:置信区间的上下限称之。一般以L1和L2表示其上下限。

置信系数(置信度):保证参数在该区间内的概率P =(1- ), 为显著水平。

22.何谓简单效应、主效和互作?举例说明。

处理效应是处理因素作用于受试对象的反应,是研究结果的最终体现。

简单效应(simple effect):同一因素内两种水平间试验指标的差数。

主要效应(main effect):一个因素内各简单效应的平均数,又称平均效应,简称主效。 交互作用(interaction effect):两个因素简单效应间的平均差异称为交互作用效应,简称互作

23.什么叫抽样分数?抽样方案的3个基本内容是什么?

五、计算题

1. 有一水稻品种作两因素(施氮肥N 和磷肥P )两水平试验,测产结果如下(单位:斤):

问:(1)P 1水平下N 1与N 2的简单效应=?(2)N 的主效=?(3)N 和P 有无互作?

如有互作是正互作还是负互作?交互作用为多少?

答: ①P1水平下N1与N2的简单效应=14-10=4;②(4+8)/2=6;③有,{(24-16)-(14-10)}/2=2,成正交互租用,交互作用为2.

生物统计学 实验报告 大肠杆菌

A 题 细胞体内代谢物浓度预测 随着基因组、转录组、蛋白质组等各种“组学”研究计划的蓬勃开展,生命科学进入了“组学”时代。代谢组学作为系统生物学的重要分支,其研究的重点是细胞内代谢物种类与浓度的定性和定量分析以及代谢网络的构建和模拟。 对代谢物的检测及浓度测定主要采用实验方法,包括核磁共振、气相色谱-质谱联用和液相色谱-质谱联用等技术。但由于代谢物种类繁多,且大部分浓度较低(μM 数量级),尤其是胞内代谢物提取难度非常大,精确测定其浓度异常困难,而且实验测定需要消耗大量财力物力和人力,因此通过计算机方法对代谢物浓度预测和分析变得越来越重要。 活细胞的代谢物浓度由什么决定?除了一些特定的代谢和酶的作用以外,有没有那种能全局影响浓度值的性质? 试根据附件中的数据完成如下问题: 1 根据不同类型的数据,分析代谢物浓度与其物理化学性质之间的关系。 2 筛选合适的物理化学性质,建立预测代谢物浓度的预测模型,并对此模型进行评价; 1.线性插补法处理缺失数据 原理:用该列数据缺失值前一个数据和后一个数据建立线性插值,然后用缺失点在线性插值函数的函数值填充该缺失值,即: 在于消除不同变量的量纲的影响,而且标准化转化不会改变变量的相关系数。 代谢物浓度:取对数 代谢物理化性质:标准差标准化法 )1,1( m j n i S x x x j j ij ij ≤≤≤≤-=' 式中:.)(11,1121∑∑==--= =n i j ij j n i ij j x x n S x n x 3.SAS 软件建立多元线性回归方程 回归模型一般形式: u X b X b X b b Y k k +++++= (22110)

试验统计学实验一

1、数据分析结果如下表: 表1 水稻F2代株高数据的基本特征数 基本特征数计算结果 平均数x109.7131667cm 离均差平方和SS720022.226cm2 方差S21202.040444cm2 标准差S34.67045492cm 变异系数CV31.6009974% 最大值max177.6cm 最小值min24.4cm 极差R153.2cm 样本大小n600 峰值g2-0.589380069 偏斜度g1-0.6121756 分析:根据上表结果,在水稻F2代株高调查中,共抽取了600个样本。样本中最大值为177.6cm,最小值为24.4cm,极差为153.2cm;变异系数为31.6009974%;其峰值为-0.589380069,为一个小于0的值,说明其次数分布曲线比正态分布低,为低润峰;其偏斜度为-0.6121756,小于0,说明该次数分布曲线不对称,且峰往右边偏。 表2 玉米单交种株高数据的基本特征数 基本特征数计算结果 平均数x229.2075cm 离均差平方和SS68065.63625cm2 方差S2113.6321139cm2 标准差S10.65983649cm 变异系数CV 4.6507363% 最大值max257.8cm 最小值min200.3cm 极差R57.5cm 样本大小n600 峰值g2-0.112906602 偏斜度g10.005430104 分析:根据上表结果,在玉米单交种株高调查中,共抽取了600个样本。样本中最大值为257.8cm,最小值为200.3cm,极差为57.5cm;变异系数为4.6507363%;其峰值为-0.112906602,小于0,说明其次数分布曲线比正态分布低,为低润峰;其偏斜度为0.005430104,大于0,说明该次数分布曲线不对称,且峰往左边偏。

生物统计学考试题及答案

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专 业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已 知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。

A 、[-9.32,11.32] B 、[-4.16,6.16] C 、[-1.58,3.58] D 、都不是 2、态分布不具有下列哪种特征( )。 A 、左右对称 B 、单峰分布 C 、中间高、两头低 D 、概率处处相等 3、一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( )。 A 、 2MSe/6 , 3 B 、 MSe/6 , 3 C 、 2MSe/3 , 12 D 、 MSe/3 , 12 4、已知),N(~x 2σμ,则x 在区间]96.1,[σμ+-∞的概率为( )。 A 、0.025 B 、0.975 C 、0.95 D 、0.05 5、 方差分析时,进行数据转换的目的是( )。 A. 误差方差同质 B. 处理效应与环境效应线性可加 C. 误差方差具有正态性 D. A 、B 、C 都对 三、简答题;(每小题6分,共30分 ) 1、方差分析有哪些步骤? 2、统计假设是?统计假设分类及含义? 3、卡方检验主要用于哪些方面? 4、显著性检验的基本步骤? 5、平均数有哪些?各用于什么情况? 四、计算题;(共4题、50分) 1、进行大豆等位酶Aph 的电泳分析,193份野生大豆、223份栽培大豆等位基因型的次数列于下表。试分析大豆Aph 等位酶的等位基因型频率是否因物种而不同。( 99 .52 05.0,2=χ, 81 .7205.0,3=χ)(10分) 野生大豆和栽培大豆Aph 等位酶的等位基因型次数分布 物 种 等位基因型 1 2 3 野生大豆 29 68 96

生物统计学实验指导

《生物统计学》实验教学教案 [实验项目] 实验一平均数标准差及有关概率的计算 [教学时数] 2课时。 [实验目的与要求] 1、通过对平均数、标准差、中位数、众数等数据的计算,掌握使用计算机计算统计量的方法。 2、通过对正态分布、标准正态分布、二项分布、波松分布的学习,掌握使用计算机计算有关概率和分位数的方法。为统计推断打下基础。 [实验材料与设备] 计算器、计算机;有关数据资料。 [实验内容] 1、平均数、标准差、中位数、众数等数据的计算。 2、正态分布、标准正态分布有关概率和分位数的计算。 3、二项分布有关概率和分位数的计算。 4、波松分布有关概率和分位数的计算。 [实验方法] 1、平均数、标准差、中位数、众数等数据的计算公式。 平均数=Average(x1x2…x n) 几何平均数=Geomean(x1x2…x n) 调和平均数=Harmean(x1x2…x n) 中位数=median(x1x2…x n) 众数=Mode(x1x2…x n) 最大值=Max(x1x2…x n) 最小值=Min(x1x2…x n) 平方和(Σ(x- )2)=Devsq(x1x2…x n) x 样本方差=Var (x1x2…x n) 样本标准差=Stdev(x1x2…x n) 总体方差=Varp(x1x2…x n) 总体标准差=Stdevp(x1x2…x n) 2、正态分布、标准正态分布有关概率和分位数的计算。 一般正态分布概率、分位数计算:

概率=Normdist(x,μ,σ,c) c 取1时计算 -∞-x 的概率 c 取0时计算 x 的概率 分位数=Norminv(p, μ, σ) p 取-∞到分位数的概率 练习: 猪血红蛋白含量x 服从正态分布N(12.86,1.332),(1) 求猪血红蛋白含量x 在11.53—14.19范围内的概率。(0.6826)(2) 若P(x <1l )=0.025,P(x >2l )=0.025,求1l ,2l 。 (10.25325) L1=10.25 L2=15.47 标准正态分布概率、分位数计算: 概率=Normsdist(x) c 取1时计算 -∞--x 的概率 c 取0时计算 x 的概率 分位数=Normsinv(p) p 取-∞到分位数的概率 练习: 1、已知随机变量u 服从N(0,1),求P(u <-1.4), P(u ≥1.49), P (|u |≥2.58), P(-1.21≤u <0.45),并作图示意。 参考答案: (0.080757,0.06811,0.00988,0.5605) 2、已知随机变量u 服从N(0,1),求下列各式的αu 。 (1) P(u <-αu )+P(u ≥αu )=0.1; 0.52 (2) P(-αu ≤u <αu )=0.42; 0.95 参考答案: [1.644854, 0.63345; 0.553385, 1.959964] 3、二项分布有关概率和分位数的计算。 概率=Binomdist(x,n,p,c) c 取1时计算 0-x 的概率 c 取0时计算 x 的概率 练习: 1、已知随机变量x 服从二项分布B (100,0.1),求μ及σ。 参考答案: 见P48,μ= np, σ=(npq)0.5 2、已知随机变量x 服从二项分布B(10,0.6),求P(2≤x ≤6),P(x ≥7),P(x<3)。 参考答案: 0.6054, 0.38228, 0.012295 4、波松分布有关概率和分位数的计算。 概率=Poisson(x,λ,c) c 取1时计算 0-x 的概率 c 取0时计算 x 的概率 练习: ),(m n Permut C m n =

统计学实验报告

统计学数学实验报告 单因素方差分析 姓名 专业 学号

单因素方差分析 摘要统计学是关于数据的科学,它所提供的是一套有关数据收集、处理、分析、解释数据并从数据中得出结论的方法,统计研究的是来自各个领域的数据。单因素方差分析也是统计学分析的一种。单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响。关键字单因素、方差、数据统计 方差分析(analysis of variance,ANOVA)就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。当方差分析中之涉及一个分类型自变量时称为单因素方差分析(one-way analysis of variance). 单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响。例如要检验汽车市场销售汽车时汽车颜色对销售数据的影响,这里只涉及汽车颜色一个因素,因而属于单因素方差分析。 为了更好的理解单因素方差分析,下面举个例子来具体说明单因素方差所要解决的问题。从3个总体中各抽取容量不同的样本数据,结果如下表1所示。检验3个总体的均值之间是否有显著差异(α=0.01)P29210.1 样本1 样本2 样本3 158 153 169 148 142 158 161 156 180 154 149 169 如果要进行单因素方差分析时,就需要得到一些相关的数据结构,从而对那些数据结构进行分析,如下表2所示: 分析步骤 1.提出假设 与通常的统计推断问题一样,方差分析的任务也是先根据实际情况提出原假设H0与备择假设H1,然后寻找适当的检验统计量进行假设检验。本节将借用上面的实例来讨论单因素试验的方差分析问题。

生物统计学

生物统计学

————————————————————————————————作者: ————————————————————————————————日期:

第七章回归分析 第一节回归和相关的概念 方差分析检验一个或多个因子对某一生物变量是否有影响,只涉及一种变量。两个以上变量之间的定量关系的统计分析需要回归分析来解决。在自然界,两个或多个变量相互制约、相互依存的现象很常见。 变量间的关系一般分为两种:一种是因果关系,即一个变量的变化受另一个变量或几个变量的制约,如微生物的繁殖速度受温度、湿度、光照等因素的影响,子女的身高是受着父母身高的影响;另一种是平行关系,即两个以上变量之间共同受到另外因素的影响,如人的身高与体重之间的关系,兄弟身高之间的关系等都属于平行关系。 设有两个随机变量X和Y,如果变量X的每一个可能的值,都有随机变量Y的一个分布相对应,则称随机变量Y对变量X存在回归(Regression)。 X也是随机变量时,X和Y相互存在回归关系,这两个随机变量间就存在相关(Correlation)关系。在实际应用中,并不严格区分相关和回归。 在回归和相关分析中,必然注意下面一些问题,以避免统计方法的误用。 (1)变量间是否存在相关以及在什么条件下会发生什么相关等问题,都必须由各具体学科本身来决定。回归和相关只能作为一种统计分析手段,帮助认识和解释事物的客观规律,决不能把风马牛不相及的资料凑到一起进行分析; (2)由于自然界各种事物间的相互联系和相互制约,一个变量的变化通常会受到许多其他变量的影响,因此,在研究两个变量之间的关系时,要求其余变量尽量保持在同一水平,否则,回归和相关分析就可能会导致不可靠甚至完全虚假的结果。例如人的身高和胸围之间的关系,如果体重固定,身高越高的人,胸围一定较小,当体重在变化时,其结果就会相反; (3)在进行回归与相关分析时,两个变量成对观测值应尽可能多一些,这样可提高分析的准确性,一般至少有5对以上的观测值。同时变量x的取值范围要尽可能大一些,这样才容易发现两个变量间的回归关系; (4)回归与相关分析一般是在变量一定取值区间内对两个变量间的关系进行描述,超出这个区间,变量间的关系类型可能会发生改变,所以回归预测必须限制自变量Y的取值区间,外推要谨慎,否则会得出错误的结果。 第二节一元线性回归 研究两个随机变量的关系时首先要收集成对数据。 7.1研究土壤中NaCl的含量对植物单位叶面积物质干重的影响时,收集到如下成对数据。问二者的回归关系如何? NaCl的含量0.00.8 1.6 2.4 3.2 4.0 4.8 单位叶面积干重80 90 95 1 根据数据作散点图,分析:1. X与Y的关系密切否?2.线性还是曲线关系?3. 有无偏

生物统计学 (2)

生物统计学 名词解释: 1.生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理,运用 统计方法来认识、分析、推断和解释生命过程中的各种现象和试验调查资料的科学。 2.总体:具有相同性质或属性的个体所组成的集合称为总体,它是指研究对象的全 体; 3.个体:组成总体的基本单元称为个体; 4.样本:从总体中抽出若干个体所构成的集合称为样本; 5.样本容量:样本中所包含的个体数目称为样本容量。 6.集中性:资料中的观测值从某一数值为中心而分布的性质。 7.离散性:是变量有差离中心分散变异的性质。 8.变量(变数):指相同性质的事物间表现差异性或差异特征的数据。 9.常数:表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是 不变的。 10.参数:描述总体特征的数量称为参数,也称参量。常用希腊字母表示参数,例如用 μ表示总体平均数,用σ表示总体标准差; 11.统计数:描述样本特征的数量称为统计数,也称统计量。常用拉丁字母表示统计数, 例如用x表示样本平均数,用S表示样本标准差。 12.效应:通过施加试验处理,引起试验差异的作用称为效应。效应是一个相对量,而 非绝对量,表现为施加处理前后的差异。效应有正效应与负效应之分。 13.互作(连应):是指两个或两个以上处理因素间相互作用产生的效应。互作也有正效 应(协同作用)与负效应(拮抗作用)之分。 14.准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接 近的程度。 15.精确性:也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近 的程度。 16.随机误差(抽样误差):这是由于试验中无法控制的内在和外在的偶然因素所造成。 随机误差越小,试验精确性越高。 17.系统误差(片面误差):这是由于试验条件控制不一致、测量仪器不准、试剂配制 不当、试验人员粗心大意使称量、观测、记载、抄录、计算中出现错误等人为因素而引起的。系统误差影响试验的准确性。只要以认真负责的态度和细心的工作作风是完全可以避免的。 18.试验误差:在试验过程中,由于试验条件及人为的一些因素而造成的试验结果与真 实值之间的偏差,来源于试验材料固有的差异和外界因素(管理措施、试验条件等)。 19.数量性状:是指能够以计数和测量或度量的方式表示其特征的性状。 20.质量性状:是指能观察到而不能直接测量的性状 21.次数资料:由质量性状量化得来的资料叫做次数资料。 22.试验:是对已有的或没有的事物加以处理的方法。 23.大数定律:是概率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称。 主要内容:样本容量越大,样本统计数与总体参数之差越小。 24.泊松分布:是一种可以用来描述和分析随机地发生在单位空间或时间里的稀有事件 的概率分布,也是一种离散型随机变量的分布。 25.假设检验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完 全知道的总体提出两种彼此对立的假设,然后由样本的实际原理,经过一定的计算,

统计学实验报告

河南工业大学管理学院 课程设计(实验)报告书题目统计学实验 专业电子商务 班级1204班 学生姓名伍琴 学号201217050430 指导教师任明利 时间:2012 年 4 月 6 日

实验一:数据整理 一、项目名称:数据整理 二、实验目的 (1)掌握Excel中基本的数据处理方法; (2)学会使用Excel进行统计分组,能以此方式独立完成相关作业。 三、实验要求 1、已学习教材相关内容,理解数据整理中的统计计算问题;已阅读本次实验导引,了解Excel中相关的计算工具。 2、准备好一个统计分组问题及相应数据(可用本实验导引所提供问题与数据)。 3、以Excel文件形式提交实验报告(包括实验过程记录、疑难问题发现与解决记录)。 四、实验内容和操作步骤 (一)问题与数据 某百货公司连续40天的商品销售额如下(单位:万元): 41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35 根据上面的数据进行适当分组,编制频数分布表,并绘制直方图. (二)操作步骤: 1、在单元区域A1:E9中输入原始数据,如图:

2、并计算原始数据的最大值(在单元格B10中)与最小值(在单元格D10中)。 3、根据经验公式计算经验组距和经验组数。 4、根据步骤3的计算结果,计算并确定各组上限、下限(在单元区域F1:G6),如图所示: 5、绘制频数分布表框架,如图所示: 6、计算各组频数: (1)选定B19:B23作为存放计算结果的区域。 (2)从“公式”菜单中选择“插入函数”项。 (3)在弹出的“插入函数”对话框中选择“统计”函数FREQUENCY.

使用统计学实验报告

*****大学 应用统计学课程实验(上机)报告 专业班级: 学号: 学生姓名: 指导老师: 实验地点: 学期:

实验(上机)日期:第一次 实验(上机)主题:统计软件的运用 实验(上机)类别:验证性 完成方式:独立 实验(上机)目的与要求: 1、掌握启动和退出统计软件 2、掌握数据库的建立 3、搜集一些数据并建立数据库 4、进行统计计算(函数、描述性统计) 5、制作统计图 6、计算各种统计指标 实验(上机)内容及方法(学生填写) 第1步:打开Excel输入需要分析的数据,然后点击公式选项,选择其中需要的函数进行计算分析。 第2步:在A1:A20区域选取从-3到3,间距为0.058的数据序列作为X序列。在B1单元格中输入公式 “=NORMDIST(A1,0,1,FALSE)”,然后将公式复制到B1:B20区域,在B1:B20区域形成相对A1:A20区间点的正态分布概率密度函数序列。 第3步:选取自由度为2,在A1:A20区域填充从0—12的等差数列,步长为0.1.在B1单元格输入公式“=(A1×EXP(-A1/2)

/2)”即可得A1在自由度为2时的卡方分布概率值,然后将B1单元格的公式复制到B1:B20区域,同样选择图标向导和折线图,经过编辑和修饰得到卡方分布概率密度函数图。 实验(上机)过程与结果(学生如实记载上机操作内容、步骤及结果) 本专业男生身高数值(单位:cm): 165、167、168、172、175、173、168、170、180、178、175、181、172、170、169、177、173、168、170、171 1.计算统计指标:在菜单栏中选择工具,然后单击数据分析,再选择描述统计输入数据。 2.点击图表向导,选择折线图第一个样式。

田间试验统计学

三、填空题 1.(统计数)是总体相应参数的估计值。 2.χ2临界值由()和()决定。 3.F分布的平均数μF=( 1 )。 4.F临界值的取值由()、()和()决定。 5.SSR临界值的取值由()、()和()决定。 6.t分布的平均数=(0 ),标准差=()。 7.t临界值的取值由(自由度)和(概率?) 决定。 8.标准化正态分布方程的参数是μ=(0 )和σ2 =( 1 )。 9.泊松分布的参数是μ=(m )和σ=(√m )。 10.常用表示资料变异程度的方法有方差、标准差、(极差)和(变异系数)四种。 11.常用的多重比较结果的表示方法有(列梯形表法)、(划线法)和(标记字母法)。 12.常用的随机排列的田间试验设计有(完全随机)设计、随机区组设计、拉丁方设计、 裂区设计、再裂区设计和(条区)设计等。 13.二项分布的两个参数μ=(np),σ=(根号npq)。 14.二项总体的样本平均数分布的两个参数μ=(),σ=()。 P66 15.二项总体分布的两个参数μ=(p ),σ =(pq )。 16.方差分析的三个基本假定是(可加性)、(正态性)和(误差同质性)。 17.方差分析的三个基本假定是:(1)处理效应与环境效应应该是(可加的);(2)试验误 差应该是(随机的)、彼此独立的,而且作正态分布,具有平均数为零;(3)所有试验处理必须具有(共同的误差方差),即误差同质性假定。 18.方差分析中,常用的变数转换方法有(平方根转换)、(对数转换)、(反正弦转换)和 采用几个观察值的平均数作方差分析等四种。 19.根据处理排列方法,常用的田间试验设计可分为(顺序排列)和(随机排列)两类。 20.观察数据依研究形状、特性不同一般可分为(数量性状)资料和(质量性状)资料两大 类。 21.回归估计标准误S y /x与离回归平方和Q和数据对数n的关系是S y /x=

统计学实验报告

统计实验报告

的方法来决定圆周率π。上个世纪40年代电子计算机的出现,特别是近年来高速电子计算机的出现,使得用数学方法在计算机上大量、快速地模拟这样的试验成为可能。 此外,模拟任何一个实际过程,Monte Carlo方法都需要用到大量的随机数,计算量很大、人工计算是不可能的,只能在计算机上实现。 实验目的 用统计科学方法求2,3的近似值并得以推广。 实验原理与统计模型 来源乌拉姆和·诺伊曼核试验模拟,几何概率 实验所用软件及版本 R version 2.14.1 主要容(要点) 、 (1)构造问题的概率模型 对随机性的问题,如中子碰撞、粒子扩散运动等,主要是描述和模拟运动,概率过程,建立概率模型或判别式。 对确定性的问题,如确定π值,计算定积分,则需将问题转化为随机性的问题,例如图2.2(a)计算连续函数g(x)在区间[a,b] 的

定积分,则是c(b-a)的有界区域产生若干随机焦,并计数满足不等式()j j x g y≤的点数,从而构成了问题的概率模型。 (2)从己知概率分布抽样 实验过程况录(含基本步骤、主要程序清单及异常情况记录等)一.求2 考虑 1 2 dx x x = ? 然后等概率地产生n个随机点(xi,yi),i=1,2,…,n,即xi是(1,2)上均匀分布的随机数,yi 是(0,1)上均匀分布的随机数。设n个点中有k个点落在下图阴影区域,即有k个点(xi,yi)满足yi*2*(xi)^0.5<1。则当∞ → n,有如下关系 P=k/n=阴影部分面积/1=2-1 因此2的估计值=k/n+1

下面编写的模拟程序(程序名:MC1.R)> MC1<-function(n){ + k<-0;x<- runif(n,1,2);y<-runif(n) + for (i in 1:n){ + if (2*x[i]^0.5*y[i]<1) + k<- k+1 + } + k/n+1 + } > MC1(100000) [1] 1.41463 3 二.求

生物统计学实验

渤海大学学生实验报告 课程名称:生物统计学实验任课教师:何余堂 实验室名称:计算机室房间号:理工Ⅱ--205 实验时间:2012-6-14 学院化学化工与食品安全学院专业食品质量与安 全 班级10-10 姓名宋帅婷学号10150142同组人其余19人 实验项目统计数据的整理及次数分布 表/图的制作 组 别第二组 实验成绩 一、实验目的 1、掌握Excel数据输入、输出与编辑方法; 2、掌握Excel用于描述性统计的基本菜单操作及命令; 3、掌握数据整理的基本方法; 4、熟练制作次数分布表/图。 二、实验原理 当观测值较多(n>30)时,宜将观测值分成若干组,以便统计分析。将观测值分组后,制成次数分布表,即可看到资料的集中和变异情况。 连续性资料的整理,需要先确定全距、组数、组距、组中值及组限,然后将全部观测值计数归组。分组结束后,将资料中的每一观测值逐一归组,统计每组内所包含的观测值个数,制作次数分布表。利用Excel的数据统计工具可以辅助完成上述工作。 三、实验步骤 1、加载分析工具库 单击Excel程序“工具”菜单中的“数据分析”命令可以浏览已有的分析工具。如果在“工具”菜单上没有“数据分析”命令,应在“工具”菜单上运行“加载宏”命令,在“加载宏”对话框中选择“分析工具库”。 2、练习 某地80例30~40岁健康男子血清总胆固醇(mol/L)测定结果如下: 4.77 4.56 5.18 4.38 4.03 5.16 4.88 4.52 4.47 5.38 3.37 4.37 5.77 4.89 5.85 5.10 5.55 4.38 3.40 3.89 6.14 5.39 4.79 4.09 5.85 3.04 4.31 3.91 4.60 3.95 6.30 5.12 5.32 3.35 4.79 4.55 4.58 2.70 4.47 3.56 4.77 4.56 5.18 4.38 4.03 5.16 4.88 4.52 4.47 5.38 3.37 4.37 5.77 4.89 5.85 5.10 5.55 4.38 3.40 3.89 6.14 5.39 4.79 4.09 5.85 3.04 4.31 3.91 4.60 3.95 6.30 5.12 5.32 3.35 4.79 4.55 4.58 2.70 4.47 3.56 5.21

统计学实验心得体会讲课稿

[标签:标题] 篇一:统计学实验心得体会 统计学实验心得体会 为期半个学期的统计学实验就要结束了,这段以来我们主要通过excl软件对一些数据进行处理,比如抽样分析,方差分析等。经过这段时间的学习我学到了很多,掌握了很多应用软件方面的知识,真正地学与实践相结合,加深知识掌握的同时也锻炼了操作能力,回顾整个学习过程我也有很多体会。 统计学是比较难的一个学科,作为工商专业的一名学生,统计学对于我们又是相当的重要。因此,每次实验课我都坚持按时到实验室,试验期间认真听老师讲解,看老师操作,然后自己独立操作数遍,不懂的问题会请教老师和同学,有时也跟同学商量找到更好的解决方法。几次实验课下来,我感觉我的能力确实提高了不少。统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。可见统计学的重要性,认真学习显得相当必要,为以后进入社会有更好的竞争力,也为多掌握一门学科,对自己对社会都有好处。 几次的实验课,我每次都有不一样的体会。个人是理科出来的,对这种数理类的课程本来就很感兴趣,经过书本知识的学习和实验的实践操作更加加深了我的兴趣。每次做实验后回来,我还会不定时再独立操作几次为了不忘记操作方法,这样做可以加深我的记忆。根据记忆曲线的理论,学而时习之才能保证对知识和技能的真正以及掌握更久的掌握。就拿最近一次实验来说吧,我们做的是“平均发展速度”的问题,这是个比较容易的问题,但是放到软件上进行操作就会变得麻烦,书本上只是直接给我们列出了公式,但是对于其中的原理和意义我了解的还不够多,在做实验的时候难免会有很多问题。不奇怪的是这次试验好多人也都是不明白,操作不好,不像以前几次试验老师讲完我们就差不多掌握了,但是这次似乎遇到了大麻烦,因为内容比较多又是一些没接触过的东西。我个人感觉最有挑战性也最有意思的就是编辑公式,这个东西必须认真听认真看,稍微走神就会什么都不知道,很显然刚开始我是遇到了麻烦。还好在老师的再次讲解下我终于大致明白了。回到寝室立马独自专研了好久,到现在才算没什么问题了。 实验的时间是有限的,对于一个文科专业来说,能有操作的机会不是很多,而真正利用好这些难得的机会,对我们的大学生涯有很大意义。不仅是学习上,能掌握具体的应用方法,我感觉更大的意义是对以后人生路的作用。我们每天都在学习理论,久而久之就会变成书呆子,问什么都知道,但是要求做一次就傻了眼。这肯定是教育制度的问题和学校的设施问题,但是如果我们能利用好很少的机会去锻炼自己,得到的好处会大于他自身的价值很多倍。例如在实验过程中如果我们要做出好的结果,就必须要有专业的统计人才和认真严肃的工作态度。这就在我们的实践工作中,不知觉中知道一丝不苟的真正内涵。以后的工作学习我们再把这些应用于工作学习,肯定会很少被挫 折和浮躁打败,因为统计的实验已经告知我们只有专心致志方能做出好的结果,方能正确的做好一件事。 最后感谢老师的耐心指导,教会我们知识也教会我们操作,老师总是最无私最和蔼的人,我一定努力学习,用自己最大的努力去回报。 篇二:统计学实验报告与总结

统计学实验报告

实验1:数据整理 一、实验目的 1)掌握Excel中基本的数据处理方法; 2)学会使用Excel进行统计分组,能以此方式独立完成相关作业 二、实验时间及地点 试验时间:2014年9月23日实验地点:计算机房 三、实验内容和操作步骤 (一)问题与数据 某百货公司连续40天的商品销售额如下(单位:万元): 41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35 根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。 (二)实验内容:使用FREQUENCY函数绘制频数分布表(图) (三)实验步骤: 1.在A1输入:某百货公司连续40天的商品销售额如下。选中A1:D1选 择合并单元格。 2.在单元区域A2:D11中输入原始数据。 3.并计算原始数据的最大值(在单元格B12中)与最小值(在单元格D12 中)。 4.根据Sturges经验公式计算经验组距(在单元格B13)和(经验数据D13 中)。 5.根据步骤3的计算结果,计算并确定各组上限、下限(在单元区域E2: F7). 步骤1~5如图所示:

6.绘制频数分布表框架,如图所示: 7.计算各组频数: 1)选定i7:i12作为存放计算结果的区域。 2)从“插入”菜单中选择“函数”项。 3)在弹出的“插入函数”对话框中选择“统计”函数FREQUENCY。 步骤(1)~(3)如图所示:

4)单击“插入函数”对话框中的“确定”按钮,弹出 “FREQUENCY”对话框。 5)确定FREQUENCY函数的两个参数的值。其中: Data-array:原始数据或其所在单元格区域(A2:D11) Bins-array:分组各组的上限值或其所在的单元格区域 (F2:F7). 步骤(4)~(5)如图所示: 6)按Shift+Ctrl+Enter组合键,如图所示 7)用公式:频数密度=频数/组距选定G7输入=i7:i12/4按 Shift+Ctrl+Enter组合键 频率=频数/总数 如图所示:

生物统计学(第三版)

概论 名词: 生物统计:将概率论和数理统计的原理应用到生物学中以分析和解释其数量资料的科学 试验设计:试验工作未进行之前应用生物统计原理,来制定合理的试验方案,包括选择动物,分组和对比以及相应的资料搜集整理和统计分析的方法。 总体与样本 ?数据具有不齐性。 ?根据研究目的确定的研究对象的全体称为总体(population); ?含有有限个个体的总体称为有限总体; ?包含有无限多个个体的总体叫无限总体; ?总体中的一个研究单位称为个体(individual); ?从总体中随机抽出一部分具有代表性的个体称为样本(sample); ?样本中所包含的个体数目叫样本容量或大小,常记为n。 ?通常把n≤30的样本叫小样本,n >30的样本叫大样本。 随机抽取(random sampling) 的样本是指总体中的每一个个体都有同等的机会被抽取组成 样本。 变数与变异数列、变量: ?变数:研究中对样本个体的观察值。 ?变量:相同性质的事物间表现差异性的某种特征。如:身高、体重。 ?变异数列:将变数按从小到大的顺序排列的一组数列。 参数与统计量 ?由总体计算的特征数叫参数(parameter); ?由样本计算的特征数叫统计量(staistic)。 准确性与精确性 ?准确性(accuracy)也叫准确度,指观测值与其真值接近的程度。若x与μ相差的 绝对值|x-μ|小,则观测值x的准确性高;反之则低。 ?精确性(precision)也叫精确度,指重复观测值彼此接近的程度。若观测值彼此接 近,即任意二个观测值xi、xj相差的绝对值|xi -xj |小,则观测值精确性高;反之 则低。 ?调查或试验的准确性、精确性合称为正确性。由于真值μ常常不知道,所以准确性 不易度量,但利用统计方法可度量精确性。 随机误差与系统误差 随机误差也叫抽样误差(sampling error) ,是由于许多无法控制的内在和外在的偶然因素所造成。带有偶然性质,在试验中,即使十分小心也难以消除。随机误差影响试验的精确性。统计上的试验误差指随机误差。这种误差愈小,试验的精确性愈高。 系统误差也叫片面误差(lopsided error),是试验处理之外的其他条件明显不一致所带来的偏差。是由于试验动物的初始条件相差较大,饲料种类、品质、数量、饲养条件未控制相同,测量的仪器不准、标准试剂未经校正,以及观测、记载、抄录、计算中的错误所引起。系统误差影响试验的准确性。 系统误差是一种有原因的偏差,因而在试验过程中要防止这种偏差的出现。随机误差是偶然性的。整个试验过程中涉及的随机波动因素愈多,试验的环节愈多,时间愈长,随机误差发生的可能性及波动程度愈大。随机误差不可避免,但可减少,这主要依赖控制试验过程,尤

统计学实验心得体会

统计学实验心得体会 篇一:统计学实验心得体会 统计学实验心得体会 为期半个学期的统计学实验就要结束了,这段以来我们主要通过excl 软件对一些数据进行处理,比如抽样分析,方差分析等。经过这段时间的学习我学到了很多,掌握了很多应用软件方面的知识,真正地学与实践相结合,加深知识掌握的同时也锻炼了操作能力,回顾整个学习过程我也有很多体会。 统计学是比较难的一个学科,作为工商专业的一名学生,统计学对于我们又是相当的重要。因此,每次实验课我都坚持按时到实验室,试验期间认真听老师讲解,看老师操作,然后自己独立操作数遍,不懂的问题会请教老师和同学,有时也跟同学商量找到更好的解决方法。几次实验课下来,我感觉我的能力确实提高了不少。统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。可见统计学的重要性,认真学习显得相当必要,为以后进入社会有更好的竞争力,也为多掌握一门学科,对自己对社会都有好处。 几次的实验课,我每次都有不一样的体会。个人是理科出来的,

对这种数理类的课程本来就很感兴趣,经过书本知识的学习和实验的实践操作更加加深了我的兴趣。每次做实验后回来,我还会不定时再独立操作几次为了不忘记操作方法,这样做可以加深我的记忆。根据记忆曲线的理论,学而时习之才能保证对知识和技能的真正以及掌握更久的掌握。就拿最近一次实验来说吧,我们做的是“平均发展速度”的问题,这是个比较容易的问题,但是放到软件上进行操作就会变得麻烦,书本上只是直接给我们列出了公式,但是对于其中的原理和意义我了解的还不够多,在做实验的时候难免会有很多问题。不奇怪的是这次试验好多人也都是不明白,操作不好,不像以前几次试验老师讲完我们就差不多掌握了,但是这次似乎遇到了大麻烦,因为内容比较多又是一些没接触过的东西。我个人感觉最有挑战性也最有意思的就是编辑公式,这个东西必须认真听认真看,稍微走神就会什么都不知道,很显然刚开始我是遇到了麻烦。还好在老师的再次讲解下我终于大致明白了。回到寝室立马独自专研了好久,到现在才算没什么问题了。 实验的时间是有限的,对于一个文科专业来说,能有操作的机会不是很多,而真正利用好这些难得的机会,对我们的大学生涯有很大意义。不仅是学习上,能掌握具体的应用方法,我感觉更大的意义是对以后人生路的作用。我们每天都在学习理论,久而久之就会变成书呆子,问什么都知道,但是要求做一次就傻了眼。这肯定是教育制度的问题和学校的设施问题,但是如果我们能利用好很少的机会去锻炼

统计学实验报告

实验报告

二、打开文件“数据”中“城市住房状况评价”工作表,完成以下操作。 1)通过函数,计算出各频率以及向上累计次数和向下累计次数;2)根据两城市频数分布数据,绘制出两城市满意度评价的环形图三、打开文件“数据”中“期末统计成绩”工作表,完成以下操作。1)要求根据数据绘制出雷达图,比较两个班考试成绩的相似情况。实验过程: 实验任务一: 1)利用函数frequency制作一张频数分布表 步骤1:打开文件“数据3. XLS”中“某公司4个月电脑销售情况”工作表 步骤2.在“频率(%)”的右侧加入一列“分组上限”,因统计分组采用“上限不在内”,故每组数据的上限都比真正的上限值小,例如:“140-150”该组的上限实际值应为“150”,但我们为了计算接下来的频数取“”.

步骤3.选定C20:C29,再选择“插入函数”按钮 3 步骤4.选择类别“统计”—选择函数“FREQUENCY” 步骤5.在“data_array”对话框中输入“A2:I13”,在“bins_array”对话框中输入“E20:E29 该函数的第一个参数指定用于编制分布数列的原始数据,第二个参数指定每一组的上限.

步骤6.选定C20:C30区域,再按“自动求和”按钮,即可得到频数的合计 步骤7.在D20中输入“=(C20/$C$30)*1OO”

步骤8:再将该公式复制到D21:D29中,并按“自动求和”按钮 计算得出所有频率的合计。 实验任务二:2)利用工具栏工具绘制插入一张直方图,并说明数据分布的特点

步骤1:选择“工具”——“数据分析”——“直方图” 实验任务三:1)通过函数,计算出各频率以及向上累计次数和向下累计次数 步骤1: 打开文件“数据”中“城市住房状况评价”工作表 步骤2:选定B5:B10单元格,按“自动求和”按钮 步骤3:在C5中输入“=(B5/$B$10)*100”,在将鼠标箭头放在该单元格的右下角,按鼠标左键向下拖动到C10,即可得C6:C10单元格中的值 步骤4:在D5单元格中输入公式“=SUM($B$5:B5)”,再将公式复制到

生物统计学名词解释

生物统计学 1、参数与统计量 参数,是指从总体中计算所得的用以描述总体特征的数值,是反映总体基本情况的特征数。如:总体平均数、总体标准差。 统计量,是指从样本中计算所得的数值称为统计量,是反映样本基本情况的特征数,一定程度上是对总体参数的估计值。如:样本平均数、样本标准差。 2、标准差与变异系数 标准差和变异系数都是反映离散性的特征数即变异数中的一种。 标准差有总体标准差和样本标准差之分:б=N x 2) (∑-μ、S=1)(2--∑n x x 。标准差的大小受多个变量影响,若各变量间差异大标准差也大。标准差的值较大时,x 的代表性受到削弱。要用标准差比较两个或两个以上样本间的变异程度时,必须满足:标准差相近似,且单位相同。 变异系数是度量数据资料变异程度的常用指标。变异系数CV=x s ×100%,是样本变量的相对差异量,是为不带单位的纯数。变异系数CV 可比较多个样本的变异系数。 3、精确性与准确性 准确性也称准确度,是指测定值与真值的符合程度大小。 精确性也称精确度,是指多次测定值的变异程度。 4、单侧检验与双侧检验 双侧检验是指进行假设检验时将拒绝性概率分置于理论分布的两侧。备择假设为

HA :0μμ≠(或21μμ≠)。单侧检验是指进行假设检验时将拒绝性概率分置于理论分布的一侧。备择假设为HA :0μμ> (0μμ<),或:21μμ>(21μμ<) 5、假设检验的两类错误 若H0是真实的,经过假设检验却否定了它,则犯了一个否定真实假设的错误—即第一类(Ⅰ类)错误,亦称“弃真”。犯第一类错误(“弃真”)的概率即为显著性水平α。若H0不是真实的,经过假设检验却接受了它,则犯了一个接受非真实假设的错误—即第二类(Ⅱ类)错误,亦称“纳伪”。犯第二类错误(“纳伪”)的概率为β。当样本含量相同时,显著性水平α↓,则β↑;反之,β↓,则α↑。 6、比较五个样本平均数的差异显著性时,检验用什么方法,为什么? 若用t 检验对四个样本进行平均数差异显著性检验时,分别对两个样本进行差异显著性检验,结果会产生较大误差,提高了犯第一类错误的概率。假设每次比较所确定的检验水准α=0.05,则每次检验拒绝H0不犯第一类错误的概率为 1-0.05=0.95。比如对五个样本进行t 检验,需比较1025=C 次,那么10次检验都不 犯第一类错误的概率为(1-0.05)10=0.5990,而都拒绝H0时犯第一类错误的概率为401.0)05.0(11=P 10=--。 故比较多个样本平均数时不适用于t 检验,而用方差分析可有效地控制第一类错误。 用方差分析比较四个样本的平均数差异显著性检验时,按照变异原因的不同,将测量数据资料的总变异分解成处理效应和试验误差,通过比较各种原因在总变异中所占的重要程度,并作出其数量估计。方差分析比t 检验运算简便,也比t 检验更为精确。 7、独立事件和概率的乘法原则

相关主题
文本预览
相关文档 最新文档