当前位置:文档之家› 生物统计学(自理重点)

生物统计学(自理重点)

生物统计学(自理重点)
生物统计学(自理重点)

生物统计学复习资料(70%)

填空:10题×1’=10’选择:5题×1’=5’ 名词解释:5题×2’=10’

判断:5题×1’=5’ 简答:3题×5’=15’ 统计推断:4题10’+10’+10’+20’=50’

第1章绪论

生物统计学:是研究收集、整理、分析和解释生物科学试验数据的科学,是统计学原理在生物学研究领域的应用。

生物统计学的主要内容

生物统计学包括试验数据的获取、整理和分析等相关内容,具体来说,包括试验或调查设计、数据的整理(描述统计学)、概率论基础(统计理论基础)、统计推断方法(推断统计学)等内容。

调查设计:是指整个调查计划的制订,包括调查研究的目的、对象与范围,调查项目及调查表内容,抽样方法的选取,抽样单位和抽样数量的确定,数据处理方法,调查组织工作,调查报告撰写等内容。

试验设计:是指试验单位的选取、生物学重复数的确定及试验单位的分组等。

生物统计学发展简史

(1)古典记录统计学

(2)近代描述统计学

(3)近代推断统计学

总体:是研究对象的全体。

个体:是总体中的一个研究单位。

样本:是从总体中抽取的用于代表总体的一部分个体。

样本容量记为n,通常把n≤30的样本称为小样本,n>30的样本称为大样本。(判断区别)随机抽样:是指总体中的每一个个体都有同等的被抽取的机会组成样本。

参数:由总体计算的特征数。

统计数:由样本计算的特征数。

准确性:也叫准确度,是指在试验中某一试验指标的观测值与其真值接近的程度。

精确性:也叫精确度,是指同一试验指标的重复观测值彼此接近的程度。

随机误差:是由于无法控制的内在和外在的偶然因素所造成的,是客观存在的,在实验中,即使十分小心也难以消除。

系统误差:也叫片面误差,是由试验材料的初始条件不同或测量仪器不准等引起的倾向性或定向性偏差。

(小题)误差怎么控制?

(小题)随机误差可完全避免(×)

(小题)减小统计误差的方法是(B)

A、提高准确度

B、提高精确度

C、减少样本容量

D、增加样本容量

第2章数据的描述与分析

数据可以大致分为数量性状数据和质量性状数据两大类。

数量性状数据:是指通过测量、度量或计数取得的数据。

根据数据的特征又分为连续型数据和离散型数据。

连续型数据:或称为计量数据,是指用测量或度量方式得到的数量性状数据。(如身高、作物产量、蛋白质含量等)

连续型数据的特点:

(1)用测量或度量方式得到的数量性状数据。

(2)数据是用长度、容积、重量等来表示。

(3)观测值可以是整数或带小数的任何数值。

(4)小数位数由测量工具或统计要求的精度而定,数据之间的变异是连续的。

离散型数据:或称为计数数据,是指用计数方法得到的数量性状数据。(如不同血型的人数、鱼的数量、白细胞数等)

质量性状数据:或称为属性数据,是指对某种现象进行观察而不能测量的数据。(如土壤的颜色、植物叶的形状等)

质量性状数据数量化的方法(1)二值化(2)等级化

离散型数据基本上采用单项式分组法整理。

连续型数据一般采用组距式分组法整理。

全距又称为极差

统计表的结构:统计表由标题、横标目、纵标目、线条、数字及合计(总计)构成。

编制统计表的总原则:

结构简单、层次分明、内容安排合理、重点突出、数据准确,便于理解和统计分析。

统计表编制的具体要求

(1)标题:标题要简明扼要、准确地说明表的内容,有时需在最右侧注明时间、地点,表中数据为同一单位时也在此说明。

(2)标目:标目分为横标目和纵标目两项。横标目列在表的左侧,纵标目列在表的上端,并注明计量单位,如%、kg、cm等。

(3)数字:一律用阿拉伯数字,小数点对齐,(每列)小数位数一致,无数字的用“—”

表示,数字是“0”的,则填写“0”。

(4)线条:表的上、下两条边线略粗,纵、横标目间及合计(总计)用细线分开,表的左右边线可省去,表的左上角一般不用斜线;科技论文则习惯使用三线表。

常用的统计图有:柱状图、饼图、线图、直方图和折线图。

离散型数据常用的统计图:柱状图、线图或饼图

连续型数据常用的统计图:直方图和折线图

统计图绘制的的基本要求:

(1)标题简明扼要,列于图的下方;纵、横两轴应有刻度,注明单位。

(2)横轴由左至右、纵轴由下而上,数值由小到大;图形宽度与高度之比为4:3至6:5。

(3)图中用不同颜色或线条代表不同事物时,应有图例说明。

变量分布具有两种明显的基本特征,及集中性和离散性。

集中性:是指变量有向某一中心聚集的趋势,或者说以某一数值中心向两侧递减分布的性质。离散性:是指变量有离中心分散变异的性质。

反映数据集中性的特征数为平均数,常用的是算术平均数,还包括几何平均数、调和平均

数、中位数和众数等。(具体事例,如进行。。的滴定叫做什么平均数)

中位数:将资料中的所有观测值按从大到小的顺序排列,位于中间的那个观测值称为中位数。变异数包括极差、方差、标准差和变异系数等。(各自的计算方法):

极差:资料中观测值的最大值与最小值之差,记为R。

R=max{x1,x2,…,x n}- min{x1,x2,…,x n}

方差:记为s2或均方,记为MS。(自由度为n-1)

()

相应的总体参数称为总体方差,记为σ2。

()

标准差:记为s。

s=

标准差的特性

(1)标准差受所有观测值的影响,观测值间的差异大小直接影响标准差的大小。

(2)在计算标准差时,所有观测值同时加上一个常数,标准差值不变;所有观测值同时乘以常数a时,标准差扩大a倍。

(3)数据呈正态分布时,在平均数两侧1s范围内的观测值个数为68.26%,在平均数两侧2s范围内的观测值个数为95.45%,在平均数两侧3s范围内的观测值个数为

99.73%。

标准差的作用

(1)表示变量变异程度的大小。标准差小,说明变量比较密集地分布于平均数附近;标准差大,说明变量分布比较分散。因此,可以根据标准差的大小判断平均数的代表

性。

(2)利用标准差估计变量的次数分布及各类观测值在总体中所占的比例。

(3)利用样本标准差代替总体标准差计算平均数的标准误。

(4)用于平均数的区间估计和变异系数的计算。

变异系数的用途

(1)比较度量衡的单位不同的多组数据的变异度。

(2)比较均数相差悬殊的多组数据的变异度。

计算:在度量单位不同和(或)平均数差异较大时,比较两个样本的变异程度就不能直接采用标准差,而须先对其进行标准化,消除度量单位的差异和平均数大小的差异的影响。

标准差与平均数的比值称为变异系数,记为C v。

第3章概率与概率分布

必然事件:在一定条件下必然发生的事件,用U表示。

不可能事件:在一定条件下不可能发生的事件,用V表示。

概率:用于反映事件发生的可能性大小的数量指标。

随机事件满足以下三个条件:

(1)试验的所有可能结果只有有限个。

(2)试验的各种结果出现的可能性相等。

(3)试验的所有可能结果两两互不相容。

事件的相互关系

(1)和事件,记作A∪B(或A+B)

(2)积事件,记作A∩B(或AB)

(3)互斥事件

(4)独立事件

概率计算法则:(应用,p20)

(1)加法定理

P(A∪B)=P(A)+P(B)(2)条件概率,记作P(B|A)

()()()

(3)乘法法则

设事件A和事件B是同一个样本空间的两个事件,则

P(AB)=P(A)P(B|A)

如果事件A与事件B相互独立,则P(B|A)=P(B),于是

P(AB)=P(A)P(B)

二项分布:

二项分布:是一种常见的离散性随机变量的概率分布。所谓二项,是指每次试验只有两个可能的结果:事件A和事件,它们互为对立事件。(非此即彼的对立事件)

二项分布的概率函数:

(3-16)

二项分布的表示方法:B(n,p)

二项分布曲线形状由n(正整数)和p(0与1之间的任何数值)两个参数决定。当p趋于0.5时,二项分布趋于对称;当p值较小(p<0.3)且n不大时,分布是左偏的;当p值较大(p>0.7)且n不大时,分布是右偏的。后两种情况下,当n→∞时,二项分布接近连续型的正态分布。

泊松分布:

事件类型:稀有事件的概率分布。

表示方法:P(λ)

性质:当n→∞时,泊松分布近似服从正态分布N(λ,λ)。(了解,p24)

正态分布:

事件类型:连续型随机变量的概率分布

表示方法:N(μ,σ2)

特征(了解,p26)

标准正态分布

表示方法:N(0,1)

普通正态分布转化为标准正态分布的方法:

【例3.6】已知u~N(0,1),试求下列概率:(记答案)

(1)P(u<-1)= 0.1587

(2)P(|u|≤2.576)= 0.99

(3)P(|u|≥1.960)= 0.05

(4)P(-3≤u<3)= 0.9972

P(-1.960≤u<1.960)= 0.95 P(|u|≥1.960)= 1-0.95 = 0.05

P(-2.576≤u<2.576)= 0.99 P(|u|≥2.576)= 1-0.99 = 0.01(记)

无偏估计:统计学上,如果样本统计数分布的平均值与总体的相应参数相等,则称该统计数为总体相应参数的无偏估计值。

无偏估计的三个推断:

(1)样本平均数是总体平均数μ的无偏估计值;

(2)样本方差s2是总体方差σ2的无偏估计值;

(3)样本标准差s不是总体标准差σ的无偏估计值。

大数定律:是概率论描述当前试验次数很大时所呈现的概率性质的定律。

中心极限定理:是概率论中讨论随机变量的和的分布趋向正态分布的定理。

计算:

=μ,=(3-28)

(3-29)

(3-30)

(3-31)

(样本方差之比)(3-38)

第4章统计推断

假设检验:又称显著性检验,是利用样本统计数推断总体参数的统计方法。

小概率原理:小概率事件在一次试验中不应该发生。

假设检验的基本思路:

根据零假设计算出事件发生的概率,如果概率很小,事件在一次试验中是不应该发生的,如果发生了,则认为零假设不成立。

假设检验的步骤:

(1)提出零假设H0和备择假设H A;

(2)确定检验的显著水平α

(3)在H0正确的前提下,根据抽样分布的统计量进行假设检验的概率计算;

(4)计算统计量对应的概率值与显著水平α比较,或统计量与显著水平α的临界值比较,进行差异显著性推断。

双尾检验与单尾检验判别

双尾检验:H0:μ=μ0H A:μ≠μ0

单尾检验:H0:μ≤μ0H A:μ>μ0

假设检验中的两类错误(区别和联系):

若H0是真实的,假设检验却否定了它,就犯了一个否定真实假设的错误,称为第Ⅰ类错误。若H0不是真实的,假设检验却接受了H0,就犯了接受不真实假设的错误,称为第Ⅱ类错误。两类错误的关系是,在样本容量相同的情况下,减少犯第Ⅰ类错误的概率α,就会增加犯第Ⅱ类错误的概率β;反之,减少犯第Ⅱ类错误的概率β,就会增加犯第Ⅰ类错误的概率α。平均数的检验(u检验,单样本/双样本,统计推断,10分,t检验,成组/配对,10分)

看例题

(1)1、已知→

(2)、未知n1≥30,n2≥30

n1<30,n2<30(t检验)

t检验成组

①n1=n2=n

S e2→→t

df=n-1

②n1≠n2

配对

参数估计包括区间估计和点估计。

()= 1-(4-18)当总体方差2为已知,或总体方差2未知但为大样本时,置性度为P=1-的总体平均数μ的区间估计和点估计分别为

[,],(4-19)

当总体方差未知且样本为小样本时,由样本方差s2来估计总体方差2,置性度为P=1-的总体平均数μ的区间估计和点估计分别为

[,],(4-20)

第5章次数资料的x2检验

(统计推断,独立性或二项分布的适合性检验,10分)

2

X检验的三个用途:

(1)单个样本方差的同质性检验

(2)独立性检验

(3)适合性检验

计算公式((5-1)-(5-3)):

第6章方差分析

(统计推断,多重比较,LSD法,一定有显著性,20分)

试验因素:试验中人为设置的影响试验指标的因素。

试验水平:试验因素所处的某种特定状态或数量等级。

效应:对试验单位施加试验处理而引起的试验指标的改变,同一因素不同水平表现出来的单独作用称为主效应,或称简单效应。

互作:多因素试验中,两个及以上因素间相互促进或相互抑制所产生的新效应,,即不能用各因素主效应解释的试验指标的改变部分,称为交互作用,简称互作。

方差分析的基本思路:

方差分析就是通过将数据的总变异分解为组间变异和组内变异,然后比较、检验组间变异相对于组内变异的悬殊程度。通常用方差s2描述数据的变异性,方差比衡量两者的悬殊程度,且由于两个方差之比服从F分布,故可用F检验法检验组间变异和组内变异的比值是否显著。

计算:最小显著差数法(LSD法)(方差分析表,4分、结果一张表)

步骤:

表6-2 方差分析表的一般形式

①C=T2/nk

方差分析的三个基本假定:

效应可加性、误差正态性、方差同质性

方差分析的数据转换:

对数转换、反正弦转换、平方根转换

估计缺失数据的原则:补上缺失数据后误差平方和最小。

第8章抽样的原理与方法

抽样调查:从研究总体中,采用一定的方法抽取一个样本,用样本的结果来估计、推断其所属总体的情况。

抽样方案的基本内容:

抽样目的、研究指标、抽样方法、样本容量、抽样调查表格及组织形式等。

抽样调查方案应遵循处理间“唯一差异”原则。

抽样方法:

(1)顺序抽样

(2)典型抽样

(3)随机抽样

第9章常用试验设计与统计分析

试验误差:同一处理的不同观测值间的差异称为误差或变异。

随机误差/偶然性误差:完全偶然性的,找不出确切原因的误差。

系统误差/偏差:有原因的误差。

系统误差影响数据的准确性,偶然误差影响数据的精确性。

试验误差的来源:

(1)试验材料固有的差异

(2)试验时操作和管理技术的不一致所引起的差异

试验误差的控制:

(1)选择同质一致的试验材料

(2)改进操作和管理技术,使之标准化

(3)控制引起差异的主要外部因素

试验设计的三大基本原则:

(1)重复(2)随机(3)局部控制

自身配对与同源配对辨别:

自身配对:指同一试验单位在两个不同时间上分别接受前后两次处理,对其前后两次的观测值进行比较;或同一试验单位的不同部位的观测值或不同方法的观测值进行自身对照比较。同源配对:指将来源相同、性质相同的两个个体配成一对,然后对配对的两个个体随机地实

施不同处理。

正交表的表示方法及各项、各字母、各数字含义

例:L9(34)读作“四因素,三水平,一共需要进行9次试验的正交表”。“9”是试验次数,“3”是水平数,“4”因素数,“L”正交表。

生物统计学期末考试上机考试部分 复习试卷B

云南师范大学2010~2011学年下学期期末统一考试 高级生物统计学实验(期末) 试卷 学院 专业 年级 学号 姓名 考试方式(闭卷或开卷): 闭卷 考试时量:60分钟 试卷编号(B 卷): 题号 一 二 三 四 五 总分 评卷人 得分 一、下表为某种动物在不同温度下的代谢率的变化,试比较温度对其代谢率 有无影响?并对SSR 法其进行多重比较 温度(℃) 代谢率(mlO 2/g.h ) -5 2.78 3.80 4.87 4.68 5.51 5.67 5.10 2.79 2.60 3.14 4.26 3.72 3.48 2.86 3.37 3.32 4.35 4.59 4.66 4.83 5.16 -5 -5 -5 -5 -5 -5 .00 .00 .00 .00 .00 .00 .00 5.0 5.0 5.0 5.0 5.0 5.0 5.0

ANOVA 数据 7.1972 3.598 5.684 .012 11.39718.633 18.593 20 Between Groups Within Groups Total Sum of Squares df Mean Square F Sig. 经但因素方差分析的:f=5.684, p=0.012,差异显著,说明多有作用, 数据 Duncan a 7 3.2643 7 4.32577 4.6300 1.000.484 温度231Sig. N 12Subset for alpha = .05 Means for groups in homogeneous subsets are displayed. Uses H armonic Mean Sample Size = 7.000. a. 二、为调查红绿色盲是否与性别有关,某单位调查结果如下: 色盲 非色盲 男 32 168 女 13 232 问红绿色盲是否与性别有关? 三、试用交互误差图比较不同季节某种动物的胃长(cm )的变化?并绘制出其在 95%置信带 季节 胃长(cm )

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

生物统计学考试题及答案

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专 业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已 知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。

A 、[-9.32,11.32] B 、[-4.16,6.16] C 、[-1.58,3.58] D 、都不是 2、态分布不具有下列哪种特征( )。 A 、左右对称 B 、单峰分布 C 、中间高、两头低 D 、概率处处相等 3、一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( )。 A 、 2MSe/6 , 3 B 、 MSe/6 , 3 C 、 2MSe/3 , 12 D 、 MSe/3 , 12 4、已知),N(~x 2σμ,则x 在区间]96.1,[σμ+-∞的概率为( )。 A 、0.025 B 、0.975 C 、0.95 D 、0.05 5、 方差分析时,进行数据转换的目的是( )。 A. 误差方差同质 B. 处理效应与环境效应线性可加 C. 误差方差具有正态性 D. A 、B 、C 都对 三、简答题;(每小题6分,共30分 ) 1、方差分析有哪些步骤? 2、统计假设是?统计假设分类及含义? 3、卡方检验主要用于哪些方面? 4、显著性检验的基本步骤? 5、平均数有哪些?各用于什么情况? 四、计算题;(共4题、50分) 1、进行大豆等位酶Aph 的电泳分析,193份野生大豆、223份栽培大豆等位基因型的次数列于下表。试分析大豆Aph 等位酶的等位基因型频率是否因物种而不同。( 99 .52 05.0,2=χ, 81 .7205.0,3=χ)(10分) 野生大豆和栽培大豆Aph 等位酶的等位基因型次数分布 物 种 等位基因型 1 2 3 野生大豆 29 68 96

生物统计学第四版知识点总结

一、田间试验的特点 1、田间试验具有严格的地区性和季节性,试验周期长。 2、田间试验普遍存在试验误差 3、研究的对象和材料是农作物,以农作物生长发育的反应作为试验指标研 究其生长发育规律、各项栽培技术或栽培条件的效果。 二、田间试验的基本要求 结果重演性、结果可靠性、条件先进代表性、目的明确性 三、单因素试验的处理数就是该因素的水平数。 四、例如:甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组 合数是? 3因素3水平的处理组合数是? 多因素试验的处理数是各因素不同水平数的所有组合。 五、如进行一个喷施叶面肥的试验,如果设置两个叶面肥浓度,对照应为 喷施等量清水。 六、简单效应的计算 N 的简单效应为40-30=10 在N1水平下,P2与P1的简单效应为38-30=8;在N2水平下,P2与P1的简单效应为54-40=14。 七、平均效应的计算 P的主效(8+14)/2=11; N的主效(10+16)/2=13; 八、互作的计算 N与P的互作为(16-10)/2=3或(14-8)/2=3 九、田间试验误差可分为系统误差和随机误差两种。(1、系统误差影响试 验的准确性,随机误差影响试验的精确性。2、准确度受系统误差影 响,也受随机误差影响;精确度受随机误差影响。3、若消除系统误 差,则精确度=准确度。) 十、小区面积扩大,误差降低,但扩大到一定程度,误差降低就不明显了。 适当的时候可以考虑增加重复次数来降低误差。小区面积一般在 6-60m2,而示范小区面积不小于330m2 。 十一、通常情况下,狭长小区误差比方形小区误差小。 小区的长边必须与肥力梯度方向平行,即与肥力变化最大的方向平行。一般小区长宽比为3-10:1,甚至达20:1 十二、何时采用方形小区?(1)肥水试验;(2)边际效应值得重视的试验。 十三、一般小区面积较小的试验,重复次数可相应增多,可设3-6次重复; 小区面积较大的试验可设2-4次重复。 十四、将对照或早熟品种种在试验田四周,一般4行以上。目的?(目的是防止外来因素破坏及边际效应的影响。) 十五、算术平均数的主要特征 ?1、样本各观测值与平均数之差的和为零,即离均差之和为0。 2、离均差的平方和最小。 十六、【例3·1】在1、2、3、…、20这20个数字中随机抽取1个,求下列随机事件的概率。 (1)A=“抽得1个数字≤4”;

生物统计学简答题

1. 什么是生物统计学生物统计学的主要内容和作用是什么 生物统计学是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料,是研究生命过程中以样本来推断总体的一门学科。 生物统计学主要包括试验设计和统计分析两大部分的内容。其基本作用表现在以下4个方面:1.提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。2.判断试验结果的可靠性。3.提供由样本推断总体的方法。4.提供试验设计的一些重要原则。 2. 随即误差与系统误差有何区别随机误差也称为抽样误差或偶然误差,它是由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的误差,是不可避免的,随机误差可以通过试验设计和精心管理设法减小,而不能完全消除。 系统误差也称为片面误差,是由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差。系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的。 3. 准确性与精确性有何区别 准确性指在调查和实验中某一实验指标或性状的观测值和真实值接近程度。精确性指调查和实验中同一实验指标或性状的重复观察值彼此接近的程度。准确性是说明测定值和真实值之间符合程度的大小;精确性是反映多次测定值的变异程度。 4. 平均数与标准差在统计分析中有何用处他们各有哪些特性平均数的用处:

①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平;②作为样本或资料的代表数据与其他资料进行比较。平均数的特征:①离均差之和为零;②离均差平方和为最小。 标准差的用处:①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;②在计算标准差是如果对观察值加上一个或减去一个a,标准差不变;如果给各观测值乘以或除以一个常数a,所得的标准差就扩大或缩小a倍;③在正态分布中,X+-S内的观测值个数占总个数的%,X-+2s内的观测值个数占总个数的%,x-+3s 内的观测值个数占总个数的%。标准差的特征:①表示变量分布的离散程度;②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;③估计平均数的标准差;④进行平均数区间估计和变异数的计算。 5. 什么是正态分布什么是标准正太分布正态分布曲线有什么特点μ和σ对正态分布曲线有何影响 正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。 U=0,σ2=1的正态分布为标准正态分布。 正态分布具有以下特点:标准正态分布具有以下特点:①、正态分布曲线是以平均数μ为峰值的曲线,当x=μ时,f(x)取最大值;②、正态分布是以μ

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

生物统计学复习重点137030032

主要统计符号注解
编号 1 2 3 4 5 6 7 8 9 11 12 13 符号 注解 希腊字母符号 统计检验的显著水平,一般 α 取 0.05 或 0.01 总体标准差。用拉丁字母 S 表示样本标准差 总体方差。用拉丁字母 S2 表示样本方差(均方) 样本平均数抽样总体方差 标准误 (样本平均数抽样总体的标准差, 表示平均数抽样误差的大小) S x 。 为标本标准误,是平均数抽样误差的估计值 总体平均数。用拉丁字母 x 表示样本平均数 卡平方值 经连续性矫正的卡平方值 自由度 df 为显著水平为 α 时的卡平方临界值 随机误差;重复内分组设计的参试材料误差 线性模型中的处理效应 表示从第 1 个观测值 xi 累加到第 n 个,观测值 xn,当
i
α
σ σ2
2 σx σx
μ χ2 χ c2 2 χ α ,df
ε τ
n
n
∑x
i=1
∑x
i =1
在意义上已明确
i
时,可简写为 ∑ x 。 ∑ 为求和符号
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
T N n SS MS S S2 H0 HA SE DF CV CK O E F LSD LSR x~N(μ, 2) ( ,σ p,q , x~B(n,p) ( , ) a b r c f t u
x
d
d
k
拉丁字母符号 观测值总和 有限总体的总观测值数目 样本的观测值数目或样本容量(样本含量) 平方和 均方 样本标准差,用以估计总体标准差 σ 标准方差(均方) ,用以估计总体方差 σ2 无效假设 备择假设 标准误 自由度,自由度具体数值用 df 表示,如 df=8 变异系数 对照 观测次数 理论次数 F 统计数,F0.05 、F0.01 分别为 0.05、0.01 的临界值 最小显著差数(least significant difference) ( ) 最小显著极差(least significant ranges) 随机变量 x 服从参数 μ 和 σ 的正态分布,μ 为总体平均数,σ 为总体标准差 二项总体成数 p+q =1 随机变量 x 服从参数 n 和 p 的二项分布,n 为试验次数, p 为理论概率 直线回归方程中样本的回归截距 直线回归方程中标本回归系数 样本相关系数;独立性检验中相依表的行数 独立性检验中相依表的列数 观测次数 t 分布的统计数 u 正态分布的统计数;正态标准离差 样本平均数,用以估计总体平均数 μ 成对观测值的差数 成对观测值的差数的平均数 样本数或处理数
第 1 页 共 14 页

2017福师《生物统计学》答案

一、单选题(共 32 道试题,共 64 分。) V 1. 最小二乘法是指各实测点到回归直线的 A. 垂直距离的平方和最小 B. 垂直距离最小 C. 纵向距离的平方和最小 D. 纵向距离最小 2. 被观察到对象中的()对象称为() A. 部分,总体 B. 所有,样本 C. 所有,总体 D. 部分,样本 3. 必须排除______因素导致“结果出现”的可能,才能确定“结果出现”是处理因素导致的。只有确定了______,才能确定吃药后出现的病愈是药导致的。 A. 非处理因素,不吃药就不可能出现病愈 B. 处理因素,不吃药就不可能出现病愈 C. 非处理因素,吃药后确实出现了病愈 D. 处理因素,吃药后确实出现了病愈 4. 张三观察到李四服药后病好了。由于张三的观察是“个案”,因此不能确定______。 A. 确实进行了观察 B. 李四病好了 C. 病好的原因 D. 观察结果是可靠的 5. 四个样本率作比较,χ2>χ20.05,ν可认为

A. 各总体率不同或不全相同 B. 各总体率均不相同 C. 各样本率均不相同 D. 各样本率不同或不全相同 6. 下列哪种说法是错误的 A. 计算相对数尤其是率时应有足够的观察单位或观察次数 B. 分析大样本数据时可以构成比代替率 C. 应分别将分子和分母合计求合计率或平均率 D. 样本率或构成比的比较应作假设检验 7. 总体指的是()的()对象 A. 要研究,部分 B. 观察到,所有 C. 观察到,部分 D. 要研究,所有 8. 以下叙述中,除了______外,其余都是正确的。 A. 在比较未知参数是否不等于已知参数时,若p(X>x)<α/2,则x为小概率事件。 B. 在比较未知参数是否等于已知参数时,若p(X=x)<α,则x为小概率事件。 C. 在比较未知参数是否大于已知参数时,若p(X>x)<α,则x为小概率事件。 D. 在比较未知参数是否小于已知参数时,若p(X

生物统计学考试试卷及答案

考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

数量遗传学知识点总结

第一章绪论 一、基本概念 遗传学:生物学中研究遗传和变异,即研究亲子间异同的分支学科。数量遗传学:采用生物统计学和数学分析方法研究数量性状遗传规律的遗传学分支学科。 二、数量遗传学的研究对象 数量遗传学的研究对象是数量性状的遗传变异。 1.性状的分类 性状:生物体的形态、结构和生理生化特征与特性的统称。如毛色、角型、产奶量、日增重等。 根据性状的表型变异、遗传机制和受环境影响的程度可将性状分为数量性状、质量性状和阈性状3类。 数量性状:遗传上受许多微效基因控制,性状变异连续,表型易受环境因素影响的性状,如生长速度、产肉量、产奶量等。 质量性状:遗传上受一对或少数几对基因控制,性状变异不连续,表型不易受环境因素影响的性状,如毛色、角的有无、血型、某些遗传疾病等。 阈性状:遗传上受许多微效基因控制,性状变异不连续,表型易受或不易受环境因素影响的性状。有或无性状:也称为二分类性状(Binary traits)。如抗病与不抗病、生存与死亡等。分类性状:如产羔数、产仔数、乳头数、肉质评分等。 必须进行度量,要用数值表示,而不是简单地用文字区分; 要用生物统计的方法进行分析和归纳; 要以群体为研究对象; 组成群体某一性状的表型值呈正态分布。 3.决定数量性状的基因不一定都是为数众多的微效基因。有许多数量性状受主基因(major gene)或大效基因(genes with large effect)控制。 果蝇的巨型突变体基因(gt);小鼠的突变型侏儒基因(dwarf, df);鸡的矮脚基因(dw);美利奴绵羊中的Booroola基因(FecB);牛的双肌(double muscling)基因(MSTN);猪的氟烷敏感基因(RYR1)三、数量遗传学的研究内容

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

生物统计学试题及答案

生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() A.31 - x ~N(0,1) B.11 - x ~N(0,1) C.91 - x ~N(0,1) D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 C.前者比后者小 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() A.应用标准正态概率表查出u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 D.置信水平 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计 上称为( )。 A.方差的齐性检验 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 在一个有限总体中要随机抽样应采用放回式抽样方法。 12. 在实际抽样工作中,为了减小标准误,最常用的办法就是增大样品容量。 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F分布的临界值为 0.25 14. 衡量优良估计量的标准有无偏性、有效性和相容性。 15. 已知随机变量x服从 N (8,4),P(x < 4.71)= 0.05 。(填数字) 四.综合分析题(共60分) 16.何谓“小概率原理”?算术平均数有两条重要的性质,是什么? 小概率的事件,在一次试验中,几乎是不会发生的。若根据一定的假设条件,计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,从而否定假设。 算术平均数的性质: 1.离均差之和为零 2. 离均差平方之和最小 17.计算5只山羊产绒量:450, 450,500, 550, 550(g)的标准差。 标准差 18.一农场主租用一块河滩地,若无洪水则年终可获利20000元,若发洪水则会损失12000

《生物统计学》期末考试试卷

《生物统计学》期末考试试卷 一 单项选择(每题3分,共21分) 1.设总体服从),(2 σμN ,其中μ未知,当检验0H :220σσ=,A H :220σσ≠时,应选 择统计量________。 A. 2 (1)n S σ- B. 2 20(1)n S σ- X X 2.设123,,X X X 是总体2 ( , )N μσ的样本,μ已知,2 σ未知,则下面不是统计量的是_____。 A. 123X X X +- B. 41i i X μ=-∑ C. 2 1X σ+ D. 4 2 1 i i X =∑ 3.设随机变量~(0,1)X N ,X 的分布函数为()x Φ,则( 2)P X >的值为_______。 A. ()212-Φ???? B. ()221Φ- C. ()22-Φ D. ()122-Φ 4.假设每升饮水中的大肠杆菌数服从参数为μ的泊松分布,则每升饮水中有3个大肠杆菌的概率是________。 A.63e μ μ- B.36e μ μ- C.36e μ μ- D. 316 e μ μ- 5.在假设检验中,显著性水平α的意义是_______。 A. 原假设0H 成立,经检验不能拒绝的概率 B. 原假设0H 不成立,经检验不能拒绝的概率 C. 原假设0H 成立,经检验被拒绝的概率 D. 原假设0H 不成立,经检验被拒绝的概率 6.单侧检验比双侧检验的效率高的原因是________。 A .单侧检验只检验一侧 B .单侧检验利用了另一侧是不可能的这一已知条件 C .单侧检验计算工作量比双侧检验小一半 D. 在同条件下双侧检验所需的样本容量比单侧检验高一倍 7.比较身高和体重两组数据变异程度的大小应采用_____。 A .样本平均数 B. 样本方差 C. 样本标准差 D. 变异系数

生物统计学简答题

1. 什么是生物统计学?生物统计学的主要容和作用是什么? 生物统计学是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料,是研究生命过程中以样本来推断总体的一门学科。 生物统计学主要包括试验设计和统计分析两大部分的容。其基本作用表现在以下4个方面:1.提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。2.判断试验结果的可靠性。3.提供由样本推断总体的方法。4.提供试验设计的一些重要原则。 2. 随即误差与系统误差有何区别?随机误差也称为抽样误差或偶然误差,它是由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的误差,是不可避免的,随机误差可以通过试验设计和精心管理设法减小,而不能完全消除。 系统误差也称为片面误差,是由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差。系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的。 3. 准确性与精确性有何区别? 准确性指在调查和实验中某一实验指标或性状的观测值和真实值接近程度。精确性指调查和实验中同一实验指标或性状的重复观察值彼此接近的程度。准确性是说明测定值和真实值之间符合程度的大小;精确性是反映多次测定值的变异程度。 4. 平均数与标准差在统计分析中有何用处?他们各有哪些特性?平均数的用处:①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平;②作为样本或资料的代表数据与其他资料进行比较。平均数的特征:①离均差之和为零;②离均差平方和为最小。 标准差的用处:①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;②在计算标准差是如果对观察值加上一个或减去一个a,标准差不变;如果给各观测值乘以或除以一个常数a,所得的标准差就扩大或缩小a倍;③在正态分布中,X+-S的观测值个数占总个数的68.26%,X-+2s的观测值个数占总个数的95.49%,x-+3s 的观测值个数占总个数的99.73%。标准差的特征:①表示变量分布的离散程度;②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;③估计平均数的标准差;④进行平均数区间估计和变异数的计算。 5. 什么是正态分布?什么是标准正太分布?正态分布曲线有什么特点?μ和σ对正态分布曲线有何影响?

《生物统计学》试题A

《生物统计学》基本知识题 一、填空题 第一章 1.填写下列符号的统计意义:①SS ②S x ③ S2 ④ SP xy。 2.t检验、u检验主要用于____ 组数据的差异显著性检验; F 检验主要用于____ _ 组数据的差异显著性检验。 3.试验误差指由因素引起的误差,它不可,但可 以和。 4.参数是由____计算得到的,统计量是由____计算得到的。 5.由样本数据计算得到的特征数叫,由总体数据计算 得到的特征数叫。 9.一般将原因产生的误差叫试验误差,它避免, 但可以和。 第二章 4.变异系数可用于当两个样本的、不同时 变异程度的比较。变异系数的计算公式为。 5.变异系数可用于当两个样本的、不同时 的比较。变异系数的计算公式为。 7.连续性随机变量等组距式次数分布表的编制方法步骤为: ①_____、②____、③____、④____、⑤___。 8.计算标准差的公式是S=。 9.变异系数的计算公式是CV=。 10. 标准差的作用是①、②、③。 12.算术平均数的两个重要性质是①②。 13.样本平均数的标准差叫。它与总体标准差的关系 是。 第三章 1.若随机变量x~N(μ,σ2),欲将其转换为u~N(0,1),则 标准化公式为u=。 第四 1.统计量与参数间的误差叫,其大小受①② ③的影响,其大小可以用来描述,计算公式 为。 2.抽样误差是指之差。抽样误差的大小可用来表 示。影响抽样误差的因素有、和。 6.在两个均数的显著性检验中,若检验结果是差异显著,则说 明。 7.在显著性检验时,当H0是正确的,检验结果却否定了H0,这 时犯的错误是:型错误。 8. 显著性检验时,犯Ⅰ型错误的概率等于。 9.显著性检验分为_______ 检验和______检验。 10.显著性检验的方法步骤为:、、。 12.若服从N(, 2)分布,则值服从分布, 值服从分布。 第五章 1.方差分析是以为检验对象的。在实际分析时常常以 作为它的估计值。 2.多重比较的方法有①和②两类;①一般适用于 组均数的检验,②适用于组均数间的检验。 3.多重比较的LSD法适用于组均数比较;LSR法适用于 组均数间的比较。 4.多重比较的方法有和两类。前者一般用于 组均数检验,后者又包含和法,适用于组 均数的比较。第六章 1.χ2 检验中,连续性矫正是指用性分布检验性数据所产生的差异,当或时,必须进行矫正。 2.在χ2检验时,当和时必须进行连续性矫正。3.χ2检验中,当或时,必须进行连续性矫正,矫正方法有_____ 和_____ 两种。 4.χ2检验的计算公式为χ2=,当、时,必须矫正,其矫正方法为、。 第七章 1.在直线相关回归分析中,相关系数显著,说明两变量间直线相关关系。 2.相关系数的大小,说明相关的紧密程度,其说明相关的性质。 相关系数r是用来描述两变量之间相关的和的指标,r 的正负号表示相关的,r的绝对值大小说明相关的。 3.变量间存在的关系,统计上称为相关关系。 4.回归分析中表示,byx表示,。 5.在回归方程中,表示依变量的,b表示,a表示。 6.已知r=-0.589*,则变量间存在的直线相关关系。 7.统计分析中,用统计量来描述两个变量间的直线相关关系,其取值范围为,其绝对值的大小说明相关的,其正负符号说明相关的。 第九章 1.试验设计的基本原则是、和。 二、单选题 1.比较胸围与体重资料的变异程度,以最好。 a.标准差b.均方c.全距d.变异系数 2.比较身高与体重两变量间的变异程度,用统计量较合适。 ①CV ②S ③R ④S2 4.若原始数据同加(或同减)一个常数,则。 a不变,S改变b.S不变,改变 c.两者均改变d.两者均不改变 5.比较身高和体重资料的变异程度,以指标最好。 a.CV b.Sc.Rd.S2 6.离均差平方和的代表符号是。 a.∑(x- )2 b.SP c.SS 7 .样本离均差平方和的代表符号是。 ①S2 ②③ ④SS 8. 愈小,表示用该样本平均数估计总体均数的可靠性愈大。 ①变异系数②标准差 ③全距④标准误 1.二项分布、Poisson分布、正态分布各有几个参数:() A、 (1,1,1 ) B、 (2,2,2) C、 (2,1, 2) D、 (2,2,1 ) 2.第一类错误是下列哪一种概率:()

2018年复旦大学生命科学学院生物统计学 [0714Z1]考试科目、参考书目、复习指导

2018年复旦大学生命科学学院生物统计学 [0714Z1]考试科目、 参考书目、复习经验 一、招生信息 所属学院:生命科学学院 所属门类代码、名称:理学[07] 所属一级学科代码、名称:统计学[0714] 二、研究方向 01 (全日制)统计遗传学的理论与实验研究 02 (全日制)计算生物学方法学与应用研究 03 (全日制)生物统计的理论与方法学研究 三、考试科目 ①101思想政治理论 ②201英语一 ③301数学一或302数学二 ④873遗传学和细胞生物学或874生物统计学或875生物信息学 四、复习指导 一、参考书的阅读方法 (1)目录法:先通读各本参考书的目录,对于知识体系有着初步了解,了解书的内在逻辑结构,然后再去深入研读书的内容。 (2)体系法:为自己所学的知识建立起框架,否则知识内容浩繁,容易遗忘,最好能够闭上眼睛的时候,眼前出现完整的知识体系。 (3)问题法:将自己所学的知识总结成问题写出来,每章的主标题和副标题都是很好的出题素材。尽可能把所有的知识要点都能够整理成问题。 二、学习笔记的整理方法 (1)第一遍学习教材的时候,做笔记主要是归纳主要内容,最好可以整理出知识框架记到笔记本上,同时记下重要知识点,如假设条件,公式,结论,缺陷等。记笔记的过程可以强迫自

己对所学内容进行整理,并用自己的语言表达出来,有效地加深印象。第一遍学习记笔记的工作量较大可能影响复习进度,但是切记第一遍学习要夯实基础,不能一味地追求速度。第一遍要以稳、细为主,而记笔记能够帮助考生有效地达到以上两个要求。并且在后期逐步脱离教材以后,笔记是一个很方便携带的知识宝典,可以方便随时查阅相关的知识点。 (2)第一遍的学习笔记和书本知识比较相近,且以基本知识点为主。第二遍学习的时候可以结合第一遍的笔记查漏补缺,记下自己生疏的或者是任何觉得重要的知识点。再到后期做题的时候注意记下典型题目和错题。 (3)做笔记要注意分类和编排,便于查询。可以在不同的阶段使用大小合适的不同的笔记本。也可以使用统一的笔记本但是要注意各项内容不要混杂在以前,不利于以后的查阅。同时注意编好页码等序号。另外注意每隔一定时间对于在此期间自己所做的笔记进行相应的复印备份,以防原件丢失。统一的参考书书店可以买到,但是笔记是独一无二的,笔记是整个复习过程的心血所得,一定要好好保管。

相关主题
文本预览
相关文档 最新文档