生物统计学标1
- 格式:doc
- 大小:43.00 KB
- 文档页数:5
掌握生物统计学的概念和特点
生物统计学(biostatistics): 数理统计在生物学研究中的应用,它是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科。
特点:1 通过样本推断总体(基本特点)
2 有很大的可靠性,但有一定的错误率
3 生物统计学研究对象是生物有机体,具有特殊的变异性,随机性和复杂性。
掌握总体与样本,样本含量,参数与统计量的概念
总体:具有相同性质的个体所组成集合
样本:从总体中抽出的若干个体所构成的集合
样本含量:样本中个体的数目
参数:对一个总体特征的度量
统计量:由样本计算所得到的数值
掌握统计分析的基本要求
了解生物统计的作用及其主要内容
作用:1 提供整理和描述数据资料的科学方法,确定某些形状和特性和数量特征2判断试验结果的可靠性
3提供由样本推断总体的方法
4提供试验设计的一些重要原则
主要内容:试验设计和统计分析
试验设计:试验设计的基本原则,试验设计的方案的制定和常用试验设计的方法
统计分析:数据资料的搜集,整理和特征数的计算,统计推断,方差分析,回归
和相关分析,协方差分析。
了解错误与误差,准确性和精确性的概念
错误:在试验过程中,人为因素所引起的差错。
误差:试验中不可控因素所引起的观测值骗离真值的差异。
准确性:在调查或试验中某一试验指标或性状的观测值与真值接近的程度
精确性:在调查或试验中同一试验指标或形状的重复观测值彼此接近程度的大小。
《生物统计学》教案授课教师:陈彦云宁夏大学生命科学学院教学内容与组织安排:第一章绪论讲述本章教学目标、概述本课时主要内容摘要:生物统计学是数理统计学的原理和方法在生命科学领域的具体应用,它是运用统计的原理和方法对生物有机体开展调查和试验,目的是以样本的特征来估计总体的特征,对所研究的总体进行合理的推论,得到对客观事物本质和规律性的认识。
生物统计学主要内容包括试验设计和统计分析两大部分,其作用主要有四个方面:提供整理、描述数据资料的可行方法并确定其数量特征;判断试验结果的可靠性;提供由样本推断总体的方法;提供试验设计的原则。
生物体计学的发展概况及六组统计学常用术语。
重点内容:生物统计学的概念、内容及作用,常用术语。
第一节、生物统计学的概念及其重要性统计学(Statistics)是把数学的语言引入具体的科学领域,把具体科学领域中要待研究的问题抽象为数学问题的过程,它是收集、分析、列示和解释数据的一门艺术和科学,目的是求得可靠的结果。
它有许多分支,如工业统计、农业统计、卫生统计等等。
生物统计学是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法,分析、推断和解释生命过程中的各种现象和试验调查资料的科学。
属于生物数学的范畴第二节生物统计学的主要内容及作用生物体计学主要内容包括试验设计和统计分析两大部分。
在试验设计中,主要介绍试验设计的有关概念、试验设计的基本原则,试验设计方案的制定,常用试验设计方法,其中主要有对比试验设计、随机区组设计、拉方设计,正交设计等;在统计分析中,主要包括数据资料的搜集与整理、数据特征数的计算、统计推断、方差分析、回归和相关分析等。
生物统计学的作用主要有四个方面:1提供整理、描述数据资料的可行方法并确定其数量特征;2判断试验结果的可靠性;3提供油样本推断总体的方法;4提供试验设计的一些重要原则。
第三节统计学的发展概况由于人类的统计实践是随着计数活动而产生的,因此,统计发展史可以追溯到远古的原始社会,也就是说距今足有五千多年的漫长岁月。
第一章概论一、什么是生物统计学生物统计学主要内容和作用1、生物统计学是数理统计在生物学研究中的应用,它是应用数理统计的原理,运用统计方法来认识、分析、推断和解释生命过程中的各种现象和试验调查资料的科学。
属于生物数学的范畴2、主要内容基本原则对比设计试验设计方案制定随机区组设计常用试验设计方法裂区设计资料的搜集和整理拉丁方设计、正交设计统计分析数据特征数的计算统计推断、方差分析协方差分析、回归和相关分析主成分分析、聚类分析3、生物统计学的基本作用:(1)提供整理和描述数据资料的科学方法,确定某些性状和特征的数量特征(2)运用显著检验,判断试验结果的可靠性或可行性(3)提供由样本推断总体的方法(4)提供试验设计的一些重要原则二、解释概念:总体、个体、样本、变量、参数、统计数、效应、试验误差总体:具有相同性质或属性的个体所组成的集合称为总体,它是指研究对象的全体;个体:组成总体的基本单元称为个体样本:从总体中抽出若干个体所构成的集合称为样本变量:变量,或变数,指相同性质的事物间表现差异性或差异特征的数据参数:描述总体特征的数量称为参数,也称参量统计数:描述样本特征的数量称为统计数,也称统计量效应:通过施加试验处理,引起试验差异的作用称为效应试验误差:误差也称为实验误差,是指观测值偏离真值的差异,可分为随机误差和系统误差三、准确性与精确性有何区别准确性,也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。
精确性,也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。
准确性反应测量值与真值符合程度的大小,而精确性则是反映多次测定值的变异程度。
(具体在课本第7页)第二章样本统计量与次数分布一、算数平均数与加权平均数形式上有何不同为什么说它们的实质是一致的1. 算术平均数定义:总体或样本资料中所有观测数的总和除以观测数的个数所得的商,简称平均数、均数或均值直接计算法或减去(加上)常数法加权平均数2、实质是一样的,是因为它们都反映的一组数据的平均水平二、为了评价两种药物对于小鼠体重的影响,随机从两组各抽出20只测定其体重(g),结果如下:药物A处理组: 15, 15, 23, 24, 26, 25, 22, 19, 15, 17, 15, 20, 23, 21, 19, 22, 26, 21, 18, 23药物B处理组: 31, 28, 26, 31, 28, 34, 32, 29, 32, 35, 28, 29, 33, 30, 34, 32, 36, 38, 40, 38试从平均数、极差、标准差、变异系数几个指标评价两种药物对于小鼠体重的影响,并给出结论。
第一章常用统计学和农业试验术语生物统计学——是数理统计在生物学研究中的应用,它是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的科学。
1. 总体与样本1)总体 Population——具有相同性质的个体所组成的集合,它是指研究对象的全体。
2)有限总体(finite population)——个体有限的总体。
3)无限总体(infinite population)——个体极多或无限多的总体。
4)个体(individual)——组成总体的基本单元。
5)随机样本——从总体中随机抽取的样本称为随机样本(random sample)。
6)样本容量(样本含量)——样本中所包含的个体数称为样本容量或样本含量(sample size)。
2. 变量与常数1)变数 (variable): 每一个体的某一性状的观察值的集合称为变数。
它是表示在一个界限内变动着的性状的数值。
2)变量(variate):变数中的每一成员/某个性状的观察值称为变量。
3)连续变量——表示在变量范围内可抽出某一范围的所有值,这种变量之间是连续的、无限的。
4)非连续变量——也称为离散变量,表示在变量数列中,仅能取得固定数值。
5)定性的变量——表示某个体属于几种互不相容的类型中的一种。
6)定量的变量——指可测量的变量7)常数 constant——表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。
3.参数与统计数1)参数(参量)——是对一个总体特征的度量。
2)统计数(statistic)——从样本中计算所得的数值,它是总体参数的估计值。
4.误差与错误1)错误(mistake):—指试验过程中人为因素所引起的差错。
(错误是可以避免的。
)2)试验误差(error)——非人为因素引起的、观察值与处理真值之间的差异。
它影响试验的精确度和准确度(误差是不可以避免的,但可以尽量降低。
)5. 准确性与精确性1)准确性(accuracy)——是说明测定值对真值间的符合程度。
一单项选择题1. 数列1,3,5,7,9,11的中位数是(C)A.3B. 5C. 6D.72. 1,4,6,6,7,7,9这组数中其众数是(C)A.6B.7C.6和7D.93. 若事件A与事件B互为逆事件,则(D)A A∪B=ΩB A∪B=Ω或A∩B=ΦC A∩B=ΦD A∪B=Ω且A∩B=Φ4. 若事件A与事件B是互不相容事件,则P(AB)=(B)A.1B.0C.0.5D.Ω5. 下列不属于随机试验的特点是(D)A.每次试验的可能结果不只一个,且能事先明确试验的所有可能结果。
B.进行试验之前不能够确定到底哪个结果会发生。
C.试验可以在相同的条件下重复进行。
D.试验不可以在相同条件下重复进行。
6. 设F1(X)与F2(X)分别为随机变量X1与X2的分布函数,为使F(X)=a F1(X)-bF2(X)是某一随机变量的分布函数,在下列给定的各组数值中应取(A)A.a=3/5,b=-2/5B.a=2/3,b=2/3C.a=-1/2,b=3/2D.a=1/2,b=-3/27. 下列变量中属于非连续性变量的是(C)A. 身高B. 体重C. 血型D. 血压8. 下列不属于随机试验的特点是(A)A. 试验不可以在相同条件下重复进行B. 进行试验之前不能够确定到底哪个结果会发生.C. 试验可以在相同的条件下重复进行.D. 每次试验的可能结果不只一个,且能事先明确试验的所有可能结果.9. 在下列分布中,其中(A)分布是与自由度无关的。
A. 正态分布B. t分布C. F分布D. 分布10. 两样本平均数进行比较时,分别取以下检验水平,以(D)所对应的犯第二类错误的概率最小。
A. α=0.01B. α=010C.α=0.05D.α=0.2011. 下列哪个概率不可能是显著水平α的取值(A)A. 95%B. 5%C. 10%D. 2.5%12.下列说法正确的是(A)A. 离均差总和为零,离均差平方和最小B. 离均差总和不为零,离均差平方和最小C. 离均差总和为零,离均差平方和最大D. 离均差总和不为零,离均差平方和最大13. 若事件A与事件B是互不相容事件,则P(AB)=(B)A. 1B. 0C. 0.5D.Ω14. 一批种蛋的孵化率为80%,同时用两枚种蛋进行孵化,则至少有一枚能孵化出小鸡的概率为(B)A. 0.90B. 0.96C. 0.80D. 0.6415. “真作假”属于(B)A. 定性错误B. 第一类错误C.统计量错误D.第二类错误16. 数列11,23,35,47,59,61的中位数是(C)A. 23B. 35C. 41D. 4717. 正态分布曲线由参数U和6决定,U值相同时,正态曲线展开程度最大,曲线最矮宽的6值是(D)A. 0.5B. 1C. 2D. 318. 下列数值属于参数的是(A)A. 总体平均数B. 自变量C. 依变量D. 样本平均数19. T分布,F分布的取值区间分别为(A)A(-∞,+);[0,+∞)20. 下列那个分布不是离散型随机变量的分布(D)D. 正态分布21. 减少统计误差的主要方法是(C)C. 增加样本容量22. 在下列分布中,其中(A)分布是与自由度无关的。
A, 正态分布23. 总体服务从N(M,62),其中U未知,当检验H(0下标):σ(2上标)=σ(0下标)(2上标),H(A下标):σ(2上标)≠σ(0下标)(2上标)时应选择的统计量是(B)。
B. (N-1)S*S/σ(0下标)(2上标)24. 下面哪个分布不是指统计量的分布(C)。
C. 正态分布二填空题1. 对于任意事件A和B,A,B两事件至少发生一个表示为和。
事件A和B两个都发生表示为积事件。
2. 偏斜度g1>0,则分布是正偏,偏斜度g1<0,则分布是负偏,g1=0,则分布是正态分布。
3. 设事件A与事件B互不相容,P(A)=0.4,P(B)=0.2,则P(A/B)=0。
4. 若事件A与B独立,且P(A)=0.5,P(B)=0.5,则P(AB)=0.25。
5. 若X服从B(x,100,0.5),则E(X)=(50),D(X)=25。
6. 已知任一白细胞是嗜中性的概率为0.6,则6个白细胞中有3个是嗜中性的概率是0.2764。
7. 身高、体重、年龄这一类数据属于计量数据。
8. 事件A发生的概率符合古典概型,以m示基本事件数,n示基本事件总数,那么事件A 发生的概率P(A)=m/n。
9. 若事件A与B独立,且P(A)=0.4,P(B)=0.6,则P(AB)=0.24。
10. 统计假设检验中的无效假设与备择假设的内容一个互立事件。
11. 参数估计包括点估计和区间估计。
12. 试验误差可以分为随机误差和系统误差两类。
13. 从1,2,3,4,5中任取3个数字,则这3个数字中不含数字3的概率为2/5.14. 统计推断主要包括假检验和参数估计两个方面。
15. 二项分布的形状是由总体平均数和总体标准差两个参数决定的。
16. 资料按生物的性状特征可分为连续性变量和离散性变量。
三、判断题1. 1995年南京市雨花区蔬菜生产基地测量全部粉团萝卜肉质根重,所得的总体,称为无限总体。
(错)2. 从雌雄各半的动物体中抽出10只动物记录性别,再从该群体中抽出另外10只动物记录性别,多次抽取,其中雄性动物只数服从二项分布。
(错)3. 众数是指位于有序数列中点上的数。
(错)4. 设A、B为二事件,则P(AUB)=P(A)+P(B)。
(错)5. 自由度是指独立观测值的个数。
(对)6. 抽样误差是不可避免的,但其大小是可以控制的。
( 对)7. 统计学的假设检验是对总体特征的假设,其结论是完全正确的。
(错)四、名词解释1. 总体:具有相同性质的个体所组成的集合。
2. 变异参数:将样本标准差除以样本平均数,得出的百分比。
3. Ⅰ型和Ⅱ型错误:再假设检验中,如果H0是真实的,假设检验却否定了它,就犯了一个否定真实假设的错误,这类错误叫做Ⅰ型错误;如果H0不是真实的,假设检验时却接受了H0,否定了否定了HA,这样就犯了接受不真实假设的错误,这类错误叫Ⅱ型错误。
4. 正态分布:正态分布是一种连续型随机变量的概率分布,他的特征是大多数变量围绕在平均数左右,有平均数到分布的两侧,变量数减少,即中间多,两头少,有两侧对称。
5. 计量资料:由测量或度量所得的数据。
6. 统计量:是由样本计算所得的数值,它是描述样本特征的数量。
五、简答1.统计假设有哪几种?他们的含义是什么?答:统计假设分为无效假设和备择假设。
无效假设是直接检验的假设,是对总体提出的一个假想目标。
备择假设是与无效假设相反的一种假设,即认为实验结果中的差异是由与总参数不同引起的。
2.什么是正态分布?什么是标准正态分布?正态分布曲线有什么特点?答:正态分布是一种连续型随机变量的概率分布,他的特征是大多数变量围绕在平均数左右,有平均数到分布的两侧,变量数减少,即中间多,两头少,有两侧对称。
U=0,62=1的正态分布称为标准正态分布。
正态分布具有以下特点:①正态分布曲线是以平局数U为峰值的曲线,当X=U时,F(X)取最大值,1/(6*根号下2π)②正太分布是以U为中心向左右两侧对称的分布③(X-U)/6的绝对值越大,F(X)值就越小,但F(X)永远不等于0,所以正太分布以X轴为渐近线,X的取值区间为(-∞,+∞)④ 正态分布曲线完全由参数U和6来决定⑤正态分布曲线在X=U±6处各有一个拐点⑥ 正态分布曲线与X轴所围成的全部面积必定等于1。
3.什么是小概率原理?它在假设检验中有何作用?答:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但在多次重复试验中几乎是必然发生的,数学上称之小概率原理。
统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
它是假设检验的依据,如果在无效假设H0成立的条件,某事件的概率大于0.05或0.01,说明无效假设成立,则接受H0,否定HA,如果某时间的概率小于0.05或0.01,说明无效假设不成立,则否定H0,接受HA。
4.试解释必然事件、不可能事件和随机事件,并举例说明。
答:必然事件(certain event)是指在一定条件下必然出现的事件;相反,在一定条件下必然不出现的事件叫不可能事件(impossible);而在某些确定条件下可能出现,也可能不出现的事件,叫随机事件(random event)。
例如,发育正常的鸡蛋,在39°C下21天会孵出小鸡,这是必然事件;太阳从西边出来,这是不可能事件;给病人做血样化验,结果可能为阳性,也可能为阴性,这是随机事件。
六、计算题(自备小抄由YY提供)1.设随机变量X的概率分布为: X| -2 0 1/P| 1/5 2/5 2/5,求X的分布函数。
七、2.一实验动物养殖中心,将每30只动物装在一个笼子中,已知其中有6只体重不合格。
购买者从每一笼中随机抽出2只称重,若都合格则接受这批动物,否则拒绝。
问:(1)检查第一只时就不合格的概率? (2)第一只合格,第二只不合格的概率? (3)接受这批动物的概率?3.麦田内,平均每10m2有一株杂草,问每100m2麦田中有1株杂草,2株杂草的概率分别是多少?4.从南郊某地乘车前往北区火车站搭火车有两条路线可走,第一条路线穿过市区,路程较短,但交通拥挤,所需时间服从正态分布N(50,100),第二条路线沿环城公路走,路程较长,但意外阻塞较少,所需时间服从正态分布N(60,16)。
(1)假如有65分钟时间可用,问应走哪一条线路?(2)若有70分钟可用,又应走哪一条路线? (已知Φ(1.25)=0.8944,Φ(1.5)=0.9332,Φ(2)=0.9772Φ,(2.5)=0.9938)5. 已知豌豆籽粒重量服从正态分布N(377。
2,3。
32)。
在改善栽培条件后,随机抽取9粒,其籽粒平均重x=379.2,若标准差仍为3.3,问改善栽培条件是否显著提高了豌豆籽粒重量?u0.05=1.645(12分)。