生物统计学讲课稿
- 格式:doc
- 大小:410.00 KB
- 文档页数:7
课程名称:生物统计学授课对象:生物科学类专业学生授课时间:2课时教学目标:1. 理解生物统计学的基本概念和原理。
2. 掌握生物统计学中的常用统计方法。
3. 能够运用生物统计学方法分析生物数据。
4. 培养学生的统计思维能力和应用意识。
教学重点:1. 生物统计学的基本概念和原理。
2. 常用统计方法,如描述性统计、推断性统计、方差分析等。
教学难点:1. 统计方法的实际应用。
2. 统计结果的解释和分析。
教学过程:一、导入(10分钟)1. 提问:什么是生物统计学?2. 介绍生物统计学的定义、研究对象和意义。
3. 引导学生思考生物统计学在生物学研究中的应用。
二、基本概念与原理(20分钟)1. 介绍生物统计学的基本概念,如总体、样本、变量、参数、统计量等。
2. 讲解概率论和数理统计的基本原理,如随机事件、概率分布、期望、方差等。
3. 通过实例说明生物统计学在生物学研究中的应用。
三、常用统计方法(30分钟)1. 描述性统计:介绍均值、中位数、众数、方差、标准差等统计量,并通过实例说明如何计算和解释这些统计量。
2. 推断性统计:介绍假设检验、置信区间、显著性水平等概念,并通过实例说明如何进行假设检验和计算置信区间。
3. 方差分析:介绍单因素方差分析、多因素方差分析等,并通过实例说明如何进行方差分析。
四、案例分析(10分钟)1. 选择一个生物学领域的实际案例,引导学生运用所学的统计方法进行分析。
2. 鼓励学生提出问题、讨论解决方案,并分享分析结果。
五、总结与作业(10分钟)1. 总结本节课的重点内容,强调生物统计学在生物学研究中的应用。
2. 布置作业,要求学生运用所学的统计方法分析一组生物学数据。
教学评价:1. 课堂参与度:观察学生在课堂上的提问、讨论和案例分析中的表现。
2. 作业完成情况:检查学生的作业,评估学生对统计方法的理解和应用能力。
教学资源:1. 教材:《生物统计学》2. 教学课件3. 生物学领域的实际案例备注:1. 教师应根据学生的实际情况调整教学内容和教学方法。
第五章统计推断通过实例、多媒体图示详细讲解下述原理和概念。
第一节统计假设测验的基本原理一、统计假设1.零假设:2.备择假设二、小概率原理小概率的事件在一次实验当中,几乎是不会发生的。
三、显著水平显著水平就是维持零假设成立的最小概率,记为α。
四、单侧检验和双侧检验1、单侧检验:在备择假设中只包含一种可能性的检验。
2、双侧检验:在备择假设中包含两种可能性的检验。
3.如何选择做单侧检验和双侧检验在抽样数据相同的情况下,单侧检验和双侧检验的结论不同,这是因为在单侧检验中应用了µ不可能小于10.00克的已知条件,因此增加了单侧检验的灵敏性,使单侧检验更容易拒绝零假设。
根据实验的考察重点和已知条件来确定选择单侧检验还是双侧检验。
通过实例、多媒体图示详细讲解下述原理和概念。
五、两种类型的错误I型错误:H0是真实的,在统计推断时却拒绝了H0。
又称拒真错误。
α= P(犯I 型错误)= P(拒绝H0/H0是真实的,μ= μ0)一般犯I 型错误的规律不会超过显著水平。
II型错误:如果μ ≠ μ0 ,而是μ = μ1,若接受接受 H0:μ = μ0 ,则发生了另一种倾向的错误,我们称之为II型错误。
发生II型错误的概率用β 表示,β 是可以计算的。
复习思考题:1.什么是统计推断?统计推断的目的是什么?怎样利用统计假设检验,判断某种现象属于偶然?2.什么叫I型错误?什么叫II型错误?在不增加犯I型错误概率的情况下,如何降低犯II型错误的概率?第二节单个样本的统计假设测验一、单个样本统计假设测验的程序1、假设H0 :θ = θ0 来源:以往的经验,某种理论或模型,预先的规定HA:θ ≠ θ0 来源: H0以外的可能的值,担心实验会出现的值,θ > θ0 希望实验出现的值,有某种特殊意义的值。
θ < θ02、显著水平α:α = 0.05,α = 0.013、两种类型的错误:α,β4、确定应使用的统计量:u,t,χ25、建立在α水平上H0的拒绝域6、对推断的解释通过实例讲解下面两个问题:二、对单个样本平均数的测验1、在σ已知时,样本平均数的显著性测验-u检验2、在σ未知时,样本平均数的显著性测验 - t检验通过实例详细讲解三、单个样本变异性的检验 ----χ2检验(一)、检验的程序1、假设H0:σ = σ0HA:σ ≠ σ0σ >σ0(已知σ不可能小于σ0)σ < σ0(已知σ不可能大于σ0 )2、显著水平α= 0.05,α= 0.013、统计量χ24、H0的拒绝域:5、作出结论,并给予生物学解释。
生物统计学教案(5)生物统计学教案第五章统计推断教学时间:5学时教学方法:课堂板书讲授教学目的:重点掌握两个样本的差异显著性检验,掌握一个样本的差异显著性检验,了解二项分布的显著性检验。
讲授难点:一个、两个样本的差异显著性检验统计假设检验:首先对总体参数提出一个假设,通过样本数据推断这个假设是否可以接受,如果可以接受,样本很可能抽自这个总体,否则拒绝该假设,样本抽自另外总体。
参数估计:通过样本统计量估计总体参数。
5.1 单个样本的统计假设检验5.1.1 一般原理及两种类型的错误例:已知动物体重服从正态分布N(μ,σ2),实验要求动物体重μ=10.00g。
已知总体标准差σ=0.40g,总体平均数μ未知,为了得出对总体平均数μ的推断,以便决定是否接受这批动物,随机抽取含量为n的样本,通过样本平均数,推断μ。
1、假设:H 0: μ=μ或H0: μ-μ0=0H A : μ>μμ<μμ≠μ三种情况中的一种。
本例的μ0=10.00g,因此H: μ=10.00HA: μ>10.00或μ<10.00或μ≠10.002、小概率原理小概率的事件,在一次试验中几乎是不会发生的,若根据一定的假设条件计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,从而拒绝假设。
从动物群体中抽出含量为n的样本,计算样本平均数,假设该样本是从N(10.00,0.402)中抽取的,标准化的样本平均数服从N (0,1)分布,可以从正态分布表中查出样本抽自平均数为μ的总体的概率,即P (U >u ), P (U <-u ), 以及P (|U |>u )的概率。
如果得到的值很小,则x 抽自平均数为μ0的总体的事件是一个小概率事件,它在一次试验中几乎是不会发生的,但实际上它发生了,说明假设的条件不正确,从而拒绝零假设,接受备择假设。
显著性检验:根据小概率原理建立起来的检验方法。
《生物统计学》教案授课教师:陈彦云宁夏大学生命科学学院教学内容与组织安排:第一章绪论讲述本章教学目标、概述本课时主要内容摘要:生物统计学是数理统计学的原理和方法在生命科学领域的具体应用,它是运用统计的原理和方法对生物有机体开展调查和试验,目的是以样本的特征来估计总体的特征,对所研究的总体进行合理的推论,得到对客观事物本质和规律性的认识。
生物统计学主要内容包括试验设计和统计分析两大部分,其作用主要有四个方面:提供整理、描述数据资料的可行方法并确定其数量特征;判断试验结果的可靠性;提供由样本推断总体的方法;提供试验设计的原则。
生物体计学的发展概况及六组统计学常用术语。
重点内容:生物统计学的概念、内容及作用,常用术语。
第一节、生物统计学的概念及其重要性统计学(Statistics)是把数学的语言引入具体的科学领域,把具体科学领域中要待研究的问题抽象为数学问题的过程,它是收集、分析、列示和解释数据的一门艺术和科学,目的是求得可靠的结果。
它有许多分支,如工业统计、农业统计、卫生统计等等。
生物统计学是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法,分析、推断和解释生命过程中的各种现象和试验调查资料的科学。
属于生物数学的范畴第二节生物统计学的主要内容及作用生物体计学主要内容包括试验设计和统计分析两大部分。
在试验设计中,主要介绍试验设计的有关概念、试验设计的基本原则,试验设计方案的制定,常用试验设计方法,其中主要有对比试验设计、随机区组设计、拉方设计,正交设计等;在统计分析中,主要包括数据资料的搜集与整理、数据特征数的计算、统计推断、方差分析、回归和相关分析等。
生物统计学的作用主要有四个方面:1提供整理、描述数据资料的可行方法并确定其数量特征;2判断试验结果的可靠性;3提供油样本推断总体的方法;4提供试验设计的一些重要原则。
第三节统计学的发展概况由于人类的统计实践是随着计数活动而产生的,因此,统计发展史可以追溯到远古的原始社会,也就是说距今足有五千多年的漫长岁月。
生物统计学第一章概论一、什么是生物统计学?生物统计学主要内容和作用?1、生物统计学是数理统计在生物学研究中的应用,它是应用数理统计的原理,运用统计方法来认识、分析、推断和解释生命过程中的各种现象和试验调查资料的科学。
属于生物数学的范畴2、主要内容基本原则对比设计试验设计方案制定随机区组设计常用试验设计方法裂区设计资料的搜集和整理拉丁方设计、正交设计统计分析数据特征数的计算统计推断、方差分析协方差分析、回归和相关分析主成分分析、聚类分析3、生物统计学的基本作用:(1)提供整理和描述数据资料的科学方法,确定某些性状和特征的数量特征(2(3)提供由样本推断总体的方法(4)提供试验设计的一些重要原则二、解释概念:总体、个体、样本、变量、参数、统计数、效应、试验误差总体:具有相同性质或属性的个体所组成的集合称为总体,它是指研究对象的全体;个体:组成总体的基本单元称为个体样本:从总体中抽出若干个体所构成的集合称为样本变量:变量,或变数,指相同性质的事物间表现差异性或差异特征的数据参数:描述总体特征的数量称为参数,也称参量统计数:描述样本特征的数量称为统计数,也称统计量效应:通过施加试验处理,引起试验差异的作用称为效应试验误差:误差也称为实验误差,是指观测值偏离真值的差异,可分为随机误差和系统误差三、准确性与精确性有何区别?准确性,也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。
精确性,也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。
准确性反应测量值与真值符合程度的大小,而精确性则是反映多次测定值的变异程度。
(具体在课本第7页)第二章样本统计量与次数分布一、算数平均数与加权平均数形式上有何不同?为什么说它们的实质是一致的?1. 算术平均数定义:总体或样本资料中所有观测数的总和除以观测数的个数所得的商,简称平均数、均数或均值直接计算法或减去(加上)常数法加权平均数2、实质是一样的,是因为它们都反映的一组数据的平均水平二、为了评价两种药物对于小鼠体重的影响,随机从两组各抽出20只测定其体重(g),结果如下:药物A处理组: 15, 15, 23, 24, 26, 25, 22, 19, 15, 17, 15, 20, 23, 21, 19, 22, 26, 21, 18, 23药物B处理组: 31, 28, 26, 31, 28, 34, 32, 29, 32, 35, 28, 29, 33, 30, 34, 32, 36, 38, 40, 38试从平均数、极差、标准差、变异系数几个指标评价两种药物对于小鼠体重的影响,并给出结论。
详细结果略,本题考查平均数(P22)、极差(P24)、标准差(P25)、变异系数(P27)等特征数第三章概率与分布一、试解释必然事件、不可能事件、随机事件、频率、概率、正态分布、抽样误差、标准误?必然事件:在一定条件下必然出现的现象称为必然事件不可能事件:在一定条件下必然不出现的事件称为不可能事件随机事件:在某些确定的条件下,可能出现也可能不出现的现象,称为随机事件,简称“事件”频率:若在相同的条件下,进行了n次试验,在这n次试验中,事件A出现的次数m称为事件A出现的频数,比值m/n称为事件A出现的频率,记为W(A)=m/n0≤W(A) ≤1概率:概率的统计定义:设在相同的条件下,进行大量重复试验,若事件A的频率稳定地在某一确定值p的附近摆动,则称p为事件A出现的概率。
P(A) = p正态分布:正态分布也称为高斯分布,是一种连续型随机变量的概率分布。
它的分布状态是多数变量值都围绕在平均值左右,由平均值到分布的两侧,变量数减少抽样误差:由这些样本算得的平均数有大有小,不尽相同,与原总体均数μ相比往往表现出不同程度的差异。
这种差异是由随机抽样造成的,称为抽样误差标准误:标准误,平均数抽样总体的标准差),标准误的大小反映样本平均数的抽样误差的大小,即精确性的高低2、已知u服从标准正态分布N(0,1),试查表计算下列各小题的概率值:(1) P(0.3<u≤1.8) P=0.34617(2) P (-1<u ≤1) P=0.6826(3) P (-1.96<u ≤1.96) P=0.95(4) P (-2.58<u ≤2.58) P=0.9901(注:此类题计算方法见课本P43例3.9)第四章统计推断一、什么是统计推断?统计推断有哪几种,含义是什么?统计推断:由一个样本或一糸列样本所得的结果来推断总体的特征,主要包括假设检验和参数估计两个方面假设检验:假设检验又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际原理,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断参数估计:参数估计是统计推断的另一个方面,它是指由样本结果对总体参数在一定概率水平下所作出的估计,参数估计包括区间估计和点估计。
参数的区间估计和点估计是建立在一定理论分布基础上的一种方法二、什么是小概率原理?它在假设检验中有何作用?小概率原理:如果假设一些条件,并在假设的条件下能够准确地算出事件A出现的概率α为很小,则在假设条件下的n次独立重复试验中,事件A将按预定的概率发生,而在一次试验中则几乎不可能发生作用:在假设检验中,根据小概率原理计算出的可能性若小于α则否定原假设,若大于α则接受原假设三、用中草药青木香治疗高血压,记录了13个病例,所测定的舒张压(mmHg)数据如下:分析:该题考查的是成对资料平均数的假设检验,用t检验法;检验该药是否具有降血压作用,故用单尾检验答案:t=5.701,否定H0,接受HA,即该药具有降血压的作用(注:此类题详细解题步骤见课本P68例4.11)4、调查了甲、乙两医院乳腺癌手术后5年的生存情况,甲医院共有755例,生存数为485人,乙医院共有383例,生存数为257人,问两医院乳腺癌手术后5年生存率有无显著差异?分析:两个样本频率的假设性检验;np和nq>30,无需连续性矫正,用u检验;事先不知道两个生存率孰高孰低,用双尾检验答案:u=-0.958 ,接收H0,否定H A,即两医院乳腺癌手术后5年生存率无显著差异(注:此类题型详解见课本P72例4.14、例4.15;例4.14是不需要连续性矫正的情况,例4.15是需要连续性矫正的情况)第五章χ2 检验一、χ2主要有几种用途?各自用于什么情况下的假设检验?χ2检验的用途:适合性检验(也称吻合度检验)、独立性检验、同质性检验(1)适合性检验比较观测数与理论数是否符合的假设检验用途:遗传学中用以检验实际结果是否符合遗传规律、样本的分布与理论分布是否相等、自由组合定律(2)独立性检验是指研究两个或两个以上的计数资料或属性资料之间是相互独立的或者是相互联系的假设检验,通过假设所观测的各属性之间没有关联,然后证明这种无关联的假设是否成立(3)同质性检验在连续型资料的假设检验中,对一个样本方差的同质性检验,也需进行χ2 检验(课本P78—P80是样本方差的同质性检验,个人觉得考的几率不大)二、有一大麦杂交组合,F2的芒性状表型有钩芒、长芒和短芒三种,观察其对应株数为348,115,157。
试检验其比率是否符合9:3:4的理论比率分析:此题为χ2适合性检验答案:χ2=0.041,χ20.05=3.84;χ2<χ20.05,p>0.05,接收H0,否定HA,即大麦F2的比率符合9:3:4的理论比率(注:df=1时,需进行连续性矫正;课本P85例5.1、P87例5.3)对于资料数多于两组的值,可以用下列简式:(课本P87例5.3)三、某仓库调查不同品种苹果的耐储藏情况,随机抽取“国光”苹果200个,腐烂14个;“红富士”苹果178个,腐烂16个,试问这两种苹果的耐贮性差异是否显著?分析:次题为χ2独立性检验(2×2 列联表的独立性检验)答案:χ2=0.274,χ2<χ20.05,p>0.05, 接收H0,否定H A,即这两种苹果的耐贮性差异与苹果种类无关(注:此类题型见课本P88例5.4)2×2 列联表需要进行连续性矫正,简式为(课本P882×2 列联一般形式、例5.4)2×c列联表不需要进行连续性矫正,简式为r×c列联表不需要进行连续性矫正第六章方差分析一、什么是方差分析?方差分析的基本思想与一般步骤?方差分析又叫变量分析,它是用以检验两个或多个均数间差异的假设检验方法。
它是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一种引伸基本思想:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小总变异来源于处理效应和实验误差一般步骤:(1)平方和计算(2)自由度计算(3)计算方差(注:详见课本P99例6.1)二、什么是多重比较?多重比较有哪些方法?多重比较:要明确不同处理平均数两两间差异的显著性,每个处理的平均数都要与其他的处理进行比较,这种差异显著性的检验就叫多重比较;统计上把多个平均数两两间的相互比较称为多重比较。
方法:最小显著差数法(LSD法)和最小显著极差法(LSR法)LSD法的实质是两个平均数相比较的t检验法、 LSR法克服了LSD法的局限性,采用不同平均数间用不同的显著差数标准进行比较,它可用于平均数间的所有相互比较三、为了研究氟对种子发芽的影响,分别用四种不同浓度的氟化钠溶液处理种子,随后进行发芽试验(每盆50粒,每处理重复三次),观察它们的发芽情况,测得芽长如下表。
试作方差分析,并用LSD法、SSR 法和q法分别进行多重比较处理 1 2 30ug·g-1(对照) 8.9 8.4 8.610ug·g-1 8.2 7.9 7.550ug·g-1 7.0 5.5 6.1100ug·g-1 5.0 6.3 4.1 答案:F=15.225**, s1-2=0.574,s=0.406四、用同一公猪对三头母猪进行配种试验,所产各头仔猪断奶时的体重(kg)资料如下:No.1: 24.0,22.5,24.0,20.0,22.0,23.0,22.0,22.5;No.2:19.0,19.5,20.0,23.5,19.0,21.0,16.5;No.3:16.0,16.0,15.5,20.5,14.0,17.5,14.5,15.5,19.0试分析母猪对仔猪体重效应的差异显著性答案:F=21.515**,s1-2=0.944第七章回归和相关分析一、什么叫回归分析?回归截距和回归系数的统计学意义?回归分析:(因果关系)如果对x的每一个可能的值,都有随机变量y的一个分布相对应,则称随机变量y对变量x存在回归关系,是一个变量的变化受另一个变量或几个变量的制约回归截距:常量a,a是总体回归截距,是回归直线在纵坐标的截距,它是y 的本底水平,即x对y没有任何作用时y的数量表现,它属于不能用x来估计的部分回归系数:β为总体回归系数,βx表示依变量y的值改变中,由y与自变量x的线性回归关系所引起变化的部分,即可以由x直接估计的部分Y=a+bx:a为当x=0时的Y值,即直线在y轴上的截距,称为回归截距;b 为回归直线的斜率,称为回归系数,其含义是自变量x改变一个单位,依变量y平均增加或减少的单位数二、什么叫相关分析?相关系数和决定系数各具什么意义?相关分析:(平行关系)是两个以上变量之间共同受到另外因素的影响相关系数:如果两个变量间呈线性关系,但不需要由一个变量来估计另一个变量,只需了解两个变量的相关程度以及相关性质,可以通过计算表示两个变量相关程度和性质的统计数——相关系数来进行研究决定系数:统计中还有另外一个表示相关程度的统计数——决定系数,决定系数定义为相关系数r的平方。