生物统计上机操作第三讲
- 格式:doc
- 大小:87.50 KB
- 文档页数:4
《生物统计学》上机实验—— SPSS for Windows 统计软件操作与应用陈光升编绵阳师范学院生命科学与技术学院实验一数据的管理及基本统计分析一、数据格式化:用户可根据具体资料的属性对数据进行格式化。
主要有以下3种数据类型:Numeric:数值型,同时定义数值的宽度(Width),即整数部分+小数点+小数部分的位数,默认为8位;定义小数位数(Decimal Places),默认为2位。
Date:日期型。
如选择mm/dd/yy形式,则1995年6月25日显示为06/25/95。
String:字符型,用户可定义字符长度(Characters)以便输入字符。
二、数据的输入:定义好变量并格式化数据之后,即可向数据管理窗口键入原始数据。
数据管理窗口的主要部分就是电子表格,横方向为电子表格的行,其行头以1、2、3、……表示,即第1、2、3、……行;纵方向为电子表格的列,其列头以var00001,var00002,var00003……表示变量名。
行列交叉处称为单元格,即保存数据的空格。
鼠标一旦移入电子表格内即呈十字形,这时按鼠标左键可激活单元格,被激活的单元格以加粗的边框显示;用户也可以按方向键上下左右移动来激活单元格。
单元格被激活后,用户即可向其中输入新数据或修改已有的数据。
三、数据管理器列宽定义:点击Column Format...钮,用户可定义数据管理器纵列的宽度,以便显示较长的数值或文字;同时用户还可指定数值或文字在数据管理器单元格中的位置:Left表示靠左、Center表示居中、Right表示靠右(此为默认方式)。
四、数据的增删:增加一个新的变量列: Data菜单的Insert Variable命令项。
增加一个新的行: Data菜单的Insert Case 命令项。
增加一个新的观察值:Edit菜单的Cut命令项。
删除一个行:Delete键或选Edit菜单的Clear命令项。
删除一个变量列:Delete键或选Edit菜单的Clear命令项。
实践指导书生物统计学附试验设计张小辉EXCEL软件常用函数平均值:average标准差:stdev方差:var开根号:sqrt总和:sum平方和:sumsq乘积和:sumproduct平方:^2相关系数:correl实践一描述性统计分析和概率计算一、实验目的学习Excel电子表格常用的基本功能,掌握描述性统计分析的计算方法。
学习Excel电子表格常用的统计功能,掌握统计分析的粘贴函数。
二、实验设备计算机三、实验步骤1. 打开Excel,了解它的基本功能。
2. 输入原始数据,全部输入在一列里。
3. 描述性统计量的计算包括平均数、标准差、众数、中位数。
4 概率分布的计算Excel中,选定空格插入f函数回车显示结果:x计算不同分布的概率以及分位数需选用不同的函数:二项分布单一概率:BINOMDIST:输入(数值,实验总个数,概率,逻辑值(FALSE))二项分布累计概率:BINOMDIST:输入(数值,实验总个数,概率,逻辑值(TRUE))正态分布概率:NORMDIST :输入(数值,总体平均数,总体标准差,逻辑值(TRUE))正态分布分位数:NORMINV :输入(概率,总体平均数,总体标准差)t分布的两尾概率:TDIST :输入(临界值,自由度,尾数)t分布的两尾概率的分位数:TINV :输入(概率,自由度)X2分布的右尾概率:CHIDIST :输入(临界值,自由度)X2分布的右侧分位数:CHIINV :输入(概率,自由度)F分布的右尾概率:FDIST :输入(临界值,第一自由度,第二自由度)F分布的右侧分位数:FINV:输入(概率,第一自由度,第二自由度)四、实验内容1. 描述性统计量的计算以教材P23的例题1的100尾小黄鱼的体长数据资料为例,计算其描述性统计量。
2. 概率分布的计算(1)二项分布的计算:1头母猪一窝产了10头仔猪,分别求其中有4头公猪的概率?4头以及4头以下公猪的概率?设任何一头仔猪为公猪的概率为0.5。
一、大样本平均数的假设检验-u检验当总体方差已知,或者总体方差未2σ知但样本为大样本(n≥30)时,样本平均数的分布服从于正态分布,标本平均数的分布服从于正态分布标准化后则服从于标准正态分布,即u 分布。
因此用u检验法进行假设检验。
2(一)一个样本平均数的()个样本平均数的u检验1.总体方差σ2已知时的检验例某渔场按常规方法所育鲢鱼苗一月龄的平均体长7.25cm,标准差为1.58cm,为提高鱼苗质量,现采用一新方法进行育苗,月龄时随机抽取100尾进行行育苗一月龄时随机抽取测量,测得其平均体长为7.65cm,试问新育苗方法与常规方法有无显著差法法异?3(4)推断:u分布中,当a=0.05时,005=196u>196P<005u 0.051.96。
实得u >1.96,P <0.05,故在0.05显著水平上否定H0,接受HA,认为新育苗方法与常规方法有显著差异。
5例:为了比较“42-67*RRIM603”和“42-67PB86两个橡胶品种的割胶产量,两品67*PB86”两个橡胶品种的割胶产量两品种分别随机抽样55株和107株进行割胶,割胶平均产量分别为95.4mL株-1和77.6mL954L776L株-1,割胶产量的方差分别为936.6(mL株-1)和800.89 (mL株-1),试检验两。
个橡胶品种在割胶产量上是否有显著差别10如果总体未知、且为小样本(n ≤2σ30),则用t 检验法。
t 检验法,就是在显著性检验时利用t 分布进行概率计算的检验方法分布进行概率计算的检验方法。
当样本容量n <30且总体方差未知时,检2σ验样本平均数与总体平均数μ的差异显著性,就必须使用t 检验。
在生物学研究中,具有重要意义。
~0−=x μ)1(−n tn s t【例3·3】63【例】晚稻良种汕优的千粒重=27.5g。
现育成一高产品种协优辐819,0μ在9个小区种植,得其千粒重为:32528628424729132.5、28.6、28.4、24.7、29.1、27.2、29.8、33.3、29.7(g)(g)问新育成品种的千粒重与汕优63有无显著差异?151、提出假设==27.50H :0μμ≠275A H :μ27.5−x )1(~0−=n t t μns 1df n =−在实际工作中还经常会遇到推断二、两个样本平均数差异显著性t 检验两个样本平均数差异是否显著的问题,以了解两样本所属总体的平均数是否相同。
《生物统计学》教学大纲课程名称:生物统计学课程编号:H09026英文名称:Biostatistics 课程属性:必修课学时:48 学分:3.0先修课程:高等数学、线性代数、概率论与数理统计、普通生物学等课程适用专业:生物技术、生物科学等本科专业一、课程简介统计学是论述收集、分析并解释数字信息的科学,生物统计学则是一门运用统计学的原理和方法,研究生物学数据资料的交叉学科。
统计方法是现代生物学研究不可缺少的工具,而且在新兴的分子生物学研究中也发挥着重要作用。
正确的统计分析能够帮助我们正确认识事物客观存在的规律性。
本课程教学的全过程可以看成是一个生物信息搜集、处理、分析,从而提炼新的生物信息的过程。
教学重点是通过生物现象的数量观察、对比、归纳和分析,揭示那些困惑费解的生物学问题,从偶然性的剖析中,发现事物的必然性,指导生物科学的理论和实践。
二、课程内容及学时分配第一单元:绪论(建议学时数:2学时)【学习目的和要求】1.知识掌握:理解什么是统计,什么是统计学,什么生物统计学。
2.能力培养:学会用统计的方法来看待生物学问题。
3.教学方法:举例讲授。
………………………【重点】统计工作、统计数据及统计学以及它们间的关系。
【难点】描述统计与推断统计的区别,应用的场合。
第二单元:统计数据的收集与整理(建议学时数:4学时)【学习目的和要求】1.知识掌握:1.1 数据收集和预处理:几个常用的统计术语、数据收集和预处理1.2 数据整理和显示:数据的整理、数据的显示1.3 数据分布特征的测度:集中趋势的测度、离散程度的测度、偏态和峭度的测度2.能力培养:了解数据收集及预处理的内容和方法。
掌握不同类型分布图的制作及应用;掌握集中趋势、离散趋势及分布形状的统计特征数计算及应用。
3.教学方法:举例讲授。
………………………【重点】集中趋势、离散趋势及分布形状的统计数计算。
【难点】数据的计量尺度,集中趋势、离散趋势及分布形状的统计特征数应用。
研究生《生物统计学》课程上机内容第三讲:如何SPSS做t检验(如何下载服务器上的《生物统计学》课程文件:打开IE,在地址栏输入:ftp://202.116.6.197,打开页面后点击<file>-登录,用户名:hydrobio,密码为空,登陆,下载文件)SPSS的t检验统计假设检验:SPSS 提供了计算指定变量的综合描述统计量的过程和对均值进行比较检验的过程:(1)用于计算变量的综合统计量的Means 过程[Analyze]=>[Compare Means]=>[Means](2)用于单独样本的t 检验过程[Analyze]=>[Compare Means]=>[One-Sample T Test](3)用于独立样本的t 检验过程[Analyze]=>[Compare Means]=>[Independent-Samples T Test] 用于检验是否两个不相关的样本来自具有相同均值的总体。
(4)用于配对样本的t 检验过程[Analyze]=>[Compare Means]=>[Paired-Samples T Test]用于检验两个相关的样本是否来自具有相同均值的总体。
一、单样本t检验:的总体)?如何同时对多个样本进行单样本t检验(即验证这些样本是否都是来自μ案例:一个生产高性能汽车的公司生产直径为322mm的圆盘制动闸。
公司的质量控制部门随机抽取不同机器生产的制动闸进行检验。
共有4台机器,每台机器抽取16支产品,测量结果见数据文件“制动闸直径单样本t检验.sav”,利用单样本t检验来检验每台机器生产的产品均值和322mm在90%置信水平下是否有显著差异。
SPSS操作:(1)数据文件:两个变量分别为“制动闸直径”和“机器编号”,“机器编号”取值1~4,分别指代4台机器;(2)拆分数据文件:若不根据“机器编号”对数据进行拆分,则会将“制动闸直径”中的所有数据作为一个样本来处理。
选择[Data] =>[Split file],弹出Split file(拆分文件)对话框,=>[Independent-Samples T Test],选择“Compare groups”,然后将“机器编号”导入“Groups Based on”列表框内,<OK>,即按不同机器编号将制动阀直径数据分为4个样本文件。
(注意:除非取消数据拆分,否则后面所有的统计操作都是按所拆分的各个文件来分析。
)(3)单样本t检验:[Analyze]=>[Compare Means]=>[One-Sample T Test],弹出对话框,将“制动闸直径”导入“Test Variable”框中,在“Test Value”中输入322,点击<Options>,打开<One-Sample T Test>对话框,在“Confidence Interval”框中输入“90”,<Continue>返回,<OK>(4)结果分析:以第一台机器数据为例,t=-0.541,p=0.597(双尾检验)>0.05,故第一台机器所生产制动闸直径与322mm无显著差异;第一台机器样本平均值与总体均值之差 x-μ0=-0.0015063,其90%置信区间为(-0.006390,0.003378),意味着第一台机器生产的样本所来自总体的平均值以90%的概率落在(321.9985-0.006390,321.9985+0.003378),即(321.993610,322.003378)其总体均值的90%置信区间,包含了322,表明与t检验结果相符。
(5)同理分析第二、三、四台机器生产的数据。
当0.01<p<0.05,差异显著;当p<0.01差异极显著自行练习:=300g。
喷洒植物生长促进剂后,随机抽取9个果1、已知玉米单交种群单105的平均穗重μ穗,其穗重为:308、305、311、298、315、300、321、294、320g。
问喷药后与喷药前的果穗重差异是否显著?SPSS操作:[Analyze]=>[Compare Means]=>[One-Sample T Test],弹出对话框,将“穗重”导入“Test Variable”框中,在“Test Value”中输入300,<OK>2、某春小麦良种的千粒重μ0 =34g ,现自外地引入一高产品种,在8 个小区种植,得其千粒重(g) 为:35.6,37.6,33.4,35.1,32.7,36.8,35.9,34.6,问新引入品种的千粒重与当地良种有无显著差异?二、成组数据t检验案例:分别测得14 例老年性慢性支气管炎病人及11 例健康人的尿中17 酮类固醇排出量(mg/dl)如下,试比较两组均值有无显著性差别(α=0.05)。
(数据文件:14 例老年性慢性支气管炎病人及11 例健康人的尿中17 酮类固醇排出量比较.sav)SPSS操作:(1)定义变量:实际观察值定义为X,变量G 来区分病人与健康人(病人“1”,健康人“2”) (2)[Analyze]=>[Compare Means]=>[Independent-Samples T Test],打开[Independent samples T Test]主对话框。
选X使之进入[Test Variable(s)]列表框,选G使之进入[Grouping Variable](分组变量)框,单击[Define Groups]按钮弹出[Define Groups](定义分组)框,输入两组的分组变量值:在[Group 1]中输入“1”,在[Group 2]中输入“2”。
单击[Continue]按钮,返回[Independent-samples T Test]主对话框,单击[OK]按钮即完成。
(注:若分组变量是连续型的变量,可在[Define Groups]对话框的“cut point”(分割点)文本框中输入分割点,分割点将数据分为两部分,大雨等于该值的数据为一组,小于此值的数据为另一组)(3)结果分析:1)先看方差同质性检验结果,根据方差齐性(p>0.05)或方差不齐(p<0.05)的结果来选择接受不同的t检验结果;2)第7列“Mean Difference”和第8列“Std. Error Difference”分别为t统计量的两个总体均值差的均值和两个总体均值差的标准误差;第9列和第10列为置信度为95%时的两个总体均值差的置信下限和置信上限,可以得到两个总体均值差的置信度为95%的置信区间为(-2.46755,0.21023),包含数据0,即表示支持t检验中的H0:μ1-μ2=0自行练习:1、给幼鼠喂以不同的饲料,研究每日钙留存量(mg)是否有显著不同,给甲组12只喂A饲料,乙组9只喂B饲料,结果如下:2、两小麦品种千粒重(g)的调查结果如下:品种甲:50,47,42,43,39,51,43,38,44,37;品种乙:36,38,37,38,36,39,37,35,33,37。
试检验两小麦品种千粒重差异是否显著?3、研究矮壮素使玉米矮化的效果,在抽穗期测定喷矮壮素小区8株、对照区玉米9株,其植问施加矮壮素后植株高度是否明显低于对照组?三、配对数据t检验案例:为研究某种减肥茶是否具有明显的减肥效果,某美体健身机构对35名肥胖自愿者进行减肥跟踪调研。
首先记录其喝减肥茶前的体重,三个月后再依次记录他们喝茶后的体重,通过这两组样本数据的对比分析,推断减肥茶是否具有明显的减肥效果?编号123456789101112减肥前9095829110087919086879888减肥后637179737465677360767172编号131415161718192021222324减肥前828792939584838987908295减肥后756267747868747160706769编号2526272829303132333435减肥前8183869395969781888595减肥后7973746060757770637368SPSS操作:(1)建立数据文件,设定两个变量:“减肥前”和“减肥后”;(2)[Analyze]=>[Compare Means]=>[Paired-Samples T Test],打开[Paired-Samples T Test]主对话框。
将两变量“减肥前”和“减肥后”导入[Paired Variables]列表框,若指定置信水平,可在<Options>项中修改,否则默认为95%。
单击[OK]按钮即完成;(3)Output结果分析:“Paired Samples Correlations”表为两变量之间的相关性,若p>0.05,表示二者线性关系不显著;(4)配对数据t检验结果:第2列为配对样本的平均差值,第3列为差值的标准差,第4列是差值的均值标准误差,第5列和第6列分别是在置信度为95%时差值的置信下限和置信上限,共同构成该差值的置信区间。
第7列为统计量的观测值,第8列为自由度,第9列为双尾检验概率p值,当p>0.05时,差异不显著,当p<0.05时,差异显著。
自行练习:1、在研究饮食中缺乏维生素E与肝中维生素A的关系时,将试验动物按性别、体重等配成8对,并将每对中的两头试验动物用随机分配法分别分配在正常饲料组和维生素E缺乏组,然后将试验动物杀死,测定试验动物肝中的维生素A含量,其测定结果如下表,试检验正常饲料组和维生素E缺乏组两组饲料对试验动物肝中维生素A含量作用是否有显著差异。
2、给幼鼠喂以不同的饲料,研究每日钙留存量(mg)是否有显著不同。
给同一鼠先后喂不同的饲料:。