生物统计附试验设计第五章t检验(2017)
- 格式:ppt
- 大小:2.22 MB
- 文档页数:125
t 检验前面讲了样本平均数抽样分布的问题。
抽样研究的目的是用样本信息来推断总体特征。
所谓统计推断是根据样本和假定模型对总体作出的以概率形式表述的推断,它主要包括假设检验(test of hypothesis )和参数估计(parametric estimation )二个内容。
由一个样本平均数可以对总体平均数作出估计,但样本平均数包含有抽样误差,用包含有抽样误差的样本平均数来推断总体,其结论并不是绝对正确的。
因而要对样本平均数进行统计假设检验。
假设检验又叫显著性检验(test of significance ),是统计学中一个很重要的内容。
显著性检验的方法很多,常用的有t 检验、F 检验和χ2检验等。
尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。
本章以两个平均数的差异显著性检验为例来阐明显著检验的原理,介绍几种t 检验的方法,然后介绍总体参数的区间估计(interval estimation )。
第一节 显著性检验的基本原理一、显著性检验的意义为了便于理解,我们结合一个具体例子来说明显著性检验的意义。
随机抽测10头长白猪和10头大白猪经产母猪的产仔数,资料如下:长白:11,11,9,12,10,13,13,8,10,13大白:8,11,12,10,9,8,8,9,10,7经计算,得长白猪10头经产母猪产仔平均数1x =11头,标准差S 1=1.76头;大白猪10头经产母猪产仔平均数2x =9.2头,标准差S 2=1.549头。
能否仅凭这两个平均数的差值1x -2x =1.8头,立即得出长白与大白两品种经产母猪产仔数不同的结论呢?统计学认为,这样得出的结论是不可靠的。
这是因为如果我们再分别随机抽测10头长白猪和10头大白猪经产母猪的产仔数,又可得到两个样本资料。
由于抽样误差的随机性,两样本平均数就不一定是11头和9.2头,其差值也不一定是1.8头。
造成这种差异可能有两种原因,一是品种造成的差异,即是长白猪与大白猪本质不同所致,另一可能是试验误差(或抽样误差)。
《生物统计附试验设计》习题集(动物医学专业用)第一章绪论一、名词解释总体个体样本样本含量随机样本参数统计量准确性精确性二、简答题1、什么是生物统计?它在畜牧、水产科学研究中有何作用?2、统计分析的两个特点是什么?3、如何提高试验的准确性与精确性?4、如何控制、降低随机误差,避免系统误差?第二章资料的整理一、名词解释数量性状资料质量性状资料半定量(等级)资料计数资料计量资料二、简答题1、资料可以分为哪几类?它们有何区别与联系?2、为什么要对资料进行整理?对于计量资料,整理的基本步骤怎样?3、在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好?4、统计表与统计图有何用途?常用统计图、统计表有哪些?第三章平均数、标准差与变异系数一、名词解释算术平均数几何平均数中位数众数调和平均数标准差方差离均差的平方和(平方和)变异系数二、简答题1、生物统计中常用的平均数有几种?各在什么情况下应用?2、算术平均数有哪些基本性质?3、标准差有哪些特性?4、为什么变异系数要与平均数、标准差配合使用?三、计算题1、10头母猪第一胎的产仔数分别为:9、8、7、10、12、10、11、14、8、9头。
试计算这10头母猪第一胎产仔数的平均数、标准差和变异系数。
2、随机测量了某品种120头6月龄母猪的体长,经整理得到如下次数分布表。
试利用加权法计算其平均数、标准差与变异系数。
组别组中值(x)次数(f)80—84 288—92 1096—100 29104—108 28112—116 20120—124 15128—132 13136—140 33、某年某猪场发生猪瘟病,测得10头猪的潜伏期分别为2、2、3、3、4、4、4、5、9、12(天)。
试求潜伏期的中位数。
4、某良种羊群1995—2000年六个年度分别为240、320、360、400、420、450只,试求该良种羊群的年平均增长率。
5、某保种牛场,由于各方面原因使得保种牛群世代规模发生波动,连续5个世代的规模分别为:120、130、140、120、110头。
生物统计附实验设计(明道绪-- 第四版)最全资料--复习题、课后思考题、试卷及答案二、填空1、生物统计分描述性统计和分析性统计。
描述性统计是指运用分类、制表、图形以及计算概括性_________ 数据(平均数、标准差等)来描述数据特征的各项活动。
分析性统计是进行数据观察、数据分____________ 以及从中得出统计推断的各项活动。
2、统计分析的基本过程就是由样本推断总体的过程。
该样本是该总体的一部分。
3、由样本获取总体的过程叫抽样。
常用的抽样方法有随机抽样、顺序抽样、分等按比例抽样、整群抽样等。
4、样本平均数与总体平均数的差异叫抽样误差。
常用s/ V N表示。
5、只有降低抽样误差才能提高试验结果的正确性。
试验结果的正确性包括准确性和精确性。
6、试验误差按来源分为系统误差(条件误差)和随机误差(偶然误差)。
系统误差(条件误差)影响试验结果的准确性,随机误差(偶然误差)影响试验结果的精确性。
7、系统误差(条件误差)可以控制,可通过合理的试验设计方法降低或消除。
随机误差(偶然—差)不可控制,可通过理论分布来研究其变异规律,或相对比较其出现的概率的大小。
8、样本推断总体分假设检验和区间估计两大内容。
常用的检验方法有t检验、F检验和卡方检验。
9、置信区间指在一定概率保证下总体平均数的可能范围。
10、t检验是通过样本平均数差值的大小来检验处理效应是否存在,两样本平均数的差值代表了试验的表观效应,它可能由处理效应(真实效应)和误差效应引起,要检验处理效应是否存在,常采用反证法。
此法先建立无效假设:即假设处理效应不存在,样本平均数差值是由误差引起,根据差异在误差分布里出现的概率二即可能性大小的衡量)来判断无效假设是否成立。
11、判断无效假设是否成立的依据是小概率事件实际不可能原理,即假设检验的基本依据。
用来肯定和否定无效假设的小概率,我们称之为显著水平,通常记为a _ 。
12、t检验通常适合两样本连续性(非间断性)随机变量资料的假设检验,当二项分布逼近正态分布时,百分数资料也可用二检验。
生物统计第一章绪论1.什么是生物统计?它在动物科学研究中有何作用?2.什么是总体、个体、样本、样本容量?统计分析的两个特点是什么?3.什么是参数、统计数?二者有何关系?4.什么是试验或调查的准确性与精确性?如何提高试验或调查的准确性与精确性?5.什么是随机误差与系统误差?如何控制、降低随机误差,避免系统误差?6.统计学发展的概貌可分为哪三种形态?拉普拉斯、高斯、高尔顿、皮尔森、哥塞特、费舍尔对统计学有何重要贡献?第二章资料的整理1.资料可以分为哪几种类型?它们有何区别与联系?2.为什么要对资料进行整理?对于计量资料,整理成次数分布表的基本步骤是什么?3.统计表与统计图有何用途?常用统计表、统计图有哪些?编制统计表、绘制统计图有何基本要求?4.某品种100头猪的血红蛋白含量资料单位:g/100ml列于下表,将其整理成次数分布表,并绘制次数分布直方图与折线图。
表格1 4某品种100头猪的血红蛋白含量(g/100ml)13. 4 13.814.414.714.814.413.913.13.12.812.512.312.111.811.10.111. 1 10.111.612.12.12.712.613.413.513.514.15.15.114.113.513.513. 2 12.712.816.312.111.711.210.510.511.311.812.212.412.812.813.313. 6 14.114.515.215.314.614.213.713.412.912.912.412.311.911.110.710. 8 11.411.512.212.112.89.512.312.512.713.13.113.914.214.912.413. 1 12.512.712.12.411.611.510.911.111.612.613.213.814.114.715.615. 7 14.714.13.95.1~9周龄大型肉鸭杂交组合GW和GY的料肉比列于下表,绘制线图。