生物统计学答案
- 格式:doc
- 大小:97.50 KB
- 文档页数:15
《生物统计学》习题集答案一、填空题:1.统计假设测验中犯第一类错误是正确的假设被否定。
(附统计假设测验中犯第二类错误是错误的假设被肯定。
)2.有共同性质的个体所组成的集团称为总体。
从总体中抽取部分个体进行观测,用以估计总体的一般特性,这部分被观测的个体总称为样本。
3.由总体中包含的全部个体求得的能够反映总体性质的特征数称为参数;由样本的全部观察值求得的用以估计总体参数的特征数叫统计数。
4.试验误差可以分为系统(片面)误差和偶然(随机)误差两种类型。
5.一般而言,在一定范围内,增加试验小区的面积,试验误差将会降低。
6.在试验中重复的主要作用是估计试验误差和降低试验误差。
7.田间试验设计的基本原则是重复、随机排列、局部控制。
8.田间试验可按试验因素的多少分为单因素试验和多因素试验。
9.样本平均数显著性测验接受或者否定假设的根据是“小概率事件实际上不可能发生”原理。
10.从总体中抽取的样本要具有代表性,必须是随机抽取的样本。
11.从一个正态总体中随机抽取的样本平均数,理论上服从正态分布。
12.数据1、3、2、4、5、6、3、3的算术平均数是 3.375 ,众数是 3 。
13.常用的变异程度(变异)指标有极差、方差、标准差、变异系数。
14.小麦品种A每穗小穗数的平均数和标准差值为18和3(厘米),品种B为30和4.5(厘米),根据CV A _(或A品种的变异系数)_ 大于_CV B(或B品种的变异系数),品种__A_____ 的该性状变异大于品种B___。
15.要比较单位不同或者单位相同但平均数大小相差较大的两个样本资料的变异度宜采用变异系数。
16.试验资料按所研究的性状、特性可以分为质量性状资料和数量性状资料。
17.样本根据样本容量的多少可以分为小样本和大样本。
18. 二项总体是非此即彼的两项构成的总体,此事件以变量“ 1 ”表示, 彼事件以变量“ 0 ”表示,也可以称为0,1总体。
19.标准正态分布是参数μ=0__,_ σ2_=1_的一个特定正态分布,记作N (0,1)。
生物统计学试题库及答案一、单项选择题1. 生物统计学中,数据的变异性通常用以下哪个指标来衡量?A. 平均值B. 中位数C. 众数D. 标准差答案:D2. 在统计学中,总体是指:A. 研究对象的全体B. 研究对象的一部分C. 研究对象的样本D. 研究对象的个体答案:A3. 以下哪个不是描述性统计的内容?A. 频率分布B. 描述性统计图C. 回归分析D. 集中趋势的度量答案:C4. 假设检验中,P值小于显著性水平α,我们通常会:A. 拒绝零假设B. 接受零假设C. 不能做出决策D. 需要更多的数据答案:A5. 以下哪种分布是正态分布?A. 均匀分布B. 泊松分布C. 指数分布D. 高斯分布答案:D二、多项选择题1. 下列哪些是生物统计学中常用的统计图表?A. 条形图B. 散点图C. 箱线图D. 饼图答案:ABC2. 在进行方差分析时,需要考虑的因素包括:A. 组间差异B. 组内差异C. 样本大小D. 总体均值答案:ABC3. 以下哪些是生物统计学中常用的参数估计方法?A. 最大似然估计B. 贝叶斯估计C. 矩估计D. 最小二乘估计答案:ABCD三、填空题1. 生物统计学中,________是用来描述数据集中趋势的指标。
答案:平均值2. 在回归分析中,________是用来衡量自变量对因变量影响程度的指标。
答案:回归系数3. 假设检验的基本步骤包括:________、________、________、________。
答案:提出假设、选择检验统计量、确定显著性水平、做出决策4. 在生物统计学中,________是用来描述数据离散程度的指标。
答案:方差5. 正态分布的数学表达式为:________。
答案:N(μ, σ^2)四、简答题1. 简述生物统计学在生物科学研究中的作用。
答案:生物统计学在生物科学研究中的作用包括:帮助研究者设计实验,以确保数据收集的有效性和可靠性;对收集到的数据进行分析,以检验研究假设;评估实验结果的可靠性和普遍性;以及在数据解释和报告中提供科学依据。
生物统计学智慧树知到课后章节答案2023年下齐鲁师范学院齐鲁师范学院第一章测试1.与非生物相比,生物学研究对象具有以下哪些特殊的特性()。
A:随机性B:一致性C:变异性D:复杂性答案:随机性;变异性;复杂性2.生物统计学基本作用主要有()。
A:提供由样本推断总体的方法B:提供整理和描述数据资料的科学方法,确定某些性状和特征的数量特征。
C:提供试验设计的一些重要原则D:判断试验结果的可靠性答案:提供由样本推断总体的方法;提供整理和描述数据资料的科学方法,确定某些性状和特征的数量特征。
;提供试验设计的一些重要原则;判断试验结果的可靠性3.具有相同性质或属性的个体所组成的集合称为总体。
()A:错 B:对答案:对4.以下哪个选项是用来描述总体参数的()。
A:SB:xC:μD:n答案:μ5.以下哪组数据精确度最高()。
A:2、3、4、5、6B:2、4、6、8、10C:1、3、5、7、9D:1、1、1、1、1答案:1、1、1、1、1第二章测试1.下列变量中属于非连续性变量的是()。
A:体重 B:身高 C:血压D:血型答案:血型2.计数资料也称为连续性变量资料,计量资料也称为非连续性变量资料。
()A:对 B:错答案:错3.整群抽样是对被抽中的群体做全面调查,所以整群抽样是()。
A:非全面调查 B:经常性调查C:全面调查 D:一次性调查答案:非全面调查4.分层随机抽样通常比简单随机抽样得到结果更准确。
()A:对 B:错答案:对5.对某鱼塘不同年龄鱼的尾数进行统计分析时,可作成()图来表示。
A:条形图 B:多边形图 C:折线图D:直方图答案:条形图6.变量有两个明显基本特征,即()。
A:可变性B:离散性 C:不稳定性 D:集中性答案:离散性;集中性7.反映集中性的特征数是()。
A:中位数 B:众数 C:标准差D:算数平均数答案:中位数;众数;算数平均数8.反映离散性的特征数是()。
A:中位数 B:众数 C:算数平均数 D:标准差答案:标准差9.比较幼儿园孩子和大学生身高的变异度,应采用的指标是()。
第一章填空1.变量按其性质可以分为(连续型)变量和(非连续/离散型)变量。
2.样本统计数是总体(总体参数)的估计值。
3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。
4.生物统计学的基本内容包括(实验设计)和(统计推断)两大部分。
5.生物统计学的发展过程经历了(古典统计学)、(近代统计学)和(现代统计学)3个阶段。
6 .生物学研究中,—般将样本容量(大于30 )称为大样本。
7 .试验误差可以分为(随机误差)和(系统误差)两类。
判断1.对于有限总体不必用统计推断方法。
(错)2.资料的精确性高,其准确性也一定高。
(错)3•在试验设计中,随机误差只能减小,而不能完全消除。
(对)4.统计学上的试验误差,通常指随机误差。
(对)第二章填空1.资料按生物的性状特征可分为(数量性状)变量和(质量性状)变量。
2.直方图适合于表示(非连续型/离散型)资料的次数分布。
3•变量的分布具有两个明显基本特征,即(集中性)和(离散性)。
4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(标准差)。
5 .样本标准差的计算公式s=()。
判断题1•计数资料也称连续性变量资料,计量资料也称非连续性变量资料。
(错)2.条形图和多边形图均适合于表示计数资料的次数分布。
(错)3.离均差平方和为最小。
(对)4.资料中出现最多的那个观测值或最多一组的中点值,称为众数。
(对)5.变异系数是样本变量的绝对变异量。
(对)单项选择1.下列变量中属于非连续性变量的是(C).A.身高B・体重C・血型D・血压2•对某鱼塘不同年龄鱼的尾数进行统计分析,可做成(A)图来表示.A.条形B・直方C.多边形D・折线3.关于平均数,下列说法正确的是(B).A.正态分布的算术平均数和几何平均数相等.B.正态分布的算术平均数和中位数相等.C.正态分布的中位数和几何平均数相等.D.正态分布的算术平均数、中位数、几何平均数均相等。
4.如果对各观测值加上一个常数「其标准差(D )。
生物统计试题及答案一、选择题(每题2分,共10分)1. 下列哪项不是生物统计学的研究内容?A. 数据收集B. 数据分析C. 数据存储D. 数据解释答案:C2. 在生物统计学中,下列哪项是描述性统计分析的主要任务?A. 建立假设B. 进行推断C. 描述数据D. 预测未来答案:C3. 以下哪个选项是生物统计学中常用的数据类型?A. 定性数据B. 定量数据C. 计数数据D. 所有以上答案:D4. 在生物统计学中,下列哪项是进行假设检验的前提条件?A. 随机抽样B. 样本量足够大C. 数据符合正态分布D. 所有以上答案:D5. 下列哪项是生物统计学中用于评估两个独立样本均值差异的统计方法?A. 卡方检验B. 方差分析C. t检验D. 相关分析答案:C二、填空题(每题2分,共10分)1. 统计学中的总体是指研究对象的________。
答案:全部个体2. 在生物统计学中,________是用于衡量数据集中趋势的指标。
答案:均值3. 当数据不满足正态分布时,可以使用________检验来比较两个独立样本的均值。
答案:Mann-Whitney U检验4. 回归分析中,________系数表示自变量每增加一个单位,因变量预期的变化量。
答案:回归5. 在生物统计学中,________图可以展示变量之间的关系。
答案:散点三、简答题(每题5分,共20分)1. 简述生物统计学在生物医学研究中的作用。
答案:生物统计学在生物医学研究中的作用包括设计实验、收集和分析数据、解释结果、做出科学决策和推断等。
2. 描述生物统计学中的参数估计和假设检验的区别。
答案:参数估计是指根据样本数据来估计总体参数的值,而假设检验则是在给定的零假设基础上,通过样本数据来检验零假设是否成立。
3. 解释什么是生物统计学中的置信区间。
答案:置信区间是参数估计的一种形式,它给出了一个区间范围,在这个区间内,我们有一定程度的信心认为总体参数值会落在这个范围内。
生物统计学智慧树知到课后章节答案2023年下烟台大学烟台大学绪论单元测试1.概率论是研究随机现象数量规律的数学分支。
A:对 B:错答案:对2.在18世纪概率论引进之后,统计才逐渐发展成为一门成熟的学科。
A:错 B:对答案:对3.同质基础上的变异是随机现象的基本属性。
A:对 B:错答案:对4.同质性是总体的基本特征。
A:对 B:错答案:对5.抽样研究的目的是用有限的样本信息推断总体特征。
A:错 B:对答案:对6.变异是导致抽样误差的根本原因。
A:错 B:对答案:对7.参数是描述样本特征的指标。
A:对 B:错答案:错8.数理统计以概率论为基础,通过对随机现象观察数据的收集整理和分析推断来研究其统计规律。
A:错 B:对答案:对9.统计方法体系的主体内容是A:推断 B:数据收集 C:描述 D:抽样答案:推断10.统计学的主要研究内容包括A:数据整理 B:数据收集 C:数据解释 D:数据分析答案:数据整理;数据收集;数据解释;数据分析第一章测试1.各样本观察值均加同一常数c后A:两者均不变 B:样本均值改变,样本标准差不变 C:样本均值不变,样本标准差改变 D:两者均改变答案:样本均值改变,样本标准差不变2.关于样本标准差,以下叙述错误的是A:反映了均值代表性的好坏 B:度量了数据偏离样本均值的大小 C:反映样本观察值的离散程度 D:不会小于样本均值答案:不会小于样本均值3.表示定性数据整理结果的统计图有条形图、圆形图。
A:对 B:错答案:对4.直方图、频数折线图、茎叶图、箱图是专用于表示定量数据的特征和规律的统计图。
A:对 B:错答案:对5.描述数据离散程度的常用统计量主要有极差、方差、标准差、变异系数等,其中最重要的是方差、标准差。
A:对 B:错答案:对6.统计数据可以分为定类数据、定序数据和数值数据等三类,其中定类数据、定序数据属于定性数据。
A:错 B:对答案:对7.描述数据集中趋势的常用统计量主要有均值、众数和中位数等,其中最重要的是均值。
生物统计考试题及答案一、选择题(每题2分,共20分)1. 以下哪个选项是生物统计学中常用的统计方法?A. 描述性统计B. 推断性统计C. 探索性统计D. 以上都是答案:D2. 在生物统计中,样本均值的标准差被称为:A. 标准误B. 变异系数C. 置信区间D. 标准差答案:A3. 假设检验中,P值小于显著性水平α时,我们通常会:A. 拒绝原假设B. 接受原假设C. 无法判断D. 需要更多数据答案:A4. 以下哪个选项是生物统计中用于描述数据分布的参数?A. 中位数B. 众数C. 方差D. 以上都是答案:D5. 线性回归分析中,斜率(slope)表示的是:A. 自变量每增加一个单位,因变量增加的量B. 自变量每增加一个单位,因变量减少的量C. 自变量每增加一个单位,因变量增加或减少的量D. 自变量与因变量之间的相关性答案:A6. 以下哪个选项是生物统计中用于描述数据集中趋势的参数?A. 平均值B. 标准差C. 四分位数D. 以上都是答案:D7. 在生物统计中,相关系数的取值范围是:A. -1到1B. 0到1C. 0到2D. 以上都不是答案:A8. 以下哪个选项是生物统计中用于描述数据离散程度的参数?A. 平均值B. 方差C. 标准差D. 以上都是答案:B9. 配对t检验用于比较的是:A. 两个独立样本的均值B. 两个相关样本的均值C. 一个样本的均值与一个已知值D. 两个样本的中位数答案:B10. 以下哪个选项是生物统计中用于描述数据分布形态的参数?A. 偏度B. 峰度C. 以上都是D. 以上都不是答案:C二、填空题(每题2分,共20分)1. 在生物统计中,________是用来描述数据的中心趋势。
答案:平均值2. 标准差是衡量数据________的统计量。
答案:离散程度3. 假设检验中的原假设通常表示为________。
答案:H04. 相关系数的平方,即________,可以解释两变量之间线性关系的强度。
生物统计学基础知识单选题100道及答案解析1. 生物统计学的主要研究对象是()A. 生物学数据B. 生物实验设计C. 生物现象D. 生物模型答案:A解析:生物统计学主要研究和处理生物学中的数据。
2. 样本均值的标准误差是()A. 样本标准差除以样本量的平方根B. 总体标准差除以样本量C. 样本标准差除以样本量D. 总体标准差除以样本量的平方根答案:D解析:样本均值的标准误差是总体标准差除以样本量的平方根。
3. 在假设检验中,显著水平α表示()A. 原假设为真时被拒绝的概率B. 原假设为假时被拒绝的概率C. 备择假设为真时被拒绝的概率D. 备择假设为假时被拒绝的概率答案:A解析:显著水平α表示原假设为真时被拒绝的概率。
4. 一组数据的众数是()A. 出现次数最多的数据值B. 中间位置的数据值C. 平均数D. 最大值答案:A解析:众数是一组数据中出现次数最多的数据值。
5. 方差分析的基本思想是()A. 比较组内方差和组间方差B. 比较均值C. 比较标准差D. 比较变异系数答案:A解析:方差分析的基本思想是比较组内方差和组间方差。
6. 完全随机设计的方差分析中,总变异可分解为()A. 组间变异和组内变异B. 处理变异和误差变异C. 抽样变异和系统变异D. 以上都不对答案:A解析:完全随机设计的方差分析中,总变异可分解为组间变异和组内变异。
7. 对于正态分布,以下说法正确的是()A. 均值和中位数相等B. 均值大于中位数C. 均值小于中位数D. 以上都不对答案:A解析:正态分布的均值和中位数相等。
8. 标准正态分布的均值和标准差分别是()A. 0 和1B. 1 和0C. 0 和0D. 1 和1答案:A解析:标准正态分布的均值为0,标准差为1。
9. 相关系数的取值范围是()A. [-1, 1]B. (0, 1)C. (-∞, +∞)D. [0, 1]答案:A解析:相关系数的取值范围是[-1, 1]。
10. 进行t 检验时,自由度的计算公式是()A. n - 1B. n - 2C. n1 + n2 - 2D. n1 + n2 - 1答案:A解析:进行单样本t 检验时,自由度为n - 1。
生物统计考试题目及答案一、单项选择题(每题2分,共20分)1. 以下哪项不是生物统计学的研究内容?A. 数据收集B. 数据分析C. 统计推断D. 艺术欣赏答案:D2. 在生物统计学中,总体是指:A. 研究对象的全体B. 研究对象的一部分C. 研究对象的样本D. 研究对象的个体答案:A3. 以下哪项是描述性统计中的集中趋势指标?A. 方差B. 标准差C. 平均数D. 极差答案:C4. 假设检验中,如果p值小于显著性水平α,我们通常会:A. 拒绝零假设B. 接受零假设C. 无法判断D. 重新收集数据5. 以下哪项是生物统计学中常用的非参数检验方法?A. t检验B. 方差分析C. 卡方检验D. 秩和检验答案:D6. 相关系数的取值范围是:A. -1到1之间B. -1到0之间C. 0到1之间D. 无法确定答案:A7. 在回归分析中,回归方程的斜率表示:A. 自变量每变化一个单位,因变量的变化量B. 因变量每变化一个单位,自变量的变化量C. 自变量和因变量之间的相关性D. 自变量和因变量之间的因果关系答案:A8. 以下哪项是生物统计学中常用的数据转换方法?A. 对数转换B. 平方转换C. 立方转换D. 所有选项答案:D9. 以下哪项是生物统计学中常用的图形表示方法?B. 条形图C. 箱线图D. 所有选项答案:D10. 在生物统计学中,置信区间的宽度与以下哪项因素无关?A. 样本大小B. 置信水平C. 数据的变异性D. 总体均值答案:D二、多项选择题(每题3分,共15分)1. 以下哪些是生物统计学中常用的数据类型?A. 计数数据B. 测量数据C. 等级数据D. 时间序列数据答案:ABCD2. 在生物统计学中,以下哪些因素会影响样本均值的标准误差?A. 总体标准差B. 样本大小C. 抽样方法D. 总体均值答案:AB3. 以下哪些是生物统计学中常用的参数估计方法?A. 点估计B. 区间估计C. 极大似然估计D. 贝叶斯估计答案:ABCD4. 在生物统计学中,以下哪些因素会影响假设检验的功效?A. 样本大小B. 效应大小C. 显著性水平D. 数据的分布答案:ABCD5. 以下哪些是生物统计学中常用的数据质量控制方法?A. 数据清洗B. 数据转换C. 数据插补D. 数据标准化答案:AC三、简答题(每题10分,共20分)1. 请简述生物统计学中样本量确定的基本原则。
生物统计考试题库及答案一、单项选择题1. 生物统计中,数据的类型分为()。
A. 定性数据和定量数据B. 计数数据和测量数据C. 离散数据和连续数据D. 描述性数据和推断性数据答案:A2. 在统计学中,总体是指()。
A. 研究对象的全部个体B. 研究对象的样本C. 研究对象的子集D. 研究对象的特定个体答案:A3. 描述一组数据集中趋势的统计量是()。
A. 方差B. 标准差C. 平均数D. 极差答案:C4. 以下哪个不是正态分布的特征()?A. 对称性B. 单峰性C. 均值、中位数和众数相等D. 偏态分布答案:D5. 相关系数的取值范围是()。
A. -1到1之间B. 0到1之间C. -1到0之间D. 0到正无穷答案:A二、多项选择题6. 下列哪些是生物统计中的常见概率分布()。
A. 正态分布B. t分布C. F分布D. 泊松分布答案:ABCD7. 在生物统计分析中,以下哪些是描述离散程度的统计量()。
A. 方差B. 标准差C. 极差D. 平均数答案:ABC8. 以下哪些是生物统计中的非参数检验方法()。
A. 卡方检验B. 秩和检验C. 曼-惠特尼U检验D. 方差分析答案:ABC三、判断题9. 样本均值是总体均值的无偏估计。
()答案:√10. 标准差越大,数据的离散程度越小。
()答案:×四、简答题11. 简述生物统计中假设检验的基本步骤。
答案:假设检验的基本步骤包括:1. 提出零假设和备择假设;2. 选择适当的检验统计量和显著性水平;3. 计算检验统计量;4. 根据检验统计量和显著性水平,确定是否拒绝零假设。
12. 描述性统计和推断性统计的主要区别是什么?答案:描述性统计主要关注数据的收集、整理和描述,目的是对数据集进行总结和概括;而推断性统计则是基于样本数据对总体进行推断,目的是对总体参数进行估计和假设检验。
五、计算题13. 给定一组数据:10, 12, 15, 18, 20,计算其平均数和标准差。
第一章绪论一、名词解释1、总体:根据研究目的确定的研究对象的全体称为总体。
2、个体:总体中的一个研究单位称为个体。
3、样本:总体的一部分称为样本。
4、样本含量:样本中所包含的个体数目称为样本含量(容量)或大小。
5、随机样本:从总体中随机抽取的样本称为随机样本,而随机抽取是指总体中的每一个个体都有同等的机会被抽取组成样本。
6、参数:由总体计算的特征数叫参数。
7、统计量:由样本计算的特征数叫统计量。
8、随机误差:也叫抽样误差,是由于许多无法控制的内在和外在的偶然因素所造成,带有偶然性质,影响试验的精确性。
9、系统误差:也叫片面误差,是由于一些能控制但未加控制的因素造成的,其影响试验的准确性。
10、准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与真值接近的程度。
11、精确性:也叫精确度,指调查或试验研究中同一试验指标或性状的重复观测值彼此接近的程度。
二、简答题1、什么是生物统计?它在畜牧、水产科学研究中有何作用?答:(1)生物统计是数理统计的原理和方法在生物科学研究中的应用,是一门应用数学。
(2)生物统计在畜牧、水产科学研究中的作用主要体现在两个方面:一是提供试验或调查设计的方法,二是提供整理、分析资料的方法。
2、统计分析的两个特点是什么?答:统计分析的两个特点是:①通过样本来推断总体。
②有很大的可靠性但也有一定的错误率。
3、如何提高试验的准确性与精确性?答:在调查或试验中应严格按照调查或试验计划进行,准确地进行观察记载,力求避免认为差错,特别要注意试验条件的一致性,即除所研究的各个处理外,供试畜禽的初始条件如品种、性别、年龄、健康状况、饲养条件、管理措施等尽量控制一致,并通过合理的调查或试验设计,努力提高试验的准确性和精确性。
4、如何控制、降低随机误差,避免系统误差?答:随机误差是由于一些无法控制的偶然因素造成的,难以消除,只能尽量控制和降低;主要是试验动物的初始条件、饲养条件、管理措施等在试验中要力求一致,尽量降低差异。
系统误差是由于一些可以控制但未加控制的因素造成的,一般只要试验工作做得精细是可以消除的。
避免系统误差的主要措施有:尽量保证试验动物初始条件的一致(年龄、初始重、性别、健康状况等),尽量控制饲料种类、品质、数量、饲养条件等,测量仪器要准确,标准试剂要校正,要避免观测、记载、抄录、计算中的错误。
第二章资料的整理一、名词解释1、数量性状资料:数量性状是指能够以量测或记数的方式表示其特征的象状,观察测定数量性状而获得的数据称为数量性状资料。
2、质量性状资料:质量性状是指能观察到而不能直接测量的性状,观察质量性状而获得的资料称为质量性状资料。
3、半定量(等级)资料:是指将观察单位按所考察的性状或指标的等级顺序分组,然后清点各组观察单位的次数而得到的资料。
4、计数资料:指用计数方式获得的数量性状资料。
5、计量资料:指用量测手段得到的数量性状资料,即用度、量、衡等计量工具直接测定的数量性状资料。
6、全距(极差):是资料中最大值与最小值之差。
7、组中值:分组后每一组的中点值称为组中值,是该组的代表值。
二、简答题1、资料可以分为哪几类?它们有何区别与联系?答:资料一般可以分为数量性状资料、质量性状资料、半定量资料三大类,其中数量性状资料又包括计量资料和计数资料。
区别:数量性状资料是能够以量测或计数的方式获得的资料,质量性状资料是只能观察而不能直接测量的资料,半定量资料既有计数资料的特点又有程度或量的不同。
联系:三种不同类型的资料有时可根据研究目的和统计方法的要求将一种类型资料转化成另一种类型的资料。
2、为什么要对资料进行整理?对于计量资料,整理的基本步骤怎样?答:(1)由调查或试验收集来的原始资料往往是零乱的,无规律可循。
只有通过统计整理,才能发现其内部的联系和规律性,从而揭示事物的本质。
资料整理是进行统计分析的基础。
(2)计量资料整理的基本步骤包括:①求全距,全距即为资料中最大值与最小值之差。
②确定组数,一般根据样本含量及资料的变动范围大小确定组数。
③确定组距,通常根据等距离分组的原则,组距等于全距除以组数。
④确定组限和组中值,各组的最大值为组上限,最小值为组下限;每一组的中点值称为组中值。
⑤归组划线计数,作次数分布表。
3、在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好?答:在对计量资料进行整理时,第一组的组中值以接近或等于资料中的最小值可以避免第一组中观察值过多的情况,同时也确保资料中最小值不会遗漏。
4、统计表与统计图有何用途?常用统计图有哪些?常用统计表有哪些?列统计表、绘统计图时,应注意什么?答:(1)统计表用表格形式来表示数量关系;统计图用几何图形来表示数量关系。
用统计表和统计图可以把研究对象的特征、内部构成、相互关系等简明、形象地表达出来,便于比较分析。
(2)常用的统计图有长条图、圆图、线图、直方图和折线图等。
(3)常用的统计表有简单表和复合表两大类。
(4)列统计表的注意事项:①标题要简明扼要、准确地说明表的内容,有时须注明时间、地点。
②标目分横标目和纵标目两项,横标目列在表的左侧,用以表示被说明事物的主要标志;纵标目列在表的上端,说明横标目各统计指标内容,并注明计算单位。
③数字一律用阿拉伯数字,数字小数点对齐,小数位数一致,无数字的用“—”表示,数字是“0”的须写“0”。
④表的上下两条边线略粗,纵、横标目间及合计用细线分开,表的左右边线可以省去,表的左上角一般不用斜线。
(5)绘统计图的注意事项:①标题简明扼要并列于图的下方。
②纵、横两轴应有刻度,注明单位。
③横轴由左至右,纵轴由上而下,数值由小到大;图形长宽比例约为5:4或6:5。
④图中需用不同颜色或线条表示不同事物时应有图例说明。
第三章平均数、标准差与变异系数一、名词解释1、算术平均数:是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数。
2、无偏估计:当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏估计。
3、几何均数:n个观测值相乘之积开n次方所得的方根称为几何均数,记为G。
4、中位数:将资料内所有观测值从小到大依次排列,位于中间的那个观测值称为中位数,记为Md。
5、众数:资料中出现次数最多的那个观测值或次数最多一组的组中值称为众数,记为Mo。
6、调和平均数:资料中各观测值倒数的算术平均数的倒数称为调和平均数,记为H。
7、标准差:统计学上把样本方差S2的平方根叫做样本标准差,记做S。
8、方差:统计量Σ(x - )2/(n - 1)称为均方,又称样本方差,记为S2。
9、离均差平方和(平方和):各个观测值与平均数的离差(x - )称为离均差,各个离均差平方再求和即为离均差平方和,简称平方和,记为SS。
10、变异系数:标准差与平均数的比值称为变异系数,是衡量资料中各观测值变异程度的另一个统计量,记做C.V。
二、简答题1、生物统计中常用的平均数有几种?各在什么情况下应用?答:生物统计中常用的平均数有算术平均数、几何平均数、调和平均数、中位数和众数。
算术平均数较常用,简称平均数,当资料呈正态分布时可用算术平均数描述其中心位置。
几何均数主要应用于畜牧、水产业的动态分析,畜禽疾病及药物效价的统计分析,如畜禽、水产养殖的增长率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等。
调和均数主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。
当所获得的数据资料呈偏态分布时中位数的代表性优于算术平均数。
众数也适用于资料呈偏态分布的情况。
2、算术平均数有哪些基本性质?答:算术平均数的两个基本性质是:①离均差之和等于零。
②离均差平方和最小。
3、标准差有哪些特性?答:标准差的特性主要表现在四个方面:①标准差的大小受资料中每个观测值的影响,若观测值间变异大求得的标准差也大,反之则小。
②在计算标准差时,在各观测值加上或减去一个常数,其数值不变。
③当每个观测值乘以或除以一个常数a,则所得的标准差是原来标准差的a倍或1/a倍。
④在资料服从正态分布的条件下,资料中约有68.26%的观测值在平均数左右1倍标准差( ±S)范围内;约有95.43%的观测值在平均数左右2倍标准差( ±2S)范围内;约有99.73%的观测值在平均数左右3倍标准差( ±3S)范围内。
4、为什么变异系数要与平均数、标准差配合使用?答:变异系数是标准差与平均数的比值,是衡量资料中各观测值变异程度的另一个统计量。
当进行两个或多个资料变异程度的比较时,若度量单位与平均数相同,可以直接利用标准差来比较;若单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而要用变异系数。
变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。
第四章常用概率分布一、名词解释1、必然现象:某类现象是可预言其结果的,即在保持条件不变的情况下,重复进行试验,其结果总是确定的,这类现象称为必然现象。
2、随机现象:某类现象事前不可预言其结果的,即在保持条件不变的情况下,重复进行试验,其结果未必相同,这类现象称为随机现象。
3、随机试验:一个试验若满足下述三个特性则称为随机试验,简称试验:①试验可以在相同条件下多次重复进行。
②每次试验的可能结果不止一个,并且事先知道会有哪些可能的结果。
③每次试验总是恰好出现这些可能结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪个结果。
4、随机事件:随机试验的每一种可能结果,在一定条件下可能发生,也可能不发生,称为随机事件,简称事件。
5、概率的统计定义:在相同条件下进行n次重复试验,若随机事件A发生的次数为m,那么m/n称为随机事件A的频率;当试验重复数n逐渐增大时,随机事件A的频率越来越稳定地接近某一数值P,那么就把P称为随机事件A的概率。
这样定义的概率称为统计概率,也叫后验概率。
6、小概率原理:若随机事件的概率很小,例如小于0.05、0.01、0.001,称之为小概率事件;在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,简称小概率原理。
7、随机变量:作一次试验,其结果有多种可能,每一种可能结果都可以用一个数来表示,把这些数作为变量x的取值范围,则试验结果可用随机变量x来表示。
8、离散型随机变量:如果表示试验结果的变量x,其可能取值至多为可数个,且以各种确定的概率取这些不同的值,则称x为离散型随机变量。
9、连续型随机变量:如果表示试验结果的变量x,其可能取值为某范围内的任何数值,且x 在其取值范围内的任一区间中取值时,其概率是确定的,则称x为连续型随机变量。
9、标准正态分布:μ= 0,δ2 = 1 的正态分布称为标准正态分布。
10、标准正态变量(标准正态离差):任何一个服从正态分布N(μ,δ2)的随机变量x,都可以通过标准化变换:u = (x –μ)/δ,将其变换为服从标准正态分布的随机变量u,u 称为标准正态变量。