生物统计学考试2008参考答案a
- 格式:doc
- 大小:97.00 KB
- 文档页数:4
07级研究生《生物统计学》试题2008年6月3日一、试题:1.15个数据的标准差未知的单个样本平均数的t检验。
2.每组15个数据的标准差未知的两个样本平均数成组数据的t检验。
3.每组15个数据的配对数据的t检验。
4.是否符合孟德尔定律的拟合优度检验。
5. 2 x 2 列联表检验。
6.单因素方差分析(单因素设定为4水平,每组n均大于15,且不相等)。
7.一元线性回归方程。
各15个数据。
画散点图,求a、b和r。
二、要求:1. 自己根据基本知识,编写具体试题内容。
2. 每个人数据不能相同,与书上数据也不能相同。
3. 按书上的检验程序、计算公式进行计算,写出计算过程。
1-7题均手写。
4. 使用B5或A4大小的纸张、单面书写,周边留有空余。
5. 以上的任意两道题再使用SPSS计算。
打印出数据输入后以及计算结果的页面。
一、某批水培的植物,平均株重μ0=302g,更换培养液后,从中抽取出15株,株重分别为:320、321、300、298、305、294、315、305、308、296、309、312、307、299、319(单位:克)问:更换培养液后与更换培养液前相比,植株株重的差异是否显著,差异是否极显著?解:根据检验的基本程序:①已知植物株重是服从正态分布的随机变量,σ未知。
②假设:H0:μ=μ0(300g)H A:μ≠μ0(300g)关于备择假设的说明:因为问题要求检验的是“株重差异是否显著”,并没有明确说明到底是株重增加还是减少,因此备择假设为H A:μ≠μ0(300g)。
③显著性水平:根据试验的要求(差异是否“极显著”)规定在α=0.05,α=0.01两个水平上判别。
④统计量的值:由于α未知,需使用t检验。
t=2.27785t临界值0.05=2.131t临界值0.01=2.602⑤建立H0的拒绝域,因H A:μ≠μ0(300g),所以是双侧检验。
当|t|>t0.05(双侧)时,拒绝H0。
α=0.05的双侧临界值可以从附表中查处,t15,0.05(双侧)=2.131。
生物统计学试题库及答案一、单项选择题1. 生物统计学中,数据的变异性通常用以下哪个指标来衡量?A. 平均值B. 中位数C. 众数D. 标准差答案:D2. 在统计学中,总体是指:A. 研究对象的全体B. 研究对象的一部分C. 研究对象的样本D. 研究对象的个体答案:A3. 以下哪个不是描述性统计的内容?A. 频率分布B. 描述性统计图C. 回归分析D. 集中趋势的度量答案:C4. 假设检验中,P值小于显著性水平α,我们通常会:A. 拒绝零假设B. 接受零假设C. 不能做出决策D. 需要更多的数据答案:A5. 以下哪种分布是正态分布?A. 均匀分布B. 泊松分布C. 指数分布D. 高斯分布答案:D二、多项选择题1. 下列哪些是生物统计学中常用的统计图表?A. 条形图B. 散点图C. 箱线图D. 饼图答案:ABC2. 在进行方差分析时,需要考虑的因素包括:A. 组间差异B. 组内差异C. 样本大小D. 总体均值答案:ABC3. 以下哪些是生物统计学中常用的参数估计方法?A. 最大似然估计B. 贝叶斯估计C. 矩估计D. 最小二乘估计答案:ABCD三、填空题1. 生物统计学中,________是用来描述数据集中趋势的指标。
答案:平均值2. 在回归分析中,________是用来衡量自变量对因变量影响程度的指标。
答案:回归系数3. 假设检验的基本步骤包括:________、________、________、________。
答案:提出假设、选择检验统计量、确定显著性水平、做出决策4. 在生物统计学中,________是用来描述数据离散程度的指标。
答案:方差5. 正态分布的数学表达式为:________。
答案:N(μ, σ^2)四、简答题1. 简述生物统计学在生物科学研究中的作用。
答案:生物统计学在生物科学研究中的作用包括:帮助研究者设计实验,以确保数据收集的有效性和可靠性;对收集到的数据进行分析,以检验研究假设;评估实验结果的可靠性和普遍性;以及在数据解释和报告中提供科学依据。
生物统计试题总结及答案一、选择题1. 下列哪项是生物统计学的主要研究内容?A. 生物数据的收集B. 生物数据的分析C. 生物数据的解释D. 以上都是答案:D2. 统计学中,总体是指:A. 研究对象的个体B. 研究对象的全体C. 研究对象的样本D. 研究对象的子集答案:B3. 描述数据集中趋势的统计量是:A. 平均数B. 中位数C. 众数D. 以上都是答案:D二、填空题1. 统计学中的________是指在一定条件下,可能发生也可能不发生的事件。
答案:随机事件2. 在生物统计学中,________是用来描述数据分布形态的统计量。
答案:偏度3. 回归分析中,________系数表示自变量对因变量的影响程度。
答案:回归三、简答题1. 简述生物统计学在生物科学研究中的应用。
答案:生物统计学在生物科学研究中的应用包括:实验设计、数据收集、数据分析、结果解释和科学决策等。
2. 描述一下生物统计学中的假设检验。
答案:假设检验是生物统计学中的一种方法,用于根据样本数据对总体参数进行推断。
它包括提出假设、选择适当的检验方法、计算检验统计量和做出决策等步骤。
四、计算题1. 已知某生物实验中,一组数据的平均数为10,标准差为2,求这组数据的变异系数。
答案:变异系数 = 标准差 / 平均数 = 2 / 10 = 0.22. 假设某生物实验中,两组数据的均值分别为5和7,标准差分别为1和1.5,求两组数据的均值差异的置信区间(置信度为95%)。
答案:首先需要计算两组数据的均值差异的标准误差,然后使用t分布表查找相应的t值,最后计算置信区间。
具体计算过程略。
五、论述题1. 论述生物统计学在现代生物技术发展中的重要性。
答案:生物统计学在现代生物技术发展中的重要性体现在:它提供了科学的数据收集和分析方法,帮助科研人员从大量数据中提取有价值的信息,从而推动了生物科学的进步。
此外,生物统计学还有助于提高实验设计的合理性和数据分析的准确性,减少实验误差,提高研究结果的可靠性。
中国科学院武汉教育基地2007—2008学年第一学期期末考试试卷课程名称:生物统计学考试时间:2008年1月21日下午2:30-5:00一、选择题(每题选择一个最佳答案。
每小题1分,共17分)1、为了了解某地20~29岁健康女性血红蛋白的正常值范围,现随机调查了该地2000名20~29岁的健康女性,并对其血红蛋白进行测量,请问本次调查的总体是()。
A、该地所有20-29的健康女性B、该地所有20-29的健康女性的血红蛋白测量值C、抽取的这2000名20-29岁女性D、抽取的这2000名20-29岁女性的血红蛋白测量值2、下列说法正确的是()。
A.系统误差可以完全消除B.随机误差可以完全消除C.两种误差都可以完全消除D.两种误差都不可以完全消除3、算术均数与中位数相比,()。
A、抽样误差更大B、不易受极端值的影响C、更充分利用数据信息D、更适用于分布不明及偏态分布资料4、在一个右偏(峰在左边,右边有较长的尾巴)的分布中,反映集中趋势的数值最大的是()。
A.中位数B.算数平均数C.众数D.几何平均数5、对于标准正态分布变量,()范围内有90%变量值。
A、0~1.96B、-1.96~1.96C、-1.645~∞D、-1.645~1.6456、在抽样方式和样本容量不变的条件下,置信区间愈大,则()。
A.可靠性愈大B.可靠性愈小C.估计的效率愈高D.估计的效率愈低7、利用t分布构造置信区间的条件是()。
A.总体服从正态分布,且方差已知B.总体服从正态分布,且方差未知C.总体不一定服从正态分布,但要求是大样本D.总体不一定服从正态分布,但要求方差已知8、比较两药的疗效时,哪种情况应做单侧检验()。
A. 已知甲乙两药均有效B. 不知甲乙两药哪种好C. 已知甲药不会优于乙药D. 不知甲乙两药是否有效9、作两样本均数差别的t检验中,P值与α值中()。
A、α值是研究者指定的B、P值是研究者指定的C、两者意义相同,数值不同D、两者意义相同,数值相同10、对一批经过长途运输的货物损坏率是否超过0.003进行假设检验。
生物统计试题及答案一、选择题(每题2分,共10分)1. 下列哪项不是生物统计学的研究内容?A. 数据收集B. 数据分析C. 数据存储D. 数据解释答案:C2. 在生物统计学中,下列哪项是描述性统计分析的主要任务?A. 建立假设B. 进行推断C. 描述数据D. 预测未来答案:C3. 以下哪个选项是生物统计学中常用的数据类型?A. 定性数据B. 定量数据C. 计数数据D. 所有以上答案:D4. 在生物统计学中,下列哪项是进行假设检验的前提条件?A. 随机抽样B. 样本量足够大C. 数据符合正态分布D. 所有以上答案:D5. 下列哪项是生物统计学中用于评估两个独立样本均值差异的统计方法?A. 卡方检验B. 方差分析C. t检验D. 相关分析答案:C二、填空题(每题2分,共10分)1. 统计学中的总体是指研究对象的________。
答案:全部个体2. 在生物统计学中,________是用于衡量数据集中趋势的指标。
答案:均值3. 当数据不满足正态分布时,可以使用________检验来比较两个独立样本的均值。
答案:Mann-Whitney U检验4. 回归分析中,________系数表示自变量每增加一个单位,因变量预期的变化量。
答案:回归5. 在生物统计学中,________图可以展示变量之间的关系。
答案:散点三、简答题(每题5分,共20分)1. 简述生物统计学在生物医学研究中的作用。
答案:生物统计学在生物医学研究中的作用包括设计实验、收集和分析数据、解释结果、做出科学决策和推断等。
2. 描述生物统计学中的参数估计和假设检验的区别。
答案:参数估计是指根据样本数据来估计总体参数的值,而假设检验则是在给定的零假设基础上,通过样本数据来检验零假设是否成立。
3. 解释什么是生物统计学中的置信区间。
答案:置信区间是参数估计的一种形式,它给出了一个区间范围,在这个区间内,我们有一定程度的信心认为总体参数值会落在这个范围内。
生物统计考试题及答案一、选择题(每题2分,共20分)1. 以下哪个选项是生物统计学中常用的统计方法?A. 描述性统计B. 推断性统计C. 探索性统计D. 以上都是答案:D2. 在生物统计中,样本均值的标准差被称为:A. 标准误B. 变异系数C. 置信区间D. 标准差答案:A3. 假设检验中,P值小于显著性水平α时,我们通常会:A. 拒绝原假设B. 接受原假设C. 无法判断D. 需要更多数据答案:A4. 以下哪个选项是生物统计中用于描述数据分布的参数?A. 中位数B. 众数C. 方差D. 以上都是答案:D5. 线性回归分析中,斜率(slope)表示的是:A. 自变量每增加一个单位,因变量增加的量B. 自变量每增加一个单位,因变量减少的量C. 自变量每增加一个单位,因变量增加或减少的量D. 自变量与因变量之间的相关性答案:A6. 以下哪个选项是生物统计中用于描述数据集中趋势的参数?A. 平均值B. 标准差C. 四分位数D. 以上都是答案:D7. 在生物统计中,相关系数的取值范围是:A. -1到1B. 0到1C. 0到2D. 以上都不是答案:A8. 以下哪个选项是生物统计中用于描述数据离散程度的参数?A. 平均值B. 方差C. 标准差D. 以上都是答案:B9. 配对t检验用于比较的是:A. 两个独立样本的均值B. 两个相关样本的均值C. 一个样本的均值与一个已知值D. 两个样本的中位数答案:B10. 以下哪个选项是生物统计中用于描述数据分布形态的参数?A. 偏度B. 峰度C. 以上都是D. 以上都不是答案:C二、填空题(每题2分,共20分)1. 在生物统计中,________是用来描述数据的中心趋势。
答案:平均值2. 标准差是衡量数据________的统计量。
答案:离散程度3. 假设检验中的原假设通常表示为________。
答案:H04. 相关系数的平方,即________,可以解释两变量之间线性关系的强度。
《生物统计学》试卷一.判断题(正确的打“√”错误的打“×”,每题2分,共10分)1. 分组时,组距和组数成反比。
( )2. 粮食总产量属于离散型数据。
( )3. 样本标准差的数学期望是总体标准差。
( )4. F 分布的概率密度曲线是对称曲线。
( )5. 在配对数据资料用t 检验比较时,若对数n=13,则查t 表的自由度为12。
( )二. 选择题(每题2分,共10分)1. x ~N (1,9),x 1,x 2,…,x 9是X 的样本,则有( ) A.31-x ~N (0,1)B.11-x ~N (0,1) C.91-x ~N (0,1)D.以上答案均不正确2. 假定我国和美国的居民年龄的方差相同。
现在各自用重复抽样方法抽取本国人口的1%计算平均年龄,则平均年龄的标准误( )A.两者相等B.前者比后者大C.前者比后者小D.不能确定大小3. 设容量为16人的简单随机样本,平均完成工作需时13分钟。
已知总体标准差为3分钟。
若想对完成工作所需时间总体构造一个90%置信区间,则( )A.应用标准正态概率表查出u 值B.应用t 分布表查出t 值C.应用卡方分布表查出卡方值D.应用F 分布表查出F 值 4. 1-α是( )A.置信限B.置信区间C.置信距D.置信水平5. 如检验k (k=3)个样本方差s i 2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为( )。
A.方差的齐性检验B. t 检验C. F 检验D. u 检验 三. 填空题(每题1分,共10分)1、统计学的3个基本特点: 、 、 。
2、统计资料的特点: 、 、 。
3、统计资料可分为 、和 、两类,后者又可分为 、和 。
4、统计表由 、 、 、 、 组成,通常分为 和 。
5、显著性检验又称 ,是统计学的核心内容。
6、随机实验的每一个可能的结果称为 。
7、通常把α称为显著性水平或置信系数,常用显著性水平有两个,它们是 和 。
生物统计考试题目及答案一、单项选择题(每题2分,共20分)1. 生物统计中,描述数据集中趋势的常用指标是()。
A. 平均值B. 中位数C. 众数D. 标准差答案:A2. 在统计学中,标准差是用来衡量数据的()。
A. 集中程度B. 离散程度C. 相关性D. 正态性答案:B3. 以下哪项不是假设检验中的基本概念()。
A. 零假设B. 备择假设C. 显著性水平D. 置信区间答案:D4. 相关系数的取值范围是()。
A. -1 到 1B. -2 到 2C. 0 到 1D. 0 到 2答案:A5. 以下哪种统计图适合展示分类数据的分布情况()。
A. 折线图B. 条形图C. 散点图D. 箱线图答案:B6. 在回归分析中,回归系数表示的是()。
A. 自变量每变化一个单位,因变量的平均变化量B. 自变量每变化一个单位,因变量的变化量C. 自变量每变化一个单位,因变量的最小变化量D. 自变量每变化一个单位,因变量的最大变化量答案:A7. 以下哪项是描述数据分布形状的统计量()。
A. 平均值B. 标准差C. 偏度D. 峰度答案:C8. 在生物统计中,样本量的大小会影响()。
A. 抽样误差B. 总体参数C. 样本均值D. 样本方差答案:A9. 以下哪项不是方差分析(ANOVA)的基本假设()。
A. 各组样本独立B. 各组样本方差相等C. 各组样本均值相等D. 各组样本服从正态分布答案:C10. 以下哪项是用于比较两个相关样本的统计方法()。
A. 独立样本t检验B. 配对样本t检验C. 方差分析D. 卡方检验答案:B二、多项选择题(每题3分,共15分)11. 下列哪些是生物统计中常用的数据类型()。
A. 定量数据B. 定性数据C. 计数数据D. 等级数据答案:ABCD12. 在进行假设检验时,以下哪些因素会影响p值的大小()。
A. 样本量B. 效应大小C. 显著性水平D. 检验方法答案:ABD13. 以下哪些是描述数据离散程度的统计量()。
生物统计试题及答案一、选择题(每题2分,共20分)1. 以下哪项不是生物统计学的研究内容?A. 描述性统计B. 推断性统计C. 人口统计学D. 基因统计学答案:C2. 在生物统计学中,中位数是以下哪种数据的度量?A. 位置B. 变异C. 形状D. 相关性答案:A3. 以下哪个选项不是生物统计学中常用的数据类型?A. 定量数据B. 定性数据C. 计数数据D. 虚拟数据答案:D4. 假设检验中,P值小于0.05通常意味着什么?A. 拒绝零假设B. 接受零假设C. 无法得出结论D. 需要更多的数据答案:A5. 在生物统计学中,以下哪个选项不是数据收集方法?A. 观察法B. 实验法C. 调查法D. 推断法答案:D6. 以下哪种图形最适合展示两个变量之间的相关性?A. 条形图B. 散点图C. 饼图D. 直方图答案:B7. 以下哪种统计方法用于估计两个变量之间的关联强度?A. 相关系数B. 回归分析C. 方差分析D. 卡方检验答案:A8. 在生物统计学中,以下哪种分布用于描述二项分布?A. 正态分布B. 泊松分布C. 二项分布D. t分布答案:C9. 以下哪个选项是生物统计学中用于比较两组独立样本均值差异的检验?A. 方差分析B. 卡方检验C. t检验D. 相关性检验答案:C10. 在生物统计学中,以下哪种方法用于估计总体参数?A. 描述性统计B. 推断性统计C. 探索性数据分析D. 预测性数据分析答案:B二、填空题(每题2分,共20分)1. 在统计学中,样本均值的估计误差通常用________来表示。
答案:标准误2. 当数据服从正态分布时,大约________%的数据值会落在均值两侧各一个标准差范围内。
答案:683. 在生物统计学中,________检验用于检验两个或多个样本均值是否相等。
答案:方差分析4. 相关系数的取值范围在________之间。
答案:-1到15. 在生物统计学中,________图用于展示数据的分布情况。
中国科学院武汉教育基地
2007—2008学年第一学期生物统计学期末考试参考答案
一、选择题(每题选择一个最佳答案。
每小题1分,共17分)
1、B
2、A
3、C
4、B
5、D
6、A
7、B
8、C
9、A 10、A 11、A12、B 13、D 14、D 15、D 16、A 17、A
二、填空题(填空题每空1分,共18分)
1、中位数,集中;四分位数间距,离散。
2、卡方。
3、4.804~5.196 mmol/L 。
4、 2 ,是。
5、作用显著,作用不显著。
6、距离,相关系数。
7、变量,样本。
8、终点,截尾点。
9、相关,相对独立。
三、是非题(每小题1分, 共15分)
1、√
2、×
3、√
4、×
5、√
6、×
7、×
8、√
9、×10、√11、√12、√13、×14、×15、√
四、简答题(每小题5分,共10分)
1、t分布与标准正态分布比较,中心位置不变,但分布曲线的峰较低,两侧较伸展(3分)。
t分布可用于两组均数比较时的假设检验,总体方差未知时总体均数的区间估计等等(2分)。
2、此分析方法不合理。
如果用成组比较t检验对3组脑铅浓度进行检验,共有3次比较。
每次检验所用I类错误的概率水准为0.05,累积Ⅰ类错误的概率为α’=
1-(1-0.05)3 =1-(0.95)3 = 0.143。
如果不对α进行校正,则会增加Ⅰ类错误的概率。
(3分)
合理的分析方法:先进行方差分析,在检测到3组脑铅浓度不全相等时,进
行3组均数的两两比较。
基本步骤如下:
首先,提出一个原假设,如H 0:µ1=µ2=µ3, 对应的备选假设H 1:µ1,µ2,µ3不全相等;
第二,计算F 值;
第三,确定显著性水平(α=0.05或0.01);
第四,查F 值表,确定p 值。
如果F 值大于某个临界值,表示处理组间的效应不同;如果F 值接近甚至小于某个临界值,表示处理组间效应相同。
第五,如果F 检验表明各处理组间的效应不全同,选择一种控制累积Ⅰ类错误概率增大的方法,如LSD 法、Duncan 法和S-N-K 法,进行均数间的两两比较。
(2分)
五.计算题(每小题5分, 共10分) 1、(1分)
1)pc =(a+c )/n= 28.6% 2)(2分)
χ2 < 2
1,05.0χ,P > 0.05,故经两药治疗后,心血管病的病死率没有区别。
3)(2分)
2、
1)体长的CV=3/21=14.3%,体重的CV=5/120=4.2%(1分)。
体长的变异程度更大。
(1分)
2)体长的离均差平方和l XX = MS × df x =9×(100 - 1),体重的离均差平方和l YY = SD 2 × df y =252×(100 - 1);5.19/259.0=⨯==XX YY l l r b 。
(2分)
回归直线一定经过“均数”点,因此回归截距5.88215.1120=⨯-=-=X b Y a 。
体重对体长的回归方程:Y = 88.5+1.5X 。
3)x = 27cm ,y =88.5+1.5×27 =129g 。
(1分)。
3.646)2525)(515)(255)(2515(70)5252515())()()(()(2
22
=++++⨯⨯-⨯=++++⋅-=d b c a d c b a n bc ad χ
六、分析题(每小题10分,共30分)
1、
1)各康复方案组的语言功能评分均为正态资料。
第1,2,3组Shapiro-Wilk 统计量分别为0.963,0.967和0.980,p值分别为0.588,0.759和0.983,均大于0.05,因此接受它们为正态分布的假设。
(1分)
对于肢体功能评分,第1,2组Shapiro-Wilk统计量分别为0.969和0.932,p值分别为0.715和0.238,均大于0.05,因此接受它们为正态分布的假设。
第3组Shapiro-Wilk统计量为0.783,p值为0.006,小于0.05,因此拒绝它为正态分布的假设。
(1分)
2)两固定变量的不同水平组合间的方差齐(F=1.666,df=5,44, p>0.05)。
(1分)
根据方差分析的结果,不同性别患者的语言功能评分均数间相等(F = 0.385, df=1,46,p=0.538)。
(1分)
不同康复方案组的语言功能评分均数间不相等(F = 6.935, df=2,46,
p=0.002)。
(1分)
3)根据S-N-K检验的结果,第2种和第3种康复方案的语言功能评分均数相等的概率为0.151。
(1分)
4)根据Kruskal Wallis检验的结果,不同康复方案组的肢体功能评分不同(χ2=598,df=2,p=0.001)。
(1分)
5)如果不考虑康各性别组肢体功能评分的分布背景,应该用两独立样本非参数检验(或两独立样本比较的秩和检验,或Wilcoxon(Mann-Whitney)秩和检验,Kolmogorov-Smirnov秩和检验)。
(2分)
2、
1)年龄与是否饮酒对食道癌的发病没有交互作用(Wald χ2=0.002, df=1, P=0.962)。
(2分)
2)模型有统计学意义(χ2=179.573, df=2, P<0.001)(2分)。
饮酒组的食道癌发病率是不饮酒组的5.918倍(2分)。
年龄组一栏中Exp(B)=1.064的生物学意义是年龄每增加10岁,食道癌发病率增加1.064倍。
(2分)
3)如果欲知道75岁以上组与其它各年龄组的食道癌发病率是否有差异,则在回过分析前应该将变量age设置为哑变量(伪变量),并将75岁以上组设置为参照组。
(2分)
3、
1) Life Table
2) (3分)
3)甲、乙疗法组脑瘤患者的ST 50分别是10和38周。
(2分)
4)比较两组脑瘤患者的ST 50是否相等,则
因为z > 1.96, 所以P < 0.05,拒绝两组ST 50相同的假设,甲、乙疗法组脑瘤患者的ST 50不相等。
(3分)
2.5045528
5
101038)]2([)]1([)2()1(2
25025025050=⨯=+-=+-=ST SE ST SE ST ST z。