当前位置：文档之家› 进化生物学-考试整理答案-1

进化生物学-考试整理答案-1

第一章

1.进化: 进化指事物由低级的、简单的形式向高级的、复杂的形式转变过程。广义进化是指事物的变化与发展。涵盖了天体的消长，生物的进化，以及人类的出现和社会的发展。

2.生物进化: 生物进化就是生物在与其生存环境相互作用的过程中，其遗传系统随时间而发生一系列不可逆的改变，并导致相应的表型改变，在大多数情况下这种改变导致生物总体对其生存环境的相对适应。

3.生物进化论：生物进化论是研究生物界进化发展的规律以及如何运用这些规律的科学。主要研究对象是生物界的系统发展，也包括某一物种。

4.比较拉马克学说和达尔文学说的异同。

相同点：

1二者均认为物种是可变的，而是在自然界里，在环境的影响下，发生变异，并且从一种生物类型变为另一种生物类型。

2二者均主张生物的进化史渐进的。

不同点：

1.达尔文进化论的一个重要方面是他主张物种演变和共同起源，他认为地球上现今生存的物种都是曾经生存的物种的后代，溯源于共同的祖先。共同起源是生物进化一元论的观点，而拉马克则是认为最原始的生物源于自然发生，各系统或群体生物

并不起源于共同祖先，是典型的生物进化多元论的观点。

2.二者对适应起源看法比不同。按照拉马克看法，用进废退或获得性遗传是一步适应，也称直接适应，即变异是定向的，

“变异＝适应”。按照达尔文的看法，适应是两步适应，也称间接适应，第一步是变异的产生，第二步是通过生存斗争的选择，即变异是不定项的，“变异≠适应”。

3.拉马克学说是在同灾变论的斗争中创立的，达尔文学说是在同神创论的斗争中创立的。

5.你如何看待“美国的猴子事件”？

第二章

6.试述生物大分子起源研究的最新进展

生物化学起源于19世纪的生理化学，发展于20世纪。起先，由于一些有机化学家对动植物化学的研究，开始认识了组成生命的重要物质——蛋白质、核酸、糖和脂肪的化学成分和部分结构。化学家们用了100多年的时间，到1940年才全部阐明了组成蛋白质的20种氨基酸。19世纪末、20世纪初，德国化学家E.菲舍尔和F.霍夫迈斯特先后分别提出蛋白质的结构是由肽键把各种氨基酸链接为长链的理论，并指出了天然氨基酸都是L系的。但直到1929年，瑞典化学家T.斯韦德贝里用他自己发明的超速离心机进行了测定后才证明了蛋白质的大分子本质。1869年，J.F.米舍尔发现核酸以后，德国生化学家A.科赛尔和美籍俄裔的生化学家P.A.T.列文等从世纪交替时起到20世纪30年代，对核酸的结构作了系统的研究，发现核酸是由4种不同的含氮的杂环化合物（嘌呤核嘧啶的衍生物，通称为碱基）同核糖、磷酸结合成核苷酸，然后再集合为大分子。1929年P.T.A.列文发现，由于核糖含氧量不同，而有脱氧核糖核酸（DNA）与核糖核酸（RNA）之分。由于当时条件的局限，他根据不够精确的测定，误以为核酸中4种碱基的含量相等，于1921年提出关于核酸结构的错误的“四核苷酸”假说，把复杂的核酸结构简单化了。30年代这一假说被普遍接受，影响了人们揭示核酸作为生命物质的重要功能。直到40年代中期核酸在遗传上的功能被肯定，才有人再次用刚建立不久的精确方法进行分析，发现四种碱基含量并不完全相等。这才推翻了“四核苷酸”假说，有助于以后DNA双螺旋结构模型的建立。

第三章

7.超循环组织模式：指由自催化或自我复制的单元组织起来的超循环系统

8.真核细胞起源的内共生学说的合理性表现在那些方面，还存在哪些不足？

合理性：1、在膜形态结构上，线粒体和细菌相似，叶绿体和蓝藻相似。在化学组成上，内外膜不一致，线粒体外膜与真核细胞的质膜相似，而线粒体的内膜与原核细胞的质膜相似。

2、线粒体和叶绿体都是半自主性细胞器，它们像细菌一样，以二分裂方式进行繁殖，这些特征具有曾是独立生存的生物性质。它们所含的DNA

均为裸露的环状分子。3、线粒体、叶绿体的核糖体在大小和对蛋白质合成的抑制剂反应性质上与原核生物相似。

4、现今的生物中，有些真核细胞中存在有共生现象。

5、分子进化方面的证据，根据16SrRNA序列比较分析，红藻的叶绿体毫无疑问是从蓝藻来的。

6、同工酶与代谢途径研究的证据也支持内共生学说。

不足：1、只重视形态学方面而忽视细胞生理和生化特征。2、不能很好的解释细胞核的起源。

9.简述真核细胞起源对生物进化的意义

1）为生物性分化和有性生殖打下基础；

2）推动生物向多细胞化方向发展；

3）促成了三级生态系统的建立。

第四章

一、名词解释

化石：化石就是经过自然界的作用保存于地层中的古生物的遗体、遗物和它们生活的遗迹。五界说：将生物界分为动物界、植物界、真菌界、原生生物界和原核界。

二、化石按照保存的特点可分为哪几类？决定化石形成的因素有哪些？

化石按照保存：1、遗体化石2、模铸化石3、遗物化石4、遗迹化石

决定化石形成的因素：1、生物死亡种群的大小2、生物体组成部分的坚硬程度。3、生物尸体被掩埋的速度4、掩埋的环境5、化石的程度和速度

三、地质年代划分的原则是什么？地质史划分为哪几个代？每个代又包括哪些纪？（P70）地质学家根据底层叠加原则及标准化石，将地质史划分为6个代，由早到晚依次是冥古代、太古代、元古代、古生代、中生代和新生代。

第五章

一、名词解释

“有产者”原则：是指斗争中资源（食物、领域、配偶）占有者往往处于优势。

二、新构造的起源及其在进化中的意义是什么？

生物的多功能性是器官系统发育变异的基础，基因的多效性是新构造、新器官形成的基础。基因多效性即一个基因控制若干性状的特征。随着环境的改变，某些原先没有多大适应意义的特征可能对新环境具有较大的适应性，因而会得到保存和加强

三、新功能起源的基本方式有哪些？

1、功能的强化：功能的强化按结构水平，分为两种，即细胞与组织的功能强化和器官的动能强化。

2、功能的扩大：功能扩大是指结构功能范围的扩大。

3、功能的更替：功能的更替指动物在进化过程中，由于环境的改变，原先次要的功能逐渐转化为主要的功能，随着功能更替，器官也发生相应的变化。

四、谈谈你学习争斗行为后的感受。

第六章

一、名词解释

微观进化：是无性繁殖系或种群在遗传组成上的微小差异导致的微小变化。

遗传平衡定律：一个群体在符合一定条件的情况下，群体中各个体的比例可从一代到另一代维持不变。

遗传漂变：由于群体太小引起的基因频率随机增减甚至丢失的现象。

二、测定了1000人的MN血型样本，发现其中M型360人，MN型480人，N型160人。试从该样本计算基因M和N的频率

三、在300人的一个群体中，三种血型的百分比数如下：M型42.6%；MN型46.7%；N型

10.7%。计算基因M和N的频率。

四、试述微观进化与宏观进化二者的关系。

试述微观进化与宏观进化的关系。

（1）微观进化过程是宏观进化现象的基础，微观进化过程在一定程度上可以解释宏观进化现象，不存在与微观进化无关的独立的宏观进化过程。

（2）微观进化的速率有快有慢，在一定情况下，微观进化速率也会很快。说明在一定条件下，微观进化和宏观进化是统一的，微观进化通过选择、隔离分化同样可以导致高速率的进化。

（3）微观进化与宏观进化是不同层次上的进化，二者是相互关联的.

第7章

名词解释

1.物种：是进化的单位，又是生态系统中的功能单位。是指生命存在的主要形式，体现了生物界统一性中的多样性，连续中的不连续性，不稳定中的相对稳定性。

2.生殖隔离（广义的生殖隔离）：是指在自然界中生物间彼此不能自由交配或交配后不能产生正常可育后代的现象。生殖隔离机制是指生物防止杂交的生物学上的特性和机理。

简答题

二、举例说明隔离在物种形成中的作用。

答：物种的形成一般是通过隔离实现的，因为只有隔离才能导致遗传物质交流中断，防止因基因交流而将彼此间的差异淹没，保证群体向各自方向发展，使歧化不断加深，直至新种形成。

另一方面，生物学上差异造成的隔离，也是随着物种的形成而获得的。以美洲棉尾兔分布为例，在美国东部棉尾兔有8个种，而在西部多山地区则有23个种，说明在多山地理隔离在物种形成中起了重要作用。又如蚊子中至少有6个物种之间的隔离属于生态隔离，一些种生活在盐水中，另一些生活在活水中，还有一些生活在静水中。

第8章

名词解释

1宏观进化：宏观进化研究的是种以上的高级分类群在长时间（地质时间）尺度上的变化过程。物种是宏观进化的基本单位。

2表型趋异：是指后裔的平均表型相对其祖先表型的偏离。

3谱系趋异：是指一个单源群内代表不同进化方向的线系之间因种形成速率和绝灭速率的差异而造成的谱系不对称性。

简答题：

1举例说明特化式进化的主要类型。（P164）书上找例子

答：特化式进化的主要方式

（1）分歧（divergence , 趋异）由一个祖先物种适应于不同的环境，向着两个或两个以上方向发展的进化过程。北极熊是从棕熊发展而来的

（2）辐射(radiation)由一个祖先物种进化产生各种各样不同的新物种，以适

应不同环境或生态位，从而形成一个同源的辐射状进化系统。哺乳类在历史上发生的三次适应辐射，最后一次发生在新生代，从原始的食虫类分化出包括灵长类在内的胎盘哺乳类。

（3）趋同（convergence) 指亲缘关系较远的生物在条件相同的环境中，在同

样的选择压力下，有可能产生功能相同或十分相似的形态结构，以适应相同的环境条件，这种现象称为趋同。化石爬行类中的翼龙很像哺乳类的蝙蝠，这就是生物进化中的趋同作用

（4）平行(parallelism) 指源于一个共同祖先，但后来适应不同条件产生分

歧，之后又遇到了相同的条件，产生了对相似环境的相同适应。澳大利亚的鹅袋类与大陆的真兽类在形态和生活习性等方面是非常相似的从一个共同祖先为了适应各种不同条件中，进行了平行进化。

2试述微观进化与宏观进化的关系（P179）

答：微观进化过程是宏观进化现象的基础，微观进化过程在一定程度上可以解释宏观进化现象，不存在与微观进化无关的独立的宏观进化过程。

微观进化的速率有快有慢，在一定情况下，微观进化速率也会很快。说明在一定条件下，微观进化和宏观进化是统一的，微观进化通过选择、隔离分化同样可以

导致高速率的进化。

微观进化与宏观进化是不同层次上的进化，二者是相互关联的。

第9章

名词解释

1选择性剪接：指从一个基因转录出来的RNA前提，通过不同的剪接方式形成

不同的成熟mRNA，产生不同的蛋白质。

2结构域：是指蛋白质亚基结构中明显分开的紧密球状结构区域，又称为辖区

却发生了可遗传的改变。这种改变是细胞内除了遗传信息以外的其他可遗传物质发生的改变，且这种改变在发育和细胞增殖过程中能稳定传递。（来源于百度知道搜索的词条，文库里面没有这个答案）

简答题：

一．染色体的进化有什么方式和途径？

答：1. 染色体数目进化

①基本染色体组整倍的增减，形成整倍体。

②染色体组内个别染色体的增减，使细胞内染色体的数目不成基数的完整倍

数，导致非整倍体的产生。

2.染色体结构进化

①缺失②重复③倒位④易位

3. 染色体功能进化随着有性生殖在进化中的出现，在很多生物的性别决定

上就产生了染色体功能的分化，即产生了与性别有关的性染色体和与性别无关或关系不大的常染色体。性染色体是逐渐从一对原始的同源染色体分化而来。

二．对于内含子的起源，现有什么假说？你认为哪一种假说更具有说服力？

1、内含子的起源主要有“后起源”和“先起源”两种观点。

2、“后起源”观点认为，内含子都是作为间隔序列，插入到连续编码的基因序列中形成的，内含子在较高级的功能基因出现之后，或在真核生物出现之后才产生。

3、“先起源”观点则认为，早期的内含子具有自我催化、自我复制等能力，因此

它们是原始基因和基因组的组织与复制必不可少的。内含子在原始基因组中就已存在，现代的内含子则是一类进化的遗迹。

4、你认为哪一种假说更具有说服力？请开动自己的思维咯

生物统计学期末考试题

生物统计学期末考试题一名词解释(每题2分,共10分) 1．生物统计学期末考试题 2．样本：从总体中抽出的若干个体所构成的集合称为样本 3．方差：用样本容量n来除离均差平方和,得到的平方和,称为方差 4．标准差：方差的平方根就是标准差 5．标准误：即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6．变异系数：将样本标准差除以样本平均数,得出的百分比就是变异系数 7．抽样：通常按相等的时间间隔对信号抽取样值的过程。 8．总体参数：所谓总体参数是指总体中对某变量的概括性描述。 9．样本统计量：样本统计量的概念很宽泛（譬如样本均值、样本中位数、样本方差等等）,到现在为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间的关系已经被证明了。 10．正态分布：若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名高斯分布 11．假设测验：又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该接受的那种假设的推断。 12．方差分析：又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13．小概率原理：一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15．决定系数：决定系数定义为相关系数r的平方 16．随机误差：在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17．系统误差：它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和符号（正值或负值）保持不变；或者在条件变化时,按一定规律变化的误差二. 判断题（每题2分,共10分） 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体（） 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生（） 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验（） 6.系统误差是不可避免的,并且可以用来计算试验精度。（） 7.精确度就是指观察值与真值之间的差异。（） 8. 实验设计的三个基本原则是重复、随机、局部控制。（） 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。（） 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。（）三. 简答题（每题5分共20分） 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

生物信息学期末考试重点

第一讲生物信息学（Bioinformatics）是20世纪80年代末随着人类基因组计划的启动而兴起的一门新型交叉学科，它体现了生物学、计算机科学、数学、物理学等学科间的渗透与融合。生物信息学通过对生物学实验数据的获取、加工、存储、检索与分析，达到揭示数据所蕴含的生物学意义从而解读生命活动规律的目的。生物信息学不仅是一门学科，更是一种重要的研究开发平台与工具，是今后进行几乎所有生命科学研究的推手。生物技术与生物信息学的区别及联系生物信息学的发展历史 ?人类基因组计划（HGP） ?人类基因组计划由美国科学家于1985年提出，1990年启动。根据该计划，在2015年要把人体约4万个基因的密码全部揭开，同时绘制出人类基因的谱图，也就是说，要揭开组成人体4万个基因的30亿个碱基对的秘密。HGP与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划，被誉为生命科学的登月计划。(百度百科) 随着基因组计划的不断发展，海量的生物学数据必须通过生物信息学的手段进行收集、分析和整理后，才能成为有用的信息和知识。换句话说，人类基因组计划为生物信息学提供了兴盛的契机。上文所说的基因、碱基对、遗传密码子等术语都是生物信息学需要着重研究的地方。：

】第二讲回顾细胞结构细胞是所有生命形式结构和功能的基本单位细胞组成细胞膜主要由脂类和蛋白质组成的环绕在细胞表面的双层膜结构细胞质细胞膜与细胞核之间的区域：包含液体流质，夹杂物存储的营养、分泌物、天然色素和细胞器细胞器细胞内完成特定功能的结构：线粒体、核糖体、高尔基体、溶酶体等细胞核最大的细胞器 DNA的结构碱基（腺嘌呤A、鸟嘌呤G、胞嘧啶C、胸腺嘧啶G）。核苷酸核苷酸是构成DNA分子的重要模块。每个核苷酸分子由一分子称作脱氧核糖的戊糖（五碳糖）、一分子磷酸和一分子碱基构成。每种核苷酸都有一个碱基对，也就是A、T、C、G 基因是什么基因是遗传物质的基本单位基因就是核苷酸序列。大部分的基因大约是1000-4000个核苷酸那么长。基因通过控制蛋白质的合成，从微观和宏观上影响细胞、组织和器官的产生。基因在染色体上。

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期生物统计学试题（A ）试题使用对象： 2011 级专业(本科) 命题人：考试用时 120 分钟答题方式采用：闭卷说明：1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题，在此卷上答题作废. 一：判断题；（每小题1分，共10分） 1、正确无效假设的错误为统计假设测验的第一类错误。（） 2、标准差为5，B 群体的标准差为12，B 群体的变异一定大于A 群体。（） 3、一差异”是指仅允许处理不同，其它非处理因素都应保持不变。（） 4、30位学生中有男生16位、女生14位，可推断该班男女生比例符合1∶1 （已知84.321,05.0=χ）。（） 5、固定模型中所得的结论仅在于推断关于特定的处理，而随机模型中试验结论则将用于推断处理的总体。（） 6、率百分数资料进行方差分析前，应该对资料数据作反正弦转换。（） 7、比较前，应该先作F 测验。（） 8、验中，测验统计假设H 00:μμ≥ ，对H A :μμ<0 时，显著水平为5%，则测验的αu 值为1.96（） 9、行回归系数假设测验后，若接受H o :β=0，则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y （厘米），果穗长的平均数和标准差为s y ±1030±=（厘米），可认为该玉米的株高性状比果穗性状变异大。（）二：选择题；（每小题2分，共10分） 1分别从总体方差为4和12的总体中抽取容量为4的样本，样本平均数分别为3和2，在95%置信度下总体平均数差数的置信区间为（）。 A 、[-9.32，11.32] B 、[-4.16，6.16]

贵州大学《生物统计学》考试试卷(含答案)

贵州大学《生物统计学》考试试卷（含答案）一单项选择题（每题3分，共21分） 1.在假设检验中，显著性水平α的意义是___C___。 A. 原假设0H 成立，经检验不能拒绝的概率 B. 原假设0H 不成立，经检验不能拒绝的概率 C. 原假设0H 成立，经检验被拒绝的概率 D. 原假设0H 不成立，经检验被拒绝的概率 2．设123,,X X X 是总体2( , )N μσ的样本，μ已知，2 σ未知，则下面不是统计量的是__C___。 A. 123X X X +- B. 4 1 i i X μ=-∑ C. 2 1X σ+ D. 4 21 i i X =∑ 3.设随机变量~(0,1)X N ，X 的分布函数为()x Φ,则( 2)P X >的值为___A____。 A. ()212-Φ???? B. ()221Φ- C. ()22-Φ D. ()122-Φ 4．比较身高和体重两组数据变异程度的大小应采用__D___。 A ．样本平均数 B. 样本方差 C. 样本标准差 D. 变异系数 5．设总体服从),(2 σμN ，其中μ未知，当检验0H :220σσ=,A H :220σσ≠时，应选择统计量___B_____。 A. 2 (1)n S σ- B. 2 2 (1)n S σ- X X 6．单侧检验比双侧检验的效率高的原因是___B_____。 A ．单侧检验只检验一侧 B ．单侧检验利用了另一侧是不可能的这一已知条件 C ．单侧检验计算工作量比双侧检验小一半 D. 在同条件下双侧检验所需的样本容量比单侧检验高一倍 7．假设每升饮水中的大肠杆菌数服从参数为μ的泊松分布，则每升饮水中有3个大肠杆菌的概率是____D____。 A.63e μ μ- B.36e μμ- C.36e μ μ- D. 316 e μμ-

生物信息学考试试卷修订稿

生物信息学考试试卷 WEIHUA system office room 【WEIHUA 16H-WEIHUA WEIHUA8Q8-

一、名词解释(每小题4分,共20分) 1、生物信息学广义：生命科学中的信息科学。生物体系和过程中信息的存贮、传递和表达；细胞、组织、器官的生理、病理、药理过程的中各种生物信息。狭义：生物分子信息的获取、存贮、分析和利用。 2、人类基因组计划人类基因组计划准备用15年时间，投入30亿美元，完成人类全部24条染色体的3×109脱氧核苷酸对(bp)的序列测定，主要任务包括作图(遗传图谱、物理图谱的建立及转录图谱的绘制)、测序和基因识别。其中还包括模式生物(如大肠杆菌、酵母、线虫、小鼠等)基因组的作图和测序，以及信息系统的建立。作图和测序是基本的任务，在此基础上解读和破译生物体生老病死以及和疾病相关的遗传信息。 3、蛋白质的一级结构蛋白质的一级结构是指多肽链中氨基酸的序列 4、基因基因--有遗传效应的DNA片断,是控制生物性状的基本遗传单位。 5、中心法则是指遗传信息从传递给，再从RNA传递给，即完成遗传信息的转录和翻译的过程。也可以从DNA传递给DNA，即完成DNA的复制过程。这是所有有细胞结构的生物所遵循的法则。 6 、DNA序列比较序列比较的根本任务是：（1）发现序列之间的相似性；（2）辨别序列之间的差异目的：相似序列相似的结构，相似的功能判别序列之间的同源性推测序列之间的进化关系 7、一级数据库数据库中的数据直接来源于实验获得的原始数据，只经过简单的归类整理和注释 8、基因识别基因识别，是生物信息学的一个重要分支，使用生物学实验或计算机等手段识别DNA序列上的具有生物学特征的片段。基因识别的对象主要是蛋白质编码基因，也包括其他具有一定生物学功能的因子，如RNA基因和调控因子。 9、系统发生学系统发生学(phylogenetics)——研究物种之间的进化关系。 10、基因芯片基因芯片（gene chip），又称DNA微阵列（microarray），是由大量cDNA或寡核苷酸探针密集排列所形成的探针阵列，其工作的基本原理是通过杂交检测信息。

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期生物统计学试题（A ）试题使用对象： 2011 级专业(本科) 命题人：考试用时 120 分钟答题方式采用：一：判断题；（每小题1分，共10分） 1、正确无效假设的错误为统计假设测验的第一类错误。（） 2、标准差为5，B 群体的标准差为12，B 群体的变异一定大于A 群体。（） 3、一差异”是指仅允许处理不同，其它非处理因素都应保持不变。（） 4、30位学生中有男生16位、女生14位，可推断该班男女生比例符合1∶1（已知84.321,05.0=χ）。（） 5、固定模型中所得的结论仅在于推断关于特定的处理，而随机模型中试验结论则将用于推断处理的总体。（） 6、率百分数资料进行方差分析前，应该对资料数据作反正弦转换。（） 7、比较前，应该先作F 测验。（） 8、验中，测验统计假设H 00:μμ≥ ，对H A :μμ<0 时，显著水平为5%，则测验的αu 值为1.96（） 9、行回归系数假设测验后，若接受H o :β=0，则表明X 、Y 两变数无相关关系。( ) 10、株高的平均数和标准差为30150±=±s y （厘米），果穗长的平均数和标准差为s y ±1030±=（厘米），可认为该玉米的株高性状比果穗性状变异大。（）二：选择题；（每小题2分，共10分） 1分别从总体方差为4和12的总体中抽取容量为4的样本，样本平均数分别为3和2，在95%置信度下总体平均数差数的置信区间为（）。

A 、[-9.32，11.32] B 、[-4.16，6.16] C 、[-1.58，3.58] D 、都不是 2、态分布不具有下列哪种特征（）。 A 、左右对称 B 、单峰分布 C 、中间高、两头低 D 、概率处处相等 3、一个单因素6个水平、3次重复的完全随机设计进行方差分析，若按最小显著差数法进行多重比较，比较所用的标准误及计算最小显著差数时查表的自由度分别为（）。 A 、 2MSe/6 , 3 B 、 MSe/6 , 3 C 、 2MSe/3 , 12 D 、 MSe/3 , 12 4、已知),N(~x 2σμ，则x 在区间]96.1,[σμ+-∞的概率为（）。 A 、0.025 B 、0.975 C 、0.95 D 、0.05 5、方差分析时，进行数据转换的目的是（）。 A. 误差方差同质 B. 处理效应与环境效应线性可加 C. 误差方差具有正态性 D. A 、B 、C 都对三、简答题；（每小题6分，共30分） 1、方差分析有哪些步骤？ 2、统计假设是？统计假设分类及含义？ 3、卡方检验主要用于哪些方面？ 4、显著性检验的基本步骤？ 5、平均数有哪些？各用于什么情况？四、计算题；（共４题、50分） 1、进行大豆等位酶Aph 的电泳分析，193份野生大豆、223份栽培大豆等位基因型的次数列于下表。试分析大豆Aph 等位酶的等位基因型频率是否因物种而不同。（ 99 .52 05.0,2=χ， 81 .7205.0,3=χ）（10分）野生大豆和栽培大豆Aph 等位酶的等位基因型次数分布物种等位基因型 1 2 3 野生大豆 29 68 96

生物统计学试题及答案

生物统计学考试一.判断题（每题2分，共10分） √1. 分组时，组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时，若对数n=13，则查t表的自由度为12。二. 选择题(每题3分，共15分) 6.x～N（1，9），x1，x2，…，x9是X的样本，则有（） x N（0，1）B.11 - x ～N（0，1）C.91 - x ～N（0，1）D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计算平均年龄，则平均年龄的标准误（） A.两者相等 B.前者比后者大 D.不能确定大小 8. 设容量为16人的简单随机样本，平均完成工作需时13分钟。已知总体标准差为3分钟。若想对完成工作所需时间总体构造一个90%置信区间，则（） u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是（） A.置信限 B.置信区间 C.置信距 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为 ( )。 B. t检验 C. F检验 D. u检验三. 填空题(每题3分，共15分) 11. 12. 13. 已知F分布的上侧临界值F0.05（1，60）=4.00，则左尾概率为0.05，自由度为（60，1）的F 14. 15.已知随机变量x服从N (8，4)，P（x < 4.71）(填数字) 四．综合分析题（共60分）

生物信息学试题整理

UTR的含义是（B ） A.编码区 B. 非编码区 C. motif的含义是（D ）。 A.基序 B. 跨叠克隆群 C. algorithm 的含义是（B ）。 A.登录号 B. 算法 C. RGR^ （D ）。 A.在线人类孟德尔遗传数据 D.水稻基因组计划下列Fasta格式正确的是（B）低复杂度区域 D. 幵放阅读框碱基对 D. 结构域比对 D. 类推 B. 国家核酸数据库 C. 人类基因组计划 A. seql: agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta B. >seq1 agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta C. seq1:agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta D. >seq1agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta 如果我们试图做蛋白质亚细胞定位分析，应使用（D） A. NDB 数据库 B. PDB 数据库 C. GenBank 数据库 D. SWISS-PROT 数

据库 Bioinformatics 的含义是（A ）。 A. 生物信息学 B. 基因组学 C. 蛋白质组学 D. 表观遗传学 Gen Bank中分类码PLN表示是（D ）。 A.哺乳类序列 B. 细菌序列 C.噬菌体序列 D. 植物、真菌和藻类序列 ortholog 的含义是（A）0 A.直系同源 B.旁系同源 C.直接进化 D.间接进化从cDNA文库中获得的短序列是（D ）o A. STS B. UTR C. CDS D. EST con tig的含义是（B ）o A.基序 B. 跨叠克隆群 C. 碱基对 D. 结构域 TAIR （AtDB）数据库是（C）o A.线虫基因组 B. 果蝇基因组 C. 拟南芥数据库 D. 大肠杆菌基因组ORF的含义是（D ）o A.调控区 B. 非编码区 C.低复杂度区域 D. 幵放阅读框

生物统计学期末复习题

统计选择题 1，由于（1，研究对象本身的性质）造成我们所遇到的各种统计数据的不齐性。 2，研究某一品种小麦株高，因为该品种小麦是个极大的群体，其数量甚至于是个天文数字，该体属于（4，无限总体） 3，从总体中（2，随机抽出）一部分个体称为样本。 4，用随机抽样方法从总体中获得一个样本的过程称为（3，抽样） 5，身高，体重，年龄这一类数据属于（3，连续型数据；1，度量数据） 6，每10个中男性人数，每亩麦田中杂草株数，喷洒农药后每100只害虫中死虫数等，这一类数据属于（1，离散型数据；2，计数数据） 7，把频数按其组值的顺序排列起来，称为（3，频数分布） 8，以组值作为一个边，相应的频数为另一个边，做成的连续矩形图称为（2，直方图）9，绘制（4，多边形图）的方法是在坐标平面内点上各点（中值，频数），以线段连接各点，最高和最低非零频数点与相邻零频数点相连。 10，累积频数图是根据（3，累积频数表）直接绘出的。 11，样本数据总和除以样本含量，称为（算数平均数 12，已知样本平方和为360，样本含量为10，以下4种结果中（2，6.0）是正确的标准差。 13，概率的古典定义是（2，基本事件数与事件总数之比） 14，下面第（2，概率是事物所固有的特性） 15，对于事件A和B，P（A∪B）等于（2，P（AB）） 16，对于事件A和事件B，P（A|B）等于（P（AB）/P（B）） 17，对于任意事件A和B，P（AB）等于（P（B）P（B|A）） 18，下述（3随机试验中所输入的变量）项称为随机变量 19，关于连续型随机变量，有以下4种提法，其中（1，可取某一区间内的任何数值）20，总体平均数可以用以下4种符号中的一种表示，它是（2，μ） 21，样本标准差可以用以下4种符号中的一种表示，它是（1，s） 22，在养鱼场中，A鱼塘的面积占10%，A鱼塘中鱼的发病率为1%，问从养鱼场中任意捕捞一条鱼，它既是A鱼塘，又是生病的鱼的概率是（4,0.003） 23，以下4点是描述连续型随机变量特征的，其中（2，f（x）=lim △x→0P（x

生物统计学考试试卷及答案

考试轮次：2017－2018学年第一学期期末考试试卷编号考试课程：[120770] 生物统计与实验设计命题负责人曾汉元适用对象：生物与食品工程学院生物科学专业2015级审查人签字考核方式：上机考试试卷类型：A卷时量:150分钟总分：100分注意：答案中要求保留必要的计算和推理过程，全部答案保存为一个Word文档，文件名为学号最后两位数+姓名。考试结束后不要关机。提交答卷后，请到主机看一下是否提交成功。第1题12分，第3题5分，第10题13分，其余的题各10分。 1、下表为某大学96位男生的体重测定结果（单位：kg），请根据资料分别计算以下指标：（1）算术平均数；（2）几何平均数；(3)中位数；（4）众数；（5）极差；（6）方差；（7）标准差；（8）变异系数；（9）标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N（97，3 2），求：（1）株高在94cm以上的概率？（2）株高在90~99cm之间的概率？（3）株高在多少cm之间的中间概率占全体的99%？ 3．已知某批30个小麦样品的平均蛋白质含量为14.5%，σ=2.50%，试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合，F2代的芒性状表型有钩芒、长芒和短芒三种，观察计得其株数依次分别为348、11 5、157，试检验其比率是否符合9：3：4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者，现将血红蛋白含量（g/L）变化的数据列在下面，假定资料满足各种假设测验所要求的前提条件，问：治疗前后之间的差别有无显著性意义？患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

生物统计学期末考试试题A

漳州师范学院生物系_____________专业_____级本科_______班《生物统计学》课程期末考试卷（A）（2011—2012学年度第一学期）学号___________姓名________考试时间：2011-12-29 一、名词解释（6×2） 1统计数： 2小概率原理： 3无偏估计： 4准确性： 5纳伪错误： 6方差：二、判断题：请在下列正确的题目后面打“√”，错误的打“×”。（12×1） 1 t分布曲线的平均数与中位数相等（√） 2众数是总体中出现最多个体的次数。（×） 3 正态分布曲线形状与样本容量n无关（√） 4 假设检验显著水平越高，检验效果越好（×） 5 样本频率假设检验如果需要连续性矫正时，矫正系数＝0. 5（×） 6 样本标准差是总体标准差的无偏估计（×） 7计算相关系数的两个变量都是随机变量（√） 8 试验因素的任一水平就是一个处理（×） 9 在同一显著水平下，双尾检验的临界正态离差大于单位检验（√） 10 LSD检验方法实质上就是t检验（×） 11对多个样本平均数仍可采用t测验进行两两独立比较。（×）

12假设测验结果或犯α错误或犯β错误。（ × ）三、选择题（18×2） 1、某学生某门课成绩为75分，则其中的变量为[ ] A. 某学生 B. 某门课成绩 C. 75分 D. 某学生的成绩 2、算术平均数的重要特性之一是离均差之和[ ] A 、最小 B 、最大 C 、等于零 D 、接近零 3、在回归直线y=a+bx 中，若b ＜0，则x 与y 之间的相关系数[ ] A. r=0 B. r=1 C. 0＜r ＜1 D. -1＜r ＜0 4、假定我国和美国的居民年龄的方差相同。现在各自用重复抽方法抽取本国人口的1%计算平均年龄，则平均年龄的标准误 [ ] A.两者相等 B.前者比后者大 C 前者比后者小 D.不能确定大小 5、1-α是[ ] A.置信限 B.置信区间 C.置信距 D 置信水平 6、在一组数据中，如果一个变数10的离均差是2，那么该组数据的平均数是[ ] A 、12 B 、10 C 、8 D 、2 7、两个二项成数的差异显著性一般用[ ]测验。 A 、t B 、F C 、u D 、卡方测验 8、测验回归截距的显著性时，()/a t a s α=-遵循自由度为[ ] 的学生氏分布。 A 、n -1 B 、n -2 C 、n -m -1 D 、n 9、对一批大麦种子做发芽试验，抽样1000粒，得发芽种子870粒，若规定发芽率达90%为合格，测验这批种子是否合格的差异显著性为[ ]。 A 、不显著 B 、显著 C 、极显著 D 、不好确定 10设容量为16人的简单随机样本，平均完成工作需时13分钟。已知总体标准差为3分钟。若想对完成工作所需时间总体构造一个90%置信区间，则[ ] A 应用标准正态概率表查出u 值 B.应用t 分布表查出t 值 C.应用卡方分布表查出卡方值 D.应用F 分布表查出F 值

生物统计学期末复习题库及答案

第一章填空 1．变量按其性质可以分为（连续）变量和（非连续）变量。 2．样本统计数是总体（参数）的估计值。 3．生物统计学是研究生命过程中以样本来推断（总体）的一门学科。 4．生物统计学的基本内容包括（试验设计）和（统计分析）两大部分。 5．生物统计学的发展过程经历了（古典记录统计学）、（近代描述统计学）和（现代推断统计学）3个阶段。 6．生物学研究中，一般将样本容量（n ≥30）称为大样本。 7．试验误差可以分为（随机误差）和（系统误差）两类。判断 1．对于有限总体不必用统计推断方法。（×） 2．资料的精确性高，其准确性也一定高。（×） 3．在试验设计中，随机误差只能减小，而不能完全消除。（∨） 4．统计学上的试验误差，通常指随机误差。（∨）第二章填空 1．资料按生物的性状特征可分为（数量性状资料）变量和（质量性状资料）变量。 2. 直方图适合于表示（连续变量）资料的次数分布。 3．变量的分布具有两个明显基本特征，即（集中性）和（离散性）。 4．反映变量集中性的特征数是（平均数），反映变量离散性的特征数是（变异数）。 5．样本标准差的计算公式s=（）。判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。（×） 2. 条形图和多边形图均适合于表示计数资料的次数分布。（×） 3. 离均差平方和为最小。（∨） 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。（∨） 5. 变异系数是样本变量的绝对变异量。（×）单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ，其标准差（ D ）。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度，应采用的指标是（ C ）。 A. 标准差 B.方差 C.变异系数 D.平均数第三章 12 2--∑∑n n x x )(

生物信息学期末考试重点

1、生物信息学(Bioinformatics)是研究生物信息的采集、处理、存储、传播，分析和解释等各方面的学科，也是随着生命科学和计算机科学的迅猛发展，生命科学和计算机科学相结合形成的一门新学科。它通过综合利用生物学，计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。 2、数据库（Database）是按照数据结构来组织、存储和管理数据的仓库，它产生于距今六十多年前，随着信息技术和市场的发展，特别是二十世纪九十年代以后，数据管理不再仅仅是存储和管理数据，而转变成用户所需要的各种数据管理的方式。数据库有很多种类型，从最简单的存储有各种数据的表格到能够进行海量数据存储的大型数据库系统都在各个方面得到了广泛的应用。 3、表达序列标签从一个随机选择的cDNA 克隆进行5’端和3’端单一次测序获得的短的cDNA 部分序列，代表一个完整基因的一小部分，在数据库中其长度一般从20 到7000bp 不等，平均长度为360 ±120bp。EST 来源于一定环境下一个组织总 mRNA 所构建的cDNA 文库，因此EST也能说明该组织中各基因的表达水平。 4、开放阅读框是基因序列中的一段无终止序列打断的碱基序列，可编码相应的蛋白。 ORF识别包括检测六个阅读框架并决定哪一个包含以启动子和终止子为界限的 DNA序列而其内部不包含启动子或终止子，符合这些条件的序列有可能对应一个真正的单一的基因产物。ORF的识别是证明一个新的DNA序列为特定的蛋白质编码基因的部分或全部的先决条件。 5、蛋白质的一级结构在每种蛋白质中氨基酸按照一定的数目和组成进行排列，并进一步折叠成特定的空间结构前者我们称为蛋白质的一级结构，也叫初级结构或基本结构。蛋白质一级结构是理解蛋白质结构、作用机制以及与其同源蛋白质生理功能的必要基础。 6、基因识别是生物信息学的一个重要分支，使用生物学实验或计算机等手段识别 DNA序列上的具有生物学特征的片段。基因识别的对象主要是蛋白质编码基因，也包括其他具有一定生物学功能的因子，如RNA基因和调控因子。基因识别是基因组研究的基础。

2019版国科大生物信息学期末考试复习题

中科院生物信息学期末考试复习题陈润生老师部分： 1.什么是生物信息学，如何理解其含义？为什么在大规模测序研究中，生物信息学至关重要？答：生物信息学有三个方面的含义： 1)生物信息学是一个学科领域，包含着基因组信息的获取、处理、存储、分配、分析和解释的所有方面，是基因组研究不可分割的部分。 2)生物信息学是把基因组DNA序列信息分析作为源头，破译隐藏在DNA序列中的遗传语言，特别是非编码区的实质；同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测；其本质是识别基因信号。 3)生物信息学的研究目标是揭示“基因组信息结构的复杂性及遗传语言的根本规律”。它是当今自然科学和技术科学领域中“基因组、“信息结构”和“复杂性”这三个重大科学问题的有机结合。 2.如何利用数据库信息发现新基因，其算法本质是什么？答：利用数据库资源发现新基因，根据数据源不同，可分2种不同的查找方式： 1)从大规模基因组测序得到的数据出发，经过基因识别发现新基因：（利用统计，神经网络，分维，复杂度，密码学，HMM，多序列比对等方法识别特殊序列，预测新ORF。但因为基因组中编码区少，所以关键是“数据识别”问题。）利用大规模拼接好的基因组，使用不同数据方法，进行标识查找，并将找到的可能的新基因同数据库中已有的基因对比，从而确定是否为新基因。可分为：①基于信号，如剪切位点、序列中的启动子与终止子等。②基于组分，即基因家族、特殊序列间比较，Complexity analysis，Neural Network 2)利用EST数据库发现新基因和新SNPs：（归属于同一基因的EST片断一定有overlapping，通过alignment可组装成一完整的基因，但EST片断太小，不存在数据来源，主要是拼接问题）数据来源于大量的序列小片段，EST较短，故关键在正确拼接。方法有基因组序列比对、拼接、组装法等。经常采用SiClone策略。其主要步骤有：构建数据库；将序列纯化格式标准化；从种子库中取序列和大库序列比对；延长种子序列，至不能再延长；放入contig库①构建若干数据库：总的纯化的EST数据库，种子数据库，载体数据库，杂质、引物数据库，蛋白数据库，cDNA数据库； ②用所用种子数据库和杂质、引物数据库及载体数据库比对，去除杂质； ③用种子和纯化的EST数据库比对 ④用经过一次比对得到的长的片段和蛋白数据库、cDNA数据库比较，判断是否为已有序列，再利用该大片段与纯化的EST数据库比对，重复以上步骤，直到序列不能再延伸； ⑤判断是否为全长cDNA序列。（利用EST数据库：原理：当测序获得一条EST序列时，它来自哪一个基因的哪个区域是未知的（随机的），所以属于同一个基因的不同EST序列之间常有交叠的区域。根据这种“交叠”现象，就能找出属于同一个基因的所有EST序列，进而将它们拼接成和完整基因相对应的全长cDNA序列。而到目前为止，公共EST数据库(dbEST)中已经收集到约800万条的人的EST序列。估计这些序列已覆盖了人类全部基因的95%以上，平均起来每个基因有10倍以上的覆盖率。）

《生物统计学-2019》复习题

《生物统计学》复习题 1．变量之间的相关关系主要有两大类：（因果关系），（平行关系） 2．在统计学中，常见平均数主要有（算术平均数）、（几何平均数） 3．样本标准差的计算公式（ 1 ) (2 --= ∑n X X S ） 4．小概率事件原理是指（某事件发生的概率很小，人为的认为不会发生） 5．在分析变量之间的关系时，一个变量X 确定，Y 是随着X 变化而变化，两变量呈因果关系，则X 称为（自变量），Y 称为（因变量） ADCAA BABCB DADBB ADBCB 1、下列数值属于参数的是： A 、总体平均数 B 、自变量 C 、依变量 D 、样本平均数 2、下面一组数据中属于计量资料的是 A 、产品合格数 B 、抽样的样品数 C 、病人的治愈数 D 、产品的合格率 3、在一组数据中，如果一个变数10的离均差是2，那么该组数据的平均数是 A 、12 B 、10 C 、8 D 、2 4、变异系数是衡量样本资料程度的一个统计量。 A 、变异 B 、同一 C 、集中 D 、分布 5、方差分析适合于，数据资料的均数假设检验。 A 、两组以上 B 、两组 C 、一组 D 、任何 6、在t 检验时，如果t = t 0、01 ，此差异是： A 、显著水平 B 、极显著水平 C 、无显著差异 D 、没法判断 7、生物统计中t 检验常用来检验 A 、两均数差异比较 B 、两个数差异比较 C 、两总体差异比较 D 、多组数据差异比较 8、平均数是反映数据资料性的代表值。 A 、变异性 B 、集中性 C 、差异性 D 、独立性 9、在假设检验中，是以为前提。 A 、肯定假设 B 、备择假设 C 、无效假设 D 、有效假设 10、抽取样本的基本首要原则是 A 、统一性原则 B 、随机性原则 C 、完全性原则 D 、重复性原则 11、统计学研究的事件属于事件。 A 、不可能事件 B 、必然事件 C 、小概率事件 D 、随机事件 12、下列属于大样本的是 A 、40 B 、30 C 、20 D 、10 13、一组数据有9个样本，其样本标准差是0.96，该组数据的标本标准误（差）是 A 、0.11 B 、8.64 C 、2.88 D 、0.32 14、在假设检验中，计算的统计量与事件发生的概率之间存在的关系是。 A 、正比关系 B 、反比关系 C 、加减关系 D 、没有关系 15、在方差分析中，已知总自由度是15，组间自由度是3，组内自由度是 A 、18 B 、12 C 、10 D 、5 16、已知数据资料有10对数据，并呈线性回归关系，它的总自由度、回归自由度和残差自由度分别是 A 、9、1和8 B 、1、8和9 C 、8、1和9 D 、 9、8和1 18、下列那种措施是减少统计误差的主要方法。 A 、提高准确度 B 、提高精确度 C 、减少样本容量 D 、增加样本容量 19、相关系数显著性检验常用的方法是

生物统计学试题及答案

一、填空变量按其性质可以分为连续变量和非连续变量。样本统计数是总体参数的估计量。生物统计学是研究生命过程中以样本来推断总体的一门学科。生物统计学的基本内容包括试验设计、统计分析两大部分。统计学的发展过程经历了古典记录统计学、近代描述统计学、现代推断统计学3 个阶段。生物学研究中，一般将样本容量n >30称为大样本。试验误差可以分为随机误差、系统误差两类。资料按生物的性状特征可分为数量性状资料变量和质量性状资料变量。直方图适合于表示连续变量资料的次数分布。变量的分布具有两个明显基本特征，即集中性和离散性。反映变量集中性的特征数是平均数，反映变量离散性的特征数是变异数。林星s= 样本标准差的计算公式s= 如果事件A和事件B为独立事件，则事件A与事件B同时发生地概率P (AB) = P(A)*P(B)。二项分布的形状是由n和p两个参数决定的。正态分布曲线上，卩确定曲线在x轴上的中心位置，c确定曲线的展开程度。样本平均数的标准误等于c Wi。 t分布曲线和正态分布曲线相比，顶部偏低，尾部偏高。

统计推断主要包括假设检验和参数估计两个方面。

参数估计包括点估计和区间估计假设检验首先要对总体提出假设，一般应作两个假设，一个是无效假设，一个是备择假设。对一个大样本的平均数来说，一般将接受区和否定区的两个临界值写作卩-U a^x_ 卩+U a c x 在频率的假设检验中，当np或nq v30时，需进行连续性矫正。 2检验主要有3种用途：一个样本方差的同质性检验、适应性检验和独立性检验。 2检验中，在自由度df = (1)时，需要进行连续性矫正，其矫正的2 = ( p85 )。 2分布是连续型资料的分布，其取值区间为［0.+ %)。猪的毛色受一对等位基因控制，检验两个纯合亲本的F2代性状分离比是否符合孟德尔第一遗传规律应采用适应性检验法。独立性检验的形式有多种，常利用列联表进行检验。根据对处理效应的不同假定，方差分析中的数学模型可以分为固定模型、随机模型和混合模型混合模型3类。在进行两因素或多因素试验时，通常应该设置重复，以正确估计试验误差，研究因素间的交互作用。在方差分析中，对缺失数据进行弥补时，应使补上来数据后，误差平方和最小。方差分析必须满足正态性、可加性、方差同质性3个基本假定。如果样本资料不符合方差分析的基本假定，则需要对其进行数据转换，常用的数据转换方法有平方根转换、对数转换、正反弦转换等。相关系数的取值范围是［-1,1］O

生物信息学试题

华中农业大学研究生课程考试试卷（B）考试科目名称：生物信息学考试时间：2011年6月15日备注：所有答案均要写在答题纸上，否则，一律无效。提示：（1）2小时答题时间；（2）课堂开卷，独立完成；（3）答题简明扼要 1．请查询序列AK101913（GenBank注册号）的相关信息并回答下列问题：（1）若用限制性内切酶PstΙ消化这条序列，可以得到几个片段？（4分）（2）该序列编码的蛋白质有多少个氨基酸？哪种氨基酸所占比例最高？等电点是多少？是否糖蛋白质？如果是糖蛋白，请给出具体类型及糖基化位点。（10分）（3）请分析该序列编码蛋白的保守结构域，根据你的分析，该蛋白可能具有什么样的生物学功能？（6分） 2．任选一种基因结构分析工具，预测序列J04982（GenBank注册号）的基因结构及其编码产物的理化性质。请注明分析工具的名称，以及是否采用某一物种的数据作为参照。（1）根据你所选用的分析方法，这条序列编码多少个基因？分别包含有多少个exon？预测基因（如有多个基因请注明是第几个基因）是否有转录起点和PolyA加尾信号？分析结果是否与GenBank提供的注释信息相符合？（10分）（2）预测的第一个基因编码的蛋白质是否包含有信号肽（注明切割位点）和跨膜区域（注明跨膜区）？预测该蛋白的亚细胞定位。（10分）注：3a、3b任选一题 3a．RZ220是水稻分子标记遗传连锁图上的一个分子标记，请回答下列有关问题：（1）这个分子标记/位点被定位于水稻的第几号染色体？在你检索的网站（请注明网址）多少水稻的遗传连锁图使用了该分子标记？请列出分子标记遗传连锁图的名称及其类型（Map Type）（10分）（2）RZ220属于什么类型的分子标记？指出一个与该标记连锁或附近的QTL（注明其编号），并说明该QTL控制什么性状，列出定位该QTL的研究的相关文献。（10分） 3b．BM6506是羊分子标记遗传连锁图上的一个分子标记或位点，请回答下列有关问题：（请注明分析方法名称）（1）这个分子标记/位点被定位于羊的第几号染色体？（4分）（2）在SM1分子标记遗传连锁图上与这个分子标记/位点紧密连锁（两侧）的分子标记/位点的名称是什么？这个分子标记/位点在SM1分子标记遗传连锁图上的遗传位置是多少？（8分）（3）列出一篇与该标记相关的文献及其在PubMed中的PMID号。（8分） 4．分析六条蛋白质序列（BAF63641、ABO31104、ACO11338、ABH07379、AAF65254、AAB38498）的同源性并回答下列问题（请注明分析方法名称）：（1）哪两条序列的进化关系最近，一致性（Identity）是多少？相似度（Similarity/Positive）是多少？（10分）

文档之家

进化生物学-考试整理答案-1

生物统计学期末考试题

生物信息学期末考试重点

生物统计学考试题及答案

贵州大学《生物统计学》考试试卷(含答案)

生物信息学考试试卷修订稿

生物统计学考试题及答案

生物统计学试题及答案

生物信息学试题整理

生物统计学期末复习题

生物统计学考试试卷及答案

最新生物信息学考试复习

生物统计学期末考试试题A

生物统计学期末复习题库及答案

生物信息学期末考试重点

2019版国科大生物信息学期末考试复习题

《生物统计学-2019》复习题

生物统计学试题及答案

生物信息学试题