第七种碱基5fC在基因组中的分布
- 格式:doc
- 大小:21.00 KB
- 文档页数:3
第5章基因突变及其他变异一、本章总概念图:二、各节子概念图:5.1.1基因突变5.1.2 基因重组5.2 染色体变异5.3 人类遗传病三、基因突变、基因重组和染色体变异列表比较项目基因突变基因重组染色体变异适用范围生物种类所有生物(包括病毒)均可发生,具有普遍性自然状态下,只发生在真核生物的有性生殖过程中,细胞核遗传真核生物细胞增殖过程均可发生生殖无性生殖、有性生殖有性生殖无性生殖、有性生殖类型可分为自然突变和诱发突变,也可分为显性突变和隐性突变自由组合型、交叉互换型染色体结构的改变、染色体数目的变化发生时间有丝分裂间期和减数Ⅰ间期减数Ⅰ前期和减数Ⅰ后期细胞分裂期产生结果产生新的基因(产生了它的等位基因)、新的基因型、新的性状。
产生新的基因型,但不可以产生新的基因和新的性状。
不产生新的基因,但会引起基因数目或顺序变化。
镜检光镜下均无法检出,可根据是否有新性状或新性状组合确定光镜下可检出本质基因的分子结构发生改变,产生了新的基因,改变了基因的“质”,出现了新性状,但没有改变基因的“量”。
原有基因的重新组合,产生了新的基因型,使性状重新组合,但未改变基因的“质”和“量”。
染色体结构或数目发生改变,没有产生新的基因,基因的数量可发生改变条件外界条件剧变和内部因素的相互作用不同个体间的杂交,有性生殖过程中的减数分裂和受精作用存在染色体的真核生物特点普遍性、随机性、不定向性、低频率性、多害少利性原有基因的重新组合存在普遍性意义新基因产生的途径,生物变异的根本来源,也是生物进化的原材料是生物产生变异的来源之一,是生物进化的重要因素之一。
对生物的进化有一定的意义发生可能性可能性小,突变频率低非常普遍,产生的变异类型多可能性较小应用诱变育种杂交育种单倍体育种、多倍体育种生物多样性产生新的基因,丰富了基因文库产生配子种类多、组合方式多,受精卵多。
变异种类多实例果蝇的白眼、镰刀型细胞贫血症等豌豆杂交等无籽西瓜的培育等联系①三者均属于可遗传的变异,都为生物的进化提供了原材料;②基因突变产生新的基因,为进化提供了最初的原材料,是生物变异的根本来源;基因突变为基因重组提供大量可供自由组合的新基因,基因突变是基因重组的基础;③基因重组的变异频率高,为进化提供了广泛的选择材料,是形成生物多样性的重要原因之一;④基因重组和基因突变均产生新的基因型,可能产生新的表现型。
第二章生物的遗传与变异遗传、变异与遗传物质1.遗传:(1)概念:亲子间的相似性。
(2)性状:生物体形态结构、生理和行为等特征的统称。
(3)相对性状:同种生物同一性状的不同表现形式。
2.变异:(1)概念:亲子间及子代个体间的差异。
(2)类型:(3)意义:使生物更好地适应环境的变化,为生物的进化提供了可选择的原始材料。
(4)应用:人工选择育种、杂交育种和诱变育种。
3.遗传物质:(1)染色体。
①组成及特点:②细胞核、染色体、DNA和基因由大到小的关系(填出字母代表的名称):a.DNAb.细胞核c.染色体d.基因(2)基因:具有遗传效应的DNA片段。
(3)性状与基因和环境的关系:性状是基因和环境共同作用的结果。
(4)亲子代间的关系:子代同时具备了父母双亲的遗传物质,从而表现出遗传和变异现象。
1.豌豆的黄粒和豌豆的圆粒是一对相对性状。
( ×)2.基因控制生物的性状,基因就是DNA,DNA就是染色体。
( ×)3.从大花生中选择一粒饱满粒大的种子种下去所收获的种子一定是大的。
( ×)4.血友病患者伤口流血时不易凝固,此情况在他们的后代中还有可能出现,这是受基因控制的性状。
( √)由现象推断生物的遗传、变异1.种瓜得瓜,种豆得豆。
结论:描述了生物的遗传现象。
2.一母生九子,连母十个样。
结论:描述了生物的变异现象。
3.克隆羊多莉更像供核母羊。
结论:控制生物性状的遗传物质位于细胞核中。
遗传规律1.基因经精子或卵细胞的传递:(1)图示:(2)数量变化:项目亲代体细胞生殖细胞子代体细胞染色体成对成单成对DNA 成对成单成对基因成对成单成对数量(用N表示) 2N N 2N2.孟德尔遗传规律:(1)识别孟德尔的豌豆杂交实验和遗传图解示意图,并填空:(2)显性性状、隐性性状、显性基因和隐性基因:(3)基因与性状的关系及其遗传特点。
①显性性状:控制显性性状的基因组成不确定,可能是纯合的,也可能是杂合的,如DD或Dd。
第七讲原核生物的基因调控科学家把这个从DNA到蛋白质的过程称为基因表达(gene expression),对这个过程的调节就称为基因表达调控(gene regulation或gene control)。
要了解动、植物发展发育的规律、形态布局特征和生物学功能,就必需弄清楚基因表达调控的时间和空间概念,掌握了基因表达调控的奥秘,我们手中就有了一把揭示生物学微妙的金钥匙。
基因表达调控主要暗示在以下几个方面:①转录程度上的调控(transcriptional regulation);②mRNA加工成熟程度上的调控(differential processing of RNAtranscript);③翻译程度上的调控(differential translation of mRNA).原核生物中,营养状况(nutritionalstatus)和环境因素(environmental factor)对基因表达起着举足轻重的影响。
在真核生物尤其是高等真核生物中,激素程度(hormone level)和发育阶段(developmental stage)是基因表达调控的最主要手段,营养和环境因素的影响力大为下降。
二、基因表达调控的底子道理〔一〕基因表达的多级调控基因的布局活化、转录起始、转录后加工及转运、mRNA降解、翻译及翻译后加工及蛋白质降解等均为基因表达调控的控制点。
可见,基因表达调控是在多级程度长进行的复杂事件。
此中转录起始是基因表达的底子控制点。
四个底子的调控点:〔1〕基因布局的活化。
DNA表露碱基后RNA聚合酶才能有效结合。
活化状态的基因暗示为:1.对核酸酶敏感;2.结合有非组蛋白及修饰的组蛋白;3.低甲基化。
〔2〕转录起始。
最有效的调节环节,通过DNA元件与调控蛋白彼此作用来调控基因表达。
〔3〕转录后加工及转运。
RNA编纂、剪接、转运。
〔4〕翻译及翻译后加工。
翻译程度可通过特异的蛋白因子阻断mRNA 翻译翻译后对蛋白的加工、修饰也是底子调控环节。
第六、七章基因表达调控习题(引自网络,略有修订)一、单项选择题1.关于基因表达调控的说法错误..的是 A. 转录起始是调控基因表达的关键 B. 环境因素影响管家基因的表达 C. 在发育分化和适应环境上有重要意义 D. 表现为基因表达的时间特异性和空间特异性 E. 真核生物的基因表达调控较原核生物复杂的多2.下列哪项属于可调节基因 A. 组蛋白编码基因 B. 5S rRNA编码基因 C. 异柠檬酸脱氢酶编码基因 D. 肌动蛋白编码基因 E. 血红蛋白编码基因3.与α-酮戊二酸脱氢酶系协调表达的是 A. 肉毒碱脂酰转移酶I B. 柠檬酸合成酶 C. 丙酮酸羧化酶 D. 葡萄糖-6-磷酸酶 E. HMG-CoA合成酶4.乳糖操纵子中,能结合别位乳糖(诱导剂)的物质是 A. AraC B. cAMP C. 阻遏蛋白 D. 转录因子 E. CAP5.乳糖操纵子模型是在哪个环节上调节基因表达 A. 复制水平 B. 转录水平 C. 转录后水平 D. 翻译水平 E. 翻译后水平6.乳糖操纵子的调控方式是 A. CAP的正调控 B. 阻遏蛋白的负调控 C. 正、负调控机制不可能同时发挥作用 D. CAP拮抗阻遏蛋白的转录封闭作用 E. 阻遏作用解除时,仍需CAP加强转录活性7. 与分解代谢相关的操纵子模型中,存在分解代谢物阻遏现象,参与这一调控的主要作用因子是 A. 阻遏蛋白 B. AraC C. 衰减子D. cAMP-CAP复合物E. 诱导剂8. 原核细胞中,识别基因转录起始点的是 A. 阻遏蛋白 B. 转录激活蛋白 C. 基础转录因子D. 特异转录因子E. σ因子9. 使乳糖操纵子实现高表达的条件是 A. 乳糖存在,葡萄糖缺乏 B. 乳糖缺乏,葡萄糖存在 C. 乳糖和葡萄糖均存在 D. 乳糖存在 E. 葡萄糖存在10. 大肠杆菌可以采用哪种方式调控转录终止 A. 阻遏作用 B. 去阻遏作用 C. 反义控制 D. 衰减作用 E. 降低转录产物的稳定性11. 关于色氨酸操纵子错误..的描述是 A. 核蛋白体参与转录终止 B. 衰减子是关键的调控元件 C. 色氨酸不足时,转录提前终止 D. 转录与翻译偶联是其转录调控的分子基础 E. 色氨酸存在与否不影响先导mRNA的转录 12.下列哪种因素对原核生物的翻译没有..影响 A. microRNA B. 稀有密码子所占的比例 C. mRNA 的稳定性 D. 反义RNA E. 调节蛋白结合mRNA13. 真核生物基因表达调控的关键环节是① 染色质活化② 转录起始③ 转录后加工④ 翻译起始⑤ 翻译后加工 A. ① +② +③ B. ① +② +④ C. ① +② D. ② +③ E. ②14. 下列哪种染色质结构的变化不.利于基因表达 A. 组蛋白乙酰化 B. 核小体解聚 C. CpG岛甲基化 D. 基因扩增 E. 染色质结构松散,对DNA酶I敏感15. 下列哪项不.属于真核生物基因的顺式作用元件 A. 激素反应元件 B. 衰减子 C. 启动子 D. 沉默子 E. 增强子16. 与RNA聚合酶相识别和结合的DNA片段是 A. 增强子 B. 衰减子 C. 沉默子 D. 操纵子 E. 启动子17. 下列哪项不.参与调控真核细胞基因的特异性表达 A. 反应元件 B. 特异转录因子 C. 增强子 D. 基础转录因子 E. 沉默子 18. 与原核生物相比较,真核生物的基因表达调控包括多个层次,下列哪项不.是其调控复杂性特有的分子基础 A. 含有重复序列 B. 断裂基因 C. 转录与翻译分离 D. 细胞内被膜性结构分隔形成多个区域 E. 染色质结构 19. 能够与基础转录因子结合的是 A. 上游启动子元件 B. TATA box C. 增强子 D. 反应元件 E. Pribnow box 20. 有关基础转录因子的叙述,正确的是 A. 与非转录核心序列相结合 B. 决定基因表达的特异性 C. 其种类和数量在不同组织中差别很大 D. 辅助RNA聚合酶结合启动子 E. 在原核生物中的种类比真核生物少21. 不.属于特异转录因子的是 A. TF II D B. HSF C. AP1 D. 类固醇激素受体E. NF-κ B22. 关于特异转录因子的说法,正确的是 A. 调控管家基因的表达 B. 仅通过蛋白质-蛋白质相互作用进行调控 C. 仅通过DNA-蛋白质相互作用进行调控 D. 仅通过RNA-蛋白质相互作用进行调控 E. 起转录激活或者转录抑制作用23. 锌指结构可能存在于下列哪种物质中 A. 阻遏蛋白 B. RNA聚合酶 C. 转录因子 D. 端粒酶 E. 核酶 24. 下列哪种氨基酸在转录因子的转录激活结构域中含量丰富 A. Lys B. Arg C. Asp D. His E. Trp 25. 下列哪种因素不.会影响真核细胞中mRNA的稳定性 A. 5' 端帽子 B. siRNA C. poly A尾 D. 去稳定元件 E. miRNA26. 小干扰RNA调节基因表达的机制是 A. 封闭mRNA上的核蛋白体结合位点 B. 特异性降解靶mRNA C. 形成局部双链,抑制靶mRNA的模板活性 D. 使翻译出的蛋白质进入泛素化降解途径E. 使翻译提早终止27. eIF-2对翻译起始具有重要的调控作用,下列哪项是它的活性形式 A. 磷酸化 B. 脱乙酰化 C. 乙酰化 D. 脱磷酸化 E. ADP-核糖基化28. 不.影响真核生物翻译起始的因素是 A. eIF B. 帽子结合蛋白 C. RNA编辑 D. mRNA 非翻译区的二级结构 E. miRNA29. 原核生物中,某种代谢途径相关的几种酶类往往通过何种机制进行协调表达 A. 顺反子 B. 操纵子 C. 转录因子 D. 衰减子 E. RNAi 30. 生物体在不同发育阶段,蛋白质的表达谱也相应变化,这主要取决于 A. 转录调控元件的差异 B. 翻译调控元件的差异 C. 基础转录因子的差异 D. 特异转录因子的差异 E. 翻译起始因子的差异 31. 原癌基因通常是 A. 管家基因 B. 可调节基因 C. 突变的基因 D. 表达增强的基因 E. 促进凋亡的基因32. 管家基因编码的产物不.包括 A. 细胞外生长因子 B. 电子传递链的成员 C. 细胞的主要结构蛋白 D. 转录因子 E. 血红蛋白33. 下列哪项不.是可调节基因的特点 A. 组织特异性 B. 阶段特异性 C. 时间特异性D. 空间特异性E. 组成性表达34. 关于操纵子的说法,正确的是 A. 几个串联的结构基因由一个启动子控制 B. 几个串联的结构基因分别由不同的启动子控制 C. 一个结构基因由不同的启动子控制 D. 转录生成单顺反子RNA E. 以正性调控为主35. 核蛋白体调控转录终止的典型例子是 A. 乳糖操纵子 B. 半乳糖操纵子 C. 阿拉伯糖操纵子 D. 色氨酸操纵子 E. 以上都不对36. 色氨酸操纵子的显著特点是 A. 阻遏作用 B. 诱导作用 C. 衰减作用 D. 分解物阻遏作用 E. 抗终止作用37. 关于色氨酸操纵子的调控,正确的说法是 A. 色氨酸存在时,仅生成前导mRNA B. 色氨酸不足时,转录提前终止 C. 是翻译水平的调控 D. 具有抗终止作用 E. 依赖ρ因子进行转录调控38. 细菌优先利用葡萄糖作为碳源,葡萄糖耗尽后才会诱导产生代谢其他糖的酶类,这种现象称为 A. 衰减作用 B. 阻遏作用 C. 诱导作用 D. 协调调节作用 E. 分解物阻遏作用39. 关于分解物阻遏的作用机制,说法正确的是 A. 葡萄糖缺乏时,cAMP浓度低B. 葡萄糖缺乏时,CAP浓度低C. 葡萄糖缺乏时,cAMP不能与CAP形成复合物D. 葡萄糖缺乏时,cAMP-CAP复合物浓度高E. 葡萄糖缺乏时,cAMP-CAP复合物失去DNA结合能力40.大肠杆菌的乳糖操纵子模型中,与操纵基因结合而调控转录的是 A. 阻遏蛋白B. RNA聚合酶C. 调节基因D. cAMP-CAPE. 启动子41.翻译终止阶段,新生多肽链的释放涉及哪种化学键的断裂 A. 肽键 B. 磷酸二酯键 C. 氢键 D. 疏水键 E. 酯键42.IPTG诱导乳糖操纵子表达的机制是 A. 使乳糖-阻遏蛋白复合物解离 B. 与阻遏蛋白结合,使之丧失DNA结合能力 C. 与乳糖竞争结合阻遏蛋白 D. 与RNA聚合酶结合,使之通过操纵序列 E. 变构修饰RNA聚合酶,提高其活性43.下列哪一项是真核生物可调节基因的表达调控特有的机制 A. 基础转录因子B. 衰减子C. RNA聚合酶D. 增强子E. 阻遏蛋白44.基础转录因子属于DNA结合蛋白,它们能够 A. 结合转录核心元件 B. 结合增强子 C. 结合5' 端非翻译区 D. 结合3' 端非翻译区 E. 结合内含子45.特异转录因子不.能够 A. 结合RNA聚合酶 B. 结合基础转录因子 C. 结合其他特异转录因子 D. 结合转录非核心元件 E. 结合沉默子46.基因特异性表达的根本机制是 A. 顺式作用元件的种类不同 B. RNA聚合酶活性的差异 C. 基础转录因子的质和量的差异 D. 特异转录因子的质和量的差异 E. 表达产物后加工过程的差异47.下列哪一类分子常具有亮氨酸拉链的结构特征 A. 生长因子 B. 酪氨酸蛋白激酶受体 C. G蛋白 D. 转录因子 E. 丝/苏氨酸蛋白激酶48.葡萄糖缺乏时,细菌中cAMP浓度升高,可以结合49.实验室常使用IPTG作为诱导剂,其作用是结合50.阿拉伯糖操纵子的主要调节因子是(48-50题选项)A. 阻遏蛋白 B. AraC C. 衰减子 D. CAP E. ρ因子51.色氨酸操纵子的调节作用依赖于52.原核基因表达调控的最基本环节是53.真核基因表达调控的最基本环节是(51-53题选项)A. 转录起始 B. 转录终止 C. 翻译起始 D. 翻译终止 E. mRNA 稳定性54.真核细胞中管家基因的转录需要55.真核细胞中可调节基因的转录主要取决于56.真核细胞中参与翻译起始复合物形成的是57.绿脓杆菌外毒素抑制真核细胞蛋白质合成的靶点是58.真核细胞中识别终止密码子的是(54-58题选项)A. eIF-2 B. 特异转录因子 C. EF-2 D. 基础转录因子 E. eRF59.色氨酸操纵子的转录调控依赖于60.乳糖缺乏时,乳糖操纵子不转录,这主要取决于61.葡萄糖缺乏时,乳糖操纵子转录,这主要取决于(59-61题选项)A. 阻遏蛋白 B. 转录因子 C. cAMP-CAP D. 终止因子 E. 核蛋白体62.人血红蛋白表达特异性的决定因素是63.小鼠异柠檬酸合成酶的表达需要哪一类蛋白质因子辅助64.大肠杆菌β-半乳糖苷酶表达的关键调控因素是(62-64题选项)A. 基础转录因子 B. 特异转录因子 C. 起始因子 D. 阻遏蛋白 E. ρ因子二、多项选择题65.管家基因的转录受哪些因素控制 A. 基础转录因子 B. 增强子 C. 特异转录因子 D. 启动子 E. 反应元件66.大肠杆菌乳糖操纵子中,属于调控元件的是 A. 操纵基因 B. 调节基因C. 启动子D. 阻遏蛋白E. CAP结合位点67.色氨酸操纵子模型中,哪些因素参与调控作用 A. 释放因子 B. 核蛋白体C. CAP复合物D. 阻遏蛋白E. 衰减子68.原核生物转录终止的调控机制涉及 A. RNA干扰 B. 分解物阻遏 C. ρ因子 D. 衰减 E. 抗终止69.真核生物的基因表达调控表现在 A. 转录水平 B. 翻译水平 C. 染色质水平D. 转录后加工E. 翻译后加工70.真核生物中,影响RNA聚合酶转录活性的因素包括 A. 启动子 B. 增强子 C. 基础转录因子 D. 衰减子 E. 特异转录因子71.真核生物基因表达的空间特异性的机制包括 A. 特异转录因子的种类不同 B. 同种特异转录因子的浓度不同 C. 特定组织的基因中存在组织特异性启动子 D. 特异转录因子的排列组合不同E. 增强子等调控元件在不同组织的基因中分布不同72.转录因子的DNA结合结构域包含哪些结构类型 A. 螺旋-片层-螺旋 B. 锌指C. 螺旋-转角-螺旋D. 亮氨酸拉链E. 螺旋-环-螺旋73.与siRNA相比较,miRNA的显著特点是 A. 单链 B. 在转录后水平发挥作用 C. 与靶mRNA碱基互补 D. 不降解靶mRNA E. 个别碱基与靶mRNA序列不完全匹配74.转录因子的作用机制包括 A. DNA-DNA相互作用 B. DNA-RNA相互作用C. DNA-蛋白质相互作用D. RNA-蛋白质相互作用E. 蛋白质-蛋白质相互作用75.真核生物的基因转录涉及哪些物质的相互作用 A. operator B. cis-acting element C. polysome D. trans-acting factor E. RNA polymerase76.在同一个体的不同组织中 A. 基因的表达谱不同 B. 基因组结构不同 C. 特异转录因子的种类不同 D. 存在的蛋白质的种类不同 E. 特异性启动子的种类不同77.真核生物独有的转录调控机制涉及 A. 启动子 B. 增强子 C. 转录因子 D. 组蛋白 E. SD序列78.生物对环境的适应性表现在 A. 基因变异 B. 合成不同种类的mRNA C. 合成不同种类的蛋白质 D. 产物的反馈抑制 E. 蛋白质活性的快速调节79.下列哪些情况对于真核生物的基因转录具有调控作用 A. 反式作用因子的磷酸化 B. 类固醇激素与胞内受体结合 C. 特定DNA序列的甲基化 D. 组蛋白的乙酰化 E. 蛋白质因子的羟基化80.管家基因的含义是 A. 在各组织细胞中都表达 B. 在特定的组织细胞中表达C. 在不同发育阶段都表达D. 在特定的发育阶段表达E. 表达程度在不同时空条件下差异显著81.关于特异转录因子的描述,正确的是 A. 在所有组织细胞中组成性表达 B. 在不同组织细胞中存在的种类不同 C. 在不同组织细胞中的浓度不同 D. 调控管家基因的转录 E. 是真核生物基因表达特异性的根源所在三、名词解释1.管家基因(housekeeping gene)2. 可调节基因(regulated gene)3. 顺式作用元件(cis-acting element)4. 反式作用因子(trans-acting factors)/转录因子(transcription factor, TF)5. 基础转录因子(basal/general transcription factor)6. 特异转录因子(special transcription factor)7. 操纵子(operon)8. 衰减(attenuation)9. 锌指(zinc finger)结构10. 亮氨酸拉链(leucine zipper)结构三、简答题(一)1.正调控和负调控的主要不同是什么?2.为什么操纵区和启动子是反式隐性、顺式显性的,而编码阻抑蛋白的基因既是反式显性又是顺式显性。
简答题第一章染色体与DNA:一、真核生物基因组特征1.真核基因组庞大,一般远大于原核生物的基因组。
2.真核基因组存在大量的重复序列。
3.真核基因组大部分为非编码序列,占整个基因组序列的90%以上,这是真核生物与原核生物的重要区别。
4.真核基因组的转录产物为单顺反子。
5.真核基因是断裂基因,有内含子结构。
6.真核基因组存在大量的顺式作用元件。
7.真核基因组中存在大量的DNA多态性。
8.真核基因组具有端粒结构。
二、原核生物基因组特征1结构简练:DNA中的大部分结构是用来编码蛋白质2存在转录单元:在原核生物中功能相关的蛋白的基因往往集中在基因组的一个或几个特定部位如大肠杆菌乳糖操纵子3有重叠基因:两种或两种以上的基因公用部分DNA序列,则这些基因互称重叠基因三、真核生物DNA复制特点1、真核生物每条染色体上有多个复制起点,多复制子(约150bp左右);2、复制叉移动的速度较慢(约50bp/秒),仅为原核生物的1/10。
3、真核生物染色体在全部复制完之前,各个起始点不再重新开始DNA复制;真核生物快速生长时,往往采用更多的复制起点。
4、真核生物有多种DNA聚合酶。
5、真核生物DNA复制过程中的引物及冈崎片段的长度均小于原核生物。
(真核冈崎片段长约100-200bp,原核冈崎片段长约1000-2000bp。
)6、真核生物线性DNA末端具有端粒结构四、原核和真核生物DNA的复制特点比较①复制起点(ori):原核一个,真核多个;②复制子:原核一个,真核多个;③复制子长度:原核长;真核短;④复制叉:原核多个;真核多个;⑤复制移动速度:原核较快;真核较慢;⑥真核生物染色体在全部完成复制前,各起始点的DNA复制不能再开始。
而在快速生长的原核生物中,复制起点上可以连续开始新的DNA复制。
⑦原核生物染色体的复制与细胞分裂同步,可以多次复制;真核生物染色体的复制发生在S期,是细胞分类的特定时期,而且仅此一次。
五、大肠杆菌复制体完成复制的过程1双链的解开2 RNA引物的合成3 DNA链的延伸4切除RNA引物,填补缺口,连接相邻的DNA片段六、P-转座子特征1.当p转座子在转座酶的催化下,会导致不育。
第七章遗传物质的分子学基础第一节DNA作为主要遗传物质的证据⏹基因存在于染色体上⏹染色体= 27%DNA+ 6%RNA+ 66%蛋白质⏹此外,还含有少量的拟脂与无机物质。
⏹⏹20世纪40年代以来,由于微生物遗传学的发展,加上生物化学、生物物理学以及许多新技术不断被引入遗传学,促成了一个崭新的领域⏹——分子遗传学的诞生和发展。
⏹分子遗传学已拥有大量直接和间接的证据,说明DNA是主要的遗传物质,而在缺乏DNA的某些病毒中,RNA就是遗传物质。
一、DNA作为主要遗传物质的间接证⏹1、大部分DNA存在于染色体上.而RNA和蛋白质在细胞质内也很多,但成分并不稳定。
⏹2、DNA含量是恒定性每个物种不同组织的细胞不论其大小和功能如何,它们的DNA含量是恒定的,而且精子或卵子中的DNA含量正好是体细胞的一半;而细胞内的RNA和蛋白质的量在不同细胞间变化很大。
⏹3、多倍体DNA含量增加多倍体系列的一些物种,其细胞中DNA的含量随染色体倍数的增加,也呈现倍数性的递增。
⏹4、DNA在代谢上比较稳定细胞内蛋白质和RNA分子在迅速形成的同时,又不断分解。
而DNA分子则不同,原子一旦被DNA分子所摄取,则在细胞保持健全生长的情况下,保持稳定,不会离开DNA。
⏹5、用不同波长的紫外线诱发各种生物突变时,其最有效的波长均为260nm。
这与DNA所吸收的紫外线光谱是一致的,亦即在260nm处吸收最多。
这证明基因突变是与DNA分子的变异密切相关的。
⏹虽然上述间接证据有力地说明DNA是遗传物质,但并不能直接证明之。
二、DNA作为主要遗传物质的直接证据(一)细菌的转化⏹肺炎双球菌(Streptococcuspneumoniae)有两种不同的类型:⏹光滑型(S型) 被一层多糖类的荚膜所保护,具有毒性,在⏹培养基上形成光滑的菌落。
⏹粗糙型(R型) 没有荚膜和毒性,在培养基上形成粗糙的⏹菌落。
⏹在S 型和R型内还可以按血清免疫反应的不同,分成许多抗原型,常用IR、ⅡR和IS、ⅡS、ⅢS等加以区别。
第一章绪论无第二章遗传的细胞学基础1.常染色质:间期核内纤维折叠盘曲程度小、分散度大、能活跃地进行转录的染色质。
2.异染色质:间期核内纤维折叠盘曲紧密、呈凝聚状态,一般无转录活性的染色质,又分为结构异染色质和兼性异染色质两大类。
3.兼性异染色质:是在特定细胞的某一发育阶段由原来的常染色质失去转录活性,转变成凝缩状态的异染色质,二者的转化可能与基因的表达调控有关。
4.Lyon假说:(1)雌性哺乳动物体细胞内仅有一条X染色体有活性,其他的X染色体在间期细胞核中螺旋化而呈异固缩状态的X染色质,在遗传上失去活性。
(2)失活发生在胚胎发育的早期(人胚第16天);在此之前所有体细胞中的X染色体都具有活性。
(3)X染色体的失活是随机的,但是是恒定的。
5.剂量补偿:由于正常女性体细胞中的1条X染色体发生了异固缩,失去了转录活性,这样就保证了男女性个体X染色体上的基因产物在数量上基本一致,这称为X染色体的剂量补偿。
第三章遗传的分子基础1.外显子和内含子:真核生物的基因为断裂基因,即结构基因是不连续排列的,中间被不编码的插入序列隔开,编码序列称为外显子,编码序列中间的插入序列称为内含子。
2.单一序列和高度重复序列:单一序列是在一个基因组中只出现一次或少数几次,大多数编码蛋白质和酶类的基因即结构基因为单一序列。
重复序列是指在基因组中有很多拷贝的DNA序列,有些重复序列与染色体的结构有关。
3.基因突变:是指基因在结构上发生碱基对组成或排列顺序的改变。
4.转换和颠换:转换是指一个嘌呤被另一个嘌呤所取代,或是一个嘧啶被另一个嘧啶所取代。
颠换指嘌呤取代嘧啶,或嘧啶取代嘌呤。
5.同义突变:是指碱基替换使某一密码子发生改变,但改变前后的密码子都编码同一氨基酸,实质上并不发生突变效应。
6.错义突变:是指碱基替换导致改变后的密码子编码另一种氨基酸,结果使多肽链氨基酸种类和顺序发生改变,产生异常的蛋白质分子。
7.无义突变:是指碱基替换使原来为某一个氨基酸编码的密码子变成终止密码子,导致多肽链合成提前终止。
高通量测序常用名词汇总一代测序技术:即传统的Sanger测序法,Sanger法是根据核苷酸在待定序列模板上的引物点开始,随机在某一个特定的碱基处终止,并且在每个碱基后面进行荧光标记,产生以A、T、C、G结束的四组不同长度的一系列核苷酸,每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸dNTP,并混入限量的一种不同的双脱氧核苷三磷酸ddNTP;由于ddNTP缺乏延伸所需要的3-OH 基团,使延长的寡聚核苷酸选择性地在G、A、T 或C处终止,使反应得到一组长几百至几千碱基的链终止产物;它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,通过检测得到DNA碱基序列;二代测序技术:next generation sequencingNGS又称为高通量测序技术,与传统测序相比,二代测序技术可以一次对几十万到几百万条核酸分子同时进行序列测定,从而使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序Deep sequencing;NGS主要的平台有Roche454 & 454+,IlluminaHiSeq 2000/2500、GA IIx、MiSeq,ABI SOLiD等;基因:Gene,是遗传的物质基础,是DNA或RNA分子上具有遗传信息的特定核苷酸序列;基因通过复制把遗传信息传递给下一代,使后代出现与亲代相似的性状;DNA:Deoxyribonucleic acid,脱氧核糖核酸,一个脱氧核苷酸分子由三部分组成:含氮碱基、脱氧核糖、磷酸;脱氧核糖核酸通过3',5'-磷酸二酯键按一定的顺序彼此相连构成长链,即DNA链,DNA链上特定的核苷酸序列包含有生物的遗传信息,是绝大部分生物遗传信息的载体;RNA:Ribonucleic Acid,,核糖核酸,一个核糖核苷酸分子由碱基,核糖和磷酸构成;核糖核苷酸经磷酯键缩合而成长链状分子称之为RNA链;RNA是存在于生物细胞以及部分病毒、类病毒中的遗传信息载体;不同种类的RNA链长不同,行使各式各样的生物功能,如参与蛋白质生物合成的RNA有信使RNA、转移RNA和核糖体RNA等;16S rDNA:"S"是沉降系数,是反映生物大分子在离心场中向下沉降速度的一个指标,值越高,说明分子越大;rDNAribosome DNA指的是原核生物基因组中编码核糖体RNArRNA分子对应的DNA序列,16S rDNA 是原核生物编码核糖体小亚基16S rRNA的基因;细菌rRNA核糖体RNA按沉降系数分为3种,分别为5S、16S和23S rRNA;16S rDNA是细菌染色体上编码16S rRNA相对应的DNA序列,存在于所有细菌染色体基因中;16S rRNA 普遍存在于原核生物中;16S rRNA 分子,其大小约1540bp,既含有高度保守的序列区域,又有中度保守和高度变化的序列区域,其可变区序列因细菌不同而异,恒定区序列基本保守,所以可利用恒定区序列设计引物,将16S rDNA片段扩增出来,通过高通量测序利用可变区序列的差异来对不同菌属、菌种的细菌进行分类鉴定;cDNA:complementary DNA,互补脱氧核糖核酸,与RNA链互补的单链DNA,以RNA为模板,在反转录酶的作用下所合成的DNA;Small RNA:生物体内一类高度保守的重要的功能分子,其大小在18-30nt,包括microRNA、siRNA、snRNA、snoRNA和piRNApiwi-interacting RNA等,它的主要功能是诱导基因沉默,调控细胞生长、发育、基因转录和翻译等生物学过程;以miRNA为例介绍它们的功能:miRNA 与RNA诱导沉默复合体RNA induced silencing complex, RISC结合,并将此复合体与其互补的mRNA序列结合,根据靶序列与miRNA的互补程度,从而导致靶序列降解或干扰靶序列蛋白质的翻译过程;SD 区域:Segment duplication,串联重复是由序列相近的一些 DNA 片段串联组成;串联重复在人类基因多样性的灵长类基因中发挥重要作用;Genotype and phenotype:基因型与表型,基因型是指某一生物个体全部基因组合的总称;表型,又称性状,是基因型和环境共同作用的结果;基因组:Genome,单倍体细胞核、细胞器线粒体、叶绿体或病毒粒子所含的全部DNA分子或RNA分子;全基因组de novo测序:又称从头测序,它不依赖于任何现有的序列资料,而直接对某个物种的基因组进行测序,然后利用生物信息学分析手段对序列进行拼接、组装,从而获得该物种的基因组序列图谱;全基因组重测序:对已有参考序列Reference Sequence物种的不同个体进行基因组测序,并以此为基础进行个体或群体水平的遗传差异性分析;全基因组重测序能够发现大量的单核苷酸多态性位点SNP、拷贝数变异Copy Number Variation,CNV、插入缺失InDel,Insertion/Deletion、结构变异Structure Variation,SV等变异类型,以准确快速的方法将单个参考基因组信息上升为群体遗传特征;转录组:Transcriptome,是指特定生长阶段某组织或细胞内所有转录产物的集合;狭义上指所有mRNA的集合;转录组测序:对某组织在某一功能状态下所能转录出来的所有RNA进行测序,获得特定状态下的该物种的几乎所有转录本序列信息;通常转录组测序是指对mRNA进行测序获得相关序列的过程;其根据所研究物种是否有参考基因组序列分为转录组de novo测序无参考基因组序列和转录组重测序有参考基因组序列;外显子组:Exome,人类基因组全部外显子区域的集合称为外显子组,是基因中重要的编码蛋白的部分,并涵盖了与个体表型相关的大部分的功能性变异;外显子组测序:是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法;外显子测序相对于基因组重测序成本较低,对研究已知基因的SNP、InDel 等具有较大的优势;目标区域测序:应用相关试剂盒对基因组上感兴趣的目标区域进行捕获富集后进行大规模测序,一般需要根据目标区域专门定制捕获芯片;宏基因组:Metagenome,指特定生活环境中全部微小生物遗传物质的总和;它包含了可培养的和未可培养的微生物的基因;目前主要指环境样品中的细菌和真菌的基因组总和;宏基因组16S rRNA测序:可以对特定环境下的细菌和古细菌群体的微生物种类和风度进行有效的鉴定;对不同地点、不同条件下的多个样本16S rRNA的PCR产物平行测序,可以比较不同样本间的微生物组成及成分差异,进而阐明物种丰度、种群结果等生态学信息;表观遗传学:Epigenetics,是指在基因组DNA序列没有改变的情况下,基因的表达调控和性状发生了可遗传的变化;表观遗传的现象很多,已知的有DNA甲基化DNA methylation,基因组印记genomic impriting,母体效应maternal effects,基因沉默gene silencing,核仁显性,休眠转座子激活和RNA编辑RNA editing等;全基因组甲基化测序:DNA 甲基化是指在 DNA 甲基化转移酶的作用下,在基因组 CpG 二核苷酸的胞嘧啶5'碳位共价键结合一个甲基基团;DNA 甲基化已经成为表观遗传学和表观基因组学的重要研究内容;甲基化是基因表达的主要调控方式之一,研究染色体DNA甲基化情况是了解基因调控的重要手段;对已经有参考基因组的物种的基因组DNA用标准亚硫酸氢盐Bisulfite处理后,未甲基化的胞嘧啶C会脱氨基形成尿嘧啶U,经PCR扩增,U替换为胸腺嘧啶T,而发生甲基化的胞嘧啶C保持不变;将处理组与参考基因组序列进行比对,可发现甲基化位点并对甲基化情况进行定量分析的方法叫做全基因组甲基化测序;ChIp-Seq:Chromatin Immunoprecipitation sequencing,即染色质免疫共沉淀-测序技术,即通过染色质免疫共沉淀技术特异性地富集目的蛋白结合的DNA片段;对富集得到的DNA片段进行纯化与文库构建,然后进行高通量测序,从而得到全基因组范围内可以与目的蛋白相互作用的DNA片段的方法叫做ChIP-Seq;数字表达谱:Digital Gene Expression Profile,利用新一代高通量测序技术和高性能计算分析技术,能够全面、经济、快速地检测某一物种特定组织在特定状态下的基因表达情况,即运用特定的酶对mRNA距polyA tail 21-25nt的位置进行酶切,所获得的带polyA尾的序列Tag通过高通量测序,该tag被测得的次数即是对应基因的表达值;数字基因表达谱已被广泛应用于基础科学研究、医学研究和药物研发等领域;特点是经济,但获得的数据量有限;若想获得转录本的更多信息的话,一般都采用转录组测序的方法来测序;SBS:sequencing by synthesis,边合成边测序反应,是指在DNA聚合酶的作用下延伸碱基所进行的测序;Run:指高通量测序平台单次上机测序反应;图1. Flow Cell结构示意图Lane:也叫channel,单泳道,每条泳道包含2列column,每列分布有多个小区tile,如图1;不同的测序平台Flow Cell中所含的Lane不一样,如HiSeq 2000是2个flow cell,每个flow cell中含有8个lane;HiSeq 2500是包含2个mini flow cell快速运行模式和2个high output flow cell,两个模式不能同时运行,其中每个mini flow cell包含2个lane,每个high output flow cell中包含8个lane;Miseq系统的flow cell仅含有1个lane; Tile:小区,每条Lane中有2列tile,合计120个小区;每个小区上分布数目繁多的簇结合位点,如图1;Cluster:簇,在Illumina测序平台中会采用桥式PCR方式生产DNA簇,每个DNA簇才能产生亮度达到CCD可以分辨的荧光点;Index:标签,在Illumina平台的多重测序Multiplexed Sequencing过程中会使用Index 来区分样品,并在常规测序完成后,针对Index部分额外进行7个循环的测序,通过Index的识别,可以在1条Lane中区分12种不同的样品;Barcode:与Index同义,多指在Roche GS FLX 454测序平台的16S PCR产物的测序过程中接头序列所包含的的用来区分不同样本的序列;PF%:PF%是指符合测序质量标准的簇的百分比,与测序的通量相关联;Fasta:一种序列存储格式;一个序列文件若以FASTA格式存储,则每一条序列的第一行以“>”开头,而跟随“>”的是序列的ID号即唯一的标识符及对该序列的描述信息;第二行开始是序列内容,序列短于61nt的,则一行排列完;序列长于61nt的,则每行存储61nt,最后剩下小于61nt的,在最后一行排列完;第二条序列另起一行,仍然由“>”和序列的ID号开始,以此类推;Fastq:Fastq是Solexa测序技术中一种反映测序序列的碱基质量的文件格式;第一行以“”符号开头,后面紧跟一个序列的描述信息;第二行是该序列的内容;第三行以“+”符号开头,后面可以是该序列的描述信息,也可省略;而第四行是第二行中的序列内容每个碱基所对应的测序质量值;Read:高通量测序平台产生的序列标签就称为 reads;基因组组装:进行基因组或转录组de novo测序时,物种基因组经构建不同的文库测序所得的片段需经过生物信息学手段对其进行整理拼接,并通过一定的标准如N50对后续组装结果进行质量评估等,最终获得高准确度的基因组序列的过程;基因组测序深度:测序得到的总碱基数与待测基因组大小的比值;如测一个物种的全基因组的重测序,基因组大小约为5G,测序获得100G的数据量,则测序深度为20×;基因组覆盖率:指测序获得的序列占整个基因组的比例;由于基因组中的高GC、重复序列等复杂结构的存在,测序最终拼接组装获得的序列往往无法覆盖有所的区域,这部分没有获得的区域就称为Gap;例如一个细菌基因组测序,覆盖率是98%,那么还有2%的序列区域是没有通过测序获得的;Contig:在de novo测序中拼接软件基于 reads 之间的 overlap 区,拼接获得的中间没有gap的序列称为 Contig重叠群;Scaffold:基因组 de novo 测序,通过 reads 拼接获得 Contigs 后,往往还需要构建 454 Paired-end 库或 Illumina Mate-pair 库,以获得一定大小片段如 3Kb、8Kb、10Kb、20Kb 两端的序列;基于这些序列,可以确定一些Contig 之间的顺序关系,这些先后顺序已知的Contigs 组成 Scaffold;Contig N50:Reads拼接后会获得一些不同长度的Contigs;将所有的Contig长度相加,能获得一个Contig总长度;然后将所有的Contigs按照从长到短进行排序,如获得Contig 1,Contig 2,Contig 3……Contig 25;将Contig按照这个顺序依次相加,当相加的长度达到Contig总长度的一半时,最后一个加上的Contig长度即为Contig N50;举例:Contig 1+Contig 2+ Contig 3 +Contig 4=Contig总长度1/2时,Contig 4的长度即为Contig N50;Contig N50可以作为基因组拼接的结果好坏的一个判断标准;Scaffold N50:Scaffold N50与Contig N50的定义类似;Contigs拼接组装获得一些不同长度的Scaffolds;将所有的Scaffold长度相加,能获得一个Scaffold总长度;然后将所有的Scaffolds按照从长到短进行排序,如获得Scaffold 1,Scaffold 2,Scaffold 3……Scaffold 25;将Scaffold按照这个顺序依次相加,当相加的长度达到Scaffold总长度的一半时,最后一个加上的Scaffold长度即为Scaffold N50;举例:Scaffold 1+Scaffold 2+ Scaffold 3 +Scaffold 4 +Scaffold 5=Scaffold总长度1/2时,Scaffold 5的长度即为Scaffold N50;Scaffold N50可以作为基因组拼接的结果好坏的一个判断标准;Isotig:指在转录组de novo测序时,用454平台测序完成后组装出的结果,一个isotig可视为一个转录本;Isogroup:指转录组de novo测序中,用454平台测序完成后组装出的结果获得的可聚类到同一个基因的转录本群;GC%:GC含量,全基因组范围内或在特定基因组序列内的4种碱基中,鸟嘌呤和胞嘧啶所占的比率;SNP:single nucleotide polymorphism,单核苷酸多态性,个体间基因组DNA序列同一位置单个核苷酸变异替代、插入或缺失所引起的多态性;不同物种个体基因组 DNA 序列同一位置上的单个核苷酸存在差别的现象;有这种差别的基因座、DNA序列等可作为基因组作图的标志;SNP 在CG序列上出现最为频繁,而且多是C转换为T ,原因是CG中的C 常为甲基化的,自发地脱氨后即成为胸腺嘧啶;一般而言,SNP 是指变异频率大于 1 %的单核苷酸变异,主要用于高危群体的发现、疾病相关基因的鉴定、药物的设计和测试以及生物学的基础研究等;InDel:Insertion/Deletion,插入/缺失,在基因组重测序进行mapping时,进行容Gap的比对并检测可信的Short InDel,如基因组上小片段>50bp的插入或缺失;在检测过程中,Gap 的长度为1~5个碱基;CNV:copy number variation,基因组拷贝数变异,是基因组变异的一种形式,通常使基因组中大片段的DNA形成非正常的拷贝数量;如人类正常染色体拷贝数是2,有些染色体区域拷贝数变成1或3,这样,该区域发生拷贝数缺失或增加,位于该区域内的基因表达量也会受到影响;如果把一条染色体分成A-B-C-D四个区域,则A-B-C-C-D/A-C-B-C-D/A-C-C-B-C-D/A-B-D 分别发生了C区域的扩增及缺失,扩增的位置可以是连续扩增如 A-B-C-C-D 也可以是在其他位置的扩增,如A-C-B-C-D;SV:structure variation,基因组结构变异,染色体结构变异是指在染色体上发生了大片段的变异;主要包括染色体大片段的插入和缺失引起 CNV 的变化,染色体内部的某块区域发生重复复制、翻转颠换、易位、两条染色体之间发生重组inter-chromosome trans-location 等;基因表达差异:是指某一物种或特定细胞在特定时期/功能状态下,多样本间不同基因在mRNA水平上表达量的差异,可通过RPKM/FPKM值来体现;RPKM:Reads Per Kilobase per Million mapped reads Mortazavi etal., 2008,是指每 1 百万个map 上的reads 中map 到外显子的每1K 个碱基上的reads 个数;计算公式四RPKM=106C/NL/103,其中C为唯一比对到目的基因的reads数;N为唯一比对到参考基因的总reads数,L是目的基因编码区的碱基数;RPKM法可以消除基因长度、数据量之间的差异进行计算基因表达量;可变剪切:alternative splicing大多数真核基因转录产生的mRNA前体是按一种方式剪接产生出一种mRNA,因而只产生一种蛋白质;但有些基因产生的mRNA前体可按不同的方式剪接,产生出两种或更多种mRNA,即可变剪接;基因融合:Gene fusion,将基因组位置不同的两个或多个基因中的一部分或全部整合到一起,形成新的基因,称作融合基因或嵌合体基因,该基因有可能翻译出融合或嵌合体蛋白;基因家族分析:通过进行BLASTN/ HMM比对等查找基因归属的基因家族并添加相关功能注释;基因组注释:Genome annotation是利用生物信息学方法和工具,对基因组所有基因的生物学功能进行高通量注释,是当前功能基因组学研究的一个热点;基因组注释的研究内容包括基因识别和基因功能注释两个方面;基因识别的核心是确定全基因组序列中所有基因的确切位置;常见的基因组注释有GO注释、pathway分析;GO注释:gene ontology是指对基因功能的注解;GO强调基因产物在细胞中的功能;GO不能反映此基因的表达情况,即是否在特定细胞中、特定组织中、特定发育阶段或与某种疾病相关,但GO支持其他的OBOopen biology ontologies成员成立其他类型的本体论数据库如发育本体学、蛋白组本体学、基因芯片本体学等Pathway注释:是指对功能基因参与的信号通路等进行分析注释;甲基化率:是指在甲基化测序中,发生甲基化的胞嘧啶占所有胞嘧啶的比率;CpG岛:CpG island 是指DNA上一个区域,此区域含有大量相联的胞嘧啶C、鸟嘌呤G,以及使两者相连的磷酸酯键p;基因组中长度为300~3000 bp的富含CpG二核苷酸的一些区域,主要存在于基因的5’区域;启动子区中CpG岛的未甲基化状态是基因转录所必需的,而CpG序列中的C的甲基化可导致基因转录被抑制;Q20,Q30:基因的二代测序中,每测一个碱基会给出一个相应的质量值,这个质量值是衡量测序准确度的;碱基的质量值13,错误率为5%,20的错误率为1%,30的错误率为0.1%;行业中Q20与Q30则表示质量值≧20或30的碱基所占百分比;例如一共测了1G的数据量,其中有0.9G的碱基质量值大于或等于20,那么Q20则为90%;Q20值是指的测序过程碱基识别Base Calling过程中,对所识别的碱基给出的错误概率;质量值是Q20,则错误识别的概率是1%,即错误率1%,或者正确率是99%;质量值是Q30,则错误识别的概率是0.1%,即错误率0.1%,或者正确率是99.9%;质量值是Q40,则错误识别的概率是0.01%,即错误率0.01%,或者正确率是99.99%;全基因组测序全基因组测序-技术路线提取基因组DNA,然后随机打断,电泳回收所需长度的DNA片段0.2~5Kb,加上接头, 进行基因簇cluster制备或电子扩增E-PCR,最后利用Paired-EndSolexa或者Mate-PairSOLiD的方法对插入片段进行测序;然后对测得的序列组装成Contig,通过Paired-End的距离可进一步组装成Scaffold,进而可组装成染色体等;组装效果与测序深度与覆盖度、测序质量等有关;常用的组装有:SOAPdenovo、Trimity、Abyss等;全基因组测序-原理双末端Paired-End测序原理测序深度Sequencing Depth:测序得到的碱基总量bp与基因组大小Genome的比值,它是评价测序量的指标之一;测序深度与基因组覆盖度之间是一个正相关的关系,测序带来的错误率或假阳性结果会随着测序深度的提升而下降;重测序的个体,如果采用的是Paired-End 或Mate-Pair方案,当测序深度在10~15X以上时,基因组覆盖度和测序错误率控制均得以保证;测序深度对基因组覆盖度和测序错误率的影响HOM:纯合体 HET:杂合体全基因组测序-分析流程1.数据量产出总碱基数量、Totally mapped reads、Uniquely mapped reads统计,测序深度分析;2.一致性序列组装与参考基因组序列Reference genome sequence的比对分析,利用贝叶斯统计模型检测出每个碱基位点的最大可能性基因型,并组装出该个体基因组的一致序列;3.SNP检测及在基因组中的分布提取全基因组中所有多态性位点,结合质量值、测序深度、重复性等因素作进一步的过滤筛选,最终得到可信度高的SNP数据集;并根据参考基因组序列对检测到的变异进行注释; 4.InDel检测及在基因组的分布在进行mapping的过程中,进行容Gap的比对并检测可信的Short InDel;在检测过程中,Gap 的长度为1~5个碱基;5.Structure Variation检测及在基因组中的分布目前SBC能够检测到的结构变异类型主要有:插入、缺失、复制、倒位、易位等;根据测序个体序列与参考基因组序列比对分析结果,检测全基因组水平的结构变异并对检测到的变异进进行注释;全基因组重测序生物信息学分析流程。
四川省成都市第七中学2023-2024学年度下学期高一生物期末模拟试卷第I卷(选择题)一、单选题(每题2分,共50分)1.如图是某人体内一条染色体发生变异的示意图(字母表示基因),下列说法错误的是()A.图示的变异类型为染色体结构变异中的缺失,会改变基因的数目B.上述变异与21三体综合征的变异类型不同,但都可在显微镜下观察到C.若上述变异发生在配子形成过程中,则该变异可能遗传给后代D.如图所示变异类型可为生物进化提供原材料,也能决定生物进化的方向2.人的多种生理生化过程都表现出一定的昼夜节律。
研究表明,下丘脑SCN细胞中PER 基因表达与此生理过程有关,其表达产物的浓度呈周期性变化,如图为相关过程。
据此判断,下列说法错误的是()A.垂体细胞也含有PER基因,图2过程的原料为核糖核苷酸B.PER基因的表达过程存在反馈调节C.图3中核糖体沿着mRNA从右往左移动D.由图3可知,决定“天”氨基酸的密码子为GAC3.生殖隔离可分为两大类:受精前的生殖隔离和受精后的生殖隔离,前者包括生态隔离、季节隔离、行为隔离等,后者包括杂种不活、杂种不育、杂种败育等。
下列相关叙述错误的是()A.体虱和头虱因寄生场所不同,通过基因突变产生不同的适应性为生态隔离B.大西洋舞鱼的产卵季节不同,季节隔离导致不同水域的种群形成不同物种C.树棉和草棉可杂交产生健壮的F1,但是F2十分少见,说明两者的杂种不育D.各种隔离机制在两个物种间不一定同时发生,可能存在两种或以上的生殖隔离4.导蜜鸟在树上发现野蜂的蜂巢后会立即扇动翅膀,飞出特殊的路线,并发出“嗒嗒”的声响,引起另一种动物蜜獾的注意,蜜獾会爬上树赶走野蜂,取食花蜜,导蜜鸟等蜜獾走后,再去取食蜂蜡。
下列说法错误的是()A.导蜜鸟向蜜獾传递的“嗒嗒”的声响属于物理信息B.导蜜鸟飞出特殊的路线与孔雀开屏属于同一种信息传递方式C.生物生命活动的正常进行离不开信息传递,且信息传递都是双向的D.导蜜鸟和蜜獾共同合作取食的行为是生物间协同进化的结果5.中国首创的人造麦类新作物八倍体小黑麦,由于具有品质佳、抗逆性强和抗病害等特点,在生产上有广阔的应用前景。
初中生物•人教版•八年级下册一一本章检测本章检测一、选择题(每小题2分,共50分)1.(2021安徽芜湖期中)下列属于遗传现象的是()A•—树结果,酸甜各异B.种瓜得瓜,种豆得豆C.一猪生九仔,连母十个样D.父母手指正常,所生儿子出现多指的现象答案BA体现了生物的子代个体之间在性状上的差异,C体现了亲子间及子代个体之间的差异,D体现了亲子间的差异,都属于变异。
2.(2021江西南昌南昌期中)生物的性状就是()A.生物的形态结构特征B.生物的生理特性C.生物先天的行为方式D.前三项都对答案D生物体的形态结构、生理特性和行为方式等统称为性状。
3.(2021黑龙江龙东地区中考)下列各组性状中,属于相对性状的是()A.果蝇的红眼与白眼B.玉米的高茎与小麦的矮茎C.豌豆的绿粒与圆粒D.狗的黑毛与卷毛答案A玉米和小麦是两种生物;豌豆的绿粒和圆粒、狗的黑毛和卷毛,分别都是两种性状,因此都不属于相对性状,B、C、D错误。
4.(2021广东梅州大埔实验学校段考)指纹解锁是生物识别技术应用的一个实例。
研究显示,即使是同卵双胞胎,其指纹也只是相似而非完全相同。
以下有关说法错误的是()A.指纹是人体的一种性状B.指纹的特征因人而异C.指纹的形成主要由基因控制D.指纹的形成不受环境影响答案D指纹的形成虽然主要受到遗传物质的影响,但是也受环境因素的影响。
5.(2021广西钦州四中第五周周测)科学家将鱼的抗冻蛋白基因转入番茄中,使番茄的耐寒能力得到提高。
下列相关叙述正确的是()①运用的是发酵技术②运用的是转基因技术③可以说明生物的性状是由基因控制的④可以说明基因主要存在于染色体上A.①③B.②③C.①④D.②④答案B“科学家将鱼的抗冻蛋白基因转入番茄中,使番茄的耐寒能力得到提高”,可以说明生物的性状是由基因控制的,运用的是转基因技术。
6.(2021江西南昌南昌期中)科学家成功地把人的抗病毒干扰素基因植入烟草细胞中的DNA分子上,使烟草获得了抗病毒的能力。
安徽省中职五校联盟2024届高三第七次联考农林牧渔类(种植)专业试卷(本卷满分200分,考试时间150分钟)第一部分化学(40分)可能用到的相对原子质量:H一1C-120一16Ca一40一、单项选择题(在下列各题选项中选出最符合题意的一项,将代表该选项的字母填在相应的括号内。
每小题2分,共14分)1.下列原子中,原子半径最小的是( )。
A.MgB.SiC.ND.O2.下列氧化还原反应发生在同种元素之间的是( )。
A.Zn+2HC1=ZnCl2+H2 ↑B.2H2S+SO2=3S↓+2H2OC.Cl2+2KBr=Br2+2KClD.2Na++2H2O=2NaOH+H2↑3.下列物质中所含化学键的类型只有离子键的是( )。
A.CaCl2B.Na2 O2C.HNO3D.KOH4.不能用氯气直接反应制得的氯化物是( )。
A.HCIB.FeCl2C.CuCl2D.MgCl25.下列物质的水溶液呈碱性的是( )。
A.Na2SO4B.CH3COONaC.SO3D.NH4CI6.下列离子方程式中,书写不正确的是()A.氢氧化钠溶液中加入盐酸:H++OH-=H2OB.硝酸银溶液中加人溴化钠溶液:Ag十Br=AgBr↓C纯碱溶液中加人稀硫酸:Na2C03+2H+=2Na++H20+C02↑D.硫酸钠溶液中加人氯化钡溶液:Ba2++SO42-=BaSO4↓7.下列说法中,正确的是( )。
A.分子内含有苯环和羟基的化合物一定是酚类B类和酚类具有相同的官能团,因而具有相同的化学性质C.苯酚水溶液的酸性比碳酸弱D.含有羟基的化合物一定是醇类二、多项选择题(每小题至少有两个正确选项,多选、错选、不选不得分,少选的情况下每选对一项得1分,全选对得3分,共6分)8.下列物质可发生银镜反应的有()。
A.乙醛B.甲酸C.乙醇D.乙酸乙酯9.下列有关元素、物质的性质比较,正确的有()A .非金属性:F > CIB .金属性:Al > NaC .酸性:HNO3>H3PO4D .热稳定性:H2O>H2S三、填空题(每空1分,共4分)10.黑火药的反应方程式是S +2KNO3+3C=K2S+N2↑+3CO2个,该反应中,还原剂是。
第一章蛋白质氨基酸分类1、非极性脂肪族氨基酸Gly 甘氨酸Ala 丙氨酸Val 缬氨酸Leu 亮氨酸Ile 异亮氨酸Pro 脯氨酸2、极性中性氨基酸Ser 丝氨酸Cys 半胱氨酸Met 蛋氨酸Asn 天冬酰胺Gln 谷氨酰胺Thr 苏氨酸3、芳香族氨基酸Phe 苯丙氨酸Trp 色氨酸Tyr 酪氨酸4、酸性氨基酸Asp 天冬氨酸Glu 谷氨酸5、碱性氨基酸Lys 赖氨酸Arg 精氨酸His 组氨酸Hb 血红蛋白Mb 肌红蛋白PrP 阮病毒蛋白PI 等电点CD 圆二色光谱NMR 核磁共振技术第二章核酸cAMP 环腺苷酸HGP 人类基因组计划hnRNA 不均一核RNAm7GpppN 7-甲基鸟嘌呤-三磷酸核苷CBP 帽结合蛋白PABP poly(A)结合蛋白ORF 开放阅读框DHU 双氢尿嘧啶ψ假尿嘧啶核苷m G,m A 甲基化嘌呤snmRNA 非mRNA小RNAsnRNA 核内小RNAsnoRNA 核仁小RNAscRNA 胞质小RNAsiRNA 小片段干扰RNA第三章酶NAD+尼克酰胺腺嘌呤二核苷酸,辅酶I NADP+尼克酰胺腺嘌呤二核苷酸磷酸,辅酶IIFMN 黄素单核苷酸FAD 黄素腺嘌呤核苷酸LDH 乳酸脱氢酶CK 肌酸激酶PCR 聚合酶链反应BAL 二巯基丙醇PAM 解磷定第四章糖代谢SGLT Na+依赖型葡萄糖转运体GLUT 依赖一类葡萄糖转运体G-6-P 6-磷酸葡萄糖PEK-1 6-磷酸果糖激酶-1PEP 磷酸烯醇式丙酮酸FBP-2 果糖二磷酸酶-2TAC 三羧酸循环(TCA循环)GSH 谷胱甘肽UDPG 尿苷二磷酸葡萄糖UDPGA尿苷二磷酸葡萄糖醛酸PKA 蛋白激酶A第五章脂类代谢FA 脂肪酸PG 前列腺素TX 血栓烷LTs 白三烯CM 乳糜微粒FFA 游离脂肪酸HSL 激素敏感性甘油三酯脂酶ACP 酰基载体蛋白VLDL 极低密度脂蛋白LDL 低密度脂蛋白IDL 中密度脂蛋白HDL 高密度脂蛋白SRS-A 过敏反应的慢反应物质5-HPETE 氢过氧化廿碳四烯酸PA 磷脂酸PIP2磷脂酰肌醇-4,5-二磷酸IP3三磷酸肌醇RCDP 康-亨综合症MV A 甲羟戊酸SCP 固醇载体蛋白CE 胆固醇酯LRP LDL受体相关蛋白HL 肝脂酶FC 游离胆固醇CERP 胆固醇流出调节蛋白LCAT 卵磷脂胆固醇脂肪酰转移酶第六章生物氧化Fe-S 铁硫中心CoQ 辅酶Q(泛醌)F P2黄素蛋白-2(人复合体2)Cyt 细胞色素OSCP 寡霉素敏感蛋白DNP 二硝基苯酚mtDNA 线粒体DNACP 磷酸肌酸ROS 反应活性氧类(自由基)SOD 超氧物歧化酶第七章氨基酸代谢GPT 谷丙转氨酶ALT 丙氨酸转氨酶GOT 谷草转氨酶AST 天冬氨酸转氨酶IMP 次黄嘌呤核苷酸CPS-I 氨基甲酰磷酸合成酶I AGA N-乙酰谷氨酸OCT 鸟氨酸氨基甲酰转移酶5-HT 5-羟色胺FH4四氢叶酸SAM S-腺苷甲硫氨酸NOS 一氧化氮合酶第八章核苷酸代谢HGPRT 次黄嘌呤-鸟嘌呤磷酸核糖转移酶PRPP 磷酸核糖焦磷酸6MP 6-巯基嘌呤MTX 甲氨蝶呤5-FU 5-氟尿嘧啶FUTP 三磷酸氟尿嘧啶核苷第九章物质代谢的联系与调节MS 中心性肥胖CCK 胆囊收缩素第十章DNA的生物合成E.coli 大肠杆菌dNTP 脱氢三磷酸核苷(N代表任一碱基)DNA-pol DNA聚合酶SSB 单链DNA结合蛋白HDP 螺旋反稳定蛋白RF 复制因子/释放因子PCNA 增殖细胞核抗原CDK 细胞周期蛋白依赖激酶hTR 人类端粒RNAhTP1人类端粒协同蛋白1hTRT 端粒酶逆转录酶TT 胸苷酸二聚体第十一章RNA的生物合成CTP 羧基末端结合域Inr 转录起始子TF 转录因子PIC 转录起始前复合物TPB TATA-结合蛋白CDK-9 周期蛋白依赖性激酶9CPSF 断裂和聚腺苷酸化特异性因子CStF 断裂激动因子PAP 多聚腺苷酸聚合酶PAB II 腺苷酸结合蛋白II第十二章蛋白质的生物合成rp 多种核糖体蛋白质EF 延长因子fMet N-甲酰甲硫氨酸THFA N10-甲酰四氢叶酸RBS 核糖体结合位点PAB/PABP poly A结合蛋白TF 触发因子HSP 热休克蛋白PDI 蛋白质二硫键异构酶PPI 肽-脯氨酰顺反异构酶POMC 鸦片促黑皮质素原ACTH 促肾上腺皮质激素β-LT β酯酸释放激素α-MSH α-促黑激素CLIP 促肾上腺皮质激素样中叶肽SRP 信号肽识别颗粒IFN 干扰素第十三章基因表达调控AFP 编码甲胎蛋白CAP 分解物基因激活蛋白IPTG 异丙基硫代半乳糖苷TAF TATA盒结合蛋白(TBP)相关因子UAS 上游激活序列EBP 增强子结合蛋白bZIP 碱性亮氨酸拉链bHLH 碱性螺旋-环-螺旋RNP 核糖体复合物TfR 运铁蛋白受体IRE 铁反应元件eIF 翻译起始因子RBP RNA结合蛋白RISC 沉默复合体dsRNA 双链RNA。
大学生物学智慧树知到课后章节答案2023年下浙江大学浙江大学第一章测试1.生命的基本特征包括()。
A:新陈代谢B:自我调控C:生长和发育D:进化和适应E:细胞结构F:遗传和变异答案:新陈代谢;自我调控;生长和发育;进化和适应;细胞结构;遗传和变异2.西湖中的所有草鱼称为一个()A:种群B:生态系统C:群落D:个体答案:种群3.三域学说认为地球上的生命包括()三大类群。
B:真核生物C:细菌D:古菌E:菌物F:动物答案:真核生物;细菌;古菌4.一个生态系统的基本角色包括()A:分解者B:毁灭者C:生产者D:消费者答案:分解者;生产者;消费者5.病毒是不具有细胞结构的非独立生命体。
()A:对 B:错答案:对第二章测试1.只有植物能进行光合作用。
()答案:错2.双子叶植物茎的次生生长是由维管形成层和木栓形成层周期性进行分裂活动引起的。
()A:对 B:错答案:对3.一般来讲,在植物生活史中,配子体是单倍体,孢子体是二倍体。
()A:错 B:对答案:对4.植物系统学的基本研究内容包括分类、系统发育重建和演化的过程和机制。
()A:对 B:错答案:对5.裸子植物在受精过程中产生了花粉管,适应陆地生活,所以裸子植物的精子都没有鞭毛。
()A:对 B:错答案:错6.假果是()A:由花托发育而来B:由子房和其他部分共同发育而来C:果实的变态D:由花托和花被发育而来答案:由子房和其他部分共同发育而来7.植物细胞同动物细胞的主要区别特征是植物细胞具有细胞壁,细胞壁的功能是()A:分泌的功能B:维持形状C:运输的功能D:保护作用答案:分泌的功能;维持形状;运输的功能;保护作用第三章测试1.软骨囊是软骨的一部分。
( )A:陷窝B:细胞C:纤维D:基质答案:基质2.如果一种动物的肠壁上具有中胚层组织,那么这种动物的体腔类型一定不属于。
()A:裂体腔B:肠体腔C:假体腔D:混合体腔答案:假体腔3.涡虫等扁形动物的消化道类型为。
()A:消化循环腔B:完全的消化管C:不完全的消化管D:完全的消化管和复杂的消化腺答案:不完全的消化管4.软体动物是一种具有和贝壳的动物。
第七种碱基5fC在基因组中的分布
第七种碱基5fC在基因组中的分布
来自英国剑桥大学的研究人员绘制了第一张小鼠胚胎干细胞中5-甲酰基胞嘧啶(5fC)的基因组分布图,并评估了5fC 在分化中的可能作用。
该研究成果于8月17日发表在《Genome Biology》上。
近几年,科学家的研究重心从4种基本碱基逐渐转移到其他经过修饰的碱基。
一开始是5mC,之后是5hmC,而随着5fC (5-甲酰基胞嘧啶)和5caC(5-羧基胞嘧啶)的发现,它们也称为热门的研究对象。
这四种经过修饰的碱基被称为第5-8种碱基,也被称为“新四大碱基”。
这一次,剑桥大学的研究对象是第7种碱基5fC。
胞嘧啶甲基化是一个重要的表观遗传学标记,它参与了基因组功能的调控。
在哺乳动物的早期胚胎发育期间,胞嘧啶甲基化发生了显著的变化。
尽管目前已经了解5mC的形成,但对DNA去甲基化的机制仍不清楚。
近期有研究鉴定出参与去甲基化途径的关键分子,包括5mC被TET酶氧化成5-hmC 和5fC,以及胸腺嘧啶DNA糖基化酶(TDG)对5fC的切
除。
在检测胞嘧啶甲基化时,亚硫酸氢盐处理以及随后的高通量测序(BS-Seq)一直是金标准方法。
然而,这种方法无法区分5mC和5hmC,或C和5fC/5caC。
而之前的质谱分析表明,5fC在胚胎干细胞所有胞嘧啶中仅以0.02-0.002%存在,比
5hmC还要低10-100倍。
因此,5fC的检测需要一种可靠又灵敏的方法。
参照5hmC的研究方法,研究人员对5fC进行了化学修饰,共价连接了生物素标签,随后利用链霉亲和素包被的磁珠进行pulldown。
之后对富集的DNA片段进行深度测序,分析了小鼠胚胎干细胞中5fC的分布。
全基因组分析表明5fC集中在启动子和外显子的CpG岛。
5fC 相对集中的启动子对应了转录活跃的基因。
因此,富含5fC 启动子的H3K4me3水平升高,常常与RNA聚合酶II结合。
TDG下调导致小鼠胚胎干细胞中5fC的累积,这与胚胎干细胞分化时这些基因组区域的甲基化增加相关。
作者认为,5fC在特定基因组区域的表观遗传重建(epigenetic reprogramming)上发挥作用,它在某种程度上受到TDG介导的切除的控制。
值得注意的是,胚胎干细胞中5fC的切除
是分化过程中建立正确的CpG岛甲基化模式所必需的。
(生物通余亮)。