第二章 基因组结构与功能
- 格式:doc
- 大小:527.22 KB
- 文档页数:19
第二章 基因组基本概念本章主要内容基因 基因组 转录组和蛋白质组第一部分 基因一、基因的含义与结构所有生命都具有指令其生长发育、维持其结构 与功能所必需的遗传信息,生物中携带遗传信 息的遗传物质的总和称为基因组。
大部分生物的基因组都是由DNA组成,少数病 毒为RNA。
基因的含义分子角度:基因的基本含义是指编码蛋白质或RNA分子遗传 信息的基本遗传单位。
编码蛋白基因包括结构基 因和调控基因。
化学角度:基因是一段具有特定功能和结构的连续脱氧核糖 核苷酸序列,是构成染色体的重要组成部分,是 染色体上的遗传功能单位。
基因的物质基础-----核酸核酸:脱氧核糖核酸(DNA) 核糖核酸(RNA)DNA腺嘌呤 (A) 鸟嘌呤 (G) 胞嘧啶 (C)RNA胸腺嘧啶 (T)尿嘧啶 (U)DNA的双螺旋结构James Watson & Francis CrickErwin Chargaff (1905-1995)Chargaff ’s rule:A%=T%G%=C%DNA 分子X射线衍射照片Rosalind FranklinRNA的化学与生物化学RNA的功能:主要是传递遗传信息,参与基因的表达调控。
RNA与DNA的差异:1)连接在核糖2碳原子上的基团是羟基非氢原子。
2)DNA中胸腺嘧啶T的位置由尿嘧啶U代替。
RNA的种类和功能转运RNA(tRNA):转运氨基酸信使RNA(mRNA):蛋白质合成的模板核糖体RNA(rRNA):核蛋白体组成成分不均一核RNA(hnRNA):成熟mRNA的前体小核RNA(snRNA):参与hnRNA的剪接、转运小核仁RNA(snoRNA):rRNA的加工和修饰小胞质RNA(scRNA/7SL-RNA):蛋白质内质网定位合成的信号识别体的组成成分1. 帽子结构:转录后加工中,在5′-端加上7甲基三磷酸鸟苷,并在第二位核苷酸的C2′上甲基化(m7GpppNm)。
真核生物mRNA 5'端帽子结构的重要性在于它是mRNA 做为翻译起始的必要的结构,对核糖体对mRNA的识别提供了信号,这种帽子结构还可能增加mRNA的稳定性,保护mRNA 免遭5'外切核酸酶的攻击。
第一章基因的结构与功能自测题(三)简答题1. 顺式作用元件如何发挥转录调控作用?2. 比较原核细胞和真核细胞mRNA的异同。
3. 说明tRNA分子的结构特点及其与功能的关系。
4. 如何认识和利用核酶?5. 若某一基因的外显子发生一处颠换,对该基因表达产物的结构和功能有什么影响?6. 举例说明基因突变如何导致疾病。
(四)论述题1. 真核生物基因中的非编码序列有何意义?2. 比较一般的真核生物基因与其转录初级产物、转录成熟产物的异同之处。
3. 真核生物的基因发生突变可能产生哪些效应?(三)简答题1. (1) 真核生物基因中与转录调控相关的一些DNA 片段称为顺式作用元件,包括启动子、上游启动子元件、增强子、加尾信号和反应元件等。
(2) 顺式作用元件通常与一些蛋白质(如RNA聚合酶、转录因子)结合,作用形式包括DNA-蛋白质、蛋白质-蛋白质之间的相互作用。
(3) 顺式作用元件与蛋白质相互作用后,主要通过影响RNA聚合酶的DNA结合活性,增强或者减弱基因转录。
2. 原核生物和真核生物mRNA的相同点:(1) 都含有开放阅读框和非翻译区。
(2) 开放阅读框编码蛋白质,非翻译区调控翻译起始。
原核生物和真核生物mRNA的不同点:(1) 前者常为多顺反子RNA;后者常为单顺反子RNA。
(2) 前者5' 端有与核糖体结合的SD序列;后者5' 端有帽子结构,3' 端有poly (A) 尾。
(3) 前者合成后很少被加工修饰;后者先合成hnRNA,经一系列修饰才变为成熟mRNA。
3. tRNA分子中富含稀有碱基,其二级和三级结构分别为三叶草形和倒L形,包括一茎四环:(1) 3' 端CCA:结合活化的氨基酸。
(2) 反密码环:含有反密码子,能够与mRNA上的密码子互补配对。
(3) 二氢尿嘧啶环:与氨基酰-tRNA合成酶的结合有关。
(4) TΨC环:与核糖体结合有关。
(5) 额外环:tRNA分类的标志。
现代分子生物学课后习题及答案(共10章)第一章绪论1. 你对现代分子生物学的含义和包括的研究范围是怎么理解的?2. 分子生物学研究内容有哪些方面?3. 分子生物学发展前景如何?4. 人类基因组计划完成的社会意义和科学意义是什么?答案:1. 分子生物学是从分子水平研究生命本质的一门新兴边缘学科,它以核酸和蛋白质等生物大分子的结构及其在遗传信息和细胞信息传递中的作用为研究对象,是当前生命科学中发展最快并正在与其它学科广泛交叉与渗透的重要前沿领域。
狭义:偏重于核酸的分子生物学,主要研究基因或 DNA 的复制、转录、达和调节控制等过程,其中也涉及与这些过程有关的蛋白质和酶的结构与功能的研究。
分子生物学的发展为人类认识生命现象带来了前所未有的机会,也为人类利用和改造生物创造了极为广阔的前景。
所谓在分子水平上研究生命的本质主要是指对遗传、生殖、生长和发育等生命基本特征的分子机理的阐明,从而为利用和改造生物奠定理论基础和提供新的手段。
这里的分子水平指的是那些携带遗传信息的核酸和在遗传信息传递及细胞内、细胞间通讯过程中发挥着重要作用的蛋白质等生物大分子。
这些生物大分子均具有较大的分子量,由简单的小分子核苷酸或氨基酸排列组合以蕴藏各种信息,并且具有复杂的空间结构以形成精确的相互作用系统,由此构成生物的多样化和生物个体精确的生长发育和代谢调节控制系统。
阐明这些复杂的结构及结构与功能的关系是分子生物学的主要任务。
2. 分子生物学主要包含以下三部分研究内容:A.核酸的分子生物学,核酸的分子生物学研究核酸的结构及其功能。
由于核酸的主要作用是携带和传递遗传信息,因此分子遗传学(moleculargenetics)是其主要组成部分。
由于 50 年代以来的迅速发展,该领域已形成了比较完整的理论体系和研究技术,是目前分子生物学内容最丰富的一个领域。
研究内容包括核酸/基因组的结构、遗传信息的复制、转录与翻译,核酸存储的信息修复与突变,基因达调控和基因工程技术的发展和应用等。
第二章真核微生物的形态构造和功能真核微生物(eukaryotic micro-organisms):是一大类细胞核具有核膜,能进行有丝分裂,细胞质中存在线粒体或同时存在叶绿体等多种细胞器的微生物。
真菌、显微藻类和原生动物等是属于真核微生物。
我们的重点是真菌,真菌包括酵母、霉菌和蕈菌。
真核生物与原核生物的比较:第一节酵母菌(Yeast)酵母菌:泛指能发酵糖类的各种单细胞的真菌。
5个特点:(1)个体一般以单细胞状态存在(2)多数营出芽繁殖(3)能发酵糖类产能(4)细胞壁常含甘露聚糖(5)常生活在含糖量较高、酸度较大的水生环境中一、分布及与人类的关系1. 多分布在含糖的偏酸性环境,也称为“糖菌”如水果、蔬菜、叶子、树皮等处,及葡萄园和果园土壤中等。
有的酵母菌可利用烃类物质如:假丝酵母、毕赤式酵母是正烷烃发酵生产二羧酸的高产微生物。
为石油化工开发出许多崭新的工艺过程和生产出许多用化学合成所不能生产的新产品。
2. 重要的微生物资源酵母菌是人类的第一种“家养微生物”酿造工业:酒类的生产、果汁发酵食品工业:面包、馒头的制作医药工业:核苷酸、CoA、细胞色素C、凝血质和维生素等生化药物和试剂饲料工业:单细胞蛋白(SCP)---“人造肉”化学工业:有机酸、酒精、脂肪酸和甘油等3. 重要的科研模式微生物啤酒酵母(Saccharomyces cerevisae)第一个完成全基因组序列测定的真核生物(1996)表达外源蛋白功能的优良“工程菌”---真核微生物4. 有些酵母菌具有危害性有些酵母菌能引起皮肤、呼吸道、消化道、泌尿生殖道疾病。
白假丝酵母(Candida albicans)白色念珠菌新型隐球菌(Cryptococcus neoformans)引起鹅口疮、阴道炎或肺炎等疾病二、酵母菌的形态和大小酵母菌细胞的形态通常有球形、卵圆形、圆柱、梨形、腊肠形、椭圆形、柠檬形或藕节形等。
其细胞直径一般是细菌的10倍左右。
酵母菌无鞭毛,不能游动。
(完整版)分子生物学笔记完全版分子生物学笔记第一章基因的结构第一节基因和基因组一、基因(gene) 是合成一种功能蛋白或RNA分子所必须的全部DNA序列.一个典型的真核基因包括①编码序列—外显子(exon) ②插入外显子之间的非编码序列—内合子(intron) ③5'-端和3'-端非翻译区(UTR) ④调控序列(可位于上述三种序列中) 绝大多数真核基因是断裂基因(split-gene),外显子不连续。
二、基因组(genome) 一特定生物体的整套(单倍体)遗传物质的总和,基因组的大小用全部DNA的碱基对总数表示。
人基因组3X1 09(30亿bp),共编码约10万个基因。
每种真核生物的单倍体基因组中的全部DNA量称为C值,与进化的复杂性并不一致(C-value Paradox)。
人类基因组计划(human genome project, HGP)基因组学(genomics),结构基因组学(structural genomics)和功能基因组学(functional genomics)。
蛋白质组(proteome)和蛋白质组学(proteomics)第二节真核生物基因组一、真核生物基因组的特点:,①真核基因组DNA在细胞核内处于以核小体为基本单位的染色体结构中.②真核基因组中,编码序列只占整个基因组的很小部分(2—3%),三、基因家族(gene family) 一组功能相似且核苷酸序列具有同源性的基因.可能由某一共同祖先基因(ancestral gene)经重复(duplication)和突变产生。
基因家族的特点:①基因家族的成员可以串联排列在一起,形成基因簇(genecluster)或串联重复基因(tandemly repeated genes),如rRNA、tRNA和组蛋白的基因;②有些基因家族的成员也可位于不同的染色体上,如珠蛋白基因;③有些成员不产生有功能的基因产物,这种基因称为假基因(Pseudogene).Ψa1表示与a1相似的假基因.四、超基因家族(Supergene family ,Superfamily) 由基因家族和单基因组成的大基因家族,结构上有程度不等的同源性,但功能不同.第四节细菌和病毒基因组一、细菌基因组的特点。
第二章基因组结构与功能基因组是指细胞内所有DNA分子的总称。
基因组中不同的区域具有不同的功能,有些是编码蛋白质的结构基因,有些是复制及转录的调控信号,有些区域的功能尚不清楚。
基因组结构是指不同功能区域在整个DNA分子中的分布情况。
不同生物体中DNA的大小千碱基对/ 染色体长度( m)染色体数(单倍体)形状原核生物病毒SV405.2 1.7 1 环状噬菌体φX174 5.4 1.8 1 线状单链噬菌体λ46 15 1 线状细菌大肠杆菌4000 1300 1 环状真核生物酵母1000 330 17果蝇41000 14000 4人125000 41000 23不同的生物体,其基因组的大小和复杂程度各不相同。
上表列出了从原核生物到真核生物较有代表性的生物体中DNA分子的大小。
从表上可以看出,进化程度越高的生物体其基因组越复杂,本章主要介绍病毒、细菌及真核细胞染色体基因组结构和功能。
另外,对染色体的遗传因子如质粒和线粒体DNA的结构和功能也分别作一介绍。
一、病毒基因组的结构和功能病毒是最简单的原核生物,完整的病毒颗粒包括外壳蛋白和内部的基因组DNA或RNA(有些病毒的外壳蛋白外面有一层由宿主细胞构成的被膜(envelope),被膜内含有病毒基因编码的糖蛋白。
病毒不能独立地复制,必需进入宿主细胞中借助细胞内的一些酶类和细胞器才能使病毒得以复制。
外壳蛋白(或被膜)的功能是识别和侵袭特定的宿主细胞并保护病毒基因组不受核酸酶的破坏。
1.病毒基因组的结构特点1. 与细菌或真核细胞相比,病毒的基因组很小。
如乙肝病毒DNA只有3kb大小,所含信息量也较小,只能编码4种蛋白质,而痘病毒的基因组有300kb之大,可以编码几百种蛋白质,不但为病毒复制所涉及的酶类编码,甚至为核苷酸代谢的酶类编码,因此,痘病毒对宿主的依赖性较乙肝病毒小得多。
2. 病毒基因组可以由DNA或RNA组成;病毒基因组的DNA和RNA可以是单链或双链的;可以是闭环分子,也可以是线性分子。
如乳头瘤病毒是一种闭环的双链DNA病毒,而腺病毒的基因组则是线性的双链DNA,脊髓灰质炎病毒是一种单链的RNA病毒,而呼肠孤病毒的基因组是双链的RNA分子。
一般说来,大多数DNA病毒的基因组双链DNA分子,而大多数RNA病毒的基因组是单链RNA分子。
3. 多数RNA病毒的基因组是一条RNA,但也有多条的RNA。
如流感病毒的基因组由八条RNA分子构成,每条RNA分子都含有编码蛋白质分子的信息;而呼肠孤病毒的基因组由双链的节段性的RNA分子构成,共有10个双链RNA片段,同样每段RNA分子都编码一种蛋白质。
4. 基因重叠现象普遍。
即同一段DNA片段能够编码两种甚至三种蛋白质分子,这种现象在其它的生物细胞中仅见于线粒体和质粒DNA,所以也可以认为是病毒基因组的结构特点。
这种结构使较小的基因组能够携带较多的遗传信息。
重叠基因是1977年Sanger在研究ΦX174时发现的。
ΦX174是一种单链DNA病毒,宿主为大肠杆菌,因此,又是噬菌体。
它感染大肠杆菌后共合成11个蛋白质分子,总分子量为25万左右,相当于6078个核苷酸所容纳的信息量。
而该病毒DNA本身只有5375个核苷酸,最多能编码总分子量为20万的蛋白质分子,Sanger在弄清ΦX174的11个基因中有些是重叠的之前,这样一个矛盾长时间无法解决。
重叠基因有以下几种情况:(1)一个基因完全在另一个基因里面。
如基因A和B是两个不同基因,而B包含在基因A内。
同样,基因E在基因D内。
(2)部分重叠。
如基因K和基因A及C的一部分基因重叠。
(3)两个基因只有一个碱基重叠。
如基因D的终止密码子的最后一个碱基是J基因起始密码子的第一个碱基(如TAATG)。
这些重叠基因尽管它们的DNA 大部分相同,但是由于将mRNA翻译成蛋白质时的读框不一样,产生的蛋白质分子往往并不相同。
有些重叠基因读框相同,只是起始部位不同,如SV40DNA基因组中,编码三个外壳蛋白VP1、VP2、VP3基因之间有122个碱基的重叠,但密码子的读框不一样。
而小t抗原完全在大T抗原基因里面,它们有共同的起始密码子。
5. 病毒基因组的大部分是用来编码蛋白质的,只有非常小的一份不被翻译,这与真核细胞DNA的冗余现象不同如在ΦX174中不翻译的部份只占217/5375,G4DNA中占282/5577,都不到5%。
不翻译的DNA序列通常是基因表达的控制序列。
如ΦX174的H基因和A基因之间的序列(3906-3973),共67个碱基,包括RNA聚合酶结合位,转录的终止信号及核糖体结合位点等基因表达的控制区。
乳头瘤病毒是一类感染人和动物的病毒,基因组约8.0Kb,其中不翻译的部份约为1.0kb,该区同样也是其他基因表达的调控区.6. 病毒基因组DNA序列中功能上相关的蛋白质的基因或rRNA的基因往往丛集在基因组的一个或几个特定的部位,形成一个功能单位或转录单元。
它们可被一起转录成为含有多个mRNA的分子,称为多顺反子mRNA(polycistronie mRNA),然后再加工成各种蛋白质的模板mRNA。
如腺病毒晚期基因编码病毒的12种外壳蛋白,在晚期基因转录时是在一个启动子的作用下生成多顺反子mRNA,然后再加工成各种mRNA,编码病毒的各种外壳蛋白,它们在功能上都是相关的;ΦX174基因组中的D-E-J-F-G-H基因也转录在同一mRNA中,然后再翻译成各种蛋白质,其中J、F、G及H都是编码外壳蛋白的,D蛋白与病毒的装配有关,E蛋白负责细菌的裂解,它们在功能上也是相关的。
7. 除了反转录病毒以外,一切病毒基因组都是单倍体,每个基因在病毒颗粒中只出现一次。
反转录病毒基因组有两个拷贝。
8. 噬菌体(细胞病毒)的基因是连续的;而真核细胞病毒的基因是不连续的,具有内含子,除了正链RNA病毒之外,真核细胞病毒的基因都是先转录成mRNA前体,再经加工才能切除内含子成为成熟的mRNA。
更为有趣的是,有些真核病毒的内含子或其中的一部分,对某一个基因来说是内含子,而对另一个基因却是外显子。
如SV40和多瘤病毒(polyomavirus)的早期基因就是这样。
SV40的早期基因即大T和小t抗原的基因都是从5146开始反时针方向进行,大T抗原基因到2676位终止,而小t抗原到4624位即终止了,但是,从4900到4555之间一段346bp的片段是大T抗原基因的内含子,而该内含子中从4900-4624之间的DNA序列则是小t抗原的编码基因。
同样,在多瘤病毒中,大T抗原基因中的内含子则是中T和t抗原的编码基因。
2.RNA噬菌体的基因组结构和功能目前研究最清楚的大肠杆菌RNA噬菌体是MS2,R17,f2和Qβ。
它们的基因组小,只有3600到4200个核苷酸,包含四个基因。
MS2.R17和f2具有几乎一样的基因组结构。
在四个基因中有两个基因编码噬菌体的结构蛋白:一个是A蛋白的基因,长1178个核苷酸。
A蛋白(称为成熟蛋白)的功能是使噬菌体能识别宿主,并使其RNA基因组能进入宿主菌,每个噬菌体一般只存在分子的A蛋白。
另一个结构蛋白基因长399个核苷酸,编码外壳蛋白以构成病毒颗粒,每个噬菌体有180个分子。
基因组的其他部分编码RNA复制酶和一个溶解蛋白,编码溶解蛋白的基因与外壳蛋白和复制酶的基因有部分重叠,但读框与外壳蛋白的读框不一样。
在MS2、R17、f2基因组内有许多二级结构,RNA分子内碱基的自我配对,可能对防止RNase降解有一定作用。
另外,在编码基因的5'和3'端各有一段非翻译序列,该序列对稳定RNA分子也有一定作用。
另一种RNA噬菌体Qβ的基因组略大,与上述RNA噬菌体的基因组有以下不同;[1]没有独立的溶解蛋白基因,但结构蛋白A2(或称成熟蛋白,MaturaitonProtein)即具有溶解蛋白的功能,[2]还编码另一种外壳蛋白A1。
二、细菌基因组的结构和功能细菌基因组的结构特点在许多方面与病毒的基因组特点相似,而在另一些方面又有其独特的结构和功能。
1.细菌染色体基因组结构的一般特点(1)组通常仅由一条环状双链DNA分子组成。
细菌的染色体相对聚集在一起,形成一个较为致密的区域,称为类核(nucleoid)。
类核无核膜与胞浆分开,类核的中央部分由RNA和支架蛋白组成,外围是双链闭环的DNA超螺旋。
染色体DNA通常与细胞膜相连。
细胞膜在这里的作用可能是对染色体起固定作用。
另外,在细胞分裂时将复制后的染色体均匀地分配到两个子代细菌中去。
有关类核结构的详细情况目前尚不清楚。
(2)具有操纵子结构。
其中的结构基因为多顺反子,即数个功能相关的结构基因串联在一起,受同一个调节区的调节。
数个操纵子还可以由一个共同的调节基因(regulatory gene)即调节子(regulon)所调控。
(3)在大多数情况下,结构基因在细菌染色体基因组中都是单拷贝,但是编码rRNA的基因rrn往往是多拷贝的,这样可能有利于核糖体的快速组装,便于在急需蛋白质合成时细胞可以在短时间内有大量核糖体生成。
(4)和病毒的基因组相似,不编码的DNA部份所占比例比真核细胞基因组少得多。
(5)具有编码同工酶的同基因(isogene)。
例如,在大肠杆菌基因组中有两个编码分支酸(chorismicacid)变位酶的基因,两个编码乙酰乳酸(acetolactate)合成酶的基因。
(6)和病毒基因组不同的是,在细菌基因组中编码序列一般不会重叠,即不出现基因重叠现象。
(7)具有各种功能的识别区域如复制起始区OriC,复制终止区TerC,转录启动区和终止区等。
这些区域往往具有特殊的序列,并且含有反向重复序列。
(8)在基因或操纵子的终末往往具有特殊的终止序列,它可使转录终止和RNA聚合酶从DNA链上脱落。
例如大肠杆菌色氨酸操纵子后尾含有40bp的GC 丰富区,其后紧跟AT丰富区,这就是转录终止子的结构。
终止子有强、弱之分,强终止子含有反向重复序列,可形成茎环结构,其后面为polyT结构,这样的终止子无需终止蛋白参与即可以使转录终止。
而弱终止子尽管也有反向重复序列,但无polyT结构,需要有终止蛋白参与才能使转录终止。
2.大肠杆菌染色体基因组的结构和功能大肠杆菌染色体基因组是研究最清楚的基因组。
估计其基因组含有3500个基因,75个操纵子。
已知基因中8%的序列具有调控作用。
大肠杆菌染色体基因组中已知的基因多是编码一些酶类的基因,如氨基酸、嘌呤、嘧啶、脂肪酸和维生素合成代谢的一些酶类的基因,以及大多数碳、氮化合物分解代谢的酶类的基因。
除了有些具有相关功能的基因在一个操纵子内由一个启动子转录外,大多数基因的相对位臵可以说是随机分布的。
如控制小分子合成和分解代谢的基因,糖酵解的酶类的基因等。
在已知转录方向的50个操纵子中,27个操纵子按顺时针方向转录,23个操纵子按反时针方向转录,即DNA两条链作为模板指导mRNA合成的机率差不多相等。