真核基因与基因组
- 格式:ppt
- 大小:1.43 MB
- 文档页数:42
为什么原核生物是单拷贝基因,而真核是多拷贝?(1)真核基因组比原核基因组大得多,大肠杆菌基因组约4×106bp,哺乳类基因组在109bp数量级,比细菌大千倍;大肠杆菌约有4000个基因,人则约有10万个基因.(2)真核生物主要的遗传物质与组蛋白等构成染色质,被包裹在核膜内,核外还有遗传成分(如线粒体DNA等),这就增加了基因表达调控的层次和复杂性.(3)原核生物的基因组基本上是单倍体,而真核基因组是二倍体.(4)如前所述,细菌多数基因按功能相关成串排列,组成操纵元的基因表达调控的单元,共同开启或关闭,转录出多顺反子(polycistron)的mRNA;真核生物则是一个结构基因转录生成一条mRNA,即mRNA 是单顺反子(monocistron),基本上没有操纵元的结构,而真核细胞的许多活性蛋白是由相同和不同的多肽形成的亚基构成的,这就涉及到多个基因协调表达的问题,真核生物基因协调表达要比原核生物复杂得多.(5)原核基因组的大部分序列都为基因编码,而核酸杂交等实验表明:哺乳类基因组中仅约10%的序列为蛋白质、rRNA、tRNA等编码,其余约90%的序列功能至今还不清楚.(6)原核生物的基因为蛋白质编码的序列绝大多数是连续的,而真核生物为蛋白质编码的基因绝大多数是不连续的,即有外显子(exon)和内含子(intron),转录后需经剪接(splicing)去除内含子,才能翻译获得完整的蛋白质,这就增加了基因表达调控的环节.(7)原核基因组中除rRNA、tRNA基因有多个拷贝外,重复序列不多.哺乳动物基因组中则存在大量重复序列(repetitive sequences).用复性动力学等实验表明有三类重复序列:①高度重复序列(highly repetitive sequences),这类序列一般较短,长10-300bp,在哺乳类基因组中重复106次左右,占基因组DNA 序列总量的10-60%,人的基因组中这类序列约占20%,功能还不明了.②中度重复序列(moderately repetitive sequences),这类序列多数长100-500bp,重复101-105次,占基因组10-40%.例如哺乳类中含量最多的一种称为Alu的序列,长约300bp,在哺乳类不同种属间相似,在基因组中重复3-×105次,在人的基因组中约占7%,功能也还不很清楚.在人的基因组中18S/28SrRNA基因重复280次,5SrRNA基因重复2000次,tRNA基因重复1300次,5种组蛋白的基因串连成簇重复30-40次,这些基因都可归入中度重复序列范围.③单拷贝序列(single copy sequences).这类序列基本上不重复,占哺乳类基因组的50-80%,在人基因组中约占65%.绝大多数真核生物为蛋白质编码的基因在单倍体基因组中都不重复,是单拷贝的基因.从上述可见真核基因组比原核基因组复杂得多,至今人类对真核基因组的认识还很有限,使现在国际上制订的人基因组研究计划(human gene project)完成,绘出人全部基因的染色体定位图,测出人基因组109bp全部DNA序列后,要搞清楚人全部基因的功能及其相互关系,特别是要明了基因表达调控的全部规律,还需要经历很长期艰巨的研究过程.。
原核生物基因组和真核生物基因组的区别:1、真核生物基因组指一个物种的单倍体染色体组(1n)所含有的一整套基因。
还包括叶绿体、线粒体的基因组。
原核生物一般只有一个环状的DNA分子,其上所含有的基因为一个基因组。
2、原核生物的染色体分子量较小,基因组含有大量单一顺序(unique-sequences),DNA仅有少量的重复顺序和基因。
真核生物基因组存在大量的非编码序列。
包括:.内含子和外显子、.基因家族和假基因、重复DNA序列。
真核生物的基因组的重复顺序不但大量,而且存在复杂谱系。
3、原核生物的细胞中除了主染色体以外,还含有各种质粒和转座因子。
质粒常为双链环状DNA,可独立复制,有的既可以游离于细胞质中,也可以整合到染色体上。
转座因子一般都是整合在基因组中。
真核生物除了核染色体以外,还存在细胞器DNA,如线粒体和叶绿体的DNA,为双链环状,可自主复制。
有的真核细胞中也存在质粒,如酵母和植物。
4、原核生物的DNA位于细胞的中央,称为类核(nucleoid)。
真核生物有细胞核,DNA序列压缩为染色体存在于细胞核中。
5、真核基因组都是由DNA序列组成,原核基因组还有可能由RNA组成,如RNA病毒。
原核生物和真核生物区别(从细胞结构、基因组结构和遗传过程分析)主要差别由真核细胞构成的生物。
包括原生生物界、真菌界、植物界和动物界。
真核细胞与原核细胞的主要区别是:【从细胞结构】1.真核细胞具有由染色体、核仁、核液、双层核膜等构成的细胞核;原核细胞无核膜、核仁,故无真正的细胞核,仅有由核酸集中组成的拟核2.真核细胞有内质网、高尔基体、溶酶体、液泡等细胞器,原核细胞没有。
真核细胞有发达的微管系统,其鞭毛(纤毛)、中心粒、纺锤体等都与微管有关,原核生物则否。
3.真核细胞有由肌动、肌球蛋白等构成的微纤维系统,后者与胞质环流、吞噬作用等密切相关;而原核生物却没有这种系统,因而也没有胞质环流和吞噬作用。
真核细胞的核糖体为80S型,原核生物的为70S型,两者在化学组成和形态结构上都有明显的区别。
真核生物染色体基因组的结构和功能真核生物的基因组一般比较庞大,例如人的单倍体基因组由3×106bp硷基组成,但人细胞中所含基因总数大概会超过3万个。
这就说明在人细胞基因组中有许多DN A序列并不转录成mR NA用于指导蛋白质的合成。
研究发现这些非编码区往往都是一些大量的重复序列,这些重复序列或集中成簇,或分散在基因之间。
在基因内部也有许多能转录但不翻译的间隔序列(内含子)。
因此,在人细胞的整个基因组当中只有很少一部份(约占2-3%)的DNA序列用以编码蛋白质。
真核生物基因组有以下特点。
1.真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因的基因组是双份的(即双倍体,diploi d),即有两份同源的基因组。
2.真核细胞基因转录产物为单顺反子。
一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链。
3.存在重复序列,重复次数可达百万次以上。
4.基因组中不编码的区域多于编码区域。
5.大部分基因含有内含子,因此,基因是不连续的。
6.基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。
高度重复序列:高度重复序列在基因组中重复频率高,可达百万(106)以上。
在基因组中所占比例随种属而异,约占10-60%,在人基因组中约占20%。
高度重复顺序又按其结构特点分为三种(1)反向重复序列这种重复顺序约占人基因组的5%。
反向重复序列由两个相同顺序的互补拷贝在同一DNA链上反向排列而成。
变性后再复性时,同一条链内的互补的拷贝可以形成链内碱基配对,形成发夹式或“+”字形结构。
反向重复间可有一到几个核苷酸的间隔,也可以没有间隔。
没有间隔的又称回文结构,这种结构约占所有反向重复的三分之一。
病毒、真核和原核生物的基因组结构特点病毒基因组结构特点:1.病毒基因组所含核酸类型不同2.不同病毒基因组大小相差较大3.病毒基因组可以是连续的也可以是不连续的4.病毒基因组的编码序列大5.基因可以是连续的也可以是间断的6.病毒基因组都是单倍体和单拷贝7.基因重叠8.病毒基因组功能单位或转录单位9.病毒基因组含有不规则结构基因(1)几个结构基因的编码区无间隔(2)结构基因本身没有翻译起始序列(3)mRNA没有5’端的帽结构原核生物基因组结构特点:1.细菌等原核生物的基因组是一条双链闭环的DNA分子2.具有操纵子结构3.原核基因组中只有1个复制起点4.结构基因无重叠现象5.基因序列是连续的,无内含子,因此转录后不需要剪切6.编码区在基因组中所占的比例远远大于真核基因组,但又远远小于病毒基因组。
非编码区主要是一些调控序列7.基因组中重复序列很少8.具有编码同工酶的基因9.细菌基因组中存在着可移动的DNA序列,包括插入序列和转座子10.在DNA分子中具有多种功能的识别区域,如复制起始区、复制终止区、转录启动区和终止区等。
这些区域往往具有特殊的序列,并且含有反向重复序列真核生物基因组结构特点:1)真核基因组远远大于原核生物的基因组。
2)真核基因具有许多复制起点,每个复制子大小不一。
每一种真核生物都有一定的染色体数目,除了配子为单倍体外,体细胞一般为双倍体,即含两份同源的基因组。
3)真核基因都出一个结构基因与相关的调控区组成,转录产物的单顺反子,即一分子mRNA只能翻译成一种蛋白质。
4)真核生物基因组中含有大量重复顺序。
5)真核生物基因组内非编码的顺序(NCS)占90%以上。
编码序列占5%。
6)真核基因产断列基因,即编码序列被非编码序列分隔开来,基因与基因内非编码序列为间隔DNA,基因内非编码序列为内含子,被内含子隔开的编码序列则为外显子。
7)真核生物基因组功能相关的基因构成各种基因家族,它们可串联在一起,亦可相距很远,但即使串联在一起成族的基因也是分别转录的。
基因genes:基因是负责编码RNA或一条多肽链的DNA片段,包括编码序列、编码序列外的侧翼序列及插入序列。
是决定遗传性状的功能单位。
结构基因structure genes:基因中编码RNA或蛋白质的DNA序列称为结构基因。
基因组genome:一个细胞或病毒的全部遗传信息。
(细胞或生物体的一套完整单倍体的遗传物质的总和。
)真核生物基因组是指一套完整单倍体DNA(染色体DNA)和线粒体DNA的全部序列,包括编码序列和非编码序列。
GT-AG法则:真核生物基因的外显子与内含子接头处都有一段高度保守的一致性序列,即:内含子5’端大多数是以GT开始,3’端大多是以AG结束。
端粒:以线性染色体形式存在的真核基因组DNA末端都有一种特殊的结构叫端粒。
该结构是一段DNA序列和蛋白质形成的一种复合体,仅在真核细胞染色体末端存在。
端粒DNA由重复序列组成,人类端粒一端是TTAGGG 另一端是AATCCC.操纵子:是指数个功能上相关的结构基因串联在一起,构成信息区,连同其上游的调控区(包括启动子和操纵基因)以及下游的转录终止信号所构成的基因表达单位。
所转录的RNA为多顺反子。
操纵元件:是一段能够被不同基因表达调控蛋白质识别和结合的DNA序列,是决定基因表达效率的关键元件。
顺式作用元件:是指那些与结构基因表达调控相关、能够被基因调控蛋白特异性识别和结合的特异DNA序列。
包括启动子、上游启动子元件、增强子、反应元件和poly(A)加尾信号。
反式作用因子:是指真核细胞内含有的大量可以通过直接或间接结合顺式作用元件而调节基因转录活性的蛋白质因子。
启动子:是能够被RNA聚合酶特异性识别并与其结合并开始转录的核苷酸序列。
(TATAbox、CAATbox、GCbox)增强子enhancer:是一段短的DNA序列,其中含有多个作用元件,可以特异性地与转录因子结合,增强基因的转录活性。
它可位于被增强的转录基因的上游或下游,也可相距靶基因较远。