第三章 真核生物基因组
- 格式:ppt
- 大小:2.65 MB
- 文档页数:1
真核生物的基因组结构与功能分析真核生物是指在生命进化过程中逐渐形成的一类生物,其基本特征之一是存在真核细胞核。
真核生物的基因组结构较为复杂,包含多个线性染色体和一些质粒。
对基因组结构的分析与理解,对于揭示其生物功能和进化机制是至关重要的。
一、真核生物的基因组结构真核生物的基因组大小较大,同一物种不同个体之间的基因组大小存在较大的差异。
基因组大小与细胞大小和复杂度之间存在着类似关联性。
人类基因组大小约为3亿个碱基对,其中蛋白编码基因仅占大约2%。
真核生物的基因组在基本结构上与细菌大相径庭,主要包括以下几个方面。
1. 染色体染色体是真核生物中最重要、最基本的遗传物质,是基因在生物体内的物质传递介质,是遗传信息的载体。
在精细结构上,真核细胞中存在很多复杂的染色体结构,如核小体、类固醇激素受体、平衡染色体等。
2. 基因组复制真核生物的基因组复制主要包括原核生物和真核生物的不同模式,其中原核生物中存在着DNA单线复制机制,而真核生物则采用DNA复制机器进行自我复制。
与原核生物不同的是,真核生物的DNA复制机器必须满足染色体的线性特性和复杂的三维结构,包括多个酶和蛋白质。
3. 基因只读基因只读是指通过读取基因组中的基因序列,进而达到生物高效功能表达和调节的过程。
真核生物基因组的序列阅读具有高度异质性,不同物种、不同个体之间存在大量的序列差异,这在一定程度上阻碍了对真核生物的功能研究。
二、真核生物的基因组功能分析真核生物的基因组分析主要包括以下几个方面。
1. 蛋白编码基因预测蛋白编码基因是真核生物基因组的重要组成部分,对真核生物的基因组进行蛋白编码基因预测,可以揭示其生物功能和进化机制。
目前,已经建立了多种基于序列、结构、相对位置等的蛋白编码基因预测算法与工具,如Glimmer、InterProScan、Pfam等。
2. 生物信息分析真核生物的基因组分析需要大量的计算资源和分析工具,这就需要借助生物信息学的手段来实现。
真核生物染色体基因组的结构和功能真核生物的基因组一般比较庞大,例如人的单倍体基因组由3×106bp硷基组成,但人细胞中所含基因总数大概会超过3万个。
这就说明在人细胞基因组中有许多DN A序列并不转录成mR NA用于指导蛋白质的合成。
研究发现这些非编码区往往都是一些大量的重复序列,这些重复序列或集中成簇,或分散在基因之间。
在基因内部也有许多能转录但不翻译的间隔序列(内含子)。
因此,在人细胞的整个基因组当中只有很少一部份(约占2-3%)的DNA序列用以编码蛋白质。
真核生物基因组有以下特点。
1.真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因的基因组是双份的(即双倍体,diploi d),即有两份同源的基因组。
2.真核细胞基因转录产物为单顺反子。
一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链。
3.存在重复序列,重复次数可达百万次以上。
4.基因组中不编码的区域多于编码区域。
5.大部分基因含有内含子,因此,基因是不连续的。
6.基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。
高度重复序列:高度重复序列在基因组中重复频率高,可达百万(106)以上。
在基因组中所占比例随种属而异,约占10-60%,在人基因组中约占20%。
高度重复顺序又按其结构特点分为三种(1)反向重复序列这种重复顺序约占人基因组的5%。
反向重复序列由两个相同顺序的互补拷贝在同一DNA链上反向排列而成。
变性后再复性时,同一条链内的互补的拷贝可以形成链内碱基配对,形成发夹式或“+”字形结构。
反向重复间可有一到几个核苷酸的间隔,也可以没有间隔。
没有间隔的又称回文结构,这种结构约占所有反向重复的三分之一。
第三章生物体中究竟有多少基因?与原核基因组(Genome)相比,真核基因组有一些不同的特点。
一个基因的完整性可以被打断,会有多个相同的重复序列,并且有大量的DNA并不编码蛋白。
由于核与胞质的分离,真核中基因的表达也必然和原核生物不同。
但是“真核基因组”并没有明确的界限,其必要条件是基因组大部分位于核内。
核DNA的数量变化很大,它所形成的染色体数量各不相同,序列类型也有很大区别,而细胞器含有相对较少的基因组,其大小也表现出广泛差异。
在分析真核基因组,特别是高等真核生物基因组的主要困难是编码区只代表总DNA 的很小一部分。
由于基因可能是割裂的,其大部分可能并非与编码的蛋白质相关。
基因之间也可能存在很长的DNA。
因此我们不可能从基因组总大小上推测出基因的大小。
可以通过鉴定拥有开放读框的区域直接推知基因组的编码潜力。
但是割裂基因可能含有很多分离的开放读框,从而混淆大规模基因组作图。
由于我们不知道蛋白产物的功能,或者没有确实证据说明它们表达,这种方法仅局限于确定基因组的潜力(但也有假设认为保守的开放读框会被表达,见第二章)。
另一种确认基因数量的途径是通过它们表达的蛋白或者mRNA。
这对处理已知条件下表达的基因非常可靠。
可了解在特定组织或者细胞中有多少基因表达,在相关表达水平上存在哪些差别,并且在一个细胞中表达的基因有多少与其它细胞不同,或者有多少也在其他细胞表达。
关于细胞类型,我们可能会问一个特定基因是否是必要的,当该基因突变时会发生什么情况呢?如果这种突变是致死的,或者生物表现出可见的缺陷,我们可能推测这个基因是必须的,或者至少表现出选择优势。
但有些基因的缺失对表型没有明显的影响,这些基因真是不需要的吗?在其他情况下或者经过长期的进化,它们的缺失意味着选择的劣势吗?3.1 基因组为何如此之大?基因组中DNA的总量是物种所特有的,称为C值(C-value)。
C值的范围变化很大,从微生物中的<106到一些植物和两栖类的>1011。
第三章基因与基因组第一节基因概念的历史演变第二节DNA与基因第三节真核生物的割裂基因第四节基因大小第五节重叠基因第六节真核生物的基因组第七节真核生物DNA序列组织第八节细胞器基因组第九节基因鉴定第十节人类基因组计划第三章基因与基因组1 基因(gene)的概念基因是遗传的功能单位,DNA分子中不同排列顺序的DNA片段构成特定的功能单位;含有合成有功能的蛋白质多肽链或RNA所必需的全部核苷酸序列。
广义地说,基因是有功能的DNA片段。
第一节基因概念的历史演变2 基因概念的历史演变:(1)Mendel提出基因的存在(2)Morgan证实基因在染色体上(3)“一个基因一个酶”修正为“一个基因一个多肽链”“基因”一词的创立: 1909年,丹麦遗传学家约翰逊“基因”(gene)。
Gregor MendelThomas Hunt Morgan3 基因概念的理论基础3.1 一个基因一个酶1941年G W Beadle 和E L Tatum研究证实红色链孢霉各种突变体的异常代谢是一种酶的缺陷,产生这种酶缺陷的原因是单个基因的突变。
3.2 一个基因一条多肽链本世纪50年代,Yanofsky有些蛋白质不只由一种肽链组成,如血红蛋白和胰岛素,不同肽链由不同基因编码,因而又提出了“一个基因一条多肽链”的假设。
3.3 基因的化学本质是DNA(有时是RNA)1944年,O T Avery 证实了DNA是遗传物质。
有些病毒只含有RNA。
1953年沃森和克里克建立DNA分子的双螺旋结构模型。
3.4 基因顺反子(Cistron)的概念1955年,美国本兹尔(Benzer)提出顺反子的概念:是指编码一个蛋白质的全部组成所需信息的最短片段,即一个基因。
基因仅是一个功能单位,基因内部的碱基对才是重组单位和突变单位。
一对同源染色体上两突变(a和b)在同一染色体上时,称为顺式构型,在两个染色体上时,为反式构型;顺反互补测验(cis-trans test):比较顺式和反式构型个体的表型来判断两个突变是否发生在一个基因(顺反子)内的测验。
真核细胞器基因组概述真核生物细胞器基因组概述中文摘要真核生物的基因组分为细胞核基因组和细胞器基因组。
细胞核基因组,占绝大多数的基因都由核基因组控制;细胞器基因组,与该细胞器功能相关的少数基因由该细胞器自身控制。
它们的基因结构、转录和翻译不一样,核基因组是真核的系统,细胞器基因组类似原核生物的系统。
核基因组占控制地位,它调控细胞器基因组,但后者也可以调节核基因组基因的表达。
本文主要对真核生物细胞器基因组进行描述。
关键字:真核生物基因组细胞器基因组Overview of eukaryotic organelle genomesAbstractEukaryotic genome into the nucleus genome and organelle genomes. Nuclear genome,the majority of genes controlled by the nuclear genome; organelle genomes, cells,functions associated with the small number of genes controlled by the organelle itself.Their gene structure, transcription and translation is not the same, eukaryotic nucleargenome is a system, organelle genomes like prokaryotes system. Total control of thenuclear genome position, which regulate organelle genome, but the latter can also adjustthe nuclear genome gene expression. In this paper, the genome of eukaryotic organellesare described.Keywords:Eukaryotes genomes organelle genomes前言基因组,Genome,一般的定义是单倍体细胞中的全套染色体为一个基因组,或是单倍体细胞中的全部基因为一个基因组。
分子生物学笔记完全版第三、四章--------------------------------------------------------------------------------作者: tonyloveyou 收录日期: 2006-07-13 发布日期: 2006-07-13第三章基因表达的调控基因表达:DNA→mRNA→蛋白质的遗传信息传递过程基因表达的调控第一节基因的活化基因的“开关”-染色质的活化一、活性染色质的结构间期核染色质:异染色质(heterochromatin),高度压缩(不转录);常染色质(euchromatin),较为松散,常染色质中约10%为活性染色质(更开放疏松)。
活性染色质→←非活性染色质二、活性染色质的结构特点(一)DNaseI敏感性转录活性(或有潜在转录活性)的染色质对DNase I更敏感.DNase I超敏感位点(DNase I HyperSensitive Sites,DHSS)(二)组蛋白H3的CyS110上巯基暴露,三、活性染色质结构的形成(一)、核小体位相(Phased positioning)1.核小体的旋转定位(rotational positioning)指核小体核心与DNA双螺旋在空间结构中的相互关系,主要包括DNA双螺旋的大沟是面向还是背向核心结构.‘2.核小体的平移定位(translational positioning)指核小体与特定DNA序列的结合位置和方式,特别是转录活性相关的DNA调控元件(启动子、增强子等)序列与核小体的相互位置关系。
(二)、组蛋白修饰1.H1组蛋白磷酸化促进染色体包装,影响转录活性,2.核心组蛋白修饰乙酰化:常发生在组蛋白的Lys,一般活性染色质是高度乙酰化的。
(三)HMG蛋白结合HMG(high mobility group)蛋白—高迁移率蛋白, 如HMG14/HMG17.与核小体核心颗粒结合,有利转录。