【精品】第三章基因与基因组
- 格式:doc
- 大小:37.50 KB
- 文档页数:37
第三章基因组和基因第一节基因组与C值矛盾一、基因组一个生物物种所有染色体的总和(细胞遗传学)所有核酸分子的总和(分子遗传学)所有基因的总和(经典遗传学)指导一个物种的结构与功能的所有遗传信息的总和(现代分子生物学理论)二、C值一个单倍体基因组的DNA含量。
单位为dolton或uug或bp1 uug = 1 pg = 6.1×1011dolton对每一个物种,C值是恒定的。
三、C值矛盾一般而言,随着生物的进化,生物体的结构与功能越复杂,其C值也越大。
但真核生物中DNA含量并不与生物的复杂性相一致,这种反常现象称为C值矛盾。
C值矛盾表现在:1、结构、功能相似的同一类生物中,甚至亲缘关系十分接近的物种之间,它们的C值可相差10倍乃至上千倍。
如:豌豆的C值为14pg,而蚕豆只有2pg。
两栖类C值的变动范围很大,为109-1011bp。
2、较低等生物的C值大于较高等生物的C值如:两栖动物(1011bp)>哺乳动物(109bp)3、真核生物的C值之大,远远超过其基因编码所需将内含子算上,哺乳动物的一个基因长约5-8Kb,少数10Kb,则哺乳动物应有40-60万个基因。
目前研究表明,实际基因数估计不会超过这个数值的10%(3-4万)。
有些基因的序列不编码蛋白质,则基因组中只含有2%-3%的DNA序列用于编码蛋白质。
余下那么多DNA序列具何功能?难道不被表达的DNA序列都是调控基因吗?目前还无法圆满解释。
第二节原核生物基因组一、原核生物基因组的特点1、不具备明显的核结构,只有类核,即DNA相对集中的区域。
2、基因组小,一般只有一个染色体,大多为双链环状,少数为单链或线型。
E.coli DNA分子量为2.4×109,相当于4.2×106 bp,含3000-4000个基因;噬菌体DNA分子长48502bp,含46个基因;ΦX174 DNA分子长5386bp,含有11个基因;SV40病毒DNA分子量为3×106bp,含5个基因。
第三章基因与基因组第一节基因概念的历史演变第二节DNA与基因第三节真核生物的割裂基因第四节基因大小第五节重叠基因第六节真核生物的基因组第七节真核生物DNA序列组织第八节细胞器基因组第九节基因鉴定第十节人类基因组计划第三章基因与基因组1 基因(gene)的概念基因是遗传的功能单位,DNA分子中不同排列顺序的DNA片段构成特定的功能单位;含有合成有功能的蛋白质多肽链或RNA所必需的全部核苷酸序列。
广义地说,基因是有功能的DNA片段。
第一节基因概念的历史演变2 基因概念的历史演变:(1)Mendel提出基因的存在(2)Morgan证实基因在染色体上(3)“一个基因一个酶”修正为“一个基因一个多肽链”“基因”一词的创立: 1909年,丹麦遗传学家约翰逊“基因”(gene)。
Gregor MendelThomas Hunt Morgan3 基因概念的理论基础3.1 一个基因一个酶1941年G W Beadle 和E L Tatum研究证实红色链孢霉各种突变体的异常代谢是一种酶的缺陷,产生这种酶缺陷的原因是单个基因的突变。
3.2 一个基因一条多肽链本世纪50年代,Yanofsky有些蛋白质不只由一种肽链组成,如血红蛋白和胰岛素,不同肽链由不同基因编码,因而又提出了“一个基因一条多肽链”的假设。
3.3 基因的化学本质是DNA(有时是RNA)1944年,O T Avery 证实了DNA是遗传物质。
有些病毒只含有RNA。
1953年沃森和克里克建立DNA分子的双螺旋结构模型。
3.4 基因顺反子(Cistron)的概念1955年,美国本兹尔(Benzer)提出顺反子的概念:是指编码一个蛋白质的全部组成所需信息的最短片段,即一个基因。
基因仅是一个功能单位,基因内部的碱基对才是重组单位和突变单位。
一对同源染色体上两突变(a和b)在同一染色体上时,称为顺式构型,在两个染色体上时,为反式构型;顺反互补测验(cis-trans test):比较顺式和反式构型个体的表型来判断两个突变是否发生在一个基因(顺反子)内的测验。
第三章基因与基因组第一节基因概念的历史演变第二节DNA与基因第三节真核生物的割裂基因第四节基因大小第五节重叠基因第六节真核生物的基因组第七节真核生物DNA序列组织第八节细胞器基因组第九节基因鉴定第十节人类基因组计划第三章基因与基因组1基因(gene)的概念基因是遗传的功能单位,DNA分子中不同排列顺序的DNA片段构成特定的功能单位;含有合成有功能的蛋白质多肽链或RNA所必需的全部核苷酸序列。
广义地说,基因是有功能的DNA片段。
第一节基因概念的历史演变2基因概念的历史演变:(1)Mendel提出基因的存在(2)Morgan证实基因在染色体上(3)“一个基因一个酶”修正为“一个基因一个多肽链”“基因”一词的创立:1909年,丹麦遗传学家约翰逊“基因”(gene)。
GregorMendelThomasHuntMorgan3基因概念的理论基础3.1 一个基因一个酶1941年GWBeadle和ELTatum研究证实红色链孢霉各种突变体的异常代谢是一种酶的缺陷,产生这种酶缺陷的原因是单个基因的突变。
3。
2 一个基因一条多肽链本世纪50年代,Yanofsky有些蛋白质不只由一种肽链组成,如血红蛋白和胰岛素,不同肽链由不同基因编码,因而又提出了“一个基因一条多肽链”的假设。
3。
3 基因的化学本质是DNA(有时是RNA)1944年,OTAvery证实了DNA是遗传物质.有些病毒只含有RNA。
1953年沃森和克里克建立DNA分子的双螺旋结构模型。
3。
4基因顺反子(Cistron)的概念1955年,美国本兹尔(Benzer)提出顺反子的概念:是指编码一个蛋白质的全部组成所需信息的最短片段,即一个基因.基因仅是一个功能单位,基因内部的碱基对才是重组单位和突变单位.一对同源染色体上两突变(a和b)在同一染色体上时,称为顺式构型,在两个染色体上时,为反式构型;顺反互补测验(cis—transtest):比较顺式和反式构型个体的表型来判断两个突变是否发生在一个基因(顺反子)内的测验。
测验时,两突变发生在同一基因上,杂合体就不存在野生型的基因,因而为突变体表型;如果两突变在两个不同的基因上,后代杂合体中将有一个基因是野生型的,另外一个基因是突变型,杂合体的表型成了野生型。
这两个基因的这种关系称为互补。
反式排列:用于互补测验中所用的两个突变型,如果分别位于两条染色体上,这种组合方式称为反式排列,顺式排列:如果两个突变同时位于一条染色体上,则称为顺式排列。
顺反子:将不同突变之间没有互补的功能区称为顺反子,顺反子就是一个功能水平上的基因.4新的发现--概念断裂基因重叠基因跳跃基因★可转录、可翻译的(乳糖操纵子结构基因Z,Y,A)★可转录但不翻译(tDNA,rDNA)★不转录、不翻译(promoter,operator)5基因的类型2DNA中的编码区与间隔区1)编码区:与蛋白质中氨基酸序列相应的核苷酸序列。
2)间隔区:基因序列外,没有编码功能序列。
3)转录单位的组成:启动子,上游调控区,基因编码区,转录终止序列4)假基因:在序列上与活性的基因相似,但不能转录或翻译生成成熟mRNA或蛋白质,或产生过早终止的无活性肽链,或由于错误的阅读框架形成无活性的蛋白质。
第三节真核生物的割裂基因1割裂基因(splittinggene)不连续基因(discontinuousgene)断裂基因(interruptedgene)◘本世纪70年代,Chambon和Berget。
通过成熟mRNA(或cDNA)与编码基因的DNA杂交试验而发现.割裂基因:基因的编码序列在DNA放在上不是连续的,而是被不编码的序列隔开.外显子Exon:基因中编码的序列,与mRNA的序列相对应。
内含子Intron:基因中不编码的序列.鸡的卵清蛋白基因DNA与其mRNA杂交图剪接:前体RNA中由内含子转录下来的序列去除,并把由外显子转录的RNA序列连接起来的过程。
2割裂基因的性质:1)外显子在基因中的排列顺序和它在成熟mRNA产物中的排列顺序是相同的,2)某种割裂基因在所有组织中都有相同的内含子成分,3)核基因的内含子的可读框通常含无义密码子,没有编码功能。
3割裂基因的普遍性b)原核生物中:SV40大T抗原gene小t抗原gene1984Dr。
ChuT4phage的胸苷合成酶gene1017bpintronSplittinggene并非真核生物所特有酵母成熟酶合成受intronII的自动控制maturase过剩利用intronII编码成熟酶maturase减少提前剪切intronIIa) Intron并非“含而不露”Yeast细胞色素b基因IntronII编码成熟酶(Maturase) 4割裂基因概念的相对性c)并非真核生物所有的结构基因均为splittinggene 不是splittinggeneb)Exon并非“表里如一"人类尿激酶原基因ExonI不编码氨基酸序列Histonegenefamily干扰素Yeast中多数基因(ADH…)(果蝇ADH乙醇脱氢酶基因为间隔基因)第四节基因大小取决于它所包含的内含子的长度取决于所包含的内含子的数目不同生物的外显子数目随着进化增加,基因平均长度也在增加.在进化相关的相似组织的基因,其外显子基本一致,内含子的位置也是保守的,只是长度有变化。
基因的大小第五节重叠基因1977年维纳(Weiner)1978年费尔(Feir)和桑戈尔(Sanger)噬菌体G4、MS2和SV40中都发现了重叠基因基因的重叠果蝇蛹上皮蛋白质基因位于另一个基因的内含子之中人I型神经纤维瘤(NF1)基因的第一个内含子中有三个编码蛋白质的基因,线虫基因组中每个基因平均有5个内含子,有的内含子中包含tRNA基因,以上这些重叠基因的转录方向不一定与包含它的基因的转录方向一致--两个重叠基因的转录是各自独立、互不依赖.第六节真核生物的基因组基因组(genome):真核基因组是指一个物种单倍体的染色体所携带的一整套基因.比如人基因组的全长为大约3X109对碱基,编码3-4万个蛋白分子1真核生物的基因组:与预期的编码蛋白质的基因的数量相比,基因组的DNA含量过多例:人类与E.coli编码基因数目的比较研究E。
coli.4.2X106bpDNA约编码3000种基因人类3。
3X109bp的DNA是大肠杆菌的700多倍有上百万个基因???根据不同细胞中的mRNA数目来估算表达基因的方法,人类编码基因约为3-4万个持家基因(housekeepinggene):有些基因是在所有的细胞类型中都表达的,即这些基因的功能为所有细胞所必须(或称组成型基因constitutivegene)◘奢侈基因(luxurygene):仅在某种特定类型的细胞中表达的基因约为大肠杆菌的30倍,那么90%以上的DNA功能何在???果蝇基因组的基因原核生物与真核生物基因组的特点原核生物基因组的特点:1)原核生物的基因组很小,DNA含量低;2)原核生物DNA不和蛋白质固定结合,一般不具有核小体结构;3)原核生物的基因组内绝大部分序列用于编码蛋白质.4)功能上密切相关得到基因高度集中形成一个功能转录单位,可以转录形成含有多个蛋白质分子的一个mRNA单元。
5)重复序列少,具重叠基因;真核生物基因组的特点:1)真核生物基因组的分子量大2)真核生物的DNA一般与蛋白质结合成染色体。
3)转录和翻译在细胞中不同的位置进行。
4)基因组DNA的大量序列不编码蛋白.5)真核生物的蛋白编码基因往往以单拷贝存在。
2基因组大小和C值C值(CValue):在每一种生物中其单倍体基因组的DNA总量是特异的。
DNA的长度是根据碱基对的多少推算出来的。
C值是每种生物的一个特征,不同生物之间差别很大低等真核生物中与形态学复杂程度相关,但高等真核生物中变化很大C值矛盾(C—valueparadox)C值悖论:C值和生物结构或组成的复杂性不一致的现象。
高等生物的C值不一定就意味着它的C值高于比它低等的生物. 3基因组的基因数目第七节真核生物DNA序列组织DNA复性过程遵循二级反应动力学DNA复性过程中单链消失的速度用公式表示:-dC/dt=kC21DNA的复性动力学反应初始t=0单链DNA浓度=C0反应达t时单链DNA浓度=CtK=复性速度常数DNA复性的影响因素:DNA序列的复杂性、初始浓度、片段大小、温度、离子强度—dCt/dt=KC02积分Ct/C0=1/(1+KC0t)当Ct/C0=1/2时的Cot值定义为Cot1/2Ct/C0=1/2=1/(1+KC0t(1/2))K=1/Cot(1/2)C0t(1/2)值对DNA具有特征性,其中与DNA的碱基对数目成反相关即复性反应完成一半时Ct/C0是C0t的函数,按此公式作图得C0t曲线Cot曲线:用以表示复性速度与DNA顺序复杂性的关系.不同DNA的Cot(1/2)值不同,与K值相关DNA序列的复杂性影响K值:在控制反应条件(初始浓度、温度、离子强度、片段大小)相同的前提下,两种DNA分子的C0t(1/2)值,取决于核苷酸的排列复杂性。
DNA序列的复杂性(complexity)X:最长的没有重复序列的核苷酸对的数值。
X=KCot1/2AAAAAAAAX=1ATCGATCGATCGX=4N105X=105Cot(1/2)=1/K形状相似(跨越2-3个数量级),Cot(1/2)不相同--单一序列只是复杂性不同高度重复序列Cot(1/2)值小单一排列序列Cot(1/2)值大poly(A)X=1Cot(1/2)=2x10-6 T4X=1.7x105Cot(1/2)=0。
3不同原核生物的Cot曲线复性分数(1-c/c0)P74图-16真核生物复性动力学研究复性曲线的模式图复性反应分为三相,每相代表不同复杂长度的序列类型Cot1/2所占比例复杂性X重复频率2重复序列(repetitivesequences)真核生物复性动力学研究发现了重复序列单拷贝序列轻度重复序列中度重复序列高度重复序列1)单拷贝序列(singlecopysequences)又称非重复序列:一个基因组中只有一个拷贝。
单一序列的复性曲线常只有一个拐点,而重复序列常有多个拐点。
结构基因(蛋白质基因)大多是单拷贝。
2)轻度重复序列(lightrepetitivesequences)在基因组中重复数2—10的重复顺序,为慢复性速度。
少数在基因组中成串排列在一个区域,大多数与单拷贝基因间隔排列.多为编码功能3)中度重复序列(moderaterepetitivesequences)基因组中重复数十至数万(<105)次的重复顺序,复性速度快于单拷贝顺序,慢于高度重复顺序。
多与单拷贝基因间隔排列.多为非编码序列,如Alu序列也有编码基因产物的,如rDNA、tDNA、Histonegenecluster,一般往往以基因家族的形式组织.4)高度重复序列(highlyrepetitivesequences)在基因组中重复频率高,可达百万(106)以上,复性速度很快.序列一般较短,长10—300bp,如真核生物的卫星DNA。