可变剪接与蛋白质组多样性及其调节机制解读
- 格式:doc
- 大小:85.00 KB
- 文档页数:12
可变剪接:有些基因的一个mRNA前体通过不同的剪接方式(选择不同的剪接位点)产生不同的mRNA剪接异构体,这一过程称为可变剪接(或选择性剪接,alternative splicing) 。
可变剪接是调节基因表达和产生蛋白质组多样性的重要机制,是导致人类基因和蛋白质数量较大差异的重要原因。
基本内容大多数真核基因转录产生的mRNA前体是按一种方式剪接产生出一种成熟mRNA分子,因而只翻译成一种蛋白质。
但有些基因的一个mRNA前体通过不同的剪接方式(选择不同的剪接位点)产生不同的mRNA剪接异构体,这一过程称为可变剪接(或选择性剪接, alternative splicing)。
由于RNA的可变剪接不牵涉到遗传信息的永久性改变.所以是真核基因表达调控中一种比较灵活的方式。
可变剪接是调节基因表达和产生蛋白质组多样性的重要机制, 是导致人类基因和蛋白质数量较大差异的重要原因。
可变剪接形式的识别真核细胞核内前体mRNA加工通过5’加帽、剪接(移除内含子)、3’末端切割加尾.从而形成成熟的mRNA.成熟的mRNA和hnRNP及其他蛋白质形成复合体输出核外再经过选择性降解参与翻译。
这些步骤并不是简单的线性顺序.而是在转录物延伸期和转录同时发生的。
从而形成一个大型的“生产链。
一般认为,可变剪接有5种基本形式:①内含子保留;②可变的5’端;③可变的3’端;④外显子盒;⑤互斥外显子(一组外显子中只选其一)。
也有分为7种形式的,加上可变的起始或末端外显子,而这两种形式更有可能是可变启动子、可变polyA位点造成的。
可进行专门分析。
可变剪接的意义和作用可变剪接被认为是导致蛋白质功能多样性的重要原因之一,它使一个基因可编码多个不同转录产物和蛋白产物。
可变剪接也是产生基因组规模与生物复杂性之间的矛盾根源之一。
已有实验研究表明,可变剪接在产生受体多样性、控制调节生长发育等方面起决定性作用。
尤其表现在神经系统和免疫系统,这与该类系统的功能多样性和反应敏感性是密切相关的。
可变剪接与蛋白质组多样性及其调节机制武春晓 2001级博士生专业:免疫学导师:马大龙教授前言可变剪接是指从一个mRNA前体中通过不同的剪接方式(选择不同的剪接位点组合)产生不同的mRNA剪接异构体的过程。
可变剪接是调节基因表达和产生蛋白质组多样性的重要机制。
剪接过程受多种顺式作用序列和反式作用因子相互作用调节。
包括SR和hnRNP 家族蛋白在内的多种剪接因子参与这一调节过程。
转录机器(machine)也参与可变剪接的调节。
本文将讨论:一.可变剪接与蛋白质组多样性二. 可变剪接的调节机制。
.第一部分可变剪接与蛋白质组多样性5据预测,人类基因组可能有约35,000个基因,果蝇约14,000个,而简单的模式生物线虫约19,000个基因。
生物的复杂性与其基因组基因数量似乎存在明显差异。
原因在蛋白质组。
基因重排,RNA编辑,和可变剪接等机制可以从一个基因产生多种蛋白,从而使蛋白质组中蛋白质的数量超过基因组中基因的数量。
其中,从影响的基因数量和生物种类范围来看,可变剪接是扩大蛋白质多样性的最重要的机制1-4。
一、可变剪接的频率。
5,61. 5%。
从1977年Walter Gilbert提出可变剪接概念,1980年Baltimore在小鼠IgM基因发现第一个可变剪接产生膜型、分泌型IgM,至2001年,用经典分子生物学实验的方法研究,一共仅发现了数百种有可变剪接的基因。
并推测在高级真核细胞生物约5%的基因有可变剪接。
2. 35%-60%。
高通量的基因组测序和EST测序,使得生物信息学的方法研究可变剪接成为可能。
EST来源于完全加工的mRNA, 它们提供了一个广泛的mRNA多样性的样品库。
这种多样性可以用计算机分析。
最近两年,多个研究小组通过不同的生物信息学的方法,从整个人基因组的水平进行分析,结果一致显示约35%-60%的人基因有可变剪接形式。
而且,由于对大多数基因来说,每个基因只测了很少几EST甚至没有EST;EST不是全长的mRNA,多位于mRNA的5’和3’端;EST来源于有限的组织和发育阶段;很有可能存在有更多的可变剪接而在现在的EST库中没有显示。
专题五遗传的分子基础、变异与进化A组基础对点练考点1 遗传的分子基础1.(四川广安一模)科学研究发现,T2噬菌体侵染大肠杆菌后,大肠杆菌自身蛋白质的合成立即停止,转而合成噬菌体蛋白质。
下列叙述正确的是( )A.T2噬菌体和大肠杆菌主要的遗传物质都是DNAB.噬菌体蛋白质的合成需要大肠杆菌提供酶和能量C.噬菌体基因控制合成的蛋白质需内质网进行加工D.噬菌体蛋白质外壳会侵入大肠杆菌影响细菌代谢2.(山东联考二模)DNA复制过程中,尚未解开螺旋的亲代双链DNA同新合成的两条子代双链DNA的交界处称为复制叉。
研究发现,啤酒酵母中某种蛋白被加载到复制叉时,被招募并停滞在复制叉处的Mec1蛋白就会被激活并随复制叉向前移动,从而完成DNA的复制。
下列说法错误的是( )A.DNA一条链中的磷酸基团和脱氧核糖通过磷酸二酯键连接B.DNA解旋过程中解旋酶需在ATP供能驱动下断裂两条链间的氢键C.Mec1蛋白被激活后会与RNA聚合酶结合,进而完成DNA的复制过程D.抑制细胞中Mec1基因的表达,细胞可能会被阻滞在细胞分裂间期3.(浙江台州二模)唾液腺细胞合成淀粉酶的局部过程如图所示,图中①表示某种细胞器,②表示某种大分子化合物。
下列叙述错误的是( )A.图中的囊腔是内质网腔B.①识别②上的启动子,启动多肽合成C.多个①结合在②上合成同一种多肽,提高翻译效率D.图示过程需三种RNA参与,三种RNA都是基因转录产物4.(山东模拟)不同核酸类型的病毒完成遗传信息传递的具体方式不同。
下图为某“双链±RNA病毒”基因表达示意图。
这类病毒携带有RNA复制酶,在该酶的作用下,-RNA作为模板复制出新的+RNA。
合成的+RNA既可以翻译出病毒的蛋白质,又可以作为模板合成-RNA,最终形成“±RNA”。
已知逆转录病毒的核酸为“+RNA”。
下列说法正确的是( )B.与DNA的复制不同,±RNA的双链可能都是新合成的C.该病毒与逆转录病毒基因表达时都存在A—T、A—U的配对D.逆转录病毒与该病毒繁殖时均有+RNA到-RNA的过程5.DNA甲基化是指在甲基转移酶的催化下,DNA的CG二核苷酸中的胞嘧啶被选择性地添加甲基。
RNA-seq基础知识1.RNA-Seq名词解释2.测序名词解释3.高通量测序常用名词解释4.转录组测序问题集锦RNA-Seq名词解释1.index 测序的标签,用于测定混合样本,通过每个样本添加的不同标签进行数据区分,鉴别测序样品。
2.碱基质量值(Quality Score或Q-score)是碱基识别(Base Calling)出错的概率的整数映射。
碱基质量值越高表明碱基识别越可靠,碱基测错的可能性越小。
3.Q30 碱基质量值为Q30代表碱基的精确度在99.9%。
4.FPKM(Fragments Per Kilobase of transcript per Millionfragments mapped)每1百万个map上的reads中map到外显子的每1K个碱基上的fragment个数。
计算公式为公式中,cDNAFragments 表示比对到某一转录本上的片段数目,即双端Reads数目;Mapped Reads(Millions)表示Mapped Reads总数,以10为单位;Transcript Length(kb):转录本长度,以kb个碱基为单位。
5.FC(Fold Change)即差异表达倍数。
6.FDR(False Discovery Rate)即错误发现率,定义为在多重假设检验过程中,错误拒绝(拒绝真的原(零)假设)的个数占所有被拒绝的原假设个数的比例的期望值。
通过控制FDR来决定P值的阈值。
7.P值(P-value)即概率,反映某一事件发生的可能性大小。
统计学根据显著性检验方法所得到的P 值,一般以P<0.05为显著,P<0.01为非常显著,其含义是样本间的差异由抽样误差所致的概率小于0.05或0.01。
8.可变剪接(Alternative splicing)有些基因的一个mRNA前体通过不同的剪接方式(选择不同的剪接位点)产生不同的mRNA剪接异构体,这一过程称为可变剪接(或选择性剪接,alternative splicing)。
基因可变剪接的调控机制及其研究进展作者:苏握瑜,李丽娟,贺花,雷初朝,陈宏,黄永震来源:《畜牧兽医科学》 2018年第3期摘要:基因的可变剪接( alternative splicing AS)自从被发现以来,对于它的研究一直是一个热门,它是由一个RNA前体经过剪接体( spliceosome)和剪接因子(splicing factor)的相互作用,最终形成多种成熟的具有不同生物学和化学活性的功能RNA的过程。
它的出现让蛋白质的多样性的形成原因有了更为合理的解释并在基因表达调控中占据重要地位。
近年来对基因可变剪接的研究主要集中在它的调控机制以及在不同生物中的发生状况,旨通过这些研究来为人们利用可变剪接创造经济效益或者在人类疾病的治疗方面做出贡献奠定基础。
本文对近1 0年来猪(Sus scrofa)、牛(Bos taurus)、山羊(Capra hircus)、绵羊(Ovis aries)、鸡(GalLus gallus)、和鸭(Anas platyrhynchos)等主要畜禽的基因可变剪接研究进展进行综述,分别从基因可变剪接的调控机制及其在动物遗传育种中的研究进展2个方面进行论述,并对畜禽基因可变剪接的未来的研究工作进行了展望。
关键词:可变剪接;调控机制;不同动物;研究进展中图分类号:Q752 文献标识码:A doi:10. 3969/j. i ssn. 2096-3637. 2018. 03. 002O引言早在19世纪80年代就有关于基因可变剪接的记录”],而随着测序技术的成熟,越来越多的基因被发现可以进行可变剪接,这使得人们不得不重新认识基因的表达的蛋白质的多样性的关联。
随着越来越多的生物物种中可变剪接被发现,它的作用也越来越重要,弄清它的调控机制成了至关重要的一步,这也是对可变剪接进行利用的前提。
研究发现顺式作用元件( Cis-acting element)和反式作用因子(Trans-acting element)的相互作用调控着可变剪接的发生,而随着研究的深入,越来越多的因素被牵扯其中。
rna的可变剪接名词解释在生物学领域中,RNA的可变剪接是一个重要的概念。
在这篇文章中,我们将对可变剪接进行详细的解释和探讨。
1. 什么是RNA的可变剪接?RNA可变剪接是指基因表达过程中,通过在RNA转录过程中选择性剪切外显子(exon)和内含子(intron),从而产生多种不同的mRNA亚型的过程。
这种剪接过程使得一个基因能够编码多种不同的蛋白质,增加了基因的功能和表达的多样性。
2. 可变剪接的机制可变剪接的机制涉及到多种蛋白质和核酸的相互作用。
在RNA转录过程中,剪接酶会识别内含子与外显子的边界,并切断两者之间的连接。
然后,外显子会被连起来,形成成熟的mRNA,而内含子则会被剪除。
这个剪接过程通常由剪接信号序列来指导,而这些信号序列存在于基因的DNA序列中。
3. 可变剪接的类型可变剪接有多种类型,包括:- 保留外显子:某些外显子可能会被选择性地保留在成熟的mRNA中,从而影响蛋白质的功能和结构。
- 选择性剪切:在剪接过程中,一些外显子或内含子可能会被选择性地剪除或保留,产生不同的mRNA亚型。
- 备用剪接位点:在剪接过程中,可发生在不同的剪接位点上,从而产生具有不同外显子组合的mRNA亚型。
4. 可变剪接的意义与功能RNA的可变剪接对于生物体具有重要的意义和功能,如下所示:- 增加蛋白质的多样性:通过可变剪接,单个基因可以产生多个mRNA亚型,从而编码多种不同的蛋白质。
这种多样性使得生物体能够在不同的条件下调节基因的表达和功能。
- 调节基因表达:可变剪接可以影响mRNA的稳定性和翻译效率,进而调节基因的表达水平。
- 调控生物过程:可变剪接在生物体的许多生物过程中发挥着重要的调控作用,包括细胞分化、发育、免疫应答等。
- 疾病与可变剪接:许多疾病与可变剪接异常相关,如某些癌症、神经系统疾病等。
研究可变剪接异常可以帮助我们更好地理解疾病的发生机制,并开发相应的治疗方法。
5. 可变剪接研究的进展近年来,随着高通量测序技术和生物信息学的快速发展,可变剪接研究取得了许多重要进展。
可变剪切对蛋白质表达的影响蛋白质是生命中不可或缺的基本分子,它们在细胞中扮演着各种重要的功能角色。
蛋白质的表达过程需要依赖于基因组中的DNA序列,并通过mRNA的转录和翻译过程转化为蛋白质。
然而,除了这个基本的流程之外,许多蛋白质的表达还受到可变剪切的影响。
本文将探讨可变剪切在调控蛋白质表达中的作用。
一、可变剪切的定义和原理可变剪切是一种生物学过程,它使同一个基因可以产生多种不同的mRNA剪接异构体。
在可变剪切中,基因的转录产物(预mRNA)经过剪接修饰,去除其中的一些内含子(introns),保留下部分外显子(exons)。
剪接的方式可以使外显子的顺序发生变化,或者从预mRNA中去除或保留某些外显子。
可变剪切是一种高度调控的过程,它依赖于多种剪接因子的作用,并受到细胞内环境和外部刺激的调节。
通过可变剪切,一个基因可以产生多个不同的mRNA,这些mRNA进一步翻译为不同的蛋白质异构体,从而增加了蛋白质的多样性。
二、可变剪切对蛋白质功能的影响可变剪切的存在使得一个基因可以编码多种不同的蛋白质,这些蛋白质的结构和功能可能有所不同。
通过剪接,细胞可以在遗传水平上产生不同类型的蛋白质,以适应不同的环境和生理需求。
1. 蛋白质亚型的产生可变剪切对蛋白质的功能影响最直接的表现就是产生不同的蛋白质亚型。
同一个基因通过可变剪切可以产生多种外显子组合的mRNA,这些mRNA进一步翻译为不同的蛋白质。
这些蛋白质可能在结构和功能上存在差异,从而拥有不同的生物学功能。
2. 蛋白质的调控可变剪切对蛋白质的表达调控具有重要意义。
在不同的细胞类型和组织中,可变剪切程度可能会有所不同。
研究发现,在某些疾病的发生和发展中,可变剪切异常可能会导致蛋白质的异常表达。
因此,研究可变剪切的调控机制和其对蛋白质的调节作用,对于深入理解疾病的发生和预防具有重要意义。
三、可变剪切与疾病可变剪切异常与多种疾病的发生和发展相关联。
研究发现,可变剪切的异常可以导致蛋白质功能的改变,进而引发多种疾病的发生,如癌症、神经系统疾病、心血管疾病等。
蛋白质表达中可变剪接机制的研究进展可变剪接是一种重要的转录后修饰过程,能够通过选择性使用内含子和剪接位点来产生不同的mRNA转录产物,从而增加基因的多样性。
在蛋白质表达调控中,可变剪接机制起着至关重要的作用。
近年来,关于可变剪接机制的研究进展取得了显著成果。
本文将对蛋白质表达中可变剪接机制的研究进展进行综述。
一、可变剪接的基本原理可变剪接是指在转录后成熟mRNA的剪接过程中,选择性使用不同的内含子和剪接位点,从而产生多个具有不同功能的蛋白质转录产物的一种现象。
可变剪接的基本原理包括:初级转录产物的前体mRNA经过剪接酶的作用,使得内含子被去除,外显子被保留,最终形成成熟的mRNA。
二、可变剪接的作用及意义可变剪接在生物学过程中发挥着重要的作用。
首先,可变剪接可以增加基因的多样性。
同一个基因通过可变剪接可以产生多个转录产物,从而实现不同组织和不同发育阶段的蛋白质表达差异。
此外,可变剪接还可以调节基因的表达水平,通过剪接的选择性使用不同的剪接位点,对基因的转录水平进行调控。
三、可变剪接机制的研究进展近年来,随着高通量测序技术的发展,可变剪接机制的研究取得了重要进展。
首先,在可变剪接调控的研究中,已经发现多种转录因子和RNA结合蛋白与可变剪接的发生密切相关。
转录因子能够结合到基因的启动子或者剪接位点附近的调控区域,调控剪接酶的招募和活性。
此外,已经发现了多种RNA结合蛋白能够通过结合预剪切复合体中的RNA分子,调控可变剪接的发生。
这些研究为揭示可变剪接机制的调控网络提供了重要线索。
另外,大量的测序数据的积累,为可变剪接机制的实时监测和分析提供了可能。
通过RNA测序技术,研究人员可以全面了解某个细胞或者组织中的可变剪接事件,进而对其进行分析和挖掘。
这些测序数据的分析,不仅有助于发现新的可变剪接事件,还可以揭示可变剪接在不同生理状态下的调控模式。
此外,生物信息学分析方法的发展,也为可变剪接机制的研究提供了便利。
可变剪接的生物信息数据分析综述章天骄【摘要】前体mRNA的可变剪接是扩大真核生物蛋白质组多样性的重要基因调控机制.可变剪接的错误调节可以引起多种人类疾病.由于高通量技术的发展,生物信息学成为可变剪接研究的主要手段.本文总结了可变剪接在生物信息学领域的研究方法,同时也分析并预测了可变剪接的发展方向.%Alternative pre - mRNA splicing is an important gene regulation mechanism for expanding proteomic diversity in higher eukaryotes. The misregulation of alternative splicing underlies many human diseases. With the development of high - throughput technology, bioinformatics becomes to the main method in study of alternative splicing. This article summarizes the bioinformatics methods in alternative splicing research, as well as analyzes and predicts the direction of alternative splicing.【期刊名称】《生物信息学》【年(卷),期】2012(010)001【总页数】4页(P61-64)【关键词】可变剪接;高通量技术;生物信息学【作者】章天骄【作者单位】哈尔滨工业大学计算机科学与技术学院,哈尔滨150001【正文语种】中文【中图分类】Q811可变剪接是指一个前体mRNA通过不同的剪接方式(选择不同的剪接位点组合)产生不同mRNA剪接异构体的过程。
可变剪接的五种方式可变剪接(alternative splicing)是指在基因转录过程中,不同的外显子可以在剪接过程中以不同的方式组合,从而产生多种不同的mRNA转录本。
这种剪接方式的存在使得一个基因可以编码出多个不同的蛋白质产物,从而增加了基因的功能多样性。
可变剪接是真核生物基因表达调控的重要机制之一,也是功能基因组学研究的热点之一。
在本文中,我们将介绍可变剪接的五种方式。
第一种方式是外显子的跳跃剪接(exon skipping)。
在外显子的跳跃剪接中,某些外显子被剪接过程跳过,不参与mRNA的合成,从而产生缺失某些外显子的转录本。
这种剪接方式常见于许多基因,包括一些与遗传性疾病相关的基因。
外显子的跳跃剪接可以导致蛋白质结构的改变,从而影响其功能。
第二种方式是外显子互斥剪接(exon exclusion)。
在外显子互斥剪接中,两个或多个相邻的外显子中只有一个被选择性地剪接进入mRNA,而其他外显子则被排除在外。
这种剪接方式常见于许多基因,特别是在调控神经系统发育和功能方面起重要作用的基因。
外显子互斥剪接可以导致不同的外显子组合,从而产生多种不同的蛋白质产物。
第三种方式是内含子保留剪接(intron retention)。
在内含子保留剪接中,转录过程中的内含子没有被剪接去除,而是保留在mRNA中。
这种剪接方式相对较少见,但在某些基因中仍然起重要作用。
内含子保留剪接可能会导致蛋白质序列中插入额外的氨基酸,从而改变蛋白质的结构和功能。
第四种方式是选择性启动剪接(alternative promoter usage)。
在选择性启动剪接中,基因的不同启动子可以选择性地启动转录过程,从而产生不同的转录本。
这种剪接方式常见于一些复杂的基因,特别是在不同组织或不同发育阶段中具有组织特异性表达的基因。
选择性启动剪接可以导致不同的启动子产生不同的转录本,从而产生多个具有不同功能的蛋白质产物。
第五种方式是内含子扩增剪接(intron amplification)。
可变剪接与蛋白质组多样性及其调节机制武春晓 2001级博士生专业:免疫学导师:马大龙教授前言可变剪接是指从一个mRNA 前体中通过不同的剪接方式(选择不同的剪接位点组合)产生不同的mRNA 剪接异构体的过程。
可变剪接是调节基因表达和产生蛋白质组多样性的重要机制。
剪接过程受多种顺式作用序列和反式作用因子相互作用调节。
包括SR 和hnRNP 家族蛋白在内的多种剪接因子参与这一调节过程。
转录机器(machine )也参与可变剪接的调节。
本文将讨论:一. 可变剪接与蛋白质组多样性二. 可变剪接的调节机制。
.第一部分可变剪接与蛋白质组多样性5据预测,人类基因组可能有约35,000个基因,果蝇约14,000个,而简单的模式生物线虫约19,000个基因。
生物的复杂性与其基因组基因数量似乎存在明显差异。
原因在蛋白质组。
基因重排,RNA 编辑,和可变剪接等机制可以从一个基因产生多种蛋白,从而使蛋白质组中蛋白质的数量超过基因组中基因的数量。
其中,从影响的基因数量和生物种类范围来-看,可变剪接是扩大蛋白质多样性的最重要的机制14。
一、可变剪接的频率。
5,61. 5%。
从1977年Walter Gilbert提出可变剪接概念,1980年Baltimore 在小鼠IgM 基因发现第一个可变剪接产生膜型、分泌型IgM ,至2001年,用经典分子生物学实验的方法研究,一共仅发现了数百种有可变剪接的基因。
并推测在高级真核细胞生物约5%的基因有可变剪接。
2. 35%-60%。
高通量的基因组测序和EST 测序,使得生物信息学的方法研究可变剪接成为可能。
EST 来源于完全加工的mRNA, 它们提供了一个广泛的mRNA 多样性的样品库。
这种多样性可以用计算机分析。
最近两年,多个研究小组通过不同的生物信息学的方法,从整个人基因组的水平进行分析,结果一致显示约35%-60%的人基因有可变剪接形式。
而且,由于对大多数基因来说,每个基因只测了很少几EST 甚至没有EST ;EST 不是全长的mRNA ,多位于mRNA 的5’和3’端;EST 来源于有限的组织和发育阶段;很有可能存在有更多的可变剪接而在现在的EST 库中没有显示。
因此实际可变剪接的频率可能比预测的更高。
这还有待于建立新的高通量的分子生物学方法,如生物芯片的方法,以进一步实验验证。
二、单个基因可变剪接产生的多样性5。
一个基因可以通过如下几种方式产生多个转录体,如不同的转录起始位点,可变剪接,选择不同的加尾信号位点,RNA 编辑等。
可变剪接包括3种类型:1. 内含子的保留;2. 可变外显子的保留或切除;3. 3’和5’剪接位点的转移(shift )导致外显子的增长或缩短。
可变剪接对蛋白质结构的影响也是多样性的,如多肽链中一个到数百个氨基酸的增加或减少;某功能域的有无;如果可变剪接使读码框架改变,则可能无法有效翻译,mRNA 被监视系统降解。
单独一个基因通过可变剪接产生的十几种剪接异构体的现象很常见。
有些基因甚至能够产生成千上万种剪接异构体。
最突出的例子是果蝇(Drosophila melanogaster )的Dscam 基因,可以通过可变剪接产生38,000多种mRNA 异构体。
Dscam 基因编码一个神经元轴突定向受体,它细胞外有一个由10个免疫球蛋白重复序列组成的结构域,第2,3,7个免疫球蛋白重复序列分别由第4,6,9号外显子编码,4号外显子盒(cassette )有12个变异体,6号外显子有48个变异体,9号外显子有33个变异体,再加上17号外显子的2个变异体。
每个成熟的Dscam mRNA 分别只有一个有4,6,9,17号外显子的变异体,由此理论推测Dscam 基因共有12×48×33×2=38016剪接异构体。
对Dscam 基因50个cDNA 克隆随机测序发现了49种不同的剪接异构体,说明实际存在的剪接异构体即使没有理论那么多,也至少有上千种。
人的Neurexins, n-Cadherins, calcium-activated potassium channels等基因也有类似的高度多样的剪接异构体。
上述现象非常类似于淋巴细胞TCR 或免疫球蛋白的胚系基因重排,不同之处在于后者发生在DNA 水平,前者发生在RNA 水平。
基因重排产生的高度多样抗原受体库可以识别高度复杂的自身和异己抗原。
而Dscam 基因的转录异构体可能有神经系统的发育有关。
神经元的定向迁移和相互连接可能是发育过程中最复杂的事件。
果蝇约有25,000个神经元,要使它们生长的轴突准确的,可重复性的到达目的地,使这些神经元准确的连接在一起,必然需要一个特殊的系统。
Dscam 基因的38,000多种mRNA 异构体,每个异构体各编码一个不同的受体,每个受体具有识别不同分子定向信号的潜能,从而有能力指导各个生长的轴突到达准确的位置。
如果将可变剪接与其它RNA 加工过程(如RNA 编辑)联系起来共同考虑,基因产物会更复杂。
例如,果蝇的para 基因(voltage-gated action potential sodium channel)有13个可变外显子,可编码1536种不同的mRNA ,另外,para 的转录体还要经过在11个已知位点的RNA 编辑,这样理论上一共可以产生1,032,192个不同的para 转录异构体。
根据受可变剪接影响的基因的概率,以及单个基因可能产生的可变剪接体的数目,足以表明可变剪接对蛋白质组多样性的巨大影响。
三、可变剪接的功能和生物学意义5,111. 可变剪接是在RNA 水平调控基因表达的机制之一。
一个基因通过可变剪接产生多个转录异构体,各个不同的转录异构体编码结构和功能不同的蛋白质,它们分别在细胞/个体分化发育不同阶段,在不同的组织,有各自特异的表达和功能。
因此,可变剪接是一种在转录后RNA 水平调控基因表达的重要机制。
目前已知的可变剪接异构体中,只有一小部分明确确定了功能和生物学意义。
第一个确定的可变剪接异构体功能是 IgM 基因,其末端最后两个外显子的可变剪接,决定了所编码的膜型/分泌型IgM 的产生。
最著名的例子是果蝇性别决定系统,在此系统中,至少5个基因(sxl, tra, msl2, dsx, and fru 转录体的可变剪接级联反应最终决定了果蝇雄性和雌性性别特征的表达。
有些基因,可变剪接造成的蛋白质异构体之间功能上的差异没有被实验检测出来。
不过阴性的结果不能代表没有功能差异,只是目前没有检测出来而已。
也有很多异构体造成读码框架改变,不能被翻译为蛋白质,而是直接被降解了。
真核生物也有mRNA 监视系统NMD(nonsense-mediated degradation,检测 mRNA 中异常提前出现的终止密码子,一经发现,立即降解异常的mRNA ,防止其翻译。
在大多数情况下,检测可变剪接造成的蛋白质异构体之间功能上的差异的实验还没有开展。
最近发展的RNAi 技术,可以适应高通量的从功能基因组水平研究各基因可变剪接异构体的功能的要求。
2000年已经有人将RNAi 技术应用于模式生物线虫的可变剪接异构体的大规模研究上。
(目前已经大量开始用于哺乳动物系统)2. 多样性与复杂性可变剪接是从相对简单的基因组提高蛋白质组多样性的重要机制,蛋白质组的多样性与多细胞高等生物的复杂性相适应。
从可变剪接涉及的基因分布格局分析,可变剪接多发生在参与信号传导和表达调节等复杂过程的基因上,如受体,信号传导通路(凋亡),转录因子等。
对个体分化发育和一些关键的细胞生理过程如凋亡、细胞兴奋等的精确调控有重要意义。
从可变剪接涉及的基因系统分类分析,可变剪接多发生在免疫和神经等复杂系统。
正如Dscam 基因所示,可变剪接产生的多样性,赋予这些系统精确处理复杂信息相适应的潜力。
第二部分可变剪接的调节机制7可变剪接能够产生惊人的多样性,但我们对其调节机制所知不多。
剪接位点的选择受到结合到非剪接位点RNA 元件的剪接因子的多重调节。
参与可变剪接调节的RNA 元件包括ESE 、ISE 、ESS 、ISS 。
剪接因子包括SR 和hnRNP 家族蛋白等多种因子。
真核生物新生的mRNA 前体经过5’戴帽,剪接,3’加尾等加工成为成熟的mRNA 。
在剪接反应过程中,含有内含子和外显子的新生的mRNA 前体,在剪接体作用下切除内含子,并将外显子依次连接起来的过程。
剪接反应由剪接体执行,剪接体包括5个小核糖核蛋白复合体U1,U2,U4,U5 和U6 snRNPs ,和50-100种非snRNP 蛋白。
剪接体通过RNA-RNA,RNA-蛋白质,蛋白质-蛋白质等多重相互作用以精确切除每个内含子和以正确次序连接外显子。
为有效剪接,绝大部分内含子需要:1. 一个保守的5’剪接位点,A/CAG↓GURAGU ;2. 一个分支点序列,后面跟着一个多聚嘧啶Pytract Y10-20;3. 一个3’剪接位点Y AG 。
剪接体的形成是一个多步骤依次进行过程,形成多个中间体:1 E -复合体形成:U1snRNA 通过碱基互补识别5’剪接位点,SR 蛋白结合。
U2AF65和U2AF35识别多聚嘧啶Pytract 和3’剪接位点;2 A -复合体形成:U2snRNA 通过碱基互补识别分支点序列BPS ;需ATP ;3 B -复合体形成:U4/U6 _ U5 tri-snRNP随后与mRNA 结合;4 C -复合体形成:最后,RNA-RNA,RNA-蛋白质相互作用构象改变形成有催化活性的剪接体。
(见图1)一、参与可变剪接的RNA 顺式作用元件:根据它们所在的位置和作用特点,分为4类:1.ESE: exon splicing enhancer 外显子剪接增强子;2.ISE: intron splicing enhancer 内含子剪接增强子;3.ESS: exon splicing silencer 外显子剪接沉默子;4.ISS: intron splicing silencer 内含子剪接沉默子。
ESE 和ISE 是剪接因子SR 蛋白结合位点,提高相邻剪接位点的活性。
ESS 和ISS 是hnRNP 蛋白结合位点,抑制相邻剪接位点的活性。
ESE 、ISE 、ESS 、ISS 都是很短的序列基序,一般由6-10碱基组成。
每一类成员内部之间即有相对的特异性,也有简并性,作用有交叉和冗余。
二、SR 蛋白SR 蛋白是一个多细胞生物中高度保守的剪接因子家族,其成员多带有一个或二个拷贝的RNA 识别基序(RRM ),后面有一个精氨酸/丝氨酸富含结构域(RS )。
RRM 介导RNA 结合,并决定各SR 蛋白的底物特异性;RS 结构域参与蛋白-蛋白间相互作用。
各SR 蛋白在固有剪接和可变剪接中有多种作用。