当前位置:文档之家› 可变剪接与蛋白质组多样性及其调节机制解读

可变剪接与蛋白质组多样性及其调节机制解读

可变剪接与蛋白质组多样性及其调节机制解读
可变剪接与蛋白质组多样性及其调节机制解读

可变剪接与蛋白质组多样性及其调节机制

武春晓 2001级博士生专业:免疫学导师:马大龙教授

前言

可变剪接是指从一个mRNA 前体中通过不同的剪接方式(选择不同的剪接位点组合)产生不同的mRNA 剪接异构体的过程。可变剪接是调节基因表达和产生蛋白质组多样性的重要机制。剪接过程受多种顺式作用序列和反式作用因子相互作用调节。包括SR 和hnRNP 家族蛋白在内的多种剪接因子参与这一调节过程。转录机器(machine )也参与可变剪接的调节。本文将讨论:一. 可变剪接与蛋白质组多样性二. 可变剪接的调节机制。.

第一部分可变剪接与蛋白质组多样性5

据预测,人类基因组可能有约35,000个基因,果蝇约14,000个,而简单的模式生物线虫约19,000个基因。生物的复杂性与其基因组基因数量似乎存在明显差异。原因在蛋白质组。基因重排,RNA 编辑,和可变剪接等机制可以从一个基因产生多种蛋白,从而使蛋白质组中蛋白质的数量超过基因组中基因的数量。其中,从影响的基因数量和生物种类范围来

-看,可变剪接是扩大蛋白质多样性的最重要的机制14。

一、可变剪接的频率。5,6

1. 5%。从1977年Walter Gilbert提出可变剪接概念,1980年Baltimore 在小鼠IgM 基因发现第一个可变剪接产生膜型、分泌型IgM ,至2001年,用经典分子生物学实验的方法研究,一共仅发现了数百种有可变剪接的基因。并推测在高级真核细胞生物约5%的基因有可变剪接。

2. 35%-60%。高通量的基因组测序和EST 测序,使得生物信息学的方法研究可变剪接成为可能。EST 来源于完全加工的mRNA, 它们提供了一个广泛的mRNA 多样性的样品库。这种多样性可以用计算机分析。最近两年,多个研究小组通过不

同的生物信息学的方法,从整个人基因组的水平进行分析,结果一致显示约35%-60%的人基因有可变剪接形式。而且,由于对大多数基因来说,每个基因只测了很少几EST 甚至没有EST ;EST 不是全长的mRNA ,多位于mRNA 的5’和3’端;EST 来源于有限的组织和发育阶段;很有可能存在有更多的可变剪接而在现在的EST 库中没有显示。因此实际可变剪接的频率可能比预测的更高。这还有待于建立新的高通量的分子生物学方法,如生物芯片的方法,以进一步实验验证。

二、单个基因可变剪接产生的多样性5。

一个基因可以通过如下几种方式产生多个转录体,如不同的转录起始位点,可变剪接,选择不同的加尾信号位点,RNA 编辑等。可变剪接包括3种类型:1. 内含子的保留;2. 可变外显子的保留或切除;3. 3’和5’剪接位点的转移(shift )导致外显子的增长或缩短。可变剪接对蛋白质结构的影响也是多样性的,如多肽链中一个到数百个氨基酸的增加或减少;某功能域的有无;如果可变剪接使读码框架改变,则可能无法有效翻译,mRNA 被监视系统降解。

单独一个基因通过可变剪接产生的十几种剪接异构体的现象很常见。有些基因甚至能够产生成千上万种剪接异构体。最突出的例子是果蝇(Drosophila melanogaster )的Dscam 基因,可以通过可变剪接产生38,000多种mRNA 异构体。Dscam 基因编码一个神经元轴突定向受体,它细胞外有一个由10个免疫球蛋白重复序列组成的结构域,第2,3,7个免疫球蛋白重复序

列分别由第4,6,9号外显子编码,4号外显子盒(cassette )有12个变异体,6号外显子有48个变异体,9号外显子有33个变异体,再加上17号外显子的2个变异体。每个成熟的Dscam mRNA 分别只有一个有4,6,9,17号外显子的变异体,由此理论推测Dscam 基因共有12×48×33×2=38016剪接异构体。对Dscam 基因50个cDNA 克隆随机测序发现了49种不同的剪接异构体,说明实际存在的剪接异构体即使没有理论那么多,也至少有上千种。人的Neurexins, n-Cadherins, calcium-activated potassium channels等基因也有类似的高度多样的剪接异构体。

上述现象非常类似于淋巴细胞TCR 或免疫球蛋白的胚系基因重排,不同之处在于后者发生在DNA 水平,前者发生在RNA 水平。基因重排产生的高度多样抗原受体库可以识别高度复杂的自身和异己抗原。而Dscam 基因的转录异构体可能有神经系统的发育有关。神经元的定向迁移和相互连接可能是发育过程中最复杂的事件。果蝇约有25,000个神经元,要使它们生长的轴突准确的,可重复性的到达目的地,使这些神经元准确的连接在一起,必然需要一个特殊的系统。Dscam 基因的38,000多种mRNA 异构体,每个异构体各编码一个不同的受体,每个受体具有识别不同分子定向信号的潜能,从而有能力指导各个生长的轴突到达准确的位置。

如果将可变剪接与其它RNA 加工过程(如RNA 编辑)联系起来共同考虑,基因产物会更复杂。例如,果蝇的para 基因(voltage-gated action potential sodium channel)有13个可变外显子,可编码1536种不同的mRNA ,另外,para 的转录体还要经过在11个已知位点的RNA 编辑,这样理论上一共可以产生1,032,192个不同的para 转录异构体。

根据受可变剪接影响的基因的概率,以及单个基因可能产生的可变剪接体的数目,足以表明可变剪接对蛋白质组多样性的巨大影响。

三、可变剪接的功能和生物学意义5,11

1. 可变剪接是在RNA 水平调控基因表达的机制之一。

一个基因通过可变剪接产生多个转录异构体,各个不同的转录异构体编码结构和功能不同的蛋白质,它们分别在细胞/个体分化发育不同阶段,在不同的组织,有各自特异的表达和功能。因此,可变剪接是一种在转录后RNA 水平调控基因表达的重要机制。

目前已知的可变剪接异构体中,只有一小部分明确确定了功能和生物学意义。第一个确定的可变剪接异构体功能是 IgM 基因,其末端最后两个外显子的可变剪接,决定了所编码的膜型/分泌型IgM 的产生。最著名的例子是果蝇性别决定系

统,在此系统中,至少5个基因(sxl, tra, msl2, dsx, and fru 转录体的可变剪接级联反应最终决定了果蝇雄性和雌性性别特征的表达。有些基因,可变剪接造成的蛋白质异构体之间功能上的差异没有被实验检测出来。不过阴性的结果不能代表没有功能差异,只是目前没有检测出来而已。也有很多异构体造成读码框架改变,不能被翻译为蛋白质,而是直接被降解了。真核生物也有mRNA 监视系统NMD(nonsense-mediated degradation,检测 mRNA 中异常提前出现的终止密码子,一经发现,立即降解异常的mRNA ,防止其翻译。在大多数情况下,检测可变剪接造成的蛋白质异构体之间功能上的差异的实验还没有开展。最近发展的RNAi 技术,可以适应高通量的从功能基因组水平研究各基因可变剪接异构体的功能的要求。2000年已经有人将RNAi 技术应用于模式生物线虫的可变剪接异构体的大规模研究上。(目前已经大量开始用于哺乳动物系统)

2. 多样性与复杂性

可变剪接是从相对简单的基因组提高蛋白质组多样性的重要机制,蛋白质组的多样性与多细胞高等生物的复杂性相适应。从可变剪接涉及的基因分布格局分析,可变剪接多发生在参与信号传导和表达调节等复杂过程的基因上,如受体,信号传导通路(凋亡),转录因子等。对个体分化发育和一些关键的细胞生理过程如凋亡、细胞兴奋等的精确调控有重要意

义。从可变剪接涉及的基因系统分类分析,可变剪接多发生在免疫和神经等复杂系统。正如Dscam 基因所示,可变剪接产生的多样性,赋予这些系统精确处理复杂信息相适应的潜力。

第二部分可变剪接的调节机制7

可变剪接能够产生惊人的多样性,但我们对其调节机制所知不多。剪接位点的选择受到结合到非剪接位点RNA 元件的剪接因子的多重调节。参与可变剪接调节的RNA 元件包括ESE 、ISE 、ESS 、ISS 。剪接因子包括SR 和hnRNP 家族蛋白等多种因子。

真核生物新生的mRNA 前体经过5’戴帽,剪接,3’加尾等加工成为成熟的mRNA 。在剪接反应过程中,含有内含子和外显子的新生的mRNA 前体,在剪接体作用下切除内含子,并将外显子依次连接起来的过程。剪接反应由剪接体执行,剪接体包括5个小核糖核蛋白复合体U1,U2,U4,U5 和U6 snRNPs ,和50-100种非snRNP 蛋白。剪接体通过RNA-RNA,RNA-蛋白质,蛋白质-蛋白质等多重相互作用以精确切除每个内含子和以正确次序连接外显子。

为有效剪接,绝大部分内含子需要:

1. 一个保守的5’剪接位点,A/CAG↓GURAGU ;

2. 一个分支点序列,后面跟着一个多聚嘧啶Pytract Y10-20;

3. 一个3’剪接位点Y AG 。

剪接体的形成是一个多步骤依次进行过程,形成多个中间体:

1 E -复合体形成:U1snRNA 通过碱基互补识别5’剪接位点,SR 蛋白结合。U2AF65和U2AF35识别多聚嘧啶Pytract 和3’剪接位点;

2 A -复合体形成:U2snRNA 通过碱基互补识别分支点序列BPS ;需ATP ;

3 B -复合体形成:U4/U6 _ U5 tri-snRNP随后与mRNA 结合;

4 C -复合体形成:最后,RNA-RNA,RNA-蛋白质相互作用构象改变形成有催化活性的剪接体。

(见图1)

一、参与可变剪接的RNA 顺式作用元件:

根据它们所在的位置和作用特点,分为4类:

1.ESE: exon splicing enhancer 外显子剪接增强子;

2.ISE: intron splicing enhancer 内含子剪接增强子;

3.ESS: exon splicing silencer 外显子剪接沉默子;

4.ISS: intron splicing silencer 内含子剪接沉默子。

ESE 和ISE 是剪接因子SR 蛋白结合位点,提高相邻剪接位点的活性。ESS 和ISS 是hnRNP 蛋白结合位点,抑制相邻剪接位点的活性。ESE 、ISE 、ESS 、ISS 都是很短的序列基序,一般由6-10碱基组成。每一类成员内部之间即有相对的特异性,也有简并性,作用有交叉和冗余。

二、SR 蛋白

SR 蛋白是一个多细胞生物中高度保守的剪接因子家族,其成员多带有一个或二个拷贝的RNA 识别基序(RRM ),后面有一个精氨酸/丝氨酸富含结构域(RS )。RRM 介导RNA 结合,并决定各SR 蛋白的底物特异性;RS 结构域参与蛋白-蛋白间相互作用。各SR 蛋白在固有剪接和可变剪接中有多种作用。其中之一是识别并结ESE 或ISE ,提高相邻剪接位点的活性。SR 蛋白的底物ESE/ISE含有简并性的共有识别序列基序,因此不同SR 蛋白之间底物有交叉,其特异性取决于SR 蛋白各自的表达水平、亲和力和与其它蛋白的相互作用。

SR-相关蛋白(SRrp )是另一组带有SR 结构域,并参与剪接反应的蛋白。它们可能有RRM ,如U1-70K 蛋白,U2AF65/35,SRm160/300KD(两个SR 相关核基质蛋白),和可变剪接调控因子,如Tra 和Tra2。SR 与SRrp 都可以增强相邻弱(suboptimal )剪接位点的活

性。

图1。

三、hnRNP 蛋白

hnRNP 蛋白是一组由多种RNA 结合蛋白组成的具有多种功能的多肽家族。其成员带有多种不同形式的RNA 结合基序和富含甘氨酸结构域。富含甘氨酸结构域可能参与蛋白-蛋白相互作用。hnRNP A 、B 、C 家族的蛋白与新生的mRNA 前体组装成40S 的结构。多种hnRNP 蛋白始终伴随mRNA ,影响mRNA 的剪接,出核转运,甚至在胞浆的翻译,RNA 定位,和降解。

四、SR 蛋白和hnRNP A/B蛋白在剪接位点选择中的拮抗作用

单个SR 蛋白在5’位点的选择使用上有相似作用:增加蛋白浓度,结果将在pre-mRNA 的两个或多个5’可变剪接位点中促进选择使用内含子近端的5’位点。值得注意的是,hnRNP A/B蛋白作用正好相反:它们促进选择内含子远端的5’位点。不同SR 蛋白个体有时可能作

用相反。如SF2/ASF 和 SC35在β-tropomyosin 可变剪接调节中的拮抗作用。

SF2/ASF与hnRNP A1的功能拮抗作用基于它们对mRNA 前体的竞争性结合。用双5’剪接位点mRNA 前体为底物实验,表明SF2/ASF 干扰hnRNPA1对双5’位点的结合,同时增高了U1 snRNP的对两个5’位点的结合,在此条件下近内含子的5’位点被选择剪接(与3’位点最近)。相反,hnRNPA1非选择性的结合到此mRNA 前体,同时干扰了U1 snRNP的对两个5’位点的结合,结果是选择了远端的5’位点。

SR 蛋白和hnRNP A/B蛋白一般不需要识别特异性的靶序列,就可发挥对可变剪接位点的选择作用。但它们要发挥增强子或沉默子的作用,就必须结合到特异性的位点。在增强子依赖性剪接中,SR 家族蛋白结合到ESE ,就能够促进招募

U2AF 到多聚嘧啶序列PY -tract ,而活化邻近的3’剪接位点。ESE 结合的SR 蛋白通过RS 结构域介导与U2AF35亚基的相互作用参与这一活性。或者,ESE 结合SR 蛋白可能与剪接共活化因子SRm160作用,通过一系列反应招募U2AF65到多聚嘧啶序列PY -tract 。最后,剪接增强子ESE 可以拮抗由识别外显子剪接沉默子ESS 的hnRNP 蛋白的介导的抑制作用。例如,在HIV-1 tat基因,其外显子3含有SF2/ASF 和 SC35-依赖性ESE ,和一个结合hnRNP A1的沉默子ESS3。hnRNP A1结合ESS3后可以引发hnRNP A1与外显子上游区域的结合。ESE 结合的

SF2/ASF,可阻止此作用;而SC35不能拮抗hnRNP A1的作用。因此,此ESS3抑制SC35,而非 SF2/ASF依赖的剪接。

SR 和hnRNP A/B蛋白的相对浓度,也是影响组织和发育特异性可变剪接格局的重要调节因素。在不同的组织,SR 蛋白的总浓度和个体浓度不同,特别是

SF2/ASF和它的拮抗剂hnRNP A1的分子摩尔比更是不同。另外,蛋白磷酸化可调节SR 和hnRNP A/B蛋白活性。提示可变剪接受细胞外信号的调节。SR 蛋白家族成员功能有重叠和冗余,但各成员也有一定特异性。

五、多聚嘧啶序列结合蛋白(PTB

PTB ,又称hnRNP1,识别3’剪接位点前的多聚嘧啶序列,有抑制剪接作用。机制可能是与U2AF 竞争性结合多聚嘧啶序列。PTB 自身就有3个剪接变异体PTB1,2,3,各自在可变剪接中有不同的作用。

六、CELF 蛋白家族

CELF 家族的蛋白(CUG-BP 和 ETR3-like factors 参与细胞特异性和发育调节的可变剪接。这些RNA 结合蛋白包含3个RRM 和一个功能未知的接头。CELF3和CELF5仅在脑组织表达;CUG-BP ,ETR-3和CELF4表达较广泛,但在脑组织和横纹肌表达受发育调控。CELF 蛋白结合到cTNT 基因的肌肉特异性增强子

MSE ,并促进受发育调节的外显子5的保留(inclusion )。

七、组织特异性因子

一般性剪接因子之间的拮抗作用,如SR 蛋白和hnRNP 蛋白,是造成多种的可变剪接形式的原因之一。而组织和发育特异性调节的剪接因子,也在可变剪接的调节中也发挥着重要作用。但寻找这种剪接因子的进展非常缓慢。

在神经系统可变剪接是一种普遍现象。NOV A1是一种带有KH RNA结合结构域(hnRNP K homology)的神经元特异性RNA 结合蛋白,它调节神经元特异性可变剪接,是神经元的功能活性必需的因子。NOV A1识别GlyR α2 pre-mRNA 可变外显子3A 相邻的一个内含子位点,促使该外显子的保留。该活性被另一个神经元富含的剪接因子brPTB 拮抗。brPTB 是PTB 的一种异构体,它可以诱导hnRNP 复合体的组装(packing ),封闭了可变外显子3A 的剪接体识别位点,使之被切除。同样brPTB 介导了c-src pre-mRNA N1外显子的神经元特异性剪接。

八、多重调控即使是一个剪接位点的选择,也往往是剪接信号和多种调节信号ESE,ISE, ESS,ISS 等及相应的多种剪接因子组成的复合体的共同作用的结果。而不是由单个的基因特异性的因子所决定。这种机制非常类似于基因的表达调控,其优点在于:1.特异性:剪接信号和多种调节信号序列都很短,且有简并性,单个信号的一级结构的信息量很少,而剪接复合体多种成分之间弱相互作用

的叠加可以产生特异性的识别。2.敏感性:不同细胞剪接复合体某个成分发生改变,同时其它成分保持稳定,则可以产生敏感的反应。九、转录在可变剪接中的作用10 转录和mRNA前体的加工、转运、降解并不是相互独立的过程。 RNA 聚合酶Ⅱ(POLⅡ)的延伸过程与mRNA前体的三个加工过程(戴帽、剪接、加尾)在时间和空间上高度协同。 POLⅡ靶基因的转录活化将招募SR蛋白到转录区域。RNA POLⅡC末端结构域(CTD)介导mRNA 的合成与剪接的偶联作用。抗RNA POLⅡ或CTD的抗体可以免疫共沉淀SR蛋白,并可在体内和体外阻断mRNA的剪接加工。无CTD或CTD截短的RNA POLⅡ产生的转录本不能被有效的剪接。调节基因表达的启动子结构也影响可变剪接。例如,有人将受不同的启动子启动的,带有可变剪接外显子EDI的α-globin/fibronectin 微基因转染人细胞系,发现在FN 或 CMV启动子作用下, EDI的保留比α-globin启动子高10倍左右。 EDI带有一个ESE,是SR蛋白SF2/ASF 和9G8的靶点。SF2/ASF和9G8过表达促进EDI的保留,但此作用受启动子的调节。十、转录和可变剪接偶联的分子模型7,10 1. 启动子模型。启动子或增强子可能通过与之结合的转录因子来招募SR家族蛋白。例如:P52,一种转录辅助活化因子,可以直接于SF2/ASF作用而促进mRNA前体剪接。另外一些蛋白可能有双重功能:即参与转录,也参与剪接。如人转录活化因子PGC-1, 它可以促进一个可变外显子的保留,但此作用只有在它被招募到与基因启动子相互作用的转录复合体时才有这种作用。当启动子突变,招募PGC1的转录因子不能结合到DNA时,PGC1就没有这种效应。其它转录因子,如WT1和SAF-B,也有偶联剪接的作用。Prp40, ESS1,CA150三用。一组称为SR样CTG结合因子(SCAF),与SR蛋白相似,带有RS结构域和RNA结合结构域,有人推测它们也可能具有偶联剪接和转录的功能。 2。延伸速率模型。启动子替换法是一种有效的研究转录对可变剪接的调节作用的方法。然而自然界不存在启动子替换现象。另一种方法是用不同的转录因子作用于同一个启动子,以研究转录和可变剪接的偶联机制。最近,有报道SV40T-Ag和VP16两种转录因子对可变剪接有截然相反的作用。一方面,SV40T-Ag降低RNA POLⅡ的延伸活性,增加了FN EDI外显子的保留。另一方面,VP16促进RNA POLⅡ的延伸活性,抑制了EDI的保留。这就是延伸速率模型的基础,即RNA POLⅡ延伸速

度减慢,或中间停顿,则有利于可变剪接外显子上游的内含子的切除,一般该内含子3’剪接位点效应较弱。等RNA POLⅡ继续前进,剪接体只能切除下游的内含子,使得可变外显子保留。如果RNA POLⅡ延伸速度快,或没有中间停顿,则两个3’ 剪接位点之间竞争,下游的强3’ 剪接位点效应更强,导致了可变外显子的去除。另外,延伸速率对RNA二级结构的作用,或RNA POLⅡ停止位点迟缓ESE,ESS转录的作用,也影响可变剪接。结束语:发现新的可变剪接异构体,确定每个异构体的独特功能和生物学意义,并阐明其调节机

制,是功能基因组时代研究的一个重要领域。在这一领域研究中,除利用经典的分子生物学技术外,还需建立新的高通量的技术,如生物芯片技术,RNAi 技术等,并要与生物信息学技术紧密结合,同时需要细胞生物学、生物化学、临床与病理学、免疫学等多学科的协作,才有可能对这一重要的生命现象有所了解。参考文献 1 Ewing, B. and Green, P. (2000 Analysis of expressed sequence tags indicates 35,000 human genes. Nat. Genet. 25, 232–234 2. Adams, M.D. et al. The genome sequence of Drosophila melanogaster. Science 287, 2185–2195 (2000. 3. The C. elegans Sequencing Consortium. Genome sequence of the nematode C. 4 Pennisi, E. Human genome project: and the gene number is...? Science 288, 1146–1147 (2000. 5 Brenton R. Graveley Alternative splicing: increasing diversity in the proteomic world. TRENDS in Genetics Vol.17 No.2 February 2001 6. Barmak Modrek & Christopher Lee. A genomic view of alternative splicing nature genetics ? volume 30,13-19 ?January 2002 7. Javier F. Cá ceres and Alberto R. Kornblihtt Alternative splicing: multiple control mechanisms and involvement in human disease TRENDS in Genetics Vol.18 No.4,186-193 April 2002 8 Michelle L Hastings and Adrian R Krainer Pre-mRNA splicing in the new millennium. Current Opinion in Cell Biology 2001, 13:302–309 9 Douglas L. Black Protein Diversity from Alternative Splicing: A Challenge for Bioinformatics and Post-Genome Biology. Cell, Vol. 103, 367–370, October 27, 2000, 10 Aaron C. Goldstrohm, Arno L. Greenleaf, Mariano A. Garcia-Blanco . Co-transcriptional splicing of pre-messenger RNAs: considerations for the mechanism of alternative splicing. Gene 277 (2001 31–47 11

Malka Nissim-Rafinia and Batsheva Kerem TRENDS in Genetics Vol.18 No.3 March 2002

可变剪接

可变剪接:有些基因的一个mRNA前体通过不同的剪接方式(选择不同的剪接位点)产生不同的mRNA剪接异构体,这一过程称为可变剪接(或选择性剪接,alternative splicing) 。可变剪接是调节基因表达和产生蛋白质组多样性的重要机制,是导致人类基因和蛋白质数量较大差异的重要原因。 基本内容 大多数真核基因转录产生的mRNA前体是按一种方式剪接产生出一种成熟mRNA分子,因而只翻译成一种蛋白质。但有些基因的一个mRNA前体通过不同的剪接方式(选择不同的剪接位点)产生不同的mRNA剪接异构体,这一过程称为可变剪接(或选择性剪接, alternative splicing)。由于RNA的可变剪接不牵涉到遗传信息的永久性改变.所以是真核基因表达调控中一种比较灵活的方式。可变剪接是调节基因表达和产生蛋白质组多样性的重要机制, 是导致人类基因和蛋白质数量较大差异的重要原因。 可变剪接形式的识别 真核细胞核内前体mRNA加工通过5’加帽、剪接(移除内含子)、3’末端切割加尾.从而形成成熟的mRNA.成熟的mRNA和hnRNP及其他蛋白质形成复合体输出核外再经过选择性降解参与翻译。这些步骤并不是简单的线性顺序.而是在转录物延伸期和转录同时发生的。从而形成一个大型的“生产链。 一般认为,可变剪接有5种基本形式:①内含子保留;②可变的5’端;③可变的3’端; ④外显子盒;⑤互斥外显子(一组外显子中只选其一)。也有分为7种形式的,加上可变的起始或末端外显子,而这两种形式更有可能是可变启动子、可变polyA位点造成的。可进行专门分析。 可变剪接的意义和作用 可变剪接被认为是导致蛋白质功能多样性的重要原因之一,它使一个基因可编码多个不同转录产物和蛋白产物。 可变剪接也是产生基因组规模与生物复杂性之间的矛盾根源之一。 已有实验研究表明,可变剪接在产生受体多样性、控制调节生长发育等方面起决定性作用。尤其表现在神经系统和免疫系统,这与该类系统的功能多样性和反应敏感性是密切相关的。许多遗传疾病都与剪接繁盛异常紧密相关据估计。导致疾病的变异中约15%会影响pre—mRNA的剪接。

蛋白质组学与分析技术1

名词解释 蛋白质组学:是研究与基因对应的蛋白质组的学科。指一种基因组所表达的全套蛋白质,即包括一个基因组、一种细胞或组织,乃至一种生物所表达的全部蛋白质。 双向电泳原理:双向一般是指第一向为等点聚焦(IEF),根据蛋白质等电点进行分离;第二向为SDS凝胶电泳(SDS-PAGE),根据蛋白质的相对分子量进行分离。 三步纯化策略:第一步粗提,浓缩,稳定蛋白,去除蛋白酶,使用梯度洗脱来增加捕获步骤的速度和容量;第二步中度纯化,去除主要杂质,一般需要连续梯度洗脱; 第三步精纯,最终去除痕量杂质,如目标蛋白的结构变体。 高效液相色谱:是一种以高压输出液体为流动相的色谱技术。在技术上采用高压输液泵、高效固定相和高灵敏度检测器,克服了经典液相色谱固定相柱效低,分析周期 长的缺点,具有分析速度快、分离效率高、检出极限地的特点。 吸附色谱:吸附色谱系色谱法之一种,利用固定相吸附中对物质分子吸附能力的差异实现对混合物的分离,吸附色谱的色谱过程是流动相分子与物质分子竞争固定相吸 附中心的过程。 PCR扩增:即聚合酶链式反应,是体外酶促合成特异DNA片段的一种方法,由高温变性、低温退火(复性)及适温延伸等反应组成一个周期,循环进行,使目的DNA 得以迅速扩增,具有特异性强、灵敏度高、操作简便、省时等特点。 基因组文库:基因文库是指整套由基因组DNA片段插入克隆载体获得的分子克隆的总和。 广义的基因文库指来于单个基因组的全部DNA克隆,理想情况下应含有这一 基因组的全部DNA序列(遗传信息),这种基因文库常通过鸟枪法获得。 狭义的基因文库有基因组文库和cDNA文库之分。 cDNA文库:按构建基因文库的类似方法对cDNA进行克隆,获得的克隆总称。 基因芯片:基因芯片又叫DNA芯片(DNA chip),DNA微阵列(DNA microarray), DNA集微芯片(DNA microchip),寡核苷酸阵列(oligonucleotide array)是一种将核酸分子杂交原理与微电子技术相结合而形成的高新生物技术。将靶标样品核酸或探针中的任一方按阵列形式固定在固相载体(硅片、尼龙膜、聚丙烯膜、硝酸纤维素膜、玻璃片等)上,另一方用荧光分子标记后,加样至微阵列上杂交,然后用荧光扫描或摄像技术记录,通过计算机软件分析处理,获得样品中大量的基因序列和表达信息。 基因敲除(gene knock out):又称基因打靶(gene targeting),是指用外源的DNA与受体细

微生物制剂MP代谢产物的蛋白质组分析

101赵敏等 微生物制剂MP代谢产物的蛋白质组分析 生物技术 微生物制剂MP代谢产物的蛋白质组分析 赵敏1,汪长国1,李宁1,夏庆友2,3,戴亚1 1川渝中烟工业有限责任公司技术中心,成都市成龙大道1段56号 610066; 2 西南大学家蚕基因组生物学国家重点实验室,重庆市北碚区天生路2号 400715; 3 西南大学生物技术学院,重庆市北碚区天生路2号 400715 摘 要:为明确微生物制剂MP提高烟叶品质的原因,以该制剂的代谢产物作为研究材料,采用液相色谱串联质谱法(LC-MS/ MS)分析了微生物制剂MP代谢产物的蛋白质组成分。结果共鉴定出35个非重复蛋白质,蛋白等电点几乎均在4-7范围内,分子量均大于20 kD。KEGG代谢通路分析显示,所鉴定的蛋白几乎都与代谢有关,其中参与氨基酸代谢、糖酵解、三羧酸循环、丙酮酸盐代谢的蛋白最多。其中,氨基酰组氨酸二肽酶、嗜热菌状金属蛋白酶、尿刊酸水合酶和组氨酸氨裂解酶能有效降低烟叶中蛋白质。 关键词:微生物制剂MP;LC-MS/MS;KEGG;烟叶;蛋白降解 doi:10.3969/j.issn.1004-5708.2013.05.018 中图分类号:TS416;TQ937 文献标识码:A 文章编号:1004-5708(2013)05-0101-06 Proteome analysis of metabolic products by microbial agents MP ZHAO Min1, WANG Changguo1, LI Ning1, XIA Qingyou2,3 , DAI Ya1 1 Technical Center, China Tobacco Chuanyu Industrial Corporation, Chengdu, 610066 China; 2 State Key Laboratory of Silkworm Genome Biology, Southwest University, Chongqing 400715,China; 3 College of Biotechnology, Southwest University, Chongqing 400715,China Abstract: Proteome of MP metabolic productions was analyzed by LC-MS/MS to determine the mechanism of MP in increasing tobacco quality. 35 non-repeated proteins were identi?ed whose isoelectric point fall within the scope of 4 to 7 and molecular weight are more than 20 kD. KEGG analysis indicated that those proteins were involved in metabolic pathways especially in amino acid metabolism, glycolysis, tricarboxylic acid cycle and pyruvate metabolism. Enzymes such as aminoacyl-histidine dipeptidase, thermolysin-like metalloprotease, HutU urocanate hydratase and histidine ammonia-lyase, function in protein degradation were vital for increasing tobacco quality after MP spraying. Keywords: Microbial agent MP; LC-MS/MS; KEGG; tobacco leaf; protein degradation 烟草(Nicotiana tabacum)是重要经济作物,也是植物学研究中的重要模式植物。汪长国等人从烟田土壤中分离筛选出的芽孢杆菌并制备成一种微生物制剂MP,采收前烟叶喷施MP制剂可改善烟叶重要香味成分和蛋白质含量,提高烟叶品质[1]。赵敏等人研究发现,喷施微生物制剂MP后烟叶中可能具有抗菌功能的组织蛋白酶B基因表达量增加[2],与植物抗病性相关的几丁质酶和逆渗透蛋白表达量也有增加[3]。但该制剂分泌的代谢产物含有哪些蛋白以及这些蛋白对烟叶品质的作用机制还有待于进一步研究。 “鸟枪法”(Shotgun)蛋白质学研究策略是基于复杂蛋白质混合物的酶解,它可以大规模的筛选复杂样品中的多肽和蛋白,并快速鉴定细胞、组织和器官中的蛋白质表达谱[4-6],其基本原理是蛋白质溶液或经过SDS-PAGE分离的蛋白质条带经过酶解后形 作者简介:赵敏,博士研究生,工程师,主要从事微生物与烟叶品质等方面的研究,Email: lszhaomin@https://www.doczj.com/doc/6d11969372.html, 通讯作者:戴亚,教授,主要从事烟草化学、降焦减害等方面的研究,Email:dycy@https://www.doczj.com/doc/6d11969372.html, 收稿日期:2012-10-12

蛋白质组学生物信息学分析介绍

生物信息学分析FAQ CHAPTER ONE ABOUT GENE ONTOLOGY ANNOTATION (3) 什么是GO? (3) GO和KEGG注释之前,为什么要先进行序列比对(BLAST)? (3) GO注释的意义? (3) GO和GOslim的区别 (4) 为什么有些蛋白没有GO注释信息? (4) 为什么GO Level 2的统计饼图里蛋白数目和差异蛋白总数不一致? (4) 什么是差异蛋白的功能富集分析&WHY? (4) GO注释结果文件解析 (5) Sheet TopBlastHits (5) Sheet protein2GO/protein2GOslim (5) Sheet BP/MF/CC (6) Sheet Level2_BP/Level2_MF/Level2_CC (6) CHAPTER TWO ABOUT KEGG PATHWAY ANNOTATION (7) WHY KEGG pathway annotation? (7) KEGG通路注释的方法&流程? (7) KEGG通路注释的意义? (7) 为什么有些蛋白没有KEGG通路注释信息? (8) 什么是差异蛋白的通路富集分析&WHY? (8) KEGG注释结果文件解析 (8) Sheet query2map (8) Sheet map2query (9) Sheet TopMapStat (9) CHAPTER THREE ABOUT FEATURE SELECTION & CLUSTERING (10) WHY Feature Selection? (10)

聚类分析(Clustering) (10) 聚类结果文件解析 (10) CHAPTER FOUR ABOUT PROTEIN-PROTEIN INTERACTION NETWORK (12) 蛋白质相互作用网络分析的意义 (12) 蛋白质相互作用 VS生物学通路? (12) 蛋白质相互作用网络分析结果文件解析 (12)

蛋白质组学与分析技术课复习思1考

蛋白质组学与分析技术课复习思考 一、名词解释 1、蛋白质组学: 蛋白质组学是研究与基因对应的蛋白质组的学科,蛋白质组(proteome)一词,源于蛋白质(protein)与基因组(genome)两个词的杂合,意指“一种基因组所表达的全套蛋白质”,即包括一种细胞乃至一种生物所表达的全部蛋白质。 2、二维(双向)电泳原理: 根据蛋白质的等电点和相对分子质量的特异性将蛋白质混合物在第一个方向上按照等电点高低进行分离,在第二个方向上按照相对分子质量大小进行分离。二维电泳分离后的蛋白质点经显色,通过图象扫描存档,最后是呈现出来的是二维方向排列的,呈漫天星状的小原点,每个点代表一个蛋白质。 3、三步纯化策略: 第一步:粗提。纯化粗样快速浓缩(减少体积) 和稳定样品(去除蛋白酶) 最适用层析技术: 离子交换/疏水层析 第二步:中度纯化。去除大部分杂质 最适用层析技术: 离子交换/疏水层析 第三步:精细纯化。达到最终纯度(去除聚合物,结构变异物) 最适用层析技术:凝焦过滤/离子交换/疏水层析/反相层析 4、高效纯化策略 在三步纯化蛋白质过程中,同时考虑到纯化的速度、载量、回收率及分辨率的纯化策略。5、离子交换色谱: 离子交换色谱中的固定相是一些带电荷的基团,这些带电基团通过静电相互作用与带相反电荷的离子结合。如果流动相中存在其他带相反电荷的离子,按照质量作用定律,这些离子将与结合在固定相上的反离子进行交换。固定相基团带正电荷的时候,其可交换离子为阴离子,这种离子交换剂为阴离子交换剂;固定相的带电基团带负电荷,可用来与流动相交换的离子就是阳离子,这种离子交换剂叫做阳离子交换剂。阴离子交换柱的功能团主要是-NH2,及-NH3 :阳离子交换剂的功能团主要是-SO3H及-COOH。其中-NH3 离子交换柱及-SO3H离子交换剂属于强离子交换剂,它们在很广泛的pH范围内都有离子交换能力;-NH2及-COOH 离子交换柱属于弱离子交换剂,只有在一定的pH值范围内,才能有离子交换能力。离子交换色谱主要用于可电离化合物的分离,例如,氨基酸自动分析仪中的色谱柱,多肽的分离、蛋白质的分离,核苷酸、核苷和各种碱基的分离等。 6、吸附色谱 吸附色谱系色谱法之一种,利用固定相吸附中对物质分子吸附能力的差异实现对混合物的分离,吸附色谱的色谱过程是流动相分子与物质分子竞争固定相吸附中心的过程。洗脱次序∶一般为正相,即:极性低的先被洗脱。 7、PCR扩增 PCR技术(polymerase chain reaction)技术能把单个目的基因大量扩增,这个方法必须在已知基因序列或已知该基因所翻译的氨基酸序列。进而推断出因序列的情况下使用。PCR 的每次扩增循环包括三步:1)变性,在高温下把双链靶DNA拆开;2)在较低的温度下使

可变剪接与蛋白质组多样性及其调节机制

可变剪接与蛋白质组多样性及其调节机制 武春晓 2001级博士生专业:免疫学导师:马大龙教授 前言 可变剪接是指从一个mRNA前体中通过不同的剪接方式(选择不同的剪接位点组合)产生不同的mRNA剪接异构体的过程。可变剪接是调节基因表达和产生蛋白质组多样性的重要机制。剪接过程受多种顺式作用序列和反式作用因子相互作用调节。包括SR和hnRNP 家族蛋白在内的多种剪接因子参与这一调节过程。转录机器(machine)也参与可变剪接的调节。本文将讨论:一.可变剪接与蛋白质组多样性二. 可变剪接的调节机制。. 第一部分可变剪接与蛋白质组多样性5 据预测,人类基因组可能有约35,000个基因,果蝇约14,000个,而简单的模式生物线虫约19,000个基因。生物的复杂性与其基因组基因数量似乎存在明显差异。原因在蛋白质组。基因重排,RNA编辑,和可变剪接等机制可以从一个基因产生多种蛋白,从而使蛋白质组中蛋白质的数量超过基因组中基因的数量。其中,从影响的基因数量和生物种类范围来看,可变剪接是扩大蛋白质多样性的最重要的机制1-4。 一、可变剪接的频率。5,6 1. 5%。从1977年Walter Gilbert提出可变剪接概念,1980年Baltimore在小鼠IgM基因发现第一个可变剪接产生膜型、分泌型IgM,至2001年,用经典分子生物学实验的方法研究,一共仅发现了数百种有可变剪接的基因。并推测在高级真核细胞生物约5%的基因有可变剪接。 2. 35%-60%。高通量的基因组测序和EST测序,使得生物信息学的方法研究可变剪接成为可能。EST来源于完全加工的mRNA, 它们提供了一个广泛的mRNA多样性的样品库。这种多样性可以用计算机分析。最近两年,多个研究小组通过不同的生物信息学的方法,从整个人基因组的水平进行分析,结果一致显示约35%-60%的人基因有可变剪接形式。而且,由于对大多数基因来说,每个基因只测了很少几EST甚至没有EST;EST不是全长的mRNA,多位于mRNA的5’和3’端;EST来源于有限的组织和发育阶段;很有可能存在有更多的可变剪接而在现在的EST库中没有显示。因此实际可变剪接的频率可能比预测的更高。这还有待于建立新的高通量的分子生物学方法,如生物芯片的方法,以进一步实验验证。 二、单个基因可变剪接产生的多样性5。 一个基因可以通过如下几种方式产生多个转录体,如不同的转录起始位点,可变剪接,选择不同的加尾信号位点,RNA编辑等。可变剪接包括3种类型:1.内含子的保留;2.可变外显子的保留或切除;3. 3’和5’剪接位点的转移(shift)导致外显子的增长或缩短。可变剪接对蛋白质结构的影响也是多样性的,如多肽链中一个到数百个氨基酸的增加或减少;某功能域的有无;如果可变剪接使读码框架改变,则可能无法有效翻译,mRNA被监视系统降解。

基于质谱的蛋白质组学分析.

基于质谱分析的蛋白质组学 在21世纪,生命科学的研究进入了后基因组时代,蛋白质组学作为其中的一个重要分支于20世纪90年代中期应运而生。由于蛋白质的复杂性,传统的蛋白质鉴定方法如末端测序等已无法满足蛋白质组学研究中的一系列需要。因此,质谱技术作为蛋白质组学研究的一项强有力的工具日趋成熟,并作为样品制备和数据分析的信息学工具被广泛地应用。质谱技术具有灵敏度、准确度、自动化程度高的优点,能准确测量肽和蛋白质的相对分子质量,氨基酸序列及翻译后修饰、蛋白质间相互作用的检测[1],因此质谱分析无可争议地成为蛋白质组学研究的必然选择。 1. 蛋白质组学 蛋白质组学(proteomics )是从整体水平上研究细胞内蛋白质的组成、活动规律及蛋白质与蛋白质的相互作用,是功能基因组学时代一门新的科学。包括鉴定蛋白质的表达、修饰形式、结构、功能和相互作用等。根据研究目的,蛋白质组学可以分为表达蛋白质组学、结构蛋白质组学和功能蛋白质组学。表达蛋白质组学用于细胞内蛋白样品表达的定量研究。以绘制出蛋白复合物的结构或存在于一个特殊的细胞器中的蛋白为研究目的的蛋白质组学称为结构蛋白质组学,用于建立细胞内信号转导的网络图谱并解释某些特定蛋白的表达对细胞的作用[2]。功能蛋白质组学以细胞内蛋白质的功能及蛋白质之间的相互作用为研究目的,通过对选定的蛋白质组进行研究和分析,能够提供有关蛋白质的磷酸化、糖基化等重要信息。 蛋白质组学研究的核心就是能够系地的鉴定一个细胞或组织中表达的每一个蛋白质及蛋白质的性能。蛋白质组学的主要相关技术有双向凝胶电泳、双向荧光差异凝胶电泳、质谱分析等[2]。由于蛋白质的高度复杂性和大量低丰度蛋白质的存在,对分析技术提出了巨大挑战,生物质谱技术则是适应这一挑战的必然选择。 2. 生物质谱技术

mRNA可变剪接的调控

mRNA可变剪接的调控 有些基因的一个mRNA前体通过不同的剪接方式(选择不同的剪接位点)产生不同的mRNA剪接异构体,这一过程称为可变剪接(或选择性剪接,alternative splicing) 。可变剪接是调节基因表达和产生蛋白质组多样性的重要机制,是导致真核生物基因和蛋白质数量较大差异的重要原因。 真核细胞核内前体mRNA加工通过5’加帽、剪接(移除内含子)、3’末端切割加尾.从而形成成熟的mRNA.成熟的mRNA和hnRNP 及其他蛋白质形成复合体输出核外再经过选择性降解参与翻译。这些步骤并不是简单的线性顺序.而是在转录物延伸期和转录同时发生的。从而形成一个大型的“生产链。 一般认为,可变剪接有5种基本形式:①内含子保留;②可变的5’端;③可变的3’端;④外显子盒;⑤互斥外显子(一组外显子中只选其一)。也有分为7种形式的,加上可变的起始或末端外显子,而这两种形式更有可能是可变启动子、可变polyA位点造成的。可进行专门分析。 mRNA前体中内含子的剪切和外显子的拼接主要由剪接复合体加工完成,后者是一类大分子蛋白复合物,主要由5个小核糖核蛋白(U1,U2,U4,U5,U6)剪接位点约300多种蛋白分子组成。目前认为剪接位点的正确识别并被精确剪接主要依赖于mRNA前体上的顺式原件和剪接因子之间的相互作用。除此之外,一些组织或发育阶段特异性的剪接因子对剪接位点的选择也很重要。

剪接的发生必然涉及到蛋白-蛋白(剪接复合体、剪接因子)、蛋白-RNA(剪接因子与顺式原件)以及RNA-RNA(U snRNP与顺式原件)的相互作用,而信号转导对剪接调控也会涉及这些相互作用。 参考文献 1.细胞信号转导和可变剪接调控王稳、杭兴宜等医学分子生物学杂志2009.6(5) 2.mRNA可变剪接调控—维基百科

蛋白质组学研究的完整解决方案

蛋白质组学研究的完整解决方案 人体内真正发挥作用的是蛋白质,蛋白质扮演着构筑生命大厦的“砖块”角色,随着破译生命密码的人类基因组计划进入尾声,一个以蛋白质和药物基因学为研究重点的后基因组时代已经拉开序幕,蛋白质将是今后的重点研究方向之一。然而,蛋白质的分离和鉴定非常费时,目前测定蛋白质的技术远远落后于破译基因组的工具,最好的实验室每天只能分离和识别出100种蛋白质。据估计,人体内可能有几十万种蛋白质,这大概需要10年时间进行识别。 为了加快蛋白质组学研究进程,以专业生产蛋白质组学研究设备而著称的美国Genomic Solution Inc.公司开发了完整的蛋白质组学解决方案,由一系列机械手臂与软件,并结合了二维电泳实验设备与质谱仪,可以进行高效、自动化且具重复性的试验分析。在Genomic solution值得信赖的技术平台上,你的研究工作将更富成效,重复性更好。在这一整套Investigator平台上,各仪器之间配合无隙,由于它的整合性及标准性,使得研究进程大大加快,原来需要9—12个月才能获得数据结果发表的时间减少到9—12周。这套完整的系统具备蛋白质组研究所需的众多功能:2-D电泳、图像获取、2-D胶分析、蛋白样品切割、蛋白消化、MALDI样品准备、消化及点样、数据分析整合,再加上制备好的胶、试剂及附件,使研究工作可以立即展开。此套设备为进行蛋白质组学研究的利器,大大加速了蛋白质分离和鉴定的速度。该系统主要由以下几部分组成: 一、2-D电泳系统(Investigator? 2-D Electophoresis System) 该系统主要进行2D PAGE第一向等电聚焦凝胶电泳和第二向SDS-PAGE电泳,设备包括2-D电泳系统所需的各种设备,如pHaser?(IPG胶条电泳)、管状制胶设备、二维电泳装置、电源设备、半导体冷却器及各种相关的蛋白纯化试剂盒。 产品特征: * 提供2D PAGE电泳所需的各种设备,使电泳更加简便,大大节约研究时间 * 高分辨率:有效的第一向等电聚焦凝胶电泳和23cm X 23cm第二向SDS-PAGE大面积板胶提供清晰的电泳图像,有效提高单体、磷酸化和糖基化蛋白的分离 * 大容量:可同时容纳15块1mm一维管状胶,或8块2-3mm管状胶;10块IPG胶条和10块二维电泳板胶 * 灵活性:该系统用于管状胶、IPG 胶条、预制胶、自制胶和SDS PAGE胶使用 * 恒温:高效的半导体制冷装置保证电泳体系温度恒定,温度变化< 0.5℃ * 专门为高分辨率2D PAGE而设计的电源系统 * 提供超纯的相关化学试剂和药品

选择性剪接中的剪接模式

选择性剪接中的剪接模式 有几种不同的剪接模式(见图1-1)[1,6]。最常见的模式是在成熟的mRNA中跳过外显子,使其包括或者剔除盒式外显子(也称为跳过的外显子)。跳过外显子的一个著名的例子是果蝇性别致死的基因(SXL),这是一个由性别决定的转变。跳过SXL基因的第3外显子,可以保持雌性的分化。SXL的第3外显子包含一个早提前的终止密码子,这个外显子的存在合成出截短的、也有可能是非功能的蛋白质[7,8]。另一个剪接模式是外显子互斥,这使得两个相邻外显子中,仅有一个出现在最终产物中。人类成纤维细胞生长因子受体二号(FGFR-2)基因含有外显子IIIB和IIIC,这两者是互斥的。从外显子IIIB得到的的基因产物,具有比纤维细胞生长因子低得多的聚合吸引力[9]。 不仅可以作用于整个外显子,不同的剪接方式也可以只剪接外显子的某一部分。5'或3'选择性剪接位点的选择,通过加上、或者不加上与外显子侧面相连的支链而生成,从而造成多样性。果蝇无子(FRU)和双性别(DSX)基因包含了雌性特有的选择性剪接位点,前者在 5‘端,而后者在3'端。由于选择性剪接位点的不同,造成支链的细小差异[10,11]。 选择性剪接可发生在转录体的任意一端。选择性终止外显子 不仅改变最后一个外显子的包含性,而且还影响聚腺苷酸化位点的选择。 在许多情况下,它可以在最后的外显子中生成提前的终止密码子,并且生成

功能性截短的多肽或者产生无意义介导衰变(NMD, 即,由于终止密码子位于最后外显子与外显子的结点上游超过50-55碱基对处,从而造成的mRNA的降解) [2,12,13]。钙调节激素(降钙素)基因包括6个外显子。 成熟的的降钙素转录体包括前四个外显子,并使用位于第4外显子上的多聚腺苷酸化位点,从而生成甲状腺C细胞中超过98%的基因产物。同时,在大脑和周围神经系统中,通过将前三个、第五和第六个外显子编码成降钙素相关肽的前体,并利用下游的腺苷酸化位点(CGRP),从而产生差异[14,15]。同样,选择性启动子的使用使得可以选择不同的转录启动子,这样通常会影响到第一个外显子。尽管人们普遍将其当作转录调控,选择性启动子的使用和选择性剪接有很大的关联。人们已经观察到,有选择性启动子的基因更容易进行选择性剪接,同时,选择性启动子的数量与不同选择性的剪接方式的数量正相关[16]。鼠标单羧酸转运蛋白二号(MCT2)基因有几种选择性的启动子,由此形成五种独特的首外显子(1A - 1E)。外显子1C 用于各种组织中,而其他的外显子则是有组织特异性的[17]。 除此以外,内含子同样可以参与选择性剪接。在内含子保留性中,整个内含子可以被包括或排除。对于人类来说,这种模式是罕见的[1]。然而,最近的研究表明,在已知的人类基因中,这个频率比想象中要高得多(约15%)[18]。内含子的保留性在植物中比在其他真核生物中常见[19]。例如,对于拟南芥,50%以上的案例都是关于内含子保留性的[20]。人类FosB (FBJ 小鼠骨肉瘤病毒致癌基因对等质B)基因的最后一个外显子包含一个140碱基对的序列,它可以剪接出来,产生一个截断的产物——ΔFosB。通过观察动物长期的药物依赖性,检测ΔFosB的表达[21]。 基本剪接机制 无论是选择性还是组成型剪接,用的都是同一种基本剪接机制,称为剪接体。剪接体识别和选择的剪接位点(外显子和内含子的结点),同时,催化打破并重组RNA链。剪接体主要由五个小核核糖核蛋白(snRNP)——U1,U2,U4,U5和U6组成。其中包括尿苷丰富的小核RNA和多种蛋白质。它们能识别前体mRNA上的剪接信号,并与其他辅助剪接因子交互[22-24]。 在剪接中,三个保留序列元素是必须的。这些保留序列元素可以是经典或异常的剪接节点,多嘧啶束和分支点(见图1-2)[22,23]。剪接位点含有包括外显子和内含子结点的短序列。GU 和AG二核苷酸在外显子的5'和3'端通常来说是分别不变的。在剪接结合中,这种类型的GU-AG对被称为经典剪接位点。它存在于超过98%的哺乳动物基因组中[25]。异常的剪接位点含有如GC-AG、AT-AC之类的二核苷酸对,AT-AC等。这种情况比较罕见。多嘧啶束是指位于内含子的3’端,且紧邻3‘剪接位点的UC丰富的片段。这是几种剪接因子的结合位点,如U2 snRNP辅助因子(U2AF)和多嘧啶束结合蛋白(PTB)[26]。分支点(也称为分支位点)位于多嘧啶束的上游。对于人和老鼠来说,分支点和3'剪接结点间的平均距离大约是30至40个碱基对[27]。虽然分支点序列在哺乳动物中是可变的,分支点的突变可以促使由组成型剪接到选择性剪接的转变[27]。

蛋白质组学研究的基本步骤

请简述蛋白质组学研究的基本步骤 1.蛋白质样品的制备:蛋白质样品的制备是蛋白质组学研究的首要环节,也是最为重要的部分。蛋白质样品的质量直接影响到科学研究的真实性和可信度。 2.蛋白质的分离:双向凝胶电泳技术是目前最基础和常用的蛋白质分离方法,它能将数千种蛋白质同时分离与展示的分离技术。双向电泳分为等电聚焦电泳和SDS-PAGE两个步骤,即先进行等电聚焦电泳,按照pI的不同将蛋白分离,然后再进行SDS-PAGE按照分子量的大小不同对蛋白进行分离。IPG胶条的应用,大大提高了双向电泳的重复性。 3. 蛋白质双向电泳凝胶的染色。目前双向电泳凝胶的染色的方法有3种,分别为考马斯亮蓝染色法、银染法和荧光染色法。考马斯亮蓝染色法,操作简便,无毒性,染色后的背景及对比度良好,与下游的蛋白质鉴定方法兼容,但灵敏度较低,可以检测到30~100 ng蛋白质。银染法是一种较为流行的染色方法,银染成本较低,灵敏度高,可检测少到2~5ng的蛋白。荧光试剂显色对蛋白质无固定作用,与质谱兼容性好,而其灵敏度与银染相仿,但线性范围要远高于银染,这使二维电泳分离蛋白质的荧光检测受到普遍关注和应用。 4.双向电泳凝胶图像的采集与分析:图像采集系统通过投射扫描根据吸光度的大小获碍蛋白质点的光密度信息。一般来说,该光密度值与蛋白质点的表达丰度成正比,以便于软件分析时的定量比较。完成图像采集后采用ImageMaster等图像分析软件进行分析。分析步骤:蛋白质点检测、背景消减、归一化处理、蛋白质点匹配。 5.蛋白质鉴定:蛋白质鉴定是蛋白质组学研究中的核心内容。目前蛋白质鉴定技术主要有Edman 降解法测序、质谱。质谱是目前最常用的蛋白质鉴定方法。质谱技术的基本原理是带电粒子在磁场或电场中运动的轨迹和速度依粒子的质量与携带电荷之比质荷比( m/z) 的不同而变化,可以据此来判断粒子的质量和特性。质谱完成后利用蛋白质的各种属性参数如相对分子质量、等电点、序列、氨基酸组成、肽质量指纹谱等在蛋白质数据库中检索,寻找与这些参数相符的蛋白质。

磷酸化蛋白质组学常用定量方法介绍

磷酸化蛋白质组学常用定量方法介绍 蛋白质的磷酸化修饰是生物体内重要的共价修饰方式之一。蛋白质的磷酸化和去磷酸化这一可逆过程几乎调节着包括细胞的增殖、发育、分化、信号转导、细胞凋亡、神经活动、肌肉收缩及肿瘤发生等过程在内的所有生命活动。目前已知有许多人类疾病是由于某些异常的磷酸化修饰所引起,而有些磷酸化修饰却是某种疾病所导致的后果。在哺乳动物细胞生命周期中,大约有1/3的蛋白质发生过磷酸化修饰;在脊椎动物基因组中,有5%的基因编码的蛋白质是参与磷酸化和去磷酸化过程的蛋白激酶和磷酸(酯)酶。磷酸化修饰本身所具有的简单、灵活、可逆的特性以及磷酸基团的供体ATP的易得性,使得磷酸化修饰被真核细胞所选择接受而成为一种最普遍的调控手段。鉴于磷酸化修饰在生命活动中所具有的重要意义,探索磷酸化修饰过程的奥秘及其对细胞功能的影响已成为众多生物化学家及蛋白组学家所关心的内容。用蛋白质组学的理念和分析方法研究蛋白质磷酸化修饰,可以从整体上观察细胞或组织中磷酸化修饰的状态及其变化,这对以某一种或几种激酶及其产物为研究对象的经典分析方法是一个重要的补充,同时提供了一个全新的研究视角,并由此派生出磷酸化蛋白质组学(phosphoproteomics)这一新概念。在蛋白质组学水平进行磷酸化蛋白质的分析定量研究已引起人们广泛关注,各种技术也相应地发展起来。 1. 磷酸化蛋白质和磷酸肽的富集 1.1 免疫亲和色谱 富集磷酸化蛋白质最简单的方法就是用识别磷酸化氨基酸残基的特异抗体进行免疫共沉淀,从复杂混合物中免疫沉淀出目标蛋白质。目前,仅有酪氨酸磷酸化蛋白质的单克隆抗体可以用来进行有效的免疫共沉淀。这是因为该抗体具有较强的亲和力和特异性,可以有效地免疫沉淀酪氨酸磷酸化的蛋白质。Imam-Sghiouar等人从B-淋巴细胞中通过免疫沉淀获得酪氨酸磷酸化的蛋白质,然后再用二维电泳分离技术并结合质谱分析方法,鉴定出多个与斯科特综合症相关的酪氨酸磷酸化的蛋白质。由于抗磷酸化丝氨酸和苏氨酸抗体的抗原决定簇较小,所以令抗原抗体的结合位点存在空间障碍,特异性较差。因此,目前采用磷酸化丝氨酸/苏氨酸的抗体来富集磷酸化蛋白质的研究相对较 少。 1.2 固相金属亲和色谱(IMAC) 固相金属亲和色谱(immobilized metal affinity chromatography, IMAC)是一项较为成熟的磷酸化多肽分离富集技术。它是利用磷酸基团与固相化的Fe3+、Ga2+和Cu2+等金属离子的高亲和力来富集磷酸肽。目前发展的高通量磷酸化蛋白质组分析途径主要采用IMAC亲和色谱-反相液相色谱-串联质谱-数据库检索联用的方法。Ficarro等人最先将IMAC 富集技术应用到细胞系大规模磷酸化蛋白质组学的分析中,并从啤酒酵母中鉴定出了216个磷酸化肽段和383个磷酸化位点。该方法的优点在于对每个可溶磷酸肽,不管其长度如何,都有富集作用,而且IMAC柱洗脱下的样品可直接用于RP-HPLC分析,但有可能丢失一些与IMAC柱结合能力较弱的磷酸肽或某些因有多个磷酸化位点而难以洗脱的磷酸肽。另外,那些富含酸性氨基酸的非磷酸化肽段与固相金属离子也有结合能力,也可能被富集。为了解决IMAC柱的非特异性吸附的问题,可以采用对羧基进行酯化反应以及改变洗脱液的体系等方法来提高IMAC柱的特异性。此外,自动化IMAC- capillary RP HPLC-ESI MS/MS技术平台的研究开发,使磷酸肽的富集、反相分离和质谱检测都能自动在线进行,为IMAC在蛋白质组学中的高通量应用开辟了道路。

蛋白质组学及其主要技术

蛋白质组学及其主要技术 朱红1 周海涛2 (综述) 何春涤1, (审校) (1.中国医科大学附属第一医院皮肤科,辽宁沈阳110001; 2.北京大学深圳医院核医学 科,广东深圳518036) 【摘要】蛋白质组是指一种细胞、组织或有机体所表达的全部蛋白质。蛋白质组学是以蛋白质组为研究对象的新兴学科,近年来发展迅速,已成为后基因组时代的研究热点。目前,蛋白质组学研究技术主要包括:样品的制备和蛋白质的分离、蛋白质检测与图像分析、蛋白质鉴定及信息查询。本文就蛋白质组学概念及主要技术进行综述。 【关键词】蛋白质组,蛋白质组学 1蛋白质组学的概念 随着人类基因组测序计划的完成,人们对生命科学的研究重点由结构基因组转向功能基因组,1994年Wilkins和Williams首先提出蛋白质组一词[1],蛋白质组是指一种细胞、组织或有机体所表达的全部蛋白质。从基因到蛋白质存在转录水平、翻译水平及翻译后水平的调控,组织中mRNA丰度与蛋白质丰度不完全符合[2]。蛋白质复杂的翻译后修饰、蛋白质的亚细胞定位或迁移、蛋白质-蛋白质相互作用等也无法从DNA/mRNA水平来判断。因此,只有将功能基因组学与蛋白质组学相结合,才能精确阐明生命的生理及病理机制。 蛋白质组学是以蛋白质组为研究对象,对组织、细胞的整体蛋白进行检测,包括蛋白质表达水平、氨基酸序列、翻译后加工和蛋白质的相互作用,在蛋白质水平上了解细胞各项功能、各种生理、生化过程及疾病的病理过程等[3,4]。蛋白质组学有两种研究策略。一种是高通量研究技术,把生物体内所有的蛋白质作为对象进行研究,并建立蛋白质数据库,从大规模、系统性的角度来看待蛋白质组学,更符合蛋白质组学的本质。但是,由于剪切变异和翻译后修饰,蛋白质数量极其庞大,且表达随空间和时间不断变化,所以分析生物体内所有的蛋白质是一个耗时费力,难以实现的理想目标。另一种策略是研究不同状态或不同时期细胞或组织蛋白质组成的变化,主要目标是研究有差异蛋白质及其功能,如正常组织与肿瘤组织间的差异蛋白质,寻找肿瘤等疾病标记物并为其诊断治疗提供依据。 2蛋白质组学的常用技术 2.1样品的制备和蛋白质的分离技术 2.1.1样品的制备样品制备包括细胞裂解与蛋白质溶解,以及去除核酸等非蛋白质成分。 激光捕获显微切割(Laser-captured microdissection, LCM)[5]技术可大量获得足够用于蛋白质组学研究的单一细胞成分,避免其他蛋白成分对电泳结果的干扰。尤其是肿瘤的蛋白质组学研究常用LCM技术来获取单一的肿瘤细胞。 2.1.2蛋白质的分离技术 ①双向凝胶电泳(Two-dimensional electrophoresis, 2-DE):双向电泳方法于 l975年由O'Farrell[6]首先提出,根据蛋白质等电点和分子量的差异,连续进行成垂直方向的两次电泳将其分离。 第一向为等电聚焦(Isoelectric focusing,IEF)电泳,其基本原理是利用蛋白质分子的等电点不同进行蛋白质的分离。较早出现的IEF是载体两性电解质pH梯度,即在电场中通过两性缓冲离子建立pH梯度;20世纪80年代初建立起来的固相pH梯度(Immobilized pH gradients,IPG)IEF,是利用一系列具有弱酸或弱碱性质的丙烯酰胺衍生物形成pH梯度并参与丙烯酰胺的共价聚合,形成固定的、不随环境电场条件变化的pH梯度。IPG胶实验的重复

可变剪接与疾病的生物信息学研究概况

可变剪接与疾病的生物信息学研究概况 王科俊1*,吕俊杰1,冯伟兴1,王 鑫2 (1.哈尔滨工程大学自动化学院,中国黑龙江哈尔滨150001;2.剑桥大学癌症分子研究中心英国剑桥) 摘要:可变剪接是真核基因转录后期的重要调控机制,它使得同一条蛋白质编码基因能够产生多种转录 体,极大的扩展了遗传信息的应用.研究发现,可变剪接与人类疾病有着密切的联系.错误的剪接会导致疾病,增加疾病的易感性与病变程度,甚至直接导致癌变.现对可变剪接调控机制与疾病的生物信息学研究进展进行综述. 关键词:可变剪接;疾病;癌症;生物信息学中图分类号:Q752 文献标识码:A 文章编号:1007-7847(2011)01-0086-09 The Application of Bioinformatics in the Research of Alternative Splicing and Disease WANG Ke -jun 1,L 譈Jun -jie 1*,FENG Wei -xing 1,WANG Xin 2 (1.College of Automation ,Harbin Engineering University ,Harbin 150001,Heilongjiang ,China ; 2.Cancer Research Center ,Cambridge University ,Cambridge ,England ) 收稿日期:2010-09-01;修回日期:2010-12-01 基金项目:国家自然科学基金资助项目(61071174);国家863计划项目(2008AA01Z148) 作者简介:王科俊(1962-),男,黑龙江哈尔滨人,哈尔滨工程大学自动化学院教授,博士生导师,主要从事模式识别、多模态生物特 征识别、生物信息学研究,E -mail :wangkejun@https://www.doczj.com/doc/6d11969372.html, ;吕俊杰(1982-),女,黑龙江齐齐哈尔人,博士研究生,主要从事生物信息学研究. Abstract :Alternative splicing is an important mechanism in regulating eukaryotic gene expression during post -transcriptional processing as it generates numerous transcripts from a single protein -coding gene ,which largely increases the use of genetic information.Researches showed that alternative splicing was highly relevant to human diseases.Wrong splicing patterns could cause disease ,contribute to disease severity and susceptibility ,and even cause cancer directly.Research progress of bioinformatics in alternative splicing regulation mechanism and disease was summarized. Key words :alternative splicing ;disease ;cancer ;bioinformatics (Life Science Research ,2011,15(1):086~094)1977年Walter Gilbert 在对Adenovirus hexon 基因的研究中发现并提出可变剪接现象[1],同时,他表明一个基因的不同编码区可以拼接在一起被剪接下来,产生功能不同的信使核糖核酸,这是对可变剪接的最早描述.随后Sharp 和Roberts 发现高等生物基因的编码区被非编码区所分割,并提出分割的基因结构[2,3].这一发现推翻了传统生物学关于“一种基因对应一种蛋白 质”的观点,接下来1981年,第一次在哺乳动物 编码荷尔蒙降血钙素的基因中发现可变剪接现象[4],20世纪80年代初,在编码免疫球蛋白的基因中发现可变剪接[4,5].此后,可变剪接被发现广泛存在于真核生物中[6].大量关于可变剪接的实验性文章不断发表出来.很长一段时间,对可变剪接机制的研究多停留在对单个基因的可变剪接现象和机制的研究上,而缺少更为系统更为综 第15卷第1期生命科学研究 Vol.15No.12011年2月 Life Science Research Feb.2011 ·综述·

可变剪切结果说明文件

一、events of exon skipping 1. 结果一(跳过一个exon): a)首先是psl文件(一共是21列,具体每一列的格式见说明1,主要利用了第10列转录本id,第14列染色体id,第19列转录本的每个exon的长度,第21列转录本的每个exon在染色体的起始位置): 转录本NM_004749的psl结果如下(只有一行,多行显示只为方便): 0 0 0 0 0 0 0 0 - NM_004749:45106223-45117842 0 0 0 chr7 0 45106223 45117842 11 327,115,112,246,145,111,158,172,324,461,76, 0,0,0,0,0,0,0,0,0,0,0, 45106223,45107381,45107626,45107948,45108470,45109456,45110222,45110661,45111564,45114950,451177 66, 因为psl结果的位置信息是从0开始的,所以每个起始位置需要加上1,结合每个exon的大小,我们可以知道这个转录本每个exon的在染色体具体位置: exon1:45106224-45106550(45106224=45106223+1, 45106550=45106224+327-1) exon2:45107382-45107496 exon3:45107627-45107738 exon4:45107949-45108194 exon5:45108471-45108615 exon6:45109457-45109567 exon7:45110223-45110380 exon8:45110662-45110833 exon9:45111565-45111888 exon10:45114951-45115411 exon11:45117767-45117842 b)其次在junctions的结果里有: chr7 45109567 45110223 junction1 chr7 45109567 45110662 junction2 chr7 45110380 45110662 junction3 所以从junction1可以知道来exon6和exon7存在连接,从junction3可以知道exon7和exon8存在连接,从junction2可以知道来exon6和exon8存在连接(跳过了exon7),因此exon6(45109457-45109567)、exon7(45110223-45110380)、exon8(45110662-45110833)存在exon skipping,如下图: 在结果文中显示如下,9238为转录本NM_004749所对应的基因id(用基因id替换转录本id的原因见说明2): gene chromsome strand constitutive exon inclusive exon constitutive exon (表头)

相关主题
文本预览
相关文档 最新文档