第四章基因在大肠杆菌、酵母中的高效的表达
前言
基因表达是指结构基因在生物体中的转录、翻译以及所有加工过程。
基因工程主要目标之一是生产常规方法难以生产的大量蛋白质产物—即实现基因的高效表达。
基因高效表达研究是指外源基因在某种细胞中的表达活动,即剪切下外源基因片段,拼接到另一个基因表达体系中,使其能获得原生物活性又可高产的表达产物。
第一节基因的表达系统与表达策略
一、最佳的基因表达体系:
⑴目的基因的表达产量高;
⑵表达产物稳定;
⑶生物活性高;
⑷表达产物容易分离纯化。
二、宿主细胞的选择
(一)适合目的基因表达的宿主细胞的要求:
1、容易获得较高浓度的细胞;
2、能利用易得廉价原料;
3、不致病、不产生内毒素;
4、发热量低、需氧低、适当的发酵温度和细胞形态;
5、容易进行代谢调控;
6、容易进行DNA重组技术操作;
7、产物的产量、产率高,
8、产物容易提取纯化。
(二)宿主细胞分为两大类:
1、原核细胞:常用有大肠杆菌、枯草芽胞杆菌、链霉菌等;
2、真核细胞:常用有酵母、丝状真菌、哺乳动物细胞等。
大肠杆菌目前仍是基因工程研究中采用最多的原核表达体系。
优越性:
①对大肠杆菌的基础生物学、分子遗传学等背景知识和基因表达的调控机理已有了深刻了解。
②有各类菌株和载体系列。
③目前以实现多种基因的高效表达。表达基因产物形式多样:细胞内不溶性表达(包含体)、细胞内可溶性表达、细胞周质表达等。
④易培养,成本低。
缺点:
①大肠杆菌中的表达不存在信号肽,产品多为胞内产物,提取困难。
②因分泌能力不足,真核蛋白质常形成不溶性的包含体,表达产物需经变性复性才恢复活性。
③蛋白质不能糖基化。产物蛋白质N端多余一个蛋氨酸残基。
④其内毒素很难除去。
酵母酵母菌是研究基因表达最有效的单细胞真核微生物。其基因组小,世代时间短,有单倍体双倍体两种形式,繁殖迅速,无毒性。能外分泌,产物可糖基化。已有不少真核基因成功表达。
三、根据表达蛋白用途选择基因的表达策略
1.生物化学和分子生物学研究
2.表达蛋白质用作抗原
3.结构研究
真核基因表达的特点
●一条成熟的mRNA只能翻译成一条多肽,不存在象原核生物那样的多基因操纵子模
式;
●基因转录调节区很大,而且往往远离启动子达几百个甚至上千个碱基,它们并不直
接影响RNA聚合酶与启动子区的结合,而是通过改变基因5’上游区DNA的构型来影响RNA聚合酶与启动子区的结合;
●mRNA合成后穿过核膜进入细胞质中后才进行翻译工作,而且通常都有复杂的成熟
和剪接过程;
●基因的启动子区和原核基因差异很大,而且有增强子序列存在。
原核体系中表达真核基因的困难
1.细菌的RNA聚合酶不识别真核基因的启动子;
2.真核基因转录的mRNA在原核细胞中不能结合到核糖体上;
3.真核基因一般含有内含子,而原核细胞没有象真核细胞那样的转录后加工系统,所
以mRNA中的内含子部分不能被切除,不能形成成熟的RNA,也就不能表达出有功能的真核蛋白;
4.表达的真核蛋白在原核细胞中很不稳定,容易被细菌蛋白酶降解破坏。
四、构建表达载体的策略
⑴将真核基因克隆到一个强大的原核启动子和SD序列的下游,使得真核基因处于原核调控体系中。
⑵采用真核基因的cDNA序列作为构建表达载体的目的基因,这样就解决了原核细胞没有RNA剪接功能的问题。
⑶构建载体时,将真核基因插在几个原核密码子的后面,翻译后就得到了原核多肽和真核多肽的融合蛋白,这样就可以避免被原核蛋白酶的识别和降解,最后可以将融合多肽切除。
第二节基因在大肠杆菌中的高效表达
一、大肠杆菌表达载体的成份
⑴启动子
要求是:①强启动子②是诱导性的,如热诱导和化学诱导。
⑵转录终止子
使转录终止,增强mRNA的稳定性,提高蛋白质产物的表达水平。
尤其是将两个终止子串联,转录终止功能更强。
⑶核糖体结合位点
在转录起始位点下游的一段DNA序列(SD,5’AGGAGG3’)
(4)筛选标记基因
(5)密码子的选择
二、常见的大肠杆菌表达系统
①T7表达系统T7噬菌RNA聚合酶能选择性的激活T7噬菌体启动子的转录,其mRNA合成速率相当于大肠杆菌RNA聚合酶的5倍。
②Lac表达系统是β-半乳糖苷酶编码基因LacZ的转录的调控序列,该启动子可以被IPTG 诱导,所以在培养基中加入该安慰诱导物就可以诱导目的基因的表达。
③Tac表达系统是一种由Lac和Trp启动子杂合而成的启动子,其强度得到了很大的提高,也可被IPTG诱导表达。
④λPL表达系统是负责λDNA分子转录的启动子之一,是一种极强的启动子。
三、影响克隆基因表达效率的因素
一般而言,所用启动子的强度、DNA的转录起始序列、密码子的选择、mRNA的二级结构、转录的终止、基因的拷贝数等都会在一定程度上影响到转基因的表达。
1.启动子的结构对表达效率的影响
大多数大肠杆菌启动子都含有两种保守区,即-10区(位于转录其始位点上游5-10bp,故称为-10区,序列为5’--TATAAT)和-35区(位于转录起始位点上游25bp处,一般有10bp组成,5’-- TTGACA故称为-35区,)。当然,实际的启动子中很少具备与上述序列完全一致的区域,但是研究表明,启动子的这两个区域与上述保守序列的相似程度越高,该启动子的表达能力也就越强。另外,这两个保守区间的距离也是影响启动子强度的重要因素,即这个间距越是接近于17bp,启动子的活性就越强。
2.翻译起始序列对表达效率的影响
mRNA的有效翻译依赖于核糖体和其的稳定结合,大肠杆菌的mRNA序列中,核糖体的结合位点是起始密码子AUG和其上游的SD序列。所谓SD序列就是由Shine-Dalgarno 首先提出的一种位于位于起始密码子上游的一段保守序列,为细菌核糖体有效结合和翻译起始所必需。一般SD序列的长度约为3-9bp,位于起始密码子上游3-11碱基的位置,它与16S 核糖体RNA的3‘端互补,控制了翻译的起始。
3.启动子与克隆基因间的距离对基因表达的影响
研究表明启动子和目的基因间的距离对基因的表达效率影响很大,所以在构建新的表达载体时要考虑到这一因素的影响。另外,在克隆基因的末端要就近插入有效的终止子序列,否则会导致细胞能量的大量消耗,或是形成不应有的二级结构,最终影响的目的基因的表达效率。
四、蛋白质的融合表达
融合表达一般是将基因引入某表达载体编码的高表达蛋白(担体蛋白)序列的3’末端。表达出来的融合蛋白的N末端含有由担体序列编码的片段。
融合蛋白可以直接用作抗体,但通常是将N端的担体蛋白部分从C端的目的蛋白中裂解出来,有利于对目的蛋白进行生化研究及功能分析。方法主要有:化学裂解法和酶解法。
五、蛋白质的分泌型表达
将目的蛋白的基因置于原核蛋白信号肽序列的下游有可能实现分泌表达。
●实现蛋白质分泌表达有许多有利之处:
1.在穿膜过程中信号肽被信号肽酶切除。生产的蛋白质和天然蛋白质是一致的。
2.周质中蛋白酶活性低,分泌的蛋白稳定。
3.周质中细菌的蛋白很少,使得重组蛋白易纯化。
4.周质中提供了一个氧化环境,更有利于二硫键的正确形成。
因此,对于许多难以纯化的蛋白质可以通过分泌表达来实现生产。
六、蛋白质的包含体形式表达
●重组蛋白在大肠杆菌中高表达时,绝大多数是以包含体形式存在的。
●包含体就是表达的蛋白质在细胞内聚集成没有生物活性的固体颗粒。
●不可溶、无生物活性的包含体必需经过变性、复性才能获得天然结构及生物活性。
●重组蛋白在大肠杆菌中高表达时,绝大多数是以包含体形式存在的。
●包含体就是表达的蛋白质在细胞内聚集成没有生物活性的固体颗粒。
●不可溶、无生物活性的包含体必需经过变性、复性才能获得天然结构及生物活性。减少包含体形成的策略:
1.降低重组菌的生长温度。
2.添加可促进重组蛋白质可溶性表达的生长添加剂。如高浓度的多醇类、蔗糖或非代谢糖。
3.供给丰富的培养基,创造最佳培养条件,如供氧、pH值等。
不过,包含体的形成有时也是有利的,不仅可以获得高表达、高纯度的蛋白质,还可避免细胞水解酶对重组蛋白的破坏。
有效、理想的复性方法应具备一下几个特点:
1.活性蛋白质的回收率高。
2.正确复性的产物易于与错误折叠蛋白质分离。
3.折叠复性后应得到浓度较高的蛋白质产品。
4.折叠复性方法利用放大。
5.复性过程耗时较少。
第三节基因在酵母中的表达
一、大肠杆菌表达系统的缺陷
1.缺失真核生物的蛋白质翻译后修饰和加工,如剪切、糖基化、形成二硫键等。
2.表达的蛋白多以包含体形式存在,需要经过复杂的复性才能恢复构象和生物活性。
因此,可以使用真核生物酵母作为表达菌。如酿酒酵母、甲醇酵母等。
二、甲醇酵母表达系统
●甲醇酵母能利用甲醇为其唯一碳源。
●甲醇代谢的第一步是甲醇在乙醇氧化酶作用下氧化成甲醛,乙醇氧化酶对氧的亲和
力很弱,因此甲醇酵母代偿性的大量产生这种酶。
●调控乙醇氧化酶的启动子是强启动子,可用来调控异源蛋白的表达。
(一)甲醇酵母表达系统的优点
1.具有强启动子,可严格调控目的蛋白的表达。
2.可对表达的蛋白进行翻译后的加工和修饰,从而使表达出的蛋白具有生物活性。
3.营养要求低,生长快,培养基廉价,便于工业化生产。
4.可高密度发酵培养。
(二)影响目的基因在甲醇酵母中表达的因素
1.目的基因的特性
2.表达框的染色体整合位点与基因拷贝数
3.宿主的甲醇利用表型
4.分泌信号
5.产物稳定性
6.翻译后修饰
全基因组表达谱分析方法(DGE)----基于新一代测序技术的 技术路线 该方法首先从每个mRNA的3’端酶切得到一段21bp的TAG片段(特异性标记该基因);然后通过高通量测序,得到大量的TAG序列,不同的TAG序列的数量就代表了相应基因的表达量;通过生物信息学分析得到TAG代表的基因、基因表达水平、以及样品间基因表达差异等信息。技术路线如下: 1、样品准备: a) 提供浓度≥300ng/ul、总量≥6ug、OD260/280为1.8~2.2的总RNA样品; 2、样品制备(见图1-1): a) 类似SAGE技术,通过特异性酶切的方法从每个mRNA的3’末端得到一段21bp 的特异性片段,用来标记该基因,称为TAG; b) 在TAG片段两端连接上用于测序的接头引物; 3、上机测序: a) 通过高通量测序每个样品可以得到至少250万条TAG序列; 4、基本信息分析: a) 对原始数据进行基本处理,得到高质量的TAG序列; b) 通过统计每个TAG序列的数量,得到该TAG标记的基因的表达量; c) 对TAG进行注释,建立TAG和基因的对应关系; d) 基因在正义链和反义链上表达量间的关系; e) 其它统计分析; 5、高级信息分析: a) 基因在样品间差异表达分析; b) 库容量饱和度分析;
c) 其它分析; 测序优势 利用高通量测序进行表达谱研究的优势很明显,具体如下: 1.数字化信号:直接测定每个基因的特异性表达标签序列,通过计数表达标签序列的数目来确定该基因的表达量,大大提高了定量分析的准确度。整体表达差异分布符合正态分布,不会因为不同批次实验引起不必要的误差。 2.可重复性高:不同批次的表达谱度量准确,能够更准确的进行表达差异分析。 3.高灵敏度:对于表达差异不大的基因能够灵敏的检测其表达差异;能够检测出低丰度的表达基因。 4.全基因组分析,高性价比:由于该技术不用事先设计探针,而是直接测序的方式,因此无需了解物种基因信息,可以直接对任何物种进行包括未知基因在内的全基因组表达谱分析,因此性价比很高。 5.高通量测序:已有数据表明,当测序通量达到200万个表达标签时,即可得到样本中接近全部表达基因的表达量数据,而目前每个样本分析可以得到300 万~600万个表达标签。
大肠杆菌基因型及遗传符号说明系列一 点击次数:982 作者:佚名发表于:2009-09-27 00:00转载请注明来自丁香园 来源:丁香园 实验室的一般大肠杆菌拥有4288条基因,每条基因的长度约为950bp,基因间的平均间隔为118bp (基因Ⅷ)。E.coli基因组中还包含有许多插入序列,如λ-噬菌体片段和一些其他特殊组份的片段,这些插入的片段都是由基因的水平转移和基因重组而形成的,由此表明了基因组具有它的可塑造性。 利用大肠杆菌基因组的这种特性对其进行改造,使其中的某些基因发生突变或缺失,从而给大肠杆菌带来可以观察到的变化,这种能观察到的特征叫做大肠杆菌的表现型(Phenotype),把引起这种变化的基因构成叫做大肠杆菌的基因型(Genotype)。具有不同基因型的菌株表现出不同的特性。 分子克隆中常用的大肠杆菌及其遗传标记按Demerec等1966年提出的命名原则,采用的菌株所有的基因都假定处于野生型状态,除非在基因型上另外注明。 大肠杆菌基因型的表示方法(Demerec, et, al. 1966): 一、一般规则: 1、根据基因产物或其作用产物的英文名称的第一个字母缩写成3个小写斜体字母来表示。例如:D NA Adenine Methylase→dam。 2、不同的基因座,其中任何一个突变所产生的表型变化可能相同,其表示方法是在3个小写斜体字母后加上一个斜体大写字母来表示区别。例如:Recombination→recA、recB、recC。 3、突变位点应通过在突变基因符号后加不同数字表示。如supE44(sup基因座E的44位突变)。
如果不知道几个等位基因中哪一/几个发生了功能性突变,则用连字符“ -”代替大写字母,如trp-31。 4、细菌的基因型中应该包含关于其携带的质粒或附加体的的信息。这些符号包括菌株携带的质粒或附加体、质粒或附加体上的突变基因座和突变位点。其基因符号应与基因座的表示符号明显区别,符号的第一个字母大写、不斜体并位于括号内;质粒或附加体上的突变基因座和突变位点的基因符号的表示方法与染色体上突变基因座、突变位点的符号相同。 5、对于携带附加体的菌株的完整基因型描述应包括附加体的状态(游离或整合)。以F因子为例,F-:F因子缺失;F+:自主性F因子,不携带任何遗传可识别染色体片段;F':携带有遗传可识别细菌染色体片段的自主性F因子;Hfr:整合到染色体上的F因子(high frequency of recombination)。当这些质粒或噬菌体片段变异或缺失时,用()“或”/“等以区别。例如:/F' [traD3 6、proAB、lac I q、lacZ. M 15] 6、某个基因或某个领域缺失时,在其基因型前面加上“ ”表示。例如:lac-proAB基因缺失时它的基因型表示为(lac-proAB)。 7、由于某种基因的变异导致大肠杆菌可以明显观察到特征变化,有时也用其表现型代替基因型进行表示。例如:某些抗药性的获得或丧失,用如下方式表示:Streptomycin抗性→Str +或Str r,Ampicilli n敏感性→ Amp-。(第一个字母要大写,“+”或“r”表示有抗性,“-”表示无抗性或敏感)。 8、根据某些特异性蛋白的变异及其导致的结果变化进行表示。例如:TH2菌株上有一种基因型表示如下:hsdS20 (rB-、mB-),其中S20代表特异性识别蛋白发生变异,()中的rB-、mB-表示由于 S20的变异而导致B株来源的hsdR和hsdM的功能缺失。 9、蛋白质的名称与对应的基因或等位基因相同,但不用斜体,且首字母大写,如,UvrA、UvrB。 二、基因符号和意义(见表1)