当前位置:文档之家› 如何查找一个基因的启动子序列

如何查找一个基因的启动子序列

如何查找一个基因的启动子序列
如何查找一个基因的启动子序列

如何查找一个基因的启动子序列

发表者:刘小丰 (访问人次:6102)

刘小丰收集整理

定义:启动子是参与特定基因转录及其调控的DNA序列。包含核心启动子区域和调控区域。核心启动子区域产生基础水平的转录,调控区域能够对不同的环境条件作出应答,对基因的表达水平做出相应的调节。

区域:启动子的范围非常大,可以包含转录起始位点上游2000bp,有些特定基因的转录区内部也存在着转录因子的结合位点,因此也属于启动子范围。

这项搜寻要从UCSC基因组浏览器开始,网址为

https://www.doczj.com/doc/441243414.html,/cgi-bin/hgGateway。以编码pendrin (PDS)的基因为例来说明上述问题。PDS与耳蜗的异常发育、感觉神经性听力下降以及弥散性甲状腺增大(甲状腺肿)有关。

进入UCSC的主页后,在Organism的下拉菜单中选择Human,然后点击Browser。使用者现在到了人类基因组浏览器入口。本例的搜寻很简单:在assembly的下拉菜单中选择Dec. 2001,在position框中键入pendrin,然后点击Submit。返回的页面结果显示一个已知的基因和两个mRNA序列。继续点击mRNA序列的登录号AF030880,出现包含这个mRNA区域的图解概要。为了获得这个区域更清晰的图像,点击紧靠zoom out的1.5X按钮。最后点击页面中部的reset all按钮,使各个路径的设置恢复默认状态。

然而,对于本例的搜寻目的来说,默认设置不是理想的设置。按照视图利用页面底部的Track Controls按纽,将一些路径设置为hide模式(即不显示),其他设置为dense模式(所有资料密集在一条直线上);另一些路径设置为full模式(每个特征有一个分开的线条,最多达300)。在考虑这些路径内究竟存在那些资料之前,对这些路径的内容和表现做一个简要的讨论是必要的,许多这些讨论是由外界提供给UCSC的。下面是对基因预测方法的更进一步讨论,这些信息也可以在其他地方找到。

对于Known Genes(已知基因)和预测的基因路径来说,一般的惯例是以一个高的垂直线或块状表示每个编码外显子,以短的垂直线或块状表示5′端和3′端非翻译区。

起连接作用的内含子以非常细的线条表示。翻译的方向由沿着细线的箭头指示。

Known Genes来自LocusLink内的mRNA参照序列,已经利用BLAT程序将这些序列与基因组序列进行比对排列。

Acembly Gene Predictions With Alt-splicing路径是利用Acembly程序将人类mRNA 和EST序列数据与人类基因组序列进行比对排列而来的。Acembly程序试图找到mRNA与基因组序列的最好的比对排列以及判断选择性剪接模型。假如有多于1个的基因模型具有统计学意义,则它们都全部显示出来。有关Acembly的更多信息可以在NCBI的网站找到(https://www.doczj.com/doc/441243414.html,/IEB/Research/Acembly/)。

Ensembl Gene Predictions路径由Ensembl提供。Ensembl基因通过许多方法来预测,包括与已知mRNA和蛋白质进行同源性比较,ab initio基因预测使用GENSCAN和基因预测HMMs。 https://www.doczj.com/doc/441243414.html,/ensembl/ Fgenesh++ Gene Predictions路径通过寻找基因的结构特征来预测基因内部的外显子,例如剪接位点的给位和受位的结构特征,利用一

种动态的程序算法推定编码区域和推定外显子5′端和3′端的内含子区域;这个方法也考虑到蛋白质相似性的资料。

Genscan Gene Predictions路径由GENSCAN方法衍生而来,通过这个方法,可以确定内含子、外显子、启动子区域和poly(A)信号。此时,这个方法并不期望查询的序列只出现1个基因,因此可以对部分基因或被基因之间的DNA分隔的多个基因进行准确的预测。

Human mRNAs from Genbank路径显示基因库的人类mRNAs与基因组序列的比对排列。

Spliced ESTs和Human EST路径显示来自GenBank的ESTs序列与基因组的序列对齐比较。由于ESTs通常代表了转录基因的片断,一个EST很有可能对应于某个外显子区。

最后,Repeating Elements by RepeatMasker这个路径显示的是重复元件,例如散在的或长或短的核元素(SINEs和LINEs),长末端重复序列(LTRs)和低复杂性区域

(https://www.doczj.com/doc/441243414.html,/cgi-bin/RepeatMasker)。一般来说,在将基因预测方法应用于核苷酸序列之前,需要去掉或掩饰这些成分。

回到视图显示的例子,可以看到大多数路径返回了几乎同样的基因预测结果。作为一个规则,通过多种方法预测的外显子提高了预测的正确率而不会出现“假阳性”结果。多数方法显示3′端非翻译区,以左侧大而短的块状表示。Acembly路径显示除了全长序列产物(如这个部分第3条线所示)之外还有3个可能的选择性剪接,其它大多数路径显示与此预测结果相符。Genscan路径从左、右方向往远处延伸:GENSCAN可以被用于预测多个基因。

尽管这些图解概要很有用,然而研究者更需要与这些垂直线或块状相对应的序列。以此为例,用Fgenesh++预测作为获得原始序列数据的基础,但不管选择哪个路径其步骤都是一样的。点击标有Fgenesh++ Gene Predictions的路径,出现的是一个描述预测的概要页面。

序列的区域与pendrin基因相似(从这个例子一开始就已经知道了)。给出了序列的大小及序列开始和结束的预测,并显示预测是以负链为基础的。想要获得序列,点击Genomic Sequence。使用者将被带到一个标题为Get Genomic Sequence Near Gene的查询页面,在这个页面上,可以获得转录物、编码区、启动子或转录物加启动子的序列。

点击Transcript返回的页面显示完整的转录子,外显子以大写字母表示。

点击Coding Region Only得到的是编码区,外显子以大写字母表示。

点击Transcript + Promoter,返回的页面显示的是在上述选择Transcript所获序列的5′端添加了启动子序列,以大写字母表示外显子。启动子的长度显示在文本框内。

点击Promoter返回的页面正好是启动子区

2 基因启动子序列的预测分析

真核细胞的基因表达调节虽然是多个水平的调节,但主要是转录水平的调节. 转录水平的调节基础就是转录因子蛋白与启动子DNA序列之间的结合和激活. 转录因子蛋白的结构可以分成结合域(BD,binding domain)以及激活域(AD,activation domain). 作为基因启动子DNA的序列也具有特征性的结构. 但是相比较而言,目前基因启动子以及转录因子蛋白结合的种类,积累的资料还十分有限,数据库容量偏小,计算技术相对滞后,其预测结果仅供参考,还必须结合其他的分子生物学技术进行证实.

一般情况下,确定了一种新基因的编码区序列之后,通过与htgs数据库的同源性比对,

可以很方便地确定其相应的基因组DNA序列. 在确定编码基因的起始密码子之后,指导基因表达的启动子序列一般位于其上游基因序列300-3 000 nt之间,鲜有例外. 可以从翻译起始密码子上有的基因组DNA序列,选取3 000 nt左右的核苷酸序列进行生物信息学分析. 例如可以应用在线软件分析技术,或自行研发的启动子序列分析技术等软件分析,如:http://www.cbs.dtu.dk/services/promoter/、

https://www.doczj.com/doc/441243414.html,/cgi-bin/seq_tools/promoter.pl,

https://www.doczj.com/doc/441243414.html,/molbio/proscan/等. 根据这些软件分析的结果,首先确定进行缺失突变体构建时应该采用的引物序列,如果一段序列的缺失导致报告基因表达水平的升高,那么说明这一段基因序列存在着启动子的静息子(silencer)的序列,对于基因的表达水平具有负调节作用. 通过逐步缺失的策略,最终确定启动子DNA的核心序列. 报告基因表达载体的构建以及细胞转染技术,仍然是目前研究基因启动子序列活性最为基本的方法.

研究转录因子蛋白的结合及其对基因表达水平的调节作用和性质有许多技术,但是利用生物信息学技术预测的启动子DNA序列的结合的转录因子蛋白结果只有部分参考的意义. 凝胶迟滞(gel shift)试验、超级迁移实验(super shift)、竞争性结合实验、酵母单杂交技术(yeast one hybrid)、噬菌体展示技术(phage display)等在转录因子蛋白与启动子DNA 序列结合的研究中具有重要应用前景.

干擾素γ增強GH3細胞中人生長激素基因表達機制

干擾素γ,生長激素基因啟動子,GH3細胞,熒光素酶報告基因interferon-γ,hGH gene promote

r,GH3 cell line,luciferase reporter gene

為了研究干擾素γ(IFN-r)對大鼠垂體GH3細胞中人生長激素(hGH)基因啟動子活性的影響及其

可能的作用機制,採用熒光素酶報告基因方法,將含hGH基因啟動子(-484~2bp)和熒光素酶報

告基因的表達質粒pGL3-484-Luc單獨轉染或與垂體特異性核轉錄因子Pit-1蛋白表達質粒(pc

DNA-Pit-1-cDNA)或Pit-1反義寡核苷酸(Pit-1 OND)共轉染於大鼠垂體GH3細胞中,觀察加入

IFNγ及細胞內信號轉導途徑的抑制劑後GH3細胞中熒光素酶表達的變化,反映其對hGH啟動

子活性的影響;將含不同長度hGH基因啟動子序列的熒光素酶表達質粒pGL3-380-Luc(-380~2b

p)、pGL3-250-Luc(-250~2bp)、pGL3-132-Luc(-132~2bp)和pGL3-66-Luc(-66~2bp)分別轉染G

H3細胞,觀察它們對IFN-γ的反應,以尋找IFN-γ影響hGH基因啟動子活性的關鍵序列。結

果表明,IFN-γ(10^5u/L, 10^6u/L)均能促進大鼠垂體GH3細胞中熒光素酶的表達,最高達對

照組的131%(P<0.001);在胞內信號轉導抑制劑中,只有絲裂原活化蛋白激酶(MAPK)信號轉導

途徑抑制劑PD98059(40μmol/L),能完全阻斷IFN-γ的促進作用;Pit-1蛋白過表達和表達被

抑制對IFNγ的促進作用沒有影響;含不同長度hGH基因啟動子序列質粒中,只有pGL3-380-L

uc和pGL3-250-Luc仍具有對IFN-γ的反應性。這說明IFN-γ能增強大鼠垂體GH3細胞中hG

H基因的啟動子的活性,此作用可能是通過激活細胞內依賴MAPK的途徑完成的,並與hGH基因

上游-250~-132bp啟動子序列密切相關,但與垂體特異性核轉錄因子Pit-1蛋白關係不大。

The method of luciferase reporter gene was used to investigate the effect of inter

feron-γ (IFN-γ) on the activity of human growth hormone (hGH) gene promoter in r

at pituitary GH3 cells, to elucidate the post-receptor signal transduction pathway

and the key promoter sequence which mediated the action of IFN-γ. The luciferase

expression plasmid pGL3-484-Luc containing hGH gene promoter (-484-2bp) and lucif

erase reporter gene were transfected alone or cotransfected with pituitary-specifi

c transcription factor Pit-1 expression plasmi

d (PcDNA-Pit-1-cDNA) or Pit-1 antise

nse oligonucleotide (Pit-1 OND) into rat GH3 cells. The changes of luciferase expr

ession in the GH3 cells were determined, after treatment with IFN-γ or IFN-γ plu

s inhibitors of intracellular signaling pathways, to observe the effect of IFN-γ

and these inhibitors on the activity of hGH gene promoter. The various deletion co

nstructs of Luc-reporter: pGL3-380-Luc, pGL3-250-Luc, pGL3-132-Luc and pGL3-66-Lu

c, which contained the -380-2bp, -250-2bp, -132-2bp and -66-2bp sequences of hGH g

ene promoter, respectively, were transfected into GH3 cells, then the changes of l

uciferase expression in the GH3 cells were assayed, after treatment with IFN-γ, t

o find out the key sequence which mediated the action of IFN-γ. Our results showe

d that IFN-7 (10^5u/L, 10^6u/L) could increas

e luciferase expression in GH3 cells transfected with pGL3-484-Luc alone, the maximal action being 131% o

f the control

(P<0.001). Among the inhibitors of intracellular signaling transduction pathways,

only mitogen-activated protein kinases (MAPK) inhibitor PD98059 (40μmol/L) could completely blocked the stimulatory effect of IFN-γ on hGH gene promoter activity.

Pit- overexpression or inhibited Pit-1 expression, both had no effect on IFN-7-in

duced hGH gene promoter activity. When various deletion constructs of Luc-reporter

were transfected into GH3 cells, only pGL3-380-Luc and pGL3-250-Luc still respond

ed to IFN-γ. In conclusion, IFN-γ could increase the activity of hGH gene promot

er in rat pituitary GH3 cells. This stimulatory effect of IFN-γ may be associated

with the intracellular MAPK signaling pathway and with -252--132bp sequence in hG

H gene promoter, but had no relationship with pituitary-specific transcription fac

tor Pit-1.

与DNA结合蛋白相作用的启动子序列的鉴定

信息来源:本站原创更新时间:2004-3-24 14:35:00

将细胞核置于冰上解冻,精确测定核悬浮液的体积。

番茄子叶细胞核的分离提取为例子进行实验

步骤2~7须在4℃下使用高压灭菌过的设备进行。

1.将番茄种子种在灭菌的水饱和滤纸上,置于小盆内,用薄膜封口后,培养7天。用刀片切下番茄子叶后收集备用。

2.将40~50g新鲜组织放入300ml匀浆缓冲液,用韦林氏搅切器先1×4秒而后6×1秒。3.过滤匀浆混合液,使其透过漏斗上的4层厚纱布及纱布下按孔径递减次序放置的3层Nitex尼龙筛网(300μm,100μm,52μm),汇入大烧杯中。全部匀浆物均滤完后把纱布

集中在一起,将纱布上的滤液压入尼龙网,并使其经漏斗流入烧杯中。切勿将滤液压出尼龙网,亦不可使用抽滤,让滤液靠重力作用下流。

4.将每批滤出的匀浆倒入500ml离心瓶中,用Sorvall GS-3转头5000r/min(4225g),4℃离心20分钟。

5.吸去上清,然后将核粗提沉淀物用大口径塑料巴斯德吸管温和地反复吹吸,使沉淀悬浮于匀浆缓冲液中。将重悬起的沉淀转入50ml离心管中,用匀浆缓冲液调节体积至约40ml。6.4℃用Sorvall SS-34转头4000r/min(1912g)离心10分钟,再次沉淀细胞核。重复步骤5和6三次,分别在3500r/min离心10分钟,8分钟和6分钟。最后一次离心后,尽可能洗净匀浆缓冲液。

7.将核悬浮于核悬浮缓冲液中,按每50g植物组织加0.5ml核悬浮缓冲液。用液氮冷冻,保存于-80℃。若核蛋白抽提即将进行,可不必将核冷冻起来。

核抽提物的制备

2.加入核裂解缓冲液,使NaCl终浓度为0.47 mol/L(即,每毫升核悬浮加入182μl核裂解液)。

3.将核悬浮液置于摇床上,4℃温和摇动30分钟。

4.4℃微量离心20分钟沉淀染色质。

5.小心移出上清,避免搅起胶状的含DNA的沉淀,以使抽提液中避免含有此类杂质。6.4℃透析上清3~4小时,中间换几次透析液。

7.将透析液用液氮冷冻,再置于冰上解冻,4℃微量离心或用Sorvall SS-34转头10 000r/min(12 000g)离心15分钟,弃沉淀,保留上清。此步骤是为了将其余可能在浓缩步骤中阻塞微量浓缩器的蛋白质沉淀除去。

8.用CENTRICON TM10微量浓缩器浓缩上清,以使提取液中蛋白质的终浓度为1~3mg/ml。可以溶菌酶为标准物用Bio-Rad Bradford-based蛋白质分析试剂盒来测定蛋白质浓度。经验表明,要达到上述浓度,至少需要浓缩2~3次。

9.留出待作迁移分析的核抽提物,将剩余部分用液氮或干冰冷冻,贮于-80℃备用。DNA片段的标记

l 聚丙烯酰胺凝胶的制备

1.安装凝胶装置并洗净玻璃板。

2.配制4%丙稀酰胺凝胶液,将以下成分混合:

丙稀酰胺/双丙稀酰胺(29:1) 4ml

TBE(10×) 3ml

APS(10%) 200

nbsp; 200μl

TEMED40μl

制备厚1mm的凝胶,并保证上样孔可容纳25μl样品。凝胶聚合约需1小时,制好后,使用前可于室温放置1天。

l 探针的标记

1.按下表顺序将下列试剂加入1.5ml微量离心管中:

EcoR I酶解的质粒DNA(1μg或约800fmol末端) 2.5μl

Sequerase?缓冲液(5 2.0μl

[α-32P]dATP(6000 Ci/mmol) 3.0μl

二硫苏糖醇(0.1mol/L)

双蒸去离子水(ddH2O) 0.5μl

Sequerase?酶(用4倍Sequerase?稀释缓冲液稀释) 1.0μl

总体积: 10μl

2.室温放置15分钟。

3.加入0.5μl dNTP混合物,充分混匀。

4.室温放置15

μl 0.35mol/L的乙酸钠并充分吹吸混匀以终止反应。

l 测定掺入的放射性活度

1.取5μl标记反应混合物移至一新管中。将2μl此混合物点加到DE81滤膜上,再将该滤膜浸入盛有约20ml 0.5mol/L磷酸钠(pH7.0)的烧杯中。再取第二张滤膜重复上述操作。2.将烧杯置于平面振荡器上,使溶液温和振荡5分钟,将缓冲液倒入放射性废弃物中。3.用新缓冲液重复两次清洗步骤。

4.用双蒸水漂洗滤膜5分钟,再用双蒸水重复漂洗两次。

5.用95%乙醇洗滤膜5分钟。

6.使滤膜完全干燥,再将每一张滤膜移入闪烁计数管,加入闪烁混合物,计数。

7.计算理论掺入的最大比率。计算方法如下:1)每个反应可标记400fmol质粒DNA。2)标记反应在EcoR I酶切的质粒DNA两端进行,每个末端可掺入两个脱氧腺苷磷酸残基。3)因此,每400fmol质粒DNA可结合1600fmol标记核苷酸。4)标记核苷酸的比活性是6000 Ci/mmol,即13 000cpm/fmol。5)因此,理论最大掺入值为每400fmol质粒DNA 13 000cpm ×1600fmol=2.08×107cpm或每400fmol片段1.04×107cpm。注意,仅掺入量的一半包含在待测片段中。随后的酶解反应会释放出一端标记的待测DNA片段和一端标记的载体DNA。

l 标记探针的分离

1.加95μl酚/氯仿/异戊醇(25:24

:1)于剩余的95μl标记混合物中。充分混匀。

2.室温离心3~5分钟以分离酚相与水相。

3.小心取85μl上层水相于另一干净离心管中,将盛有酚相的离心管弃入放射性废弃物中。加入200μl 95%乙醇于水相中,旋紧管盖后,涡旋混匀。

4.将离心管于碎干冰上放置15~20分钟,然后离心20分钟。

5.用移液器,小心将含乙醇的上清弃于放射性废弃物中。加入600μl 80%乙醇洗涤沉淀,离心1~2分钟,用移液器弃去乙醇。

6.用真空离心蒸发浓缩器干燥沉淀2~3分钟。

7.将沉淀用20μl 1×Sequenase?缓冲液重悬,再加入0.5μl 10units/μl的Pst I将标记的DNA片段从载体DNA上切下。37℃温育30~60分钟。

8.加入2.5μl高EDTA 10×凝胶染液于酶解混合物中。向先制好4%丙稀酰胺凝胶中上样,然后用1×TBE缓冲液在大约10V/cm电压下电泳约2.5小时。电泳时间取决于标记片段的大小。目的是为了很好地分离标记片段与质粒载体,但切勿使目的片段跑出胶外。

9.电泳后,小心地把凝胶用保险膜包裹好,对X光片曝光5~10分钟。使用Sharpie?或其他防水标记物标记胶片及凝胶边缘,以便胶片显像之后可根据标记使凝胶与胶片重合。10.切下凝胶上对应地标记DNA的条带,置于1.5ml离心管中。4℃下用300μl洗脱缓冲液温育凝胶薄片过夜,以洗脱DNA

将洗缓冲液移取至另一干净的离心管中。再向凝胶管中加入250μl洗脱缓冲液。-80℃冷冻再解冻,然后将洗脱缓冲液取出与前一次洗脱的溶液合并。将合并后的洗脱液离心10分钟以沉淀聚丙稀酰胺的小碎片。移取上清至另一干净离心管中,用2倍体积的95%乙醇沉淀DNA,碎干冰上放置20分钟,然后离心20分钟。弃上清,用约500μl 80%乙醇洗沉淀。用真空离心蒸发浓缩器干燥沉淀2~3分钟。

11.将纯化的DNA片段重悬于20μl片段重悬缓冲液中。取一小等份计数测定回收的片段fmol数。一般情况下,大约可以回收原初标记量的50%。从凝胶中洗脱的效率大约为80%,但是收率会因DNA片段的大小而异。纯化的DNA片段可在4℃最多可以保存2个星期。

迁移率变动分析法

l 聚丙烯酰胺凝胶的制备

1.组装电泳装置并洗净玻璃板。

2.按下表配制4%非变性丙稀酰按凝胶溶液:

丙稀酰按/双丙稀酰按(29:1) 4ml

TBE(10×) 3ml

APS(10%) 200μl

TEMED 40μl

可灌制成1~1.5mm厚的凝胶。凝胶聚合约需1小时,使用前可于室温下保存1天。

l DNA-蛋白质结合反应

1.将10mg/ml

的poly(dI-dC)?poly(dI-dC)贮液用无菌双蒸馏水稀释成终浓度6μg/μl。将6μg/μl的poly(dI-dC)?poly(dI-dC)溶液与32mmol/L(pH8.0)的EDTA等体积混合,配制成工作溶液。用片段重悬缓冲液将32P标记的DNA片段稀释至终浓度2fmol/μl。

2.对于标准DNA-蛋白质结合反应,按下表顺序将下列试剂加入1.5ml微量离心管:

32P-标记DNA片段(2fmol/μl) 0.5μl

poly(dI-dC)?poly(dI-dC)+EDTA工作溶液 0.5μl

核抽提液和/或透析缓冲液 9μl

总体积 10μl

吹吸混匀。

3.室温温育45分钟,此时可将凝胶在100V预电泳10~15分钟。

4.温育结束后,可不加染液直接将样品加在凝胶上。在一个小样孔中单独加入10μl含0.05%二甲苯青和0.05%溴酚蓝的透析缓冲液用来跟踪电泳进程。

5.用1×TBE缓冲液在约10V/cm条件下电泳约2小时。具体时间取决于所使用的DNA片段的大小。

6.小心地把凝胶转移到Whatman 3MM

滤纸上并用保鲜膜覆盖在凝胶上。80℃用凝胶干燥器干燥凝胶约1小时。

7.室温下把干燥凝胶对X光片曝光过夜。

DNase I足迹分析法

l 聚丙烯酰胺凝胶的制备

1.组装制作测序胶所需装置并洗净玻璃板。

2.按下表配制4%非变性丙稀酰按凝胶溶液:

丙稀酰按/双丙稀酰按(38:2) 11.3ml

尿素 31.5g

TBE(10×) 3.75ml

APS(10%) 300μl

TEMED 30μl

灌制凝胶。此凝胶聚合约需2小时。使用前可在室温下存放1天。

l DNA-蛋白质结合反应

1.将10mg/ml的poly(dI-dC)?poly(dI-dC)贮液用水稀释成6μg/μl,等体积混合6μg/μl poly(dI-dC)?poly(dI-dC)和32mmol/L EDTA(pH8.0),配制成poly(dI-dC)+EDTA工作溶液。将32P标记的DNA片段用片段重悬缓冲液稀释成2fmol/μl。

2.对于标准结合反应,将以下试剂按下表顺序逐个加入1.5ml微量离心管:

32P标记DNA片段(2fmol;通常约20 000cpm) 1μl

poly(dI-dC)?poly(dI-dC)+EDTA工作溶液 1μl

核抽提液和/或透析缓冲液 18μl

(含20~50μg蛋白质,具体用量取决于抽提物中DNA结合蛋白的活性)

总体积 20μl

吹吸混匀。

3.室温温育30分钟。温育过程中,用DNase I稀释缓冲液稀释DNase I。(对于标准结合反应,稀释后的DNase I的浓度为20μg/ml)

4.每管结合反应混合液中加2μl稀释的DNase I 溶液,吹吸混匀(标准结合反应中,DNase I的终浓度为2μg/ml)。室温温育10分钟,从第一次加样入结合反应混合液终起开始计时。5.加入80μl DNase I终止液和100μl酚/氯仿/异戊醇(25:24:1)以终止酶解反应。6.振荡每管样品数秒,注意微量离心管管口应旋紧。室温离心3~5分钟。

7.每管移取85μl上层水相至另一新管,将含酚相的离心管作为放射性废弃物丢弃。向每管水相中加入200

μl 95%乙醇,略作振荡后,将管置于碎干冰上放置15~20分钟。

8.离心20分钟,小心弃上清。向每管沉淀加入500μl 85%乙醇。离心2~3分钟,小心弃去上清,干燥沉淀。

9.将沉淀在真空离心蒸发浓缩器中干燥约5分钟(确保沉淀干燥彻底)。每管中加入3μl 甲酰按染液,用Eppendorf振荡器或涡旋混匀。

10.煮样品3分钟后,立即置于冰上冷却。稍作离心,使样品汇集于管底,再放回冰上。上样于6%测序胶,然后用1×测序TBE缓冲液,在45~50℃ 3000~4000V下电泳,直至溴酚蓝走到凝胶底部。电泳过程中,为保持凝胶温度在45~50℃,可能需要加大电压。11.甲醇/乙酸/H2O(5:5:90)固定凝胶15分钟后,将胶移至Whatman 3MM滤纸上用凝胶干燥器干燥。

12.把干燥凝胶对X光片在-80℃曝光过夜,需使用增感屏。

启动子克隆方法研究进展

作者:来源:时间: 2007-03-07 字体: [大中小]

随着基因工程的发展,常常需要构建一种能高水平表达异源蛋白质的表达载体。启动子对外源基

因的表达水平影响很大,是基因工程表达载体的重要元件。因此研究启动子的克隆方法,对研究基因表达调控和构建表达载体至关重要。

迄今为止,国外尚未见到有关启动子克隆方法的综述性报道,国内仅孙晓红等曾就启动子的结构、分类、克隆方法和食用菌中已经分离到的启动子作过综述。而近年来又有许多改进的克隆启动子的方法获得了多方面的成功,本文就近年来改进的启动子克隆方法作一综述,以期促进对启动子分离技术的应用。

1 启动子克隆的几种方法

1.1 利用启动子探针载体筛选启动子

启动子探针型载体是一种有效、经济、快速分离基因启动子的工具型载体,包含2个基本部分:转化单元和检测单元。其中,转化单元含复制起点和抗生素抗性基因,用于选择被转化的细胞;检测单元则包括1个已失去转录功能且易于检测的遗传标记基因以及克隆位点。

利用启动子探针载体筛选启动子的过程为,先选用1种适当的限制性核酸内切酶消化切割染色体DNA,然后将切割产生的DNA限制片段群体与无启动子的探针质粒载体重组,并按照设计的要求使克隆的片段恰好插在紧邻报告基因的上游位置;随后再把重组混合物转化给寄主细胞,构建质粒载体基因文库,并检测报告基因的表达活性。

当插入段同时满足(1)具有基因启动子序列;(2)具有翻译启始区;(3)具有启始密码子;(4)插入方向正确;(5)插入片段3'端编码区序列抗性基因编码区读码框一致,则有可能形成有功能的抗性融合基因,从而启动抗性基因的表达。

最早由Rachael等在大肠杆菌中以四环素抗性基因作为报告基因构建了启动子探针质粒pBRH3B,并克隆了一些原核和真核启动子片段。其后Donna等以氯霉素抗性基因作为报告基因,Fodor等以大肠杆菌La cZ为报告基因,构建了酵母启动子探针质粒并克隆了一些启动子片段。构建启动子探针型载体,较为常见的检测标记基因有β-半乳糖苷酶基因(lacZ)、氯霉素乙酰转移酶基因(cat)、四环素抗性基因(Tet')和卡那霉素抗性基因(Kan')。近年来,人们渐渐较多地使用潮霉素B磷酸转移酶(hph)基因作为检测标记基因。李维等曾构建了含有hph抗性基因的启动子探针型载体pSUPV8,直接在大肠杆菌中分离黄孢原毛平革菌基因的启动子。先用Sau3AI酶切黄孢原毛平革菌基因总DNA,再与用BamHI酶切后的pSUPV8相连,转化大

肠杆菌,用间接筛选法从氨苄青霉素和潮霉素抗性平板上筛选重组子,得到6个双抗重组子(pCH1~pCH6),电泳检测插入片段分别命名为CHl~CH6;再用原生质体转化法将重组子分别转化黄孢原毛平革菌,对获得的转化子进行复筛,仅pCH6的转化平板上有稳定生长的菌落,说明了CH6片段在黄孢原毛平革菌中具有启动基因表达的功能。该方法不需要知道具体基因的序列,可随机筛选启动子,避免了引物设计,能获得大量的启动子片段。

1.2 利用PCR技术克隆启动子

即根据发表的基因序列,设计引物,克隆基因的启动子,由于PCR法简便快捷,近年来人们较多采用此方法克隆基因启动子。

苏宁等根据已报道的水稻叶绿体16SrRNA启动子基因序列设计5'启动子序列的引物,以水稻叶绿体D NA为模板,PCR扩增出16SrRNA基因5'启动子区的片段,酶切克隆到pSK的SacI和SphI位点,构建测序载体质粒pZ16S,进行序列测定,结果表明所克隆的片段长为144bp,含有SD序列。同源比较结果表明,所克隆的片段与水稻叶绿体16SrRNA启动子序列具有100%的同源性。

上述的PCR方法简便、快捷、操作简单,是人们较为广泛使用的技术。

1.3 环状PCR

环状PCR包括I-PCR(Inverse-PCR)和P-PCR(Panhandle-PCR)。这2种PCR都是根据一端已知序列设计的嵌套式引物进行PCR。

1.3.1 I-PCR I-PCR是1988年由Triglia最早提出的一种基于PCR的改进的染色体步行方法。

I-PCR的实验程序包括,基因组DNA经酶切后用T4DNA连接酶进行自连接,产生环状DNA片段;以环化产物为底物,用根据已知片段设计的反向引物进行PCR扩增,从而得到含有未知片段的扩增产物(流程如图1所示)。

韩志勇等以I-PCR技术为基础克隆了转基因水稻的外源基因旁侧序列。先用小量法提取转基因水稻的总DNA,总DNA用10倍过量的限制内切酶进行过夜酶切,酶切片段进行自连接,然后根据工程质粒的T-D NA区设计2对反向引物,进行套式PCR扩增旁侧序列。建立了适合于处理大量材料的克隆转基因水稻中外源基因旁侧序列的技术体系。在1周内克隆了35个转基因水稻株系中外源基因的旁侧序列,长度在300~750bp之间。I-PCR法快速、高效、稳定,操作相对简单,花费少,PCR引物设计比较方便。

1.3.2 P-PCR P-PCR是由Jones等提出的利用末端反向重复序列与已知序列互补配对形成环状单链模板,有效增强了引物与模板结合的特异性。反应需要3个根据已知序列设计的引物,3个引物在已知序列内呈线性排列,其中第3个引物可作为接头使用,可与已知序列互补配对形成锅柄状单链模板。其过程为,首先酶切基因组DNA,产生5'或3'粘末端,然后连接上合适的接头(primer 3),连接好后最好用核酸外切酶I除去多余的接头,由于连接上的接头与已知序列是反向重复序列,变性后的DNA单链可退火形成锅柄状单链模板,之后分别用3个单引物进行3次PCR扩增,能有效地扩增2~9kbp的大片段未知序列(流程如图2所示)。

黄君健等成功地应用P-PCR技术从正常的人外周血单核细胞基因组DNA中扩增端粒催化亚基hTERT基因5'端上游旁侧序列,获得了hTERT基因翻译启始位点上游2090bp的基因组DNA序列。首先用酶切消化基因组DNA,得到带有GATC的5'突出端的DNA片段。然后利用已知的hTERTcDNA序列设计PCR引物,用常规的PCR方法扩增出1条大约900bp的基因组特异片段,序列分析为hTERT的基因组DNA片段。根据得到的基因组DNA序列的信息,确定P-PCR的引物退火区,并合成了5'磷酸化的连接寡核苷酸和4条基因特异性引物,其中连接寡核苷酸5'端的4个碱基CTAG与上述核酸内切酶消化产生的5'突出端GATC互补,然后将连接寡核苷酸与基因组酶切产物连接,以连接产物为反应模板,进行PCR,使模板自身进行退火-延伸反应,以形成Panhandle结构。最后以单链Panhandle为模板,4条基因特异序列为引物进行嵌套式PCR,最终获得了1条约2kb的含hTERT基因启动子的DNA片段。Jones等利用改进的P-PCR,在形成panhandle 结构之前3'末端连上ddCTP,使引物错配的机率减少,特异性增加。他们从人类基因组DNA已知位点侧翼

扩增了4~9kb的大片段未知序列。P-PCR是目前能够扩增距已知序列最远的未知DNA序列的方法,有很高的特异性。

1.4 利用载体或接头的染色体步行技术克隆基因启动子

这类方法的第一步都是酶切基因组DNA,连接载体或接头,既可以用pUCl8等质粒载体,也可以使用λDNA等噬菌体载体,只要选用的载体带有合适的酶切位点;同样根据实验需要,接头既可以是双链也可以是单链,然后根据基因组DNA序列设计的特异引物和载体的通用引物或接头序列进行扩增。

1.4.1 利用载体的PCR Shyamala等利用的单特异性引物PCR(SSP-PCR)对以小鼠伤寒杆菌组氨酸转运操纵子为起点进行连续步行。以M13mpl8RF DNA为载体。用PstI和AraI酶切基因组DNA,PstI和XmaI酶切载体DNA,然后连接基因组片段和载体片段,用根据基因组DNA序列设计的特异引物和载体的通用引物进行扩增,由于非特异片段没有单特异引物结合的位点,即使有载体连到非特异片段,也无法得到大量扩增,而使特异片段得到有效扩增。

1.4.2 利用接头的PCR王新国等利用衔接头的方法,设计了位于单链DNA两端互补的颠倒末端重复序列,增加了反应的特异性,在胡萝卜II型转化酶基因启动子的克隆方面取得了新的进展。首先将胡萝卜基因组DNA分别用PvuI、SmaI、DraI、EcoRV酶切,并设计了1个衔接头长链序列和1个衔接头短链序列,并在衔接头短链的3'末端带有1个氨基的衔接头,能够阻止聚合酶催化的衔接头短链的延伸,同时衔接头的长链和短链之间是反向重复序列。将酶切片段与此衔接头连接,取连接产物做模板,以衔接头引物和基因特异引物做PCR,在首轮PCR中只有限定的远端基因特异引物有结合位点,当基因特异引物延伸产生的D NA链通过衔接头时,才能产生衔接头引物的结合位点,PCR才能以衔接头引物和基因特异引物进行指数扩增。而另一方面,如果非特异合成产生了DNA两端都有双链衔接头序列的PCR产物时,这种PCR产物在每次变性后,单链DNA末端的衔接头反向重复序列将形成锅柄结构,此结构比引物-模板杂交更稳定,能抑制非特异序列的指数增长。最后得到主要的PCR产物为3.4kb、1.3kb、0.6kb和0.4kb。将EcoR V-衔接头体系的PCR产物克隆、测序、同源性比较,得到1个新的胡萝卜II型转化酶基因启动子序列,它含有类似于TATA box和CAAT box的元件,在启动子的远上游区域含多个AT富含区,该启动子的发现对于研究植物中的糖代谢具有重要的意义。接头引物的相对位置如图3所示。

这种方法具有便于操作、实验线路简单的优点,但是特异性较差,产物需进一步杂交验证。

1.5 YADE法

Prashar等在扩增cDNA3'端时采用“Y”形接头,以减少接头引物的单引物扩增。

其原理是接头引物处于“Y”接头的2个分叉单链上,序列与接头一样,只有与特异引物引导合成了接头的互补序列后,接头引物才能退火参与扩增,流程如图4。

方卫国等尝试将YADE法引入到昆虫病原真菌的分子生物学研究,并取得了成功,建立了适合于球孢白僵菌和金龟子绿僵菌YADE体系。在已克隆的类球孢白僵菌类枯草杆菌蛋白酶基因CDEP-1的基础上,利用YADE法,克隆到该基因的启动子CDEPP。

先酶切球孢白僵菌基因组DNA,然后与“Y”形接头相连,取连接产物做模板,先以基因特异引物1做线性扩增,再以线性扩增产物为模板,以接头引物和基因特异引物2做指数扩增,只有当线性扩增时合成了含有接头引物的互补单链,接头引物才能与其发生退火,参与指数扩增,从而有效防止了接头引物的单引物扩增。最后得PCR产物,进行序列分析确定为CDEP-1的上游启动子序列。

在应用YADE法时,内切酶的选择至关重要。好的内切酶产生适合PCR扩增的片段,太大太小都不行。为了得到合适的内切酶,需要从众多的内切酶中筛选。研究表明,不同的物种有自己合适的内切酶。YADE 法延伸的起始片段可以是基因组 DNA片段,也可以是cDNA片段,在延伸cDNA片段时,设计的引物需要避开内含子和外显子的边界,在内含子的位置未知的情况下,可考虑多合成1~2条特异引物,以提高扩增未知片段的机率。该方法假阳性低、效率高,理论上能扩出所有目的片段。

1.6 TAlL-PCR

很早就有用随机引物的PCR,但由于无法有效地控制由随机引物引发的非特异产物的产生,所以一直未能广泛应用。近年来由IJiu等设计的TAIL-PCR(Termal Asymmetric Interlaced PCR)又叫热不对称交错PCR,则解决了这个问题,后来有研究表明,经改良过的TAIL-PCR 成功地从突变体中克隆到外源插入基因的旁侧序列,从而为启动子的克隆提供了有效的新方法。

在利用特异引物和随机引物进行PCR中一般有3种产物生成:(1)由特异性引物和简并引物扩增出的产物;(2)由同一特异性弓l物扩增出的产物;(3)由同一简并引物扩增出的产物。在TAIL-PCR反应中,其中后2种目标产物可以通过以嵌套的特异性引物进行的后续反应来消除。

TAIL-PCR的基本原理是利用目标序列旁的已知序列设计3个嵌套的特异性引物(specialprimer,简称sp1,sp2,sp3,约20bp),用它们分别和1个具有低Tm值的短的随机简并引物(Arbitrarydegenerate prime,AD,约14bp)相组合,以基因组DNA为模板.

根据引物的长短和特异性的差异设计不对称的温度循环,通过分级反应来扩增特异引物(流程如图5所示)。

TAIL-PCR共分3次反应。第一次反应包括5次高特异性、1次低特异、10次较低特异性反应和12个热不对称的超级循环。5次高特异性反应,使sp1与已知的序列退火并延伸,增加了目标序列的浓度;1次低特异性的反应使简并引物结合到较多的目标序列上;10次较低特异性反应使2种引物均与模板退火,随后进行12次超级循环。

经上述反应得到了不同浓度的3种类型产物:特异性产物(I)型和非特异性产物(Ⅰ型和Ⅲ型)。第二次反应则将第一级反应的产物稀释1000倍作为模板,通过10次热不对称的超级循环,使特异性产物被选择地扩增,而非特异产物含量极低。第三次反应又将第二次反应的产物稀释作模板,再设置普通的PCR反应或热不对称超级循环,通过上述3次PCR反应可获得与已知序列邻近的目标序列。

Gento等曾用构建的含有潮霉素抗性基因(hph)的双元表达载体pBIG2RHPH2转化真菌,然后利用TAIL-PCR法克隆得到的真菌转化子基因组DNA的T-DNA插入区的旁侧序列并取得了成功。根据T-DNA区的HPH基因设计了扩增右边界的3个引物HS1~HS3,以及扩增左边界的引物HAS2~HAS4,另外又根据不同的转化子分别设计了简并引物ADl~AD3(引物位置如图6所示)。

在首轮PCR中,以AD/HS1为引物扩增右边界(以AD/HAS2扩增左边界),然后取首轮PCR 产物为模板,以AD/HS2(AD/HAS3)进行二次PCR,再以二次PCR产物为模板,AD/HS3(AD/HAS4)为模板进行第三轮PCR,将3轮的PCR产物进行电泳分析结果表明,采用TAIL-PCR的方法成功地从突变体中获得了带有T-DNA左右边界的旁侧序列,从而证明了TAIL-PCR法是有效地扩增基因旁侧序列的方法,为启动子的克隆又增添了1种可行的方法。

TAIL-PCR不需要PCR前的任何DNA操作,避免了环化和连接,速度快,特异性强,效率高,灵敏,在分子生物学研究的各个领域都有广泛的应用。

2 讨论

以上介绍的几种方法基本代表了现有的启动子克隆方法,它们分别具有不同的特点和适用范围。

利用启动子探针载体筛选启动子时,不需要知道具体的基因序列,避免了引物设计,并能获得大量的启动子片段;其缺点是需要构建1个穿梭质粒,建库、转化、筛选,工作量大,费时费力,而且克隆、亚克隆的过程繁琐。因此在基因的遗传背景不是很清楚时,往往通过探针载体随机筛选启动子。

而PCR法的主要优点是简便、快捷、操作简单;其缺点是只能扩增两端已知序列间的DNA区,且扩增的特异性较低。其适用条件是建立在对基因序列十分清楚的基础上,只有知道基因的全序列,才可根据已知序列设计引物,扩增出该基因的启动子。因此,在基因序列清楚的情况下.我们首先想到的就是PCR法。

I-PCR法操作简单,克服了文库筛选、克隆、亚克隆的繁琐步骤,对实验条件要求不高,花费少,在PCR法的基础上,增加了DNA的环化过程,从而可以扩增只有一端序列已知的DNA,由于不需要设计和合成大量昂贵的核苷酸接头,因此避免了引物设计和有接头而产生的非特异性产物的麻烦;然而由于直接克隆已知序列外的未知DNA区域依赖于DNA的环化性,而环化连接过程中常常产生多联体,成为副产物甚至是主要产物,导致非特异扩增,造成了闭环双链的DNA的PCR扩增效率差,经常得不到满意的结果,同时酶切片段太长也会使扩增效率下降。其适用于寻找只有一端序列已知的DNA,对未知DNA片段进行扩增。

相对于I-PCR,P-PCR经过设计形成的是锅柄状单链DNA模板,从而有效增加了引物与模板结合的特异性,p-PCR能够完成全部嵌套式扩增,因而产物有非常高的特异性;其缺点是也存在DNA环化、连接的弊端,但与I-PCR相比,其PCR产物的特异性已大大增加。目前,P-PCR可以扩增位于已知位点侧翼的大于3.0kb的人基因组DNA的启动子,是目前为止能扩增距离已知序列最远的DNA序列的方法.因而常用于扩增大片段的未知序列。

利用载体的PCR克隆启动子有实验设计简便的优点,在基因组DNA中加入含合适酶切位点的载体,是基于PCR法的又一创新之处;然而其实验操作较为繁琐,特异性差,即使用套式PCR,仍然有几条电泳条带,因而特异性产物需杂交进一步确定。

利用接头的PCR克隆启动子的优点是避免了DNA环化,改进的接头可以通过形成锅柄结构有效抑制非特异性序列的扩增,但设计和合成大量的核苷酸接头,价格昂贵;此外用常规的加接头的方法来克隆启动子时往往有接头非特异产物产生,特异性较低,特异产物需杂交确定。由于利用接头的PCR法不需要DNA环化,通常适用于寻找已知cDNA周围未知启动子或其它调控区域。

YADE法在利用接头PCR时,巧妙地设计了“Y”型接头,从而有效地防止接头引物的单引物扩增,延伸时起始片段可以是基因组DNA也可以是cDNA.可用于复杂的基因组的PCR 步行,能广泛应用于真核生物;其缺点是成本较高,在应用YADE法时,为了得到合适的内切酶,需要从众多的内切酶中筛选,另外,特殊的接头往往也增加了实验的成本。通常对于较复杂的真核生物基因组可以采用YADE法。

目前理想的启动子克隆方法需要更为广泛的,不需要PCR前的酶切、环化等操作,且特异性较高的PCR技术,TAIL-PCR基本符合这一条件。TAIL-PCR法的有以下优点:(1)方法简单,只要设计好引物,即可用基因组DNA为模板直接进行PCR扩增;(2)特异性高,用简并

引物和特异性嵌套引物相组合,通过不对称的温度循环和分级反应,使最终的目的片段占绝对优势;(3)高效灵敏,使用任何一个AD引物,在60%~80%的反应中能产生特异性产物;

(4)快速,整个反应可在ld内完成,(5)避免了DNA的环化和连接,反应产物准确可靠,重复性好。TAIL~PCR的创新之处在于其热不对称的分级反应,有效防止了非特异产物的扩增;但是TAIL~PCR仍有很多不尽人意的地方:TAIL~PCR反应需要较多的引物组合;此外,由于随机简并引物存在有限的结合位点,对个别侧翼序列,即使使用不同的简并引物也难以扩增到阳性结果,整个反应需要一系列连续反应,条件设置要求精细;还要求引物和模板有较高的纯度,如果有降解或纯度不够,也很难扩增出特异性条带;此外,TAlL~PCR还很有可能扩增的是高度重复序列,因而无法步行。TAIL~PCR技术适合于分离获得克隆载体上的DNA 序列,达到克隆相关基因的启动子的目的,也可用于基因组小的物种,如拟南芥和基因组大的物种,如小麦的已知序列两侧翼的DNA序列的分离。

3 展望

目前,启动子克隆的方法种类繁多,进展迅速。启动子克隆方法绝大多数是建立在PCR 的基础上的染色体步行技术,因而利用启动子克隆的方法不仅可以克隆到基因的启动子,同时还可以用于克隆cDNA的全长。分子生物学的一个重要问题是如何利用大量积累的基因部分序列(如EST)进一步克隆全长基因及其调控序列,而启动子克隆方法为这一问题提供了简便有效的手段。另外,随着基因工程的发展,出现了越来越多的转基因动植物,启动子克隆的方法也可以应用在转基因生物的研究中,如转基因水稻的T-DNA区,通过启动子克隆方法的PCR步行技术,能成功地克隆到T-DNA区的旁侧序列,有助于分析突变体中突变区序列。

随着PCR技术的不断进步,一定会有更多、更好的克隆启动子的方法产生,而它们最后也将会是克隆基因全长或突变体(特别是转座子插入突变体)中目的基因的简便高效的新方法。

启动子

启动子是基因(gene)的一个组成部分,控制基因表达(转录)的起始时间和表达的程度。启动子(Prom oters)就像“开关”,决定基因的活动。既然基因是成序列的核苷酸(nucleotides),那么启动子也应由DNA组成。启动子本身并不控制基因活动,而是通过与称为转录(transcription)因子的这种蛋白质(p roteins)结合而控制基因活动的。转录因子就像一面“旗子”,指挥着酶(enzymes)(RNA聚合酶polym erases) 的活动。这种酶制造着基因的RNA复制本。基因的启动子部分发生改变(突变),则导致基因表

达的调节障碍。这种变化常见于恶性肿瘤。

许多原核生物都含有这两个重要的启动子区:(如图)

启动子是位于结构基因5,端上游的一段DNA序列,能够指导全酶(holoenzyme)同模板正确结合,活化RN A聚合酶,启动基因转录。全酶是指酶蛋白及其辅酶构成的有功能的复合物。RNA,聚合酶的核心酶虽可合成RNA,但不能找到模板DNA上的转录起始位点,只有带σ因子的全酶才能专一地同启动子结合。RNA聚合酶沿着模板前进,直到终止子,转录产生一条RNA链。通常把基因转录起点前面即5’端的序列称为上游(upstream),起点后面即3’端的序列称为下游(downstream)。并把起点的位置记为十1,下游的核苷酸依次记为+2,+3,……,上游方向依次记为—1,—2,—3,……。

RNA聚合酶同启动子结合的区域称为启动子区。将各种原核基因同RNA聚合酶全酶结合后,用DNase I水解DNA,最后得到与RAN聚合酶结合而未被水解的DNA片段,这些片段有一个由5个核苷酸(TATAA)组成的共同序列,以其发现者的名字命名为Pribnow框(Pribnowbox),这个框的中央位于起点上游10bp处,所以又称—10序列(—10 sequence),后来在—35 bp处又找到另一个共同序列(TTGACA)。Hogness等在真核基因中又发现了类似Pribnow框的共同序列,即位于—25~—30 bp处的TATAAAAG,也称TATA框(TATAbox)。TATA框上游的保守序列称为上游启动子元件(upstream promoter element,UPE)或上游激活序列(uptream activatingsequence,UAS)。另外在—70~—78 bp处还有一段共同序列CCAAT,称为CAAT框(CAAT box)

原核生物中—10区同—35区之间核苷酸数目的变动会影响基因转录活性的高低,强启动子一般为17±1 b p,当间距小于15 bp或大于20 bp时都会降低启动子的活性。

在真核基因中,有少数基因没有TATA框。没有TATA框的真核基因启动子序列中,有的富集GC,即有GC 框;有的则没有GC框。GC框位于—80~—110bp处的GCCACACCC或GGGCGGG序列。

TATA框的主要作用是使转录精确地起始;CAAT框和GC框则主要是控制转录起始的频率,特别是CAAT框对转录起始频率的作用更大。如在TATA框同相邻的UPE之间插入核苷酸,也会影响转录使之减弱。

为什么RNA聚合酶能够仅在启动子处结合呢?显然启动子处的核苷酸顺序具有特异的形状以便与RNA聚合酶结合,就好像酶与其底物的结构相恰恰适合一样。将100个以上启动子的顺序进行了比较,发现在RNA合成开始位点的上游大约10bp和35bp处有两个共同的顺序,称为-10和-35序列。这两个序列的共同顺序如下,-35区“AATGTGTGGAAT”,-10区“TTGACATATATT”。大多数启动子均有共同顺序(consensus sequenc e),只有少数几个核苷酸的差别。

-10序列又称为Pribnow盒(原核生物)。在真核生物中相应的序列位于-35bp处,称为TATA盒,又称为Go ldberg-Hognessbox,是RNA聚合酶Ⅱ的结合部位。-10和-35这两个部位都很重要:[1]RNA聚合酶能和-35和-10序列中的碱基和DNA主链中的磷酸基相接触;[2]离开共同顺序较远的启动子的活性亦较弱;[3]最重要的是,破坏启动子功能的突变中有75%都是改变了共同顺序中的碱基,其余25%亦为离共同顺序较近的。-35和-10序列相距约20bp,即大致是双螺旋绕两圈的长度。因为这两个结合区是在DNA分子的同一侧面,可见此酶是结合在双螺旋的一面。可以想像,它能"感觉到每个结合区的沟底中碱基所产生的特异形状。"

原核生物亦有少数启动子缺乏这两个序列(-35和-10)之一。在这种情况下,RNA聚合酶往往不能单独识别这种启动子,而需要有辅助蛋白质的帮助。可能是这些蛋白质因子与邻近序列的反应可以弥补启动子的这个缺陷。

在真核生物中,在转录起始位点上游70-80bp处有CAAT顺序,也称为CAAT盒。这一顺序也是比较保守的共同顺序:GCCTCAATCT。RNA聚合酶Ⅱ可以识别一顺序。近年来在对家兔β珠蛋白基因CAAT顺序的研究中发现,用人工方法诱导CAAT顺序发生突变使家兔β珠蛋白基因的转录水平降低。

启动子中的-10和-35序列是RNA聚合酶所结合和作用必需的顺序。但是附近其他DNA顺序也能影响启动子的功能。例如,在核糖体RNA合成的起始位点的上游50到150核苷酸之间的顺序就是对启动子的完全活性所必需的。如果这一段DNA顺序缺失并由其他外来DNA所取代(例如克隆在质粒DNA中的rRNA基因),则转录起始的频率将降低10倍。同样,在其他情况下,远隔部位的富有AT的DNA顺序被认为能增进转录起始的频率。有时候上游顺序可以是某些能直接激活RNA聚合酶的"激活蛋白"的结合部位。但是,上游顺序往往有另外的功能。例如上游顺序可以吸引拓扑异构酶,后者可导致结合的局部产生有利于转录起始的超螺旋状态。上游顺序所引起的DNA结构的微细变化可能在双螺旋上被传导到相当远的距离,因此上游顺序的变化可以影响到-10和-35区的DNA结构细节。

基因启动子分析基本流程

“螺旋讲堂”2008 年第十一课----“基因启动子分析基本流程”
“螺旋讲堂”2008年第十一课----“基因启动子分析基本流程”
螺旋 亲爱的螺友们,大家好!欢迎光临螺旋讲堂,很高兴有机会和大家相聚螺旋网,让 我们一同在讨论中学习,在交流中成长! 分子生物学发展迅猛,新方法新技术新发现层出不穷,但是我想,我们的基础研究从 某种意义上来说,可以简单的分为两大部分,一个是基因的表达,另一个是基因的功能。当 然,这个基因的概念现在已经不仅仅是指编码蛋白的 DNA 序列了。 我们这期主要探讨基因的表达。而转录调控在基因表达中占有很重要的地位。基因 的转录调控机制非常复杂,这些理论有机会我们再详细探讨,这里就不多介绍了,我们主要 谈一下对于一个新的基因,如何开始他的转录调控研究,第一步到底该怎么做呢? 这里提供一些简单的入门级别的方法,希望对大家有用。相信还有更多更好更实用 的方法,也希望螺友们能够拿出来和大家分享,共同进步! 本次讲座共分为五个部分主要是讲第一部分,因为这个一般的文献和书籍都很少有 详细说明.
一:克隆目的基因基本启动子序列 我们都知道, 基因的基本启动子一般是在基因转录起始位点上游, 当一个基因在没有 确定其转录起始位点的时候,我们假定 NCBI 上提交的序列就是他的完整转录本,那么他的 第一个碱基就是他的转录起始位点。而基因的基本启动子一般就是在转录起始位点的上游 2000bp 左右和下游200bp 左右,当然,这个是一般情况,具体问题还要具体分析.尤其现在发 现一般的基因都是有几个转录起始位点的. 我们通过该基因 mRNA 序列和基因组序列 BLAST, 就能够在染色体上找到这段基因 组序列。我这里用 human 的 AGGF1基因做个例子给大家具体演示一下.
https://www.doczj.com/doc/441243414.html,

一步一步教你使用 NCBI 查找DNA、mRNA、cDNA、Protein、promoter、引物设计、BLAST 序列比对等

一步一步教你使用NCBI 查找DNA、 mRNA、cDNA、Protein、promoter、引 物设计、BLAST 序列比对等 最近看到很多战友在论坛上询问如何查询基因序列、如何进行引物设计、如何使用 BLAST 进行序列比对……,这些问题在NCBI 上都可以方便的找到答案。现在我就结合我自 己使用NCBI的一些经历(经验)跟大家交流一下BCBI 的使用。希望大家都能发表自己的使 用心得,让我们共同进步! 我分以下几个部分说一下NCBI 的使用: Part one 如何查找基因序列、mRNA、Promoter Part two 如何查找连续的mRNA、cDNA、蛋白序列 Part three 运用STS 查找已经公布的引物序列 Part four 如何运用BLAST 进行序列比对、检验引物特异性 特别感谢本版版主,将这个帖子置顶! 从发帖到现在,很多战友对该帖给与了积极的关注,在此向给我投票的(以及想给我 投票却暂时不能投票的)各位战友表示真诚的感谢,谢谢各位战友! 请大家对以下我发表的内容提出自己的意见。关于NCBI 其他方面的使用也请水平较高 的战友给予补充 First of all,还是让我们从查找基因序列开始。 第一部分利用Map viewer 查找基因序列、mRNA 序列、 启动子(Promoter) 下面以人的IL6(白细胞介素6)为例讲述一下具体的操作步骤 1.打开Map viewer 页面,网址为:https://www.doczj.com/doc/441243414.html,/mapview/index.html 在search 的下拉菜单里选择物种,for 后面填写你的目的基因。操作完毕如图所示:

DNA启动子概述

启动子概述 启动子是DNA链上一段能与RNA聚合酶结合并能起始mRNA合成的序列,它是基因表达不可缺少的重要调控序列。启动子是一段位于结构基因5’-端上游区的DNA序列,能活化RNA聚合酶,使之与模板DNA准确地结合,并具有转录起始的特异性。基因的特异性转录取决于酶与启动子能否有效地形成二元复合物。启动子分三类:启动子Ⅰ、启动子Ⅱ、启动子Ⅲ.只有启动子Ⅱ指导mRNA的转录。真核生物启动子Ⅱ由两大部分组成:上游元件(upstream element)和启动子核心(core promoter)。上游元件与转录的效率有关;启动子核心包括3部分:TATA 盒、起始子(initinator)及下游元件(downstream element)。TATA盒为转录调控因子包括各种调节蛋白的结合区,与转录起始位点的精确选择及转录有关,起始子是转录起始所必须,下游元件作用尚不清楚。原核生物启动子区范围较小,包括TATAAT区(Pribnow区)及其上游的TTGACA区。 启动子是一段提供RNA聚合酶识别和结合位点的DNA序列,位于基因上游。启动子具有如下特征: 1序列特异性。在启动子的DNA序列中,通常含有几个保守的序列框,序列框中碱基的变化会导致转录启动活性的改变。 2方向性。启动子是一种有方向性的顺式调控元件,有单向启动子和双向启动子两类。 3位置特性。启动子一般位于所启动转录基因的上游或基因内的前端。处于基因的下4种属特异性。原核生物的不同种、属,真核生物的不同组织都具有不同类型的启动 没有启动子,基因就不能转录。原核生物启动子是由两段彼此分开且又高度保守的核苷酸序列组成,对mRNA的合成极为重要。启动子区域:(1)Pribnow盒,位于转录起始位点上游5—10bp,一般由6~8个碱基组成,富含A和T, 故又称为TATA盒或—10区。启动子来源不同,Pribnow盒的碱基顺序稍有变化。(2)—35区,位于转录起始位点上游35bp处,故称—35区,一般由10个碱基组成。 质粒设计时都需要加入启动子序列,以保证目的基因的表达。启动子可分为诱导型启动子和组成型启动子两大类,后者包括CMV,SV40,T7,pMC1,PGK启动子等。一下介绍几个常见的启动子。 (1)U6启动子 U6是二型启动子,一般发现是启动小片段,不带PolyA尾的序列。由Ⅲ类RNA聚合酶启动子U6启动子转录产生shRNA,经剪切后产生成熟siRNA,产生干扰效果。这一类 启动子在腺病毒和慢病毒干扰载体的构建中应用很多。U6更多的是用在shRNA的启动,来达到敲低一个基因的作用。

找一个基因的启动子

1、UCSC (1)网址:https://www.doczj.com/doc/441243414.html,/cgi-bin/hgNear 在Genome里选择物种,比如human,search里输入你的基因名PTEN,点击Go (2)出现新的页面,看到“Known Gene Names”下面的PTEN了吧,点它 (3)又回到了和(1)类似的页面,此时,点击sequence (4)出现一个新的页面,选中promoter,同时可以输入数值修改具体的序列区域,比如Promoter including 2000 bases upstream and 100 downstream,即表示启动子-2000~+100区域 (5)点击“get sequence”,出现页面中最上面的序列“>uc001kfb.1 (promoter 2000 100) PTEN - phosphatase and tensin homolog”就是你要的人PTEN启动子-2000~+100区域的序列了 2、Ensembl (1)网址:https://www.doczj.com/doc/441243414.html,/index.html 在“Search Ensembl“标题下search后的下拉框中选中物种名homo sapiens(人),for框中输入基因名PTEN,点击Go (2)出现的新页面中比较乱,但不要管它,直接寻找“Ensembl protein coding gene ”字样的,对,也就是第二个,点击它 (3)新出现的页面也很乱,不过依然不用管它,看到左侧有点肉色(实在不知道怎么描述了)的那些选项了吗,对,就是“Your Ensembl”下面那一堆,在里面找“Genomic sequence”,点它 (4)现在的界面就一目了然了,在“5' Flanking sequence”中输入数值确定启动子长度(默认为600),比如1000,点击update; (5)出现的序列中,标为红色的就是基因的外显子,红色之间黑色的序列就是内含子,而第一个红色自然就是第一外显子了,那么从开始的碱基一直到第一个红色的碱基间自然就是启动子-1000~+1的序列啦 这样,你不仅查到了启动子,连它的外显子、内含子序列也全部搞定了

如何查找一个基因的启动子序列

如何查找一个基因的启动子序列 发表者:刘小丰 (访问人次:6102) 刘小丰收集整理 定义:启动子是参与特定基因转录及其调控的DNA序列。包含核心启动子区域和调控区域。核心启动子区域产生基础水平的转录,调控区域能够对不同的环境条件作出应答,对基因的表达水平做出相应的调节。 区域:启动子的范围非常大,可以包含转录起始位点上游2000bp,有些特定基因的转录区内部也存在着转录因子的结合位点,因此也属于启动子范围。 这项搜寻要从UCSC基因组浏览器开始,网址为 https://www.doczj.com/doc/441243414.html,/cgi-bin/hgGateway。以编码pendrin (PDS)的基因为例来说明上述问题。PDS与耳蜗的异常发育、感觉神经性听力下降以及弥散性甲状腺增大(甲状腺肿)有关。 进入UCSC的主页后,在Organism的下拉菜单中选择Human,然后点击Browser。使用者现在到了人类基因组浏览器入口。本例的搜寻很简单:在assembly的下拉菜单中选择Dec. 2001,在position框中键入pendrin,然后点击Submit。返回的页面结果显示一个已知的基因和两个mRNA序列。继续点击mRNA序列的登录号AF030880,出现包含这个mRNA区域的图解概要。为了获得这个区域更清晰的图像,点击紧靠zoom out的1.5X按钮。最后点击页面中部的reset all按钮,使各个路径的设置恢复默认状态。 然而,对于本例的搜寻目的来说,默认设置不是理想的设置。按照视图利用页面底部的Track Controls按纽,将一些路径设置为hide模式(即不显示),其他设置为dense模式(所有资料密集在一条直线上);另一些路径设置为full模式(每个特征有一个分开的线条,最多达300)。在考虑这些路径内究竟存在那些资料之前,对这些路径的内容和表现做一个简要的讨论是必要的,许多这些讨论是由外界提供给UCSC的。下面是对基因预测方法的更进一步讨论,这些信息也可以在其他地方找到。 对于Known Genes(已知基因)和预测的基因路径来说,一般的惯例是以一个高的垂直线或块状表示每个编码外显子,以短的垂直线或块状表示5′端和3′端非翻译区。 起连接作用的内含子以非常细的线条表示。翻译的方向由沿着细线的箭头指示。 Known Genes来自LocusLink内的mRNA参照序列,已经利用BLAT程序将这些序列与基因组序列进行比对排列。 Acembly Gene Predictions With Alt-splicing路径是利用Acembly程序将人类mRNA 和EST序列数据与人类基因组序列进行比对排列而来的。Acembly程序试图找到mRNA与基因组序列的最好的比对排列以及判断选择性剪接模型。假如有多于1个的基因模型具有统计学意义,则它们都全部显示出来。有关Acembly的更多信息可以在NCBI的网站找到(https://www.doczj.com/doc/441243414.html,/IEB/Research/Acembly/)。 Ensembl Gene Predictions路径由Ensembl提供。Ensembl基因通过许多方法来预测,包括与已知mRNA和蛋白质进行同源性比较,ab initio基因预测使用GENSCAN和基因预测HMMs。 https://www.doczj.com/doc/441243414.html,/ensembl/ Fgenesh++ Gene Predictions路径通过寻找基因的结构特征来预测基因内部的外显子,例如剪接位点的给位和受位的结构特征,利用一

如何查找一个基因的启动子序列

定义:启动子是参与特定基因转录及其调控的DNA序列。包含核心启动子区域和调控区域。核心启动子区域产生基础水平的转录,调控区域能够对不同的环境条件作出应答,对基因的表达水平做出相应的调节。一般查阅外文文献,老外从转录起始位点(Transcription Strart Site,TSS,记为+1位)开始上溯2K -3K的区间算做是启动子 区域:启动子的范围非常大,可以包含转录起始位点上游2000bp,有些特定基因的转录区内部也存在着转录因子的结合位点,因此也属于启动子范围。 票数 Do One Thing, And Do It Well. mybbff edited on 2005-07-22 08:41 ? ? ? ? 2005-05-07 11:23 分享 分享到哪里? ? ?

??? ? ? ? ? 下面以BCL-2基因为例,查找查找该基因的启动子区域,首先要找到该基因的基因组序列。去NCBI吧,在Search的下拉菜单里找到Gene,在检索项里输入Bcl-2,检索第一项就是bcl-2 for human,点进去看看啥样。。。 票数 Do One Thing, And Do It Well. ??

???2005-05-07 11:29 分享 分享到哪里? ? ? ? ? ? ? 首先你可以看到该基因的参考序列(reference sequence),然后看到bcl-2的位置和基因组背景。bcl-2上游是 PHLPP,下游是FVT1基因。在这个长长的网页的最后是已经注册的Bcl-2基因的信息。

票数 Do One Thing, And Do It Well. Revelation edited on 2005-05-07 11:59 ? ???2005-05-07 11:35 分享 分享到哪里? ? ? ? ? ? ? 看到基因组序列了么,点进去,根据序列信息自己就能定位转录起始位点,上游就是promoter了,简单吧。不!我觉得麻烦。有更简单的方法么?有!注意到在网页的开头有这么个链接么?HGNC:990

启动子分析流程

“螺旋课堂”2008 年第十一课----“基因启动子分析基本流程”
“螺旋课堂”2008年第十一课----“基因启动子分析基本流程”
螺旋 亲爱的螺友们好,大家好!欢迎光临螺旋讲堂,很高兴有机会和大家相聚螺旋网, 让我们一同在讨论中学习,在交流中成长! 分子生物学发展迅猛,新方法新技术新发现层出不穷,但是我想,我们的基础研究从 某种意义上来说,可以简单的分为两大部分,一个是基因的表达,另一个是基因的功能。当 然,这个基因的概念现在已经不仅仅是指编码蛋白的 DNA 序列了。 我们这期主要探讨基因的表达。而转录调控在基因表达中占有很重要的地位。基因 的转录调控机制非常复杂,这些理论有机会我们再详细探讨,这里就不多介绍了,我们主要 谈一下对于一个新的基因,如何开始他的转录调控研究,第一步到底该怎么做呢? 这里提供一些简单的入门级别的方法,希望对大家有用。相信还有更多更好更实用 的方法,也希望螺友们能够拿出来和大家分享,共同进步! 本次讲座共分为五个部分主要是讲第一部分,因为这个一般的文献和书籍都很少有 详细说明.
一:克隆目的基因基本启动子序列 我们都知道, 基因的基本启动子一般是在基因转录起始位点上游, 当一个基因在没有 确定其转录起始位点的时候,我们假定 NCBI 上提交的序列就是他的完整转录本,那么他的 第一个碱基就是他的转录起始位点。而基因的基本启动子一般就是在转录起始位点的上游 2000bp 左右和下游200bp 左右,当然,这个是一般情况,具体问题还要具体分析.尤其现在发 现一般的基因都是有几个转录起始位点的. 我们通过该基因 mRNA 序列和基因组序列 BLAST, 就能够在染色体上找到这段基因 组序列。我这里用 human 的 AGGF1基因做个例子给大家具体演示一下.
https://www.doczj.com/doc/441243414.html,

基因启动子分析

基因启动子分析 一:克隆目的基因基本启动子序列 我们都知道,基因的基本启动子一般是在基因转录起始位点上游,当一个基因在没有确定其转录起始位点的时候,我们假定NCBI上提交的序列就是他的完整转录本,那么他的第一个碱基就是他的转录起始位点。而基因的基本启动子一般就是在转录起始位点的上游2000bp左右和下游200bp左右,当然,这个是一般情况,具体问题还要具体分析.尤其现在发现一般的基因都是有几个转录起始位点的. 我们通过该基因mRNA序列和基因组序列BLAST,就能够在染色体上找到这段基因组序列。我这里用human的AGGF1基因做个例子给大家具体演示一下. 1 首先需要在NCBI里面查找到AGGF1基因的mRNA序列,这个我想大家都应该很清楚,如下图.

2 然后就是用这段mRNA序列和人类的基因组序列BLAST 3 BLAST得到了很多结果,我们往往选择最上面那个最匹配的结果。

4 点击之后就可以看到下图,这个基因的14个外显子和13个内含子在5号染色体上的位置一目了然,第一个外显子在上面,说明这个基因在染色体上是正向的,基本启动子就应该在第一外显子上面,我用红色的方框标明了。 5 大家有没有注意到左上方有个数据框,我把数值改为76,360K 到 76,362.200 ,刚好2200BP,包括了第一个外显子的前200BP左右. 然后点击红色框标明的Download/view sequence.

6 然后就到了这个界面, Sequence Format 选择GenBank, 然后点击 Display. 就得到我们所需要的序列了. 7 这里我们可以看到1989到2201是AGGF1的mRNA序列,说明我们的确找到了该基因5'非翻译区的上游启动子序列.建议将这2200bp都克隆下来. 以上的步骤就是基因基本启动子的查找,其实还有很多调控序列是在基因内含子区域或者是基因的3'非翻译区等,序列查找的步骤和上面是一样的.

如何查找一个基因的启动子序列

如何查找一个基因的启动子序列 关键词:基因启动子序列软 件 定义:启动子是参与特定基因转录及其调控的DNA序列。包含核心启动子区域和调控区域。核心启动子区域产生基础水平的转录,调控区域能够对不同的环境条件作出应答,对基因的表达水平做出相应的调节。 区域:启动子的范围非常大,可以包含转录起始位点上游2000bp,有些特定基因的转录区内部也存在着转录因子的结合位点,因此也属于启动子范围。 这项搜寻要从UCSC基因组浏览器开始,网址为https://www.doczj.com/doc/441243414.html,/。以编码pendrin (PDS)的基因为例来说明上述问题。PDS与耳蜗的异常发育、感觉神经性听力下降以及弥散性甲状腺增大(甲状腺肿)有关。 进入UCSC的主页后,在Organism的下拉菜单中选择Human,然后点击Browser。使用者现在到了人类基因组浏览器入口。本例的搜寻很简单:在assembly的下拉菜单中选择Dec. 2001,在position框中键入pendrin,然后点击Submit。返回的页面结果显示一个已知的基因和两个mRNA序列。继续点击mRNA序列的登录号AF030880,出现包含这个mRNA区域的图解概要。为了获得这个区域更清晰的图像,点击紧靠zoom out的1.5X按钮。最后点击页面中部的reset all按钮,使各个路径的设置恢复默认状态。 然而,对于本例的搜寻目的来说,默认设置不是理想的设置。按照视图利用页面底部的Track Controls按纽,将一些路径设置为hide模式(即不显示),其他设置为dense模式(所有资料密集在一条直线上);另一些路径设置为full 模式(每个特征有一个分开的线条,最多达300)。在考虑这些路径内究竟存在那些资料之前,对这些路径的内容和表现做一个简要的讨论是必要的,许多这些讨论是由外界提供给UCSC的。下面是对基因预测方法的更进一步讨论,这些信息也可以在其他地方找到。 对于Known Genes(已知基因)和预测的基因路径来说,一般的惯例是以一个高的垂直线或块状表示每个编码外显子,以短的垂直线或块状表示5′端和3′端非翻译区。 起连接作用的内含子以非常细的线条表示。翻译的方向由沿着细线的箭头指示。 Known Genes来自LocusLink内的mRNA参照序列,已经利用BLAT程序将这些序列与基因组序列进行比对排列。

如何查找基因的启动子区

如何查找一个基因的启动子序列 定义:启动子是参与特定基因转录及其调控的DNA序列。包含核心启动子区域和调控区域。核心启动子区域产生基础水平的转录,调控区域能够对不同的环境条件作出应答,对基因的表达水平做出相应的调节。区域:启动子的范围非常大,可以包含转录起始位点上游2000bp,有些特定基因的转录区内部也存在着转录因子的结合位点,因此也属于启动子范围。这项搜寻要从UCSC基因组浏览器开始,网址为https://www.doczj.com/doc/441243414.html,/。以编码pendrin (PDS)的基因为例来说明上述问题。PDS与耳蜗的异常发育、感觉神经性听力下降以及弥散性甲状腺增大(甲状腺肿)有关。 进入UCSC的主页后,在Organism的下拉菜单中选择Human,然后点击Browser。使用者现在到了人类基因组浏览器入口。本例的搜寻很简单:在assembly的下拉菜单中选择Dec. 2001,在position 框中键入pendrin,然后点击Submit。返回的页面结果显示一个已知的基因和两个mRNA序列。继续点击mRNA序列的登录号AF030880,出现包含这个mRNA区域的图解概要。为了获得这个区域更清晰的图像,点击紧靠zoom out的1.5X按钮。最后点击页面中部的reset all按钮,使各个路径的设置恢复默认状态。 然而,对于本例的搜寻目的来说,默认设置不是理想的设置。按照视图利用页面底部的Track Controls 按纽,将一些路径设置为hide模式(即不显示),其他设置为dense模式(所有资料密集在一条直线上);另一些路径设置为full模式(每个特征有一个分开的线条,最多达300)。在考虑这些路径内究竟存在那些资料之前,对这些路径的内容和表现做一个简要的讨论是必要的,许多这些讨论是由外界提供给UCSC 的。下面是对基因预测方法的更进一步讨论,这些信息也可以在其他地方找到。对于Known Genes(已知基因)和预测的基因路径来说,一般的惯例是以一个高的垂直线或块状表示每个编码外显子,以短的垂直线或块状表示5′端和3′端非翻译区。起连接作用的内含子以非常细的线条表示。翻译的方向由沿着细线的箭头指示。 Known Genes来自LocusLink内的mRNA参照序列,已经利用BLAT程序将这些序列与基因组序列进行比对排列。Acembly Gene Predictions With Alt-splicing路径是利用Acembly程序将人类mRNA和EST 序列数据与人类基因组序列进行比对排列而来的。Acembly程序试图找到mRNA与基因组序列的最好的比对排列以及判断选择性剪接模型。假如有多于1个的基因模型具有统计学意义,则它们都全部显示出来。有关Acembly的更多信息可以在NCBI的网站找到(https://www.doczj.com/doc/441243414.html,/IEB/Research/Acembly/)。 Ensembl Gene Predictions路径由Ensembl提供。Ensembl基因通过许多方法来预测,包括与已知mRNA和蛋白质进行同源性比较,ab initio基因预测使用GENSCAN和基因预测HMMs。https://www.doczj.com/doc/441243414.html,/ensembl/ Fgenesh++ Gene Predictions路径通过寻找基因的结构特征来预测基因内部的外显子,例如剪接位点的给位和受位的结构特征,利用一种动态的程序算法推定编码区域和推定外显子5′端和3′端的内含子区域;这个方法也考虑到蛋白质相似性的资料。Genscan Gene Predictions路径由GENSCAN方法衍生而来,通过这个方法,可以确定内含子、外显子、启动子区域和poly(A)信号。此时,这个方法并不期望查询的序列只出现1个基因,因此可以对部分基因或被基因之间的DNA分隔的多个基因进行准确的预测。Human mRNAs from Genbank路径显示基因库的人类mRNAs与基因组序列的比对排列。Spliced ESTs和Human EST路径显示来自GenBank的ESTs序列与基因组的序列对齐比较。由于ESTs通常代表了转录基因的片断,一个EST很有可能对应于某个外显子区。 最后,Repeating Elements by RepeatMasker这个路径显示的是重复元件,例如散在的或长或短的核元素(SINEs和LINEs),长末端重复序列(LTRs)和低复杂性区域(https://www.doczj.com/doc/441243414.html,/cgi-bin/RepeatMasker)。一般来说,在将基因预测方法应用于核苷酸序列之前,需要去掉或掩饰这些成分。 回到视图显示的例子,可以看到大多数路径返回了几乎同样的基因预测结果。作为一个规则,通过多种方法预测的外显子提高了预测的正确率而不会出现“假阳性”结果。多数方法显示3′端非翻译区,以左侧大而短的块状表示。Acembly路径显示除了全长序列产物(如这个部分第3条线所示)之外还有3个可能的选择性剪接,其它大多数路径显示与此预测结果相符。Genscan路径从左、右方向往远处延伸:GENSCAN可以被用于预测多个基因。

真核生物三类启动子

真核生物启动子有三类,分别由RNA 聚合酶Ⅰ、Ⅱ和Ⅲ进行转录。 类别Ⅰ(class Ⅰ)启动子: 只控制rRNA 前体基因的转录,转录产物经切割和加工后生成各种成熟rRNA 。 类别Ⅰ启动子由两部分保守序列组成: 核心启动子(core promoter ):位于转录起点附近,从-45至+20; 上游控制元件(upstream control element ,UCE ):位于-180至-107; RNA 聚合酶Ⅰ对其转录需要2种因子参与: UBF1:一条M 为97000的多肽链,结合在上述两部分的富含GC 区; 1个TBP ,即TATA 结合蛋白(TA TA-binding protein ,TBP ); SL1:一个四聚体蛋白,含有 3个不同的转录辅助因子TAF Ⅰ; 在SL1因子介导下RNA 聚合酶Ⅰ结合在转录起点上并开始转录。 类别Ⅱ(class Ⅱ)启动子: 类别Ⅱ启动子涉及众多编码蛋白质的基因表达的控制。 该类启动子包含4类控制元件: 基本启动子(basal promoter ):序列为中心在-25至-30左右的7 bp 保守区,TA TAAAA/T , 称为TATA 框或Goldberg-Hogness 框。与RNA 聚合酶的定 位有关,DNA 双链在此解开并决定转录的起点位置。失去 TATA 框,转录将在许多位点上开始。 起始子(initiator ):转录起点位置处的一保守序列,共有序列为:P y P y ANT(A)P y P y P y 为嘧啶碱(C 或T ),N 为任意碱基,A 为转录的起点。DNA 在此 解开并起始转录。 上游元件(upstream factor ):普遍存在的上游元件有CAAT 框、GC 框和八聚体(octamer ) 框等。CAAT 框的共有序列是GCCAATCT ,GC 框的共有序 列为GGGCGG 和CCGCCC ,八聚体框含有8bp ,共有序列 为ATGCAAA T ; 应答元件(response element ):诱导调节产生的转录激活因子与靶基因上的应答元件结合。 如热休克效应元件HSE 的共有序列是 CNNGAANNTCCNNG ,可被热休克因子HSF 识别和作用; 血清效应元件SRE 的共有序列CCA TATTAGG ,可被血清效 应因子SRF 识别和作用。 +1

最新CMV启动子

CMV启动子 质粒设计时都需要加入启动子序列,以保证目的基因的表达。启动子可分为诱导型启动子和组成型启动子两大类,后者包括CMV,SV40,T7, pMC1,PGK启动子等。zhengzzh对CMV和T7的来源做了介绍。启动子是基因(gene)的一个组成部分,控制基因表达(转录)的起始时间和表达的程度。启动子(Promoters)就像“开关”,决定基因的活动。既然基因是成序列的核苷酸(nucleotides),那么启动子也应由DNA组成。启动子本身并不控制基因活动,而是通过与称为转录(transcription)因子的这种蛋白质(proteins)结合而控制基因活动的。转录因子就像一面“旗子”,指挥着酶(enzymes)(RNA聚合酶polymerases) 的活动。这种酶制造着基因的RNA复制本。基因的启动子部分发生改变(突变),则导致基因表达的调节障碍。 T7启动子是当今大肠杆菌表达系统的主流,这个功能强大兼专一性高的启动子经过巧妙的设计而成为原核表达的首选,尤其以Novagen公司的pET系统为杰出代表。强大的T7启动子完全专一受控于T7 RNA聚合酶,而高活性的T7 RNA 聚合酶合成mRNA的速度比大肠杆菌RNA聚合酶快5倍——当二者同时存在时,宿主本身基因的转录竞争不过T7表达系统,几乎所有的细胞资源都用于表达目的蛋白;诱导表达后仅几个小时目的蛋白通常可以占到细胞总蛋白的50%以上。由于大肠杆菌本身不含T7 RNA 聚合酶,需要将外源的T7 RNA 聚合酶引入宿主菌,因而T7 RNA 聚合酶的调控模式就决定了T7系统的调控模式——非诱导条件下,可以使目的基因完全处于沉默状态而不转录,从而避免目的基因毒性对宿主细胞以及质粒稳定性的影响;通过控制诱导条件控制T7 RNA 聚合酶的量,就可以控制产物表达量,某些情况下可以提高产物的可溶性部分。有几种方案可用于调控T7 RNA 聚合酶的合成,从而调控T7表达系统。1.噬菌体DE3是lambda噬菌体的衍生株,含有lacI抑制基因和位于lacUV5启动子下的T7 RNA 聚合酶基因。DE3溶源化的菌株如BL21(DE3)就是最常用的表达菌株,构建好的表达载体可以直接转入表达菌株中,诱导调控方式和lac一样都是IPTG诱导。2.另一种策略是用不含T7 RNA聚合酶的宿主菌克隆目的基因,即可完全避免因目的蛋白对宿主细胞的潜在毒性而造成的质粒不稳定。然后用λCE6噬菌体侵染宿主细胞——CE6是lambda噬菌体含温度敏感突变(cI857ts)和pL/pR启动子控制T7 RNA 聚合酶表达的衍生株,在热诱导条件下可以激活T7 RNA 聚合酶的合成。此了噬菌体之外,还可以通过共转化质粒提供T7 RNA 聚合酶。比如有人用受溶氧浓度控制的启动子调控T7 RNA 聚合酶合成,据说这比较适合工业化发酵的条件控制。由于T7 RNA 聚合酶的调控方式仍有可能有痕量的本底表达,控制基础表达的手段之一是培养基外加葡萄糖,有助于控制本底表达水平;之二是采用带有T7 lac 启动子的载体——在紧邻T7 启动子的下游有一段lacI 操纵子序列编码表达lac 阻遏蛋白(lacI),lac 阻遏蛋白可以作用于宿主染色体上T7 RNA 聚合酶前的lacUV5 启动子并抑制其表达,也作用于载体T7 lac 启动子,以阻断任何T7 RNA聚合酶导致的目的基因转录。pLacI转化也是同样的原理。如果这还不够,更为严谨调控手段还有——在宿主菌中表达另一个可以结合并抑制T7 RNA 聚合酶的基因——T7溶菌酶基因,降低本底。常用的带溶菌酶质粒有pLysS和pLysE,相容的ori都不会影响后继的表达质粒转化,前者表达的溶菌酶的水平要比后者低得多,对细胞生长影响小,而pLysE会明显降低宿主菌的生长水平,容易出现过度调节,增加蛋白表达的滞后时间,从而降低表达水平。通过几种不同方法来巧妙调控T7聚合酶合成,T7启动子发展出了史上功能最强大,最丰富的表达系统。 CMV:CMV基因组有229kb,属疱疹病毒亚β科。CMV DNA只有一个单向性的IE启动子复合体,可指导多个基因的表达[1]。在IE94基因上游存在一个强启动子,IE94的上游区比SV40病毒的72bp重复序列具有更高的增强子功能。IE94基因启动子区序列分析证明这一区段内有多个回文结构,并相间着保守的序列。在这一区段的-50~-580bp之间至少有4套13~18bp的重复序列。IE1和IE2蛋白的表达受增强子的调控,此增强子也称为主要增强子立即早期启动了一增强子、IE1/IE2增强子或CMV增强子,是上游调节区复合体的一部分。因集中了细胞转录因子结合位点而具有异常高的活性,并且在多种类型的细胞的影响条件下均有活性。根据对基因表达的影响可将此增强子分为3个区。在CMV感染中,增强子调控的表达先激活后抑制。在CMV复制早期可诱导NF-κB、AP-1和CREB/A TF等细胞转录因子与增强子中多位点结合。感染后可诱导产生NF-kB和aP-1。在感染晚期,A TF的结合受影响,其活性受病毒基因产物的调节。

基因启动子分析基本流程

2008 年螺旋讲堂第十一课----“基因启动子分析基本流程”
“螺旋课堂”2008年第十一课----“基因启动子分析基本流程”
螺旋 亲爱的螺友们好,大家好!欢迎光临螺旋讲堂,很高兴有机会和大家相聚螺旋网,让我们一 同在讨论中学习,在交流中成长! 分子生物学发展迅猛,新方法新技术新发现层出不穷,但是我想,我们的基础研究从某种意 义上来说,可以简单的分为两大部分,一个是基因的表达,另一个是基因的功能。当然,这 个基因的概念现在已经不仅仅是指编码蛋白的核苷算序列了。 我们这期主要探讨基因的表达。 而转录调控在基因表达中占有很重要的地位。 基因的转录调 控机制非常复杂,这些理论有机会我们再详细探讨,这里就不多介绍了,我们主要谈一下对 于一个新的基因,如何开始他的转录调控研究,第一步到底该怎么做呢? 这里提供一些简单的入门级别的方法,希望对大家有用。相信还有更多更好更实用的方法, 也希望螺友们能够拿出来和大家分享,共同进步! 本次讲座共分为五个部分主要是讲第一部分 , 因为这个一般的文献和书籍都很少有详细说 明.
一:克隆目的基因基本启动子序列 我们都知道, 基因的基本启动子一般是在基因转录起始位点上游, 当一个基因在没有确定其 转录起始位点的时候,我们假定 NCBI 上提交的序列就是他的完整转录本,那么他的第一个 碱基就是他的转录起始位点。而基因的基本启动子一般就是在转录起始位点的上游2000bp 左右和下游200bp 左右, 当然,这个是一般情况,具体问题还要具体分析.尤其现在发现一般的 基因都是有几个转录起始位点的. 我们通过该基因 mRNA 序列和基因组序列 BLAST, 就能够在染色体上找到这段基因组序列。 我这里用 human 的 AGGF1基因做个例子给大家具体演示一下.

如何查找一个基因的启动子序列

如何查找一个基因的启动子序列 如何查找一个基因的启动子序列 定义:启动子是参与特定基因转录及其调控的DNA序列。包含核心启动子区域和调控区域。核心启动子区域产生基础水平的转录,调控区域能够对不同的环境条件作出应答,对基因的表达水平做出相应的调节。 区域:启动子的范围非常大,可以包含转录起始位点上游2000bp,有些特定基因的转录区内部也存在着转录因子的结合位点,因此也属于启动子范围。南京妇幼保健院乳腺科刘小丰 这项搜寻要从UCSC基因组浏览器开始,网址为 https://www.doczj.com/doc/441243414.html,/cgi-bin/hgGateway。以编码pendrin (PDS)的基因为例来说明上述问题。PDS与耳蜗的异常发育、感觉神经性听力下降以及弥散性甲状腺增大(甲状腺肿)有关。 进入UCSC的主页后,在Organism的下拉菜单中选择Human,然后点击Browser。使用者现在到了人类基因组浏览器入口。本例的搜寻很简单:在assembly的下拉菜单中选择Dec. 2001,在position框中键入pendrin,然后点击Submit。返回的页面结果显示一个已知的基因和两个mRNA

序列。继续点击mRNA序列的登录号AF030880,出现包含这个mRNA区域的图解概要。为了获得这个区域更清晰的图像,点击紧靠zoom out的1.5X按钮。最后点击页面中部的reset all按钮,使各个路径的设置恢复默认状态。 然而,对于本例的搜寻目的来说,默认设置不是理想的设置。按照视图利用页面底部的Track Controls按纽,将一些路径设置为hide模式(即不显示),其他设置为dense模式(所有资料密集在一条直线上);另一些路径设置为full 模式(每个特征有一个分开的线条,最多达300)。在考虑这些路径内究竟存在那些资料之前,对这些路径的内容和表现做一个简要的讨论是必要的,许多这些讨论是由外界提供给UCSC的。下面是对基因预测方法的更进一步讨论,这些信息也可以在其他地方找到。 对于Known Genes(已知基因)和预测的基因路径来说,一般的惯例是以一个高的垂直线或块状表示每个编码外显子,以短的垂直线或块状表示5′端和3′端非翻译区。 起连接作用的内含子以非常细的线条表示。翻译的方向由沿着细线的箭头指示。 Known Genes来自LocusLink内的mRNA参照序列,已经利用BLAT程序将这些序列与基因组序列进行比对排列。 Acembly Gene Predictions With Alt-splicing路径是利

如何查找一个基因的启动子序列- UCSC Genome Bioinformatics Site

如何查找一个基因的启动子序列- UCSC Genome Bioinformatics Site 来源:shumingky 发布时间:2009-09-13 查看次数:1712 本篇文章写于早期,随着UCSC网站的改版,本文部分内容与网站不一致,读者操作起来可能不方便。为此,站长原创了一篇文章:“应用UCSC/Ensembl查找基因启动子(promoter)、内含子、外显子序列”,大家可按该文章讲述的方法进行查询基因的启动子,这篇文章之所以没删除,原因是其中有些原理性的内容是一致的,读者可将这两篇文章结合起来阅读。 关键词:基因,启动子序列,软件 定义:启动子是参与特定基因转录及其调控的DNA序列。包含核心启动子区域和调控区域。核心启动子区域产生基础水平的转录,调控区域能够对不同的环境条件作出应答,对基因的表达水平做出相应的调节。 区域:启动子的范围非常大,可以包含转录起始位点上游2000bp,有些特定基因的转录区内部也存在着转录因子的结合位点,因此也属于启动子范围。 这项搜寻要从UCSC基因组浏览器开始,网址为https://www.doczj.com/doc/441243414.html,/。以编码pendrin (PDS)的基因为例来说明上述问题。PDS与耳蜗的异常发育、感觉神经性听力下降以及弥散性甲状腺增大(甲状腺肿)有关。 进入UCSC的主页后,在Organism的下拉菜单中选择Human,然后点击B rowser。使用者现在到了人类基因组浏览器入口。本例的搜寻很简单:在assemb ly的下拉菜单中选择Dec. 2001,在position框中键入pendrin,然后点击Submi t。返回的页面结果显示一个已知的基因和两个mRNA序列。继续点击mRNA序列的登录号AF030880,出现包含这个mRNA区域的图解概要。为了获得这个区

基因启动子分析基本流程

基因启动子分析基本流程


分子生物学发展迅猛,新方法新技术新发现层出不穷,但是我想,我们的基础研究从 某种意义上来说,可以简单的分为两大部分,一个是基因的表达,另一个是基因的功能。当 然,这个基因的概念现在已经不仅仅是指编码蛋白的 DNA 序列了。 我们这期主要探讨基因的表达。而转录调控在基因表达中占有很重要的地位。基因 的转录调控机制非常复杂,这些理论有机会我们再详细探讨,这里就不多介绍了,我们主要 谈一下对于一个新的基因,如何开始他的转录调控研究,第一步到底该怎么做呢? 这里提供一些简单的入门级别的方法,希望对大家有用。相信还有更多更好更实用 的方法,也希望螺友们能够拿出来和大家分享,共同进步! 本次讲座共分为五个部分主要是讲第一部分 因为这个一般的文献和书籍都很少有 详细说明.
一:克隆目的基因基本启动子序列 我们都知道, 基因的基本启动子一般是在基因转录起始位点上游, 当一个基因在没有 确定其转录起始位点的时候,我们假定 NCBI 上提交的序列就是他的完整转录本,那么他的 第一个碱基就是他的转录起始位点。而基因的基本启动子一般就是在转录起始位点的上游 2000bp 左右和下游200bp 左右,当然,这个是一般情况,具体问题还要具体分析.尤其现在发 现一般的基因都是有几个转录起始位点的. 我们通过该基因 mRNA 序列和基因组序列 BLAST, 就能够在染色体上找到这段基因 组序列。我这里用 human 的 AGGF1基因做个例子给大家具体演示一下.

1 首先需要在 NCBI 里面查找到 AGGF1基因的 mRNA 序列,这个我想大家都应该很清楚,如 下图.

相关主题
文本预览
相关文档 最新文档