基因启动子分析
- 格式:pdf
- 大小:281.41 KB
- 文档页数:7
Science &Technology Vision 科技视界α-法尼烯是一种普遍存在于植物体内的倍半萜类次生代谢物质,研究发现果皮中α-法尼烯的生物合成是通过类异戊二烯途径中的甲羟戊酸途径[1-2]。
多年来的研究普遍认为,在储存过程中倍半萜α-法尼烯在果皮尤其是果皮蜡质中的积累是引起苹果和梨果实中的重大生理病害—虎皮病的主要原因[3-6]。
Busatto 等(2014)研究发现,α-法尼烯及其氧化产物共轭三烯(CTols)一个新的作用即作为苹果果实褐变的信号开关。
研究表明苹果虎皮病发生过程中多酚提取液的变化也与乙烯合成抑制剂1-MCP 有关。
这些代谢物积累的变化与参与这个途径的基因以及两种特异的挥发物α-法尼烯和共轭三烯(Ctols)的最终氧化形式6-甲基-5-庚烯-2-酮(MHO)关系密切[7],这与Whitaker 等(2000)报道的MHO 与苹果虎皮病发病率之间存在正相关关系,且只有在发病的果实上才能检测到MHO 一致[6]。
候真等(2013)在研究MHO 对苹果虎皮病发生和果皮活性氧代谢的影响时发现,外源MHO 可能通过降低抗氧化酶活性,进而参与苹果虎皮病的发病过程[8]。
而Xie 等(2014)研究还发现,梨(‘d’Anjou’,Pyrus communis L.)果实储存过程中,在乙烯产生和成熟度与虎皮病发生方面对1-MCP 非常敏感[9]。
通过以上研究发现,α-法尼烯及其氧化产物与虎皮病发生关系密切,而α-法尼烯含量及α-法尼烯合酶表达模式可能受到1-MCP 影响或乙烯的调节。
因此,仅通过研究α-法尼烯合酶基因本身很难真正阐明虎皮病发生的分子机制,尤其是研究外界环境对虎皮病发生率的影响时,此时α-法尼烯的产生与其代谢途径中的关键酶的表达量有重要关系。
本文拟通过分离α-法尼烯合成途径的最后一个关键酶α-法尼烯合成酶基因的启动子序列,对其结构进行分析,研究其所含有的顺式作用元件,为下一步植物表达载体的构建,以及光、激素、温度、氧气等因素对启动子调控的研究奠定基础。
植物分子生物学研究中的基因启动子分析随着基因组学技术的不断发展和应用,越来越多的生物信息学分析工具被应用于生物学研究领域。
在植物分子生物学研究中,基因启动子的分析是一个非常重要的研究内容。
基因启动子是指位于基因转录起始区域的DNA序列,是控制基因表达的关键因素之一。
通过对植物基因启动子的分析,可以深入了解植物基因调控机制的运作方式,从而更好地理解植物发育、适应和响应环境等生理过程。
本文将从基因启动子的含义、种类及其在植物研究中的作用三个方面,深入探讨基因启动子分析的重要性。
一、基因启动子的含义和种类基因启动子通常定位在基因转录起始区域的5'端,长度约为100-2000bp。
它被认为是基因调控的主要起点,控制着基因的转录和表达。
在植物基因组中,启动子类型主要包括:(1)核心启动子:位于编码区域的5'端,仅包括转录起始位点(TSS)及其周围几个碱基,长度通常小于50bp。
(2)组织特异性启动子:指仅在特定细胞或组织中启动转录的启动子,其控制基因的表达仅限于某些细胞或细胞群。
(3)响应性启动子:指在特定的内外环境因素刺激下,通过识别响应元件进行调控的启动子,包括各种环境因素的响应元件,如光响应元件、温度响应元件、激素响应元件等。
(4)增强子和沉默子:指在不同细胞类型间及不同环境因素下对启动子的转录调控进行分别增强或沉默的序列。
二、基因启动子在植物研究中的作用1.基因启动子在基因工程中的应用首先,在植物基因工程中,研究者经常需要通过改变启动子的序列来调整基因表达,从而改变植物表现型。
例如,在转基因作物的育种中,利用卫星病毒启动子来改变抗病性基因的表达,使作物获得更好的病毒抗性。
此外,一些促生长和耐旱基因的启动子也被广泛应用在转基因植物的生产和品种改良上。
2.基因启动子在基因调控机制研究中的应用基因启动子的功能不止于此,它在植物基因调控机制的研究中也具有很大的应用前景。
对基因启动子的分析可以揭示基因调控网络中的重要组成部分及其相互作用。
如何找一个基因的启动子序列呢一个基因的启动子序列是一个基因组区域,位于基因的上游,并能够识别和结合转录因子,调控基因的转录活性。
寻找一个基因的启动子序列可以通过多种方法和技术来进行。
1. 基因组数据挖掘:最简单的方法是使用公开的基因组数据库,例如Ensembl、NCBI等,使用基因名或序列信息目标基因,并获取其序列信息。
这些数据库通常会提供基因的起始位置和上游区域的信息。
2.序列比对和多序列比较:如果基因组数据库中没有目标基因的启动子序列信息,可以通过对已知相关物种的基因组进行序列比对来获取启动子序列。
过去研究或其他相关文献中可能已经报道了该基因位点的启动子信息,可以通过多序列比较来找到高度保守的区域进行分析。
3.实验方法:寻找基因的启动子序列也可以通过实验方法来进行。
以下是几个常用的实验方法:-基因克隆:通过PCR扩增目标基因的上游区域,然后将PCR产物克隆到适当的载体中进行测序。
从测序结果中截取相应的序列作为启动子序列。
- 5' RACE(Rapid Amplification of cDNA Ends):通过5' RACE技术,可以找到目标基因的转录起始位点,从而确定启动子序列。
这种方法从mRNA上游端引导逆转录聚合酶链式反应(RT-PCR),然后再通过测序获取启动子序列。
-转录组学方法:RNA测序和转录组学方法可以检测到基因的转录产物,从而很大程度上能够帮助确定启动子序列。
RNA测序可以生成从基因的5'端到3'端的转录产物的序列信息,因此可以利用这些数据来识别基因的启动子区域。
4. 计算方法:计算方法可以利用一些生物学特征或机器学习算法来预测基因的启动子序列。
例如,启动子序列通常富含一些特定的DNA序列模式,如TATA box、CAAT box和GC box等。
利用这些DNA序列模式的分布和相互作用关系,可以预测和确定基因的启动子区域。
在寻找基因的启动子序列时,需要根据研究目的选择适当的方法。
《苏尼特羊脂肪组织UCP1基因启动子区的甲基化水平分析》篇一一、引言近年来,随着生物技术的飞速发展,基因表达调控机制的研究逐渐成为生命科学领域的重要课题。
其中,基因启动子区的甲基化水平是影响基因表达的重要因子之一。
在苏尼特羊的育种与生产过程中,提高脂肪组织的UCP1基因启动子区的甲基化水平有助于我们理解羊体脂的生成和调控机制,对于改良肉质和提高畜牧业经济效益具有重要意义。
因此,本文对苏尼特羊脂肪组织UCP1基因启动子区的甲基化水平进行了深入研究与分析。
二、材料与方法1. 实验材料本实验选取了健康的苏尼特羊作为研究对象,采集其脂肪组织样本。
同时,我们使用PCR技术扩增UCP1基因启动子区序列,并利用相关试剂盒进行甲基化处理。
2. 实验方法(1)基因组DNA提取:从苏尼特羊脂肪组织中提取基因组DNA。
(2)PCR扩增:利用特异性引物对UCP1基因启动子区进行PCR扩增。
(3)甲基化处理:将PCR产物进行甲基化处理,以检测甲基化水平。
(4)数据分析:通过生物信息学软件对甲基化数据进行统计分析。
三、实验结果1. UCP1基因启动子区序列扩增结果通过PCR技术成功扩增了苏尼特羊UCP1基因启动子区序列,序列长度与预期相符,无突变现象。
2. 甲基化水平分析结果通过对扩增的UCP1基因启动子区序列进行甲基化处理和数据分析,我们发现苏尼特羊脂肪组织中UCP1基因启动子区的甲基化水平较高,且在不同个体间存在一定差异。
四、讨论基因启动子区的甲基化水平对基因表达具有重要影响。
在本研究中,我们发现苏尼特羊脂肪组织UCP1基因启动子区的甲基化水平较高,这可能与其体脂生成和调控机制有关。
UCP1基因是一种与线粒体解耦联蛋白相关的基因,其表达水平与脂肪组织的能量代谢密切相关。
因此,UCP1基因启动子区的甲基化水平可能影响其表达水平,从而影响苏尼特羊的体脂生成和调控。
此外,我们还发现不同个体间UCP1基因启动子区的甲基化水平存在差异,这可能与遗传因素、环境因素以及饲养管理等因素有关。
基因启动子分析范文基因启动子的分析方法主要有两种:实验方法和计算方法。
实验方法包括DNA酶切、染色质免疫沉淀、荧光素酶报告等技术,可以直接测定基因启动子的功能。
计算方法则通过对DNA序列进行计算和预测,识别潜在的启动子序列。
在这两种方法中,计算方法在大规模基因组分析中更具优势,能够有效筛选出候选的启动子序列。
基因启动子分析的重要性在于深入研究基因调控机制。
通过对启动子序列的研究,可以预测转录因子结合位点,即调控基因表达的关键位点。
这些转录因子位点在启动子中起着核心的调控作用,可以确定基因的表达模式和组织特异性。
此外,基因启动子分析也可以预测启动子的甲基化程度,甲基化是一种常见的基因调控机制,通过甲基化可以调控基因的表达水平。
因此,基因启动子分析对于了解基因调控机制具有重要意义。
基因启动子分析还可以用于预测转录启动位点。
转录启动位点是指RNA聚合酶在启动子上结合并开始转录的位置,它和基因的结构以及转录机制密切相关。
通过基因启动子分析,可以预测转录启动位点,并进一步研究基因的表达调控。
此外,基因启动子分析还可以揭示启动子序列的保守性,即在不同物种中启动子序列的相似性。
这种保守性通常表示该启动子在不同物种中具有重要的功能,在进化过程中得到保留。
基因启动子分析的应用广泛。
在医学研究中,基因启动子分析可以用于疾病基因的筛选和诊断。
通过比较病患与正常人的基因启动子序列差异,可以发现可能与疾病相关的启动子突变或甲基化位点。
在生物工程领域,基因启动子分析可以用于合成生物学研究中的基因调控。
通过预测和设计基因启动子序列,可以实现对目标基因的精确调控,从而提高产物的产量和纯度。
总之,基因启动子分析是基因调控研究的重要手段之一、通过对基因启动子序列和功能的深入分析,可以准确了解基因调控机制、预测转录启动位点和转录因子结合位点,并应用于医学和生物工程等领域。
基因启动子分析的进一步发展和应用将对疾病诊断和基因调控技术的发展提供重要的支持。
DAZL基因启动子活性初步分析及其诱导剂的筛选、
验证的开题报告
开题报告:
研究题目:DAZL基因启动子活性初步分析及其诱导剂的筛选、验证
研究背景:
DAZL基因是一种与性别有关的基因,在生殖系统中发挥着重要的作用。
目前的研究表明,DAZL基因参与了生殖细胞的分化和成熟过程。
为了深入探究DAZL基因的调节机制,我们需要首先研究其启动子的活性以及与其相关的调节因子。
研究内容:
1. 分析DAZL基因启动子区域:通过生物信息学方法预测DAZL基因启动子区域,并确定重要的启动子序列。
2. 建立DAZL基因启动子报告系统:利用荧光素酶或荧光蛋白标记DAZL基因启动子,建立DAZL基因启动子报告系统,用于检测其活性。
3. 筛选DAZL基因启动子活性调节因子:利用高通量药物筛选技术,筛选出与DAZL基因启动子活性相关的化合物。
4. 验证DAZL基因启动子活性调节因子:使用荧光素酶或荧光蛋白
标记DAZL基因启动子,通过检测其荧光强度,确认筛选出的化合物是否能够调节DAZL基因启动子的活性。
研究意义:
本研究将为深入理解DAZL基因的调节机制提供重要的实验数据和
理论依据,为进一步研究DAZL基因在生殖细胞分化、成熟等生物学过程中的作用提供基础。
同时,通过筛选与DAZL基因启动子活性相关的化合物,为未来针对生殖系统疾病的治疗提供资料支持。
基因启动子分析一:克隆目的基因基本启动子序列我们都知道,基因的基本启动子一般是在基因转录起始位点上游,当一个基因在没有确定其转录起始位点的时候,我们假定NCBI上提交的序列就是他的完整转录本,那么他的第一个碱基就是他的转录起始位点。
而基因的基本启动子一般就是在转录起始位点的上游2000bp左右和下游200bp左右,当然,这个是一般情况,具体问题还要具体分析.尤其现在发现一般的基因都是有几个转录起始位点的.我们通过该基因mRNA序列和基因组序列BLAST,就能够在染色体上找到这段基因组序列。
我这里用human的AGGF1基因做个例子给大家具体演示一下.1 首先需要在NCBI里面查找到AGGF1基因的mRNA序列,这个我想大家都应该很清楚,如下图.2 然后就是用这段mRNA序列和人类的基因组序列BLAST3 BLAST得到了很多结果,我们往往选择最上面那个最匹配的结果。
4 点击之后就可以看到下图,这个基因的14个外显子和13个内含子在5号染色体上的位置一目了然,第一个外显子在上面,说明这个基因在染色体上是正向的,基本启动子就应该在第一外显子上面,我用红色的方框标明了。
5 大家有没有注意到左上方有个数据框,我把数值改为76,360K 到 76,362.200 ,刚好2200BP,包括了第一个外显子的前200BP左右.然后点击红色框标明的Download/view sequence.6 然后就到了这个界面, Sequence Format 选择GenBank, 然后点击 Display. 就得到我们所需要的序列了.7 这里我们可以看到1989到2201是AGGF1的mRNA序列,说明我们的确找到了该基因5'非翻译区的上游启动子序列.建议将这2200bp都克隆下来.以上的步骤就是基因基本启动子的查找,其实还有很多调控序列是在基因内含子区域或者是基因的3'非翻译区等,序列查找的步骤和上面是一样的.8 还有一个方法更加简单,那就是用AGGF1的 前60bp序列和nucleotide 数据库 BLAST,可以得到该序列在染色体上的位置,需要注意的是,如果是反向的序列的话,我们就要选择反向互补的序列.二:软件预测顺式作用元件,做点突变分析得到这些序列后,克隆进没有启动子载体pGL3或者pTAL-luc中去,转染细胞, 测定荧光活性,如果有很强的活性,那么说明你已经成功克隆到了该基因的基本启动子. 然后可以通过5‘非翻译区一系列的缺失突变,不断把范围缩小,找到哪一段序列对于该基因的启动子活性是必须的或者是最重要的。
激光生物学报ACTA LASER BIOLOGY SINICAVol. 32 No. 4Aug . 2023第32卷第4期2023年8月收稿日期:2023-04-18;修回日期:2023-05-11。
基金项目:国家自然科学基金项目(31670178);湖南省自然科学基金项目(2021JJ 30918)。
作者简介:王道,主管技师,主要从事女性生殖系统疾病的基础研究。
* 通信作者:宋甜,助理研究员,主要从事衣原体感染疾病的诊断研究。
E-mail:****************.cn 。
人SIRT1基因启动子及蛋白的生物信息学分析王 道1,陈建林1,刘文彬2,刘 丹1,宋 甜1*(1. 中南大学湘雅二医院妇产科,长沙 410011;2. 湖南师范大学生命科学学院,长沙 410081)摘 要:为深入分析人SIRT1基因启动子及蛋白的结构和功能,本文采用生物信息学方法分析人SIRT1基因5′端启动子、启动子区Motif 、转录因子结合位点、甲基化CpG 岛、单核苷酸多态性、进化关系、理化性质、二级和三级结构、保守结构域、突变和翻译后修饰位点、互作蛋白及生物学功能。
TSSW 和Neural Network Promoter Prediction 数据库预测其区间分别存在3个、2个启动子。
MEME 数据库预测启动子区存在3个Motif 。
EMBOSS 、MethPrimer 和CpG Finder 数据库都发现CpG 岛聚集分布于1 600 ~ 2 200 bp 区。
PROMO 和AliBaba 2.1数据库预测其启动子区域共同转录因子为22个。
JASPAR 软件获得6个与正负链相结合的转录因子。
SNP Function Prediction 数据库还发现不同种族等位基因频率存在差异。
人SIRT1基因位于染色体10q 21.3上,广泛分布在不同组织中。
人SIRT 1蛋白由747个氨基酸组成,属于亲水、不稳定的蛋白质,在不同物种间具有较高的保守性。
基因启动子分析基本流程”1. 数据获取:首先需要获取所研究基因的启动子序列。
可以通过数据库查询或测序技术获取,数据库比如NCBI、Ensembl等,或者利用PCR、随机引物法等技术从DNA中扩增得到。
2. 启动子预测:将获取到的DNA序列输入到启动子预测软件中进行预测,以确定是否存在启动子元件。
启动子元件一般包括TATA-box、CAAT-box、GC-box等保守序列,以及增强子和抑制子。
3.序列比对和进化保守性分析:通过多序列比对,将同一基因在不同物种中的启动子序列进行比对,以确定其中的保守序列。
保守序列通常表示该序列的功能在进化过程中具有重要作用。
4.功能元件鉴定:通过启动子序列中的保守序列和已知的转录调控因子结合位点进行分析,找出可能的功能元件。
可以使用在线工具或软件来预测可能的调控因子结合位点。
5.转录因子分析:对启动子中找到的调控因子结合位点,进一步验证其与转录调控因子的结合关系。
可以使用DNA酶切、染色质免疫沉淀等技术验证。
6.功能验证:通过转录因子与启动子结合部位上下游引入突变或上调/下调转录因子表达等方式,验证启动子的调控功能。
可以通过克隆启动子片段构建报告基因体系,如荧光素酶报告基因体系。
7.体外与体内实验:进行体外和体内实验验证启动子的功能。
体外实验可以通过细胞培养和转染技术,体内实验可以通过转基因动物模型。
8.数据分析和结果展示:对实验结果进行数据分析和统计,并进行可视化展示。
可以使用各种数据分析软件和绘图工具来展示实验结果。
总结:基因启动子分析是一项复杂而重要的研究工作,通过获取基因启动子序列、预测和鉴定功能元件,进一步验证其调控机制,最终得到基因在不同环境下的调控模式。
这项工作对深入理解基因调控机制、疾病研究和基因工程具有重要意义。
启动子分析-----------转录因子结合位点2011-03-07 02:58:25| 分类:默认分类|字号订阅启动子是DNA分子可以与RNA聚合酶特异结合的部位,也就是使转录开始的部位。
在基因表达的调控中,转录的起始是个关键。
常常某个基因是否应当表达决定于在特定的启动子起始过程。
启动子一般可分为两类:(1)一类是RNA聚合酶可以直接识别的启动子。
这类启动子应当总是能被转录。
但实际上也不都如此,外来蛋白质可对其有影响,即该蛋白质可直接阻断启动子,也可间接作用于邻近的DNA结构,使聚合酶不能和启动子结合。
(2)另一类启动子在和聚合酶结和时需要有蛋白质辅助因子的存在。
这种蛋白质因子能够识别与该启动子顺序相邻或甚至重叠的DNA顺序。
因此,RNA聚合酶能否与启动子相互作用是起始转录的关键问题,似乎是蛋白质分子如何能识别DNA链上特异序列。
例如,RNA聚合酶分子上是否有一个活性中心能够识别出DNA双螺旋上某特异序列的化学结构?不同启动子对RNA聚合酶的亲和力各不同。
这就可能对调控转录起始的频率,亦即对基因表达的程度有重要不同。
DNA链上从启动子直到终止子为止的长度称为一个转录单位。
一个转录单位可以包括一个基因,也可以包括几个基因。
启动子预测软件大体分为三类,第一类是启发式的方法,它利用模型描述几种转录因子结合部位定向及其侧翼结构特点,它具有挺高的特异性,但未提供通用的启动子预测方法;第二类是根据启动子与转录因子结合的特性,从转录因子结合部位的密度推测出启动子区域,这方法存在较高的假阳性;另一类是根据启动子区自身的特征来进行测定,这种方法的准确性比较高。
同时,还可以结合是否存在CpG岛,而对启动子预测的准确性做出辅助性的推测。
启动子预测软件有:PromoterScan ; Promoter 2.0 ; NNPP ;EMBOSS Cpgplot ; CpG Prediction启动子及转录因子结合位点数据库及预测工具冷泉港启动子分析程序介绍/links/ch_09_t_6.html在线预测和分析基因启动子(promoter)一般在公共数据库中,如NCBI、UCSC、Ensembl给出的人类基因序列都没有对基因进行详细的标注。
基因启动子序列分析和编码机制序言生命科学在我们的日常生活中越来越受到关注,现代科技的快速发展允许研究生命科学的深入分析和研究。
其中,基因启动子序列的分析和编码机制是研究生命科学的重要领域之一。
在本文中,我将详细介绍这一领域的研究和相应的技术和方法。
基因启动子序列的定义基因启动子序列位于基因的上游区域,它是一个调控基因转录的区域。
它与RNA聚合酶的结合起始转录,从而进行基因的表达。
该区域的长度约为50到1000个碱基对,启动子序列通常由一些保守区域组成,这些区域的位置是基因转录调控的关键。
基因启动子序列的分析现代技术的发展为基因启动子序列的分析提供了更多的方法。
其中,逆转录聚合酶链式反应技术(RT-PCR)是其中之一,它利用RNA聚合酶所产生的RNA反向转录成DNA。
这里是应用 RT-PCR 技术来测量基因转录的定量方法。
另一个相关的方法是 DNA甲基化分析。
该技术可用来研究基因启动子序列区域的甲基化状态使其转录活性受到抑制。
它具有高灵敏度和特异性,并可用来测定细胞DNA的甲基化程度。
基因编码机制基因编码机制是指基因信息转录的过程。
DNA的双螺旋结构中的两条链被调控螺旋外螺旋,在RNA聚合酶的帮助下,DNA反向转录成翻译的RNA,后者进入细胞质,转化成蛋白质。
这个转录和翻译的过程中起到关键作用的RNA分子被称为信息媒介分子(mRNA),它是一种大分子,其中包含了所有基础对上的DNA编码信息的转录。
它包含了基因的编码区域和非编码区域,分别对应了内部可读取的信息和对上游启动子具有调控作用的region区域。
基因编码区域位于RNA分子中间,是由n个具有20种氨基酸codon的nucleotide三联体组成的,而非编码区域则是由其他部分的RNA组成的。
此外,还存在一些区域用于帮助RNA 加工和细胞内搬运。
基因编辑技术目前,一些新技术已经允许将 CRISPR-Cas9 用于将特定的基因序列修改成我们所需的版本。
一文教会你查找基因的启动子、UTR、TSS等区域以及预测转录因子结合位点展开全文本文授权转载自科研小助手(ID:SciRes)斜体小一号字体为生信宝典的备注或校正。
基础知识首先我们了解一些基础知识(注:文中图片皆可点击放大查看!):启动子(promoter):与RNA聚合酶结合并能起始mRNA合成的序列。
做生信分析时,一般选择上游1 kb,下游 500 nt,也有选上下游各1 kb的。
如果关注核心启动子,可见生信宝典之前发布的Jaspar数据库介绍。
获取正链或负链的启动子序列时要注意方向。
之前awk的教程中有些提及。
转录起始点(TSS):转录时,mRNA链第一个核苷酸相对应DNA链上的碱基,通常为一个嘌呤。
UTR(Untranslated Regions):即非翻译区,是信使RNA (mRNA)分子编码区(CDS)两端的非编码片段。
5’-UTR从mRNA起点的甲基化鸟嘌呤核苷酸帽延伸至AUG起始密码子,3’-UTR从编码区末端的终止密码子延伸至多聚A尾巴(Poly-A)的末端。
生信老司机以中心法则为主线讲解组学技术的应用和生信分析心得- 限时免费中讲述了如何基于高通量数据对这些区域的调节变化进行分析,可配合此文观看。
1. 查找基因的启动子区域-NCBI1. 打开PubMed:/pubmed2. 选择Gene,输入IL17A,点击search,结果如下图,点击第一个:3. 下拉到下图位置,可以看到该基因的以下信息:点击Tools,选择Sequence Text View:还可以看到如下序列信息:4. 以上只是该基因的一些信息,可以用于查找相应的UTR等区域,下面进入正题,寻找promoter区域。
还是拉到如下图位置,点击FASTA:5. 基因位置信息如下图:6. 一般认为基因上游2 kb区域为该基因的promoter区域,所以将基因上游2 kb序列调出来:7. 复制上述序列就是基因的启动子序列了。
基因启动子分析
一:克隆目的基因基本启动子序列
我们都知道,基因的基本启动子一般是在基因转录起始位点上游,当一个基因在没有确定其转录起始位点的时候,我们假定NCBI上提交的序列就是他的完整转录本,那么他的第一个碱基就是他的转录起始位点。
而基因的基本启动子一般就是在转录起始位点的上游2000bp左右和下游200bp左右,当然,这个是一般情况,具体问题还要具体分析.尤其现在发现一般的基因都是有几个转录起始位点的.
我们通过该基因mRNA序列和基因组序列BLAST,就能够在染色体上找到这段基因组序列。
我这里用human的AGGF1基因做个例子给大家具体演示一下.
1 首先需要在NCBI里面查找到AGGF1基因的mRNA序列,这个我想大家都应该很清楚,如下图.
2 然后就是用这段mRNA序列和人类的基因组序列BLAST
3 BLAST得到了很多结果,我们往往选择最上面那个最匹配的结果。
4 点击之后就可以看到下图,这个基因的14个外显子和13个内含子在5号染色体上的位置一目了然,第一个外显子在上面,说明这个基因在染色体上是正向的,基本启动子就应该在第一外显子上面,我用红色的方框标明了。
5 大家有没有注意到左上方有个数据框,我把数值改为76,360K 到 76,362.200 ,刚好2200BP,包括了第一个外显子的前200BP左右.
然后点击红色框标明的Download/view sequence.
6 然后就到了这个界面, Sequence Format 选择GenBank, 然后点击 Display. 就得到我们所需要的序列了.
7 这里我们可以看到1989到2201是AGGF1的mRNA序列,说明我们的确找到了该基因5'非翻译区的上游启动子序列.建议将这2200bp都克隆下来.
以上的步骤就是基因基本启动子的查找,其实还有很多调控序列是在基因内含子区域或者是基因的3'非翻译区等,序列查找的步骤和上面是一样的.
8 还有一个方法更加简单,那就是用AGGF1的 前60bp序列和nucleotide 数据库 BLAST,可以得到该序列在染色体上的位置,需要注意的是,如果是反向的序列的话,我们就要选择反向互补的序列.
二:软件预测顺式作用元件,做点突变分析
得到这些序列后,克隆进没有启动子载体pGL3或者pTAL-luc中去,转染细胞, 测定
荧光活性,如果有很强的活性,那么说明你已经成功克隆到了该基因的基本启动子. 然后可以通过5‘非翻译区一系列的缺失突变,不断把范围缩小,找到哪一段序列对于该基因的启动子活性是必须的或者是最重要的。
当找到这个比较核心的启动子序列后,可以通过一些在线的软件去预测其顺式作用元件的位点,,每个在线软件都有自己独特的算法分析,得到的结果并不都是可靠的,每个软件都有自己的优势,需要多综合一些软件预测的结果,并通过分析预测出来
的转录因子是不是和该基因有功能上的联系等做进一步的选择,继续做下面的验证实验。
下面这两个有商业化的软件:
http://www.genomatix.de/
/pub/databases.html#transfac
下面这两个是免费:
http://www.cbrc.jp/research/db/TFSEARCH.html
/cgi-bin/tess/tess
用TESS举个列,直接在首页下面的方框里输入你要分析的序列就可以了。
同样在首页,通过下面的方框,你可以查找一些转录因子的相关信息.
了解转录因子结合DNA的保守序列后,就可以用重叠延伸PCR的方法针对几个最重要的碱基做点突变。
有时候,你可以突变2-3个碱基,这样有效果会更好.
同时突变避免形成新的转录因子的结合位点,提交引物之前把突变后的序列也要通
过上面的软件预测一下.
三:EMSA实验在体外验证顺式作用元件同反式作用因子的结合
反式作用因子一般指的就是转录因子,顺式作用元件一般是指转录因子和启动子结合的那部分序列,一般是10-20bp左右.
点突变证实该顺式作用元件对于启动子活性是有影响的,接下来就要用EMSA实验验证反式作用因子和该顺式作用元件在体外是有直接结合的.,反式作用因子可以用
细胞核抽提物做,也可以用体外表达纯化的蛋白,也可以用该反式作用因子的抗体做Super shift 实验,进一步证实该证顺式作用元件同反式作用因子的特异性结合。
四:CHIP实验在体内验证顺式作用元件同反式作用因子的结合
当EMSA实验得到阳性结果后,还是不能最后肯定该反式作用因子和该顺式作用元件有结合.毕竟体外的结合并不能代表生理条件下的结合.接下来就要用染色质免疫
沉淀(ChIP) 技术来证实在体内的生理条件下该顺式作用元件和该反式作用因子是有结合的.
五:过表达和干扰反式作用因子情况下用RT-PCR验证目的基因的表达情况
那么,反式作用因子和顺式作用元件有结合,就一定会影响该基因的表达吗?很多时候很多转录因子一起形成复合体才有调控作用,于是我们要在过表达和干扰该反式作用因子的条件下,做RT-PCR看目的基因的表达是否有变化.这个才能最后说明反
式作用因子和顺式作用元件结合后真的能够调控目的基因的表达,
对于以上很多的实验,选取细胞系是非常重要的,在不同的细胞系,目的基因的表达是有区别的,因此,只有在某种细胞系才会得到理想的结果.。