激活蛋白PEAt1的生物信息学分析-abc
- 格式:pdf
- 大小:2.86 MB
- 文档页数:53
⽣物信息学实验报告3(三)蛋⽩质序列分析(三)蛋⽩质序列分析实验⽬的:掌握蛋⽩质序列检索的操作⽅法,熟悉蛋⽩质基本性质分析,了解蛋⽩质结构分析和预测。
实验内容:1、检索SOX-21蛋⽩质序列,利⽤ProParam⼯具进⾏蛋⽩质的氨基酸组成、分⼦质量、等电点、氨基酸组成、原⼦总数及疏⽔性(ProtScale⼯具)等理化性质的分析。
2、利⽤PredictProtein、PROF、HNN等软件预测分析蛋⽩质的⼆级结构;利⽤Scan Prosite软件对蛋⽩质进⾏结构域分析。
3、利⽤TMHMM、TMPRED、SOSUI等⼯具对蛋⽩质进⾏跨膜分析;采⽤PredictNLS进⾏核定位信号分析;利⽤PSORT进⾏蛋⽩质的亚细胞定位预测;利⽤CBS(http://www.cbs.dtu.dk/services/ProtFun/)⽹站⼯具预测蛋⽩的功能,将序列⽤Blocks、SMART、InterProScan、PFSCAN等搜索其保守序列的特征,进⾏motif 的结构分析。
4、利⽤Swiss-Model数据库软件预测该蛋⽩的三级结构,结果⽤蛋⽩质三维图象软件Jmol查看。
CPHmodels 也是利⽤神经⽹络进⾏同源模建预测蛋⽩质结构的⽅法和⽹络服务器I-TASSER预测所选蛋⽩质的空间结构。
5、分析蛋⽩质的翻译后修饰:分析信号肽及其剪切位点: SignalIP http://www.cbs.dtu.dk/services/SignalP/;分析糖链连接点:分析O-连接糖蛋⽩,NetOGlyc,http://www.cbs.dtu.dk/services/NetOGlyc/;分析N-连接糖蛋⽩,NetNGlyc,http://www.cbs.dtu.dk/services/NetNGlyc/。
6、利⽤检索的序列,进⾏同源⽐对,获得并分析⽐对结果。
实验步骤(⼀)1、在NCBI 蛋⽩质数据库中查找SOX-21蛋⽩质序列分别选择⽖蟾(Xenopus laevis)、⼩家⿏[Mus musculus]、猕猴[Macaca mulatt a]的SOX-21蛋⽩质序列,并保存其FASTA格式。
2018年11月P4501A1蛋白生物信息学分析易灵(成都市实验外国语学校,四川成都610000)摘要:CYP1A1基因编码细胞色素P4501A1蛋白。
该蛋白是重要的活化多环芳烃类致癌物的主要酶类。
本文对P4501A1蛋白的基本特性进行了初步预测和分析。
通过分析其氨基酸的组成表明P4501A1蛋白组成比例最高的为亮氨酸,占比10.2%。
疏水性分析表明P4501A1蛋白整体呈现为亲水性。
利用PSORT 对其进行亚细胞定位表明P4501A1主要分布于细胞质中,这与大多数蛋白的分布一致。
其后采用同源建模方法,构建了P4501A1的三级结构模型,从预测结果来看,P4501A1蛋白主要以α-螺旋为其主要结构。
这些结果是对P4501A1蛋白的初步分析,为更进一步地了解P4501A1蛋白提供了帮助。
关键词:P4501A1蛋白;氨基酸性质;蛋白结构;亲疏水性P4501A1蛋白是重要的活化多环芳烃类致癌物的主要酶类。
被激活的P4501A1能将多种环境中的有机物质如多环芳烃(polycyclic aromatic hydrocarbons ,PAH )转化为细胞毒素或其他致癌物质,从而增加癌症发生的危险。
研究表明,P4501A1与多种癌症的发生有关。
国内外的众多研究显示P4501A1的突变型与野生型相比有更高的酶接触反应活性和癌症可诱导性,从而增加肝癌、肺癌、乳腺癌、食道癌、前列腺癌等疾病的危险度[1]。
细胞色素P450酶(CYP450)是细胞内重要的Ⅰ相代谢酶,在致癌物的活化和解毒过程中起着重要的作用。
它作为一种微神经元体细胞酶与一些致癌物质的生物激活有关,例如苯并芘[benzo(a)pyrene]。
同时,P4501A1易于被2,3,7,8-四氯二苯-对-二恶英(2,3,7,8-tetrachlorodibenzo-p-dioxin ,TCDD )和多环的芳香族化合物所诱变,包括3-甲基胆蒽等实验室用致癌物质。
目前的动物实验表明,P4501A1的表达与多环芳烃受体(AhR )和芳烃受体核转运蛋白(AhR Nuclear Translocator )的激动剂,以及上游刺激因子1(Upstream Stimulatory Factor1,USF1)的拮抗剂有关。
D iscussi o nNAC p r otein fa mily is highly conserved fr o m p ri mary eukary ote to hu man .Most of NAC family p r oteins exist in the for m of a di m er which consist of t w o si milar subunit αand β.Mean while,α2NAC and β2NAC both have a “NAC do 2main ”.But α2NAC had a “UBA do main ”in the C end whileβ2NAC didn ’t have [4].So we infered that Peat1may bel ong to α2NAC .So me researches have sho wn that the main func 2tions of NAC p r otein were as foll o ws:①NAC co mpeted with SRP for co mbinati on with the pep tide which just synthesis on the ribos o mes in order t o av oid p r otein sequences which fold incorrectly and lack of signal pep tide were trans ported t o en 2dop las mic reticulu m me mbrane [5-6].②NAC can co mbine with DNA.It als o inv olved in the p r ocess of certain DNAtranscrip tion as a necessary fact or [7-9].③NAC can co mbinewith translation initiation fact or [10].All these sho wed that NAC p r otein may be a kind of p r otein elicit ors .It has an i m 2portant function on p r o moti on of p lant gr o wth and disease re 2sistance .All 3mutants constructed in this research have g ood ther mal stability like the original Peat1p r otein .Therefore,the coexistence of NAC or UBA do mains is not necessary to ther mal stability of Peat1p r otein .A s t o whether the mutants still have the elicit ors ’functi on,p r o mote p lants gr o wth and resist disease needed to be further studied .R efe rence s[1]Q I U D W .Multifuncti on fungal pr otein f or plant .China,Z L01128666[P].2004-03-17.(in Chinese ).[2]Q I U D W.M icr obe pr otein pesticide and it ’s pr os pect [J ].Chinese Jour 2nal of B i ol ogical Contr ol,2004,20(2):91-94.(in Chinese ).[3]Z HAO MZ,Y ANG XF,Z HANGM,et al .Purificati on and bi oactivities of apr otein gr o wth 2activat or fr o m A lter naria tenuissi m a [J ].Chinese Journal of Bi ol ogical Contr ol,2007,23(2):170-173.(in Chinese ).[4]SPRETER T,PECH M,BE AT R I X B.The crystal structure of archaealnascent poly peptide 2ass ociated co mplex (NAC )reveals a unique f old and the presence of a ubiquitin 2ass ociated do main[J ].The Journal of Bi ol ogi 2cal Che mistry,2005,280(16):15849-15854.[5]P O WERS T,WALTER P .The nascent poly peptide 2ass ociated co mplexmodulates interacti ons bet w een the signal recogniti on particle and the ri 2bos o me[C ].Research Paper Current Bi ol ogy,1996,6(3):331-338.[6]GE ORGE R,WALS HB P,BE DDOE B T,et al .The nascent poly peptide 2ass ociated co mplex (NAC )pr o motes interacti on of ribos o meswith the mi 2t ochondrial surface in viv o[J ].Febs Letters,2002,516:213-216.[7]WH I T BYMC,D I X ON J .Fissi on yeast nascent poly peptide 2ass ociated co m 2plex binds t o f our 2way DNA juncti ons[J ].J Mol B i ol,2001,306:703-716.[8]AK HOUAY R I O,QUE LO I,ST 2ARNAUD R .Sequence 2s pecific DNAbinding by the NAC coactivat or is required f or potentiati on of c 2jun 2de 2pendent transcri pti on of the osteocalcin gene[J ].Molecular and Cellular Bi ol ogy,2005,25(9):3452-3460.[9]Y OT OV WV,MORE AU A,ST 2ARNAUD R .The al pha chain of the nas 2cent poly peptide 2ass ociated co mplex functi ons as a transcri pti onal coacti 2vat or[J ].Molecular and Cellular Bi ol ogy,1998,18(3):1303-1311.[10]M I G UE L AF .Translati on initiati on fact or (is o )4E interacts with BTF3,the βsubunit of the nascent poly peptide 2ass ociated co mplex [J ].Gene ,2005,345:271-277.Peat1蛋白及其3个缺失突变体的表达与热稳定性分析李明勇3,邱德文,曾洪梅,杨秀芬 (中国农业科学院植物保护研究所,北京100081)基金项目 “973”项目(2003CB114204);北京市科技计划(D0*******40431)。
激光生物学报ACTA LASER BIOLOGY SINICAVol. 32 No. 4Aug . 2023第32卷第4期2023年8月收稿日期:2023-04-18;修回日期:2023-05-11。
基金项目:国家自然科学基金项目(31670178);湖南省自然科学基金项目(2021JJ 30918)。
作者简介:王道,主管技师,主要从事女性生殖系统疾病的基础研究。
* 通信作者:宋甜,助理研究员,主要从事衣原体感染疾病的诊断研究。
E-mail:****************.cn 。
人SIRT1基因启动子及蛋白的生物信息学分析王 道1,陈建林1,刘文彬2,刘 丹1,宋 甜1*(1. 中南大学湘雅二医院妇产科,长沙 410011;2. 湖南师范大学生命科学学院,长沙 410081)摘 要:为深入分析人SIRT1基因启动子及蛋白的结构和功能,本文采用生物信息学方法分析人SIRT1基因5′端启动子、启动子区Motif 、转录因子结合位点、甲基化CpG 岛、单核苷酸多态性、进化关系、理化性质、二级和三级结构、保守结构域、突变和翻译后修饰位点、互作蛋白及生物学功能。
TSSW 和Neural Network Promoter Prediction 数据库预测其区间分别存在3个、2个启动子。
MEME 数据库预测启动子区存在3个Motif 。
EMBOSS 、MethPrimer 和CpG Finder 数据库都发现CpG 岛聚集分布于1 600 ~ 2 200 bp 区。
PROMO 和AliBaba 2.1数据库预测其启动子区域共同转录因子为22个。
JASPAR 软件获得6个与正负链相结合的转录因子。
SNP Function Prediction 数据库还发现不同种族等位基因频率存在差异。
人SIRT1基因位于染色体10q 21.3上,广泛分布在不同组织中。
人SIRT 1蛋白由747个氨基酸组成,属于亲水、不稳定的蛋白质,在不同物种间具有较高的保守性。
极细链格孢菌激活蛋白PeaT1结构域分析与功能研究的开
题报告
一、研究背景
极细链格孢菌(Streptomyces cinnamoneus)是一种广泛存在于自然环境中、具有代表性的高产抗生素细菌之一,因其在发酵过程中可产生丰富的次级代谢产物而备受研究者关注。
而构成极细链格孢菌生物合成次级代谢产物工具包的激活蛋白则是该细菌次级代谢物合成的起点之一。
PeaT1是极细链格孢菌中一个RNA聚合酶激活蛋白,通过结合RNA聚合酶和DNA,在次级代谢物的生物合成过程中起到关键作用。
研究表明,PeaT1结构与功能的研究可以为次级代谢物的生物合成提供重要的理论支持和实践指导。
二、研究目的
本研究旨在通过对PeaT1结构域的分析和功能研究,探究其对次级代谢物生物合成的作用机制,为进一步探究PeaT1的作用提供理论依据和实践指导。
三、研究内容和方法
1. PeaT1的生物学与生物化学性质的鉴定
通过PCR扩增和基因组定位方法获得PeaT1基因,利用蛋白质组学方法对PeaT1进行鉴定和分析,探究其生物学和生物化学性质。
2. PeaT1结构域分析
利用生物信息学方法对PeaT1结构域进行分析,探究PeaT1结构域中的保守结构域、功能域及其在生物合成过程中的作用。
3. PeaT1功能研究
通过分子生物学手段构建PeaT1突变体,并对其在次级代谢物生物合成过程中的作用进行分析,探究PeaT1的作用机制,为次级代谢物合成提供实践指导。
四、研究意义
本研究通过对PeaT1结构域的分析和功能研究,可以为探究细菌次级代谢产物的生物合成提供重要的理论基础和实践指导。
同时,该研究可以为开发和应用极细链格孢菌生产抗生素等重要药物等产业提供支持。
t-pa基因-概述说明以及解释1.引言1.1 概述概述部分的内容:引言中的概述部分旨在介绍T-PA基因的背景和相关信息。
T-PA基因,全称为组织型纤溶酶原激活剂基因(tissue-type plasminogen activator gene),是编码相关蛋白质的基因。
该基因编码的蛋白质被称为t-PA,是一种能够将纤溶酶原激活为纤溶酶,参与并调节血液凝固与溶解的重要因子。
随着生物医学研究的深入,人们对T-PA基因的发现、结构、功能以及在疾病中的作用越来越感兴趣。
T-PA基因被广泛研究,通过了解这一基因的特点和功能,可以更好地理解其在血栓溶解、血管新生和其他疾病中的作用机制。
本文将分为引言、正文和结论三个部分。
引言部分将简要介绍T-PA 基因的概念、文章的结构以及研究目的。
正文将详细探讨T-PA基因的发现与作用、结构与功能,以及其在疾病中的作用。
结论部分将总结T-PA 基因的研究意义和应用前景。
通过深入研究T-PA基因,我们能够更好地认识和理解其在生物学和医学领域中的重要性,为相关疾病的预防、诊断和治疗提供更有效的策略和方法。
同时,我们也能够探索其在生物技术和药物研发方面的广阔应用前景。
本文旨在全面介绍T-PA基因及其相关领域研究的进展,为读者提供一个全面了解和掌握该基因的机会。
文章结构是指整篇文章的组织框架和布局方式。
一个良好的文章结构可以使读者更容易理解文章的内容和逻辑关系。
本文的文章结构如下:一、引言1.1 概述:介绍有关T-PA基因的背景和意义,以及其在医学及遗传学领域的重要性。
1.2 文章结构:本部分,将详细介绍文章的整体结构和各个章节的内容。
1.3 目的:说明本文的研究目的和意义。
二、正文2.1 T-PA基因的发现与作用:介绍T-PA基因的发现历程,以及其在机体内的作用机制。
2.2 T-PA基因的结构与功能:探讨T-PA基因的基因序列、氨基酸序列及其所编码的蛋白质的功能。
2.3 T-PA基因在疾病中的作用:详细描述T-PA基因在某些疾病中的变异与突变对相应疾病的影响及作用机制。
激活蛋白PEAt1的生物信息学分析尹富仕张丽勍王垚张薇CAAS08S3 group2中国农业科学院植保所药物工程室激活蛋激活蛋白(Activator)•该蛋白是从多种不同种属的植物病原真菌中筛选、分离、纯化出的一系列蛋白激发子(邱德文,2002)。
•该类蛋白有较强的诱导植物抗病,增产,抗逆,促进植物生长的生物活性,提高作物产量,理化特性上该类蛋白都有很好的热稳定性。
几类蛋白激发子对比情况蛋白激发子类型主要生物来源专利情况分子量过敏反应(烟草寄主)热稳定性隐地蛋白卵菌法国专利10~15kD (Cryptogein )(P. cryptogea )1985年1015kD 或有或无无报道过敏蛋白细菌美国专利30~40kD (Harpin )(E. amylovora )1992年30~40kD 有高激活蛋白真菌中国专利30~70kD (Activitor )(A. alternaria )2000年3070kD 无很高激活蛋白的作用机理•激活蛋白通过激活植物体内的免疫系统而达到抗病防虫和抗逆的目的。
•激活蛋白通过激活植物的代谢系统而使植物生长加快,活力增强。
脯氨酸含量的增加和纤维素酶的加强,植物细胞增长,根系的活力加强,达到增产目的。
(Activator)激活蛋白•激活蛋白可湿性粉剂已经商业化生产,大田推广中取得了良好的效果,具有广泛的应用前景。
激活蛋白诱导处理种子能加快黄瓜种子的萌发,促进幼根的生长;提高多种瓜果蔬菜的座果率,如处理西瓜和番茄可使瓜果数和果重显著提高,分别达到77.4%和45.7%;,对白菜有显著的抗病增产作用,同时能大幅度提高白菜的品质(邱德文等,2005),同时,研究还发现该蛋白制剂能够成倍地提高Bt 对鳞翅目害虫的防治效果,增效达18.5倍(邱德文,曾凡荣等,2005)。
研究背景Peat1蛋白是一种从极细链格孢菌中分离得到的蛋白激发子(p,)。
经验protein elicitor from Alternaria tenuissima PEAt1证,该蛋白具有耐热的特性,能诱导植物产生系统抗性,促进植物生长,改善作物品质,可发展为新型的多功能生物农药。
目前,该蛋白已申报中国发明专利,其有关基因已在GenBank登录(CH445335)。
分析目的•用生物信息学的方法分析PEAt1的结构•探讨PEAt1结构与功能的关系•分析与探究PEAt1耐热,抗病,促生长的分子机制•以PEAt1蛋白为例,练习和巩固有关生物信息学数据库和软件的使用,希望对大家分析自己研究中遇到类似的实际问题有所启发。
研究路线1.氨基酸的理化性质初步分析22.膜蛋白的跨膜区预测3.蛋白质序列的二级结构4.蛋白质序列的结构域预测5.蛋白质序列的三级结构预测/同源建模66.总结与讨论PEAt1结构与功能的关系1. 氨基酸的理化性质分析2. 蛋白质的亚细胞定位3. 膜蛋白的跨膜区预测4. 蛋白质序列的二级结构预测5. 蛋白质序列的三级结构预测PEAt1蛋白的生物信息学分析pEAt1基因序列(共624bp)ATGGCCAACCCCCGCATTGAAGAGCTCCCCGACGAGCCCGAGAAGAAGAACGTCCAGATCGAGGAGGATGAGTCCAGCGACGAGTCTGAGGGCGAGGAGGGCGAGGTCAGCGTACCCGCGGGCTCCTCCGTCGCTGTCCACTCCCGCAACGAGAAGAAGGCTCGCAAGGCCATCGCCAAGCTCGGCCTGAAGCACATCGACGGCATCACACGCGTCACCCTCCGCCG C CGCC GC CGGCC G GC C CG CGGC C C CGCG C CCC CCGCCGACCCAAGAACATCCTCTTTGTCATCAACCAGCCCGACGTCTACAAGTCCCCTTCAAGCAACACCTGGATCATCTTCGGTGAGGCCAAGATCGAGGACCTCAACTCCCAGGCTCAGGCTTCCGCCGCCCAGCAGCTTGCTCAGGCCGAGGCCGCATCCCACGACCACGCCGGCCACGACCACGGCGACGAGGCCAGCAAGGGCAAGGGCAAGGCTGTCGAGGACAAGAAGGACGAGGAGGAGGAGGATGACGATGAGGAGATTGACGACTCTGGCCTTGAGGCCAAGGACATCGAGCTCGTCATGCAGCAGGCCAGCGTTTCGCGGAAGAAGGCCGTCAAGGCCCTCAAGGAGAACGATAACGATATAGTCAACTCCATCATGGCGCTGAGCATATAGPEAt1蛋白序列(207aa)MANPRIEELPDEPEKKNVQIEEDESSDESEGEEGEVSVPAGSSVAVHSRNEKKARKAIAKL GLKHIDGITRVTLRRPKNILFVINQPDVYKSPSSNTWIIFGEAKIEDLNSQAQASAAQQLAQA EAASHDHAGHDHGDEASKGKGKAVEDKKDEEEEDDDEEIDDSGLEAKDIELVMQQASVSR KKAVKALKENDNDIVNSIMALSIPEAt1序列的初步分析¾Molecular weight = 22632.80¾Residues 207Residues=207¾Average Residue Weight = 109.337 ¾Charge = -16.0Ch160¾Isoelectric Point = 4.4305¾A280 Molar Extinction Coefficient = 6970¾A280 Extinction Coefficient 1mg/ml 0.31 A280Extinction Coefficient1mg/ml=0.31Property Residues Number Mole% Tiny (A+C+G+S+T) 56 27.053 S(C G S V)Small (A+B+C+D+G+N+P+S+T+V) 105 50.725 Aliphatic (A+I+L+V) 62 29.952 Aromatic (F+H+W+Y) 10 4.831 i()Non-polar (A+C+F+G+I+L+M+P+V+W+Y) 87 42.029 Polar (D+E+H+K+N+Q+R+S+T+Z) 120 57.971 Charged (B D E H K R Z) 79 38.164 Charged(B+D+E+H+K+R+Z)7938.164 Basic (H+K+R) 33 15.942 Acidic (B+D+E+Z) 46 22.222Self alignment of PEAt1141155169184所用软件: Vector NTI Advance 10软99113127件包的Dot Matrix 参数: stringency 20; window 2457718511733496581971131291451611771841152943从上图可看出PEAt1氨基酸序列的1-35残基同129-163残基具有显著相似性,极性特别是酸性氨基酸出现的频率很高。
推测这两段序列可能以某种方式出现蛋白表面,构成富含负电荷的亲水侧。
进一步分析:这两段序列的一致性为22.2%,相似性为33.3%跨膜区预测TMHMM20¾PEAt1TMHMM2.0¾# Sequence Length: 207#Sequence Number of predicted TMHs:0¾# Sequence Number of predicted TMHs: 0¾# Sequence Exp number of AAs in TMHs: 0.00038¾# Sequence Exp number, first 60 AAs: 4e-05¾# Sequence Total prob of N-in: 0.03326¾Sequence TMHMM2.0outside 1-207does it contain transmembrane segments?•Report_format: seqtable# Report_file: peat1.tmap#Report file:peat1tmap#====================================# Sequence: Peat1 from: 1 to: 207#Sequence:Peat1from:1to:207# HitCount: 0#====================================Start End TransMem SequenceSignalP 3.0 Server -prediction results信号肽预测SignalP-NN(neural networks )result:>seq1length =70seq1 length 70Measure Position Value Cutoff signal peptide?max. C 32 0.060 0.32 NOmax. Y 32 0.018 0.33 NOmax. S 1 0.016 0.87 NOmean S 1310009048NOmean S 1-31 0.009 0.48 NO D 1-31 0.014 0.43 NODoes it contain coiled-coils?NCOILS version 1.0using MTIDK matrix, weights: a,d=2.5 and b,c,e,f,g=1.0ÎSecondary Structure PredictionSecondary Structure Prediction•PROFsec summaryoverall your protein can be classified as:>>> mixed <<<given the following classes:given the following classes:\all-alpha\: %H > 45% AND %E < 5%\all-beta\: %H < 5% AND %E > 45%\alpha-beta\: %H > 30% AND %E > 20%\mixed\: all others\mixed\:all othersPredicted secondary structure composition:+---------------+-------+-------+------+| sec str type | H | E | L || % in protein | 29.5 | 10.6 | 59.9 |+---------------+-------+-------+-------+Predicted solvent accessibility composition (core/surface ratio):Classes used:e: residues exposed with more than 16% of their surfaceb: all other residues.+--------------+-------+-------+| acc type | b | e || % in protein | 22.2 | 77.8 |+--------------+-------+-------+++++HNN-Hierarchical Neural Network method HNN Hierarchical Neural Network methodÎSequence Database searchingPeat1 Sequence Database searchingz基因序列的同源比对发现与NAC蛋白高度同源:Identities = 426/516 (82%)z NAC编码基因的102-614位序列与PEAt1的108-623位序列相匹配,有82%的一致性z蛋白序列比对发现与NAC蛋白家族结构域NAC和EGD2(UBA)有高度同源。