激活蛋白PEAt1的生物信息学分析-abc

格式：pdf
大小：2.86 MB
文档页数：53

下载文档原格式

生物信息学实验报告3（三）蛋白质序列分析

⽣物信息学实验报告3（三）蛋⽩质序列分析（三）蛋⽩质序列分析实验⽬的：掌握蛋⽩质序列检索的操作⽅法，熟悉蛋⽩质基本性质分析，了解蛋⽩质结构分析和预测。

实验内容：1、检索SOX-21蛋⽩质序列，利⽤ProParam⼯具进⾏蛋⽩质的氨基酸组成、分⼦质量、等电点、氨基酸组成、原⼦总数及疏⽔性（ProtScale⼯具）等理化性质的分析。

2、利⽤PredictProtein、PROF、HNN等软件预测分析蛋⽩质的⼆级结构；利⽤Scan Prosite软件对蛋⽩质进⾏结构域分析。

3、利⽤TMHMM、TMPRED、SOSUI等⼯具对蛋⽩质进⾏跨膜分析；采⽤PredictNLS进⾏核定位信号分析；利⽤PSORT进⾏蛋⽩质的亚细胞定位预测；利⽤CBS（http://www.cbs.dtu.dk/services/ProtFun/）⽹站⼯具预测蛋⽩的功能，将序列⽤Blocks、SMART、InterProScan、PFSCAN等搜索其保守序列的特征，进⾏motif 的结构分析。

4、利⽤Swiss-Model数据库软件预测该蛋⽩的三级结构，结果⽤蛋⽩质三维图象软件Jmol查看。

CPHmodels 也是利⽤神经⽹络进⾏同源模建预测蛋⽩质结构的⽅法和⽹络服务器I-TASSER预测所选蛋⽩质的空间结构。

5、分析蛋⽩质的翻译后修饰：分析信号肽及其剪切位点: SignalIP http://www.cbs.dtu.dk/services/SignalP/；分析糖链连接点:分析O－连接糖蛋⽩,NetOGlyc，http://www.cbs.dtu.dk/services/NetOGlyc/；分析N－连接糖蛋⽩，NetNGlyc，http://www.cbs.dtu.dk/services/NetNGlyc/。

6、利⽤检索的序列，进⾏同源⽐对，获得并分析⽐对结果。

实验步骤（⼀）1、在NCBI 蛋⽩质数据库中查找SOX-21蛋⽩质序列分别选择⽖蟾（Xenopus laevis）、⼩家⿏[Mus musculus]、猕猴[Macaca mulatt a]的SOX-21蛋⽩质序列，并保存其FASTA格式。

猪肠道寡肽转运载体1(PepT1)mRNA表达的肠段特异性和发育性变化

空肠、回肠和结肠组织样品；１ＳＲＡ为内标基因，实时荧光定量ＰＲ法（ＹＲＧｅｎＩ剂盒）测ＰｐＩＮ在以８Ｎｒ用ＣＳＢｒｅ试检ｅＴｍＲＡ
６白猪表达的肠段特异性及其在蓝塘和长白猪肠道的发育模式。结果显示：白猪肠道Ｐｐ１ＮＡ的表达丰度十二指０ｄ长长ｅＴｍＲ肠显著高于空肠和回肠（００）结肠无ＰｐＩＮＡ的表达；ｅＴＮ的表达丰度在十二指肠为蓝塘猪７９Ｐ＜．，５ｅＴｍＲＰｐ１ｍＲＡ、０ｄ和长白猪６，０ｄ而在空肠和回肠为蓝塘猪６０ｄ和长白猪９ｄ时达最高水平（０５；０Ｐ＜．）蓝塘和长白猪肠道Ｐｐ１ＮＡ的表达在断０ｅＴｍＲ奶前（８ｄ断奶）２具有不同的发育模式，而在断奶后则具有相似的发育性变化；同一猪种不同肠段Ｐｐ１ＮＡ的表达模式不ｅＴｍＲ同，但空肠和回肠在断奶后具有相似的发育性变化；同猪种同一肠段ＰｐｌＲＮ的表达蓝塘猪十二指肠在７和９、不ｅＴｍＡ０ｄ空肠在７和６回肠在３０ｄ及０ｄ时分别显著高于长白猪（００）Ｐ＜．５。结果说明猪肠道Ｐｐ１Ｎ的表达受到发育阶段、ｅＴｍＲＡ品种和肠
段的调控。
关键词：；猪肠道；寡肽转运载体ｌｅＴ）ＮＡ；（ｐ１ｍＲＰ肠段特异性；育模式发
中图分类号：１８文献标识码：Ｓ８Ａ文章编号：０６１０（０８０ —２９０１０．３４２０）２０２．８

P450 1A1蛋白生物信息学分析

2018年11月P4501A1蛋白生物信息学分析易灵（成都市实验外国语学校，四川成都610000）摘要：CYP1A1基因编码细胞色素P4501A1蛋白。

该蛋白是重要的活化多环芳烃类致癌物的主要酶类。

本文对P4501A1蛋白的基本特性进行了初步预测和分析。

通过分析其氨基酸的组成表明P4501A1蛋白组成比例最高的为亮氨酸，占比10.2%。

疏水性分析表明P4501A1蛋白整体呈现为亲水性。

利用PSORT 对其进行亚细胞定位表明P4501A1主要分布于细胞质中，这与大多数蛋白的分布一致。

其后采用同源建模方法，构建了P4501A1的三级结构模型，从预测结果来看，P4501A1蛋白主要以α-螺旋为其主要结构。

这些结果是对P4501A1蛋白的初步分析，为更进一步地了解P4501A1蛋白提供了帮助。

关键词：P4501A1蛋白；氨基酸性质；蛋白结构；亲疏水性P4501A1蛋白是重要的活化多环芳烃类致癌物的主要酶类。

被激活的P4501A1能将多种环境中的有机物质如多环芳烃（polycyclic aromatic hydrocarbons ，PAH ）转化为细胞毒素或其他致癌物质，从而增加癌症发生的危险。

研究表明，P4501A1与多种癌症的发生有关。

国内外的众多研究显示P4501A1的突变型与野生型相比有更高的酶接触反应活性和癌症可诱导性，从而增加肝癌、肺癌、乳腺癌、食道癌、前列腺癌等疾病的危险度[1]。

细胞色素P450酶（CYP450）是细胞内重要的Ⅰ相代谢酶，在致癌物的活化和解毒过程中起着重要的作用。

它作为一种微神经元体细胞酶与一些致癌物质的生物激活有关，例如苯并芘[benzo(a)pyrene]。

同时，P4501A1易于被2,3,7,8-四氯二苯-对-二恶英（2,3,7,8-tetrachlorodibenzo-p-dioxin ，TCDD ）和多环的芳香族化合物所诱变，包括3-甲基胆蒽等实验室用致癌物质。

目前的动物实验表明，P4501A1的表达与多环芳烃受体（AhR ）和芳烃受体核转运蛋白（AhR Nuclear Translocator ）的激动剂，以及上游刺激因子1（Upstream Stimulatory Factor1，USF1）的拮抗剂有关。

蛋白及其3个缺失突变体的表达与热稳定性分析

D iscussi o nNAC p r otein fa mily is highly conserved fr o m p ri mary eukary ote to hu man .Most of NAC family p r oteins exist in the for m of a di m er which consist of t w o si milar subunit αand β.Mean while,α2NAC and β2NAC both have a “NAC do 2main ”.But α2NAC had a “UBA do main ”in the C end whileβ2NAC didn ’t have [4].So we infered that Peat1may bel ong to α2NAC .So me researches have sho wn that the main func 2tions of NAC p r otein were as foll o ws:①NAC co mpeted with SRP for co mbinati on with the pep tide which just synthesis on the ribos o mes in order t o av oid p r otein sequences which fold incorrectly and lack of signal pep tide were trans ported t o en 2dop las mic reticulu m me mbrane [5-6].②NAC can co mbine with DNA.It als o inv olved in the p r ocess of certain DNAtranscrip tion as a necessary fact or [7-9].③NAC can co mbinewith translation initiation fact or [10].All these sho wed that NAC p r otein may be a kind of p r otein elicit ors .It has an i m 2portant function on p r o moti on of p lant gr o wth and disease re 2sistance .All 3mutants constructed in this research have g ood ther mal stability like the original Peat1p r otein .Therefore,the coexistence of NAC or UBA do mains is not necessary to ther mal stability of Peat1p r otein .A s t o whether the mutants still have the elicit ors ’functi on,p r o mote p lants gr o wth and resist disease needed to be further studied .R efe rence s[1]Q I U D W .Multifuncti on fungal pr otein f or plant .China,Z L01128666[P].2004-03-17.(in Chinese ).[2]Q I U D W.M icr obe pr otein pesticide and it ’s pr os pect [J ].Chinese Jour 2nal of B i ol ogical Contr ol,2004,20(2):91-94.(in Chinese ).[3]Z HAO MZ,Y ANG XF,Z HANGM,et al .Purificati on and bi oactivities of apr otein gr o wth 2activat or fr o m A lter naria tenuissi m a [J ].Chinese Journal of Bi ol ogical Contr ol,2007,23(2):170-173.(in Chinese ).[4]SPRETER T,PECH M,BE AT R I X B.The crystal structure of archaealnascent poly peptide 2ass ociated co mplex (NAC )reveals a unique f old and the presence of a ubiquitin 2ass ociated do main[J ].The Journal of Bi ol ogi 2cal Che mistry,2005,280(16):15849-15854.[5]P O WERS T,WALTER P .The nascent poly peptide 2ass ociated co mplexmodulates interacti ons bet w een the signal recogniti on particle and the ri 2bos o me[C ].Research Paper Current Bi ol ogy,1996,6(3):331-338.[6]GE ORGE R,WALS HB P,BE DDOE B T,et al .The nascent poly peptide 2ass ociated co mplex (NAC )pr o motes interacti on of ribos o meswith the mi 2t ochondrial surface in viv o[J ].Febs Letters,2002,516:213-216.[7]WH I T BYMC,D I X ON J .Fissi on yeast nascent poly peptide 2ass ociated co m 2plex binds t o f our 2way DNA juncti ons[J ].J Mol B i ol,2001,306:703-716.[8]AK HOUAY R I O,QUE LO I,ST 2ARNAUD R .Sequence 2s pecific DNAbinding by the NAC coactivat or is required f or potentiati on of c 2jun 2de 2pendent transcri pti on of the osteocalcin gene[J ].Molecular and Cellular Bi ol ogy,2005,25(9):3452-3460.[9]Y OT OV WV,MORE AU A,ST 2ARNAUD R .The al pha chain of the nas 2cent poly peptide 2ass ociated co mplex functi ons as a transcri pti onal coacti 2vat or[J ].Molecular and Cellular Bi ol ogy,1998,18(3):1303-1311.[10]M I G UE L AF .Translati on initiati on fact or (is o )4E interacts with BTF3,the βsubunit of the nascent poly peptide 2ass ociated co mplex [J ].Gene ,2005,345:271-277.Peat1蛋白及其3个缺失突变体的表达与热稳定性分析李明勇3,邱德文,曾洪梅,杨秀芬　(中国农业科学院植物保护研究所,北京100081)基金项目　“973”项目(2003CB114204);北京市科技计划(D0*******40431)。

2-蛋白质序列特征分析-生物信息学

其网址为： /software/TMPRED_form.html
TMPRED在线网页
生命科学学院
用TMPRED分析P51684序列所得到生的命可科能学学院的7个跨膜螺旋区
生命科学学院
用TMPRED分析P51684序列所得到的7个可能的跨膜螺旋区的相关性列表
含有卷曲螺旋结构最知名的蛋白质有原癌蛋白（oncoprotein）c-fos和jun，以及原肌球蛋白（tropomyosin）。
生命科学学院
利用COILS分析蛋白质的卷曲螺旋
COILS是由Swiss EMBNet维护的预测卷曲螺旋的在线工具，该软件是基于Lupas算法，将查询序列在一个由已知包含卷曲螺旋蛋白结构的数据库中进行搜索，同时也将查询序列与包含球状蛋白序列的PDB次级库进行比较，并根据两个库搜索得分决定查询序列形成卷曲螺旋的概率。 COILS也可以下载到本地进行运算。
生命科学学院
序列特征分析
Analysis of Sequence Characterristics
一、蛋白质结构蛋白质的一级结构
生命科学学院
蛋白质的一级结构决定二级结构蛋白质的二级结构决定三级结构
蛋白质的二级结构
生命科学学院
H表示螺旋 E表示折叠 B表示β桥 G表示3-螺旋 I表示π螺旋 T表示氢键转角 S代表转向
或者全部由碳原子和氢原子组成，因此这类氨基酸不太可能与水分子形成氢键； 2. 极性氨基酸（polar amino acid），其测链通常由氧原子或氮原子组成，它们比较容易与水分子形成氢键，因此也称为亲水氨基酸； 3. 带电氨基酸（charged amino acids），这类氨基酸在生物 pH环境中带有正电或负电。
生命科学学院

激活蛋白-1 在妇科疾病中的研究进展

0 引言
激活蛋白 -1(Activator protein-1, AP-1) 于八十年代由美国科学家 Lee 等 [1] 首次发现，并被鉴定为转录因子。目前研究发现，AP-1 是由碱性亮氨酸拉链 (basic leucine- zipper, bZIP) 结构的 Jun 蛋白质 (c-Jun、v-Jun、JunB 和 JunD)、Fos 蛋白质 (c-Fos、 v-Fos、FosB、Fral 和 Fra2)、激活转录因子 (activating transcription factor,ATF, 包括 ATF2、ATF3/LRF1、B-ATF、JDP1 和 JDP2) 和肌肉腱膜纤维肉瘤 (musculoaponeurotic fibrosarcoma, MAF，包括 C-Maf、MafB、MafA、MafG/F/K 和 Nrl) 家族形成高度保守的同源或异源二聚体，可激活下游靶基因的转录 [2]。
ABSTRACT: Activator protein-1 (AP-1) is one of the earliest transcription factors in mammals.Ap-1 belong to a multi-gene family, and its activity is regulated at various levels. Meanwhile, Ap-1, as an important nuclear transcription regulator, is involved in physiological processes such as cell proliferation, differentiation and apoptosis.Activated Ap-1 can be involved in the occurrence and development of multi-organ and multi-system diseases, such as malignant tumors.In recent years, breakthroughs have been made in the research on Ap-1, but there are relatively few studies on the diseases related to obstetrics and gynecology.This paper reviews the research of Ap-1 in gynecological diseases. KEY WORDS: Activator protein-1; c-Jun; c-Fos; Gynecological cancer; Endometriosis; Uterine myoma

人SIRT1基因启动子及蛋白的生物信息学分析

激光生物学报ACTA　LASER　BIOLOGY　SINICAVol. 32 No. 4Aug . 2023第32卷第4期2023年8月收稿日期：2023-04-18；修回日期：2023-05-11。

基金项目：国家自然科学基金项目（31670178）；湖南省自然科学基金项目（2021JJ 30918）。

作者简介：王道，主管技师，主要从事女性生殖系统疾病的基础研究。

* 通信作者：宋甜，助理研究员，主要从事衣原体感染疾病的诊断研究。

E-mail:****************.cn 。

人SIRT1基因启动子及蛋白的生物信息学分析王　道1，陈建林1，刘文彬2，刘　丹1，宋　甜1*（1. 中南大学湘雅二医院妇产科，长沙 410011；2. 湖南师范大学生命科学学院，长沙 410081）摘　要：为深入分析人SIRT1基因启动子及蛋白的结构和功能，本文采用生物信息学方法分析人SIRT1基因5′端启动子、启动子区Motif 、转录因子结合位点、甲基化CpG 岛、单核苷酸多态性、进化关系、理化性质、二级和三级结构、保守结构域、突变和翻译后修饰位点、互作蛋白及生物学功能。

TSSW 和Neural Network Promoter Prediction 数据库预测其区间分别存在3个、2个启动子。

MEME 数据库预测启动子区存在3个Motif 。

EMBOSS 、MethPrimer 和CpG Finder 数据库都发现CpG 岛聚集分布于1 600 ～ 2 200 bp 区。

PROMO 和AliBaba 2.1数据库预测其启动子区域共同转录因子为22个。

JASPAR 软件获得6个与正负链相结合的转录因子。

SNP Function Prediction 数据库还发现不同种族等位基因频率存在差异。

人SIRT1基因位于染色体10q 21.3上，广泛分布在不同组织中。

人SIRT 1蛋白由747个氨基酸组成，属于亲水、不稳定的蛋白质，在不同物种间具有较高的保守性。

极细链格孢菌激活蛋白PeaT1结构域分析与功能研究的开题报告

极细链格孢菌激活蛋白PeaT1结构域分析与功能研究的开
题报告
一、研究背景
极细链格孢菌（Streptomyces cinnamoneus）是一种广泛存在于自然环境中、具有代表性的高产抗生素细菌之一，因其在发酵过程中可产生丰富的次级代谢产物而备受研究者关注。

而构成极细链格孢菌生物合成次级代谢产物工具包的激活蛋白则是该细菌次级代谢物合成的起点之一。

PeaT1是极细链格孢菌中一个RNA聚合酶激活蛋白，通过结合RNA聚合酶和DNA，在次级代谢物的生物合成过程中起到关键作用。

研究表明，PeaT1结构与功能的研究可以为次级代谢物的生物合成提供重要的理论支持和实践指导。

二、研究目的
本研究旨在通过对PeaT1结构域的分析和功能研究，探究其对次级代谢物生物合成的作用机制，为进一步探究PeaT1的作用提供理论依据和实践指导。

三、研究内容和方法
1. PeaT1的生物学与生物化学性质的鉴定
通过PCR扩增和基因组定位方法获得PeaT1基因，利用蛋白质组学方法对PeaT1进行鉴定和分析，探究其生物学和生物化学性质。

2. PeaT1结构域分析
利用生物信息学方法对PeaT1结构域进行分析，探究PeaT1结构域中的保守结构域、功能域及其在生物合成过程中的作用。

3. PeaT1功能研究
通过分子生物学手段构建PeaT1突变体，并对其在次级代谢物生物合成过程中的作用进行分析，探究PeaT1的作用机制，为次级代谢物合成提供实践指导。

四、研究意义
本研究通过对PeaT1结构域的分析和功能研究，可以为探究细菌次级代谢产物的生物合成提供重要的理论基础和实践指导。

同时，该研究可以为开发和应用极细链格孢菌生产抗生素等重要药物等产业提供支持。

生物信息学讲义--清华大学

（Cartesian coordinate），即给定每个原子核的 x，y，z 坐标。但是由于蛋白质结构中化学键的存在，不同原子的笛卡尔坐标往往不是相互独立的。比如肽键连接的原子 C 和 N，其空间距离通常在 1.3 埃左右。因此实际相互独立的坐标个数通常远小于笛卡尔坐标的个数（3N，N 为原子个数）。在蛋白质结构中常常采用的是另一种坐标：内坐标（Internal coordinate）。在内坐标描述中，如果前三个原子（用 1, 2, 3 表示）的位置确定，那么确定第四个原子的位置只需要知道原子对 3-4 间的距离、原子组 2-3-4 间的夹角、以及原子组 1-2-3-4 间的二面角。例如，参与肽键的四个原子分别为 Cα，C，N 和 Cα（下一个残基），确定下一个残基 Cα 的位置时只需要知道 N-Cα 的键长，C-N-Cα 的键角，和 Cα-C-N-Cα 的二面角。前两项（键长和键角）在蛋白质结构中基本上是固定不变的，只有第三项（二面角）可以采取 0 度（顺式）或 180 度（反式）两种取值。在此例中，使用内坐标描述会大大减少结构描述的复杂度，即只使用 0 度或 180 度即可描述肽键的顺式和反式结构。在实际应用中，笛卡尔坐标和内坐标是一一对应的，对特定的分子结构，已知笛卡尔坐标可以计算出内坐标，而已知内坐标也可以得到笛卡尔坐标。值得注意的是，在研究分子结构时使用内坐标会大大降低坐标描述的复杂度。以含 100 个残基的肽链为例，要完整描述肽键的主链，通常需要知道每个残基中至少五种重原子（N、O、C、Cα 和 Cβ）的位置。使用笛卡尔坐标时，由于每个重原子有 x，y，z 三个坐标，因此共需要 1500 个坐标变量来描述蛋白质的主链结构。如果使用内坐标，由于化学键的键长和键角基本不变，且可以从模型分子结构（如氨基酸结构）推知，因此只需要提供变化的变量（二面角）即可。二面角主要描述四个原子在绕连接中间两个原子的化学键旋转时的位置变化，比如，肽键中 Cα-C-N-Cα 的二面角指绕肽键（C-N）旋转的角度。在蛋白质的主链结构中只有 N-Cα 和 Cα-C 这两条化学键是可以自由旋转的 σ 键，而绕这两条化学键旋转的二面角就是通常描述蛋白质主链的扭角（torsion angle）φ 和 ψ。因此每个残基只需要两个变量描述。即使考虑到肽键的顺式和反式构象，加入一个辅助二面角 ω 来表示这种区别，每个残基也只需要不超过三个变量描述。对 100 个残基的肽链，只需要不超过 300 个变量即可准确地描述其主链构象。对比使用笛卡尔坐标时需要的 1500 维坐标，内坐标系可以有效地简化坐标描述，极大地降低坐标描述的维度。从另一个角度看，蛋白质构象主要反映在不破坏化学键的条件下蛋白质结构的变化。因此，在研究构象时，可以忽略化学键的键长和键角的改变。对比蛋白质的不同构象可以发现，构象的变化主要是由于某些可以自由旋转的化学键的转动引发的。绕这些化学键旋转的二面角包括前面所讲的主链的 φ 和 ψ 角，以及侧链的 χ 角。如果已知这些自由旋转的二面角的值，那么蛋白质的三维构象也就基本确定了。因此，我们会在下述部分中详细讲述蛋白质结构中重要的二面角及相关知识。

t-pa基因-概述说明以及解释

t-pa基因-概述说明以及解释1.引言1.1 概述概述部分的内容：引言中的概述部分旨在介绍T-PA基因的背景和相关信息。

T-PA基因，全称为组织型纤溶酶原激活剂基因（tissue-type plasminogen activator gene），是编码相关蛋白质的基因。

该基因编码的蛋白质被称为t-PA，是一种能够将纤溶酶原激活为纤溶酶，参与并调节血液凝固与溶解的重要因子。

随着生物医学研究的深入，人们对T-PA基因的发现、结构、功能以及在疾病中的作用越来越感兴趣。

T-PA基因被广泛研究，通过了解这一基因的特点和功能，可以更好地理解其在血栓溶解、血管新生和其他疾病中的作用机制。

本文将分为引言、正文和结论三个部分。

引言部分将简要介绍T-PA 基因的概念、文章的结构以及研究目的。

正文将详细探讨T-PA基因的发现与作用、结构与功能，以及其在疾病中的作用。

结论部分将总结T-PA 基因的研究意义和应用前景。

通过深入研究T-PA基因，我们能够更好地认识和理解其在生物学和医学领域中的重要性，为相关疾病的预防、诊断和治疗提供更有效的策略和方法。

同时，我们也能够探索其在生物技术和药物研发方面的广阔应用前景。

本文旨在全面介绍T-PA基因及其相关领域研究的进展，为读者提供一个全面了解和掌握该基因的机会。

文章结构是指整篇文章的组织框架和布局方式。

一个良好的文章结构可以使读者更容易理解文章的内容和逻辑关系。

本文的文章结构如下：一、引言1.1 概述：介绍有关T-PA基因的背景和意义，以及其在医学及遗传学领域的重要性。

1.2 文章结构：本部分，将详细介绍文章的整体结构和各个章节的内容。

1.3 目的：说明本文的研究目的和意义。

二、正文2.1 T-PA基因的发现与作用：介绍T-PA基因的发现历程，以及其在机体内的作用机制。

2.2 T-PA基因的结构与功能：探讨T-PA基因的基因序列、氨基酸序列及其所编码的蛋白质的功能。

2.3 T-PA基因在疾病中的作用：详细描述T-PA基因在某些疾病中的变异与突变对相应疾病的影响及作用机制。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

激活蛋白PEAt1的生物信息学分析尹富仕张丽勍王垚张薇CAAS08S3 group2中国农业科学院植保所药物工程室激活蛋激活蛋白（Activator）•该蛋白是从多种不同种属的植物病原真菌中筛选、分离、纯化出的一系列蛋白激发子（邱德文，2002）。

•该类蛋白有较强的诱导植物抗病，增产，抗逆，促进植物生长的生物活性，提高作物产量，理化特性上该类蛋白都有很好的热稳定性。

几类蛋白激发子对比情况蛋白激发子类型主要生物来源专利情况分子量过敏反应（烟草寄主）热稳定性隐地蛋白卵菌法国专利10~15kD （Cryptogein ）（P. cryptogea ）1985年1015kD 或有或无无报道过敏蛋白细菌美国专利30~40kD （Harpin ）（E. amylovora ）1992年30~40kD 有高激活蛋白真菌中国专利30~70kD （Activitor ）（A. alternaria ）2000年3070kD 无很高激活蛋白的作用机理•激活蛋白通过激活植物体内的免疫系统而达到抗病防虫和抗逆的目的。

•激活蛋白通过激活植物的代谢系统而使植物生长加快，活力增强。

脯氨酸含量的增加和纤维素酶的加强，植物细胞增长，根系的活力加强，达到增产目的。

（Activator）激活蛋白•激活蛋白可湿性粉剂已经商业化生产，大田推广中取得了良好的效果，具有广泛的应用前景。

激活蛋白诱导处理种子能加快黄瓜种子的萌发，促进幼根的生长；提高多种瓜果蔬菜的座果率，如处理西瓜和番茄可使瓜果数和果重显著提高，分别达到77.4%和45.7%；，对白菜有显著的抗病增产作用，同时能大幅度提高白菜的品质（邱德文等，2005），同时，研究还发现该蛋白制剂能够成倍地提高Bt 对鳞翅目害虫的防治效果，增效达18.5倍(邱德文，曾凡荣等，2005)。

研究背景Peat1蛋白是一种从极细链格孢菌中分离得到的蛋白激发子（p，）。

经验protein elicitor from Alternaria tenuissima PEAt1证，该蛋白具有耐热的特性，能诱导植物产生系统抗性，促进植物生长，改善作物品质，可发展为新型的多功能生物农药。

目前，该蛋白已申报中国发明专利，其有关基因已在GenBank登录（CH445335）。

分析目的•用生物信息学的方法分析PEAt1的结构•探讨PEAt1结构与功能的关系•分析与探究PEAt1耐热，抗病，促生长的分子机制•以PEAt1蛋白为例，练习和巩固有关生物信息学数据库和软件的使用，希望对大家分析自己研究中遇到类似的实际问题有所启发。

研究路线1.氨基酸的理化性质初步分析22.膜蛋白的跨膜区预测3.蛋白质序列的二级结构4.蛋白质序列的结构域预测5.蛋白质序列的三级结构预测/同源建模66.总结与讨论PEAt1结构与功能的关系1. 氨基酸的理化性质分析2. 蛋白质的亚细胞定位3. 膜蛋白的跨膜区预测4. 蛋白质序列的二级结构预测5. 蛋白质序列的三级结构预测PEAt1蛋白的生物信息学分析pEAt1基因序列（共624bp）ATGGCCAACCCCCGCATTGAAGAGCTCCCCGACGAGCCCGAGAAGAAGAACGTCCAGATCGAGGAGGATGAGTCCAGCGACGAGTCTGAGGGCGAGGAGGGCGAGGTCAGCGTACCCGCGGGCTCCTCCGTCGCTGTCCACTCCCGCAACGAGAAGAAGGCTCGCAAGGCCATCGCCAAGCTCGGCCTGAAGCACATCGACGGCATCACACGCGTCACCCTCCGCCG C CGCC GC CGGCC G GC C CG CGGC C C CGCG C CCC CCGCCGACCCAAGAACATCCTCTTTGTCATCAACCAGCCCGACGTCTACAAGTCCCCTTCAAGCAACACCTGGATCATCTTCGGTGAGGCCAAGATCGAGGACCTCAACTCCCAGGCTCAGGCTTCCGCCGCCCAGCAGCTTGCTCAGGCCGAGGCCGCATCCCACGACCACGCCGGCCACGACCACGGCGACGAGGCCAGCAAGGGCAAGGGCAAGGCTGTCGAGGACAAGAAGGACGAGGAGGAGGAGGATGACGATGAGGAGATTGACGACTCTGGCCTTGAGGCCAAGGACATCGAGCTCGTCATGCAGCAGGCCAGCGTTTCGCGGAAGAAGGCCGTCAAGGCCCTCAAGGAGAACGATAACGATATAGTCAACTCCATCATGGCGCTGAGCATATAGPEAt1蛋白序列（207aa）MANPRIEELPDEPEKKNVQIEEDESSDESEGEEGEVSVPAGSSVAVHSRNEKKARKAIAKL GLKHIDGITRVTLRRPKNILFVINQPDVYKSPSSNTWIIFGEAKIEDLNSQAQASAAQQLAQA EAASHDHAGHDHGDEASKGKGKAVEDKKDEEEEDDDEEIDDSGLEAKDIELVMQQASVSR KKAVKALKENDNDIVNSIMALSIPEAt1序列的初步分析¾Molecular weight = 22632.80¾Residues 207Residues=207¾Average Residue Weight = 109.337 ¾Charge = -16.0Ch160¾Isoelectric Point = 4.4305¾A280 Molar Extinction Coefficient = 6970¾A280 Extinction Coefficient 1mg/ml 0.31 A280Extinction Coefficient1mg/ml=0.31Property Residues Number Mole% Tiny (A+C+G+S+T) 56 27.053 S(C G S V)Small (A+B+C+D+G+N+P+S+T+V) 105 50.725 Aliphatic (A+I+L+V) 62 29.952 Aromatic (F+H+W+Y) 10 4.831 i()Non-polar (A+C+F+G+I+L+M+P+V+W+Y) 87 42.029 Polar (D+E+H+K+N+Q+R+S+T+Z) 120 57.971 Charged (B D E H K R Z) 79 38.164 Charged(B+D+E+H+K+R+Z)7938.164 Basic (H+K+R) 33 15.942 Acidic (B+D+E+Z) 46 22.222Self alignment of PEAt1141155169184所用软件: Vector NTI Advance 10软99113127件包的Dot Matrix 参数: stringency 20; window 2457718511733496581971131291451611771841152943从上图可看出PEAt1氨基酸序列的1-35残基同129-163残基具有显著相似性，极性特别是酸性氨基酸出现的频率很高。

推测这两段序列可能以某种方式出现蛋白表面，构成富含负电荷的亲水侧。

进一步分析：这两段序列的一致性为22.2％，相似性为33.3％跨膜区预测TMHMM20¾PEAt1TMHMM2.0¾# Sequence Length: 207#Sequence Number of predicted TMHs:0¾# Sequence Number of predicted TMHs: 0¾# Sequence Exp number of AAs in TMHs: 0.00038¾# Sequence Exp number, first 60 AAs: 4e-05¾# Sequence Total prob of N-in: 0.03326¾Sequence TMHMM2.0outside 1-207does it contain transmembrane segments?•Report_format: seqtable# Report_file: peat1.tmap#Report file:peat1tmap#====================================# Sequence: Peat1 from: 1 to: 207#Sequence:Peat1from:1to:207# HitCount: 0#====================================Start End TransMem SequenceSignalP 3.0 Server -prediction results信号肽预测SignalP-NN(neural networks )result:>seq1length =70seq1 length 70Measure Position Value Cutoff signal peptide?max. C 32 0.060 0.32 NOmax. Y 32 0.018 0.33 NOmax. S 1 0.016 0.87 NOmean S 1310009048NOmean S 1-31 0.009 0.48 NO D 1-31 0.014 0.43 NODoes it contain coiled-coils?NCOILS version 1.0using MTIDK matrix, weights: a,d=2.5 and b,c,e,f,g=1.0ÎSecondary Structure PredictionSecondary Structure Prediction•PROFsec summaryoverall your protein can be classified as:>>> mixed <<<given the following classes:given the following classes:\all-alpha\: %H > 45% AND %E < 5%\all-beta\: %H < 5% AND %E > 45%\alpha-beta\: %H > 30% AND %E > 20%\mixed\: all others\mixed\:all othersPredicted secondary structure composition:+---------------+-------+-------+------+| sec str type | H | E | L || % in protein | 29.5 | 10.6 | 59.9 |+---------------+-------+-------+-------+Predicted solvent accessibility composition (core/surface ratio):Classes used:e: residues exposed with more than 16% of their surfaceb: all other residues.+--------------+-------+-------+| acc type | b | e || % in protein | 22.2 | 77.8 |+--------------+-------+-------+++++HNN-Hierarchical Neural Network method HNN Hierarchical Neural Network methodÎSequence Database searchingPeat1 Sequence Database searchingz基因序列的同源比对发现与NAC蛋白高度同源：Identities = 426/516 (82%)z NAC编码基因的102-614位序列与PEAt1的108-623位序列相匹配，有82%的一致性z蛋白序列比对发现与NAC蛋白家族结构域NAC和EGD2（UBA）有高度同源。