生物信息学课程论文.doc

  • 格式:docx
  • 大小:304.53 KB
  • 文档页数:12

下载文档原格式

  / 12
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

番茄WRKY26基因的生物信息学分析

摘要:番茄(Lyeopersicon 1)是世界上重要的蔬菜作物之一,已

经成为蔬菜基因工程研究的模式植物之一。由于环境污染,气候条件不断恶化,使地球上的生物生存环境遭受到越来越严重的危害,因此番茄非生物抗逆性改良的研究工作就更显得迫切和重要。已有研究证明WRKY转录因子可参与多种植物抗性反应,WRKY26基因存在于番茄中,其编码的WRKY26转录因子对番茄抗旱性有重要调控作用,研究其生物学功能显得尤为重要。本文采用生物信息学的方法对已在GenBank 上登录的番茄WRKY26基因的核酸及氨基酸序列、组成成分、同源性比对、编码蛋白质的理化性质、信号肽、跨膜结构域、亲、疏水性、蛋白质结构及功能域等进行预测和推断。结果表明:该基因的ORF长度为1608bp 且与马铃薯STWRKY8同源性很高,该基因编码的蛋白质分子量为分子量为59624.9,等电点为6.87,为酸性疏水性蛋白质,且不稳定。该蛋白质无信号肽和跨膜结构域,属于非分泌蛋白质。蛋白质结构表明该蛋白主要为β转角和无规则卷曲,没有α螺旋。通过此次研究,希望为今后深入研究该类基因的功能和结构特征提供依据。

关键词:番茄;WRKY26基因;蛋白质功能;同源性

前言

番茄基因组中,数目众多的转录因子参与植物的生长发育、物质代谢、响应

生物和非生物胁迫等多种生物进程。WRKY基因家族是植物重要的转录因子家族,

在抗病信号转导途径中起重要调控作用,因而成为分子植物病理研究领域中的热

点。WRKY转录因子是一类植物所特有的抗逆相关转录因子超家族,在植物生物、

非生物胁迫[1]以及植物的生长发育和多种代谢途[2]的调控中起重要作用。

近年来的研究发现,转录因子和抗逆基因会对环境胁迫作出响应。一个抗逆

基因的超表达只能提高植物单一抗性,而一个转录因子基因的超表达能够激活多

个下游抗逆基因的表达,从而提高植物综合抗逆能力。所以与单抗基因相比,转录

因子已成为作物改良的研究热点。尤其是WRKY转录因子,因其可显著地调控植

物生物和非生物胁迫,更是备受关注[3]。WRKY家族中的大部分成员受到水杨酸(SA)、NaCl、低温等刺激后会诱导表达[4-6]。Q iu等[7]发现OsWRKY45可在病原菌的诱导下表达,并提高转基因拟南芥的抗病性,说明WRKY基因还具有潜在的抗病能力。现已证明WRKY可参与多种植物抗病反应[8]。番茄作为重要的模式植物周年生产中常受到高盐、低温、病原菌的影响,其遗传改良越来越受到重视[9]。所以研究WRKY26基因的生物信息学功能显得尤为重要,可以为转基因番茄等其他遗传操作提供技术储备。

一.基因的查找,在NCBI中查找基因序列

mRNA sequence

>gi|723709376|ref|XM_004241707.2| PREDICTED: Solanum lycopersicum probable WRKY

transcription factor 26 (LOC101255501), mRNA

GTATCTTCTTTCTTTTAATGGCTGCTTCAAGTTTCTCTTTTCCCACTTCATCTTCTTCATTCATGACGACTTCTTT CACCGACCTTCTTGCTTCTGATGATTATCCAACCAAAGGACTTGCTGATAGAATTGCAGAGAGGACTGGTTCTGGA GTTCCTAAATTCAAATCTCTTCCACCTCCTTCACTTCCATTATCGCCTCCTCCTTTTTCGCCTTCCTCTTACTTTG CTATTCCTCCTGGTTTAAGTCCAACTGAACTTTTAGACTCCCCTGTTCTTTTGTCTTCTTCAAACCTTCTTCCATC TCCGACGACTGGGAGTTTTCCATCTCGTGCTTTTAATTGGAAGAGCAGTAGTCATCAGGATGTGAAACAGGAAGAC AAAAACTACTCAGATTTTTCTTTCCAGCCTCAAGTAGGGACAGCTGCATCATCAATCTCTCAATCTCAAACTAACC ATGTCCCTCTGGGGCAGCAAGCATGGAATTGTCAAGAGCCCACAAAACAGAATGATCAAAATGCTAATGGAAGATC CGAATTCAACACTGTACAGAATTTTATGCAGAATAATAATGATCAGAACAATAGTGGAAACCAATACAATCAGAGT ATAAGGGAGCAGAAAAGGTCAGATGACGGATACAATTGGAGGAAATACGGGCAGAAACAAGTAAAAGGTAGTGAAA ATCCGAGAAGCTACTACAAGTGTACATACCCAAATTGTCCCACCAAGAAGAAGGTTGAGAGATCTTTAGATGGTCA AATTACTGAAATTGTGTACAAGGGTAATCACAACCATCCAAAGCCTCAGTCTACCAGAAGATCGTCATCATCCACA GCTTCATCTGCATTCCAATCTTACAATACACAAACTAATGAAATTCCAGATCATCAATCCTATGGTTCAAATGGAC AAATGGATTCCGTTGCAACACCTGAGAATTCTTCGATTTCATTTGGGGATGATGATCATGAACACACTTCTCAAAA GAGTAGTAGGTCAAGAGGAGATGATCTTGATGAAGAGGAACCAGACTCAAAAAGATGGAAAAGAGAAAACGAAAGT GAAGGTGTATCTGCACTAGGAGGGAGTAGGACAGTTAGAGAACCTAGAGTTGTAGTTCAAACTACGAGTGACATCG ATATCCTAGATGATGGTTATAGATGGAGGAAGTATGGTCAAAAAGTAGTGAAAGGAAATCCTAATCCCAGGAGCTA CTACAAATGCACAAGTACGGGATGTCCAGTAAGAAAACATGTGGAAAGGGCATCACAAGACATAAGGTCAGTGATA ACAACCTATGAAGGGAAGCACAACCATGATGTTCCAGCAGCAAGGGGCAGTGGCAACCACTCAATTAACCGACCTA TGGCACCGACCATAAGGCCTACTGTGACATCTCATCAATCCAACTATCAAGTTCCATTACAAAGTATAAGGCCACA ACAGTCTGAAATGGGAGCACCCTTTACACTAGAGATGTTGCAGAAGCCTAATAATTATGGTTTCTCAGGATATGCA AATTCAGGGGATTCATATGAAAACCAAGTTCAGGACAATAATGTGTTTTCGAGAACTAAGGACGAGCCTCGAGATG ACTTGTTTATGGAGTCATTGCTTTGCTGAAACTGGAATCCTAGAAAGGAGCACGAATTGAAGTTTATGAAACGAAA AACTGAACCTTTTATTTATTTATTTTTGCATAAAGAATATGATAGGAAGCATTTTGATTTCATTTGTTAATAGATC ATATACTGTTTTTTTTTTTGGTGTGTGTACATTTTGTACTAGGAAATTTGTTTGTTGTAAATTCAATCAAATGCGG TGTAGATGTTCATGCAGTTACCACTGTTATGGGGGTTATATAATTTAGGATAGGAATGTAAATCCCCAACTCATGA CTATATGACACTGATTCTTTATTTCTATCACATTTTCAAGTTTTATATATTAAAGAAGATTGCAGTTTTTCAA Protein sequence

>gi|460392301|ref|XP_004241755.1| PREDICTED: probable WRKY transcription factor 26 [Solanum lycopersicum] MAASSFSFPTSSSSFMTTSFTDLLASDDYPTKGLADRIAERTGSGVPKFKSLPPPSLPLSPPPFSPSSYFAIPPGL SPTELLDSPVLLSSSNLLPSPTTGSFPSRAFNWKSSSHQDVKQEDKNYSDFSFQPQVGTAASSISQSQTNHVPLGQ QAWNCQEPTKQNDQNANGRSEFNTVQNFMQNNNDQNNSGNQYNQSIREQKRSDDGYNWRKYGQKQVKGSENPRSYY KCTYPNCPTKKKVERSLDGQITEIVYKGNHNHPKPQSTRRSSSSTASSAFQSYNTQTNEIPDHQSYGSNGQMDSVA TPENSSISFGDDDHEHTSQKSSRSRGDDLDEEEPDSKRWKRENESEGVSALGGSRTVREPRVVVQTTSDIDILDDG YRWRKYGQKVVKGNPNPRSYYKCTSTGCPVRKHVERASQDIRSVITTYEGKHNHDVPAARGSGNHSINRPMAPTIR PTVTSHQSNYQVPLQSIRPQQSEMGAPFTLEMLQKPNNYGFSGYANSGDSYENQVQDNNVFSRTKDEPRDDLFMES LLC

二.开放阅读框(ORF)的查找

开放阅读框(Open Reading Frame, ORF)是基因序列中的一段无终止序列打断的碱基序列,可编码相应的蛋白。在没有其它信息的前提下,DNA序列可能按六种框架阅读和翻译(每条链三种,对应三种不同的起始位点)。ORF识别包括检测这六个阅读框架并决定哪一个包含以启动子和终止子为界限的DNA序列而其内部不包含启动子或终止子,符合这些条件的序列有可能对应一个真正的单一