密码子偏好性分析
- 格式:ppt
- 大小:1.05 MB
- 文档页数:28
兰科植物FNR基因的密码子偏好性分析作者:李蓉谢析颖王雪晶苏立遥林玉玲郭容芳陈裕坤赖钟雄徐涵来源:《热带作物学报》2018年第06期摘要为揭示兰科植物FNR基因的特性和密码子偏好性,采用DNAMAN、CodonW和SPSS软件及 EMBOSS、SWISS-MODEL在线网站对17种兰科植物的FNR基因序列、氨基酸序列、同源区域及蛋白质三维结构进行分析。
结果表明:兰科植物FNR基因普遍具有在A/T (U)与G/C之间较弱的密码子偏好性;密码子的末位在A和T(U)之间存在显著的T (U)偏好性,在C和G之间存在显著的C偏好性;NADP结合域比非结合域有较小的密码子偏好性;基于CDS和氨基酸聚类结果比基于RSCU聚类更接近于植物的进化分类;自然选择的作用是导致兰科植物FNR基因的密码子使用偏好性的主要成因。
关键词兰科;FNR基因;密码子偏好性中图分类号 S682.31 文献标识码 ACodon Usage Bias of Ferredoxin-NADP+ Oxidoreductase (FNR)in OrchidaceaeLI Rong1, XIE Xiying1, WANG Xuejing1, SU Liyao1, LIN Yuling1, GUO Rongfang1,CHEN Yukun1, LAI Zhongxiong1*, XUHAN Xu1,2*1 Institute of Horticulture of Biotechnology, Fujian Agriculture and Forestry University,Fuzhou, Fujian 350002, China2 Institut de la Recherche Interdisciplinaire de Toulouse, Toulouse 313008, FranceAbstract For a good understanding of the codon usage bias of ferredoxin-NADP+ oxidoreductase (FNR) in Orchidaceae, the gene sequence, amino acid sequence, homologous region and three-dimensional protein structure of 17 FNR genes in Orchidaceae were analyzed by DNAMAN,CodonW, SPSS softwares, and EMBOSS, SWISS-MODEL online programs. The results showed that there was a low-level codon usage bias in FNR genes between A/T(U) and G/C;there existed a significant T(U) bias between A and T(U) and a significant C bias between C and G in the codons; NADP binding domain showed less codon bias than that of the non-binding domain; the cluster tree based on coding sequence (CDS) as well as amino acid sequences matched better with the plant evolution classification; the codon usage bias of FNR was mainly influenced by the natural selection in Orchidaceae.Key words orchidaceae; FNR gene; codon usage biasdoi 10.3969/j.issn.1000-2561.2018.06.015基因表达是细胞在生命活动过程中将储存在DNA双链中的遗传信息转录、翻译为具有生物活性的蛋白质的过程。
研究密码子偏好性常用的参数1、相对同义密码子使用度(Relativ e Synonymous Codon Usage, RSCU )是指对于某一特定的密码子在编码对应氨基酸的同义密码子间的相对概率,它去除了氨基酸组成对密码子使用的影响。
如果密码子的使用没有偏好性,该密码子的RSCU值等于1,当某一密码子的RSCU值大于1时,代表该密码子为使用相对较多的密码子,反之亦然。
第i个氨基酸的第j个密码子的相对同义密码子使用度值的计算公式如下:公式中, X ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为1~6) 。
研究中通常先利用高表达基因的RSCU值建立参考表格。
2、密码子适应指数(Codon Adaptation Index, CAI)可以根据已知高表达基因的序列来估计未知基因密码子使用的偏好性程度。
CAI的值在0~1之间, 如果越高则表明该基因的密码子使用偏好性越强。
CAI 值一般用来预测种内基因的表达水平( 但目前的研究发现对于单细胞生物比较适用, 而在哺乳动物中并不能用来表示基因表达水平), 又可以用来预测外源基因的表达水平。
w ij(The relative adaptiveness of a codon): 密码子相对适应度上式中RSCU imax、X imax分别指编码第i个氨基酸的使用频率最高的密码子的RSCU值和X值L是指基因中所使用的密码子数。
3、密码子偏好参数(Codon Preference Parameter, CPP)CPP的变化范围为0 ~ 18, 越接近18表示密码子被非随机使用的程度越高。
它对于基因编码区域总的碱基组成不敏感, 适于比较基因间或物种间密码子使用偏性的大小。
x ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为2~6, n i= 1 的情况被排除)4、有效密码子数(Effective Number of Codon, ENC)ENC值的范围在20~ 61之间, 越靠近20偏性越强。
密码子使用偏好性量化方法研究摘要在基因组学水平上研究密码子使用偏性模式、成因并分析进化过程中的选择压力在基因组学研究中有重要意义。
文章概述了目前提出的密码子使用偏性的量化方法及实现原理。
目前研究发现:有些量化密码子偏性的方法受高表达基因参考数据集未完全注释的限制,不同密码子位置对变异和选择的影响不同,以及不同密码子位置处GC 含量和嘌呤含量的贡献不同。
由此展望密码子偏性量化方法发展方向为:需要设计不需要相关参考基因集合先验知识的密码子使用偏性量化方法;考虑不同位置处背景核苷酸组成的密码子使用偏性的量化方法;同时考虑基因表达水平的密码子使用偏性量化方法。
最后,归纳了目前可用的密码子使用偏性的量化工具和数据库。
关键词同义密码子, 密码子使用偏性, 背景核苷酸, GC3, 高表达基因密码子使用偏性是指在不同物种间或同一物种内的基因翻译过程中,某些密码子的使用次数多于其它同义密码子的现象。
密码子使用偏性现象在许多物种中广泛存在。
在基因组学水平上研究密码子使用偏性模式、成因并分析进化过程中的选择压力在基因组学研究中有重要意义。
分子进化研究表明:密码子使用偏性在基因组中广泛存在,对基因组进化有极深的影响(Sharp and Matassi, 1994)。
并且密码子与氨基酸的关系影响到细胞的蛋白质组分的变化,即分子机制的变化(Xiao and Yu, 2007)。
同时,密码子使用偏性的有效衡量对相关基因功能的推断很重要。
最近的研究表明某些特殊同义密码子的使用也能影响蛋白质的折叠和错误折叠(Tsai et al., 2008;Marin, 2008)。
基因组内不同基因具有不同的密码子使用偏性,变异、选择和随机漂移是形成物种间密码子使用偏性的三个主要原因(Bulmer, 1991; Palidwor et al., 2010Supek et al., 2010 ; Shah and Gilchrist, 2011)。
密码子数据库及密码子偏好性分析软件题记:转基因研究中经常要进行基因的异源表达,在翻译过程中,受体物种对外源基因密码子的翻译效率对表达有非常大的制约。
因此,利用相应的生物信息学数据库及软件对目标序列进行受体物种的密码子偏好性分析将有助于完成对转基因效率的评价,适当选择合适的受体物种进行高效、可行的表达。
人物,阅读前,让我们感谢下列科学家,是他们为基因异源高效表达提供有价值参考。
Yasukazu Nakamura博士:The First Laboratory for Plant Gene Research,Kazusa DNA Research Institute 开发Codon Usage Database(生物密码子表的利用情况统计)。
PrimerX:编写了Codon Usage Analyzer在线密码子统计表处理软件(/cgi-bin/codon.cgi),它使得对密码子的统计用图表的形式显示出来,更加的直观可读。
Morris Maduro博士:针对E. coli开发了E. coli Codon Usage Analyze 。
目前的版本为2.1。
Thomas Schödl:开发设计的以图形形式对异源基因表达的密码子使用分析软件(Graphical codon usage analyser),用以帮助异源基因表达时对异源基因进行改造,以适应受体物种,避免由于翻译时密码子使用情况的限制使受体物种对外源基因表达产生负面影响。
内容:一:密码子使用统计数据库Codon Usage Database(.jp/codon/ 是由植物基因研究第一实验室(The First Laboratory for Plant Gene Research)Kazusa DNA Research Institute的Yasukazu Nakamura博士开发的生物密码子表的利用情况统计。
数据来源于GenBank 的DNA 序列数据库,是GenBank 的Codon Usage Tabulated 数据库在WWW模式下的扩展和整合。
菠萝叶绿体基因组密码子偏好性分析作者:杨祥燕蔡元保谭秦亮覃旭黄显雅吴密来源:《热带作物学报》2022年第03期摘要:葉绿体基因组密码子偏好性影响基因的表达效率,对于叶绿体基因工程应用及物种遗传改良具有重要的科学意义。
为了明确菠萝叶绿体基因组密码子偏好性的使用特征及主要影响因素,本研究以菠萝叶绿体基因组为研究对象,利用生物信息学软件分析其密码子的使用模式和偏好性。
密码子偏好性相关参数分析显示:(1)菠萝叶绿体基因密码子的GC含量平均值为38.31%,密码子第1~3位的GC含量平均值分别为46.78%、39.61%、28.53%,密码子前两位的GC平均含量明显高于第3位;(2)有效密码子数(ENC)的取值范围为38.48~61.00,平均值为47.21,其密码子偏性较弱。
相关性分析显示:(1)GC1与GC2显著相关,GC all与GC1、GC2、GC3都极显著正相关,GC3与GC1、GC2都不显著相关;(2)ENC与GC1不显著相关,但与GC2和GC3分别显著和极显著相关;(3)密码子数(N)只与GC3显著相关,说明密码子3个位置中第3位碱基组成主要影响着密码子数。
RSCU分析显示,29个RSCU>1的密码子中以A结尾有12个、以U结尾有16个、以G结尾有1个。
中性绘图分析显示,GC12与GC3的相关系数和回归系数分别为0.065和0.085,二者不显著相关。
ENC-plot 绘图分析显示,大多数基因分布于标准曲线附近,多数ENC比值分布在–0.05~0.05区间。
PR2-plot绘图分析显示,所有基因不均匀分布在平面图的4个区域内,密码子第3位嘧啶T/C 的使用频率高于嘌呤A/G。
这3种绘图分析综合表明,自然选择和突变作为主要因素,相对均衡地影响菠萝叶绿体基因组的密码子偏好性。
最优密码子和RSCU分析显示,29个RSCU>1的密码子及筛选的18个最优密码子绝大多数偏好以A或U结尾。
这些研究结果可为外源基因的密码子优化及提高其表达效率提供科学依据。
密码子偏好表DNA密码子是指DNA分子上一组三个碱基(核苷酸)的排列顺序,它们对应着氨基酸的编码。
在遗传密码表中,常用的密码子有某种氨基酸的编码,而有些密码子编码了相同的氨基酸。
这种一对多的编码关系就是密码子偏好。
密码子偏好表是一种记录了各种氨基酸编码的密码子使用频率的工具。
通过分析密码子的使用频率,我们可以了解到细胞对不同氨基酸的需求程度,进而提供改良基因表达的依据。
本文将对密码子偏好表的研究内容进行讨论。
一、密码子偏好的分析方法密码子偏好的分析通常基于大规模的基因组数据。
研究者可以从不同生物体的基因组数据库中获取相关数据,并利用生物信息学工具进行分析。
下面介绍几种常用的密码子偏好分析方法:1. 基于相对密码子使用频率的分析方法这种方法主要是比较不同密码子在基因组中的相对使用频率。
通过计算某个密码子相对于其他密码子在同一个位置上的使用频率,可以得出具体的密码子偏好情况。
这种方法需要大规模的基因组数据支持,具备较高的可靠性和准确性。
2. 基于机器学习的方法机器学习方法可以利用已知的密码子和氨基酸关系,构建模型来预测未知密码子的氨基酸编码。
这种方法可以通过训练集和测试集的分割,提高密码子偏好预测的准确性。
然而,由于模型的构建和调整需要大量的计算和优化,这种方法的复杂度较高。
3. 基于统计学的方法统计学方法通过对密码子出现的频率进行统计学分析,来确定密码子偏好情况。
这种方法常常用于不同物种间的密码子偏好比较。
通过统计学的方法,可以发现特定物种在某些密码子的使用上存在明显差异,这些差异可能与物种的进化和适应环境有关。
二、密码子偏好的影响因素密码子偏好的形成和影响因素非常复杂,下面列举了一些常见的影响因素:1. 突变率和选择压力密码子偏好可能受到突变率和选择压力的共同影响。
突变率指的是密码子在基因组中发生变异的速率,而选择压力指的是外界环境对密码子选择的影响。
突变率越高,密码子偏好可能越小,因为基因组中出现新的密码子编码的几率会增加。