密码子偏好性
- 格式:doc
- 大小:100.50 KB
- 文档页数:2
核农学报2023,37(6):1118~1129Journal of Nuclear Agricultural Sciences豇豆叶绿体基因组密码子使用偏好性分析仇学文李丹甘玉迪杨有新程柳洋徐梦怡吴才君 *(江西农业大学农学院,江西南昌330000)摘要:为了探究豇豆(Vigna unguiculata)叶绿体基因组密码子的使用模式,本研究从NCBI下载完整的豇豆叶绿体基因组序列,并对其进行结构分析。
利用CodonW和CUSP对筛选获得的50条可编码蛋白序列(CDS)进行分析,获得GC1、GC2、GC3、RSCU、CAI、CBI、Fop、ENc、RFSC等重要参数,并进行中性绘图、PR2-plot绘图、ENc-plot绘图以及对应分析、最优密码子分析和其他物种对比分析。
结果发现,豇豆叶绿体基因密码子更偏向以A或U(T)结尾,G和C在密码子各位置中的占比较低,平均值为36.31%;有效密码子数(ENc)的平均值为44.903,密码子偏好性较弱;GC1与GC2、GC3间均有相关性,表明碱基突变对密码子选择也有影响。
从中性绘图、PR2-plot绘图、ENc-plot绘图结果可以看出,豇豆叶绿体密码子使用偏好性同时受到了碱基突变与自然选择的影响。
本研究最终筛选出20个最优密码子,并将豇豆叶绿体基因组密码子使用频率与其他物种进行比较,发现豇豆与番茄在密码子使用频率上存在较高的相似度。
本研究结果为提高豇豆叶绿体外源基因的表达效率提供了参考依据。
关键词:豇豆;叶绿体;基因组;密码子;使用偏好性DOI:10.11869/j.issn.1000⁃8551.2023.06.1118生物体内的DNA序列表达与信息传递主要借助64个密码子进行,而大多数氨基酸有不止一个密码子对应,称为密码子的简并性[1]。
编码同一个氨基酸的多个密码子称为同义密码子,除色氨酸与蛋氨酸之外,其余18个氨基酸都有多个同义密码子。
而某些同义密码子被高频使用的现象被称为密码子使用偏好性(codon usage bias, CUB)[2]。
研究密码子偏好性常用的参数1、相对同义密码子使用度(Relativ e Synonymous Codon Usage, RSCU )是指对于某一特定的密码子在编码对应氨基酸的同义密码子间的相对概率,它去除了氨基酸组成对密码子使用的影响。
如果密码子的使用没有偏好性,该密码子的RSCU值等于1,当某一密码子的RSCU值大于1时,代表该密码子为使用相对较多的密码子,反之亦然。
第i个氨基酸的第j个密码子的相对同义密码子使用度值的计算公式如下:公式中, X ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为1~6) 。
研究中通常先利用高表达基因的RSCU值建立参考表格。
2、密码子适应指数(Codon Adaptation Index, CAI)可以根据已知高表达基因的序列来估计未知基因密码子使用的偏好性程度。
CAI的值在0~1之间, 如果越高则表明该基因的密码子使用偏好性越强。
CAI 值一般用来预测种内基因的表达水平( 但目前的研究发现对于单细胞生物比较适用, 而在哺乳动物中并不能用来表示基因表达水平), 又可以用来预测外源基因的表达水平。
w ij(The relative adaptiveness of a codon): 密码子相对适应度上式中RSCU imax、X imax分别指编码第i个氨基酸的使用频率最高的密码子的RSCU值和X值L是指基因中所使用的密码子数。
3、密码子偏好参数(Codon Preference Parameter, CPP)CPP的变化范围为0 ~ 18, 越接近18表示密码子被非随机使用的程度越高。
它对于基因编码区域总的碱基组成不敏感, 适于比较基因间或物种间密码子使用偏性的大小。
x ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为2~6, n i= 1 的情况被排除)4、有效密码子数(Effective Number of Codon, ENC)ENC值的范围在20~ 61之间, 越靠近20偏性越强。
116口蹄疫病毒VP1基因密码子偏好性分析马 园1,仲 亮2,王国华3,田普厚3,张 涛3,武俊兰3,刘 月3,马红艳3,徐婉瑛3,石顺利4,张七斤1(1. 内蒙古农业大学兽医学院,内蒙古呼和浩特 010018;2. 额尔克哈什哈苏木综合保障和技术推广中心,内蒙古阿拉善 750300;3. 内蒙古必威安泰生物科技有限公司,内蒙古呼和浩特 011500;4.通辽市家畜繁育指导站,内蒙古通辽 028000)摘 要:VP1蛋白是口蹄疫病毒(FMDV)的主要结构蛋白,可诱导机体产生中和抗体以及激发保护性免疫应答。
为探究VP1基因密码子偏好性,筛选出其最佳体外表达系统,使用Visual Gene Developer、CodonW、GraphPad Prism等软件,对VP1基因进行密码子偏好性分析,同时将VP1基因密码子使用频率与大肠杆菌、毕赤酵母、昆虫杆状病毒和哺乳动物细胞表达系统作了比较。
结果显示,VP1基因的CAI为0.21,ENC为55.43,GC3S为65.26%,表明该基因密码子使用偏好较弱并且密码子偏好以G/C碱基结尾。
结合VP1基因与各表达系统密码子使用频率比值,发现其与昆虫杆状病毒表达系统频率比值差异最小且CAI最大,因此推断昆虫杆状病毒表达系统是FMDV VP1基因最适体外表达系统。
本研究为FMDV亚单位疫苗研制等提供了技术基础。
关键词:口蹄疫病毒;VP1基因;密码子;外源表达;昆虫杆状病毒表达系统中图分类号:S852.65 文献标识码:A 文章编号:1005-944X(2021)04-0116-08DOI:10.3969/j.issn.1005-944X.2021.04.024 开放科学(资源服务)标识码(OSID):Analysis on Codon Preference of FMDV VP1 GeneMa Yuan1,Zhong Liang2,Wang Guohua3,Tian Puhou3,Zhang Tao3,Wu Junlan3,Liu Yue3,Ma Hongyan3,Xu Wanying3,Shi Shunli4,Zhang Qijin1(1. College of V eterinary Medicine,Inner Mongolia Agricultural University,Hohhot,Inner Mongolia 010018,China;2. Erkhash Hasumu Comprehensive Security and Technology Promotion Center,Alashan,Inner Mongolia 750300,China;3. Inner Mongolia Bigvet Biotech. Co.,Ltd.,Hohhot,Inner Mongolia 011500,China;4. Tongliao Animal Breeding Station,Tongliao,Inner Mongolia 028000,China)Abstract:VP1 protein is the main structural protein of foot-and-mouth disease virus(FMDV),by which neutralizing antibodies could be induced and protective immune response could be stimulated. In order to identify the codon preference of VP1 gene and screen its best expression system in vitro,relevant analysis was carried out by use of Visual Gene Developer,Codon W,GraphPad Prism and other softwares whilst the usage frequency of VP1 gene codon was compared with that of E. coli,Pichia pastoris,insect baculovirus and mammalian expression systems. The results showed that the CAI value of VP1 gene was 0.21,ENC value was 55.43,and GC3S was 65.26%,indicating that the codon usage preference was weak and ended with G/C base. It was found that,the frequency ratio of VP1 gene to insect baculovirus expression system was minimum,compared to that to the codon of various expression systems,and the CAI value was maximum. Therefore,it was concluded that insect baculovirus expression system was the most appropriate expression system in vitro for FMDV VP1 gene,technical support was thus provided for development of FMDV sub-unit vaccine.Key words:FMDV;VP1 gene;codon;exogenous expression;insect baculovirus expression system收稿日期:2021-02-02 修回日期:2021-02-22通信作者:张七斤。
研究密码子偏好性常用的参数1、相对同义密码子使用度(Relativ e Synonymous Codon Usage, RSCU )是指对于某一特定的密码子在编码对应氨基酸的同义密码子间的相对概率,它去除了氨基酸组成对密码子使用的影响。
如果密码子的使用没有偏好性,该密码子的RSCU值等于1,当某一密码子的RSCU值大于1时,代表该密码子为使用相对较多的密码子,反之亦然。
第i个氨基酸的第j个密码子的相对同义密码子使用度值的计算公式如下:公式中, X ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为1~6) 。
研究中通常先利用高表达基因的RSCU值建立参考表格。
2、密码子适应指数(Codon Adaptation Index, CAI)可以根据已知高表达基因的序列来估计未知基因密码子使用的偏好性程度。
CAI的值在0~1之间, 如果越高则表明该基因的密码子使用偏好性越强。
CAI 值一般用来预测种内基因的表达水平( 但目前的研究发现对于单细胞生物比较适用, 而在哺乳动物中并不能用来表示基因表达水平), 又可以用来预测外源基因的表达水平。
w ij(The relative adaptiveness of a codon): 密码子相对适应度上式中RSCU imax、X imax分别指编码第i个氨基酸的使用频率最高的密码子的RSCU值和X值L是指基因中所使用的密码子数。
3、密码子偏好参数(Codon Preference Parameter, CPP)CPP的变化范围为0 ~ 18, 越接近18表示密码子被非随机使用的程度越高。
它对于基因编码区域总的碱基组成不敏感, 适于比较基因间或物种间密码子使用偏性的大小。
x ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为2~6, n i= 1 的情况被排除)4、有效密码子数(Effective Number of Codon, ENC)ENC值的范围在20~ 61之间, 越靠近20偏性越强。
密码子使用偏好性量化方法研究摘要在基因组学水平上研究密码子使用偏性模式、成因并分析进化过程中的选择压力在基因组学研究中有重要意义。
文章概述了目前提出的密码子使用偏性的量化方法及实现原理。
目前研究发现:有些量化密码子偏性的方法受高表达基因参考数据集未完全注释的限制,不同密码子位置对变异和选择的影响不同,以及不同密码子位置处GC 含量和嘌呤含量的贡献不同。
由此展望密码子偏性量化方法发展方向为:需要设计不需要相关参考基因集合先验知识的密码子使用偏性量化方法;考虑不同位置处背景核苷酸组成的密码子使用偏性的量化方法;同时考虑基因表达水平的密码子使用偏性量化方法。
最后,归纳了目前可用的密码子使用偏性的量化工具和数据库。
关键词同义密码子, 密码子使用偏性, 背景核苷酸, GC3, 高表达基因密码子使用偏性是指在不同物种间或同一物种内的基因翻译过程中,某些密码子的使用次数多于其它同义密码子的现象。
密码子使用偏性现象在许多物种中广泛存在。
在基因组学水平上研究密码子使用偏性模式、成因并分析进化过程中的选择压力在基因组学研究中有重要意义。
分子进化研究表明:密码子使用偏性在基因组中广泛存在,对基因组进化有极深的影响(Sharp and Matassi, 1994)。
并且密码子与氨基酸的关系影响到细胞的蛋白质组分的变化,即分子机制的变化(Xiao and Yu, 2007)。
同时,密码子使用偏性的有效衡量对相关基因功能的推断很重要。
最近的研究表明某些特殊同义密码子的使用也能影响蛋白质的折叠和错误折叠(Tsai et al., 2008;Marin, 2008)。
基因组内不同基因具有不同的密码子使用偏性,变异、选择和随机漂移是形成物种间密码子使用偏性的三个主要原因(Bulmer, 1991; Palidwor et al., 2010Supek et al., 2010 ; Shah and Gilchrist, 2011)。
密码子偏性与异源蛋白表达原文:Claes Gustafsson, et al. TRENDS in Biotechnology, 2004,22(7): 346-353./corp/images/MS102504CG.pdf翻译:zhxm409511在1977年,当Genetech的科学家和他们的科研合作伙伴首次利用细菌生产出人类蛋白(生长激素释放抑制因子)时[1],蛋白的异源表达在整个生物技术产业中发挥着关键的角色。
那时,仅知道生长激素释放抑制因子的氨基酸序列,还不知如何从人的基因组中克隆该基因,因此,Genetech小组采用数条寡核苷酸合成了14个密码子长的生长激素释放抑制因子基因。
Itakura和同事们设计这些寡核苷酸时遵循了三条标准[1]。
首先,优先使用MS2噬菌体偏爱的密码子——尽管当时对大肠杆菌的基因组DNA序列还知之甚少,却已刚刚完成了MS2噬菌体的测序,并认为该噬菌体的序列能够代表大肠杆菌高表达基因所使用的密码子。
其次,消除寡核苷酸不必要的分子内和分子间配对,因为这可能影响基因合成。
第三,避免那些先是富含GC随后是富含AT的序列,当时认为这种序列可能会导致转录终止。
结果,利用这条合成的基因首次制生产出来了具有功能活性的多肽。
25年后的今天,大多数基因克隆自cDNA文库或直接利用聚合酶链反应(PCR)从相应的基因组中扩增获得。
要尽量避免从头合成基因,因为这样做需要消耗大量的财力和人力[2]。
尽管基于PCR的克隆被广泛使用,但很多情况下它还是不及所描述的那样快捷和容易。
它经常需要一些不易得到的模板(对于具有内含子的生物,需要cDNA模板),此外还需要进行PCR条件的优化,需要对PCR产物进行测序,如果PCR引入了任何的配对错误,还经常需要通过定点突变进行修复。
然而,当扩增出的基因克隆入表达载体后,真正有趣的事情就发生了:经常是没有蛋白表达或表达水平很低。
人们已经进行了大量的研究,以提高克隆基因的表达水平,包括优化宿主的生长条件,建立新的宿主系,改用新的宿主,和无细胞系统[3]。
收稿日期:2023-05-05作者简介:韩君(1988—),男,黑龙江哈尔滨人,硕士,工程师,研究方向为生物信息学与多组学数据分析。
刺猬线粒体基因组密码子偏好性分析韩君(北京康仁堂药业有限公司,北京101301)摘要:为利用分子技术探究刺猬皮等组织作为中药使用的机制,促进远东刺猬分子进化研究。
以远东刺猬线粒体全基因组序列为材料,从中筛选出长度大于300bp 的非重复编码序列(CDS )12条,利用CodonW1.4.2、SPSS 25.0和Excel 2007等软件分析其密码子偏好性。
结果显示:密码子第3位的碱基平均GC 含量为24.30%;有效密码子数目(ENC )分布范围为31.83~50.67,平均值为43.37;相对同义密码子使用度(RSCU )值>1.00的密码子共有32个,偏好以碱基A 或U (T )结尾。
中性绘图分析结果显示,GC 1和GC 2的平均值(GC 12)与GC 3之间的相关系数为0.443;ENC-plot 分析结果显示,多数基因在标准曲线附近聚集;对应性分析结果表明,第1~4个向量轴的贡献率分别为35.64%、16.22%、10.26%和9.13%,同义密码子第3位的GC 含量(GC3s )、ENC 与第1向量轴(Axis1)呈显著正相关;密码子适应指数(CAI )与Axis1呈负相关,最终确定CUA 、AUA 、GUU 、UCU 、CCC 、ACA 、GCU 、CAU 、AAA 、GAA 、UGA 、CGC 、GGC 和GGA 为最优密码子。
通过优化远东刺猬线粒体基因组密码子以及应用分子手段进行深入研究,有助于探究远东刺猬组织入药机制。
关键词:远东刺猬;线粒体;密码子;偏好性;中药中图分类号:S862;R282文献标志码:A文章编号:1001-0084(2023)04-0031-07Codon Preference Analysis on MitochondrialGenome of Erinaceus amurensisHAN Jun(Beijing Tcmages Pharmaceutical Co.,Ltd.,Beijing 101301,China )Abstract:Using molecular technique to explore the mechanism of hedgehog hide and other tissues applied astraditional Chinese medicine,and promote molecular evolution of Erinaceus amurensis in the Far East,taking the complete mitochondrial genome sequence of Erinaceus amurensis as the material,12non-repeating coding sequences (CDS)with a length greater than 300bp were selected as the research objects in this study,and their codon preference was analyzed by using CodonW1.4.2,SPSS 25.0,Excel 2007and other software.The average GC content of the third codon was 24.30%;the number of effective codons (ENC)ranged from 31.83to 50.67,with an average value of 43.37;and the relative synonymous codon usage (RSCU)value of 32codons was greater than 1.00,and the preference ends with either A or U (T).According to neutral plot analysis,the correlation coefficientbetween the average value (GC 12)of GC 1,and GC 2and GC 3was 0.443.In addition,ENC-plot analysis also revealed that most genes cluster near the standard curve;besides,the corresponding analysis showed that the contribution rates of the 1-4vector axes were 35.64%,16.22%,10.26%and 9.13%,respectively;and the GC content of the third synonymous codon (GC3s )and ENC were significantly positively correlated with the first vector axis (Axis1).In addition,the codon adaptation index (CAI)was negatively correlated with Axis1.Hence,it could finally beDOI:10.20041/ki.slbl.2023.04.006猬科在我国共有5个属7个种。