密码子数据库及密码子偏好性分析软件
- 格式:doc
- 大小:19.50 KB
- 文档页数:2
甘蔗属种及其近缘属种蔗茅的全基因组密码子偏好性分析田春艳;李旭娟;李纯佳;毛钧;刘新龙【期刊名称】《生物技术通报》【年(卷),期】2024(40)3【摘要】【目的】为解析甘蔗基因组的密码子使用特征,提高异源基因在甘蔗中的表达效率。
【方法】以已发布的甘蔗属种(热带种LA-purple、割手密NP-X和AP85-441)及其近缘属种蔗茅(Yunnan2009-3)基因组为数据,利用Python、CodonW1.4.2进行密码子偏好性分析,同时通过中性绘图、ENC-plot、PR2-plot 等分析探讨密码子偏好性形成的影响因素,并结合转录组测序数据分析密码子偏好性参数与基因表达水平的相关性。
最后,基于RSCU均值与7个主要模式生物种(玉米、高粱、水稻、拟南芥、烟草、大肠杆菌、酿酒酵母)的密码子使用模式进行比较分析。
【结果】显示热带种、割手密和蔗茅的基因组都富含GC,平均GC含量为56.3%,且GC3>GC1>GC2,倾向于使用以G/C结尾的密码子,平均ENC值为48.45,偏好性较低。
中性绘图、ENC-plot和PR2-plot分析表明它们的密码子偏好性受到自然选择、突变压力等多种因素的共同影响,其中自然选择占主导作用。
相关性分析表明密码子偏好性参数与基因实际的转录表达水平存在显著相关性,但相关性不强。
根据RSCU和?RSCU值,确定了13个最优密码子,均以C或G结尾,密码子使用特性在全基因组和染色体组水平上无差异。
通过比较发现,甘蔗的核苷酸组成及密码子偏好性与玉米、高粱和水稻较为相似,而与拟南芥、烟草、大肠杆菌和酵母具有显著差异。
【结论】甘蔗热带种、割手密和蔗茅的密码子偏好性高度相似,其形成受自然选择和突变因素的影响。
此外,对甘蔗优异基因功能异源验证时可优先选择玉米、水稻和高粱作为异源表达系统。
【总页数】13页(P202-214)【作者】田春艳;李旭娟;李纯佳;毛钧;刘新龙【作者单位】热带作物生物育种全国重点实验室;云南省农业科学院甘蔗研究所云南省甘蔗遗传改良重点实验室;农业农村部甘蔗生物学与遗传育种重点实验室【正文语种】中文【中图分类】S51【相关文献】1.甘蔗近缘属野生种滇蔗茅(Erianthus rockii) 的种质创新利用2.四川甘蔗种质资源研究:I.甘蔗野生种和蔗属近缘植物的种类及其分析3.斑茅种与甘蔗,蔗茅二属几个种的植物形态学和同工酶比较研究4.3种含笑属植物叶绿体基因组密码子偏好性分析5.2种玉兰属植物叶绿体基因组密码子偏好性分析因版权原因,仅展示原文概要,查看原文内容请购买。
第46卷 第2期2022年3月南京林业大学学报(自然科学版)JournalofNanjingForestryUniversity(NaturalSciencesEdition)Vol.46,No.2Mar.,2022DOI:10.12302/j.issn.1000-2006.202108049 收稿日期Received:2021 08 29 修回日期Accepted:2021 11 29 基金项目:国家自然科学基金项目(32072624);安徽农业大学茶树生物学与资源利用国家重点实验室开放基金资助项目(SKLTOF20200129);安徽省高校优秀青年人才支持计划项目(gxyq2020040)。
第一作者:王占军(wangzhanjunhxj@163.com),副教授,负责试验设计与论文撰写;吴子琦(1293014657@qq.com),负责实验操作与数据处理。
通信作者:张照亮(zhlzhang@ahau.edu.cn),教授。
引文格式:王占军,吴子琦,王朝霞,等.3个茶树品种WOX基因家族的进化及密码子偏好性比较[J].南京林业大学学报(自然科学版),2022,46(2):71-80.WANGZJ,WUZQ,WANGZX,etal.AcomparativestudyoftheevolutionandcodonusagebiasinWOXgenefamilyofthreeCamelliasinensiscultivars[J].JournalofNanjingForestryUniversity(NaturalSciencesEdition),2022,46(2):71-80.DOI:10.12302/j.issn.1000-2006.202108049.3个茶树品种WOX基因家族的进化及密码子偏好性比较王占军1,2△,吴子琦1△,王朝霞1,欧祖兰1,李 杰1,蔡倩文1,徐忠东1,张照亮2(1.合肥师范学院生命科学学院,安徽 合肥 230601;2.安徽农业大学茶树生物学与资源利用国家重点实验室,安徽 合肥 230036)摘要:【目的】WOX基因家族在模式植物组织培养中扮演着重要的分子调控角色。
法螺线粒体全基因组密码子偏好性分析作者:任童童喻达辉翟子钦谭传港何积翠尚东维陈移波白丽蓉来源:《南方农业学报》2022年第05期摘要:【目的】分析法螺(Charonia tritonis)线粒体基因组密码子偏好性,探究基因突变和自然选择对密码子偏好性的影响,为法螺属动物类群的系统发育树构建及种质资源保护与遗传改良提供参考依据。
【方法】以法螺线粒体全基因组序列为材料,选择以ATG为起始密码子的非重复且长度大于300 bp的11个CDS(Coding DNA sequence)序列,采用CodonW1.4.2进行密码子偏好性分析,并根据相对使用度差值(△RSCU)>0.08且RSCU在高表达基因库中>1.00的标准筛选出最优密码子。
【结果】法螺线粒体基因组密码子第1位GC含量(GC1)的波动范围在35.80%~53.10%,平均为43.54%;第2位GC含量(GC2)的波动范围在32.40%~43.40%,平均为36.11%;第3位GC含量(GC3)的波动范围在23.00%~30.60%,平均为27.79%,GC1和GC2明显高于GC3;同义密码子第3位的GC含量(GC3S)的波动范围在20.90%~29.60%,平均为26.23%,表明密码子第3位碱基以A/U(T)结尾为主;密码子适应指数(CAI)的波动范围为0.096~0.166,平均为0.137;密码子偏好性指数(CBI)的波动范围在-0.212~-0.086,平均为-0.133;最优密码子使用频率(FOP)的波动范围为0.246~0.339,平均为0.306;有效密码子数目ENC的波动范围在44.37~51.69,平均为47.84;总平均亲水性(GRAVY)的变化范围在0.4419~1.4727,平均为0.9501。
中性绘图分析、ENC-plot绘图分析及对应性分析均表明,在法螺线粒体基因组密码子偏好性的形成过程中受基因突变和自然选择的双重作用,但以自然选择为主导。
密码子偏好表是指生物体内不同基因在不同组织或不同细胞类型中的密码子使用偏好性。
它反映了基因在不同环境下的表达和翻译效率。
密码子偏好性对于理解基因表达调控、药物设计和生物信息学等领域具有重要意义。
首先,从遗传密码的特性来看,密码子偏好性是必然存在的。
生物体使用的密码子有3个,分别代表不同的氨基酸。
由于自然界中氨基酸的种类有限,因此不同的密码子在生物体内出现的频率必然有所不同。
这反映了基因在不同环境下的表达和翻译效率。
其次,不同基因在不同组织或不同细胞类型中的密码子偏好性存在差异。
这种差异可能是由于基因在特定组织或细胞类型中的表达调控机制所致。
例如,某些基因在某些组织中的表达可能受到转录因子或RNA加工机制的影响,而这些机制可能会影响密码子的使用偏好性。
再者,密码子偏好性受到生物体内各种因素的影响,如代谢状态、环境压力、营养条件等。
这些因素可能通过影响基因的表达和翻译效率来影响密码子的使用偏好性。
此外,遗传变异和进化也可能会影响密码子的使用偏好性,从而使不同的物种和种群表现出不同的密码子偏好性。
具体来说,某些密码子在生物体内可能更常见于编码某些特定的氨基酸,而其他密码子则可能较少出现。
这可能是由于某些氨基酸在生物体内的需求较高,因此在基因表达和翻译过程中更频繁地使用某些密码子。
此外,某些氨基酸可能与特定的辅因子或信号分子结合,从而影响其翻译效率,这也可能导致某些密码子的偏好性。
总之,密码子偏好表反映了生物体内不同基因在不同组织或不同细胞类型中的密码子使用偏好性。
这种偏好性是基因在不同环境下的表达和翻译效率的体现,同时也受到各种因素的影响。
密码子偏好性对于理解基因表达调控、药物设计和生物信息学等领域具有重要意义。
通过研究密码子偏好性,我们可以更好地了解生物体的基因表达机制和蛋白质合成过程,从而为药物设计和疾病治疗提供新的思路和方法。
蒺藜苜蓿叶绿体密码子偏好性分析杨国锋;苏昆龙;赵怡然;宋智斌;孙娟【期刊名称】《草业学报》【年(卷),期】2015(000)012【摘要】本文对蒺藜苜蓿叶绿体基因组全序列密码子进行分析,筛选出50条CDS(coding DNA sequence)利用 Codo-nW 软件进行分析其密码子使用模式。
结果显示,蒺藜苜蓿叶绿体基因组密码子第3位碱基 GC 含量为26.9%,即第3位密码子富含 A 和 U,ENC 值在37.11~51.91之间密码子偏好性较弱。
相对同义密码子使用度分析显示RSCU 值大于1的密码子有23个,其中以 A 和 U 为结尾20个。
中性绘图分析显示 GC12与 GC3的相关系数为0.341,相关性不显著,回归系数为0.4843;单基因 ENC 比值多分布在-0.05~0.05,即大部分基因 ENC 值离 ENC期望值较近;对应性分析,第一轴显示了12.50%的差异为主要影响因素,第一轴与ENC 和GC3的相关系数分别为0.091和-0.092,均相关不显著。
综合这几项分析发现蒺藜苜蓿叶绿体基因组密码子偏好性主要受到突变的影响,但是并不是唯一的影响因素,其他因素对密码子偏好性也可能有一定的影响。
最终通过高表达优越密码子方法确定得出 UUA、UUG、CCU 等23个密码子为最优密码子,为之后对外源基因进行改造,提高其在叶绿体中的表达效率奠定了基础。
【总页数】9页(P171-179)【作者】杨国锋;苏昆龙;赵怡然;宋智斌;孙娟【作者单位】青岛农业大学经济草本植物应用研究所,山东青岛 266109; 青岛农业大学生命科学学院,山东省高校植物生物技术重点实验室,山东青岛 266109;青岛农业大学经济草本植物应用研究所,山东青岛 266109; 青岛农业大学生命科学学院,山东省高校植物生物技术重点实验室,山东青岛 266109;青岛农业大学经济草本植物应用研究所,山东青岛 266109;青岛农业大学经济草本植物应用研究所,山东青岛 266109; 青岛农业大学生命科学学院,山东省高校植物生物技术重点实验室,山东青岛 266109;青岛农业大学经济草本植物应用研究所,山东青岛 266109【正文语种】中文【相关文献】1.蒺藜苜蓿WRKY转录因子密码子使用偏好性分析 [J], 宋辉;王鹏飞;马登超;夏晗;赵传志;张烨;赵术珍2.槲蕨属叶绿体基因组密码子偏好性分析 [J], 沈宗芳;陆添权;张志荣;蔡传涛;田波3.蒜头果叶绿体基因组密码子偏好性分析 [J], 原晓龙;刘音;康洪梅;陈中华;李云琴;王毅4.降香黄檀叶绿体基因组密码子偏好性分析 [J], 原晓龙;李云琴;张劲峰;王毅5.2种药用獐牙菜叶绿体基因组密码子偏好性分析 [J], 张俊焱;曾阳;李锦萍;王虹雨;张瑞峰;刘力宽因版权原因,仅展示原文概要,查看原文内容请购买。
密码子偏好性的相关研究及方法分析
冉然;张晓明;宛涛;伊卫东
【期刊名称】《草原与草业》
【年(卷),期】2022(34)3
【摘要】密码子偏好性指的是物种对编码相同氨基酸的同义密码子的不均等使用。
这样的现象和生物功能分子蛋白质和遗传信息载体分子DNA有相关联系,因此对
其的研究具有非常重要的意义。
本文概述了密码子偏好性的研究进展,实现密码子
偏好性的生物学基础,并简要介绍了研究密码子偏好性的意义以及研究分析方法以
及相关研究在草业科学中应用的意义。
【总页数】7页(P5-10)
【作者】冉然;张晓明;宛涛;伊卫东
【作者单位】内蒙古农业大学草原与资源环境学院/草地资源教育部重点实验室/农业农村部饲草加工高效利用重点实验室/内蒙古自治区草地管理与利用重点实验室【正文语种】中文
【中图分类】S812;Q75
【相关文献】
1.基于相关分析的超偏载装置精度评价方法研究
2.密码子偏性的分析方法及相关研究进展
3.密码子偏性分析方法及茶树中密码子偏性研究进展
4.应用脑电信号偏直
线相关分析方法研究颞叶内侧癫痫网络连接机制5.应用脑电信号偏直线相关分析
方法研究颞叶内侧癫痫网络连接机制
因版权原因,仅展示原文概要,查看原文内容请购买。
刘 洋,路 妍,景 岚.向日葵全基因组NBS抗病基因密码子使用偏好性分析[J].江苏农业科学,2021,49(10):43-47.doi:10.15889/j.issn.1002-1302.2021.10.008向日葵全基因组NBS抗病基因密码子使用偏好性分析刘 洋,路 妍,景 岚(内蒙古农业大学园艺与植物保护学院,内蒙古呼和浩特010019) 摘要:为分析了解向日葵(HelianthusannuusL.)核苷酸结合位点(nucleotidebindingsite,简称NBS)型抗病基因编码时各密码子的使用情况,以向日葵全基因组NBS型抗病基因的255条基因序列为来源,利用CodonW软件对每个基因序列进行密码子统计分析。
结果表明,向日葵NBS型抗病基因使用A/T(U)结尾的密码子占比大于G/C结尾的密码子,且有效密码子数(effectivenumberofcodon,简称ENC)平均值为51.40,整体偏好性较弱,但第3位碱基偏好使用以A/T(U)结尾的密码子。
从同义密码子相对使用频率(relativesynonymouscodonwusage,简称RSCU)分析得到第3位为A、T结尾的密码子占密码子总数(RSCU>1)的比例最高。
ENC-GC3s分布图表明,碱基突变是影响密码子偏好性的关键因素。
同时相关性分析结果还表明,ENC与A3s、T3s呈极显著负相关关系,多种不同分析都印证了向日葵NBS型抗病基因序列偏好于以A/T(U)结尾的密码子。
分析向日葵NBS型抗病基因密码子偏好性,通过优化密码子来提高NBS抗病基因在向日葵中的表达,可为向日葵分子改造和抗病育种提供理论依据。
关键词:向日葵;NBS抗病基因;密码子偏好性;密码子相关参数;相关性分析 中图分类号:S565.501;Q943.2 文献标志码:A 文章编号:1002-1302(2021)10-0043-05收稿日期:2020-09-15基金项目:国家自然科学基金(编号:31760509);内蒙古自然科学基金(编号:2020MS03046)。
原核表达密码子偏好概述及解释说明1. 引言1.1 概述原核表达密码子偏好是指原核生物在蛋白质合成过程中对编码氨基酸的密码子选择存在一定规律性。
密码子是由三个核苷酸组成的序列,用于编码不同的氨基酸。
在原核生物中,有些密码子被广泛使用,而其他密码子则较少使用。
这种密码子偏好现象引发了科学家们的兴趣,并且对研究人员揭示了一些有关遗传信息传递机制和生物进化的重要见解。
1.2 文章结构本文将以以下几个部分来描述原核表达密码子偏好。
首先,在第2部分中,我们将概述原核表达密码子偏好的基本概念和背景知识。
然后,在第3部分中,我们将解释说明影响原核表达密码子偏好的主要原因和机制。
接下来,在第4部分中,我们将通过实例分析具体介绍常见原核生物中的密码子偏好现象及其解释。
最后,在第5部分中,我们将总结原核表达密码子偏好的特点并展望该领域未来的研究方向。
1.3 目的本文旨在深入探讨原核表达密码子偏好的现象和机制,并通过实例分析加深对该领域的理解。
了解原核表达密码子偏好对我们揭示细胞功能和进化过程具有重要意义。
同时,本文也希望能够促进对密码子偏好研究领域的发展,为未来的研究提供新的思路和方向。
2. 原核表达密码子偏好概述:2.1 什么是原核表达密码子偏好原核生物中的基因编码信息通过密码子来进行转录和翻译,密码子是由三个核苷酸组成的序列,每个密码子对应着一个氨基酸。
然而,在同一种原核生物的基因组中,对于某些氨基酸来说,并非所有可能的密码子都被等概率地使用。
相反,原核生物存在一种选择性地使用某些密码子来编码特定氨基酸的现象,这就是原核表达密码子偏好。
2.2 密码子的定义和功能在DNA或RNA序列中,每三个连续的核苷酸被称为一个密码子。
根据遗传密码表,不同的密码子对应着不同的氨基酸,起到了翻译基因信息为蛋白质序列的作用。
2.3 原核生物中密码子使用的规律性原核生物在使用密码子时并非随机选择,而是存在一定程度上的规律性。
具体而言,原核生物中较为常见或者富集的密碼雙取决于其所编码氨基酸出现频率及其它影响因素。
密码子数据库及密码子偏好性分析软件
题记:转基因研究中经常要进行基因的异源表达,在翻译过程中,受体物种对外源基因密码子的翻译效率对表达有非常大的制约。
因此,利用相应的生物信息学数据库及软件对目标序列进行受体物种的密码子偏好性分析将有助于完成对转基因效率的评价,适当选择合适的受体物种进行高效、可行的表达。
人物,阅读前,让我们感谢下列科学家,是他们为基因异源高效表达提供有价值参考。
Yasukazu Nakamura博士:
The First Laboratory for Plant Gene Research,Kazusa DNA Research Institute 开发Codon Usage Database(生物密码子表的利用情况统计)。
PrimerX:编写了Codon Usage Analyzer在线密码子统计表处理软件(/cgi-bin/codon.cgi),它使得对密码子的统计用图表的形式显示出来,更加的直观可读。
Morris Maduro博士:针对E. coli开发了E. coli Codon Usage Analyze 。
目前的版本为2.1。
Thomas Schödl:开发设计的以图形形式对异源基因表达的密码子使用分析软件
(Graphical codon usage analyser),用以帮助异源基因表达时对异源基因进行改造,以适应受体物种,避免由于翻译时密码子使用情况的限制使受体物种对外源基因表达产生负面影响。
内容:
一:密码子使用统计数据库
Codon Usage Database(.jp/codon/ 是由植物基因研究第一实验室(The First Laboratory for Plant Gene Research)Kazusa DNA Research Institute的Yasukazu Nakamura博士开发的生物密码子表的利用情况统计。
数据来源于GenBank 的DNA 序列数据库,是GenBank 的Codon Usage Tabulated 数据库在WWW模式下的扩展和整合。
每个物种的密码子使用情况都可以通过WWW方式以网页的形式进行分析查询。
在该数据库中29,311个物种的不同形式的密码子使用情况被统计,包含1,756,171 个全长编码区序列。
该数据库的数据来源于NCBI GenBank 的Flat File[December 19 2005]. 在数据库的编写过程中,GenBank中的pri (primate sequence entries), rod (rodent sequence entries), mam (other mammalian sequence entries), rt (other ertebrate sequence entries), in (inertebrate sequence entries), pln (plant sequence entries), bct (bacterial sequence entries), rl (iral sequence entries) and phg (phage sequence entries) 文件类型所代表的数据被采用,而EST,pat (patent sequence entries), rna (Structural RNA sequence entries), sts (STS: sequence tagged site sequence entries), syn (synthetic and chimeric sequence entries) and una (unanotated sequence entries)文件类型所代表的数据被舍弃。
另外,编码区序列(complete sequenced protein coding genes)被采用,但测序数据中包含的不明确碱基所代表的密码子被排除。
数据库的使用方法:
该数据库可以对物种的拉丁名进行密码子使用情况的搜索,但数据库的搜索是不支持英文别名的。
比如对于酵母密码子的搜索,要用其拉丁名Saccharomyces cereisiae,而“yeast”的搜索结果显示为零。
另外,数据库对物种也进行了字母排序的统计,同样对酵母,进入S起始的“字典”里可以找到。
对于线粒体、叶绿体的密码子使用情况,数据库同样给出了汇总整理。
二:密码子偏好性分析
对于密码子偏好性的分析,有Correspondence Analysis of Codon Usage软件分析程序(/)和graphical codon usage analyser在线分析软件(/faq.php?on=cut)。
而对于E. coli,由于其作为发酵工程表达蛋白的最主要的手段,因此Morris Maduro博士针对E. coli开发了 E. coli Codon Usage Analyzer(.edu/~mmaduro/codonusage/usage.htm),目前的版本为2.1,它对于在
E. coli中异源蛋白的表达效率给出了很好的建议。
而由于graphical codon usage analyser的直观性和方便性,在密码子偏好性分析中得到了广泛的应用。
下面就重点介绍以图形形式进行密码子偏好性分析的graphical codon usage analyser系统。
Graphical codon usage analyser 是由科学家Thomas Schödl开发设计的以图形形式对异源基因表达的密码子使用分析,用以帮助异源基因表达时对异源基因进行改造,以适应受体物种,避免由于翻译时密码子使用情况的限制使受体物种对外源基因表达产生负面影响。
Graphical codon usage analyser 有三大方面的功能。
它们完成了对特定序列的异源表达密码子使用情况的统计以及不同物种密码子使用情况间的比较。
它与Codon Usage Database 联合使用,可以完成对Codon Usage Database 中已存在的所有物种的密码子偏好性的分析。
1. each triplet position s. usage table的功能是针对输入的特定序列进行异源表达分析的。
在交互式的选择界面中输入你分析序列的名称、其来源物种以及DNA 序列,然后选择要进行异源表达的物种,系统即返回表达时针对每一个密码子进行翻译的效率。
以GFP蛋白为例,其在A. ictoria 的表达情况的部分图示如图一。
我们看到其翻译时密码子的使用效率非常的低,所以可以通过序列改造的方式对序列进行编辑。
或者通过在高效表达受体中表达。
上图即是该基因在C. reinhardtii中的表达情况,我们看到通过选用C. reinhardtii进行表达,其翻译的效率得到明显的提高。
2. each codon s. usage table 的功能是针对输入的特定序列,其不同的氨基酸所对应的密码子在来源物种及异源物种中出现的情况的比较。
操作方式同上。
同样对GFP蛋白来说,部分比较图如图三所示,可以看到针对Ala和Arg其在来源物种A. ictoria及异源物种C. reinhardtii 中不同密码子的使用频率统计。
经统计分析,两物种密码子使用的差异为32.56。
3. compare two usage tables 的功能则不是针对特定基因序列的,而是把两个不同物种的密码子使用频率进行对比,估计其总体翻译效率的差异。
在交互式的选择中,只要指定两种想要比较的物种,即可得到其数据。
例如对H. sapiens 和 E. coli之间的比较(见图四)我们看到其效果如each codon s. usage table 的结果。
Ala的GCA密码子使用频率在H. sapiens为23%,而E. coli为21%。
但与each codon s. usage table 不同的是这时对大量基因的统计的总体效果。
另外,Graphical codon usage analyser所提供的物种仅是最常用的物种,对于其他物种,可以利用Codon Usage Database进行其密码子使用情况统计的及时生成进行http添加。
具体方式是利用Codon Usage Database找到你想用的物种的密码子表(例如Saccharomyces cereisiae 为.jp/codon/cgi-bin/showcodon.cgi?species=Saccharomyces+cereisiae+[gbpln] 然后在Format:中选择1. Standard 并选择A style like CodonFrequency output in GCG Wisconsin PackageTM 进行提交,对于得到的网页的链接
(.jp/codon/cgi-bin/showcodon.cgi?species=Saccharomyces+cereisiae
+%5Bgbpln%5D&aa=1&style=GCG)复制到Graphical codon usage analyser的分析系统里originating organism的Not listed的空白框里即可。