大戟科Lhcb基因家族的全基因组鉴定、分类与进化分析
- 格式:pdf
- 大小:451.96 KB
- 文档页数:7
油棕脱落酸受体PYL基因家族的全基因组鉴定及表达分析作者:金龙飞尹欣幸曹红星来源:《南方农业学报》2021年第06期摘要:【目的】鑒定油棕(Elaeis guineensis)脱落酸(ABA)受体PYR/PYL/RCARs (PYL)基因家族成员,分析其表达特性,为探究ABA信号通路在油棕果肉成熟过程中的功能研究提供理论依据。
【方法】以拟南芥和水稻的PYL蛋白氨基酸序列作为参考序列,通过BLASTp比对及保守结构域预测分析从油棕基因组中鉴定出PYL基因家族成员,利用生物信息学软件对其染色体定位、基因结构、启动子顺式作用元件及编码蛋白的理化性质、保守结构域、进化关系进行分析,并采用实时荧光定量PCR对PYL家族基因在不同组织、不同发育期果实及外源ABA处理下的表达特性进行检测。
【结果】从油棕基因组中共鉴定出12个油棕PYL基因家族成员(EgPYL1~EgPYL112),分布在8条染色体和1个Scaffolds上,含有1~3个外显子,开放阅读框(ORF)为564~765 bp,编码187~254个氨基酸,蛋白分子量为20.95~28.33 kD,等电点(pI)为5.26~7.95,不稳定指数为32.67~52.87,脂溶指数为73.87~87.60,总平均亲水性为-0.68~-0.17。
12个PYL家族蛋白均含有特征结构域PYR/PYL/RCAR,分为3个亚族。
EgPYL1和EgPYL6基因具有共线性,EgPYL4、EgPYL5、EgPYL9和EgPYL11基因具有共线性。
EgPYLs基因的启动子上含有大量植物激素响应元件、逆境胁迫响应元件和光响应元件。
EgPYLs基因在根、茎尖、叶、花和果肉中均有表达,但表达量差异较明显。
EgPYL7、EgPYL8和EgPYL9基因的表达量随果肉成熟度增加逐渐升高,在23周达峰值。
11个EgPYLs基因均受外源ABA诱导表达。
【结论】大多数PYL基因家族成员参与油棕对ABA的响应,且部分成员(如EgPYL7、EgPYL8和EgPYL9)在油棕果实发育中发挥重要的调控作用。
五种大戟科植物种子的脂肪酸的结构鉴定
喻学俭;张继跃
【期刊名称】《植物学报:英文版》
【年(卷),期】1991(033)003
【摘要】对西双版纳地区采集的五种大戟科植物——中平树(Mcaranga denticulata(Bl.)Muell-Arg.)、白楸(Mallotus paniculatus(Lam.)Muell-Arg.)、木油桐(Aleurites montana(Lour)Wis.)、叶轮木(Ostodes paniculata Bl.)及滑桃树(Trewia nudiflora L.)种子中的脂肪酸作了成分分析。
长键脂肪酸样品与2-氨基-2-甲基丙醇(AMP)缩合,生成2-取代-4,4-二甲基二氢(口恶)唑(DMOX)衍生物,再进行色谱-质谱分析。
根据质谱中特征峰的质量,可以明确地确定脂肪键上双键及其它取代基的位置。
这一方法简便有效,重现性好,能在一次分析中同时给出各成分的定性与定量结果,适合于油脂化学中脂肪酸的鉴定。
【总页数】7页(P199-205)
【作者】喻学俭;张继跃
【作者单位】不详;不详
【正文语种】中文
【中图分类】Q949.753.5
因版权原因,仅展示原文概要,查看原文内容请购买。
《Hoxc8基因与乌珠穆沁羊多脊椎性状成因关系的研究》篇一一、引言随着生物科技的快速发展,基因研究逐渐成为各领域科研工作的重点。
乌珠穆沁羊作为我国重要的畜牧业品种之一,其多脊椎性状在育种过程中具有重要意义。
本文旨在探讨Hoxc8基因与乌珠穆沁羊多脊椎性状成因之间的关系,以期为乌珠穆沁羊的遗传育种提供理论依据。
二、乌珠穆沁羊多脊椎性状概述乌珠穆沁羊以其独特的多脊椎性状而著称,这一性状不仅关系到其生长速度和肉质品质,还与其抗病能力和适应环境的能力密切相关。
多脊椎性状的形成受多种基因和环境因素的共同影响,是乌珠穆沁羊遗传育种的重要研究内容。
三、Hoxc8基因简介Hoxc8基因是一种重要的发育调控基因,参与骨骼系统的发育和形态形成。
研究表明,Hoxc8基因的变异与动物骨骼系统的性状密切相关。
因此,Hoxc8基因可能是影响乌珠穆沁羊多脊椎性状的重要因素之一。
四、Hoxc8基因与乌珠穆沁羊多脊椎性状成因关系的研究方法本研究采用分子生物学和遗传学方法,对乌珠穆沁羊的Hoxc8基因进行克隆、测序和表达分析,探究其与多脊椎性状之间的关系。
具体包括:1. 样本采集与DNA提取:采集乌珠穆沁羊的血液样本,提取基因组DNA。
2. Hoxc8基因克隆与测序:利用PCR技术扩增Hoxc8基因片段,进行克隆和测序。
3. 序列分析:对测序结果进行序列分析,比较不同个体间Hoxc8基因的差异。
4. 表达分析:通过实时荧光定量PCR技术,检测Hoxc8基因在不同组织中的表达水平。
5. 统计分析:利用生物统计学方法,分析Hoxc8基因变异与乌珠穆沁羊多脊椎性状之间的关系。
五、研究结果1. 序列分析结果:通过测序和序列分析,我们发现乌珠穆沁羊Hoxc8基因存在多种变异类型,包括单核苷酸多态性(SNP)和插入/删除突变等。
2. 表达分析结果:实时荧光定量PCR结果表明,Hoxc8基因在乌珠穆沁羊的不同组织中表达水平存在差异,且与多脊椎性状有一定的相关性。
大戟科植物分类的数值分析
徐增莱;余伯阳;徐珞珊
【期刊名称】《热带亚热带植物学报》
【年(卷),期】2004(12)5
【摘要】根据大戟科216个分类性状的分布,采用欧氏距离系数-类平均法对Webster(1994)广义大戟科49个族或亚族进行聚类分析.结果表明,现行的大戟科分类系统中,大多数族和亚族水平的分类基本合理,而Galearieae族的系统位置和五月茶族Antidesmeae等亚族的划分出现较大矛盾.该系统中未包含的方鼎木属Archileptopus,应与叶下珠族的Pseudolachnostylidinae亚族接近.
【总页数】6页(P399-404)
【作者】徐增莱;余伯阳;徐珞珊
【作者单位】中国药科大学,江苏,南京,210038;江苏省中国科学院植物研究所,江苏,南京,210014;中国药科大学,江苏,南京,210038;中国药科大学,江苏,南京,210038【正文语种】中文
【中图分类】Q949.753.509
【相关文献】
1.新疆大戟科、千屈菜科2个外来杂草新记录 [J], 马占仓; 徐文斌; 王睿; 张欢; 阎平
2.浙江大戟科一新种——仙霞岭大戟 [J], 张芬耀; 陈锋; 谢文远; 郑志鑫; 毛美红; 陈征海
3.广西大戟科新记录——台西地锦 [J], 蔡毅;侯静;黎理;梁圆;景晓彤;马雯芳
4.三岭山国家森林公园大戟科植物资源及园林应用 [J], 孙刚;王子凡;陈杰;王静;牛学礼
5.浙江大戟科植物新资料 [J], 张芬耀;陈锋;谢文远;陈征海
因版权原因,仅展示原文概要,查看原文内容请购买。
hacd2基因
HACD2基因,也被称为Ptplb,是HACD家族的第二个成员,定位于16号染色体。
HACD2基因在几乎所有的组织中均有表达,其中在前列腺组织中的表达量最高,其次是白色脂肪组织和褐色脂肪组织,以及上皮组织。
HACD2基因编码的蛋白质是长链脂肪酸向超长链脂肪酸转化的重要酶。
它位于内质网膜上,负责催化脂肪酸的延伸步骤。
此外,该基因与体重控制有关,有研究发现,在体重减轻的女性中,HACD2基因的基本表达量较低。
在肿瘤细胞的研究中,参与脂肪酸延长和多不饱和脂肪酸(PUFA)生成的基因,包括HACD2基因,通常呈现下调趋势。
为了研究HACD2基因的功能或进一步了解其作用机制,科学家们会使用基因敲除技术。
例如,HACD2基因敲除的HEK293T细胞株,是通过同时表达Cas9、目的基因的sgRNA和puromycin抗性基因而获得的。
这种细胞株可以用于研究HACD2基因的生物学功能,或者验证与该基因相关的抗体。
另外,还有HACD2基因敲除质粒,这是一种可以在动物细胞中表达Cas9、目的基因的sgRNA和puromycin抗性基因的质粒。
这种质粒可用于在动物细胞中基于CRISPR/Cas9技术敲除目的基因,或者通过包装慢病毒后进行敲除。
总之,HACD2基因在生物学和医学研究中具有重要意义,其功能和作用机制的深入研究将有助于我们更好地理解生命过程和疾病的发生发展。
第52卷 第3期2024年3月西北农林科技大学学报(自然科学版)J o u r n a l o f N o r t h w e s t A&F U n i v e r s i t y(N a t .S c i .E d .)V o l .52N o .3M a r .2024网络出版时间:2023-09-04 14:29 D O I :10.13207/j .c n k i .jn w a f u .2024.03.001网络出版地址:h t t ps ://l i n k .c n k i .n e t /u r l i d /61.1390.S .20230831.1424.010中华蜜蜂细胞吞噬与包囊作用相关基因全长转录本鉴定及分析[收稿日期] 2022-12-14[基金项目] 国家自然科学基金面上项目(32172792);国家现代农业产业技术体系建设专项资金项目(C A R S -44-K X J 7);福建农林大学硕士生导师团队项目;福建农林大学动物科学学院(蜂学学院)科研扶持项目;福建省省级大学生创新创业训练计划项目(202310389027,X 202310389084) [作者简介] 郭思佳(1998-),女,四川什邡人,在读硕士,主要从事蜜蜂分子生物学研究㊂E -m a i l :g u o s i j i a 1998@163.c o m [通信作者] 付中民(1972-),男,河北唐山人,副教授,主要从事蜜蜂科学研究㊂E -m a i l :z m f @f a f u .e d u .c n郭 睿(1987-),男,安徽六安人,副教授,主要从事昆虫-病原互作研究㊂E -m a i l :r u i gu o @f a f u .e d u .c n 郭思佳1,张凯遥1,荆 欣1,高旭泽1,冯佩林1,邹培缘1,张浩宇1,陈大福1,2,郭 睿1,2,付中民1,2(1福建农林大学动物科学学院(蜂学学院),福建福州350002;2福建省蜂疗研究所,福建福州350002)[摘 要] ʌ目的ɔ系统鉴定和分析中华蜜蜂(A pi s c e r a n a c e r a n a )吞噬与包囊作用相关基因和全长转录本,为深入开展相关基因和剪接体的功能研究奠定基础㊂ʌ方法ɔ基于前期已获得的高质量中华蜜蜂纳米孔长读段测序数据,通过B l a s t 工具将全长转录本比对N r 数据库筛选出吞噬与包囊作用相关基因和全长转录本㊂利用g f f c o m p a r e 软件将全长转录本与东方蜜蜂(A pi s c e r a n a )参考基因组上注释的转录本进行比较,鉴定未注释的新基因和新转录本㊂利用T A P I S p i p e l i n e 预测和分析吞噬与包囊作用相关基因的可变多聚腺苷酸化(a l t e r n a t i v e p o l y a d e n yl a t i o n ,A P A )位点,并通过T B t o o l s 软件鉴定A P A 位点上游的基序(m o t i f )㊂使用A s t a l a v i s t a 软件鉴定可变剪接(a l t e r n a t i v e s p l i c i n g ,A S )事件,并通过I G V 浏览器进行结构可视化㊂通过R T -P C R 验证A S 事件的真实性㊂ʌ结果ɔ共鉴定到中华蜜蜂吞噬与包囊作用相关的基因66个和全长转录本395条,发掘出东方蜜蜂参考基因组未注释的2个新基因和303条新转录本㊂对参考基因组已注释的34个基因进行了结构优化,分别延伸了18个基因的5'端和12个基因的3'端,同时延长了4个基因的5'端和3'端㊂共鉴定到含有1个及以上A P A 位点的吞噬与包囊作用相关基因47个,其中多于5个A P A 位点的基因最多,为32个㊂在A P A 位点上游鉴定到多个基序,一致性序列为:G R B G C N K S D A A C A A Y T R B -G C B M R N G G B Y A Y T A YW C N VWN G G ㊂共鉴定到吞噬与包囊作用相关基因的A S 事件296次,其中包括131次可变3'端剪接(a l t e r n a t i v e 3's pl i c e s i t e ,A 3S S )㊁85次内含子保留(i n t r o n r e t e n t i o n ,I R )㊁70次可变5'端剪接(a l t e r n a t i v e 5's p l i c e s i t e ,A 5S S )和10次外显子跳跃(e x o n s k i p p i n g,E S )㊂R T -P C R 结果显示,扩增的目的片段大小符合预期,证实了随机选择的2次A S 事件的真实性㊂ʌ结论ɔ系统鉴定了中华蜜蜂吞噬与包囊作用相关基因和全长转录本以及A S 事件和A P A 位点,优化了东方蜜蜂参考基因组注释的吞噬与包囊作用相关基因的结构㊂[关键词] 中华蜜蜂;吞噬作用;包囊作用;全长转录本;纳米孔测序;可变剪接;可变多聚腺苷酸化[中图分类号] S 895.137[文献标志码] A[文章编号] 1671-9387(2024)03-0001-10I d e n t i f i c a t i o n a n d a n a l y s i s o f f u l l -l e n g t h t r a n s c r i p t s o f ge n e s r e l a t i v e t o p h a g o c y t o s i s a n d c a p s u l a t i o n i n A pi s c e r a n a c e r a n a G U O S i j i a 1,Z H A N G K a i y a o 1,J I N G X i n 1,G A O X u z e 1,F E N G P e i l i n 1,Z O U P e i yu a n 1,Z H A N G H a o y u 1,C H E N D a f u 1,2,G U O R u i 1,2,F U Z h o n gm i n 1,2(1C o l l e g e o f A n i m a l S c i e n c e s (C o l l e g e o f B e e S c i e n c e ),F u j i a n A g r i c u l t u r e a n d F o r e s t r y U n i v e r s i t y ,F u z h o u ,F u ji a n 350002,C h i n a ;2A p i t h e r a p y R e s e a r c h I n s t i t u t e o f F u j i a n P r o v i n c e ,F u z h o u ,F u ji a n 350002,C h i n a )A b s t r a c t :ʌO b j e c t i v e ɔS y s t e m a t i c i d e n t i f i c a t i o n a n d i n v e s t i g a t i o n o f g e n e s a n d f u l l -l e n g t h t r a n s c r i pt sa s s o c i a t e d w i t h p h a g o c y t o s i s a n d c a p s u l a t i o n i n A p i s c e r a n a c e r a n a w e r e c o n d u c t e d,a i m i n g t o p r o v i d eb a-s i s f o r f u r t h e r f u nc t i o n a l s t ud y o n re l a t e d g e n e s a n d i s of o r m s.ʌM e t h o dɔB a s e d o n p r e v i o u s l yg a i n e dhi g h-q u a l i t y N a n o p o r e l o n g r e a d s e q u e n c i n g d a t a f r o m A p i s c e r a n a c e r a n a,t h e m a p p i n g o f f u l l-l e n g t h t r a n-s c r i p t s t o N r d a t a b a s e w a s c o n d u c t e d b y B l a s t t o o l t o i d e n t i f y f u l l-l e n g t h t r a n s c r i p t s r e l a t i v e t o p h a g o c y t o-s i s a n d c a p s u l a t i o n.T h e f u l l-l e n g t h t r a n s c r i p t s w e r e c o m p a r e d w i t h t h o s e a n n o t a t e d o n r e f e r e n c e g e n o m e u s i n g t h e g f f c o m p a r e s o f t w a r e t o i d e n t i f y u n a n n o t a t e d n o v e l g e n e s a n d f u l l-l e n g t h t r a n s c r i p t s.P r e d i c t i o n a n d a n a l y s i s o f a l t e r n a t i v e p o l y a d e n y l a t i o n(A P A)s i t e s w e r e c o n d u c t e d w i t h T A P I S p i p e l i n e,f o l l o w e d b y i d e n t i f i c a t i o n o f m o t i f s u p s t r e a m o f A P A s i t e s b y T B t o o l s s o f t w a r e.A s t a l a v i s t a s o f t w a r e w a s e m p l o y e d t o i d e n t i f y a l t e r n a t i v e s p l i c i n g(A S)e v e n t s f o l l o w e d b y s t r u c t u r a l v i s u a l i z a t i o n b y I G V b r o w s e r.R T-P C R w a s p e r f o r m e d t o v a l i d a t e t h e a u t h e n t i c i t y o f A S e v e n t s.ʌR e s u l tɔA t o t a l o f66g e n e s a n d395f u l l-l e n g t h t r a n-s c r i p t s r e l e v a n t t o p h a g o c y t o s i s a n d c a p s u l a t i o n i n A p i s c e r a n a c e r a n a w e r e d i s c o v e r e d,i n c l u d i n g2n e w g e n e s a n d303n e w t r a n s c r i p t s u n a n n o t a t e d o n t h e r e f e r e n c e g e n o m e o f A p i s c e r a n a.T h e s t r u c t u r e o f34 a n n o t a t e d g e n e s o f t h e r e f e r e n c e g e n o m e w a s o p t i m i z e d,a m o n g w h i c h5'e n d s o f18g e n e s a n d3'e n d s o f12 g e n e s w e r e e x t e n d e d,a n d5'e n d s a n d3'e n d s o f4g e n e s w e r e p r o l o n g e d.A d d i t i o n a l l y,47g e n e s r e l a t e d t o p h a g o c y t o s i s a n d c a p s u l a t i o n w e r e i d e n t i f i e d t o c o n t a i n o n e o r m o r e A P A s i t e s.T h e n u m b e r o f g e n e s w i t h m o r e t h a n5A P A s i t e s w a s32.M u l t i p l e m o t i f s w e r e i d e n t i f i e d i n u p s t r e a m o f A P A s i t e s,a n d t h e c o n s i s t-e n t s e q u e n c e w a s G R B G C N K S D A A C A A Y T R B G C B MR N G G B Y A Y T A YW C N VWN G G.I n t o t a l,296A S e v e n t s w e r e i d e n t i f i e d,i n c l u d i n g131a l t e r n a t i v e s3's p l i c e s i t e s(A3S S),85i n t r o n r e t e n t i o n(I R),70a l t e r-n a t i v e5's p l i c e s i t e s(A5S S)a n d10e x o n s k i p p i n g(E S).R T-P C R s h o w e d t h a t t h e s i z e s o f a m p l i f i e d f r a g-m e n t s w e r e c o n s i s t e n t w i t h e x p e c t e d s i z e s,c o n f i r m i n g t h a t t h e a u t h e n t i c i t y o f t h e2r a n d o m l y s e l e c t e d A S e v e n t s.ʌC o n c l u s i o nɔG e n e s a n d f u l l-l e n g t h t r a n s c r i p t s r e l a t i v e t o p h a g o c y t o s i s a n d c a p s u l a t i o n i n A p i s c e r-a n a c e r a n a a n d A S e v e n t s a s w e l l a s A P A s i t e s w e r e s y s t e m a t i c a l l y i d e n t i f i e d,a n d s t r u c t u r e s o f p h a g o c y t o-s i s a n d c a p s u l a t i o n-a s s o c i a t e d g e n e s w e r e o p t i m i z e d.K e y w o r d s:A p i s c e r a n a c e r a n a;p h a g o c y t o s i s;c a p s u l a t i o n;f u l l-l e n g t h t r a n s c r i p t s;N a n o p o r e s e q u e n-c i n g;a l t e r n a t i v e s p l i c i n g;a l t e r n a t i v e p o l y a d e n y l a t i o n蜜蜂是自然界最重要的授粉昆虫,在生态平衡和粮食安全方面发挥举足轻重的作用㊂中华蜜蜂(A p i s c e r a n a c e r a n a),简称中蜂,是东方蜜蜂(A p i s c e r a n a)的指名亚种,也是我国养蜂生产中使用的主要蜂种之一,经过长期的适应性进化已高度适应我国地理环境,具有重要的生态和经济价值[1]㊂近年来,以牛津纳米孔(N a n o p o r e)长读段测序技术为代表的第三代测序技术不断革新㊁突飞猛进,在组装染色体级别基因组和揭示转录组复杂性等方面应用广泛㊂由于具有超长读长的显著优势,牛津纳米孔测序技术已成功应用于可变剪接体(i s o-f o r m)㊁可变剪切(a l t e r n a t i v e s p l i c i n g,A S)和可变多聚腺苷酸化(a l t e r n a t i v e p o l y a d e n y l a t i o n,A P A)位点等的精确鉴定和分析[2-3]㊂目前,基于牛津纳米孔测序技术的全长转录组研究已见诸于橄榄果蝇(B a c t r o c e r a o l e a e)[4]㊁亚洲飞蝗(L o c u s t a m i g r a t o-r i a)[5]和椰蛀犀金龟(O r y c t e s r h i n o c e r o s)[6]等昆虫中㊂东方蜜蜂的全长转录组研究报道迄今仅有2例,L i u等[7]对长白山东方蜜蜂越冬期抗寒性的全长转录本进行了分析,确定了5941个完整的O R F 序列;蔡宗兵等[8]在中华蜜蜂中肠中鉴定到265个与细胞色素P450相关的全长转录本㊂此前,本课题组利用牛津纳米孔测序技术对蜜蜂的2种真菌病原蜜蜂球囊菌(A s c o s p h a e r a a p i s)和东方蜜蜂微孢子虫(N o s e m a c e r a n a e)进行了较为系统的全长转录组研究[9-14],但中蜂的全长转录组研究总体上仍较为滞后㊂作为无脊椎动物,蜜蜂等昆虫缺乏获得性免疫,但拥有包括细胞免疫和体液免疫在内的天然免疫系统㊂当侵入昆虫血淋巴的病原体被宿主细胞识别后,宿主的细胞免疫随即被激活,进而合成与分泌抗菌肽,抵御病原侵染[15]㊂吞噬和包囊作用是昆虫的2种重要细胞免疫反应,吞噬能直接杀死真菌孢子和外源小分子,而包囊能抵御如寄生虫等无法被吞噬的入侵者[16]㊂W a n g等[17]研究发现,棉铃虫(H e l i c o v e r p a a r m i g e r a)20E-H a E c R-H a U S P复合物刺激血淋巴中H a C T L1基因的表达,进而提高2西北农林科技大学学报(自然科学版)第52卷H a C T L1蛋白的合成与分泌,并促进细胞吞噬和包囊作用,抵抗中华卵索线虫(O v o m e r m i s s i n e n s i s)的侵袭㊂在果蝇(D r o s o p h i l a)中,TM9S F4基因突变可引起吞噬与包囊作用缺失,导致果蝇对革兰氏阴性菌更加敏感[18]㊂P a r k等[19]利用二代测序技术组装和注释了东方蜜蜂的参考基因组,但由于二代测序产生的读段较短,故该版本参考基因组仅组装到重叠群(c o n t i g)水平,东方蜜蜂参考基因组仍需要进一步完善㊂目前,人们对中蜂吞噬与包囊作用的认识非常有限,对其相关基因和全长转录组缺乏深入的研究㊂前期研究中,本课题组已利用牛津纳米孔测序技术对中华蜜蜂工蜂幼虫肠道组织进行了测序,获得了高质量的长读段数据[8]㊂在此基础上,本研究对中华蜜蜂吞噬与包囊作用相关基因和全长转录本进行了系统鉴定,对东方蜜蜂参考基因组已注释的吞噬与包囊作用相关基因进行结构优化,进而发掘和分析吞噬与包囊作用相关基因的A P A位点和A S事件,并对A S事件进行分子验证,以期丰富中华蜜蜂吞噬与包囊作用相关基因和全长转录本的相关信息,为深入开展相关基因和剪接体的功能研究奠定基础㊂1材料与方法1.1细胞吞噬与包囊作用相关基因与全长转录本的筛选与分析本课题组前期已完成中蜂幼虫4,5和6日龄肠道样品(A c4组㊁A c5组和A c6组)制备㊁R N A提取㊁c D N A建库及牛津纳米孔测序㊂A c4㊁A c5和A c6组测序结果分别获得了7338627,7003419和7434233条原始读段,其N50分别为1276,1306和1404b p,平均读长分别为1126,1126和1166 b p,最大长度分别为16628,12808和14359b p,质量值均达到Q12[8]㊂高质量的长读段测序数据可用于本研究中中蜂细胞吞噬与包囊作用相关基因和全长转录本的鉴定及分析㊂使用B l a s t工具(参数为默认设置)将鉴定到的所有全长转录本序列比对到G O(h t t p://g e n e o n t o l o g y.o r g/)㊁K E G G(h t t p s:// w w w.k e g g.j p/)和N r(h t t p s://f t p.n c b i.n l m.n i h.g o v/b l a s t/d b/F A S T A/)数据库,再根据注释信息筛选细胞吞噬与包囊作用相关基因和全长转录本㊂1.2东方蜜蜂参考基因组中已注释细胞吞噬与包囊作用相关基因的结构优化按照本课题组已建立的技术流程[12,20],利用g f f c o m p a r e软件(参数为默认设置)将本研究中鉴定到的细胞吞噬与包囊作用相关全长转录本与中蜂参考基因组(A C S N U-2.0)上已注释的转录本进行比较,以发现未注释的新基因和转录本,并对已注释基因进行结构优化㊂如果在原有基因边界之外的区域有比对读段(m a p p e d r e a d s)支持,则将基因的非翻译区向上㊁下游延伸,以修正基因的边界㊂1.3细胞吞噬与包囊作用相关基因的A P A位点鉴定与分析参照杜宇等[11]报道的方法,利用T A P I S p i p e-l i n e[21]鉴定细胞吞噬与包囊作用相关基因的A P A 位点,参数设置为:-n o r c㊁-m e m e-m i n w6㊁-m e m e-m a x w6㊁-s p a m o-s k i p㊁-f i m o-s k i p㊂通过T B t o o l s软件[22]对细胞吞噬与包囊作用相关基因A P A位点上游50b p的序列特征进行分析,以鉴定基序(m o-t i f)㊂1.4细胞吞噬与包囊作用相关基因的可变剪接分析参照陈华枝等[13]和杜宇等[11]报道的方法,使用A s t a l a v i s t a软件[23]鉴定中蜂细胞吞噬与包囊作用相关基因的A S事件类型,其中包括互斥外显子(m u t u a l l y e x c l u s i v e e x o n,M E E)㊁内含子保留(i n-t r o n r e t e n t i o n,I R)㊁外显子跳跃(e x o n s k i p p i n g, E S)㊁可变3'端剪接(a l t e r n a t i v e3's p l i c e s i t e,A3S S)和可变5'端剪接(a l t e r n a t i v e5's p l i c e s i t e,A5S S)㊂参数为默认设置㊂根据预测结果统计以上可变剪接类型数量㊂1.5细胞吞噬与包囊作用相关基因的A S事件验证中蜂幼虫取自福建农林大学动物科学学院(蜂学学院)蜜蜂保护课题组的实验蜂群㊂参照本课题组已建立的技术流程[24-26],从蜂群中提取巢脾,在实验室中将2日龄幼虫移至干净的48孔培养板,放入恒温恒湿箱,在温度为35ħ㊁相对湿度(R H)为90%的条件下饲养,分别剖取4,5和6日龄幼虫肠道组织,液氮速冻后迅速转移到-80ħ超低温冰箱保存,备用㊂为验证细胞吞噬与包囊作用相关基因的A S事件准确性,以β-a c t i n为内参基因,随机选择2种A S 类型(A3S S㊁I R)的1个基因进行R T-P C R验证㊂根据上述基因的核酸序列设计跨剪接位点的特异性引物,交由生工生物(上海)公司合成(表1)㊂以肌动蛋白基因β-a c t i n(L O C107999330)作为内参基因,将上述制备的4,5和6日龄幼虫肠道的R N A等物3第3期郭思佳,等:中华蜜蜂细胞吞噬与包囊作用相关基因全长转录本鉴定及分析质的量混合后进行反转录,获得c D N A ㊂以得到的c D N A 作为模板进行P C R 扩增,反应体系和程序参照蔡宗兵等[8]的报道进行㊂P C R 产物经3%琼脂糖凝胶电泳后使用核酸凝胶成像仪进行检测和拍照㊂表1 本研究中使用的引物序列T a b l e 1 S e q u e n c e s o f p r i m e r s u s e d i n t h i s s t u d yA S 类型T y pe of A S 基因或基因I DG e n e o r g e n e I D预测的转录本号P r e d i c t e d t r a n s c r i pt n u m b e r 序列S e qu e n c e I RL O C 107999286O N T.6127.13(444b p ),O N T.6127.3(341b p)F :5'-C T C A C G G A A C T A C C A C G G -3'R :5'-G G G A T A T T C G C C A C A A C A -3'A 3S S L O C 107999764O N T.6364.6(362b p ),O N T.6364.2(425b p)F :5'-A G A A A G A G C A T T A G G A G A -3'R :5'-G G A G T A C G T T G A A T A G G A -3'-β-a c t i n -F :5'-T T A T A TG C C A A C A C T G T C C T T T -3'R :5'-A G A A T T G A T C C A C C A A T C C A -3'注:括号中的数据为片段长度㊂N o t e :D a t a i n t h e b r a c k e t s i s t h e l e n g t h o f t r a n s c r i pt .2 结果与分析2.1 中蜂细胞吞噬与包囊作用相关基因和全长转录本的鉴定与分析试验共鉴定到吞噬相关的基因65个和全长转录本391条,包囊作用相关的基因1个和全长转录本4条,其中包括东方蜜蜂参考基因组上未注释的2个新基因和303条新转录本㊂对鉴定到的基因进行K E G G 和G O 注释,结果有62个基因注释到22条K E G G 通路(图1);有65个基因注释到53个G O 条目,其中P 值排序前20的条目见图2㊂图中数据为注释到的基因数及其占比㊂图2同D i g i t s i n d i c a t e n u m b e r s o f g e n e s a n n o t a t e d a n d i t s r a t i o .F i g.2i s t h e s a m e 图1 中蜂细胞吞噬与包囊作用相关基因的K E G G 注释F i g .1 K EG G a n n o t a t i o n s o f g e n e s r e l a t e d t o p h a g o c y t o s i s a n d c a p s u l a t i o n i n A pi s c e r a n a c e r a n a 4西北农林科技大学学报(自然科学版)第52卷图2 中蜂细胞吞噬与包囊作用相关基因的G O 注释F i g .2G O a n n o t a t i o n s o f g e n e s r e l a t e d t o p h a g o c y t o s i s a n d c a p s u l e i n A pi s c e r a n a c e r a n a 2.2 东方蜜蜂参考基因组已注释细胞吞噬与包囊作用相关基因的结构优化试验共对东方蜜蜂参考基因组上已注释的34个细胞吞噬与包囊作用相关基因的结构进行了优化,其中正链结构优化的基因为17个,负链结构优化的基因为17个;5'端延长的基因有18个,延长长度介于4~5512b p;3'端延长的基因有12个,延长长度介于1~3218b p;3'和5'端均延长的基因有4个,分别为L O C 107999172,L O C 107999330,L O C 108000752和L O C 108003556(表2)㊂表2 中蜂细胞吞噬与包囊作用相关基因结构优化的详细信息T a b l e 2 D e t a i l e d i n f o r m a t i o n o f s t r u c t u r a l o p t i m i z a t i o n o f g e n e s r e l a t e d t o p h a g o c y t o s i s a n d c a p s u l a t i o n i n A pi s c e r a n a c e r a n a 基因I DG e n e I D参考序列R e f e r e n c e s e qu e n c e 优化前的起止位置S t a r t a n d e n d s i t e s b e f o r e o pt i m i z a t i o n 优化后的起止位置S t a r t a n d e n d s i t e s a f t e r o pt i m i z a t i o n 正负链P o s i t i v e o r n e ga t i v e s t r a n d 末端E n d L O C 107998143NW _016019219.11777187-17784171771675-1778417+5'L O C 108003298NW _016019863.197472-9977891999-99778-5'L O C 107995660NW _016017456.11776644-18069261774455-1806926+5'L O C 107999172NW _016019319.1419590-429628417412-429628+5'L O C 107997445NW _016019153.11089494-11037821087610-1103782-5'L O C 107999159NW _016019319.117703-2478016575-24780-5'L O C 107994640NW _016018544.15265-71014277-7101-5'L O C 107999790NW _016019364.180049-8323779245-83237-5'L O C 107994136NW _016018344.11816913-18226661816182-1822666-5'L O C 107999764NW _016019364.1946296-958611945624-958611-5'L O C 108000406NW _016019441.1709872-713105709245-713105-5'L O C 107997632NW _016019175.11062418-10727961061901-1072796-5'L O C 108000577NW _016019442.1960650-965211960161-965211-5'5第3期郭思佳,等:中华蜜蜂细胞吞噬与包囊作用相关基因全长转录本鉴定及分析表2(续) T a b l e 2(c o n t i n u e d)基因I DG e n e I D参考序列R e f e r e n c e s e qu e n c e 优化前的起止位置S t a r t a n d e n d s i t e s b e f o r e o pt i m i z a t i o n 优化后的起止位置S t a r t a n d e n d s i t e s a f t e r o pt i m i z a t i o n 正负链P o s i t i v e o r n e ga t i v e s t r a n d 末端E n d L O C 107999330NW _016019330.11372267-13770341371781-1377034-5'L O C 108000587NW _016019442.1569024-569997568540-569997-5'L O C 108000752NW _016017512.1181972-183084181594-183084-5'L O C 107998213NW _016019219.12093759-21004742093552-2100474-5'L O C 107998677NW _016019275.1760522-765147760336-765147-5'L O C 107999232NW _016019330.1492630-495090492481-495090-5'L O C 108001305NW _016019552.1187553-189571187438-189571-5'L O C 107995080NW _016017456.1516106-518939516101-518939+5'L O C 108003556NW _016017567.12875991-28786182875987-2878618+5'L O C 107999330NW _016019330.11371781-13770331371781-1377034-3'L O C 107992565NW _016017856.1183783-185914183783-185924+3'L O C 108001195NW _016017512.1514991-517027514991-517058+3'L O C 108000752NW _016017512.1181594-182906181594-183084-3'L O C 107998372NW _016019231.11386200-13883801386200-1388790+3'L O C 107995099NW _016018567.1136406-140802136406-141304+3'L O C 107993924NW _016018256.1253448-258337253448-258848+3'L O C 107997332NW _016017457.1590209-593951590209-594488+3'L O C 108003264NW _016017556.1192600-196182192600-196785+3'L O C 107992702NW _016017899.1 211-1820211-2563+3'L O C 107999172NW _016019319.1417412-428815417412-429628+3'L O C 108000484NW _016019441.14376457-43802124376457-4381188+3'L O C 108003556NW _016017567.12875987-28772962875987-2878618+3'L O C 108002524NW _016017455.1845010-847931845010-849556+3'L O C 122719477NW _016017767.1310646-314815310646-318033+3'L O C 107995086NW _016018567.1848331-849310848331-849899+3'2.3 中蜂细胞吞噬与包囊作用相关基因的A P A位点鉴定与分析试验共鉴定到含有1个及以上A P A 位点的细胞吞噬与包囊作用相关基因47个(图3),其中多于5个A P A 位点的基因最多,为32个;含有1个A P A 位点的基因次之,为6个;含有2个和3个A P A 位点的基因均为4个;含有4个A P A 位点的基因为1个㊂此外,在细胞吞噬与包囊作用相关基因的A P A 位点上游鉴定到多个基序,一致性序列为:G R B G C N K S D A A C A A Y T R B G C B M R N G G B Y -A Y T A YW C N VWN G G (图4)㊂图3 不同数量A P A 位点中蜂细胞吞噬与包囊作用相关基因的分布F i g.3 D i s t r i b u t i o n o f d i f f e r e n t n u m b e r s o f A P A s i t e s o f g e n e s r e l a t e d t o p h a g o c y t o s i s a n d c a p s u l e i n A pi s c e r a n a c e r a na 图4 中蜂细胞吞噬与包囊作用相关基因的一致性基序F i g .4 M o t i f s o f g e n e s r e l a t e d t o p h a g o c y t o s i s a n d c a p s u l a t i o n i n A pi s c e r a n a c e r a n a 6西北农林科技大学学报(自然科学版)第52卷2.4 中蜂细胞吞噬与包囊作用相关基因的A S 事件鉴定与分析试验共鉴定到细胞吞噬与包囊作用相关基因的296次A S 事件,其中数量最多的类型是可变3'端剪接(A 3S S ,131次),其次为内含子保留(I R ,85次)和可变5'端剪接(A 5S S ,70次),数量最少的类型为外显子跳跃(E S ,10次)(图5)㊂部分细胞吞噬与包囊作用相关基因的A S 事件详细信息见表3㊂表3 细胞吞噬与包囊作用相关基因的可变剪接事件(A S)详细信息(仅展示6个)T a b l e 3 D e t a i l i n f o r m a t i o n o f a l t e r n a t i v e s p l i c i n g e v e n t s o c c u r r e d i n p h a g o c yt o s i s a n d c a p s u l a t i o n r e l e v a n t g e n e s (s i x d i s p l a y e d o n l y)基因I DG e n e I D转录本I DT r a n s c r i pt I D A S 事件类型A S e v e n t t y pe 参考序列R e f e r e n c e s e q u e n c e 链属S t r a n d t y pe 区域R e gi o n L O C 107999286O N T.6127.13,O N T.6127.3I RNW _016019330.1C 3148146-3148035L O C 107999764O N T.6364.6,O N T.6364.2A 3S S NW _016019364.1C 949340-949306L O C 107999286O N T.6127.7,O N T.6127.2E SNW _016019330.1C3172740-3172667L O C 107995660O N T.309.1,O N T.309.2A 5S S NW _016017456.1W 1780668-1780704L O C 107995099O N T.3315.1,O N T.3315.3A 3S S NW _016018567.1W 137912-137926L O C 107992565O N T.1750.1,O N T.1750.2I R NW _016017856.1W183906-184992注:C 和W 分别代表负义链和正义链㊂N o t e :C a n d W r e p r e s e n t n o n s e n s e s t r a n d a n d s e n s e s t r a n d ,r e s p e c t i v e l y.图5 中蜂细胞吞噬与包囊作用相关基因的A S 事件类型F i g .5 T y p e s o f A S e v e n t s i n g e n e s r e l a t e d t o p h a g o c yt o s i s a n d c a p s u l a t i o n i n A pi s c e r a n a c e r a n a 2.5 中蜂细胞吞噬与包囊作用相关基因的A S 事件验证随机选择2种A S 事件类型进行R T -P C R 验证,结果(图6)显示,L O C 107999764基因可检测到2条转录本,大小分别约为425和362b p ,与基于测序数据预测出的O N T.6364.2和O N T 6364.6的大小(表1)一致;L O C 107999286基因可检测到2条转录本,大小分别约为444和341b p,与基于测序数据预测出的O N T.6127.3和O N T.6127.13的大小(表1)一致㊂上述结果表明,本研究鉴定到的A S 事件真实可靠㊂A ,C .A 3S S 和I R 的可变剪接事件类型示意图,方框表示外显子,直线表示内含子,箭头表示转录方向;B ,D.L O C 107999764和L O C 107999286扩增产物的琼脂糖凝胶电泳A a n d C s h o w t y p e s o f a l t e r n a t i v e s p l i c i n g e v e n t s o c c u r r e d i n A 3S S a n d I R ,r e c t a n g l e s r e p r e s e n t e x o n s ,a n d b l a c k l i n e s r e pr e s e n t i n t r o n s ,a r r o w i n d i c a t e d i r e c t i o n o f t r a n s c r i p t i o n ;B a n d D s h o w a g a r o s e g e l e l e c t r o p h o r e s i s f o r a m pl i f i e d pr o d u c t s f r o m L O C 107999764a n d L O C 107999286图6 中蜂2个基因可变剪接事件的P C R 验证F i g .6 P C R v a l i d a t i o n o f a l t e r n a t i v e s p l i c i n g e v e n t s o c c u r r e d i n t w o g e n e s i n A pi s c e r a n a c e r a n a 7第3期郭思佳,等:中华蜜蜂细胞吞噬与包囊作用相关基因全长转录本鉴定及分析3讨论此前,P a r k等[19]利用二代测序技术组装和注释了东方蜜蜂的参考基因组(A C S N U-2.0),该版本的基因组大小约为238M b,共包含10651个编码基因,其中注释到吞噬作用的基因和转录本数目分别为95个和182条,注释到包囊作用的基因和转录本数目分别为1个和1条㊂基于已获得的高质量牛津纳米孔测序数据,本研究共鉴定到中蜂吞噬作用相关的基因65个和全长转录本391条,包囊作用相关的基因1个和全长转录本4条,其中包括参考基因组上未注释的新基因2个和新转录本303条㊂这为持续深入开展中蜂吞噬与包囊作用相关基因和i s o-f o r m的研究提供了宝贵的材料㊂U T R主要通过顺式调节元件和R N A结合蛋白(或小R N A反式作用因子)之间的动态相互作用来调节特定的m R N A的代谢和翻译[27]㊂3'U T R 参与m i R N A或以蛋白质为基础的m R N A的降解机制,而5'U T R影响m R N A的翻译效率[28]㊂本研究共对东方蜜蜂参考基因组上已注释的34个吞噬与包囊作用相关基因结构进行优化,延长了18个基因的5'U T R(延长长度介于4~5512b p)和12个基因的3'U T R(延长长度介于1~3218b p),同时延长了4个基因的5'U T R和3'U T R㊂这为进一步开展上述中蜂吞噬与包囊作用相关基因表达调控的深入研究提供了重要基础㊂A P A通过产生编码序列或3'U T R不同的异构体,从而调节目标R N A的功能㊁稳定性㊁定位和翻译效率,促进转录组的复杂性[29]㊂哺乳动物基因组中有50%~80%的基因发生A S和A P A,进而产生数量众多的剪接异构体[30];在人(H o m o s a p i e n s)中,至少有70%的基因含有A P A位点[31-32];在小鼠(M u s m u s c u l u s)中,32%的表达基因经历A P A[33];在水稻(O r y z a s a t i v a)中,约48%的基因含有A P A 位点[34];在小麦(T r i t i c u m a e s t i v u m)中,有31%的基因含有A P A位点[35];在拟南芥(A r a b i d o p s i s t h a l i a n a)中,超过60%的基因含有A P A位点[36]㊂本研究鉴定到中蜂吞噬与包囊作用相关的66个基因,其中有47(约71.2%)个基因含有1个及以上的A P A位点,表明中蜂吞噬与包囊作用相关的基因多数发生A P A㊂其中,多于5个A P A位点的基因最多,这与他人对热带爪蟾(X e n o p u s t r o p i c a l i s)[37]和蜜蜂球囊菌[11]等物种的研究报道一致㊂但在高粱[38]和草地贪夜蛾(S p o d o p t e r a f r u g i p e r d a)[39]等物种中,含2个A P A位点的基因最为丰富㊂上述结果表明,不同物种中,A P A位点数的分布规律存在差异㊂此外,在吞噬与包囊作用相关基因的A P A 位点上游鉴定到多个基序,一致性序列为:G RB G C-N K S D A AC A A Y T R B G C B M R N G G B Y A Y T A YW-C N VWN G G㊂人类基因的A P A位点上游存在1个经典m o t i f(A A U A A A),该基序同样存在于果蝇基因A P A位点上游[40]㊂M a等[35]在小麦基因的A P A位点上游鉴定到多个基序,其中出现频率最高的是A A U A A A㊁A U A U A U和U A U A U A㊂玉米(Z e a m a y s)基因的A P A位点上游出现频率前3位的基序为:A A U A A A㊁A U A U A U和U A U A U A[41]㊂本课题组在东方蜜蜂微孢子虫基因的A P A位点上游发现3个基序:A A U A A A㊁U G A U G C和G C G A C G[13],在蜜蜂球囊菌基因的A P A位点上游鉴定到4个基序:A U G A U A A㊁C A U G A A C㊁G U U C A A U和U C A U C A U[42]㊂以上结果表明,A P A上游基序具有一定的种属特异性㊂W a n g等[30]研究发现,哺乳动物基因进化过程中聚腺苷酸化位点(p o l y a d e n y l a t i o n s i t e s,P A S)选择对A P A施加进化压力的基因特征包括基因年龄㊁基因表达模式和基因功能㊂本研究鉴定到的基序与其他物种中A P A位点上游的基序均不相同,推测可能是由于高分化细胞一般倾向于使用远端P A S,导致具有较长3'U T R的转录本表达,而生长较快的细胞则倾向于使用近端P A S,产生较短的3'U T R,从而导致产生的转录本具有潜在的高表达水平[43]㊂A S 在基因的功能多样性中扮演着重要的角色,由A S 产生的蛋白质异构体在酶活性㊁定位或稳定性等方面存在差异,从而影响细胞的活动[44]㊂本研究共鉴定到吞噬与包囊作用相关基因的296次A S事件,说明中蜂吞噬与包囊作用相关基因广泛发生A S㊂其中,最丰富的A S事件类型是A3S S(131次),其次是I R(85次),数量最少的为E S(10次)㊂在硝酸盐胁迫条件下,大豆(G l y c i n e m a x L.)根系中R I 和A3S S是最常见的A S类型,其中A3S S产生的剪接异构体的相对表达量在不同硝酸盐条件差异显著[45]㊂L e v e s q u e等[46]报告了第一个关于癌症中A3S S使用的全基因组研究,强调了乳腺癌中数百个不同剪接的事件,表明A3S S在乳腺癌整体剪接网络中具有重要作用㊂I R和A3S S主要涉及调节前体m R N A产生不同的成熟剪接体,调节细胞中基因的表达,然后影响编码蛋白的功能[47]㊂本研究通过R T-P C R对随机选择2种A S事件类型进行验8西北农林科技大学学报(自然科学版)第52卷证,结果显示L O C107999764和L O C107999286均能扩增出2条转录本,大小与基于测序数据的预测结果一致,表明中蜂吞噬与包囊作用相关基因的A S 事件真实可靠㊂[参考文献][1]曾志将.养蜂学[M].北京:中国农业出版社,2017.Z e n g Z J.A p i c u l t u r e[M].B e i j i n g:C h i n a A g r i c u l t u r e P r e s s, 2017.[2] D e a m e r D,A k e s o n M,B r a n t o n D.T h r e e d e c a d e s o f n a n o p o r es e q u e n c i n g[J].N a t u r e B i o t e c h n o l o g y,2016,34(5):518-524.[3] W a n g Y,Z h a o Y,B o l l a s A,e t a l.N a n o p o r e s e q u e n c i n g t e c h n o-l o g y,b i o i n f o r m a t i c s a n d a p p l i c a t i o n s[J].N a t u r e B i o t e c h n o l o-g y,2021,39(11):1348-1365.[4] B a y e g a A,O i k o n o m o p o u l o s S,G r e g o r i o u M E,e t a l.N a n o p o r el o n g-r e a d R N A-s e q a n d a b s o l u t e q u a n t i f i c a t i o n d e l i n e a t e t r a n-s c r i p t i o n d y n a m i c s i n e a r l y e m b r y o d e v e l o p m e n t o f a n i n s e c t p e s t[J].S c i e n t i f i c R e p o r t s,2021,11(1):7878.[5] J i a n g F,Z h a n g J,L i u Q,e t a l.L o n g-r e a d d i r e c t R N A s e q u e n-c i n g b y5'-C a p c a p t u r i n g r e v e a l s t h e i m p a c t o f P i w i o n t h ew i d e s p r e a d e x o n i z a t i o n o f t r a n s p o s a b l e e l e m e n t s i n l o c u s t s [J].R N A B i o l o g y,2019,16(7):950-959.[6] F i l i p o v i c I,H e r e w a r d J P,R aši c G,e t a l.T h e c o m p l e t e m i t o-c h o nd r i a l ge n o m e s e q u e n c e of O r y c t e s r h i n o c e r o s(C o l e o p t e r a:S c a r a b a e i d a e)b a s e d o n l o n g-r e a d n a n o p o r e s e q u e n c i n g[J].P e e r J,2021,9:e10552.[7] L i u N N,R e n Z Y,R e n Q D,e t a l.F u l l l e n g t h t r a n s c r i p t o m e sa n a l y s i s o f c o l d-r e s i s t a n c e o f A p i s c e r a n a i n C h a n gb a i M o u n-t a i n d u r i n g o v e r w i n t e r i n g p e r i o d[J].G e n e,2022,830:146503.[8]蔡宗兵,王紫馨,吴鹰,等.中华蜜蜂细胞色素P450相关基因和全长转录本的鉴定及分析[J].昆虫学报,2023,66(1):11-18.C a i Z B,W a n g Z X,W u Y,e t a l.I d e n t i f i c a t i o n a n d a n a l y s i s o fg e n e s a n d f u l l-l e n g t h t r a n s c r i p t s r e l a t e d t o c y t o c h r o m e P450i nA p i s c e r a n a c e r a n a[J].A c t a E n t o m o l o g i c a S i n i c a,2023,66(1):11-18.[9]隆琦,余岢骏,吴鹰,等.蜜蜂球囊菌菌丝和孢子中毒力因子相关全长转录本的鉴定及分析[J].应用昆虫学报,2021,58(5):1073-1082.L o n g Q,Y u K J,W u Y,e t a l.I d e n t i f i c a t i o n a n d a n a l y s i s o f v i-r u l e n c e f a c t o r-r e l a t e d f u l l-l e n g t h t r a n s c r i p t s i n A s c o s p h a e r a a-p i s m y c e l i u m a n d s p o r e s[J].C h i n e s e J o u r n a l o f A p p l i e d E n t o-m o l o g y,2021,58(5):1073-1082.[10]杜宇,祝智威,王杰,等.利用第三代纳米孔长读段测序技术构建和注释蜜蜂球囊菌的全长转录组[J].中国农业科学, 2021,54(4):864-876.D u Y,Z h u Z W,W a n g J,e t a l.C o n s t r u c t i o n a n d a n n o t a t i o n o fA s c o s p h a e r a a p i s f u l l-l e n g t h t r a n s c r i p t o m e u t i l i z i n g n a n o p o r et h i r d-g e n e r a t i o n l o n g-r e a d s e q u e n c i n g t e c h n o l o g y[J].S c i e n t i aA g r i c u l t u r a S i n i c a,2021,54(4):864-876.[11]杜宇,王杰,蒋海宾,等.基于第三代长读段测序数据解析蜜蜂球囊菌基因的可变剪切与可变腺苷酸化[J].微生物学报,2021,61(3):667-682.D u Y,W a n g J,J i a n g H B,e t a l.A n a l y s i s o f a l t e r n a t i v e s p l i c i n ga n d p o l y a d e n y l a t i o n o f A s c o s p h a e r a a p i s g e n e sb a s e d o nt h i r d-g e n e r a t i o n l o n g-r e a d s e q u e n c i n g d a t a s e t[J].A c t a M i-c r o b i o l o g i c a S i n i c a,2021,61(3):667-682.[12]陈华枝,范元婵,蒋海宾,等.基于纳米孔全长转录组数据完善东方蜜蜂微孢子虫的基因组注释[J].中国农业科学,2021, 54(6):1288-1300.C h e n H Z,F a n Y C,J i a n g H B,e t a l.I m p r o v e m e n t o f N o s e m ac e r a n a e g e n o m e a n n o t a t i o n b a s ed o n n a n o p o ref u l l-l e ng t ht r a n s c r i p t o m e d a t a[J].S c i e n t i a A g r i c u l t u r a S i n i c a,2021,54(6):1288-1300.[13]陈华枝,范小雪,范元婵,等.东方蜜蜂微孢子虫基因的可变剪接及可变腺苷酸化解析[J].菌物学报,2021,40(1):161-173.C h e n H Z,F a n X X,F a n Y C,e t a l.A n a l y s i s o f a l t e r n a t i v es p l i c i n g a n d a l t e r n a t i v e p o l y a d e n y l a t i o n o f N o s e m a c e r a n a eg e n e s[J].M y c o s y s t e m a,2021,40(1):161-173.[14]陈华枝,杜宇,范小雪,等.基于第三代纳米孔测序技术的东方蜜蜂微孢子虫全长转录组构建及注释[J].昆虫学报, 2020,63(12):1461-1472.C h e n H Z,D u Y,F a n X X,e t a l.C o n s t r u c t i o n a n d a n n o t a t i o no f t h e f u l l-l e n g t h t r a n s c r i p t o m e o f N o s e m a c e r a n a e b a s e d o nt h e t h i r d-g e n e r a t i o n n a n o p o r e s e q u e n c i n g t e c h n o l o g y[J].A c-t a E n t o m o l o g i c a S i n i c a,2020,63(12):1461-1472. [15] S t r a n d M R.T h e i n s e c t c e l l u l a r i mm u n e r e s p o n s e[J].I n s e c tS c i e n c e,2008,15:1-14.[16]吴姗,凌尔军.昆虫细胞免疫反应中的吞噬㊁集结和包囊作用[J].昆虫学报,2009,52(7):791-798.W u S,L i n g E J.P h a g o c y t o s i s,n o d u l a t i o n a n d e n c a p s u l a t i o n i nc e l l u l a r i mm u n e r e s p o n s e s i n i n s e c t s[J].A c t a E n t o m o l o g i c aS i n i c a,2009,52(7):791-798.[17]W a n g G J,W a n g W W,L i u Y,e t a l.S t e r o i d h o r m o n e20-h y d r o x y e c d y s o n e p r o m o t e s C T L1-m e d i a t e d c e l l u l a r i mm u n i t yi n H e l i c o v e r p a a r m i g e r a[J].I n s e c t S c i e n c e,2021,28(5):1399-1413.[18] B e r g e r e t E,P e r r i n J,W i l l i a m s M,e t a l.T M9S F4i s r e q u i r e df o r D r o s o p h i l a c e l l u l a r i mm u n i t y v i a c e l l a d h e s i o n a n d p h a-g o c y t o s i s[J].J o u r n a l o f C e l l S c i e n c e,2008,121(P t20):3325-3334.[19] P a r k D,J u n g J W,C h o i B S,e t a l.U n c o v e r i n g t h e n o v e l c h a-r a c t e r i s t i c s o f A s i a n h o n e y b e e,A p i s c e r a n a,b y w h o l e g e-n o m e s e q u e n c i n g[J].B M C G e n o m i c s,2015,16(1):1. [20]杜宇,付中民,祝智威,等.基于蜜蜂球囊菌纳米孔测序数据的基因非翻译区延长㊁S S R位点发掘及未注释基因和转录本鉴定[J].昆虫学报,2020,63(11):1345-1357.D u Y,F u Z M,Z h u Z W,e t a l.E l o n g a t i o n o f g e n i c u n t r a n s-l a t e d r e g i o n s,e x p l o r a t i o n o f S S R l o c i a n d i d e n t i f i c a t i o n o fu n a n n o t a t e d g e n e s a n d t r a n s c r i p t s b a s e d o n t h e N a n o p o r e s e-q u e n c i n g d a t a s e t o f A s c o s p h a e r a a p i s[J].A c t a E n t o m o l o g i c aS i n i c a,2020,63(11):1345-1357.[21] A b d e l-G h a n y S E,H a m i l t o n M,J a c o b i J L,e t a l.A s u r v e y o f9第3期郭思佳,等:中华蜜蜂细胞吞噬与包囊作用相关基因全长转录本鉴定及分析。
第49卷第6期2020年11月福建农林大学学报(自然科学版)Journal of Fujian Agriculture and Forestry University ( Natural Science Edition )巨桉GOLDEN2-LIKE 基因家族全基因组鉴定与进化分析李丁宁「,吴进樟「,李白杨2,曹世江1(1.福建农林大学林学院;2.福建农林大学植物保护学院,福建福州350002)摘要:利用生物信息学方法,基于全基因组水平筛选鉴定出40个巨桉GLK 基因(EgG1~ EgG40),对其分子质量、等电点和亲水性进行了预测.结果表明,这些基因非均匀地分布在11条染色体上,亚细胞定位主要在细胞质和细胞核上.GLK 蛋白二 级结构主要以a-螺旋和无规则卷曲为主.系统进化分析将巨桉GLK 基因分为I 、D 、皿、W 和V 等5个亚家族.该家族基因 含有1~11个外显子,基因结构相对保守.结果表明巨桉GLK 基因在成熟叶、茎尖和幼叶中表达较高,而在木质部中表达相对较低.关键词:巨桉;G0LDEN2-LIKE 基因;全基因组鉴定;进化分析中图分类号:S792.39 文献标识码:A 文章编号:1671-5470(2020)06-0816-09DOI :10.13323/ki.j.fafu(nat.sci.) .2020.06.016开放科学(资源服务) 标识码(0SID )Genome-wide identification and evolutionary analysis of GOLEDEN2-LIKEgene family of Eucalyptus grandisLI Dingning 1 , WU Jinzhang 1 , LI Baiyang 2, CAO Shijiang 1(1.College of Forestry ; 2.College of Plant Protection , Fujian Agriculture andForestry University , Fuzhou , Fujian 350002, China )Abstract : Forty G0LDEN2-LIKE ( GLK) genes ( EgG1_EgG40) of Eucalyptus grandis were screened and identified by bioinfor^nat-ics method at the whole-genome level , and their molecular weight , isoelectric point and hydrophilicity were estimated. The results showed that these genes were unevenly distributed on 11 chronosones, and the subcellular localization was nainly located on the cy toplasm and nucleus. The secondary structures of GLK protein were mainly a-helix and random coil. According to phylogenetic anal ysis ,the EgGLK genes can be divided into 5 subfamilies ( I -M ). The genes of this family contained 1-11 exons , and the genestructure was relatively conservative. Analysis of the gene expression patterns revealed that the EgGLK gene was mainly expressed in mature leaves, stem tips and young leaves, but relatively low in xylem.Key words : Eucalyptus grandis ; GOLDEN2-LIKE gene ; genome-wide identification ; evolutionary analysisGOLDEN2-LIKE(GLK)是植物特有的一类转录因子,在叶绿体发育、果实品质、生物胁迫和非生物胁迫、植物衰老和激素影响等方面有着重要作用[I]-GLK 转录因子属于GARP 超家族中的一员,此外该超家族还包括拟南芥中的ARR-B 蛋白和衣藻中的PSR1(磷酸盐匮乏响应子)[2].GLK 基因家族与GARP 超家族其他成员的区别在于它有两个高度保守的结构域[3].glk 最先在玉米中作为能够引起植株黄化的基因 而被发现⑷,随后在小立碗藓(Physcomitrella patens )、拟南芥(Arabidopsis thaliana )、水稻(Oiyza sativa )、辣椒(Capsicum annuum L.)、番茄(Solanum lycopersicum )的核基因组中均发现GLK 转录因子参与调控核定位 的叶绿体蛋白以及与光合作用相关基因的表达[3,5-8].GLK 基因在不同类型植物光合细胞中的表达是不同的,在C4植物中GLK 基因主要在叶片中的维管束细胞(bundle sheath )和叶肉细胞(mesophyll)中表达,而在C3植物中该基因只在叶肉细胞中表达[3,8] •研究发现GLK 基因是通过基因对的形式共同调控叶绿体的收稿日期:2020-05-07修回日期:2020-07-12基金项目:福建农林大学林学高峰学科建设项目(71201800739).作者简介:李丁宁(2000-),女•研究方向:林木遗传育种.Email :**********************•通信作者曹世江(1984-),男,讲师,博士.研究方向: 林木遗传育种.Email : csjiang1123@ .第6期李丁宁等:巨桉G0LDEN2-LIKE基因家族全基因组鉴定与进化分析-817-发育,且在拟南芥和苔藓中GLK基因功能表达存在冗余现象,单个基因突变导致缺少的功能由另外一条基因补充[5,7'8].拟南芥中GLK转录因子调控长角果果色和叶片发育,并且过表达该转录因子可以影响拟南芥根部叶绿体的发育[5,9].辣椒中GLK基因通过调节叶绿体大小来控制叶绿素含量,同时调控未成熟果实颜色自然变化的数量性状位点[1°].在番茄中,GLK基因通过调控叶绿体的发育来改变成熟果实中糖类和类胡萝卜素的含量,影响果实的品质[11],而过表达SIGLK1和SIGLK2两个基因均可提高成熟番茄的营养价值[12],但是S1GLK2转录因子会与CUL4-DDB1-DET1E3复合物发生反应,导致S1GLK2蛋白被降解[|3].桉树(Eucalyptus)作为世界三大速生树种之一,具有重要的经济、生态和社会价值[14],为造纸和木材工业提供了大量的原材料,具有成为新型生物质能源树种的潜力.桉树在生长过程中常因遭受不良环境因素影响而造成木材生长速度、质量以及抗逆性等方面的不足.据报道[15],桉树焦枯病对桉树幼苗和人工幼林造成极大危害,严重时会导致整株枯死,而GLK蛋白在植物逆境应答和生长发育方面发挥着极其重要的作用.目前,还未见有关巨桉(Eucalyptus grandis)中GLK基因家族功能的报道.本研究利用生物信息学方法在全基因组水平对巨桉GLK基因家族进行染色体定位、蛋白质理化性质、基因结构特征、蛋白质结构、系统进化以及组织表达模式等全方面分析,为巨桉GLK基因功能的进一步解析提供依据.1材料与方法1.1GLK家族基因序列的提取从Phytozome数据库下载巨桉和番茄的基因序列信息.1.2巨桉GLK蛋白的筛选及染色体定位首先从Pfam数据库获得结构域PF00249.31,并在HMMER中对巨桉所有蛋白质序列进行保守序列筛选,标准e值小于1,大致筛选出含有Myb_DNA-binding结构域的序列,然后用SMART再次筛选,最终得到4°条巨桉GLK的蛋白质序列.利用ExPASy在线网站(https:///protparam)预测GLK 蛋白的一些基本理化性质.根据JGI数据库获得的基因在染色体上的定位信息,采用MG2C在线软件绘制染色体定位图.1.3系统进化树构建、基因结构分析及GLK蛋白结构分析通过Clustal X对巨桉和番茄GLK蛋白的序列进行多序列比对,利用MEGA6软件邻接法构建GLK基因家族系统进化树,校验参数Bootstrap设定为100°.利用Phytozome数据库获得巨桉GLK的基因组序列以及CDS序列,通过在线软件GSDS(http:///)对其基因结构进行分析.利用S0PMA分析蛋白序列二级结构.利用SWISS-M0DEL(https:///)在线建模得到巨桉GLK蛋白三级结构.I.4巨桉GLK基因家族的表达量分析通过Phytozome数据库(https://)下载巨桉未成熟木质部、成熟木质部、韧皮部、成熟叶、新叶和茎尖的GLK家族基因的表达数据,绘制基因表达热图.2结果与分析2.1巨桉GLK蛋白的鉴定及其理化性质采用生物信息学方法,从巨桉全基因组中鉴定出4°个GLK基因,并命名为EgG1~EgG4°(表1).GLK 基因编码1°1~688个氨基酸,其中EgG37的分子质量最大,为74.964ku;而EgG15的分子质量最小,为II.69°ku.4°个GLK蛋白的等电点为4.77~1°.22,有12个碱性蛋白(EgG2、EgG8、EgG9、EgG12、EgG15、EgG16、EgG17、EgG18、EgG19、EgG26、EgG31和EgG32),中性蛋白只有一个(EgG34),其余均为酸性蛋白.由亲水性指数分析可知,GLK基因家族编码的蛋白均为亲水蛋白.亚细胞定位预测结果表明,EgGLK基因家族主要在细胞质和细胞核中表达.-818-福建农林大学学报(自然科学版)第49卷Table1表1巨桉GLK转录因子家族的基本信息Basic information of the GLK transcription factor family in E.grandis基因名登录号蛋白长度分子质量等电点亲水性指数染色体定位亚细胞定位aa uEgG1Eucgr.A0018966872504.39 5.81-0.445Chr01:7805221..7809813细胞核EgG2Eucgr.A0051714416285.687.02-0.344Chr01:17444835..17446416微体(过氧化物酶体)EgG3Eucgr.A0132348453070.55 5.21-0.812Chr01:8233113..8239446叶绿体基质EgG4Eucgr.A0185746750954.10 6.01-0.673Chr01:33608330..33612765细胞核EgG5Eucgr.A0192117119053.88 4.77-0.817Chr01:34530669..34532062细胞质EgG6Eucgr.A0203121224059.79 5.83-0.831Chr01:35741939..35746799线粒体基质EgG l Eucgr.A0208237741747.57 6.82-0.727Chr01:36277691..36280320细胞核EgG8Eucgr.A0220130932763.849.25-0.451Chr01:37382917..37384778微体(过氧化物酶体)EgG9Eucgr.A0244438442957.857.63-0.757Chr01:39776908..39779403细胞质EgG10Eucgr.B0215537140932.61 5.20-0.759Chr02:40667707..40672664叶绿体基质EgG11Eucgr.B0231333637255.93 4.77-0.841Chr02:42073119..42074948细胞核EgG12Eucgr.B0262728631746.748.19-0.640Chr02:46202988..46206837线粒体基质EgG13Eucgr.C0415547952138.75 6.60-0.824Chr03:78649962..78652848细胞质EgG14Eucgr.D0097230833078.83 6.50-0.725Chr04:21132122..21137252微体(过氧化物酶体)EgG15Eucgr.D0134610111689.9010.22-0.109Chr04:17250462..17250970线粒体基质EgG16Eucgr.D0222537541990.759.33-0.844Chr04:35765713..35770752细胞质EgG17Eucgr.D0261129332064.099.04-0.692Chr04:40020902..40024966细胞质EgG18Eucgr.E0023438843135.719.14-0.794Chr05:2267724..2273201细胞质EgG19Eucgr.E0024634638620.759.17-0.731Chr05:2412510..2421762细胞质EgG20Eucgr.E0275419021601.73 5.59-0.974Chr05:48944350..48945391叶绿体基质EgG21Eucgr.E0423232936040.02 5.69-0.780Chr05:74981964..74988000细胞质EgG22Eucgr.F0289645049407.98 6.70-0.630Chr06:41128595..41132747叶绿体基质EgG23Eucgr.F0405549854973.18 5.62-0.716Chr06:51329899..51336284细胞核EgG24Eucgr.F0447535839694.62 6.59-0.735Chr06:57276036..57278443微体(过氧化物酶体)EgG25Eucgr.G0150340744709.24 6.48-0.706Chr07:24195911..24199198细胞质EgG26Eucgr.G0234339443255.477.04-1.020Chr07:44100593..44103437细胞质EgG27Eucgr.G0249435339241.02 6.57-0.747Chr07:45799252..45801435细胞质EgG28Eucgr.l10005531333816.32 6.08-0.334Chr08:4287466..4292435细胞质EgG29Eucgr.110199342548317.01 6.00-1.017Chr08:20710917..20713708线粒体基质EgG30Eucgr.I0117837040274.79 5.59-0.696Chr09:22723451..22725940细胞核EgG31Eucgr.J0018240445164.488.59-0.851Chr10:1909756..1911619微体(过氧化物酶体)EgG32Eucgr.J0190413615323.269.37-0.779Chr10:24412949..24413573叶绿体基质EgG33Eucgr.K0105645948814.58 6.12-0.549Chr11:13546489..13549812细胞核EgG34Eucgr.K0147641945984.747.00-0.622Chr11:18158377..18161567细胞质EgG35Eucgr.K0167030132447.42 6.43-0.543Chr11:19659447..19661493微体(过氧化物酶体)EgG36Eucgr.K0296636641802.11 6.48-1.071Chr11:37110402..37113349微体(过氧化物酶体)EgG37Eucgr.C0038068874964.13 5.61-0.523Chr03:6065170..6069823细胞核EgG38Eucgr.10469357264221.54 5.64-0.549Chr08:65832185..65836257微体(过氧化物酶体)EgG39Eucgr.G0209467772986.17 5.99-0.373Chr07:40710921..40719657细胞核EgG40Eucgr.E0030855762253.87 5.50-0.668Chr05:2880990..2887358细胞质2.2巨桉GLK基因家族染色体定位从图1可知:40个GLK基因非均匀地分布于11条染色体上,基因数目分别为9、3、2、4、5、3、4、3、1、2和4个.根据基因在进化树上的位置及序列间的同源性分析得到6个旁系同源基因对:EgG7/EgG34、EgG5/EgG20、EgG31/EgG36、EgG18/EgG19、EgG1/EgG39 和EgG37/EgG38.只有EgG18/EgG19在同一条染色体上,其余5个同源基因对均不在同一条染色体上.根据这些旁系同源基因对在染色体上的位置分布,推测这6个旁系同源基因对都来源于片段复制.2.3巨桉GLK基因家族系统进化及基因结构为了进一步了解巨桉GLK家族基因的功能和特征,对鉴定到的40个巨桉和已经报道的番茄(54个)GLK基因的氨基酸序列构建系统进化树(图2).结果表明,GLK家族基因明显聚类于5个亚族(I、H、皿、W和V),其中I~V每个亚族中均有巨桉和番茄分布,分别包含13、8、4、5、10个巨桉GLK蛋白和19、12、6、4、9个番茄GLK蛋白,但是M亚族只有4个番茄家族成员.此外,EgG14和SlG26、EgG28和SlG29、EgG24和SlG41、EgG27和SlG10、EgG12和SlG6、EgG15和SlG3、EgG32和SlG16、EgG22和SlG9、EgG29和SlG1、EgG25和SlG4、EgG26和SlG11、EgG13和SlG40、EgG11和SlG19、EgG4与SlG21蛋白进化关系极为第6期李丁宁等:巨桉G0LDEN2-LIKE 基因家族全基因组鉴定与进化分析・819・接近,由此可知两物种的这些GLK 基因序列的同源性较高.ChromO 1Chrom02ChromOS•OMb8 Mb16 Mb ■24 Mb•32 Mb-40 Mb48 Nfb 56 Mb64 Mb72 Mb-SO Mb•ONfb8 Mb16 Mb ■24 Mb•32 Mb-40 Mb 48 Nfb 56 Mb64 Mb72 Mb-80 Mb■0 Mb8 Mb16 Mb ■24 Mb32 Mb -40 Mb 48 Mb56 Mb ■64 Mb72 Mb-80 MbEgG2-、&G8Chrom05EgG21EgG19EgG20Chrom09EgG30~^EgG37^EgGIO^£q G12^EgG11Chrom06E q G22^EgG24JEgG23ChromlO E q G31^'7q G32^-EgG13ChromO?EgG25^印G26-EgG39厂氐G2?ChromllEgG33-EgG35EgG36Chrom08EgG28^EgG38^gG9 -图1巨桉GLK 基因在染色体上的分布Fig.1 Location of the GLK genes on E. grandis chromosome基因结构分析表明(图3),巨桉GLK 家族各成员基因外显子的数量、长度以及位置存在差异.这些基 因大多数长度在1~9 kb,且这些基因的上游非编码区均不超过1 kb,其中EgG19长度最长,该基因存在8kb 左右的内含子.EgG11、EgG8和EgG35只有一个外显子,属于内含子缺失类型.EgG4°外显子最多(11个),EgG5有2个,EgG15、EgG2°和EgG32有3个,EgG13有4个,其余基因有5~7个.同一亚族的基因结构呈现出较大的相似性,推测其可能具有相似的生物学功能.-82°-福建农林大学学报(自然科学版)第49卷I实心圆(•)与空心圆(O)分别代表番茄和巨桉,分支上数字代表在Bootstrap验证中基于1°°°次重复的该节点可信度;不同大类的分枝具有不同的颜色,每一段弧形代表一个亚族(I〜W).图2巨桉与番茄GLK转录因子的系统进化树Fig.2Phylogenetic tree of GLK transcription factors in E.grandis and Solanum lycopersicum2.4巨桉GLK蛋白结构及保守基序通过预测分析发现巨桉GLK编码的蛋白质二级结构由a-螺旋、卜转角、延伸链和无规则卷曲组成(表2).EgGLK蛋白的无规则卷曲占比最高,其次为a-螺旋,且EgG4、EgG16和EgG22的无规则卷曲占比大于7°%.利用MEME软件分析巨桉GLK基因家族成员的蛋白保守基序(图4),共发现15个保守序列: Motif2.Motif1.Motif3.Motif13.Motif12.Motif9.Motif6、Motif1°、Motif5.Motif14.Motif4.Motif8.Motif7、Motif11和Motif15.利用SWISS-MODEL在线建模得到5个GLK转录因子蛋白保守结构域3D结构(图5),图5I〜5V分别是EgG17、EgG5、EgG18、EgG26、EgG8.结果表明,GLK家族成员的蛋白在三级结构上是比较保守的,具有非常相似的三维结构,大多由多个螺旋、延伸链及转角结构组成,推测巨桉GLK蛋白三维结构的相似性可能导致部分功能相同.从图4可看出,每个亚族内多数Motif排列顺序相同,但位置不尽相同.GLK蛋白所有成员都有Motif2和Motif1,说明两个基序是GLK蛋白的核心组件.Group I特有的基序是Motif3和Motif13,而Group II基 序最少,只有Motif2和Motif1.Group川、W和V特有的基序分别是Motif12和Motif9.Motif5和Motif14、Motif4.Motif7和Motif15.每个亚族GLK蛋白的基序类型有一定的相似性,不同亚族之间有一定的差异性.在Group I和Group I中均有部分基因所有Motif的位置出现后移现象,这可能是由于在进化过程中基第6期李丁宁等:巨桉G0LDEN2-LIKE基因家族全基因组鉴定与进化分析-821-因前端插入一段外显子,推测这些现象可能与该基因家族功能有关.图3巨桉GLK家族基因结构Fig.3Structural diagram of the GLK gene family in E.grandis表2巨桉GLK蛋白家族成员的二级结构Table2Secondary structures of the members of GLK protein family in E.grandisa-螺旋0-转角延伸链无规则卷曲单口輿氨基酸长度/个占比/%氨基酸长度/个占比/%氨基酸长度/个占比/%氨基酸长度/个占比/% EgG114121.1128 4.19608.9843965.72 EgG28156.25139.0310 6.944027.78 EgG313127.0712 2.4831 6.4031064.05 EgG49620.568 1.71357.4932870.24 EgG57443.2710 5.85137.607443.27 EgG66229.2512 5.663215.0910650.00 EgG713736.349 2.3926 6.9020554.38 EgG89229.7718 5.83289.0617155.34 EgG99424.488 2.08318.0725165.36 EgG1010628.577 1.8924 6.4723463.07 EgG118124.1111 3.2718 5.3622667.26 EgG129232.179 3.1518 6.2916758.39 EgG1312325.6811 2.30377.7230864.30 EgG149430.529 2.9213 4.2219262.34-822-福建农林大学学报(自然科学版)第49卷续表2a-螺旋0-转角延伸链无规则卷曲蛋白质------------------------------------------------------------------------------------------------------氨基酸长度/个占比/%氨基酸长度/个占比/%氨基酸长度/个占比/%氨基酸长度/个占比/% EgG154443.566 5.941413.863736.63 EgG16752°.°°1° 2.67277.2°2637°.13 EgG1712542.669 3.°74°13.651194°.61 EgG18782°.1°9 2.32359.°226668.56 EgG197621.978 2.3123 6.6523969.°8 EgG2°8243.16168.42191°.°°7338.42 EgG219528.881° 3.°4278.2119759.88 EgG227216.°°9 2.°°419.1132872.89 EgG2313927.9116 3.21357.°33°861.85 EgG2413337.1511 3.°7267.2618852.51 EgG2512831.457 1.7224 5.9°2486°.93 EgG261°526.656 1.5218 4.5726567.26 EgG2713137.1121 5.953°8.5°17148.44 EgG2814847.281° 3.19237.3513242.17 EgG2912729.8814 3.2924 5.6526°61.18 EgG3°1113°.°°4 1.°8287.5722761.35 EgG3114°34.65327.924511.1418746.29 EgG324331.621°7.351°7.357353.68 EgG3312827.8922 4.79398.5°27°58.82 EgG341283°.5511 2.63421°.°223856.8°EgG358227.2414 4.6516 5.3218962.79 EgG3611731.9713 3.553°8.2°2°656.28 EgG3713619.7733 4.8°8211.9243763.52 EgG3812622.°319 3.326411.1936363.46 EgG3914421.2732 4.738712.8541461.15 EgG4°16529.6217 3.°5427.5433359.78Motif2Motif1Motif3Motif13Motif12Motif9Motif6Motif10Motif5Motif14Motif4Motif8Motif7Motif11Motif15100200300400500600700图4巨桉GLK转录因子家族的基序Fig.4Motifs of the GLK transcription factors in E.grandis第6期李丁宁等:巨桉G0LDEN2-LIKE基因家族全基因组鉴定与进化分析-823-2.5巨桉GLK家族组织表达根据GLK基因在巨桉未成熟木质部、成熟木质部、韧皮部、成熟叶、新叶和茎尖的表达数据,绘制了GLK基因家族在不同组织的表达热图(图6).从图6可知,巨桉GLK基因在不同组织中的表达存在差异. EgG36、EgG5和EgG31在成熟叶中表达量较高,EgG20、EgG6和EgG15在茎尖表达量偏高,表明这些基因可能在植物的成熟叶和茎尖生长过程中起着积极的作用.EgG9和EgG35分别在韧皮部和木质部有较高的表达量,说明这两个基因可能在韧皮部和木质部的发育过程中发挥着重要作用.而EgG29、EgG26、EgG37和EgG17在未成熟木质部的表达量很低,EgG18和EgG33在成熟木质部的表达量较低,EgG23、EgG40和EgG30在韧皮部表达量很低,这意味着这些基因可能在特殊条件下或在其他未受试植物部位表达.从以上分析可以得出这40个巨桉GLK基因在未成熟木质部、成熟木质部和韧皮部中表达量最少,在新叶中表达量适中,但在成熟叶和茎尖具有较高的表达量.EgG8EgG35未成熟木质部成熟叶韧皮部茎尖木质部新叶红黄蓝代表基因表达水平,红色越亮表达越强,蓝色越亮表达越弱.图6GLK基因在巨桉不同组织中的表达Fig.6Expressions of the GLK gene in different tissues of E.grandis3小结与讨论本研究从基因组水平鉴定出40个巨桉GLK基因,并分为5个亚族(Group I~Group V),分析发现该基因家族在进化过程中具有较高的保守性.染色体定位分析表明巨桉GLK家族基因相对分散地分布在巨-824-福建农林大学学报(自然科学版)第49卷桉11条染色体上,且有6个均来自于片段复制的旁系同源基因对,说明片段复制可能是该基因家族扩增的主要方式.巨桉GLK基因结构相对复杂,大多数基因外显子的数量以及位置均不相同.同一亚族基因具有相似的外显子数目和长度,表明进化关系相近的基因具有相似的结构.此外,该基因家族还存在内含子缺失类型(EgG8、EgG11和EgG35),表明这些基因可能在转录时只需要进行一些简单的剪切便可以直接翻译成蛋白质.巨桉和番茄GLK基因的聚类分析结果表明,位于同一亚族或分枝的基因可能具有相似的功能,这为预测巨桉GLK家族中基因功能提供了重要的参考依据.通过分析巨桉GLK基因表达数据,发现不同GLK家族成员在不同组织中表达具有一定的特异性,表明不同GLK家族成员之间可能存在功能分化.一些基因在某些组织中异常高表达,如EgG5、EgG31和EgG36在成熟叶中表达量较高,EgG6、EgG15和EgG2°在茎尖表达量偏高,表明这些基因可能参与调控老叶和茎尖的叶绿体发育过程.参考文献[1]刘俊芳.番茄G2-1ike转录因子家族生物信息学分析及抗逆相关基因鉴定[D].哈尔滨:东北农业大学,2018.[2]RIECHMANN J L,HEARD J,MARTIN G,et al.Arabidopsis transcription factors:genome-wide comparative analysis amongeukaryotes]J].Science,2°°°,29°(5499):21°5-211°.[3]ROSSINI L,CRIBB L,MARTIN D J,et al.The maize golden2gene defines a novel class of transcriptional regulators in plants[J].Plant Cell,2°°1,13(5):1231-1244.[4]JENKINS M T.A second gene producing golden plant color in maize[J].The American Naturalist,1926,6°(67°):484-488.[5]FITTER D W,MARTIN D J,COPLEY M J,et al.GLK gene pairs regulate chloroplast development in diverse plant species[J].Plant Journal,2°°2,31(6):713-727.[6]HALL L N,ROSSINI L,CRIBB L,et al.GOLDEN2:a novel transcriptional regulator of cellular differentiation in the maizeleaf[J].Plant Cell,1998,1°(6):925-936.[7]WATERS M T,WANG P,KORKARIC M,et al.GLK transcription factors coordinate expression of the photosynthetic apparatus in Arabidopsis[J].Plant Cell,2°°9,21(4):11°9-1128.[8]YASUMURA Y,MOYLAN E C,LANGDALE J A.A conserved transcription factor mediates nuclear control of organelle biogenesis in anciently diverged land plants[J].Plant Cell,2°°5,17(7):1894-19°7.[9]KOBAYASHI K,BABA S,OBAYASHI T,et al.Regulation of root greening by light and auxin/cytokinin signaling in Arabi-dopsis[J].Plant Cell,2°12,24(3):1°81-1°95.[1°]BRAND A,BOROVSKY Y,HILL T,et al.CaGLK2regulates natural variation of chlorophyll content and fruit color in pepper fruit[J].Theoretical Applied Genetics,2°14,127(1°):2139-2148.[11]刘冠,赵婷婷,杨欢欢,等.番茄转录组学研究进展[J].基因组学与应用生物学,2°16,35(1°):28°2-28°7.[12]NGUYEN C V,VREBALOV J T,GAPPER N E,et al.Tomato GOLDEN2-LIKE transcription factors reveal molecular gradients that function during fruit development and ripening[J].Plant Cell,2°14,26(2):585-6°1.[13]TANG X,MIAO M,NIU X,et al.Ubiquitin-conjugated degradation of golden2-like transcription factor is mediated byCUL4-DDB1-based E3ligase complex in tomato[J].New-Phytologist,2°16,2°9(3):1°28-1°39.[14]黄承标.桉树生态环境问题的研究现状及其可持续发展对策[J].桉树科技,2°12,29(3):44-47.[15]叶小真,郭文硕,冯丽贞,等.桉树焦枯病菌原生质体制备条件的优化[J].福建农林大学学报(自然科学版),2°16,45(2):141-145.(责任编辑:叶济蓉)。
河南农业科学,2020,49(10):33-41Journal of Henan Agricultural Sciencesdoi :10.15933/ki.1004-3268.2020.10.005收稿日期:2020-03-20基金项目:福建农林大学科技创新专项基金项目(KFA190212)作者简介:元志成(1995-),男,福建光泽县人,在读本科生,研究方向:高粱分子育种㊂E -mail:2371647940@ 通信作者:肖乃衍(1993-),男,河南信阳人,硕士,主要从事高粱分子育种研究㊂E -mail:185********@高粱COBRA 基因家族全基因组的鉴定和表达分析元志成1,柯余生2,吴富进2,王建平2,肖乃衍2(1.福建农林大学金山学院,福建福州350002;2.福建农林大学农学院,福建福州350002)摘要:利用生物信息学和比较基因组学方法对高粱COBRA 基因家族进行鉴定,并对其基因结构㊁系统进化㊁选择压力和表达模式进行分析,为进一步研究COBRA 基因功能奠定基础㊂结果表明,在高粱基因组中共鉴定出10个COBRA 基因,分别命名为SbBC1和SbBC1L1 SbBC1L9,其中5个成员分布于1号染色体,4个成员分布于2号染色体,仅SbBC1L6分布于6号染色体,同时明确了SbBC1L1和SbBC1L3㊁SbBC1和SbBC1L4㊁SbBC1L2和SbBC1L5共6个成员是由3次串联复制事件产生㊂此外,这些基因编码蛋白质在N 端都具有信号肽和CCVS 保守结构域,除SbBC1L5外,其他9个成员C 端都有GPI 锚定蛋白的ω-位点㊂系统进化分析显示,COBRA 基因家族可以分为两组,第一组包含A ㊁B 亚组;第二组包含C ㊁D ㊁E 和F 亚组㊂其中,B 亚组产生于单子叶和双子叶植物分化之后,属于单子叶植物特有类群,而C 亚组在单子叶和双子叶植物中都发生COBRA 基因丢失㊂Ka (非同义替换率)/Ks (同义替换率)值揭示,所有高粱COBRA 基因在进化过程中都受到了纯化选择㊂表达分析显示,在高粱的11个检测样本中,所有家族成员存在差异表达,其中SbBC1L1在11个样本中都有很高的表达量;SbBC1㊁SbBC1L3和SbBC1L4在ABA (脱落酸)处理的根㊁雌蕊和新生花序中表达量较高;SbBC1L5和SbBC1L6在花药中的表达量较高㊂关键词:高粱;COBRA 基因家族;全基因组鉴定;系统发育分析;表达分析中图分类号:S514㊀㊀文献标志码:A㊀㊀文章编号:1004-3268(2020)10-0033-09Genome-Wide Identification and Expression of COBRAGene Family in Sorghum bicolorYUAN Zhicheng 1,KE Yusheng 2,WU Fujin 2,WANG Jianping 2,XIAO Naiyan 2(1.College of Jinshan,Fujian Agriculture and Forestry University,Fuzhou 350002,China;2.College of Agriculture,Fujian Agriculture and Forestry University,Fuzhou 350002,China)Abstract :Based on the bioinformatics and comparative genomics methods,the COBRA gene family ofSorghum bicolor was identified,and gene structure,phylogenetic relationship,selection pressure and ex-pression patterns were analyzed,so as to lay the foundation for further study of the function of the COBRA gene.The results showed that 10COBRA genes were identified from the genome of Sorghum bicolor ,named SbBC1and SbBC1L1 SbBC1L9.Five of them were distributed on chromosome 1,four of themwere distributed on chromosome 2,and the remaining SbBC1L6was distributed on chromosome 6.Be-sides,six members (SbBC1L1and SbBC1L3,SbBC1and SbBC1L4,SbBC1L2and SbBC1L5)were gener-ated by three-tandem replication events.All proteins encoded by COBRA genes had signal peptide and CCVS conserved domain at the N-terminus.Except for SbBC1L5,the other 9members had the ω-site of the GPI anchor protein at C-terminus.Phylogenetic tree analysis showed that the COBRA genes were di-vided into two major groups.The first group contained two subgroups (A and B).The second group was constituted of four subgroups (C,D,E and F).Subgroup B was generated after differentiation of monocot-河南农业科学第49卷yledonous and dicotyledonous plants,and belonged to the specific group for monocotyledonous plants.In subgroup C,COBRA gene loss occurred in monocotyledonous and dicotyledonous plants.The Ka(nonsyn-onymous substitution rate)/Ks(synonymous substitution rate)ratio indicated that all COBRA genes of Sorghum bicolor had experienced purification selection in the evolution process.Expression analysis showed that all COBRA genes had different expression levels in11tissues of Sorghum bicolor.SbBC1L1 had the higher expression in11tissues;three members(SbBC1,SbBC1L3and SbBC1L4)had high ex-pression levels in roots,pistils and new inflorescences treated by ABA(abscisic acid).While two members (SbBC1L5and SbBC1L6)had higher expression levels in anthers tissues.Key words:Sorghum bicolor;COBRA gene family;Genome-wide identification;Phylogenetic analysis; Expression analysis㊀㊀COBRA基因编码糖基磷脂酰肌醇锚定蛋白,在植物细胞壁纤维素合成㊁细胞的定向伸长和纤维素的沉积过程中起到重要作用[1-2]㊂COBRA蛋白的结构极为保守,主要包含N端信号肽㊁碳水化合物结合域㊁富含半胱氨酸的CCVS结构域和C末端GPI (Glycosyl phosphatidyl inositol)蛋白的ω-位点[3]㊂其中,碳水化合物结合域是一个功能结构域,对晶体纤维素有较强亲和力[4],CCVS结构域参与富含半胱氨酸特征的二硫键形成或金属离子结合[4]㊂根据COBRA蛋白序列的相似性,可将其分为2组,其中第二组的COBRA蛋白N端的氨基酸序列比第一组长,外显子数量少[3,5-6]㊂COBRA基因首次在拟南芥(Arabidopsis thali-ana)根细胞异常膨大的突变体中被发现[7]㊂CO-BRA蛋白能够作用于植物质膜外表面,将微管骨架的位置信息传递到纤维素合酶复合体上,参与细胞壁和质膜间的信号传导[8]㊂COBRA蛋白控制细胞壁纤维素微纤丝的正确定位和细胞的定向伸长[2]㊂因此,在cobra突变体中,纤维素的排列方向发生变化,进而导致纤维素含量减少㊁根组织变短㊁肿胀,侧根减少[1,3,7,9]㊂在拟南芥已报道的5个COBRA基因中,AtCOBL4基因参与细胞壁中次生壁纤维素的合成,Atcobl4突变体表型正常,但是花絮和茎秆极易折断[10];AtCOBL9基因影响根毛的形态和发育,使根毛变短㊁数量变少[11];AtCOBL5基因功能完全缺失时,植株的生长和发育会受到严重影响,同时会产生大量的花青素和胼胝体等应激反应化学物质,防御相关基因也出现上调表达趋势[12]㊂水稻(Ory-za sativa)COBRA基因突变体均表现出纤维素含量显著减少㊁茎秆强度下降的特征[6,13]㊂水稻BC1 (Brittle culm1)蛋白与拟南芥COB蛋白的氨基酸序列相似性为60.7%,水稻bc1突变体细胞壁厚度减小,纤维素含量显著减少,木质素含量增加,茎秆机械强度显著降低[6]㊂水稻bc1l4(Brittle culm1like 4)突变体的细胞异常膨胀,纤维素含量减少,植株分蘖减少,果胶含量增加[13]㊂此外,水稻bc1l5突变体雄配子体运输严重受阻,BC1L5基因参与茎节厚壁组织次生壁合成[6]㊂目前,已从拟南芥[7]㊁水稻[6,13]㊁玉米(Zea mays)[14]㊁棉花(Gossypium)[15]㊁番茄(Solanum lyco-persicum)[16]㊁毛果杨(Populus trichocarpa)[17]等植物中鉴定了COBRA基因家族成员,数量分别为12㊁10㊁9㊁19㊁17㊁14个㊂高粱(Sorghum bicolor)作为世界上的第五大禾谷类作物,是重要的能源作物和饲料作物,具有光合效率高㊁营养价值高㊁适应性强及抗旱㊁耐盐碱等优异的农艺性状,也是研究其他能源作物(甘蔗㊁玉米和柳枝稷)的重要模式作物[18]㊂自从2009年高粱全基因组测序完成后,许多基因家族的鉴定和功能研究工作迅速开展㊂目前,关于高粱COBRA基因鉴定的研究鲜见报道[9],而关于其家族全基因组鉴定的研究尚未见报道㊂因此,基于生物信息学和比较基因组方法,在高粱全基因组水平上鉴定COBRA基因家族成员,并对其基因结构㊁系统进化㊁选择压力和表达模式进行分析,为进一步研究COBRA基因功能奠定基础㊂1㊀材料和方法1.1㊀试验材料高粱㊁狗尾草(Setaira viridis)㊁谷子(Setaria ital-ica)㊁二穗短柄草(Brachypodium distachyon)㊁菠萝(Ananas comosus)和无油樟(Amborella trichopoda)的基因组㊁蛋白质序列数据均来自于Phytozome12数据库(https:///pz/portal.ht-ml),玉米[19]㊁水稻[6]㊁雷蒙德氏棉(Gossypium raimondii)[15]㊁毛果杨[17]㊁番茄[16]和拟南芥[3]的COBRA蛋白序列分别来自相关文献㊂1.2㊀高粱和其他11种代表性植物的COBRA基因的鉴定利用已经鉴定的玉米COBRA基因家族成员(Zea mays brittle stalk2-like,ZmBK2和ZmBK2L143㊀第10期元志成等:高粱COBRA基因家族全基因组的鉴定和表达分析ZmBK2L9)的蛋白质序列为种子,建立本地数据库后,BLAST比对到高粱的全基因组蛋白质数据库,蛋白质筛选标准为e-value为10-5,相似性为75%以上,获得高粱COBRA基因㊂利用NCBI conserved domains数据库(https:/// Structure/cdd/wrpsb.cgi)分析候选蛋白质的保守结构域以验证高粱COBRA基因家族鉴定的准确性㊂狗尾草㊁谷子㊁二穗短柄草㊁菠萝和无油樟的COBRA 基因的鉴定方法与高粱一致㊂1.3㊀高粱COBRA基因家族的生物信息学分析利用Expasy数据库(https://www.expasy. org/)预测蛋白质的氨基酸数量㊁理论等电点㊁分子质量㊁疏水性㊁锚定位点等㊂利用SignalP3.0(ht-tp://www.cbs.dtu.dk/services/SignalP/)预测CO-BRA相似蛋白的N端信号肽[20]和big-PI(http:// mendel.imp.ac.at/gpi/gpi_server.html)预测C端疏水末端的锚定位点[21]㊂采用KYTE等[22]的方法预测蛋白质疏水性,使用默认参数值㊂使用TBtools软件分析高粱COBRA基因结构,并绘制基因的内含子-外显子结构图㊂通过Clustal W软件对高粱和其他11个物种COBRA蛋白的氨基酸序列进行比对,运用MEGA7软件采用邻接法(Neighbor-joining method,NJ)构建系统进化树,Bootstrap设置1000次重复㊂1.4㊀高粱COBRA基因家族复制事件和选择压力通过高粱基因组的注释信息获取每个COBRA 基因对应染色体位置,如果同一条染色体上的2个基因间距小于200kb,判断其为串联复制基因[23]㊂运用TBtools软件中Simple Ka/Ks Calclator模块,分别输入基因的编码序列(Coding sequences,CDS)和直系同源基因对,计算同源基因之间的Ka(非同义替换率)/Ks(同义替换率)值,估算选择压力㊂1.5㊀高粱COBRA基因家族的表达分析高粱RNA-seq数据来源于已经发表的公共数据库(/sorghum3/generate_ figures.php),即NCBI的SRA数据库(登录号: SRP008469)和GEO数据库(登录号:PRJNA143783)[24-25]㊂它包括了高粱授粉后5㊁10㊁25d的胚(Embryo),授粉后25d的胚乳(Endo-sperm),生长20d的叶片(Leaf)㊁花药(Anther),早期花序(Early inflorescence),新生花序(Emerging in-florescence)㊁雌蕊(Pistil)及ABA处理的根(Root)和茎(Stem),共11个样本RNA-seq数据[24-25],每个基因相对表达水平通过FPKM(Fragments per kilo-base of exon model per million mapped fragments)值来表示㊂运用Excel2016的 条件格式 - 色阶 功能,绘制基因表达量热图,最后选用Adobe Illustrator CS6软件加工㊁处理图片㊂2㊀结果与分析2.1㊀高粱COBRA基因家族的鉴定本研究共鉴定到10个高粱COBRA基因家族成员㊂为了方便比较和分析,参照LI等[9]初步鉴定结果,将其命名为SbBC1和SbBC1L1 SbBC1L9㊂如表1所示,5个COBRA基因分布于高粱的1号染色体,4个COBRA基因分布于2号染色体上,仅Sb-BC1L6基因位于6号染色体上㊂对于高粱10个COBRA基因编码蛋白质的氨基酸序列长度,除Sb-BC1L7㊁SbBC1L8和SbBC1L9蛋白的氨基酸序列较长外,在670个左右,其他7个蛋白质(SbBC1和Sb-BC1L1 SbBC1L6)的氨基酸序列长度比较相近,基本在440个左右㊂同时,相应蛋白质分子质量都表表1㊀高粱COBRA基因家族成员基本信息Tab.1㊀Basic information of COBRA gene family member in Sorghum bicolor 基因名称Gene name 基因代码Gene ID染色体Chromosome氨基酸长度/个Aminoacidlength分子质量/kuMolecularweight等电点pIN端信号肽位置/可靠性N-terminal signalpeptide position/probability潜在的ω位点Potentialω-site玉米直系同源基因Orthologous genefrom maize相似性/%SimilaritySbBC1Sobic.001G336700144648.868.8226 27/0.9769N(420)ZmBK292.15 SbBC1L1Sobic.002G368300244649.268.7721 22/0.9977A(423)ZmBK2L795.76 SbBC1L2Sobic.001G086200144949.788.8830 31/0.9986N(422)ZmBK2L497.33 SbBC1L3Sobic.002G368100245850.998.9337 38/0.9118N(630)ZmBK2L685.15 SbBC1L4Sobic.001G336600145951.349.0331 32/0.9955S(425) SbBC1L5Sobic.001G086000142546.838.8031 32/0.9952 ZmBK2L384.83 SbBC1L6Sobic.006G163200644750.55 6.1524 25/0.9882S(430)ZmBK2L982.42 SbBC1L7Sobic.001G399900167071.91 6.2623 24/0.9973G(645)ZmBK2L192.85 SbBC1L8Sobic.002G427400266171.19 5.1425 26/0.9974S(634)ZmBK2L882.88 SbBC1L9Sobic.002G323200267374.629.0230 31/0.8956S(645)ZmBK2L592.7353河南农业科学第49卷现出相同的趋势,基本分布在46.83~74.62ku,平均为56.53ku㊂蛋白质的理论等电点大于7的有7个成员,小于7的有3个成员,表明高粱COBRA 家族成员碱性氨基酸的数量多于酸性氨基酸,其中SbBC1L4等电点最高,为9.03㊂如表1所示,所有高粱COBRA 蛋白都具有信号肽,位于N 端第21 38个氨基酸残基间㊂此外,该家族所有蛋白质都属于分泌性蛋白,在核糖体合成后,由信号肽引导其前体蛋白质到达指定部位,信号肽切除后成为功能性的成熟蛋白质㊂除SbBC1L5蛋白外,其他成员均有GPI 锚定蛋白的结合位点,这也暗示SbBC1L5蛋白可能不是一个GPI 锚定蛋白㊂同时,从表1中高粱的基因ID 可以得出,该家族基因发生了3次串联重复事件,分别为SbBC1和SbBC1L4(Sobic.001G336700和Sobic.001G336600)㊁SbBC1L1和SbBC1L3(Sobic.002G368300和Sobic.002G368100)㊁SbBC1L2和SbBC1L5(Sobic.001G086200和Sobic.001G086000),这些串联重复事件对于该家族基因数量的扩增起到重要作用㊂经预测,除SbBC1L5蛋白的C 端无疏水性外,其他10个蛋白质中间部分都具有亲水性,而N 端和C 端两侧都具有疏水性㊂由图1可知,除Sb-BC1L7蛋白的丝氨酸(S)变成苏氨酸(T)外,其他蛋白质的氨基酸序列中都具有半胱氨酸的CCVS 保守结构域(图1)㊂此外,有3个成员(SbBC1L7㊁Sb-BC1L8和SbBC1L9)的N 端氨基酸数量比其他成员多170个,这与拟南芥㊁玉米COBRA 蛋白序列相似[3,14,19]㊂图1㊀高粱COBRA 家族成员的氨基酸序列比对Fig.1㊀Amino acid sequence alignment of COBRA family members in Sorghum bicolor2.2㊀高粱和其他11种被子植物的COBRA 蛋白的系统发育分析为了全面分析高粱COBRA 蛋白的系统发育关系,鉴定和收集了12种代表性植物COBRA 蛋白家族成员,共计139个(图2 3)㊂其中,单子叶植物高粱㊁玉米㊁狗尾草㊁谷子㊁水稻㊁二穗短柄草和菠萝中分别有10㊁9㊁10㊁9㊁11㊁10㊁10个成员;双子叶植物拟南芥㊁雷蒙德氏棉㊁毛果杨和番茄中分别有12㊁19㊁14㊁17个成员;无油樟中有8个成员㊂以莱茵衣藻(Chlamydomonas reinhardtii )的COBRA 蛋白(XP_001695086.1)作为外类群,可将139个COBRA 蛋白分为2个组6个亚组,其中第一组含有2个亚组(A 和B),第二组含有4个亚组(C㊁D㊁E 和F)㊂从不同物种COBRA 基因数量和经历的全基因组复制事件(Whole genome duplication events,WGD )可以得出,WGD 对于COBRA 基因数量没有起到扩增作63㊀第10期元志成等:高粱COBRA 基因家族全基因组的鉴定和表达分析用㊂菠萝是被公认的没有经历ρWGD 事件的[26],作为单子叶植物的外类群,菠萝COBRA 基因数量为10,表明ρWGD 事件对于单子叶植物COBRA 基因家族扩增没有影响㊂图2㊀12种植物COBRA 蛋白的系统进化树Fig.2㊀Phylogenetic analysis of COBRA proteins from 12plantspeciesα㊁β㊁γ㊁ε㊁ζ㊁ρ㊁σ㊁τ表示不同时期的全基因组复制事件α,β,γ,ε,ζ,ρ,σ,τrepresent whole-genome replication events in different periods图3㊀12种植物的COBRA 蛋白系统发育关系Fig.3㊀Phylogenetic relationships of COBRA proteins from 12plant species73河南农业科学第49卷㊀㊀从图2可以看出,在被子植物中,最早分化的无油樟有8个COBRA 成员,而在其后分化出来的单子叶和双子叶植物COBRA 成员数量在9~19个,表明COBRA 基因数量在单子叶植物和双子叶植物中都发生了扩增㊂与单子叶植物相比,双子叶植物中COBRA 基因数量有明显的扩增㊂在A 亚组中,双子叶植物基因家族出现明显的扩增现象,而单子叶植物中,除菠萝外,其他物种都有1个COBRA 成员丢失㊂在B 亚组中,单子叶植物COBRA 基因有1~2成员,而双子叶植物都没有,无油樟也没有任何成员,表明B 亚组的COBRA 成员产生于单子叶植物和双子叶植物分化之后㊂在C 亚组中,双子叶植物都有1个COBRA 成员,而单子叶植物都没有,无油樟有2个COBRA 成员,表明单子叶植物和双子叶植物分化之后都发生COBRA 基因丢失现象㊂在D亚组中,除菠萝和雷蒙德氏棉COBRA 基因扩增到了3个成员外,其他物种的成员数量都没有变化㊂在E 和F 亚组中,单子叶植物和双子叶植物的CO-BRA 基因都出现了明显的扩增现象㊂此外,除B 亚组外,其他5个亚组都含有来自代表性的被子植物无油樟的COBRA 基因,表明这些亚组的COBRA 基因出现在被子植物分化之前㊂2.3㊀高梁COBRA 基因家族选择压力分析当Ka /Ks>1,表明基因受正选择;当Ka /Ks =1,表明基因受到中性选择;当Ka /Ks<1,表明基因受纯化选择[26]㊂本研究以玉米和高粱COBRA 的直系同源基因对估算基因家族的选择压力㊂结果表明,除SbBC1L6基因外,其他9个基因对的Ka /Ks 比值均小于0.5(图4),说明纯化选择是推动COBRA 基因进化的主要力量㊂图4㊀高粱和玉米COBRA 直系同源基因对的Ka /Ks 比值Fig.4㊀The Ka /Ks of orthologous COBRA gene pairs between Sorghum bicolor and maize2.4㊀高粱COBRA 蛋白的系统进化和基因结构分析选择双子叶植物的拟南芥和单子叶植物的水稻㊁玉米和高粱的COBRA 蛋白家族成员,共计42个,利用MEGA 7软件对它们构建系统进化树㊂结果表明,所有COBRA 蛋白都被分为两组(图5),与其他物种(玉米㊁水稻和拟南芥)的报道结果一致[3,6,19]㊂第二组COBRA 蛋白的保守性高于第一组,家族成员的数量也少于第一组㊂高粱有7个COBRA 蛋白在第一组中,其中6个编码基因(Sb-BC1L1和SbBC1L3,SbBC1和SbBC1L4,SbBC1L2和SbBC1L5)是由3次串联重复事件产生㊂与拟南芥COBRA 蛋白相比,3个禾本科(高粱㊁玉米和水稻)的COBRA 蛋白都明显聚类在一起,表明具有较近的亲缘关系㊂为了进一步表明高粱和其他作物COBRA 基因的进化关系,运用TBtool 软件绘制了COBRA 基因的外显子和内含子结构图,结果显示,与进化关系分类基本一致,可分为两组,第一组明显具有多个内含子㊁外显子;第二组除拟南芥的AtCOBL10和AtCOBL11基因外,其他成员只含有1~2个外显子(图5)㊂2.5㊀高粱COBRA 基因家族成员的表达分析由图6可知,在11个检测样本中,所有COBRA 基因在高粱各组织和发育时期中的表达量不同㊂需要特别强调的是,SbBC1L1基因在11个样本中都具有很高的表达量,尤其是在新生和早期的花序㊁授粉后5d 的种子㊁ABA 处理的根和幼苗中,表明该基因在高粱的纤维素合成中起主要作用㊂此外,SbBC1㊁SbBC1L3和SbBC1L4基因在ABA 处理的根㊁雌蕊和新生花序中都有较高的表达量㊂SbBC1L2㊁SbBC1L8和SbBC1L9基因在11个样本中具有较低的表达量,表明这些基因有其他特异的表达模式或为功能冗余基因㊂同时,在SbBC1L5㊁SbBC1L6和SbBC1L7基因中,SbBC1L5和SbBC1L6在花药组织中具有组织特异性的表达,而SbBC1L7基因在ABA 处理下的根和幼苗中有较高的表达量㊂83㊀第10期元志成等:高粱COBRA基因家族全基因组的鉴定和表达分析图5㊀高粱COBRA 蛋白的系统进化树和基因结构分析Fig.5㊀Phylogenetic tree and gene structure of the COBRA protein in Sorghumbicolor图6㊀COBRA 基因在不同高粱组织中的表达分析Fig.6㊀COBRA gene expression patterns in different tissues of Sorghum bicolor93河南农业科学第49卷3㊀结论与讨论COBRA基因家族是植物特有的基因家族[3],主要参与植物根㊁茎㊁叶等机械组织中细胞壁的生物合成[1,6,10,27]和果实的成熟软化[16,28-29]㊂迄今,对高粱COBRA基因的研究相对较少[9]㊂本研究基于生物信息学和比较基因组学方法,共鉴定到10个高粱COBRA基因,与前人在其他单子叶植物中鉴定到的该家族基因数量基本一致,比如水稻有11个[6,13],玉米有9个[19],狗尾草有10个,谷子有9个,二穗短柄草有10个,菠萝有10个㊂双子叶植物中,拟南芥有12个[3],番茄有17个[16],毛果杨有14个[17],雷蒙德氏棉有19个[15],家族基因数量相差较大㊂生物信息学分析结果表明,12个不同被子植物都经历过次数不等的WGD事件,但是对于COBRA基因数量没有起到扩增作用㊂COBRA基因编码的蛋白具有4个明显的特征:第一,N端有信号肽;第二,有碳水化合物结合域;第三,含有半胱氨酸的CCVS结构域;第四,C端有GPI 锚定蛋白的ω-位点[3]㊂上述4个特征在高粱的10个COBRA家族成员内基本都有,仅SbBC1L5蛋白没有预测到潜在GPI-P锚定位点,但若要判定其是否为GPI锚定蛋白,尚需在多个高粱材料中进行验证㊂这些预测结果与LI等[9]的鉴定结果具有较大差别,可能是由于不同的预测软件引起的差异㊂玉米㊁高粱和甘蔗都属于蜀黍族,有较近的亲缘关系㊂高粱和玉米源于2000万年前的共同祖先分化,而高粱和甘蔗的共同祖先分化于800万~900万年前[30]㊂水稻作为禾本科的模式作物,与蜀黍族的共同祖先于5000万~7000万年前分化[18]㊂本研究系统进化分析表明,COBRA基因是一个比较古老的基因家族,可能起源于被子植物分化之前[31]㊂需要加以注意的是,以基部被子植物无油樟为外类群,单子叶植物和双子叶植物分化之后,COBRA基因家族出现明显的分化,第一组中的B亚组产生于单子叶植物和双子叶植物分化之后,属于单子叶植物特有类群,但是在C亚组中单子叶植物和双子叶植物都发生了COBRA基因丢失,其中单子叶植物都丢失2个成员㊂在E和F亚组中,单子叶植物和双子叶植物都出现基因扩增现象,这与曹颖等[28]的研究结果不同,原因可能是由于其聚类分析只有拟南芥和番茄,物种数量太少导致结果不够准确㊂此外,从系统进化树分析,除SbBC1L4基因外,每个SbBC1L 基因都与一个ZmBK2L基因组成一个较小分支,9个分支上的SbBC1L基因和ZmBK2L基因形成直系同源基因对,这表明高粱和玉米具有更近的亲缘关系,与高粱全基因组测序的聚类分析结果一致[18]㊂在基因结构上,第一组COBRA基因的外显子数量较多,而第二组大多数基因仅有1~2个外显子,这些结果与水稻[31]㊁冬枣[29]㊁棉花[15]和拟南芥[3]上的研究结果基本一致㊂在系统进化树中,距离相近或在同一分支上的基因可能执行类似的功能,因此,将高粱COBRA家族成员与已报道的其他植物COBRA家族成员进行聚类分析,推测它们可能在高粱中发挥的功能或作用㊂拟南芥中AtCOBL4基因在营养和花组织中都有较高的表达量,该基因突变后引起茎和枝的次生细胞壁增厚,导致纤维素含量和茎秆机械强度降低[10]㊂LI等[6]研究发现,高粱sbbc1突变体茎秆机械强度下降,纤维素含量降低60%,木质素含量增加25%,但植株表型没有明显改变,表明SbBC1基因参与次生壁纤维素的生物合成,对高粱茎秆强度起到重要作用㊂在本研究中,高粱的SbBC1㊁SbBC1L1基因与拟南芥的At-COBL4聚类在同一个分支上,在11个高粱组织中的表达量均很高,且SbBC1基因和SbBC1L1基因的表达趋势相似㊂LI等[6]研究发现,SbBC1基因在高粱的根㊁茎㊁叶㊁圆锥花序和种子中都有较高的表达量,尤其在根和茎中表达量很高,且SbBC1L1基因在根㊁茎㊁花㊁穗和种子也有较高表达量,这与本研究结果基本一致㊂水稻的OsBCL4基因定位在细胞壁和细胞膜上,该基因突变导致细胞异常膨胀㊁纤维素含量降低㊁果胶含量增加[32]㊂在高粱中,SbBC1L5与水稻OsBCL4聚在同一分支,且在高粱花药中的表达量较高,推测该基因可能参与花药组织生成,具有与OsBCL4基因类似的作用㊂玉米ZmBk2L1基因初生根中表达量最高,可能参与根毛的生长和发育[13]㊂在高粱中,SbBC1L7基因与玉米ZmBk2L1基因聚在同一分支,在ABA处理的高粱根中也呈现较高的表达量,暗示SbBC1L7基因可能与ZmBk2L1基因具有类似的作用㊂参考文献:[1]㊀ROUDIER F,FERNANDEZ A G,FUJITA M,et al.CO-BRA,an Arabidopsis extracellular glycosyl-phosphatidylinositol-anchored protein,specifically controls highly ani-sotropic expansion through its involvement in cellulosemicrofibril orientation[J].The Plant Cell,2005,17(6):1749-1763.[2]㊀SCHINDELMAN G,MORIKAMI A,JUNG J,et al.CO-BRA encodes a putative GPI-anchored protein,which ispolarly localized and necessary for oriented cell expansionin Arabidopsis[J].Genes Dev,2001,15(9):1115-1127.[3]㊀ROUDIER F,SCHINDELMAN G,DESALLE R,et al.TheCOBRA family of putative GPI-anchored proteins in Ara-bidopsis.A new fellowship in expansion[J].Plant Physi-ology,2002,130(2):538-548.[4]㊀LIU L,SHANG-GUAN K,ZHANG B,et al.Brittle Culm1,aCOBRA-like protein,functions in cellulose assembly through04㊀第10期元志成等:高粱COBRA基因家族全基因组的鉴定和表达分析binding cellulose microfibrils[J].PLoS Genet,2013,9(8):e1003704.[5]㊀NIU E,FANG S,SHANG X,et al.Ectopic expression ofGhCOBL9A,a cotton glycosyl-phosphatidylinositol-an-chored protein encoding gene,promotes cell elongation,thickening and increased plant biomass in transgenic Ara-bidopsis[J].Molecular Genetics and Genomics,2018,293(5):1191-1204.[6]㊀DAI X,YOU C,WANG L,et al.Molecular characteriza-tion,expression pattern,and function analysis of the Os-BC1L family in rice[J].Plant Molecular Biology,2009,71(4/5):469-481.[7]㊀BORNER G H,LILLEY K S,STEVENS T J,et al.Identi-fication of glycosyl-phosphatidylinositol-anchored proteinsin Arabidopsis.A proteomic and genomic analysis[J].Plant Physiology,2003,132(2):568-577.[8]㊀RINGLI C.Monitoring the outside:Cell wall-sensing mecha-nisms[J].Plant Physiology,2010,153(4):1445-1452. [9]㊀LI P,LIU Y,TAN W,et al.Brittle culm1encodes a CO-BRA-like protein involved in secondary cell wall cellulosebiosynthesis in sorghum[J].Plant&Cell Physiology,2019,60(4):788-801.[10]㊀BROWN D M,ZEEF L A,ELLIS J,et al.Identificationof novel genes in Arabidopsis involved in secondary cellwall formation using expression profiling and reverse ge-netics[J].The Plant Cell,2005,17(8):2281-2295.[11]㊀JONES M A,RAYMOND M J,SMIRNOFF N.Analysisof the root-hair morphogenesis transcriptome reveals themolecular identity of six genes with roles in root-hair de-velopment in Arabidopsis[J].The Plant Journal,2006,45(1):83-100.[12]㊀KO J H,KIM J H,JAYANTY S S,et al.Loss of functionof COBRA,a determinant of oriented cell expansion,in-vokes cellular defence responses in Arabidopsis thaliana[J].Journal of Experimental Botany,2006,57(12):2923-2936.[13]㊀DAI X,YOU C,CHEN G,et al.OsBC1L4encodes a CO-BRA-like protein that affects cellulose synthesis in rice[J].Plant Molecular Biology,2011,75(4/5):333-345.[14]㊀SINDHU A,LANGEWISCH T,OLEK A,et al.Maize Brittlestalk2encodes a COBRA-like protein expressed in early or-gan development but required for tissue flexibility at matu-rity[J].Plant Physiology,2007,145(4):1444-1459. [15]㊀NIU E,SHANG X,CHENG C,et prehensiveAnalysis of the COBRA-like(COBL)gene family in Gos-sypium identifies two COBLs potentially associated with fi-ber quality[J].PLoS One,2015,10(12):e0145725. [16]㊀CAO Y,TANG X,GIOVANNONI J,et al.Functionalcharacterization of a tomato COBRA-like gene functio-ning in fruit development and ripening[J].BMC PlantBiology,2012,12:211.[17]㊀崔永耀.毛果杨COBRA基因家族及COBRA3/11功能分析[D].黑龙江:东北林业大学,2018.CUI Y prehesive analysis of poplar ptrCOBRAand COBRA3/11function[D].Heilongjiang:NortheastForestry University,2018.[18]㊀PATERSON A H,BOWERS J E,BRUGGMANN R,etal.The Sorghum bicolor genome and the diversification ofgrasses[J].Nature,2009,457(7229):551-556. [19]㊀BRADY S M,SONG S,DHUGGA K S,et biningexpression and comparative evolutionary analysis.TheCOBRA gene family[J].Plant Physiology,2007,143(1):172-187.[20]㊀BENDTSEN J D,NIELSEN H,VON HEIJNE G,et al.Improved prediction of signal peptides:SignalP3.0[J].Journal of Molecular Biology,2004,340(4):783-795.[21]㊀EISENHABER B,BORK P,EISENHABER F.Sequenceproperties of GPI-anchored proteins near the omega-site:Constraints for the polypeptide binding site of the putativetransamidase[J].Protein Engineering,1998,11(12):1155-1161.[22]㊀KYTE J,DOOLITTLE R F.A simple method for displa-ying the hydropathic character of a protein[J].Journalof Molecular Biology,1982,157(1):105-132. [23]㊀HOLUB E B.The arms race is ancient history in Arabidop-sis,the wildflower[J].Nature Reviews Genetics,2001,2(7):516-527.[24]㊀DUGAS D V,MONACO M K,OLSEN A,et al.Function-al annotation of the transcriptome of Sorghum bicolor inresponse to osmotic stress and abscisic acid[J].BMCGenomics,2011,12:514.[25]㊀DAVIDSON R M,GOWDA M,MOGHE G,et -parative transcriptomics of three Poaceae species revealspatterns of gene expression evolution[J].The PlantJournal,2012,71(3):492-502.[26]㊀NEKRUTENKO A,MAKOVA K D,LI W H.The K(A)/K(S)ratio test for assessing the protein-coding potentialof genomic regions:An empirical and simulation study[J].Genome Research,2002,12(1):198-202. [27]㊀PERSSON S,CAFFALL K H,FRESHOUR G,et al.TheArabidopsis irregular xylem8mutant is deficient in glucu-ronoxylan and homogalacturonan,which are essential forsecondary cell wall integrity[J].The Plant Cell,2007,19(1):237-255.[28]㊀曹颖,唐晓凤,刘永胜.番茄COBRA基因克隆㊁表达模式及生物信息学分析[J].植物研究,2012,32(3):304-310.CAO Y,TANG X F,LIU Y S.Cloning,expression patternand bioinformation analyses of COBRA gene in tomato(Solanum lycopersicum)[J].Bulletin of Botanical Re-search,2012,32(3):304-310.[29]㊀盛松柏,田菊,庞晓明.冬枣COBRA基因家族全基因组鉴定及表达分析[J].分子植物育种,2018,16(1):61-68.SHENG S B,TIAN J,PANG X M.Genome-wide identifi-cation and expression analysis of COBRA gene family inziziphus jujuba[J].Molecular Plant Breeding,2018,16(1):61-68.[30]㊀WOLFE K H,GOUY M,YANG Y W,et al.Date of themonocot-dicot divergence estimated from chloroplastDNA sequence data[J].Proceedings of the NationalAcademy of Sciences of the United States of America,1989,86(16):6201-6205.[31]㊀LI Y,QIAN Q,ZHOU Y,et al.BRITTLE CULM1,whichencodes a COBRA-like protein,affects the mechanicalproperties of rice plants[J].The Plant Cell,2003,15(9):2020-2031.[32]㊀HOCHHOLDINGER F,WEN T J,ZIMMERMANN R,etal.The maize(Zea mays L.)roothairless3gene encodesa putative GPI-anchored,monocot-specific,COBRA-likeprotein that significantly affects grain yield[J].ThePlant Journal,2008,54(5):888-898.14。
第41卷第2期2021年3月森林与环境学报2021, 41(2): 172-179Journal of Forest and Environment DOI : 10.13324/ki.jfcf.2021.02.008杨梅侧生器官边界域基因组鉴定及进化分析梁健翔,吴进樟,张 尧,曹世江(福建农林大学林学院,福建福州350002)摘要:为探究杨梅侧生器官边界域基因(LBD )在杨梅全基因组中的数量和结构,利用杨梅最新基因组的数据,结合生物信息学的方法对基因蛋白进行结构、系统进化和共线性分析,对杨梅LBD 基因家族 进行了鉴定,并分析其分子质量和等电点,为今后研究LBD 基因家族在杨梅成长过程和逆境调节中的 详细功能奠定基础。
结果表明,从杨梅基因组中共鉴定出33个杨梅LBD ( MrLBD )基因,根据染色体分 布对其进行重命名。
根据其LBD 结构域和系统进化树分析的特征,杨梅LBD 家族基因分为Class I 和开放科学标识码(OSID 码)Class H 两类,各有28个和5个LBD 基因。
杨梅LBD 家族基因的结构并不复杂,其中内含子总数不超过 2。
在对保守域的研究中,通过对LBD 基因进行亚细胞定位、三级结构的同源建模和种内与种间共线性分析,发现同一组的基因往往具有相似的外显子-内含子、基序和蛋白质结构。
关键词:杨梅;侧生器官边界域基因组;系统进化分析;转录因子;生物信息学中图分类号:S184 文献标识码:A 文章编号:2096-0018(2021)02-0172-08Genomic identification and evolutionary analysis of the boundary domain oflateral organs in Myrica rubraLIANG Jianxiang ,WU Jinzhang ,ZHANG Yao, CAO Shijiang(College of Forestry ,Fujian Agriculture and Forestry University ,Fuzhou ,Fujian 350002,China)Abstract : The latest genome of Myrica rubra ,combined with bioinformatics method ,were used to explore the number and structure of lateral organ boundary domain(LBD) genes in the former. Moreover ,this study will lay the foundation for studies of the detailedfunctions of the LBD gene family in the growth of and stress regulation in M. rubra ,via analyses of the structure ,phylogeny ,andcollinearity of genes ; identification of the LBD gene family in M. rubra ,and analyses of the molecular weight and isoelectric point ofthe protein. The results identified 33 M. rubra LBD( MrLBD ) genes that were subsequently renamed according to their chromosome distribution. Analysis of the characteristics of the LBD genes and their phylogenetic tree showed that they can be denoted as Class I(28 genes ) and Class 11( 5 genes ). The structures of the MrLBD genes were not complicated ; there were no more than two intronsin total. A study of the conserved domains , which included intraspecific and interspecies collinearity analysis of the subcellularlocalization and tertiary structure of LBD genes via homology modeling , revealed that genes in the same group often had similar exons ( intraspecific) , intron structures , motifs , and proteins.Key words : Myrica rubra ; lateral organ boundary domain genome ; system evolution analysis ; transcription factors ; bioinformatics杨梅]Myrica rubra ( Lour.) S. et Zucc.]是杨梅科(Myricaceae)杨梅属(Myrica )的常绿乔木,是我国原产的特色植物。
㊀山东农业科学㊀2023ꎬ55(5):1~7ShandongAgriculturalSciences㊀DOI:10.14083/j.issn.1001-4942.2023.05.001收稿日期:2022-08-08基金项目:国家重点研发计划项目(2019YFD1001300ꎬ2019YFD1001303)ꎻ山东省农业科学院农业科技创新工程项目(CXGC2022E01)ꎻ山东省农业良种工程项目(2020LZGC004)作者简介:周媛媛(1989 )ꎬ女ꎬ博士ꎬ助理研究员ꎬ主要从事甘薯分子遗传育种研究ꎮE-mail:zhou_yy_2020@163.com通信作者:董顺旭(1980 )ꎬ男ꎬ学士ꎬ副研究员ꎬ主要从事甘薯遗传育种研究ꎮE-mail:dsx2010@163.com甘薯CLE多肽家族的全基因组鉴定和IbCLE12的克隆及抗旱性表达分析周媛媛1ꎬ赵春玲2ꎬ侯夫云1ꎬ李爱贤1ꎬ秦桢1ꎬ王庆美1ꎬ董顺旭1(1.山东省农业科学院作物研究所ꎬ山东济南㊀250100ꎻ2.山东师范大学ꎬ山东济南㊀250014)㊀㊀摘要:CLAVATA3/Embryosurroundingregion-related(CLE)多肽作为植物体内小分子信号激素ꎬ在植物的生长发育和抗逆性中发挥重要的调控作用ꎮ本研究从甘薯近缘野生种Ipomoeatrifida的基因组数据库中筛选出12个ItfCLE基因ꎬ并对其结构㊁蛋白理化性质㊁进化关系以及转录水平的表达进行了分析ꎮ结果表明ꎬ12个ItfCLE蛋白的长度和分子量分别为81~154aa和9.0~17.5kDaꎻ均具有C末端保守基序(VSKRKVPSGPB ̄PJHN)ꎻ除了ItfCLE2和ItfCLE6ꎬ均为不稳定蛋白ꎻ除了ItfCLE5ꎬ均为亲水性脂溶蛋白ꎻ亚细胞定位表明均为胞外分泌型小肽ꎮ进化分析表明这12个CLE多肽属于5个不同的亚组ꎮ表达模式分析表明ꎬ各ItfCLE基因在不同组织中的表达不同ꎬItfCLE9和ItfCLE10在花中表达较高ꎬItfCLE4和ItfCLE12在根中表达较高ꎬItf ̄CLE2㊁ItfCLE6和ItfCLE8在茎中表达较高ꎻItfCLE12基因受干旱诱导表达最高ꎬItfCLE8受干旱和盐胁迫诱导上调表达ꎮ进一步从甘薯栽培种济薯25中克隆ItfCLE12的同源基因IbCLE12ꎬ实时荧光定量结果表明IbCLE12受PEG6000干旱和ABA处理诱导显著上调表达ꎬ推测IbCLE12在甘薯抗旱性中发挥重要的调控作用ꎮ本研究结果可为进一步解析甘薯CLE多肽家族功能及IbCLE12基因在甘薯抗旱性中的分子机制奠定基础ꎮ关键词:甘薯ꎻCLE多肽ꎻ生物信息学分析ꎻIbCLE12ꎻ基因表达ꎻ抗旱性中图分类号:S531:Q78㊀㊀文献标识号:A㊀㊀文章编号:1001-4942(2023)05-0001-07Genome ̄WideIdentificationofCLEPeptideFamilyinSweetPotatoandCloningandExpressingAnalysisofIbCLE12underDroughtStressZhouYuanyuan1ꎬZhaoChunling2ꎬHouFuyun1ꎬLiAixian1ꎬQinZhen1ꎬWangQingmei1ꎬDongShunxu1(1.CropResearchInstituteꎬShandongAcademyofAgriculturalSciencesꎬJinan250100ꎬChinaꎻ2.ShandongNormalUniversityꎬJinan250014ꎬChina)Abstract㊀CLAVATA3/Embryosurroundingregion ̄related(CLE)peptidesaresignallingphytohor ̄monesinplantsꎬwhichplayimportantrolesinplantgrowthanddevelopmentandresponsetostresses.Inthisstudyꎬ12ItfCLEgeneswereisolatedfromIpomoeatrifidagenomedatabaseꎬandtheirstructureꎬphysicochem ̄icalpropertiesꎬevolutionaryrelationshipandexpressionlevelwereanalyzed.Theresultsshowedthatthe12It ̄fCLEproteinswerebetween81~154aainlengthand9.0~17.5kDainmolecularweightꎻallofthemcon ̄tainedaC ̄terminalconservedmotif(VSKRKVPSGPBPJHN)ꎻmostofthemwereunstableproteinsexceptforItfCLE2andItfCLE6ꎻtheywerehydrophilicandlipid ̄solubleproteinsexceptforItfCLE5ꎻthesubcellularlo ̄cationrevealedthatalltheywereextracellularsecretorysmallpeptides.Thephylogeneticanalysisshowedthatthe12CLEpolypeptidesweredividedintofivesubgroups.TheexpressionanalysisshowedthattheexpressionofItfCLEsweredifferentindifferentorgans.ItfCLE9andItfCLE10mainlyexpressedinflowersꎬwhileItfCLE4andItfCLE12mainlyinrootsandItfCLE2ꎬItfCLE6andItfCLE8mainlyinstemꎻtheexpressionofItfCLE12wasthehighestunderdroughtstressꎬandthatofItfCLE8wasup ̄regulatedunderdroughtandsaltstresses.ThehomologousgeneofItfCLE12wasclonedfromsweetpotatocultivarJishu25andwasnamedasIbCLE12.Thereal ̄timequantitativepolymerasechainreaction(qRT ̄PCR)showedthattheexpressionofIbCLE12wasup ̄regulatedbyPEG6000andABAtreatmentꎬwhichindicatedthatitmightplayaimportantroleindroughtre ̄sistanceofsweetpotato.TheseresultscouldlayfoundationsforfurtherresearchesonthefunctionsofCLEfam ̄ilyandthemolecularmechanismofIbCLE12indroughttoleranceofsweetpotao.Keywords㊀SweetpotatoꎻCLEpeptideꎻBioinformaticsanalysisꎻIbCLE12ꎻGeneexpressionꎻDroughtresistance㊀㊀多肽类激素与脱落酸㊁茉莉酸㊁细胞分裂素㊁生长素㊁赤霉素㊁乙烯等传统植物激素一起ꎬ在植物抵御逆境胁迫过程中起重要作用ꎬ近年来多肽激素的研究进展较快[1ꎬ2]ꎮCLAVATA3/Embryosurroundingregion-related(CLE)多肽家族是研究最多的一类多肽激素[3ꎬ4]ꎬ其命名依据是拟南芥CLAVATA3(CLV3)和玉米胚胎周边区(embryosurroundingregionꎬERS)ꎻ在结构上ꎬ一般编码50~200个氨基酸的小蛋白ꎬN-末端存在一个分泌信号肽ꎬC-末端存在一个含14个氨基酸的保守结构域ꎬ中间是可变区域[5]ꎻ根据CLEmotif的首个氨基酸类型将其分为R(arginineꎬArg)和H(histidineꎬHis)两类ꎬ这两类之外的统称other类[6]ꎮ相关研究表明ꎬCLE家族成员在根㊁茎尖分生组织的干细胞分裂和分化㊁维管(原)形成层㊁激素信号响应以及抗逆性响应中发挥着关键性作用[7-9]ꎮ目前ꎬ在拟南芥中发现32个CLE成员[6]ꎬ其中ꎬCLE25多肽在根部响应干旱胁迫ꎬ并通过BAM受体将缺水信号传导至叶片ꎬ与ABA共同调控气孔的关闭ꎬ减少蒸腾作用ꎬ从而提高对干旱的抗性[9]ꎮ甘薯[Ipomoeabatatas(L.)Lam.]是世界主要农作物之一ꎬ可用作粮食㊁饲料㊁工业原料和新型能源ꎬ广泛种植于100多个国家或地区ꎬ具有重要的经济价值[10ꎬ11]ꎮ甘薯在生长过程中经常遭受干旱等逆境胁迫[12]ꎬ所以研究CLE家族成员及其功能对提高甘薯抗逆性具有重要意义ꎮ目前已有57个植物基因组中的1628个CLE多肽得到预测ꎬ但在甘薯中尚未见研究报道ꎮ本研究利用野生型甘薯Ipomoeatrifida(H.B.K.)G.Don.的基因组[13]ꎬ系统挖掘甘薯CLE家族成员ꎬ利用生物信息学方法进行分析ꎬ并进一步从甘薯栽培种中克隆得到IbCLE12基因ꎬ利用实时荧光定量法分析其在干旱胁迫下的表达ꎬ以期为探究甘薯CLE多肽家族基因的功能奠定基础ꎮ1㊀材料与方法1.1㊀试验材料甘薯近缘二倍体野生种Ipomoeatrifida(H.B.K.)G.Don.ꎬ是栽培甘薯的祖先种之一ꎬ其基因组测序已经完成ꎮ甘薯栽培种选用济薯25ꎮ1.2㊀IpomoeatrifidaCLE家族基因的全基因组鉴定及分析1.2.1㊀甘薯CLE家族基因的筛选㊀基于甘薯组学资源网GT4SP项目的基因注释文件(http://sweetpotato.plantbiology.msu.edu/index.shtml)查找所有已注释的ItfCLE基因ꎬ并下载相关序列ꎮ1.2.2㊀ItfCLE基因结构分析㊀利用ProtParam在线软件(https://web.expasy.org/protparam)分析ItfCLE蛋白理化性质ꎮ利用TMHMM2.0(ht ̄tps://services.healthtech.dtu.dk/service.php?TM ̄HMM-2.0)分析基因的跨膜螺旋位点ꎬ利用Soft ̄BerryProtComp9.0预测蛋白亚细胞定位情况ꎮ利用MEME(http://meme ̄suite.org/tools/meme)分析ItfCLE氨基酸序列的保守结构域ꎬ参数设置为允许保守结构域重复出现㊁搜索得到的保守域上限为6个㊁基序长度为10~100ꎮ利用TBtools工具绘制ItfCLE基因结构图ꎮ1.2.3㊀ItfCLE家族的系统发育分析㊀采用MEGA5.0软件的NJ法ꎬ基于保守CLEmotif氨基酸序列ꎬ构建ItfCLEs和拟南芥AtCLEs的系统发育进化树ꎬBootstrap重复1000次ꎮ1.2.4㊀ItfCLEs基因的组织特异性表达和不同逆境下的表达谱分析㊀利用甘薯基因组学资源网站2㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀山东农业科学㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第55卷㊀中的RNA-seq基因表达数据ꎬ用FPKM(fragmentsperkilobasepermillionmappedreads)值表示基因相对表达水平ꎬ利用TBtools建立热图ꎬ进行不同基因间聚类ꎮ1.3㊀IbCLE12基因的克隆及表达分析1.3.1㊀IbCLE12基因的克隆㊀利用TRIzol试剂盒(Invitrogenꎬ上海ꎬ中国)提取总RNAꎬ利用TaKa ̄Ra反转录试剂盒PrimeScriptTMRTreagentKitwithgDNAEraser(PerfectRealTime)对样品进行反转录ꎬ获得济薯25的cDNAꎬ利用TaKaRaLATaq试剂盒扩增IbCLE12基因的完整CDS序列ꎮ扩增引物为IbCLE12-F(5ᶄ-ATGGGTAGTAATTTGAG ̄GAGTAGGA-3ᶄ)和IbCLE12-R(5ᶄ-TCATGGCTT ̄GTCAAGCTCTCC-3ᶄ)ꎮ扩增体系(50μL):LATaq0.5μLꎬLABuffer(Mg2+plus)8μLꎬdNTPMix ̄ture5μLꎬ引物混合物2μLꎬcDNA2μLꎬddH2O32.5μLꎮ扩增程序:94ħ3minꎻ94ħ30sꎬ55ħ30sꎬ72ħ30sꎬ34个循环ꎻ72ħ10minꎮ1.3.2㊀干旱胁迫和ABA处理下IbCLE12基因的表达分析㊀用2021年收获的济薯25薯块ꎬ在温室中培养4周ꎬ取长势一致㊁含5~6个功能叶的茎段ꎬ分别用含20%PEG6000和100mmol/LABA的1/2霍格兰溶液处理ꎬ分别于处理0㊁3㊁6㊁12㊁24㊁48h取叶片ꎬ用液氮速冻ꎬ-80ħ保存备用ꎮ利用InvitrogenTRIzol试剂盒提取总RNAꎬ利用TaKaRa反转录试剂盒PrimeScriptTMRTrea ̄gentKitwithgDNAEraser对每个样品进行反转录ꎬ利用SYBRPremixExTaqⅡ定量试剂(TliRNaseHPlusꎬTaKaRaꎬ大连ꎬ中国)在RocheLightCycler®480Ⅱ(Rocheꎬ英国)进行qRT-PCR分析ꎮ扩增引物为ItfCLE-qPCR-F(5ᶄ-TATTG ̄GTGGGAGTGGTTGGGT-3ᶄ)和ItfCLE-qPCR-R(5ᶄ-CATGCTCATATGCCTCATGCT-3ᶄ)ꎮ扩增体系:SYBRGreenMasterMix5μLꎬ引物混合物0.4μLꎬcDNA1μLꎬddH2O3.6μLꎮ反应程序:95ħ预变性2minꎻ95ħ变性15sꎬ55ħ退火15sꎬ72ħ延伸15sꎬ40个循环ꎮ使用内参基因IbActin为校准ꎬ利用2-ΔΔCt计算基因的相对表达水平ꎮ每个样品进行3次重复试验ꎬ以未处理(0h)的样品为对照ꎬ采用Student st-test方法进行显著性分析ꎮ2㊀结果与分析2.1㊀ItfCLE基因的筛选和蛋白特征分析从I.trifida中筛选到12个CLE家族基因ꎬ根据其在染色体上的位置进行重新编号ꎬ分别命名为ItfCLE1~ItfCLE12(表1)ꎮ这12个ItfCLE蛋白长度在81~154个氨基酸之间ꎬ分子量在9.0~17.5kDa之间ꎬ等电点均大于7ꎬ属于碱性蛋白ꎮ只有ItfCLE2和ItfCLE6为稳定蛋白ꎬ其余均为不稳定蛋白ꎬ且ItfCLE3不稳定系数最高ꎮ除分子量最大的ItfCLE5为疏水脂溶蛋白外ꎬ其余均为亲水性脂溶蛋白ꎮ根据保守区的首个氨基酸类型分类ꎬ只有ItfCLE6属于H型ꎬ其余均为R型ꎮ㊀㊀表1㊀ItfCLEs蛋白理化性质基因名称基因编号氨基酸数(aa)分子量(kDa)等电点不稳定系数脂溶系数总平均亲水性跨膜螺旋起止位点CLE基序ItfCLE1itf00g65600.t110712.49.3058.9185.70-0.6159 26RRVRKGSDPIHNItfCLE2itf01g24760.t19710.710.0937.1672.47-0.51613 35RKVRTGPNPLHNItfCLE3itf02g10900.t1819.08.0383.5970.00-0.3627 29RKIPTGSNPLHNItfCLE4itf05g24380.t110411.711.2153.0479.71-0.36615 32RRVPNGPDPIHNItfCLE5itf06g14150.t115417.59.1453.07100.000.21327 84RLVPSGPNPLHHItfCLE6itf07g19560.t1889.910.5737.2773.30-0.37512 34HKKPSGPNPIGNItfCLE7itf07g21380.t111713.09.5571.8867.61-0.268膜外RLVPSGPNPLHNItfCLE8itf08g12680.t19510.910.4655.3369.68-0.5087 29RRVPNGSDPIHNItfCLE9itf13g22480.t110411.811.2266.7590.96-0.408膜外RLVPTGPNPLHHItfCLE10itf14g01560.t19910.811.1471.5859.19-0.51413 35RRVPSCPDPLHNItfCLE11itf14g03150.t114716.49.4745.0470.20-0.435膜外RKVPSGPDPIVSItfCLE12itf14g03970.t111212.810.3252.1969.55-0.88610 32RKVPNGPDPIHN3㊀第5期㊀㊀㊀㊀㊀周媛媛ꎬ等:甘薯CLE多肽家族的全基因组鉴定和IbCLE12的克隆及抗旱性表达分析㊀㊀利用MEME软件分析ItfCLE蛋白的保守结构域ꎬ共获得6个保守基序ꎬ分别命名为Motif1~Motif6ꎮ12个ItfCLE成员均含有Motif1(VSKRKVPSGPBPJHN)ꎬ所以ꎬMotif1是甘薯CLE的特征保守基序(图1)ꎮ根据蛋白定位预测结果(表2)ꎬ12个ItfCLE蛋白在胞外都有分布ꎻ仅ItfCLE9在质膜中有分布ꎬ其余蛋白则在细胞质㊁过氧化物酶体以及叶绿体中有分布ꎮ据此推测ItfCLE蛋白可能主要存在于过氧化物酶体㊁叶绿体以及细胞质中ꎬ外排到胞外ꎮ2.2㊀ItfCLEs的进化分析通过ItfCLEs与AtCLEs的进化关系树(图2)可知ꎬ甘薯的ItfCLEs主要分为5个亚族ꎮItf ̄CLE1㊁ItfCLE4㊁ItfCLE6㊁ItfCLE8㊁ItfCLE11㊁Itf ̄CLE12亲缘关系较近ꎬ其中ꎬItfCLE1㊁ItfCLE8㊁Itf ̄CLE4与拟南芥的AtCLE45属于同一组ꎬItfCLE12与AtCLE25属于同一组ꎬItfCLE6与AtCLE46属于同一组ꎻItfCLE10与AtCLE27亲缘关系较近ꎻIt ̄fCLE3和ItfCLE2属于同一亚族ꎬ并与AtCLE20亲缘关系较近ꎻItfCLE7与AtCLE9㊁AtCLE10亲缘关系较近ꎻItfCLE5和ItfCLE9属于同一亚族ꎬ分别与AtCLE13和AtCLE8亲缘关系较近ꎮ图1㊀ItfCLE蛋白保守基序分析㊀㊀表2㊀ItfCLE蛋白的定位分析蛋白名称细胞核质膜胞外细胞质线粒体细胞质内层过氧化物酶体高尔基体叶绿体液泡ItfCLE10.000.002.381.900.580.002.250.782.110.00ItfCLE20.000.002.232.050.910.002.201.231.380.00ItfCLE30.000.002.271.991.590.002.121.130.890.00ItfCLE40.000.002.321.880.850.002.210.722.020.00ItfCLE50.000.002.281.960.990.002.151.161.460.00ItfCLE60.690.003.020.720.000.002.580.002.980.00ItfCLE70.000.002.371.250.910.182.281.261.750.00ItfCLE80.000.002.421.291.240.032.220.941.870.00ItfCLE90.000.978.730.001.180.000.120.000.000.00ItfCLE100.000.002.391.641.230.002.031.031.670.00ItfCLE110.000.002.760.890.450.102.610.582.620.00ItfCLE120.000.002.231.930.970.002.121.221.530.002.3㊀ItfCLE基因的组织特异性表达分析结果(图3)表明ꎬItfCLE9㊁ItfCLE10在花中有较高的表达ꎻItfCLE4㊁ItfCLE12在根中有较高的表达ꎻItfCLE1㊁ItfCLE3㊁ItfCLE5㊁ItfCLE7㊁ItfCLE11在各组织中表达量较低ꎬ差异较小ꎻItfCLE2㊁ItfCLE6和ItfCLE8在茎中表达较高ꎮ2.4㊀ItfCLE基因在不同逆境胁迫下的表达特征分析结果(图4)表明ꎬ与对照相比ꎬItfCLE10受旱㊁盐胁迫和两种病害处理后下调表达ꎻItfCLE8受旱㊁盐胁迫后上调表达ꎬ受冷和热胁迫后下调表达ꎻItfCLE12受旱胁迫和病2处理后上调表达ꎬ受4㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀山东农业科学㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第55卷㊀盐㊁冷和病1胁迫后下调表达ꎻItfCLE3受盐㊁冷㊁热胁迫后下调表达ꎮ其余基因受胁迫后表达量变化较小ꎮ2.5㊀IbCLE12基因的克隆和氨基酸序列比对利用同源克隆方法在济薯25中克隆得到Itf ̄CLE12的同源基因ꎬ命名为IbCLE12ꎮ氨基酸序列比对结果(图5)表明ꎬIbCLE12与ItfCLE12一致性较高ꎬ仅在第23㊁26位有两个氨基酸的差异ꎻIbCLE12与AtCLE25的一致性达到32.74%ꎬ两者C端保守CLE基序一致ꎮ图2㊀甘薯12个ItfCLEs和拟南芥32个AtCLEs进化树分析根1㊁根2为两个重复ꎮ图3㊀甘薯12个ItfCLE基因的组织特异性表达分析CK1为旱㊁盐处理的对照ꎬCK2为冷处理的对照ꎬCK3为热处理的对照ꎬCK4为病1(氨基丁酸模拟病害处理)和病2(苯并噻二唑模拟病害处理)处理的对照ꎮ图4㊀甘薯12个ItfCLE基因的表达谱分析5㊀第5期㊀㊀㊀㊀㊀周媛媛ꎬ等:甘薯CLE多肽家族的全基因组鉴定和IbCLE12的克隆及抗旱性表达分析图5㊀IbCLE12与ItfCLE12㊁AtCLE25的序列比对2.6㊀IbCLE12基因受干旱和ABA诱导表达分析结果(图6)表明ꎬIbCLE12基因受干旱和ABA诱导上调表达ꎬ分别在处理6h(5.48倍)和12h(5.06倍)表达量最高ꎮ处理时间延长ꎬ表达量显著降低ꎮ柱上不同小写字母表示不同处理时间差异显著(P<0.05)ꎮ图6㊀干旱(A)和ABA(B)胁迫下IbCLE12基因的表达情况3㊀讨论与结论CLE家族基因编码的多肽是21世纪以来发现的新型多肽激素ꎬ在细胞间的信号交流中发挥重要作用[3ꎬ5ꎬ14]ꎮCLE蛋白信号肽使蛋白迁移至细胞膜ꎬ并与膜上的受体激酶特异性结合ꎬ将信号转导至下游分生组织发育的WUSCHEL(WUS)转录因子ꎬ形成信号转导模块ꎬ从而调控分生组织的干细胞增殖和分化ꎬ最终影响根㊁茎等器官的分化[15]ꎮ甘薯野生种I.trifida中包含12个CLE家族基因ꎬ蛋白C端均包含CLE保守结构域ꎬ家族基因数量少于拟南芥等模式植物ꎬ可能与数据库组装过程中小分子基因的覆盖度相关[16]ꎮ甘薯作为块根作物ꎬ根中分生组织的干细胞分化和增殖直接影响形成层的发育ꎬ并最终与产量密切相关ꎮ有研究表明ꎬ通过对人参CLE家族序列特征和系统进化关系进行分析ꎬ发现PgCLE基因对其根型发育起重要的调控作用[17]ꎮ本研究结果表明ꎬItfCLE在野生型甘薯中存在明显的组织表达差异性ꎬ其中ꎬItfCLE9㊁ItfCLE10在花中有较高的表达ꎻItfCLE4㊁ItfCLE12在根中有较高的表达ꎻItf ̄CLE2㊁ItfCLE6和ItfCLE8在茎中表达较高ꎻItf ̄CLE1㊁ItfCLE3㊁ItfCLE5㊁ItfCLE7㊁ItfCLE11在各组织中表达量较低ꎬ差异较小ꎮ可见ꎬ甘薯中CLE成员在不同器官发育过程中可能发挥不同的调控作用ꎮCLE家族基因在作物响应生物胁迫中也具有重要调节作用ꎮ研究表明ꎬ在大豆囊线虫㊁马铃薯囊线虫和根结线虫中具有和宿主类似的CLEꎬ并通过与宿主中的CLE受体相互作用ꎬ提高线虫对宿主的侵染力[18ꎬ19]ꎮ敲除CLE受体可以显著提高大豆对大豆囊线虫的抵抗能力[20]ꎮ本研究结果表明ꎬ与对照相比ꎬ在两种病害胁迫下大部分ItfCLEs表达量变化不大ꎬ但ItfCLE7㊁ItfCLE10明显下调表达ꎬItfCLE12在病1处理下也表达下调ꎬ推测其在生物胁迫中主要起负调控作用ꎮ6㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀山东农业科学㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第55卷㊀CLE家族基因在作物抵御非生物胁迫中也发挥重要作用ꎮ研究表明ꎬ拟南芥的AtCLE25多肽可以实现从根到芽的长距离信号转导ꎬ并通过介导ABA信号途径促进气孔关闭ꎬ感应根的缺水信号ꎬ提高植物的抗旱性[9]ꎻAtCLE45通过下游受体SKM1和SKM2调节拟南芥种子形成过程中的耐热性[21]ꎮ在拟南芥缺失突变体cle40-2中ꎬABA合成通路上的AtCLE25㊁AtCLE45基因表达下调ꎬ说明其在ABA合成通路上起关键的正调控功能[22]ꎮ在本研究中ꎬ受旱胁迫后明显上调表达的有ItfCLE8和ItfCLE12ꎬ而ItfCLE12与拟南芥At ̄CLE25亲缘关系较近ꎬ推测ItfCLE12在甘薯抗旱性中发挥调控作用ꎮ为此ꎬ我们在甘薯栽培品种中克隆了ItfCLE12的同源基因IbCLE12ꎬ并进行模拟干旱和ABA处理ꎬ结果表明该基因分别在处理6h和12h受干旱和ABA诱导显著上调表达ꎬ可为深入研究IbCLE12在甘薯抗旱性中的分子机制奠定基础ꎮ参㊀考㊀文㊀献:[1]㊀ZhuJK.Abioticstresssignalingandresponsesinplants[J].Cellꎬ2016ꎬ167(2):313-324.[2]㊀HirakawaYꎬSawaS.Diversefunctionofplantpeptidehor ̄monesinlocalsignalinganddevelopment[J].CurrentOpinioninPlantBiologyꎬ2019ꎬ51:81-87.[3]㊀CockJMꎬMccormickS.Alargefamilyofgenesthatshareho ̄mologywithCLAVATA3[J].PlantPhysiologyꎬ2001ꎬ126(3):939-942.[4]㊀FletcherJCꎬBrandUꎬRunningMPꎬetal.SignalingofcellfatedecisionsbyCLAVATA3inArabidopsisshootmeristems[J].Scienceꎬ1999ꎬ283(5409):1911-1914. [5]㊀SharmaVKꎬRamirezJꎬFletcherJC.TheArabidopsisCLV3 ̄like(CLE)genesareexpressedindiversetissuesandencodesecretedproteins[J].PlantMolecularBiologyꎬ2003ꎬ51(3):415-425.[6]㊀ItoYꎬNakanomyoIꎬMotoseHꎬetal.Dodeca ̄CLEpeptidesassuppressorsofplantstemcelldifferentiation[J].Scienceꎬ2006ꎬ313(5788):842-845.[7]㊀GruelJꎬLandreinBꎬTarrPꎬetal.Anepidermis ̄drivenmech ̄anismpositionsandscalesstemcellnichesinplants[J].Sci ̄enceAdvancesꎬ2016ꎬ2(1):e1500989.[8]㊀JenniferCF.RecentadvancesinArabidopsisCLEpeptidesig ̄naling[J].TrendsinPlantScienceꎬ2020ꎬ137(22):3911-3920.[9]㊀TakahashiFꎬSuzukiTꎬOsakabeYꎬetal.Asmallpeptidemodu ̄latesstomatalcontrolviaabscisicacidinlong ̄distancesignal ̄ling[J].Natureꎬ2018ꎬ556(7700):235-238.[10]ElSAꎬRayRC.Potentialimpactsofbioprocessingofsweetpotato:review[J].CriticalReviewsinFoodScienceandNutri ̄tionꎬ2017ꎬ57(3):455-471.[11]马代夫ꎬ李强ꎬ曹清河ꎬ等.中国甘薯产业及产业技术的发展与展望[J].江苏农业学报ꎬ2012ꎬ28(5):969-973. [12]LiuYꎬChenQꎬZhouMꎬetal.SweetpotatostudyinChina:stressresponsemechanismsꎬmolecularbreedingꎬandproduc ̄tivity[J].JournalofPlantPhysiologyꎬ2020ꎬ254:153283. [13]HirakawaHꎬOkadaYꎬTabuchiHꎬetal.SurveyofgenomesequencesinawildsweetpotatoꎬIpomoeatrifida(H.B.K.)G.Don.[J].DNAResearchꎬ2015ꎬ22(2):171-179. [14]MatsubayashiYꎬYangHꎬSakagamiY.Peptidesignalsandtheirreceptorsinhigherplants[J].TrendsinPlantScienceꎬ2001ꎬ6(12):573-577.[15]WilloughbyACꎬNimchukZL.WOXgoingon:CLEpeptidesinplantdevelopment[J].CurrentOpinioninPlantBiologyꎬ2021ꎬ63:102056.[16]KhitunAꎬNessTJꎬSlavoffSA.Smallopenreadingframesandcellularstressresponses[J].MolecularOmicsꎬ2019ꎬ15(2):108-116.[17]李天笑ꎬ李琛ꎬ孙彻ꎬ等.人参CLE多肽的系统鉴定及其功能分析[J].分子植物育种ꎬ2022ꎬ20(22):7391-7399. [18]ChenSꎬLangPꎬChronisDꎬetal.InplantaprocessingandglycosylationofanematodeCLAVATA3/ENDOSPERMSUR ̄ROUNDINGREGION ̄likeeffectoranditsinteractionwithahostCLAVATA2 ̄likereceptortopromoteparasitism[J].PlantPhysiologyꎬ2015ꎬ167(1):262-272.[19]GuoYFꎬNiJꎬDenverRꎬetal.MechanismsofmolecularmimicryofplantCLEpeptideligandsbytheparasiticnematodeGloboderarostochiensis[J].PlantPhysiologyꎬ2011ꎬ157(1):476-484.[20]GuoXLꎬChronisDꎬDeLaTorreCMꎬetal.Enhancedresist ̄ancetosoybeancystnematodeHeteroderaglycinesintransgenicsoybeanbysilencingputativeCLEreceptors[J].PlantPhysiol ̄ogyꎬ2015ꎬ13(6):801-810.[21]EndoSꎬShinoharaHꎬMatsubayashiYꎬetal.Anovelpollen ̄pistilinteractionconferringhigh ̄temperaturetoleranceduringreproductionviaCLE45signaling[J].CurrentBiologyꎬ2013ꎬ23(17):1670-1676.[22]PallakiesHꎬSimonR.TheCLE40andCRN/CLV2signalingpathwaysantagonisticallycontrolrootmeristemgrowthinArabi ̄dopsis[J].MolecularPlantꎬ2014ꎬ7(11):1619-1636.7㊀第5期㊀㊀㊀㊀㊀周媛媛ꎬ等:甘薯CLE多肽家族的全基因组鉴定和IbCLE12的克隆及抗旱性表达分析。