水稻全基因组R基因鉴定及候选RGA标记开发
- 格式:pdf
- 大小:516.19 KB
- 文档页数:5
一种新的水稻香味基因功能标记的开发与应用作者:刘文静胡文彬周政刘烨赵正洪徐庆国来源:《热带作物学报》2022年第04期摘要:香味是影響稻米品质的一个重要性状,Badh2基因突变是水稻产生香味的主要原因,水稻香味产生主要有Badh2基因第2、4、5、7、8外显子突变类型,其中研究最多的是第7外显子突变类型。
为了提高水稻香味性状检测的准确性、安全性和效率,本研究根据水稻Badh2基因突变(第7外显子8 bp缺失、3 bp突变)的序列设计开发了3条分子标记引物,分别命名为Fgr-FF、Fgr-NF和Fgr-R,利用该三引物分子标记法可准确扩增出Badh2第7外显子突变基因,并鉴定其纯杂合情况。
本标记利用PCR扩增中引物5¢端保守性差的特点,将31 bp 外源DNA序列添加至Fgr-NF引物的5¢端,将Badh2基因第7外显子突变类型的非香型和香型特征条带差异由8 bp扩大至41 bp,通过琼脂糖凝胶就能准确、清晰、快速地检测出水稻植株中香味基因的纯合、杂合和无3种基因型。
利用该三引物分子标记的PCR扩增结果表明:该标记在香型水稻中扩增出一条115 bp的特征条带,在非香型水稻中扩增出一条156 bp的特征条带,而在杂合型水稻中能同时扩增出115 bp和156 bp两条特征条带。
本研究利用该三引物功能标记对30个水稻品种香味基因型进行检测,结果检测出香味纯合植株9株,非香纯合植株20株,该检测结果与2种表型鉴定结果相符;杂合植株1株,这是由于水稻香味基因是隐性基因,杂合型水稻叶片表现为非香,部分籽粒表现为香;使用传统的香味鉴定方法容易对香味杂合型水稻产生误判,而通过基因检测结果和表型验证表明新开发香味三引物功能标记准确可靠;利用三引物功能标记对94个F2代单株的香味基因进行检测,结果检测出香味纯合植株23株,非香纯合植株44株,杂合植株27株,符合1∶2∶1孟德尔遗传的分离比例。
该研究既避免了水稻香味鉴定与检测中KOH法和咀嚼法的主观误差,也解决了聚丙烯酰胺凝胶电泳的毒性强、耗时长等问题,大幅度地提高了香型水稻品种的选择效率。
水稻功能基因组学
《水稻功能基因组学》
1. 什么是水稻功能基因组学
水稻功能基因组学是一种研究水稻基因、调控元件以及它们之间关系的基因组学分析方法。
它也称为水稻结构基因组学、水稻基因组注释、水稻转录组分析、水稻基因组辅助比较、水稻DNA芯片分析等。
2. 水稻功能基因组学的基本技术
水稻功能基因组学的基本技术包括基因克隆、染色质基因克隆、染色质免疫沉淀、小RNA技术、cDNA克隆、DNA测序、转录组分析、甲基化分析和生物信息学分析等。
3. 水稻功能基因组学的应用
水稻功能基因组学通过对水稻基因、调控元件及它们之间调控网络的研究,可以解析水稻的遗传特性,深入了解水稻的生物学特性,可以为水稻的种质改良和育种提供有用信息。
此外,它还可以为水稻抗逆性、营养品质、穗发育特性的调控、除草剂抗性基因的挖掘等提供重要依据。
水稻功能基因组
水稻功能基因组是指水稻基因组中具有特定功能的基因组成的集合。
水稻是世界上重要的粮食作物之一,其功能基因组研究有助于了解水稻的生物学特性和农艺性状,提高水稻的抗病虫害能力和产量。
水稻功能基因组研究的主要内容包括:
1. 基因功能鉴定:通过基因敲除、基因表达调控等方法,确定水稻基因的功能和参与的生物过程,如光合作用、抗逆性等。
2. 基因互作网络:研究水稻基因之间的相互作用关系,构建基因互作网络,揭示基因调控网络和信号传递途径。
3. 基因表达调控:研究水稻基因的转录调控机制,包括转录因子、miRNA等对基因表达的调控。
4. 基因组变异分析:研究水稻基因组中的遗传变异,包括单核苷酸多态性(SNP)和插入/缺失事件等,以及这些变异与性状相关性的分析。
5. 基因工程:应用功能基因组研究的成果,进行水稻的基因编辑、转基因等技术,改良水稻的农艺性状和抗逆能力。
水稻功能基因组的研究可以帮助农业科学家和育种者更好地理解水稻的遗传机制和性状调控,为水稻的改良和优化提供科学依据。
此外,水稻功能基因组的研究也为其他作物的基因组研究提供了借鉴和参考。
作物学报 ACTA AGRONOMICA SINICA 2019, 45(1): 1-9/ ISSN 0496-3490; CN 11-1809/S; CODEN TSHPA9E-mail: zwxb301@本研究由国家重点研发计划项目(2016YFD0100101-08), 国家自然科学基金重点项目(91535302)和国家级大学生创新性实验计划项目(201710307014)。
This study was supported by the National Key Research and Development Program of China (2016YFD0100101-08), the Key Projects of National Natural Science Foundation (91535302), and the National University Student Innovation Program (201710307014).*通信作者(Corresponding author): 江玲, E-mail: jiangling@第一作者联系方式: E-mail: 11115225@Received(收稿日期): 2018-06-07; Accepted(接受日期): 2018-10-08; Published online(网络出版日期): 2018-11-01. URL: /kcms/detail/11.1809.S.20181030.1120.004.htmlDOI: 10.3724/SP.J.1006.2019.82032水稻圆粒基因RS 的鉴定和定位陈雅萍 缪 荣 刘 喜 陈本佳 兰 杰 马腾飞 王益华 刘世家 江 玲*南京农业大学作物遗传与种质创新国家重点实验室 / 江苏省植物基因工程技术研究中心, 江苏南京210095摘 要: 阐明水稻籽粒大小相关基因的遗传和分子机制对水稻产量形成具有重要意义。
生物信息学在作物遗传育种中的应用作物是我们日常生活中离不开的一部分,而遗传育种则是作物品种改良的重要手段。
传统的遗传育种方法必须依赖于长期的培育、育种和选育,但无论是时间成本还是费用成本都非常高昂。
随着现代科学技术的不断发展,生物信息学的出现为作物遗传育种提供了更为有效和便捷的手段,迅速成为作物遗传研究中的重要工具和方法。
生物信息学是一门将计算机科学、生命科学和数学技术结合起来的交叉学科,主要研究基因组学、蛋白质组学、转录组学等相关领域中的生物信息学问题,旨在提高数据分析的效率和准确性,为生命科学研究提供有力支持。
在作物遗传育种中,生物信息学应用主要包括基因组数据的挖掘、分析和解读,从而为作物优良品种的培育和选育提供理论依据和实验基础。
一、生物信息学在作物遗传育种中的应用1. 基因组测序和组学分析随着高通量测序技术的发展,基因组测序和组学分析成为生物信息学的重要组成部分。
通过对不同作物基因组的整体测序,可以全面了解作物的基因结构、基因组变异、分子标记和全基因组序列信息,同时也为作物基因组功能分析和生物学进化分析提供了重要依据。
综合应用基因组测序和组学分析技术,能够揭示作物遗传育种中的许多问题,为改进和优化作物品种提供新的思路和举措。
2. 转录组分析作物生长发育和适应环境的过程中,其中很大一部分遵循基因转录水平的调控。
转录组分析以高通量测序技术为基础,利用RNA-seq分析转录水平的变化,得出基因表达模式和调控网络,为作物适应环境和生长发育提供理论依据。
转录组分析也为作物品种的筛选和优化提供新的途径。
3. 生物信息学数据库和资源利用生物信息学数据库是各类生物信息学数据和理论的库存,包括基因组数据库、分子数据库和生态系统数据库等。
通过对生物信息学数据库的挖掘和分析,可以发现新的适应机制和生物学规律,同时也为作物遗传育种研究和实践提供更加广泛和深入的信息资源。
二、生物信息学在作物遗传育种中的应用案例1. 水稻基因组测序及分析2002年,水稻全基因组测序完成,通过比较和分析,发现RGA1基因的表达与水稻莱秆抗病性有关,RGA2基因与水稻缺花性相关。
水稻全基因组关联分析及其花品种选育近年来,随着基因测序技术的不断发展,全基因组关联分析在许多领域取得了广泛的应用,其中包括水稻的花品种选育。
水稻是世界上最重要的粮食作物之一,对于解决全球粮食安全问题具有重要意义。
而在水稻育种中,花品种的选育是至关重要的一环,通过全基因组关联分析可以有效地辅助实现该目标。
水稻基因组序列于2002年完成,为水稻花品种选育提供了重要的基础数据。
全基因组关联分析是一种通过在大量样本中比较基因型和表型,找出基因与表型之间的关联的方法。
其基本原理是将样本的基因型与表型数据进行关联,从而找出特定基因与表型之间的联系。
在水稻花品种选育中,全基因组关联分析通常使用基于单核苷酸多态性(SNP)的关联研究。
SNP是基因组DNA序列中常见的变异形式之一。
它是指在基因组DNA序列某个位置上出现的一个单个核苷酸变异。
SNP的存在可以与个体物理和生化性状的变异相关联。
因此,通过分析大量样本的SNP位点与花表型数据的关系,可以找到与花表型相关的SNP位点,从而辅助选育出更好的花品种。
水稻全基因组关联分析需要大量的数据和计算资源。
首先,需要收集足够数量的花表型数据和基因型数据。
其次,需要使用适当的统计学方法来分析数据。
常用的统计学方法包括线性回归和混合效应模型。
最终,需要在大量样本中验证分析结果的可靠性,并使用该结果来开发新的花品种。
全基因组关联分析在水稻花品种选育中的应用已经取得了重要进展。
例如,在水稻花生产中,使用全基因组关联分析可以找到与花粉数量和质量相关的SNP位点,从而辅助选育出更好的花品种。
另外,全基因组关联分析还可以在其他水稻花性状的选育中发挥重要作用,如花瓣颜色、花形态等。
全基因组关联分析在水稻花品种选育中的潜在应用还有很多。
未来的研究需要进一步探究SNP位点与表型之间的关联,开发更加高效的统计学方法。
此外,还需要建立更大规模的花表型和基因型数据库,以便更加深入地了解水稻花品种的遗传基础。
论 文 第50卷 第11期 2005年6月 www.scichina.com 1085 水稻全基因组R基因鉴定及候选RGA标记开发 汪旭升① 吴为人①②* 金谷雷② 朱 军① (① 浙江大学农业与生物技术学院生物信息学研究所, 杭州 310029; ② 福建农林大学作物科学学院, 福州 350002. * 联系人, E-mail: wuwr@zju.edu.cn)
摘要 用45个已知功能的植物抗病(R)基因序列对粳稻全基因组序列进行搜索, 共找出2119个R基因同源序列或类似物(RGA), 表明RGA在水稻基因组中成簇存在, 呈非随机分布. 采用隐马尔柯夫模型(HMM), 将这些RGA按其功能域分成了21类. 将粳稻的RGA与籼稻的基因组序列进行比较, 共找到
702个两亚种间等位的RGA, 并发现其中有671个(占95.6%)RGA的基因组序列(包括编码区和非编码
区)在两亚种间存在长度差异(InDel), 表明水稻RGA在两亚种间存在很高的多态性. 通过在InDel两侧设计引物并进行e-PCR验证, 共开发出402个基于PCR的、表现为共显性的候选RGA标记. 这些候选标记在两亚种间的长度差异在1~742 bp之间, 平均为10.26 bp. 有关数据均可从我们的网站(http://ibi.zju.edu.cn/RGAs/index.html)上获得.
关键词 水稻 抗病基因 RGA 多态性 分子标记
植物抗病(R)基因是决定寄主植物对病原菌专化性识别并激发抗病反应的基因, 与病原菌的无毒基因互补. 经典遗传学认为, 植物与病原菌间相互作用的遗传机制是“基因对基因”, 并提出了配体-受体模型来解释这一学说[1,2]. 自1992年以来, 利用图位克隆和转座子标签法, 已经在水稻、拟南芥、玉米、烟草、亚麻等植物中克隆了40多个R基因[3]. 研究发现, 这些R基因存在一些共同的结构. 根据其蛋白结构及在细胞中的位置, R基因大致可分为5类[4,5]: (ⅰ) NBS-LRR, 是含有核苷酸结合位点(NBS)和富亮氨酸重复(LRR)的胞内受体蛋白基因, 包括2个亚类: (1) TIR-NBS-LRR, 以拟南芥的RPP5基因、烟草的N基因及亚麻的L6和M基因为代表; (2) CC-NBS-LRR, 以拟南芥的RPS2和RPM1基因、番茄的I2基因及大麦的Mla1基因为代表. (ⅱ) 细胞间的苏氨酸/丝氨酸蛋白激酶(PK)基因, 包括番茄的Pto基因和大麦的Rpg1基因. (ⅲ) LRR-TM, 是N端存在一个胞外LRR, C端具有由疏水氨基酸组成的跨膜区的受体蛋白基因, 包括番茄抗叶霉病的基因Cf-2, Cf-4, Cf-5和Cf-9等. (ⅳ) PK-LRR-TM, 除含有LRR-TM结构外, 还具有PK结构, 包括水稻的Xa-21基因和拟南芥的FLS2基因. (ⅴ) SA-CC, 包括拟南芥的RPW8.2和RPW8.1基因. 此外, 还有玉米的Hm1及HslPro-1和Asc等其他结构域的R基因. R基因是一个庞大的基因家族. 尽管已经克隆了40多个R基因, 但对R基因的了解还非常有限. 目前, 对拟南芥和水稻的基因组测序工作皆已基本完成. 水稻籼、粳2个亚种的基因组草图已经完成[6,7], 而且粳稻的1号、4号和10号3条染色体已经发布了精细图[8~10]. 这些成果为在整个基因组水平上研究R基
因提供了契机. 利用拟南芥基因组的测序结果, Meyers等人[11]分析了NBS-LRR型R基因在拟南芥
基因组中的分布. 对水稻基因组序列的初步分析显示, 水稻基因组中存在大量的R基因[6~7], 且往往成
簇存在[12~14]. Monosi等人[15]发现在水稻中存在近500个NBS-LRR的基因, 但没有发现TIR的基因. Chelkowski等人[16]和Koczyk等人[17]利用18个已知
的R基因分别对拟南芥和粳稻基因组序列进行分析, 发现拟南芥和水稻分别存在549和1744个R基因, 其中水稻的R基因中有597个属于NBS-LRR类型. 可以看出, 目前这些基于基因组序列的研究主要都集中在对NBS-LRR型R基因的分析上. 分子标记是现代遗传学研究的有力工具. 自1980年首次提出分子标记的概念以来[18], 分子标记已广泛应用于遗传图谱构建、基因定位、基因克隆、基因组比较、遗传多样性分析、标记辅助育种等领域的研究[19~21]. 利用R基因类似物(RGA)作探针, 可以
检测相应座位上的限制性片段长度多态性(RFLP), 从而开发成为RFLP标记, 常称为RGA标记. 由于RGA本身可能就是潜在的R基因, 而且R基因常常成簇分布于基因组中, 因此RGA标记对于R基因的克隆和标记辅助选择可能具有特别的应用价值. 但是, 由于RGA标记是基于RFLP分析技术的, 操作上比较麻烦, 因此目前应用得并不多. 第50卷 第11期 2005年6月 论 文
1086 www.scichina.com 本研究利用已公布的籼稻和粳稻的基因组序列, 采用生物信息学的方法, 通过收集目前所有已知的R基因序列, 对水稻基因组中RGA的数目、分布和类型进行了更为详尽的分析, 以期在全基因组水平上加深对水稻R基因的了解. 同时, 对RGA在水稻2个亚种间进行了遗传多态性(SNP和InDel)比较、引物设计和e-PCR验证, 为开发方便实用的基于PCR技术的新型RGA标记奠定基础. 1 材料与方法 (ⅰ) 基因组及蛋白质序列的来源. 从TIGR网站(http://www.tigr.org/)和北京基因组学研究所网站(http://rise.genomic.org.cn/)分别下载粳稻(Nipponbare)和籼稻(93-11)的基因组及蛋白质序列, 它们的更新时间皆为2004年4月. 所有数据的处理和分析皆在IBM P650的服务器上完成, 使用IBM AIX的Unix操作系统. (ⅱ) 水稻RGA的搜索. 搜集已报道的45个R基因, 然后用它们对粳稻蛋白质数据库进行BLASTP[22]搜索(参数E < +10−10, 最小长度为该基因的80%), 获得所有粳稻的RGA序列. 去除粳稻数据库中存在的克隆重复, 建立一个粳稻RGA蛋白数据库. 同时, 根据每个BLASTP搜索中匹配最好的结果, 得到这些粳稻RGA的核苷酸序列. 为了进一步验证得到的RGA, 我们进行候选RGA序列与TIGR发布的CDS序列进行比较, 去除不符的序列. (ⅲ) 水稻RGA的结构分类及其在染色体上的分布. 利用Hmmer程序[23]中的hmmsearch部分, 采用
前面建立的功能域列表, 在新建立的数据库中搜索基因序列所包含的功能域. 利用pepcoil程序[24]分析
序列中CC结构的可能性, 数值大于90%的认为具备该结构. 运用TM-HMMer[25]分析TM跨膜功能域. 依据功能域分布的情况, 对RGA进行分类, 分别统计各类RGA在不同染色体上的分布情况. (ⅳ) 2个亚种间RGA多态性的鉴定和开发. 将所有粳稻的RGA序列分别与籼稻基因组数据库进行TBLASTN[22]联配, 以确定籼稻中对应的等位基因.
为消除非等位联配, 在TBLASTN搜索中采用了严格的判别标准, 将E值设为1×10−20. 对初筛到的籼、粳
稻RGA等位基因, 进一步用sim4程序[26]进行联配分析, 去除匹配率≤85%且2条序列同时间断200 bp以
上的结果. 接着运用diffseq程序[27]分析SNP和InDel
在RGA的基因组序列中的分布情况, 将存在InDel的作为候选的RGA标记. 以粳稻的基因组序列为模板, 在InDel位置的两侧各取100 bp的序列, 连接成一条200 bp长的模板序列, 然后利用ePrimer3程序1)在
模板序列上设计引物. ePrimer3程序一般给出5对候选引物, 我们选取其中设计最合适的一对, 并要求正、反向引物分别位于InDel的左、右侧, 且扩增出的目标片段长度不大于1000 bp. 最后, 通过电子PCR(e- PCR)[28]进行验证. 对得到的水稻RGA标记进行命名,
规则为以OSR开头, 后跟4个数字, 例如: OSR0255. 上述步骤主要通过编写perl脚本程序来实现. 2 结果与分析
2.1 粳稻中RGA的数目、密度及其在染色体上的分布 通过对粳稻蛋白质数据库的搜索, 共获得2119个RGA(表1). 它们在各染色体上的数量变化在113 (3号染色体)~333个(1号染色体)之间, 平均为176个, 以1, 2, 11号染色体最多. 单条染色体上RGA的平均密度变化在0.66~2.42或2.68~9.44 个/Mb之间. 无论是遗传图密度还是物理图密度, 都是以11号染色体最多, 3号染色体最少. 根据TIGR发布的拼接好的水稻基因组序列, 分析RGA在染色体上的分布情况, 发现大部分RGA都以成簇形式存在(多数情况下每簇包含2~12个RGA), 如在1号染色体的AP003209克隆上发现有10个RGA. 表1 粳稻中RGA在各染色体上的数量和密度 染色体长度 RGA平均密度 染色体 /cM /MbRGA数目
/cM−1 /Mb−1
1 181.8 44.3333 1.83 7.51 2 157.9 39.9217 1.37 5.44 3 166.4 41.1110 0.66 2.68 4 129.6 38.2195 1.50 5.10 5 122.3 33.2134 1.09 4.04 6 126.3 31.7190 1.50 5.99 7 118.6 35.0125 1.05 3.57 8 121.2 27.6158 1.30 5.72 9 93.5 21.6133 1.42 6.16 10 83.8 25.7113 1.35 4.40 11 117.9 30.2285 2.42 9.44 12 109.5 30.6126 1.15 4.12 全基因组1528.8399.12119 1.39 5.31
2.2 水稻RGA的结构分类 通常将R基因分为5大类, 其中NBS-LRR是最
1) http://www.hgmp.mrc.ac.uk/