当前位置：文档之家› 科学家完成迄今最大基因组测序

科学家完成迄今最大基因组测序

生长在美国佐治亚州奥古斯塔国家高尔夫俱乐部第17号洞附近的火炬松(Pinus taeda)曾挡住了美国前总统德怀特·戴维·艾森豪威尔的很多杆球。1956年，他曾试图砍掉这棵树。如今，火炬松正在书写一段与众不同的历史：火炬松的基因组有221.8亿个碱基对，约为人类基因组的7倍多，是目前已完成测序的最大基因组。

火炬松原产于美国东南部，是美国南方松中重要的速生针叶用材树种。在基因测序工作伊始，火炬松就被确定为研究对象。然而，火炬松基因组的庞大规模给传统的全基因组“鸟枪法”测序(只能对短的基因组片段进行测序)出了一道难题。

新研究中，研究人员改进了原有的“鸟枪法”——利用基因克隆方法对单独的DNA片段进行预处理，因而能够更容易地拼装出一个完整的基因组。该团队发现，82%的火炬松基因组由重复的基因片段组成——而人类基因组中重复的基因片段只占25%。研究人员将该结果发表于近日的《基因组生物学》和《遗传学》杂志上。研究人员还确定了能解释火炬松重要特性(例如抗病性、木材形成、应激反应)的基因。

诺禾致源高分文章集锦-植物基因组

陆地棉基因组测序揭示四倍体棉进化与纤维发育机制Sequencing of allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement 研究对象：陆地棉遗传标准系TM-1 期刊：Nature Biotechnology 影响因子：41.514 合作单位：南京农业大学发表时间：2015年4月摘要 Upland cotton is a model for polyploid crop domestication and transgenic improvement. Here we sequenced the allotetraploid Gossypium hirsutum L. acc. TM-1 genome by integrating whole-genome shotgun reads, bacterial artificial chromosome (BAC)-end sequences and genotype-by-sequencing genetic maps. We assembled and annotated 32,032 A-subgenome genes and 34,402 D-subgenome genes. Structural rearrangements, gene loss, disrupted genes and sequence divergence were more common in the A subgenome than in the D subgenome, suggesting asymmetric evolution. However, no genome-wide expression dominance was found between the subgenomes. Genomic signatures of selection and domestication are associated with positively selected genes (PSGs) for fiber improvement in the A subgenome and for stress tolerance in the D subgenome. This draft genome sequence provides a resource for engineering superior cotton lines.关键词陆地棉；de novo；四倍体研究背景陆地棉（Gossypium hirsutum L.）隶属锦葵目（Malvales），锦葵科（Malvaceae），棉属（Gossypium），因最早在美洲大陆种植而得名，是世界上最重要的棉花栽培品种，占全球棉花种植面积的90%以上。尽管陆地棉在棉花产业中占据核心地位，但由于其为异源四倍体，相关的全基因组测序工作一直难以开展。来自南京农业大学、北京诺禾致源、美国德克斯大学的国际团队，利用最新测序技术，成功构建了高质量的陆地棉全基因组图谱，为进一步改良棉花的农艺性状提供了基础，同时也为多倍体植物的形成和演化机制提供了新的启示。

植物数量性状全基因组选择研究进展

４期吴永升等：植物数量性状全基因组选择研究进展１５１１全基因组选择的概念和原理全基因组选择（Ｇｅｎｏｍｅ－ｗｉｄｅｓｅｌｅｃｔｉｏｎ，ＧＷＳ），又称基因组选择（Ｇｅｎｏｍｉｃｓｅｌｅｃｔｉｏｎ，ＧＳ），由Ｍｅｕ—ｗｉｓｓｅｎ于２００１年首先提出∞Ｊ。主要是通过全基因组中大量的分子标记和参照群体（ｔｒａｉｎｉｎｇｐｏｐｕｌａ—ｔｉｏｎ）的表型数据建立ＢＬＵＰ模型估计出每一标记的育种值，然后仅利用同样的分子标记估计出后代个体育种值并进行选择［７】。全基因组选择理论主要利用连锁不平衡信息，即假设标记与其相邻的ＱＴＬ处于连锁不平衡状态，因而由相同标记估计的不同群体的染色体片段效应是相同的，这就要求标记密度足够高以使所有的ＱＴＬ与标记处于连锁不平衡（ＬＤ）状态哺Ｊ。而目前随着拟南芥、水稻、玉米等植物基因组序列图谱及ＳＮＰ图谱的完成或即将完成，提供了大量的ＳＮＰ标记用于基因组研究。而随着ＳＮＰ芯片等大规模高通量ＳＮＰ检测技术的发展和成本的降低，使得全基因组选择应用成为可能。２全基因组选择的基本方法及案例说明２．１全基因组选择的基本方法全基因组选择在实施过程中应该包括以下几个基本步骤：在需要实行选择的参照群体中获取参照群体的基因型数据和表现型数据；然后，通过ＢＬＵＰ程序估计出每个标记位点的标记效应值，从而获得育种值；最后，在接下来每一轮的选择中，不再需要表型数据，根据每一轮次群体基因型信息估计育种值，直接选择群体的优良单株【９ｊ。全基因组选择的核心过程就是用从参照群体中每一个体的表现型数据和基因型数据建立的数学模型来估算接下来的育种群体中仅有基因型数据的个体的ＧＥＢＶ值。由既有表现型数据又有基因型数据的每一个体组成的群体被成为参照群体。参照群体用来估计数学模型的参数，这个参数接着用来计算仅有基因型数据的育种个体ＧＥＢＶ值，然后根据计算的ＧＥＢＶ值对育种群体进行选择并提升到下一轮次的选择中。因此，通过模型来预测个体的育种值，可以不进行表型鉴定就直接对育种群体的个体进行选择（Ｍｅｕｖｉｓｓｅｎ，２００１）。为了使估算的ＧＥＢＶ值尽可能地准确，参照群体必须具有代表性，尽可能地代表接下来在育种过程中用全基因组选择方法来进行选择的分离群体。２．２全基因组选择方法案例如图ｌ所示，在这个例子中，笔者的目标是把外来种质中的优良性状基因（包括产量、矮杆、抗逆等）导入本地优良的自交系，从而实现种质的改良图１在玉米中利用全基因组选择方法导入外源种质Ｆｉｇ．１Ｇｅｎｏｍｅｗｉｄｅｓｅｌｅｃｔｉｏｎｔｏｉｎｔｒｏｇｒ％ｅｘｏｔｉｃｔｒａｉｔｓｉｎｔｏａｄａｐｔｅｄｍａｉｚｅ

全基因组关联分析的原理和方法

全基因组关联分析(Genome-wide association study;GWAS)是应用基因组中数以百万计的单核苷酸多态性(single nucleotide ploymorphism ，SNP)为分子遗传标记，进行全基因组水平上的对照分析或相关性分析，通过比较发现影响复杂性状的基因变异的一种新策略。随着基因组学研究以及基因芯片技术的发展，人们已通过GWAS方法发现并鉴定了大量与复杂性状相关联的遗传变异。近年来，这种方法在农业动物重要经济性状主效基因的筛查和鉴定中得到了应用。全基因组关联方法首先在人类医学领域的研究中得到了极大的重视和应用，尤其是其在复杂疾病研究领域中的应用，使许多重要的复杂疾病的研究取得了突破性进展，因而，全基因组关联分析研究方法的设计原理得到重视。人类的疾病分为单基因疾病和复杂性疾病。单基因疾病是指由于单个基因的突变导致的疾病，通过家系连锁分析的定位克隆方法，人们已发现了囊性纤维化、亨廷顿病等大量单基因疾病的致病基因，这些单基因的突变改变了相应的编码蛋白氨基酸序列或者产量，从而产生了符合孟德尔遗传方式的疾病表型。复杂性疾病是指由于遗传和环境因素的共同作用引起的疾病。目前已经鉴定出的与人类复杂性疾病相关联的SNP位点有439 个。全基因组关联分析技术的重大革新及其应用，极大地推动了基因组医学的发展。(2005年, Science 杂志首次报道了年龄相关性视网膜黄斑变性GWAS结果,在医学界和遗传学界引起了极大的轰动, 此后一系列GWAS陆续展开。2006 年, 波士顿大学医学院联合哈佛大学等多个研究机构报道了基于佛明翰心脏研究样本关于肥胖的GWAS结果(Herbert 等. 2006);2007 年, Saxena 等多个研究组联合报道了与2 型糖尿病( T2D ) 关联的多个位点, Samani 等则发表了冠心病GWAS结果( Samani 等. 2007); 2008 年, Barrett 等通过GWAS发现了30 个与克罗恩病( Crohns ' disrease) 相关的易感位点; 2009 年, W e is s 等通过GWAS发现了与具有高度遗传性的神经发育疾病——自闭症关联的染色体区域。我国学者则通过对12 000 多名汉族系统性红斑狼疮患者以及健康对照者的GWAS发现了5 个红斑狼疮易感基因, 并确定了4 个新的易感位点( Han 等. 2009) 。截至2009 年10 月, 已经陆续报道了关于人类身高、体重、血压等主要性状, 以及视网膜黄斑、乳腺癌、前列腺癌、白血病、冠心病、肥胖症、糖尿病、精神分裂症、风湿性关节炎等几十种威胁人类健康的常见疾病的GWAS结果, 累计发表了近万篇论文, 确定了一系列疾病发病的致病基因、相关基因、易感区域和SNP变异。) 标记基因的选择： 1)Hap Map是展示人类常见遗传变异的一个图谱, 第1 阶段完成后提供了 4 个人类种族[ Yoruban ,Northern and Western European , and Asian ( Chinese and Japanese) ] 共269 个个体基因组, 超过100 万个SNP( 约1

基因组重测序

基因组重测序背景介绍全基因组重测序，是对基因组序列已知的个体进行基因组测序，并在个体或群体水平上进行差异性分析的方法。与已知序列比对，寻找单核苷酸多态性位点（SNP ）、插入缺失位点（InDel ，Insertion/Deletion ）、结构变异位点（SV ，Structure Variation ）位点及拷贝数变化(CNV) 。可以寻找到大量基因差异，实现遗传进化分析及重要性状候选基因的预测。涉及临床医药研究、群体遗传学研究、关联分析、进化分析等众多应用领域。随着测序成本的大幅度降低以及测序效率的数量级提升，全基因组重测序已经成为研究人类疾病及动植物分子育种最为快速有效的方法之一。利用illumina Hiseq 2000 平台，将不同插入片段文库和双末端测序相结合，可以高效地挖掘基因序列差异和结构变异等信息，为客户进行疾病研究、分子育种等提供准确依据。重测序的两个条件：（1）该物种基因组序列已知；（2）所测序群体之间遗传性差异不大（ >99% 相似度）在已经完成的全基因组测序及其基因功能注释的基础上，采用全基因组鸟枪法（WGS ）对DNA 插入片段进行双末端测序。技术路线生物信息学分析

送样要求 1.样品总量：每次样品制备需要大于5ug 的样品。为保证实验质量及延续性，请一次性提供至少20ug的样品。如需多次制备样品，按照制备次数计算样品总量。 2.样品纯度：OD值260/280应在1.8～2.0 之间；无蛋白质、RNA或肉眼可见杂质污染。 3.样品浓度：不低于50 ng/μL。 4.样品质量：基因组完整、无降解，电泳结果基因组DNA主带应在λ‐Hind III digest 最大条带23 Kb以上且主带清晰，无弥散。 5.样品保存：限选择干粉、酒精、TE buffer或超纯水一种，请在样品信息单中注明。 6.样品运输：样品请置于1.5 ml管中，做好标记，使用封口膜封好；基因组DNA如果用乙醇沉淀，可以常温运输；否则建议使用干冰或冰袋运输，并选择较快的运输方式。提供结果根据客户需求，提供不同深度的信息分析结果。

植物功能基因组学及其研究技术_崔兴国

第9卷　第1期2007年3月衡水学院学报 J o u r n a l o f H e n g s h u i U n i v e r s i t y V o l.9,N o.1 Ma r.2007植物功能基因组学及其研究技术崔兴国 (衡水学院　生命科学系,河北　衡水053000) 摘　要:植物基因组的研究已经由以全基因组测序为目标的结构基因组学转向以基因功能鉴定为目标的功能基因组学研究.植物功能基因组学研究是利用结构基因组学积累的数据,从中得到有价值的信息,阐述D N A序列的功能,从而对所有基因如何行使其职能并控制各种生命现象的问题作出回答.近年来植物功能基因组学的研究技术主要包括表达序列标签、基因表达的系列分析、D N A微阵列和反向遗传学等.对植物功能基因组学的研究将有利于我们对基因功能的理解和对植物形状的定性改造和利用. 关键词:植物;功能基因组学;研究技术中图分类号:Q3-3 文献标识码:A 文章编号:1673-2065(2007)01-0023-04 基因是细胞的遗传物质,决定细胞的生物学形状,细胞的生物学功能最终是由大量的基因表达完成的.随着人类基因组“工作框架图”的完成,生命科学研究的重点已经从结构基因组学转移到了功能基因组学的研究,特别是模式植物拟南芥(A r a b i d o p-s i s t h a l i a n a)和水稻(O r y z a s a t i v a)基因组测序的完成,公共数据库中已经积累了大量基因序列信息,获得了许多与植物发育相关的功能基因,在此基础上应用实验分析方法并结合统计和计算机分析来研究基因的表达、调控与功能,并相应诞生和发展了一批新的研究技术,为功能基因组学的研究提供了必要而有效的技术支撑.功能基因组学研究的最终目标是解析所有基因的功能,即从基因水平上大规模批量鉴定基因的功能,进而全面研究控制植物生长发育及响应环境变化的遗传机制,在基因组序列与细胞学行为之间起到桥梁作用,共同承担起从整体水平上解析生命现象的重任. 1　植物功能基因组学研究植物的生长和发育是一个有机体或有机体的一部分形态建成和功能按一定次序而进行的一系列生化代谢反应的总合,反应在分子水平上,它要求相应的遗传代谢途径必须按照特定的时空次序严格进行以保证正常发育.植物功能基因组研究就是要利用植物全基因组序列的信息,通过发展和应用系统基因组水平的实验方法来研究和鉴别基因组序列的作用;研究基因组的结构、组织与植物功能在细胞、有机体和进化上的关系以及基因与基因间的调控关系;从表达时间、表达部位和表达水平3个方面对目的基因在植物中的精细调控进行系统研究.当前植物功能基因组学研究主要集中于一年生的拟南芥与水稻两个物种上,这主要是由于它们的遗传背景清楚,基因组较小,基因结构简单而且易于进行分子生物学操作.拟南芥研究组“2010计划”的宏伟目标是充分利用拟南芥基因组计划获得的序列信息并结合功能基因组研究技术来获知其25000个基因的全部功能,例如开花的诱导过程是植物生活周期中最奇妙的过程,目前从拟南芥中鉴定了提早开花和延迟开花的多种突变体,显示植物开花受多个遗传基因的控制,如延迟开花的两个突变体是由等位基因 C O(C O N S T A N S)和L D(C O L D L U M I N I D E P E N- D E N S)突变引起,这两个基因均已被克隆,并使其在转基因植物的叶片中进行表达,将C O基因转移到拟南芥中,高效表达C O蛋白的转基因植株即使处于短日照条件下也会开花,这说明C O基因具有激活开花基因的作用.对模式植物功能基因组的研究将有助于整个植物基因组学的研究. 目前的功能基因组研究主要包括以下几个方面:(1)c D N A全长克隆与测序;(2)获得D N A芯片 ①收稿日期:2006-10-12 作者简介:崔兴国(1963-),女,河北冀州市人,衡水学院生命科学系副教授.

已完成基因组测序的生物(植物部分)分析解析

水稻、玉米、大豆、甘蓝、白菜、高粱、黄瓜、西瓜、马铃薯、番茄、拟南芥、杨树、麻风树、苹果、桃、葡萄、花生拟南芥籼稻粳稻葡萄番木瓜高粱黄瓜玉米栽培大豆苹果蓖麻野草莓马铃薯白菜野生番茄番茄梨甜瓜香蕉亚麻大麦普通小麦西瓜甜橙陆地棉梅毛竹桃芝麻杨树麻风树卷柏狗尾草属花生甘蓝物种基因组大小和开放阅读框文献 Sesamum indicum L. Sesame 芝麻（2n = 26）293.7 Mb, 10,656 orfs 1 Oryza brachyantha短药野生稻261 Mb, 32,038 orfs 2 Chondrus crispus Red seaweed爱尔兰海藻105 Mb, 9,606 orfs 3 Pyropia yezoensis susabi-nori海苔43 Mb, 10,327 orfs 4 Prunus persica Peach 桃226.6 of 265 Mb 27,852 orfs 5 Aegilops tauschii 山羊草（DD）4.23 Gb (97% of the 4.36), 43,150 orfs 6 Triticum urartu 乌拉尔图小麦（AA）4.66 Gb (94.3 % of 4.94 Gb, 34,879 orfs 7 moso bamboo (Phyllostachys heterocycla) 毛竹2.05 Gb (95%) 31,987 orfs 8 Cicer arietinum Chickpea鹰嘴豆~738-Mb，28,269 orfs 9 520 Mb (70% of 740 Mb), 27,571 orfs 10 Prunus mume 梅280 Mb, 31,390 orfs 11 Gossypium hirsutum L.陆地棉2.425 Gb 12 Gossypium hirsutum L. 雷蒙德氏棉761.8?Mb 13 Citrus sinensis甜橙87.3% of ~367 Mb, 29,445 orfs 14 甜橙367 Mb 15 Citrullus lanatus watermelon 西瓜353.5 of ~425 Mb (83.2%) 23,440 orfs 16 Betula nana dwarf birch，矮桦450 Mb 17

全基因组重测序数据分析

全基因组重测序数据分析 1. 简介(Introduction) 通过高通量测序识别发现de novo的somatic和germ line 突变，结构变异-SNV，包括重排突变（deletioin, duplication 以及copy number variation）以及SNP的座位；针对重排突变和SNP的功能性进行综合分析；我们将分析基因功能（包括miRNA），重组率（Recombination）情况，杂合性缺失（LOH）以及进化选择与mutation之间的关系；以及这些关系将怎样使得在disease（cancer）genome中的mutation产生对应的易感机制和功能。我们将在基因组学以及比较基因组学，群体遗传学综合层面上深入探索疾病基因组和癌症基因组。实验设计与样本（1）Case-Control 对照组设计；（2）家庭成员组设计：父母-子女组（4人、3人组或多人）；初级数据分析 1．数据量产出：总碱基数量、Total Mapping Reads、Uniquely Mapping Reads统计，测序深度分析。 2．一致性序列组装：与参考基因组序列（Reference genome sequence）的比对分析，利用贝叶斯统计模型检测出每个碱基位点的最大可能性基因型，并组装出该个体基因组的一致序列。3．SNP检测及在基因组中的分布：提取全基因组中所有多态性位点，结合质量值、测序深度、重复性等因素作进一步的过滤筛选，最终得到可信度高的SNP数据集。并根据参考基因组信息对检测到的变异进行注释。 4．InDel检测及在基因组的分布: 在进行mapping的过程中，进行容gap的比对并检测可信的short InDel。在检测过程中，gap的长度为1~5个碱基。对于每个InDel的检测，至少需要3个Paired-End序列的支持。 5．Structure Variation检测及在基因组中的分布: 能够检测到的结构变异类型主要有：插入、缺失、复制、倒位、易位等。根据测序个体序列与参考基因组序列比对分析结果，检测全基因组水平的结构变异并对检测到的变异进行注释。

植物基因组测序

千年基因将应邀参加第十六届全国植物基因组学大会第十六届全国植物基因组学大会将于2015年8月19日-22日在陕西杨凌召开，千年基因应邀参加此次会议，并将在会场学术交流区设立展台。届时千年基因的技术团队会向大家展示我们最全面的测序平台、一站式的基因组学解决方案以及近年来在植物基因组学领域取得的科研成果，欢迎广大科研人员莅临指导交流！在测序平台方面，千年基因目前拥有国内最全面的测序平台，能够为科研人员提供一站式解决方案。以PacBio RS II三代平台为例，千年基因自去年提供PacBio RS II测序以来，通过项目经验的积累及严格的质量控制，目前各项数据指标已达国内最高水平。数据产出已稳步升级至1.4Gb/ SMRT cell，读长最长可达42 Kb，reads N50高达18Kb，远超PacBio官方提供的数据标准！在植物基因组de novo测序的研究中，千年基因提供的超长读长测序可更好地跨越基因组高重复序列、转座子区域以及大的拷贝数变异区域和结构变异区，从而实现对高杂合及高重复基因组的完美组装。在植物转录组测序的研究中，千年基因提供的超长读长测序无需拼接即可获得全长转录组序列信息，同时可获得全面的可变剪切、融合基因以及Isoform信息。另外，千年基因提供的HiSeq 4000及HiSeq 2000/2500测序可解决研究人员在植物基因组重测序、转录组测序、小RNA测序等方面的科研需求。在项目经验方面，千年基因与来自全球的科研人员合作开展了大量植物基因组项目，相关成果已发表于Nature、Nature Genetics、Science等杂志。例如，油棕榈基因组项目在Nature 杂志同时发表两篇文章，辣椒基因组项目的成果发表于Nature Genetics，玉米基因组项目的成果发表于Science。在国外合作方面，千年基因与美国爱荷华州立大学Patrick Schnable教授领导的国际玉米基因组团队合作开展的上万份玉米样本重测序项目也正在进行中；千年基因与国际半干旱热带作物研究所建立长期战略合作关系，正在开展上千份木豆、鹰嘴豆及高粱样本的群体遗传学研究；同时千年基因与华盛顿大学的Evan Eugene Eichler院士及佐治亚大学的Jeffrey Lynn Bennetzen院士也有大量基因组项目合作。在国内合作方面，千年基因与广东省农科院、山东省农科院共同启动的花生基因组项目已全部完成de novo测序及数据挖掘，同时与中国科学院、北京大学、中国农业大学、中国科学技术大学、上海交通大学、

美科学家完成大豆基因组测序

Animal Reproduction,Prague(C),Blackwell Publishing Inc, November23-25 Ptak G.,Tischer M.,Bernabo N.,and Loi P.,2003,Donor-depen-dent developmental competence of oocytes from lambs sub-jected to repeated hormonal stimulation,Biology of Repro-duction,69:278-285 Revel F.,Mermillod P.,Peynot N.,Renard J.P.,and Heyman Y., 1995,Low developmental capacity of in vitro matured and fertilize oocytes from calves compared with that of cows, Journal of Reproduction and Fertility,103:115-120Salkamone D.F.,Damiani P.,Fissore R.A.,Robl J.M.,and Duby R.T.,2001,Biochemical and developmental evidence that ooplasmic maturation of prepubertal bovine oocytes is com-promised,Biology of Reproduction,64:1761-1768 Taneja M.,Bols P.E.J.,van de Velde A.,Ju J.C.,Schreiber D., Tripp M.W.,Levine H.,Echelard Y.,Riesen J.,and Yang X. Z.,2000,Developmental competence of juvenile calf oocytes in vitro and in vivo:Influence of donor animal varia-tion and repeated gonadotropin stimulation1,Biology of Re-production,62:206-213 幼畜繁殖(JIVET)技术在性成熟前奶牛上的应用 Application of Juvenile in intro Embryo Transfer(JIVET)Technology on Prepubertal Dairy Cattle !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 美科学家完成大豆基因组测序 US Scientists Sequenced the Genome of Soybean 期待已久的大豆基因组序列终于测通。在2010年1月14日的《Nature》杂志上，公布了由美国农业部、美国能源部联合基因组研究所和普渡大学等多家科研机构联合完成的豆科植物最重要的物种大豆的完整基因组序列草图。科学家门利用全基因组鸟枪测序法对大豆基因组的1.1GB的序列进行了测序，结合物理图谱和高密度遗传图谱，获得了大豆基因组的序列拼接草图。研究结果表明大豆中有46320个编码蛋白的臆测基因，约78%的臆测基因位于染色体末端，这些基因在数量上不到染色体基因组的一半，但几乎全部发生了遗传重组。大豆基因组的编码蛋白比双子叶模式植物拟南芥多70%，与同为“古老的多倍体”的杨树的基因组大小相似。研究人员推测大豆基因组的复制至少发生了两次，一次大约是在5900万年前，另一次则可能发生在1300万年前，由此引起了整个基因组的高度重复，约75%的基因以多拷贝形式出现。两次复制发生后紧接着出现了基因多样化和基因丢失，大量的染色体发生重排。毫无疑问，精确的大豆基因组序列图谱将为更多的大豆性状遗传基础的鉴定提供便利，并加快大豆品种改良的步伐。大豆是人类最重要的食用油来源作物，研究人员通过对大豆基因组基因序列的分析，发现了约1110个基因与脂代谢有关，这些基因及其相关通路对大豆油含量有重要的影响，通过对某些基因的修饰和调控，或许可增加大豆的油脂产量。作者：Courtney H.Wilcox,本刊通讯员本文引用格式：Courtney Wilcox,2010,美科学家完成大豆基因组测序,农业生物技术学报,18(1):191 信息来源：https://www.doczj.com/doc/b21370953.html,/nature/journal/v463/n7278/full/nature08670.html 191

全基因组从头测序(de novo测序)

全基因组从头测序(de novo测序) https://www.doczj.com/doc/b21370953.html,/view/351686f19e3143323968936a.html 从头测序即de novo 测序，不需要任何参考序列资料即可对某个物种进行测序，用生物信息学分析方法进行拼接、组装，从而获得该物种的基因组序列图谱。利用全基因组从头测序技术，可以获得动物、植物、细菌、真菌的全基因组序列，从而推进该物种的研究。一个物种基因组序列图谱的完成，意味着这个物种学科和产业的新开端！这也将带动这个物种下游一系列研究的开展。全基因组序列图谱完成后，可以构建该物种的基因组数据库，为该物种的后基因组学研究搭建一个高效的平台；为后续的基因挖掘、功能验证提供DNA序列信息。华大科技利用新一代高通量测序技术，可以高效、低成本地完成所有物种的基因组序列图谱。包括研究内容、案例、技术流程、技术参数等，摘自深圳华大科技网站 https://www.doczj.com/doc/b21370953.html,/service-solutions/ngs/genomics/de-novo-sequencing/ 技术优势: 高通量测序：效率高，成本低；高深度测序：准确率高；全球领先的基因组组装软件：采用华大基因研究院自主研发的SOAPdenovo软件；经验丰富：华大科技已经成功完成上百个物种的全基因组从头测序。研究内容: 基因组组装■K-mer分析以及基因组大小估计；■基因组杂合模拟（出现杂合时使用）； ■初步组装；■GC-Depth分布分析；■测序深度分析。基因组注释■Repeat注释； ■基因预测；■基因功能注释；■ ncRNA 注释。动植物进化分析■基因家族鉴定（动物TreeFam；植物OrthoMCL）；■物种系统发育树构建； ■物种分歧时间估算（需要标定时间信息）；■基因组共线性分析； ■全基因组复制分析（动物WGAC；植物WGD）。微生物高级分析 ■基因组圈图；■共线性分析；■基因家族分析； ■CRISPR预测；■基因岛预测（毒力岛）； ■前噬菌体预测；■分泌蛋白预测。熊猫基因组图谱Nature. 2010.463:311-317. 案例描述大熊猫有21对染色体，基因组大小2.4 Gb，重复序列含量36%，基因2万多个。熊猫基因组图谱是世界上第一个完全采用新一代测序技术完成的基因组图谱，样品取自北京奥运会吉祥物大熊猫“晶晶”。部分研究成果测序分析结果表明，大熊猫不喜欢吃肉主要是因为T1R1基因失活，无法感觉到肉的鲜味。大熊猫基因组仍然具备很高的杂合率，从而推断具有较高的遗传多态性，不会濒于灭绝。研究人员全面掌握了大熊猫的基因资源，对其在分子水平上的保护具有重要意义。黄瓜基因组图谱黄三文, 李瑞强, 王俊等. Nature Genetics. 2009. 案例描述国际黄瓜基因组计划是由中国农业科学院蔬菜花卉研究所于2007年初发起并组织，并由深圳华大基因研究院承担基因组测序和组装等技术工作。部分研究成果黄瓜基因组是世界上第一个蔬菜作物的基因组图谱。该项目首次将传

植物功能基因组学概述

植物功能基因组学概述 XXX* (XXXXX) 摘要：植物功能基因组学是从整体水平研究基因的功能及表达规律的科学。对植物功能基因组学的研究将助于我们对基因功能的理解和对植物性状的定性改造和利用。本文简要介绍了植物功能基因组学的概念、研究内容和研究方法。关键词：植物；功能基因组学；ESTs；SAGE Summarize of Plant Functional Genomics XXX （XXXXX） Abstract：Plant functional genomics studies provide a novel approach to the identification of genome-wide gene expression. It is currently being widely focused on the gene expression by transcript profiling and takes us rapidly forward in our understanding of plant biological traits. In this review, comprehensive of concepts, research contents and methodologies regarding plant functional genomics and transcript profiling are described. Key words: Plant; functional genomics; ESTs; SAGE 1 植物功能基因组学基因组学(Genomics)是20世纪最后10年研究最活跃的领域之一。基因组学是指对所有基因的结构和功能进行分析的一门学科, 1986年由美国科学家Thomas Roderick提出, 兴起于20世纪90年代[1]。基因组学研究分为结构基因组学( structural genomics) 和功能基因组学( functional genomics)。结构基因组学代表基因组分析的早期阶段, 以建立生物体高分辨率遗传、物理和转录图谱为主, 以研究基因序列为目标。功能基因组学(Functional genomics)的研究又被称为后基因组学(Post genomics)研究，它是利用结构基因组学提供的信息和产物，通过在基因组或系统水平上全面分析基因的功能，使得生物学研究从对单一基因或蛋白质的研究转向对多个基因或蛋白质同时进行系统研究。植物功能基因组学是植物后基因时代研究的核心内容,它强调发展和应用整体的(基因组水平或系统水平)实验方法分析基因组序列信息、阐明基因功能,其特点是采用高通量的实验方法结合大规模的数据统计计算方法进行研究。基本策略是从研究单一基因或蛋白质上升到从系统角度研究所有基因或蛋白质。在植物功能基因组学的研究中，拟南芥和水稻是两种最常用的模式植物。目前, 功能基因组学在水稻、拟南芥等模式植物中取得了较快进展, 主要原因在于这两种植物已完成全基因组测序工作[2], 获得了结构基因组数据, 且遗传背景清楚, 易于开展分子生物学研究, 已率先步入后基因组时代。 2 植物功能基因组学研究内容 2、1基因组多样性研究[1] *联系人Tel：XXXXX；E-mail：XXXXX

科学家完成马铃薯基因组测序

中国科技通讯中华人民共和国科学技术部第625期 2011年7月20日《国家“十二五”科学和技术发展规划》正式发布科技部会同发改委、财政部、教育部、中科院、工程院、国家自然科学基金会、中国科协、国防科工局等有关部门和单位编制完成的《国家“十二五”科学和技术发展规划》近日正式发布实施。《规划》提出“十二五”科技发展的总体目标是：自主创新能力大幅提升，科技竞争力和国际影响力显著增强，重点领域核心关键技术取得重大突破，为加快经济发展方式转变提供有力支撑，基本建成功能明确、结构合理、良性互动、运行高效的国家创新体系，国家综合创新能力世界排名由目前第21位上升至前18位，科技进步贡献率力争达到55%，创新型国家建设取得实质性进展。同时，从研发投入强度、原始创新能力、科技与经济结合、科技惠及民生、创新基地建设布局、科技人才队伍建设、体制机制创新等方面提出了具体目标和指标。《规划》对未来五年我国科技发展和自主创新的战略任务进行了部署，突出以下重点：一是加快实施国家科技重大专项，二是大力培育和发展战略性新兴产业，三是推进重点领域核心关键技术突破，四是前瞻部署基础研究和前沿技术研究，五是加强科技创新基地和平台建设，六是大力培养造就创新型科技人才，七是提升科技开放与合作水平。科技部发布《关于加快发展民生科技的意见》 7月18日，第四次全国社会发展科技工作会议在京召开，科技部发布了《关于加快发展民生科技的意见》。科技部表示，将根据《关于加快发展民生科技的意见》，组织实施国家民生科技行动，重点围绕人口健康、生态环境、公共安全、防灾减灾四个领域大力推进相关科技工作。全国政协副主席、科技部长万钢提出了具体要求：全面加强民生科技的领导；切实加大民生科技的投入；加快民生科技创新和能力建设；加强民生科技的国际合作；加强民生相关的科学知识宣传和技术成果的应用普及。会上，科技部副部长王伟中对“十一五”我国社会发展科技工作的成就进行了全面回顾，对“十二五”社会发展科技工作的重点任务进行了部署。王伟中说，在“十二五”期间，我国社会发展科技工作将把保障和改善民生放在突出位置，重点围绕六个方面开展工作：一是加强科技管理体制机制创新；二是加快组织实施国家科技重大专项；三是加快实施社会发展科技专项规划和计划；四是组织实施国家民生科技行动；五是加强可持续发展实验区建设；六是积极开展社会发展科技领域的国际合作。 “十二五”粮食丰产工程启动科技部、农业部、财政部和国家粮食局近日在北京分别与湖南等13个粮食主产省（区）签订协议，实施新一轮“国家粮食丰产科技工程”，“十二五”国家粮食丰产科技工程正式启动实施。科技部在“十一五”期间牵头组织实施了粮食丰产工程。五年来，在国家粮食丰产工程带动下，各相关省市自治区发挥以科技创新为核心，政府引导和市场为主体有机结合，使国家粮食丰产科技工程取得显著成效。工程实施过程中，突出了水稻、小麦和玉米“三大作物”增产，立足东北、华北、长江中下游“三大平原”，强化攻关田、核心区、示范区、辐射区“一田三区”建设。工程的实施为全国粮食大面积高产树立了典范，也为实现粮食增产、保障国家粮食安全提供了强有力的技术支撑。全国政协副主席、科技部长万钢指出，要促进粮食丰产技术集成和大面积均衡增产；要强化粮食科技服务，鼓励和支持科技人员深入农村基层一线，组织实施好“百千万科技特派员”专项行动，在粮食主产省建立新型科技服务体系；要积极创造条件，强化粮食丰产科技基地、平台、人才队伍建设，稳步推进粮食丰产科技工作；要增加粮食科技投入，逐步完善粮食科技稳定支持的长效机制。

已基因组测序物种

已完成植物基因组测序情况（更新至2014年11月）中文名拉丁名发表时间刊物科、属基因组大小拟南芥Arabidopsis thaliana 2000.12 Nature 十字花科、鼠耳芥属125M 水稻Oryza sativa. ssp. indica 2002.04 Science 禾本科、稻属466M 水稻Oryza sativa. ssp. japonica 2002.04 Science 禾本科、稻属466M 杨树Populus trichocarpa 2006.09 Science 杨柳科、杨属480M 葡萄Vitis vinifera 2007.09 Nature 葡萄科、葡萄属490M 衣藻Chlamydomonas reinhardtii 2007.01 Science 衣藻科、衣藻属130 M 小立碗藓Physcomitrella pattens 2008.01 Science 葫芦藓科、小立碗藓属480M 番木瓜Carica papaya 2008.04 Nature 番木瓜科、番木瓜属370M 百脉根Lotus japonicus 2008.05 DNA Res. 豆科472 Mb 三角褐指藻Phaeodactylum tricornutum 2008.11 Nature 褐指藻属27.4M 高粱Sorghum bicolor 2009.01 Nature 禾本科、高粱属730M 玉米Zea mays ssp. mays 2009.11 Science 禾本科、玉米属2300M 黄瓜Cucumis sativus 2009.11 Nature Genetics 葫芦科、黄瓜属350M 大豆Glycine max 2010.01 Nature 豆科、大豆属1100M 二穗短柄草Brachypodium distachyon 2010.02 Nature 禾本科、短柄草属260M 褐藻Ectocarpus 2010.06 Nature 水云属196M 团藻Volvox carteri 2010.07 Science 团藻属138M 蓖麻Ricinus communis 2010.08 Nature Biotechnology 大戟科、蓖麻属350M 小球藻Chlorella variabilis 2010.09 Plant Cell 小球藻科46M 苹果Malus × domestica 2010.09 Nature Genetics 蔷薇科、苹果属742M 森林草莓Fragaria vesca 2010.12 Nature Genetics 蔷薇科、草莓属240M 可可树Theobroma cacao 2010.12 Nature Genetics 梧桐科、可可属430-Mb 野生大豆Glycine soja 2010.12 PNAS 豆科、大豆属915.4 Mb 褐潮藻类Aureococcus anophagefferens 2011.02 PNAS 57M 麻风树Jatropha curcas 2010.12 DNA Res. 大戟科、麻风树属410M 卷柏Selaginella moellendorffii 2011.05 Science 卷柏属212M 枣椰树Phoenix dactylifera 2011.05 Nature biotechnology 棕榈科685M 琴叶拟南芥 Arabidopsis lyrata 2011.05 Nature Genetics 十字花科、鼠耳芥属206.7 Mb 马铃薯Solanum tuberosum 2011.07 Nature 茄目、茄科、茄属844M 条叶蓝芥Thellugiella parvula 2011.08 Nature Genetics 盐芥属140M

紫花苜蓿基因组测序及分析

紫花苜蓿基因组测序及分析近年来,随着基因组测序技术的不断发展越来越多的植物基因组序列得到完善。通过基因组测序,可以系统地解析植物基因功能。紫花苜蓿具有优良的农艺性状,是全世界种植范围最广的牧草作物,具有“牧草之王”的美称。在我国,紫花苜蓿生长主要集中在北方地区,这些地区气候寒冷,容易发生低温冻害,造成苜蓿减产,大大降低苜蓿的生产效益。肇东苜蓿作为紫花苜蓿的地方品种之一,具有良好的抗寒特性。因此,本研究以肇东苜蓿为主要研究材料,进行基因组测序、组装及注释,获得基因组草图;对其它四种紫花苜蓿品种:阿尔冈金、WL168、WL525和WL440进行基因组重测序, 挖掘抗寒相关的SNP。同时,对紫花苜蓿AP2/ERF转录因子进行挖掘分析,构建紫花苜蓿AP2/ERF 基因调控网络,系统的解析紫花苜蓿AP2/ERF转录因子在抗寒胁迫中的调控机制。主要研究成果如下:1.紫花苜蓿全基因组组装及注释分析通过高通量测序,评估紫花苜蓿基因组大小为1107M左右,杂合率为1.77%,通过组装获得紫花苜蓿基因组草图。进一步注释分析,挖掘119194个蛋白质编码基因,它们主要的功能集中在信号转导机制、蛋白质翻译后修饰、防御机制以及转录调控等生物过程。2.紫花苜蓿抗寒性状相关遗传变异的挖掘通过四个紫花苜蓿品种进行基因组重测序,发掘紫花苜蓿品种间的遗传变异(SNP),获得8909604个遗传变异;结合5个紫花苜蓿品种的抗寒性数据,挖掘82838个SNP与紫花苜蓿抗寒性状形成相关。这些SNP分布在14372个基因上,它们主要涉及转录调控、还原代谢和信号转导等过程。进一步富集分析发现,AP2/ERF、bHLH、MADS、NAC、MYB以及WRKY

农作物重要品种全基因组de novo测序

首页科技服务医学检测科学与技术市场与支持加入我们关于我们提供领先的基因组学解决方案Providing Advanced Genomic Solutions 参考文献 [ 1 ] Li Y, Zhou G, Jiang W, et al. De novo assembly of soybean wild relatives for pan-genome analysis of diversity and agronomic traits[J]. Nature biotechnology, 2014, 32(10): 1045-1052. [ 2 ] Da Silva C, Zamperin G, et al. The high polyphenol content of grapevine cultivar tannat berries is conferred primarily by genes that are not shared with the reference genome. Plant Cell, 2013, 25(12):4777-88. [ 3 ] Qi XP, Li M, et al. Identification of a novel salt tolerance gene in wild soybean by whole-genome sequencing. Nature Communica－ tions, 2014(5). 挖掘特异基因解析特有性状重要品种全基因组 de novo 所研究品种小片段文库大片段文库 HiSeq测序(>100X) 基因组组装注释全基因组序列比对转录组遗传图谱等辅助验证重要农艺性状解析基因家族聚类分析所研究品种基因组序列已发表品种基因组序列已发表品种基因集合所研究品种基因集合变异检测小的插入缺失 SNP 倒位易位大的插入缺失基因挖掘新基因鉴定拷贝数扩增基因基因丢失正选择基因鉴定物种品种发表杂志（年份）物种品种发表杂志（年份）大豆棉花番茄土豆水稻葡萄猪栽培大豆7种野生大豆野生耐盐大豆雷德氏棉亚洲棉陆地棉栽培番茄抗病番茄栽培土豆耐寒土豆 Nature (2010) Nature Biotechnology (2014) Nature Communications (2014) Nature (2012)Nature Genetics (2014)Nature Biotechnology (2015)Nature (2012) Nature Genetics (2014) Nature (2011) Plant Cell (2015) 栽培水稻（粳稻）栽培水稻（籼稻）短花药野生稻非洲栽培稻五种野生稻三种栽培稻葡萄丹娜葡萄杜洛克猪藏猪 Science (2002)Science (2002) 野生大豆泛基因组阅读原文>> 诺禾致源的项目经验诺禾致源在动植物全基因组测序领域一直处于领先地位，以第一通讯作者发表基因组文章5篇（影响因子累计152.474），其中2篇为杂志封面文章。近年来，诺禾通过自主研发软件与技术革新，成功地将项目周期压缩至14个月内，费用降低一半以上。特有基因检测对7株代表性野生大豆品种进行全基因组de novo 测序及比较基因组分析，发现每个大豆品种中有1,000~3,000个品种特有的基因。高变区变异检测在传统测序方法中，将研究物种短reads 比对参考基因组无法检测到变异位点；在全基因组de novo 方法中，将组装后的超长序列比对参考基因组可准确识别高变区域内的所有变异位点。性状解析方案设计通过对重要品种高深度(>100X)测序，并进行基因组组装注释：找到传统测序无法鉴定的高度变异位点，找到更多更准确的SNP位点；找到参考基因组中所不存在的基因——品种特有基因。 2. 耐盐大豆耐盐基因的发现 2014年，研究人员对一株耐盐大豆开展了全基因组de novo 测序，并与栽培大豆基因组进行全基因组比对，通过一条跨过长达388 Kb 的重要功能区的scaffold，发现了巨大的结构变异，从而成功鉴定出耐盐基因。该基因在栽培大豆中被插入了一个长达3.4 Kb 的反转座子，影响了阳离子转运体功能，从而使栽培大豆失去了耐盐能力。传统的测序手段，采用的是短reads 比对，因而对这类大的结构变异检测精度差、灵敏度低、甚至难以实现检测，而全基因组de novo 测序则能很好的克服该问题。阅读原文>> 案例分享 1. 丹娜葡萄全基因组测序揭示高丹宁含量性状的分子机制丹娜葡萄被认为是丹宁含量最高的葡萄品种之一，由于富含丹宁等抗氧化分子，被认为有延缓衰老的作用。通过对其基因组测序，研究人员发现与丹宁合成有关的关键酶，几乎都能找到新的基因。很显然，只依赖已有的参考基因组，完全无法了解丹娜葡萄高丹宁含量这一性状的遗传基础，而全基因组de novo 测序则完美回答了该问题。阅读原文>> 重要品种基因组的价值一些物种，虽然已有参考基因组，但仍然无法找到性状关联基因。一方面，参考基因组与研究物种差异太大；另一方面，性状相关基因处于基因组快速进化区域，变异极大，传统测序手段难以鉴定。目前，de novo测序在有参品种重要性状探究方面的应用愈发广泛，相关研究结果常见于国际顶级杂志上。