兰州大学生物信息学课件:6-基因组组装- 王明成
- 格式:pptx
- 大小:20.09 MB
- 文档页数:19
生物信息学中的基因组组装方法基因组组装是生物信息学中的核心技术之一,它是将DNA序列片段重新组合成完整基因组的过程。
通过基因组组装,我们能够获得基因组的完整信息,进而深入研究基因功能、系统进化以及遗传变异等重要问题。
在生物信息学领域,目前存在多种基因组组装方法,如下所述。
1. 叠加法(Overlap-based Assembly)叠加法是最早也是最简单的基因组组装方法之一。
该方法基于序列片段的相互重叠关系,通过比对序列片段的重叠区域将它们拼接成长序列。
然而,这种方法无法解决高覆盖度的测序数据,且对于含有重复序列的基因组也存在困难。
2. De Bruijn图法(De Bruijn graph)De Bruijn图法是目前应用最广泛的基因组组装方法之一。
该方法将DNA序列片段切割成较短的k-mers(常见的长度为20~25bp),然后通过构建De Bruijn图来表示k-mers之间的连接关系。
最后,通过分析和连接De Bruijn图的路径来重构基因组。
这种方法可以解决高覆盖度的测序数据,并且具有较好的计算效率。
3. 重叠布朗运动方法(Overlapping Brownian motion)重叠布朗运动方法是一种基于概率模型的基因组组装方法。
它通过根据DNA片段之间的相对位置概率来预测和重构连续序列。
这种方法可以解决高覆盖度的测序数据和复杂基因组的组装问题,并且对于含有重复序列的基因组也能得到较好的结果。
4. 来回跳跃法(Jumping Library)来回跳跃法是一种结合多种测序策略的基因组组装方法。
它通过使用不同长度的DNA文库进行多轮测序,从而解决了含有重复序列的基因组组装问题。
该方法的优点在于提高了测序的准确性和连续性,但是需要较高的测序覆盖度。
5. 混合组装方法(Hybrid Assembly)混合组装方法结合了不同测序技术和组装策略的优点,从而提高了基因组组装的质量和准确性。
例如,可以将叠加法和De Bruijn图法相结合,先将DNA序列片段通过叠加法拼接成较长序列,然后通过De Bruijn图方法进行细化和修正。