脱氧核糖核酸(DNA)序列可组成遗传指令,引导生物发育与生命机能运作。因此获取完整和准确的DNA序列是理解生命活动内在组织和过程的基础。现有的基因组测序技术不能直接获得完整的基因组序列,而是得到一些序列片段,即读数(reads)。序列组装方法就是利用零散的读数恢复出完整的基因组序列,进而对下游的基因检测、基因表达、结构变异检测、基因调控网络等研究提供帮助,是当前研究热点之一。本书讲述序列组装过程中的几个关键方法,包括contig构建方法、scaffolding方法、gap填充方法及其评价方法。
展开