组装与图算法
组装问题关注如何从大量短片段或长读段重建原始基因组或转录本序列。
这是从”局部观测恢复整体结构”的经典计算问题。
这一部分在全站中的位置
Section titled “这一部分在全站中的位置”这一节位于”核心方法”大板块内部,连接 reads、coverage、错误模型与图算法,重点回答:为什么局部读段信息会在图里形成路径问题,以及这些路径为什么难解。
推荐阅读顺序
Section titled “推荐阅读顺序”OLC:Overlap-Layout-Consensus
从 read-read overlap 出发理解经典组装思路。
进入子主题de Bruijn graph 组装
通过 k-mer 建图,把序列恢复问题转成图上的路径问题。
进入子主题 图算法
图遍历算法
从DFS、BFS到Hamiltonian path,理解组装中的图搜索问题。
进入子主题重复序列、分叉与图清理
理解为什么真实图结构需要错误识别、分叉判断与清理。
进入子主题组装评估
从 N50 之外理解连续性、完整性与正确性的平衡。
进入子主题