跳转到内容

组装与图算法

组装问题关注如何从大量短片段或长读段重建原始基因组或转录本序列。

基因组组装知识逻辑地图
基因组组装的整体逻辑:从测序 reads 出发,基于最短超串和 SBH 的理论基础,演化出 OLC 和 de Bruijn 图两大核心范式,并结合图遍历与清理技术,最终通过多维度指标进行评估。

这是从”局部观测恢复整体结构”的经典计算问题。

所属板块 核心方法

索引、比对、组装与概率模型构成的核心算法主轴。

阅读目标 帮助建立阅读上下文

先判断这页与你当前问题的关系,再决定是否深入展开。

建议前置 先建立相关基础对象与方法直觉

建议先建立相关基础对象与方法直觉,再进入本页。

这一节位于”核心方法”大板块内部,连接 reads、coverage、错误模型与图算法,重点回答:为什么局部读段信息会在图里形成路径问题,以及这些路径为什么难解。

  1. OLC:Overlap-Layout-Consensus
  2. de Bruijn graph 组装
  3. 图遍历算法
  4. 重复序列、分叉与图清理
  5. 组装评估