Skip to content

MaSuRCA

马里兰超级读段组装器,整合短读段和长读段数据进行混合组装,利用超级读段压缩降低计算复杂度。 该方法支持多种测序平台数据的混合组装,适用于各类基因组的从头组装项目。

属性
用途混合测序数据的超级读段组装
时间复杂度O(n log n)
空间复杂度O(n)
年份2013
难度进阶 (Intermediate)
实现语言C++
分类序列组装

复杂度分析

  • 时间复杂度O(n log n)
  • 空间复杂度O(n)

性能洞见:该算法时间复杂度属于准线性(n log n 量级),兼顾实用性与理论最优性,适合 GB 级数据集。空间复杂度线性,通常可通过滑动窗口等技术在常数因子上优化。

注:复杂度基于理论模型。实际性能受数据规模、硬件环境与实现优化影响,建议针对具体场景进行基准测试。

文献与实现

相关工具

SPAdes · SOAPdenovo2 · AllPaths-LG

标签

hybrid super-read de-novo versatile

Released under the MIT License.