Skip to content

CRAM

专为比对数据设计的参考序列压缩格式,通过存储与参考序列的差异实现高压缩比。 该方法可将 BAM 文件压缩至原大小的 40-60%,是大规模测序项目的首选存储格式。

属性
用途比对数据的高效压缩存储
时间复杂度O(n)
空间复杂度O(r)
年份2011
分类数据压缩

复杂度分析

  • 时间复杂度O(n)
  • 空间复杂度O(r)

性能洞见:该算法时间复杂度属于线性(O(n) 量级),可在 TB 级数据上线性扩展,适合流式处理。

注:复杂度基于理论模型。实际性能受数据规模、硬件环境与实现优化影响,建议针对具体场景进行基准测试。

文献与实现

相关工具

samtools · htslib · cramtools

标签

reference-based alignment bam efficient

Released under the MIT License.