白皮书
白皮书部分汇总 fq-compressor 面向公众的技术叙述。 这里用系统层面的方式解释主要压缩思路,而不把站点变成实现细节笔记。
白皮书主题
- ABC 流水线 说明全局分析、block 形成与逻辑流写入如何把短读长冗余变成可 seek 的归档。
- SCM 质量值建模 说明为什么质量值被视为独立统计信号,并通过自适应算术编码处理。
- Reads 重排 说明 minimizer 引导的顺序调整如何提升局部性,同时保持完全可逆。
- 共识与差分表示 说明局部 contig 如何用“一条共识 + 稀疏编辑”来表示多条 reads。
阅读收获
读完这些页面后,读者应能理解 fq-compressor 四个核心技术主张:为什么要做短读长重排、序列为何采用共识/差分表示、质量值为何独立建模,以及当前实现刻意止步于哪些边界。