BGZF and Tabix¶
2011年 数据压缩 通用压缩
BGZF and Tabix
面向基因组区间文件的块压缩与随机索引方案,可对 VCF、BED 和 GFF 等文本格式实现按区域快速访问。 该方法是群体遗传学和变异分析工作流中的事实标准,使大规模文本数据在保持压缩的同时仍便于检索。
:material-target: 用途
对基因组区间文件进行块压缩与随机区域访问
:material-clock-fast: 时间复杂度
O(n):material-memory: 空间复杂度
O(1)相关工具¶
gzip · CRAM · htslib
标签¶
[block-compression](tags.md#block-compression) [indexing](tags.md#indexing) [random-access](tags.md#random-access) [genomics](tags.md#genomics)