跳转至

数据压缩

压缩生物信息学数据的算法

10 个算法收录于该分类。

通用压缩 (General Compression)

通用数据压缩格式

算法年份用途难度
BGZF and Tabix2011对基因组区间文件进行块压缩与随机区域访问-
GZIP for FASTQ1992测序数据的通用压缩-

专用压缩 (Specialized Compression)

针对特定生物数据格式的压缩方法

算法年份用途难度
Genozip2021基因组数据的高压缩比无损压缩-
SPRING Compress2020大规模 FASTQ 数据集的高比率重排序压缩进阶
SPRING2019FASTQ 读段及质量值的高比率无损压缩-
MANGO2018无需参考基因组的基因组序列压缩高级
Orione2015参考辅助的 FASTQ/SAM 压缩进阶
fqzcomp2014FASTQ 质量分数的高效无损压缩进阶
DSRC2013FASTQ 数据的高速专用无损压缩-
CRAM2011比对数据的高效压缩存储-