Skip to content

性能证据

这一节是整个站点的证据契约。它的职责不是把 fq-compressor 讲得无限强,而是把仓库今天能证明什么和仍属于设计意图的部分清清楚楚分开。

性能账本

所有公开主张都要和方法、产物、检索成本绑在一起。

这个站点不会把 headline 数字和归档语义拆开看。每个指标都会连回某个子系统、方法学约束,或仓库中的可追溯产物。

查看方法学
01

3.97x

归档密度

压缩比被当作有边界的结果来呈现,而不是脱离数据集范围自由漂浮的口号。

  • ERR091571 smoke-scale 产物
  • 仓库内公开 benchmark 报告
追踪证据链
02

11.9 MB/s

压缩吞吐

压缩速度必须放回流水线、chunk 切分和背压设计中理解,而不是单独的计时数字。

  • 流水线拓扑
  • block 级并行调度
查看流水线
03

62.3 MB/s

回读速度

解压速度仍被放进主叙事,因为只有当检索代价可接受时,随机访问才真正有意义。

  • 解压路径
  • 原始顺序恢复边界
阅读算法综述
04

O(1)

随机访问

索引定位被视为一等契约。格式和 block map 是公开论证的一部分,不是实现尾注。

  • FQC block 索引
  • 无需全量展开的范围解码
研究格式

当前公开边界

  • 当前被跟踪的公开证据,主要围绕 ENA accession ERR091571 与可复现的 2,000-record smoke-scale 子集。
  • 站点可以讨论压缩密度、压缩吞吐、解压吞吐与归档语义,但不能把自己描述成已经被证明领先所有 FASTQ 专用同类。
  • 由于 Spring 仍处于 deferred 状态,当前 benchmark 叙事应被理解为有边界的,而不是完整结论。
  • 新的已跟踪 benchmark 证据应通过 ./scripts/benchmark.sh 生成;./scripts/benchmark_v2.sh 则保留为本地 exploratory / comparison CLI。
  • 当前压缩比和吞吐的区间位置,应以上述生成报告为准,而不是继续引用仓库里的写死文案。

主张矩阵

主张当前公开强度原因
fq-compressor 有一组被记录的短读长压缩结果benchmark/results/ 中有跟踪产物
fq-compressor 已经是同类最佳不能公开宣称Spring 仍未纳入完成的对照证明链
O(1) 随机访问是系统契约的一部分有格式设计、架构文档与代码锚点共同支撑
吞吐必须和归档语义一起解读站点把写路径、读路径和检索代价写成同一条故事线

建议同时打开的证据锚点

下一步