Skip to content

Foldseek

超高速蛋白质结构搜索工具,通过将三维结构编码为一维的 3Di 字母序列实现比传统方法快数万倍的结构相似性搜索。 该工具支持对大型结构数据库进行快速检索,是蛋白质功能注释、同源发现和结构聚类的重要利器。

属性
用途超快速蛋白质三维结构相似性搜索
时间复杂度O(n)
空间复杂度O(n)
年份2023
分类蛋白质结构预测

复杂度分析

  • 时间复杂度O(n)
  • 空间复杂度O(n)

性能洞见:该算法时间复杂度属于线性(O(n) 量级),可在 TB 级数据上线性扩展,适合流式处理。空间复杂度线性,通常可通过滑动窗口等技术在常数因子上优化。

注:复杂度基于理论模型。实际性能受数据规模、硬件环境与实现优化影响,建议针对具体场景进行基准测试。

文献与实现

相关工具

TM-align · DALI · MMseqs2

标签

structure-search fast 3Di structural-alignment

Released under the MIT License.