Skip to content

ProGen

基于条件语言模型的蛋白质序列生成方法,可按指定的功能标签和结构条件 生成具有目标属性的新蛋白质序列。该方法生成的序列具有天然蛋白的特性, 可通过实验验证其功能。

属性
用途条件可控的蛋白质序列生成
时间复杂度O(n^2 * d)
空间复杂度O(n^2)
年份2020
难度高级 (Advanced)
实现语言Python
分类蛋白质语言模型

复杂度分析

  • 时间复杂度O(n^2 * d)
  • 空间复杂度O(n^2)

性能洞见:该算法时间复杂度属于多项式量级。空间复杂度较高;对超长序列可考虑 Hirschberg 算法等空间优化变体。

注:复杂度基于理论模型。实际性能受数据规模、硬件环境与实现优化影响,建议针对具体场景进行基准测试。

文献与实现

相关工具

ProteinMPNN · RFdiffusion · ESM

标签

generative protein-design conditional-generation transformer

Released under the MIT License.