ESM-2
Meta AI 开发的蛋白质语言模型,使用 Transformer 架构在数亿条蛋白质序列上 预训练。该模型学习到的表征包含丰富的进化和结构信息,可用于下游任务 如接触预测、功能预测和结构推断。
| 属性 | 值 |
|---|---|
| 用途 | 基于 Transformer 的蛋白质序列表征学习 |
| 时间复杂度 | O(n^2 * d) |
| 空间复杂度 | O(n^2) |
| 年份 | 2022 |
| 难度 | 进阶 (Intermediate) |
| 实现语言 | Python |
| 分类 | 蛋白质语言模型 |
复杂度分析
- 时间复杂度:
O(n^2 * d) - 空间复杂度:
O(n^2)
性能洞见:该算法时间复杂度属于多项式量级。空间复杂度较高;对超长序列可考虑 Hirschberg 算法等空间优化变体。
注:复杂度基于理论模型。实际性能受数据规模、硬件环境与实现优化影响,建议针对具体场景进行基准测试。
文献与实现
相关工具
ProtTrans · Ankh · ProGen
标签
language-model transformer representation-learning pretrained