跳转至

ProtBERT

2020年 蛋白质语言模型 蛋白质语言模型预训练 进阶 (Intermediate)

ProtBERT

基于 BERT 架构的蛋白质语言模型,在 UniRef100 上预训练,学习氨基酸序列 的上下文相关表征。该模型可用于蛋白质家族分类、亚细胞定位预测和 翻译后修饰位点预测等任务。
:material-target: 用途
基于 BERT 的蛋白质序列表征学习
:material-clock-fast: 时间复杂度
O(n^2 * d)
:material-memory: 空间复杂度
O(n^2)
:material-code: 实现语言
Python

相关工具

ESM-2 · ProtTrans · UniRep

标签

[language-model](tags.md#language-model) [bert](tags.md#bert) [sequence-embedding](tags.md#sequence-embedding) [pretrained](tags.md#pretrained)

:material-folder: 分类:蛋白质语言模型 / 蛋白质语言模型预训练 | :material-identifier: ID:proteinbert