ProtBERT¶

2020年蛋白质语言模型蛋白质语言模型预训练进阶 (Intermediate)

ProtBERT

基于 BERT 架构的蛋白质语言模型，在 UniRef100 上预训练，学习氨基酸序列的上下文相关表征。该模型可用于蛋白质家族分类、亚细胞定位预测和翻译后修饰位点预测等任务。

:material-target: 用途

基于 BERT 的蛋白质序列表征学习

:material-clock-fast: 时间复杂度

O(n^2 * d)

:material-memory: 空间复杂度

O(n^2)

:material-code: 实现语言

Python

:material-folder: 分类：蛋白质语言模型 / 蛋白质语言模型预训练 | :material-identifier: ID：proteinbert