ProtBERT

基于 BERT 架构的蛋白质语言模型，在 UniRef100 上预训练，学习氨基酸序列的上下文相关表征。该模型可用于蛋白质家族分类、亚细胞定位预测和翻译后修饰位点预测等任务。

复杂度分析

性能洞见：该算法时间复杂度属于多项式量级。空间复杂度较高；对超长序列可考虑 Hirschberg 算法等空间优化变体。

注：复杂度基于理论模型。实际性能受数据规模、硬件环境与实现优化影响，建议针对具体场景进行基准测试。