P

Prot T5 Xl Bfd

由 Rostlab 开发
ProtT5-XL-BFD是基于蛋白质序列的自监督预训练模型,采用T5架构,在21亿蛋白质序列上训练,用于蛋白质特征提取和下游任务微调。
下载量 605
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型通过掩码语言建模目标在大型蛋白质序列语料库上进行预训练,能够捕捉蛋白质的生物物理特性,适用于蛋白质结构预测和功能分析。

模型特点

大规模预训练
在包含21亿蛋白质序列的BFD数据集上预训练,覆盖广泛的蛋白质多样性。
自监督学习
无需人工标注,通过掩码语言建模目标从原始蛋白质序列中学习。
生物物理特性捕捉
模型提取的特征能够反映决定蛋白质形状的重要生物物理特性。

模型能力

蛋白质序列特征提取
蛋白质结构预测
蛋白质功能分析

使用案例

生物信息学
蛋白质二级结构预测
用于预测蛋白质的二级结构(3态或8态分类)。
在CASP12数据集上达到77%准确率(3态)
亚细胞定位预测
预测蛋白质在细胞中的定位位置。
在DeepLoc数据集上达到77%准确率