P

Prostt5

由 Rostlab 开发
ProstT5是一种蛋白质语言模型,能够在蛋白质序列与结构之间进行翻译。
下载量 252.91k
发布时间 : 7/21/2023
模型介绍
内容详情
替代品

模型简介

ProstT5(蛋白质结构序列T5)基于ProtT5-XL-U50,通过微调实现了蛋白质序列与3D结构之间的双向翻译。它支持从氨基酸序列预测3D结构(折叠)和从3D结构生成氨基酸序列(逆折叠)。

模型特点

双向翻译能力
支持蛋白质序列(AA)与结构(3Di)之间的双向翻译,包括折叠(AA→3Di)和逆折叠(3Di→AA)
基于ProtT5-XL-U50微调
在1700万高质量3D结构预测蛋白质上微调,继承了ProtT5-XL-U50的强大表示能力
结构特征提取
能够从3Di标记表示的3D结构中提取特征,扩展了传统蛋白质语言模型的功能

模型能力

蛋白质序列到结构翻译
蛋白质结构到序列翻译
蛋白质序列特征提取
蛋白质结构特征提取

使用案例

生物信息学
远程同源检测
通过预测的3Di字符串与Foldseek结合,无需显式计算3D结构即可进行远程同源检测
蛋白质设计
通过逆折叠从3D结构生成可能的氨基酸序列,辅助蛋白质设计
计算生物学
蛋白质结构预测
从氨基酸序列预测3D结构的简化表示(3Di标记)