P

Protgpt2

由 nferruz 开发
ProtGPT2是基于GPT2架构的蛋白质语言模型,能够生成全新的蛋白质序列,同时保留天然蛋白质的关键特征。
下载量 17.99k
发布时间 : 3/7/2022
模型介绍
内容详情
替代品

模型简介

ProtGPT2是一个能够理解蛋白质语言并用于全新蛋白质设计与工程的语言模型。其生成的序列在探索蛋白质空间未知区域的同时,保留了天然蛋白质的关键特征(氨基酸倾向性、二级结构含量和球状特性)。

模型特点

蛋白质序列生成
能够生成全新的蛋白质序列,探索蛋白质空间的未知区域。
保留天然特征
生成的序列保留了天然蛋白质的关键特征,如氨基酸倾向性、二级结构含量和球状特性。
自监督训练
采用自监督训练方式,通过因果建模目标训练模型预测序列中的下一个标记。

模型能力

蛋白质序列生成
蛋白质设计
蛋白质工程

使用案例

蛋白质设计
零样本生成全新蛋白质
从甲硫氨酸(M)开始生成全新的蛋白质序列。
生成的序列保留了天然蛋白质的关键特征。
基于用户序列微调
基于用户提供的序列进行微调,生成特定类型的蛋白质序列。
生成的序列更符合用户需求。