开源ESM-2蛋白质模型，适用于以蛋白质序列为输入的下游任务微调！

首页

Esm2 T36 3B UR50D

由 facebook 开发

ESM-2是基于掩码语言建模目标训练的新一代蛋白质模型，适用于各类以蛋白质序列为输入的下游任务微调。

蛋白质模型

Transformers

开源协议:MIT #蛋白质序列预测 #掩码语言建模 #生物医学研究

下载量 3.5M

发布时间 : 10/13/2022

模型简介

ESM-2是一个蛋白质语言模型，通过掩码语言建模目标训练，能够理解和生成蛋白质序列，适用于蛋白质结构预测、功能注释等任务。

模型特点

大规模预训练

模型在大量蛋白质序列数据上进行预训练，具有强大的序列理解和生成能力。

多规模可选

提供从800万到150亿参数不等的多种规模模型，适应不同计算资源需求。

下游任务适配

模型设计考虑了各类蛋白质相关下游任务的微调需求。

模型能力

蛋白质序列建模

蛋白质掩码预测

蛋白质结构预测

蛋白质功能注释

使用案例

生物信息学

蛋白质结构预测

利用模型对蛋白质序列的理解能力预测其三维结构。

蛋白质功能注释

通过模型分析蛋白质序列，预测其可能的功能。

药物发现

蛋白质设计

利用模型生成具有特定功能的蛋白质序列。

检查点名称	层数	参数数量
esm2_t48_15B_UR50D	48	150亿
esm2_t36_3B_UR50D	36	30亿
esm2_t33_650M_UR50D	33	6.5亿
esm2_t30_150M_UR50D	30	1.5亿
esm2_t12_35M_UR50D	12	3500万
esm2_t6_8M_UR50D	6	800万

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Esm2 T36 3B UR50D

模型简介

模型特点

模型能力

使用案例

🚀 ESM-2

📄 许可证