E

Esmplusplus Small

由 Synthyra 开发
ESM++是对ESMC的忠实实现,支持批处理且兼容标准Huggingface接口,无需依赖ESM Python包。小型版本对应ESMC的3亿参数版本。
下载量 6,460
发布时间 : 12/4/2024
模型介绍
内容详情
替代品

模型简介

ESM++是一个蛋白质语言模型,用于蛋白质序列的掩码语言建模、序列分类和标记分类任务。

模型特点

高效批处理
相比ESMC,ESM++通过高效批处理显著提升吞吐量,即使在批大小为1时也更快。
兼容Huggingface接口
完全兼容标准Huggingface接口,无需依赖ESM Python包。
多精度支持
支持fp32、fp16和bf16精度,fp16版本更接近fp32输出,推荐使用。
快速嵌入
提供embed_dataset方法,可快速嵌入整个蛋白质序列数据集。

模型能力

蛋白质序列嵌入
掩码语言建模
序列分类
标记分类
注意力图生成

使用案例

蛋白质研究
蛋白质功能预测
使用序列分类功能预测蛋白质功能。
蛋白质结构预测
利用蛋白质序列嵌入进行结构预测。