E

Esm2 T6 8M UR50D Sequence Classifier V1

由 AmelieSchreiber 开发
基于ESM-2蛋白质语言模型训练的小型序列分类器,可将蛋白质序列分为酶、受体蛋白和结构蛋白三类。
下载量 30
发布时间 : 7/29/2023
模型介绍
内容详情
替代品

模型简介

该模型使用facebook/esm2_t6_8M_UR50D训练,能够对蛋白质序列进行分类,主要分为三类:酶(类别0)、受体蛋白(类别1)和结构蛋白(类别2)。

模型特点

基于ESM-2模型
使用facebook/esm2_t6_8M_UR50D训练,属于ESM-2模型系列之一。
合成数据训练
基于GPT-4生成的合成数据训练,能够对蛋白质序列进行分类。
轻量级
模型参数规模较小(8M),适合实验和教育用途。

模型能力

蛋白质序列分类
零样本分类

使用案例

生物信息学
蛋白质功能预测
通过分类蛋白质序列,预测其可能的功能类别。
能够将蛋白质序列分为酶、受体蛋白和结构蛋白三类。
教育演示
用于教学和演示蛋白质序列分类的基本原理。