P

Plantcaduceus L20

由 kuleshov-group 开发
PlantCaduceus是一个基于16种被子植物基因组预训练的DNA语言模型,采用Caduceus和Mamba架构,通过掩码语言建模目标学习进化保守性和DNA序列语法。
下载量 8,967
发布时间 : 5/19/2024
模型介绍
内容详情
替代品

模型简介

PlantCaduceus是一个DNA语言模型,专门用于处理和分析植物基因组序列,能够学习进化保守性和DNA序列语法。

模型特点

多物种基因组预训练
基于16种被子植物基因组进行预训练,涵盖1.6亿年演化历史。
多种参数规模
提供从2000万到2.25亿参数的不同规模模型,适应不同计算需求。
进化保守性学习
能够学习DNA序列中的进化保守性和语法规则。

模型能力

DNA序列分析
基因组掩码语言建模
进化保守性预测

使用案例

基因组研究
DNA序列评分
使用模型对DNA序列进行零样本评分估计。
进化保守性分析
分析不同物种DNA序列中的保守区域。