R

Rinalmo

由 multimolecule 开发
RiNALMo是基于掩码语言建模(MLM)目标预训练的非编码RNA(ncRNA)模型,在大量非编码RNA序列上通过自监督方式训练。
下载量 21.38k
发布时间 : 9/10/2024
模型介绍
内容详情
替代品

模型简介

RiNALMo是一个BERT风格的模型,专门用于处理非编码RNA序列,通过掩码语言建模任务进行预训练,可用于RNA序列分析和结构预测。

模型特点

大规模预训练
在3600万条独特的ncRNA序列上进行预训练,涵盖多个RNA数据库。
自监督学习
通过掩码语言建模任务进行训练,无需人工标注数据。
序列多样性处理
使用MMSeqs2将序列聚类,确保训练批次中的序列多样性。
高性能架构
采用33层Transformer架构,隐藏层大小1280,20个头,适合处理长序列。

模型能力

RNA序列分析
RNA结构预测
掩码核苷酸预测
RNA序列特征提取

使用案例

生物信息学
HIV-1 RNA分析
预测HIV-1 RNA序列中的掩码核苷酸
模型能准确预测掩码位置最可能的核苷酸
microRNA分析
预测microRNA-21序列中的掩码核苷酸
模型能识别microRNA序列中的关键核苷酸
RNA研究
非编码RNA功能预测
通过序列特征预测非编码RNA的功能