H

Hyenadna Large 1m Seqlen Hf

由 LongSafari 开发
HyenaDNA是一个长距离基因组基础模型,预训练上下文长度可达100万个标记,具有单核苷酸分辨率。
下载量 775
发布时间 : 11/3/2023
模型介绍
内容详情
替代品

模型简介

HyenaDNA是一个专注于基因组学的基础模型,能够处理长达100万个标记的序列,并实现单核苷酸级别的分析。

模型特点

长距离上下文处理
支持处理长达100万个标记的序列,比传统Transformer模型长500倍。
单核苷酸分辨率
使用单字符标记器实现单核苷酸级别的分析精度。
高效训练
在100万序列长度下训练速度比Flash Attention快160倍。
全局感受野
隐式长卷积使每层都具有全局感受野。

模型能力

基因组序列分析
序列分类
长序列处理
单核苷酸分辨率分析

使用案例

基因组学研究
调控元件预测
预测基因组中的调控元件位置和功能。
在23个下游任务上设定了新的SotA。
染色质谱分析
分析染色质结构和功能。
物种分类
基于基因组序列进行物种分类。