H

Hyenadna Small 32k Seqlen Hf

由 LongSafari 开发
HyenaDNA是一个长距离基因组基础模型,在单核苷酸分辨率下预训练了长达100万个标记的上下文长度。
下载量 2,885
发布时间 : 11/3/2023
模型介绍
内容详情
替代品

模型简介

HyenaDNA是一个基于Hyena操作符的长距离基因组基础模型,能够在单核苷酸分辨率下处理长达100万个标记的上下文长度。它通过次二次操作实现了比传统Transformer更高效的基因组序列建模。

模型特点

超长上下文处理
支持长达100万个标记的上下文长度,比传统Transformer模型长500倍
单核苷酸分辨率
使用单字符分词器实现单核苷酸级别的精确建模
高效训练
在1M序列长度下训练速度比Flash Attention快160倍
全局感受野
隐式长卷积使每一层都具有全局感受野

模型能力

长序列基因组建模
调控元件预测
染色质谱分析
物种分类
上下文学习
指令微调

使用案例

基因组研究
调控元件预测
预测基因组中的调控元件位置
在23个下游任务上设定了新的SotA
物种分类
基于基因组序列进行物种分类
生物医学研究
染色质谱分析
分析染色质结构特征