N

Nucleotide Transformer 500m Human Ref

由 InstaDeepAI 开发
基于人类参考基因组预训练的5亿参数Transformer模型,整合了3,200多个多样化人类基因组和850个物种的DNA序列信息
下载量 4,482
发布时间 : 4/4/2023
模型介绍
内容详情
替代品

模型简介

核苷酸Transformer是一系列基于全基因组DNA序列预训练的基础语言模型,专注于基因组学领域,提供精确的分子表型预测

模型特点

多源基因组整合
整合了3,200多个多样化人类基因组以及850个物种的DNA序列信息
大规模预训练
在3000亿词元上进行训练,使用8块A100 80GB显卡
6-mer分词策略
采用6-mer分词策略,词表大小4105,能够有效处理DNA序列
双框架支持
提供Tensorflow和Pytorch双版本支持

模型能力

DNA序列分析
分子表型预测
基因组特征提取
DNA序列掩码预测

使用案例

基因组学研究
DNA序列特征提取
从DNA序列中提取高级特征表示
可用于下游基因组学任务
分子表型预测
预测与DNA序列相关的分子表型
相比现有方法提供更精确的预测