N

Nucleotide Transformer 500m 1000g

由 InstaDeepAI 开发
基于3,202个遗传多样性人类基因组预训练的5亿参数DNA序列分析模型
下载量 8,341
发布时间 : 4/4/2023
模型介绍
内容详情
替代品

模型简介

专为基因组学设计的Transformer模型,整合了3,200多个人类基因组和850个物种的DNA序列信息,提供高精度分子表型预测能力

模型特点

多源基因组整合
整合3,202个多样化人类基因组及850个物种的DNA序列数据
大规模预训练
在3,000亿词元规模上进行训练,覆盖19,212亿核苷酸
精准预测能力
相比现有方法提供更准确的分子表型预测
双框架支持
同时提供TensorFlow和PyTorch实现版本

模型能力

DNA序列分析
分子表型预测
基因组特征提取
掩码核苷酸预测

使用案例

基因组研究
人类基因组变异分析
利用模型分析不同人群基因组变异特征
可识别1.25亿个突变位点(含1.11亿SNP)
跨物种基因组比较
分析850个物种的DNA序列保守区域
生物医学
疾病相关基因预测
基于DNA序列特征预测疾病相关基因位点