N

Nucleotide Transformer 2.5b 1000g

由 InstaDeepAI 开发
基于3,202个遗传多样性人类基因组预训练的25亿参数DNA序列基础模型,可精确预测分子表型
下载量 122
发布时间 : 4/4/2023

模型简介

核苷酸变换器是专为全基因组DNA序列设计的预训练语言模型,整合了人类及多物种基因组数据,在分子表型预测上展现卓越性能

模型特点

多源基因组预训练
整合3,200+人类基因组和850+物种数据,覆盖广泛遗传多样性
高效分词策略
采用6-mer优先的分词方法,平衡序列信息密度与计算效率
大规模参数
25亿参数规模可捕捉复杂基因组特征模式

模型能力

DNA序列嵌入生成
基因组变异预测
分子表型推断
掩码核苷酸预测

使用案例

基因组学研究
遗传变异分析
通过序列嵌入识别功能基因组区域
相比传统方法显著提升变异效应预测准确率
跨物种比较
利用多物种预训练特征进行保守区域分析
生物医学应用
疾病风险预测
基于全基因组序列的疾病关联研究
AIbase
智启未来,您的人工智能解决方案智库
简体中文