C

C2S Pythia 410m Cell Type Prediction

由 vandijklab 开发
基于Pythia-410m架构的细胞类型预测模型,通过Cell2Sentence方法将scRNA-seq数据转化为'细胞句子'进行微调,专注于单细胞RNA测序数据的细胞类型预测。
下载量 266
发布时间 : 9/3/2024
模型介绍
内容详情
替代品

模型简介

该模型利用大型语言模型处理自然语言的能力,通过创新的Cell2Sentence方法将单细胞RNA测序数据转换为基因名称序列,从而实现细胞类型的预测。

模型特点

Cell2Sentence创新方法
将scRNA-seq数据转化为按表达水平排序的基因名称序列('细胞句子'),使LLMs能够适应单细胞生物学研究。
大规模训练数据
基于800多个单细胞RNA测序数据集中的超过5700万个人类和鼠类细胞进行训练,涵盖多种组织和细胞类型。
跨物种适用性
训练数据包含人类和鼠类细胞,模型可能具备跨物种细胞类型预测能力。

模型能力

单细胞RNA测序数据分析
细胞类型预测
基因表达模式识别

使用案例

生物医学研究
细胞图谱构建
帮助研究人员快速分类和注释大规模单细胞测序数据中的细胞类型
加速人类细胞图谱等项目的细胞注释过程
疾病研究
识别疾病样本中的异常细胞类型或状态
可能发现新的疾病相关细胞亚群