G

Galactica 125m

由 facebook 开发
GALACTICA是基于大规模科学语料库训练的系列语言模型,专注于科学任务处理。
下载量 193.82k
发布时间 : 11/16/2022
模型介绍
内容详情
替代品

模型简介

GALACTICA模型设计用于执行科学任务,包括引文预测、科学问答、数学推理、摘要生成、文档生成、分子属性预测和实体提取等。

模型特点

科学专用训练
基于1060亿token的开源科学文本和数据训练,涵盖论文、教科书、科学网站等专业内容
多模态支持
支持处理SMILES分子式、氨基酸序列等科学专用数据格式
低毒性输出
相比其他大型语言模型表现出显著较低的毒性率

模型能力

引文预测
科学问答
数学推理
摘要生成
文档生成
分子属性预测
实体提取

使用案例

学术研究
文献引用预测
预测给定文本段落可能引用的文献
较大规模模型表现出接近真实引文行为
科学概念解释
生成科学术语和概念的解释说明
在高质量学术语料上训练,解释具有专业性
教育
数学问题求解
解决物理和数学问题
能够处理包含公式和计算的复杂问题