G

Galactica 120b

由 facebook 开发
GALACTICA是基于大规模科学语料训练的大语言模型,专为科学任务设计,包括引文预测、科学问答、数学推理等。
下载量 136
发布时间 : 11/16/2022

模型简介

GALACTICA模型由Meta AI的Papers with Code团队开发,旨在研究语言模型在科学自动组织中的应用。该模型系列参数规模从1.25亿到1200亿不等,120B版本为最大规格。

模型特点

科学专用训练
训练于1060亿标记的开源科学文本与数据,涵盖论文、教科书、科学网站等专业内容
多模态支持
通过特殊标记支持引文、数学公式、分子结构等多种科学数据类型的处理
低毒性设计
在偏见与毒性评估中表现优于其他大型语言模型
规模可扩展
提供从125M到120B不同参数规模的模型版本

模型能力

科学文本生成
引文预测
数学问题求解
科学问答
文档摘要
分子属性预测
科学实体提取

使用案例

学术研究
文献辅助写作
自动生成包含正确引文的学术文本
提高学术写作效率,但需人工验证引文准确性
科学问题解答
回答专业领域的科学问题
在知识密集型任务上优于通用语言模型
教育
数学解题辅导
分步骤解决物理、数学问题
可展示完整的推理过程
AIbase
智启未来,您的人工智能解决方案智库
简体中文