SciGLM-6B开源科学语言模型 - 助力大学水平科学推理应用

首页

Sciglm 6B

由 zd21 开发

SciGLM是一套能够进行大学水平科学推理的科学语言模型，通过自反思指令标注框架构建高质量数据集SciInstruct。

大型语言模型

Transformers

英语开源协议:Apache-2.0 #科学推理 #自反思指令标注 #大学水平科学问题

下载量 67

发布时间 : 2/25/2024

模型简介

SciGLM是一套专注于科学推理的大语言模型，能够处理物理、化学、数学及形式化证明等领域的复杂问题。其核心创新在于提出自反思指令标注框架，解决了科学领域数据稀缺的挑战。

模型特点

自反思指令标注框架

利用现有大语言模型为未标注科学问题生成逐步推理步骤，通过自反思的批判与修订流程进行优化，构建高质量数据集。

多学科科学推理能力

能够处理物理、化学、数学及形式化证明等多个科学领域的复杂问题，达到大学水平。

高质量数据集SciInstruct

包含254,051条数据，涵盖数学、物理与化学、形式化证明（Lean）等多个学科。

模型能力

科学问题解答

多步推理

数学计算

物理问题分析

化学问题解答

形式化证明

使用案例

教育

大学科学课程辅助

帮助学生理解复杂的科学概念和解决科学问题。

提高学习效率和理解深度

研究

科学问题探索

辅助研究人员进行科学问题的初步探索和假设验证。

加速研究进程

🚀 SciGLM：基于自反思指令标注与调优的科学语言模型训练

SciGLM 是一套能够进行大学水平科学推理的科学语言模型。我们方法的核心是一种新颖的自反思指令标注框架，旨在解决科学领域数据稀缺的挑战。该框架利用现有的大语言模型为未标注的科学问题生成逐步推理，随后进行自反思的批评与修正。应用此框架，我们精心构建了 SciInstruct，这是一个涵盖物理、化学、数学和形式证明的多样化、高质量数据集。

🚀 快速开始

你可以按照以下步骤使用 SciGLM 模型：

安装依赖

git clone https://github.com/THUDM/SciGLM.git
cd SciGLM
pip install -r requirements.txt

模型微调

若要训练 6B 模型，请运行：

bash /path/training/finetune.sh

模型推理

cd /path/to/inference
python cli_demo.py

✨ 主要特性

自反思指令标注框架：有效解决科学领域数据稀缺问题，利用现有大语言模型生成推理并进行自反思修正。
高质量数据集：构建了涵盖物理、化学、数学和形式证明的 SciInstruct 数据集。
可公开获取：数据和模型均公开，方便研究人员使用。

📦 安装指南

git clone https://github.com/THUDM/SciGLM.git
cd SciGLM
pip install -r requirements.txt

💻 使用示例

基础用法

微调模型

bash /path/training/finetune.sh

模型推理

cd /path/to/inference
python cli_demo.py

📚 详细文档

SciInstruct 数据集

我们按如下方式构建了 SciInstruct 数据集：

学科	数学	物理与化学	形式证明（Lean）	总计
数量	89,934	123,869	40,248	254,051

我们公开了数据和模型供公众使用。如果你希望使用 SciInstruct 或 SciGLM，可以从以下链接下载：

下载数据

[Google Drive]
[Tsinghua Cloud]

下载模型

[Hugging Face]

📄 许可证

本项目采用 Apache-2.0 许可证。

📄 引用

如果你觉得我们的工作有帮助，请引用我们的论文：

@article{zhang2024sciglm,
  title={Sciglm: Training scientific language models with self-reflective instruction annotation and tuning},
  author={Zhang, Dan and Hu, Ziniu and Zhoubian, Sining and Du, Zhengxiao and Yang, Kaiyu and Wang, Zihan and Yue, Yisong and Dong, Yuxiao and Tang, Jie},
  journal={arXiv preprint arXiv:2401.07950},
  year={2024}
}