SciGLM是一套能够进行大学水平科学推理的科学语言模型,通过自反思指令标注框架构建高质量数据集SciInstruct。
下载量 67
发布时间 : 2/25/2024
模型简介
SciGLM是一套专注于科学推理的大语言模型,能够处理物理、化学、数学及形式化证明等领域的复杂问题。其核心创新在于提出自反思指令标注框架,解决了科学领域数据稀缺的挑战。
模型特点
自反思指令标注框架
利用现有大语言模型为未标注科学问题生成逐步推理步骤,通过自反思的批判与修订流程进行优化,构建高质量数据集。
多学科科学推理能力
能够处理物理、化学、数学及形式化证明等多个科学领域的复杂问题,达到大学水平。
高质量数据集SciInstruct
包含254,051条数据,涵盖数学、物理与化学、形式化证明(Lean)等多个学科。
模型能力
科学问题解答
多步推理
数学计算
物理问题分析
化学问题解答
形式化证明
使用案例
教育
大学科学课程辅助
帮助学生理解复杂的科学概念和解决科学问题。
提高学习效率和理解深度
研究
科学问题探索
辅助研究人员进行科学问题的初步探索和假设验证。
加速研究进程
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文