Llemma 34B是一个专注于数学领域的语言模型,基于Code Llama 34B的权重进行初始化,并在Proof-Pile-2数据集上训练了500亿个token。
下载量 60
发布时间 : 9/27/2023
模型简介
Llemma是一个开放的数学语言模型,专注于数学推理和计算任务,在思维链数学推理以及使用Python和形式化定理证明器等数学计算工具方面表现突出。
模型特点
数学专业能力
专门针对数学领域进行优化,在数学推理和计算任务上表现优异
思维链推理
支持复杂的思维链推理过程,能够逐步解决数学问题
工具集成
能够使用Python和形式化定理证明器等数学计算工具
开放模型
基于开放许可发布,可供研究和商业使用
模型能力
数学问题求解
定理证明
数学推理
思维链推理
Python代码生成
形式化证明
使用案例
教育
数学问题解答
帮助学生理解和解决各类数学问题
在GSM8k等数学测试集上表现优异
数学辅导
提供逐步的数学问题解决指导
通过思维链推理展示解题过程
研究
数学定理证明
辅助数学研究者进行定理证明
能够使用形式化定理证明器
数学计算
执行复杂的数学计算任务
支持Python等计算工具
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文