GSM8K 是一个包含8.5K个高质量小学数学问题的数据集,用于评估模型的数学推理能力。
下载量 437
发布时间 : 1/27/2025
模型简介
GSM8K 数据集由OpenAI发布,包含8,500个高质量的小学数学问题,旨在评估模型解决数学问题的能力。这些问题需要多步推理才能解决,适合测试模型的数学推理和问题解决能力。
模型特点
高质量数学问题
包含8,500个高质量的小学数学问题,涵盖多种数学概念和难度级别。
多步推理
每个问题需要多步推理才能解决,适合评估模型的复杂推理能力。
人工验证
所有问题均由人工编写和验证,确保问题的准确性和多样性。
模型能力
数学问题解决
多步推理
数学概念理解
使用案例
教育
数学辅导
用于开发数学辅导工具,帮助学生理解和解决数学问题。
提升学生的数学推理和问题解决能力。
模型评估
用于评估和比较不同模型在数学问题解决上的性能。
帮助研究人员了解模型的数学推理能力。
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文