S

Smollm3 3B

由 HuggingFaceTB 开发
SmolLM3是一款参数为30亿的语言模型,旨在突破小模型的性能边界。它支持6种语言,具备高级推理能力和长上下文处理能力,是一个完全开源的模型。
下载量 1,138
发布时间 : 7/8/2025

模型简介

SmolLM3是一个30亿参数的语言模型,支持6种语言,具备高级推理能力和长上下文处理能力,适用于多种自然语言处理任务。

模型特点

高级推理能力
支持扩展思考模式,提升复杂推理任务的性能。
长上下文处理
支持64k上下文训练,并可扩展至128k标记。
多语言支持
原生支持6种语言(英语、法语、西班牙语、德语、意大利语和葡萄牙语)。
工具调用
支持通过XML或Python代码片段调用外部工具。
完全开源
开放权重和完整的训练细节,包括数据混合和训练配置。

模型能力

文本生成
高级推理
长上下文处理
多语言支持
工具调用

使用案例

教育
数学问题解答
解答高中数学竞赛题目,如AIME 2025。
在AIME 2025评估中得分36.7(扩展思考模式)。
编程
代码生成
生成竞赛编程代码。
在LiveCodeBench v4评估中得分30.0(扩展思考模式)。
多语言应用
多语言问答
支持多种语言的问答任务。
在Global MMLU评估中得分64.1(扩展思考模式)。
AIbase
智启未来,您的人工智能解决方案智库
简体中文