S

Smollm3 3B Base

由 HuggingFaceTB 开发
SmolLM3是一款拥有30亿参数的开源语言模型,支持6种语言,具备强大的推理能力和长上下文处理能力。
下载量 1,208
发布时间 : 6/19/2025

模型简介

SmolLM3是一款完全开源的语言模型,专注于在小模型规模下提供高性能,支持多语言和长上下文处理。

模型特点

混合推理优化
针对混合推理进行了优化的指令模型,提升推理效率。
完全开源
开放模型权重和完整的训练细节,包括公开的数据混合和训练配置。
长上下文支持
在64k上下文上进行训练,并使用YARN外推法支持最多128k个标记。
多语言支持
原生支持6种语言(英语、法语、西班牙语、德语、意大利语和葡萄牙语)。

模型能力

文本生成
多语言处理
长上下文理解
推理能力
代码生成
数学问题解决

使用案例

教育
数学问题解答
解答高中数学竞赛题目
在AIME 2025竞赛中表现优异
编程
代码生成
生成竞赛编程代码
在LiveCodeBench v4评估中表现良好
多语言应用
多语言问答
支持多种语言的问答系统
在Global MMLU评估中表现优异
AIbase
智启未来,您的人工智能解决方案智库
简体中文