T

Tri 21B

由 trillionlabs 开发
Tri-21B是一款旗舰级大语言模型,仅使用2T训练令牌便达到最先进性能,重新定义了训练效率边界。
下载量 223
发布时间 : 7/19/2025

模型简介

Tri-21B是一款高效的大语言模型,专注于推理能力,支持多语言,并在多个基准测试中表现优异。

模型特点

高效训练
仅使用2T令牌进行训练,远少于同类模型,同时在多个基准测试中实现70.3%的平均准确率。
突破帕累托边界
仅需2.95E+23 FLOPs,性能超过需要2-10倍计算资源的模型。
增强推理能力
训练数据集经过优化,专门提升推理能力。
先进的后训练
改进强化学习训练流程,专注于数学推理和日常使用。
多语言支持
针对韩语、英语和日语进行了特别优化。

模型能力

文本生成
问答系统
代码生成
数学推理
多语言支持
指令遵循

使用案例

教育
解释复杂概念
用简单术语解释量子计算等复杂概念
在MMLU基准测试中达到77.62%准确率
编程
代码生成
根据描述生成代码
HumanEval基准测试中达到75.61% pass@1
数学
数学问题解决
解决数学推理问题
GSM8k基准测试中达到87.95%准确率
AIbase
智启未来,您的人工智能解决方案智库
简体中文