A

Arcee Blitz

由 arcee-ai 开发
基于Mistral架构的24B参数模型,通过从DeepSeek模型蒸馏而来,旨在实现快速高效。
下载量 4,923
发布时间 : 2/7/2025
模型介绍
内容详情
替代品

模型简介

Arcee-Blitz是一款实用的主力模型,能够处理多种任务而无需大型架构的开销。

模型特点

高效蒸馏
通过从DeepSeek-V3模型蒸馏而来,使用超过30亿token的预训练数据进行热启动训练。
性能提升
在MMLU-Pro等基准测试中展现出显著性能提升,反映世界知识的巨大增长。
量化支持
提供GGUF和AWQ量化版本,便于不同硬件环境部署。

模型能力

文本生成
问答系统
代码生成
逻辑推理
数学计算

使用案例

代码相关
代码补全
帮助开发者快速生成代码片段
在BigCodeBench基准测试中表现优异
代码解释
解释复杂代码逻辑
知识问答
专业领域问答
回答各类专业知识问题
在GPQA和MMLU Pro基准测试中表现突出