E

Elastic DeepSeek R1 Distill Qwen 7B

由 TheStageAI 开发
DeepSeek-R1-Distill-Qwen-7B 是一个基于 Qwen-7B 的蒸馏模型,支持多种语言,适用于文本生成任务。
下载量 78
发布时间 : 4/25/2025
模型介绍
内容详情
替代品

模型简介

该模型是一个经过优化的文本生成模型,支持多种语言,适用于自托管场景,提供灵活的模型大小、延迟与质量调整选项。

模型特点

弹性模型
通过滑动控制条灵活调整模型大小、延迟与质量,提供 XL、L、M、S 四种优化版本。
多语言支持
支持 13 种语言,包括中文、英语、法语、西班牙语等。
高性能推理
在 H100 和 L40S GPU 上提供高效的推理性能,S 版在保持速度的同时显著提升质量。

模型能力

文本生成
多语言支持
自托管优化

使用案例

搜索助手
问答系统
回答用户提问,提供高质量的文本生成结果。
在 MMLU 和 PIQA 等基准测试中表现优异。
多语言应用
多语言翻译
支持多种语言的文本生成和翻译任务。
在多种语言环境下保持高质量的生成效果。