D

Deepseek R1 BF16

由 unsloth 开发
DeepSeek-R1是基于Llama架构的8B参数模型,由DeepSeek团队开发,专注于高效推理和微调。
下载量 944
发布时间 : 1/20/2025
模型介绍
内容详情
替代品

模型简介

该模型是DeepSeek-R1系列的蒸馏版本,基于Llama架构,适用于文本生成和对话任务。

模型特点

高效推理
支持在llama.cpp中高效运行,提供多种量化选项。
微调优化
使用Unsloth工具可显著提升微调速度并减少内存使用。
多格式支持
提供GGUF、4-bit和原始格式,适应不同部署需求。

模型能力

文本生成
对话系统
数学推理

使用案例

教育
数学问题解答
解答基础数学问题,如加法运算。
能够逐步推理并给出正确答案。
对话系统
日常对话
模拟自然对话流程。
生成连贯且有逻辑的回复。