D

Deepseek R1 Chinese Law

由 corn6 开发
基于Unsloth和Huggingface TRL库训练的Llama模型,推理速度提升2倍
下载量 74
发布时间 : 4/3/2025
模型介绍
内容详情
替代品

模型简介

这是一个经过蒸馏和优化的8B参数Llama模型,使用Unsloth框架和TRL库进行训练,专注于文本生成任务。

模型特点

高效训练
使用Unsloth框架训练,速度提升2倍
4位量化
采用4位量化技术(BNB-4bit),降低资源需求
蒸馏优化
基于deepseek-r1的蒸馏版本,保持性能的同时减小模型体积

模型能力

文本生成
文本推理

使用案例

文本生成
内容创作
自动生成文章、故事等文本内容
对话系统
构建智能对话助手