DeepSeek-R1-Distill-Qwen-32B-lora-r32开源模型 - 高效微调适配多种应用场景

首页

Deepseek R1 Distill Qwen 32B Lora R32

由 Naozumi0512 开发

这是从DeepSeek-R1-蒸馏-Qwen-32B中提取的LoRA适配器，基于Qwen2.5-32B基础模型，适用于参数高效微调。

大型语言模型

Transformers

#LoRA适配器 #参数高效微调 #模型蒸馏

下载量 109

发布时间 : 2/3/2025

模型简介

该LoRA适配器提取自DeepSeek-R1-蒸馏-Qwen-32B模型，用于在Qwen2.5-32B基础模型上进行参数高效微调，适用于各种自然语言处理任务。

模型特点

参数高效微调

使用LoRA适配器实现参数高效微调，减少计算资源需求

基于强大基础模型

基于Qwen2.5-32B大语言模型，具备强大的语言理解和生成能力

蒸馏模型适配

适配器提取自蒸馏模型，可能保留蒸馏模型的优势特性

模型能力

文本生成

语言理解

参数高效微调

使用案例

自然语言处理

文本生成任务

可用于各种文本生成应用

对话系统

可用于构建智能对话系统

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Deepseek R1 Distill Qwen 32B Lora R32

模型简介

模型特点

模型能力

使用案例

🚀 DeepSeek-R1-Distill-Qwen-32B-lora-r32

🚀 快速开始

✨ 主要特性

📦 安装指南

💻 使用示例

基础用法

📚 详细文档

🔧 技术细节

📄 许可证