Q

Qwq Bakeneko 32b

由 rinna 开发
基于Qwen2.5-32B和QwQ-32B合并优化的日语对话模型,通过Chat Vector和ORPO技术增强指令跟随能力
下载量 1,597
发布时间 : 3/12/2025
模型介绍
内容详情
替代品

模型简介

该模型是针对日语任务优化的32B参数语言模型,通过参数向量合并和ORPO微调技术开发,擅长对话生成和指令理解

模型特点

Chat Vector合并技术
通过参数向量加减法融合QwQ-32B的对话能力
ORPO优化
使用Odds Ratio Preference Optimization进行指令微调
多阶段训练
结合预训练、向量合并和ORPO微调三阶段优化

模型能力

日语文本生成
多轮对话
指令理解
数学问题解答
知识问答

使用案例

教育
数学问题生成
自动生成微积分等数学问题并提供解答
可生成结构良好的数学题目和分步解答
客服
日语客服对话
处理日语用户的咨询和问题
能进行自然流畅的多轮对话