Z

Zurich 14B GCv2 10k

由 rubenroy 开发
基于伽马语料库微调的Qwen 2.5模型,旨在超越同规模的其他模型
下载量 47
发布时间 : 1/29/2025
模型介绍
内容详情
替代品

模型简介

苏黎世14B伽马语料库v2-10k是对阿里巴巴Qwen 2.5 14B Instruct模型的微调版本,展示了伽马语料库v2-10k的潜力。

模型特点

高效微调
使用Unsloth框架在1块A100显卡上仅训练约10分钟完成60个周期
先进架构
采用RoPE、SwiGLU、RMSNorm及注意力QKV偏置的变换器架构
多轮对话支持
基于伽马语料库训练,擅长处理结构化多轮对话

模型能力

文本生成
多轮对话
问答系统

使用案例

对话系统
AI助手
可作为智能助手处理用户查询
能够生成连贯、有帮助的回复
问答系统
事实查询
回答关于事实信息的问题
能提供准确的事实性回答