G

Goku 8x22B V0.1

由 MaziyarPanahi 开发
基于Mixtral-8x22B-v0.1微调的多语言大模型,总参数量1410亿,激活参数350亿
下载量 35
发布时间 : 4/12/2024
模型介绍
内容详情
替代品

模型简介

这是一个基于guanaco-sharegpt-style数据集微调的混合专家模型,支持多语言文本生成任务

模型特点

混合专家架构
采用8个专家模型组合,每次推理仅激活部分专家,实现高效计算
多语言支持
原生支持法语、意大利语、德语、西班牙语和英语
指令微调
基于guanaco-sharegpt-style数据集优化,增强对话和指令跟随能力

模型能力

多语言文本生成
长文本理解
编程代码生成
基础推理
故事创作

使用案例

内容创作
故事生成
生成连贯的长篇叙事文本
如示例中展示的龙珠主题故事
技术应用
代码辅助
生成和解释编程代码