L

Llama 3.1 Swallow 8B Instruct V0.3

由 tokyotech-llm 开发
Llama 3.1 Swallow是基于Meta Llama 3.1构建的大语言模型系列,通过持续预训练增强了日语能力,同时保留英文能力。
下载量 16.48k
发布时间 : 12/18/2024

模型简介

该模型在Llama 3.1基础上进行了日语能力的增强,适用于日语和英语的文本生成任务,特别适合需要日语支持的场景。

模型特点

日语能力增强
通过约2000亿标记的持续预训练,显著提升了日语处理能力。
多语言支持
在增强日语能力的同时,保留了原有的英文能力。
指令微调
通过监督微调构建的指令微调模型,能更好地响应指令。

模型能力

日语文本生成
英语文本生成
多轮对话
指令响应

使用案例

对话系统
日语客服助手
用于日语环境的客户服务对话系统。
在日语MT-Bench上表现出色
内容创作
日语故事创作
生成日语短篇故事或创意写作。
能生成连贯的日语叙事
AIbase
智启未来,您的人工智能解决方案智库
简体中文