L

Llama 3.1 Swallow 70B Instruct V0.3

由 tokyotech-llm 开发
Llama 3.1 Swallow是基于Meta Llama 3.1构建的大语言模型系列,通过持续预训练增强了日语能力,同时保留英文能力。
下载量 1,659
发布时间 : 12/25/2024

模型简介

Llama 3.1 Swallow是一系列大语言模型(8B、70B),通过在Meta Llama 3.1模型上进行持续预训练构建而成,增强了日语语言能力,同时保留英文能力。

模型特点

多语言能力
支持英语和日语,在保留英文能力的同时,增强了日语语言能力。
持续预训练
基于Meta Llama 3.1模型进行持续预训练,提升了模型性能。
指令调优
通过专门为日语构建的合成数据进行指令调优,使模型能更好地理解和响应用户指令。

模型能力

日语文本生成
英语文本生成
多轮对话
指令理解与响应

使用案例

对话系统
日语对话助手
用于构建日语对话助手,能够理解和生成自然的日语对话。
在日语MT-Bench测试中表现优异。
内容生成
日语故事生成
生成日语故事或内容,如示例中的东京红叶公园的故事。
AIbase
智启未来,您的人工智能解决方案智库
简体中文