L

Llama 3.3 Swallow 70B V0.4

由 tokyotech-llm 开发
Llama 3.3 Swallow是一个700亿参数的大语言模型,基于Meta Llama 3.3构建,增强了日语能力同时保留英文能力。
下载量 1,950
发布时间 : 2/17/2025

模型简介

Llama 3.3 Swallow通过在Meta Llama 3.3模型上进行持续预训练而构建,使用大规模日语和英语语料库增强双语处理能力。

模型特点

双语能力增强
在保留英文能力的基础上,显著提升了日语处理能力。
持续预训练
使用大规模多样化的语料进行持续预训练,提升模型性能。
多种模型变体
提供不同版本和规格的模型,满足不同需求。

模型能力

日语文本生成
英语文本生成
机器翻译
问答系统
代码生成
数学推理

使用案例

教育
日语学习辅助
帮助学生理解和生成日语文本。
在日语评估基准中表现优异。
翻译
日英互译
用于日英和英日机器翻译任务。
在WMT20翻译任务中表现良好。
编程
代码生成
生成符合Google Python风格指南的代码。
在JHumanEval评估中表现优异。
AIbase
智启未来,您的人工智能解决方案智库
简体中文