L

Llama 3.1 8B Instruct

由 meta-llama 开发
Llama 3.1是Meta推出的多语言大语言模型系列,包含8B、70B和405B参数规模,支持8种语言和代码生成,优化了多语言对话场景。
下载量 5.7M
发布时间 : 7/18/2024

模型简介

基于Transformer架构的多语言生成模型,通过指令调优优化对话能力,适用于商业与研究场景的文本生成任务。

模型特点

多语言优化
针对8种语言进行专项调优,在MMLU等多语言基准测试中表现优异
超长上下文
支持128k tokens的上下文窗口,适合处理长文档和复杂对话
安全强化
通过RLHF对齐人类偏好,集成Llama Guard 3等安全工具
高效推理
采用GQA(分组查询注意力)机制提升计算效率

模型能力

多语言文本生成
代码生成与补全
指令跟随对话
跨语言知识问答
长文档摘要

使用案例

商业应用
多语言客服助手
部署支持8种语言的自动化客服系统
在葡萄牙语MMLU测试中达到84.95分(405B模型)
研究开发
合成数据生成
为其他AI系统生成训练数据
AIbase
智启未来,您的人工智能解决方案智库
简体中文