L

Llama 3.3 70b Instruct Awq

由 casperhansen 开发
Llama 3.3是Meta开发的多语言大语言模型,拥有700亿参数,针对多语言对话用例优化,在多项基准测试中表现优异。
下载量 47.12k
发布时间 : 12/6/2024
模型介绍
内容详情
替代品

模型简介

预训练和指令调优的700亿参数生成模型,支持多语言文本输入/输出,优化了对话场景下的表现。

模型特点

多语言支持
支持8种主要语言的文本生成和对话
长上下文处理
128k tokens的上下文长度,适合处理长文档
高效推理
采用分组查询注意力(GQA)技术提高推理效率
强化学习调优
通过RLHF(基于人类反馈的强化学习)优化对话安全性和帮助性

模型能力

多语言文本生成
指令跟随
代码生成
数学推理
工具使用

使用案例

对话系统
多语言客服机器人
支持多种语言的智能客服对话
在泰语和印地语等非英语语言中表现优异
代码辅助
编程助手
帮助开发者生成和优化代码
HumanEval基准测试pass@1达88.4%
教育辅助
数学问题解答
解决复杂数学问题并展示推理过程
MATH基准测试达77.0分