M

Meta Llama 3 8B Instruct

由 meta-llama 开发
Meta发布的80亿参数指令微调大语言模型,优化对话场景并在基准测试中超越多数开源聊天模型
下载量 1.2M
发布时间 : 4/17/2024
模型介绍
内容详情
替代品

模型简介

基于Transformer架构的生成式文本模型,通过监督微调和强化学习对齐人类偏好,适用于英语对话和文本生成任务

模型特点

长上下文支持
8k tokens上下文窗口,适合处理长文档和复杂对话
安全对齐
通过RLHF和Llama Guard 2安全过滤器降低有害内容风险
高效推理
支持GQA(分组查询注意力)机制提升推理效率

模型能力

文本生成
代码生成
对话交互
知识问答
阅读理解

使用案例

商业应用
智能客服
处理客户咨询和售后服务对话
在GSM-8K测试集达到79.6%准确率
研究开发
原型验证
快速构建对话系统原型
HumanEval代码生成测试62.2分