M

Meta Llama 3 70B Instruct GGUF

由 MaziyarPanahi 开发
基于Meta官方Llama 3 70B指令微调模型的GGUF量化版本,支持2-16bit多种量化级别,适用于本地部署的对话场景
下载量 18.89k
发布时间 : 4/18/2024
模型介绍
内容详情
替代品

模型简介

Llama 3 70B参数的指令微调版本,经过监督微调和RLHF对齐,专为对话任务优化

模型特点

多级量化支持
提供2bit到16bit共9种量化级别,适配不同硬件资源需求
对话优化
通过监督微调(SFT)和人类反馈强化学习(RLHF)实现人类偏好对齐
长上下文处理
支持8k tokens的上下文窗口,适合长文档理解任务
GQA加速
采用分组查询注意力机制提升推理效率

模型能力

文本生成
代码生成
多轮对话
知识问答
指令跟随

使用案例

商业应用
智能客服
部署于企业客服系统的自动应答解决方案
在行业基准测试中超越多数开源聊天模型
研究开发
AI助手原型
作为基础模型开发定制化AI助手