M

Meta Llama 3.3 70B Instruct AWQ INT4

由 ibnzterrell 开发
Llama 3.3 70B Instruct AWQ INT4 是 Meta Llama 3.3 70B Instruct 模型的 4 位量化版本,适用于多语言对话用例,优化了文本生成任务。
下载量 6,410
发布时间 : 12/7/2024
模型介绍
内容详情
替代品

模型简介

这是一个预训练并经过指令调优的 700 亿参数生成模型,针对多语言对话用例进行了优化,支持多种语言,性能优于许多开源和闭源聊天模型。

模型特点

高效量化
使用 AutoAWQ 从 FP16 量化至 INT4,采用 GEMM 内核、零点量化和 128 的分组大小,显著减少显存占用。
多语言支持
支持多种语言,包括英语、法语、意大利语、葡萄牙语、印地语、西班牙语、泰语和德语。
高性能
在常见的行业基准测试中表现优于许多开源和闭源聊天模型。

模型能力

多语言文本生成
对话系统
指令调优

使用案例

对话系统
多语言客服助手
用于构建支持多种语言的客服助手,提供高效、准确的回答。
优化了对话体验,支持多语言交互。
内容生成
多语言内容创作
生成多语言的文章、报告或其他文本内容。
提高内容创作的效率和质量。