N

Nvidia Llama 3.1 Nemotron 70B Instruct HF AWQ INT4

由 ibnzterrell 开发
这是 NVIDIA 基于 Meta Llama-3.1-70B-Instruct 定制的 Llama-3.1-Nemotron-70B-Instruct 模型的 AWQ 4位量化版本,专注于提升生成响应的有用性。
下载量 206
发布时间 : 10/24/2024
模型介绍
内容详情
替代品

模型简介

该模型是大型语言模型,经过优化以提供高质量的回答,支持多种语言,适用于文本生成任务。

模型特点

高性能量化
使用 AutoAWQ 从 FP16 量化至 INT4,采用 GEMM 内核、零点量化和 128 的分组大小,优化推理效率。
多语言支持
支持包括英语、德语、法语、西班牙语等在内的多种语言,适用于国际化应用场景。
强化对齐训练
使用 RLHF 和 HelpSteer2-Preference prompts 进行强化学习对齐训练,提升生成响应的有用性。

模型能力

文本生成
多语言支持
对话系统

使用案例

对话系统
智能客服
用于构建多语言智能客服系统,提供高质量的回答。
在 Arena Hard 上达到 85.0 分,AlpacaEval 2 LC 上达到 57.6 分。
内容生成
多语言内容创作
生成高质量的多语言文本内容,适用于新闻、博客等。