M

Meta Llama 3.1 8B Instruct GPTQ INT4

由 hugging-quants 开发
这是Meta-Llama-3.1-8B-Instruct模型的INT4量化版本,使用GPTQ算法进行量化,适用于多语言对话场景。
下载量 128.18k
发布时间 : 7/24/2024
模型介绍
内容详情
替代品

模型简介

Llama 3.1 8B Instruct是一个指令调优的大语言模型,针对多语言对话进行了优化,支持多种语言。本版本是原模型的INT4量化版本,降低了显存需求。

模型特点

多语言支持
支持包括英语、德语、法语、意大利语等多种语言的文本生成
指令调优
针对对话场景进行了专门的指令调优,能更好地理解并执行用户指令
高效量化
使用GPTQ算法进行INT4量化,显著降低显存需求同时保持较好的模型性能

模型能力

多语言文本生成
对话式交互
指令理解与执行
知识问答

使用案例

智能助手
多语言客服机器人
构建支持多种语言的智能客服系统
能流畅处理不同语言的客户咨询
教育
语言学习助手
帮助语言学习者练习对话和写作
提供自然流畅的目标语言交流体验