D

Deepseek V3 AWQ

由 QuixiAI 开发
DeepSeek V3的AWQ量化版本,优化了float16使用时的溢出问题,适合在8张80GB GPU上使用vLLM进行高效服务。
下载量 1,512
发布时间 : 1/1/2025

模型简介

DeepSeek V3的AWQ量化版本,主要用于文本生成任务,支持高上下文推理。

模型特点

高效量化
使用AWQ量化技术,优化了float16使用时的溢出问题,提升了推理效率。
高上下文支持
支持高上下文推理,最大上下文长度可达65536。
多GPU支持
支持在8张80GB GPU上使用vLLM进行高效服务。

模型能力

文本生成
高上下文推理

使用案例

文本生成
长文本生成
支持生成长达65536个token的文本,适合长文写作和对话系统。
在高上下文推理中表现优异,推理速度较快。
AIbase
智启未来,您的人工智能解决方案智库
简体中文