D

Deepseek R1 AWQ

由 cognitivecomputations 开发
DeepSeek R1模型的AWQ量化版本,优化了float16溢出问题,支持高效推理部署
下载量 30.46k
发布时间 : 1/21/2025
模型介绍
内容详情
替代品

模型简介

基于DeepSeek-R1基础模型的AWQ量化版本,适用于文本生成任务,支持中英文处理

模型特点

高效量化
采用AWQ量化技术,在保持模型性能的同时显著减少计算资源需求
溢出修复
修改了模型代码,修复了使用float16时的溢出问题
高性能部署
支持通过vLLM进行高效部署,提供多种GPU配置下的性能基准

模型能力

文本生成
中英文处理
长上下文推理

使用案例

文本生成
内容创作
生成各种类型的文本内容
对话系统
构建智能对话代理