Qwen3-235B-A22B-exl2开源模型 - 多精度量化高效完成文本生成任务

首页

Qwen3 235B A22B Exl2

由 MikeRoz 开发

Qwen3-235B-A22B的Exllamav2量化版本，提供多种量化精度选择，适用于高效文本生成任务。

大型语言模型开源协议:Apache-2.0 #大语言模型量化 #ExLlamaV2优化 #多精度可选

下载量 53

发布时间 : 5/2/2025

模型简介

基于Qwen3-235B-A22B大语言模型的Exllamav2量化版本，支持不同比特宽度的量化配置，适用于需要高效推理的文本生成场景。

模型特点

多精度量化支持

提供2.25bpw、3.00bpw和4.00bpw三种量化精度选择，满足不同场景下的精度和效率需求

高效推理

通过Exllamav2量化技术实现更高效的大模型推理

前沿技术支持

使用Exllamav2开发分支的最新量化技术（commit 68976a0）

模型能力

文本生成

大语言模型推理

使用案例

文本生成

内容创作

用于自动生成文章、故事等内容

对话系统

构建智能对话助手

属性	详情
库名称	exllamav2
模型类型	对Qwen/Qwen3 - 235B - A22B进行Exllamav2量化后的模型
基础模型	Qwen/Qwen3 - 235B - A22B
基础模型关系	量化版本
标签	exl2
任务类型	文本生成
许可证	Apache 2.0

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Qwen3 235B A22B Exl2

模型简介

模型特点

模型能力

使用案例

🚀 Exllamav2量化模型

🚀 快速开始

不同量化版本及大小

📄 许可证

📦 模型信息