G

Gemma 3 27b It Quantized W4A16

由 abhishekchohan 开发
Gemma 3是Google开发的指令调优大语言模型,本仓库提供其27B参数的W4A16量化版本,显著降低硬件需求
下载量 640
发布时间 : 3/17/2025
模型介绍
内容详情
替代品

模型简介

Gemma 3是Google开发的高效大语言模型,经过指令调优优化对话能力。本量化版本通过4位权重和16位激活值量化,使模型能在消费级硬件上运行

模型特点

高效量化
采用W4A16量化技术,权重压缩至4位精度,显著降低内存需求
指令调优
经过专门指令调优,优化对话和任务执行能力
工具支持
内置工具调用功能,支持自动工具选择和解析

模型能力

文本生成
多轮对话
工具调用
指令理解
多模态理解(推断,基于image-text-to-text标签)

使用案例

对话系统
智能助手
部署为个人或企业级智能助手
提供流畅自然的对话体验
开发工具
代码辅助
帮助开发者完成代码生成和解释任务