Gemma 2-27b-it-Q8_0-GGUF开源模型 - 助力文本生成任务轻松开展

首页

Gemma 2 27b It Q8 0 GGUF

由 KimChen 开发

这是一个基于Google Gemma 2B模型转换而来的GGUF格式模型，适用于文本生成任务。

大型语言模型 #高精度量化 #大语言模型 #本地部署

下载量 471

发布时间 : 6/30/2024

模型简介

该模型是从google/gemma-2-27b-it转换而来的GGUF格式模型，主要用于文本生成任务，支持中文和其他多种语言。

模型特点

高效推理

使用GGUF格式优化，适合在多种硬件上高效运行。

多语言支持

支持包括中文在内的多种语言文本生成。

易于部署

可通过llama.cpp轻松部署和使用。

模型能力

文本生成

对话系统

内容创作

使用案例

内容创作

文章生成

根据提示生成连贯的文章或段落。

可生成符合主题的连贯文本

对话系统

智能聊天机器人

用于构建自然语言对话系统。

能够进行流畅的对话交互

🚀 KimChen/gemma-2-27b-it-Q8_0-GGUF

本项目将模型转换为GGUF格式，原始模型为google/gemma-2-27b-it，转换借助了llama.cpp并通过ggml.ai的GGUF-my-repo空间完成。如需了解该模型的更多详细信息，请参考原始模型卡片。

🚀 快速开始

访问Gemma模型

要在Hugging Face上访问Gemma模型，你需要查看并同意Google的使用许可。请确保你已登录Hugging Face，然后点击下方按钮。请求将立即处理。

按钮内容：确认许可

使用llama.cpp

安装llama.cpp

可以通过brew（适用于Mac和Linux）来安装llama.cpp：

brew install llama.cpp

调用llama.cpp服务器或CLI

CLI方式：

llama-cli --hf-repo KimChen/gemma-2-27b-it-Q8_0-GGUF --hf-file gemma-2-27b-it-q8_0.gguf -p "The meaning to life and the universe is"

服务器方式：

llama-server --hf-repo KimChen/gemma-2-27b-it-Q8_0-GGUF --hf-file gemma-2-27b-it-q8_0.gguf -c 2048

直接使用检查点

你也可以通过Llama.cpp仓库中列出的使用步骤直接使用此检查点：

步骤1：从GitHub克隆llama.cpp

git clone https://github.com/ggerganov/llama.cpp

步骤2：进入llama.cpp文件夹并使用`LLAMA_CURL=1`标志以及其他特定硬件标志（例如，在Linux上使用Nvidia GPU时使用`LLAMA_CUDA=1`）进行编译

cd llama.cpp && LLAMA_CURL=1 make

步骤3：通过主二进制文件运行推理

./llama-cli --hf-repo KimChen/gemma-2-27b-it-Q8_0-GGUF --hf-file gemma-2-27b-it-q8_0.gguf -p "The meaning to life and the universe is"

或者

./llama-server --hf-repo KimChen/gemma-2-27b-it-Q8_0-GGUF --hf-file gemma-2-27b-it-q8_0.gguf -c 2048

📦 安装指南

安装llama.cpp

可以通过brew（适用于Mac和Linux）来安装llama.cpp：

brew install llama.cpp

💻 使用示例

基础用法

CLI方式

llama-cli --hf-repo KimChen/gemma-2-27b-it-Q8_0-GGUF --hf-file gemma-2-27b-it-q8_0.gguf -p "The meaning to life and the universe is"

服务器方式

llama-server --hf-repo KimChen/gemma-2-27b-it-Q8_0-GGUF --hf-file gemma-2-27b-it-q8_0.gguf -c 2048

高级用法

直接使用检查点

# 步骤1：克隆llama.cpp
git clone https://github.com/ggerganov/llama.cpp
# 步骤2：进入文件夹并编译
cd llama.cpp && LLAMA_CURL=1 make
# 步骤3：运行推理（CLI方式）
./llama-cli --hf-repo KimChen/gemma-2-27b-it-Q8_0-GGUF --hf-file gemma-2-27b-it-q8_0.gguf -p "The meaning to life and the universe is"
# 步骤3：运行推理（服务器方式）
./llama-server --hf-repo KimChen/gemma-2-27b-it-Q8_0-GGUF --hf-file gemma-2-27b-it-q8_0.gguf -c 2048