Llama-3-8B-Instruct-64k-GGUF开源文本生成模型 - 支持多比特量化免费可用

Llama 3 8B Instruct 64k GGUF

由 MaziyarPanahi 开发

Llama-3-8B-Instruct-64k的GGUF量化版本，支持多种比特量化，适用于文本生成任务。

下载量 201.57k

发布时间 : 4/25/2024

模型简介

该模型是Llama-3-8B-Instruct-64k的GGUF格式版本，主要用于文本生成任务，支持2比特至8比特的量化选项。

多比特量化支持

支持2比特、3比特、4比特、5比特、6比特和8比特的量化选项，适用于不同硬件需求。

GGUF格式

采用GGUF格式，取代了旧的GGML格式，兼容多种客户端和库。

64k上下文长度

支持长达64k的上下文长度，适合处理长文本生成任务。

文本生成

指令跟随

长文本处理

文本生成

对话系统

可用于构建对话系统，生成自然流畅的回复。

故事创作

适用于长文本故事创作，支持连贯的上下文生成。

本项目提供了 MaziyarPanahi/Llama-3-8B-Instruct-64k 的 GGUF 格式模型文件，可用于文本生成任务。

本项目的模型文件以 GGUF 格式存储，适用于多种支持该格式的客户端和库。以下是一些已知支持 GGUF 的工具：

llama.cpp：GGUF 的源项目，提供命令行界面和服务器选项。
llama-cpp-python：一个支持 GPU 加速、LangChain 集成和兼容 OpenAI API 的 Python 库。
LM Studio：一个易于使用且功能强大的本地图形界面应用，支持 Windows 和 macOS（Silicon），并提供 GPU 加速。截至 2023 年 11 月 27 日，Linux 版本处于测试阶段。
text-generation-webui：最广泛使用的 Web 界面，具有众多功能和强大的扩展，支持 GPU 加速。
KoboldCpp：一个功能齐全的 Web 界面，支持全平台和各种 GPU 架构的加速，尤其适合故事创作。
GPT4All：一个免费开源的本地运行图形界面，支持 Windows、Linux 和 macOS，并提供全 GPU 加速。
LoLLMS Web UI：一个出色的 Web 界面，具有许多有趣和独特的功能，包括一个完整的模型库，方便模型选择。
Faraday.dev：一个美观易用的基于角色的聊天图形界面，支持 Windows 和 macOS（Silicon 和 Intel），并提供 GPU 加速。
candle：一个专注于性能的 Rust 机器学习框架，支持 GPU 加速，易于使用。
ctransformers：一个支持 GPU 加速、LangChain 集成和兼容 OpenAI API 的 Python 库。截至 2023 年 11 月 27 日，该库已有很长时间未更新，可能不支持许多最新模型。