base_model: Delcos/Velara-11B-V2
inference: false
language:
-
en
library_name: transformers
license: cc-by-nc-nd-4.0
model_creator: Devon M
model_name: Velara 11B v2
model_type: mistral
pipeline_tag: text-generation
prompt_template: '### 指令:
{prompt}
回复:
'
quantized_by: TheBloke
tags:
-
starling
-
mistral
-
llama-2
Velara 11B v2 - GGUF
模型描述
本仓库包含Devon M的Velara 11B v2的GGUF格式模型文件。
这些量化文件由Massed Compute提供的硬件支持生成。
关于GGUF
GGUF是由llama.cpp团队于2023年8月21日引入的新格式,用于替代不再受支持的GGML格式。
以下是已知支持GGUF的客户端和库的不完整列表:
- llama.cpp。GGUF的源项目,提供CLI和服务器选项。
- text-generation-webui,最广泛使用的Web UI,具有许多功能和强大扩展,支持GPU加速。
- KoboldCpp,全功能Web UI,支持跨平台和GPU架构的加速,特别适合故事创作。
- GPT4All,免费开源的本地运行GUI,支持Windows、Linux和macOS,具备完整GPU加速。
- LM Studio,易于使用且功能强大的本地GUI,支持Windows和macOS(Silicon),具备GPU加速。Linux版本于2023年11月27日进入测试阶段。
- LoLLMS Web UI,功能丰富的Web UI,包含许多有趣且独特的功能,如完整的模型库便于模型选择。
- Faraday.dev,美观易用的基于角色的聊天GUI,支持Windows和macOS(Silicon和Intel),具备GPU加速。
- llama-cpp-python,支持GPU加速的Python库,具备LangChain支持和OpenAI兼容的API服务器。
- candle,专注于性能的Rust ML框架,支持GPU,易于使用。
- ctransformers,支持GPU加速的Python库,具备LangChain支持和OpenAI兼容的AI服务器。截至2023年11月27日,ctransformers已长时间未更新,不支持许多新模型。
可用仓库
提示模板:Alpaca-InstructOnly2
### 指令:
{prompt}
### 回复:
兼容性
这些量化的GGUFv2文件与2023年8月27日之后的llama.cpp兼容,提交号为d0cee0d。
它们也与许多第三方UI和库兼容——请参阅本README顶部的列表。
量化方法说明
点击查看详情
可用的新方法包括:
- GGML_TYPE_Q2_K - "type-1" 2位量化,超级块包含16个块,每个块16个权重。块比例和最小值用4位量化。最终有效使用每权重2.5625位(bpw)。
- GGML_TYPE_Q3_K - "type-0" 3位量化,超级块包含16个块,每个块16个权重。比例用6位量化。最终使用3.4375 bpw。
- GGML_TYPE_Q4_K - "type-1" 4位量化,超级块包含8个块,每个块32个权重。比例和最小值用6位量化。最终使用4.5 bpw。
- GGML_TYPE_Q5_K - "type-1" 5位量化。与GGML_TYPE_Q4_K相同的超级块结构,结果为5.5 bpw。
- GGML_TYPE_Q6_K - "type-0" 6位量化。超级块包含16个块,每个块16个权重。比例用8位量化。最终使用6.5625 bpw。
请参阅下面的“提供文件”表格,了解哪些文件使用哪些方法及其具体信息。
提供文件
注意:上述RAM需求假设未启用GPU卸载。如果将层卸载到GPU,将减少RAM使用并改用VRAM。
如何下载GGUF文件
手动下载者注意:您几乎不需要克隆整个仓库!提供了多种不同的量化格式,大多数用户只需选择并下载单个文件。
以下客户端/库会自动为您下载模型,提供可用模型列表供选择:
- LM Studio
- LoLLMS Web UI
- Faraday.dev
在text-generation-webui
中
在“下载模型”下,输入模型仓库:TheBloke/Velara-11B-V2-GGUF,并在下方输入特定文件名,如:velara-11b-v2.Q4_K_M.gguf。
然后点击“下载”。
在命令行中,包括一次性下载多个文件
建议使用`huggingface-hub