Ichigo-llama3.1-s-instruct-v0.4-GGUF开源模型 - 多量化版本适配不同硬件需求

Ichigo Llama3.1 S Instruct V0.4 GGUF

由 mradermacher 开发

基于Menlo/Ichigo-llama3.1-s-instruct-v0.4的静态量化模型，提供多种量化版本，适用于不同硬件需求。

下载量 369

发布时间 : 11/8/2024

模型简介

这是一个基于Llama架构的量化语言模型，主要用于指令跟随和文本生成任务。模型经过静态量化处理，提供多种精度版本以适应不同计算环境。

多种量化版本

提供从Q2_K到f16共13种不同量化版本，适应不同硬件性能和精度需求

高效推理

量化版本显著减小模型大小并提高推理速度，适合资源受限环境

跨平台兼容

GGUF格式支持多种平台和设备，包括ARM架构

文本生成

指令跟随

英语语言处理

自然语言处理

对话系统

构建英语对话机器人

文本生成

生成连贯的英语文本

本项目提供了 Ichigo-llama3.1-s-instruct-v0.4 模型的静态量化版本，适用于声音语言处理任务，如音频文本转换等。

如果你不确定如何使用 GGUF 文件，请参考 TheBloke 的 README 获取更多详细信息，包括如何拼接多部分文件。

属性	详情
基础模型	Menlo/Ichigo-llama3.1-s-instruct-v0.4
数据集	homebrewltd/instruction-speech-whispervq-v2
语言	英语
库名称	transformers
量化者	mradermacher
标签	声音语言模型、音频文本转换、torchtune
许可证	apache-2.0

（按大小排序，不一定代表质量。IQ 量化通常优于类似大小的非 IQ 量化）

链接	类型	大小/GB	说明
GGUF	Q2_K	3.3
GGUF	Q3_K_S	3.8
GGUF	Q3_K_M	4.1	质量较低
GGUF	Q3_K_L	4.4
GGUF	IQ4_XS	4.6
GGUF	Q4_0_4_4	4.8	在 ARM 上速度快，质量低
GGUF	Q4_K_S	4.8	速度快，推荐使用
GGUF	Q4_K_M	5.0	速度快，推荐使用
GGUF	Q5_K_S	5.7
GGUF	Q5_K_M	5.8
GGUF	Q6_K	6.7	质量非常好
GGUF	Q8_0	8.6	速度快，质量最佳
GGUF	f16	16.2	16 位每权重，有些过度