EraX-VL-2B-V1.5开源多模态模型 - 支持多语言图像及图文转文本

Erax VL 2B V1.5 I1 GGUF

由 mradermacher 开发

EraX-VL-2B-V1.5是一个多模态基础模型，支持越南语、英语和中文，具备图像转文本和图文转文本能力。

下载量 467

发布时间 : 12/29/2024

模型简介

这是一个多模态视觉语言模型，专注于图像到文本和图文到文本的转换任务，特别适用于保险、光学字符识别(OCR)等领域。

多语言支持

支持越南语、英语和中文三种语言的文本处理

多模态能力

能够处理图像和文本输入，实现图像到文本的转换

量化版本多样

提供多种量化版本，适应不同硬件和性能需求

图像转文本

图文转文本

多语言处理

光学字符识别(OCR)

保险行业

保险单据处理

自动识别和处理保险单据中的文字信息

文档数字化

文档OCR

将扫描文档或图片中的文字转换为可编辑文本

EraX-VL-2B-V1.5是一个多模态模型，支持越南语、英语和中文，可用于保险、OCR等领域。本项目提供了该模型的量化版本，方便在不同设备上使用。

属性	详情
基础模型	erax-ai/EraX-VL-2B-V1.5
支持语言	越南语、英语、中文
库名称	transformers
许可证	apache-2.0
量化者	mradermacher
标签	erax、多模态、erax-vl-2B、保险、OCR、越南语、bcg、图像转文本、图像文本转文本

https://huggingface.co/erax-ai/EraX-VL-2B-V1.5 的加权/imatrix量化版本。静态量化文件可在这里获取。

如果您不确定如何使用GGUF文件，请参考 TheBloke的README 以获取更多详细信息，包括如何拼接多部分文件。

（按大小排序，不一定按质量排序。IQ量化通常比类似大小的非IQ量化更可取）

链接	类型	大小/GB	备注
GGUF	i1-IQ1_S	0.5	适用于急需的情况
GGUF	i1-IQ1_M	0.6	大多适用于急需的情况
GGUF	i1-IQ2_XXS	0.6
GGUF	i1-IQ2_XS	0.7
GGUF	i1-IQ2_S	0.7
GGUF	i1-IQ2_M	0.7
GGUF	i1-Q2_K_S	0.7	质量非常低
GGUF	i1-IQ3_XXS	0.8	质量较低
GGUF	i1-Q2_K	0.8	IQ3_XXS可能更好
GGUF	i1-IQ3_XS	0.8
GGUF	i1-Q3_K_S	0.9	IQ3_XS可能更好
GGUF	i1-IQ3_S	0.9	优于Q3_K*
GGUF	i1-IQ3_M	0.9
GGUF	i1-Q3_K_M	0.9	IQ3_S可能更好
GGUF	i1-Q3_K_L	1.0	IQ3_M可能更好
GGUF	i1-IQ4_XS	1.0
GGUF	i1-IQ4_NL	1.0	优先选择IQ4_XS
GGUF	i1-Q4_0	1.0	速度快，质量低
GGUF	i1-Q4_K_S	1.0	大小/速度/质量最优
GGUF	i1-Q4_K_M	1.1	速度快，推荐使用
GGUF	i1-Q4_1	1.1
GGUF	i1-Q5_K_S	1.2
GGUF	i1-Q5_K_M	1.2
GGUF	i1-Q6_K	1.4	实际上类似于静态Q6_K