Q

Qwen2 VL 2B OCR

由 JackChew 开发
Qwen2-VL-2B-OCR是基于unsloth/Qwen2-VL-2B-Instruct微调的OCR模型,专注于从文档、表格和工资单图像中提取完整文本。
下载量 842
发布时间 : 12/28/2024
模型介绍
内容详情
替代品

模型简介

该模型专门针对光学字符识别(OCR)任务进行了优化,能够从各种文档(如工资单、发票和表格)中准确提取文本,确保信息不遗漏。

模型特点

完整文本提取
专注于从文档中提取所有文本,确保不遗漏任何关键信息。
高效微调
使用Unsloth框架和Huggingface的TRL库进行微调,训练速度提升2倍。
优化OCR性能
针对工资单、表格等结构化文档的文本提取进行了专门优化。

模型能力

图像文本提取
结构化文档处理
工资单数据分析
表格数据提取

使用案例

金融
工资单处理
从工资单图像中提取员工信息、收入和扣除项等完整数据。
显著改进扣除部分的提取,确保信息完整。
文档管理
发票处理
从发票图像中提取供应商、金额和日期等关键信息。
准确提取结构化数据,减少人工录入错误。