金融文档处理
Typhoon Ocr 7b
专为泰英双语现实场景文档解析打造的视觉语言模型,基于Qwen2.5-VL-Instruction框架
图像生成文本
Transformers
支持多种语言
T
scb10x
126
9
Qwen2 VL 2B OCR
Apache-2.0
Qwen2-VL-2B-OCR是基于unsloth/Qwen2-VL-2B-Instruct微调的OCR模型,专注于从文档、表格和工资单图像中提取完整文本。
图像生成文本
Transformers
英语
Q
JackChew
842
4
Sk Invoice Receipts
Apache-2.0
基于Donut架构微调的实验性模型,专用于将发票或收据图像转换为XML或JSON数据结构,无需传统OCR引擎。
图像生成文本
Transformers
S
selvakumarcts
201
39
Invoice And Receipts Donut V1
Apache-2.0
基于Donut架构的大型语言模型,专为发票和收据图像转换为结构化数据而设计
图像生成文本
Transformers
I
mychen76
2,945
54
Tatr Tab Struct V2
基于PubTables1M和FinTabNet数据集训练的DETR架构模型,专用于表格结构识别任务
文字识别
Transformers
T
deepdoctection
99
2
Layout Xlm Base Finetuned With DocLayNet Base At Linelevel Ml384
MIT
基于LayoutXLM基础模型在DocLayNet数据集上微调的行级别文档理解模型,支持多语言文档布局分析和标记分类。
文字识别
Transformers
支持多种语言
L
pierreguillou
103
3
Lilt Xlm Roberta Base Finetuned With DocLayNet Base At Paragraphlevel Ml512
MIT
这是一个文档理解模型,专门用于分析文档布局和内容,在段落级别进行标记分类任务。
文字识别
Transformers
支持多种语言
L
pierreguillou
126
3
Lilt Xlm Roberta Base Finetuned With DocLayNet Base At Linelevel Ml384
MIT
基于LiLT和DocLayNet数据集微调的行级别文档理解模型,支持多语言文档布局分析
图像生成文本
Transformers
支持多种语言
L
pierreguillou
700
12
Donut Base Payslips
MIT
基于Donut架构的文档理解模型,专门针对工资单图像处理进行微调
文字识别
Transformers
D
Assadullah
20
0