L

Layoutlmv3 Finetuned Cord

由 nielsr 开发
基于LayoutLMv3在CORD数据集上微调的文档理解模型,擅长文档标记分类任务
下载量 617
发布时间 : 5/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是微软LayoutLMv3架构的微调版本,专门用于处理CORD数据集中的文档标记分类任务,能够准确识别和分类文档中的文本元素

模型特点

高精度文档理解
在CORD数据集上达到96%以上的F1值,能够准确识别文档中的各类文本元素
多模态处理能力
结合文本内容和视觉布局信息进行综合分析
端到端训练
支持从原始文档图像到最终分类结果的完整处理流程

模型能力

文档标记分类
文档布局分析
文本元素识别
结构化文档理解

使用案例

文档处理
收据信息提取
从扫描的收据中自动提取商家、日期、金额等信息
准确率96.8%
表格数据识别
识别文档中的表格结构并提取内容
金融自动化
发票处理
自动化处理企业发票,提取关键财务信息