T

Tatr Tab Struct V2

由 deepdoctection 开发
基于PubTables1M和FinTabNet数据集训练的DETR架构模型,专用于表格结构识别任务
下载量 99
发布时间 : 9/4/2023
模型介绍
内容详情
替代品

模型简介

该模型采用Transformer架构,能够识别表格中的行、列、表头及跨单元格结构,适用于文档数字化处理场景

模型特点

跨单元格识别
能够准确识别表格中的合并单元格和跨行列结构
多元素检测
同时检测表格、行、列、表头等多种布局元素
优化边缘处理
建议使用5像素填充边距以获得最佳识别效果

模型能力

表格区域检测
行列结构识别
表头分类
合并单元格检测

使用案例

文档数字化
财务报表解析
自动识别复杂财务报表的结构化数据
准确提取行列关系及跨单元格数据
科研文献处理
从学术论文中提取数据表格内容
保持原始表格的层级关系