F

Florence 2 DocLayNet Fixed

由 yifeihu 开发
基于DocLayNet数据集微调的Florence-2模型,专用于文档布局分析任务,通过类别名称简化提升性能
下载量 95
发布时间 : 10/29/2024
模型介绍
内容详情
替代品

模型简介

该模型是Florence-2-large-ft的微调版本,针对文档布局分析任务进行了优化,特别处理了文档中的视觉元素分类和定位问题。

模型特点

类别名称优化
将原始类别名称简化为单标记,提升模型性能7%并加速训练推理
边界框质量
生成的边界框边缘更清晰,避免了文本截断和多重框问题
科学论文优化
在科学论文子集上表现优异,mAP50-95达到87%

模型能力

文档布局分析
视觉元素检测
文本区域识别
表格检测
公式识别

使用案例

学术文档处理
论文图表识别
自动识别学术论文中的图表、公式等元素
在科学论文子集上mAP50-95达87%
文档数字化
文档结构解析
分析文档布局结构,识别页眉、页脚、标题等元素
整体mAP50-95达70%