V

Visualheist Large

由 shixuanleong 开发
VisualHeist是一个目标检测模型,专门用于从PDF文件中提取图表、示意图和表格,包括标题、页眉和页脚。
下载量 1,693
发布时间 : 10/28/2024

模型简介

VisualHeist通过微调目标检测模型,能够准确识别和分割PDF文档中的图表和表格,提高文档处理的自动化程度和工作效率。

模型特点

多版本选择
提供基础版和大型版两种模型规模,适应不同硬件配置需求。
高质量训练数据
使用3435张图表和1716个表格进行微调,所有数据均经过手动标注。
广泛适用性
在多种学科领域的文献上表现良好,包括化学、材料科学、生物学等。

模型能力

PDF文档解析
图表检测
表格检测
示意图检测
学术文献处理

使用案例

学术研究
文献数据提取
从科研论文中自动提取图表和表格数据
F1分数达到93%(整体)
文档处理
PDF内容结构化
将PDF文档中的可视化元素自动分类和提取
在补充材料上达到92%的F1分数
AIbase
智启未来,您的人工智能解决方案智库
简体中文