Visualheist Large
模型简介
VisualHeist通过微调目标检测模型,能够准确识别和分割PDF文档中的图表和表格,提高文档处理的自动化程度和工作效率。
模型特点
多版本选择
提供基础版和大型版两种模型规模,适应不同硬件配置需求。
高质量训练数据
使用3435张图表和1716个表格进行微调,所有数据均经过手动标注。
广泛适用性
在多种学科领域的文献上表现良好,包括化学、材料科学、生物学等。
模型能力
PDF文档解析
图表检测
表格检测
示意图检测
学术文献处理
使用案例
学术研究
文献数据提取
从科研论文中自动提取图表和表格数据
F1分数达到93%(整体)
文档处理
PDF内容结构化
将PDF文档中的可视化元素自动分类和提取
在补充材料上达到92%的F1分数
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98
智启未来,您的人工智能解决方案智库
简体中文