M

Matcha Chart2text Pew

由 google 开发
MatCha是基于Pix2Struct架构的视觉语言模型,专门针对图表理解和数值推理任务进行优化,在图表问答任务中表现优异
下载量 168
发布时间 : 4/3/2023

模型简介

该模型通过联合建模图表与语言数据来增强视觉语言能力,特别设计了图表解构和数值推理等预训练任务,适用于图表摘要和问答场景

模型特点

图表理解能力
专门针对图表、曲线图等信息图进行优化,具备出色的视觉语言理解能力
数值推理能力
模型内建数学推理能力,可处理图表中的数值计算和逻辑推理任务
迁移学习能力
在屏幕截图、教科书图表和文档插图等不同领域展现出良好的迁移效果

模型能力

图表解析
图表摘要生成
视觉问答
数值推理
多语言图表理解

使用案例

数据分析
商业图表分析
自动解析商业报告中的图表并生成摘要
在ChartQA基准测试中超越之前最佳方法20%
教育
教科书图表理解
帮助学生理解教科书中的复杂图表
AIbase
智启未来,您的人工智能解决方案智库
简体中文