U

Udop Large 512 300k

由 microsoft 开发
UDOP是一个统一处理视觉、文本和布局的通用文档处理模型,基于T5架构,适用于文档AI任务。
下载量 264
发布时间 : 2/26/2024
模型介绍
内容详情
替代品

模型简介

UDOP采用基于T5的编码器-解码器Transformer架构,适用于文档图像分类、文档解析和文档视觉问答等文档AI任务。

模型特点

统一多模态处理
能够同时处理视觉、文本和布局信息,实现全面的文档理解
通用文档AI能力
支持多种文档AI任务,包括分类、解析和问答
基于T5架构
采用成熟的T5架构,具有良好的扩展性和适应性

模型能力

文档图像分类
文档解析
文档视觉问答
文本布局理解
多模态文档处理

使用案例

文档处理
文档图像分类
自动识别和分类不同类型的文档图像
文档解析
提取文档中的结构化信息,如表格、字段等
文档视觉问答
回答基于文档内容的自然语言问题
示例中正确回答了表格上的日期问题