H

Horus OCR

由 TeeA 开发
Donut 是一个基于 Transformer 的图像转文本模型,能够从图像中提取和生成文本内容。
下载量 21
发布时间 : 6/12/2024
模型介绍
内容详情
替代品

模型简介

Donut 是一个视觉语言模型,主要用于从图像中提取文本信息,适用于文档理解、表格识别等任务。

模型特点

图像转文本
能够从图像中提取和生成文本内容,适用于文档和表格识别。
基于 Transformer
采用 Transformer 架构,具有强大的视觉和语言处理能力。

模型能力

图像转文本
文档理解
表格识别

使用案例

文档处理
处方识别
从医疗处方图像中提取文本信息。
准确提取处方中的药品名称和剂量。
表格识别
表格数据提取
从图像中的表格提取结构化数据。
生成可编辑的表格格式数据。