T

Trocr Base Printed

由 philschmid 开发
基于microsoft/trocr-base-printed的分支模型,专注于印刷体文本的OCR识别任务。
下载量 14
发布时间 : 8/17/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个OCR(光学字符识别)模型,专门用于从图像中识别印刷体文本。它基于Transformer架构,能够高效地将图像中的文本转换为可编辑的文本格式。

模型特点

印刷体文本识别
专门优化用于识别印刷体文本,具有较高的准确率。
自定义推理端点
支持通过自定义pipeline部署为推理端点,便于集成到生产环境。
简单易用的API
提供清晰的cURL和Python请求示例,便于快速集成和使用。

模型能力

图像转文本
印刷体文字识别
端到端文本提取

使用案例

文档数字化
印刷文档转换
将扫描的印刷文档转换为可编辑的文本格式。
准确提取文档中的文本内容
自动化处理
表单处理
自动识别和提取印刷表单中的信息。
提高数据处理效率