T

Trocr Base Printed Synthetic Dataset Ocr

由 DunnBC22 开发
基于microsoft/trocr-base-printed微调的印刷文本识别模型,专为合成OCR数据集优化
下载量 65
发布时间 : 3/27/2023
模型介绍
内容详情
替代品

模型简介

该模型用于读取印刷文本标签,在合成OCR数据集上表现出色

模型特点

高精度OCR
在合成数据集上达到0.003的字符错误率(CER)
印刷文本优化
专门针对印刷文本标签识别进行优化
基于Transformer架构
采用先进的TrOCR架构,结合视觉和语言理解能力

模型能力

印刷文本识别
图像到文本转换
标签信息提取

使用案例

文档数字化
标签信息提取
从产品标签、包装等印刷文本中提取信息
高精度识别印刷文本内容
自动化处理
自动化数据录入
将印刷文档自动转换为可编辑文本
减少人工录入错误