T

Trocr Base Ru

由 raxtemur 开发
基于microsoft/trocr-base-handwritten微调的俄语和英语OCR模型,专注于手写和印刷体文本识别
下载量 977
发布时间 : 2/16/2024
模型介绍
内容详情
替代品

模型简介

TrOCR-Ru是基于微软基础模型微调的俄语/英语光学字符识别(OCR)模型,专门用于从图像中提取文本内容,支持手写体和印刷体识别。

模型特点

多语言支持
同时支持俄语和英语的文本识别
混合数据训练
使用大规模合成数据集和真实数据混合训练
高性能OCR
在多个测试集上表现出稳定的识别准确率

模型能力

图像中的文本识别
手写体识别
印刷体识别
俄语文本提取
英语文本提取

使用案例

文档数字化
手写笔记数字化
将手写的俄语或英语笔记转换为可编辑文本
准确率约70%
表单处理
表格数据提取
从扫描的表格或表单中提取结构化数据