T

Trocr Base Ru

由 sherstpasha99 开发
TrOCR-Ru是基于microsoft/trocr-base-handwritten在俄语和英语合成数据集上微调的光学字符识别模型,专注于图像转文本任务。
下载量 30
发布时间 : 5/15/2024
模型介绍
内容详情
替代品

模型简介

该模型主要用于光学字符识别(OCR)任务,能够从图像中识别并提取俄语和英语文本。

模型特点

多语言支持
支持俄语和英语文本识别
高性能OCR
在HKR和西里尔数据集上表现出色,准确率最高达72.36%
大规模数据训练
基于nastyboget提供的大规模合成数据集进行微调

模型能力

图像中的俄语文本识别
图像中的英语文本识别
手写体文本识别
印刷体文本识别

使用案例

文档数字化
俄语文档扫描
将纸质俄语文档转换为可编辑的电子文本
准确率约70%
多语言OCR
双语文本识别
识别同时包含俄语和英语的混合文本图像