trocr-base-ru开源OCR模型 - 免费部署，高效实现俄英图像转文本任务

Trocr Base Ru

由 sherstpasha99 开发

TrOCR-Ru是基于microsoft/trocr-base-handwritten在俄语和英语合成数据集上微调的光学字符识别模型，专注于图像转文本任务。

下载量 30

发布时间 : 5/15/2024

模型简介

该模型主要用于光学字符识别（OCR）任务，能够从图像中识别并提取俄语和英语文本。

多语言支持

支持俄语和英语文本识别

高性能OCR

在HKR和西里尔数据集上表现出色，准确率最高达72.36%

大规模数据训练

基于nastyboget提供的大规模合成数据集进行微调

图像中的俄语文本识别

图像中的英语文本识别

手写体文本识别

印刷体文本识别

文档数字化

俄语文档扫描

将纸质俄语文档转换为可编辑的电子文本

准确率约70%

多语言OCR

双语文本识别

识别同时包含俄语和英语的混合文本图像

数据集	详情
`nastyboget/stackmix_hkr_large`	用于模型训练和评估的大型合成数据集。
`nastyboget/stackmix_cyrillic_large`	用于模型训练和评估的大型合成数据集。
`nastyboget/synthetic_cyrillic_large`	用于模型训练和评估的大型合成数据集。

指标	HKR验证集	HKR测试集1	HKR测试集2	西里尔字母验证集	西里尔字母测试集
准确率（Accuracy）	69.9947	67.4184	69.9187	72.3613	63.9249
字符错误率（CER）	6.7964	8.9113	6.7278	6.6403	9.2576
单词错误率（WER）	21.6688	27.3849	21.6200	27.6715	33.2406