T

Trocr Kurrent

由 dh-unibe 开发
专为19世纪德语手写文本识别优化的光学字符识别模型,基于微软TrOCR基础模型微调训练
下载量 384
发布时间 : 12/6/2022

模型简介

该模型专门用于识别19世纪德语库伦特体手写文本,适用于历史文献数字化和档案处理场景

模型特点

历史手写体优化
专门针对19世纪库伦特体手写风格进行优化训练
多源数据训练
整合了瑞士、德国等多国档案馆的历史文献数据进行训练
高精度识别
在测试集上达到2.655%的低字符错误率(CER)

模型能力

手写文本识别
历史文献数字化
德语库伦特体解析
光学字符识别

使用案例

历史档案数字化
政府会议记录转录
自动识别19世纪政府会议手写记录
测试集CER 2.655%
学者手稿数字化
处理洪堡等学者的手写讲座笔记
学术研究支持
历史日记转录
自动识别欧根·胡贝尔等历史人物的手写日记
AIbase
智启未来,您的人工智能解决方案智库
简体中文