C

Court Records Htr

由 Kansallisarkisto 开发
基于微软TrOCR微调的手写文字识别模型,专用于19世纪芬兰语和瑞典语法庭记录文档
下载量 24
发布时间 : 9/12/2024
模型介绍
内容详情
替代品

模型简介

该模型用于从文本行图像中识别手写文字,特别针对19世纪芬兰语和瑞典语的数字化法庭记录文档进行了优化训练。

模型特点

历史文档专项优化
专门针对19世纪手写体特点进行训练,在历史文档识别任务上表现优异
多语言支持
同时支持芬兰语和瑞典语的手写识别
高精度识别
在验证集上达到2.4%的字错误率和11.3%的词错误率

模型能力

手写文字识别
历史文档处理
多语言文本提取

使用案例

历史档案数字化
法庭记录转录
将19世纪手写法庭记录转换为可搜索的数字文本
实现高精度自动转录,字错误率仅2.4%
家谱研究
历史人口记录处理
自动识别历史人口登记簿中的手写信息