T

Trocr Medieval Base

由 medieval-data 开发
这是一个针对中世纪手稿的TrOCR模型,基于microsoft/trocr-base-handwritten微调,专注于拉丁语、法语和西班牙语的中世纪手写文本识别。
下载量 153
发布时间 : 7/8/2024
模型介绍
内容详情
替代品

模型简介

该模型用于识别中世纪手稿中的文字,支持多种中世纪书写体,如卡罗琳体、哥特体等。

模型特点

多字体支持
能够识别多种中世纪书写体,包括卡罗琳体、哥特体、半哥特体、混合体等。
多语言支持
支持拉丁语、法语和西班牙语的中世纪文本识别。
基于TrOCR架构
利用Transformer架构进行光学字符识别,具有较好的文本识别能力。

模型能力

中世纪手写文本识别
多字体文本识别
多语言文本识别

使用案例

历史文献数字化
中世纪手稿转录
将中世纪手稿图像转换为可编辑的文本格式
字符错误率(CER)为0.035
学术研究
历史文献分析
帮助历史学家和语言学家分析中世纪文本内容