T

Tablecell Htr

由 Kansallisarkisto 开发
该模型用于从表格单元格的文本行图像中识别手写文本,特别适用于20世纪30年代芬兰死亡记录和人口普查记录中的手写文本识别。
下载量 39
发布时间 : 9/12/2024
模型介绍
内容详情
替代品

模型简介

通过对芬兰国家档案馆的多世纪手写文本识别模型和微软的TrOCR模型进行微调训练而成,专门用于识别特定类型表格单元格中的手写文本。

模型特点

特定领域优化
专门针对历史文档表格单元格中的手写文本进行优化,识别精度高
基于TrOCR架构
利用微软TrOCR模型的强大能力,结合领域特定数据进行微调
GPU加速支持
支持GPU加速推理,提高处理速度

模型能力

手写文本识别
表格单元格内容提取
历史文档数字化

使用案例

档案数字化
历史人口记录转录
将20世纪30年代芬兰人口普查记录中的手写内容转换为可搜索的文本
验证CER为0.107,WER为0.237
死亡记录数字化
自动识别和转录历史死亡记录表格中的手写信息