K

Ko Trocr

由 ddobokki 开发
支持韩语初声识别的OCR模型,采用改进分词器解决传统TrOCR对韩语初声识别不足的问题
下载量 2,035
发布时间 : 3/9/2023
模型介绍
内容详情
替代品

模型简介

基于TrOCR架构优化的韩语光学字符识别模型,专门解决韩语初声识别问题,适用于韩语文档的数字化处理

模型特点

韩语初声支持
采用特殊分词器解码器,确保韩语初声不会显示为UNK未知字符
专业比赛验证
技术方案经过2023教元集团AI OCR挑战赛验证
高质量训练数据
使用AI Hub平台的专业韩语OCR数据集进行训练

模型能力

韩语文本识别
印刷体文字提取
文档数字化处理

使用案例

文档处理
公共行政文档数字化
将纸质行政文档转换为可编辑的电子文本
准确识别包含复杂韩文字符的官方文档
印刷材料转录
从书籍、杂志等印刷材料中提取韩语文本