K

Ko Trocr Base Nsmc News Chatbot

由 daekeun-ml 开发
这是一个针对韩语文本识别的概念验证模型,基于TrOCR架构训练,支持从图像中识别韩语文本。
下载量 44
发布时间 : 11/22/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个基于TrOCR架构的韩语文本识别模型,专门用于从图像中提取韩语文本。由于TrOCR尚未发布包含韩语的多语言模型,此模型作为概念验证开发,建议基于该模型收集更多数据进行微调。

模型特点

韩语文本识别
专门针对韩语文本优化的OCR能力,能够准确识别韩语字符
多领域训练数据
使用新闻摘要、电影评论和聊天机器人数据集的混合数据进行训练,提高模型泛化能力
TrOCR架构
基于Transformer的OCR架构,结合视觉编码器和文本解码器

模型能力

韩语文本识别
图像转文本
多领域文本处理

使用案例

文档数字化
新闻文章数字化
将印刷或手写的韩语新闻文章转换为可编辑的文本格式
内容分析
电影评论分析
从图像中提取电影评论文本进行情感分析
聊天机器人
聊天记录处理
识别并处理图像中的韩语聊天记录