M

Mangaocr Hoogberta V2

由 dsupa 开发
一个基于TrOCR架构的日文漫画文本识别模型,专门用于从漫画图像中提取文本内容。
下载量 39
发布时间 : 4/22/2023
模型介绍
内容详情
替代品

模型简介

该模型结合了视觉编码器和文本解码器,能够准确识别漫画图像中的日文文本,适用于漫画翻译、内容分析等场景。

模型特点

漫画专用OCR
专门针对漫画文本特点优化,能处理气泡文字、艺术字体等复杂排版
端到端识别
直接从图像生成文本,无需传统OCR的分步处理流程
Hoogberta架构
基于改进的Transformer架构,在日文文本识别上表现优异

模型能力

漫画文本识别
日文OCR
图像转文本
气泡文字提取

使用案例

漫画翻译
自动提取对话文本
从扫描的漫画页面中自动识别对话内容
可显著减少人工输入工作量
内容分析
漫画内容索引
为漫画内容建立可搜索的文本数据库
实现基于文本的漫画内容检索