M
Manga Ocr
由 TeamFnord 开发
专为日语文本设计的光学字符识别工具,主要针对日本漫画场景优化
下载量 17
发布时间 : 3/25/2022
模型简介
基于视觉编码器-解码器框架构建的日语OCR模型,特别优化了漫画场景中的文本识别能力
模型特点
多方向文本识别
同时支持竖排与横排文本识别
复杂文本处理
可准确识别含注音假名的文本
背景文字提取
能处理图像背景上的叠加文字
字体兼容性强
兼容多种字体及艺术字样式
鲁棒性高
对低画质图像具有强鲁棒性
模型能力
日语文本识别
漫画文字提取
多方向文本处理
复杂排版解析
使用案例
漫画数字化
漫画翻译辅助
自动提取漫画中的日语文本用于翻译工作
提高翻译效率,减少手动输入错误
漫画内容索引
从漫画图像中提取文字内容建立可搜索数据库
便于内容检索和分析
通用OCR应用
日语文档数字化
将印刷体日语文档转换为可编辑文本
支持多种排版格式的文档转换
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文