G

GOT CPU

由 srimanth-d 开发
GOT-OCR2.0是一个多语言通用OCR模型,采用端到端架构实现先进的文本识别能力。
下载量 960
发布时间 : 9/24/2024
模型介绍
内容详情
替代品

模型简介

该模型通过统一的端到端架构实现了OCR-2.0技术,支持多语言文本识别,结合了视觉语言处理能力,适用于各种文档和场景文本识别任务。

模型特点

统一端到端架构
采用端到端模型设计,简化了传统OCR的多阶段流程
多语言支持
能够处理多种语言的文本识别任务
OCR-2.0技术
实现了新一代OCR技术,提供更准确的文本识别能力

模型能力

文档文本识别
场景文本识别
多语言文本提取
图像到文本转换

使用案例

文档数字化
纸质文档OCR
将扫描或拍摄的纸质文档转换为可编辑文本
高精度的文本识别结果
场景文本识别
街景文字识别
识别街道标志、广告牌等场景中的文字
适应各种字体和背景的识别能力