高精度字符识别

# 高精度字符识别

Cyrillic PP OCRv3 Mobile Rec

由PaddleOCR团队开发的超轻量级西里尔文文本行识别模型，基于PP-OCRv3_mobile_rec训练，专门针对西里尔文优化

文字识别支持多种语言

Florence Base Mixed Line Bbox Ocr

基于Microsoft Florence-2基础模型微调的图像转文本模型，支持瑞典语和英语，专注于历史手写文本识别和光学字符识别。

图像生成文本

Qari OCR 0.2.2.1 VL 2B Instruct

基于Qwen2-VL-2B-Instruct微调的阿拉伯语OCR模型，专为整页阿拉伯文本识别优化，支持变音符号识别

图像生成文本

Transformers 阿拉伯语

Latex Finetuned

基于Transformer的光学字符识别模型，专为处理手写数学图像和结构化数学语法而优化。

Crnn Fa License Plate Recognition V2

一个基于CRNN的鲁棒OCR模型，专用于波斯语车牌识别。该模型是在波斯语车牌数据集(v1)上对基础模型进行微调的版本。

文字识别其他

TrOCR-Ru是基于microsoft/trocr-base-handwritten在俄语和英语合成数据集上微调的光学字符识别模型，专注于图像转文本任务。

Transformers 支持多种语言

基于microsoft/trocr-base-handwritten微调的俄语和英语OCR模型，专注于手写和印刷体文本识别

Transformers 支持多种语言

Vit Gpt2 Verifycode Caption

基于60000张图片训练集微调的Vit-GPT2架构验证码识别模型，能够准确识别图像中的验证码文本。

图像生成文本

Trocr Base Printed Synthetic Dataset Ocr

基于microsoft/trocr-base-printed微调的印刷文本识别模型，专为合成OCR数据集优化

Transformers 英语

ArOCR是一个阿拉伯语光学字符识别(OCR)模型，能够将包含阿拉伯文本的图像转换为可编辑的文本格式。

Transformers 阿拉伯语

Wav2vec2 Large Xls R 300m Marathi Cv8

这是一个基于Facebook的wav2vec2-xls-r-300m模型在马拉地语(Marathi)语音数据集上微调的自动语音识别(ASR)模型。

Transformers 其他

Wav2vec2 Xls R 1b Ka

基于facebook/wav2vec2-xls-r-1b在格鲁吉亚语数据集上微调的自动语音识别模型

Transformers 其他

Wav2vec2 Large Xls R 300m Or D5

这是一个基于facebook/wav2vec2-xls-r-300m在奥里亚语数据集上微调的自动语音识别(ASR)模型，专门用于奥里亚语的语音转文本任务。

Transformers 其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24