低CER

# 低CER

Whisper Finetune Teochew

基于Whisper-medium微调的潮州话（潮汕话）正字识别模型，支持多方言口音的正字转录

Safetensors 中文

基于TrOCR基础手写体模型微调而成的泰语和英语光学字符识别模型，擅长处理手写文本行图像

Transformers 支持多种语言

该模型用于从表格单元格的文本行图像中识别手写文本，特别适用于20世纪30年代芬兰死亡记录和人口普查记录中的手写文本识别。

Kansallisarkisto

Phoneme Scorer V2 Wav2vec2

基于Wav2Vec2-Base架构的自动语音识别模型，专门用于音素识别，在LJSpeech Phonemes数据集上微调

Transformers 英语

ct-vikramanantha

Wav2vec2 Base Korean

基于Facebook的wav2vec2-base模型微调而来，专门针对韩语语音识别进行了优化，能够将韩语语音准确地转录为文本。

Transformers 韩语

OCR TextInput Base

一个专注于金融领域的图像转文本模型，支持英文文本识别，主要用于处理金融文档中的图像内容。

Transformers 英语

Pretrained Trocr Small Vietnamese Nom

一个专注于越南语语音识别的模型，支持高准确率的语音转文本功能。

Transformers 其他

Image Text Captcha V2

基于microsoft/trocr-base-printed微调的印刷体文本识别模型，主要用于验证码识别任务

Whisper Small Japanese

该模型是基于openai/whisper-small微调的日语语音识别模型，支持日语语音转文本任务。

Transformers 日语

Trocr Base Printed Fr

基于Transformer的法语印刷体OCR模型，填补了TrOCR模型法语版本的空白

图像生成文本

Transformers 法语

Wav2vec2 Ljspeech Gruut

基于Wav2Vec2架构的音素识别模型，在LJSpeech Phonemes数据集上微调，用于将语音转换为音素序列

Transformers 英语

Whisper Small Cantonese

基于OpenAI Whisper-small微调的粤语语音识别模型，在Common Voice 16.0测试集上CER为7.93

Transformers 支持多种语言

Stt Zh Conformer Transducer Large

这是一个用于转录普通话语音的大型Conformer-Transducer模型，参数约1.2亿，在AISHELL-2数据集上训练。

语音识别中文

Stt Zh Citrinet 1024 Gamma 0 25

这是一个用于中文普通话自动语音识别(ASR)的非自回归Citrinet模型，拥有约1.4亿参数，采用字符编码方案和CTC损失/解码。

语音识别中文

Wav2vec2 Xls R 300m Cs Cv8

基于facebook/wav2vec2-xls-r-300m在Common Voice 8.0捷克语数据集上微调的语音识别模型

Transformers 其他

基于facebook/wav2vec2-xls-r-300m微调的爱沙尼亚语自动语音识别模型，使用约800小时多样化数据训练

Transformers 其他

Wav2vec2 Bn 300m

基于facebook/wav2vec2-xls-r-300m微调的孟加拉语自动语音识别模型，使用OPENSLR_SLR53数据集训练

Transformers 其他

Tahsin-Mayeesha

Wav2vec2 Large Xlsr 53 Chinese Zh Cn Gpt

基于facebook/wav2vec2-large-xlsr-53在中文(zh-CN)上使用Common Voice数据集进行微调的语音识别模型

Transformers 中文

Wav2vec2 Xls R 1b Ro

该模型是基于facebook/wav2vec2-xls-r-1b在罗马尼亚语Common Voice 7.0数据集上微调的自动语音识别模型。

Transformers 其他

Wav2vec2 Large Xlsr 53 Th

这是一个基于wav2vec2-large-xlsr-53模型在泰语通用语音7.0数据集上微调的自动语音识别(ASR)模型。

Transformers 其他

Wav2vec2 Xls R 1b Npsc Bokmaal

基于facebook/wav2vec2-xls-r-1b模型在挪威书面语（博克马尔语）语音数据集上微调的自动语音识别模型

Xls R 1b Cv 8 Fr

这是一个基于facebook/wav2vec2-xls-r-1b在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - FR数据集上微调的法语自动语音识别模型。

Transformers 法语

Wav2vec2 Xls R Sl A1

这是一个基于facebook/wav2vec2-xls-r-300m在斯洛文尼亚语(Common Voice 8.0)数据集上微调的自动语音识别(ASR)模型。

Transformers 其他

Wav2vec2 Large Xls R 300m Bg D2

基于facebook/wav2vec2-xls-r-300m在保加利亚语数据集上微调的自动语音识别模型

Transformers 其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24