Whisper Finetune Teochew
基于Whisper-medium微调的潮州话(潮汕话)正字识别模型,支持多方言口音的正字转录
语音识别
Safetensors
中文
W
panlr
20
4
Thai Trocr
Apache-2.0
基于TrOCR基础手写体模型微调而成的泰语和英语光学字符识别模型,擅长处理手写文本行图像
文字识别
Transformers
支持多种语言
T
openthaigpt
2,677
9
Tablecell Htr
MIT
该模型用于从表格单元格的文本行图像中识别手写文本,特别适用于20世纪30年代芬兰死亡记录和人口普查记录中的手写文本识别。
文字识别
T
Kansallisarkisto
39
1
Phoneme Scorer V2 Wav2vec2
Apache-2.0
基于Wav2Vec2-Base架构的自动语音识别模型,专门用于音素识别,在LJSpeech Phonemes数据集上微调
语音识别
Transformers
英语
P
ct-vikramanantha
167
9
OCR TextInput Base
一个专注于金融领域的图像转文本模型,支持英文文本识别,主要用于处理金融文档中的图像内容。
文字识别
Transformers
英语
O
rohit5895
31
0
Pretrained Trocr Small Vietnamese Nom
一个专注于越南语语音识别的模型,支持高准确率的语音转文本功能。
机器翻译
Transformers
其他
P
nxquang-al
19
2
Image Text Captcha V2
基于microsoft/trocr-base-printed微调的印刷体文本识别模型,主要用于验证码识别任务
文字识别
Transformers
I
dragonstar
66
3
Whisper Small Japanese
Apache-2.0
该模型是基于openai/whisper-small微调的日语语音识别模型,支持日语语音转文本任务。
语音识别
Transformers
日语
W
Ivydata
356
5
Trocr Base Printed Fr
MIT
基于Transformer的法语印刷体OCR模型,填补了TrOCR模型法语版本的空白
图像生成文本
Transformers
法语
T
agomberto
110
2
Wav2vec2 Ljspeech Gruut
Apache-2.0
基于Wav2Vec2架构的音素识别模型,在LJSpeech Phonemes数据集上微调,用于将语音转换为音素序列
语音识别
Transformers
英语
W
bookbot
2,484
17
Whisper Small Cantonese
Apache-2.0
基于OpenAI Whisper-small微调的粤语语音识别模型,在Common Voice 16.0测试集上CER为7.93
语音识别
Transformers
支持多种语言
W
alvanlii
2,413
85
Stt Zh Conformer Transducer Large
这是一个用于转录普通话语音的大型Conformer-Transducer模型,参数约1.2亿,在AISHELL-2数据集上训练。
语音识别
中文
S
nvidia
72
13
Stt Zh Citrinet 1024 Gamma 0 25
这是一个用于中文普通话自动语音识别(ASR)的非自回归Citrinet模型,拥有约1.4亿参数,采用字符编码方案和CTC损失/解码。
语音识别
中文
S
nvidia
92
5
Wav2vec2 Xls R 300m Cs Cv8
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在Common Voice 8.0捷克语数据集上微调的语音识别模型
语音识别
Transformers
其他
W
comodoro
13
1
Xls R 300m Et
基于facebook/wav2vec2-xls-r-300m微调的爱沙尼亚语自动语音识别模型,使用约800小时多样化数据训练
语音识别
Transformers
其他
X
TalTechNLP
58
1
Wav2vec2 Bn 300m
Apache-2.0
基于facebook/wav2vec2-xls-r-300m微调的孟加拉语自动语音识别模型,使用OPENSLR_SLR53数据集训练
语音识别
Transformers
其他
W
Tahsin-Mayeesha
25
4
Wav2vec2 Xls R 1b Ro
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-1b在罗马尼亚语Common Voice 7.0数据集上微调的自动语音识别模型。
语音识别
Transformers
其他
W
ubamba98
16
0
Wav2vec2 Large Xlsr 53 Chinese Zh Cn Gpt
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在中文(zh-CN)上使用Common Voice数据集进行微调的语音识别模型
语音识别
Transformers
中文
W
ydshieh
127
32
Wav2vec2 Large Xlsr 53 Th
这是一个基于wav2vec2-large-xlsr-53模型在泰语通用语音7.0数据集上微调的自动语音识别(ASR)模型。
语音识别
Transformers
其他
W
airesearch
110.74k
21
Wav2vec2 Xls R 1b Npsc Bokmaal
Apache-2.0
基于facebook/wav2vec2-xls-r-1b模型在挪威书面语(博克马尔语)语音数据集上微调的自动语音识别模型
语音识别
Transformers
W
NbAiLab
23
0
Xls R 1b Cv 8 Fr
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-1b在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - FR数据集上微调的法语自动语音识别模型。
语音识别
Transformers
法语
X
Plim
26
0
Wav2vec2 Xls R Sl A1
Apache-2.0
这是一个基于facebook/wav2vec2-xls-r-300m在斯洛文尼亚语(Common Voice 8.0)数据集上微调的自动语音识别(ASR)模型。
语音识别
Transformers
其他
W
DrishtiSharma
25
0
Wav2vec2 Large Xls R 300m Bg D2
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在保加利亚语数据集上微调的自动语音识别模型
语音识别
Transformers
其他
W
DrishtiSharma
20
1