俄语语音识别
Stt Ru Fastconformer Hybrid Large Pc Onnx
NVIDIA FastConformer-Hybrid Large 是一个基于 FastConformer 架构的俄语自动语音识别模型,支持 CTC 和 RNN-T 解码器。
语音识别
S
istupakov
163
1
Gigaam V2 Onnx
MIT
GigaAM v2 是一个自动语音识别(ASR)模型,支持俄语语音转文本任务,提供CTC和RNN-T两种架构。
语音识别
其他
G
istupakov
170
2
Gigaam Rnnt
MIT
GigaAM-v2-RNNT 是一个俄语自动语音识别(ASR)模型,基于RNNT架构,适用于语音转文本任务。
语音识别
Transformers
其他
G
waveletdeboshir
70
1
Gigaam Ctc
MIT
GigaAM-v2-CTC 是一个俄语自动语音识别(ASR)模型,基于CTC损失函数训练,可通过Hugging Face transformers库使用。
语音识别
Transformers
其他
G
waveletdeboshir
255
1
Whisper Large V3 Russian Ties Podlodka V1.0
基于TIES合并方法融合的俄语语音识别模型,优化电话语音识别效果
语音识别
Transformers
其他
W
Apel-sin
96
1
Wav2vec2 Large Xls R 300m Ru
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice_17_0数据集上微调的俄语自动语音识别(ASR)模型,词错误率(WER)为0.195。
语音识别
Transformers
W
NLPVladimir
56
1
Whisper Large V3 Turbo Russian
MIT
基于OpenAI Whisper Large V3 Turbo优化的俄语自动语音识别(ASR)模型,使用Mozilla Common Voice 17俄语数据集微调
语音识别
Transformers
其他
W
dvislobokov
1,022
12
Faster Whisper Large V3 Ru Podlodka Int8
Apache-2.0
这是基于OpenAI Whisper架构的俄语语音识别模型,专为俄语语音转文本任务优化,并转换为ctranslate2格式以提高推理效率。
语音识别
其他
F
bzikst
29
3
Faster Whisper Large V3 Russian
Apache-2.0
这是antony66/whisper-large-v3-russian模型的ctranslate2转换版本,针对俄语语音识别任务进行了优化。
语音识别
Transformers
其他
F
bzikst
155
3
Faster Whisper Large V3 Ru Podlodka
Apache-2.0
这是 bond005/whisper-large-v3-ru-podlodka 的 ctranslate2 转换版本,针对俄语语音识别任务进行了优化。
语音识别
Transformers
其他
F
bzikst
23
1
Whisper Large V3 Russian
基于OpenAI Whisper-large-v3微调的俄语语音识别模型,针对俄语识别性能进行了优化
语音识别
Transformers
其他
W
antony66
6,665
60
Whisper Large V3 Ru Podlodka
Apache-2.0
这是一个基于Whisper Large V3的俄语语音识别模型,专门针对俄语语音进行了优化。
语音识别
Transformers
其他
W
bond005
570
8
Ru Whisper Small
Apache-2.0
基于openai/whisper-small微调的俄语语音识别模型,在Sberdevices_golos_10h_crowd数据集上训练
语音识别
Transformers
其他
R
Val123val
43
1
Training V2
Apache-2.0
基于OpenAI Whisper-base模型在Common Voice 11.0俄语数据集上微调的语音识别模型
语音识别
Transformers
其他
T
SofiaK
15
1
Stt Ru Fastconformer Hybrid Large Pc
这是一个用于俄语自动语音识别的FastConformer混合模型,结合了Transducer和CTC解码器,参数规模约1.15亿。
语音识别
其他
S
nvidia
6,513
10
Stt Ru Conformer Ctc Large
这是一个用于俄语自动语音识别的大型Conformer-CTC模型,在约1636小时的俄语语音数据上训练,具有约1.2亿参数。
语音识别
其他
S
nvidia
452
5
Wav2vec2 Large Ru Golos With Lm
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53微调的俄语语音识别模型,使用Sberdevices Golos数据集训练,并集成了2-gram语言模型以提高识别准确率。
语音识别
Transformers
其他
W
bond005
434
15
Wav2vec2 Large Ru Golos
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53微调的俄语语音识别模型,使用Sberdevices Golos数据集训练,支持16kHz音频输入
语音识别
Transformers
其他
W
bond005
1,182
12
Wav2vec2 Large Multilang Cv Ru
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在common_voice数据集上微调的版本,主要用于俄语语音识别任务。
语音识别
Transformers
W
cutten
16
0
Wav2vec2 Large Xls R 300m Russian Colab Beam Search Test
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的俄语语音识别模型,在评估集上取得了0.468的词错误率。
语音识别
Transformers
W
jfealko
18
0
Wav2vec2 Russian
基于wav2vec2架构的俄语语音识别模型,识别结果可通过配套文本纠错网络进行后处理
语音识别
Transformers
W
UrukHan
100
8
Wav2vec2 Large Xls R 300m Ru
这是一个基于Wav2Vec2 XLS-R架构的俄语自动语音识别模型,参数规模为300m,在公共语音和鲁棒语音事件数据集上进行了评估。
语音识别
Transformers
其他
W
mobedkova
37
1
Wav2vec2 Xls R 1b Russian
Apache-2.0
基于XLS-R 1B架构微调的俄语语音识别模型,在Common Voice 8.0等数据集上训练
语音识别
Transformers
其他
W
jonatasgrosman
765
14
Wav2vec2 Large Xlsr 53 Russian
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的俄语语音识别模型,支持16kHz采样率的语音输入
语音识别
其他
W
jonatasgrosman
3.9M
54
Wav2vec2 Large Xlsr 53 Russian
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的俄语自动语音识别(ASR)模型,在Common Voice俄语数据集上达到17.39%的词错误率(WER)。
语音识别
其他
W
anton-l
735
4
Wav2vec2 Xlsr 1b Ru
基于facebook/wav2vec2-xls-r-1b在Common Voice数据集上微调的俄语自动语音识别模型
语音识别
Transformers
其他
W
RASMUS
41
2
Wav2vec2 Base Russian Big Kaggle
Apache-2.0
该模型是基于facebook/wav2vec2-base在俄语数据集上微调的语音识别模型
语音识别
Transformers
W
Eyvaz
17
1
Wav2vec2 Large 100k Voxpopuli Ft Common Voice Plus TTS Dataset Russian
Apache-2.0
这是一个基于Facebook的wav2vec2-large-100k-voxpopuli模型,使用Common Voice 7.0和M-AILABS俄语数据进行微调的语音识别模型。
语音识别
Transformers
其他
W
Edresson
25
6
Wav2vec2 Large 100k Voxpopuli Ft Common Voice Plus TTS Dataset Plus Data Augmentation Russian
Apache-2.0
基于Facebook的Wav2vec2 Large 100k Voxpopuli模型,使用Common Voice 7.0、M-AILABS数据集及数据增强技术在俄语上进行微调的语音识别模型。
语音识别
Transformers
其他
W
Edresson
23
2
Wav2vec2 Base Russian Modified Kaggle
Apache-2.0
该模型是基于facebook/wav2vec2-base在未知数据集上微调的版本,适用于俄语语音处理任务。
语音识别
Transformers
W
Eyvaz
16
1