Stt Ru Fastconformer Hybrid Large Pc Onnx
NVIDIA FastConformer-Hybrid Large 是一个基于 FastConformer 架构的俄语自动语音识别模型,支持 CTC 和 RNN-T 解码器。
语音识别
S
istupakov
163
1
Gigaam V2 Onnx
MIT
GigaAM v2 是一个自动语音识别(ASR)模型,支持俄语语音转文本任务,提供CTC和RNN-T两种架构。
语音识别
其他
G
istupakov
170
2
Gigaam Rnnt
MIT
GigaAM-v2-RNNT 是一个俄语自动语音识别(ASR)模型,基于RNNT架构,适用于语音转文本任务。
语音识别
Transformers

其他
G
waveletdeboshir
70
1
Gigaam Ctc
MIT
GigaAM-v2-CTC 是一个俄语自动语音识别(ASR)模型,基于CTC损失函数训练,可通过Hugging Face transformers库使用。
语音识别
Transformers

其他
G
waveletdeboshir
255
1
Whisper Large V3 Russian Ties Podlodka V1.0
基于TIES合并方法融合的俄语语音识别模型,优化电话语音识别效果
语音识别
Transformers

其他
W
Apel-sin
96
1
Wav2vec2 Large Xls R 300m Ru
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice_17_0数据集上微调的俄语自动语音识别(ASR)模型,词错误率(WER)为0.195。
语音识别
Transformers

W
NLPVladimir
56
1
Whisper Large V3 Turbo Russian
MIT
基于OpenAI Whisper Large V3 Turbo优化的俄语自动语音识别(ASR)模型,使用Mozilla Common Voice 17俄语数据集微调
语音识别
Transformers

其他
W
dvislobokov
1,022
12
Faster Whisper Large V3 Ru Podlodka Int8
Apache-2.0
这是基于OpenAI Whisper架构的俄语语音识别模型,专为俄语语音转文本任务优化,并转换为ctranslate2格式以提高推理效率。
语音识别
其他
F
bzikst
29
3
Faster Whisper Large V3 Russian
Apache-2.0
这是antony66/whisper-large-v3-russian模型的ctranslate2转换版本,针对俄语语音识别任务进行了优化。
语音识别
Transformers

其他
F
bzikst
155
3
Faster Whisper Large V3 Ru Podlodka
Apache-2.0
这是 bond005/whisper-large-v3-ru-podlodka 的 ctranslate2 转换版本,针对俄语语音识别任务进行了优化。
语音识别
Transformers

其他
F
bzikst
23
1
Whisper Large V3 Russian
基于OpenAI Whisper-large-v3微调的俄语语音识别模型,针对俄语识别性能进行了优化
语音识别
Transformers

其他
W
antony66
6,665
60
Whisper Large V3 Ru Podlodka
Apache-2.0
这是一个基于Whisper Large V3的俄语语音识别模型,专门针对俄语语音进行了优化。
语音识别
Transformers

其他
W
bond005
570
8
Ru Whisper Small
Apache-2.0
基于openai/whisper-small微调的俄语语音识别模型,在Sberdevices_golos_10h_crowd数据集上训练
语音识别
Transformers

其他
R
Val123val
43
1
Training V2
Apache-2.0
基于OpenAI Whisper-base模型在Common Voice 11.0俄语数据集上微调的语音识别模型
语音识别
Transformers

其他
T
SofiaK
15
1
Stt Ru Fastconformer Hybrid Large Pc
这是一个用于俄语自动语音识别的FastConformer混合模型,结合了Transducer和CTC解码器,参数规模约1.15亿。
语音识别
其他
S
nvidia
6,513
10
Stt Ru Conformer Ctc Large
这是一个用于俄语自动语音识别的大型Conformer-CTC模型,在约1636小时的俄语语音数据上训练,具有约1.2亿参数。
语音识别
其他
S
nvidia
452
5
Wav2vec2 Large Ru Golos With Lm
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53微调的俄语语音识别模型,使用Sberdevices Golos数据集训练,并集成了2-gram语言模型以提高识别准确率。
语音识别
Transformers

其他
W
bond005
434
15
Wav2vec2 Large Ru Golos
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53微调的俄语语音识别模型,使用Sberdevices Golos数据集训练,支持16kHz音频输入
语音识别
Transformers

其他
W
bond005
1,182
12
Wav2vec2 Large Multilang Cv Ru
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在common_voice数据集上微调的版本,主要用于俄语语音识别任务。
语音识别
Transformers

W
cutten
16
0
Wav2vec2 Large Xls R 300m Russian Colab Beam Search Test
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的俄语语音识别模型,在评估集上取得了0.468的词错误率。
语音识别
Transformers

W
jfealko
18
0
Wav2vec2 Russian
基于wav2vec2架构的俄语语音识别模型,识别结果可通过配套文本纠错网络进行后处理
语音识别
Transformers

W
UrukHan
100
8
Wav2vec2 Large Xls R 300m Ru
这是一个基于Wav2Vec2 XLS-R架构的俄语自动语音识别模型,参数规模为300m,在公共语音和鲁棒语音事件数据集上进行了评估。
语音识别
Transformers

其他
W
mobedkova
37
1
Wav2vec2 Xls R 1b Russian
Apache-2.0
基于XLS-R 1B架构微调的俄语语音识别模型,在Common Voice 8.0等数据集上训练
语音识别
Transformers

其他
W
jonatasgrosman
765
14
Wav2vec2 Large Xlsr 53 Russian
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的俄语语音识别模型,支持16kHz采样率的语音输入
语音识别
其他
W
jonatasgrosman
3.9M
54
Wav2vec2 Large Xlsr 53 Russian
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的俄语自动语音识别(ASR)模型,在Common Voice俄语数据集上达到17.39%的词错误率(WER)。
语音识别
其他
W
anton-l
735
4
Wav2vec2 Xlsr 1b Ru
基于facebook/wav2vec2-xls-r-1b在Common Voice数据集上微调的俄语自动语音识别模型
语音识别
Transformers

其他
W
RASMUS
41
2
Wav2vec2 Base Russian Big Kaggle
Apache-2.0
该模型是基于facebook/wav2vec2-base在俄语数据集上微调的语音识别模型
语音识别
Transformers

W
Eyvaz
17
1
Wav2vec2 Large 100k Voxpopuli Ft Common Voice Plus TTS Dataset Russian
Apache-2.0
这是一个基于Facebook的wav2vec2-large-100k-voxpopuli模型,使用Common Voice 7.0和M-AILABS俄语数据进行微调的语音识别模型。
语音识别
Transformers

其他
W
Edresson
25
6
Wav2vec2 Large 100k Voxpopuli Ft Common Voice Plus TTS Dataset Plus Data Augmentation Russian
Apache-2.0
基于Facebook的Wav2vec2 Large 100k Voxpopuli模型,使用Common Voice 7.0、M-AILABS数据集及数据增强技术在俄语上进行微调的语音识别模型。
语音识别
Transformers

其他
W
Edresson
23
2
Wav2vec2 Base Russian Modified Kaggle
Apache-2.0
该模型是基于facebook/wav2vec2-base在未知数据集上微调的版本,适用于俄语语音处理任务。
语音识别
Transformers

W
Eyvaz
16
1
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文