俄语语音识别

# 俄语语音识别

Stt Ru Fastconformer Hybrid Large Pc Onnx

NVIDIA FastConformer-Hybrid Large 是一个基于 FastConformer 架构的俄语自动语音识别模型，支持 CTC 和 RNN-T 解码器。

GigaAM v2 是一个自动语音识别（ASR）模型，支持俄语语音转文本任务，提供CTC和RNN-T两种架构。

语音识别其他

GigaAM-v2-RNNT 是一个俄语自动语音识别（ASR）模型，基于RNNT架构，适用于语音转文本任务。

Transformers 其他

waveletdeboshir

GigaAM-v2-CTC 是一个俄语自动语音识别(ASR)模型，基于CTC损失函数训练，可通过Hugging Face transformers库使用。

Transformers 其他

waveletdeboshir

Whisper Large V3 Russian Ties Podlodka V1.0

基于TIES合并方法融合的俄语语音识别模型，优化电话语音识别效果

Transformers 其他

Wav2vec2 Large Xls R 300m Ru

该模型是基于facebook/wav2vec2-xls-r-300m在common_voice_17_0数据集上微调的俄语自动语音识别(ASR)模型，词错误率(WER)为0.195。

Whisper Large V3 Turbo Russian

基于OpenAI Whisper Large V3 Turbo优化的俄语自动语音识别(ASR)模型，使用Mozilla Common Voice 17俄语数据集微调

Transformers 其他

Faster Whisper Large V3 Ru Podlodka Int8

这是基于OpenAI Whisper架构的俄语语音识别模型，专为俄语语音转文本任务优化，并转换为ctranslate2格式以提高推理效率。

语音识别其他

Faster Whisper Large V3 Russian

这是antony66/whisper-large-v3-russian模型的ctranslate2转换版本，针对俄语语音识别任务进行了优化。

Transformers 其他

Faster Whisper Large V3 Ru Podlodka

这是 bond005/whisper-large-v3-ru-podlodka 的 ctranslate2 转换版本，针对俄语语音识别任务进行了优化。

Transformers 其他

Whisper Large V3 Russian

基于OpenAI Whisper-large-v3微调的俄语语音识别模型，针对俄语识别性能进行了优化

Transformers 其他

Whisper Large V3 Ru Podlodka

这是一个基于Whisper Large V3的俄语语音识别模型，专门针对俄语语音进行了优化。

Transformers 其他

Whisper Tiny Ru

本模型是基于openai/whisper-tiny在Common Voice 14.0数据集上微调的俄语自动语音识别模型

Ru Whisper Small

基于openai/whisper-small微调的俄语语音识别模型，在Sberdevices_golos_10h_crowd数据集上训练

Transformers 其他

基于OpenAI Whisper-base模型在Common Voice 11.0俄语数据集上微调的语音识别模型

Transformers 其他

Stt Ru Fastconformer Hybrid Large Pc

这是一个用于俄语自动语音识别的FastConformer混合模型，结合了Transducer和CTC解码器，参数规模约1.15亿。

语音识别其他

Stt Ru Conformer Ctc Large

这是一个用于俄语自动语音识别的大型Conformer-CTC模型，在约1636小时的俄语语音数据上训练，具有约1.2亿参数。

语音识别其他

Stt Ru Conformer Transducer Large

这是一个基于Conformer架构的非自回归大型俄语语音识别模型，参数约1.2亿，训练数据约1636小时俄语语音。

语音识别其他

Wav2vec2 Large Ru Golos With Lm

这是一个基于facebook/wav2vec2-large-xlsr-53微调的俄语语音识别模型，使用Sberdevices Golos数据集训练，并集成了2-gram语言模型以提高识别准确率。

Transformers 其他

Wav2vec2 Large Ru Golos

基于facebook/wav2vec2-large-xlsr-53微调的俄语语音识别模型，使用Sberdevices Golos数据集训练，支持16kHz音频输入

Transformers 其他

Wav2vec2 Large Multilang Cv Ru

该模型是基于facebook/wav2vec2-large-xlsr-53在common_voice数据集上微调的版本，主要用于俄语语音识别任务。

Wav2vec2 Large Xls R 300m Russian Colab Beam Search Test

该模型是基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的俄语语音识别模型，在评估集上取得了0.468的词错误率。

Wav2vec2 Russian

基于wav2vec2架构的俄语语音识别模型，识别结果可通过配套文本纠错网络进行后处理

Wav2vec2 Large Xls R 300m Ru

这是一个基于Wav2Vec2 XLS-R架构的俄语自动语音识别模型，参数规模为300m，在公共语音和鲁棒语音事件数据集上进行了评估。

Transformers 其他

Wav2vec2 Large Xlsr 53 Russian

基于facebook/wav2vec2-large-xlsr-53模型微调的俄语语音识别模型，支持16kHz采样率的语音输入

语音识别其他

Wav2vec2 Xls R 1b Russian

基于XLS-R 1B架构微调的俄语语音识别模型，在Common Voice 8.0等数据集上训练

Transformers 其他

Wav2vec2 Large Xlsr 53 Russian

基于facebook/wav2vec2-large-xlsr-53模型微调的俄语自动语音识别(ASR)模型，在Common Voice俄语数据集上达到17.39%的词错误率(WER)。

语音识别其他

Wav2vec2 Xlsr 1b Ru

基于facebook/wav2vec2-xls-r-1b在Common Voice数据集上微调的俄语自动语音识别模型

Transformers 其他

Wav2vec2 Large 100k Voxpopuli Ft Common Voice Plus TTS Dataset Russian

这是一个基于Facebook的wav2vec2-large-100k-voxpopuli模型，使用Common Voice 7.0和M-AILABS俄语数据进行微调的语音识别模型。

Transformers 其他

Wav2vec2 Base Russian Big Kaggle

该模型是基于facebook/wav2vec2-base在俄语数据集上微调的语音识别模型

Wav2vec2 Large 100k Voxpopuli Ft Common Voice Plus TTS Dataset Plus Data Augmentation Russian

基于Facebook的Wav2vec2 Large 100k Voxpopuli模型，使用Common Voice 7.0、M-AILABS数据集及数据增强技术在俄语上进行微调的语音识别模型。

Transformers 其他

Wav2vec2 Base Russian Modified Kaggle

该模型是基于facebook/wav2vec2-base在未知数据集上微调的版本，适用于俄语语音处理任务。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24