高精度WER

# 高精度WER

Wav2vec2 Large Xlrs Korean V5

该模型是基于facebook/wav2vec2-xls-r-300m在zeroth_korean数据集上微调的韩语自动语音识别模型，词错误率为0.2433。

Wav2vec2 Large Xlsr 53 Icelandic Ep30 967h

专为冰岛语自动语音识别任务微调的声学模型，基于967小时冰岛语数据训练

Transformers 其他

language-and-voice-lab

Stt Ru Fastconformer Hybrid Large Pc

这是一个用于俄语自动语音识别的FastConformer混合模型，结合了Transducer和CTC解码器，参数规模约1.15亿。

语音识别其他

Stt De Fastconformer Hybrid Large Pc

这是一个基于FastConformer架构的德语自动语音识别模型，采用转换器和CTC混合训练方式，参数规模约115M。

语音识别德语

Wav2vec2 Large Xlsr 53 Spanish Ep5 944h

适用于西班牙语自动语音识别的声学模型，基于facebook/wav2vec2-large-xlsr-53微调5个周期，使用约944小时西班牙语数据。

Transformers 西班牙语

carlosdanielhernandezmena

Wav2vec2 Large Vi Vlsp2020

基于wav2vec2架构的越南语自动语音识别模型，预训练使用1.3万小时未标注YouTube音频，并在250小时标注数据上微调

Transformers 其他

Stt Ru Conformer Ctc Large

这是一个用于俄语自动语音识别的大型Conformer-CTC模型，在约1636小时的俄语语音数据上训练，具有约1.2亿参数。

语音识别其他

Stt Es Conformer Ctc Large

这是一个用于西班牙语自动语音识别(ASR)的大型Conformer-CTC模型，由NVIDIA训练并发布。

语音识别西班牙语

Stt Fr Conformer Transducer Large

这是一个用于法语自动语音识别的大规模康福默-转换器模型，参数约1.2亿，在超过1500小时的法语语音数据上训练而成。

语音识别法语

Wav2vec2 Large 960h Lv60 Self 4 Gram Fine Tune Real 29 Jun

该模型是基于facebook/wav2vec2-large-960h-lv60-self在uob_singlish数据集上微调的语音识别模型，支持新加坡英语识别。

Stt Fr Conformer Ctc Large

这是一个基于Conformer架构的法语自动语音识别(ASR)大模型，采用CTC损失函数，在超过1500小时的法语语音数据上训练而成。

语音识别法语

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53

该模型是基于facebook/wav2vec2-large-xlsr-53在GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2数据集上微调的自动语音识别模型

Wav2vec2 Large Multilang Cv Ru

该模型是基于facebook/wav2vec2-large-xlsr-53在common_voice数据集上微调的版本，主要用于俄语语音识别任务。

Assignment1 Maria

s2t-small-librispeech-asr 是一个用于自动语音识别（ASR）的语音到文本转换器（S2T）模型，基于序列到序列的转换器架构。

Transformers 英语

Classroom-workshop

Assignment1 Joane

一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型

Transformers 英语

Classroom-workshop

Assignment1 Jack

一个用于自动语音识别(ASR)的语音到文本转换器(S2T)模型，基于序列到序列转换器架构

Transformers 英语

Classroom-workshop

Assignment1 Jane

s2t-small-librispeech-asr 是一个用于自动语音识别（ASR）的语音到文本转换器（S2T）模型，基于序列到序列转换器架构。

Transformers 英语

Classroom-workshop

Assignment1 Omar

Wav2Vec2是一个基于自监督学习的语音识别模型，在LibriSpeech 960小时语音数据上预训练和微调，支持英语语音转录。

Transformers 英语

Classroom-workshop

Wav2vec2 Large Xls R 300m Singlish Colab

基于facebook/wav2vec2-xls-r-300m在新加坡英语(li_singlish)数据集上微调的语音识别模型

Ai Light Dance Singing Ft Wav2vec2 Large Lv60 V2

该模型是基于wav2vec2-large-lv60在ONSET-SINGING数据集上微调的自动语音识别模型，专注于歌唱语音识别任务。

Dansk Wav2vec21

该模型是基于Siyam/SKYLy在common_voice数据集上微调得到的丹麦语语音识别模型

English Filipino Wav2vec2 L Xls R Test 02

这是一个基于wav2vec2-large-xlsr-53-english模型在菲律宾语音数据集上微调的语音识别模型，支持英语和菲律宾语的语音转文本任务。

Wav2vec2 Common Voice Lithuanian

该模型是基于facebook/wav2vec2-large-xlsr-53在COMMON_VOICE - LT数据集上微调的版本，用于立陶宛语语音识别。

Transformers 其他

20220413 210552

该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的语音识别模型

Aradia Ctc Distilhubert Ft

基于distilhubert在阿拉伯语语音数据集上微调的自动语音识别(ASR)模型

Wav2vec2 Large Xls R 300m Irish Colab Test

这是一个基于facebook/wav2vec2-xls-r-300m模型在common_voice爱尔兰语数据集上微调的语音识别模型，主要用于爱尔兰语的自动语音识别任务。

Wav2vec2 Xls R 1b Portuguese CORAA 3

基于facebook/wav2vec2-xls-r-1b在CORAA数据集上微调的葡萄牙语自动语音识别模型

Transformers 其他

Wav2vec2 Speechdat

该模型是基于facebook/wav2vec2-large-xlsr-53在COMMON_VOICE - SV-SE数据集上微调的瑞典语自动语音识别模型。

Wav2vec2 Xlsr Basaa

该模型是基于facebook/wav2vec2-xls-r-1b在Common Voice 8巴萨语数据集上微调得到的自动语音识别模型。

Transformers 其他

Wav2vec2 Xlsr Czech

该模型是基于facebook/wav2vec2-xls-r-1b在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - cs数据集上微调得到的捷克语自动语音识别模型。

Transformers 其他

Wav2vec2 Xls R 1b Portuguese

这是一个基于XLS-R 1B架构的葡萄牙语自动语音识别模型，在多个葡萄牙语语音数据集上进行了微调。

Transformers 其他

S2t Small Librispeech Asr

一个用于自动语音识别（ASR）的语音到文本转换器（S2T）模型，基于序列到序列转换器架构

Transformers 英语

Wav2vec2 Large Xls R 300m Hindi Colab

该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的版本，用于印地语语音识别任务。

Wav2vec2 Xls R 1b Italian

这是一个基于XLS-R 1B架构的意大利语自动语音识别模型，在多个意大利语数据集上进行了微调

Transformers 其他

Wav2vec2 Xls R 1b Russian

基于XLS-R 1B架构微调的俄语语音识别模型，在Common Voice 8.0等数据集上训练

Transformers 其他

Wav2vec2 Large Xlsr 53 Ir

基于wav2vec2-large-xlsr-53微调的爱尔兰盖尔语自动语音识别模型，在Common Voice 7.0数据集上训练

Wav2vec2 Xls R Hindi

这是一个基于facebook/wav2vec2-xls-r-300m在印地语Common Voice 7.0数据集上微调的自动语音识别(ASR)模型

Transformers 其他

Wav2vec2 Large Xls R 300m Ur

基于wav2vec2-large-xls-r-300m架构的乌尔都语语音识别模型，在common_voice数据集上微调

Wav2vec2 Base Turkish Cv7

基于wav2vec2架构的土耳其语自动语音识别模型，在Common Voice 7.0土耳其语数据集上微调

Transformers 其他

Wav2vec2 Large Xls R 300m Irish Colab

基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的爱尔兰语语音识别模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24