通用语音数据集

# 通用语音数据集

Wav2vec2 Base Cv 10000

基于wav2vec2-base-cv在通用语音数据集上微调的语音识别模型，在评估集上取得了36.84%的词错误率。

Wav2vec2 Large Xlsr Portuguese

基于Facebook的wav2vec2-large-xlsr-53架构微调的葡萄牙语自动语音识别模型，在通用语音数据集上训练，词错误率13.77%。

语音识别其他

Wav2vec2 Xls R 300m Hy AM CV8 V1

基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的语音识别模型

Wav2vec2 Xls R 300m Zh CN

该模型是基于facebook/wav2vec2-xls-r-300m在通用语音数据集ZH-CN上微调的自动语音识别(ASR)模型，支持中文普通话识别。

Transformers 其他

Wav2vec2 Large Xlsr Mongolian

基于facebook/wav2vec2-large-xlsr-53在通用语音数据集上对蒙古语进行微调的自动语音识别模型

Transformers 其他

Wav2vec2 Large Xlsr 53 Hsb

基于facebook/wav2vec2-large-xlsr-53模型微调的上索布语语音识别模型，支持16kHz音频输入

语音识别其他

Wav2vec Tr Lite AG

这是一个基于XLSR Wav2Vec2架构的土耳其语自动语音识别模型，在通用语音土耳其语数据集上训练

语音识别其他

Wav2vec2 Xls R 300m Es

该模型是基于facebook/wav2vec2-xls-r-300m在COMMON_VOICE - ES数据集上微调的西班牙语自动语音识别模型。

Transformers 西班牙语

Wav2vec2 Large Xls R 300m Spanish Small

这是一个基于wav2vec2架构的西班牙语语音识别模型，在通用语音数据集上进行了微调，词错误率(WER)为0.2105。

Wav2vec2 Large Xlsr Frisian

这是一个基于facebook/wav2vec2-large-xlsr-53模型在弗里斯兰语上进行微调的自动语音识别模型，使用通用语音数据集训练。

Wav2vec2 Large Xls R 300m Spanish Small

基于wav2vec2-large-xls-r-300m架构的西班牙语语音识别模型，在通用语音数据集上微调，词错误率(WER)为0.1791

Wav2vec2 Large Xlsr Finnish

这是一个基于facebook/wav2vec2-large-xlsr-53在芬兰语上微调的自动语音识别模型，使用通用语音数据集进行训练。

语音识别其他

Wav2vec2 Large Xlsr 53 Vietnamese

基于facebook/wav2vec2-large-xlsr-53模型微调的越南语自动语音识别模型，使用通用语音数据集训练。

语音识别其他

Wav2vec2 Large Xlsr Luganda

基于facebook/wav2vec2-large-xlsr-53模型微调的卢干达语语音识别模型，在通用语音数据集上训练，词错误率29.52%

语音识别其他

Wav2vec2 10july

这是一个基于XLSR Wav2Vec2架构的德语自动语音识别模型，在通用语音德语数据集上进行了微调。

Transformers 德语

Xlsr Wav2vec English

基于facebook/wav2vec2-large在通用语音数据集上进行英语微调的自动语音识别模型，支持16kHz采样率的语音输入。

Transformers 英语

基于COMMON_VOICE - FA数据集微调的波斯语自动语音识别模型

Transformers 其他

Wav2vec2 Large Xlrs Estonian

这是一个基于facebook/wav2vec2-large-xlsr-53模型在爱沙尼亚语通用语音数据集上微调的自动语音识别(ASR)模型。

语音识别其他

Wav2vec2 Large Xlsr Swedish

这是一个基于XLSR-53架构的瑞典语自动语音识别模型，在通用语音数据集上进行微调。

语音识别其他

Wav2vec2 Cv Coral 30ep

基于Facebook的wav2vec2-large-xlsr-53模型微调的葡萄牙语语音识别模型，在通用语音数据集上训练

语音识别其他

Wav2vec2 Large Xlsr 53 Sah CV8

基于facebook/wav2vec2-large-xlsr-53在通用语音雅库特语数据集上微调的语音识别模型

Transformers 其他

Wav2vec2 Large Xlsr Punjabi

这是一个基于facebook/wav2vec2-large-xlsr-53模型在旁遮普语语音数据上微调的自动语音识别(ASR)模型。

Wav2vec2 Base Checkpoint 14

基于wav2vec2架构的语音识别模型，在通用语音数据集上微调

Wav2vec2 Xlsr Multilingual 56

这是一个支持56种语言的多语言自动语音识别(ASR)模型，基于facebook/wav2vec2-large-xlsr-53在通用语音数据集上微调而成。

Transformers 支持多种语言

Wav2vec2 Xls R 300m Urdu

Facebook的3亿参数语音识别模型，针对乌尔都语进行微调，基于通用语音8.0乌尔都语数据集训练

Wav2vec2 Large Xlsr Mongolian

基于facebook/wav2vec2-large-xlsr-53在蒙古语通用语音数据集上微调的自动语音识别模型

语音识别其他

Base Spanish Asr

基于通用语音数据集训练的西班牙语语音识别模型，采用wav2vec2架构

Wav2vec2 Large Xlsr 53 Chuvash

基于facebook/wav2vec2-large-xlsr-53模型微调的楚瓦什语自动语音识别模型，在通用语音数据集上训练，词错误率为40.01%。

语音识别其他

Wav2vec2 Large Xlsr Kinyarwanda Apostrophied

基于facebook/wav2vec2-large-xlsr-53在卢旺达语上的微调模型，支持预测标记代词与元音开头单词缩写的撇号

语音识别其他

Wav2vec2 Large Xlsr Hu

这是一个基于facebook/wav2vec2-large-xlsr-53模型微调的匈牙利语自动语音识别(ASR)模型，使用通用语音数据集训练。

语音识别其他

Wav2vec2 Xlsr Punjabi

基于facebook/wav2vec2-large-xlsr-53模型，使用通用语音数据集对旁遮普语进行微调的自动语音识别模型

Wav2vec2 Large Xls R 300m Greek

基于通用语音数据集训练的希腊语语音识别模型，采用wav2vec2架构

Wav2vec2 Large Xls R 300m Turkish Colab

基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的土耳其语语音识别模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24