多场景语音转写

# 多场景语音转写

Whisper Fa Tinyyy

基于OpenAI Whisper-tiny微调的波斯语自动语音识别模型，在common_voice_11_0数据集上训练

Transformers 其他

Whisper Large V3 Turbo Es

基于Whisper-large-v3-turbo微调的西班牙语语音识别模型，在Common Voice 17.0西班牙语数据集上词错误率降低至5.34%

Transformers 西班牙语

Whisper Large V3 Turkish Test1

基于OpenAI Whisper-large-v3模型在Common Voice 17.0土耳其语数据集上微调的语音识别模型

Transformers 其他

Whisper Small Sinhala Fine Tune

基于OpenAI Whisper-small模型在僧伽罗语上进行微调的语音识别模型

Whisper Medium Et

基于约800小时多样化爱沙尼亚语数据微调的Whisper-medium模型，适用于通用语音识别场景

Whisper Medium Turkish 2

基于OpenAI Whisper Medium微调的土耳其语语音识别模型，在Common Voice 11.0数据集上训练

Transformers 其他

Whisper Large V2 Serbian

这是基于OpenAI Whisper Large-V2模型在塞尔维亚语Common Voice 11.0数据集上微调的语音识别模型，词错误率为10.76%。

Transformers 其他

Exp W2v2t Fa Hubert S801

基于facebook/hubert-large-ll60k模型微调的波斯语自动语音识别模型，使用Common Voice 7.0波斯语数据集训练。

Transformers 其他

Exp W2v2t Sv Se Vp Nl S842

这是一个基于facebook/wav2vec2-large-nl-voxpopuli模型微调的瑞典语自动语音识别模型，使用Common Voice 7.0 (sv-SE)数据集进行训练。

Wav2vec2 Large Xls R 300m Pt Colab

该模型是基于facebook/wav2vec2-xls-r-300m在common_voice_9_0数据集上微调的语音识别模型，支持葡萄牙语语音转文本任务。

Wav2vec2 Large Xls R 300m Turkish Colab

该模型是基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的土耳其语语音识别模型

基于facebook/wav2vec2-xls-r-300m的乌克兰语自动语音识别模型，在Common Voice 10.0数据集上训练

Transformers 其他

Wav2vec2 Large Xls R 300m Turkish Colab

该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的土耳其语语音识别模型

Wav2vec2 Large Xls R 300m Russian Colab Beam Search Test

该模型是基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的俄语语音识别模型，在评估集上取得了0.468的词错误率。

Wav2vec2 Base Turkish Cv8

这是一个基于Common Voice 8.0土耳其语数据集微调的自动语音识别(ASR)模型，能够将土耳其语语音转换为文本。

Transformers 其他

Wav2vec2 Large Xlsr Greek 1

基于facebook/wav2vec2-large-xlsr-53在希腊语上微调的语音识别模型，支持16kHz采样率的语音输入。

Transformers 其他

Wav2vec2 Xlsr Georgian

该模型是基于facebook/wav2vec2-xls-r-1b在格鲁吉亚语数据集上微调的自动语音识别模型

Transformers 其他

Wav2vec2 Large Nl Voxpopuli

基于VoxPopuli语料库荷兰语子集预训练的自动语音识别模型

语音识别其他

Wav2vec2 Base Sv Voxpopuli

基于VoxPopuli语料库瑞典语子集预训练的Wav2Vec2基础模型，适用于瑞典语语音识别任务。

Transformers 其他

Wav2vec2 Large Xls R 300m Spanish Custom

这是一个基于facebook/wav2vec2-xls-r-300m模型在common_voice西班牙语数据集上微调的语音识别模型，在评估集上取得了21.17%的词错误率。

Wav2vec2 Common Voice Tr Demo

该模型是基于facebook/wav2vec2-large-xlsr-53在COMMON_VOICE SV-SE数据集上微调的自动语音识别(ASR)模型，支持瑞典语语音识别。

Wav2vec2 Large Xls R 300m Ur

基于wav2vec2-large-xls-r-300m架构的乌尔都语语音识别模型，在common_voice数据集上微调

Wav2vec2 Xlsr Estonian

这是一个基于facebook/wav2vec2-xls-r-1b模型在爱沙尼亚语数据集上微调的自动语音识别模型。

Transformers 其他

Wav2vec2 Large Xlsr 53 Dutch

Facebook开发的基于Wav2Vec 2.0架构的荷兰语自动语音识别(ASR)模型，采用XLSR-53多语言预训练模型微调

语音识别其他

Wav2vec2 Base It Voxpopuli

基于VoxPopuli意大利语无标注数据预训练的Wav2Vec2基础模型，适用于语音识别任务。

Transformers 其他

Wav2vec2 Large Xls R 300m Urdu

基于facebook/wav2vec2-xls-r-300m在Common Voice 8乌尔都语数据集上微调的语音识别模型

Transformers 其他

基于通用语音波斯语数据微调的XLS-R-300m语音识别模型

Transformers 其他

Wav2vec2 Large Xls R 300m Turkish Colab

基于facebook/wav2vec2-xls-r-300m在common_voice土耳其语数据集上微调的语音识别模型

Wav2vec2 Xls R 300m Uk

这是一个基于facebook/wav2vec2-xls-r-300m模型在乌克兰语数据集上微调的自动语音识别(ASR)模型，在Common Voice乌克兰语测试集上取得了12.22%的词错误率(WER)。

Transformers 其他

Wav2vec2 Large Xls R 300m Basque

基于facebook/wav2vec2-xls-r-300m在巴斯克语Common Voice数据集上微调的自动语音识别模型

Transformers 其他

Wav2vec2 Large Xls R 300m Bulgarian

基于facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_7_0 - BG数据集上微调的保加利亚语语音识别模型

Transformers 其他

Wav2vec2 Large Xlsr 53 Portuguese

Facebook开发的基于Wav2Vec 2.0架构的大规模葡萄牙语自动语音识别(ASR)模型，支持葡萄牙语语音转文本任务。

语音识别其他

Wav2vec2 Large Xls R 300m Latvian

这是一个基于facebook/wav2vec2-xls-r-300m在拉脱维亚语数据集上微调的自动语音识别模型，在Common Voice 7测试集上取得了16.98%的WER。

Transformers 其他

该模型是基于KBLab/wav2vec2-large-voxrex在NBAILAB/NPSC - 48K_MP3数据集上微调的自动语音识别模型

Wav2vec2 Common Voice Nl Demo

这是一个基于facebook/wav2vec2-large-xlsr-53模型在荷兰语COMMON_VOICE数据集上微调的自动语音识别(ASR)模型。

Transformers 其他

Wav2vec2 Large Xls R 300m Sl With LM V2

这是一个基于facebook/wav2vec2-xls-r-300m在斯洛文尼亚语(common_voice_8_0)数据集上微调的自动语音识别(ASR)模型，支持语言模型(LM)增强。

Transformers 其他

Wav2vec2 Large Xlsr 53 Frisian

这是一个基于wav2vec2-large-xlsr-53模型微调的弗里斯兰语自动语音识别(ASR)模型，由RuudVelo开发。

Wav2vec2 Large Xls R 300m Bg V1

这是一个基于facebook/wav2vec2-xls-r-300m模型在保加利亚语语音数据集上微调的自动语音识别(ASR)模型。

Transformers 其他

Wav2vec2 Xls R 300m Cv8 Turkish

这是一个基于Facebook的wav2vec2-xls-r-300m模型在土耳其语Common Voice 8数据集上微调的自动语音识别(ASR)模型。

Transformers 其他

Wav2vec2 Large Xls R 300m Hsb V1

这是一个基于facebook/wav2vec2-xls-r-300m在上索布语(HSB)数据集上微调的自动语音识别模型，在Common Voice 8测试集上取得了0.4393的词错误率(WER)。

Transformers 其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24