低资源语音处理

# 低资源语音处理

Whisper Small Ta

该模型是基于OpenAI的Whisper Small在泰米尔语Common Voice 17.0数据集上微调的语音识别模型，词错误率(WER)为43.23%。

Transformers 其他

Whisper Fa Tinyyy

基于OpenAI Whisper-tiny微调的波斯语自动语音识别模型，在common_voice_11_0数据集上训练

Transformers 其他

Mms 300m Arabic Dialect Identifier

该模型是基于MMS-300m微调的阿拉伯语方言语音识别模型，能够识别现代标准阿拉伯语及四种主要阿拉伯方言。

Transformers 阿拉伯语

Xls R Greek Cretan

首个针对克里特方言的自动语音识别(ASR)模型，基于希腊语XLS-R模型微调训练。

Arabic Alphabet Speech Classification

这是一个用于阿拉伯字母语音分类的transformers模型，能够识别和分类阿拉伯语字母的发音。

Whisper Large V3 Taiwanese Hakka

基于Whisper-large-v3微调的台湾客家话语音识别模型，支持多种客家话方言

Transformers 其他

Wav2vec2 Large Xls R 300m Albanian Colab

该模型是基于facebook/wav2vec2-xls-r-300m在common_voice_albanian数据集上微调的语音处理模型，适用于阿尔巴尼亚语相关任务。

Viet Tones Model

基于wav2vec2-base-vietnamese-250h微调的越南语声调识别模型，准确率59.72%

Vegam Whisper Medium Ml

这是将thennal/whisper-medium-ml转换为CTranslate2模型格式的版本，用于马拉雅拉姆语语音识别

语音识别其他

Exp W2v2t Th Hubert S533

基于facebook/hubert-large-ll60k微调的泰语语音识别模型，训练数据来自Common Voice 7.0

Transformers 其他

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V3

基于wav2vec2-large-xlsr-53的自动语音识别模型，在GARY109/AI_LIGHT_DANCE数据集上微调

Asr Wav2vec2 Dvoice Amharic

这是一个针对阿姆哈拉语的自动语音识别模型，使用wav2vec 2.0架构和CTC/Attention机制训练

语音识别其他

Wav2vec2 Xls R 300m Mrbrown Finetune1

基于facebook/wav2vec2-xls-r-300m预训练模型，使用uob_singlish数据集进行微调的语音识别模型

Malaya Speech Mrbrown Finetune1

该模型是基于uob_singlish数据集对wav2vec2-xls-r-300m-mixed进行微调的版本，专注于新加坡英语语音识别。

One Simple Finetune Test

该模型是基于li_singlish数据集对RuiqianLi/wav2vec2-large-xls-r-300m-singlish-colab进行微调的版本，主要用于新加坡英语语音识别任务。

该模型是基于facebook/wav2vec2-large-xlsr-53在未知数据集上微调得到的语音识别模型，支持阿拉伯语方言(Arabizi)的识别。

Speech Processing Project Wav2vec2

该模型是基于kingabzpro/wav2vec2-urdu微调的语音处理模型，适用于特定语音识别任务。

Filipino Wav2vec2 L Xls R 300m Test

该模型是基于facebook/wav2vec2-xls-r-300m在filipino_voice数据集上微调的语音识别模型，支持菲律宾语。

Wav2vec2 Large 100h Lv60 Self

Wav2Vec2-Large-100h-Lv60是基于100小时Libri-Light和Librispeech语音数据预训练和微调的大模型，采用自训练目标训练，适用于16kHz采样率的语音识别任务。

Transformers 英语

Wav2vec2 Common Voice Tr Demo

该模型是基于facebook/wav2vec2-large-xlsr-53在土耳其语Common Voice数据集上微调的语音识别模型

Transformers 其他

Wav2vec2 Base 10k 8khz Pt Cv7 2

该模型是基于wav2vec2架构的葡萄牙语自动语音识别模型，在Common Voice 7数据集上微调，支持8kHz采样率音频输入。

Transformers 其他

Wav2vec2 Base 10k Voxpopuli Ft Cs

基于Facebook Wav2Vec2架构的语音识别模型，使用VoxPopuli语料库的10K未标记捷克语数据进行预训练，并在捷克语转录数据上微调。

Transformers 其他

Xlrs 53 Finnish

XLSR-Wav2Vec2是一个多语言语音识别模型，通过跨语言预训练学习共享语音表征，支持53种语言。

语音识别其他

Fb Youtube Vi Large

该模型是基于facebook/wav2vec2-large-xlsr-53在越南语YouTube非正式音频数据集上微调的自动语音识别模型。

Sew D Small 100k Ft Timit

基于asapp/sew-d-small-100k在TIMIT_ASR数据集上微调的自动语音识别模型

patrickvonplaten

该模型是在Common Voice 7.0 AB数据集上微调的自动语音识别模型，基于XLS-R dummy架构

Transformers 其他

Wav2vec2 Large Xlsr Arabic Demo Colab

基于facebook/wav2vec2-large-xlsr-53模型在通用语音数据集上微调的阿拉伯语语音识别模型

Wav2vec2 Large Xlsr Finnish

这是一个基于facebook/wav2vec2-large-xlsr-53在芬兰语上微调的自动语音识别模型，使用通用语音数据集进行训练。

语音识别其他

W2v Timit Ft 4001

基于Wav2Vec 2.0架构的语音识别模型，在TIMIT数据集上微调，适用于英语语音转文本任务

Wav2vec2 Base Timit Demo Colab

基于anas/wav2vec2-large-xlsr-arabic在common_voice数据集上微调的语音识别模型

Arabic Speech Recognition

基于facebook/wav2vec2-large-xlsr-53模型微调的阿拉伯语自动语音识别模型，支持16kHz采样率语音输入

语音识别阿拉伯语

Wav2vec2 Large Xlsr Turkish Demo Colab

该模型是基于facebook/wav2vec2-large-xlsr-53在通用语音数据集上微调的土耳其语语音识别模型

patrickvonplaten

Wav2vec2 Large Xlsr 53 Ir

基于wav2vec2-large-xlsr-53微调的爱尔兰盖尔语自动语音识别模型，在Common Voice 7.0数据集上训练

Wav2vec2 Large Xlsr 53 Turkish

这是一个基于Facebook的wav2vec2-large-xlsr-53模型在土耳其语Common Voice数据集上微调的自动语音识别(ASR)模型。

语音识别其他

Wav2vec2 Large Xls Ar

基于facebook/wav2vec2-large-xlsr-53模型微调的阿拉伯语自动语音识别模型，在Common Voice阿拉伯语数据集上测试WER为52%。

Transformers 阿拉伯语

Unispeech 1350 En 168 Es Ft 1h

UniSpeech是一个统一语音表征学习模型，结合标注与无标注数据进行预训练，特别针对西班牙语音素识别进行了微调。

Transformers 西班牙语

Wav2vec2 Large Xls R 300m My Hindi Home Colab

该模型是基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的版本，适用于语音识别任务。

DistilHuBERT是一种通过层级蒸馏HuBERT模型实现的轻量级语音表征学习模型，在保持性能的同时显著减小模型体积和计算成本。

Transformers 英语

Wav2vec2 Large Xlsr Tamil Commonvoice

该模型是基于facebook/wav2vec2-large-xlsr-53在common_voice泰米尔语数据集上微调的语音识别模型

Wav2vec2 Base 10k Voxpopuli Ft Sk

基于VoxPopuli语料库10K未标注数据预训练，并在斯洛伐克语转录数据上微调的语音识别模型

Transformers 其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24