低资源语音识别

# 低资源语音识别

Whisper Akan Finetuned

基于Whisper架构的自动语音识别模型，针对特定语言或方言进行了微调

KinyaWhisper是基于OpenAI Whisper模型微调的卢旺达语自动语音识别(ASR)系统，专为低资源土著语言设计。

Transformers 其他

Wav2vec2 Large Mms 1b Wolof

该模型是基于facebook/mms-1b-all在Isma/alffa_wolof数据集上微调的版本，专为沃洛夫语自动语音识别（ASR）任务设计。

Safetensors 其他

Xlsr 53 Bemba 5hrs

基于facebook/wav2vec2-large-xlsr-53微调的语音识别模型，支持Bemba语

Wav2vec2 Large 10min Lv60 Self

该模型是基于Wav2Vec2架构的大规模语音识别模型，在Libri-Light和Librispeech的10分钟数据上进行了预训练和微调，使用自训练目标进行训练，适用于16kHz采样率的语音音频。

Transformers 英语

Wav2vec2 Large Xlsr Rm Sursilv

这是一个基于facebook/wav2vec2-large-xlsr-53模型微调的自动语音识别模型，专门用于识别罗曼什语的苏塞尔瓦方言。

Wav2vec2 Xls R 300m Bas CV8 V2

基于facebook/wav2vec2-xls-r-300m在Common Voice 8数据集上微调的自动语音识别模型，支持巴斯克语(bas)。

Transformers 其他

基于facebook/wav2vec2-large-xlsr-53微调的埃及阿拉伯语自动语音识别模型，使用arabicspeech.org MGB-3数据集训练。

Transformers 阿拉伯语

Unispeech 1350 En 90 It Ft 1h

UniSpeech是一个统一的语音表征学习模型，结合了监督式音素CTC学习和自监督学习，特别针对意大利语进行了微调。

Transformers 其他

Wav2vec2 Large Xlsr 53 Rm Vallader

基于facebook/wav2vec2-large-xlsr-53模型微调的罗曼什语瓦拉迪尔方言语音识别模型，词错误率32.89%

基于facebook/wav2vec2-xls-r-300m在泰米尔语数据集上微调的自动语音识别模型

Transformers 其他

Wav2vec2 Base 100h

Wav2Vec2基础版是在16kHz采样的Librispeech语音音频上进行了100小时预训练和微调的自动语音识别模型。

Transformers 英语

Asr Hubert Cluster Bart Base

基于Hubert和BART架构的自动语音识别模型，通过聚类特征转换实现语音到文本的转换

Transformers 支持多种语言

Wav2vec2 Xls R 1b Hi Cv8

这是一个基于facebook/wav2vec2-xls-r-1b模型在Common Voice 8.0印地语数据集上微调的自动语音识别模型，支持印地语语音转文本任务。

Transformers 其他

Wav2vec2 Large Xlsr Egyptian

基于facebook/wav2vec2-large-xlsr-53模型微调的埃及阿拉伯语自动语音识别模型，支持16kHz采样率的语音输入。

Transformers 其他

Xlsr Large 53 Ur

该模型是基于facebook/wav2vec2-large-xlsr-53在Common Voice 8.0乌尔都语数据集上微调的自动语音识别模型

Transformers 其他

HarrisDePerceptron

Wav2vec2 Xls R 60 Urdu

该模型是基于facebook/wav2vec2-large-xlsr-53在Common Voice乌尔都语数据集上微调的自动语音识别模型

Transformers 其他

基于Facebook的wav2vec2-xls-r-1b模型微调的乌尔都语自动语音识别(ASR)模型，在Common Voice 8.0乌尔都语数据集上训练

Transformers 其他

HarrisDePerceptron

Xls R 300m Ur Cv7

该模型是基于facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_7_0 - UR数据集上微调的乌尔都语自动语音识别(ASR)模型

Transformers 其他

HarrisDePerceptron

这是一个基于XLS-R架构在Common Voice 8.0乌尔都语数据集上微调的自动语音识别模型，词错误率(WER)为47.38。

Transformers 其他

HarrisDePerceptron

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24