Whisper Medium Vaani Telugu
MIT
基于OpenAI Whisper-small架构的泰卢固语自动语音识别模型,由ARTPARK-IISc团队针对印度语言优化
语音识别
其他
W
ARTPARK-IISc
26
1
Viwav2vec2 Base 3k
该模型是基于3千小时越南语语音数据预训练的Wav2Vec2基础模型,适用于越南语语音识别任务,需在下游任务上微调后使用。
语音识别
Transformers

其他
V
dragonSwing
41
2
Data2vec Audio Large 100h
Apache-2.0
Data2Vec是一个通用的自监督学习框架,适用于语音、自然语言处理和计算机视觉任务。
语音识别
Transformers

英语
D
facebook
46
2
Wav2vec2 Large Xlsr 53 Dhivehi V2
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型,使用普通语音的迪维希语数据进行了微调的自动语音识别模型。
语音识别
Transformers

其他
W
shahukareem
31
3
W2v Hf Commonvoice From Xlsr53 Pretrain 0329UTC1500
基于facebook/wav2vec2-large-xlsr-53在Common Voice日语数据集上微调的语音识别模型
语音识别
Transformers

W
qqpann
15
0
Wav2vec2 Large Xlsr 53 Vietnamese
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的越南语自动语音识别模型,支持16kHz采样率的语音输入。
语音识别
Transformers

其他
W
not-tanh
22
4
Wav2vec2 Large West Germanic Voxpopuli V2
Facebook的Wav2Vec2大型模型,仅在西日耳曼语系的VoxPopuli语料库66.3无标注数据上进行预训练。
语音识别
Transformers

W
facebook
25
1
Wav2vec2 Large El Voxpopuli V2
基于VoxPopuli语料库预训练的希腊语语音识别模型,使用17.7小时未标注数据
语音识别
Transformers

其他
W
facebook
24
0
Wav2vec2 Large Xlsr 53 Sakha
Apache-2.0
基于XLSR-53大模型微调的雅库特语语音识别模型,词错误率32.23%
语音识别
其他
W
anton-l
25
0
Wav2vec2 Large Xlsr 53 Spanish
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的西班牙语语音识别模型,在Common Voice 6.1西班牙语数据集上训练
语音识别
西班牙语
W
jonatasgrosman
46.28k
30
Wav2vec2 Large Xlsr 53 German
Apache-2.0
这是一个针对德语语音识别任务微调的XLSR-53大模型,基于Facebook的wav2vec2-large-xlsr-53模型,在Common Voice 6.1德语数据集上进行了微调。
语音识别
德语
W
jonatasgrosman
8,266
7
Wav2vec2 Large Xlsr 53 Breton
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在布列塔尼语上微调的语音识别模型
语音识别
其他
W
mrm8488
26
0
Wav2vec2 Base Da Voxpopuli V2
基于Facebook Wav2Vec2架构的语音模型,专门针对丹麦语进行预训练,使用VoxPopuli语料库的13.6k未标注数据。
语音识别
Transformers

其他
W
facebook
35
0
Wav2vec2 Large Xlsr 53 Mongolian
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在蒙古语通用语音数据集上微调的自动语音识别模型
语音识别
Transformers

其他
W
tugstugi
251
0
Wav2vec2 Large Xlsr Georgian
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的格鲁吉亚语自动语音识别模型,支持16kHz采样率语音输入
语音识别
Transformers

其他
W
xsway
14.80k
1
Sew D Tiny 100k
Apache-2.0
SEW-D是由ASAPP Research开发的压缩高效型语音预训练模型,基于16kHz采样的语音音频进行预训练,适用于多种下游语音任务。
语音识别
Transformers

英语
S
asapp
1,074
2
Sew Tiny 100k
Apache-2.0
SEW-tiny是由ASAPP Research开发的压缩高效型语音预训练模型,基于16kHz采样的语音音频进行预训练,适用于多种下游语音任务。
语音识别
Transformers

支持多种语言
S
asapp
1,080
3
Wav2vec2 Large Xlsr Hindi Marathi
Apache-2.0
基于Facebook的wav2vec2-large-xlsr-53模型微调,支持印地语和马拉地语的自动语音识别任务
语音识别
Transformers

其他
W
tanmaylaud
76
0
Hubert Large Superb Ks
Apache-2.0
基于Hubert-Large架构的关键词检测模型,在SUPERB基准测试中表现优异
语音识别
Transformers

英语
H
superb
78
0
Wav2vec2 Xlsr Multilingual 53 Fa
基于wav2vec 2.0架构的多语言语音识别模型,专门针对波斯语进行微调,显著降低词错误率
语音识别
Transformers

W
masoudmzb
83
7
Unispeech 1350 En 17h Ky Ft 1h
基于微软UniSpeech架构的语音识别模型,专门针对吉尔吉斯语进行微调
语音识别
Transformers

其他
U
microsoft
39
1
Wav2vec2 Large Fr Voxpopuli French
Apache-2.0
基于facebook/wav2vec2-large-fr-voxpopuli微调的法语语音识别模型,在Common Voice 6.1法语数据集上训练,支持16kHz音频输入
语音识别
法语
W
jonatasgrosman
51
3
Wav2vec2 Base Hr Voxpopuli V2
基于Facebook Wav2Vec2架构的语音模型,使用克罗地亚语VoxPopuli语料库预训练
语音识别
Transformers

其他
W
facebook
30
1
Wav2vec2 Large Xlrs Estonian
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53模型在爱沙尼亚语通用语音数据集上微调的自动语音识别(ASR)模型。
语音识别
其他
W
birgermoell
18
0
Wav2vec2 Large Xlsr Bengali
基于facebook/wav2vec2-large-xlsr-53模型微调的孟加拉语自动语音识别模型,使用OpenSLR数据集训练。
语音识别
Transformers

W
tanmoyio
24.32k
3
Sew D Base Plus 400k Ft Ls100h
Apache-2.0
SEW-D-base+ 是由 ASAPP Research 开发的高效语音识别模型,基于 16kHz 采样的语音音频进行预训练,在 LibriSpeech 数据集上表现出色。
语音识别
Transformers

英语
S
asapp
66
4
Wav2vec2 Xlsr 53 Tamil
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的泰米尔语语音识别模型,在Common Voice泰米尔语数据集上训练。
语音识别
其他
W
anuragshas
64
0
Wav2vec2 Large Xlsr 53 Estonian
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型,使用通用语音数据集对爱沙尼亚语进行微调的自动语音识别模型
语音识别
Transformers

其他
W
vasilis
26
0
Wav2vec2 Large Xlsr 53 Chuvash
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的楚瓦什语自动语音识别模型,在通用语音数据集上训练,词错误率为40.01%。
语音识别
其他
W
anton-l
30
0
Wav2vec2 Large Superb Ks
Apache-2.0
基于Wav2Vec2-Large-LV60预训练模型,在SUPERB关键词检测任务上微调的语音分类模型
语音识别
Transformers

英语
W
superb
18
1
Viwav2vec2 Base 100h
Apache-2.0
基于VLSP数据集中100小时未标注越南语语音音频预训练的Wav2Vec2基础模型,需在下游任务上微调使用。
语音识别
Transformers

其他
V
dragonSwing
19
0
Wav2vec2 Large Xlsr 53 Hungarian
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53模型微调的匈牙利语自动语音识别模型,使用通用语音数据集训练。
语音识别
其他
W
anton-l
17
0
Wav2vec2 Base Vn 270h
基于约270小时越南语标注数据微调的语音识别模型,支持越南语自动语音识别任务
语音识别
其他
W
dragonSwing
202
8
Wav2vec2 Large 960h Lv60
Apache-2.0
Wav2Vec2是一个强大的语音识别模型,通过自监督学习从原始音频中提取特征,并在有限标记数据下实现高性能语音识别。
语音识别
英语
W
facebook
7,011
6
Wav2vec2 Large Xlsr 53 Estonian
Apache-2.0
基于Facebook的XLSR-53大模型微调的爱沙尼亚语语音识别模型,在通用语音数据集上达到30.74%词错误率
语音识别
其他
W
anton-l
3,259
0
Wav2vec2 Large Xlsr Vietnamese
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的越南语自动语音识别模型
语音识别
其他
W
Nhut
22
0
Wav2vec2 Large Xlsr 53 Lithuanian
Apache-2.0
基于Facebook的XLSR-53大模型微调的立陶宛语语音识别模型,在Common Voice数据集上训练,测试WER为56.55%。
语音识别
其他
W
DeividasM
4,105
1
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文