Whisper Small Ta
Apache-2.0
该模型是基于OpenAI的Whisper Small在泰米尔语Common Voice 17.0数据集上微调的语音识别模型,词错误率(WER)为43.23%。
语音识别
Transformers

其他
W
navin-kumar-j
38
1
Whisper Fa Tinyyy
MIT
基于OpenAI Whisper-tiny微调的波斯语自动语音识别模型,在common_voice_11_0数据集上训练
语音识别
Transformers

其他
W
hackergeek98
55
2
Mms 300m Arabic Dialect Identifier
该模型是基于MMS-300m微调的阿拉伯语方言语音识别模型,能够识别现代标准阿拉伯语及四种主要阿拉伯方言。
音频分类
Transformers

阿拉伯语
M
badrex
73
2
Xls R Greek Cretan
首个针对克里特方言的自动语音识别(ASR)模型,基于希腊语XLS-R模型微调训练。
语音识别
Transformers

X
ilsp
17
1
Arabic Alphabet Speech Classification
这是一个用于阿拉伯字母语音分类的transformers模型,能够识别和分类阿拉伯语字母的发音。
音频分类
Transformers

A
HamzaSidhu786
60
1
Whisper Large V3 Taiwanese Hakka
基于Whisper-large-v3微调的台湾客家话语音识别模型,支持多种客家话方言
语音识别
Transformers

其他
W
formospeech
41
5
Viet Tones Model
基于wav2vec2-base-vietnamese-250h微调的越南语声调识别模型,准确率59.72%
语音识别
Transformers

V
StevenLe456
22
0
Vegam Whisper Medium Ml
MIT
这是将thennal/whisper-medium-ml转换为CTranslate2模型格式的版本,用于马拉雅拉姆语语音识别
语音识别
其他
V
smcproject
83
5
Exp W2v2t Th Hubert S533
Apache-2.0
基于facebook/hubert-large-ll60k微调的泰语语音识别模型,训练数据来自Common Voice 7.0
语音识别
Transformers

其他
E
jonatasgrosman
19
0
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V3
Apache-2.0
基于wav2vec2-large-xlsr-53的自动语音识别模型,在GARY109/AI_LIGHT_DANCE数据集上微调
语音识别
Transformers

A
gary109
191
0
Asr Wav2vec2 Dvoice Amharic
Apache-2.0
这是一个针对阿姆哈拉语的自动语音识别模型,使用wav2vec 2.0架构和CTC/Attention机制训练
语音识别
其他
A
speechbrain
96
9
Wav2vec2 Xls R 300m Mrbrown Finetune1
Apache-2.0
基于facebook/wav2vec2-xls-r-300m预训练模型,使用uob_singlish数据集进行微调的语音识别模型
语音识别
Transformers

W
RuiqianLi
18
0
Malaya Speech Mrbrown Finetune1
该模型是基于uob_singlish数据集对wav2vec2-xls-r-300m-mixed进行微调的版本,专注于新加坡英语语音识别。
语音识别
Transformers

M
RuiqianLi
24
0
One Simple Finetune Test
Apache-2.0
该模型是基于li_singlish数据集对RuiqianLi/wav2vec2-large-xls-r-300m-singlish-colab进行微调的版本,主要用于新加坡英语语音识别任务。
语音识别
Transformers

O
RuiqianLi
28
0
FYP ARABIZI
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在未知数据集上微调得到的语音识别模型,支持阿拉伯语方言(Arabizi)的识别。
语音识别
Transformers

F
ali-issa
33
1
Speech Processing Project Wav2vec2
Apache-2.0
该模型是基于kingabzpro/wav2vec2-urdu微调的语音处理模型,适用于特定语音识别任务。
语音识别
Transformers

S
Raffay
21
0
Filipino Wav2vec2 L Xls R 300m Test
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在filipino_voice数据集上微调的语音识别模型,支持菲律宾语。
语音识别
Transformers

F
Khalsuu
5,738
0
Wav2vec2 Large 100h Lv60 Self
Apache-2.0
Wav2Vec2-Large-100h-Lv60是基于100小时Libri-Light和Librispeech语音数据预训练和微调的大模型,采用自训练目标训练,适用于16kHz采样率的语音识别任务。
语音识别
Transformers

英语
W
Splend1dchan
17
0
Wav2vec2 Common Voice Tr Demo
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在土耳其语Common Voice数据集上微调的语音识别模型
语音识别
Transformers

其他
W
YiTian
30
0
Xlrs 53 Finnish
Apache-2.0
XLSR-Wav2Vec2是一个多语言语音识别模型,通过跨语言预训练学习共享语音表征,支持53种语言。
语音识别
其他
X
vneralla
32
0
Fb Youtube Vi Large
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在越南语YouTube非正式音频数据集上微调的自动语音识别模型。
语音识别
Transformers

F
phongdtd
31
1
Sew D Small 100k Ft Timit
Apache-2.0
基于asapp/sew-d-small-100k在TIMIT_ASR数据集上微调的自动语音识别模型
语音识别
Transformers

S
patrickvonplaten
18
0
Wav2vec2 Base 10k 8khz Pt Cv7 2
Apache-2.0
该模型是基于wav2vec2架构的葡萄牙语自动语音识别模型,在Common Voice 7数据集上微调,支持8kHz采样率音频输入。
语音识别
Transformers

其他
W
lgris
24
2
Xls R Ab Test
该模型是在Common Voice 7.0 AB数据集上微调的自动语音识别模型,基于XLS-R dummy架构
语音识别
Transformers

其他
X
cahya
20
0
Wav2vec2 Large Xlsr Arabic Demo Colab
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型在通用语音数据集上微调的阿拉伯语语音识别模型
语音识别
Transformers

W
Wiam
22
0
Wav2vec2 Base 10k Voxpopuli Ft Cs
基于Facebook Wav2Vec2架构的语音识别模型,使用VoxPopuli语料库的10K未标记捷克语数据进行预训练,并在捷克语转录数据上微调。
语音识别
Transformers

其他
W
facebook
226
0
Wav2vec2 Large Xlsr Turkish Demo Colab
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在通用语音数据集上微调的土耳其语语音识别模型
语音识别
Transformers

W
patrickvonplaten
14
2
Wav2vec2 Base Timit Demo Colab
Apache-2.0
基于anas/wav2vec2-large-xlsr-arabic在common_voice数据集上微调的语音识别模型
语音识别
Transformers

W
nadaAlnada
16
0
Wav2vec2 Large Xlsr 53 Ir
Apache-2.0
基于wav2vec2-large-xlsr-53微调的爱尔兰盖尔语自动语音识别模型,在Common Voice 7.0数据集上训练
语音识别
Transformers

W
jcmc
24
0
W2v Timit Ft 4001
基于Wav2Vec 2.0架构的语音识别模型,在TIMIT数据集上微调,适用于英语语音转文本任务
语音识别
Transformers

W
devin132
22
0
Wav2vec2 Large Xlsr 53 Turkish
Apache-2.0
这是一个基于Facebook的wav2vec2-large-xlsr-53模型在土耳其语Common Voice数据集上微调的自动语音识别(ASR)模型。
语音识别
其他
W
ceyda
54
1
Arabic Speech Recognition
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的阿拉伯语自动语音识别模型,支持16kHz采样率语音输入
语音识别
阿拉伯语
A
mohammed
37
2
Wav2vec2 Large Xlsr Finnish
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53在芬兰语上微调的自动语音识别模型,使用通用语音数据集进行训练。
语音识别
其他
W
birgermoell
22
0
Wav2vec2 Large Xlsr Tamil Commonvoice
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在common_voice泰米尔语数据集上微调的语音识别模型
语音识别
Transformers

W
nikhil6041
43
0
Wav2vec2 Large Xls R 300m My Hindi Home Colab
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的版本,适用于语音识别任务。
语音识别
Transformers

W
nimrah
16
0
Wav2vec2 Large Xls Ar
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的阿拉伯语自动语音识别模型,在Common Voice阿拉伯语数据集上测试WER为52%。
语音识别
Transformers

阿拉伯语
W
mohamed1ai
30
1
Unispeech 1350 En 168 Es Ft 1h
UniSpeech是一个统一语音表征学习模型,结合标注与无标注数据进行预训练,特别针对西班牙语音素识别进行了微调。
语音识别
Transformers

西班牙语
U
microsoft
19
0
Wav2vec2 Base 10k Voxpopuli Ft Sk
基于VoxPopuli语料库10K未标注数据预训练,并在斯洛伐克语转录数据上微调的语音识别模型
语音识别
Transformers

其他
W
facebook
39
1
Distilhubert
Apache-2.0
DistilHuBERT是一种通过层级蒸馏HuBERT模型实现的轻量级语音表征学习模型,在保持性能的同时显著减小模型体积和计算成本。
语音识别
Transformers

英语
D
ntu-spml
2,962
31
Wavlm VLSP Vi
基于microsoft/wavlm-base-plus在PHONGDTD/VINDATAVLSP - NA数据集上微调的越南语自动语音识别模型
语音识别
Transformers

W
phongdtd
21
0
- 1
- 2
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文