越南语语音识别
Whisper Small Vi
MIT
基于openai/whisper-small针对越南语语音数据微调的自动语音识别模型,提升越南语转录准确性和鲁棒性
语音识别
Transformers
其他
W
namphungdn134
334
2
Whisper Base Vi
MIT
基于openai/whisper-base模型在100小时越南语语音数据上微调的语音识别模型,提升越南语转录准确性
语音识别
Transformers
其他
W
namphungdn134
215
3
Chunkformer Large Vie
基于ChunkFormer架构的大规模越南语自动语音识别模型,在约3000小时的越南语公开语音数据上微调,性能优异。
语音识别
其他
C
khanhld
1,765
12
Vi Whisper Large V3 Turbo V1
针对越南语自动语音识别(ASR)任务优化的Whisper-V3-Turbo模型,使用多个越南语数据集微调
语音识别
Transformers
其他
V
suzii
182
7
Viwhisper Medium
MIT
针对越南语语音识别任务优化的Whisper-medium模型,在1308小时越南语数据上微调
语音识别
Transformers
其他
V
NhutP
139
4
Whisper Tiny Vi
Apache-2.0
基于OpenAI Whisper-tiny架构微调的越南语自动语音识别(ASR)模型,在多个越南语数据集上表现出色
语音识别
Transformers
其他
W
doof-ferb
44
2
Phowhisper Small
Bsd-3-clause
PhoWhisper是一个专为越南语自动语音识别设计的系统,基于Whisper模型微调,支持多种越南语口音。
语音识别
Transformers
其他
P
vinai
2,725
8
Wav2vec2 Bartpho
这是一个支持越南语的自动语音识别模型,能够输出规范化文本、标记时间戳以及多说话人分段。
语音识别
Transformers
其他
W
nguyenvulebinh
472
6
Whisper Large V2 Vietnamese
Apache-2.0
该模型是基于OpenAI的Whisper Small架构,在Common Voice 11.0越南语数据集上微调的自动语音识别(ASR)模型
语音识别
Transformers
其他
W
DrishtiSharma
25
2
Wav2vec2 Large Vi Vlsp2020
基于wav2vec2架构的越南语自动语音识别模型,预训练使用1.3万小时未标注YouTube音频,并在250小时标注数据上微调
语音识别
Transformers
其他
W
nguyenvulebinh
385
4
Wav2vec2 Base Vietnamese 160h
基于Wav2vec2的越南语语音识别模型,在160小时越南语语音数据上微调
语音识别
Transformers
其他
W
khanhld
356
10
Viwav2vec2 Base 3k
该模型是基于3千小时越南语语音数据预训练的Wav2Vec2基础模型,适用于越南语语音识别任务,需在下游任务上微调后使用。
语音识别
Transformers
其他
V
dragonSwing
41
2
Viwav2vec2 Base 1.5k
该模型通过1.5千小时越南语语音数据预训练得到,适用于越南语语音识别任务,需微调后使用。
语音识别
Transformers
其他
V
dragonSwing
38
0
Wav2vec NCKH 2022
基于Wav2vec2架构的越南语自动语音识别模型,支持从音频到文本的转换
语音识别
Transformers
其他
W
hoangbinhmta99
29
0
Wav2vec2 Large Xls R 300m Vietnamese Colab
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的越南语语音识别模型
语音识别
Transformers
W
Jungwonchang
22
0
Fb Youtube Vi Large
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在越南语YouTube非正式音频数据集上微调的自动语音识别模型。
语音识别
Transformers
F
phongdtd
31
1
Wav2vec2 Large Xlsr 53 Vietnamese
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的越南语自动语音识别模型,支持16kHz采样率的语音输入。
语音识别
Transformers
其他
W
not-tanh
22
4
Fb Vindata Vi Large
Apache-2.0
该模型是基于facebook/wav2vec2-large-xlsr-53在PHONGDTD/VINDATAVLSP - NA数据集上微调的越南语自动语音识别模型
语音识别
Transformers
F
phongdtd
29
0
Xls Asr Vi 40h 1B
Apache-2.0
基于facebook/wav2vec2-xls-r-1b在40小时FPT开放语音数据集(FOSD)和公共语音数据集7.0上微调的越南语自动语音识别模型
语音识别
Transformers
其他
X
geninhu
23
0
Wav2vec2 Large Xlsr 53 Vietnamese
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的越南语自动语音识别模型,使用通用语音数据集训练。
语音识别
其他
W
anuragshas
279
2
Wav2vec2 Base Vietnamese 250h
基于wav2vec 2.0架构的越南语自动语音识别模型,在13,000小时未标注音频和250小时标注数据上训练
语音识别
Transformers
其他
W
nguyenvulebinh
6,868
39
Fine Tune XLSR Wav2Vec2 Speech2Text Vietnamese
Apache-2.0
这是一个基于MT5架构的越南语自动语音识别(ASR)修复模型,针对越南语语音识别任务进行了微调。
语音识别
其他
F
leduytan93
25
0
Wavlm VLSP Vi
基于microsoft/wavlm-base-plus在PHONGDTD/VINDATAVLSP - NA数据集上微调的越南语自动语音识别模型
语音识别
Transformers
W
phongdtd
21
0
Wavlm Vindata Demo Dist
基于microsoft/wavlm-base在越南语数据集上微调的自动语音识别模型
语音识别
Transformers
W
phongdtd
17
0
Xls Asr Vi 40h
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在Common Voice 7.0越南语及私有数据集上微调的语音识别模型。
语音识别
Transformers
其他
X
geninhu
14
0
Viwav2vec2 Base 100h
Apache-2.0
基于VLSP数据集中100小时未标注越南语语音音频预训练的Wav2Vec2基础模型,需在下游任务上微调使用。
语音识别
Transformers
其他
V
dragonSwing
19
0
Wav2vec2 Base Vietnamese
Apache-2.0
基于Wav2Vec2架构的越南语语音识别模型,在VSLP数据集上微调,支持16kHz采样率的语音输入
语音识别
Transformers
其他
W
dragonSwing
16
2
Wav2vec2 Base Vn 270h
基于约270小时越南语标注数据微调的语音识别模型,支持越南语自动语音识别任务
语音识别
其他
W
dragonSwing
202
8
Wav2vec2 Large Xlsr Vietnamese
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53模型微调的越南语自动语音识别模型
语音识别
其他
W
Nhut
22
0
Wav2vec2 Large Xlsr Vietnamese
Apache-2.0
这是一个基于facebook/wav2vec2-large-xlsr-53模型在越南语上微调的语音识别模型,使用了Common Voice和Infore_25h数据集进行训练。
语音识别
其他
W
CuongLD
37
1