Wav2Vec2架构
Indicwav2vec Hindi
Apache-2.0
基于Wav2Vec2架构的印地语自动语音识别模型,由AI4Bharat开发
语音识别
Transformers
其他
I
ai4bharat
34.90k
17
Indicwav2vec Odia
Apache-2.0
基于Wav2Vec2架构的印地语自动语音识别(ASR)模型,由AI4Bharat开发
语音识别
Transformers
其他
I
ai4bharat
401
2
Audio Classification Model
Apache-2.0
基于facebook/wav2vec2-base-960h微调的音频分类模型,具体用途和训练数据未明确说明。
音频分类
Transformers
A
SinghManish
19
1
Mms Lid 4017
这是一个基于Wav2Vec2架构的语音语言识别模型,能够识别4017种语言,属于Facebook大规模多语言语音项目的一部分。
音频分类
Transformers
支持多种语言
M
facebook
3,721
8
Mms Lid 1024
该模型是Facebook大规模多语言语音项目的一部分,基于Wav2Vec2架构,能够识别1024种语言的语音输入。
音频分类
Transformers
支持多种语言
M
facebook
1,869
9
Mms Lid 512
这是一个针对512种语言的语音语言识别(LID)进行微调的模型,基于Wav2Vec2架构,能够识别输入音频的语言类别。
语音识别
Transformers
支持多种语言
M
facebook
32
2
Mms Lid 256
这是一个基于Wav2Vec2架构的语音语言识别模型,能够识别256种语言,属于Facebook大规模多语言语音(MMS)项目的一部分。
音频分类
Transformers
支持多种语言
M
facebook
48.38k
10
Mms Lid 126
基于Facebook大规模多语言语音项目微调的语言识别模型,支持126种语言的音频分类
音频分类
Transformers
支持多种语言
M
facebook
2.1M
26
Accent Determinator
基于Wav2Vec2架构的音频分类模型,用于识别波多黎各、哥伦比亚、委内瑞拉、秘鲁或智利西班牙语口音
音频分类
Transformers
A
hhsavich
29
2
Exp W2v2t It Vp Fr S821
Apache-2.0
基于facebook/wav2vec2-large-fr-voxpopuli模型微调的意大利语自动语音识别模型,使用Common Voice 7.0意大利语数据集训练
语音识别
Transformers
其他
E
jonatasgrosman
27
0
Exp W2v2t It Vp 100k S449
Apache-2.0
基于facebook/wav2vec2-large-100k-voxpopuli模型微调的意大利语自动语音识别模型,使用Common Voice 7.0意大利语数据集训练。
语音识别
Transformers
其他
E
jonatasgrosman
17
0
Wav2vec2 Ksponspeech
Apache-2.0
基于Ksponspeech数据集微调的韩语语音识别模型,在Wav2vec2-large-xlsr-53基础上优化
语音识别
Transformers
W
Taeham
111
4
84rry Xls R 300M AR
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的阿拉伯语语音识别模型,在评估集上取得了0.5078的词错误率。
语音识别
Transformers
8
84rry
27
0
Xlrs Best Lm
Apache-2.0
这是一个基于XLSR Wav2Vec2架构的印尼语自动语音识别模型,在公共语音印尼语数据集上进行了微调。
语音识别
Transformers
其他
X
ridhoalattqas
19
1
Chinese Hubert Base
MIT
基于1万小时WenetSpeech L子集预训练的中文语音模型,适用于语音相关任务
语音识别
Transformers
C
TencentGameMate
1,312
39
Wav2vec2 17
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,支持自动语音转文本任务。
语音识别
Transformers
W
chrisvinsen
17
0
Wav2vec2 10
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在评估集上词错误率(WER)为1.0
语音识别
Transformers
W
chrisvinsen
20
0
Wav2vec2 Xlsr 53 Russian Emotion Recognition
MIT
这是一个基于XLS-R Wav2Vec2架构的俄语语音情感识别模型,能够识别7种基本情感,准确率达72%。
音频分类
Transformers
其他
W
Aniemore
1,106
13
Wav2vec2 3
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,词错误率(WER)为1.0
语音识别
Transformers
W
chrisvinsen
16
0
D L Dl
该模型是基于facebook/wav2vec2-base-960h微调的语音识别模型,在评估集上词错误率(WER)为1.0。
语音识别
Transformers
D
bkh6722
25
0
English Filipino Wav2vec2 L Xls R Test 07
Apache-2.0
该模型是基于jonatasgrosman/wav2vec2-large-xlsr-53-english在菲律宾语音数据集上微调的版本,主要用于英语到菲律宾语的语音识别任务。
语音识别
Transformers
E
Khalsuu
24
0
Wav2vec2 Base Timit Demo Colab3
Apache-2.0
基于facebook/wav2vec2-base模型在TIMIT数据集上微调的语音识别模型
语音识别
Transformers
W
sherry7144
24
0
Wav2vec2 Base Timit Demo Colab1
Apache-2.0
该模型是基于facebook/wav2vec2-base微调的语音识别模型,在TIMIT数据集上进行了训练和评估。
语音识别
Transformers
W
cuzeverynameistaken
16
0
Wav2vec2 Base Timit Demo Colab60
Apache-2.0
该模型是基于facebook/wav2vec2-base微调的语音识别模型,在TIMIT数据集上训练60轮,词错误率(WER)达到1.0。
语音识别
Transformers
W
hassnain
16
0
Wav2vec2 Base Timit Demo Colab7
Apache-2.0
该模型是基于facebook/wav2vec2-base微调得到的语音识别模型,在TIMIT数据集上训练,词错误率(WER)为0.5426。
语音识别
Transformers
W
sameearif88
16
0
Wav2vec2 Base Timit Demo Colab7
Apache-2.0
基于facebook/wav2vec2-base模型在TIMIT数据集上微调的语音识别模型,主要用于英语语音转文本任务。
语音识别
Transformers
W
hassnain
16
0
Wav2vec2 Base Timit Demo Colab3
Apache-2.0
该模型是基于facebook/wav2vec2-base微调的语音识别模型,在TIMIT数据集上训练,评估词错误率为0.5608。
语音识别
Transformers
W
sameearif88
16
0
Wav2vec2 Base Timit Demo Colab2
Apache-2.0
该模型是基于facebook/wav2vec2-base微调得到的语音识别模型,在评估集上取得了0.5664的词错误率(WER)。
语音识别
Transformers
W
sameearif88
16
0
Wav2vec2 Base Timit Demo Colab6
Apache-2.0
该模型是基于facebook/wav2vec2-base微调的语音识别模型,在TIMIT数据集上训练,词错误率(WER)为0.5282。
语音识别
Transformers
W
hassnain
19
0
Wav2vec2 Base Timit Moaiz Explast
Apache-2.0
该模型是基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型,主要用于英语语音转文本任务。
语音识别
Transformers
W
moaiz237
19
0
Wav2vec2 Base Timit Demo Colab1
Apache-2.0
该模型是基于facebook/wav2vec2-base微调的语音识别模型,在TIMIT数据集上训练,词错误率(WER)为1.0。
语音识别
Transformers
W
tahazakir
24
0
Xlsr 53 Bemba 5hrs
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53微调的语音识别模型,支持Bemba语
语音识别
Transformers
X
csikasote
25
0
Ctrlv Wav2vec2 Tokenizer
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在评估集上取得了31.38%的词错误率
语音识别
Transformers
C
proseph
25
0
Wav2vec2 Commonvoice Tamil
MIT
基于Harveenchadha/vakyansh-wav2vec2-tamil-tam-250在common_voice数据集上微调的泰米尔语语音识别模型
语音识别
Transformers
W
nikhil6041
40
0
Wav2vec2 Base Toy Train Data Slow 10pct
Apache-2.0
基于facebook/wav2vec2-base模型在未知数据集上微调的语音识别模型,词错误率(WER)为0.7175
语音识别
Transformers
W
scasutt
22
0
Wav2vec2 Base Toy Train Data Masked Audio 10ms
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在10ms音频掩码任务上训练
语音识别
Transformers
W
scasutt
22
0
Wav2vec2 From Scratch Finetune Dummy
Apache-2.0
这是一个基于XLSR Wav2Vec2架构的印度尼西亚语自动语音识别模型,由cahya开发并在通用语音印度尼西亚语数据集上微调。
语音识别
Transformers
其他
W
inergi
15
0
Wav2vec2 Tr AG V1
基于Wav2Vec2架构的土耳其语语音识别模型,针对土耳其语进行了优化。
语音识别
Transformers
W
adresgezgini
20
0
Wav2vec2 Urdu
Apache-2.0
基于wav2vec2架构的乌尔都语自动语音识别模型,在Common Voice数据集上微调
语音识别
Transformers
其他
W
kingabzpro
101
3
Alvenir Wav2vec2 Base Cv8 Da
Apache-2.0
基于丹麦语声学模型在Common Voice 8.0丹麦语部分数据上微调而成的语音识别模型
语音识别
Transformers
其他
A
saattrupdan
21
0