端到端语音处理
Ultravox V0 5 Llama 3 1 8b
MIT
基于Llama-3.1-8B-Instruct的多语言音频文本转文本模型,支持40多种语言处理
大型语言模型
Transformers
支持多种语言
U
FriendliAI
218
0
Speechless Llama3.2 V0.1
Apache-2.0
Speechless是一款紧凑的开源文本转语义模型(10亿参数),旨在直接将音频转换为离散的语义表征标记,无需依赖传统的文本转语音(TTS)模型。
语音合成
支持多种语言
S
homebrewltd
28
3
Speechless Llama3.2 V0.1
Apache-2.0
无言是一个紧凑的开源文本到语义模型(10亿参数),旨在直接将音频转换为离散的语义标记,无需依赖传统的文本转语音(TTS)模型。
语音识别
支持多种语言
S
Menlo
39
3
Wav2vec2 Nepali
基于Facebook的wav2vec2模型微调的尼泊尔语语音识别模型
语音识别
Transformers
其他
W
anish-shilpakar
312
1
Wav2vec Test
这是一个基于wav2vec架构的语音处理测试模型,具体用途和训练数据未明确说明。
语音识别
Transformers
W
eugenetanjc
73
0
Test Audio
MIT
一个基于Transformer的端到端语音翻译模型,专门用于法语到英语的语音翻译任务。
语音识别
Transformers
支持多种语言
T
joaogante
19
0
Wav2vec2 Base Common Voice Fa Demo Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base微调的波斯语语音识别模型,适用于波斯语语音转文本任务。
语音识别
Transformers
W
zoha
15
0
Wav2vec2 Large Xlsr 300m Nepali
这是一个基于Wav2Vec2架构的尼泊尔语语音识别模型,支持将尼泊尔语语音转换为文本。
语音识别
Transformers
W
shniranjan
15
0
Wav2vec2 Large Xls R 300m Turkish Colab 4
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice土耳其语数据集上微调的语音识别模型。
语音识别
Transformers
W
nimrah
20
0
S2t Small Covost2 En De St
MIT
一个为端到端英语到德语语音翻译训练的语音到文本转换器模型
语音识别
Transformers
支持多种语言
S
facebook
15
1
Wav2vec2 Malayalam Stt
这是一个基于Wav2Vec2架构的马拉雅拉姆语语音识别模型,用于将马拉雅拉姆语语音转换为文本。
语音识别
Transformers
W
addy88
15
0
Wavlm Base En
基于microsoft/wavlm-base微调的英语自动语音识别(ASR)模型,在english_ASR - CLEAN数据集上训练,词错误率(WER)为0.0773。
语音识别
Transformers
W
anjulRajendraSharma
17
0
Wav2vec2 Dogri Stt
这是一个基于Wav2Vec2架构的自动语音识别(ASR)模型,专门用于识别多格拉语(Dogri)的语音内容。
语音识别
Transformers
W
addy88
30
1
Wav2vec2 Urdu Stt
这是一个基于Wav2Vec2架构的乌尔都语语音识别模型,能够将乌尔都语语音转换为文本。
语音识别
Transformers
W
addy88
145
0
Wav2vec2 Xls R 300m En To 15
Apache-2.0
Facebook的Wav2Vec2 XLS-R模型微调用于多语言语音翻译任务,支持15种语言的英语到目标语言的翻译。
语音识别
Transformers
支持多种语言
W
facebook
167
6
Wav2vec2 Large Xlsr Korean
Apache-2.0
基于Wav2Vec2 XLSR架构的韩语自动语音识别(ASR)模型,在Zeroth韩语数据集上表现出色
语音识别
Transformers
韩语
W
kresnik
1.7M
44
Wav2vec2 Xls R 2b En To 15
Apache-2.0
Facebook的Wav2Vec2 XLS-R模型,针对15种语言的语音翻译任务进行了微调,能够将英语口语翻译为多种书面语言。
语音识别
Transformers
支持多种语言
W
facebook
27
1
S2t Small Covost2 En Fa St
MIT
一个基于Transformer的端到端语音翻译模型,用于英语到波斯语的语音翻译任务
语音识别
Transformers
支持多种语言
S
facebook
49
3
Wav2vec2 Nepali Stt
基于Wav2Vec2架构的尼泊尔语语音识别模型,可直接将尼泊尔语语音转换为文本
语音识别
Transformers
W
addy88
23
1
Wav2vec2 Large Xlsr Turkish Demo
该模型是基于土耳其语Common Voice数据集微调的XLSR-Wav2Vec2语音识别模型,主要用于土耳其语语音转文本任务。
语音识别
W
patrickvonplaten
18
0
Wav2vec2 Xls R 1b 21 To En
Apache-2.0
Facebook的Wav2Vec2 XLS-R模型,用于多语言语音到英语的翻译任务
语音识别
Transformers
支持多种语言
W
facebook
511
3
Wav2vec2 Kannada Stt
一个基于Wav2Vec2架构的卡纳达语语音识别模型,可直接将卡纳达语语音转换为文本。
语音识别
Transformers
W
addy88
96
1
Wav2vec2 Base 100k Gtzan Music Genres
基于Wav2Vec 2.0架构的音频分类模型,专门用于音乐流派识别
音频分类
Transformers
W
m3hrdadfi
405
20
S2t Small Mustc En It St
MIT
一个基于Transformer的端到端语音翻译模型,专为英语到意大利语的语音翻译任务设计。
语音识别
Transformers
支持多种语言
S
facebook
1,331
1
Wav2vec2 Base Russian Big Kaggle
Apache-2.0
该模型是基于facebook/wav2vec2-base在俄语数据集上微调的语音识别模型
语音识别
Transformers
W
Eyvaz
17
1