Ultravox V0 5 Llama 3 1 8b
MIT
基于Llama-3.1-8B-Instruct的多语言音频文本转文本模型,支持40多种语言处理
大型语言模型
Transformers

支持多种语言
U
FriendliAI
218
0
Speechless Llama3.2 V0.1
Apache-2.0
Speechless是一款紧凑的开源文本转语义模型(10亿参数),旨在直接将音频转换为离散的语义表征标记,无需依赖传统的文本转语音(TTS)模型。
语音合成
支持多种语言
S
homebrewltd
28
3
Speechless Llama3.2 V0.1
Apache-2.0
无言是一个紧凑的开源文本到语义模型(10亿参数),旨在直接将音频转换为离散的语义标记,无需依赖传统的文本转语音(TTS)模型。
语音识别
支持多种语言
S
Menlo
39
3
Wav2vec2 Nepali
基于Facebook的wav2vec2模型微调的尼泊尔语语音识别模型
语音识别
Transformers

其他
W
anish-shilpakar
312
1
Wav2vec Test
这是一个基于wav2vec架构的语音处理测试模型,具体用途和训练数据未明确说明。
语音识别
Transformers

W
eugenetanjc
73
0
Test Audio
MIT
一个基于Transformer的端到端语音翻译模型,专门用于法语到英语的语音翻译任务。
语音识别
Transformers

支持多种语言
T
joaogante
19
0
Wav2vec2 Base Common Voice Fa Demo Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base微调的波斯语语音识别模型,适用于波斯语语音转文本任务。
语音识别
Transformers

W
zoha
15
0
Wav2vec2 Large Xlsr 300m Nepali
这是一个基于Wav2Vec2架构的尼泊尔语语音识别模型,支持将尼泊尔语语音转换为文本。
语音识别
Transformers

W
shniranjan
15
0
Wav2vec2 Large Xls R 300m Turkish Colab 4
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice土耳其语数据集上微调的语音识别模型。
语音识别
Transformers

W
nimrah
20
0
S2t Small Covost2 En De St
MIT
一个为端到端英语到德语语音翻译训练的语音到文本转换器模型
语音识别
Transformers

支持多种语言
S
facebook
15
1
Wav2vec2 Malayalam Stt
这是一个基于Wav2Vec2架构的马拉雅拉姆语语音识别模型,用于将马拉雅拉姆语语音转换为文本。
语音识别
Transformers

W
addy88
15
0
Wavlm Base En
基于microsoft/wavlm-base微调的英语自动语音识别(ASR)模型,在english_ASR - CLEAN数据集上训练,词错误率(WER)为0.0773。
语音识别
Transformers

W
anjulRajendraSharma
17
0
Wav2vec2 Dogri Stt
这是一个基于Wav2Vec2架构的自动语音识别(ASR)模型,专门用于识别多格拉语(Dogri)的语音内容。
语音识别
Transformers

W
addy88
30
1
Wav2vec2 Urdu Stt
这是一个基于Wav2Vec2架构的乌尔都语语音识别模型,能够将乌尔都语语音转换为文本。
语音识别
Transformers

W
addy88
145
0
Wav2vec2 Xls R 300m En To 15
Apache-2.0
Facebook的Wav2Vec2 XLS-R模型微调用于多语言语音翻译任务,支持15种语言的英语到目标语言的翻译。
语音识别
Transformers

支持多种语言
W
facebook
167
6
Wav2vec2 Large Xlsr Korean
Apache-2.0
基于Wav2Vec2 XLSR架构的韩语自动语音识别(ASR)模型,在Zeroth韩语数据集上表现出色
语音识别
Transformers

韩语
W
kresnik
1.7M
44
Wav2vec2 Xls R 2b En To 15
Apache-2.0
Facebook的Wav2Vec2 XLS-R模型,针对15种语言的语音翻译任务进行了微调,能够将英语口语翻译为多种书面语言。
语音识别
Transformers

支持多种语言
W
facebook
27
1
S2t Small Covost2 En Fa St
MIT
一个基于Transformer的端到端语音翻译模型,用于英语到波斯语的语音翻译任务
语音识别
Transformers

支持多种语言
S
facebook
49
3
Wav2vec2 Nepali Stt
基于Wav2Vec2架构的尼泊尔语语音识别模型,可直接将尼泊尔语语音转换为文本
语音识别
Transformers

W
addy88
23
1
Wav2vec2 Large Xlsr Turkish Demo
该模型是基于土耳其语Common Voice数据集微调的XLSR-Wav2Vec2语音识别模型,主要用于土耳其语语音转文本任务。
语音识别
W
patrickvonplaten
18
0
Wav2vec2 Xls R 1b 21 To En
Apache-2.0
Facebook的Wav2Vec2 XLS-R模型,用于多语言语音到英语的翻译任务
语音识别
Transformers

支持多种语言
W
facebook
511
3
Wav2vec2 Kannada Stt
一个基于Wav2Vec2架构的卡纳达语语音识别模型,可直接将卡纳达语语音转换为文本。
语音识别
Transformers

W
addy88
96
1
Wav2vec2 Base 100k Gtzan Music Genres
基于Wav2Vec 2.0架构的音频分类模型,专门用于音乐流派识别
音频分类
Transformers

W
m3hrdadfi
405
20
S2t Small Mustc En It St
MIT
一个基于Transformer的端到端语音翻译模型,专为英语到意大利语的语音翻译任务设计。
语音识别
Transformers

支持多种语言
S
facebook
1,331
1
Wav2vec2 Base Russian Big Kaggle
Apache-2.0
该模型是基于facebook/wav2vec2-base在俄语数据集上微调的语音识别模型
语音识别
Transformers

W
Eyvaz
17
1
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文