Wav2vec2 Base Librispeech Demo Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base在LibriSpeech数据集上微调的语音识别模型,在评估集上取得了0.3174的词错误率。
语音识别
Transformers

W
vishwasgautam
14
0
Distil Large V3.5 ONNX
MIT
Distil-Whisper是OpenAI Whisper-Large-v3的知识蒸馏版本,提供更优的性能表现和高效性。
语音识别
Transformers

英语
D
distil-whisper
25
1
Ichigo Llama3.1 S Instruct V0.3 Phase 3
Apache-2.0
Ichigo-llama3s是一个支持音频和文本输入的大语言模型系列,专注于提升声音理解能力和用户交互体验。
文本生成音频
英语
I
homebrewltd
43
35
Whisper Ner V1
MIT
WhisperNER是一种能够同时进行语音转录和实体识别的新颖模型,支持开放类型的命名实体识别(NER)。
语音识别
支持多种语言
W
aiola
174
23
Phoneme Scorer V2 Wav2vec2
Apache-2.0
基于Wav2Vec2-Base架构的自动语音识别模型,专门用于音素识别,在LJSpeech Phonemes数据集上微调
语音识别
Transformers

英语
P
ct-vikramanantha
167
9
Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k
Apache-2.0
基于facebook/wav2vec2-large-lv60微调的英语音素识别模型,在TIMIT数据集上取得10.53%的音素错误率
语音识别
Transformers

英语
W
excalibur12
306
3
Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k 002
Apache-2.0
基于facebook/wav2vec2-large-lv60在TIMIT数据集上微调的英语音素识别模型,音素错误率10.53%
语音识别
Transformers

英语
W
excalibur12
103
1
Gazelle V0.2
Apache-2.0
Gazelle v0.2 是由 Tincans 发布的联合语音-语言模型,支持英语。
文本生成音频
Transformers

英语
G
tincans-ai
90
99
Wav2vec2 Large Xlsr 53 English Finetuned Ravdess
Apache-2.0
基于wav2vec2-large-xlsr-53-english模型在RAVDESS数据集上微调的语音情感识别模型
音频分类
Transformers

W
firdho26
68
0
Wav2vec2 Lg Xlsr En Speech Emotion Recognition Finetuned Ravdess V8
Apache-2.0
基于wav2vec2架构的英语语音情感识别模型,在RAVDESS数据集上微调
音频分类
Transformers

W
Wiam
94
4
Wav2vec2 Base Speech Emotion Recognition
Apache-2.0
基于facebook/wav2vec2-base微调的语音情感识别模型,用于预测音频样本中说话者的情感。
音频分类
Transformers

英语
W
DunnBC22
128
13
Wav2vec2 Ljspeech Gruut
Apache-2.0
基于Wav2Vec2架构的音素识别模型,在LJSpeech Phonemes数据集上微调,用于将语音转换为音素序列
语音识别
Transformers

英语
W
bookbot
2,484
17
Wav2vec2 Large 960h Intent Classification Ori
Apache-2.0
基于facebook/wav2vec2-large-960h微调的意图分类模型,在评估集上准确率达77.08%
音频分类
Transformers

W
MuhammadIqbalBazmi
15
0
Wav2vec2 Large Tedlium
Apache-2.0
基于TEDLIUM语料库微调的Wav2Vec2大型语音识别模型,支持英语语音转文本
语音识别
英语
W
sanchit-gandhi
58
1
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型,在Google Colab环境下训练完成。
语音识别
Transformers

W
pannaga
16
0
Wav2vec2 Base Timit Demo Colab
Apache-2.0
基于facebook/wav2vec2-base模型在TIMIT数据集上微调的语音识别模型,具有较低的词错误率(WER)。
语音识别
Transformers

W
nawta
96
1
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型,专注于英语语音转文字任务
语音识别
Transformers

W
dasolj
127
0
Wav2vec Cv
Apache-2.0
基于facebook/wav2vec2-base-960h微调的语音识别模型
语音识别
Transformers

W
eugenetanjc
69
0
Wav2vec Mle
Apache-2.0
基于facebook/wav2vec2-base-960h微调的语音识别模型,在评估集上词错误率为1.0
语音识别
Transformers

W
eugenetanjc
68
0
Wav2vec2 Base Dataset Asr Demo Colab
Apache-2.0
这是一个基于distilhubert在superb数据集上微调的语音识别模型,主要用于自动语音识别(ASR)任务。
语音识别
Transformers

W
aminnaghavi
34
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型,在评估集上取得了0.3384的词错误率(WER)。
语音识别
Transformers

W
mikeluck
38
0
Assignment1 Francesco
MIT
基于语音到文本转换器(S2T)训练的自动语音识别(ASR)模型,专为英语语音识别设计
语音识别
Transformers

英语
A
Classroom-workshop
22
0
Wav2vec2 19
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,支持自动语音转文字任务
语音识别
Transformers

W
chrisvinsen
18
0
Xlsr English
Apache-2.0
基于facebook/wav2vec2-xls-r-300m在librispeech_asr数据集上微调的英语语音识别模型
语音识别
Transformers

X
ashesicsis1
18
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型,专注于英语语音转文字任务。
语音识别
Transformers

W
wrice
17
0
Wav2vec2 Base Timit Google Colab
Apache-2.0
基于facebook/wav2vec2-base在空数据集上微调的语音识别模型,在评估集上取得了0.3355的词错误率(WER)。
语音识别
Transformers

W
anithapappu
19
0
Wav2vec2 7
Apache-2.0
该模型是基于facebook/wav2vec2-base微调的语音识别模型,在评估集上取得了0.52的词错误率。
语音识别
Transformers

W
chrisvinsen
20
0
D L Dl
该模型是基于facebook/wav2vec2-base-960h微调的语音识别模型,在评估集上词错误率(WER)为1.0。
语音识别
Transformers

D
bkh6722
25
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型,适用于英语语音转文本任务
语音识别
Transformers

W
BitanBiswas
28
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型,主要用于英语语音转文字任务。
语音识别
Transformers

W
patrickvonplaten
26
2
Wav2vec2 Base Timit Demo Colab92
Apache-2.0
基于facebook/wav2vec2-base模型在TIMIT数据集上微调的语音识别模型
语音识别
Transformers

W
hassnain
16
0
Wav2vec2 Base Timit Demo Colab90
Apache-2.0
基于facebook/wav2vec2-base模型在TIMIT数据集上微调的语音识别模型,专注于英语语音转文本任务
语音识别
Transformers

W
hassnain
16
0
Wav2vec2 Base Timit Demo Colab11
Apache-2.0
该模型是基于facebook/wav2vec2-base进行微调的语音识别模型,在TIMIT数据集上取得了0.4348的词错误率。
语音识别
Transformers

W
sameearif88
18
0
Wav2vec2 Base Timit Demo Colab 1
Apache-2.0
该模型是基于facebook/wav2vec2-base微调的语音识别模型,在TIMIT数据集上训练,词错误率(WER)为0.4398。
语音识别
Transformers

W
zasheza
18
0
Wav2vec2 Base Timit Demo Colab2
Apache-2.0
该模型是基于facebook/wav2vec2-base微调得到的语音识别模型,在评估集上取得了0.5664的词错误率(WER)。
语音识别
Transformers

W
sameearif88
16
0
Wav2vec2 Base Timit Ali Hasan Colab EX2
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在TIMIT数据集上训练,评估集WER为0.4458
语音识别
Transformers

W
ali221000262
23
0
Wav2vec2 Base Timit Ali Hasan Colab
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在TIMIT数据集上训练
语音识别
Transformers

W
ali221000262
25
0
Wav2vec2 Base Timit Moaiz Exp2
Apache-2.0
基于facebook/wav2vec2-base模型在TIMIT数据集上微调的语音识别模型
语音识别
Transformers

W
moaiz237
24
0
Wav2vec2 Base Timit Demo Colab
Apache-2.0
基于wav2vec2-base模型在TIMIT数据集上微调的语音识别模型
语音识别
Transformers

W
ali221000262
23
0
Wav2vec2 Base Timit Demo Colab
Apache-2.0
基于facebook/wav2vec2-base模型微调的语音识别模型,在TIMIT数据集上进行了训练和评估。
语音识别
Transformers

W
shumail
24
0
- 1
- 2
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文