Ultravox V0 5 Llama 3 2 1b GGUF
MIT
Ultravox v0.5是基于Llama-3 2.1B架构优化的音频文本转文本模型,专注于高效处理语音转写任务。
语音识别
U
ggml-org
421
1
Wav2vec2 Base Librispeech Demo Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base在LibriSpeech数据集上微调的语音识别模型,在评估集上取得了0.3174的词错误率。
语音识别
Transformers

W
vishwasgautam
14
0
Hubert Base Librispeech Demo Colab
Apache-2.0
基于facebook/hubert-large-ls960-ft微调的语音识别模型,在LibriSpeech数据集上训练
语音识别
Transformers

H
vishwasgautam
101
0
Wav2vec Checkpoints
Apache-2.0
基于facebook/wav2vec2-base微调的语音处理模型,在评估集上准确率达99.48%
语音识别
Transformers

W
Zeyadd-Mostaffa
19
0
Deepfake Audio Detection
Apache-2.0
基于wav2vec2-base-finetuned进一步微调的语音处理模型,在评估集上准确率达98.82%
语音识别
Transformers

D
motheecreator
1,468
7
Deepfake Audio Detection
Apache-2.0
基于wav2vec2-base-finetuned模型微调的语音处理模型,在评估集上准确率达98.82%
语音识别
Transformers

D
mo-thecreator
801
7
Wav2vec2 Phoneme
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53微调的语音识别模型,专注于音素识别任务
语音识别
Transformers

W
Bluecast
189
3
Wav2vec2 Base Finetuned
Apache-2.0
基于facebook/wav2vec2-base模型微调的语音处理模型,在评估集上达到99.97%的准确率
语音识别
Transformers

W
mo-thecreator
19
4
Wav2vec2 Base Finetuned
Apache-2.0
基于facebook/wav2vec2-base模型微调的语音处理模型,在评估集上准确率达99.97%
语音识别
Transformers

W
motheecreator
105
4
Wav2vec2 Base Finetuned Ks
Apache-2.0
基于wav2vec2-base模型在音频文件夹数据集上微调的音频分类模型,验证集准确率达99.82%
音频分类
Transformers

W
motheecreator
54
3
Whisper Small Dialect Classifier Cross
Apache-2.0
该模型是基于whisper-small架构的方言分类器,用于识别和分类特定方言的语音输入。
音频分类
Transformers

W
yaygomii
53
1
Bsc Ai Thesis Torgo Model 1
Apache-2.0
基于facebook/wav2vec2-base微调的语音处理模型,在评估集上表现出色
语音识别
Transformers

B
Juardo
19
0
Neunit Ks Kangyuan0601
Apache-2.0
该模型是基于facebook/wav2vec2-base在superb数据集上微调的音频分类模型,在评估集上取得了99.87%的准确率。
音频分类
Transformers

N
SHENMU007
16
0
Wav2vec2 Base Finetuned Amd
Apache-2.0
该模型是基于facebook/wav2vec2-base在未知数据集上微调的版本,主要用于语音识别任务,在评估集上达到84.55%的准确率。
语音识别
Transformers

W
justin1983
14
0
Audio Class Finetuned
Apache-2.0
该模型是基于facebook/wav2vec2-base在superb数据集上微调的音频分类模型,在评估集上取得了0.6578的准确率。
音频分类
Transformers

A
Chemsseddine
20
0
Wav2vec2 Base Finetuned Ks
Apache-2.0
基于facebook/wav2vec2-base在superb数据集上微调的语音识别模型,准确率达98.34%
语音识别
Transformers

W
marcatanante1
13
0
Whisper Small ISSAI KSC 335RS V2
基于Whisper架构的小型语音识别模型,适用于特定领域的语音转文本任务
语音识别
Transformers

W
Shirali
83
1
Englishmodel
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m微调的语音识别模型,主要用于英语语音转文本任务。
语音识别
Transformers

E
Foxasdf
24
1
Wav2vec2 Base Finetuned Ks
Apache-2.0
该模型是基于facebook/wav2vec2-base在superb数据集上微调的语音识别模型,在关键词识别任务上表现出色。
语音识别
Transformers

W
teoha
14
0
Wav2vec2 Base Finetuned Ie
Apache-2.0
基于facebook/wav2vec2-base模型微调的版本,用于特定任务
语音识别
Transformers

W
minoosh
14
0
Wav2vec2 Base Finetuned Ks
Apache-2.0
基于facebook/wav2vec2-base模型微调的语音识别模型,在评估集上准确率达到87.27%。
语音识别
Transformers

W
FerhatDk
38
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型,在Google Colab环境下训练完成。
语音识别
Transformers

W
pannaga
16
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base的微调版本,主要用于语音识别任务。
语音识别
Transformers

W
ones
108
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
基于facebook/wav2vec2-base模型在TIMIT数据集上微调的语音识别模型
语音识别
Transformers

W
Nancyzzz
103
0
Wav2vec2 Base Timit Demo Colab
Apache-2.0
基于facebook/wav2vec2-base模型在TIMIT数据集上微调的语音识别模型,具有较低的词错误率(WER)。
语音识别
Transformers

W
nawta
96
1
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型,专注于英语语音转文字任务
语音识别
Transformers

W
dasolj
127
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base在TIMIT数据集上微调得到的语音识别模型,主要用于英语语音转文本任务。
语音识别
Transformers

W
neweasterns
100
0
Wav2vec2 Base Ft Cv3 V3
Apache-2.0
该模型是基于facebook/wav2vec2-base在Common Voice 3.0英语数据集上微调的语音识别模型,在测试集上取得了0.247的词错误率。
语音识别
Transformers

W
danieleV9H
120
0
Wav2vec Trained
Apache-2.0
该模型是基于facebook/wav2vec2-base微调而成的语音识别模型,在评估集上取得了词错误率0.1042的表现。
语音识别
Transformers

W
eugenetanjc
70
0
Wav2vec Cv
Apache-2.0
基于facebook/wav2vec2-base-960h微调的语音识别模型
语音识别
Transformers

W
eugenetanjc
69
0
Wav2vec Mle
Apache-2.0
基于facebook/wav2vec2-base-960h微调的语音识别模型,在评估集上词错误率为1.0
语音识别
Transformers

W
eugenetanjc
68
0
Project NLP
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在评估集上取得了0.3355的词错误率(WER)。
语音识别
Transformers

P
zakria
22
0
Wav2vec2 Base Dataset Asr Demo Colab
Apache-2.0
这是一个基于distilhubert在superb数据集上微调的语音识别模型,主要用于自动语音识别(ASR)任务。
语音识别
Transformers

W
aminnaghavi
34
0
Test Demo Colab
这是一个自动生成的测试模型,主要用于演示和实验目的。
大型语言模型
Transformers

T
YYSH
16
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型,在评估集上取得了0.3384的词错误率(WER)。
语音识别
Transformers

W
mikeluck
38
0
Wav2vec2 Keyword Spotting Int8
基于wav2vec2架构的语音关键词检测模型,已通过Optimum OpenVINO进行量化优化
语音识别
Transformers

W
sampras343
17
0
Wac2vec Lllfantomlll
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在评估集上取得了0.3417的词错误率。
语音识别
Transformers

W
lllFaNToMlll
27
0
Wav2vec2 Base Vios Commonvoice 1
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在Common Voice数据集上微调的语音识别模型,支持自动语音识别任务。
语音识别
Transformers

W
tclong
21
0
Wav2vec2 Base Timit Demo Colab53
Apache-2.0
基于facebook/wav2vec2-base模型微调的语音识别模型,适用于TIMIT数据集
语音识别
Transformers

W
Mudassar
22
0
Wav2vec2 Final 1 Lm 4
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在评估集上词错误率为0.4499
语音识别
Transformers

W
chrisvinsen
16
0
- 1
- 2
- 3
- 4
- 5
- 6
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文