语音识别
Ultravox V0 5 Llama 3 2 1b GGUF
MIT
Ultravox v0.5是基于Llama-3 2.1B架构优化的音频文本转文本模型,专注于高效处理语音转写任务。
语音识别
U
ggml-org
421
1
Wav2vec2 Base Librispeech Demo Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base在LibriSpeech数据集上微调的语音识别模型,在评估集上取得了0.3174的词错误率。
语音识别
Transformers
W
vishwasgautam
14
0
Hubert Base Librispeech Demo Colab
Apache-2.0
基于facebook/hubert-large-ls960-ft微调的语音识别模型,在LibriSpeech数据集上训练
语音识别
Transformers
H
vishwasgautam
101
0
Wav2vec Checkpoints
Apache-2.0
基于facebook/wav2vec2-base微调的语音处理模型,在评估集上准确率达99.48%
语音识别
Transformers
W
Zeyadd-Mostaffa
19
0
Deepfake Audio Detection
Apache-2.0
基于wav2vec2-base-finetuned进一步微调的语音处理模型,在评估集上准确率达98.82%
语音识别
Transformers
D
motheecreator
1,468
7
Deepfake Audio Detection
Apache-2.0
基于wav2vec2-base-finetuned模型微调的语音处理模型,在评估集上准确率达98.82%
语音识别
Transformers
D
mo-thecreator
801
7
Wav2vec2 Phoneme
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53微调的语音识别模型,专注于音素识别任务
语音识别
Transformers
W
Bluecast
189
3
Wav2vec2 Base Finetuned
Apache-2.0
基于facebook/wav2vec2-base模型微调的语音处理模型,在评估集上达到99.97%的准确率
语音识别
Transformers
W
mo-thecreator
19
4
Wav2vec2 Base Finetuned
Apache-2.0
基于facebook/wav2vec2-base模型微调的语音处理模型,在评估集上准确率达99.97%
语音识别
Transformers
W
motheecreator
105
4
Wav2vec2 Base Finetuned Ks
Apache-2.0
基于wav2vec2-base模型在音频文件夹数据集上微调的音频分类模型,验证集准确率达99.82%
音频分类
Transformers
W
motheecreator
54
3
Whisper Small Dialect Classifier Cross
Apache-2.0
该模型是基于whisper-small架构的方言分类器,用于识别和分类特定方言的语音输入。
音频分类
Transformers
W
yaygomii
53
1
Bsc Ai Thesis Torgo Model 1
Apache-2.0
基于facebook/wav2vec2-base微调的语音处理模型,在评估集上表现出色
语音识别
Transformers
B
Juardo
19
0
Neunit Ks Kangyuan0601
Apache-2.0
该模型是基于facebook/wav2vec2-base在superb数据集上微调的音频分类模型,在评估集上取得了99.87%的准确率。
音频分类
Transformers
N
SHENMU007
16
0
Wav2vec2 Base Finetuned Amd
Apache-2.0
该模型是基于facebook/wav2vec2-base在未知数据集上微调的版本,主要用于语音识别任务,在评估集上达到84.55%的准确率。
语音识别
Transformers
W
justin1983
14
0
Audio Class Finetuned
Apache-2.0
该模型是基于facebook/wav2vec2-base在superb数据集上微调的音频分类模型,在评估集上取得了0.6578的准确率。
音频分类
Transformers
A
Chemsseddine
20
0
Wav2vec2 Base Finetuned Ks
Apache-2.0
基于facebook/wav2vec2-base在superb数据集上微调的语音识别模型,准确率达98.34%
语音识别
Transformers
W
marcatanante1
13
0
Whisper Small ISSAI KSC 335RS V2
基于Whisper架构的小型语音识别模型,适用于特定领域的语音转文本任务
语音识别
Transformers
W
Shirali
83
1
Englishmodel
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m微调的语音识别模型,主要用于英语语音转文本任务。
语音识别
Transformers
E
Foxasdf
24
1
Wav2vec2 Base Finetuned Ks
Apache-2.0
该模型是基于facebook/wav2vec2-base在superb数据集上微调的语音识别模型,在关键词识别任务上表现出色。
语音识别
Transformers
W
teoha
14
0
Wav2vec2 Base Finetuned Ie
Apache-2.0
基于facebook/wav2vec2-base模型微调的版本,用于特定任务
语音识别
Transformers
W
minoosh
14
0
Wav2vec2 Base Finetuned Ks
Apache-2.0
基于facebook/wav2vec2-base模型微调的语音识别模型,在评估集上准确率达到87.27%。
语音识别
Transformers
W
FerhatDk
38
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型,在Google Colab环境下训练完成。
语音识别
Transformers
W
pannaga
16
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base的微调版本,主要用于语音识别任务。
语音识别
Transformers
W
ones
108
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
基于facebook/wav2vec2-base模型在TIMIT数据集上微调的语音识别模型
语音识别
Transformers
W
Nancyzzz
103
0
Wav2vec2 Base Timit Demo Colab
Apache-2.0
基于facebook/wav2vec2-base模型在TIMIT数据集上微调的语音识别模型,具有较低的词错误率(WER)。
语音识别
Transformers
W
nawta
96
1
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型,专注于英语语音转文字任务
语音识别
Transformers
W
dasolj
127
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base在TIMIT数据集上微调得到的语音识别模型,主要用于英语语音转文本任务。
语音识别
Transformers
W
neweasterns
100
0
Wav2vec2 Base Ft Cv3 V3
Apache-2.0
该模型是基于facebook/wav2vec2-base在Common Voice 3.0英语数据集上微调的语音识别模型,在测试集上取得了0.247的词错误率。
语音识别
Transformers
W
danieleV9H
120
0
Wav2vec Trained
Apache-2.0
该模型是基于facebook/wav2vec2-base微调而成的语音识别模型,在评估集上取得了词错误率0.1042的表现。
语音识别
Transformers
W
eugenetanjc
70
0
Wav2vec Cv
Apache-2.0
基于facebook/wav2vec2-base-960h微调的语音识别模型
语音识别
Transformers
W
eugenetanjc
69
0
Wav2vec Mle
Apache-2.0
基于facebook/wav2vec2-base-960h微调的语音识别模型,在评估集上词错误率为1.0
语音识别
Transformers
W
eugenetanjc
68
0
Project NLP
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在评估集上取得了0.3355的词错误率(WER)。
语音识别
Transformers
P
zakria
22
0
Wav2vec2 Base Dataset Asr Demo Colab
Apache-2.0
这是一个基于distilhubert在superb数据集上微调的语音识别模型,主要用于自动语音识别(ASR)任务。
语音识别
Transformers
W
aminnaghavi
34
0
Test Demo Colab
这是一个自动生成的测试模型,主要用于演示和实验目的。
大型语言模型
Transformers
T
YYSH
16
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base在TIMIT数据集上微调的语音识别模型,在评估集上取得了0.3384的词错误率(WER)。
语音识别
Transformers
W
mikeluck
38
0
Wav2vec2 Keyword Spotting Int8
基于wav2vec2架构的语音关键词检测模型,已通过Optimum OpenVINO进行量化优化
语音识别
Transformers
W
sampras343
17
0
Wac2vec Lllfantomlll
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在评估集上取得了0.3417的词错误率。
语音识别
Transformers
W
lllFaNToMlll
27
0
Wav2vec2 Base Vios Commonvoice 1
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在Common Voice数据集上微调的语音识别模型,支持自动语音识别任务。
语音识别
Transformers
W
tclong
21
0
Wav2vec2 Base Timit Demo Colab53
Apache-2.0
基于facebook/wav2vec2-base模型微调的语音识别模型,适用于TIMIT数据集
语音识别
Transformers
W
Mudassar
22
0
Wav2vec2 Final 1 Lm 4
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在评估集上词错误率为0.4499
语音识别
Transformers
W
chrisvinsen
16
0