Whisper微调
Whisper Large V3 Speech Flow
Apache-2.0
基于Whisper Large v3的语音流畅度分类模型,可检测语音流畅度及不流畅类型
音频分类
Safetensors
英语
W
tiantiaf
157
1
Kinyawhisper
MIT
KinyaWhisper是基于OpenAI Whisper模型微调的卢旺达语自动语音识别(ASR)系统,专为低资源土著语言设计。
语音识别
Transformers
其他
K
benax-rw
149
3
Whisper Small Ta
Apache-2.0
该模型是基于OpenAI的Whisper Small在泰米尔语Common Voice 17.0数据集上微调的语音识别模型,词错误率(WER)为43.23%。
语音识别
Transformers
其他
W
navin-kumar-j
38
1
Indian Accent English Whisper Finetuned Epoch 15
MIT
基于OpenAI Whisper-large-v3-turbo微调的印度英语口音语音识别模型,在印度英语口音数据集上取得7.99%的词错误率
语音识别
Transformers
英语
I
Tejveer12
21
2
Whisper Finetuned
MIT
基于Whisper-large-v3-turbo微调的印度英语口音语音识别模型,词错误率4.39%
语音识别
Transformers
英语
W
Tejveer12
25
2
Quran Whisper Base Fine Tune
Apache-2.0
该模型是基于openai/whisper-base在quran-ayat-speech-to-text数据集上微调的阿拉伯语语音识别模型,专注于古兰经经文的语音转文字任务。
语音识别
Transformers
阿拉伯语
Q
Baselhany
35
1
Whisper Base Pl
Apache-2.0
基于OpenAI Whisper-base模型在波兰语Common Voice 17.0数据集上微调的语音识别模型
语音识别
Transformers
其他
W
marcsixtysix
27
1
Vlzcrz Whisper Small Japanese 2
Apache-2.0
基于openai/whisper-small在Common Voice 17.0数据集上微调的日语语音识别模型
语音识别
Transformers
日语
V
vlzcrz
28
1
Viwhisper Medium
MIT
针对越南语语音识别任务优化的Whisper-medium模型,在1308小时越南语数据上微调
语音识别
Transformers
其他
V
NhutP
139
4
Whisper Large V3 Cantonese
Apache-2.0
基于Whisper v3微调的粤语自动语音识别模型,在Common Voice 17数据集上训练
语音识别
Transformers
其他
W
khleeloo
25
4
Voice Clone Large Finetune Final
Apache-2.0
该模型是基于openai/whisper-large-v3微调的语音克隆模型,主要用于语音识别任务,在评估集上词错误率为15.3572。
语音识别
Transformers
V
neuronbit
37
2
Akan Whisper Model
基于OpenAI Whisper模型微调的版本,专为加纳低资源语言阿坎语的自动语音识别任务设计
语音识别
Transformers
其他
A
GiftMark
354
3
Whisper Small Khmer
MIT
基于openai/whisper-small微调的语音识别模型,专门优化高棉语转录准确率
语音识别
Transformers
其他
W
Vira21
15
1
Speech Emotion Recognition With Openai Whisper Large V3
Apache-2.0
本项目利用Whisper模型实现语音情感识别,能够将音频分类为快乐、悲伤、惊讶等不同情感类别。
音频分类
Transformers
S
firdhokk
7,750
33
Whisper Tiny De Emodb Emotion Classification
Apache-2.0
基于openai/whisper-tiny微调的德语情感分类模型,在Emo-DB数据集上达到91.59%准确率
音频分类
Transformers
德语
W
Flocksserver
27
0
Whisper Tiny Myanmar
Apache-2.0
该模型是基于openai/whisper-tiny在缅甸语语音数据集上微调的自动语音识别(ASR)模型,支持缅甸语语音转文本任务。
语音识别
Transformers
其他
W
chuuhtetnaing
84
1
Monsoon Whisper Medium Gigaspeech2
Apache-2.0
Monsoon-Whisper-Medium-GigaSpeech2 是一款泰语自动语音识别(ASR)模型,基于Whisper-Medium并在GigaSpeech2数据集上进行了微调,适用于真实场景下的语音识别。
语音识别
Transformers
M
scb10x
546
5
Akylai STT Small
Apache-2.0
吉尔吉斯语Whisper ASR是一款专为吉尔吉斯语定制的自动语音识别解决方案,基于预训练的Whisper模型微调适配。
语音识别
Transformers
其他
A
the-cramer-project
73
1
Whisper Large V3 Taiwanese Hakka
基于Whisper-large-v3微调的台湾客家话语音识别模型,支持多种客家话方言
语音识别
Transformers
其他
W
formospeech
41
5
Detect Language
Apache-2.0
基于Whisper Medium模型微调的语言识别模型,专门用于FLEURS数据集上的语言分类任务
音频分类
Transformers
D
apparaomulpuriril
15
0
Whisper Sinhala Audio To Text
Apache-2.0
基于openai/whisper-small微调的僧伽罗语语音识别模型,支持将僧伽罗语语音转换为文本。
语音识别
Transformers
W
AqeelShafy7
229
2
Pronunciation Accuracy
Apache-2.0
基于OpenAI Whisper-base微调的发音准确度评估模型,用于评估语音发音准确性
语音识别
Transformers
P
JohnJumon
18
2
Whisper Small Kyrgyz
基于Whisper架构的吉尔吉斯语自动语音识别(ASR)模型,由吉尔吉斯共和国总统下属国家语言与语言政策全国委员会支持开发
语音识别
Transformers
其他
W
UlutSoftLLC
841
4
Whisper Tiny Vi
Apache-2.0
基于OpenAI Whisper-tiny架构微调的越南语自动语音识别(ASR)模型,在多个越南语数据集上表现出色
语音识别
Transformers
其他
W
doof-ferb
44
2
Phowhisper Small
Bsd-3-clause
PhoWhisper是一个专为越南语自动语音识别设计的系统,基于Whisper模型微调,支持多种越南语口音。
语音识别
Transformers
其他
P
vinai
2,725
8
Whisper Large V3 Japanese 4k Steps
Apache-2.0
基于openai/whisper-large-v3在Common Voice 16.1日语数据集上微调的语音识别模型,训练4000步
语音识别
Transformers
日语
W
drewschaub
94
4
Haitian Speech To Text
Apache-2.0
专为海地克里奥尔语优化的Whisper语音识别模型,具有高准确度的语音转文本能力
语音识别
Transformers
其他
H
ZeeshanGeoPk
156
1
Audiosangraha Audio To Text
Apache-2.0
基于openai/whisper-small微调的语音转文本模型,支持音频翻译和文本生成任务。
语音识别
Transformers
A
AqeelShafy7
224
4
Phowhisper Large
Bsd-3-clause
PhoWhisper是一个专为越南语自动语音识别设计的系统,基于Whisper模型微调,支持多种越南语口音。
语音识别
Transformers
其他
P
vinai
2,373
28
Whisper Large V3 Atco2 Asr
Apache-2.0
基于OpenAI Whisper-large-v3微调的语音识别模型,专注于航空交通管制(ATCO)场景,词错误率17.04%
语音识别
Transformers
W
jlvdoorn
1,792
5
Whisper Large V2 Spanish
Apache-2.0
基于OpenAI Whisper-large-v2模型在Common Voice 13.0西班牙语数据集上微调的语音识别模型
语音识别
Transformers
W
Sandiago21
38
3
Asr Whisper Medium Commonvoice Fa
Apache-2.0
基于CommonVoice-14.0波斯语数据集微调的whisper medium模型,用于波斯语自动语音识别任务。
语音识别
其他
A
speechbrain
21
3
Whisper Small Keyword Spotting
Apache-2.0
基于openai/whisper-small微调的音频关键词识别模型,在kw-spotting-fsc-sl-agv数据集上训练,评估准确率达99.98%
音频分类
Transformers
W
FlandersMakeAGV
24
0
Banglaasr
MIT
这是一个基于Whisper small架构的孟加拉语自动语音识别模型,在约400小时的Mozilla Common Voice数据集上微调训练,词错误率4.58%
语音识别
Transformers
B
bangla-speech-processing
782
15
Whisper Base Japanese
Apache-2.0
本模型使用Common Voice、JVS和JSUT数据集对openai/whisper-base进行日语微调,适用于日语语音识别任务。
语音识别
Transformers
日语
W
Ivydata
137
3
Afrispeech Large A100
基于Whisper-large-v2微调的非洲语言语音识别模型,在afrispeech-200数据集上训练,词错误率(WER)为14.81
语音识别
Transformers
A
Seyfelislem
20
1
Whisper Small Ft Common Language Id
Apache-2.0
基于openai/whisper-small微调的通用语言识别模型,在评估集上准确率达88.6%
音频分类
Transformers
W
sanchit-gandhi
256.20k
2
Whisper Medium Fleurs Lang Id
Apache-2.0
基于OpenAI Whisper-medium微调的语音语种识别模型,在FLEURS数据集上达到88.05%准确率
音频分类
Transformers
W
sanchit-gandhi
590.30k
14
Whisper Large V2 Spanish
Apache-2.0
基于openai/whisper-large-v2微调的西班牙语语音识别模型,在Common Voice 11.0西班牙语测试集上WER为8.55%
语音识别
Transformers
W
clu-ling
85
2
Whisper Large V2 Kazakh
Apache-2.0
该模型是基于OpenAI的Whisper Large V2在哈萨克语Common Voice 11.0数据集上微调的语音识别模型
语音识别
Transformers
其他
W
DrishtiSharma
40
3