噪声鲁棒性
Whisper Large V3 Turbo Atcosim Finetune
MIT
基于OpenAI Whisper Large V3 Turbo微调的模型,专门优化用于空中交通管制(ATC)通信的转录。
语音识别
Transformers
英语
W
tclin
28
1
AV HuBERT MuAViC Ru
AV-HuBERT是一种视听语音识别模型,基于MuAViC多语言视听语料库训练,结合音频和视觉模态实现鲁棒性能。
音频生成文本
Transformers
A
nguyenvulebinh
91
1
Audiox South V1
Apache-2.0
AudioX是由Jivi AI开发的多语言自动语音识别模型,专门针对印度南方语言优化,支持泰米尔语、泰卢固语、卡纳达语和马拉雅拉姆语。
语音识别
其他
A
jiviai
148
1
Ichigo Llama3.1 S Instruct V0.4
Apache-2.0
基于Llama-3架构的多模态语言模型,支持音频和文本输入理解,具有噪声鲁棒性和多轮对话能力
文本生成音频
英语
I
homebrewltd
486
19
Whisper Small Ita
Apache-2.0
基于OpenAI Whisper-small针对意大利语优化的语音识别模型,通过特殊标记增强元信息捕获能力
语音识别
Transformers
支持多种语言
W
litus-ai
193
8
Wav2vec2 Xls R 300m En Atc Atcosim
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在ATCOSIM语料库上微调的版本,专用于航空交通管制通信的自动语音识别任务。
语音识别
Transformers
英语
W
Jzuluaga
104
4
Wav2vec2 Base Toy Train Data Random Noise
Apache-2.0
该模型是基于facebook/wav2vec2-base在玩具训练数据上微调的语音识别模型,主要用于处理随机噪声环境下的语音识别任务。
语音识别
Transformers
W
scasutt
22
0
Wav2vec2 Base Toy Train Data Random Noise 0.1
Apache-2.0
基于facebook/wav2vec2-base模型在随机噪声数据集上微调的语音识别模型
语音识别
Transformers
W
scasutt
22
0
Macbert Base Chinese Medical Collation
Apache-2.0
基于macbert微调的医疗文本拼写检查模型,在3亿规模医学数据集上训练,准确率达96%
序列标注
Transformers
中文
M
9pinus
23
10