A

Asr Whisper Large V3 Salt

由 Sunbird 开发
基于whisper-large-v3适配的语音识别模型,专门针对乌干达地区多种语言优化
下载量 249
发布时间 : 2/4/2025
模型介绍
内容详情
替代品

模型简介

该模型是针对乌干达地区多种语言的语音识别模型,支持卢干达语、英语、尼扬科勒语、阿乔利语、特索语、卢格巴拉语等多种语言,特别优化了乌干达口音和环境噪音下的识别性能

模型特点

多语言支持
专门针对乌干达地区11种语言优化,包括多种本土语言和乌干达口音英语
环境噪音鲁棒性
训练过程中添加了随机噪声和街道环境噪音,增强了实际应用场景下的识别能力
电话语音优化
通过随机降采样至8kHz模拟电话语音质量,提高了低质量音频的识别准确率

模型能力

语音转文本
多语言识别
自动语言检测
噪音环境下的语音识别

使用案例

语音转录
多语言会议记录
用于乌干达多语言会议的实时转录
支持11种语言的自动识别和转录
电话客服记录
处理低质量的电话语音记录
针对8kHz采样率优化的识别能力
语音辅助技术
本地语言语音助手
为乌干达地区开发支持本土语言的语音助手
对多种本土语言的高准确率识别