P

Phowhisper Large

由 vinai 开发
PhoWhisper是一个专为越南语自动语音识别设计的系统,基于Whisper模型微调,支持多种越南语口音。
下载量 2,373
发布时间 : 12/19/2023

模型简介

PhoWhisper是一个越南语自动语音识别系统,通过在多语言Whisper模型基础上使用844小时越南语数据集进行微调实现,具有鲁棒性和高准确率。

模型特点

多口音支持
使用涵盖多种越南语口音的844小时数据集进行微调,适应不同地区的发音特点。
高性能
在越南语ASR基准数据集上达到最先进的性能。
基于Whisper模型
在多语言Whisper模型基础上微调,继承了Whisper的鲁棒性和准确性。

模型能力

越南语语音识别
多口音适应

使用案例

语音转文字
越南语会议记录
将越南语会议录音自动转换为文字记录。
高准确率的文字输出
语音助手
用于越南语语音助手的语音识别模块。
提升语音助手的识别准确率
AIbase
智启未来,您的人工智能解决方案智库
简体中文