V

Viwhisper Medium

由 NhutP 开发
针对越南语语音识别任务优化的Whisper-medium模型,在1308小时越南语数据上微调
下载量 139
发布时间 : 12/16/2024

模型简介

基于OpenAI Whisper-medium架构的越南语语音识别模型,在多个越南语数据集上微调,支持高精度语音转文本

模型特点

大规模越南语训练
在1308小时的越南语数据上微调,包含多种来源的语音数据
多数据集支持
在VSV-1100、Common Voice、VIVOS等多个越南语数据集上评估
低WER表现
在多个测试集上实现4.69-28.76的WER,越南语识别效果优异

模型能力

越南语语音识别
长音频处理
高精度转录

使用案例

语音转录
越南语会议记录
将越南语会议录音自动转为文字记录
WER低至4.69-8.1
语音助手
为越南语语音助手提供语音识别能力
教育
语言学习应用
帮助学习者练习越南语发音和听力
AIbase
智启未来,您的人工智能解决方案智库
简体中文