W

Wav2vec2 Base Vietnamese 160h

由 khanhld 开发
基于Wav2vec2的越南语语音识别模型,在160小时越南语语音数据上微调
下载量 356
发布时间 : 5/7/2022

模型简介

该模型是基于Wav2vec2架构的越南语自动语音识别(ASR)模型,在约160小时的越南语语音数据集上微调而成,支持越南语语音转文本任务。

模型特点

多数据集训练
模型在VIVOS、COMMON VOICE、FOSD和VLSP等多个越南语语音数据集上训练
无语言模型支持
即使未集成语言模型,仍能取得较好的识别效果
开源实现
提供完整的预训练和微调代码,支持自定义数据集训练

模型能力

越南语语音识别
音频转文本
语音转录

使用案例

语音转录
越南语语音转写
将越南语语音内容转换为文本
在Common Voice越南语测试集上WER为10.78%
语音助手
越南语语音指令识别
用于越南语语音助手的前端语音识别模块
AIbase
智启未来,您的人工智能解决方案智库
简体中文