W

Wavlm VLSP Vi

由 phongdtd 开发
基于microsoft/wavlm-base-plus在PHONGDTD/VINDATAVLSP - NA数据集上微调的越南语自动语音识别模型
下载量 21
发布时间 : 3/2/2022

模型简介

该模型是针对越南语的自动语音识别(ASR)任务进行优化的模型,基于WavLM架构微调而成

模型特点

越南语优化
专门针对越南语语音识别任务进行微调
基于WavLM架构
使用微软WavLM-base-plus作为基础模型,具有强大的语音表示能力
多GPU训练
采用分布式多GPU训练方式,提高训练效率

模型能力

越南语语音转文本
连续语音识别

使用案例

语音转录
越南语会议记录
将越南语会议录音转换为文字记录
语音助手
为越南语语音助手提供语音识别能力
AIbase
智启未来,您的人工智能解决方案智库
简体中文