W

Wav2vec2 Large Xlsr Japanese

由 vumichien 开发
基于facebook/wav2vec2-large-xlsr-53在日语上的微调模型,支持日语语音识别任务。
下载量 214
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于XLSR-53架构的日语语音识别模型,经过Common Voice和JSUT数据集的微调,适用于日语语音转文本任务。

模型特点

日语语音识别
专门针对日语优化的语音识别模型,支持日语语音转文本。
基于XLSR-53微调
基于facebook/wav2vec2-large-xlsr-53模型进行微调,继承了其强大的语音特征提取能力。
多数据集训练
使用Common Voice和JSUT日语语音语料库进行训练,提高了模型的泛化能力。

模型能力

日语语音识别
语音转文本
16kHz采样率语音处理

使用案例

语音转写
日语语音转录
将日语语音内容转换为文本格式
WER: 30.84%, CER: 17.85%
语音助手
日语语音指令识别
识别和理解日语语音指令