W

Wav2vec2 Live Japanese

由 ttop324 开发
基于facebook/wav2vec2-large-xlsr-53微调的日语语音识别模型,支持平假名输出
下载量 20
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对日语优化的自动语音识别(ASR)模型,能够将日语语音转换为平假名文本。模型在多个日语语音数据集上进行了微调,适用于日语语音转写任务。

模型特点

多数据集微调
在common_voice、JSUT、CSS10、TEDxJP-10K、JVS和JSSS等多个日语语音数据集上进行了微调
平假名输出
专门针对日语平假名转换进行了优化,能够输出标准化的平假名文本
高性能
在Common Voice日语测试集上取得了21.48%的WER和9.82%的CER

模型能力

日语语音识别
音频转文本
平假名转换

使用案例

语音转写
日语语音转文本
将日语语音内容转换为平假名文本
21.48% WER的准确率
辅助工具
实时字幕生成
为日语视频或直播生成实时字幕