W

Wav2vec2 Xls R 300m Japanese

由 vitouphy 开发
这是一个基于facebook/wav2vec2-xls-r-300m微调的日语自动语音识别模型,专门用于将日语音频转录为平假名文本。
下载量 29
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是在mozilla-foundation/common_voice_8_0数据集上微调的日语语音识别模型,特别优化了将日语语音转换为平假名的能力。

模型特点

平假名转录优化
专门优化了将日语语音转换为平假名的能力,使用pykakasi将所有文本转换为平假名
多数据集验证
在Common Voice 8和鲁棒语音事件等多个数据集上进行了验证
语言模型支持
支持使用语言模型(LM)来提高识别准确率

模型能力

日语语音识别
音频转文本
平假名转录

使用案例

语音转录
日语语音转文字
将日语语音内容转换为平假名文本
CER 0.2754 (Common Voice 8测试集)
语音内容分析
分析日语语音内容并转换为可处理的文本格式
CER 0.2487 (鲁棒语音事件开发集)