W

Wav2vec2 Xls R 300m Japanese

由 AndrewMcDowell 开发
这是一个基于facebook/wav2vec2-xls-r-300m在日语Common Voice 8.0数据集上微调的自动语音识别(ASR)模型,支持日语语音转文字功能。
下载量 24
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门针对日语语音识别任务进行了优化,能够将日语语音转换为平假名和片假名文本。由于日语书写特性,模型评估主要使用字符错误率(CER)而非词错误率(WER)。

模型特点

日语专用优化
专门针对日语语音特性进行训练和优化,支持平假名和片假名输出
汉字转假名处理
使用pykakasi库将汉字转换为平假名,简化识别任务
大规模预训练基础
基于facebook的wav2vec2-xls-r-300m模型微调,具备强大的语音特征提取能力

模型能力

日语语音识别
语音转文本
连续语音处理

使用案例

语音转录
日语语音转写
将日语语音内容转换为文本形式
在Common Voice 8.0测试集上达到23.64%的CER
语音助手
日语语音指令识别
识别和理解日语语音命令