F

Fonxlsr

由 chrisjay 开发
基于facebook/wav2vec2-large-xlsr-53模型微调的丰语(Fon)语音识别模型,测试WER为14.97%
下载量 56
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个用于丰语(Fon)自动语音识别的模型,基于Wav2Vec2-Large-XLSR-53架构微调而成,支持16kHz采样率的语音输入。

模型特点

低词错误率
在丰语测试集上达到14.97%的词错误率(WER)
无需语言模型
可直接使用,无需额外的语言模型支持
专门针对丰语优化
使用丰语数据集进行微调,适合丰语语音识别任务

模型能力

丰语语音识别
16kHz音频处理

使用案例

语音技术
丰语语音转文本
将丰语语音转换为文本内容
词错误率14.97%