R

Romanian Wav2vec2

由 gigant 开发
基于facebook/wav2vec2-xls-r-300m微调的罗马尼亚语语音识别模型,在共同语音8.0和罗马尼亚语音合成数据集上训练,在HuggingFace鲁棒语音挑战赛中位列罗马尼亚语音识别第一名。
下载量 88.90k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

本模型用于从16kHz采样的音频片段中进行罗马尼亚语语音识别,预测文本为小写且不包含标点符号。

模型特点

高性能罗马尼亚语识别
在共同语音8.0测试集上达到WER 11.73(CER 2.93)的优异表现
语言模型增强
集成了5-gram语言模型,可显著提升识别准确率(WER从46.99降至38.63)
多数据集训练
结合了共同语音8.0和罗马尼亚语音合成数据集进行训练
竞赛优胜模型
在HuggingFace鲁棒语音挑战赛中位列罗马尼亚语音识别第一名

模型能力

罗马尼亚语语音识别
16kHz音频处理
无标点文本输出

使用案例

语音转文字
罗马尼亚语语音转录
将罗马尼亚语语音转换为文本
在共同语音8.0测试集上WER 11.73
语音助手
罗马尼亚语语音指令识别
用于罗马尼亚语语音助手的前端语音识别