W

Wav2vec2 Xls R 300m Italian Robust

由 dbdmg 开发
基于facebook/wav2vec2-xls-r-300m在多个意大利语语音数据集上微调的自动语音识别模型
下载量 28
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对意大利语的自动语音识别(ASR)模型,基于XLS-R架构,在Common Voice等公开数据集上微调而成,支持带语言模型的增强识别。

模型特点

多数据集训练
在Common Voice、LibriSpeech、TED等多语言数据集上微调,提高模型鲁棒性
语言模型增强
支持结合语言模型进行识别,WER相对降低约30%
跨场景适应
在鲁棒语音事件数据集上表现良好,适应不同录音环境

模型能力

意大利语语音转文本
带语言模型的增强识别
多种口音识别

使用案例

语音转录
会议记录
将意大利语会议录音转换为文字记录
CER 3.52%(带语言模型)
媒体字幕生成
为意大利语视频内容自动生成字幕
语音交互
语音助手
支持意大利语语音指令识别