W

Wav2vec2 Large Xlsr 53 Italian

由 jonatasgrosman 开发
基于facebook/wav2vec2-large-xlsr-53模型微调的意大利语自动语音识别模型,在Common Voice 6.1数据集上训练
下载量 1,012
发布时间 : 3/2/2022

模型简介

该模型是针对意大利语优化的自动语音识别(ASR)模型,基于XLSR-53架构微调,支持16kHz采样率的语音输入转换

模型特点

高性能意大利语识别
在Common Voice意大利语测试集上达到9.41%的词错误率(WER)和2.29%的字符错误率(CER)
语言模型增强
结合语言模型后,词错误率可进一步降低至6.91%,字符错误率降至1.83%
多场景适用
在标准测试集和鲁棒语音赛事开发集上均表现良好,显示较强的泛化能力
易用集成
提供HuggingSound库和自定义脚本两种使用方式,便于快速集成到应用中

模型能力

意大利语语音转文本
16kHz音频处理
批量语音识别
长音频分块处理

使用案例

语音转录
意大利语语音内容转录
将意大利语语音内容转换为文本格式
高准确率的转录结果,适合内容存档和分析
语音助手
意大利语语音指令识别
用于意大利语语音助手系统中的指令识别
低延迟高准确率的指令识别
无障碍应用
语音转文字辅助
为听力障碍人士提供实时语音转文字服务
高准确率的实时转换
AIbase
智启未来,您的人工智能解决方案智库
简体中文