W

Wav2vec2 Large Xlsr 53 Italian

由 facebook 开发
Facebook 发布的基于 Wav2Vec2 架构的大规模意大利语自动语音识别模型,在 Common Voice 数据集上微调
下载量 4,013
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于 Wav2Vec2 架构的自动语音识别(ASR)系统,专门针对意大利语优化,能够将意大利语音频转换为文本

模型特点

大规模预训练
基于 XLSR-53 大规模多语言语音表示学习模型
意大利语优化
专门针对意大利语进行微调,提高识别准确率
高效语音处理
支持 16kHz 采样率音频输入,适合常见语音应用场景

模型能力

意大利语音频转文本
语音识别
语音转录

使用案例

语音转写
意大利语会议记录
将意大利语会议录音自动转换为文字记录
在 Common Voice 测试集上 WER 22.1%
语音助手
为意大利语语音助手提供语音识别能力
无障碍应用
实时字幕生成
为意大利语视频内容生成实时字幕