A

Asr Wav2vec2 Ctc French

由 bofenghuang 开发
这是一个基于wav2vec2-FR-7K-large模型微调的法语自动语音识别(ASR)模型,在超过2200小时的法语语音数据上训练而成。
下载量 520
发布时间 : 11/25/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于法语语音识别任务,支持16kHz采样率的音频输入,在多个法语语音数据集上表现出色。

模型特点

多数据集训练
模型在Common Voice 11.0、多语言LibriSpeech、Voxpopuli等多个法语语音数据集上训练,覆盖多种语音场景。
支持语言模型
模型可与语言模型结合使用,显著降低词错误率(WER)。
非洲口音支持
模型在非洲口音法语数据上进行了训练,能够识别带有非洲口音的法语。

模型能力

法语语音识别
支持16kHz采样率音频处理
支持语言模型集成
多场景语音识别

使用案例

语音转录
法语语音转文字
将法语语音内容转换为文字
在Common Voice 11.0测试集上WER为11.44(无语言模型)和9.66(有语言模型)
语音分析
非洲口音法语识别
识别带有非洲口音的法语语音
在非洲口音法语测试集上WER为16.22(无语言模型)和15.39(有语言模型)