A

Asr Crdnn Commonvoice Fr

由 speechbrain 开发
这是一个基于CommonVoice法语数据集训练的端到端自动语音识别系统,采用CRDNN架构结合CTC和注意力机制。
下载量 167
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型用于法语语音识别任务,能够将法语语音转换为文本,适用于需要法语语音转写的应用场景。

模型特点

双解码机制
同时使用CTC和注意力机制进行解码,提高识别准确性
子词单元分词
采用unigram分词器将单词转换为子词单元,提高模型对未见过词汇的处理能力
自动音频处理
内置音频标准化处理,包括自动重采样和单声道选择

模型能力

法语语音识别
音频转录
语音转文本

使用案例

语音转录
法语语音转写
将法语语音内容转换为文本格式
测试集CER 6.54%,WER 17.70%
语音助手
法语语音指令识别
用于法语语音助手或智能家居设备的语音指令识别