M

M Ctc T Large

由 speechbrain 开发
Meta AI推出的大规模多语言语音识别模型,支持60种语言,基于10亿参数Transformer编码器架构。
下载量 88
发布时间 : 5/27/2022
模型介绍
内容详情
替代品

模型简介

M-CTC-T是一个多语言语音识别模型,能够将语音转换为文本,支持多种语言并保留标点符号与大小写。

模型特点

多语言支持
支持60种语言的语音识别,覆盖广泛的语种需求。
大规模训练数据
基于通用语音和大众之声语料库进行训练,数据量大且多样。
字符级转录
采用未标准化的字符级转录文本,保留标点符号与大小写。

模型能力

语音识别
多语言转录
字符级文本生成

使用案例

语音转录
多语言语音转文本
将多种语言的语音转换为文本,适用于国际化应用场景。
在通用语音测试集上字符错误率(CER)为21.4-23.3