W

Wav2vec2 Large Xlsr Ia

由 gchhablani 开发
这是一个基于Facebook的wav2vec2-large-xlsr-53模型在国际语(Interlingua)上微调的自动语音识别(ASR)模型,使用通用语音(Common Voice)数据集训练。
下载量 367
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型用于国际语的自动语音识别任务,能够将语音输入转换为文本输出。

模型特点

多语言支持
基于XLSR-53模型,具有跨语言学习能力
高精度识别
在国际语测试集上达到25.09%的词错误率(WER)
易于使用
提供简单的API接口,可直接用于语音识别

模型能力

语音识别
国际语语音转文本
16kHz音频处理

使用案例

语音转录
国际语语音转录
将国际语语音内容转换为文本
词错误率25.09%
语音助手
国际语语音指令识别
用于构建支持国际语的语音助手