W

Wav2vec2 Large Xls R 300m Guarani Colab

由 FitoDS 开发
基于facebook/wav2vec2-xls-r-300m在瓜拉尼语数据集上微调的语音识别模型
下载量 19
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对瓜拉尼语优化的语音识别模型,基于wav2vec2架构,在特定数据集上微调后展现出良好的识别准确率。

模型特点

高效语音识别
针对瓜拉尼语优化的语音识别能力,在评估集上取得1.07%的词错误率
基于大规模预训练模型
基于facebook/wav2vec2-xls-r-300m模型微调,继承了原模型的强大特征提取能力
轻量级部署
300M参数的规模相对适中,适合多种部署场景

模型能力

瓜拉尼语语音识别
音频转文本
语音内容分析

使用案例

语音转录
瓜拉尼语语音转录
将瓜拉尼语语音内容转换为文本
词错误率1.07%
语言学习辅助
瓜拉尼语学习工具
为学习瓜拉尼语的学生提供语音识别支持