W

Wav2vec2 Large Xlsr Upper Sorbian Mixed

由 jimregan 开发
这是一个基于facebook/wav2vec2-large-xlsr-53微调的上索布语语音识别模型,训练数据来自通用语音数据集和在线索布语课程。
下载量 25
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型用于上索布语的自动语音识别任务,支持16kHz采样率的语音输入。

模型特点

多源数据训练
结合了通用语音数据集和在线索布语课程数据,增强了模型性能
高兼容性
支持16kHz采样率的语音输入,适用于多种语音识别场景
预训练微调
基于facebook/wav2vec2-large-xlsr-53模型微调,继承了强大的语音特征提取能力

模型能力

上索布语语音识别
自动语音转文本

使用案例

教育
索布语学习辅助
帮助学习者通过语音识别检查发音准确性
语音转写
上索布语语音转录
将上索布语语音内容转换为文本