W

Wav2vec2 Base 10k Voxpopuli Ft Hr

由 facebook 开发
基于Facebook Wav2Vec2架构的语音识别模型,使用VoxPopuli语料库预训练并在克罗地亚语数据上微调
下载量 20
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个自动语音识别(ASR)模型,专门针对克罗地亚语优化,能够将语音转换为文本

模型特点

多阶段训练
先在大规模无标注数据上预训练,再在克罗地亚语标注数据上微调
高效表征学习
使用Wav2Vec2架构直接从原始音频学习有效语音表征
特定语言优化
专门针对克罗地亚语进行优化,提高该语言的识别准确率

模型能力

克罗地亚语语音识别
音频转文本
语音转录

使用案例

语音转录
克罗地亚语语音转写
将克罗地亚语语音内容转换为文本格式
语音助手
克罗地亚语语音命令识别
用于支持克罗地亚语的语音助手和智能设备