W

Wav2vec2 Base 10k Voxpopuli Ft Ro

由 facebook 开发
基于Facebook Wav2Vec2架构的语音识别模型,针对罗马尼亚语进行微调,适用于自动语音识别任务。
下载量 36
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是Facebook Wav2Vec2基础模型的微调版本,使用VoxPopuli语料库的1万条无标注数据进行预训练,并在罗马尼亚语转录数据上微调,专门用于罗马尼亚语语音识别。

模型特点

多阶段训练
先在大规模无标注数据上预训练,再在特定语言标注数据上微调
罗马尼亚语优化
专门针对罗马尼亚语语音特性进行优化
高效表征学习
利用Wav2Vec2架构从原始音频中学习有效语音表征

模型能力

罗马尼亚语语音识别
音频转文本
语音内容转录

使用案例

语音转录
语音内容转写
将罗马尼亚语语音内容转换为文本
准确转录罗马尼亚语语音内容
语音助手
罗马尼亚语语音指令识别
用于罗马尼亚语语音助手系统的语音识别组件
准确理解罗马尼亚语语音指令