W

Wav2vec2 Base Sv Voxpopuli V2

由 facebook 开发
基于Facebook Wav2Vec2架构的语音模型,专门针对瑞典语进行预训练,使用VoxPopuli语料库的16.3k未标注数据。
下载量 30
发布时间 : 3/2/2022

模型简介

这是一个基础语音识别模型,专注于瑞典语处理,适用于语音转文本任务。

模型特点

瑞典语专用
专门针对瑞典语进行预训练,优化了瑞典语语音识别性能。
基于VoxPopuli语料库
使用VoxPopuli语料库中的16.3k小时瑞典语数据进行训练。
16kHz音频支持
模型针对16kHz采样的语音音频进行优化,使用时需确保输入音频匹配此采样率。

模型能力

瑞典语语音识别
语音特征提取

使用案例

语音转文字
瑞典语语音转录
将瑞典语语音内容转换为文本
语音分析
瑞典语语音特征分析
提取瑞典语语音的特征表示
AIbase
智启未来,您的人工智能解决方案智库
简体中文