W

Wav2vec2 Large Voxrex Npsc

由 NbAiLab 开发
基于KBLab/wav2vec2-large-voxrex在NBAILAB/NPSC - 16K_MP3数据集上微调的自动语音识别模型
下载量 37
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

本模型是针对挪威语语音识别任务优化的自动语音识别(ASR)模型,在NPSC数据集上微调,适用于挪威语语音转文本任务。

模型特点

挪威语优化
专门针对挪威语语音识别任务进行微调优化
基于wav2vec2架构
采用强大的wav2vec2-large-voxrex基础模型
强健语音处理
能够处理各种语音质量和环境条件下的语音输入

模型能力

挪威语语音识别
语音转文本
16kHz音频处理

使用案例

语音转录
挪威语会议记录
将挪威语会议录音自动转录为文字记录
在NPSC评估集上达到约11%的词错误率
语音助手
为挪威语语音助手提供语音识别能力