W

Whisper Medium Et

由 TalTechNLP 开发
基于约800小时多样化爱沙尼亚语数据微调的Whisper-medium模型,适用于通用语音识别场景
下载量 115
发布时间 : 3/20/2023
模型介绍
内容详情
替代品

模型简介

这是由塔林理工大学语言技术实验室训练的通用爱沙尼亚语自动语音识别(ASR)模型,适用于广播对话、访谈、演讲等场景

模型特点

多样化训练数据
基于约800小时多样化爱沙尼亚语数据训练,包括广播语音、即兴对话、老年人语音等多种类型
高性能识别
在Common Voice测试集上取得13.8-14.7的WER表现
通用场景适用
适用于广播对话、访谈、演讲等多种通用语音识别场景

模型能力

爱沙尼亚语语音识别
自动语音转文本

使用案例

媒体与广播
广播内容转录
将爱沙尼亚语广播节目自动转换为文字
会议记录
会议语音转录
将爱沙尼亚语会议内容自动转换为文字记录