W

Whisper Large Et

由 TalTechNLP 开发
基于OpenAI Whisper-large-v2微调的爱沙尼亚语语音识别模型,由塔尔图理工大学开发,训练数据约1200小时
下载量 245
发布时间 : 4/13/2023
模型介绍
内容详情
替代品

模型简介

这是一个通用型爱沙尼亚语自动语音识别(ASR)模型,适用于广播对话、访谈、讲座等多种场景的语音转文字任务

模型特点

高精度爱沙尼亚语识别
在Common Voice测试集上达到WER 11.35-12.03的优异表现
多样化训练数据
使用约1200小时的多样化爱沙尼亚语数据训练,包括广播、演讲、议会记录等
基于Whisper架构
基于业界领先的Whisper-large-v2模型微调,继承其优秀架构特性

模型能力

爱沙尼亚语语音转文字
广播语音识别
讲座内容转录
访谈记录生成

使用案例

媒体内容处理
广播节目转录
将爱沙尼亚语广播节目自动转换为文字稿
WER约12%的高精度转录
访谈记录生成
自动生成访谈对话的文字记录
教育应用
讲座内容转录
将大学讲座内容自动转换为文字