W

Whisper Th Medium Combined

由 biodatlab 开发
基于openai/whisper-medium在增强版的泰语数据集上进行微调,用于泰语自动语音识别
下载量 4,167
发布时间 : 12/14/2022

模型简介

本模型是基于openai/whisper-medium在增强版的mozilla-foundation/common_voice_13_0泰语数据集、google/fleurs数据集以及精选数据集上进行微调得到的泰语自动语音识别模型。

模型特点

高精度泰语识别
在common-voice-13测试集上取得了7.42的字错率(WER)
多数据集微调
基于mozilla-foundation/common_voice_13_0、google/fleurs及精选数据集进行微调
支持长音频处理
支持chunk_length_s=30的长音频分段处理

模型能力

泰语语音识别
长音频转录

使用案例

语音转录
泰语语音转文字
将泰语语音文件转换为文字
字错率7.42
AIbase
智启未来,您的人工智能解决方案智库
简体中文