M

Monsoon Whisper Medium Gigaspeech2

由 scb10x 开发
Monsoon-Whisper-Medium-GigaSpeech2 是一款泰语自动语音识别(ASR)模型,基于Whisper-Medium并在GigaSpeech2数据集上进行了微调,适用于真实场景下的语音识别。
下载量 546
发布时间 : 7/12/2024
模型介绍
内容详情
替代品

模型简介

该模型专注于泰语自动语音识别任务,在YouTube音频和嘈杂环境下的语音识别中表现优异。

模型特点

泰语语音识别
专注于泰语语音识别任务,在真实场景中表现优异。
基于Whisper-Medium微调
基于Whisper-Medium架构,并在GigaSpeech2数据集上进行了微调。
高性能
在WER和CER指标上表现优于同类模型。

模型能力

泰语语音识别
嘈杂环境下的语音识别

使用案例

语音识别
YouTube音频转录
适用于转录YouTube视频中的泰语语音内容。
嘈杂环境下的语音识别
在嘈杂环境下仍能保持较高的识别准确率。