W

Whisper Th Large V3 Combined

由 biodatlab 开发
这是一个基于 OpenAI 的 Whisper Large V3 模型微调的泰语自动语音识别模型,在 Common Voice 13 泰语测试集上取得了 6.59% 的词错误率。
下载量 1,354
发布时间 : 2/20/2024
模型介绍
内容详情
替代品

模型简介

该模型是针对泰语优化的自动语音识别(ASR)模型,在增强版的 Common Voice 13 和 FLEURS 数据集上进行微调,专门用于泰语语音转录任务。

模型特点

低词错误率
在 Common Voice 13 泰语测试集上仅 6.59% 的词错误率(WER)
泰语优化
专门针对泰语语音特性进行微调
混合数据集训练
使用 Common Voice 13 和 FLEURS 等多个数据集增强训练

模型能力

泰语语音识别
音频转录
长音频处理(支持30秒分块)

使用案例

语音转录
泰语会议记录
将泰语会议录音自动转录为文字
高准确率的转录文本
泰语媒体字幕生成
为泰语视频内容自动生成字幕