W

Whisper Tamil Small

由 vasista22 开发
基于OpenAI Whisper-small微调的泰米尔语自动语音识别模型,在多个公开数据集上训练,词错误率表现优异。
下载量 10.78k
发布时间 : 1/1/2023
模型介绍
内容详情
替代品

模型简介

本模型是专为泰米尔语优化的自动语音识别(ASR)模型,基于Whisper-small架构微调,适用于泰米尔语语音转文本任务。

模型特点

低词错误率
在Common Voice 11.0泰米尔语测试集上WER仅7.95,Fleurs测试集WER 9.11
多数据集训练
融合了6个主流泰米尔语ASR数据集的训练数据
加速推理支持
提供基于whisper-jax的加速推理方案,支持批量处理

模型能力

泰米尔语语音识别
长音频处理(支持分块)
实时转录

使用案例

语音转写
会议记录
将泰米尔语会议录音转为文字记录
高准确率的转录文本
媒体字幕生成
为泰米尔语视频内容自动生成字幕
WER低于10%的准确字幕
语音助手
泰米尔语语音指令识别
用于本地化语音助手开发