M

Malaysian Distil Whisper Large V3

由 mesolitica 开发
基于马来西亚数据集蒸馏优化的Whisper Large V3语音识别模型,支持马来语等多种语言
下载量 30
发布时间 : 12/30/2023
模型介绍
内容详情
替代品

模型简介

该模型是Whisper Large V3的蒸馏版本,专门针对马来西亚地区的语音数据进行了优化训练,提高了对马来语等当地语言的识别准确率。

模型特点

马来西亚本地化优化
使用马来西亚本地数据集训练,对马来语等当地语言有更好的识别效果
高效蒸馏模型
通过HuggingFace标准蒸馏流程优化,在保持性能的同时减小模型规模
多源训练数据
整合了IMDA官方数据集、YouTube伪标注数据、会话语料库等多种数据源

模型能力

马来语语音识别
多语言语音转文本
长音频处理

使用案例

语音转写服务
马来西亚本地媒体内容转录
为马来西亚YouTube视频、播客等内容提供自动转录服务
相比通用Whisper模型,对马来语口音和本地词汇有更好的识别率
教育辅助
马来语学习应用
用于开发马来语发音评估和语音交互学习工具