W

Whisper Base.kk

由 akuzdeuov 开发
Whisper-base是针对低资源哈萨克语的自动语音识别(ASR)模型,在哈萨克语音语料库2上微调,包含超过1千小时的标注数据。
下载量 43
发布时间 : 8/14/2024
模型介绍
内容详情
替代品

模型简介

这是一个仅支持哈萨克语的语音识别模型,基于Whisper架构,专为哈萨克语语音转文本任务优化。

模型特点

低资源语言优化
专门针对哈萨克语这类低资源语言进行优化,在有限数据下实现良好性能
工业级语料训练
使用超过1千小时的工业级哈萨克语音语料库(KSC2)进行训练
长音频处理
支持通过分块算法处理任意长度的音频输入

模型能力

哈萨克语语音识别
长音频转录
批量语音处理

使用案例

语音转录
哈萨克语会议记录
将哈萨克语会议录音自动转录为文字记录
测试集WER 15.36%
媒体内容字幕生成
为哈萨克语视频内容自动生成字幕