W

Whisper Small Tajik

由 abduaziz 开发
基于OpenAI Whisper-small微调的塔吉克语自动语音识别模型,在Google Fleurs数据集上训练,词错误率24.26%。
下载量 25
发布时间 : 1/20/2025
模型介绍
内容详情
替代品

模型简介

该模型是针对塔吉克语优化的自动语音识别(ASR)模型,适用于将塔吉克语语音转换为文本。

模型特点

塔吉克语优化
专门针对塔吉克语进行微调,相比原始Whisper模型有更好的本地语言识别能力
高效训练
使用相对较小的训练批次(16)和梯度累积(2步)实现高效训练
优化学习率调度
采用cosine学习率调度器配合0.1比例的预热,优化训练过程

模型能力

塔吉克语语音识别
语音转文本

使用案例

语音转录
塔吉克语会议记录
将塔吉克语会议录音自动转换为文字记录
词错误率约24.26%
语音助手
用于塔吉克语语音助手应用的语音识别模块
教育
语言学习应用
帮助学习者检查塔吉克语发音准确性