W

Whisper Hindi2Hinglish Swift

由 Oriserve 开发
基于Whisper架构优化的印地语-印地英语混合语音识别模型,专为印度口音和噪声环境优化
下载量 496
发布时间 : 1/7/2025
模型介绍
内容详情
替代品

模型简介

该模型是Whisper-base的微调版本,专注于将印地语语音转录为口语化的印地英语混合文本,适用于印度地区的语音识别场景

模型特点

印地英语混合语言支持
新增将音频转录为口语化印地英语混合文本的能力,减少语法错误概率
噪声环境优化
针对印度常见背景噪声环境特别优化,提升嘈杂场景下的识别准确率
幻觉抑制
通过训练技术最小化转录幻觉,提升输出文本的准确性
动态层冻结技术
采用创新的训练技术实现快速收敛和高效微调

模型能力

印地语语音识别
印地英语混合文本生成
噪声环境下的语音转录
长音频处理

使用案例

语音转写服务
客服电话转录
将印度地区的客服通话内容转录为文字记录
在噪声环境下保持较高识别准确率
会议记录
自动生成印地英语混合的会议纪要
支持多人对话场景
语音助手
本地化语音指令识别
为印度地区用户提供更准确的语音指令识别
支持印地英语混合口语表达