W

Whisper Hindi2Hinglish Prime

由 Oriserve 开发
基于Whisper架构优化的印地语-印英混合语自动语音识别模型,支持噪声环境下的高精度转录
下载量 1,812
发布时间 : 1/7/2025
模型介绍
内容详情
替代品

模型简介

该模型是专为印度口音设计的语音识别系统,能够将印地语和印英混合语(Hinglish)的音频准确转录为文本,特别优化了噪声环境下的识别能力和幻听抑制功能

模型特点

印英混合语支持
新增将音频转录为口语化印英混合语的能力,减少语法错误
抗噪能力增强
针对印度本土高噪声环境优化,显著提升噪声场景下的识别准确率
幻听抑制
通过特殊训练策略大幅降低语音识别中的幻听现象
性能提升
相比原始Whisper模型,在基准测试集上平均性能提升约39%
印度口音适配
使用550小时印度口音数据进行微调,特别适应印度本土语音特征

模型能力

印地语语音识别
印英混合语转录
噪声环境语音处理
长音频分段处理
多说话人识别

使用案例

语音转录服务
客服通话记录转录
将印度地区客服中心的印英混合语通话转录为文本
在噪声环境下WER降低至32.43%
教育内容字幕生成
为印度本土教育视频自动生成字幕
支持印地语和印英混合语的双语字幕
语音助手
印度方言语音助手
支持印度用户使用印英混合语与语音助手交互
准确理解口语化表达