whisper-hindi-small开源语音识别模型 - 免费部署精准识别印地语语音

首页

Whisper Hindi Small

由 vasista22 开发

基于OpenAI Whisper-small微调的印地语语音识别模型，在多个公开ASR语料库上训练

语音识别其他开源协议:Apache-2.0 #印地语语音识别 #低词错误率 #多场景适配

下载量 477

发布时间 : 1/8/2023

模型简介

这是一个专门针对印地语优化的自动语音识别(ASR)模型，基于OpenAI的Whisper-small架构微调而成。主要用于将印地语语音转换为文本。

模型特点

印地语优化

专门针对印地语语音识别进行微调优化

多数据集训练

在GramVaani、ULCA、Shrutilipi等多个公开印地语ASR语料库上训练

高效推理支持

支持使用whisper-jax进行加速推理

模型能力

印地语语音识别

长音频处理(支持分块处理)

使用案例

语音转写

印地语语音转录

将印地语语音内容转换为文本

🚀 印地语小型Whisper模型

本模型是基于多个公开可用的自动语音识别（ASR）语料库中的印地语数据，对 openai/whisper-small 进行微调后的版本。它是 Whisper 微调冲刺活动的一部分。

重要说明

本模型的训练代码可在 whisper-finetune 仓库中复用。

🚀 快速开始

若要在整个数据集上评估此模型，可使用 whisper-finetune 仓库中的评估代码。该仓库还提供了使用 whisper-jax 进行快速推理的脚本。

💻 使用示例

基础用法

若要使用此模型对单个音频文件进行推理，可使用以下代码片段：

>>> import torch
>>> from transformers import pipeline

>>> # path to the audio file to be transcribed
>>> audio = "/path/to/audio.format"
>>> device = "cuda:0" if torch.cuda.is_available() else "cpu"

>>> transcribe = pipeline(task="automatic-speech-recognition", model="vasista22/whisper-hindi-small", chunk_length_s=30, device=device)
>>> transcribe.model.config.forced_decoder_ids = transcribe.tokenizer.get_decoder_prompt_ids(language="hi", task="transcribe")

>>> print('Transcription: ', transcribe(audio)["text"])

高级用法

若要对 Whisper 模型进行快速推理，可使用 whisper-jax 库。请按照此处所述的必要安装步骤操作，然后使用以下代码片段：

>>> import jax.numpy as jnp
>>> from whisper_jax import FlaxWhisperForConditionalGeneration, FlaxWhisperPipline

>>> # path to the audio file to be transcribed
>>> audio = "/path/to/audio.format"

>>> transcribe = FlaxWhisperPipline("vasista22/whisper-hindi-small", batch_size=16)
>>> transcribe.model.config.forced_decoder_ids = transcribe.tokenizer.get_decoder_prompt_ids(language="hi", task="transcribe")

>>> print('Transcription: ', transcribe(audio)["text"])

📚 详细文档

训练和评估数据

训练数据：
评估数据：
- GramVaani ASR 语料库测试集
- Google/Fleurs 测试集

训练超参数

训练期间使用了以下超参数：

属性	详情
学习率	1.75e-05
训练批次大小	48
评估批次大小	32
随机种子	22
优化器	adamw_bnb_8bit
学习率调度器类型	linear
学习率调度器热身步数	20000
训练步数	19377（初始设置为 129180 步）
混合精度训练	True