🚀 open-vakgyata
open-vakgyata是一个开源的语言识别模型,能够从语音输入中检测和分类印度语言,为印度多语言语音处理提供了有效的解决方案。
🚀 快速开始
安装依赖
你可以使用以下代码来加载模型和处理器:
from transformers import Wav2Vec2ForSequenceClassification, AutoFeatureExtractor
import torch
device = "cpu"
model_id = "onecxi/open-vakgyata"
processor = AutoFeatureExtractor.from_pretrained(model_id)
model = Wav2Vec2ForSequenceClassification.from_pretrained(model_id).to(device)
推理示例
以下是一个推理的代码示例:
import torchaudio
audio, sr = torchaudio.load("path/to/audio.wav")
inputs = processor(audio.flatten(), sampling_rate=sr, return_tensors="pt").to(device)
with torch.no_grad():
logits = model(**inputs).logits
probs = logits.softmax(dim=-1).cpu().numpy()
language = model.config.id2label.get(probs.argmax())
print(language)
✨ 主要特性
- 支持多种印度语言的识别,包括英语(印度)、印地语、奥里亚语、孟加拉语等。
- 基于transformers库构建,易于集成和使用。
- 可用于语音分析、呼叫中心AI等多个领域。
📦 安装指南
本模型基于transformers
库,你可以通过以下命令安装依赖:
pip install transformers torch torchaudio
💻 使用示例
基础用法
from transformers import Wav2Vec2ForSequenceClassification, AutoFeatureExtractor
import torch
device = "cpu"
model_id = "onecxi/open-vakgyata"
processor = AutoFeatureExtractor.from_pretrained(model_id)
model = Wav2Vec2ForSequenceClassification.from_pretrained(model_id).to(device)
高级用法
import torchaudio
audio, sr = torchaudio.load("path/to/audio.wav")
inputs = processor(audio.flatten(), sampling_rate=sr, return_tensors="pt").to(device)
with torch.no_grad():
logits = model(**inputs).logits
probs = logits.softmax(dim=-1).cpu().numpy()
language = model.config.id2label.get(probs.argmax())
print(language)
📚 详细文档
支持的语言
语言 |
代码 |
英语(印度) |
en-IN |
印地语 |
hi-IN |
奥里亚语 |
or-IN |
孟加拉语 |
bn-IN |
泰米尔语 |
ta-IN |
泰卢固语 |
te-IN |
卡纳达语 |
kn-IN |
马拉雅拉姆语 |
ml-IN |
马拉地语 |
mr-IN |
古吉拉特语 |
gu-IN |
规格说明
- 支持的采样率:16000
- 推荐的音频格式:16kHz,16位PCM
🔧 技术细节
open-vakgyata基于Wav2Vec2ForSequenceClassification
模型,利用transformers
库进行构建。该模型能够对语音输入进行处理,通过分类器输出不同语言的概率,从而实现语言识别的功能。
📄 许可证
本模型使用CC BY-NC 4.0许可证。
📋 引用
如果你在研究或应用中使用了本模型,请考虑引用以下内容:
@misc{vakgyata2024,
title={vakgyata: Language Identification for Indian Speech},
author={OneCXI},
year={2024},
url={https://huggingface.co/onecxi/open-vakgyata}
}