vakyansh-wav2vec2旁遮普语语音识别模型 - 开源支持16kHz语音输入

首页

Vakyansh Wav2vec2 Punjabi Pam 10

由 Harveenchadha 开发

基于CLSRIL-23多语言预训练模型微调的旁遮普语自动语音识别模型，支持16kHz采样率的语音输入。

语音识别

Transformers

其他开源协议:MIT #旁遮普语语音识别 #多语言预训练微调 #无语言模型优化

下载量 96

发布时间 : 3/2/2022

模型简介

该模型是一个针对旁遮普语优化的自动语音识别系统，基于Wav2Vec2架构，适用于将旁遮普语语音转换为文本。

模型特点

多语言预训练基础

基于CLSRIL-23多语言预训练模型进行微调，具有强大的语音特征提取能力。

旁遮普语优化

专门针对旁遮普语进行优化，适合该语言的语音识别任务。

无语言模型支持

当前结果未使用语言模型，未来可通过添加语言模型进一步提高识别准确率。

模型能力

旁遮普语语音识别

16kHz采样率语音处理

使用案例

语音转文字

旁遮普语语音转录

将旁遮普语语音内容转换为文本格式

词错误率(WER)33.17

属性	详情
模型名称	Wav2Vec2 Vakyansh旁遮普语模型（由Harveen Chadha创建）
任务	语音识别（自动语音识别类型）
数据集	Common Voice hi（类型：common_voice，参数：pa）
评估指标	测试字错误率（WER）：33.17

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Vakyansh Wav2vec2 Punjabi Pam 10

模型简介

模型特点

模型能力

使用案例

🚀 Wav2Vec2 Vakyansh旁遮普语模型

🚀 快速开始

📚 详细文档

数据集

评估指标

标签

模型索引

📄 许可证