V

Vakyansh Wav2vec2 Tamil Tam 250

由 Harveenchadha 开发
基于Wav2Vec2架构的泰米尔语自动语音识别模型,由Harveen Chadha开发,在4200小时印地语数据上微调
下载量 1,843
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是专为泰米尔语设计的自动语音识别(ASR)系统,基于Facebook的Wav2Vec2架构,通过多语言预训练模型CLSRIL-23微调而来

模型特点

多语言预训练基础
基于CLSRIL-23多语言模型微调,具有跨语言迁移学习能力
大规模训练数据
使用4200小时的标注语音数据进行训练
无语言模型依赖
直接输出识别结果,无需结合外部语言模型
开源可用
完整训练代码和模型权重已开源

模型能力

泰米尔语语音识别
16kHz音频处理
端到端语音转文本

使用案例

语音转录
泰米尔语语音转写
将泰米尔语语音内容转换为文本
词错误率53.64%(Common Voice测试集)
语音助手
泰米尔语语音指令识别
为泰米尔语语音助手提供基础识别能力