W

Wav2vec2 Large Xlsr 300m Nepali

由 shniranjan 开发
这是一个基于Wav2Vec2架构的尼泊尔语语音识别模型,支持将尼泊尔语语音转换为文本。
下载量 15
发布时间 : 4/10/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于尼泊尔语的语音转文本任务,基于Facebook的Wav2Vec2架构和XLSR-300M预训练模型进行微调。

模型特点

尼泊尔语专用
专门针对尼泊尔语优化的语音识别模型
基于Wav2Vec2架构
采用Facebook的Wav2Vec2架构,具有强大的语音特征提取能力
无需语言模型
可直接使用,不需要额外的语言模型支持

模型能力

尼泊尔语语音识别
语音转文本

使用案例

语音转录
尼泊尔语语音转录
将尼泊尔语语音内容转换为可编辑的文本格式
准确的文本转录结果
语音助手
尼泊尔语语音助手
为尼泊尔语用户提供语音交互能力
实现语音指令识别