N

Nue Asr

由 rinna 开发
Nue ASR是一种端到端的日语语音识别模型,集成了预训练的语音和语言模型,识别准确度高且速度快。
下载量 722
发布时间 : 12/7/2023
模型介绍
内容详情
替代品

模型简介

该模型提供端到端的日语语音识别,识别准确度与最新的ASR模型相当。通过使用GPU,可以实现比实时更快的语音识别速度。

模型特点

端到端语音识别
集成了预训练的语音和语言模型,提供完整的端到端解决方案。
高性能
识别准确度与最新的ASR模型相当,且推理速度快于实时。
预训练模型集成
使用japanese-hubert-base和japanese-gpt-neox-3.6b的预训练权重初始化。
大规模训练数据
在约19,000小时的日语语音语料库ReazonSpeech v1上进行训练。

模型能力

日语语音识别
端到端语音转文本
实时语音处理

使用案例

语音转写
会议记录
将日语会议录音实时转写为文本
高准确度的会议记录文本
字幕生成
为日语视频内容自动生成字幕
同步的字幕文件
语音助手
日语语音指令识别
识别和理解日语语音命令
准确的指令识别