K

Kamo Naoyuki Mini An4 Asr Train Raw Bpe Valid.acc.best

由 espnet 开发
这是一个基于ESPnet2框架训练的自动语音识别(ASR)预训练模型,使用mini-an4数据集训练,支持英文语音识别。
下载量 425
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个端到端的自动语音识别模型,能够将输入的语音信号转换为对应的文本内容。

模型特点

端到端语音识别
采用端到端架构,直接从语音信号转换为文本
基于ESPnet框架
使用ESPnet这一成熟的端到端语音处理工具包训练
BPE分词
使用字节对编码(BPE)进行文本处理

模型能力

英语语音识别
端到端语音转文本

使用案例

语音转录
会议记录转录
将英语会议录音自动转换为文字记录
语音指令识别
识别英语语音指令并转换为可执行命令