A

Asr Hubert Cluster Bart Base

由 voidful 开发
基于Hubert和BART架构的自动语音识别模型,通过聚类特征转换实现语音到文本的转换
下载量 13
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型结合了Hubert的语音特征提取能力和BART的序列到序列转换能力,专门用于自动语音识别(ASR)任务。

模型特点

Hubert特征聚类
使用Hubert提取语音特征并通过k-means聚类进行编码
BART序列转换
利用BART模型将聚类特征序列转换为文本序列
高效语音处理
能够处理各种采样率的语音输入并转换为文本

模型能力

英语语音识别
语音特征提取
序列到文本转换

使用案例

语音转录
演讲转录
将演讲录音转换为文字记录
示例结果:'沿着泥泞的乡间小路行进,连续两周在潮湿的校舍里对着湿漉漉的听众演讲...'
语音助手
语音指令识别
识别并转换用户的语音指令为可执行命令