W

Wavlm Bart

由 nguyenvulebinh 开发
一个支持英语自动语音识别(ASR)的序列到序列模型,能够输出规范化文本、标注时间戳以及多说话人分段。
下载量 24
发布时间 : 5/23/2023
模型介绍
内容详情
替代品

模型简介

该模型基于wav2vec2和bartpho架构,主要用于英语语音识别任务,支持输出带有时间戳的文本和多说话人分段。

模型特点

时间戳标注
能够为识别的文本标注精确的时间戳
多说话人分段
支持识别和分段不同说话人的语音
规范化文本输出
输出经过规范化的文本结果

模型能力

英语语音识别
时间戳标注
多说话人分段

使用案例

语音转录
会议记录
将会议录音转换为带时间戳的文本记录
准确识别发言内容并标注发言时间点
访谈转录
转录访谈录音并区分不同说话人
自动分段不同访谈对象的发言