W

Wav2vec2 Bartpho

由 nguyenvulebinh 开发
这是一个支持越南语的自动语音识别模型,能够输出规范化文本、标记时间戳以及多说话人分段。
下载量 472
发布时间 : 10/5/2023
模型介绍
内容详情
替代品

模型简介

该模型基于wav2vec2和bartpho架构,专门用于越南语的自动语音识别任务,支持输出带时间戳的文本和多说话人分段。

模型特点

时间戳标记
能够为识别的文本标记精确的时间戳
多说话人分段
支持识别和分段不同说话人的语音
文本规范化
输出经过规范化的识别文本

模型能力

越南语语音识别
时间戳标记
多说话人分段
文本规范化输出

使用案例

语音转录
新闻转录
将越南语新闻广播转录为带时间戳的文本
示例输出中包含精确的时间标记和分段
会议记录
多说话人会议记录
自动识别会议中不同发言人的语音并分段
可区分不同说话人并标记发言时间