O

Owls 4B 180K

由 espnet 开发
OWLS是一套Whisper风格的模型,旨在帮助研究人员理解语音模型的扩展特性,支持多语言语音识别和翻译。
下载量 40
发布时间 : 2/14/2025
模型介绍
内容详情
替代品

模型简介

OWLS模型使用ESPnet开发,支持多语言语音识别、语音翻译、话语级对齐、长文本转录和语言识别。

模型特点

多语言支持
支持多种语言的语音识别和翻译任务。
大规模训练
在高达360K小时的公开语音数据上进行训练。
多样化任务支持
支持语音识别、语音翻译、话语级对齐、长文本转录和语言识别等多种任务。
开源工具包
使用ESPnet开发,完全开源,便于研究人员使用和扩展。

模型能力

语音识别
语音翻译
话语级对齐
长文本转录
语言识别

使用案例

语音处理
多语言语音识别
将多种语言的语音转换为文本。
跨语言语音翻译
将一种语言的语音翻译为另一种语言的文本。
语音分析
话语级对齐
分析语音中的话语边界和时间对齐。
语言识别
识别语音中的语言类型。