M

Mms Zeroshot 300m

由 mms-meta 开发
基于MMS零样本项目的检查点模型,能够转录几乎所有语言的语音,仅需少量目标语言的未标注文本。
下载量 48
发布时间 : 7/30/2024
模型介绍
内容详情
替代品

模型简介

该模型是一个多语言语音识别系统,通过少量目标语言的文本映射到中间表示,结合可选语言模型实现对新语言的转录。

模型特点

零样本语音识别
仅需少量目标语言的未标注文本即可转录新语言的语音。
多语言支持
支持1,150种语言的语音识别,覆盖广泛的语言范围。
中间表示转录
输出中间表示(uroman标记)的转录结果,便于后续处理。

模型能力

多语言语音识别
零样本学习
语音转录

使用案例

语音转录
多语言语音转录
将不同语言的语音转录为文本,适用于多语言环境下的语音处理。
高准确率的转录结果,支持多种语言。
语言学习
语言学习辅助
帮助语言学习者通过语音识别学习新语言的发音和拼写。
提供准确的语音到文本转换,辅助学习。