W

Wav2vec2 Xlsr Multilingual 56

由 voidful 开发
这是一个支持56种语言的多语言自动语音识别(ASR)模型,基于facebook/wav2vec2-large-xlsr-53在通用语音数据集上微调而成。
下载量 21.69k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型用于多语言自动语音识别任务,支持包括阿拉伯语、中文、英语、法语等在内的56种语言。

模型特点

多语言支持
支持56种语言的语音识别,覆盖广泛的语言需求
基于XLSR架构
基于facebook/wav2vec2-large-xlsr-53模型微调,具有强大的语音识别能力
通用语音数据集
使用通用语音(Common Voice)数据集进行训练,数据来源广泛

模型能力

自动语音识别
多语言语音转文本
语音内容分析

使用案例

语音转写
多语言会议记录
将多语言会议录音自动转写为文本
支持56种语言的语音转写
语音助手
为多语言语音助手提供语音识别能力
语音分析
语音内容分析
分析语音内容中的关键词和主题