W

Wav2vec2 Large Xls R 300m Hi

由 anuragshas 开发
该模型是基于facebook/wav2vec2-xls-r-300m在通用语音数据集上微调的版本,主要用于语音识别任务。
下载量 22
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于wav2vec2架构的语音识别模型,经过微调后适用于特定语言的语音转文本任务。

模型特点

高效语音识别
基于wav2vec2-xls-r-300m架构,提供高效的语音转文本能力
微调优化
在通用语音数据集上进行微调,优化了识别性能
大规模预训练
基于300M参数的大规模预训练模型

模型能力

语音识别
语音转文本

使用案例

语音处理
语音转录
将语音内容转换为文本
词错误率0.7181
语音助手
作为语音助手的基础识别组件