E

Exp W2v2t It No Pretraining S842

由 jonatasgrosman 开发
基于随机初始化的wav2vec2模型进行微调,用于意大利语语音识别任务,训练数据采用Common Voice 7.0(意大利语)的训练集分割部分。
下载量 18
发布时间 : 7/8/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个基于wav2vec2架构的自动语音识别(ASR)模型,专门针对意大利语进行优化。它不依赖预训练权重,直接从随机初始化状态开始训练。

模型特点

随机初始化训练
模型不依赖预训练权重,直接从随机初始化状态开始训练,适合特定语言的定制化开发
意大利语优化
专门针对意大利语语音识别任务进行优化,训练数据来自Common Voice 7.0意大利语数据集
16kHz采样率支持
模型处理16kHz采样率的语音输入,符合常见语音识别应用场景

模型能力

意大利语语音识别
语音转文本

使用案例

语音转录
意大利语语音转录
将意大利语语音内容转换为文本
语音助手
意大利语语音指令识别
用于意大利语语音助手系统中的指令识别