Fine-Tune-XLSR-Wav2Vec2-Speech2Text-Vietnamese开源模型 - 精准修复越南语语音识别结果

首页

Fine Tune XLSR Wav2Vec2 Speech2Text Vietnamese

由 leduytan93 开发

这是一个基于MT5架构的越南语自动语音识别(ASR)修复模型，针对越南语语音识别任务进行了微调。

语音识别其他开源协议:Apache-2.0 #越南语语音识别 #XLSR微调 #低词错误率

下载量 25

发布时间 : 3/2/2022

模型简介

该模型主要用于越南语的自动语音识别任务，能够将越南语语音转换为文本。模型在Common Voice越南语数据集上进行了微调，词错误率(WER)为25.2%。

模型特点

越南语语音识别

专门针对越南语优化的语音识别能力

基于MT5架构

使用MT5模型架构进行语音识别任务

在Common Voice上微调

使用Common Voice越南语数据集进行微调

模型能力

越南语语音识别

语音转文本

使用案例

语音转录

越南语语音转录

将越南语语音内容转换为文本

词错误率25.2%

语音助手

越南语语音助手

用于构建越南语语音助手系统

属性	详情
数据集名称	Common Voice、FOSD
数据集链接	Common Voice；FOSD

属性	详情
模型名称	MT5 Fix Asr Vietnamese by Ontocord
任务类型	自动语音识别
数据集	Common Voice vi
评估指标	测试集词错误率（Test WER）
指标值	25.207182

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Fine Tune XLSR Wav2Vec2 Speech2Text Vietnamese

模型简介

模型特点

模型能力

使用案例

🚀 MT5 Fix Asr Vietnamese by Ontocord

📚 详细文档

数据集

评估指标

标签

模型信息

许可证