wav2vec2-from-scratch-finetune-dummy开源模型 - 实现印尼语自动语音识别功能

首页

Wav2vec2 From Scratch Finetune Dummy

由 inergi 开发

这是一个基于XLSR Wav2Vec2架构的印度尼西亚语自动语音识别模型，由cahya开发并在通用语音印度尼西亚语数据集上微调。

语音识别

Transformers

其他开源协议:Apache-2.0 #印尼语语音识别 #XLSR微调 #低词错误率

下载量 15

发布时间 : 3/2/2022

模型简介

该模型专门用于印度尼西亚语的自动语音识别任务，能够将印度尼西亚语语音转换为文本。

模型特点

XLSR微调

基于XLSR Wav2Vec2架构进行微调，优化了印度尼西亚语的识别性能

低词错误率

在通用语音印度尼西亚语测试集上达到25.86%的词错误率(WER)

多语言基础

基于跨语言语音表示学习(XLSR)的预训练模型，具有良好的语音特征提取能力

模型能力

印度尼西亚语语音识别

语音转文本

使用案例

语音转录

会议记录

将印度尼西亚语的会议录音自动转录为文字记录

准确率约74.14%(基于WER指标)

语音助手

为印度尼西亚语语音助手提供语音识别能力

教育

语言学习应用

帮助学习者练习印度尼西亚语发音和听力

属性	详情
模型类型	用于自动语音识别的模型
训练数据	Common Voice（印尼语）
评估指标	词错误率（WER）
标签	音频、自动语音识别、语音、XLSR微调周
许可证	Apache-2.0

任务名称	任务类型	数据集名称	数据集类型	评估指标	指标值
语音识别	自动语音识别	Common Voice id	common_voice	测试WER	25.86

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Wav2vec2 From Scratch Finetune Dummy

模型简介

模型特点

模型能力

使用案例

🚀 Dummy Model New

📚 详细文档

模型信息

模型表现

模型名称

📄 许可证