xls-r-300m-et开源爱沙尼亚语语音识别模型 - 超800小时数据训练超实用

首页

Xls R 300m Et

由 TalTechNLP 开发

基于facebook/wav2vec2-xls-r-300m微调的爱沙尼亚语自动语音识别模型，使用约800小时多样化数据训练

语音识别

Transformers

其他#爱沙尼亚语识别 #广播语音优化 #低CER

下载量 58

发布时间 : 3/2/2022

模型简介

这是一个通用爱沙尼亚语ASR模型，主要用于广播对话、访谈、讲座等场景的语音识别

模型特点

多样化训练数据

使用约800小时多样化的爱沙尼亚语数据训练，包括广播语音、自发语音、老年人语音等多种类型

良好性能表现

在Common Voice等测试集上WER为12.5-13.4%，CER为2.7-3.0%，表现优异

专注爱沙尼亚语

专门针对爱沙尼亚语优化，相比通用多语言模型在爱沙尼亚语识别上有更好表现

模型能力

爱沙尼亚语语音识别

广播语音转录

讲座内容转录

使用案例

媒体内容处理

广播节目转录

将广播对话、访谈等内容转录为文字

WER 6.1-7.9%

教育应用

讲座内容记录

将讲座、演讲内容自动转录为文字

类型	时长（小时）
广播语音	591
自然语音	53
老年人语音语料库	53
演讲、讲座	49
议会演讲	31
总计	761

数据集	字错率（WER）
jutusaated.devset	7.9
jutusaated.testset	6.1
Common Voice 6.1	12.5
Common Voice 8.0	13.4

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Xls R 300m Et

模型简介

模型特点

模型能力

使用案例

🚀 XLS-R-300m-ET

🚀 快速开始

✨ 主要特性

📚 详细文档

预期用途与限制

使用方法

局限性和偏差

📦 安装指南

💻 使用示例

🔧 技术细节

训练数据

训练过程

📄 许可证

📈 评估结果

字错率（WER）