Whisper Medium Jp

由 vumichien 开发

基于openai/whisper-medium在common_voice_11_0数据集上微调的日语语音识别模型

语音识别

Transformers

日语

开源协议:Apache-2.0 #日语语音识别 #低词错误率 #多场景适配

下载量 4,542

发布时间 : 12/7/2022

模型介绍

内容详情

替代品

模型简介

这是一个针对日语优化的自动语音识别(ASR)模型，在Common Voice 11.0日语数据集上进行了微调，能够将日语语音转换为文本。

模型特点

日语优化

专门针对日语语音识别进行了微调，在日语测试集上表现优异

低词错误率

在Common Voice日语测试集上词错误率(WER)仅为9.04%

多数据集验证

在Common Voice和Fleurs两个日语测试集上都进行了性能评估

模型能力

日语语音识别

语音转文本

自动语音转录

使用案例

语音转录

日语会议记录

将日语会议录音自动转换为文字记录

准确率约90%

日语播客转录

将日语播客内容转录为文本

语音助手

日语语音命令识别

用于日语语音助手的命令识别系统

训练损失	周期数	步数	验证损失	词错误率
0.0392	3.03	1000	0.2023	10.1807
0.0036	7.01	2000	0.2478	9.4409
0.0013	10.04	3000	0.2791	9.1014
0.0002	14.01	4000	0.2970	9.0625
0.0002	17.04	5000	0.3029	9.0355

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

AIbase是一个专注于MCP服务的平台，为AI开发者提供高质量的模型上下文协议服务，助力AI应用开发。

简体中文

热门模型

Llama 3 Typhoon V1.5x 8b Instruct

Cadet Tiny

Roberta Base Chinese Extractive Qa

热门模型分类

热门标签

Whisper Medium Jp

模型简介

模型特点

模型能力

使用案例

openai/whisper-medium

模型描述

预期用途与限制

训练与评估数据

训练流程

训练超参数

训练结果

框架版本