X

Xlsr Timit A0

由 KoelLabs 开发
基于XLSR预训练模型在TIMIT英语语料库上微调的音位转录模型,用于将英语音频转换为音位表征。
下载量 17
发布时间 : 12/1/2024

模型简介

本模型专门用于英语音频的音位级自动语音识别(ASR),可将语音信号转换为国际音标(IPA)符号序列。

模型特点

高精度音位转录
在TIMIT测试集上达到0.14的平均字符错误率(CER)
专业语音学标注
输出为国际音标(IPA)符号,适合语音学研究
轻量级微调
基于预训练XLSR模型进行高效微调,只需40个训练轮次

模型能力

英语语音识别
音位级转录
国际音标转换

使用案例

语音学研究
音位分析
自动生成语音样本的音位标注
提供精确到音位的语音分析结果
语音技术开发
ASR系统预训练
作为语音识别系统的音位特征提取器
提升下游ASR任务的性能
AIbase
智启未来,您的人工智能解决方案智库
简体中文