I

Ipa Whisper Base

由 neurlang 开发
基于Whisper-base微调的多语言语音识别模型,支持国际音标(IPA)输出
下载量 599
发布时间 : 4/11/2025
模型介绍
内容详情
替代品

模型简介

该模型是基于OpenAI Whisper-base架构微调的自动语音识别(ASR)模型,专门针对国际音标(IPA)转录任务进行了优化,支持多种语言的语音转IPA符号

模型特点

多语言IPA转录
能够将多种语言的语音直接转录为国际音标符号
基于Whisper架构
利用Whisper强大的预训练基础,具备良好的泛化能力
长音频处理
支持通过分块算法处理任意长度的音频输入

模型能力

语音转国际音标
多语言语音识别
长音频转录
时间戳预测

使用案例

语言学分析
语音学研究
用于语音学研究中将语音样本转换为标准音标符号
提供准确的音标转录结果
语言教育
发音教学辅助
帮助语言学习者分析发音并对比标准音标
可视化发音差异