P

Phi 4 Multimodal Instruct Commonvoice Zh Tw

由 JacobLinCool 开发
基于microsoft/Phi-4-multimodal-instruct微调的台湾普通话语音识别模型,在台湾普通话通用语音19.0数据集上训练
下载量 28
发布时间 : 3/13/2025

模型简介

针对台湾普通话(zh-TW)优化的自动语音识别模型,能够将台湾普通话语音转换为繁体中文文本

模型特点

台湾普通话优化
专门针对台湾普通话的语音模式和词汇进行优化
多模态能力
基于多模态基础模型,具备处理音频输入的能力
高效微调
使用LoRA适配器进行高效微调,保留基础模型能力的同时优化语音识别性能

模型能力

台湾普通话语音识别
音频转文本
自动字幕生成

使用案例

语音转文字
会议记录
将台湾普通话会议录音转换为文本记录
CER 6.67%, WER 31.18%
内容字幕
为台湾普通话视频内容生成自动字幕
AIbase
智启未来,您的人工智能解决方案智库
简体中文