P

Phi 4 Mm Inst Asr Singlish

由 mjwong 开发
针对新加坡英语优化的多模态语音识别模型,基于微软Phi-4多模态指令模型微调,显著提升对新加坡英语独特语音特征的识别能力。
下载量 61
发布时间 : 5/1/2025
模型介绍
内容详情
替代品

模型简介

该模型致力于解决通用大语言模型对区域方言表征不足的问题,特别针对新加坡英语(Singlish)的语码转换和独特韵律进行优化,实现'听-理解-自然响应'的统一模型愿景。

模型特点

新加坡英语优化
专门针对新加坡英语的语码转换和独特韵律特征进行优化,显著提升识别准确率。
多模态能力
基于Phi-4多模态指令模型,具备音频和文本的多模态处理能力。
高效微调
仅解冻音频相关模块进行训练,保持核心语言理解能力的同时高效适配新加坡英语。
智能终止
通过结束标记训练,模型能准确判断转录结束点,避免冗余输出。

模型能力

新加坡英语语音识别
多模态理解
语音转录
语音优先智能体开发

使用案例

语音转录
新加坡英语对话转录
将包含新加坡英语特色的日常对话转录为文本
词错误率(WER)低至13.16%
智能助手
新加坡英语语音助手
开发能理解新加坡英语口音的语音优先智能助手
实现'听-理解-自然响应'的统一模型