M

Meralion AudioLLM Whisper SEA LION

由 MERaLiON 开发
专为新加坡多语言多元文化环境定制的语音-文本大语言模型,整合Whisper-large-v2语音编码器和SEA-LION V3文本解码器
下载量 2,828
发布时间 : 11/22/2024
模型介绍
内容详情
替代品

模型简介

针对新加坡本地口音和方言的多样化语言细微差别进行优化,支持多种语音文本转换任务

模型特点

本地化优化
专门针对新加坡本地口音、方言和语码转换进行优化
多任务支持
支持6种不同语音文本转换任务
高效推理
支持vLLM框架实现闪电级推理速度
大规模训练
基于26万小时语音音频数据进行训练

模型能力

语音识别
语音翻译
口语问答
对话摘要
语音指令理解
副语言学分析

使用案例

语音转录
句子级语音识别
将单句语音转换为文本
准确转录新加坡口音的英语
对话级语音识别
将对话语音转换为带说话人标签的文本
支持多说话人识别和语码转换
语音理解
口语对话摘要
从对话语音中提取关键信息生成摘要
准确捕捉对话核心内容