L

Llama 3 Typhoon V1.5 8b Audio Preview

由 scb10x 开发
Typhoon-Audio 预览版是一款支持泰语和英语的音频-语言模型,能够处理文本和音频输入,输出为文本。
下载量 218
发布时间 : 8/10/2024

模型简介

基于Typhoon-1.5-8b-instruct的多模态音频-语言模型,支持泰语和英语的音频转录、翻译和问答任务。

模型特点

多模态输入
原生支持文本和音频输入,输出为文本。
泰语优化
专门针对泰语进行优化,支持泰语音频转录和问答。
高性能
在泰语ASR、翻译和问答任务中表现优异,超越同类模型。

模型能力

音频转录
文本生成
语音指令理解
多语言翻译

使用案例

语音转录
泰语音频转录
将泰语语音内容转录为文本。
WER(词错误率)为14.17
翻译
英译泰
将英语语音或文本翻译为泰语。
BLEU分数为17.52
泰译英
将泰语语音或文本翻译为英语。
BLEU分数为24.14
问答
泰语口语问答
回答基于泰语语音的提问。
F1分数为64.60
AIbase
智启未来,您的人工智能解决方案智库
简体中文