U

Ultravox V0 4 1 Llama 3 3 70b

由 fixie-ai 开发
Ultravox是一个基于Llama3.3-70B-Instruct和whisper-large-v3-turbo构建的多模态语音大语言模型,能够同时处理语音和文本输入。
下载量 26
发布时间 : 12/16/2024
模型介绍
内容详情
替代品

模型简介

Ultravox是一个多模态模型,能够同时接收语音和文本输入,可用于语音代理、语音到语音翻译、口语音频分析等任务。

模型特点

多模态输入
能够同时接收语音和文本输入,处理包含特殊伪标记的文本提示。
多语言支持
支持15种语言的语音和文本处理。
高效训练
仅训练多模态适配器,Whisper编码器和Llama保持冻结状态,提高训练效率。

模型能力

语音识别
文本生成
语音到语音翻译
口语音频分析

使用案例

语音代理
语音助手
作为语音助手回答用户问题。
语音翻译
多语言语音翻译
将一种语言的语音翻译成另一种语言的文本或语音。
在英语-阿拉伯语翻译中BLEU得分19.64