I

Ichigo Llama3.1 S Instruct V0.4

由 Menlo 开发
基于Llama-3架构的多模态语言模型,支持音频和文本输入理解,在嘈杂环境下具有更强的鲁棒性和多轮对话能力。
下载量 44
发布时间 : 11/8/2024
模型介绍
内容详情
替代品

模型简介

该模型是Homebrew Research开发的Ichigo-llama3s系列模型之一,通过监督微调增强了音频理解能力,适用于研究应用。

模型特点

多模态输入支持
原生支持音频和文本输入理解
噪声环境鲁棒性
在嘈杂环境输入下表现出更强的鲁棒性
增强多轮对话
通过训练数据增强多轮对话能力

模型能力

音频理解
文本生成
多轮对话
噪声环境处理

使用案例

语音交互研究
嘈杂环境语音理解
在背景噪声较大的环境中准确理解语音指令
相比前代模型提升约10%的识别准确率
多轮语音对话系统
构建支持上下文理解的语音对话系统
在MMLU评估中获得64.66分