I

Ichigo Llama3.1 S Base V0.3

由 Menlo 开发
Llama3-S 是一个支持音频和文本输入的多模态语言模型,基于 Llama-3 架构开发,专注于提升语音理解能力。
下载量 18
发布时间 : 9/9/2024
模型介绍
内容详情
替代品

模型简介

该模型在扩展词汇表基础上进行了持续预训练,原生支持音频和文本输入,主要用于研究应用,特别是语音理解方面的能力提升。

模型特点

多模态输入支持
原生支持音频和文本输入,能够处理语音和文本数据。
语音理解优化
通过持续预训练和扩展词汇表,显著提升了语音理解能力。
高效训练
使用最新的 FSDP2 训练代码,优化了训练效率和资源利用。

模型能力

音频转文本
文本生成
语音理解

使用案例

研究应用
语音理解研究
用于研究大语言模型在语音理解方面的能力提升。