S

SIMS Llama3.2 3B

由 slprl 开发
该模型是基于Llama-3.2-3B微调的语音语言模型,专注于分析交错语音-文本SLM的扩展性,支持语音和文本的生成任务。
下载量 54
发布时间 : 4/2/2025
模型介绍
内容详情
替代品

模型简介

这是一个语音语言模型(SLM),用于在给定语音-文本提示的情况下,基于离散的Hubert标记生成语音或文本延续。

模型特点

高效扩展性
通过交错语音-文本初始化,显著提高了计算扩展效率,相比纯语音SLM更高效。
知识迁移
从预训练的文本语言模型(TextLM)初始化,实现了知识迁移,提升了模型性能。
多模态支持
支持语音和文本的生成任务,能够处理跨模态任务,如根据语音提示生成文本延续。

模型能力

语音生成
文本生成
跨模态任务处理

使用案例

语音生成
语音片段延续
根据给定的语音提示生成语音片段的延续。
跨模态任务
语音到文本生成
根据语音提示生成文本延续。