M

Mobilellm 1.5B

由 facebook 开发
MobileLLM是Meta开发的优化Transformer架构语言模型,专为资源受限的端侧应用设计,参数规模从125M到1.5B不等。
下载量 89
发布时间 : 11/26/2024
模型介绍
内容详情
替代品

模型简介

MobileLLM是一种自回归语言模型,采用优化的Transformer架构,专注于在资源受限的设备上实现高效性能。

模型特点

端侧优化设计
专为资源受限设备设计,通过架构优化实现高效推理
高性能小模型
在相同参数规模下显著超越同类模型性能
训练充分
所有模型均训练1T tokens数据量
技术集成
整合SwiGLU激活函数、分组查询注意力等多项先进技术

模型能力

文本生成
常识推理
零样本学习

使用案例

移动端应用
移动设备智能助手
在资源受限的移动设备上实现流畅的对话体验
研究
小模型性能研究
探索参数效率与模型性能的关系