M

Microllama

由 keeeeenw 开发
MicroLlama是一个由个人开发者keeeeenw在500美元预算内预训练的3亿参数Llama模型,专注于英语文本生成任务。
下载量 2,955
发布时间 : 3/29/2024
模型介绍
内容详情
替代品

模型简介

这是一个小型化的Llama模型,旨在证明在有限资源下也能训练出有效的大型语言模型。模型基于TinyLlama项目修改,移除了代码相关数据,专注于通用文本生成。

模型特点

低成本训练
在500美元预算内完成训练,证明小型化LLM的可行性
完全开源
使用完全开源的数据集和模型架构,无专有数据依赖
轻量级
仅3亿参数,适合资源有限的环境部署

模型能力

英语文本生成
问答系统
语言理解

使用案例

教育研究
小型LLM研究
作为研究资源受限环境下LLM表现的案例
证明小型模型也能达到一定性能
应用开发
轻量级聊天机器人
适用于移动端或边缘设备的对话应用