M

Minillm 0.2B WithWudao

由 Tongjilibo 开发
MiniLLM是基于bert4torch框架开发的轻量级中文语言模型,覆盖预训练至指令微调全流程,具备基础对话能力
下载量 127
发布时间 : 4/25/2025
模型介绍
内容详情
替代品

模型简介

12层Transformer结构的轻量级中文语言模型,经过预训练和Alpaca指令微调,适用于基础对话场景

模型特点

全流程训练
完整实现预训练→指令微调→奖励建模→强化学习全流程
轻量高效
12层Transformer结构,单卡17G显存即可微调
框架兼容
训练使用bert4torch框架,推理兼容transformers

模型能力

中文文本生成
基础对话交互
指令跟随

使用案例

智能助手
日常问答
回答日常生活相关问题
生成符合常识的简短回答