I

Instella 3B

由 amd 开发
AMD基于Instinct MI300X GPU训练的30亿参数全开放语言模型家族,性能超越同规模开放模型
下载量 3,048
发布时间 : 3/5/2025

模型简介

Instella是由AMD开发的完全开源语言模型系列,包含预训练、监督微调和DPO对齐版本,支持4096 tokens上下文长度

模型特点

全开放模型
完整公开模型权重、训练配置和数据集,促进社区协作
高性能
超越同规模全开放模型,接近开放权重模型性能
AMD硬件优化
基于Instinct MI300X GPU和ROCm软件栈专门优化
四阶段训练
包含预训练、增强训练、监督微调和DPO对齐的完整训练流程

模型能力

文本生成
指令跟随
问题解答
对话交互
知识推理

使用案例

智能助手
对话系统
构建能理解复杂指令的对话AI
在Alpaca评估中表现优异
教育研究
AI教学助手
解答学科问题并提供分步解释
在MMLU综合评估达到57.81分
AIbase
智启未来,您的人工智能解决方案智库
简体中文