F

Falcon H1 1.5B Deep Base

由 tiiuae 开发
Falcon-H1是由TII开发的高效混合架构语言模型,结合Transformer与Mamba架构,支持多语言任务
下载量 194
发布时间 : 5/1/2025
模型介绍
内容详情
替代品

模型简介

因果仅解码器架构的混合Transformer+Mamba模型,专注于高效推理和多语言处理能力

模型特点

混合架构创新
结合Transformer的注意力机制与Mamba架构的高效序列建模能力
多语言支持
原生支持18种语言处理,包括东亚和阿拉伯语系
高效推理
在1B参数级别实现超越同类模型的推理效率

模型能力

多语言文本生成
复杂推理任务处理
编程代码生成
数学问题求解
科学知识问答

使用案例

教育
多语言学习助手
支持18种语言的互动式学习
在MMLU多语言理解基准中表现优异
研发
科研辅助
处理STEM领域复杂问题
在MMLU-Pro科学基准测试中达41.07分