F

Falcon H1 1.5B Base

由 tiiuae 开发
Falcon-H1是由TII开发的混合Transformers + Mamba架构的仅解码因果模型,支持英语和多语言任务。
下载量 454
发布时间 : 5/1/2025
模型介绍
内容详情
替代品

模型简介

Falcon-H1是一个高效的混合架构语言模型,结合了Transformers和Mamba架构的优势,适用于多种自然语言处理任务。

模型特点

混合架构
结合Transformers和Mamba架构的优势,提高模型效率和性能。
多语言支持
支持英语和多语言任务,具有较强的语言理解能力。
高效推理
在多种推理任务上表现优异,包括数学和科学任务。

模型能力

文本生成
推理任务
多语言支持
代码生成

使用案例

通用任务
通用问答
用于回答各种通用问题,表现优于同类模型。
在BBH任务上得分为46.57,优于Qwen3-1.7B和Gemma3-1B等模型。
数学任务
数学推理
解决数学问题和推理任务。
在GSM8k任务上得分为52.01,在MATH lvl5任务上得分为20.39。
代码生成
代码生成
生成和补全代码片段。
在HumanEval任务上得分为50.0,在MBPP任务上得分为65.08。