F

Falcon H1 3B Base

由 tiiuae 开发
猎鹰H1是由阿联酋技术创新研究院开发的混合架构语言模型,结合Transformer与Mamba架构,支持多语言处理
下载量 334
发布时间 : 5/1/2025
模型介绍
内容详情
替代品

模型简介

基于混合Transformer与Mamba架构的因果解码模型,适用于多语言文本生成任务

模型特点

混合架构设计
结合Transformer与Mamba架构优势,提升模型效率与性能
多语言支持
支持18种语言的文本处理与生成
高效推理
在各类基准测试中展现出卓越的推理能力

模型能力

多语言文本生成
逻辑推理
数学计算
编程代码生成
科学问题解答

使用案例

教育
多语言学习助手
帮助学习者进行多语言翻译和语言学习
科研
科学问题解答
解答STEM领域的专业问题
在MMLU-stem测试中达到69.55分
软件开发
代码生成
根据自然语言描述生成编程代码
HumanEval测试得分59.15