Falcon-H1-7B-Base开源语言模型 - 免费部署支持多语言处理，性能优异

首页

Falcon H1 7B Base

由 tiiuae 开发

Falcon-H1是由TII开发的混合Transformers + Mamba架构的因果解码器专用语言模型，支持多语言处理，性能优异。

大型语言模型

Transformers

支持多种语言开源协议:其他 #混合架构Transformers-Mamba #多语言推理 #高效数学计算

下载量 227

发布时间 : 5/1/2025

模型简介

Falcon-H1是一个高效的混合架构语言模型，结合了Transformers和Mamba的优势，适用于多种自然语言处理任务。

模型特点

混合架构

结合Transformers和Mamba架构的优势，提高模型效率和性能。

多语言支持

支持18种语言，包括英语、中文、法语、德语等。

高性能

在多种基准测试中表现优异，特别是在推理和数学任务上。

模型能力

文本生成

多语言处理

推理任务

数学计算

代码生成

使用案例

通用任务

问答系统

用于构建高效的问答系统，回答复杂问题。

在BBH和MMLU基准测试中表现优异。

文本生成

生成高质量、连贯的文本内容。

在HellaSwag和Winogrande基准测试中表现良好。

数学与科学

数学问题求解

解决复杂的数学问题，包括GSM8k和MATH lvl5任务。

在GSM8k和MATH lvl5基准测试中表现突出。

科学问答

回答科学相关的问题，特别是在MMLU-Pro和MMLU-stem任务中。

在GPQA和MMLU-Pro基准测试中表现优异。

代码生成

代码补全

生成高质量的代码片段，支持多种编程语言。

在HumanEval和MBPP基准测试中表现良好。

🚀 大语言模型Falcon-H1

Falcon-H1是由https://www.tii.ae开发的一系列大语言模型，采用混合Transformer + Mamba架构，支持多语言，在多种任务中表现出色，能为自然语言处理相关工作提供强大助力。

🚀 快速开始

目前，要使用此模型，你可以依赖Hugging Face的transformers、vLLM或我们自定义的llama.cpp库分支。

推理

请确保安装最新版本的transformers或vLLM，必要时从源代码安装这些包：

pip install git+https://github.com/huggingface/transformers.git

有关从源代码构建vLLM的更多详细信息，请参考官方vLLM文档。

🤗 transformers

参考以下代码片段，使用🤗 transformers运行H1模型：

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "tiiuae/Falcon-H1-1B-Base"

model = AutoModelForCausalLM.from_pretrained(
  model_id,
  torch_dtype=torch.bfloat16,
  device_map="auto"
)

# Perform text generation

vLLM

对于vLLM，只需执行以下命令启动服务器：

# pip install vllm
vllm serve tiiuae/Falcon-H1-1B-Instruct --tensor-parallel-size 2 --data-parallel-size 1

`llama.cpp`

虽然我们正在努力将我们的架构直接集成到llama.cpp库中，但你可以安装我们的库分支并直接使用：https://github.com/tiiuae/llama.cpp-Falcon-H1，使用与llama.cpp相同的安装指南。

✨ 主要特性

多语言支持：支持阿拉伯语（ar）、捷克语（cs）、德语（de）、英语（en）等多种语言。
优秀架构：采用混合Transformer + Mamba架构。
广泛任务适用性：在推理任务等多种任务中表现出色。

📦 安装指南

安装`transformers`

pip install git+https://github.com/huggingface/transformers.git

安装`vLLM`

pip install vllm

安装`llama.cpp`分支

参考https://github.com/tiiuae/llama.cpp-Falcon-H1的安装指南。

💻 使用示例

基础用法

使用transformers库进行文本生成：

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "tiiuae/Falcon-H1-1B-Base"

model = AutoModelForCausalLM.from_pretrained(
  model_id,
  torch_dtype=torch.bfloat16,
  device_map="auto"
)

# Perform text generation

高级用法

使用vLLM启动服务器：

# pip install vllm
vllm serve tiiuae/Falcon-H1-1B-Instruct --tensor-parallel-size 2 --data-parallel-size 1

📚 详细文档

模型详情

模型描述

开发者：https://www.tii.ae
模型类型：因果解码器
架构：混合Transformer + Mamba架构
语言（NLP）：英语、多语言
许可证：Falcon-LLM许可证

训练详情

有关此模型训练协议的更多详细信息，请参考Falcon-H1技术博客文章。

评估

Falcon-H1系列在各种任务中表现出色，包括推理任务。

任务	Falcon-H1-7B	Qwen3-8B	Qwen2.5-7B	Gemma3-12B	Llama3.1-8B	Falcon3-7B	Falcon3-10B
通用
BBH	60.61	58.44	53.72	54.33	46.52	50.88	59.3
MMLU	77.38	76.63	74.17	74.23	65.17	69.98	73.22
ARC-C	65.19	67.75	63.91	67.58	57.68	62.71	67.49
HellaSwag	81.26	79.6	80.2	84.22	81.97	76.69	79.64
Winogrande	79.01	76.8	76.01	79.79	77.11	73.64	79.01
数学
GSM8k	73.46	83.02	83.09	71.19	49.51	76.95	82.11
MATH lvl5	34.67	28.85	22.58	17.22	6.57	20.09	25.38
科学
GPQA	36.58	35.65	32.3	34.56	31.46	35.07	35.4
MMLU-Pro	48.38	48.25	43.55	42.72	32.71	39.23	42.45
MMLU-stem	77.2	78.53	71.04	68.51	55.72	67.71	70.85
代码
HumanEval	67.68	87.8	57.32	45.12	39.02	50.0	51.83
HumanEval+	63.41	82.32	48.78	36.59	31.71	43.29	44.51
MBPP	78.57	75.13	76.72	73.02	61.38	67.99	73.54
MBPP+	67.2	64.02	63.49	59.79	51.32	57.14	61.38

你可以在我们的发布博客文章中查看更详细的基准测试。

有用链接

查看我们的发布博客文章。
如果你有任何问题或想与我们的研究人员和开发人员交流，请随时加入我们的Discord服务器。

🔧 技术细节

有关此模型训练协议的更多详细信息，请参考Falcon-H1技术博客文章。

📄 许可证

本项目使用Falcon-LLM许可证，详情请见https://falconllm.tii.ae/falcon-terms-and-conditions.html。

📚 引用

如果Falcon-H1系列模型对你的工作有帮助，请引用：

@misc{tiifalconh1,
    title = {Falcon-H1: A Family of Hybrid-Head Language Models Redefining Efficiency and Performance},
    url = {https://falcon-lm.github.io/blog/falcon-h1},
    author = {Falcon-LLM Team},
    month = {May},
    year = {2025}
}