Hebrew-Gemma-11B-V2开源大语言模型 - 支持希伯来语/英语文本生成

首页

Hebrew Gemma 11B V2

由 yam-peleg 开发

Hebrew-Gemma-11B-V2 是一个开源的希伯来语/英语预训练生成文本大语言模型，拥有110亿参数，基于Google的Gemma-7B架构。

大型语言模型

Transformers

支持多种语言开源协议:其他 #希伯来语生成 #多语言大模型 #110亿参数

下载量 5,292

发布时间 : 3/16/2024

模型简介

该模型是对gemma-7b的继续预训练，扩展至更大规模，并在30亿额外英语和希伯来语文本数据上进行了训练。适用于广泛的自然语言处理任务，尤其专注于希伯来语的理解和生成。

模型特点

多语言支持

支持希伯来语和英语的双语文本生成和理解。

大规模预训练

在30亿额外英语和希伯来语文本数据上进行了训练，增强了语言理解和生成能力。

高性能

基于Google的Gemma-7B架构，拥有110亿参数，提供强大的语言处理能力。

模型能力

文本生成

希伯来语理解

英语理解

自然语言处理

使用案例

自然语言处理

希伯来语文本生成

生成高质量的希伯来语文本，适用于内容创作、翻译等场景。

英语文本生成

生成高质量的英语文本，适用于内容创作、翻译等场景。

🚀 希伯来语-Gemma-11B-V2

希伯来语-Gemma-11B-V2 是希伯来语-Gemma-11B 的更新版本，经过了更长时间的训练，并修复了一些漏洞。该模型是基于谷歌的 Gemma-7B 架构的开源大语言模型（LLM），是一个拥有 110 亿参数的希伯来语/英语预训练生成式文本模型。它在 gemma-7b 的基础上继续预训练，扩展到了更大的规模，并在 30 亿额外的英语和希伯来语文本数据上进行了训练。最终得到的 Gemma-11B 是一个强大的通用语言模型，适用于广泛的自然语言处理任务，尤其专注于希伯来语的理解和生成。

🚀 快速开始

首先，确保你已经安装了 transformers 库，你可以使用以下命令进行更新安装：

pip install -U transformers

然后，根据你的使用场景，从下面的代码片段中选择适合你的部分进行复制使用。

💻 使用示例

基础用法

在 CPU 上运行

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("yam-peleg/Hebrew-Gemma-11B-V2")
model = AutoModelForCausalLM.from_pretrained("yam-peleg/Hebrew-Gemma-11B-V2")

input_text = "שלום! מה שלומך היום?"
input_ids = tokenizer(input_text, return_tensors="pt")

outputs = model.generate(**input_ids)
print(tokenizer.decode(outputs[0]))

在 GPU 上运行

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("yam-peleg/Hebrew-Gemma-11B-V2")
model = AutoModelForCausalLM.from_pretrained("yam-peleg/Hebrew-Gemma-11B-V2", device_map="auto")

input_text = "שלום! מה שלומך היום?"
input_ids = tokenizer(input_text, return_tensors="pt").to("cuda")

outputs = model.generate(**input_ids)
print(tokenizer.decode(outputs[0]))

使用 4 位精度运行

from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig

tokenizer = AutoTokenizer.from_pretrained("yam-peleg/Hebrew-Gemma-11B-V2")
model = AutoModelForCausalLM.from_pretrained("yam-peleg/Hebrew-Gemma-11B-V2", quantization_config = BitsAndBytesConfig(load_in_4bit=True))

input_text = "שלום! מה שלומך היום?"
input_ids = tokenizer(input_text, return_tensors="pt").to("cuda")

outputs = model.generate(**input_ids)
print(tokenizer.decode(outputs[0]))