Turkish - Gemma - 9b - v0.1开源土耳其语文本生成模型

首页

Turkish Gemma 9b V0.1

由 ytu-ce-cosmos 开发

Turkish-Gemma-9b-v0.1是基于Gemma-2-9b开发的土耳其语文本生成模型，通过持续预训练、监督微调（SFT）、直接偏好优化（DPO）和模型合并技术优化而成。

大型语言模型

Safetensors

#土耳其语生成 #数学推理 #指令微调

下载量 167

发布时间 : 4/18/2025

模型简介

该模型专为土耳其语文本生成任务设计，能够生成连贯且上下文相关的续写和回答。适用于对话式交互和指令遵循任务。

模型特点

土耳其语优化

专门针对土耳其语进行持续预训练和微调，优化了语言理解和生成能力。

多阶段训练

结合了持续预训练、监督微调（SFT）和直接偏好优化（DPO）等多种训练方法。

性能优异

在土耳其语评估基准中表现优异，胜率超过多个同类模型。

模型能力

土耳其语文本生成

对话式交互

指令遵循

数学问题解答

使用案例

教育

数学问题解答

解答土耳其语数学问题，如函数和方程相关题目。

能正确解答并解释数学问题，如RD(X)=X的解法。

客服

土耳其语客服对话

生成自然流畅的土耳其语客服回复。

🚀 土耳其语Gemma-9b-v0.1

土耳其语Gemma-9b-v0.1是基于Gemma-2-9b开发的模型，通过持续预训练、监督微调（SFT）、直接偏好优化（DPO）和模型合并等方法训练而成。该模型专为土耳其语文本生成任务设计，能够提供连贯且与上下文相关的续写和回答。不过，由于训练数据的多样性（包括大规模预训练语料库、指令调优数据和人类偏好数据），模型可能存在偏差，用户在使用时应予以关注并负责任地部署。

你可以在这里轻松体验模型演示（即将推出！）：https://cosmos.yildiz.edu.tr/cosmosllm

为了评估模型性能，我们精心设计了一个包含1450个问题的数据集，涵盖多个不同类别。每个问题由18位人工标注员进行审核和评分，以便在多个模型之间进行可靠比较。

🚀 快速开始

模型使用示例

Transformers pipeline

import transformers
import torch
model_id = "ytu-ce-cosmos/Turkish-Gemma-9b-v0.1"
pipeline = transformers.pipeline(
    "text-generation",
    model=model_id,
    model_kwargs={"torch_dtype": torch.bfloat16},
    device_map="auto",
)
messages = [
    {"role": "user", "content": "İsmi RD olan bir fonksiyon ona verilen sayının çarpmaya göre tersini döndürmektedir. Örneğin RD(3)=1/3. Buna göre RD(X)=X ifadesini doğru yapan kaç X değeri vardır?"}
]

terminators = [
    pipeline.tokenizer.eos_token_id,
    pipeline.tokenizer.convert_tokens_to_ids("<end_of_turn>")
]

outputs = pipeline(
    messages,
    max_new_tokens=512,
    eos_token_id=terminators,
    do_sample=True,
    temperature=0.6,
    top_p=0.9,
)
print(outputs[0]["generated_text"][-1])
# RD(X) = X ifadesi, bir sayının çarpmaya göre tersinin kendisiyle eşit olması anlamına gelir. Yani, X ile 1/X aynı olmalıdır. Bu durum yalnızca X'in karesi 1 olduğunda gerçekleşir:

# X² = 1

# Bu denklemin çözümleri:

# X = 1 ve X = -1

# Dolayısıyla, RD(X) = X eşitliğini sağlayan *iki* X değeri vardır: *1* ve *-1*.

Transformers AutoModelForCausalLM

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

model_id = "ytu-ce-cosmos/Turkish-Gemma-9b-v0.1"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)

messages = [
    {"role": "user", "content": "İsmi RD olan bir fonksiyon ona verilen sayının çarpmaya göre tersini döndürmektedir. Örneğin RD(3)=1/3. Buna göre RD(X)=X ifadesini doğru yapan kaç X değeri vardır?"}
]

input_ids = tokenizer.apply_chat_template(
    messages,
    add_generation_prompt=True,
    return_tensors="pt"
).to(model.device)

terminators = [
    pipeline.tokenizer.eos_token_id,
    pipeline.tokenizer.convert_tokens_to_ids("<end_of_turn>")
]

outputs = model.generate(
    input_ids,
    max_new_tokens=512,
    eos_token_id=terminators,
    do_sample=False,
)
response = outputs[0][input_ids.shape[-1]:]
print(tokenizer.decode(response, skip_special_tokens=True))
# RD(X) = X ifadesi, bir sayının çarpmaya göre tersinin kendisiyle eşit olması anlamına gelir. Yani, X ile 1/X aynı olmalıdır. Bu durum yalnızca X'in karesi 1 olduğunda gerçekleşir:

# X² = 1

# Bu denklemin çözümleri:

# X = 1 ve X = -1

# Dolayısıyla, RD(X) = X eşitliğini sağlayan *iki* X değeri vardır: *1* ve *-1*.

✨ 主要特性

基于Gemma-2-9b：以Gemma-2-9b为基础模型进行开发。
多方法训练：结合持续预训练、监督微调（SFT）、直接偏好优化（DPO）和模型合并等方法。
土耳其语适配：专为土耳其语文本生成任务设计，能提供高质量的文本续写和回答。

📚 详细文档

🏆 模型比较：胜率

模型名称	胜率
Qwen/Qwen3-30B-A3B	62.39%
gpt-4o-mini	62.12%
google/gemma-3-12b-it	61.61%
google/gemma-2-27b-it	57.91%
ytu-ce-cosmos/Turkish-Gemma-9b-v0.1	57.30%
google/gemma-2-9b-it	54.13%
ytu-ce-cosmos/Turkish-Llama-8b-DPO-v0.1	36.89%

投票方法

将一个问题和来自不同模型的两个答案呈现给人类评委，评委根据自己的偏好选择更好的答案。例如，在下面的问题中，评委选择了右侧的答案： Alt text

📊 土耳其语评估基准结果（通过 `malhajar17/lm-evaluation-harness_turkish`）

模型名称	平均分	MMLU	Truthful_QA	ARC	Hellaswag	Gsm8K	Winogrande
Qwen/Qwen2.5-72B-Instruct	67.69	77.28	59.86	61.52	61.98	83.6	61.92
google/gemma-3-27b-it	67.36	70.2	57.06	66.98	66.58	77.52	65.8
google/gemma-2-27b-it	65.57	66.49	57.45	63.65	63.86	76.54	65.4
meta-llama/Llama-3-1-70B-Instruct	63.92	74.00	51.41	59.64	64.31	66.13	66.90
Qwen/Qwen2.5-32B-Instruct	63.74	70.93	57.87	57.00	57.04	77.83	61.77
ytu-ce-cosmos/Turkish-Gemma-9b-v0.1	63.31	63.85	54.21	59.64	64.19	73.42	64.53
google/gemma-3-12b-it	62.94	63.92	57.16	60.67	62.00	72.06	61.77
Qwen/Qwen2.5-14B-it	60.34	65.28	59.00	50.00	52.22	76.77	58.77
google/gemma-2-9b-it	59.14	61.07	55.77	56.31	56.48	63.10	62.09
ytu-ce-cosmos/Turkish-Llama-8b-DPO-v0.1	55.03	51.97	57.56	51.02	52.96	59.87	57.77
Qwen/Qwen2.5-7B-Instruct	53.42	56.31	55.99	42.06	44.71	64.16	59.66