GreenMind-Medium-14B-R1开源越南语语言模型 - 免费部署解决中级推理难题

首页

Greenmind Medium 14B R1

由 GreenNode 开发

GreenMind-Medium-14B-R1 是一款中等规模的越南语语言模型，能够有效解决需要中级推理的问题，例如常识、数学、自然科学和社会科学主题。

大型语言模型

Safetensors

支持多种语言开源协议:MIT #越南语推理优化 #多语言数学解题 #结构化思维生成

下载量 50

发布时间 : 4/25/2025

模型简介

该模型基于 Qwen/Qwen2.5-14B-Instruct 进行微调，采用 Group Relative Policy Optimization 策略，生成逻辑连贯的响应。

模型特点

中级推理能力

能够有效解决需要中级推理的问题，如常识、数学、自然科学和社会科学主题。

逻辑连贯响应

采用 Group Relative Policy Optimization 策略进行微调，生成逻辑连贯的响应。

多语言支持

支持越南语、英语、中文、印尼语和泰语等多种语言。

模型能力

文本生成

逻辑推理

多语言处理

使用案例

教育

数学问题解答

解答数学问题，如鸡兔同笼问题。

能够正确解答并展示推理过程。

自然科学问题解答

解答自然科学相关的问题。

能够提供逻辑连贯的答案。

社会科学

社会科学问题解答

解答社会科学相关的问题。

能够提供逻辑连贯的答案。

🚀 GreenMind-Medium-14B-R1

我们发布了 GreenMind-Medium-14B-R1，这是一个中等规模的越南语模型，能够有效解决需要中级推理的问题，例如常识、数学、自然科学和社会科学等领域的问题。通过采用分组相对策略优化（Group Relative Policy Optimization）策略进行微调，我们引导模型生成逻辑连贯的响应。

🚀 快速开始

这里提供了一个使用 apply_chat_template 的代码片段，向你展示如何加载分词器和模型，以及如何生成内容。

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "GreenNode/GreenMind-Medium-14B-R1"

model = AutoModelForCausalLM.from_pretrained(
	model_name,
	torch_dtype="auto",
	device_map="auto"
)

tokenizer = AutoTokenizer.from_pretrained(
	model_name,
	revision='main',
	trust_remote_code=False,
)
prompt = r"""Vừa gà vừa chó
Bó lại cho tròn
Ba mươi sáu con
Một trăm chân chẵn
Hỏi có bao nhiêu con gà, bao nhiêu con chó?"""

messages = [
	{
	"role": "system",
	"content": "Bạn là một trợ lý ảo hữu ích trong việc trả lời câu hỏi. Hãy suy luận từng bước, và đưa ra đáp án trong thẻ <answer> </answer>."
	},
	{
	"role": "user",
	"content": f"{prompt} Hãy suy luận từng bước trong thẻ <think> </think>. Và trả về đáp án trong thẻ <answer> </answer>."
	},
	{
	"role": "assistant",
	"content": "Hãy để tôi giải quyết từng bước.\n<think>"
	}
]

text = tokenizer.apply_chat_template(
	messages, 
	tokenize=False, 
	continue_final_message=True)

model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=1024
)

generated_ids = [
output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
print(response)
# Đầu tiên, chúng ta cần thiết lập hai phương trình dựa trên thông tin đề bài:
# 1. Tổng số con gà và chó là 36: x + y = 36
# 2. Tổng số chân là 100: 2x + 4y = 100
# Trong đó, x là số con gà và y là số con chó.
# Tiếp theo, chúng ta giải hệ phương trình này:
# Từ phương trình thứ nhất, ta có: x = 36 - y
# Thay vào phương trình thứ hai: 2(36 - y) + 4y = 100
# => 72 - 2y + 4y = 100
# => 2y = 28
# => y = 14 (số con chó)
# Thay y = 14 vào phương trình x + y = 36:
# => x = 36 - 14 = 22 (số con gà)
# Vậy, có 22 con gà và 14 con chó.
# </think>
# <answer>Có 22 con gà và 14 con chó.</answer>

✨ 主要特性

模型类型：自回归语言模型
基础模型：Qwen/Qwen2.5-14B-Instruct
参数数量：147亿
上下文长度：完整131,072个词元，生成8192个词元
支持语言：越南语

📚 详细文档

评估

SeaExam数据集

模型	SeaExam-ID	SeaExam-TH	SeaExam-VI	平均分
Meta-Llama-3.1-70B-Instruct	65.8	70.6	72.6	69.7
gemma3-27b-it	64.4	67.5	73.1	68.4
Qwen2.5-14B-Instruct	67.6	68.8	73.1	69.8
GreenMind-Medium-14B-R1	74.36	69.75	74.44	72.79

VLSP 2023挑战赛

模型	ComprehensionQA-vi ↑	Exams-vi ↑	LAMBADA-vi ↓	WikiQA-vi ↑	MMLU-vi ↑
cpt-smartbot-13b	0.6633	0.3473	21.9864	0.4455	0.414
ura-llama-13b	0.6556	0.342	17.5614	0.438	0.3973
greennode-7b (先前工作)	0.6122	0.2892	189.7782	0.3335	0.387
greennode-14b (先前工作)	0.6711	0.3672	29.5967	0.468	0.5281
GreenMind-Medium-14B-R1 (我们的模型)	0.8689	0.7796	10.7609	0.7915	0.7124

VMLU数据集

模型	Access	STEM	Social Science	Humanities	Others	平均分
VNPTAI.IO-Medium-R1	私有	77.09	82.3	78.85	69.98	77.43
MISA-Llama3-v1.1	私有	77.5	80.75	76.62	71.6	76.87
BnK-AI-Medium-v2	私有	80.94	80.76	70.7	74.06	76.66
VNPTAI.IO-Large-v4	私有	78.05	79.05	75.39	70.37	76.21
GreenNode-xMedium-v1	私有	75.7	81.09	75.25	69.33	75.5
GreenMind-Medium-14B-R1 (我们的模型)	权重	76.78	77.36	72.32	69.03	74.29
CakebyVPBank-Large	私有	77.75	78.11	70.38	67.82	73.99
DeepSeek-R1-Distill-Llama-70B	权重	76.77	76.23	67.98	66.82	72.41

🔗 关注我们

https://x.com/greennode23

💬 支持

https://discord.gg/B6MJFM3J3a

📄 许可证

本仓库和模型权重遵循 MIT许可证。

📖 引用

如果您认为我们的工作有帮助，请引用我们的成果。

@misc{tung2025greenmindnextgenerationvietnameselarge,
      title={GreenMind: A Next-Generation Vietnamese Large Language Model for Structured and Logical Reasoning}, 
      author={Luu Quy Tung and Hoang Quoc Viet and Vo Trong Thu},
      year={2025},
      eprint={2504.16832},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2504.16832}, 
}