gemma-3-12b-it-codeforces-SFT开源大语言模型 - 基于特定数据集微调实用高效

首页

Gemma 3 12b It Codeforces SFT

由 qgallouedec 开发

基于google/gemma-3-12b-it在codeforces-cots数据集上微调的大语言模型

大型语言模型

Transformers

#编程竞赛微调 #大语言模型 #代码生成

下载量 43

发布时间 : 3/14/2025

模型简介

该模型是google/gemma-3-12b-it的微调版本，专门针对编程竞赛问题解决进行了优化，使用TRL框架进行监督式微调。

模型特点

编程竞赛优化

在codeforces-cots数据集上微调，特别适合解决编程竞赛问题

监督式微调

使用TRL框架进行监督式微调(SFT)，提升模型性能

大模型能力

基于12B参数的Gemma模型，具备强大的理解和生成能力

模型能力

代码生成

编程问题解答

算法解释

文本生成

使用案例

编程教育

编程竞赛训练

帮助学生理解和解决编程竞赛题目

提高算法理解和编码能力

代码生成辅助

根据问题描述自动生成解决方案代码

加速开发过程

技术面试准备

算法问题解答

模拟技术面试中的算法问题解答

帮助面试者准备技术面试

属性	详情
基础模型	google/gemma-3-12b-it
训练数据集	open-r1/codeforces-cots
库名称	transformers
模型名称	gemma-3-12b-it-codeforces-SFT
标签	generated_from_trainer、trl、sft
许可证	license

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Gemma 3 12b It Codeforces SFT

模型简介

模型特点

模型能力

使用案例

🚀 gemma-3-12b-it-codeforces-SFT

🚀 快速开始

代码示例

📦 模型信息

🔧 训练过程

框架版本

📄 引用信息