Qwen-2.5-7B-DTF开源语言模型 - 依托俄语论坛数据优化多场景智能对话

首页

Qwen 2.5 7B DTF

由 chameleon-lizard 开发

基于Qwen2.5-7B模型，使用LoRA技术对DTF俄语论坛数据进行持续预训练的语言模型

大型语言模型

Safetensors

其他开源协议:Apache-2.0 #俄语论坛文本生成 #LoRA高效微调 #长文本处理优化

下载量 76

发布时间 : 2/3/2025

模型简介

该模型是针对俄语论坛内容优化的文本生成模型，通过LoRA适配器在DTF论坛数据集上进行持续预训练，适合生成俄语论坛风格的文本内容。

模型特点

LoRA高效微调

使用低秩适应(LoRA)技术进行高效微调，显著降低训练成本

俄语论坛优化

专门针对DTF俄语论坛数据进行训练，生成内容符合论坛风格

高效训练配置

采用8bit优化器、梯度检查点等技术实现高效训练

模型能力

俄语文本生成

论坛风格内容创作

长文本生成(1000-128000标记)

使用案例

内容生成

论坛帖子自动生成

自动生成符合DTF论坛风格的帖子内容

论坛回复建议

为论坛用户提供回复内容建议

🚀 unsloth/Qwen2.5 - 7B DTF 续写预训练模型

本项目是基于 unsloth/Qwen2.5 - 7B 模型的续写预训练版本，使用 unsloth 的低秩自适应（LoRA）技术，在 DTF 论坛的帖子数据集上进行了进一步训练，且适配器已与模型完成合并。

✨ 主要特性

基于 unsloth/Qwen2.5 - 7B 模型进行续写预训练。
使用 LoRA 技术进行高效训练。
适配器已与模型合并，可直接使用。

📦 安装指南

文档未提供安装步骤，故跳过此章节。

💻 使用示例

文档未提供代码示例，故跳过此章节。

📚 详细文档

预训练数据

预训练时，选用了 SubMaroon/DTF_comments_Responses_Counts 数据集中的帖子，通过简单的 df.unique 方法去重，并筛选出长度在 1000 到 128000 个词元之间的帖子。训练数据集大小约为 7500 万个词元。

LoRA 超参数

r=32
target_modules=[
    "q_proj", 
    "k_proj", 
    "v_proj", 
    "o_proj",
    "gate_proj",
    "up_proj",
    "down_proj",
]
lora_alpha=16
lora_dropout=0
bias="none"
use_gradient_checkpointing='unsloth'
use_rslora=True
random_state=42

训练超参数

num_train_epochs=2
train_batch_size=8
gradient_accumulation_steps=16
gradient_checkpointing=False
optim="adamw_8bit"
weight_decay=4e-2
bf16=True
learning_rate=5e-5
lr_scheduler_type="cosine"
packing=True,
seed=42

训练时间

使用 NVidia Tesla A100 80GB 显卡：约 8.5 小时
使用 NVidia RTX 3090ti 显卡：约 33.5 小时

🔧 技术细节

本项目使用低秩自适应（LoRA）技术对 unsloth/Qwen2.5 - 7B 模型进行续写预训练。在数据处理阶段，对帖子进行去重和长度筛选，以保证训练数据的质量。训练过程中，通过调整 LoRA 和训练的超参数，在不同显卡上进行训练，并记录了训练时间。

📄 许可证

本项目采用 Apache - 2.0 许可证。

属性	详情
模型类型	文本生成
训练数据	SubMaroon/DTF_Comments_Responses_Counts 数据集，筛选后约 7500 万个词元
基础模型	unsloth/Qwen2.5 - 7B