DPO优化

# DPO优化

Zhi Writing Dsr1 14b

基于DeepSeek-R1-Distill-Qwen-14B微调优化的创意写作增强模型，在创意写作方面表现显著提升

大型语言模型

Transformers 支持多种语言

Turkish Gemma 9b V0.1

Turkish-Gemma-9b-v0.1是基于Gemma-2-9b开发的土耳其语文本生成模型，通过持续预训练、监督微调（SFT）、直接偏好优化（DPO）和模型合并技术优化而成。

大型语言模型

Ablation 141 A128.dpo.armorm.rp Shisa V2 Llama 3.1 8b

基于DPO方法微调的语言模型，适用于文本生成任务

大型语言模型

Bytedance Research.ui TARS 7B DPO GGUF

UI-TARS-7B-DPO 的量化版本，致力于让知识为大众所共享。

图像生成文本

这是一个基于离散Hubert标记的语音语言模型，专注于高效训练，能够生成语音片段的延续。

Summllama3.1 8B

SummLlama3.1-8B是基于Llama3.1-8B-Instruct初始化的文本摘要模型，通过大规模摘要反馈的直接偏好优化（DPO）训练，在忠实性、完整性和简洁性方面表现优异。

SummLlama3-70B是基于Llama3-70B-Instruct初始化的文本摘要模型，通过大规模摘要反馈的DPO训练优化，在忠实性、完整性和简洁性方面表现优异。

大型语言模型

UNA ThePitbull 21.4B V2

UNA-ThePitbull-21.4B-v2是一款基于21.4B参数的大型语言模型，性能接近70B模型，融合了情商与智商，擅长对话和文本生成。

大型语言模型

Llama3 OpenBioLLM 70B

OpenBioLLM-70B是专为生物医学领域设计的先进开源语言模型，基于Meta-Llama-3-70B-Instruct微调，在生物医学任务中表现卓越。

大型语言模型

Transformers 支持多种语言

Rhea-72b-v0.5是基于Smaug-72B-v0.1微调的大语言模型，在HuggingFace开放大模型排行榜上排名第一。

大型语言模型

Transformers 英语

Nous Hermes 2 Mistral 7B DPO AWQ

Nous Hermes 2是基于Mistral 7B DPO的新一代旗舰级7B Hermes模型，经过DPO优化，在多个测试基准上表现优异。

大型语言模型

Transformers 英语

Sambalingo Hungarian Chat

支持匈牙利语和英语的对齐人类偏好的聊天模型，基于Llama-2-7b适配到匈牙利语

大型语言模型

Transformers 支持多种语言

sambanovasystems

Llava V1.5 13b Dpo Gguf

LLaVA-v1.5-13B-DPO 是一个基于LLaVA框架的视觉语言模型，经过直接偏好优化(DPO)训练，并转换为GGUF量化格式以提高推理效率。

图像生成文本

Bloom 1b1 Zh Error Correction Dpo

采用DPO训练的中文文本纠错模型，能够自动检测并修正中文文本中的拼写和语法错误。

大型语言模型

Transformers 中文

UNA TheBeagle 7b V1

TheBeagle是基于The Bagel数据集训练的70亿参数模型，采用DPO（直接偏好优化）和UNA（统一神经架构）技术优化，在多任务中表现优异。

大型语言模型

Laser Dolphin Mixtral 4x7b Dpo

基于特定模型改进的中等规模MoE实现模型，适用于文本生成任务，在多个基准测试中表现良好。

大型语言模型

结合SDXL极速版与直接偏好优化(DPO)技术的文本生成图像模型，支持快速高质量图像生成

Rocket-3B是一个30亿参数的大型语言模型，通过直接偏好优化(DPO)在公开数据集上训练，性能超越许多更大规模的模型。

大型语言模型

Transformers 英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24