DPO微调优化
Chocolatine Fusion 14B
MIT
Chocolatine-Fusion-14B是一个合并模型,结合了Chocolatine-2系列的优势,通过优化融合提升了推理能力和多轮对话表现。
大型语言模型
Transformers
C
FINGU-AI
226
5
Llama 3 Gutenberg 8B
其他
基于Llama-3-8b的微调模型,使用Gutenberg DPO数据集进行优化,适用于文本生成任务。
大型语言模型
Transformers
L
nbeerbower
18
9
Excalibur 7b DPO
Apache-2.0
Excalibur-7b-DPO是基于Excalibur-7b基础模型通过直接偏好优化(DPO)微调的大语言模型,专注于提升对话质量和视觉应用场景表现。
大型语言模型
Transformers
E
InferenceIllusionist
22
8
Westlake 7B V2 Laser Truthy Dpo
Apache-2.0
基于WestLake-7B-v2-laser模型在truthy-dpo-v0.1数据集上进行微调的大语言模型,专注于文本生成任务,在多项基准测试中表现优异。
大型语言模型
Transformers
W
macadeliccc
9,693
25
Neuralbeagle14 7B 8.0bpw H8 Exl2
Apache-2.0
NeuralBeagle14-7B是基于Beagle14-7B模型,使用DPO方法微调的7B参数大语言模型,在7B参数类别中表现优异。
大型语言模型
Transformers
N
LoneStriker
111
5
Tinymistral 248M Chat V3
Apache-2.0
TinyMistral-248M-Chat 是一个基于 TinyMistral-248M 的聊天模型,经过多数据集训练和优化,适用于多种对话任务。
大型语言模型
Transformers
英语
T
Felladrin
456
28
Tinymistral 248M Chat V4
Apache-2.0
TinyMistral-248M-Chat是一个基于TinyMistral-248M微调的聊天模型,支持多轮对话,适用于各种对话场景。
大型语言模型
Transformers
英语
T
Felladrin
516
29