Qwq Bakeneko 32b
Apache-2.0
基于Qwen2.5-32B和QwQ-32B合并优化的日语对话模型,通过Chat Vector和ORPO技术增强指令跟随能力
大型语言模型
Transformers
日语
Q
rinna
1,597
17
Llama3.1 Gutenberg Doppel 70B
基于Hermes-3-Llama-3.1-70B-lorablated模型,在Gutenberg数据集上进行微调的大语言模型
大型语言模型
Transformers
L
nbeerbower
424
6
Calmerys 78B Orpo V0.1
MIT
基于MaziyarPanahi/calme-2.4-rys-78b在mlabonne/orpo-dpo-mix-40k数据集上微调的大语言模型,在Open LLM Leaderboard上排名第一
大型语言模型
Transformers
英语
C
dfurman
353
74
Orpo Mistral 7B V0.3
该模型是基于Mistral-7B-v0.3进行ORPO微调的版本,整合了监督微调和偏好对齐阶段,适用于聊天和文本生成任务。
大型语言模型
Transformers
英语
O
MuntasirHossain
385
2
Llama3 70B Chinese Chat
Llama3-70B-Chinese-Chat是基于Meta-Llama-3-70B-Instruct开发的中英文双语大语言模型,专为中英文用户设计,具备角色扮演、工具使用和数学计算等多种能力。
大型语言模型
Transformers
支持多种语言
L
shenzhi-wang
58
102
Llama Medx V3.2
Llama-medx_v3.2 是专为医疗领域微调的大语言模型,基于 Meta-Llama-3.1-8B 架构开发,通过监督式微调(SFT)与优势比偏好优化(ORPO)技术训练,精准掌握医学术语与临床推理能力。
大型语言模型
Transformers
L
skumar9
5,677
12
Suzume Llama 3 8B Multilingual Orpo Borda Top75
基于lightblue/suzume-llama-3-8B-multilingual通过ORPO方法微调训练的多语言大语言模型
大型语言模型
Transformers
S
lightblue
1,771
4
Suzume Llama 3 8B Multilingual Orpo Borda Half
基于Llama-3-8B通过ORPO方法微调的多语言大模型,使用50%最一致排名数据训练,在多项语言任务中表现优异。
大型语言模型
Transformers
S
lightblue
4,625
16
Llama3 8B Chinese Chat
基于Meta-Llama-3-8B-Instruct微调的中英文对话模型,优化了中文回答质量,减少中英文混杂问题。
大型语言模型
Transformers
支持多种语言
L
shenzhi-wang
2,777
678