Zhi Writing Dsr1 14b
Apache-2.0
基于DeepSeek-R1-Distill-Qwen-14B微调优化的创意写作增强模型,在创意写作方面表现显著提升
大型语言模型
Transformers

支持多种语言
Z
Zhihu-ai
133
16
Turkish Gemma 9b V0.1
Turkish-Gemma-9b-v0.1是基于Gemma-2-9b开发的土耳其语文本生成模型,通过持续预训练、监督微调(SFT)、直接偏好优化(DPO)和模型合并技术优化而成。
大型语言模型
Safetensors
T
ytu-ce-cosmos
167
18
Ablation 141 A128.dpo.armorm.rp Shisa V2 Llama 3.1 8b
基于DPO方法微调的语言模型,适用于文本生成任务
大型语言模型
Transformers

A
shisa-ai
38
2
Slam
MIT
这是一个基于离散Hubert标记的语音语言模型,专注于高效训练,能够生成语音片段的延续。
音频生成
Transformers

S
slprl
115
10
Summllama3.1 8B
SummLlama3.1-8B是基于Llama3.1-8B-Instruct初始化的文本摘要模型,通过大规模摘要反馈的直接偏好优化(DPO)训练,在忠实性、完整性和简洁性方面表现优异。
文本生成
Transformers

S
DISLab
116
10
Summllama3 70B
SummLlama3-70B是基于Llama3-70B-Instruct初始化的文本摘要模型,通过大规模摘要反馈的DPO训练优化,在忠实性、完整性和简洁性方面表现优异。
大型语言模型
S
DISLab
15
7
UNA ThePitbull 21.4B V2
UNA-ThePitbull-21.4B-v2是一款基于21.4B参数的大型语言模型,性能接近70B模型,融合了情商与智商,擅长对话和文本生成。
大型语言模型
Transformers

U
fblgit
16
16
Llama3 OpenBioLLM 70B
OpenBioLLM-70B是专为生物医学领域设计的先进开源语言模型,基于Meta-Llama-3-70B-Instruct微调,在生物医学任务中表现卓越。
大型语言模型
Transformers

支持多种语言
L
aaditya
18.35k
428
Rhea 72b V0.5
Apache-2.0
Rhea-72b-v0.5是基于Smaug-72B-v0.1微调的大语言模型,在HuggingFace开放大模型排行榜上排名第一。
大型语言模型
Transformers

英语
R
davidkim205
103
135
Nous Hermes 2 Mistral 7B DPO AWQ
Apache-2.0
Nous Hermes 2是基于Mistral 7B DPO的新一代旗舰级7B Hermes模型,经过DPO优化,在多个测试基准上表现优异。
大型语言模型
Transformers

英语
N
solidrust
84
8
Sambalingo Hungarian Chat
支持匈牙利语和英语的对齐人类偏好的聊天模型,基于Llama-2-7b适配到匈牙利语
大型语言模型
Transformers

支持多种语言
S
sambanovasystems
154
43
Llava V1.5 13b Dpo Gguf
LLaVA-v1.5-13B-DPO 是一个基于LLaVA框架的视觉语言模型,经过直接偏好优化(DPO)训练,并转换为GGUF量化格式以提高推理效率。
图像生成文本
L
antiven0m
30
0
Bloom 1b1 Zh Error Correction Dpo
采用DPO训练的中文文本纠错模型,能够自动检测并修正中文文本中的拼写和语法错误。
大型语言模型
Transformers

中文
B
p208p2002
15
1
UNA TheBeagle 7b V1
TheBeagle是基于The Bagel数据集训练的70亿参数模型,采用DPO(直接偏好优化)和UNA(统一神经架构)技术优化,在多任务中表现优异。
大型语言模型
Transformers

U
fblgit
88
37
Sdxl Dpo Turbo
其他
结合SDXL极速版与直接偏好优化(DPO)技术的文本生成图像模型,支持快速高质量图像生成
图像生成
S
thibaud
291
85
Rocket 3B
Rocket-3B是一个30亿参数的大型语言模型,通过直接偏好优化(DPO)在公开数据集上训练,性能超越许多更大规模的模型。
大型语言模型
Transformers

英语
R
pansophic
26
85
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文