开放域对话
Qwen2.5 0.5B Instruct Gensyn Swarm Peaceful Exotic Butterfly
基于Gensyn/Qwen2.5-0.5B-Instruct的微调版本,采用TRL框架和GRPO算法训练,适用于指令跟随任务。
大型语言模型
Transformers
Q
juliannode
16
2
Open Llama 3b V2 Instruct
Apache-2.0
基于LLaMA 3B v2架构的指令微调语言模型,适用于文本生成任务
大型语言模型
Transformers
O
mediocredev
243
6
Remm SLERP L2 13B
ReMM-SLERP是对原始MythoMax-L2-13B的重构版本,采用SLERP技术融合了更新后的多个13B参数模型,包括Chronos-Beluga、Airoboros和Huginn等。
大型语言模型
Transformers
R
Undi95
121
21
Idefics 9b
其他
IDEFICS是一个开源的多模态模型,能够处理图像和文本输入并生成文本输出,是Deepmind Flamingo模型的开源复现版本。
图像生成文本
Transformers
英语
I
HuggingFaceM4
3,676
46
Mvp Multi Task
Apache-2.0
MVP多任务模型是基于提示词的预训练模型,通过混合标注数据集优化,专为多种自然语言生成任务设计。
大型语言模型
Transformers
支持多种语言
M
RUCAIBox
20
2
Blenderbot 90M
Apache-2.0
BlenderBot是一个开放域聊天机器人模型,专注于多轮对话和多种对话技能的融合。
对话系统
Transformers
英语
B
facebook
4,669
3
Dialogpt Small David Mast
DialoGPT 是微软推出的一个基于 GPT 架构的对话生成模型,专门用于生成类似人类的对话响应。
大型语言模型
Transformers
D
Toadally
26
0
Dialogpt Small C3po
DialoGPT是一个基于GPT架构的对话生成模型,专门用于生成自然流畅的对话响应。
对话系统
Transformers
D
limivan
32
1
Ke T5 Base Ko
Apache-2.0
KE-T5是由韩国电子技术研究院开发的基于T5架构的韩英双语文本生成模型,支持跨语言知识迁移的对话生成任务。
大型语言模型
韩语
K
KETI-AIR
208
9
Dialogpt Small Ricksanchez
基于DialoGPT架构的对话生成模型,以《瑞克和莫蒂》中的瑞克·桑切斯为角色设定,能够生成符合角色风格的对话内容。
大型语言模型
Transformers
D
AnthonyNelson
18
1
Ke T5 Small
Apache-2.0
基于韩语和英语预训练的T5模型,支持跨语言知识驱动的响应生成
大型语言模型
支持多种语言
K
KETI-AIR
909
2