Q

Qwen2.5 0.5B Instruct Gensyn Swarm Feathered Giant Ostrich

由 chinna6 开发
基于Transformer架构的微调模型,在问答和文本生成任务上表现出色,提供精准、高效的语言交互体验。
下载量 2,027
发布时间 : 4/16/2025

模型简介

本模型是基于Qwen2.5-0.5B-Instruct的微调版本,经过优化以适应特定任务,使用TRL框架进行训练。

模型特点

微调优化
基于Gensyn/Qwen2.5-0.5B-Instruct的微调版本,经过优化以适应特定任务。
训练框架
使用TRL进行训练,提升了模型的性能和适应性。
GRPO训练方法
采用GRPO方法进行训练,该方法在DeepSeekMath论文中被提出。

模型能力

文本生成
问答

使用案例

语言交互
时间旅行选择
回答关于时间旅行的假设性问题
生成合理的解释和选择
AIbase
智启未来,您的人工智能解决方案智库
简体中文