G

GRPO VI Qwen2 7B RAG

由 AITeamVN 开发
基于Qwen2.5-7B-Instruct微调的越南语检索增强生成(RAG)专用大模型,采用GRPO优化方法训练
下载量 402
发布时间 : 4/30/2025
模型介绍
内容详情
替代品

模型简介

专为越南语检索增强生成任务优化的语言模型,具备多跳推理、信息整合等RAG能力,同时保留通用问答和STEM任务处理能力

模型特点

越南语RAG优化
专门针对越南语检索增强生成任务进行优化,提升多跳推理和信息整合能力
GRPO训练方法
采用组相对策略优化(GRPO)方法进行训练,结合监督微调与奖励模型评分
长上下文支持
支持8192标记的上下文长度,适合处理复杂文档和长对话场景
STEM能力增强
强化数学与编程相关任务的解决能力

模型能力

多跳推理
负面过滤
信息整合
正负识别
数学问题解答
编程问题解答
通用问答

使用案例

信息检索与整合
企业信息查询
从文档中提取特定企业营收增长信息及支撑因素
准确识别并整合文档中的相关信息
教育
数学问题解答
解决各类数学方程和问题
提供分步解答过程和最终答案
通用知识问答
地理知识查询
回答关于越南地理特征的问题
提供准确的地理知识回答