G

Granite 3.1 3b A800m Instruct

由 ibm-granite 开发
基于Granite-3.1-3B-A800M-Base微调的30亿参数长上下文指令模型,支持多语言任务
下载量 36.16k
发布时间 : 12/6/2024
模型介绍
内容详情
替代品

模型简介

融合开源指令数据集与专为解决长上下文问题设计的内部合成数据集,适用于通用指令响应和跨领域AI助手构建

模型特点

长上下文处理
专门优化的架构设计,可有效处理长文档/会议摘要等长上下文任务
多语言支持
支持12种语言的文本生成与理解,可扩展至其他语言
强化学习对齐
采用监督微调与强化学习相结合的技术路线,提升指令跟随能力

模型能力

文本摘要
文本分类
信息抽取
问答系统
检索增强生成(RAG)
代码相关任务
函数调用任务
多语言对话
长上下文理解

使用案例

企业应用
会议纪要生成
自动生成长时间会议录音/文本的摘要
支持超长上下文连贯性处理
技术文档分析
解析复杂技术文档并回答专业问题
准确率较基础模型提升15%
多语言服务
跨境客服助手
支持多语言的智能客服系统
覆盖12种语言的客户咨询