P

Pllum 12B Nc Chat

由 CYFRAGOVPL 开发
PLLuM-12B-chat是波兰大语言模型家族中的120亿参数对话优化版本,专为波兰语及斯拉夫/波罗的海语言设计,通过指令微调和偏好学习实现安全高效的交互能力。
下载量 2,673
发布时间 : 2/7/2025
模型介绍
内容详情
替代品

模型简介

基于Mistral-Nemo架构的120亿参数大语言模型,经过波兰原生指令数据集微调和人类偏好对齐,在波兰公共行政、法律文书等专业场景表现优异,支持检索增强生成(RAG)应用。

模型特点

波兰语原生优化
基于1500亿波兰语token及4万条人工标注指令训练,有效解决非波兰语数据的负面迁移问题
安全对齐
通过首个波兰语偏好数据集进行人类反馈强化学习(RLHF),确保争议话题的平衡响应
检索增强生成
专为RAG场景优化,可结合外部知识库生成带准确引用的专业回答
多规模选择
提供从80亿到700亿参数的多种规格,满足不同计算资源需求

模型能力

波兰语文本生成
多轮对话处理
跨语言理解(斯拉夫/波罗的海语系)
专业领域问答
长文档摘要
安全内容过滤

使用案例

公共行政
政府文书自动生成
根据政策文件自动生成标准化公文
在波兰公共行政专项测试中排名第一
法规问答系统
解析法律条文并提供通俗解释
教育
波兰语学习助手
生成语法练习和提供写作反馈