Q

Qra 1b

由 OPI-PG 开发
Qra是由波兰国家信息处理研究所与格但斯克理工大学联合开发的波兰语优化大语言模型系列,基于TinyLlama-1.1B初始化并在900亿波兰语token上训练
下载量 246
发布时间 : 2/26/2024
模型介绍
内容详情
替代品

模型简介

专为波兰语优化的基础语言模型,需微调后用于对话或指令任务

模型特点

波兰语优化
基于900亿精选波兰语token训练,专为波兰语文本处理优化
高效训练技术
采用Flash Attention 2、混合精度训练、FSDP并行等现代优化技术
严格数据清洗
通过多阶段过滤流程确保训练数据质量,包括语言分类、主题划分和去重处理

模型能力

波兰语文本生成
长文本处理(4096 token上下文)
语言建模

使用案例

文本处理
波兰语内容生成
生成符合波兰语习惯的文本内容
语言模型微调基础
作为下游任务(如对话系统)的基础模型