P

Poro 34B

由 LumiOpen 开发
Poro是一个340亿参数的多语言大模型,专注于芬兰语、英语和代码处理,采用Apache 2.0许可证开源。
下载量 1,908
发布时间 : 10/19/2023
模型介绍
内容详情
替代品

模型简介

基于芬兰语、英语和代码训练的生成式Transformer模型,支持英芬互译和代码生成,适用于多语言NLP任务。

模型特点

多语言混合训练
通过融合芬兰语与英语数据提升低资源语言性能,同时保留英语能力
超大规模训练
在LUMI超算上使用1万亿标记数据训练,覆盖文本与代码
研究友好设计
提供训练过程检查点,支持研究不同训练阶段的模型行为

模型能力

芬兰语文本生成
英语文本生成
代码生成与补全
基础英芬机器翻译

使用案例

自然语言处理
芬兰语内容生成
为芬兰语应用自动生成文本内容
跨语言信息处理
处理英芬混合文本的NLP任务
软件开发
代码辅助
基于上下文生成或补全代码片段