M

Minerva 1B Base V1.0

由 sapienzanlp 开发
Minerva-1B-base-v1.0是由Sapienza NLP与FAIR及CINECA合作开发的10亿参数意英双语大语言模型,基于2000亿token(各1000亿意/英)训练
下载量 551
发布时间 : 4/19/2024
模型介绍
内容详情
替代品

模型简介

首个完全基于意大利语预训练的大语言模型家族成员,真正开放的意英双语基础模型,未经过对齐处理

模型特点

双语平衡训练
采用1000亿意大利语token和1000亿英语token的平衡训练数据
高效分词器
意大利语分词效率1.39(CulturaX测试),优于同类模型
长上下文支持
支持最大16384 tokens的上下文长度

模型能力

意大利语文本生成
英语文本生成
多任务处理

使用案例

教育
意大利语学习辅助
生成意大利语学习材料和练习题
内容创作
双语内容生成
自动生成意英双语的文章或营销内容