C

Croissantllmbase

由 croissantllm 开发
CroissantLLM是一个基于3万亿英法双语token预训练的13亿参数语言模型,旨在为研究和工业社区提供高性能、完全开源的双语模型。
下载量 901
发布时间 : 1/9/2024
模型介绍
内容详情
替代品

模型简介

CroissantLLM是一个高性能、完全开源的双语(英语和法语)语言模型,可在消费级本地硬件上流畅运行。模型采用1:1英法预训练数据比例、定制分词器以及双语微调数据集进行本质双语模型训练。

模型特点

双语支持
模型采用1:1英法预训练数据比例,专门针对英语和法语进行优化。
高性能
模型在消费级本地硬件上也能流畅运行,适合研究和工业应用。
开源透明
模型完全开源,包括代码库、检查点、微调后的聊天模型和优质翻译模型。
高质量法语数据
训练数据包含经过人工筛选、高质量且多样化的法语数据分支。

模型能力

文本生成
双语翻译
代码生成

使用案例

文本生成
双语翻译
将英语文本翻译为法语,或反之。
高质量的翻译结果,适用于日常和专业场景。
代码生成
根据提示生成代码片段。
适用于开发者和研究人员。
研究
多语言模型研究
用于研究语言模型在多语言环境下的表现。
提供丰富的双语数据和模型检查点。