C

Croissantllmchat V0.1

由 croissantllm 开发
CroissantLLM是一个基于3T英法双语token训练的13亿参数语言模型,专为消费级硬件设计,支持流畅的双语处理。
下载量 3,812
发布时间 : 1/24/2024
模型介绍
内容详情
替代品

模型简介

该模型是CroissantLLM计划的一部分,经过19万步训练(2.99T tokens)及最终聊天微调阶段,支持法语和英语的文本生成任务。

模型特点

双语支持
采用1:1英法预训练数据配比,专门优化了法语和英语的处理能力。
高效运行
设计用于在消费级硬件上流畅运行,适合研究和工业应用。
高质量法语语料
训练数据中包含经人工筛选的高质量多样化法语语料。
透明开源
公开了代码库、多个检查点、微调聊天模型及翻译模型,透明度标准达标率达81%。

模型能力

文本生成
双语翻译
聊天对话
代码生成

使用案例

语言处理
法语问答
回答关于法国文化、历史或时事的问题。
在写作类任务和内部知识检索上表现良好。
英法翻译
进行英语和法语之间的翻译任务。
翻译任务表现尤为突出。
代码辅助
代码生成
生成简单的代码片段。
代码能力有限,适合基础代码生成。