J

Jais Family 6p7b

由 inceptionai 开发
Jais系列是专为阿拉伯语优化的英阿双语大语言模型,具备强大的英语能力,参数量6.7亿
下载量 79
发布时间 : 8/2/2024
模型介绍
内容详情
替代品

模型简介

基于Transformer解码器架构的英阿双语大语言模型,支持文本生成任务,特别优化了阿拉伯语处理能力

模型特点

双语优化
专为阿拉伯语优化同时保持强大英语能力,阿拉伯语:英语训练数据比例为1:2
长上下文支持
原生支持2048 tokens上下文长度,部分模型扩展至16K
多样化训练数据
使用1.6万亿token的网页、书籍、代码和科学文献数据进行训练
指令微调
所有预训练模型都经过阿拉伯语和英语指令数据的微调

模型能力

阿拉伯语文本生成
英语文本生成
双语问答
代码生成
长文本处理

使用案例

研究应用
阿拉伯语NLP研究
用于自然语言理解和生成任务研究
文化对齐分析
研究双语预训练模型的文化对齐机制
商业应用
阿拉伯语聊天助手
开发面向阿拉伯语用户的智能对话系统
双语摘要
生成阿拉伯语-英语双语文档摘要