S

Sambalingo Turkish Base

由 sambanovasystems 开发
SambaLingo-土耳其语-基础版是一个基于Llama-2-7b预训练的双语(土耳其语和英语)模型,通过在Cultura-X数据集的土耳其语部分上训练420亿个令牌而适配土耳其语。
下载量 29
发布时间 : 2/15/2024
模型介绍
内容详情
替代品

模型简介

该模型是一个预训练的语言模型,支持土耳其语和英语,主要用于文本生成和理解任务。

模型特点

双语支持
支持土耳其语和英语,适用于双语任务。
大规模预训练
在Cultura-X数据集的土耳其语部分上训练了420亿个令牌,优化了土耳其语性能。
扩展词汇
通过添加多达25,000个目标语言的非重叠令牌,扩展了基础Llama模型的词汇量。

模型能力

文本生成
语言理解
双语翻译

使用案例

自然语言处理
土耳其语文本生成
生成土耳其语文本,适用于内容创作、自动回复等场景。
双语翻译
在土耳其语和英语之间进行翻译任务。