K

Komodo 7b Base

由 Yellow-AI-NLP 开发
科莫多-7B是基于Llama-2-7B通过增量预训练和词汇扩展开发的大语言模型,支持印尼语、英语及11种印尼地区语言。
下载量 1,113
发布时间 : 2/7/2024

模型简介

该模型专为处理印尼及地区语言设计,通过扩展词表增强语言覆盖能力,需进一步微调以适应下游任务。

模型特点

多语言支持
支持印尼语、英语及11种印尼地区语言,通过系统性词汇扩展增强语言覆盖
增量预训练
基于Llama-2-7B进行增量预训练,保留原模型优势的同时适应印尼语言特点
高效词表扩展
新增3000个高频词(2000印尼语+1000地区语言词),显著提升分词效率

模型能力

印尼语文本生成
多语言混合处理
跨语言理解

使用案例

语言服务
印尼语内容创作
生成符合当地语言习惯的文本内容
输出符合印尼文化背景的自然语言
地区语言翻译
处理印尼地区语言与英语/印尼语之间的翻译任务
在英印翻译基准测试中达90.5分
文化研究
方言分析
识别和处理印尼不同地区的语言变体
方言检测任务得分73.6
AIbase
智启未来,您的人工智能解决方案智库
简体中文