M

Meltemi 7B V1

由 ilsp 开发
首个希腊语大型基础语言模型,基于Mistral-7B架构,通过400亿token的希腊语和英语语料增强希腊语能力
下载量 49
发布时间 : 3/22/2024
模型介绍
内容详情
替代品

模型简介

由雅典研究与创新中心下属的语言与语音处理研究所训练的首个希腊语大语言模型,支持希腊语和英语,具备文本生成能力

模型特点

希腊语优化
扩展Mistral-7B分词器以支持希腊语词汇,通过285亿希腊语token增强希腊语能力
双语能力
在增强希腊语能力的同时保持英语能力,防止灾难性遗忘
长上下文支持
支持8192个token的上下文长度
高质量语料
使用严格清洗去重的400亿token语料库进行训练

模型能力

希腊语文本生成
英语文本生成
双语文本处理

使用案例

教育
希腊语学习辅助
帮助学习者理解和生成希腊语内容
医疗
医疗问答
基于希腊语医疗考试数据集的问答能力
在医疗MCQA希腊语测试集上达到41.0%准确率