O

OPEN SOLAR KO 10.7B

由 beomi 开发
基于SOLAR-10.7B-v1.0的韩语增强版本,通过扩充词汇表和韩语语料库进行持续预训练
下载量 1,151
发布时间 : 1/2/2024

模型简介

Open-Solar-Ko是一个专注于韩语处理的10.7B参数大语言模型,通过扩展词汇表和增加韩语语料训练提升韩语文本生成能力

模型特点

韩语优化词汇表
扩展原版词汇表至46592,显著提升韩语分词效率(示例文本分词数从26降至8)
精选公开语料
仅使用AI Hub、Modu Corpus和韩语维基百科等公开韩语语料训练,符合开源协议
高效架构
采用4k上下文长度和支持GQA(Grouped Query Attention)的优化架构

模型能力

韩语文本生成
英语文本生成
韩语理解任务

使用案例

自然语言处理
韩语文本生成
生成符合语境的韩语文本内容
情感分析
分析韩语文本情感倾向
在nsmc测试集上达到0.896准确率(50-shot)
AIbase
智启未来,您的人工智能解决方案智库
简体中文