许可证:llama3
语言:
- 英文
- 韩文
任务标签:文本生成
标签:
- saltlux
- luxia
- meta
- llama-3
- pytorch
模型详情
Saltlux AI实验室语言模型团队训练并公开的Ko-Llama3-Luxia-8B模型是基于Meta发布的Llama-3-8B模型针对韩语优化的版本。
我们从自有的超过1TB韩语训练数据中精选了约100GB数据用于预训练。
同时扩展了公开的Llama-3分词器以支持韩语,并应用于预训练过程。
- Meta Llama-3: Meta开发并发布了Llama 3系列大语言模型(LLMs),包含80亿和700亿参数的预训练及指令调优生成文本模型。Llama 3指令调优模型针对对话场景优化,在行业基准测试中超越多数开源聊天模型。我们在开发过程中特别注重优化实用性与安全性。
- 许可证: Llama3许可证 https://llama.meta.com/llama3/license
预期用途
Ko-Llama3-Luxia-8B专为研究目的开发,可自由用于各类自然语言生成任务。
使用方法
本模型卡提供Ko-Llama3-Luxia-8B
模型及基于transformers库的示例代码:
import transformers
import torch
model_id = "saltlux/Ko-Llama3-Luxia-8B"
pipeline = transformers.pipeline(
"text-generation", model=model_id, model_kwargs={"torch_dtype": torch.bfloat16}, device_map="auto"
)
pipeline("<|begin_of_text|>您好,这里是Saltlux AI实验室。")
训练详情
韩语优化的预训练数据采用Saltlux自有语料库(含新闻、法律、专利、医疗、历史、社会、文化、书面/口语对话等领域,约100GB,数据截至2023年)。
训练设备
预训练使用NVIDIA H100 80GB * 8台设备完成。
训练超参数
模型 |
参数量 |
上下文长度 |
GQA |
学习率 |
批次 |
精度 |
Ko-Llama3-Luxia-8B |
80亿 |
8k |
支持 |
1e-5 |
128 |
bf16 |
分词器
为优化韩语处理,在Llama-3分词器基础上新增17,536个韩语专用token。
模型 |
词表大小 |
Llama-3 |
128,256 |
Ko-Llama3-Luxia-8B |
145,792 |
分词效果对比
输入 |
Llama-3 |
Ko-Llama3-Luxia-8B |
最近天气反复无常,冬装到现在还没收起来.. |
['最', '近', ' 天', '气', '反', '复', '无', '常', ',', ' 冬', '装', '到', '现', '在', '还', '没', '收', '起', '来', '..'] |
['最近', ' 天气', '反复', '无常', ',', ' 冬装', '到', '现在', '还', '没', '收', '起来', '..'] |
您吃过美味的饭了吗?好奇味道如何。 |
['美', '味', '的', ' 饭', '吃', '过', '了', '吗', '?', ' 好', '奇', '味', '道', '如', '何', '。'] |
['美味', '的', ' 饭', '吃过', '了', '吗', '?', ' 好奇', ' 味道', '如何', '。'] |
输入 |
Llama-3 |
Ko-Llama3-Luxia-8B |
Korean cuisine has evolved through centuries of social change. |
['Korean', ' cuisine', ' has', ' evolved', ' through', ' centuries', ' of', ' social', ' change', '.'] |
['Korean', ' cuisine', ' has', ' evolved', ' through', ' centuries', ' of', ' social', ' change', '.'] |
生成效果对比
Llama-3 |
Ko-Llama3-Luxia-8B |
加勒比海湾位于龙仁,是该度假区的官方在线赌场。自1994年运营,2005年上线。持有英国政府批准的运营执照,提供老虎机、21点、轮盘等多种游戏及新人100%投注奖励等促销活动。<后续省略> |
加勒比海湾位于龙仁,是结合水上乐园与游乐园的综合度假区。夏季可戏水,冬季可滑雪,四季皆宜。需官网购票,另提供成人儿童皆可购买的年度通行证。<后续省略> |
越南河粉类似韩国汤饭,含米、猪肉、蛋、洋葱等食材。具体做法:1.洗米浸泡 2.切肉备料 3.炒肉加料 4.加蛋和酱油 5.放米调味 6.煮熟装碗 7.码放配料。Vietnamese rice noodles...<后续省略> |
越南河粉通常使用米浆制成的细面,烫熟过冷水后与高汤蔬菜同煮。高汤可用鸡肉、牛肉等,配菜可选胡萝卜、洋葱等。<后续省略> |
引用说明
Ko-Llama3-Luxia-8B
@article{kollama3luxiamodelcard,
title={Ko Llama 3 Luxia Model Card},
author={AILabs@Saltux},
year={2024},
url={https://huggingface.co/saltlux/Ko-Llama3-Luxia-8B/blob/main/README.md}
}
原始Llama-3
@article{llama3modelcard,
title={Llama 3 Model Card},
author={AI@Meta},
year={2024},
url={https://github.com/meta-llama/llama3/blob/main/MODEL_CARD.md}
}