extra_gated_prompt: >-
Fugaku-LLM使用条款
本使用条款(以下简称"本条款")由富士通株式会社、国立研究开发法人理化学研究所、国立大学法人东京工业大学、国立大学法人东北大学、株式会社CyberAgent、国立大学法人东海国立大学机构及株式会社Kotoba Technologies Japan(以下简称"开发者")共同制定,适用于作为超级计算机"富岳"政策对应框架下大规模语言模型分布式并行学习方法开发成果而公开的大规模语言模型(以下简称"Fugaku-LLM")的使用。Fugaku-LLM使用者(以下简称"使用者")应在同意本条款的前提下使用Fugaku-LLM。
-
第一条(使用许可)
使用者可根据本条款将Fugaku-LLM用于商业或非商业目的。使用行为包括但不限于对Fugaku-LLM的修改、复制和再分发,以及使用Fugaku-LLM或其修改后创建的大规模语言模型(以下简称"衍生作品")实施服务。但使用者在再分发Fugaku-LLM或衍生作品时的许可证,或使用Fugaku-LLM/衍生作品服务的条款中必须包含本使用条款。此外,使用者在再分发衍生作品时,必须明确标注已进行修改。违反本条款的使用者将被禁止使用Fugaku-LLM。
-
第二条(责任)
- 使用者确认Fugaku-LLM按"现状"提供,开发者不对其准确性、完整性、时效性及质量等作任何明示或默示保证,且不承担因使用或无法使用Fugaku-LLM导致的任何损害责任。
- 若因使用者使用Fugaku-LLM或违反本条款导致开发者受损,使用者应予以赔偿。
- 使用者应自行承担使用风险,妥善处理与第三方因使用Fugaku-LLM产生的纠纷,并确保不因此对开发者造成任何困扰。因使用Fugaku-LLM导致的损害由使用者自行承担。
-
第三条(禁止行为)
使用者不得利用Fugaku-LLM实施以下行为:
- 侵犯开发者或第三方知识产权的行为
- 侵害开发者或第三方财产、隐私或肖像权的行为
- 对开发者或第三方进行歧视、诽谤、侮辱,助长歧视或损害名誉/信用的行为
- 从事未经许可的法律业务或提供非专业法律建议
- 提供非专业财务建议
- 包含健康建议或治疗方案的医疗行为
- 其他需依法取得许可的行为
-
第四条(限制事项)
- 使用者确认Fugaku-LLM处理结果(以下简称"处理结果")可能包含虚假、偏见、侵权或不符合预期效果的内容,并应在认知不准确/不适当结果可能导致损害、侵权或伦理问题的前提下使用。使用者应自行验证处理结果的准确性、合法性及伦理正当性。因使用处理结果导致的损害,开发者不承担责任。
- 使用者应在遵守各国/地区法规的前提下使用处理结果。
- 不得将处理结果用于第三条所述禁止行为。
-
第五条(权利归属)
- 除本条款明确规定外,使用者不获得Fugaku-LLM任何权利。
- 使用者对衍生作品享有新产生权利,但使用需遵守本条款。
- 开发者不对处理结果主张权利。
-
第六条(出口管制)
涉及《外汇及外贸法》或美国出口管制法规的出口行为,使用者应自行取得许可。
-
第七条(管辖法院)
与本条款相关的争议由东京地方法院专属管辖。
-
第八条(适用法律)
本条款适用日本法律。
-
第九条(其他规定)
本条款构成使用者与开发者间完整协议,未尽事宜依相关法规。
-
第十条(语言版本)
本条款以日语原文为准,英文译本仅供参考且无法律效力。
以上
Fugaku-LLM使用条款(英文版)
(此处保留英文原文不作翻译)
license: other
license_name: fugaku-llm-tou
license_link: LICENSE
language:
Fugaku-LLM
我们的Fugaku LLM模型是完全利用超级计算机"富岳"从头开始预训练的国产模型。该模型因使用自有数据训练而具有高度透明性和安全性。训练数据以日语为主,模型在日语处理方面表现卓越。
本模型由Fugaku-LLM开发。其他模型链接详见索引。
模型索引
模型 |
Fugaku-LLM |
Fugaku-LLM指令调优版 |
13B |
链接 |
链接 |
模型详情
模型性能
指令调优模型
我们参照Nejumi LLM Leaderboard Neo方法对日语MT基准进行了评估。仅对Fastchat代码做了以下修改:
- 输入提示调用分词器时添加"add_special_tokens=False"参数
- 限制生成token数不超过2048
模型名称 |
平均分 |
编程 |
信息提取 |
人文 |
数学 |
推理 |
角色扮演 |
STEM |
写作 |
Fugaku-LLM-13B-instruct |
5.47 |
2.10 |
4.10 |
9.18 |
2.30 |
3.40 |
8.20 |
7.25 |
7.25 |
使用方式
使用指令调优模型
(保留代码示例原文)
使用基础模型
(保留代码示例原文)
训练数据集
指令调优数据
许可协议
Fugaku-LLM使用条款详见LICENSE和LICENSE_ja文件。
风险与限制
使用Fugaku-LLM生成的结果可能包含虚假、偏见、侵权内容或未达预期效果。
致谢
本成果基于文部科学省"富岳"国家项目《面向富岳的大规模语言模型分布式训练方法开发》。
开发团队
- 东京工业大学
- 东北大学
- 富士通株式会社
- 理化学研究所
- 名古屋大学
- 株式会社CyberAgent
- Kotoba科技有限公司