库名称: transformers
支持语言:
- 英语
- 法语
- 意大利语
- 葡萄牙语
- 印地语
- 西班牙语
- 泰语
- 德语
基础模型:
- meta-llama/Llama-3.1-70B
标签:
- facebook
- meta
- pytorch
- llama
- llama-3
授权协议门控提示: "### LLAMA 3.3社区许可协议\nLlama 3.3版本发布日期: 2024年12月6日\n本协议规定了使用、复制、分发和修改Llama材料的相关条款。\n文档指Meta在https://www.llama.com/docs/overview发布的Llama 3.3配套规范、手册和文档。\n被许可方指同意本协议的个人或实体。\nLlama 3.3指Meta在https://www.llama.com/llama-downloads发布的基础大语言模型及相关软件算法。\nLlama材料统指根据本协议提供的Llama 3.3和文档。\nMeta指Meta Platforms爱尔兰有限公司或Meta Platforms公司。\n点击下方"我接受"或使用Llama材料即表示同意本协议。\n1. 许可权利与再分发\n授予非独占、全球性、不可转让的免费有限许可。\n再分发要求包括:提供协议副本、显著标注"基于Llama构建"、保留版权声明。\n使用需遵守适用法律和可接受使用政策。\n2. 商业条款\n月活用户超过7亿需向Meta申请商业许可。\n3. 免责声明\n除非法律要求,Llama材料按"原样"提供,不提供任何明示或默示担保。\n4. 责任限制\nMeta不对任何间接、特殊、后果性损害承担责任。\n5. 知识产权\n不授予商标许可,衍生作品所有权归开发者所有。\n6. 期限与终止\n违约时Meta可终止协议。\n7. 适用法律\n受加利福尼亚州法律管辖。\n### Llama 3.3可接受使用政策\n禁止用途包括:\n1. 违法或侵犯他人权利的行为\n2. 危害人身安全的活动\n3. 欺骗误导行为\n4. 未披露AI系统风险\n违规可通过指定渠道举报。"
授权协议门控字段:
名: 文本
姓: 文本
出生日期: 日期选择器
国家: 国家选择
所属机构: 文本
职位:
类型: 下拉选择
选项:
- 学生
- 研究生
- AI研究员
- AI开发工程师
- 记者
- 其他
地理位置: IP定位
勾选框: 接受隐私政策条款
授权协议门控描述: 提供的信息将按照Meta隐私政策处理。
授权协议门控按钮内容: 提交
许可证: llama3.3
模型信息
Meta Llama 3.3多语言大语言模型(LLM)是700亿参数指令调优生成模型,专为多语言对话场景优化,在行业基准测试中表现优异。
开发者: Meta
架构: 基于优化Transformer架构的自回归语言模型,采用监督微调(SFT)和人类反馈强化学习(RLHF)对齐人类偏好。
|
训练数据 |
参数量 |
输入模态 |
输出模态 |
上下文长度 |
GQA |
token数量 |
知识截止 |
Llama 3.3(纯文本) |
公开网络数据混合 |
70B |
多语言文本 |
多语言文本与代码 |
128k |
支持 |
15T+ |
2023年12月 |
支持语言: 英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。
发布版本:
- 70B指令版: 2024年12月6日
状态: 基于离线数据训练的静态模型
许可证: 自定义商业许可,详见链接
使用方式
Transformers使用
import transformers
pipeline = transformers.pipeline(
"text-generation",
model="meta-llama/Llama-3.3-70B-Instruct",
torch_dtype=torch.bfloat16,
device_map="auto"
)
工具调用示例
def get_temperature(location: str) -> float:
"""获取指定地点当前温度"""
return 22.0
messages = [{"role":"user","content":"巴黎现在气温多少?"}]
inputs = tokenizer.apply_chat_template(messages, tools=[get_temperature])
量化部署
支持4/8位量化:
from transformers import BitsAndBytesConfig
quant_config = BitsAndBytesConfig(load_in_4bit=True)
训练数据
- 预训练数据: 约15万亿token
- 微调数据: 2500万合成示例
- 数据新鲜度: 截至2023年12月
性能基准
类别 |
测试项 |
Llama-3.3 70B表现 |
知识 |
MMLU |
86.0 |
推理 |
GPQA |
50.5 |
代码 |
HumanEval |
88.4 |
数学 |
MATH |
77.0 |
多语言 |
MGSM |
91.1 |
责任与安全
采用三重策略管理风险:
- 开发安全部署指南
- 防范对抗性滥用
- 提供社区保护措施
关键风险领域:
- CBRNE(生化核爆)风险控制
- 儿童安全保护
- 网络攻击防范
伦理考量
Llama 3.3核心价值是开放、包容和助益性,但开发者需注意:
- 可能产生不准确/偏见内容
- 需针对具体应用进行安全测试
- 参考责任使用指南