Llama-3.3-70B-Instruct-4bit-DWQ开源模型 - 适用于MLX框架的高效推理

首页

Llama 3.3 70B Instruct 4bit DWQ

由 mlx-community 开发

基于Llama 3.3 70B指令微调模型的4位DWQ量化版本，适用于MLX框架的高效推理

大型语言模型支持多种语言#70B大模型 #4bit量化 #多语言指令

下载量 140

发布时间 : 5/23/2025

模型简介

这是一个70B参数的大型语言模型，经过指令微调优化，并采用4位DWQ量化技术转换至MLX格式，支持多语言交互和复杂任务处理

模型特点

高效4位量化

采用DWQ 4位量化技术，显著降低内存需求同时保持模型性能

多语言支持

支持8种主要语言的文本生成和理解

指令优化

经过专门指令微调，更适合对话和任务导向型应用

MLX框架兼容

专为MLX框架优化，可在Apple Silicon设备上高效运行

模型能力

多语言文本生成

指令理解与执行

对话系统构建

内容创作辅助

知识问答

使用案例

智能助手

多语言客服机器人

构建支持多种语言的自动客服系统

可处理常见客户咨询，支持8种语言

教育

语言学习辅助

帮助语言学习者进行对话练习和语法纠正

提供多语言互动学习体验

内容创作

多语言内容生成

自动生成博客文章、营销文案等内容

支持多种语言的高质量内容输出

🚀 mlx-community/Llama-3.3-70B-Instruct-4bit-DWQ

本项目将模型 mlx-community/Llama-3.3-70B-Instruct-4bit-DWQ 从 mlx-community/Llama-3.3-70B-Instruct-bf16 转换为 MLX 格式，使用的是 mlx-lm 版本 0.24.0。

🚀 快速开始

与 mlx 一起使用

首先，你需要安装 mlx-lm：

pip install mlx-lm

以下是使用该模型的代码示例：

from mlx_lm import load, generate

model, tokenizer = load("mlx-community/Llama-3.3-70B-Instruct-4bit-DWQ")

prompt = "hello"

if tokenizer.chat_template is not None:
    messages = [{"role": "user", "content": prompt}]
    prompt = tokenizer.apply_chat_template(
        messages, add_generation_prompt=True
    )

response = generate(model, tokenizer, prompt=prompt, verbose=True)

📄 许可证

LLAMA 3.3 社区许可协议

Llama 3.3 版本发布日期：2024 年 12 月 6 日

“协议” 指本协议中规定的 Llama 材料的使用、复制、分发和修改的条款和条件。 “文档” 指 Meta 在 https://www.llama.com/docs/overview 上分发的 Llama 3.3 随附的规格、手册和文档。 “被许可方” 或 “您” 指您，或您的雇主，或任何其他人或实体（如果您代表该人或实体签订本协议），且该人或实体已达到适用法律、规则或法规要求的提供法律同意的年龄，并且如果您代表其签订本协议，则具有约束您的雇主或该其他人或实体的合法权力。 “Llama 3.3” 指 Meta 在 https://www.llama.com/llama-downloads 上分发的基础大语言模型、软件和算法，包括机器学习模型代码、训练好的模型权重、推理启用代码、训练启用代码、微调启用代码以及上述内容的其他元素。 “Llama 材料” 指 Meta 根据本协议提供的专有 Llama 3.3 和文档（及其任何部分）的统称。 “Meta” 或 “我们” 指 Meta Platforms Ireland Limited（如果您位于欧洲经济区或瑞士，或者如果您是一个实体，您的主要营业地位于欧洲经济区或瑞士）和 Meta Platforms, Inc.（如果您位于欧洲经济区或瑞士以外）。

通过点击下面的 “我接受”，或使用或分发 Llama 材料的任何部分或元素，即表示您同意受本协议约束。

许可权利和再分发
- 权利授予：您被授予在 Meta 体现在 Llama 材料中的知识产权或其他权利下的非排他性、全球性、不可转让且免版税的有限许可，以使用、复制、分发、拷贝、创作衍生作品并对 Llama 材料进行修改。
- 再分发和使用
  - 如果您分发或提供 Llama 材料（或其任何衍生作品），或包含其中任何内容的产品或服务（包括另一个人工智能模型），您应：
    - 随任何此类 Llama 材料提供本协议的副本；
    - 在相关网站、用户界面、博客文章、关于页面或产品文档上显著显示 “Built with Llama”。如果您使用 Llama 材料或 Llama 材料的任何输出或结果来创建、训练、微调或以其他方式改进一个人工智能模型，并进行分发或提供，则您还应在任何此类人工智能模型名称的开头包含 “Llama”。
  - 如果您作为集成最终用户产品的一部分从被许可方处接收 Llama 材料或其任何衍生作品，则本协议第 2 条不适用于您。
  - 您必须在您分发的所有 Llama 材料副本中，在作为此类副本一部分分发的 “Notice” 文本文件中保留以下归属声明：“Llama 3.3 已根据 Llama 3.3 社区许可获得许可，版权所有 © Meta Platforms, Inc. 保留所有权利。”
  - 您对 Llama 材料的使用必须符合适用的法律和法规（包括贸易合规法律和法规），并遵守 Llama 材料的可接受使用政策（可在 https://www.llama.com/llama3_3/use-policy 上获取），该政策特此通过引用并入本协议。
额外商业条款：如果在 Llama 3.3 版本发布日期，被许可方或被许可方关联方提供的产品或服务的月活跃用户在前一个日历月超过 7 亿，则您必须向 Meta 请求许可，Meta 可自行决定是否授予您许可，并且除非或直到 Meta 明确授予您此类权利，否则您无权行使本协议下的任何权利。
保修免责声明：除非适用法律要求，否则 Llama 材料及其任何输出和结果均按 “现状” 提供，不提供任何形式的保证，Meta 明确否认所有形式的保证，包括但不限于所有权、不侵权、适销性或特定用途适用性的任何保证。您独自负责确定使用或再分发 Llama 材料的适当性，并承担与您使用 Llama 材料及其任何输出和结果相关的任何风险。
责任限制：在任何情况下，Meta 或其关联方均不对因本协议引起的任何利润损失或任何间接、特殊、后果性、偶发性、惩戒性或惩罚性损害承担责任，无论责任理论如何，包括合同、侵权、疏忽、产品责任或其他，即使 Meta 或其关联方已被告知任何上述损害的可能性。
知识产权
- 本协议未授予任何商标许可，并且与 Llama 材料相关，除非在描述和再分发 Llama 材料时进行合理和惯常使用所需，或如本节 5(a) 所述，否则 Meta 和被许可方均不得使用对方或其任何关联方拥有或关联的任何名称或标记。Meta 特此授予您仅在遵守第 1.b.i 条最后一句的要求时使用 “Llama”（“标记”）的许可。您将遵守 Meta 的品牌指南（目前可在 https://about.meta.com/brand/resources/meta/company-brand/) 上获取）。因您使用标记而产生的所有商誉均归 Meta 所有。
- 鉴于 Meta 对 Llama 材料及其为 Meta 制作的衍生作品的所有权，就您制作的 Llama 材料的任何衍生作品和修改而言，在您和 Meta 之间，您是且将是此类衍生作品和修改的所有者。
- 如果您对 Meta 或任何实体提起诉讼或其他程序（包括在诉讼中的交叉索赔或反诉），声称 Llama 材料或 Llama 3.3 的输出或结果，或上述任何内容的任何部分构成侵犯您拥有或可许可的知识产权或其他权利，则本协议授予您的任何许可应自提起此类诉讼或索赔之日起终止。您将赔偿并使 Meta 免受因您使用或分发 Llama 材料而产生或与之相关的任何第三方索赔的损害。
期限和终止：本协议的期限将自您接受本协议或访问 Llama 材料时开始，并将持续完全有效，直至根据本协议的条款和条件终止。如果您违反本协议的任何条款或条件，Meta 可终止本协议。本协议终止后，您应删除并停止使用 Llama 材料。第 3、4 和 7 条在本协议终止后仍然有效。
适用法律和管辖权：本协议将受加利福尼亚州法律管辖并依其解释，不考虑法律选择原则，并且《联合国国际货物销售合同公约》不适用于本协议。加利福尼亚州的法院对因本协议引起的任何争议具有专属管辖权。

Llama 3.3 可接受使用政策

Meta 致力于促进其工具和功能（包括 Llama 3.3）的安全和公平使用。如果您访问或使用 Llama 3.3，即表示您同意本可接受使用政策（“政策”）。本政策的最新副本可在 https://www.llama.com/llama3_3/use-policy 上找到。

禁止使用

我们希望每个人都能安全、负责任地使用 Llama 3.3。您同意您不会使用或允许他人使用 Llama 3.3 来：

违反法律或他人权利，包括：
- 从事、促进、生成、促成、鼓励、计划、煽动或进一步推动非法或违法活动或内容，例如：
  - 暴力或恐怖主义；
  - 对儿童的剥削或伤害，包括招揽、创作、获取或传播儿童剥削内容或未能报告儿童性虐待材料；
  - 人口贩运、剥削和性暴力；
  - 向未成年人非法分发信息或材料，包括淫秽材料，或未能对此类信息或材料采用法律要求的年龄限制；
  - 性招揽；
  - 任何其他犯罪活动。
- 从事、促进、煽动或便利对个人或个人群体的骚扰、虐待、威胁或欺凌。
- 从事、促进、煽动或便利在就业、就业福利、信贷、住房、其他经济福利或其他基本商品和服务的提供方面的歧视或其他非法或有害行为。
- 从事未经授权或无执照的任何专业实践，包括但不限于金融、法律、医疗/健康或相关专业实践。
- 收集、处理、披露、生成或推断个人的私人或敏感信息，包括个人身份、健康或人口统计信息，除非您已根据适用法律获得这样做的权利。
- 从事或便利任何侵犯、挪用或以其他方式侵犯任何第三方权利的行为或生成任何内容，包括使用 Llama 材料的任何产品或服务的输出或结果。
- 创建、生成或便利创建恶意代码、恶意软件、计算机病毒或做任何其他可能禁用、使负担过重、干扰或损害网站或计算机系统的正常运行、完整性、操作或外观的事情。
- 从事任何行动或便利任何行动，故意规避或移除使用限制或其他安全措施，或启用 Meta 禁用的功能。
从事、促进、煽动、便利或协助规划或开展对个人造成死亡或身体伤害风险的活动，包括与以下方面相关的 Llama 3.3 的使用：
- 军事、战争、核工业或应用、间谍活动、用于受美国国务院维护的《国际武器贸易条例》（ITAR）或 1989 年《美国生物武器反恐法》或 1997 年《化学武器公约实施法》约束的材料或活动。
- 枪支和非法武器（包括武器开发）。
- 非法药物和受管制/受控物质。
- 关键基础设施、运输技术或重型机械的操作。
- 自我伤害或对他人的伤害，包括自杀、自残和饮食失调。
- 任何旨在煽动或促进暴力、虐待或对个人造成身体伤害的内容。
故意欺骗或误导他人，包括与以下方面相关的 Llama 3.3 的使用：
- 生成、促进或进一步推动欺诈或虚假信息的创建或推广。
- 生成、促进或进一步推动诽谤性内容，包括创建诽谤性声明、图像或其他内容。
- 生成、促进或进一步分发垃圾邮件。
- 在未经同意、授权或合法权利的情况下冒充他人。
- 声称使用 Llama 3.3 或其输出是人类生成的。
- 生成或便利虚假的在线互动，包括虚假评论和其他虚假在线互动方式。
未能向最终用户适当披露您的人工智能系统的任何已知危险。
与旨在生成非法内容或从事非法或有害行为的第三方工具、模型或软件进行交互，并/或声称此类工具、模型或软件的输出与 Meta 或 Llama 3.3 相关联。

对于 Llama 3.3 中包含的任何多模态模型，如果您是居住在欧盟的个人或主要营业地在欧盟的公司，则本 Llama 3.3 社区许可协议第 1(a) 条授予的权利不适用于您。此限制不适用于包含任何此类多模态模型的产品或服务的最终用户。

请通过以下方式之一报告本政策的任何违反行为、软件 “漏洞” 或其他可能导致违反本政策的问题：

报告模型问题：https://github.com/meta-llama/llama-models/issues
报告模型生成的风险内容：developers.facebook.com/llama_output_feedback
报告漏洞和安全问题：facebook.com/whitehat/info
报告违反可接受使用政策或未经授权使用 Llama 3.3 的情况：LlamaUseReport@meta.com

额外信息

属性	详情
基础模型	mlx-community/Llama-3.3-70B-Instruct-bf16
支持语言	英语、法语、意大利语、葡萄牙语、印地语、西班牙语、泰语、德语
库名称	mlx
标签	facebook、meta、pytorch、llama、llama-3、mlx
管道标签	文本生成

额外门控信息

如果需要获取该模型，您可能需要提供以下信息：

信息项	类型	详情
名字	文本框	输入您的名字
姓氏	文本框	输入您的姓氏
出生日期	日期选择器	选择您的出生日期
国家	国家选择	选择您所在的国家
所属机构	文本框	输入您所属的机构
职位	下拉选择	可选择学生、研究毕业生、AI 研究员、AI 开发者/工程师、记者、其他
地理位置	IP 定位	系统自动获取您的 IP 地理位置
接受许可协议	复选框	勾选表示您接受许可协议，并确认您提供的信息将根据 Meta 隐私政策进行收集、存储、处理和共享