KernelLLM-GGUF开源模型 - 免费部署，轻松编写Triton的GPU内核

首页

Kernelllm GGUF

由 lmstudio-community 开发

KernelLLM是基于Llama 3.1 Instruct微调的模型，专门用于编写使用Triton的GPU内核。

大型语言模型开源协议:其他 #Triton内核生成 #128k长上下文 #Llama3.1微调

下载量 214

发布时间 : 5/19/2025

模型简介

该模型能够将PyTorch模块转换为Triton内核，并在KernelBench-Triton数据集上进行了评估，表现出竞争性或更优的性能。

模型特点

128k tokens上下文长度

支持超长上下文，适合处理复杂的内核生成任务

GPU内核代码生成

专门优化用于将PyTorch模块转换为高效的Triton GPU内核

高效性能

相比更大的模型，在内核生成任务上表现出竞争性或更优的性能

模型能力

文本生成

代码生成

GPU内核优化

使用案例

GPU编程

PyTorch到Triton转换

将PyTorch模块自动转换为高效的Triton GPU内核

生成的内核在性能上可与手工优化代码媲美

高性能计算

为科学计算和机器学习任务生成优化的GPU内核

提升计算密集型任务的执行效率

🚀 社区模型：Facebook的KernelLLM

这是 LM Studio 社区模型亮点计划。该计划旨在突出社区中新颖且值得关注的模型。快来 Discord 参与讨论吧！

模型信息

属性	详情
模型创建者	facebook
原始模型	KernelLLM
GGUF量化	由 bartowski 基于 `llama.cpp` 版本 b5415 提供
量化者	bartowski
任务类型	文本生成
基础模型	facebook/KernelLLM
数据集	ScalingIntelligence/KernelBench
许可证	other
基础模型关系	量化版本

🔧 技术细节

支持128k个标记的上下文长度。
基于Llama 3.1 Instruct进行微调，专门用于使用Triton编写GPU内核的任务。
KernelLLM可以将PyTorch模块转换为Triton内核，并在KernelBench-Triton上进行了评估。
在核生成任务中，与更大的模型相比，它能取得有竞争力或更优的性能。

🙏 特别感谢

特别感谢 Georgi Gerganov 以及整个 llama.cpp 团队，是他们让这一切成为可能。

⚠️ 免责声明

LM Studio并非社区模型计划中任何模型的创建者、发起者或所有者。每个社区模型均由第三方创建和提供。LM Studio不认可、支持、代表或保证任何社区模型的完整性、真实性、准确性或可靠性。您应明白，社区模型可能会生成具有冒犯性、有害性、不准确或其他不当或欺骗性的内容。每个社区模型的唯一责任在于发起该模型的个人或实体。LM Studio可能不会监控或控制社区模型，也不能且不会对任何此类模型负责。LM Studio声明不承担关于社区模型的准确性、可靠性或益处的所有保证或担保。此外，LM Studio声明不保证社区模型能满足您的需求，不保证其安全性、连续性、随时可用性或无错误、无病毒，也不保证会纠正任何错误等。您将独自承担因使用或访问社区模型、下载任何社区模型或使用LM Studio提供或通过LM Studio提供的任何其他社区模型而导致的任何损害。