基于代码智能体的 GPU Kernel 生成与优化:MLSys 2026 FlashInfer 比赛总结

我最近参加了 MLSys 2026 - NVIDIA Track: FlashInfer AI Kernel Generation Contest(FlashInfer Contest, 2026a)。这篇博客并不是一篇关于 CUDA kernel 优化技巧的教程,我本身并不是 GPU 算子开发专家;参加这次比赛的主要目的,是想借助一个高度可验证、反馈明确的任务环境,研究如何让 Coding Agent 在持续闭环中产出高质量的 GPU kernel。 ...

Created: 2026-05-18 · Updated: 2026-05-25 · 8 分钟 · 3800 字 · Yue Shui