基于代码智能体的 GPU Kernel 生成与优化:MLSys 2026 FlashInfer 比赛总结
我最近参加了 MLSys 2026 - NVIDIA Track: FlashInfer AI Kernel Generation Contest(FlashInfer Contest, 2026a)。这篇博客并不是一篇关于 CUDA kernel 优化技巧的教程,我本身并不是 GPU 算子开发专家;参加这次比赛的主要目的,是想借助一个高度可验证、反馈明确的任务环境,研究如何让 Coding Agent 在持续闭环中产出高质量的 GPU kernel。 ...