Kimi杀回来了！编程模型Kimi-Dev登顶开源榜一

发布于：2025-06-17

作者：AI频道

还记得Kimi吗？那个曾因能一口气“读”完几十万字小说而惊艳四座的AI助手，一度是国产大模型的明星。

然而，AI界的发展日新月异，甚至可以说是“神仙打架”。在近来一波又一波的新模型浪潮中，曾经的“长文本优等生”Kimi似乎慢下了脚步，甚至被不少用户吐槽“落后了”。

就在大家以为月之暗面要被对手赶超之时，他们却悄悄放出了一个“大招”：Kimi-Dev-72B。

简单来说，Kimi-Dev是一个专为软件工程任务而生的代码大模型。它不仅仅是能读懂或生成几行代码片段的“小助手”，而是一个旨在解决真实世界软件开发问题的“虚拟工程师”。

它在业内是什么水平？

在讨论它的工作方式之前，我们先来看看它的“战绩”。在软件工程领域，有一个非常权威且高难度的评测基准，叫做SWE-bench。你可以把它理解成代码界的一场“奥运会”，专门考验AI模型修复GitHub上真实Bug和问题的能力。

在这个高难度赛场上，Kimi-Dev-72B取得了当时所有开源模型中的最佳成绩，还超过了GPT-4.1等闭源模型。这意味着，它在解决真实、复杂软件工程问题的能力上，为开源社区树立了一个新的标杆。

像人类高手一样修复Bug

那么，Kimi-Dev到底“神”在哪里？答案在于它独特的学习和工作方式：结果驱动的强化学习。

传统的代码模型可能更像一个学徒，你告诉他怎么改，他照着做。而Kimi-Dev则更像一个经验丰富的架构师。它的训练方式极其“硬核”：

实战演练：它被直接“扔”进真实的GitHub代码仓库中，面对活生生的Bug。

双重角色：它内部拥有两个“人格”——“Bug修复师”（BugFixer）和“测试编写师”（TestWriter）。发现问题后，“修复师”尝试给出解决方案，而“测试师”则会编写严格的测试用例来验证这个方案是否完美。

结果导向：模型不会因为“看起来不错”的代码而得到奖励。唯一的奖励标准是：修复后的代码必须通过整个项目所有的测试。这意味着它必须拿出真正有效、健壮且不会引发新问题的解决方案。

“修复师”提交代码后，“测试师”立刻进行测试。一旦发现问题，“测试师”就会把失败的案例作为“负反馈”传回去。“修复师”则根据这些反馈，马上调整自己的方案，再次提交……

这个“创造-检查-修改”的循环会一直持续下去，直到一个终极目标达成：新的代码不仅要解决当前的问题，还必须完美通过“测试师”设计的所有考验。模型不会因为代码“看起来不错”而得到奖励，唯一的奖励来自于“所有测试全部通过”这个最终结果。

这种“自我挑剔”和“自我博弈”的模式，保证了Kimi-Dev最终拿出的成果，不是“差不多能用就行”的临时方案，而是真正可靠、经得起考验的优质代码。

这种训练方式，让Kimi-Dev学会了像人类顶尖开发者一样思考：定位问题、大胆假设、小心求证、最终交付可靠的成果。它不再是机械地模仿，而是真正地在“解决问题”。

开源！开源！开源！

在Kimi-Dev的发布中，最重要的一点就是它开源了。

具体来说，“月之暗面”向社区开放了模型的权重文件（Model Weight）和源代码（Source Code），并表示详细的技术报告也即将发布。

这意味着，这款强大的工具和它背后的技术，现在免费开放给所有人使用和研究，也是中国AI的有一个里程碑。

接下来，“月之暗面”计划继续扩展Kimi-Dev的能力，以应对更复杂的软件工程任务。未来的重点将放在与主流开发工具、版本控制系统和CI/CD流程的深度整合上，让Kimi-Dev能更无缝地融入开发者的日常工作流。

同时，他们也会持续对模型进行改进和安全测试，并向社区发布更强大的版本。

网友评论

关注

Ta的热门作品

国内 Mureka O1音乐大模型开始超越Suno V4

华为的野心！鸿蒙智能体的背后没那么简单！

反超 DeepSeek！阿里WebSailor 登顶！

相机实拍不如 AI？摄影师天都塌了！

手机打工赚钱养你？手机智能体能做什么？

每周热榜

年度旗舰小米13现身跑分：骁龙8 Gen2性能调教给力！安卓巅峰

快科技

蔡司影像加持！vivo X90系列正式发布，3699元起

鲜Phone速递

流畅度超过鸿蒙系统？荣耀MagicOS 7发布，未来可能兼容iOS、华为鸿蒙！

老孙说手机

新性价之王来了！Redmi K60外形渲染图抢先看：配置超给力

快科技

率先搭载骁龙8 Gen2！小米13参数出炉：2K屏+IMX8系主摄

快科技

技术比苹果更强！华为北斗卫星消息实测：手机无网络也能报平安

快科技

最后一款麒麟芯片手机下架！华为麒麟芯片库存耗尽，只能采用骁龙芯片？

科学技术宅

要涨价了！消息称小米13系列已量产：定价4500元左右

快科技

魅族前高管李楠吴京用iPhone：很合理，中兴确实没苹果手机牛！

老孙说手机

未经授权禁止转载、摘编、复制或建立镜像，如有违反，追究法律责任。

增值电信业务经营许可证：粤B2-20040647

广播电视节目制作经营许可证：粤字第806号

网站备案号：粤B2-20040647号-11

举报邮箱：shenhezhiban@pconline.com.cn

粤公网安备 44010602000162号