在 Princeton 发布 SWE-Bench 之后,用真实世界代码仓库+可执行测试评测大模型软件工程能力,几乎已成为学术界与工业界的共识。围绕 SWE issue 的评测范式迅速发展,也催生了一系列 SWE 系列 benchmark,在刻画模型 bug 修复能力方面发挥了重要作用。但真实的软件工程实践并不止于修 bug。大量关键工作发生在 feature ...
导语:CODING Enterprise 可以让程序员远程协作撸代码。接下来的问题就变成:“老板是不是愿意为员工的终身幸福买单”了。 也许是为了避开程序猿的伤心事,CODING 选择了在 1.11 小光棍节的第二天上线新产品。 CODING,这个在去年收购了 GitCafe 的软件开发平台 ...
大家好呀,这里是有猫的昭意~致力于探索最前沿的AI工具,紧跟时代步伐,不落后、不到退、不原地踏步! Vibe Coding爆火!不用敲代码也能编程?大白话拆解,小白也能懂 最近开发者圈,被一个新词彻底刷屏了——Vibe Coding(氛围编程)最近开发者圈,被一个新词彻底刷屏了——Vibe ...