文章来源:万象ai发布时间:2025-07-26 14:40:49
400 多年前,宋应星著成《天工开物》。这是一部写给匠人、也写给未来的书。它让人相信:技术不是死物,而是人与世界持续互动的方式。
如果说「天工」代表了中国古代对「工程」与「制造」的极致理解,那么今天,一个同样以「天工」(即 Skywork)为名的 Agent 智能体,正试图在另一片疆域(代码世界)中,继承这份精神。
这个 Skywork,不是炼铁铸器的匠人,而是自主代码智能体基座模型,要修补的是一种现代最复杂的人造系统:(开源)软件工程。它不握锤凿,而是靠多轮交互、长上下文理解与逻辑推理,在成千上万的 GitHub 项目中识别 issue/bug、定位原因、打补丁,并验证是否真的修好了。故此,它得名 Skywork-SWE。(注:SWE 是指软件工程 / Software Engineering。)
Skywork-SWE 因何而生?
软件智能体面临的困难
在古人的世界里,修一口破鼎、补一段布帛是「匠人精神」的体现。而在今天,最频繁「破裂」的,莫过于代码。
如今,代码系统早已成为现代文明的骨架。它们运行在日常软件、银行服务、交通调度等各式系统中,也支撑着我们所依赖的 AI 算法本身。但和古代器物一样,再精妙的程序也难免出现 bug—— 有些是逻辑失误,有些是环境变迁,有些甚至源于协作失控。比如,就在前几天,AWS、谷歌云、Azure 和 Cloudflare 都发生了中断,连带着 ChatGPT 和 Cursor 等热门 AI 应用也一并短暂失联;而这一事故的原因可能是一次错误的自动配额更新导致谷歌的 API 管理系统出现了故障。
同时,bug 修复也是软件工程中最基础,却也是最复杂、最消耗人力的任务之一。特别是在真实的 GitHub 项目中,修一个 bug 并不是「找到一行错字那么简单」,它常常需要:
读取和理解成百上千个文件;推演变量在不同模块的流动路径;
阅读前人留下的修复记录与讨论;
理解上下文、猜测意图、编写代码补丁;
最后,还得跑几遍测试,看看是不是真的「已解决」。
那么,我们能否使用 AI 智能体来完成这些任务呢?
当然可以!但我们需要的绝不是传统的用于解决单独编程任务的 AI 编程模型,而是需要像人类开发者一样能够理解历史上下文、进行多轮推理、在模糊与不确定中做决策、具备落地执行的能力的软件工程智能体。
而难题也随之而生:这类任务长期缺乏高质量训练数据。市面上现有的 SWE 数据集,不是验证机制不足,就是训练样本杂乱无章,难以支持模型在真实工程中进化。另外,这些数据集的规模普遍较小,导致数据 Scaling Law 适用性不明确。
正是为了应对这种挑战,昆仑万维推出了自主代码智能体基座模型 Skywork-SWE。它不仅代表一个性能卓越的模型 ——32B 参数量级别的最强开源软件工程智能体,更是一个集数据、验证、推理与修复为一体的完整系统。不仅如此,他们还基于此成功揭示了 LLM 软件工程能力的 Scaling Law。
目前,该模型的技术报告和模型权重都已发布。
相关攻略 更多
最新资讯 更多
天工不止造物,也能修bug:Skywork-SWE给代码智能体补上软件工程课
更新时间:2025-07-26
AI写完85%的代码!字节研发负责人和TRAE合作的首个项目官宣开源
更新时间:2025-07-26
晚点独家|宇树C轮落定,中移动、腾讯、锦秋、阿里、蚂蚁、吉利共同领投,估值超100亿
更新时间:2025-07-26
小扎抢人抢到了Ilya头上:收购不成,转头挖走CEO
更新时间:2025-07-26
ZPotentials|何嘉斌,跨界10年,打造CES爆火的AI陪伴机器人Ropet,赋予科技温暖灵魂
更新时间:2025-07-26
从1500个项目里,看见中国AI的未来
更新时间:2025-07-26
AI表情包上架微信表情商店,一年时间5点进步
更新时间:2025-07-26
放弃国企工作,创办一人企业:我一定能用AI挣到钱
更新时间:2025-07-26
笑死我了,DeepSeek才是最懂鲜荔枝转运的,S到临头还不忘搞钱哈哈哈
更新时间:2025-07-26
「悄悄发育」的华为AI,这次放了个「大招」
更新时间:2025-07-26