首页 > AI教程资讯

AI编程双城记上:万字长文剖析下一代技术革命与落地挑战

文章来源:08ai导航网发布时间:2025-09-21 11:00:02

本文内容适合关注 AI 前沿的读者。回顾2024年 AI 编程领域技术和产品创新,同时总结企业编程提效在落地的真实效果和挑战,从落地实践和思考,观察行业趋势和分析解决方案。最后,展望2025年AI 编程下一代技术给大家的期待。文章信息量较大,建议阅读时长20-30分钟适宜。本文涉及关键字:Github Copilot、Cursor、v0、reweb.so、AI Agent、Coding Agent、RAG、微调、Blot.new 、Devin.ai 、Cursor Composer 、AIOps、Function Call

荣耀时刻

To C

从ChatGPT ,到 AI 编程工具 Github Copilot 的横空出世。到如今火爆全球的 Cursor、Devin ,编程领域不可否认迎来了自己的“工业革命”。我觉得所有的工程师真的都会觉得:AI 在日常的编程当中,真真切切地给大家带来了巨大的效率提升,极大的降低编程的门槛

https://survey.stackoverflow.co/2024/ai

• Stackoverflow 2024年对AI 编程领域做的调研,在受访全球2万名工程师里,81%人认同AI 工具提高了开发效率。 To C来说,AI 编程已经不是怀疑它的价值,而是想象空间能到哪的范畴了

• 相对于过去,机器学习和大模型技术推动了编程领域巨大的革命。OpenAI 在2024.12底发布了 ChatGPT o3 ,在权威的顶尖程序员竞赛CodeForces中,o3的得分达到了2727分,远超 o1 的1891分。在168076名程序员中,o3的排名为175名,o3的编程能力已经达到了一个相当高的水平,能够与顶尖程序员相媲美。

https://openai.com/

To B

工程师使用AI工具编程76%, AI编程工具在企业渗透率超过90%

https://survey.stackoverflow.co/2024/ai#sentiment-and-usage

很多企业公开宣称代码采纳率达到了30-40%,下面国内编程平台官方给出的案例

https://comate.baidu.com/zh/scenarios

https://lingma.aliyun.com/lingma/community/use-cases

问题和挑战

AI生成的代码质量堪忧

虽然AI编程越来越被企业认可接受,随着落地实践深入。我们发现AI生成代码质量很多情况是达不到生产的标准。甚至是我们主观认为简单的单元测试,API 文档,目前也存在大量的幻觉,比如下面的真实案例:

反人性的代码采纳率

在落地AI 编程提效中,很多企业会提到代码采纳率这个指标。企业想以代码采纳率去衡量AI 编程的一个产出。我觉得它本身是一个反人性的东西,很像过去“追逐代码测试覆盖率”的案例,本质上反映是企业落后管理上一种 KPI 形式:

大家可以想一想,如果代码采纳 AI 的代码越多,是说明工程师越没用嘛?同时,AI工具要靠工程师去使用,工程师的动力又在哪呢?

假如AI 这种Copilot工具用的好,让AI 贡献更多的代码,更多的参与编程,把代码采纳率提上去了。那站在企业的角度,会不会认为机器生产更多代码,工程师工作量不饱和了呢?这会给工程师、企业带来巨大的困扰。工程师完全没有使用AI编程工具动力和动机。另一个角度看,代码采纳率越低,手写的代码更多,更能突显工程师的价值?会不会产生这样的误解?如果企业以代码采纳率作为一个核心的企业研发提效的指标,从逻辑看是一个比较无解的结果。就像上面的企业案例,折腾大半年几乎看不到提效,这可能是深层次的原因

企业现阶段落地的场景

正如上面提到企业量化AI编程的解决方案,确实最近一年多接触到这方面尝试落地的企业,有比较好的结果反馈,都是往这个趋势去走。包括国内外创新科技公司,做的AI辅助编程的分享,都体现了这样的思想:他们落地的场景大部分聚焦在一个个比较垂直化的编程场景。比如像编程中一些日常的基础功能,也有针对自己特定业务的一些工作场景,把它单独抽离出来,下面总结目前大家取得一些阶段性效果的典型场景

代码 Review 和版本管理

一些AI 编程工具,GitHub Copilot、CodeRabbit、国内百度Comate、通义零码自带能力:

代码质量检测:通过机器学习算法自动识别代码中的错误、漏洞和潜在风险,提供优化建议,甚至提供 Diff格式的代码建议,直接对比应用

提升审查效率:AI Code Reviewer为Pull Request提供智能反馈和改进建议,支持文件过滤功能,避免不必要的审查,设置和集成过程简单

**代码提交版本信息管理:**代码 Commit Message 自动化一键生成,AI 能全面感知代码变动细节,比起工程师写提示词,效率高,排版更规范。尤其在每次 Commit 提交文件多,能极大帮助架构师加快梳理业务代码和分析代码质量的时间

AI Commit Message 自动生成效果

集成版本控制平台:很多技术团队通过调用大模型 API方式 与GitHub、GitLab等版本控制平台无缝集成,支持团队协作、代码共享以及版本管理

智能版本管理功能:比如 Cline 新增了智能版本管理与任务跟踪系统,通过快照、比对和恢复等功能,让开发过程更加灵活和便利

单元测试

单元测试是一个非常基础的单元,每一家企业在代码质量来说是一个必要的过程。

市面上有一些垂直类的 AI Agent 产品专注于生成单元测试。比如 Gru.ai

https://gru.ai/home/test-gru 写JavaScript、TypeScript 单元测试用例

文档编写

Readme-ai

https://github.com/eli64s/readme-ai

基于大型语言模型(LLM)的README文件生成器。它能够自动分析代码仓库,提取关键信息,并生成结构化、内容丰富的README文档

Mintlify

https://mintlify.com/

2024年9月6日 Mintlify 完成了 1850 万美元的 A 轮融资,贝恩资本和 Y Combinator 参投

用 AI 完成开发者文档,不限 ChangeLogs、API Reference、SDK Library 等

前端开发提效创新

v0 代表的创新型AI产品,主要功能是通过简单的文本提示来生成用户界面,从而简化UI的生成过程,提高设计和前端开发效率

https://v0.dev/

比如 v0 + reweb.so 工具结合,通过网站截图让它生成完整的前端代码。reweb.so 则可以直接把前端代码粘贴,自动生成控件控制台,不写代码情况下调整页面

截图后v0生成前端代码和预览效果

reweb 生成了编辑控件,不用写代码,直接操作控件调整页面

v0 + reweb 另外市场价值:对于不懂前端编程的技术,可快速入门前端开发,不需要设计,独立完成全栈开发,尤其对小团队有很大的帮助

作者简介

蒋志伟,next4.ai 创始人 (微信 nizhanali)

目前从事 AI 创业和技术顾问,关注 AI Agent、RAG、AI搜索、智能编程领域

曾就职 阿里、Qunar、美团,前 Pmcaff.com CTO,核心研发过上亿用户搜索推荐系统

我开源了一个用来测评 AI 编程质量的开源项目,也欢迎大家关注和交流

https://github.com/laziobird/CodeLLMEval