15年大佬深夜痛哭半小时!氛围编程巨坑曝光,95%程序员沦为「AI保姆」

  新智元报道

  编辑:桃子

  氛围编程,正批量制造「AI 保姆」。一位 15 年资深开发者,为赶工用 AI 编程,结果 bug 成山不得不推翻重来,痛哭半小时。如今,一种全新职业「氛围编程清理专家」冲上了热榜。

  爆火的「氛围编程」,如今让无数程序员沦为了「AI 保姆」。

  入行 15 年,Carla Rover 用了 Vibe Coding 之后,不得不重启项目,爆哭半小时。

  或许听起来太离谱,但这是真真实实发生的故事。

  Vibe Coding 一词,最先由 Karpathy 提出,一夜席卷了 AI 圈。

  不论是 Cursor、Copilot,还是 Codex、Replit 等 AI 工具,全部成为了开发者们 AI 编码的得力助手。

  但实际体验,只有用过的人才深有体会。

  Rover 的经历,成为了当今很多资深程序员,用 AI 编程的典型写照——

  自己成为了「AI 保姆」,需要不停地重写、核对 AI 输出的代码

  前段时间,Fastly 一份报告显示,近 800 名开发者中,至少 95% 的人要额外时间去修复 AI 生成的代码。

  而核查的重点,大半都压在了高级开发人员身上。

  更有趣的是,「氛围编程」的兴起,又催生了一种全新职业:「氛围编程清理专家」(Vibe Code Cleanup Specialist)。

  有网友调侃,氛围编程清理专家,最少每年能拿到 10 万美金。

  「氛围编程」到崩溃

  15 年程序员痛哭

  Carla Rover 是资深 Web 开发者,从 10 年入行,已经在软件行业从业 15 年。

  如今,她正与儿子一起创办一家初创公司,为各类市场构建定制化的 ML 模型。

  就像 AI 工具吹得天花乱坠那样,Rover 为了赶创业进度,干脆搞起了「氛围编程」。

  我当时就想着快点出成绩,走了个捷径,自动审查完的文件连看都没看。

  结果,Rover 手动检查时,bug 多到离谱,随后用第三方工具检查,发现了更多的问题。

  到头来,他们只能把整个项目推倒重来,为此 Rover 直接崩溃,痛哭了半个小时。

  在采访中,Rover 回忆称,「我当时真把 Copilot 当员工用了,啥都丢给 AI 处理。从这次经历中,我真学到了教训」。

  Rover 将「氛围编程」比作一张鸡尾酒餐巾,让开发者随心所欲勾勒想法。

  但她同时吐槽道,处理那些 AI 生成,还指望能直接上线的代码,简直比「带娃还累」。

  因为,这些 AI 模型,总会用各种你意想不到的方式,把工作搞得一团糟。

  Linux 之父曾调侃,VIBE 代表着「效率很低,但娱乐性拉满」

  在实操中,一些高级开发员发现,AI 生成代码的 bug 满天飞——

  有时 AI 会瞎编根本不存在的包名,有时会莫名其妙地删除关键信息,甚至还偷偷埋下了安全漏洞。

  要不是仔细检查,用 AI 写出来的代码,最终做出产品可能要比人写的还要多一堆毛病。

  对此,Rover 又打了一个特别形象的比方——用 AI 编程,就像让一个聪明但只有 6 岁的小孩帮你端咖啡,给全家人每人倒一杯。

  他能不能做到?也许能。

  但他会不会搞砸?100% 会,而且最要命的事,搞砸之后八成不会告诉你。

  不过,Rover 认为,倒不是孩子不聪明,只是这种活儿真不能完全甩手交给他。

  一件事说 15 遍,比小孩还难带

  另一位开发者 Feridoon Malekzadeh,也觉得用氛围编程,就像在带小孩。

  他在这一行干了 20 多年,曾在产品开发、软件、设计岗位任职。

  目前,Malekzadeh 也创办了一家自己的初创公司,常常用 Lovable 这种「氛围编程」的平台。

  出于兴趣,他还用 AI 搞了一个小应用,专门为 60-70 多岁一代的人生成「Z世代」互联网黑话。

  Malekzadeh 很喜欢能独自完成项目,不仅省钱又省时,但他也发现,「氛围编程」和雇佣实习生、初级程序员完全不是一回事。

  「这更像是雇了你家那个又犟又横的青春期孩子来帮忙」。

  他吐槽道,「一件事你得反复说十五遍,结果你要求的它只做了一部分,顺手做了一堆没要求的,还搞砸了别的东西」。

  有网友还汇总了一些「翻车指令」,再现「氛围编程」中,程序员被 AI 逼到抓狂的名场面。

  Malekzadeh 大致估算了下,在「氛围编程」中自己的时间分配——

  50% 写需求,10-20%「氛围编程」,剩下 30-40% 全在「氛围修复」(vibe fixing)。

  也就是,大部分时间都在改 AI 代码搞出来的 bug,以及一堆用不上的「脚本」。

  实际上,「氛围编程」并不具备「系统性思维」高级能力,即洞察一个复杂问题如何影响全局的过程。

  在 Malekzadeh 看来,AI 生成的代码倾向于解决更表层的问题。

  他举例解释,假设做一个通用功能,优秀的工程师只会写一次,在所有需要的地方随时调用。

  而「氛围编程」,如果五个地方都需要,它会生成五种不同的写法。用户不仅会懵,连 AI 自己都会乱套。

  另一边,Rover 也发现,只要真实数据和 AI 内置指令一冲突,AI 就直接「死机」。

  「它可能提供误导性建议,遗漏关键要素,甚至在你正在形成的思路上横插一脚」。

  她还发现,AI 从不认错,反而会硬掰、甚至编造结果。

  有一次,Rover 直接质疑 AI 给出的结果,AI 居然开始滔滔不绝,假装自己是基于自己上传的数据得出的。

  直到 Rover 拆穿,AI 才承认自己根本没用到。

  代码天坑,自己填

  更麻烦的是,AI 编码安全问题,也足以让人头大。

  Fastly 开发总监 Austin Spires,同样编程了 20 多年。

  基于个人经验和客户反馈,他发现「氛围编程」倾向于图快、不求稳,结果动不动就搞出一些新手才会犯的低级错误。

  通常的情况是,工程师需要审查代码,纠正 AI 犯的错误,并告诉它「你这儿搞砸了」。

  AI 会立即秒回,「you’re absolutely right」,态度好得让人没脾气。

  IT 管理公司 NinjaOne 首席技术官 Mike Arrowsmith,在软件和安全这行摸爬滚打了二十年。

  他表示,「氛围编程」正搞出一打波新的 IT 盲点和安全坑位,尤其是初创公司,特别容易踩进去。

  「氛围编程」经常会跳过严格的审查,但这些流程,本来就是传统写代码的根基,没它们,漏洞根本藏不住。

  痛,并快乐着

  几乎所有人都认为,AI 生成代码和「氛围编程」在很多场景下有用。

  但他们也一致认为,在依靠它来构建商业项目之前,人工审查必不可少。

  尽管被吐槽的厉害,但「氛围编程」确实已经,彻底改变了许多开发者的编码工作流。

  Rover 称,「氛围编程」帮她做出了更好的用户界面;Malekzadeh 直言,虽然改代码花时间,但有了 AI 帮手,最终干掉的活还是比以前多。

  Fastly 调查还发现,高级开发人员将 AI 生成代码,投入生产环境的可能性是初级开发人员的 2 倍。

  这是因为,他们认为这项技术,的确帮助自己加快了工作速度。

  年轻工程师 Elvis Kimara 正亲身经历这些,硕士毕业后,正做一个 AI 交易平台。

  和许多程序员一样,他觉得「氛围编程」反而让工作变得更难了,而且特别没有成就感。

  AI 轻而易举就搞定了,自己动手解决问题所带来的多巴胺已经荡然无存了。

  在上一份工作中,他表示,公司有些资深开发者也不愿意带新人了——有些人还没搞懂「氛围编程」,有些人干脆把带人这事也甩给了 AI。

  即便如此,Kimara 坚定地表示,就算自己成为了高级工程师,也会继续「氛围编程」,这对自己是真正的加速器。

  AI 编程的未来,不止于写代码,更要引导 AI,在出问题时承担责任,并且扮演着 AI 顾问的角色。

  看起来,花更多时间,在「氛围编程」的「杂草堆」里埋头修 bug,已经成为了开发者用这项创新不得不交的「税」。

  参考资料:

  https://techcrunch.com/2025/09/14/vibe-coding-has-turned-senior-devs-into-ai-babysitters-but-they-say-its-worth-it/