新智元报道
编辑:英智犀牛
还在用 AI 改改小 Bug?已经 out 了!最新研究发现,Claude Code 上 79% 的任务直接由 AI 自动完成。从前端界面到自动化任务,AI 正席卷编程。
就在昨天,Anthropic 再次更新了他们的人类经济指数报告。
这次他们把研究重点放到了编码上。
在分析了 50 万份有关编码的用户对话后,他们总结出了一些趋势。
有意思的是,从这份报告中,我们还能一窥 AI 是如何抢走程序员饭碗的。
地址:https://www.anthropic.com/research/impact-software-development
编写代码虽然在整个现代经济中占比不大,但影响力却不小。
最近几年,随着性能的增强,AI 不仅能辅助编程,还能自动完成大量的编码任务了。
Anthropic 在之前的经济指数研究中发现,美国从事计算机相关职业的人使用 Claude 的比例极高。
也就是说,与计算机相关任务的 Claude 对话量远超预测量。
在教育领域同样如此,在涉及大量编码任务的计算机科学专业,AI 的使用率同样高得惊人。
为了深入分析这些变化,Anthropic 的研究团队分析了 Claude.ai 和 Claude Code(专业编码智能体)上的 50 万个与编码有关的对话。
他们发现了三大趋势:
-
编码助手更偏向自动化。有 79% 的 Claude Code 对话可以被归为「自动化」,即 AI 直接完成任务,而不是与人类协作「增强」。相比之下,Claude.ai 的对话中只有 49% 是自动化。这可能意味着随着 AI 智能体的普及,以及更多具有智能体性质产品的构建,任务自动化的占比将大大增加。
-
程序员常用 AI 开发前端应用。在数据中,JavaScript 和 HTML 等网页开发语言是最常用的,用户界面和用户体验相关的任务位居编码任务前列。这表明,前端工作可能比纯后端工作更快受到 AI 的冲击。
-
初创公司比大企业更早采用 Claude Code。初步分析显示,33% 的 Claude Code 对话与初创公司相关,而只有 13% 与大企业应用相关。这些差距表明,灵活的初创公司更倾向于使用尖端 AI 工具,而传统大的大企业则相对滞后。
如何分析对话
Anthropic 团队使用隐私保护分析工具,共分析了 50 万次的 Claude 交互(分为 Claude Code 和 Claude.ai 两部分)。这个隐私保护分析工具可以将用户对话提炼成匿名的消息。
接下来就可以识别对话的主题,以及将对话分类为上边提到的「自动化」或者是「增强」。
结果他们发现,Claude Code 的自动化比例明显更高——达到了 79%,而 Claude.ai 仅为 49%。
他们还将自动化和增强细分为了几种子类型。
在其中的「反馈循环」模式中,Claude 能自主完成任务,但需要人类的验证(比如将错误反馈给 Claude),这种模式在 Claude Code 上几乎是 Claude.ai 的两倍(35.8% vs 21.3%)。
「指令」对话——Claude 以最小的用户交互完成任务,在 Claude Code 上也更高(43.8%,相比 Claude.ai 的 27.5%)。
所有增强模式——包括用户从 AI 模型中获取知识的「学习」模式——在 Claude Code 上的比例都明显低于 Claude.ai。
子类型定义。指令:以最小交互完成任务委派;反馈循环:由环境反馈指导任务完成;任务迭代:协作完善过程;学习:知识获取和理解;验证:工作验证和改进
这些结果展示了专业型、以编码为重点的智能体(比如 Claude Code)与用户通过 LLM 界面(如 Claude.ai)进行交互的差异。
随着更多专业智能体的推出,AI 融入人们工作的方式也会改变。至少在编码方面,这意味着更多任务的自动化。
这不禁让人思考,随着 AI 使用的越来越普遍,程序员在其中的参与程度会如何变化。
Anthropic 的报告显示,即使在自动化的过程中,人类仍需经常参与其中:「反馈循环」交互仍然需要用户输入(即便只是简单地将错误信息粘贴回 Claude)。
未来这种模式会不会持续还不好说,也许更强大的智能体会越来越少地依赖用户输入。
开发者用 Claude 都做些啥?
总的来说,开发者喜欢用 Claude 做网站、手机 APP 的界面和交互部分。
没有哪种编程语言特别突出,JavaScript 和 TypeScript(做网页的)加起来占 31%,HTML 和 CSS(也是做前端的)占 28%。
百分比表示两个平台上与编程相关的任务的总百分比
后端开发的语言像 Python,占了 14%。Python 既能做后端开发,又能做数据分析。
再加上 SQL 这种处理数据的语言(占6%),估计有不少数据分析的活,不只是传统的后端开发。
编程语言使用百分比代表两个平台的总百分比
从常见的编程任务也能看出这个规律。
排名前五的任务里,「UI/UX 组件开发」和「网页与移动应用程序开发」这两个任务,占了 12% 和8%。
现在流行一种「氛围编程」,不管新手还是老手,只要用大白话描述想要的效果,AI 就能帮你实现。
另外,像「软件架构设计」「调试和性能优化」这些通用任务,在两个平台上也挺常见。
这么看,「氛围编程」要是成了主流,那些做简单应用和用户界面的工作,可能很快就会受到 AI 冲击。
以后 AI 要是能搞定更多组件设计、样式开发,开发者可能就要转去做更高级的设计或用户体验。
谁在用 Claude 编程
报告也研究了哪些人爱用 Claude 写代码。
根据聊天内容,分析用户是自己做着玩,给初创公司做的项目,还是别的。
由于不清楚这些对话在实际中的使用场景,只能根据有限的信息猜,所以这些只能作初步参考。
点之间的距离表示 Claude.ai(蓝色)和 Claude Code(橙色)上每种项目流行程度的差距
初创公司是 Claude Code 的第一批「粉丝」,大公司用得相对少一些。
Claude Code 的对话里,跟初创公司有关的占 32.9%,比在 Claude.ai 上高了快 20%。
和大企业相关的对话,在 Claude Code 只占 23.8%,比 Claude.ai 上的 25.9% 还低一点。
学生、学者、自己做项目的人,还有学习写代码的人,加起来占了两个平台一半的对话。说明不光是公司,个人也很爱用这些 AI 辅助工具。
这跟以前技术更新差不多:小公司为了抢占先机,赶快采用新工具;大公司就比较谨慎,全面推广前,一般要做各种安全性检查。
AI 正在彻底改变开发者的工作方式。相比大公司,初创公司似乎从 AI 中获益更多。
AI 这么强,谁先用 AI 提升工作效率,可就变成实实在在的竞争优势了。
以下分析对比了和软件相关的自动化、增强模式,以及和软件无关的对话模式。
Claude.ai 中软件与非软件用例的自动化和增强功能细分
可以看到,软件开发的自动化程度更高。其中「反馈循环」增加了 18.3%,抵消了「指令式」行为下降的 11.2%。
也就是说,就算辅助编程中,大部分活是 AI 干,和非编程任务相比,还是需要人反复检查、修改。
参考资料:
https://www.anthropic.com/research/impact-software-development