氛围编程后,Karpathy又双叒有新「脑洞」!PDF将死,未来99%是AI氛围阅读

  新智元报道

  编辑:定慧

  AI 也要氛围阅读,Karpathy 提出 PDF 论文已不适合 AI 时代,呼吁以 Git、Markdown 等结构化格式重塑科研写作。他认为未来 99% 的注意力将来自 AI,科研成果应为 AI 优化。

  Karpathy 大神这次继 Vibe Coding 氛围编程后,又想造全新概念了!

  大神说他早就抱怨了很多次,未来 99% 的「Attention」(注意力)即将被 AI,而非人类关注。

  但是现在99. 9%的互联网内容还是「写给人看的」,不论是网页、视频还是科研 PDF 论文。

  这次,他提出未来的研究论文/成果绝对不是 PDF 格式的!

  他还给出一条「致富之路」:能解决这个问题的研究应用程序将拥有巨大的发展空间。

  结合之前他提出的氛围编程概念,未来全新的数据格式将是 AI 阅读和学习的基础——我们认为这应该叫做AI 的氛围阅读(AI Vibe Reading)

  这个观点在X平台上彻底的火了,各种大佬纷纷点赞,网友们也附和抱怨。

  机器学习改变人类科技进程后,网友调侃:「机器正在学习,人类正在上瘾」。

  「讽刺的是」,现在科学家更进一步,正在为 AI 如何更高效的「看资料」而集思广益。

  Karpathy 的这个观点,其实也印证了马斯克此前说过的一个观点:

  AI 将超越所有人类,未来地球上的「碳基生物智能」只占1%

  从 Attention is all you need 发布后,人类在 LLM 加持下正在狂奔向 AGI 奇点,但是 2025 年了,大部分内容和形式还是为人类服务的。

  Karpathy 很早就设想了一个网络,其中 99% 的内容都是为了 AI 优化的,而不是人类。

  这个星球上智能 99.9% 的注意力将是 LLM 的注意力,人类退下,AI 思考。

  可以看出 Karpathy 今天发X的时候,「心情很激动」,他连发了两条来表达对这个事情的看法。

  PDF 已经不适合 AI 时代,应该研发针对 AI 的数据格式,甚至以后的论文格式都不应该是 PDF、Word 这种写给人看的,而应该有点 Github 上代码的那种结构。

  这次讨论的起因还要说回一位有近 6 万粉丝的生物学大佬——Michael Levin。他是 Tufts 大学的杰出教授。

  2004 年,他在《细胞》(Cell)1995 年发表的关于左右不对称性的分子基础的研究被《自然》期刊选为「过去一个世纪发育生物学领域的里程碑」之一。

  他今天发布的一条帖子,在社区引发了广泛的讨论,评论区里各种学术大佬出没。

  Levin 提出一个深刻且尖锐的问题,这关系到所有的科学家和研究者们:

  我经常感到烦躁,因为没有时间阅读来自相关领域杰出人士的、越来越多的精彩论文。

  其他科学家也面临同样的问题,他们也没有时间阅读我那些冗长的概念性论文。那么,我们写这些论文究竟是为了谁呢?

  我猜,至少在它们因自身工作陷入同样问题之前,AI将是唯一真正有精力阅读所有这些内容的存在。

  我这里说的不只是当前的语言模型——我们假设所指的是某种不可避免会出现的人工智能,它能够阅读文献并对研究产生影响(无论是通过与人类交流,还是通过运行实验室自动化/机器人科学家平台)。

  考虑到我们的受众群体未来很大一部分将是人工智能(以及机器人、混血儿、增强人类等等),我们现在应该如何写作呢?

  这下真就戳到马蜂窝了,各种大佬也用自己的亲身经验。

  这一话题引发 Andrej Karpathy、Carlos Perez 等科技思想者热烈回应:

  「若论文的核心受众逐步转向算法,我们今天的写作规范该如何演变?」

  「科研工作者写不完论文,已经有的论文又不可能都看完,改怎么办?」

  Levin 指出科学家既写不完也读不完论文,AI 可能成为唯一能全面消化文献的「读者」。

  根本问题是,人类要消化内容,就必须将其呈现为特定的线性叙述,而这种叙述可能与读者产生共鸣,也可能不会。

  在前者情况下,你是幸运的;在后者情况下,人类读者最好借助 AI 来提取信息。

  我们要为 AI 写作。

  当前如此多令人惊叹的发展和突破性论文不断涌现。。。

  我们能够将生物心理学领域的最新进展应用于改善人类生活的各个方面。

  格式是交流的一部分。

  PDF 早就过时,是上个世纪的东西!

  这简直就是一场人类顶级科技工作者的思想碰撞如果人类的学习速度跟不上 AI,会发生什么?

  来看一组数据,全球已编入主流引文数据库(以 Scopus 为代表)的科技论文年产量:

  • 2010 年仅 190 万篇,2022 年达到约330 万篇。

  • 2012–2022 十年间总量增长 59%,折合年均复合增速约4%–4.5%。

  假设若按此区间增速外推,2025 年全年可预期被索引论文总量约为360 – 380 万篇,取中值约 370 万篇

  这意味着平均每天将有一万篇以上的新论文被正式收录。

  人类真的读不完了,目前来看,也许只有 AI 才能完成这种阅读量。

  来自 NSF 的数据显示,2022 年,有六个地区、国家或经济体各自发表了超过 10 万篇论文:中国、美国、印度、德国、英国和日本。

  与此对应的是,这些领先的地区、国家或经济体加起来占 2022 年全球总量的一半以上。

  而到了 2025 年,在 arXiv 上关于 AI 的论文已经可以说是「汗牛充栋」了!

  看不完,真看不完!

  比如,在 HuggingFace 上,即使想要阅读完每天的 Daily Papers,都几乎是一件不可能的任务。

  Karpathy 可以说是 AI 时代教育方面的最顶流明星了,他是前 OpenAI 创始团队,还是 Tesla AI 团队的负责人。

  更因为他一直关注 AI 教育、AI 对人类的影响等命题,他创造的 Vibe Coding 氛围编程概念更是风靡全世界。

  所以,他的观点往往代表了 AI 如何影响人类领域的最前沿。

  最近他在提一种新的编码方式:「像细菌一样编码,小、模块化、自给自足」。

  在这个观点,他最后的建议是:多说要点,少说废话。

  我们认为这个观点不仅适合于编程领域,未来的科研领域,科学家们也将:

  多关注要点,少些论文,要写也是写给 AI。

  在之前的程序员们常说,Talk is Cheap,Show Me the Code。

  当 ChatGPT 为代表的 AI 出现后,这句话变成了,Code is Cheap,Show Me the Talk。

  这揭示了在编程领域的一种范式变化。

  同样,AI 的影响力开始从代码扩展到真正的科研领域,也许未来的科学家们不仅要拼自己的智力,更要比拼谁的 AI 更会「氛围阅读」。

  Paper is Cheap,Show Me the Thoughs!

  参考资料:

  https://x.com/karpathy/status/1943411187296686448