围剿OpenAI:中国AI专利量占全球近40%,新架构模型推理算力暴减51%

  2025 年,随着 DeepSeek 风靡全球,中国不断加强 AI 基础研究和产业体系布局。

  4 月 27 日晚,央视披露的最新数据显示,截至 2025 年 4 月 9 日,中国 AI 专利申请量达 157.64 万件,占全球申请量的 38.58%,接近 40%,位居全球首位。

  同时,中国目前已累计培育 400 余家 AI 领域国家级专精特新“小巨人”企业,占据了全球1/10 的 AI 产业规模,已形成覆盖基础层、框架层、模型层、应用层的完整 AI 产业体系。

  另据斯坦福大学李飞飞团队(Stanford HAI)发布的《2025 年人工智能指数报告》显示,全球 AI 相关专利申请数量正在上升。2010 年至 2023 年期间,AI 专利数量稳步大幅增长,从 3833 件激增至 12.2511 万件。仅 2024 年一年,AI 专利数量增长了 29.6%,接近 30%。

  其中,截至 2023 年,中国在 AI 领域专利总量方面领先,相关专利占全球所有专利授权的 69.7%。而按人均计算,韩国和卢森堡在 AI 生产方面表现突出。

  如今,中国加速 AI 大模型和 AI 应用研发力度。就在 4 月底新加坡举行的深度学习顶会 ICLR 2025 上,阿里达摩院(湖畔实验室)、新加坡国立大学、清华大学等联合研究团队发表论文,提出全新开源视觉生成架构 DyDiT,通过时间步长与空间区域的智能资源分配,将 DiT 模型的视觉生成任务中推理算力削减 51%,生成速度提升 1.73 倍。

  同时,在 ICLR 2025 上,谷歌 DeepMind、微软、Meta、加利福尼亚大学伯克利分校(UC 伯克利)、中国科学技术大学等研究团队,以及“AI 教父”杰弗里·欣顿 (Geoffrey Hinton),ICLR 发起者、“图灵奖得主”杨立昆(Yann Lecun)等 AI 学术大咖都参与其中,多份研究成果重要性不亚于 ChatGPT。

  很显然,大模型的世界依然风云变幻。

  今年 Q1 超 55 个大模型“卷生卷死”,全新 DyDiT 架构创新替代 Sora

  4 月 27 日—28 日,深度学习领域国际顶级会议 ICLR(International Conference on Learning Representations) 2025 在新加坡举行,成千上万人参加这一盛会。

  据 ICLR 统计,研究人员向主办方提交了 122 份研讨会提案,比 2024 年的 103 个增加 1.18 倍,最终接受 40 份提案,比去年同期增加 2 倍(200%)。

  ICLR 2025 现场,包括清华“姚班”校友、美国斯坦福大学的陈丹琦,美国加州大学伯克利分校教授宋晓冬(Dawn Song),北京通用人工智能研究院院长朱松纯,香港大学计算机与数据科学学院马毅教授等人发表演讲。同时,“AI 教父”、诺奖得主、加拿大多伦多大学教授杰弗里·辛顿(Geoffrey Hinton),ICLR 发起者、“图灵奖得主”杨立昆(Yann Lecun),麻省理工学院电气工程与计算机科学系副教授何恺明(Kaiming He)等 AI 学术领域大佬也都在现场参与其中。

  2025 年,DeepSeek 引发全球新一轮 AI 模型热潮,同时也意味着,世界依然需要除 OpenAI GPT 之外能够实现运算效率降低的基座模型。

  如今,大模型研发人员依然在“卷生卷死”。公开数据显示,2024 年第四季度,全球有 49 个大模型更新发布,今年一季度就有 55 个,最多的时候一周发 8 个模型。

  作为国内 AI 领域最大研究团队之一,阿里达摩院今年持续发 paper,共有 13 篇论文被 ICLR 2025 录用,涵盖了视频生成、自然语言处理、医疗 AI、基因智能等领域,其中 3 篇被选为 Spotlight。

  其中,达摩院、新加坡国立大学、清华大学等联合研究团队提出了全新 DyDiT 架构,其中,达摩院的赵望博为通讯作者,新加坡国立大学校长青年教授、北京潞晨科技有限公司董事长尤洋也是本论文作者。

  具体来说,过去一年来,由 Sora 模型开始推动的 Diffusion Transformer(DiT)架构在视觉生成领域展现出了强大的能力,得到了包括 Stable Diffusion 3、Flux、Sora、WanX、Movie Gen 等众多视觉模型的应用。但 DiT 架构也面临一些重大挑战,其中最显著的就是运行效率问题。

  业内提出了多种方法来解决这一问题,包括高效的 Diffusion 采样器、特征缓存、注意力机制以及模型压缩剪枝等。但这些方法都是针对静态不变模型,即图像生成过程使用的模型规模完全不变,导致了潜在的冗余浪费问题,尤其 DiT 架构在执行视觉生成任务容易造成极高的算力消耗,限制其往更广泛的场景落地。

  达摩院团队提出全新 DyDiT 架构,能够根据时间步长和空间区域自适应调整计算分配,有效缓解视觉生成任务中的算力消耗问题。使用者更可根据自身的资源限制或者部署要求,灵活调整目标的计算量,DyDiT 将自动适配模型参数,实现效果与效率的最佳平衡。

  据论文显示,团队仅用不到3% 的微调成本,将 DiT-XL 的浮点运算次数(FLOPs)减少了 51%,生成速度提高了 1.73 倍,在 ImageNet 测得的 FID 得分与原模型几乎相当(2.27vs2.07)。

  目前,DyDiT 相关训练与推理代码已开源,并计划适配到更多的文生图、文生视频模型上,目前基于知名文生图模型 FLUX 调试的 Dy-FLUX 也在开源项目上架。

  除了达摩院这篇论文外,ICLR 2025 上阶跃星辰有 4 篇论文入选,包括《Unhackable Temporal Rewarding for Scalable Video MLLMs》,《DreamBench++: A Human-Aligned Benchmark for Personalized Image Generation》,《Discrete Distribution Networks》,《Reconstructive Visual Instruction Tunning》,覆盖图像生成模型质量评估、大模型视觉监督设计、大模型预训练等方向。

  根据 ICLR 官网,本次 ICLR 2025 优秀论文委员会经过两阶段评选过程,最终确定了 3 篇优秀论文获奖者和 3 篇荣誉提名如下:

  • 谷歌 DeepMind 和普林斯顿大学团队的《Safety Alignment Should be Made More Than Just a Few Tokens Deep.》
  • 不列颠哥伦比亚大学等人的《Learning Dynamics of LLM Finetuning.》
  • 新加坡国立大学和中国科学技术大学团队的《AlphaEdit: Null-Space Constrained Model Editing for Language Models.》
  • 弗吉尼亚理工大学、UC 伯克利、普林斯顿大学等团队发表的《Data Shapley in One Training Run.》
  • Meta Fair 团队的《SAM 2: Segment Anything in Images and Videos.》
  • Mistral AI 和 Google DeepMind 团队的《Faster Cascades via Speculative Decoding.》

  朱松纯近期表示,OpenAI 的创新主要是在模型(采用了 Google 发明的 Transformer 进行自回归生成式预训练),算法与执行层的优化,没有触及数理框架和哲学层面。所谓“全栈式”AI 是指在模型、算法到执行层面软硬件一体化优化,他们在这方面做得很好。而 DeepSeek 在工程落地、API 产品化、算力优化等方面取得了非常好的成绩。但主要集中在工程部署层面,没有触达人工智能的核心问题——比如模型、算法、认知架构、智能机理等。

  朱松纯强调,对底层创新的认知不足,是一个全世界的普遍问题,不仅是 AI 领域。通用 AO 是一个大科学、大工程的问题,需要长期的、多层次的科技创新。大科学的问题需要有统一的理论框架解释各种智能现象,构建智能科学的基础理论与框架;大工程的问题是实现个体的和社会层级的智能体。

  “AI 教父”发联名信阻止 OpenAI 重组,马斯克则加装“弹药”瞄向 AGI

  OpenAI 计划向营利性公司的转型受到阻碍。

  近日,辛顿、Hugging Face 首席伦理科学家玛格丽特·米切尔(Margaret Mitchell)和美国加州大学伯克利分校教授斯图尔特·拉塞尔(Stuart Russell)以及 10 名前 OpenAI 员工,近期向美国联邦检察长提交联名信,敦促美国当局阻止 OpenAI 从非营利组织转变为 PBC 公益公司。

  公开信中,辛顿等人表示,OpenAI 独特的非营利法律结构是防止商业利益凌驾使命的保障,重组将削弱公众利益的保护机制,违反公司章程,构成对其非营利责任的威胁。

  他们在公开信中要求,OpenAI 解释为什么 2023 年 OpenAI CEO 奥尔特曼(Sam Altman)在国会作证时所强调的治理保障措施对 OpenAI 的使命至关重要,却在 2024 年却成为了其使命的障碍。信中呼吁,OpenAI 需要停止重组,并保护治理保障措施(包括非营利组织的控制权),确保非营利组织保留控制权。

  与“AI 教父”辛顿步伐一致,马斯克也在对标 OpenAI,不仅通过法律诉讼反对转型一事,而且准备加装更多“弹药”全面反击。

  4 月 26 日,据彭博报道,马斯克旗下的 xAI 与X合并后的 XAI Holding 公司,正与投资者计划筹集超过 200 亿美元资金,预计投后估值超过 1200 亿美元(约合 8745 亿元人民币),所得资金或可用于偿还马斯克将X平台私有化所产生的债务。本轮融资预计将在未来几个月内完成。

  按照彭博说法,这次寻求融资的目的可能是偿还债务。当时马斯克以 440 亿美元把X平台(当时名为 Twitter)私有化,需要从摩根士丹利获得的贷款,利率为 14%,而如今摩根士丹利获推出一笔 9.5% 利率的固定利率新贷款,用于让马斯克偿还高息的旧债务。

  有消息称,马斯克的X将计划偿还银行持有的最后 12 亿美元与收购X平台相关的银行债务。而在今年 2 月,摩根士丹利还和其他六家银行,共计出售了 47.4 亿美元与X相关的债权。

  如今在产品层面,xAI 的 Grok 大模型已经深入整合到X平台中,并且利用X平台数据进行模型训练,成为 Grok 的最大竞争力。

  美国研究机构 PitchBook-NVCA 近日发布的全球风投交易市场报告显示,截至 3 月 31 日的 2025 年第一季度,AI 和机器学习领域投融资交易数量 2101 件,交易价值(额)731 亿美元,占全球风投总额比重为 57.87%。

  就在 3 月 31 日,美国 OpenAI 公司宣布完成软银领投的 400 亿美元融资,估值高达 3000 亿美元。这笔交易占美国风投资金 50% 以上,占全球总额的三分之一。

  因此,不管是马斯克的 xAI,还是其他 AI 公司,都必须要有足够的资金和资源,才能在未来的竞争中占据一席之地。

  据报道,硅谷风投 Benchmark 最近领投了 Manus 母公司蝴蝶效应新一轮融资,总额达 7500 万美元,使得投后估值大幅提升,增长约五倍(500%),达到近 5 亿美元(折合人民币 37.5 亿元)。

  金沙江创投主管合伙人朱啸虎近期表示,大模型前两年火爆,今年热度有所下降,AI 应用企业迎来爆发式增长,建议创业公司不要在底层模型训练上浪费资金,全力拥抱开源模型。而在商业层面,他认为,技术固然重要,但商业产品更为关键,产品能否让用户愿意付费使用是重点。

  朱啸虎表示,过去 6 个月,中国有非常多的创业公司每周有近 10% 的环比增长,月环比增长 20% 以上,虽然这些数字还比较小,但是增长速度类似于当年团购行业早期增长速度,这是非常让人兴奋的。

  4 月 27 日,字节跳动基础架构团队宣布,ByteBrain 利用大模型(LLM)优化火山引擎稳定性,重要 oncall 提效 26%,基于运筹优化算法对系统成本进行优化,近三年节省成本超 10 亿元人民币。

  “学术论文仅仅是 ByteBrain 团队的副产出,工业界最重要的是业务收益。”字节跳动团队表示。

  此外,作为国内 AI 独角兽之一,阶跃星辰 4 月 27 日发布图像编辑模型 Step1X-Edit,性能开源最佳,这是最近一个月阶跃星辰上新的第三款多模态模型。除了模型,阶跃星辰还在汽车、智能手机、IoT、具身智能等四个关键赛道完成技术落地,与吉利汽车集团、千里科技、智元机器人、原力灵机、TCL 等企业合作,2025 上海车展上,吉利银河展示的“蛋舱”产品,其中就内置阶跃的多模态大模型技术。

  当下,AI 行业竞争激烈,朱啸虎建议创业公司积极拥抱生成式 AI,不拥抱 AI 的企业肯定会被淘汰,但也不要迷信 Al,聚焦尖刀场景尽快落地,同时也考虑尽快出海。

  目前,OpenAI 每周活跃用户已超过 5 亿,较去年 12 月的 3 亿有所增长

  有消息指,OpenAI 将从明年开始通过免费用户和其他产品获得显著收入。OpenAI 向部分现有及潜在投资者透露,预计到 2030 年前后,其智能体(AI agents)及其他新产品的合计销售额将超越 ChatGPT 这款热门聊天机器人。根据预测,2029 年 OpenAI 总营收将达到 1250 亿美元(约合人民币 9120 亿元),2030 年更将攀升至 1740 亿美元(约合 1.27 万亿元)。

  研究公司 LightShed Partners 的联合创始人兼分析师 Rich Greenfield 表示:“广告商一直追随用户的眼球,如果 OpenAI 能获得大量用户使用时间,广告商将争相入驻。”

  据高成投资创始合伙人洪婧透露,全球百亿美元估值的 ToB 软件企业中,中国企业仅占4%。意味着中国 AI 软件的商业化距离 OpenAI 依然有较大距离。

  “星辰大海最后都是红海,脏活累活最后才是护城河。”朱啸虎称。

  (本文首发于钛媒体 App,作者|林志佳)