新智元报道
编辑:桃子好困
Grok 4 一夜爆火硅谷,幕后团队功不可没。今天,一张内部作战图在全网疯转,华人学者占比高达 80%。清华、上交、浙大等校友云集,还有一位 95 后联创。
短短两年,马斯克 Grok 4 的横空出世,让 xAI 团队一举站上 AI 之巅。
昨日一小时发布会,Grok 4 让所有人大开眼界,直接刷爆了 AIME 2025、人类最后的考试(HLE)两大基准。
这是狂堆 20 万 GPU 才换来的惊人成果,更具体讲,Grok 4 算力飙涨了 100 倍。
xAI 团队成员自豪地表示,「Scaling 强化学习才是正确的路」!
而如今,硅谷大佬的目光不再只是 AI 模型的发布,其背后的顶尖团队才是关注的C位。
尤其是,在当前疯狂抢人大战之际,小扎又在瞄准下一波候选人了。
也就是同一时间,xAI 员工 Daniel 晒出了 Grok 4 团队作战图迅速刷屏。
一眼望去,80% 的面孔几乎都是华人学者。
斯坦福博士毕业,现 xAI 研究员 Xuechen Li 感慨道,一小群顶尖人才在极致专注下的爆发力,竟能在极短时间内取得如此巨大的成就」!
Grok 4 发布会之后的狂欢
接下来,一起盘点 Grok 4 身后的顶配华人天团都有谁?
Grok 4 背后天团,华人占比惊人
先来看,能够坐镇发布会,紧挨马斯克的两位华人学者。
他们也算是 xAI 对外公开的老熟人了,上次 Grok 3 直播同样坐在了老马的身旁。
Grok 4 发布会上,图片最右边是 Jimmy Ba,多伦多大学计算机科学助理教授,AI 大佬 Hinton 的学生,创始团队一员。
另一位是 xAI 联创吴怀宇(Tony Wu),多伦多大学博士,妥妥的 95 后,也曾是 AlphaGeometry、AlphaStar 核心开发者。
其他华人学者还包括:
Greg Yang(杨格)
杨格是 xAI 创始成员之一。
他本硕就读于哈佛大学数学系,导师是数学家丘成桐,并于 2018 年荣获摩根奖(Morgan Prize)荣誉奖。
在加入 xAI 之前,他曾是微软的高级研究员,负责 AI 理论研究。
ZihangDai(戴子航)
戴子航本科毕业于清华大学计算机科学系,师从著名计算机视觉专家朱松纯开展研究。
此外,他还获得了 CMU 硕士和博士学位。
他曾是前谷歌大脑研究员,在自然语言处理(NLP)领域拥有深厚的积累,尤其擅长 Transformer 架构的优化与创新。
Guodong Zhang(张国栋)
张国栋于 2017 年获得了浙江大学学士学位,并于 2022 年获得了多伦多大学博士学位。
博士毕业后,他曾加入谷歌 DeepMind 任研究科学家。
Shengyang Sun
Shengyang Sun 在 xAI 领导 AI 专家团队。
他于 2022 年获得了多伦多大学计算机博士学位,于 2017 年获得了清华学士学位。
入职 xAI 之前,他曾在英伟达就职 1 年多,任高级研究科学家;在亚马逊担任过应用机器学习科学家。
Bill Yuchen Lin(林禹臣)
林禹臣现任 xAI 研究员兼华盛顿大学(UW)客座助理教授,专注于 LLM 对齐、AI 智能体训练、推理及多模态大模型。
他于 2022 年获得了南加州大学博士学位。他还曾拿下了上海交通大学 IEEE 荣誉班的学士学位,在校期间获校级优秀毕业论文奖。
Xuechen Li
Xuechen Li 分别获得了斯坦福大学计算机科学系的硕士和博士学位,在此之前,还曾拿到多伦多大学学士学位。
公开资料显示,他还曾就读于北京四中。
在加入 xAI 之前,他曾在谷歌任学生研究员,并在微软实习了四个月。
Tianle(Tim)Li
Tianle(Tim)Li 在 xAI 专注于 Grok 模型的后训练工作。
在此之前,他曾获得了 UC 伯克利 EECS 学士学位,并参与了著名的 LMArena 竞技平台的研发。
Haotian Liu
Haotian Liu 是 Grok-1.5V、Grok-2、Grok-3 的核心开发者。
他于 2024 年获得了威斯康星大学麦迪逊分校获得博士学位,师从 Yong Jae Lee 教授。
在此之前,他还曾获得了浙江大学获得学士学位,并拿到了优秀毕业生的称号。
Lianmin Zheng
Lianmin Zheng 曾获得了 UC 伯克利完成了博士学位,导师是 Ion Stoica 和 Joseph E. Gonzalez 教授。他本科就读于上海交通大学 ACM 班。
值得一提的是,他曾和团队共同创立了非营利组织 LMSYS.org,致力于推进开源大语言模型研究。
Jiacheng Hong
Jiacheng Hong 于 2012 年获得了 CMU 硕士学位,本科曾就读于上海交通大学。
入职 xAI 之前,他曾在 Pinterest 任职 12 年,担任工程主管。
Qian Huang
Qian Huang 本科就读于康奈尔大学数学和计算机科学系,目前仍是斯坦福大学博士生(2027 年毕业),同时也是 xAI 技术员之一。
Yiwen Yuan
Yiwen Yuan 曾获得了 CMU 计算机科学计算机系学士和硕士学位。
目前,她在 xAI 是一名技术员,曾在一家 Kumo.AI 初创任技术主管。
Su Yan
Su Yan 本科毕业于华北电力大学计算机系,并于 2017 年获得了南加州大学计算机硕士学位。
他的个人职业经历非常丰富,曾在 Airbnb 担任高级软件工程师、在 TikTok 任技术主管。
Yikang Shen
Yikang Shen 曾获得了北京航空航天大学计算机学士和硕士学位,还获得了蒙特利尔大学计算机博士学位。
此前,他在 IBM 任研究科学家,专注于打造下一代更高效的大模型。
Wenhan Xiong
Wenhan Xiong 曾获得了中国科学技术大学学士学位和 UCSB 的博士学位。
毕业后,他便加入了 Meta GenAI 团队任 AI 研究科学家,是 Llama2/3、CodeLlama 的核心作者。
还有一位研究员 Yifei Zhou 甚至暂停了 UC 伯克利博士学位,也要加入 xAI 参与最先进模型
此外,xAI 团队中参与 Grok 4 华人成员还有,Yuchen He、Tianyi Zhang、Xinlei Chen、Jihui Yang 等等。
刚刚,马斯克点评:xAI 办公室氛围很 nice!
一夜登顶,xAI 首次夺魁!
除了 xAI 官方发布的数据,独立评测机构 Artificial Analysis 也在第一时间公布了对 Grok 4 模型的全方位基准测试结果。
最引人注目的是,Grok 4 在「Artificial Analysis 智能指数」中以 73 分的成绩拔得头筹,显著超越了一众顶级模型。
包括 OpenAI o3(70 分)、谷歌 Gemini 2.5 Pro(70 分)、Anthropic Claude 4 Opus(64 分)和 DeepSeek R1 0528(68 分)。
细分能力表现如下:
代码与数学能力制霸:在「编码指数」(LiveCodeBench & SciCode) 和「数学指数」(AIME24 & MATH-500) 两大关键领域中均排名第一
刷新高难度测试纪录
在 GPQA Diamond 测试中取得了 88% 的历史最高分,大幅刷新了 Gemini 2.5 Pro 此前 84% 的纪录
在「人类最后的考试」中以 24% 的成绩创下历史新高,超越了 Gemini 2.5 Pro 的 21%
多项全能:在 MMLU-Pro 和 AIME 2024 两项测试中,分别取得了 87% 和 94% 的最高分
速度:每秒输出 75 个 token。慢于 o3(188 token/s)和 Gemini 2.5 Pro(142 token/s),但快于 Claude 4 Opus(66 token/s)
上下文窗口:256k token。低于 Gemini 2.5 Pro 的 100 万 token(1m),但优于 Claude 4 Sonnet/Opus(200k) 和 o3(200k)
其他关键特性
支持文本和图像输入(多模态能力)
支持函数调用和结构化输出
最后,在定价方面,Grok 4 延续了 Grok 3 的策略,即每百万输入/输出 token 分别为 3 美元/15 美元。
这一价位与 Claude 4 Sonnet 持平,但高于 Gemini 2.5 Pro(1.25 美元/10 美元)和近期降价后的 o3(2 美元/8 美元)。
不过,根据知名大佬「karminski-牙医」的实测,Grok 4 的代码基准结果,有过拟合的嫌疑。
不管是已经用到包浆的「七边形小球弹跳」测试,还是刚做出来的「拆烟囱」测试,Grok 4 的表现都不如旧版 DeepSeek R1。
甚至,生成的代码还得靠 Claude debug 之后,才能跑……
参考资料: