不好美国要捧杀了!新研究:中国正在成为全球科学领导者

  发表于 2024 年 6 月,却在当下登上《美国国家科学院院刊》,然后还被硅谷热议了。

  究竟是什么论文?

  答案揭晓:中美科技实力大 PK,以及得出的结论是——中国正在成为全球科学领导者

  和以往比比论文量、引用数不同,这项研究通过引入机器学习模型,分析了 600 万份论文的作者署名模式、通讯作者身份、机构影响力等多重线索,核心评估了“团队领导者”这一指标。

  研究人员表示,通过关注中国科学家在跨国合作中权力地位的变化:(我们)为研究中国在国际科学领域中的地位提供了一个新视角。

  而且他们还带来了一系列出人意料的发现——截至 2023 年,中美合作中中国领导者占比升至 45%,且预计在 2027-2028 年达到相同水平。

  预计到 2030 年,中国将在 AI、半导体、能源和材料科学等战略领域实现与美国平起平坐的领导地位。

  就是说,比人们预想的更快,中国将在科研力量上超越美国了?

  u1s1,虽然经彭博社报道后,外国网友们都在自嘲:西方科学无可争议的主导地位时代即将终结。

  但我们大多数人的反应 be like:不好,美国要捧杀了!

  咳咳,究竟是客观结论还是战略“捧杀”,还是先来看看论文是如何得出上述结论的吧——

  用 AI 模型分析 600 万篇论文

  通过分析 OpenAlex 数据库收录的近 600 万篇、涉及 13 个全球区域的双边合作出版物,研究人员想要弄清:中国科学家在国际科研团队中,到底站在什么位置?距离“世界领航者”还有多远?

  而要量化“谁是团队领导者”,可不是简单看作者排序那么简单。

  研究团队用了一套「AI+ 多维度特征」的组合拳,把这个模糊概念变成了可计算的数字。

  具体主要分成三步走:

  第一步,给“领导力”下一个可量化的定义。

  他们先从 Nature、Science、PNAS 等顶刊中,扒出 8.3 万篇带作者贡献声明的论文,通过聚类分析把科学家的工作分成三类:

  • 领导角色:构思研究、设计方案、撰写论文、监督团队(关键词为 conceive、design、lead、write);
  • 直接支持:收集数据、执行实验、分析结果(关键词为 collect、perform、analyze);
  • 间接支持:参与讨论、提供意见、修改文字(关键词为 participate、comment、edit)。

  随后给每个角色赋予“领导值”——做领导工作得 1 分,支持工作得 0 分,由此构建出训练 AI 模型的“标准答案”。

  第二步,用 9 个维度给科学家“领导力打分”。

  有了训练数据,团队又提炼出 9 个能预测领导力的关键特征,给 590 万篇论文的每一位作者“画像”。

  • 作者过往研究被该论文引用的次数(体现学术影响力);
  • 论文关键词与作者过往研究的重合度(体现领域深耕度);
  • 作者自引次数(体现研究延续性);
  • 学术生涯年限(体现经验积累);
  • 过往发表论文总量;
  • 累计被引次数;
  • 研究过的独特关键词数量(体现研究广度);
  • 作者署名顺序(如第一作者、通讯作者);
  • 所属机构的学术排名(体现平台资源)。

  用这 9 个特征训练的 AI 模型,精准度达 69.2%,最终能给每位作者输出一个领导概率分数(leader probability score)——用于衡量某个作者在一篇论文中的主导程度。

  第三步,从领导概率推断全球科研领导格局变化。

  在获得领导概率后(以 0.65 为分界线区分领导者和支持者),他们将其应用于全球范围内的数百万篇合作论文,进一步构造两个关键指标:

  • 领导占比(Leader Share):衡量某国家或机构作者在跨国合作团队中担任领导者的比例;
  • 领导溢价(Leader Premium):领导占比减去支持者占比,反映人均领导力转化效率,比如同样 100 个合作者,中国能出多少领导者,美国能出多少。

  通过对多个国家和区域的对比,研究得以量化不同科研体系在全球合作格局中的主导能力、结构变化与未来趋势。

  而他们得出的最核心的一张结论图如下:

  (1)2010 年,中美合作中中国占比仅 30%,2023 年快速升至 45%。

  (2)通过线性回归预测,中美将于 2027-2028 年达到同等领导占比。

  (3)不过中国与美国的领导溢价平等需等到 2087 年后,说明中国在“人均领导力转化”上面临长期挑战。

  老实说,这项研究之所以当下能在西方引起注意,实属意料之外,情理之中。

  不谈大道理,就拿最近陶哲轩遭遇经费断供一事就能窥见一二。

  时间回到今年 9 月,顶尖数学家陶哲轩在接受《华盛顿邮报》采访时亲口表示:

  • 研究所的经费仍然无法发放,连暑期工资都拿不到了。

  之所以会如此,是因为美国在今年的 7 月 25 日,突然暂停了国家科学基金会(NSF)、国立卫生研究院(NIH)等机构对 UCLA 的资助,金额高达 5 亿美元之多。

  即便后来事态有所好转,联邦法院在 8 月 12 日决定恢复部分拨款,但直到 9 月初,资金仍旧没有到位。

  好家伙,连陶哲轩都要被迫给自己和学生筹钱,这下西方学界和网友纷纷坐不住了——当时就有人直言这是“美国科学界的自我毁灭”,认为官僚体系正在扼杀创新。

  而现在这篇论文一出,网友们重拾焦虑也在所难免。

  作者之一来自武汉大学

  有意思的是,这项研究的作者之一也是来自中国(虽是同等贡献者但排在第一)。

  Renli Wu,论文提及的所属单位为武汉大学信息管理学院&芝加哥大学 Knowledge Lab。

  不过可能由于相对低调,目前网上公开资料较少(只找到了相关账号,且未发布任何动态)。

  从已发表的论文推断,其研究方向偏向科学计量、信息管理、知识系统演化等。

  Christopher Esposito,目前为 UCLA 安德森管理学院(加州大学洛杉矶分校顶尖商学院)博士后研究员。

  大约在 2021 年 6 月,他获得了 UCLA 地理学博士学位。

  他主要研究区域经济发展的成因,特别是技术变革如何塑造区域发展。

  James Evans,目前是芝加哥大学 Max Palevsky 社会学、计算与数据科学教授,同时也是 Knowledge Lab 的主任。

  (注:Max Palevsky 社会学是指,以硅谷初创先驱、风险投资奠基人 Max Palevsky 的人生轨迹和职业生涯为典型范例,来研究“硅谷精英”如何崛起以及影响社会的学科。)

  他主要关注“集体知识系统”、创新过程、注意力与认知的分布、科学体系结构、机器学习与大数据在科学研究中的应用等。

  One More Thing

  说到中国科技力量的崛起,不知道大家有没有一个共同的感受:怎么哪哪都有华人?(手动狗头)

  不仅频频亮相大厂发布会C位(如 OpenAI、马斯克特斯拉),而且还在硅谷抢人大战中备受瞩目,甚至连老黄也偏爱收购华人创办的初创公司……

  其影响力之大,甚至催生了 AI 内部梗:“以后 Meta 开会都是说中文了”…

  好家伙,网友诚不欺我,世界真就是一个巨大的中国村呗~

  论文:

  https://arxiv.org/pdf/2406.05917