语音-语言模型 Voila:实时自主交互和角色扮演

语音-语言模型 Voila:实时自主交互和角色扮演

多模态奖励模型(MRM)在提高多模态大语言模型(MLLM)的性能方面发挥着重要作用。虽然最近的研究进展主要集中在改进 MRM 的模型结构和训练数据上,但对奖励模型的长推理能力的有效性以及如何在 MRM 中激活这些能力的探索还很有限。 在这项工作中,来自中国科学院自动化研究所、清华大学、快手和南京大学
阅读全文
一加 Ace 5 Supreme Edition 手机跑分曝光:天玑 9400+ 芯片

一加 Ace 5 Supreme Edition 手机跑分曝光:天玑 9400+ 芯片

IT 之家 5 月 7 日消息,科技媒体 91Mobile 昨日(5 月 6 日)发布博文,报道称型号为 PLC110 的一加手机现身 GeekBench 跑分库,预计仅在中国市场发售,会叫做一加 Ace 5 Supreme Edition,配联发科天玑 9400+ 芯片。 根据跑分库页面,该机搭载
阅读全文
丰田章男砸挂:电动车造越多,碳排放越多

丰田章男砸挂:电动车造越多,碳排放越多

作者 | 王磊 编辑 | 秦章勇 丰田章男又又唱“反调”了。 新近一次采访中,他抛出一个观点,说生产太多纯电动车,碳排放反而会蹭蹭往上涨。 还甩出数据证明,丰田卖了大约 2700 万辆混合动力车,碳减排效果相当于 900 万辆纯电动汽车,但如果丰田在日本生产 900 万辆纯电动汽车,反而会增加碳排放
阅读全文
OPPO Enco Clip 开放式耳夹耳机实拍:OPPO 首款,轻巧小豆夹

OPPO Enco Clip 开放式耳夹耳机实拍:OPPO 首款,轻巧小豆夹

IT 之家 5 月 7 日消息,今天上午,OPPO Enco Clip 开放式耳机正式亮相,这也是 OPPO 首款开放式耳夹耳机,官方表示不到千元价格,即可拥有“更智能、更舒适、更清晰”的体验。 OPPO Enco Clip 具备随取随用的便捷特性,两只耳机完全一致,无需分辨左右,且左右声道自适应,
阅读全文
2025美国艺术与科学院院士出炉!中国物理巨匠王贻芳,ImageNet作者李凯当选

2025美国艺术与科学院院士出炉!中国物理巨匠王贻芳,ImageNet作者李凯当选

新智元报道 编辑:英智好困 2025 年美国艺术与科学院院士公布,有在机器学习领域开疆拓土的学者,也有在神经科学方面深入钻研的专家,他们有着怎样令人惊叹的成果?来一同揭晓新科院士的风采。 2025 年美国艺术与科学院新科院士公布! 2025 年新选出的近 250 名院士来自全球 16 个国家,涵盖
阅读全文
苹果提出原生多模态Scaling Law!早融合+MoE,性能飙升秘密武器

苹果提出原生多模态Scaling Law!早融合+MoE,性能飙升秘密武器

新智元报道 编辑:英智 研究揭示早融合架构在低计算预算下表现更优,训练效率更高。混合专家(MoE)技术让模型动态适应不同模态,显著提升性能,堪称多模态模型的秘密武器。 如今,打造强大的多模态模型是 AI 领域的重要目标。 一种常用方法是把单独预训练好的模型组合起来,比如把训练好的视觉编码器连接到 L
阅读全文
让GPT-4.1「头皮发麻的考试」!OpenAI给大模型上强度,AI能赢吗?

让GPT-4.1「头皮发麻的考试」!OpenAI给大模型上强度,AI能赢吗?

新智元报道 编辑:定慧 当 AI 模型拥有千万级 Token 的超长记忆力时,如何检验它们的真正实力?OpenAI 给出了新答案:MRCR 基准测试。这不再是简单的「大海捞针」,而是要求模型在海量文本中,区分并找到多个一模一样的「针」中的特定一个,难度堪称「AI 界的奥运会」。MRCR 不仅有助于揭
阅读全文
AI无师自通,搞定所有家务!π0.5突破泛化极限,UC伯克利系出品

AI无师自通,搞定所有家务!π0.5突破泛化极限,UC伯克利系出品

新智元报道 来源:学术头条 具身智能最大的挑战在于泛化能力,即在陌生环境中正确完成任务。最近,Physical Intelligence 推出全新的π0.5 VLA 模型,通过异构任务协同训练实现了泛化,各种家务都能拿捏。 近年来,机器人取得了显著进展,能表演杂技、跳舞、听从指令,甚至完成叠衣服、擦
阅读全文
突发!曝阿里通义薄列峰离职,此前为应用视觉团队负责人

突发!曝阿里通义薄列峰离职,此前为应用视觉团队负责人

衡宇发自凹非寺 量子位 | 公众号 QbitAI 五一节后第一口瓜,曝阿里通义实验室高层人员离职变动! “互联网八卦小喇叭”等多个微信公众号爆料,阿里巴巴通义实验室应用视觉团队负责人薄列峰(职级 P10),已于 4 月 30 日低调离职。 他曾带领团队做出通义 App 上全民舞王「兵马俑跳科目三」等
阅读全文
微信下场做抽奖,腾讯挖起自己的流量

微信下场做抽奖,腾讯挖起自己的流量

文 | 电商在线 刚在春节用蓝包完成一场电商奇袭的腾讯,又搞起大动作。 自 2024 年 12 月灰度测试以来,微信蓝包凭借其“社交送礼”的便捷性迅速崛起。先是靠着送礼物这个独特功能抢夺互联网的流量与关注,随后快速进入用户的聊天页面,成为和红包一样占据C位的聊天框角色。2 月 5 日,微信派发布数据
阅读全文
被买爆的大疆Pocket3:“产品流量感”激发品牌势能活水

被买爆的大疆Pocket3:“产品流量感”激发品牌势能活水

文 | 品牌议题 01、直男品牌,竟被女生买爆了 一部 2023 年 10 月上线的口袋相机大疆 Pocket 3,竟然在 2025 年 3 月依然断货。“电子茅台”名不虚传,太不可思议了。 一机难求,也有黄牛插脚的原因。第三方平台溢价普遍达 200-500 元,部分商家甚至效仿奢侈品行业的“配货模
阅读全文
iPhone 充值「更贵」的时代有望终结,但苹果税不会消失

iPhone 充值「更贵」的时代有望终结,但苹果税不会消失

历时 5 年的「苹果税」诉讼,迎来了第一个大结局。 负责该案的美国法官 Yvonne Gonzalez Rogers 裁定,即日起,苹果不得再对 App 外的购买行为收取费用,并禁止该公司限制 App 开发人员引导用户进行 App 外购买。 ▲ 「苹果税杀手」 Yvonne Gonzalez Rog
阅读全文
Redis 8 再次切换到开源许可证 AGPLv3

Redis 8 再次切换到开源许可证 AGPLv3

2024 年 3 月 Redis 宣布从 7.4 版本起其许可证从 3-clause BSD 切换到商业使用需获得授权的双许可证 Redis Source Available License (RSALv2) 和 Server Side Public License (SSPLv1)。此举意味着 R
阅读全文
台积电2nm需求超所有其它制程!苹果、NVIDIA、AMD都想要

台积电2nm需求超所有其它制程!苹果、NVIDIA、AMD都想要

快科技 5 月 6 日消息,据报道,台积电的 2nm 制程技术正在引发前所未有的市场需求,有望成为该公司下一个"淘金热"。 报道称,台积电的 2nm 节点需求远超以往任何制程,甚至在大规模量产之前就已经展现出强劲的吸引力,有望超越目前极为成功的 3nm 节点。 台积电的 2nm 制程技术在成熟度上取
阅读全文
谷歌支持的Waymo大力扩展自动驾驶叫车业务

谷歌支持的Waymo大力扩展自动驾驶叫车业务

谷歌支持的 Waymo 正在大力拓展其自动驾驶叫车业务。该公司目前每周在凤凰城、旧金山、洛杉矶和奥斯汀等城市完成超过 25 万次付费行程。为了满足日益增长的需求,Waymo 计划到 2026 年在亚特兰大、迈阿密和华盛顿特区推出服务。 为了支持业务扩张,Waymo 正在与麦格纳国际合作,在凤凰城都市
阅读全文
苹果用户,安卓来“偷心”

苹果用户,安卓来“偷心”

打不过就拥抱 作者丨吴姿 处处为苹果用户着想的,不只是苹果公司,还有安卓智能手机厂商们。 4 月下旬,vivo 发布了新一代旗舰机 vivo X200 Ultra 和 vivo X200s,这两款手机有一个共同的卖点:能与苹果生态(iOS/Mac)深度融合。 比如,vivo 办公套件可以让 vivo
阅读全文
大疆 Osmo 360 全景相机现身,是否上市仍是未知数

大疆 Osmo 360 全景相机现身,是否上市仍是未知数

5 月 5 日消息,大疆新品 Osmo 360 全景相机已现身 FCC,其设计图也一并曝光,该产品将直接与影石 Insta360 与 GoPro 的全景相机竞争。 Osmo 360 采用类似影石 Insta360 全景相机的双镜头对称设计,使用了 DJI Action 运动相机电池,支持 5.7K
阅读全文
曝小红书将开放外域合作:广告跳转至天猫

曝小红书将开放外域合作:广告跳转至天猫

小红书正在内测“种草直达”功能并计划升级,升级后商家将通过特定方式实现广告笔记下挂链接跳转至天猫商品页。这位知情人士还称“这也是小红书平台少见的正式开放外域合作。”对此消息,小红书客服表示,“种草直达是小红书搜索直达下的营销推广产品,在小红书搜索场域下,通过技术服务,实现站外成交数据回传,进而帮助客
阅读全文