谷歌发布开源 LMEval 框架:打破 AI 模型比较壁垒

谷歌发布开源 LMEval 框架:打破 AI 模型比较壁垒

IT 之家 5 月 27 日消息,科技媒体 The Decoder 昨日(5 月 26 日)发布博文,报道称谷歌推出开源框架 LMEval,为大语言模型和多模态模型提供标准化的评测工具。 评测新型 AI 模型一直是个难题。不同供应商使用各自的 API、数据格式和基准设置,导致跨模型比较耗时且复杂。
阅读全文
27岁博导张林峰:模型压缩获CVPR满分很意外,上交大年轻老师很多

27岁博导张林峰:模型压缩获CVPR满分很意外,上交大年轻老师很多

白交发自凹非寺 量子位 | 公众号 QbitAI 上海交大、27 岁、最年轻博导,留给张林峰的标签不多了(Doge)。 最新引发关注的,是他实实在在的一个论文成果—— 他们提出了一种新的数据集蒸馏方法,结果获得了 CVPR 2025 满分。 通过引入一个辅助的神经网络,只需一块 6 年前的 2080
阅读全文
外媒称三星将终止MLC NAND业务

外媒称三星将终止MLC NAND业务

5 月 27 日消息,据外媒 TheElec 报道称,三星即将退出多层单元(MLC)NAND 业务。 据悉,三星仅计划接收下个月前的芯片订单,并已告知客户将提高 MLC NAND 价格,促使客户另寻供应渠道。 除该客户外,LG Display 也在寻找其他 MLC NAND 供应商以取代三星。 目前
阅读全文
Claude 4被诱导窃取个人隐私!GitHub官方MCP服务器安全漏洞曝光

Claude 4被诱导窃取个人隐私!GitHub官方MCP服务器安全漏洞曝光

被选为 GitHub Copilot 官方模型后,Claude 4 直接被诱导出 bug 了! 一家瑞士网络安全公司发现,GitHub 官方 MCP 服务器正在面临新型攻击—— 通过在公共仓库的正常内容中隐藏恶意指令,可以诱导 AI Agent 自动将私有仓库的敏感数据泄露至公共仓库。 就是说,当用
阅读全文
工信部:4月份人均使用流量超20GB,同比增长14.6%

工信部:4月份人均使用流量超20GB,同比增长14.6%

5 月 27 日,南都湾财社记者获悉工信部发布《2025 年前 4 个月通信业经济运行情况》(下简称运行情况)。运行情况显示,今年前 4 个月我国通信业运行稳中有升,电信业务量收增速小幅回升,电信业务收入累计完成 5985 亿元,同比增长1%。按照上年不变价计算的电信业务总量同比增长 8.2%,增速
阅读全文
SpaceX面临重重压力:明年冲击火星之旅 还要搞“星舰快运”

SpaceX面临重重压力:明年冲击火星之旅 还要搞“星舰快运”

财联社 5 月 26 日(编辑史正丞)面对今年前两次试飞均以爆炸告终的结果,美国太空探索技术公司(SpaceX)目前计划在当地时间周二晚间(北京时间周三清晨)执行“星舰”第 9 次试飞。 根据周一的最新报道,SpaceX 正在对“星舰”项目押下重注,近几个月来不断增派人力并加大基础设施建设。知情人士
阅读全文
任天堂新闻App偷偷加入DRM?防止录屏留档?

任天堂新闻App偷偷加入DRM?防止录屏留档?

近日,Reddit 用户 Cube_play_8 发布了一则帖子,称 Nintendo Today 应用在最近的更新中悄悄加入了数字版权管理(DRM)或类似的保护措施,导致无法录制或捕捉相关的内容。 这一举措引发了不少用户的关注,尤其是在有关 Nintendo Switch 2 的推广资料和内容无法
阅读全文
男子日均点外卖2.5次患病 最爱重辣配奶茶且不爱运动

男子日均点外卖2.5次患病 最爱重辣配奶茶且不爱运动

据北京时间报道,近日,一位 34 岁程序员日均点外卖 2.5 次患病,需终身服药引发关注。 李先生因突发胸痛就诊,经检查,血压达 160/100 毫米汞柱,低密度脂蛋白胆固醇(即“坏胆固醇”)水平为 4.8 毫摩尔/升,冠脉 CTA 提示左前降支狭窄 40%~50%,医生发现其体内形成血管斑块。 医
阅读全文
苹果AI的崩塌真相:从乔布斯愿景,到高管失误的困局

苹果AI的崩塌真相:从乔布斯愿景,到高管失误的困局

AI,已经热了快三年了。 各大科技巨头争先恐后下注入局,可偏偏在这个热潮中,最接近我们生活的苹果,却看起来离 AI 最远。 最大的巨头,在最热的潮流面前,好似隐身了。 去年 6 月 WWDC 上,苹果慢吞地发布了 Apple Intelligence,可如今快一年过去,对大部分用户来说,Apple
阅读全文
天文学家发现黏在一起的双星

天文学家发现黏在一起的双星

在银河系的上千亿颗恒星中,互相环绕的双星非常常见。但中国科学家发现的一对快速互绕的双星,推测其中一颗伴星几乎是在另一颗伴星的气体壳层里绕行。双星系统之一是距离地球约 455 光年的脉冲星,名为 PSR J1928+1815。脉冲星是一种中子星,是大质量恒星在超新星爆炸后剩余的残骸。 研究团队利用 5
阅读全文
豆包可以跟你打视频了,陪我看《甄嬛传》还挺懂!

豆包可以跟你打视频了,陪我看《甄嬛传》还挺懂!

金磊发自凹非寺 量子位 | 公众号 QbitAI 几乎让大模型全军覆没的新难题——看时钟,被国产 AI 给拿下了。 要知道,之前单单是一张时钟的图表,几乎所有大模型都答不对时间。 但现在,国产 AI 却可以直接开视频,实时报准时间! 视频地址: https://mp.weixin.qq.com/s/
阅读全文
刷新世界记录!40B模型+20万亿token,散户组团挑战算力霸权

刷新世界记录!40B模型+20万亿token,散户组团挑战算力霸权

新智元报道 编辑:KingHZ 全球网友用闲置显卡组团训练大模型。40B 大模型、20 万亿 token,创下了互联网上最大规模的预训练新纪录!去中心化 AI 的反攻,正式开始。OpenAI 等巨头的算力霸权,这次真要凉了? 互联网上最大规模的预训练来了! Nous Research 宣布正式推出
阅读全文
惊了,自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死

惊了,自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死

国产智能体,这次真封神了。 过去这段时间,「智能体」简直杀疯了。 无论是初创公司还是互联网大厂,主流 AI 玩家们都开始围着它转,说它是大模型的下一站也毫不夸张。 作为人工智能的一种高级实现,智能体比大模型更具实体化、自主性、交互性,已经进化成「会思考、动手强、能串联一切工具的全能战士」。 就在 5
阅读全文
上汽通用别克昂科威第 180 万辆和君越第 130 万辆整车下线

上汽通用别克昂科威第 180 万辆和君越第 130 万辆整车下线

5 月 26 日消息,上汽通用别克今日宣布:昂科威第 180 万辆和君越第 130 万辆整车下线。 别克官方还回顾了四代君越的发展历程:初代君越拥有 5 米车长,轴距 2807mm,行业首发 HUD 抬头显示、液晶仪表盘;第二代君越同级首发 2. 0T 双涡道涡轮增压发动机、CDC 主动式悬架、触摸
阅读全文
笑疯了!全球首个机器人拳王出炉!互殴现场比机器人马拉松还抓马

笑疯了!全球首个机器人拳王出炉!互殴现场比机器人马拉松还抓马

来源:大河报 继北京亦庄马拉松后,人形机器人比赛再次开赛了。这次比的不是跑步,而是格斗。 5 月 25 日晚,以人形机器人为参赛主体的格斗竞技赛事——《CMG 世界机器人大赛·系列赛》机甲格斗擂台赛在杭州举行。“我真没想到,机器人打斗可以这么激烈、这么精彩。”观看比赛的网友评论道。 《CMG 世界机
阅读全文
李未可 View AI 眼镜发布:搭骁龙 AR1,1699 元

李未可 View AI 眼镜发布:搭骁龙 AR1,1699 元

IT 之家 5 月 25 日消息,李未可科技在今天的发布会中推出一款“李未可 View AI 眼镜”,标准价 1999 元,首发价 1699 元。 这款眼镜整机重量为 38g,续航 8 小时左右,充满电需要 45 分钟,可配近视镜片,同时有九种变色镜片可以搭配。其搭载了索尼 IMX 681 1200
阅读全文
颠覆认知!海洋真菌竟是碳循环第二大贡献者

颠覆认知!海洋真菌竟是碳循环第二大贡献者

人类对全球气候模型的科学认知,离不开“占地”70% 的海洋,也离不开海水中饱含的各种菌类。近日,来自中国上海海洋大学的科研团队,在国际顶级期刊《细胞》(Cell)发表研究成果,揭示真菌是海洋碳循环中被长期忽视的“关键角色”。 《细胞》论文链接与团队信息。 这项研究由海大海洋科学与生态环境学院外籍教授
阅读全文
Backbone Pro 手游手柄发布:新增蓝牙功能,169 美元

Backbone Pro 手游手柄发布:新增蓝牙功能,169 美元

科技日报北京 5 月 25 日电 (记者张梦然)最新一期《自然》杂志发表的论文报告发现一个原以为“不可能存在”的神秘结构。日本国立天文台团队对宇宙年龄只有 26 亿年时的一个星系的观测结果,揭示了这个神秘的棒状结构。它的出现非常令人意外,因为其特征本应摧毁这个棒状结构,但它看起来却极其稳定
阅读全文