北大发布首篇大语言模型心理测量学系统综述:评估、验证、增强

北大发布首篇大语言模型心理测量学系统综述:评估、验证、增强

随着大语言模型(LLM)能力的快速迭代,传统评估方法已难以满足需求。如何科学评估 LLM 的「心智」特征,例如价值观、性格和社交智能?如何建立更全面、更可靠的 AI 评估体系?北京大学宋国杰教授团队最新综述论文(共 63 页,包含 500 篇引文),首次尝试系统性梳理答案。 论文标题:Large L
阅读全文
DHL集团与电商平台Shopify深化合作,全球跨境物流再提速

DHL集团与电商平台Shopify深化合作,全球跨境物流再提速

来源:美通社 德国波恩 2025 年 5 月 27 日 /美通社/ -- DHL 集团宣布进一步深化与电商平台 Shopify 的合作,助力商户更快捷地将商品运送至世界各地。此次升级合作,DHL 将通过其覆盖广泛的全球物流网络,为数百万 Shopify 商户打造更高效、简捷的跨境及本土货运通道。 通
阅读全文
快手呼吁合作商勿向员工赠送礼品,严禁员工吃拿卡要

快手呼吁合作商勿向员工赠送礼品,严禁员工吃拿卡要

IT 之家 5 月 27 日消息,快手官方账号今日向各合作商发布公告称,公司一直提倡诚信合作,拒绝商业贿赂,严禁员工吃拿卡要,谋取私利。 此外,快手还提出了五项呼吁,IT 之家汇总如下: 一,请勿向快手员工及相关利益方赠送礼品、礼金或提供宴请招待等。 二,请勿与快手员工进行利益交换,共同维护公平公正
阅读全文
魏建军“挑事”?李云飞疑似反击,长城与比亚迪的那些事

魏建军“挑事”?李云飞疑似反击,长城与比亚迪的那些事

2025 年 5 月 23 日,长城汽车在微博发布了一条关于长城汽车董事长魏建军与新浪财经 CEO 邓庆旭的对话视频。视频中邓庆旭问道:“长城汽车过去,有一个最大的争议性事件,就常压油箱事件,这个事件现在有结论了吗?” 图源 :长城汽车微博 魏建军答道:“这个事件,现在虽然没结论,但是部委给我们的答
阅读全文
马斯克确认X Money 即将发布:涉及钱的事要格外小心

马斯克确认X Money 即将发布:涉及钱的事要格外小心

来源:环球网 5 月 27 日消息,据外媒 cointelegraph 报道,埃隆・马斯克于日前在 X 平台上宣布,X Money 这款支付和银行应用程序即将开始 Beta 测试,此次测试将采取极为谨慎的态度。 马斯克在 X 上写道:“当涉及到人们的储蓄时,必须格外小心。” 据粉丝账号 Tesla
阅读全文
外媒:苹果首款智能家居中心设备预计将于今年年底推出

外媒:苹果首款智能家居中心设备预计将于今年年底推出

来源:环球网 5 月 27 日消息,据 engadget 援引彭博社报道称,苹果的智能家居中心设备预计最早于今年年底发布。该设备的基础版本将率先面世,而配备机械臂的高端版本有望在随后的一两年内推出。 据介绍,苹果智能家居中心设备自 2022 年起便传出相关消息,最初因严重依赖 Apple Intel
阅读全文
百度心响上线iOS版,多智能体协作应用终于卷对地方了

百度心响上线iOS版,多智能体协作应用终于卷对地方了

小明发自凹非寺 量子位 | 公众号 QbitAI 今年的 4 月 26 日,我们测评了百度新发布的多智能体协作应用心响 APP。当时只上线了安卓版,很多网友在线求苹果版链接。 就在这几天,iOS 版也终于上线了,只需要在苹果的 APP Store 搜索关键词即可下载。 现在,苹果安卓用户全部免费用,
阅读全文
夸克健康大模型通过副主任医师考试,国内首个

夸克健康大模型通过副主任医师考试,国内首个

5 月 27 日消息,夸克健康大模型在国家副主任医师职称考试中 12 门学科全部超过合格线,成为国内首个通过该考试的大模型。 此前,国内大模型多停留在临床执业医师资格考试阶段,只能拿到初级职称。此次夸克实现“两级跳”,跨越副高门槛,在全科医学、肿瘤内科学、皮肤与性病学、精神病学等 4 个学科更达到主
阅读全文
外媒曝光特朗普为何给iPhone加税:库克没"随驾"中东惹恼总统

外媒曝光特朗普为何给iPhone加税:库克没"随驾"中东惹恼总统

5 月 27 日消息,上周五,美国总统特朗普公开威胁,对所有在美国境外生产的 iPhone 征收 25% 关税。这一表态令苹果公司及美国政府相关部门均感意外。据《纽约时报》报道,此举很可能是针对苹果 CEO 蒂姆·库克(Tim Cook)没有随行特朗普最近的中东之行,属于明显的“报复”行为。 近日,
阅读全文
马斯克:AI 将替代传统搜索

马斯克:AI 将替代传统搜索

昨日,马斯克在个人社交账号上转发了一份关于全球搜索引擎份额的报告,其配文「AI 将替代搜索」,并 @ 了自家 xAI 旗下的 AI 聊天机器人 Grok。 据马斯克转发的报告显示,Google 搜索自 2015 年以来,市场份额首次跌破 90%,降至 89.71%。报告称,用户已经厌倦了夹杂在答案中
阅读全文
阿里推出长上下文推理模 QwenLong-L1-32B

阿里推出长上下文推理模 QwenLong-L1-32B

阿里巴巴已于近日发布全新 AI 模型 QwenLong-L1-32B,一款基于强化学习(RL)优化的长上下文推理模型。 根据介绍,QwenLong-L1-32B 的最大亮点在于其惊人的 13 万个 Token 上下文长度。这一能力使其能够处理超大规模的文本输入,轻松应对复杂、多层次的信息整合任务。相
阅读全文
OpenAI正推进全球扩张 将在韩国首尔设立办公室

OpenAI正推进全球扩张 将在韩国首尔设立办公室

5 月 26 日消息,据外媒报道,在生成式人工智能方面走在行业前列的 OpenAI,正在推进他们 AI 基础设施的全球扩张,将在韩国首尔设立办公室。 OpenAI 将在韩国首尔设立办公室,是由首席战略官 Jason Kwon 透露的,他表示 OpenAI 已在韩国设立了分部,计划在首尔设立他们在韩国
阅读全文
飞猪AI“问一问”升级机酒查询、手绘地图等功能,新增“会员助手”

飞猪AI“问一问”升级机酒查询、手绘地图等功能,新增“会员助手”

5 月 26 日下午消息,飞猪 AI“问一问”近日更新部分功能。产品中的“智慧交通顾问”“酒店顾问”信息查询及生成精度双双提升,现已覆盖机型、舱位、酒店类型等信息;新的 AI 角色“会员助手”出现了,可以帮助用户查询会员等级和对应的专享权益;手绘行程地图的实用性也明显增强。 此外,“问一问”还优化了
阅读全文
微软为 Windows 11 内置全新命令行编辑器 Edit,开源且轻巧

微软为 Windows 11 内置全新命令行编辑器 Edit,开源且轻巧

在备受瞩目的 Build 2025 开发者大会上,微软正式发布了一款名为 Edit 的全新开源命令行文本编辑器。这款编辑器未来将作为 Windows 11 操作系统的内置组件一同分发,旨在为用户提供一种轻量级、原生且富有现代感的命令行编辑体验,其定位类似于经典的 Nano 及 Vim 编辑器。 微软
阅读全文
这届国产AI真的可以!20分钟生成万字报告,附带可视化网页

这届国产AI真的可以!20分钟生成万字报告,附带可视化网页

衡宇发自凹非寺 量子位 | 公众号 QbitAI 大上午的,还没到 10 点呢,量子位负责财报分析的同学就已经在我背后的工位上发出了第N次哀嚎。 不怪她,换我我也得喊救命——最近一季度财报频发,这已经是本月解读的不知道第几家 Q1 财报内容了。 每天,真的是每一天,她一会儿回头问我这个数据算得对不对
阅读全文
深蓝要做“半价问界”了

深蓝要做“半价问界”了

5 月 26 日消息,荣耀 400 系列手机发布会已定档 5 月 28 日 19:30,预计届时将带来荣耀 400 标准版和 Pro 两款新机,以及 WATCH Fit 手表、荣耀平板 10 等新品。 荣耀手机官方今日发文宣布,荣耀新任 CEO 李健将在此次发布会上完成国内首秀,具体安排如下: 荣耀
阅读全文
董明珠孟羽童合体带货500万元,71岁铁娘子向流量“低头”

董明珠孟羽童合体带货500万元,71岁铁娘子向流量“低头”

5 月 26 日讯(记者陆鹏鹏)董明珠孟羽童终于和解了,一场时隔两年的同框让格力直播间迎来了流量狂欢。 董明珠孟羽童"大和解" 一晚带货 500 万元,但美容仪仅卖了 4 单 5 月 23 日晚,格力董事长董明珠和前秘书孟羽童一同现身"格力明珠精选"直播间进行直播带货。这是孟羽童离开格力电器后两人首
阅读全文