秘塔AI推出“极速”模型,响应速度达400 tokens/秒,AI搜索实现“秒回”

  智东西 AI 前瞻(公众号:zhidxcomAI)

  作者江宇

  编辑漠影

  智东西 AI 前瞻 5 月 26 日消息,秘塔 AI 搜索今日宣布推出其全新“极速”模型,实现了在单张 H800 GPU 上高达 400 tokens/秒的响应速度,承诺用户在大部分问题上都能体验到 2 秒内完成的“秒回”搜索体验。

  秘塔 AI 搜索团队表示,实现这一速度提升得益于对 GPU 的 kernel fusion 以及 CPU 的动态编译优化。这些技术改进旨在优化数据处理流程,以期缩短生成答案的时间。

  此次技术升级在追求速度的同时,也关注答案的准确率和逻辑清晰度。

  秘塔 AI 搜索官方提供了两个测试示例:“为什么撕拉片突然火了?”这类快速响应型问题,以及“请总结 2015 年至今关于 CRISPR-Cas9 在治疗遗传性疾病中的研究进展”这类需要一定信息整合的问题,分别展示了“极速”和“极速·思考”两种模式下的表现。

  为了让用户能有一个直观的感受,秘塔 AI 搜索还提供了一个限时开放的测速站点(kuai.metaso.cn)。用户可以通过这个站点输入问题,体验新模型的响应速度。

  新模型究竟表现如何?智东西 AI 前瞻第一时间在测速站点进行了体验,以下几个维度或许能帮助你更全面地了解秘塔 AI“极速”模型的实际表现:

  1. “计时挑战”:感受“秒回”的速度

  日常问题,秘塔 AI 能多快搞定?试试下面这道逻辑题。

  • “两人从 100 枚硬币中轮流取1-5 枚,取最后一枚者胜。请问先手第一步取几枚硬币才能确保必胜?”

  测评表现:在实测中,秘塔 AI 搜索在 2.42 秒内完成了该问题的解答,响应速度达 366 token/秒,总输出字数 886 token,并明确指出先手应取 1 枚硬币以确保必胜。这展现了它在复杂逻辑推理中快速给出有效策略的能力。

  2. “刁钻问题大考验”:测试 AI 的逻辑与整合

  除了速度,新模型在处理复杂逻辑和整合信息方面表现如何?

  • “请解释一下‘薛定谔的猫’思想实验,并谈谈它对量子力学的意义。”

  测评表现:仅用 1.86 秒,秘塔 AI 搜索就完成了对思想实验的阐述,响应速度高达 353 token/秒,输出 658 token。它不仅清晰解释了该实验如何揭示量子叠加态,还深入分析了其对波函数坍缩和量子实在性等核心量子力学概念的影响。“极速”模型在快速理解并阐述复杂物理原理方面表现出色。

  3. “效率实验”:AI 能否助你高效规划?

  面对需要多方信息才能得出结论的问题,AI 搜索能否显著提升效率?

  • “下个月去日本东京旅行五天,请给我一个详细的行程规划,包括交通和特色美食推荐。”

  测评表现:面对这一信息量大、要求具体规划的问题,秘塔 AI 搜索在 4.30 秒内就输出了长达 1550 token 的详细方案(响应速度达 360 token/秒)。这份方案不仅涵盖了五天的景点、交通和美食安排,还包含了住宿区域建议、交通卡使用提示乃至特色餐厅推荐,展现了它在处理复杂任务、整合多方信息并生成详细文本方面的效率与能力。

  秘塔 AI 搜索此次推出的“极速”模型,无疑在追求 AI 搜索的响应速度上迈出了一步。从测试的逻辑题、物理概念逻辑推演到复杂的旅行规划,该模型展现出了在不同类型问题下快速生成答案的能力。

  这种速度上的提升,会让用户在日常的信息获取和复杂任务处理中感受到更直接的便利。这不仅仅是技术参数的进步,更可能意味着未来 AI 搜索体验将变得更加流畅、即时,就像随手可得的智能助手一样。