昨日,字节旗下 AI 产品豆包 App 宣布视觉推理能力升级,图片分析支持深度思考。
官方表示,在深度思考模式下,拍摄或上传一张图片,豆包就能对图片进行放大、裁切,并支持图片搜索、边想边搜,进一步提升结果的准确性。
从官方给出的案例中,豆包能根据图片细节信息,对比历史档案,检索相似图片,梳理演变脉络,最终确定图片年代范围;甚至豆包还能根据地形景观、建筑风格、窗户细节,对照地理和人文特征,判断具体方位,并确定城市名称。
目前,豆包 App 已上线上述功能。