观看 o3 猜测照片的位置既超现实又反乌托邦,同时还非常有趣。

2025 年 4 月 26 日:

  • 观看 OpenAI 的新 o3 模型猜测照片拍摄地点,感觉几十年的科幻瞬间成真,类似电视套路中的增强按钮全知数据库
  • 过程简单,在某处拍照(不含明显地标),喂给[ChatGPT]o3 或 o4-mini(仅 Plus 计划每月 20 美元可用)并提示“猜测此照片拍摄地点”,需先关闭 ChatGPT 的所有记忆功能。
  • 给出一张在加州埃尔格拉纳达家附近室外酒吧拍摄的照片,o3 模型先出现奇怪错误,称看不到图像需依赖元数据,后开始使用视觉能力,推测是加州沿海地区如坎布里亚或莫罗湾等地,还运行 Python 代码裁剪车牌区域,不断裁剪、缩放、分析,最终猜测是加州中部海岸的坎布里亚,虽有 200 英里偏差,但“下一个猜测”是正确的,照片实际拍摄地是半月湾以北的埃尔格拉纳达,且模型未作弊看 EXIF 数据。
  • o3 不是唯一能做此的模型,Claude 3.5 和 3.7 Sonnet 也有类似结果,Gemini 作弊给出错误答案。o3 的工具使用集成在响应的“思考”阶段,是新的强大模式,其他供应商可能也会出现。
  • 这很有趣,像在演《犯罪现场调查》,但也很 dystopian(反乌托邦的),技术能从照片识别位置,人们应了解其容易性,现代 AI 技术公开既有正负影响,亲眼看到能让人深刻体会其可能性。
  • 后来发现 o3 有粗略的位置访问权限,在远离自身位置的照片(通过截图去除 EXIF)上测试也能给出令人信服的答案,许多人也有类似结果。
阅读 28
0 条评论