OpenAI 推出专注于可靠性的 o3-pro 模型,在用户反馈参差不齐之际

主要观点:OpenAI 推出新模型 o3-pro,旨在复杂任务中提供更可靠、深思熟虑的响应,已对 Pro 和 Team 用户开放,替代早期 o1-pro,基于 o3 架构能使用多种工具处理多面问题,设计面向重视正确性和深度的用户,响应生成时间可能比轻量模型长,专家和学术评估显示有改进,部分用户认为是实用升级,早期测试者提出性能慢和幻觉问题等担忧。
关键信息

  • 推出新模型:o3-pro,替代 o1-pro。
  • 功能特点:基于 o3 架构,可使用 Python 等工具,设计注重正确性和深度。
  • 评估表现:在“4/4 可靠性”测试中优于 o1-pro 和 base o3,在清晰度等方面得分高。
  • 用户看法:部分认为是实用升级,如能提升生产力;早期测试者指出性能慢和幻觉问题,如在医疗领域常编造信息。
  • 技术限制:目前不支持图像生成等功能,这些功能可通过其他模型获取。
    重要细节
  • 开放对象:对 ChatGPT 中的 Pro 和 Team 用户及通过 API 开放。
  • 性能对比:在算法问题上表现尚可但时间长,在医疗等领域常出现幻觉。
  • 后续期待:用户希望模型能解决幻觉问题,提高速度和特定领域表现。
阅读 60
0 条评论