今天早晨,当我像往常一样,打开 GPT 网页版,准备开始新一天工作时,意外地收到了试用 GPT 最新的 4O 模型的邀请。
在可选模型的下拉列表里,出现了一条新的可选项:GPT-4o
在我账号的 subscription plan 里,也能看到 GPT-4O 的访问权限了:
GPT-4o 的 o 代表了 Omni(model),源自拉丁语中的词 omnis,意思是所有的
,每一个的
。
在英语中,这个前缀被用来形容无所不包、全面或普遍的含义,即全能模型。
在 ChatGPT 4O 诞生之前,过去的 ChatGPT 模型的各项能力是单独训练的。
以之前的 ChatGPT App 中提供的语音对话功能为例,其工作流程按顺序如下:
- Whisper 语音转文字
- GPT-4 回复文字内容
- TTS 生成对话语音
这三个串行步骤,类似 Unix 操作系统设计的管道机制,前一个步骤的输出,作为下一个步骤的输入。
GPT-4o 则是完全重新训练的,是一个原生的支持文字、视频和音频的端到端模型。该模型所有的输入和输出都由同一神经网络处理,工作方式同之前的 GPT 模型有着本质的区别。
举个实际的例子。
ABAP 是一门编程语言,是 Advanced Business Application Programming 的缩写。
我曾经使用 DALL-E 模型为这门语言生成一些海报。详见之前这篇文章:用 ChatGPT 生成 ABAP 海报,失败作品远远多于成功作品。
因为 DALL-E 无法准确识别文字,所以尽管我仔细维护 Prompt,一次又一次的要求它生成包含 ABAP 四个大写字母的海报,DALL-E 也经常给我生成一些让我啼笑皆非的作品。
根据 OpenAI 官网资料的介绍,我个人认为现在这个的 ChatGPT 4O,可以直接精确生成包含文字的图像。
切换成 ChatGPT 4O,使用下列 Prompt:
帮我生成一张具有编程和未来世界风格的海报,要求海报正中,包含 ABAP 四个大写字母。ABAP 是 Advanced Business Application Programming 四个单词首字母的缩写。
然而生成的海报仍然不能让我满意。是我的 Prompt 哪里有问题吗?
既然大写字母的生成不够精确,我们再来试试简单的英文单词吧。
Prompt 如下:
same exact image(same text on page), include:
- I am Jerry. I enjoying writting in SAP Community.
- I would like to continue write stories here.
sheet of paper is now taller. the field of view thus now wider, so that the scene is visible.
结果仍然不能让我满意。大家可以看到,生成的图片里面的文字,同我 Prompt 里提供的文本相比,准确率只有 10% 左右。
不过,OpenAI 官网上给出的一些 demo,效果看起来令人惊叹。
比如使用者提供一张图片,ChatGPT 4O 就可以将 OpenAI 的 logo,叠加到这张图片上。这意味着以后使用 PhotoShop 的美工人员们,都要面临失业了吗?
然后是把一首诗转换成手写体:
效果非常完美:
然而我选了一小段,亲自动手试试:
To see, to hear, to speak, to sing-
Oh, the richness these senses bring!
In harmony, they blend and weave,
A tapestry of what I perceive.
用的与 demo 完全一样的 Prompt,最后结果如下,文本的匹配准确率仍然很低。
不过知乎上有朋友做了推测,这是因为目前我们使用的 ChatGPT 4O,demo 里包含的那些能力,还没有真正上线。当然这个说法,目前也暂时无法验证。
OpenAI 技术团队成员在 X 上表示,之前在 LMSYS Chatbot Arena 上引起广泛热议的神秘模型「im-also-a-good-gpt2-chatbot」就是 GPT-4o 的一个版本。
在比较困难的 prompt 集上 —— 特别是编码方面:GPT-4o 相比于 OpenAI 之前的最佳模型,性能提升幅度尤其显著。
具体来说,在多项基准测试中,GPT-4o 在文本、推理和编码智能方面实现了 GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉功能上实现了新高。
总之我们期待 ChatGPT 4O 在接下来一段时间内,随着自身的迭代,会变得越来越好。让我们拭目以待吧。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。