我的 AI 学习一周总结：ChatGPT API 发布

即然接下来的时间准备投身 AI 行业应用层开发，那就隔三岔五分享一下近期学到的知识、在做的事情吧。（配图是今天用第一次用 SD 生成的图片，prompt：“a beautiful girl“。）

ChatGPT API 发布

今天（2023-03-02，美国时间 03-01） OpenAI 正式发布了 ChatGPT API，即基于 gpt-3.5-turbo 模型的。它的价格更便宜，$0.002/1k tokens，比之前 text-davince-003 便宜 10 倍。它能提供更好的对话质量，还提供了新的结构化数据接口，相信会给应用开发者带来更多的空间。

chatgpt 等 npm 包也相应更新，如果没有办法搞定绑卡操作，可以继续用这些社区接口白嫖。

不过国内的服务器已经不能直接访问 OpenAI API 了，国内的同学可能需要多花一些功夫，或者金钱。

尝试 Vercel Edge Function

之前开发 GPT-3 插件的时候，有同学介绍了 Building a GPT-3 app with Next.js and Vercel Edge Functions 一文，于是我尝试把 API 挪到 Vercel Edge Function 上，然后失败。

今天写本文的时候，又看了眼 TwitterBio 的例子，发现代码并没有写错。排查来排查去，原来是自己犯蠢，部署环节出了问题。如今已经可以使用了。回头重构下插件，添加一些功能进去。

学习社区 ChatGPT API 仓库

ChatGPT 的开发商 OpenAI 提供两大块服务，API 和 ChatGPT 网页版。API 需要绑卡，有一定门槛；网页版可以免费用，不过存在偶尔连不上、响应慢等情况，据说买 plus 之后会有好转。

于是社区就开发了网页版转 API 的工具，可以用来搭建自己的 ChatGPT API。但是需要使用反向代理服务器作为中转，开发者也不提供反向代理服务器的源码，存在一些风险，所以我看完就不打算使用了。

（现在我想想，所谓的代理服务器，是不是搞个 nginx 就可以了……

本地搭建 Stable Diffusion 环境

搭建过程其实很简单，难点主要在下载 pip 包和模型上，受限于墙内的网络环境，原本简单的下载变得异常艰辛。还好在换用国内 pip 源之后，我终于在本地搭建成功 Stable Diffusion Web UI 环境。大体过程如下：

安装必须的软件环境，比如 cmake、python3.10 等
clone AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI
修改 pip 源
反复执行 ./webui 直至安装成功
模型可以在 Civitai 下载

Whisper 模型

Whisper 模型是 OpenAI 释出的开源模型，可以用来做语音识别，据说效果非常好。它不仅可以识别语音内容，还可以根据声纹，区分不同的发言人。所以用途也很广，比如视频会议之后，可以用它生成会议的文字记录。如果再结合 ChatGPT，就可以进行内容总结、会议摘要等工作，想象空间很大。

因为开源，所以可以自己搭建服务器，据说不需要很强的计算能力，庶民可用。OpenAI 这次也放出了 Whisper API，方便用户使用。

ChatGPT 新知

中文语料少的副作用

使用英文要求 ChatGPT 创作哈姆雷特的故事，它会拒绝，因为它知道哈姆雷特，新故事如果背景差异过大，它就会拒绝。但如果用中文，因为语料不足，哈姆雷特对它来说也只是个人名，它就会很配合。

名人资料

GPT-3 会大量混淆中国名人，比如郭德纲、岳云鹏；相对来说，ChatGPT 就好很多。

现在 AI 工具与 AI 基础设施层出不穷，日新月异应接不暇，学起来既有动力也有压力。下一步希望能把所有工具的环境都搭建起来，先积累感性认识再说。

本文参与了SegmentFault 思否写作挑战赛，欢迎正在阅读的你也加入。

我的 AI 学习一周总结：ChatGPT API 发布

ChatGPT API 发布

尝试 Vercel Edge Function

学习社区 ChatGPT API 仓库

本地搭建 Stable Diffusion 环境

Whisper 模型

ChatGPT 新知

中文语料少的副作用

名人资料

Meathill

引用和评论

分享自制小工具：AutomateGPT – 在 ChatGPT 里批量执行任务

Open WebUI：开源AI交互平台的全面解析

大模型中的Token究竟是什么？从原理到作用深度解析

一文掌握 MCP 上下文协议：从理论到实践

MySQL × 向量数据库：大模型时代的黄金组合实战指南

Vue3-ChatGPT：基于vite4.x+vue3+pinia2模仿chatgpt聊天AI实例