0 到 1 搭建 GPTs 导航站系列:
- 0 到 1 搭建 GPTs 导航站(一):如何收录 GPTs
- 0 到 1 搭建 GPTs 导航站(二):Cloudflare CDN 性能优化
- 0 到 1 搭建 GPTs 导航站(三):SEO 优化
- 0 到 1 搭建 GPTs 导航站(四):网站推广
前言
出海小白第一次做网站,三个月前我上线了一个 GPTs 导航站 —— GPTs Happy,本系列文章主要总结过去三个多月自己做了什么,以及给大家介绍如何 0 到 1 建站。
概括来说过去三个月主要做了如下事情:
- 学习爬虫,收集了 3w 个 GPTs
- 使用 cloudflare CDN 等方式提高网站访问速度
- 使用各种策略,优化SEO
- 接入 Google Search Console、GA4、Clarity Microsoft 等工具跟踪网站流量
- 到 V2EX、Product Hunt、Reddit 等平台推广
网站运营情况如下:
- 被谷歌收条 2.7w 条
- 流量,100 多个人访问过
而今天,主要跟大家分享一下很多人最关心的问题,如何搭建网站和收录 GPTs。分享一下这个过程自己遇到什么问题,然后是怎样解决的。对于技术人员比较好理解,非技术人员也可以作为借鉴。
项目搭建
直接用 gpts.works ,按照文档部署到 Vercel 使用即可,超方便。
爬取推特 GPTs 搜索结果
虽然我是干开发的,但也没有做过爬虫。当时也在想怎样收录,到底如何找到数据最根本的源头,然后把这些数据爬取下来。网上查到 GPTs Works 初期的数据源是 GPTs hunter 分享的。于是顺藤摸瓜找到 GPTs hunter 作者的一些分享:
于是按着 GPTs hunter 作者的思路写了两个爬虫脚本,大家可以直接拿去用:
爬取谷歌 GPTs 搜索结果
当然,网上还有很多人提到可以在谷歌搜索 site:chat.openai.com/g/ ,过滤出 GPTs 链接。
研究了一下谷歌搜索,如果自己写脚本请求翻页可以这样搞 https://google.com/search?q=Query&num=10&start=0
。但是会有两个问题,第一是速率太快会被会被弹人机验证,所以别请求太快。另一个就是,谷歌虽然告诉你它收录了 49 万条数据,但实际上你可以浏览的也就只有前 10 几页,再往下滑你会发现到底了,滑不动了,用接口请求也会有同样的问题。
在搜索 API 加上时间参数,限制搜索时间就可以解决这个问题。完整 API 参数如下:
https://google.com/search?q=Query&num=10&start=0&tbs=encodeURIComponent(cdr:1,cd_min:1/1/2024,cd_max:1/2/2024)
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。