头图

最近在读 Jeff Dean 的新作 Pathways ,心中又一次出现了这样的困惑:从前沿工作上看,系统工作与算法模型工作早就已经到了相互结合、缺一不可的状态。但近几年在做开源项目的过程中,和开发者、用户交流下来,最大的体会是系统工程师和算法工程师几乎总是离的很远。同学们彼此眼中的对方,大概是“洗草药炼丹的” vs “大力出奇迹抡大锤的”……

做系统的同学们想要深入跟进 AI 技术趋势,把大锤抡到算法同学的心坎儿里,并不容易。几乎所有学习资料都透着一股浓重的科研味道,太多的公式与理论,太少的工程与系统。

作为系统出身的 AI 爱好者,我们在做 [Towhee] (https://github.com/towhee-io/...) 与 [Milvus] (https://github.com/milvus-io/...) 两个开源项目的过程中一直在等待一个为系统人量身打造的 AI 教程,但一直没有这样的作品出现。

近期,我们计划自己动手进行一次尝试,做一套咱们系统人自己的 AI 学习教程。项目定位是开源,纯系统角度,落地,好玩。目前计划中的有三个系列,分别侧重应用实战、推理系统优化、前沿系统技术:

1、从零开始搭建 AI 应用

  • 应用 CLIP 搭建文本-图片跨模态搜索服务
  • 技术宅的浪漫:图片与视频二次元化!
  • 大规模图搜系统
  • 跨模态视频语义检索
  • 音乐版权检测实战(策划中)
  • 问答系统(策划中)
  • 没有人比我更懂如何高效浏览 Github :为 Github 构建开源项目检索与推荐系统(策划中)
  • 技术宅的浪漫:你的女神总是缺一个口红色号!(策划中)

2、构建你自己的高性能推理服务

  • 初识 TorchScript ,ONNX ,TensorRT
  • 基于 Nvidia 的工具包加速你的推理服务
  • Towhee 推理服务构建实战 (策划中)

3、AI 系统论文精读

  • Pathways: Asynchronous Distributed Dataflow for ML

接下来即将和大家见面的系列文章是 《从零开始搭建 AI 应用:应用 CLIP 搭建文本-图片跨模态搜索服务》,预计 6 月 24 日发布。在这个系列中,将会学到:

  • CLIP 跨模态搜索的基本工作原理
  • 文本-图片跨模态搜索的原型搭建
  • 进阶 1:部署向量数据库,进行大规模向量召回
  • 进阶 2:部署推理服务,大幅提升推理性能
  • 进阶 3:向量数据压缩

为了最大化提高教程的流畅度,我们目前已经在 [Towhee] (https://github.com/towhee-io/...) 项目中完成了一系列准备工作,包括 CLIP 的集成封装,python 侧的 pipeline 编程接口,贴近生产实战的 docker 镜像,干货满满,敬请期待!

更多项目更新及详细内容请关注我们的项目 https://github.com/towhee-io/... ,您的关注是我们用爱发电的强大动力 :)


Zilliz 以重新定义数据科学为愿景,致力于打造一家全球领先的开源技术创新公司,并通过开源和云原生解决方案为企业解锁非结构化数据的隐藏价值。
Zilliz 构建了 Milvus 向量数据库,以加快下一代数据平台的发展。Milvus 数据库是 LF AI & Data 基金会的毕业项目,能够管理大量非结构化数据集,在新药发现、推荐系统、聊天机器人等方面具有广泛的应用。


Zilliz
154 声望829 粉丝

Vector database for Enterprise-grade AI