头图

还记得前段时间那个刷屏的全球首位 AI 工程师 Devin 吗?就是那个号称能独立写代码、改 Bug 的超级 AI。

现在它的母公司 Cognition AI(现在叫 Cognition Labs 了)又搞了个大新闻,推出了一个新工具叫 DeepWiki

这个玩意到底是啥?一句话解释:GitHub 版 Deep Research

食用方法超级简单,只需将你想看的 GitHub 仓库链接中的 github 替换成 deepwiki,按下回车,就可以打开这个仓库的 DeepWiki 专属页面了,完全免费,无需注册,是不是很帅?

我拿 Sealos 的 GitHub 仓库 试验了一下,确实有点惊艳到我了,整个页面层次清晰,还有很多可视化架构图(Sealos 项目本身并没有提供),每个章节都有相关的资料来源,非常方便查阅。

比如,这是它给出的 Sealos 前端架构,可以说很精准了:

底部还有对话框可以对项目进一步提问,同时支持【Deep Research】模式,非常适合新手小白。

我来问问 Sealos DevBox 的实现原理,好家伙,直接给我读代码了。

就问你 6 不 6?

是不是已经有点心动了?别急,我们先来看看它解决了什么问题。

阅读源码的痛点在哪里?

相信每个开发者都经历过:

  1. 文档缺失:很多仓库连像样的 README 都没有,更别提详细文档,理解全靠猜和翻 Issues。
  2. 代码庞杂:面对成百上千的文件、几十上百万行代码,想理清整体脉络难于上青天!
  3. 信息过载:GitHub 上项目日新月异,纯靠人力阅读、总结,效率低下,容易麻木。
  4. 功能与代码难对应:想借鉴某个功能实现?文档里通常不会告诉你它对应哪段源码。

虽然 GitHub 自己也在努力改进(比如代码树、依赖图谱、Copilot 对话辅助),但这些往往聚焦于局部细节,想快速建立项目的宏观认知(比如清晰的系统架构图),还是有点难。

而 DeepWiki 正好解决了这些痛点。

DeepWiki 如何化腐朽为神奇?

DeepWiki 不仅仅是简单地展示代码,它用 AI 的力量,将代码仓库变成了一本活的、可交互的百科全书。

说实话,功能还挺戳我们开发者的痛点的:

  • AI 生成的“活”文档: 它会自动分析代码、README、配置文件,然后生成简单易懂的解释。代码结构、关键函数、依赖关系都给你捋清楚,再也不用对着天书一样的脚本抓狂了。
  • 交互式图表: 能生成像类关系图、依赖图这种可以点击、缩放的图表,让你一眼看清代码库的“骨架”和各个部分是怎么连起来的。可视化大法好!
  • AI 聊天小助手: 看不懂某段代码?想知道如何贡献?直接问!DeepWiki 内置了由 Devin 支持的 AI 聊天助手。你可以高亮选中任何文本提问,AI 会结合上下文给出清晰解答,甚至直接引用相关代码。还支持中文对话
  • 深度研究查询: 对高级玩家,还能让它跑更复杂的分析,比如找潜在 Bug、提优化建议,甚至比较不同代码库的优劣。这简直就是请了个随叫随到的架构师。
  • 轻松分享: 不管是生成的 Wiki 页面,还是你跟 AI 的问答结果,都能一键生成链接分享给同事或社区小伙伴,知识共享不要太方便。
  • 私有仓库?也行! 虽然公开仓库免费,但如果你想用在自己的私有项目上,注册个 Devin 账号(对,就是那个 Devin 的账号)应该就能搞定(具体可能看后续政策)。

下了多大血本?

为了让 DeepWiki 跑起来,Cognition Labs 可真是下了血本:

  • 已经索引了大约 3 万个 GitHub 仓库(还在持续增加中)。
  • 分析处理了超过 40 亿行 代码。
  • 光是索引这些代码,据说计算成本就砸了超过 30 万美元
  • 总共处理的 Token 数量超过了 1000 亿个

听起来平均索引一个仓库的成本大概要 12 美元左右,但现在对所有开源项目免费开放,这羊毛不薅白不薅啊~

它是怎么做的呢?从我了解到的资料来看,有两点特别有意思:

  1. 层级化拆解: 它不是一上来就看细节,而是先把整个代码库拆分成一个个更高层次的“系统”或“模块”。
  2. 为“系统”建 Wiki: 然后,为每个识别出来的“系统”生成对应的 Wiki 页面,像搭积木一样,最终构建出整个项目的知识地图。

还有一个很聪明的点,它利用了 GitHub 上一个非常有价值的信息源——代码提交历史!通过分析“哪些文件经常被哪些人一起修改”,它能挖掘出代码库里隐藏的逻辑关联、模块边界,甚至是开发者之间的协作模式。这些信息对于理解一个陌生又复杂的项目来说非常重要。

最后

说实话,DeepWiki 这个想法真的挺棒的。咱们开发者,特别是刚接触一个新项目或者想给大型开源项目做贡献的时候,最大的障碍往往就是“看不懂”。文档要么没有,要么过时,要么写得云里雾里。

DeepWiki 用 AI 来自动化生成和维护这个“理解”层,还是很有吸引力的:

  • 对新手和学生: 绝对是福音!能快速上手真实世界的复杂代码,学习曲线陡然下降。
  • 对老鸟: 快速熟悉新接手的项目(尤其是那些文档匮乏的“祖传屎山”),或者在技术选型时比较不同库的实现,效率会有很大提升。
  • 对开源社区: 降低了贡献门槛,可能会吸引更多人参与进来,这对于整个生态都是好事。

当然啦,刚出来的东西,肯定也有需要完善的地方。比如,AI 生成的内容准确度怎么样?对于特别复杂或者用了冷门技术的项目,理解深度够不够?这些都有待观察和用户的反馈。

不过,目前 DeepWiki 网站上已经有 3 万个仓库的 Wiki 可以探索了。对于我们开发者来说,面对那些庞大、复杂的开源项目时,DeepWiki 提供了一个超级强大的新武器。它很有潜力改变我们理解、学习和参与代码项目的方式。

总之,强烈建议大家都去试试看,白嫖为啥不试?

对了,我也挺好奇 DeepWiki 背后的模型具体是啥,你猜是 Claude 3.7 还是 Gemini 2.5 Pro 还是 O3?🤔

哈哈,等他们透露更多信息吧!


米开朗基杨
177 声望28 粉丝