切换 AI ✨ – 关于技术的疯狂漫谈

发布于 2025-01-13

主要观点：通过一定的黑客手段，可使现代大型语言模型（LLM）在任天堂 Switch 上运行，尽管存在诸多限制和问题。
关键信息：

任天堂 Switch 运行的是现成的 Nvidia Tegra X1 芯片，含 4GB RAM，最初用于平板电脑和汽车行业，后被任天堂采用，相关开发工具和 Linux4Tegra 分布存在。
利用 Switchroot 团队对 Linux4Tegra 的移植工作，包括多个 Ubuntu 版本等，使其在 Switch 上运行良好，包括 CUDA 也能正常使用，但 Nvidia 已停止对 Tegra X1 的支持，仅支持 CUDA 10.2。
经过一系列复杂的配置、补丁和依赖操作，如更新 CUDA 版本、处理编译器错误、添加链接命令等，成功让 llama.cpp 能在 Switch 上加载和运行大型语言模型 Llama-3.2-3B-Instruct-Q4_K_M，但运行时会因内存不足被 OOM 杀手终止，通过安装 lightdm 和 LXDE 等可解决，还可通过调整 OOM 相关设置来防止被终止。
重要细节：
编译过程中遇到各种编译器和链接器错误，如 CUDA 版本不兼容、缺少编译器 intrinsics 支持、链接 std::filesystem 出错等，通过特定的 CMake 标志和代码修改来解决。
运行时内存不足问题可通过停止其他进程、设置 OOM 相关参数等方式缓解，如将 OOM 分数调整为 0 可提高优先级，禁用 lockdown 和 swap 限制等。
整个过程涉及多个项目和团队的贡献，如 Switchroot 团队、GGML 和 llama.cpp 贡献者、Atmosphere-NX 项目等，同时也提到了对模型训练数据来源的争议。

阅读 20