不同地思考，缓慢地思考：PowerPC Mac 上的大型语言模型（LLMs）

发布于 3 月 25 日

主要观点：将大型语言模型（LLM）引入旧硬件（如 2005 年的 PowerBook G4）并取得成功，展示了即使是老旧硬件也能体验到人工智能的魅力。
关键信息：

从 Andrej Karpathy 的llama2.c项目开始，fork 后改进为ullm项目，包括代码改进、引入回调输出及测试、内部重组等。
为在 PowerPC 上运行进行了调整，如处理字节序问题、使用 AltiVec 向量扩展提高性能等。
测试了不同规模的 TinyStories 模型，比较了在不同硬件（Intel Xeon Silver 4216 和 PowerBook G4）上的性能，PowerBook G4 运行速度慢约 9 倍，使用 AltiVec 后约慢 8 倍。
重要细节：
代码改进方面，如引入状态返回、抽象文件访问和内存分配等，使代码更易测试和维护。
内部重组后，代码在初始化或推理失败时通过状态传播替代 exit 调用。
在 PowerPC 上调整时，解决了模型字节序不匹配等问题，使用 AltiVec 可加速矩阵乘法操作。
性能测试中，单线程推理且开启编译器优化，PowerBook G4 运行速度远低于现代 CPU，但使用 AltiVec 有一定提升。
由于硬件限制，无法运行多亿参数模型，此项目到此为止，可继续用该硬件整理和听音乐。

阅读 17