主要观点:常听到“X 慢是因为要做很多工作”这类说法,实则大多依赖说话者对问题的直觉和理解,而非 X 本身。X 慢可能有多种原因,如使用低效算法、低效算法实现、未利用硬件、做不必要工作、未用正确问题框架等,也有确实是因为要做很多工作的情况,区分两者很难。
关键信息:
- 应用或系统组件等可能慢,不只是时间资源。
- 可能因使用低效算法(如数据库无查询索引)、低效算法实现(不同实现差距大)、未利用硬件(现代硬件很快)、做不必要工作(缓存等问题)、未用正确框架(如 C++编译器)而慢。
- 有时“X 慢因为做很多工作”可能是对的,如已充分探索问题、代码已充分优化等。
重要细节: - 不同原因导致 X 慢的具体例子,如数据库查询、算法实现差异、硬件利用等。
- 提到 C++编译器慢是框架问题,需重新构建问题。
- 链接“LLM inference speed of light”post 提供实际例子。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。