新手上路，请多包涵

fastcall 调用约定真的比 cdecl 等其他调用约定快吗？是否有任何基准可以显示调用约定如何影响性能？

原文由 zr. 发布，翻译遵循 CC BY-SA 4.0 许可协议

阅读 835

2 个回答

得票最新

✓ 已被采纳

这取决于平台。例如，对于 Xenon PowerPC，它可能是一个数量级的差异，因为在堆栈上传递数据时会出现加载命中存储问题。我凭经验将 cdecl 函数的开销计时大约 45 个周期，而 fastcall 的开销约为 4 个。

对于无序的 x86（Intel 和 AMD），影响可能要小得多，因为无论如何寄存器都被隐藏和重命名。

答案确实是您需要在您关心的特定平台上自己对其进行基准测试。

原文由 Crashworks 发布，翻译遵循 CC BY-SA 2.5 许可协议

fastcall 调用约定真的比 cdecl 等其他调用约定快吗？

我相信微软在 x86 和 x64 上实现 fastcall 涉及在寄存器而不是堆栈中传递前两个参数。

由于它通常会节省至少四次内存访问，是的，它通常更快。但是，如果所涉及的函数是寄存器匮乏的，因此很可能将它们写入堆栈上的本地，那么不太可能显着增加。

原文由 Anon. 发布，翻译遵循 CC BY-SA 2.5 许可协议

撰写回答

推荐问题

子站问答

本篇内容翻译自 Stack Overflow，如果你觉得翻译结果值得改进，欢迎直接编辑修改，感谢你为社区贡献。

相似问题

找不到问题？创建新问题

fastcall真的更快吗？