fastcall真的更快吗?

新手上路,请多包涵

fastcall 调用约定真的比 cdecl 等其他调用约定快吗?是否有任何基准可以显示调用约定如何影响性能?

原文由 zr. 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 779
2 个回答

这取决于平台。例如,对于 Xenon PowerPC,它可能是一个数量级的差异,因为在堆栈上传递数据时会出现加载命中存储问题。我凭经验将 cdecl 函数的开销计时大约 45 个周期,而 fastcall 的开销约为 4 个。

对于无序的 x86(Intel 和 AMD),影响可能要小得多,因为无论如何寄存器都被隐藏和重命名。

答案确实是您需要在您关心的特定平台上自己对其进行基准测试。

原文由 Crashworks 发布,翻译遵循 CC BY-SA 2.5 许可协议

fastcall 调用约定真的比 cdecl 等其他调用约定快吗?

我相信微软在 x86 和 x64 上实现 fastcall 涉及在寄存器而不是堆栈中传递前两个参数。

由于它通常会节省至少四次内存访问,是的,它通常更快。但是,如果所涉及的函数是寄存器匮乏的,因此很可能将它们写入堆栈上的本地,那么不太可能显着增加。

原文由 Anon. 发布,翻译遵循 CC BY-SA 2.5 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题