fastcall 调用约定真的比 cdecl 等其他调用约定快吗?是否有任何基准可以显示调用约定如何影响性能?
原文由 zr. 发布,翻译遵循 CC BY-SA 4.0 许可协议
fastcall 调用约定真的比 cdecl 等其他调用约定快吗?是否有任何基准可以显示调用约定如何影响性能?
原文由 zr. 发布,翻译遵循 CC BY-SA 4.0 许可协议
3 回答2k 阅读✓ 已解决
2 回答3.9k 阅读✓ 已解决
2 回答3.2k 阅读✓ 已解决
1 回答3.2k 阅读✓ 已解决
1 回答2.7k 阅读✓ 已解决
3 回答3.4k 阅读
1 回答1.6k 阅读✓ 已解决
这取决于平台。例如,对于 Xenon PowerPC,它可能是一个数量级的差异,因为在堆栈上传递数据时会出现加载命中存储问题。我凭经验将
cdecl
函数的开销计时大约 45 个周期,而fastcall
的开销约为 4 个。对于无序的 x86(Intel 和 AMD),影响可能要小得多,因为无论如何寄存器都被隐藏和重命名。
答案确实是您需要在您关心的特定平台上自己对其进行基准测试。