我有一个定点类(10.22),我需要一个 pow、一个 sqrt、一个 exp 和一个 log 函数。
唉,我什至不知道从哪里开始。谁能给我一些有用文章的链接,或者更好的是,给我一些代码?
我假设一旦我有了一个 exp 函数,那么实现 pow 和 sqrt 就变得相对容易了。
pow( x, y ) => exp( y * log( x ) )
sqrt( x ) => pow( x, 0.5 )
它只是我发现困难的那些 exp 和 log 函数(好像我记得我的一些日志规则,我不记得关于它们的其他内容)。
据推测,sqrt 和 pow 也会有一种更快的方法,因此即使只是说使用我上面概述的方法,这方面的任何指针都会受到赞赏。
请注意:这必须是跨平台的,并且是纯 C/C++ 代码,所以我不能使用任何汇编程序优化。
原文由 Goz 发布,翻译遵循 CC BY-SA 4.0 许可协议
一个非常简单的解决方案是使用一个像样的表驱动近似。如果您正确减少输入,您实际上并不需要大量数据。
exp(a)==exp(a/2)*exp(a/2)
,这意味着你真的只需要为exp(x)
1 < x < 2
。在该范围内,runga-kutta 近似将给出合理的结果,大约 16 个条目 IIRC。同样,
sqrt(a) == 2 * sqrt(a/4) == sqrt(4*a) / 2
这意味着您只需要1 < a < 4
的表条目。 Log(a) 有点难:log(a) == 1 + log(a/e)
。这是一个相当慢的迭代,但 log(1024) 只有 6.9,所以你不会有很多迭代。您可以对 pow 使用类似的“整数优先”算法:
pow(x,y)==pow(x, floor(y)) * pow(x, frac(y))
。这是因为pow(double, int)
是微不足道的(分而治之)。[编辑] 对于
log(a)
的积分部分,存储一个表1, e, e^2, e^3, e^4, e^5, e^6, e^7
这样你可以减少log(a) == n + log(a/e^n)
通过简单的硬编码二进制搜索 a在那张桌子上。从 7 步到 3 步的改进不是很大,但这意味着您只需将e^n
除以n
乘以e
。[编辑 2] 对于最后一个
log(a/e^n)
术语,您可以使用log(a/e^n) = log((a/e^n)^8)/8
- 每次迭代通过表查找多产生 3 位。这使您的代码和表格大小保持较小。这通常是嵌入式系统的代码,它们没有大缓存。[编辑 3] 这对我来说仍然不聪明。
log(a) = log(2) + log(a/2)
。您可以只存储定点值log2=0.6931471805599
,计算前导零的数量,将a
移到用于查找表的范围内,然后将该移位(整数)乘以定点常数log2
。可以低至 3 条指令。使用
e
进行减少步骤只会给你一个“不错的”log(e)=1.0
常量,但这是错误的优化。 0.6931471805599 和 1.0 一样好;两者都是 10.22 定点的 32 位常量。使用 2 作为范围缩小的常数允许您使用位移位进行除法。[编辑 5] 由于您将其存储在 Q10.22 中,因此您可以更好地存储 log(65536)=11.09035488。 (16 x 对数 (2))。 “x16”意味着我们还有 4 位可用的精度。
您仍然可以从编辑 2 中获得诀窍,
log(a/2^n) = log((a/2^n)^8)/8
。基本上,这会给你一个结果(a + b/8 + c/64 + d/512) * 0.6931471805599
- b,c,d 在 [0,7] 范围内。a.bcd
真的是一个八进制数。毫不奇怪,因为我们使用 8 作为电源。 (这个技巧同样适用于幂 2、4 或 16。)[编辑 4] 仍然有一个开放的结局。
pow(x, frac(y)
只是pow(sqrt(x), 2 * frac(y))
我们有一个不错的1/sqrt(x)
。这为我们提供了更有效的方法。说frac(y)=0.101
二进制,即1/2加1/8。那么这意味着x^0.101
是(x^1/2 * x^1/8)
。但是x^1/2
只是sqrt(x)
而x^1/8
是(sqrt(sqrt(sqrt(x)))
。再保存一个操作,Newton-RaphsonNR(x)
给我们1/sqrt(x)
所以我们计算1.0/(NR(x)*NR((NR(NR(x)))
。我们只反转最终结果,不要直接使用 sqrt 函数。