我有以下 Python 2.7 代码:
listOfLists = []
for l1_index, l1 in enumerate(L1):
list = []
for l2 in L2:
for l3_index,l3 in enumerate(L3):
if (L4[l2-1] == l3):
value = L5[l2-1] * l1[l3_index]
list.append(value)
break
listOfLists.append(list)
L1、L2、L3、L4、L5 列表为:
L1 = [[0.60, 0.95, 0.38, 1.02, 0.29, 0.43], [0.40, 0.09, 0.87, 0.85, 0.70, 0.46], [0.67, 0.91, 0.66, 0.79, 0.86, 0.06], [0.59, 1.81, 0.05, 1.88, 0.20, 0.48], [0.64, 0.34, 0.37, 1.39, 0.56, 0.27], [0.56, 0.34, 0.68, 2.79, 0.18, 0.42], [0.42, 1.67, 0.04, 0.44, 0.25, 0.94], [0.32, 1.92, 0.95, 2.85, 0.95, 0.96], [0.50, 0.68, 0.84, 1.79, 0.35, 0.09], [0.34, 0.66, 0.85, 0.35, 0.38, 0.59], [0.50, 0.79, 0.45, 2.93, 0.50, 0.92], [0.11, 0.11, 0.93, 1.11, 0.81, 0.49]] # a list of 12 sublists
L2 = [3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15]
L3 = [480, 120, 35, 0, 520, 300]
L4 = [120, 120, 120, 0, 300, 35, 35, 520, 300, 480, 120, 480, 0, 35, 0, 0, 300]
L5 = [5.4, 2.83, 1.16, 6.9, 0.76, 2.15, 5.61, 3.12, 1.57, 0.08, 5.36, 0.2, 1.2, 1.4, 2.9, 2.1, 3.5]
这些只是例子;实际上,列表包含数十万个数字。解释器需要数十秒来计算三个嵌套的 for
循环。
是否有可能以某种方式加速此代码,例如使用 itertools
或任何其他模块/功能?
编辑:我不能使用非标准的 python 2.7 模块(numpy、scipy …)
原文由 marco 发布,翻译遵循 CC BY-SA 4.0 许可协议
@Rogalski 是对的,您肯定需要重新考虑算法(至少尝试这样做)。
但是如果你找不到更好的算法,我认为你可以通过一些技巧来加快速度,同时仍然使用嵌套循环。请注意,我会将 L* 列表视为一些全局变量,我不需要将其传递给每个函数。因此,您需要让这些列表对新函数可见或将它们添加为参数。
首先,尝试清理。例如,您似乎从不使用 l1_index,因此您可以摆脱它。然后你可以将第一个循环内发生的所有事情都移到一个函数中。然后它看起来像这样:
这很好,但是理解比带附加的循环更快( 在这里 您可以找到关于该主题的一篇不错的文章)。第一个循环非常简单,所以让我们将它折叠成
listOfLists = [create_list(l1) for l1 in L1]
。我们可以对我们的 create_list 函数执行相同的内循环提取现在它看起来更具可读性,并且应该工作得更快一些。您也可以尝试使用内置列表函数来查找列表中的元素(
l3_index = l3.index(L4[element-1])
,),但我不知道它是否会更快。请注意,lambda 并不比以相同方式做相同事情的普通函数更快。但它们确实会破坏堆栈跟踪,从而使代码更难调试。从 itertools 开始,您可以使用组合,但是您将需要预先生成 list_of_lists,因为没有为您提供组合的订单合同。而 zip 并不是您所需要的。
代码的一个问题是您在嵌套循环的每一轮中循环 L3。这个问题的解决方案是添加一些预先计算。您需要了解 L4 的每个元素对应的 L3 索引。你可以这样做: