Python 提高查找dict的key的效率？

现在我需要将其中h_bzmc开头的所有信息提取出来，我用的是这个办法：

ip_info=json.loads(r.text)
l = []
for k, v in ip_info['data'].items():
    if k.startswith('h_bzmc')：
            l.append(ip_info['data'][k])

这样在key很多的情况下速度是否会受到较大影响？是否有效率更高的方法呢？

python

阅读 9.6k

5 个回答

得票最新

mr_s

27513142

发布于
2017-11-22

✓ 已被采纳

按照python官方的说法是直接for key in dict这种方式查找key是最快的。
你想要提取目的key可以直接这样：

l = [key for key in dict if key.startswith('h_bzmc')]

katios

29731622

发布于
2017-11-22

在python字典查找这块，时间复杂度是O(1),这是字典的优势。这上面无法进一步优化，
那么可以优化的地方就是递归了，不过水平有限，看看其他人答案吧。

起风了

4.1k2922

发布于
2017-11-22

更新于
2017-11-22

本身查找和遍历（无序）的复杂度就是O(1)*O(N)了，所以如果你的key特别多或者处理key的逻辑比较复杂，可以考虑：

import multiprocessing
import time
some_data = {'h_bzmc1' :1,
             'h_bzmc2': 2,
             'h_bzmc3': 3,
             'h_bzmc4': 4,
             'h_bzmc5': 5,
             'b_bzmc1': 1,
             'b_bzmc2': 2,
             'b_bzmc3': 3,
             'b_bzmc4': 4,
             'b_bzmc5': 5,
             }
results=[]

def func(key):
    if key.startswith('h_bzmc'):
        time.sleep(1)
        return some_data[key]
    else:
        return -1


if __name__ == "__main__":
    t0 = time.time()
    pool = multiprocessing.Pool(processes = 10)
    for key in some_data:
        results.append(pool.apply_async(func, (key, )))

    pool.close()
    pool.join()
    print([_.get() for _ in results])
    print(time.time() - t0)


    t1 = time.time()
    print([func(key) for key in some_data if key.startswith('h_bzmc')] )
    print(time.time() - t1)

云语2019

1.2k1210

发布于
2017-11-22

更新于
2017-11-22

图片描述

iter方法返回的是一个迭代器，所以应该很快且占用内存很小，这个方法应该能满足需求，如果只要判断key的话完全可以如下这样：
l = [key for key in iter(dict) if key.startswith('h_bzmc')]

同意并接受

7.2k21127

发布于
2017-11-22

做成多级嵌套字典

dic={
    'b':{
        'tax':{},
        'update':{},
    },
    'h':{
        'bzmc':{},
        'comments':{},
    },
}

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

Python 提高查找dict的key的效率？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？