并行请求的实现

Question

并行请求的实现

sirliu

341121

发布于
2019-07-11

更新于
2019-07-11

请答主尽量不要用“aiohttp、asyncio、aiofiles”，实在弄不明白。

具体的代码如下（串行），同样功能如何实现并行？

import requests

def getdata(num):
  params={
  'id':'123456789',
  'num':num
        }
  url='http://httpbin.org/post'
  r=requests.post(url,params=params).json()
  return r['url']

def main():
  nums=range(0,100)
  urls=[]
  for num in nums:
    url=getdata(num)
    urls.append(url)
  print(urls)

main()

我已知的能实现并行请求的简单方法如下，但是该方法的局限性是：必须先有URL列表，不能带参数，而实际开发当中需要带参数请求，虽然上面的问题，可以事先根据参数生成URL列表，但是我想知道事先无法生产URL列表的情况怎么实现并行，比如要提交form data时该怎么实现并行：

import requests
from multiprocessing.dummy import Pool as ThreadPool
urls = ['http://www.baidu.com']*20

# Make the Pool of workers
pool = ThreadPool(10)

# Open the urls in their own threads
# and return the results
results = pool.map(requests.get, urls)

#close the pool and wait for the work to finish
pool.close()
pool.join()
print(results)

python

阅读 2.6k

1 个回答

得票最新

prolifes

11.2k51537

发布于
2019-07-11

✓ 已被采纳

想要快速获得别人的回答，尽量提付费问答。

你的问题是对进程池的使用方法不清楚，代下如下：

# coding: utf-8

import multiprocessing
import requests
import os

def getdata(num):
    print 'run pid', os.getpid(), os.getppid()
    data = {
        'id': '123456789',
        'num': num
    }
    url = 'http://httpbin.org/post'
    try:
        d = requests.post(url, data=data, timeout=1).json()
        return d['url']
    except:
        return 'timeout'


def main():
    results = []
    p = multiprocessing.Pool()

    for num in range(0, 10):
        res = p.apply_async(getdata,(num,))
        results.append(res)

    p.close()
    p.join()

    urls = [_.get() for _ in results]
    print urls

if __name__ == '__main__':
    main()

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

并行请求的实现

请答主尽量不要用“aiohttp、asyncio、aiofiles”，实在弄不明白。

具体的代码如下（串行），同样功能如何实现并行？

相关实现方法（仍未解决本人的问题）

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？