Python如何爬取多个Request URL不变,Form Data改变的页面?

在爬取香港交易所的股票数据时链接描述,发现页面的Request URL没有改变。直接post日期,也只返回最近一日的数据。

clipboard.png

clipboard.png

url = 'http://sc.hkexnews.hk/TuniS/www.hkexnews.hk/sdw/search/mutualmarket_c.aspx?t=sh'
payload = {'ddlShareholdingDay':'4', 'ddlShareholdingMonth':'11','ddlShareholdingYear':'2017'}
r1 = requests.post(url, payload)
soup = bs(r1.text,'lxml')
soup

clipboard.png

尝试post 11.4的日期,返回11.6(昨日)的数据。

Form data里面还有其他参数,加到payload之后不返回任何数据。

刚刚学习Requests和BeautifulSoup包,很不熟练,请大家指教。

阅读 6.4k
1 个回答

如果有精力就研究一下那些不规则的参数值怎么生成的,你也可以照着写一份,如果没有精力就用selenium来解决吧

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题