Python 递归时 requests.get()中url+url问题。

图片描述

如图,下面黑框递归getlinks时传入的url应该是完整的,那么递归中走到requests.get("xxxxx"+pageurl)这里,两个url合并一起了??在这个地方很迷啊,还望懂的大佬不吝赐教。

阅读 2.9k
1 个回答
  1. 正则表达式匹配出来的不是完整的表达式,这是这样的:

/wiki/1794
/wiki/Jay_Treaty
/wiki/1863
/wiki/American_Civil_War
/wiki/President_of_the_United_States
/wiki/Abraham_Lincoln
/wiki/Gettysburg_Address
/wiki/Gettysburg_National_Cemetery
/wiki/Gettysburg,_Pennsylvania
/wiki/1942
/wiki/World_War_II
/wiki/Operation_Uranus
/wiki/Battle_of_Stalingrad
/wiki/Axis_powers
/wiki/1969
/wiki/Santos_FC
/wiki/CR_Vasco_da_Gama
/wiki/Rio_de_Janeiro
/wiki/Association_football

/wiki/1794来说,递归拼接之后就是这样的了:

https://en.wikipedia.org/wiki/Main_Page/wiki/1794
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题