在爬取58同城工作页面的申请人数和浏览人数时，网页源代码总是显示0人，但页面数据在实时更新，更新的内容和F12中的elements内容是一致的，请问这种情况应该如何爬到申请和浏览人数？网页地址：<a href="https://link.segmentfault.com/?enc=LW3c%2FP4sdQfu5AcMq8mdIA%3D%3D.U3mYIouNGb%2F1ZpnWYzr1WHVrjfD9KR177ymDncIms1cu3q9fp%2F%2FxE%2FfKPl7mfc4J2WTvyfZrhdGe7KkJ6%2B9MT2keC91b2sEf%2Bdo0RmwaTETFICUNIWZQ7Je0dsL1%2FYlvQ3%2FPNM28tclbkEdcCBJI%2Fwme0TGrARAdZnqJK84Fwp31EhlY8Cg%2FUMaVGw2B2EuG7CjO0zixij5oRAky2wD17zsY5ojReQvpwZaAFOhAAPidzqN2LmVXrZTbs7fqtbmdRMratSlIPDPDzS3Um1IBN%2FJRkGc5yF3EZA8Eh%2BfNPR9UScMy7jwMaWFdq%2Bg2tcgdjZ9XDtURNeCqI%2BdkTufYDiZtl9S3NUOBfekP0Wurgr6cfBR7n2xqRMWldtlev8KULg5G3Zmvcz7edfbugmb15vqPyzM%2Fs1BeB0%2BTH%2B1gihP80hcqjnjibTUtj9VXlGA78u9mjZ1qAFNDP%2FEAOc9%2B6mJXtdNjOFVvLwzc3kfDEQO4BXbc2SjFqwxB0%2FsnhycTWcWwujAdmK1CzF3DojfUqU8gIZgCdSRwxIBFKf0spwaJZEGW9qdY4S8WSok42kGAjbfCUy%2BCWrJiK4%2FX30pUQNBV72Wls7aqHOxNsAXOPJAwV18x7JLPAyjrgaBJjW%2FhJpdStidNm67kqIEYUpzvs84L4%2FPGj1L4EW4i%2FH8TOJ8%3D" rel="nofollow" target="_blank">https://bj.58.com/zpyiyuanyiliao/27988291906488x.shtml?psid=1... 网页页面：网页源代码：

<a href="https://link.segmentfault.com/?enc=m3EKcQzPOnBxQjtLYtjH%2Bw%3D%3D.E8Gv59nkgsyH2Mk0O1yYB0WmE%2FxQVh4013dK9t4%2BjjQayet1Q%2B6srvtYFPN%2FXjNd0aRs9gTMFrsyyBqRwfb4gUK%2F%2FsmCx6EFkkj4mrrLx%2FFg%2B%2FC5nvd4zjzwre7AGgzK4IzxtLrGWGP7yP5FwsfVNhSSDaMz%2BC2JzKz3IbXaOPiV9NS9UuOiMsKkowKOTGUq%2F3eQ3aYc7b0OVjatHIqhSoAYsH%2Bdas2dFzncGaHDG96FJDAPf6UYAGmxUn2M5O%2FhZ2CbCP1X5dpXCkjXCOYvbA%3D%3D" rel="nofollow" target="_blank">https://statisticszp.58.com/position/totalcount/?infoId=27988... 请求这个地址： { deliveryCount: 1141, commentCount: 0, infoCount: 4, resumeReadPercent: 0, referUrl: "", nextUrl: "null" }

爬虫时网页源代码和页面内容不一致，和F12中的ELEMENT也不一致，怎么办？

Moana

发布于
2023-10-13 北京

更新于
2023-10-13

在爬取58同城工作页面的申请人数和浏览人数时，网页源代码总是显示0人，但页面数据在实时更新，更新的内容和F12中的elements内容是一致的，请问这种情况应该如何爬到申请和浏览人数？
网页地址：https://bj.58.com/zpyiyuanyiliao/27988291906488x.shtml?psid=1...
网页页面：

网页源代码：

爬虫 html 数据挖掘

阅读 2.2k

4 个回答

得票最新

kaipizhe

1.6k29193270

发布于
2023-10-16 广东

✓ 已被采纳

https://statisticszp.58.com/position/totalcount/?infoId=27988...

请求这个地址：

{
  deliveryCount: 1141,
  commentCount: 0,
  infoCount: 4,
  resumeReadPercent: 0,
  referUrl: "",
  nextUrl: "null"
}

知名喷子

6k31731

发布于
2023-10-15 贵州

数据是由 JavaScript 执行后填入的。
配合使用 selenium 或者 puppeteer 等无头浏览器，等 JS 执行完毕再获取数据就行了。

忆故人

44811642

发布于
2023-10-16 上海

加个等待时间就可以了。或者你干脆分析接口不得了。

hfne3q3k

99422

发布于
2023-10-16 山东

更新于
2023-10-16

查看网页源代码只是最初的内容（最初返回的Doc）
后边都是<sricpt>标签引入的js改的
比较简单的方法是用selenium 或者 puppeteer 或者 tampermonkey（具体用啥得看你现在会啥了），就是稍微慢点
分析请求接口估计是非常难（得对前端和反爬非常了解）

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

爬虫时网页源代码和页面内容不一致，和F12中的ELEMENT也不一致，怎么办？

你尚未登录，登录后可以

浏览器能请求到数据怎么换了api工具或是爬虫都没数据了呢？

如何处理 CSS calc() 函数中的单位不一致问题？

js阻止冒泡问题？

Scss的rgba()方法无法对变量进行二次编译？

后端获取的html标签页面如何正常显示？

电脑和手机都连同一个WIFI怎么用fiddler获取手机端的请求？

如何使用echarts绘制奈奎斯特曲线？