百度等其他搜寻引擎爬虫爬取的网页原始码是?

拿大家最常用的chrome浏览器来看,网页查看原始码方式有二种
1.键盘Ctrl+U查看源代码:就是别人服务器发送到浏览器的原封不动的代码,也就是最原始的代码
2.键盘F12检查元素:看到的就是最终的html代码。即:源代码 + 网页js渲染
有些网页是Javascript渲染的技术建置,所以会有Ctrl+U查不到文字,而F12查的到内文
因此想问大家,百度爬虫的话,是爬取Ctrl+U还是F12的原始码?

阅读 2.2k
2 个回答

Google 的 bot 是会执行 JS 的,报错机器人偶尔会捕获到一些。

image.png

Ctrl+U,然后网站通过一些技术方便seo。

网上有好几种单页应用转seo的方案,有服务端渲染ssr、有预渲染prerender、google抓AJAX、静态化。。。这些方案都各有优劣,开发者可以根据不同的业务场景和环境决定用哪一种方案。本文将介绍另一种思路比较清奇的SEO方案,这个方案也是有优有劣,就看读者觉得适不适合了。

https://www.cnblogs.com/lipte...

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题