JS阻止爬取网站，如何解决？

因工作需要，需要程序定时去获取网站发布的要闻，地址为：http://cnda.cfda.gov.cn/WS04/...。

尝试过PHP，NODEJS，C#都未能抓取成功，该网站里有一段JS会阻止后台的抓取，抓下来的也是这段JS，后面的内容不会继续加载了。

比较有挑战哦，各位可以看看。
PS：一定是要用后端抓取，浏览器上看到页面无意义。

阅读 3.4k

这样的话不是一段js阻止抓取，而是一段js负责加载剩余内容，现在一些框架也是用js加载内容的，你在浏览器里禁用掉js再开应该也是一样的效果，你从那段js里抠出这个网站的api应该就行了，或者从那段js里解密出网站的真正内容。这里有个需要确定的问题是这段js是负责从服务器上加载（并解密）剩余内容，还是负责直接解密剩余内容（剩余内容已经包含在这段js中）

当然如果你的抓取规模不大的话直接开个无头chrome抓就行了

JS阻止爬取网站，如何解决？

怎么用Vue3和Element-Plus及手动写组件模仿一个网站的全站内容，要模仿的很像？

我想要可靠地升级网站，有没有标准的流程？或者需要注意的地方？

cURL error 77: error setting certificate file: /etc/ssl/certs/ca-certificates.crt 如何处理?

如何处理 npm 包依赖的依赖？

TP6指定时间段内填写指定内容？

微信支付v3接口微信小程序适用的nodejs包是什么呢？

阿里云短信服务发送短信显示ok，但是却收不到短信，有遇到过类似情况的吗，最后是这么解决的？

Microsoft