Puppeteer 和 PhantomJS 类似。我遇到的问题都发生在两者上,代码也相似。
我想从网站上获取一些信息,这些信息需要身份验证才能查看这些信息。我什至无法访问主页,因为它被检测为像 SS 一样的“可疑活动”: https ://i.imgur.com/p69OIjO.png
我发现当我使用名为 Cookie 的标头在 Postman 上进行测试时,问题并没有发生,并且它的 cookie 的值在浏览器上被捕获,但是这个 cookie 会在一段时间后过期。所以我猜 Puppeteer/PhantomJS 都没有捕获 cookie,因为这个站点拒绝无头浏览器访问。
我能做些什么来绕过这个?
// Simple Javascript example
var page = require('webpage').create();
var url = 'https://www.expertflyer.com';
page.open(url, function (status) {
if( status === "success") {
page.render("home.png");
phantom.exit();
}
});
原文由 Felipe S. Fernandes 发布,翻译遵循 CC BY-SA 4.0 许可协议
如果将来有人需要解决同样的问题。使用 puppeteer-extra
我已经在服务器上测试了代码。第二次运行时有谷歌验证码。您可以自行解决并重启机器人或使用验证码解决服务。
我确实运行代码超过 10 次没有 ip ban。我在继续运行时没有再次获得验证码。
但是你可以再次获取验证码!
请注意“解决验证码并输入 yes 以继续:”方法未按预期工作,需要一些修复。
编辑:10 分钟后重新运行机器人再次获得验证码。在
chrome://inspect/#devices
上解决了验证码--- 重新启动了机器人,一切都重新开始了。没有ip禁令。