百度搜素后出现的地址都被编码了,要访问百度的服务器,服务器重定向才能跳转到相应网站,如何直接得到跳转的路径,前端有类似的工具可以实现这个操作吗?
想过或许可以通过服务端发起请求实现,如果在不用服务端的情况下,有没有办法可以解析出正确的链接或主站域名,麻烦各位了。
百度搜索结果的url 类似这样 “http://www.baidu.com/link?url...”
我想直接拿到 “https://cnodejs.org/” 这样的地址
这个链接
百度搜素后出现的地址都被编码了,要访问百度的服务器,服务器重定向才能跳转到相应网站,如何直接得到跳转的路径,前端有类似的工具可以实现这个操作吗?
想过或许可以通过服务端发起请求实现,如果在不用服务端的情况下,有没有办法可以解析出正确的链接或主站域名,麻烦各位了。
百度搜索结果的url 类似这样 “http://www.baidu.com/link?url...”
我想直接拿到 “https://cnodejs.org/” 这样的地址
这个链接
没能听明白你的意思 只是大概猜了一下 你使用 window.location.protocol + '//' + window.location.host获取到地址栏的地址 或者你可以使用正则
13 回答13k 阅读
7 回答2.1k 阅读
3 回答1.3k 阅读✓ 已解决
6 回答1.2k 阅读✓ 已解决
2 回答1.4k 阅读✓ 已解决
3 回答1.3k 阅读✓ 已解决
6 回答1.1k 阅读
这个是百度的编解码,我也不知道怎么能够直接解码出来,提供一个思路
如果是 Nodejs,用 request 模块去请求这个搜索结果url,获取到重定向后的结果
其他语言,python也有,应该爬虫用的挺多的,你再搜索下吧
百度搜索结果url:
https://www.baidu.com/s?ie=ut...
把参数wd取出来:
https%3A%2F%2Fcnodejs.org%2F
这个其实是进行了编码(encodeURIComponent)
只要进行相应的解码就行了:
decodeURIComponent('https%3A%2F%2Fcnodejs.org%2F')