有人知道一种使用 JavaScript 获取网站中所有 URL 的方法吗?
我只需要以相同域名开头的链接。不需要考虑其他链接。
原文由 netha 发布,翻译遵循 CC BY-SA 4.0 许可协议
有人知道一种使用 JavaScript 获取网站中所有 URL 的方法吗?
我只需要以相同域名开头的链接。不需要考虑其他链接。
原文由 netha 发布,翻译遵循 CC BY-SA 4.0 许可协议
13 回答13k 阅读
7 回答2.2k 阅读
3 回答1.3k 阅读✓ 已解决
6 回答1.3k 阅读✓ 已解决
2 回答1.4k 阅读✓ 已解决
3 回答1.4k 阅读✓ 已解决
6 回答1.1k 阅读
那么这将在 页面 上获得所有相同的主机链接:
如果通过 站点, 你的意思是你想递归地获取链接页面内的链接,那就有点棘手了。您必须将每个链接下载到一个新文档中(例如在
<iframe>
中),以及onload
检查 iframe 自己的文档以获取更多链接以添加到要获取的列表.您需要查找您已经抓取过的 URL,以避免两次获取相同的文档。它可能不会很快。