我正在使用 Jsoup 库读取 URL。此 url 在几个 <script>
标记中包含文本。我是否有可能获得每个 <script>
标签中的文本?请注意,我不要求解析 Javascript 文件,因为我已经知道 JSoup 不允许这样做。 URL 的实际源代码在脚本标记中包含文本,我需要它。
doc = Jsoup.connect("http://www.example.com").timeout(10000).get();
Element div = doc.select("script").first();
for (Element element : div.children()) {
System.out.println(element.toString());
}
这是源代码中脚本标签之一的样子:
<script type="text/javascript">
(function() {
...
})();
</script>
原文由 M9A 发布,翻译遵循 CC BY-SA 4.0 许可协议
是的。您可以使用 Element#getElementsByTag() 获取所有
script
标签。每个脚本标签将由 DataNode 表示。