为什么用jsoup抓取网页，返回的html不全

想问下为什么java用jsuop包解析网页的html代码中<div id = "app">...</div>中间部分缺失。代码如下:

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.IOException;

public class test {
    public static void main(String[] args) throws IOException {
        //获取请求
        //前提 需要联网
        String url = "https://i.snssdk.com/ugc/hotboard_fe/hot_list/template/hot_list/forum_tab.html";
        //解析网页(Jsoup返回Document就是浏览器Document对象)
        Document document = Jsoup.connect(url).timeout(5000000).maxBodySize(0).get();
        System.out.println(document.html());
//        System.out.println(document.html());
        Element element = document.getElementById("app");
        Elements elements = element.getElementsByTag("div");
//        Elements elements = document.getElementsByClass("area-chart-table-row");
        for (Element e1 : elements) {
            System.out.println(e1);
        }
//        System.out.println(element);
        //获取所有的li标签
//        Elements elements = element.getElementsByTag("div");
        //获取元素的内容
//        for (Element e1 : elements) {
//            String img = e1.getElementsByTag("img").eq(0).attr("source-data-lazy-img");
//            String price = e1.getElementsByClass("area-chart-header-item confirmed-province").eq(0).text();
//            String title = e1.getElementsByClass("p-name").eq(0).text();
//            System.out.println("============================================");
//            System.out.println(img);
//            System.out.println(price);
//            System.out.println(title);
//        }
    }

}

解析的网页地址为https://i.snssdk.com/ugc/hotb...

阅读 6k

为什么用jsoup抓取网页，返回的html不全

你尚未登录，登录后可以

js 如何将Key属性相同的放在同一个数组？

前端代码更新如何通知用户刷新页面？

Spring中的两个疑惑?

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

为什么在 aws 新开 ec2 机器不显示价格？

请问开发React Native，一般是推荐哪个主流的UI库呢？

爬取知乎热榜数据，跳转链接从哪里爬取？