phpquery 或是curl都无法正常获取目标站的内容

目标站:http://dhnews.zjol.com.cn/dhnews/jrdh/dhxw/index.shtml

我用phpquery获取#pagemain的html
获取到的内容只有标签,无text,是使用姿势不对?

require('../phpQuery/phpQuery.php');
phpQuery::newDocument($url);
echo pq("#pagemain")->html();

正常是不是应该能同时获取到#pagemain下所有标签以及内容呢?

阅读 2.3k
评论
    1 个回答
    • 205

    由于phpQuery只能处理utf8的内容,因此一般建议是,你先file_get_contents取回来后,先切换编码。然后最好的情况是修复一下html结构(国内的HTML都不太标准)
    然后。。应该就正常了

      撰写回答

      登录后参与交流、获取后续更新提醒