0

目标站:http://dhnews.zjol.com.cn/dhnews/jrdh/dhxw/index.shtml

我用phpquery获取#pagemain的html
获取到的内容只有标签,无text,是使用姿势不对?

require('../phpQuery/phpQuery.php');
phpQuery::newDocument($url);
echo pq("#pagemain")->html();

正常是不是应该能同时获取到#pagemain下所有标签以及内容呢?

2015-01-21 提问
1 个回答
0

已采纳

由于phpQuery只能处理utf8的内容,因此一般建议是,你先file_get_contents取回来后,先切换编码。然后最好的情况是修复一下html结构(国内的HTML都不太标准)
然后。。应该就正常了

撰写答案

推广链接