问题描述
QueryList采集回来的内容包含<或>字符的时候,会丢失内容,我感觉是因为误以为html标签了,请问怎么解决??
相关代码
// 请把代码文本粘贴到下方(请勿用图片代替代码)
$url = 'http://www.weather.com.cn/wea...';
// 定义采集规则
$rules = [
'date' => ['#7d .t li h1','text'],
'weather' => ['#7d .t li .wea','text'],
'tem1' => ['#7d .t li p.tem > span','text'],
'tem2' => ['#7d .t li p.tem > i','text'],
'win_morning' => ['#7d .t li .win span:nth-child(1)','title'],
'win_after' => ['#7d .t li .win span:nth-child(2)','title'],
'win_level' => ['#7d .t li > p.win','html']
];
$rt = QueryList::get($url)->rules($rules)->encoding('UTF-8','UTF-8')->query()->getData();
dump($rt->all());
exit;
获取win_level时会有数据丢失的情况,英文数据可能为<3