抱歉 真的是很小白的问题,不过我确实是查了很多天;这个问题还在困扰着我请大神帮忙看看
我要爬去http://news.ci123.com/article...这个页面中的内容,即
如果带html应该如何写Xpath 如何不带html应该如何写?
//*[@id='post']/div[2]/这个代码只能抓取到‘http://news.ci123.com/uploads...’
array(
'name' => "neirong",
'selector' => "//*[@id='post']/div[2]/",
'required' => true,
),
不帶HTML標籤
帶HTML標籤
同理,若要找其他區塊
console回傳[div.entry.group]為一個元素的陣列
取其唯一元素的innerHTML
結果
若使用innerText
結果