$str = '<div class="dets lined">qwe<span>666</span></div><div class="cnma putys">123<font>name</font></div><div class="lined cnma dets">9665<font>word</font></div>';
/ 以下正则提取不到div里的内容 /
$regex="/<div class="cnma".*?>.*?</div>/ism";
$regex="/<div class="lined".*?>.*?</div>/ism";
$regex="/<div class="putys".*?>.*?</div>/ism";
preg_match_all($regex,$str,$arr);
print_r($arr);
$str1 = '<div class="dets lined">qwe<span>666</span></div><div class="cnmaeed putys">123<font>name</font></div><div class="lined cnmauoe dets">9665<font>word</font></div>';
/ 以下正则字符串里没cnma这个class也能提取div里的内容 ,这样不准确/
$regex="/<div class=".*?cnma.*?".*?>.*?</div>/ism";
preg_match_all($regex,$str1,$arr);
print_r($arr);
怎么才能准确提取内容?
用php爬虫框架比较好