处理网上爬得数据,需要进行很多的dom、字符串等相关的操作,如果用php通过正则表达式处理的话,正则写起来复杂且麻烦,很多时候还容易出错,通过ajax来操作的话,执行效率不好,而且感觉写起来不顺。如果能用jquery来处理的话会非常方便,对于dom操作,属性的替换、字符串的操作都很方便。如果有一个环境能同时解析html文档(html/javascript/css)和php代码就好了,不知道有没有呢?
处理网上爬得数据,需要进行很多的dom、字符串等相关的操作,如果用php通过正则表达式处理的话,正则写起来复杂且麻烦,很多时候还容易出错,通过ajax来操作的话,执行效率不好,而且感觉写起来不顺。如果能用jquery来处理的话会非常方便,对于dom操作,属性的替换、字符串的操作都很方便。如果有一个环境能同时解析html文档(html/javascript/css)和php代码就好了,不知道有没有呢?
可以用 Nodejs 解析 HTML,生成数据结构(JSON或XML),然后再用 PHP 来来处理后续的部分。
可以用 PHP 调用 Node 进程的方式,不过这样比较慢
另一种方式就 Node 和 PHP 同时运行,分别做自已的事情(任务队列)。任务不是一个个有序完成,而是 Node 处理成半成品之后,送到半成品库,再由 PHP 出库继续处理。
你可以混合c,java,,dotnet,php,python,js,css,html,一起用,
没错,一起用,你没看错,没有逗你,
这个语言就是
10 回答11.2k 阅读
5 回答4.9k 阅读✓ 已解决
4 回答3.2k 阅读✓ 已解决
2 回答2.8k 阅读✓ 已解决
3 回答2.4k 阅读✓ 已解决
3 回答2.2k 阅读✓ 已解决
2 回答2.6k 阅读✓ 已解决
楼主应该要找的是PHP的DOM操作库吧,可以试试
simple_html_dom.php
:http://simplehtmldom.sourceforge.net/manual.htm
比如抓取PHP官网首页新闻:
PHP类似的DOM操作库还有phpQuery和Ganon,也可以试试:
phpQuery - jQuery port to PHP
https://github.com/TobiaszCudnik/phpquery
Ganon - Fast (HTML DOM) parser written in PHP
https://github.com/Shemahmforash/Ganon